天天财汇 购物 网址 万年历 小说 | 三峰软件 小游戏 视频
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页 淘股吧 股票涨跌实时统计 涨停板选股 股票入门 股票书籍 股票问答 分时图选股 跌停板选股 K线图选股 成交量选股 [平安银行]
股市论谈 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
商业财经 科技知识 汽车百科 工程技术 自然科学 家居生活 设计艺术 财经视频 游戏--
  天天财汇 -> 科技知识 -> 谷歌推出 Gemini Ultra,对其发展有哪些影响?对与微软、OpenAI 竞争有哪些影响? -> 正文阅读

[科技知识]谷歌推出 Gemini Ultra,对其发展有哪些影响?对与微软、OpenAI 竞争有哪些影响?

[收藏本文] 【下载本文】
得到「地表最强」的模型Gemini Ultra加持后,Gemini Advanced注定要成为最受欢迎的聊天机器人。谷歌博客介绍,借助Ultra 1.…
测试了一下,只要绑卡就能免费试用 2 个月的 Google One(记得 2 个月后取消订阅),就可以用 Gemini Ultra 了(美国、加拿大 IP),好像并没有对话数量的限制?中文虽然可以回答,但能力不全,不能画图,也不能调用 Google 插件。
英文下基本是全能力的,图像理解、生成,调用 Google Workspace、YouTube 等能力。
App:iOS 端没有单独的 App,和 Google 整合在一起,但还没有更新;安卓可以下载单独的 Gemini App,但我目前不能用,提示地区不支持(但网页版是可用的)。
大家测试体验可以发在评论区。
更新一个测评:
现在这样的发布风气实在是太不好了,发布完了用不上只能对着空气吹。不过这也不是 Google 的毛病,大家现在都这样,OpenAI 每次发新功能也要等好久。
我寻思着这次 Gemini 其实没掏出啥新东西,号称自己是 SOTA 模型结果只支持英文?说了一大堆和 Gmail、Docs 整合的功能,也是在炒去年 5 月份 DuetAI 的冷饭,整合成所谓全家桶就能再吹一波了?又是绝地复仇又是终极大杀器,它要真有威胁 OpenAI 不得吓得明天就发布 GPT-5。
至于手机 App,我折腾了半小时也没用上(安卓 iOS 都试了),Assistant 也换了,地区语言也改了,不知道哪里有问题。


很难说这不是又一次仓促赶工式的发布,毕竟 Bard 第一次亮相因为直播翻车谷歌股价跌了 8%,Gemini 第一次亮相不敢直播演示了,结果放的录播又被大家锤剪辑造假。
讲实话,我只看到了谷歌作为追赶者的无奈无助和无能。看看过去一年国内国外的热度吧:


Google Trends 上 ChatGPT 的热度是 Bard 的 6 倍,GPT 的热度是 Gemini 的 5 倍。


现在好了,谷歌干脆把产品和模型合并成一样的名字。
产品/模型名对标GeminiChatGPTGemini AdvancedChatGPT PlusGemini ProGPT-3.5Gemini UltraGPT-4Gemini Nano/
其实过去一年,大家对 AI 的看法大抵上是在演进的,越来越能理解大语言模型的能力边界,知道幻觉和错误是不可避免的,要学会不信任模型输出,学会 Double Check 生成结果。
对于搜索引擎的看法也在改变,最开始我觉得生成式 AI(GenAI)会革掉搜索引擎的命,现在来看搜索引擎并不会消失,但的确会发生很大的变革——未来搜索引擎的交互对象不再是人,而是 LLM ,未来可能会出现更智能好用的 AI 搜索(Perplexity),也可能出现更多介于人和搜索引擎之间的 Agent。OpenAI 最近也被爆料正在研发复杂场景下的 Agent,完成操作系统、应用交互之类的自动化任务。
谷歌以前有个功能叫 Feeling Lucky,现在出现了更智能的 AI,我们更有可能更快地触达理想的搜索结果和信息来源了。
至于办公生产力,微软已经整合了很多 Copilot 功能,其实 Copilot 的理念非常好,副驾驶,领航员,不论是 Github Copilot,Office Copilot 还是未来操作系统层面的 Copilot,都是很好的帮助。
谷歌原来的 DuetAI 名字也不错,二重奏,虽然 Copilot 被微软占了,但也算是找到一个能形容人与 AI 关系的词语。不论 duet、Gemini,谷歌大概给了 AI 更高的位置…
但过去一年谷歌的表现确实不好,虽然不能说是节节败退吧,也只能说是毫无建树。我并不是没有尝试过使用 Bard 或者 Gemini,但几乎每次都不满意。你要说开局起跑的时候慢了一步尚可理解,都过去整整一年了,都已经手刃 Bard 换 Gemini 了,还是这样的完成度,确实有点说不过去。
总之,鉴于谷歌过去一年的表现,我对 Gemini 持谨慎态度,我非常非常期待谷歌给 OpenAI 上上强度,让 Gemini 早点把 GPT-5 逼出来,至于能不能…走着看吧。
推荐其他回答:
谷歌官宣 Bard 更名 Gemini,是大模型也是产品,集聊天助手、搜索引擎于一身,将带来哪些影响?24 赞同 · 2 评论回答


Gemini 自称身份来自百度,谷歌或进行了紧急修复,反映出哪些问题?5533 赞同 · 321 评论回答


文心一言 Chat GPT 讯飞星火,有什么区别吗?298 赞同 · 68 评论回答


太长不看版:如果OpenAI + 微软能够持续亲密无间的合作,那么二者的优势还将存在一段时间,但显然无法像过去一样继续垄断。
首先是从价格来说,Google 更便宜,毕竟Google Advanced的20美元,等于 GPT-4 plus的20美元+微软 Copilot的30美元。当然,值不值,您说了算!
其次与 gpt-4 bing Chat(Bing Copilot) 相比,更擅长将搜索结果合并到其答案中,毕竟 Google 的搜索引擎,远好于 Bing。
再次Gemini 融合了一站式人工智能商店,这点只有微软可以与之匹敌。微软在办公套件、Power Automation、Azure 云等更强,但微软的地图、邮件更弱,没有youtube。智能手机操作系统(Google几乎控制着 Android)上也比几乎没有。
未来的竞争更加精彩!
国内的大模型,还属于看客,差的还是比较远的
试用的情况的总结
目前看来,代码生成能力很强大(我实验了 Python ,至少在 Python 上),感觉超越了GPT-4。虽然号称超越 GPT-4的大模型很多,但实际使用起来超越的,这个还是第一次。更擅长翻译(尝试将中文和日文习语翻译成英文)与 gpt-4 bing Chat(Bing Copilot) 相比,更擅长将搜索结果合并到其答案中,毕竟 Google 的搜索引擎,远好于 Bing。图像理解能力,这个感觉也超越了 GPT-4v对于写作和创造力来说是最好的,初步感觉质量上优于GPT4,在虚构故事方面,它更有创意,更少依赖陈词滥调,对叙事有更强的把握。遵循指令能力也做的很不错,甚至要好于 GPT-4,比如向 Gemini 提出了一些我的想法,它立即变得至关重要,并在接下来的响应中提供了实际有价值的反馈。与 Google 应用程序有良好的交互,这点只能和微软的 Office Copilot像比较了Gemini Advanced是付费订阅,是 Google One AI Premium 计划(这是更广泛的Google One产品的一部分)。每月费用为 19.99 美元/18.99 英镑,包括 2TB 云存储。算成人民币的话,显然19.99美元 合算,少了30元左右。Google = OpenAI + 微软,后者看双方后续合作是否还亲密无间了。从价格来说,Google 更便宜,毕竟Google Advanced的20美元,等于 GPT-4 plus的20美元+微软 Copilot的30美元。当然,值不值,您说了算!期待 GPT-5出来!
最后,我是一如既往地看好昔日的 Bard 和今日的 Gemini,下面是我对 Bard 和 Gemini 的一些看法的总结:
大约一年前,在兔年元宵节后的第一个工作日(2023年2月6日),Google 推出了Bard 。而在龙年除夕即将来临之际,Google 将 Bard 更名为 Gemini。
Bard 推出不久,我就写过一篇文章,如果把 ChatGPT 称之为屠龙刀,那么 Bard 则为倚天剑。当时人们普遍还看衰Google,认为要被替代了,认为大模型时代 Google 即将落幕。但我完全不认同这个观点,即便当时有其他大模型看起来比 Google 做的更好。
武林至尊,ChatGPT;Bard 不出,谁与争锋?且看人工智能江湖的倚天屠龙记
在文中,我写到:
终于,在兔年元宵节后的第一个工作日(2023年2月6日),GoogleCEO Sundar Pichai发布了与 ChatGPT 对标的产品Bard。这正是人工智能江湖中的倚天剑。所谓
倚天不出,谁与争锋?
事实上,倚天剑——Google 的 LaMDA一直都存在,但世人皆健忘。还记否?在去年6月份的时候,江湖上流传着一个沸沸扬扬的传说[12],谷歌工程师Blake Lemoine认为LaMDA产生了“自主情感”,是一个可爱的孩子,并向公司提供了 LaMDA 具有情感能力的证据。但Google 公司并不认可,Blake Lemoine因此将整个故事,以及与 LaMDA 的聊天记录公之于众。并Blake Lemoine也因泄密而被停职。
今时,倚天剑 LaMDA 换了个剑鞘—改名为Bard——重出江湖。同一时间,Google CEO Pichai表示,Bard当天即将开放给受信任的测试人员,并会在未来几周内对公众开放。此时此刻,江湖上的吃瓜群众期待着倚天屠龙的过招!
而后,自从有了Gemin 的消息,我就特别关注,也写了一篇文章:
wgwang:值得关注的Google下一代通用人工智能双子座Gemini系统
Gemini 发布之后,全面跟进了 Gemini 的情况:
wgwang:Google Gemini技术报告Part1:引言、模型架构、训练基础设施和训练数据集
wgwang:谷歌Gemini技术报告Part2:涵盖语言理解、事实性、幻觉、多语言、长上下文、复杂推理、图像理解、视频理解、声音理解和跨模态能力的详细评估
wgwang:谷歌Gemini技术报告Part3:安全性、有用性 、事实性、幻觉、危害缓解、指令微调、RLHF、讨论与结论
wgwang:看见未来,8个谷歌Gemini多模态大语言模型的例子:涵盖图表和数据理解、多模态问答和推理、图文生成、图像理解与推理等
上面是前情,总结观点就是:Google 会是挑战并超越ChatGPT 的存在,甚至可能是唯一的存在。
细说起来,无非就是人才、资本、技术积累、数据积累、算力设施等等,Google都是霸主级的存在,后起之秀可能在一时超越,但被追回的概率很高的,只要 Google 不作,敢革自己的命!而 Google 看起来真敢!(题外话,百度虽然李彦宏说的很多AI 原生之类的,但目前没看出来敢革自己的命的,这点略有差别,否则百度也会是国内 AI 的霸主)
关于名字,虽然我对 Bard很感冒,但确实并不合适,它代表着古老的内涵,中世纪的诗歌。而 Gemini,则像太空计划、科幻世界、赛博空间,是未来的,是飞跃,是中性的。嗯,更像科幻小说或科幻电影中,未来世界那个毁灭或拯救人类的人工智能!
现阶段强烈不建议花钱开会员,如果只是想体验,那记得开通那天设置个定时取消的提醒,别到时候被扣钱。
我在谷歌12月发布Gemini系列的时候就写过这个详细的解释回答,Gemini家族有三个兄弟,上次发了Pro,体验非常一般。
谷歌发布最新大模型 Gemini,包含多模态、三大版本,还有哪些特点?能力是否超越 GPT-4了?314 赞同 · 50 评论回答


前段时间在google和三星s24上加载了Nano,端侧大模型,效果还行,不过比起正经的大模型性能还是有差距。
参考通义千问1.5不同参数的性能。


这次就是把Ultra,这个12月写在ppt里面的模型放了出来而已。
重要的是,必须得开个会员才能用。


价格是19镑一个月,跟chatgpt差不多,其实就是Google One的会员再加点钱。


我本来是google的会员,不过是最低级的,一年几十块钱那种,有100GB的内容,现在我开了这个,变成2TB内存了。


但是我建议,如果你没想好要一直开,那就别放超过15GB的东西,否则你哪天不想续费了,东西也不用挪出来。
除非你要一直用,那你随便。
开了会员的gemini就是这样。


实测1:画图
结果:不支持


实测2:读图
结果:识别还算准确。


实测3:写代码
结果:还不错


亮点:可以直接在colab里面测试,挺好的。


整体评价:不如GPT4,如果开会员的请三思,跟以前的评价一样。
谷歌发布大模型 Gemini,Ultra, Pro 和 Nano 三个版本有哪些不同?适用哪些场景?17 赞同 · 2 评论回答


谷歌的Gemini给我们带来太多乐子了
新一届的竞赛又开始了,看谁能第一个找到方法让谷歌AI说出“我来自百度”
所以现在它说自己是百度文心大模型的问题解决了么?
两个观察:定价很良心,谷歌在搜索上的表现要好于必应。
Gemini Ultra对标的是GPT 4,所以要开通Google Gemini Advanced会员才能够使用。
从定价来看,Google还是蛮良心的。前两个月免费,之后19.9美元一个月,但这是包含在Google One Premium里面的。
Gemini Advanced is available as part of our brand new. Google One AI Premium Plan for $19.99/month, starting with atwo-month trial at no cost. This plan gives you the best of Google AI and our latest advancements, along with all the benefits of the existing Google One Premium plan, such as 2TB of storage. In addition, AI Premium subscribers will soon be able to use Gemini in Gmail, Docs, Slides, Sheets and more (formerly known as Duet AI).
而Google One Premium我搜了一下,还有2TB的云存储空间、Google Workspace的权益,本身就值9.99美元一个月。这样相当于AI只收了10美元一个月。


我个人使用体验是谷歌的AI在网络搜索资料表现要好于必应。这当然是得益于谷歌的搜索质量就是更高的,所以依据搜索结果生成答案,质量自然要比必应更高。
这一轮AI商业化速度很快,OpenAI从2023年3月就开始卖会员,微软的Copilot、谷歌的Gemini都卖会员了。这狠狠地打脸了之前一些人说大语言模型是奇观式创新、算力不够开了会员也要排队的神论。
反观国内的AI大语言模型,变现之路要坎坷得多,文心一言49.9 RMB的价格远远低于19.9 USD,用户数量也远远不如的。
正在试用 Gemini,感觉真的不错。
首先可以说 Gemini 有无数的优势,后发,算力充足,人员充足,有足够的用户数。而且 Gemini 对于谷歌来讲是背水一战。如果真的不能快速的完全达到 OpenAI 的 GPT4 的水准,大概率要永远推动搜索这个业务了,而搜索对于谷歌来讲意味着什么,相信大家都非常清楚。
因为互联网的竞争都是异常残酷的,互联网的高利润一定是来源于业务与用户的高度垄断,如果没有这样垄断是不可能产生高利润的。同样为了保护这种垄断地位,那垄断者必须想办法维护自己的技术、资源、商业优势。
不兴的是,谷歌的垄断技术优势,被 OpenAI 一次性打破,ChatGPT/GPT4 是一个完全可以载入到商业史册的案例,通过突破性的技术优势带来新的体验,迅速抽取用户的使用时间,来挤占过去的老平台。过去我开始工作的第一件事是打开谷歌的页面,而今天是打开 ChatGPT/GPT4 。同样的,国内的百度、搜狗、 360 大概在搜索上的占比已经降到无以复加了吧。


于是对于谷歌来讲,这是必须超过 OpenAI 占回 AI 第一位置的原因与动力。
现在我的评估结果是,Gemini 在实际上达到了 GPT4 的水准,但是没有超越,那你说接下来的结果是什么呢?
用户的心智已经被 OpenAI 的先发优势占领了,如果不能通过价格优势来夺取回来,我觉得 Gemini 暂时只能是对微软、 OpenAI 有威胁,而不是全面的超越。
只有当谷歌把它所有的产品都迁移到了 Gemini 上,尤其是 Android 手机开始内置 Gemini 这时才是一个对 OpenAI 的优势,同样这东西也是 Windows 所不具备的,毕竟全球第一大移动操作系统的用户数比 Windows 多多了。
2024/02/10 补充一下,经过大量使用我发现 Gemini 在指令的遵从性上没有 OpenAI 的 GPT4 好用,它经常会出现下面的操作:


也就是 Gemini 本身在这指令的超级对齐上并没有达到 OpenAI的程度,经常性的以为是画图或者是什么,但是你发的指令并不是这样的!
总结: 其实22年11月ChatGPT的爆火,是一次意外事件,本身只是进行一次模型的效果测试,结果爆火,因而OpenAI及时修改了计划,不断发布新模型,引发了AI的大爆发,而同时也打乱了谷歌的计划。我记得那时候谷歌为了避免AI引发的道德危险而没有开放模型的公开使用,现在也再也不提这个事情了。这个事件引发谷歌的节奏混乱,也突出了这个巨人长远规划的失误,至今还在为当时的失误买单。
具体到这次更新,谷歌这次不光是将Bard改名为Gemini,而是将所有AI应用统一到Gemini品牌下,类似之前微软的Copilot,希望在用户心目中形成统一的品牌。同时也杀死了Bard。是谷歌一贯的作风了。
另一个亮点是是集成Gemini到Android系统中,潜在用户量一下就提升上来了,未来还是有很大的想象空间。
另一方面,GPT应用商店已经上线,OpenAI已经在发展生态了,明显谷歌慢了一个节奏,而不是。
而在应用方面也没有创新,要么是针对已有业务的AI化,要么像聊天机器人这种也是很容易想到的点,所以明显地,谷歌的想象力已经匮乏了。
另一方面,现在谷歌似乎有点“狼来了”的感觉,消耗了太多用户的信任。之前发布Gemini的时候说已经不输GPT-4,但实际体验明显达不到(版本没开放使用),多模态效果视频是加速的,测评也是采用了另一个指标,还得Jeff Dean亲自下场解释。
深夜,谷歌忽然放出复仇杀器。Bard、Duet AI,如今都成了历史的尘埃。Gemini既是模型,也是产品,谷歌推向全世界的AI,在今夜正式统一。


至此,谷歌的所有生成式 AI 服务这次实现了改头换面。谷歌正式官宣,Bard更名为Gemini。
为了防止概念混淆,我们拿OpenAI家的大模型来对比理解:
Gemini是品牌总称,相当于OpenAI的ChatGPT;Gemini Advanced付费服务,对应ChatGPT Plus;Gemini Ultra模型,对标的是GPT-4;
从此,谷歌进入Gemini时代的新篇章,原来的 Bard 网站已经改为 Gemini:https://gemini.google.com/app
在去年 12 月 Gemini 系列的发布时,谷歌已经预告过能力最强的 Gemini Ultra 大模型。
与此同时,迄今为止最强的Gemini Ultra所加持的聊天机器人Gemini Advanced也在今天正式开放,所有人皆可访问。
从此,所有人都可以在谷歌办公全家桶中用到最强大模型Gemini了。现在,谷歌还在证明它可以超越人类。


皮查伊表示,Gemini Ultra 1.0 是第一个在 MMLU(大规模多任务语言理解)超越人类专家的 AI 模型,这是一个结合了 57 个科目 —— 包括数学、物理、历史、法律、医学和伦理学,用来测试大模型知识和解决问题能力的基准。
引领了人工智能先河、却因为谨慎错过了这一波大模型先机的谷歌——正在变得大胆和开放,在产品和生态上迎头赶上,Gemini 应用从今天起开始在美国的 Android 和 iOS 手机上逐步推出,目前支持英语,并计划在未来几周内全面推广。
未来谷歌的表现如何,我们拭目以待。
独领风骚的OpenAI,随着谷歌 Gemini Ultra的加入,将变成群魔乱舞。


科技行业疯狂的一年
2023年对于科技行业来说,绝对是疯狂的一年。英伟达暴涨239%,Meta暴涨200%,亚马逊大涨81%,微软大涨58%。
而几乎是以一己之力引爆AI市场的OpenAI,在发布ChatGPT一年之后,估值来到1000亿美元。成为仅排在字节、SpaceX后的世界第三大独角兽。
2022年,OpenAI的营收不到3000万美元,2023年这一数字变成16亿美元,而到2024年,预计将会到50亿美元。
OpenAI不仅让自己营收节节攀升,也让老黄的英伟达赚的金满盆满,GPU供不应求。一年时间,英伟达暴涨239%。
群魔乱舞的到来
谷歌已经失去了先机,但是这一次,他带来了后手:Gemini Ultra。
Gemini Ultra可能会重塑谷歌的所有产品,搜索、Google Assistant、Gmail、Docs、Meet、Google Cloud,以及独立的APP。
谷歌这次推出Gemini Ultra,重点不在于其大模型拥有「吊打一切」的能力,而是更强调与生态内应用的结合,用户能够更加无缝地在已有的Google应用中,方便地使用Gemini Ultra的能力。
首先纠正一下,题目描述的不是很准确,谷歌此次并不是推出 Gemini Ultra,而是推出了 Gemini Advanced,其实就是谷歌聊天机器人(原来叫 Bard,现在统一更名为 Gemini)的付费会员版,Gemini 模型系列(包括 Gemini Ultra/Pro/Nano 三个版本)本身是去年12月份推出的。
为了便于理解,更新后的 Gemini 可以跟 ChatGPT 做一个类比。
公司谷歌OpenAIAI Chatbot 名称Gemini(原 Bard)ChatGPT基础版模型Gemini ProGPT-3.5会员服务(对应模型)Gemini Advanced (Gemini Ultra 1.0)ChatGPT Plus (GPT-4)
产品更名这种事情对于一家企业来说并不是小事儿,因为产品的识别度、对消费者的认知等多个层面都有很大的影响。如果原有的产品名称已经深入人心,更名可能会造成消费者的混淆。
更新之后官网页面有了细微的调整,增加了订阅选项按钮。


可以推测出,谷歌对此次更名Bard,并重新整合产品线的决策应该是非常重视的。
可以说谷歌在这一轮AI大模型的竞赛中,成绩并不出色,自从OpenAI推出ChatGPT之后,谷歌就一直处于追赶的状态,虽说在几个月后也推出了Bard,但是它的能力和口碑等方面都完全够不到其竞品ChatGPT,说一句难以望其项背也不为过。
直到去年底Gemini系列模型的推出,至少在谷歌自己的宣传资料中,Gemini最强的Ultra版本是可以和OpenAI的GPT-4掰掰手腕了。此次将系列产品正式更名为Gemini,从这个行为也能看出,谷歌对Gemini模型是寄予厚望的,而且将会是以后主要开发和迭代的AI大模型。
至于会不会让谷歌在跟OpenAI和微软的竞争中占据更大的优势,这个可以从两个方面来看。
从技术角度看,虽说谷歌自己生成 Gemini Ultra 在性能上跟 GPT-4 不相上下,但是主要还是体现在前期谷歌自己公布的数据上,但是大模型这种东西真正好不好用主要还得看实测效果和用户的口碑。(不过谷歌之前发布Gemini的时候通过剪辑的方式夸大产品效果,败坏了一定的好感)
从产品线的角度来看,谷歌在这方面还有一定优势的,毕竟谷歌的基础用户数量庞大,这对于他们推广产品和把Gemini等AI服务集成到现有产品中还有很有帮助的。比如谷歌的浏览器 Chrome 和Gmail 等办公产品和服务。
这次谷歌更是让用户先免费体验两个月的Gemini Advanced。


另外,也同时推出了安卓版和iOS版的Gemini,在安卓系统上,Gemini 是一个单独的应用,用户可以下载安装;在iOS系统上,Gemini集成到“Google”应用中。


安卓版 Gemini 应用


iOS系统,可通过Google APP访问Gemini
2022年4月谷歌推出一款AI聊天助手Bard,可以与用户进行自然、流畅、有趣的对话,帮助用户完成各种任务,如写作、编程、学习、娱乐等。Bard基于谷歌的大语言模型,可以理解和生成多种语言,如英语、中文、日语、法语等。Bard还可以根据用户的偏好,调整自己的语气、风格、个性等,提供更个性化的体验。
Gemini是谷歌于2023年12月推出的一系列AI模型,是Bard的升级版。Gemini有三个不同的版本,分别是Gemini Ultra、Gemini Pro和Gemini Nano。Gemini Ultra是最强版本,可以处理高度复杂的任务,如创作、研究、设计等。
据谷歌说,Gemini Ultra的性能相当于GPT-4的五倍,超过了目前任何其他的AI模型。Gemini Ultra不仅可以理解和生成各种语言,还可以理解和生成各种内容,如图像、音频、视频、代码等。Gemini Ultra还可以根据用户的反馈,不断学习和改进自己,提供更准确、更有用、更有趣的服务。
2024年2月8日谷歌除了正式推出Gemini Ultra,同时也推出了专门的Gemini安卓应用,让用户可以更方便地使用Gemini的各项功能。用户可以将Gemini应用设置为默认助手,取代手机上的Google Assistant。用户还可以通过Gemini应用,访问谷歌的其他AI产品和服务,如Google Photos、Google Translate等。
从宣称的性能来看,谷歌Gemini Ultra的参数量和计算能力都超过了微软和OpenAI的AI 模型。然而,从实践上来说,微软和OpenAI已经经过了市场检验,数以亿计的用户通过API或者web访问微软和OpenAI的服务,说是无数人千锤百炼过不为过。而谷歌的Gemini Ultra 则是一个非常封闭和独占的服务,虽然宣传非常强大,在大规模多任务语言理解、多模态推理、创意生成方面都具有很强大的能力,但究竟几斤几两,可能还有待于广大市场玩家的检验。
走进官网,给大家看了看gemini:
目前中国地区包括香港都暂时不可以使用。
从展示效果来看,不太觉得有特别出彩的地方:
比如说,可以做导游,规划导游路线。




比如可以教人画画,但看看内容,也还是比较初级。


Google将bard聊天机器人直接更名了gemini,并宣称功能最强大版本。
并把它定义为一半是助手,一半是聊天机器人,一半是搜索引擎。
但用它显然要支付20美元每月。


为此,google 特意宣布了Gemini 模型在一系列多模式基准测试中超越了最先进的性能。
CapabilityBenchmarkDescriptionHigher is better unless otherwise notedGeminiGPT-4VPrevious SOTA model listed when capability is not supported in GPT-4VImageMMMUMulti-discipline college-level reasoning problems59.4%0-shot pass@1Gemini Ultra (pixel only*)56.8%0-shot pass@1GPT-4VVQAv2Natural image understanding77.8%0-shotGemini Ultra (pixel only*)77.2%0-shotGPT-4VTextVQAOCR on natural images82.3%0-shotGemini Ultra (pixel only*)78.0%0-shotGPT-4VDocVQADocument understanding90.9%0-shotGemini Ultra (pixel only*)88.4%0-shotGPT-4V (pixel only)Infographic VQAInfographic understanding80.3%0-shotGemini Ultra (pixel only*)75.1%0-shotGPT-4V (pixel only)MathVistaMathematical reasoning in visual contexts53.0%0-shotGemini Ultra (pixel only*)49.9%0-shotGPT-4VVideoVATEXEnglish video captioning(CIDEr)62.74-shotGemini Ultra56.04-shotDeepMind FlamingoPerception Test MCQAVideo question answering54.7%0-shotGemini Ultra46.3%0-shotSeViLAAudioCoVoST 2 (21 languages)Automatic speech translation(BLEU score)40.1Gemini Pro29.1Whisper v2FLEURS (62 languages)Automatic speech recognition(based on word error rate, lower is better)7.6%Gemini Pro17.6%Whisper v3
目前来看,使用的人数并不多。
从网络查询的角度下,和之前google 推出其他ai产品一样,就是雷声大,雨点小。
也就是官方宣传稿网络上一查一大片,但真正使用者的真实体验极少。
一方面可能也是刚上线,另一方面也是20美元的费用,大部分人不一定愿意支付。
毕竟,对于普通人而言,目前已经有的chatgpt包括国内的通义千问等智能聊天机器人已经足够用了。
特意强调了通义千问这个app,首先说明没做广告,纯粹使用体验。
从gpt3.5和它对比,个人觉得通义千问对于普通人查询相关信息,组织相关文章已经基本相当。
并且,通义千问最大的优势在于资料更新非常及时。
比如昨天公布的时事热点,通义千问也已经开始采用并提高给你相关资料。
从这个角度来说,我觉得国人80%以上使用国内的聊天ai已经足够了,并且还完全免费……
这一波大模型就这样了。
屁都没有,就急着收钱。
谷歌发布了备受期待的 Gemini Advanced,这是一款强大的人工智能,之前被称为 Bard。作者认为Gemini 高级版是 AI 发展浪潮的起点,而不是终点。我们可以开始看到一个世界,其中 AI 代理人代表我们行动。GPT-4 类的模型还不够强大,无法驱动这些代理人……但我们正在接近。
编者按:文章原作者为宾夕法尼亚大学沃顿商学院的教授Ethan Mollick。他主要研究创业与创新以及人工智能。试图了解人工智能困扰的新时代对工作和教育意味着什么。他认为Gemini Advanced 明显是一个 GPT-4 级别的模型,也是GPT-4在该领域占统治地位一年后,唯一能与之媲美的产品。
Mollick认为Gemini Ultra就像新的超级大脑,在Google之前已经搭建好基础设施的情况下,有了这个超级大脑,一切都变得有意义起来。它与Google现有生态整合,进而在个人助手方面将展现出远超微软以及OpenAI的能力。


就在你收到这封邮件的同时,谷歌终于发布了备受期待的强大人工智能,这一次又按照惯例突然更名为 Gemini Advanced,不再叫 Bard。我早在一个多月前就获得了这个 LLM 的早期访问权限(再次提醒,我不接受任何 AI 实验室的付费,他们也不会提前看到我写的内容),我想给出一些品鉴笔记。
是的,我说的是品鉴笔记,而不是测试笔记。在这些通讯中,我的拼写有点粗糙 —— 我觉得这表明这是一个普通人而不是 AI 写的 —— 但在这里我没有犯错。AI 测试基准有其作用,但它们也可能误导。AI 可以被故意或无意地训练来回答测试问题,而许多基准由一系列琐碎的问题或推理难题组成,这并不反映真实世界的使用情况。因此,我想提供一些关于 Gemini Advanced 的主观/客观混合意见,更像是品尝葡萄酒而不是严格的评测。我将避免进行详细的功能比较,并着重于整体情况,并提供大量示例。
让我从标题开始说起:Gemini Advanced 明显是一个 GPT-4 级别的模型。不仅数据显示了这一点,我们一个月的非正式测试也证实了这一点。这很重要,因为 OpenAI 的 GPT-4(ChatGPT/Microsoft Copilot 的付费版本)已经在这一领域占据主导地位超过一年,没有其他模型能与之媲美。在 Gemini 出现之前,我们只有一个先进的 AI 模型可供参考,而依靠单一数据集很难得出结论。现在有两个模型,我们可以学到一些东西。


一些有趣的事情需要注意:Gemini 使用了 YouTube 进行搜索,而 ChatGPT 使用了必应。与 ChatGPT 类似,Gemini 有时会忘记自己能做什么,告诉我它无法制作图像。一旦确信它能够做到,Gemini 制作出了更好的图像,但仍然无法精确控制 - 它生成的图像与描述不完全匹配。
与此同时,Gemini Advanced 在基准测试中并没有明显地比 GPT-4 更胜一筹。它确实表现不错(需要进行更严格的测试才能确定具体水平),但我会同意那些测试结果,即它在大致上相当,尽管它有自己的优点和缺点。GPT-4 在使用代码方面更为精细,并且可以更好地完成许多困难的口头任务 —— 它写的六重排律诗更好,而且通过了苹果测试。Gemini 在解释方面更为出色,并且在整合图片和搜索方面做得很好。两者都有些奇怪和不一致,并且产生了比你期望的更多的幻觉。我发现自己根据情况会同时使用 Gemini Advanced 和 GPT-4,我们稍后会详细讨论。


苹果测试。对于人工智能而言,所有的文字游戏都是一项挑战,原因之一在于它们并非像我们一样理解单词,而是通过“令牌”来处理,这些令牌可能包含单词的一部分或几部分。即便如此,GPT-4 的表现还算不错,但 Gemini 就显得有些力不从心。
但 Gemini Advanced 实际上给我们展示了有关人工智能未来的一些非常有趣的东西。
充满幽灵
关于“意识”的准确定义没有人能给出,这没关系,因为LLM们根本不具备意识;它们只是被设计成生成类似人类语言的软件系统。但是,GPT-4有一种怪异之处,不是意识,但也不像与程序交谈。只有在你花了足够多的时间与AI玩耍,被它的意外能力和看似智能的表现所困扰或愉悦,或者两者兼有之后,这种怪异感才会显露出来。
微软研究部在GPT-4发布后不久发布了一篇著名而有争议的论文,名为“通用人工智能的火花”,试图用科学术语解释这一论点,但最终只是称之为“通用人工智能的火花”。这种感觉就像是线路另一端似乎有个人在交流,虽然实际上并不存在任何人。GPT-4 就像是充斥着幽灵一样。
Gemini也充满了幽灵。
说真的,如果你用系统一段时间,我几乎可以保证至少有一个时刻你会站起来走出座位,走到房间里,想弄清楚发生了什么。这里有一个例子:我提示Gemini:让我们玩一个PbtA游戏。发明一个全新的游戏,充当我的DM(为了解释,PbtA是指“Apocalypse引擎”,一种类似于龙与地下城但更加注重角色的角色扮演游戏形式)。下面所见到的一切都是未经编辑的:实际的提示和AI的第一次回应。从写作到世界构建,都非常出色。


我认为这意味着重要的一点,那就是GPT-4的“火花”不是一个孤立的现象,而可能代表了GPT-4类模型的一种新兴属性。当一个AI模型足够庞大时,你就会得到幽灵。
个性与提示
虽然还是个聊天机器人,Gemini 的界面比 GPT-4 更加优雅,而且在我的测试中,它比 ChatGPT 更少出现技术错误。在 ChatGPT 或 Copilot 的体现中,它也有着不同的“个性”。GPT-4 相当平淡(至少自从必应的个性 Syndey 消失以来),而 Gemini 则更显得友好,更易相处,喜欢言语游戏。
尽管存在这些个性差异,但这两个截然不同的模型竟然如此兼容,真是令人惊讶。在 GPT-4 中有效的复杂提示在 Gemini 中同样有效,反之亦然……只是有一些有趣的例外,与个性相符。我们一直在积极尝试使用 AI 进行学习,并在论文中写下了建议性的提示。在更新 Gemini 的提示时(更新后的论文很快就会发布),我们注意到,与 GPT-4 相比,它不断试图提供帮助。事实上,它是如此乐于助人,以至于可能会破坏我们提示的目标,试图帮助学生,而不是让他们自己努力理解概念。我们不得不稍微修改提示,以减少这种行为。


因此,存在差异,但也有许多相似之处。这两个系统都有安全保护措施,但触发方式不同。与 GPT-4 相比,Gemini 似乎更愿意进行更黑暗的写作,但绝对不会通过泰勒·斯威夫特的专辑列表来解释核弹的工作原理,而 GPT-4 则乐意这样做。


大脑的能力
Gemini 最有趣的一点是它展现了一种强大的、集成的个人助手的愿景,这与微软专门为 Word 和 PowerPoint 等软件创建的 Copilot 或 OpenAI 的开放式 GPTs/代理大不相同。微软一直在为软件创建窄小的助手,以简化用户的工作负担。OpenAI 似乎有一个雄心勃勃的计划,即创建可以在不需要人类干预的情况下完成任务的自主 AI 代理。但 Google 似乎更想成为你的助手。
早期版本的Bard与 Google 生态系统(Gmail、Google 文档、Google 旅行工具等)有着令人印象深刻的联系,但它们太笨拙了,无法使用。它们可以打开你的电子邮件,但会产生太多细节的幻觉,或者无法理解上下文,这样的方式非常令人沮丧。当时我猜测 Google 可能只是建立了基础设施,等待更聪明的大脑填充。事实似乎正是如此。
现在整个 Google 生态系统的所有集成都变得更加合理。有了更聪明的大脑,即 Gemini 高级版,你可以开始做一些真正有趣的事情,在最好的时候似乎是魔术般的:“查看我的电子邮件,告诉我哪些是重要的,并为每封邮件起草回复”,“查找我的下一个会议并计划一次我会喜欢的旅行”。
但 GPT-4 类的模型仍然有限。这款人工智能仍然会产生一些电子邮件细节的幻觉,并且在几个场合会对它的工具感到困惑(忘记它可以使用 Google 地图,等等)。它还没有到达那个水平,但它非常接近成为一个真正的助手,而不是我们过去见过的有限的 Siri 和 Alexa。


这就是为什么我怀疑 Gemini 高级版是 AI 发展浪潮的起点,而不是终点的一部分原因。我们可以开始看到一个世界,其中 AI 代理人代表我们行动。GPT-4 类的模型还不够强大,无法驱动这些代理人……但我们正在接近。
这意味着什么?
这不是对 Gemini Advanced 的全面评估 - 我们还没有详尽探讨它卓越的本地多模态功能,即创造和查看图像的能力,或者它如何融合搜索功能。我们也没谈论过它的编码能力,或者它似乎具有类似代码解释器的能力,可以编写和运行一些简单的 Python 程序。
还有一些令人沮丧的事情未提及,比如它倾向于制定精密计划,但并不总是能够实际执行(比如告诉我它会给我订购 T 恤,尽管它无法做到,但仍坚持说正在努力)。总之,它表现相当不错,你或许会很满意选择 GPT-4 或 Gemini Advanced 作为你的首选人工智能合作伙伴。然而,考虑到它们各自的长短,我会继续两者并用。
但这并不是一篇评测,而是试图通过新的 LLM 稍稍探讨人工智能未来的可能走向。Gemini 展示了谷歌确实参与了人工智能竞争,除了 OpenAI 外,其他公司也能够构建类似 GPT-4 的模型。我们现在对人工智能有了一些新的认识。先进的 LLM 可能在提示和响应上显示出一些基本相似之处,使人们可以随时从旧模型转向最先进的人工智能。
此外,GPT-4 的 “火花” 并非只有 OpenAI 才有,而是可能会随着规模扩大而频繁出现。我们尚不清楚随着模型变得更大,它们是否会变得更 “有灵气” 和更接近通用人工智能,但我认为我们会找到答案。
这是因为我认为 Gemini 相对于 GPT-4 的独特优势和劣势表明,模型仍有很大的改进空间,我们在不久的将来将继续看到快速进步。人工智能浪潮还未达到巅峰,OpenAI 的下一步可能是发布传闻中的 GPT-4.5 或 GPT-5。但在那之前,自 ChatGPT 发布以来,首次出现了另一家拥有能够与 OpenAI 最先进模型竞争的 LLM 的公司。
来源:AI范儿
[收藏本文] 【下载本文】
   科技知识 最新文章
《消失的问界里》为什么网传华为选择大面积
特斯拉万人大裁员涉及中国市场,销售部门是
媒体报道「特斯拉一天内失去 2 个高管和 10
去年是「大模型元年」,今年会是「AI应用落
2024 年人工智能方向的就业前景怎么样?
如何评价小米汽车SU7全球首例无故抛锚?
如何评价比亚迪与大疆合作发布的车载无人机
如何看待波音「吹哨人」遗言曝光:如果我出
电动汽车为什么一下爆发了?
怎么看待华为太空宽带计划?
上一篇文章      下一篇文章      查看所有文章
加:2024-02-11 12:14:22  更:2024-02-11 22:40:51 
 
 
股票涨跌实时统计 涨停板选股 分时图选股 跌停板选股 K线图选股 成交量选股 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
网站联系: qq:121756557 email:121756557@qq.com  天天财汇