天天财汇 购物 网址 万年历 小说 | 三峰软件 小游戏 视频
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页 淘股吧 股票涨跌实时统计 涨停板选股 股票入门 股票书籍 股票问答 分时图选股 跌停板选股 K线图选股 成交量选股 [平安银行]
股市论谈 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
商业财经 科技知识 汽车百科 工程技术 自然科学 家居生活 设计艺术 财经视频 游戏--
  天天财汇 -> 科技知识 -> 如何看待手机厂商纷纷押注 AI ? 对于「2024 年是 AI 手机元年」的说法你怎么看? -> 正文阅读

[科技知识]如何看待手机厂商纷纷押注 AI ? 对于「2024 年是 AI 手机元年」的说法你怎么看?

[收藏本文] 【下载本文】
2023 年下半年至今,AI 大模型浪潮席卷智能手机行业,手机厂商陆续将大模型能力应用在手机产品上。近日,OPPO CEO 陈明永发表内部信称,202…
今晚别睡了,大的要来了。
上面这句话,就是很多行业很多赛道的很多从业者,在最近这两年的AI大模型风暴里内心陷入一团乱麻的真实写照。
由此,我们才得以看到很多经典的地狱笑话——比如某搜索巨头为了对标ChatGPT匆忙推出AI服务,在演示视频里出现错误且明显露出马脚的回答让自己市值一夜暴跌千亿美元;再比如国内厂商all in AI的“等于13”等等……
我知道你很急,但你先别急。
真正的押注,不是干写PPT,真正的all in,不是TVC发布,而是真要把AI薅得一干二净。
先不急着看手机行业,先看最明星的那家是什么情况——这波AI大模型风暴当中的溯源源头也是最大受益者之一的OpenAI,它们的最大投资者微软直接已经摆出了要把ChatGPT榨干的架势,无论是Bing还是Office,无论后端还是前端,旗下所有产品都在试图整合ChatGPT。
你是否还记得,结合了ChatGPT能力的新Bing在刚开始测试的那段时间爆火到了什么程度?很多人都开始试图找回许久不用的Outlook邮箱密码,排队求取内测资格,洛阳纸贵,对于巨硬来说,上一次如此门庭若市应该还是近三十年前大家抢购Win95的盘。
当一个新兴业态成长起来,对原有业态的冲击是致命的。
这就像当年我们普遍还在通过Web上网的时候,那些建站者和其所依托的搜索引擎想法都一样,它们没人会预料这个风平浪静的共生体系在多年之后从外部被攻破——App画地为牢割席出一座座信息孤岛,信息和内容不再涌入。
而当LLM AI大模型试图横跨所有系统生态、所有硬件平台,来重构一个AI OS的时候,当年那些包括不限于统治底层系统、拿下主流内容平台等等来继续讲上一个时代的故事的方法,似乎都不会奏效了,至少没人会信了。
同样,我们把目光重新锁定在手机行业之后,你也就能知道,为什么大家都要押注“AI”,如果让类似的事情发生在手机这个行业当中,那可就不是搜索行业的业务决策失误那么简单,而是事关生死存亡的毁灭性且不可逆的战略空靶——你不做,有的是人做。
举一个很简单的问题:今天的LLM AI大模型完全可以回答类似的问题“今天我在知乎关注的用户,有谁更新回答或者文章了?”
LLM AI大模型不但有能力回答这个问题,而且它们也完全有能力就在对话框里就能直接给你答案和文章窗口。
尽管大家都知道,在今天主推这种削弱智能手机APP生态的功能,在依靠后向收费盈利的智能手机行业里,与这个行业的商业模式天生相悖,以及为用户培养类似的使用习惯,也会与智能手机这个行业发生冲突。
但是,还是刚刚的问题,如果它们都不来革自己的命达成最优,单纯只在智能手机上做加法,那么,它们不体面就一定会有人帮他们体面,行业老大不愿意体面,就会有行业老二、行业老三等等的窥探者甚至是外来者推他们一把,甚至替他们体面。
理解了它们的矛盾别扭,才能理解AI手机一定是未来,无论AI手机以后会怎么挣钱,它都从模式上一定会抛弃旧有机制,当智能手机的基本盘动摇了,那些躺着挣钱的利润空间才会紧缩起来,这是一个万亿美元的超级大盘子,没有人不惦念。
一念成山,一念成海,鲸落十里,万物重生。
类似的事情在LLM AI大模型首先冲击的搜索领域实在有太多且太壮烈的前车之鉴。随便举个例子,比如一些早于MJ和各种GPT的AI绘画产品,在某搜索巨头那里早就做出来了,也配合了海量论文佐证规格秒杀所有竞争对手,但是至今它都不开放给用户使用。
搜索巨头不给开放使用的理由也很充分——防止恶意滥用、语言理解有局限性、主动规避风险等等,就在它还在内心戏充沛以各种名义进行挣扎和斗争的时候,LLM AI大模型的出现让这些产品还没来得及开放给用户使用,就已经被淘汰了。
对于AI手机这种尚未形成洪流的新形态产品,我的认知也经历了很多个阶段的变化。
一开始,我觉得AI手机可能仅仅就是一台智能手机加了一个云侧大模型夺舍的AI语音助手,让那个曾经一度被遗忘的手机入口史无前例地开始支持自然语言指令。
当然,这个确实很有意义,因为在此之前,所有带有搜索功能的软件,无论是浏览器搜索引擎还是手机语音助手,都只支持程序格式指令,比如在搜索引擎,你想让它搜索某个网站的站内结果,必须严格遵循“site:网址+关键词”的格式,否则无从下手。
因为一个搜索引擎或者传统语音助手根本看不懂自然语言,它们没有办法响应自然语言的命令去行动,因为这些东西进行工作的本质是开发它们的程序员预留了程序,来通过固定格式触发特定程序来提供对应的服务。
那么其逻辑内核最后也就是用一段代码去触发另一段代码再触发下一段代码,“人工智障”的现象由来也便在此,你不按格式来,它的代码就没办法触发,然后就一无是处了。
LLM AI大模型对于自然语言的理解,最先把这种东西给颠覆了,它不再只限于检索,而且还能计算。
有这么一天,我这个零代码能力、零编程能力的小白,突发奇想,用AI大模型版的小布助手问了这么一个问题:帮我用HTML写一个最简单的小游戏。
这就是基于自然语言的沟通,人类相互之间自然而然的沟通交流,就是这么来的,在LLM AI大模型问世以前,没有任何传统语音助手可以消化这种东西。然而,在小布助手的对话框里,它已经给出完整的代码了。




这让我想到了干掉命令行的图形界面的由来——它源于施乐的成果:一台不需要输入命令行的有可视化图形界面的电脑。乔布斯完整吸收了这套工业方案,并将图形界面的设计用在了日后的Macintosh上,盖茨要给Macintosh开发软件,也不再关注Dos,转进Windows。
自此,电脑才有了未来。
当年,图形界面之于命令行的革命,是让电脑不再只是懂代码的人才会使用,任何一个普通人都能快速掌握它的基本操作,让复杂的交互变成简易的点击。


同样,LLM AI大模型把自然语言带给搜索引擎、带给语音助手、带给手机,那么这些东西的本质都会变得不同,用户将拥有提需求的能力,一切复杂、个性、细节的想法,都可以交给AI去做。
与之相比,传统的输入关键词然后自行搜寻查找结果,就和在Dos写命令没什么区别了。
还是举例来说,我想看「所有关于月球的科普」,这就是一个需求,把它发给语音助手或者搜索引擎,它们是看不懂的。但是能够处理自然语言的LLM AI大模型知道我要什么,它会按照我的要求——如果我自己来,也会这么操作,只不过要花很久——把所有关于月球的搜索结果都看一遍,然后筛选出我想要的东西,全过程用时不到一秒钟。


这还是搜索吗?
好像也是,只不过它把搜索私有化了。
小布现在已经出现了这样的迹象,每个用户都在部署一个专属于自己的智能助手,玩得比较好的,和玩得比较差的之间,存在悬殊差别——玩得好的拿它写代码、改代码、做攻略,玩得不好的就单纯把它当成聊天机器人。
当然了,千人一面会带来无聊的感受,千人千面又会滋生信息茧房。
在端水这类事情上,永远都不可能让所有人都满意的东西,AI自然也是。
更可怕的是,这只是AI手机挥手砍下的第一刀,从OPPO创始人陈明永在那篇《开启AI手机新时代》内部信的构想里看,OPPO这类主流厂商对LLM AI大模型乃至AI手机行业的设想,绝不仅仅是做几个更加聪明的聊天机器人。
“通过AI,我们可以把手机的体验重新做一遍”、“已做好充分准备,并专门成立了AI中心,我们的资源将向AI集中”,也就是说,OPPO明显要为这些事情提供近乎无限的算力,自我学习的网络,以及前仆后继的投入。
那么,手机这个行业最后迟早会重写出一套史上绝无仅有的东西。
这是件正在进行中的事情。
其实,我更多关心的是,AI在多个领域相继完成大爆发之后,它到底还跟手机发生什么关系?除了一系列的战略支持、基建投资?作为比较纯粹的手机厂商,它们到底能靠什么力量来完成自己所部署的AI战略?
在现场听OPPO聊完之后,我有了一些初步的结论。


如前文所说,这是一个行业老二、老三甚至是外来者翻盘的机会,也就是一个可以破局的杠杆。
它至少会是一个到处存在的“智能助手”,随着时间推移越发人格化,并且记忆、感知甚至管理你的生活,打破原有的不同系统、设备之间的边界。
举个例子,还是拿语音助手来说,在AI加持下,未来的语音助手不会局限在简单的执行指令的层面上,而是基于准确的自然语义理解(前面已经给大家展示过),它能主动给用户提供一些建议,回答也是千人前面定制的,等训练得足够成熟了,它完全有能力在某一天判断你吃喝玩乐以及出行得偏好,比你还懂你,这既是我们的真实需求,也是现阶段的AI有能力做到的。
这也更加考验手机厂商的云侧AI和端侧AI相结合的能力——云侧AI指的是把采集到的数据汇聚到云端中心侧进行后续处理,在数据云端汇集训练,通用性强。像ChatGPT就是典型的云侧AI。端侧AI指的则是在终端设备上进行的轻量模型,在手机、电脑上就能完成AI计算。
其中,个人生活习惯、隐私的数据必须要在端侧处理,那么“端云协同”策略就是必然。
当下,OPPO已经对AI手机做了非常明确的定义:
1、能够高效地利用计算资源,以满足AI时代下生成式AI的计算需要;
2、能敏锐地感知真实世界,了解用户与环境的复杂信息;
3、拥有强大的自学习能力;
4、具备更充沛的创作能力,为用户提供持续的灵感与知识支持。


这可能不太好理解。
但我们可以发现OPPO在Find X7上做的动作就能对应的上这四个定义——首款完成70亿参数大模型端侧部署的手机,在此基础上陆续搭建了全新升级的小布助手,拥有AI画师、小布照相馆、小布连麦等100余项功能,还实现了AIGC图片消除、语音通话摘要、文生文和图生图等诸多功能,涵盖办公效率、生活服务和学习教育等不同维度。
这些东西所带来的功能体验很多是颠覆性的,比如AI通话摘要,以往,我们在通话中需要记录重要信息时,要么拿纸笔要么敲键盘要么录音,但大模型落地OPPO手机之后现在就可以通过AI自动为你总结出通话信息。
而且,这绝不是简单的把语音转文字,而是听懂通话内容之后归纳核心要点,比如时间、地点、人名和具体的待办事项,一目了然,这是过去只有人力才能完成的工作。还有接下来我要展示的AIGC消除功能一键拯救“废片”等等都是此类。
今天,AI于OPPO,就像当年的初代Find N折叠屏于OPPO,都是——从尝鲜到常用。
OPPO,凭什么?
最近这几年,OPPO的投入有目共睹。其全球专利申请量已超过98000件,全球授权数量超过54000件,其中91%是含金量较高的发明专利,且集中布局在5G和AI等前沿技术领域,2023年,OPPO自主训练的安第斯大模型,在Super CLUE知识与百科能力排行榜上仅次于GPT-4,领先于其他所有的大模型。
前几天,我凑巧在新落成即投入使用的OPPO滨海湾AI大数据中心参加了那场让我留下如此之多感受的AI战略发布会——在此之前,OPPO就早已商用了自己的大数据模型AndesGPT,并向旗下几乎所有产品推送了具备AIGC功能的新系统。
已经大量推送的AIGC功能给了OPPO了解用户对AI能力喜好的机会,其调研结果也是AI手机继续延展的方向,例如刘作虎在会上分享不少人喜爱的AIGC消除,平均用户一天会使用15次。


比较重要的部分,是OPPO发布的全新“1+N 智能体生态战略”,涵盖包括知识、记忆、工具在内的OPPO AI 超级智能体,以及面向开发者的OPPO AI Pro智能体开发平台,说明他们至少现在就已经有了做AI智能体生态的打算了。
而举行这场发布会的滨海湾AI数据中心,也是首度对外开放——从算力的架构部署、热力一体设计、缜密的灾备和备份能源的保障以及整个园区零碳和绿色能源的应用,不难看出OPPO长期持续部署的投入、决心。








云侧之外,还有端侧AI能力,OPPO通过与联发科技等芯片厂商深度合作,形成了端侧的高效异构计算架构,能更好地适应AI时代的硬件平台特征。在Find X7上搭载的具备出色生成式Al能力的天玑9300旗舰平台,就凭借AI算力和AIGC功能为端侧生成式AI提供了底层性能和技术支持,同时也让Find X7系列在文本和视觉的处理响应上有着卓越表现。
比如,Find X7系列200字长度回答首字只需要0.2秒,领先同平台其他模型20倍;视觉生成速度则领先60%,AI算力跑分位居安卓第一。
总的来说,对于AI手机现在能做的事情,无论你怎么看衰我觉得都不过分,相比理想当中的赛博贾维斯之类的东西,它确实还很笨,并不科幻,也不高级,绝大多数夸赞过火的评论都是源自这些盛赞者见得太少、玩得不够多,但在AI手机未来能做的事情上,我觉得你怎么高估都不算过火。
毕竟,任何东西的发展都是从量变到质变。
念念不忘,必有回响。
创业者、观察者、研究者、媒体,一直都在争论个人电脑、智能手机之后的下一代平台究竟会是个什么样子?AR、VR、元宇宙全都作为风口刮起过,但是当下看来,取代智能手机的下一代平台的样子,未必一定会是某种全新的平台。
LLM AI大模型连同背后的整个产业就完全不是一种全新的平台,但是它们所涵盖的计算资源已经到了一个过去难以想象的地步。这么下去,总有一天,由AI直接或者间接生产输出的东西,将在某一天超过人类自己。
AI手机如是。
以上。
为什么手机厂商纷纷押注 AI?
人类是孤独的,至少我们自诩是孤独的。
我们尝试探寻智慧的本质,并且创造出智慧的主体。到了上个世纪,计算机的出现使得这一梦想成为可能,而这种承载了理解数据、从中学习,并利用知识实现特定目标和任务能力的智能体,就被我们称为 artificial intelligence,AI。


在人工智能概念提出后,各路科学家就在不同的路径上进行探索,包括对神经元进行数学模型的建立,计算机博弈,基础神经网络,再到后来的机器学习,模式识别,反向传播,CNN/RNN 模型,K 最近邻等一系列技术手段。
人工智能的发展并不是一帆风顺的,在 70 年代,XOR 线性不可分的问题一度让神经网络研究陷入了“训练算法有效性难题”,这一问题经过了快十年才逐渐复苏。但随后,新一代的人工智能应用开始走入新的发展高潮,人工智能开始在特定问题的解决上展示出了优秀的进展,尤其是对于特定知问题的重大突破,已经可以进入应用阶段。


互联网时代的到来进一步加速了人工智能技术的普及和应用,而这,正是我们身处的时代。
AI 之所以会再次被推动到前端,其实和供需两端都有关系。
首先,我们身边的智能设备已经达到了一个非常成熟的阶段,尤其是智能手机,它在形态和功能上都已经几乎获得了普遍的最优解,而在这个基础上,我们想要更进一步,光靠通用能力的进步,也就是所谓的 CPU 快多少多少,GPU 快多少多少,其实对于使用体验已经不会有革命性的提升了。
淘宝打开是 0.5s 还是 0.3s,开放世界游戏是 60FPS 还是 59.9FPS,当然有不同,但它已经不是那种天差地别的不同了。像今年的 D9300 或者 8G3 这些性能非常强劲的平台,日常使用哪怕是比较重载的场景,都很难摸到它的极限,大家更关心的其实是能耗比和综合的体验调优。
我们期待着的下一次“设备革命”,目前也有几个不同的方向,除了设备形态上的变化,更为各大厂商所肯定且坚定选择的,则是“设备智能化”,而人工智能,正是赋能这一未来的重要基础技术。
我们所期待的未来是拥有能够真正能够思考的机器、真正能够感知环境、理解环境的机器。


这种机器将会深刻改变人与机器的关系,由Human-Machine Interface 向 Human- Machine Collaboration 的转变,从人机交互界面向人机协作界面的转变。
同时,它也应当具有普惠性,对各行各业具有强大的辐射效果。
作为过去十年里对这个世界产生最伟大改变的设备,那无疑就是智能手机,现在的你我都很难想象一个没有智能手机的世界。这也是为什么智能手机厂商纷纷押注 AI 的原因——当下一波浪潮到来时,没有谁想被抛在沙滩上,而为现有设备形态用新兴的人工智能赋能,就是当下手机厂商最为急迫的任务。
这是厂商的需求。
对于用户来说,对于真正的“智能”手机,也有着广阔的需求。


尽管我们仍然处于 AI 的早期阶段,但手机 AI 其实已经无处不在,不管是利用 transformer 模型进行的大语言模型翻译,还是应用成熟 AI 技术大图片分类与处理,其实之前手机里零零散散的已经存在了很多 AI 应用。


但在 2024 年这个时间点,用户会希望自己的手机具有真正的通用,或者说,更接近通用的全能 AI 能力。它应当具有主动式、智能式、多模态、平台式的特征。
功能机的出现将手机由一个简单的电讯通信设备升级为一个多媒体终端,从此,早期只能打电话和发短信的设备被淘汰,手机可以拍照、录像、发电子邮件、还能简单浏览文本和多媒体内容,应用场景得到了极大拓宽。
智能手机相比于传统功能机的跃升在于对更丰富传感器和数据的利用,更方便、灵活的输入(多点触摸屏)和通信能力的跃升。我们有了应用商店,大量第三方开发者涌入,利用手机硬件的平台能力开发出了丰富多彩的应用,从小型休闲游戏到现在游戏主机画面的大型游戏,从最开始的简单记事本到现在几乎全功能的准桌面级办公套件,甚至还有视频编辑软件,丰富多彩的社交平台,它让设备成为了我们自由意志的延伸。
而在 AI 时代,我们有望看到真正的智能设备,或者说“拟人设备”。它会更像我们的伙伴,而非我们的工具,它将会与我们协作,共同塑造下一个即将到来的“能力平台”。
历史的客观规律告诉我们,多就不能快,好就不能省。
在这个竞争愈发激烈的时代,要想做好 AI,手机厂商需要什么?
答案是人才、数据、算力、算法、决心。


人才这个事情,虽然有句话说这个地球离了谁都能转,但很多事情,有一支强大的团队那还是干起来容易很多的。其实早在 18 年,OPPO 就通过贝尔计划,与全球顶尖高校开展合作,对于前沿科技领域进行人才培养。OPPO 的深圳研究院,也率先进行了这方面的人才储备。在 2011-2020 年的十年间,OPPO 的 AI 专利数量排名全国第三,仅次于国家电网与腾讯科技。这种从人才培养抓起,长期主义并且持续投入的思路,是很好的产学研结合范式,值得肯定。
第二个要点是数据。数据是现实世界映射到虚拟世界的一种方式,而指数级的数据增长,为“喂饱”AI 提供了基础养料。大模型目前来说,越大越强,而越大,训练数据越多,数据质量越好,一般来说结果也就上限越高。
在 AI 时代,会显示出非常明显的赢者通吃,先发优势。首先,只有大厂才能有足够大的数据体量来做这个事情,在 AI 时代不存在小而美的路线。尤其是大模型,越大越强的路子还没穷尽,只有搞基建和基于基建二次开发两条路子。
想要获得一席之地,手机厂商必须自己搞基建,自己打通系统与模型的壁垒。前段时间与一些行业内大佬的沟通,大家取得的一个共识就是,小厂在这个时代最好是做依附于成熟大模型的二次应用开发,自己从头炼丹这事儿,别说小厂或者一般的研究院校了,就算是 Tier 2 的一些厂商,也根本搞不定。而 OPPO 在这方面,依托庞大的海内外用户基础和设备,恰恰是很有能力和愿景去推动 AI 发展的一家公司。
至于基础设施建设,我觉得 OPPO 滨海湾的机房建设,就非常符合我对一家全力投入 AI 赛道的期待。也正是在这个庞大的机房里,这些拥有强大算力的服务器训练出了多款不同数量级的大模型,在中文手机自研大模型中名列前茅,覆盖了从端侧、云侧,更有服务侧的不同模型。
这里是造梦的场所,也是 OPPO 全力押注 AI 的底气所在。
这里就要讲到一个叫算法端云结合的概念,手机,作为一个被动散热的手持设备,它大概只能承担 5W 左右的持续负载,再考虑到其它应用的占用,要想做到 AI 智能设备,这个 AI 就必须是端侧与云侧相结合的。
端侧解决什么问题:always ready(时刻就位)、快速响应、轻量化、隐私保护,云侧解决什么问题:复杂推理、多模态、大规模,不同的模型规模适合不同的能力,拥有不同的延迟,因此,只有合理的端云协同策略:如何判断什么时候用哪一个大模型,如何让用户无感,才能真正让 AI 无缝、无感的融入设备的使用之中。


这需要对用户需求有着深刻洞见,在 Find X7 Ultra 的发布会上,我觉得朱海舟演示的那个 AI 通话记录功能,就是 ColorOS 14 AI 能力的很好展现,它打通了手机底层能力与 AI 能力的鸿沟,让通讯、通话、STT、LLM 总结、系统应用接入等一系列环节统一起来,并且能够无感识别多种方言,这就不是为了打榜或者参数的简单比拼,而是真正考虑到不同地区不同文化背景的用户,会怎样使用设备,会有着怎样的需求而做出来的功能。


最后,是决心,也就是长期投入。AI 的成功是需要坚持长期主义,需要在这条赛道上持续投入的。它不是简单推出一个产品,或者往现有功能加个 AI 前缀、或者大力出奇迹做个模型来刷榜就可以了,而是要对未来的产品发展有一个明确的规划,并且稳步推进。这个世界现在有太多的不可抗力,但排除掉这些不可抗力外,也需要有确定的路线和领导的决心。OPPO 首席产品官刘作虎将资源向 AI 集中,大力加码在数据中心,人才团队、软硬结合领域的深入投入,展现了对这一领域的决心。
有了这几块基础,我想,我们离深度融合赋能的 AI 设备,并不会太远。
为什么 2024 是 AI 手机元年?
最后回到这个问题,我们以 OPPO 为例,讲述了为什么 2024 年是 AI 手机元年。
简单来说,就是万事俱备,东风已来。
在技术上,大模型的涌现为“世界模型”打下了基础。LLM 模型给我们带来的震撼我想已经不必多言。维特根斯坦曾经说过:语言的边界即世界的边界 ,我们可能没有想到这句话在 21 世纪,会以这种形式被“证明”。一个强大的语言模型不仅能够描述世界,更加能够经过微调后快速上手几乎任何一项任务,这种通用模型和强大的普适性,以及文本交互的低侵入性,让它极为适合作为一个新的交互入口。
在硬件上,NPU 能力的跃升提供了端侧运行“可用 AI”的基础。今年无论是高通还是天玑,旗舰芯片都大幅加强了 NPU 的能力,能够在本地以低功耗运行近百亿参数的模型,这让本地模型的能力大幅提升,因此,服务端的压力得以大幅减轻,新的端云结合策略可以落地。
原本零散各处的 AI 被统一起来进行重新组织,开始构建系统级 AI 底层能力。从 ColorOS 14 上,我们可以看到尽管 UI 只是进行了微调,但其实在底层正在进行大量的重构,AI 能力底座为发力 AI 打下了坚实的基础。各大手机厂商也开始拉通不同部门、不同领域的 AI 专家,大家不再闭门造车,而是终于开始“全局一盘棋”,从以应用的视角考虑,到从以设备乃至体验的视角考虑,打通全局 AI能力。
万物互联对“人”以外的计算中枢智能提出了更高要求,需要解决信息过载的问题,AI 对信息的提炼、提纯将会极大提升工作、生活的效率,AI 的发展也迎合了数字健康(digital wellness)的潮流。
保守一点来说,通用人工智能仍然离我们有相当长的一段距离,但是,现有的 AI 技术很有希望让我们离他靠近一大步。
世界是一切事实的总和,而语言是命题的总和,命题是事实的图像。
我们通过命题去理解世界,又通过理解来改变世界、创造更多全新的事实和命题。2024 年,大抵的确是 AI 手机的元年,这是时代的浪潮,而想要争当弄潮儿,需要决心,需要勇气,更需要能力。
事实就是,无论是否高调入场,All in AI 已经成为所有手机厂商的共识。
自 ChatGPT 横空出世后,一个老生常谈的话题就是 AI 要将所有行业都重新做一遍,手机行业也不例外,自研大模型都迅速上马,动作快的都已经随系统一起推送到手机终端了,像安第斯、蓝心、盘古、MiLM……AI 显然已经成为现阶段智能手机的一个重要功能了。
21 世纪的第一个十年,是移动通信的普及改变了人类的通讯效率,21 世纪的第二个十年,是智能手机的普及颠覆了人类的生活方式,那么当我们未来回望 21 世纪的第三个十年时,一定会发现,是 AI 手机的普及再一次改变世界。
这便是自功能机、智能机后的第三个手机发展阶段——AI 手机。


而且这一概念也并非 OPPO 生硬造词,而是真正已经是所有手机厂商的共识了,IDC 甚至预计 2024 年国内手机市场新一代 AI 手机出货量会达到 3700W 台,到 2027 年会达到 1.5 亿台甚至超过 50% 的市场占比。


AI 手机元年是 2024 年,但是手机做 AI 可不是始于 2024
事实上,手机厂商 AI 比大众印象里发展得更早,手机中的诸多功能的背后都是 AI 算法。
比如移动影像最重要的「计算摄影」就是基于「AI 算法」所实现的。
举几个例子:人像的美颜、模拟真实景深的虚化效果、夜景模式下的降噪提亮、大光比场景下的压高光提暗部、逆光情况下的消眩光、乃至色彩光影的影调还原等等……在传统 ISP 计算已经到极限的现在,我们手机上用到的大部分计算摄影能力的背后都是依靠 AI 算法所实现的,这也是这几年旗舰手机发布会越来越强调 NPU 算力的原因所在。
除此之外,像是语音助手、搜索框的应用推荐、相册的智能分类、游戏中的超帧超分包括这次 OPPO Find X7 上搭载的 AIGC 消除等等都是 AI 算法在手机中的成熟应用。


而这些 AI 算法实际上已经应用很久了,从产品的开发周期来看,研发、立项都只会更早,看似 2024 才是 AI 手机元年,实际上早在四五年之前,动作快的厂商就已经起步了。
所以这些手机厂商不是跟随热点突然加入 AI 竞赛的,而是早就已经是 AI 玩家中的一员了,还是最早的那一批。
说个反直觉的爆论——手机厂商做 AI 可能会比互联网公司做 AI 更有优势。
现在人人都是手机不离手的状态,人均单日手机使用时间都已经超过 6 小时了,无论占据手机使用时长最久的是哪个 App,人离不开的永远是手机。
用户数据的量级上可能互联网公司和手机不相上下,但是数据的全面性和实际数据价值可能就会相差甚远了,互联网可能没那么了解用户,但手机一定更了解。
再加上手机有着更丰富的传感器,以及不错的本地算力和联网能力,从理论上来看,手机厂商有更庞大的数据、更强的真实世界感知能力、以及不完全依靠云端的本地算力,基于「手机是目前最为普及的个人智能终端」这一事实,手机厂商更有可能先于互联网厂商找到 AI 大模型的真正杀手级使用场景,让 AI 成为大众生活中不可或缺的部分。
不用再质疑手机厂商为什么要 All in AI,这样是否有出路了,生成式 AI 本就应该是手机的一个重要功能,手机对于 AI 算法更是有得天独厚的先发优势。
不说别的,就光是把 AI 大模型接入语音助手,就足以让现在的智能手机比以往任何一个时候都更担得起「智能」二字。
AI 手机竞赛早已拉开帷幕,谁能拔得头筹?
提出 2024 是 AI 手机元年这一说法的其实就是 OPPO,这足以可见其内部对于 AI 的重视,即便是抛开其高调宣扬成立 AI 中心这件事来看,只看成绩,OPPO 也是当下 AI 手机竞赛中的 T0 级选手了:
1、OPPO 自研的安第斯大模型能力已经在多项榜单中都排名靠前:
(23 年 9 月,SuperCLUE 能力排行榜知识与百科评比中,OPPO 自研的 AndesGPT 就以 98.33 的高分获得国内第一的成绩,在另一项角色扮演能力中也排名前三,23 年 10 月,AndesGPT 也在 C-Eval 全球中文榜单中以 79.9 的高分登顶。)


这种榜单其实会从多个不同的角度、不同的学科、多层次多难度级别地对市面上的大模型进行评测,比如会选择一些初中、高中、大学乃至注册工程师的考试真题来对大模型进行测试,下图就是 AndesGPT 70 亿参数版本在 C-Eval 测试中不同科目下的回答准确率,坦白来说,其知识水平和能力模型已经超越了绝大部分普通人。


而 OPPO 的大模型在这种评测榜单中获得了不错的成绩,其实也能在一定程度上说明 AndesGPT 的性能有多强大,而且值得注意的是,这个榜单中不只是手机厂商,各大互联网厂商开发的大模型也都可以参与测试,实际上无论是互联网厂商还是手机厂商中,OPPO AndesGPT 都可以算作大模型能力第一梯队的存在了。
2、OPPO AndesGPT是多个参数级大模型的集合体,兼具云端的强算力和终端的高速率
OPPO 的 AndesGPT 包含了 70 亿至 1800 亿等多种不同参数规模的大模型。
相比互联网公司的大模型,OPPO 的 AndesGPT 在实际体验上可能更好,因为它不会所有问题都由千亿参数级的大模型来解决,而是用终端侧的参数量稍小的大模型来解决简单的一些问题,对于更复杂需要更高算力的问题用云端的参数量更大的大模型来解决。


这有点像手机处理器的大小核架构,不同性能和频率的核心处理不同的计算,不同参数量级的模型对应处理不同的任务,以达到算力资源和计算性能的均衡和体验最优。
对速度要求高,响应时间有严格要求的任务,优先以本地端侧大模型解决,反之,对性能要求更高,响应时间没那么严格要求的任务,就分流到云端大模型来进行解决。
落实到具体场景的话,比如输入法的单词联想,可能就会优先端侧模型,而写代码写论文这类需要更大算力推理的任务就要云端模型完成。
而端侧和云侧除了分工还可以进行协同,以达到比单一模型更快且体验更好的效果,比如 OPPO Find X7 系列上已经搭载的功能「通话摘要」,语音识别转文字就可以放在本地端侧大模型来完成,而总结摘要这类需要更高算力去推理的工作,就要云端的大模型来进行运算了,这样端云协同才能有最快+最优的实际体验。


以实际表现来看,Find X7 系列的通话摘要甚至比我自己边打电话边做笔记的效果更好,它不是简单地讲全部通话内容转换为文字,而是真正地总结提炼这次通话中的核心要点,比如时间、地点和具体的工作任务,还会自动根据时间生成一个待办事项,真的不负「摘要」二字。
3、自建 AI 数据中心,算力资源自主可控建立长期优势
OPPO 对算力的需求发展很有远见卓识,早在 2019 年就设计部署了 AI 高密度风冷机房,现今面向 AI 训练业务,能有效满足 AI 大模型训练对功率密度和网络传输的高要求(单机柜功率高达 16KW,为常规机架的 3.6 倍)。还有散热更强,能耗更低的浸没式液冷机房等。


总之,OPPO AI 数据中心目前已经初步部署了超万台服务器,已经拥有了千亿级 AI 大模型训练的算力,以及 2ms 的骨干网络链接超低时延,能够保障高效可持续的算力资源。
4、芯片厂商深度合作,AI 端侧性能天花板
通过和联发科等芯片厂商的深度合作,OPPO 已经实现采用 4 位量化技术,率先实现这种行业内最优大模型端侧部署方案,做到精度不掉点性能更优。还能基于同一个模型采用两个方案共同计算,从而大幅减少模型的内容生成时间。


落实到体验上来说就是,Find X7 生成一个 200 字回答首字只需要 0.2s,领先同平台其他大模型 20 倍,视觉生成速度也要领先 60%,AI 性能算是手机中的天花板级别了。
到底什么是 AI 手机?
摆在我们面前一个很重要的问题就是,原本的智能手机也能下载大模型 App,这和 AI 手机有什么区别?
如果说智能手机的所谓「智能」是被动的,更多的是通过人的指令和操作来使用丰富的功能,那么 AI 手机的「智能」则会变得越来越主动,很多功能和操作将不再依赖人来完成。
OPPO 牵头发布的《AI 手机白皮书》明确给出了 AI 手机的定义,主要有以下四个方面:
算力高效利用能力、真实世界感知能力、自学习能力、创作能力。
而这四点实际上正是 AI 手机和现今智能手机主动智能与被动功能的分隔所在,我们一项一项来说:
算力的高效利用,AI 手机在端侧部署大模型后,能利用端侧部署的本地模型和云端服务器的模型协同工作,实现速度更快且综合性能更优的大模型体验(正是我们前文中提到过的端云协同)。而只安装了云端大模型 App 的传统智能机,则与任意一个通过浏览器接入云端大模型的终端体验没有任何区别,手机中的大部分功能并没有接入大模型能力。
真实世界的感知,对于传统智能机而言,手机中的各个传感器真的只是实现特定功能,记录单一数据的作用,比如摄像头就是拍照,就是视频,但是 AI 手机能够通过手机中的各项传感器获得对这个真实物理世界的感知能力。比如 AI 识图这个功能就是利用手机的摄像头,让大模型也有了「视觉」,语音助手和人对话就是利用了手机的麦克风和扬声器,让大模型也有「听觉」和「说话」的能力。
自学习和创作能力更是当下智能机所薄弱的能力,AI 手机能更好地通过机器学习更深入了解用户的习惯,做到更懂用户,更精准地预测用户需求并提供服务。比如搜索框的应用建议,AI 手机会在智能机的基础上,根据时间和地点以及网络情况,联系起用户的行为习惯来更精准地预测用户的需求。也会有更强的内置生成式 AI,拥有更强的智慧涌现和创作能力。
AI 手机对于普通人的意义所在
实际上 AI 手机的普及已经悄然发生了,从几年前手机影像算法的一次次颠覆传统影像思路,到手机系统越来越智能和丰富,其实都可以视作是 AI 算法的功劳,只不过这些都是对 AI 能力的初级使用,且应用也比较分散。
当下的第一代 AI 手机所搭载的 AI 消除、AI 通话摘要、AI 助手这些智能功能也是逐渐将 AI 能力接入到手机使用中的方方面面。


未来 AI 手机更是能会现在的所谓智能系统进一步变为更强的 AI OS,以全面覆盖用户的使用场景,甚至还会有我们如今根本想不到、预测不到的新场景出现。
至于意义,可能「改变世界」这四个字听起来太像画饼,离我们也太遥远(毕竟人类是想象不出没见过的事物的),但是对于我们普通人而言,手机从功能机到智能机再发展到进一步的 AI 手机,变得越来越智能的意义其实都可以归结为「科技普惠」这四个字。
消费级的科技产品一直以来在做的事就是让更多人能享受到新技术、新科技为生活带来的便利和乐趣,AI 手机的出现也是一样,它正在悄然改变着我们,改变这个世界。
多年以后未来的数码爱好者们会记得,2024 是 AI 手机元年,智能机从这一年起全面蜕变为 AI 手机。
AI 手机、AI PC 这类概念最近被经常提及,不过这个概念在过去这几年里已经逐渐萌芽。单纯就设备本身来说,假设包含有 NPU 的手机都算是 AI 手机的话,那 AI 手机在两年前就已经出现,那么现在这个 AI 手机的概念真正区别于以往是什么呢?
AIGC 应用逐渐成形并形成生产力,用户需要触手科技的 AI 产品;
印象所及,普罗大众对 AI(人工智能)的第一次震撼来自于 1997 年 5 月 Deeper Blue 成功挑战国际象棋世界冠军卡斯帕罗夫,前者以 3.5:2.5 的战绩获胜,它的算力据闻大约是 11.4 GFLOPS,由 480 枚特别定制的象棋芯片组成:


图片来源:IEEE
当时这消息在几乎所有媒体上都有报道,热闹了好一阵子,但是对普通人来说,感受其实并不是很深,只能算是一个比较有趣的猎奇话题,毕竟国际象棋对许多人来说还是比较陌生。


上图:AlphaGo 系统
在这之后 AI 战胜人类故事还在上演着。2016 年,AlphaGo 首次实现了战胜人类围棋冠军李世石,和当年 Deeper Blue 不同的是,AlphaGo 不再仅仅是一个简单的程序,而是具备自我学习和完善的人工智能。当初战胜李世石的硬件系统(AlphaGo Lee)主要由 48 块 TPU 组成(更早之前的 AlphaGo Fan 是 176 枚 GPU),随着“棋艺”的进步,到了 AlphaZero(棋力 Eio 值为 5000+,比 AlphaGo Lee 高 1000 多,以 100:0 的战绩击败了 AlphaGo Lee)的时候只需要 4 枚 TPU。
人们意识到 AI 开始变得切实可用了,但是很明显,让 AI 干活还是需要较强的相关知识,里普通人还是有一定距离。
在 2022 年 ,大型语言模型(LLM)震撼了整个世界,因为这次 AI 实现的语言理解能力达到了非常高的水平,撰稿、拟大纲、编写/分析程序代码都可以轻松实现,还能根据用户需求做更合理的修改,强大的上下文分析能力,不仅人们可以直接用自然语言要求 AI 干事情,而且 AI 还能以自然语言的方式回答人类。
至此,AI 已经在学习成本极低的情况下为普罗大众快速提高生产力,而且完成能力非常出色,对许多脑力工作者来说已经是不可获取的辅助工具。
目前大部分的 LLM 或者 GPT 类型 AI 应用基本都是透过云方式提供的,端侧部署运行的虽然不少,但是受制于模型规模和算力限制,大都有一定约束,像 Stable Diffusion 在本地部署的话,目前只有性能较强的 PC 才具有实用性,手机想要使用的话,一般都是透过网络访问。
手机在各种 AI 应用场景里有天然的优势:高度便携而且基本上是人手一台,这样的优势是台式机或者笔记本电脑等其他设备无法比拟的,因此不管是什么厂商都会把手机作为最重要的 AI 终端。
随之而来的问题是:手机上的 AI 应用太过散装了。百花齐放很多情况下当然是好事,但是对许多用户来说,则未必全然如此。
以历史发展来看,随身便携的电子产品大部分人都是希望使用越简单越好,水果公司的 iPod、iPhone 能取得巨大成功离不开简单易用的操作设计,同样 AI 加持的手机也必然需要在 AI 使用方面做到尽可能简单高效,而且 AI 本来的主要目的之一就是简化用户操作。
手机厂商开始深度介入 AI 领域,构建自己的大模型和云 AI 服务;
让手机 AI 使用更简单的最直接办法就是手机厂商大力拓展自家 AI 平台,这包括了 AI 数据中心+自研大型语言模型(LLM)+自研硬件技术体系。
要实现高可信的 AI 应用效果是需要对大量数据进行处理的,不管是模型训练还是推理应用落地,都离不开海量 AI 加速器、存储以及强大的网络基础:


上图是目前 nnlabs 提供的不同 AI 模型、数据中心以及加密币的耗电需求,像 OpenAI 的 GPT-3 175B 训练大约需要消耗 284000 度电,从侧面反映出目前最主流的AI 计算(LLM)的确需要极高的投入。当然,如果 LLM 训练好后用于内容输出的话,100 页的文本所需要的电力成本也就是几毛钱。




上图分别是 OPPO 滨海湾 AI 数据中心和其中的高密度风冷机房,整个园区规划部署 12 万台服务器,100% 绿电,实现了范围二整体零碳排放。


上图是 OPPO 滨海湾数据中心里的浸没式液冷机柜,每个机柜可容纳 16 台 GPU 训练服务器
OPPO 是目前第一家开放展示 AI 数据中心的厂商,按照这次看到的情况,滨海湾数据中心里除了有 2019 年就开始部署的 16 千瓦的高密度单机柜(功率密度是传统 4.4 千瓦机柜的四倍)外,还有多个楼层部署了大量能容纳 16 台 GPU 服务器的液冷机柜,可以看到 OPPO在 AI 手机方面上真的是倾注了大量的资源。
正常状况下,对于消费端为主的 AI 手机数据中心,部署的应用类型应该主要是以推理为主(手机用户向 AI 发出请求后,AI 调用训练好的模型网络参数计算结果并反馈给用户),训练部分相对较少,至于推理和训练的系统具体比例如何,目前应该还是机密。
数据中心有了后,自然就是部署自主模型。
现在各个手机厂商都有自己的自主模型,像 OPPO 的安第斯大模型等,之所以要上自主模型原因并不复杂:体系匹配。
各家厂商的研发进度、软硬条件、目标设定不尽相同,第三方的模型方案往往无法同步满足需求,底层接口等涉及商业秘密的部分也只有自主模型才可能掌握在手里,也只有这样才能让 AI 应用开发度身定制并快速部署,此外,第三方模型方案的更新、调整往往可能需要一等再等,最终造成客户体验降低。
在手机市场高度竞争的当下,自主模型虽然会增加研发开销,但是确实是维持竞争力、体现产品差异化的必要手段。
举个例子,如果你使用过 Stable Diffusion 的话,应该会知道目前除了有大量的 SD 基础模型外,还有难以计数的海量 LoRA 微调模型、ControlNet 参数控制模型等,人们弄出这么多不同的模型,目的就是在部署、运行成本较低的情况下提供尽可能丰富且可控的 AI 输出。
AI 手机厂商采用自主大模型也是类似的考量,那就是可以根据自身软硬件技术以及设定的目标开发、调整模型,实现全程可控。




值得关注的是,在 OPPO 的 AI 白皮书里提到了名为 AI Pro 的开发平台,这个平台目前还只在 OPPO 内部使用,但是今年会对外正式发布供大家使用。这对于 AI 手机来说是有重大意义的,因为这个平台提供了可视化的 AI 应用整合能力,让普通用户以自然语言、零代码的方式生成自己的 AI 智能体,AI 应用散装化的问题在这里能得到较好的调和。
手机发展已经经历了功能机、智能机时代。
在功能机时代,手机的功能基本局限于出厂时候的状态,用户自行添加应用的能力有限,大家关注的都是一些现在看来很基本的功能,例如短信、音乐、通讯录,再强的功能基本上都受制于功能机而无法很好实现,目前而言,功能机只有在一些特殊的场合比较容易看到,例如需要长续航、无法使用智能机的场合。
水果公司凭借 iOS、多点触控将手机带入真正的智能机时代,许多功能机时代叱咤一时的厂商都在智能机时代败下阵来。
智能机的性能、存储能力较功能机大为增强,吸引大量第三方开发商为其添砖加瓦,用户透过这些软件实现了台式机、笔记本电脑的大部分功能,特别是像微信、各种购物 App、支付 App,让人感受到了一全新时代的到来,智能手机不仅终结了功能机,还让一些原本发展蓬勃的行业遭受沉重打击,例如相机行业现在的销量也就是智能机时代之前 1/4 甚至不到的水平。
随着摩尔定律逐渐失效,芯片的性能提升逐渐乏力,智能机的发展也开始面临瓶颈,在过去数年里,手机厂商和上下游都正在寻觅新的突破点,例如尝试自研芯片保持产品差异化,但是随着以GPT 为代表的 AI 应用落地,能转化为生产力的 AI 很快就吸引了行业的注意,纷纷加注 AI,形成了名为 AI 手机的新概念。
和功能机、智能机有点不同的是,AI 手机的关注点不再仅仅局限于手机设备本身,而是一个非常大的集合,包括了端云 AI 部署、AI 功能整合等庞大内容。
现在回看过去的话,可以看到当年水果推出的智能手机的确给行业带来了翻天覆地的变化,但是在当年其实很多同行对此是并不以为然的,给出的理由也好像有些道理,但是最终的结果是不少功能机时代的巨头陨落,甚至连盛极一时的山寨机也逐渐销声匿迹。
AI 手机现在正逐渐成型,它首先是智能机基础上的进一步演化,需要拥有一定等级的性能规格,除了 SoC 要得到升级引入 transformer 算子硬件加速外,像 16GB 内存等目前智能机看上去比较高的规格,在 AI 手机时代很可能成为基本配置。
但是光凭手机本身其实在不少情况下是难以承载 AI 的所有计算需求,其背后必须依托强大的数据中心提供 AI 运算服务支撑,在 AI 整合方面也不是单个手机厂商就能完全独力实现的,必须有全行业共同参与,在 AI 手机应用牵涉的通用接口、提示词打标等方面形成共识,才能让 AI 手机提供应有的更好体验。
总的来说,手机厂商押注 AI 是必然的,一方面就好像货币天然是黄金一样,手机天然就是最佳的 AI 终端,而 AI 在生产力、日常交互等方面已经展示了强大的能力并且有难以想象的发展空间,谁在 AI 上懈怠谁就会在未来的手机竞争中处于下风。
根据 OPPO 自己在媒体交流会上透露的统计,ColorOS 14 发布后,他们发现 AI 消除这个功能非常受欢迎,只要销售给客户展示这个功能后,下单率就会显著提高。这说明 AI 手机的概念即使对许多人来说还是比较空泛,但是当它的功能展现出来时,许多人都会深受震撼,他们切实地感受到了 AI 手机能给自己带来的价值。
AI 的发展其实已经有很长历史,现在可谓是厚积薄发,就好像当年皮衣黄做 CUDA 的时候也根本没料到这个泼天富贵会降到自己的头上。
AI 手机也是类似的情况,虽然已经有了一些 AIGC(AI 生成内容)应用在手机实现并取得了初步成功,但是未来会长出怎样的硕果大家也是在不断探索中,前面依然有大量的问号在等待着,这就需要进行大量持续的研发、验证,而 OPPO 的滨海湾数据中心就可以为这样的探索提供坚实的基础。
AI 行业的发展现在日新月异,每隔几天业界就可能有闪瞎眼的新突破,例如最近的 SORA 文生视频,其效果让以往的文生视频相形见绌,这背后需要强大的人力物力支撑并且要有准确的决策,手机作为当下最好的 AI 终端何时能提供类似的能力很值得期待。
所有将历史进程简单地划分为截然不同的阶段的做法都是有待商榷的,技术的演化是一个复杂而连续的过程,各阶段之间的边界并不清晰。
不过主观上讲,我们其实无比需要这样的阶段划分,就像新年一样:
我们总感觉它真的是新的,于是就觉得就好像是电脑重启一样,所有旧年的bug就自动修复了,一句新年快乐,于是又对未来充满信心。
智能手机发展了十多年,到现在已经高度同质化,也应该带给大家一点新的东西了,现在的我们也确实需要这样的一个时间节点,在当下,AI手机就是最好的一个划分方式,至于这个元年是不是2024,无法得出一个明确的定论。
就如同几年之前,整个舆论都是宣扬5G是第四次工业革命,但是现在来看,是AI,是LLM。我们只有站在长河的末端再次回溯,才能得到一个明确的结论。
『师傅,别念了』
AI。
原谅我又把这个词念了一遍,不知道多少人跟我一样,看到这个词,第一反应不是高上大的技术,不是对于未来的期待,而是深深的『疲劳感』:
做手机的,造车的,甚至一块雪糕,都要打上AI的标签,别说关心科技和技术的人群了,就是一些不在领域内的人们,怕是耳朵都已经起了茧子。
以前做相关产品的时候,有一条不成文的规定,不许提AI这个词,我们以更为具体的算法描述,KNN(邻近算法),SVM(支持向量机),GAN(对抗生成网络)。但是很明显,对于普通消费者讲矩阵运算或者扩散模型是不现实的。


这一段时间,我一直在思考,是否能找到另外一个名词或者概念,来替代掉AI这个词,想了很久还是没有答案。
于是关于AI的『审美疲劳』这件事情,我在OPPO AI沟通会的现场也问了刘作虎先生,是这么回答的:
疲劳这个词很好,往往到这个时候,所有人就回归理性。
那么对于一个手机厂商来说,所谓的理性,就是回到用户,基于用户的痛点场景,怎么让他的体验更好,事实上所 有的技术最终还是要服务于用户的体验。
『用户体验』。
这是我十多年前入行产品经理时候,听的最多的一个词汇,一如今天的AI,那么如何评价一款产品和服务的用户体验好呢?
用户会自发且开心的使用。
自发,证明用户是真的需要这样的功能(而不是伪需求),开心,证明这个功能做的是真的好。
OPPO的AIGC消除正是这样的一个功能。
其实背后的能力大家也知道,基于diffusion的图像生成。
不少手机厂商也提供了『文生图』的功能,输入Prompt,生成一张图像,而这个功能的现状是什么呢,很多人玩两次尝鲜之后就会扔到一边了。
因为一方面,其实大多数用户并没有太多生成式图片的需求,另一方面,写好一个文生图的Prompt其实是有一定的学习成本的。自然这个功能很容易就会被束之高阁了。
而AIGC消除呢,说实话,这个功能现在已经成为了我的『生产力工具』。


根本原因就在于对于用户使用场景的深入思考。
我们虽然没有多少生图的需求,但是几乎所有人都有修图的需求,虽然还是一个好像很传统的交互模式——点击相册-编辑-手动圈选-自动去除。
但是背后你又能感受到大模型令人震惊的表现,手动圈选,你只要大致的画出范围,AI能够智能识别边缘,然后实时的给你展示去除后(其实是生成填充,而非仿制图章)的效果。
友商们其实也有类似的功能,把一张照片发给AI,然后告诉它去除路人,然后它再返回一张照片给你。
看似很好是吧,但但是多多少少存在一点使用上的小麻烦:
你有可能会成为那个『被去掉的路人』,该去的没去掉,不该留的却留下了,这是因为AI的识别有时候还是不能准确的获知你的意图。路人是完美的去掉了,原图十几个个M,给你返回一张只有几百K的图,后续实在是没有办法使用的,这背后其实是一个算力和调度的问题;如果结果不满意,你只能不断地尝试,无法在当前结果上继续修改……
如果你用用过最新版的Adobe Photoshop(AI创成填充功能),就会发现它其实也是这样的操作逻辑(选区之后再填充),这也是我为什么说OPPO上的AIGC具有一定生产力的原因。
也正是因为如此,OPPO的AIGC消除功能平均日使用量在15次左右,这已经是一个很夸张的数据了。
重要的是做好眼前的事情
现在也有人开始鼓吹VR,AI agent这样的设备,认为它们才是未来的硬件。
其实在眼下可见的未来,手机还是最为重要的『计算终端』,我们的一些想法,还是得在掌中这个小方块中落地实现。
这也就是为什么刘作虎提到,未来 10 年,手机还是一个最核心的终端形态的原因。
那么接下来的技术进化路线,究竟是应该如何发展?
OPPO的理念是,产品驱动技术。
深以为然。
真正的技术革新不应是自上而下的预设与强加,而应如同生命体内的有机生长过程,源于实际需求的内在驱动。
换言之,产品的实际需求犹如催生技术创新的土壤,牵引着技术研发的方向与进程,促使新技术自然而然地在满足市场需求的过程中萌芽、成长与完善。这才是一个健康且可持续的技术发展模式,而非预先设定一个技术目标后,再试图在现实世界中寻找匹配的应用场景(我们其实吃过不少这样的亏了),就如同先射箭而后画靶的逆向逻辑那样。
既然大家对于手机还是吐槽,还有期待,那么就用现在最好的技术把这个设备做的更加完善。
比如手机上的大模型,依旧还有很多可以做的工作。
大家都在谈端侧,但是如果你用过当下手机的大模型,你会发现,真正的端侧模型是不存在的,很简单的一个验证方式就是,当手机断网之后,所有的AI功能都不可用。
所以我们需要按照实际的需求,是判断这个任务是应该跑在本地,还是上云,场景不同,策略也应该是不同的。
产品上其实没有什么难度,我们可以按照场景来拉出一个List,比如,我们说图片搜索,通话语音识别,这些涉及到用户隐私的其实更适合放在本地,复杂推理等任务还是更适合上云。


AI 通话摘要
但是技术上却又很多难点,这背后牵扯到一系列的算力,调度,功耗的技术突破。
尤其是带宽这个问题,其实我们现在所说的算力不足,很大程度上是内存带宽不足导致的(内存墙),要想完全突破,靠的可不是修修补补,挤挤牙膏就能完成的。


当然最重要的还是成本,我们都知道,目前来说,AI上云还是很贵的,但是当端侧模型真正跑起来之后,你就只有购买的手机的成本。
这也就是OPPO提出AI手机的原因,虽然有可能看起来还是一块屏幕,还是需要摄像头和麦克风,还是触摸点击语音对话,但是底层的东西已经完全不一样了。
我们依旧还有很多的工作要去完成。
『生物』依赖? 所仰仗的是什么呢?
毫无疑问,手机现在已经成为了我们身体器官的『一部分』。
中学生物我们都学过,肠道菌群和人类这个宿主之间形成了一个『互惠共生』的关系。
我们依赖他们,试想一下,如果某一天你身体里的细菌全部消失,虽然你不会即刻毙命,也会奄奄一息。
而现在,我们也和这个计算系统形成了新的依赖,并且这种依赖关系还在与日加深。
对于AI这个计算系统来说,算力资源就如同他的生命源泉。所以我们人类不仅需要葡萄糖和ATP,在现代社会中,算力也可以被视为驱动我们生活、工作以及科技进步的一种新型『养分』。
对于一厂商来说,所谓的算力,是堆硬件,更是人的组织。
这次的OPPO的AI沟通会,有幸参观了OPPO位于滨海湾的自建数据中心,虽然看到还是一排排的机柜,但是你可以很容易感知到OPPO强有力的工程落地能力。
自建数据中心,一方面能够大模型的训练和计算提供更好的计算能力,另外一方面,还能在功耗,以及节能上做出一定的探究,比如液冷服务器,可以实现相同空间内更高的堆叠,以及更好的性能释放。


真机云测机房,开发者可以直接通过远程连接真机进行开发测试,而不只是基于虚拟机。


人的组织方面,OPPO成立了AI中心,将所有的AI智能部分划到一恶搞实体组织的下边。
上过班的同学,一定能够体会到,一个实体的组织架构的和一个跨部门合作项目的生产力是完全不同的。这也表明了OPPO的决心。
并非只是『助理』这么简单,更重要的命题是『协同进化』
很多人对于手机的AI期待,是更为智能的助理。
赫拉利在《未来简史:从智人到智神》中提出:
人工智能对我们的了解已经超过了我们对自己的了解。
于是很多人就开始畅想:想出去玩,AI助理就按照你的喜好帮你做好了旅行出行攻略,预定好了当地的美食,当你刚下飞机的时候,就帮你打好了车,你只需要确认就行。
但如果深入思考之后,会发现不仅如此。
在OpenAI大放异彩之前,来自于DeepMind的AlphaGo也曾让人感受到了一次『末日危机』:
人类智力的最后堡垒,围棋,在AI面前全面败下阵来。
但是在这之后呢?
人类在学习AlphaGo之后,发现很多流行了数千年的经验其实不是完全正确的。而AlphaGo最初的数据集,却是来自于人类。
你会发现,我们跟AI关系更像是一种亦师亦友的关系。要想AI更好的服务于人类,那么人类也应该帮助去塑造一个更好的AI。
这一塑造过程的关键要素在于数据输入、交互体验以及及时有效的反馈机制。
如何去加快这个过程?
很简单,让更多的人去用,通过日常使用为AI提供丰富的学习素材和多元化的场景需求。
这便是AI普惠的意义,所谓的大模型功能,也不应该只局限于旗舰手机上,新春前夕,将AI功能开放到16个机型,除了旗舰Find系列,还有Reno以及一加Ace系列。


只有触及更多的用户,才能造出一个更好的为我们服务的AI手机。
当未来的某一天,我们不再特意提及『AI』这一词汇,不用强调这是一台AI手机,仿佛它已成为生活中的寻常点滴,那时或许我们才是真正意义上步入了一个深度智能化的时代。
[收藏本文] 【下载本文】
   科技知识 最新文章
《消失的问界里》为什么网传华为选择大面积
特斯拉万人大裁员涉及中国市场,销售部门是
媒体报道「特斯拉一天内失去 2 个高管和 10
去年是「大模型元年」,今年会是「AI应用落
2024 年人工智能方向的就业前景怎么样?
如何评价小米汽车SU7全球首例无故抛锚?
如何评价比亚迪与大疆合作发布的车载无人机
如何看待波音「吹哨人」遗言曝光:如果我出
电动汽车为什么一下爆发了?
怎么看待华为太空宽带计划?
上一篇文章      下一篇文章      查看所有文章
加:2024-02-26 21:47:14  更:2024-02-26 21:48:45 
 
 
股票涨跌实时统计 涨停板选股 分时图选股 跌停板选股 K线图选股 成交量选股 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
网站联系: qq:121756557 email:121756557@qq.com  天天财汇