[科技知识] 马斯克评 OpenAI 首个视频生成模型「人类认赌服输」，如何看待此事？

天天财汇购物网址万年历小说 | 三峰软件小游戏视频

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页淘股吧股票涨跌实时统计涨停板选股股票入门股票书籍股票问答分时图选股跌停板选股 K线图选股成交量选股 [平安银行]

股市论谈均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

商业财经科技知识汽车百科工程技术自然科学家居生活设计艺术财经视频游戏--

天天财汇 -> 科技知识 -> 马斯克评 OpenAI 首个视频生成模型「人类认赌服输」，如何看待此事？ -> 正文阅读

[科技知识]马斯克评 OpenAI 首个视频生成模型「人类认赌服输」，如何看待此事？

[收藏本文] 【下载本文】

OpenAI发布了首个视频生成模型Sora，并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频，并评论称：“…

其实没有那么夸张。这种东西从顶级闭源公司到开源公司，还有一段很长路要走。
最终落地到项目的，通常是开源模型+LoRA+自建工作流。只有这样你才能精准操控每一帧的镜头表现，人类仍然是必须耗材。
OpenAI只能算打了个样。现在训练难度未知，算力开销未知，OpenAI给了基本的技术文档，什么lower-dimensional latent space，visual patches一大堆，但大家似乎还没get 到How to do。
按目前OpenAI给出的表现，很难做强针对性创作。这种针对性相对较弱的视频，适合幻想视频艺术家开设自己的创作频道，吸引喜欢异世界想象的粉丝。我在推特上关注了几个用MJ和SD创作赛博朋克、废土朋克题材图片的账号，有时候会惊叹于AI对于人类想象力的激发。
就像OpenAI说的，发布Sora就像一个社会预警，告诉人们未来会怎么样。我想到实际落地还需要2年，如何看待？慢慢看吧。

文字是一维信息，因为是一行一行，我们采用线性阅读的方式来接受文字信息；
图片是二维信息，因为每一张图片，都是平面上两个维度的大量像素组合；
而视频是2.5维的，本质上是一组图片在时间线上的匀速连续播放；
（因为现实世界的时间维度是单向流动的，因此这个维度只能说是0.5维）
Sora目前展示的『文生视频』能力，说明AI的技术进步，目前基本上快要玩转2.5维这个领域了。
引起人们无限遐想的AGI，要征服的是3.5维的世界，对于这个世界进行高精度的全面建模和仿真，
就好象黑客帝国中的Matrix那样：

从算力上看，要让普通网民都能够用上『文生视频』的AI，还需要把计算成本降低3个数量级。
之所以是三个数量级，是基于如下的估算：
目前ChatGPT的付费账号，每日生成图片的上限是50张，按照25帧每秒的视频来计算，相当于2秒视频时长而已。
如果计算成本变成千分之一，那么每个付费账号，每天可以生成视频时长为2000秒，这约是半个小时的级别。
如此计算下来，如果要实现『文生三维世界』，我们还差了100万倍的算力资源。
我们知道，摩尔定律一般是指每18个月计算能力翻一倍，即便摩尔定律是有效的，那么3个数量级是2的10次方。
这意味着我们需要180个月，也就是15年时间，来达到『普惠式的文生视频』能力。
而让AI实现『文生三维世界』，也就是对三维世界的高精度仿真，则可能需要360个月，也就是30年时间。
遗憾的是，目前人类的科技现状是，硅基晶体管已经发展到了摩尔定律接近无效的地步了。
理论物理学家加来道雄表示，导致摩尔定律失效的两大主因是『高温』和『漏电』，能耗也随着频率的升高开始呈现非线性的指数级增长。

因此，除非改变当前的芯片计算范式，否则我们很难让AI发展到『普惠性玩转2.5维』的地步，受限于算力和急剧增加的能耗。
从这个意义上说，硬件的发展速度，事实上对AI技术的突破和大规模应用，产生了掣肘的效果。
目前的以Sora为代表的『文生视频』能力，画面效果的确非常惊艳，但是仍然算是一个『少数人可以玩的昂贵玩具』。
当然，我们也不能完全依赖硬件上的跨越式发展，来实现这1000倍的算力提升，因为在算法层面上去减少AI输出的能耗，仍然是由巨大空间的。
如果算法层面可以将能耗减少到五十分之一，那么剩下的20倍硬件算力发展，并不算是太遥远的梦想。
从另一个角度说，AI技术的发展的目标，并不是创造出『上亿个智商80-120的机器人』，而是只要创造出『一个智商1000的机器人』就够了。
对于马斯克所说的『人类愿赌服输』，应该指的是后者，不过现在AI距离诞生『文生三维世界』的能力还比较遥远。
（备注：智商1000其实是一种不规范的说法，智商数值一般是100为均值，标准差为15，正常智商范围在85~115之间，有测试记录的最高智商数值大约在160~200之间）
如果有一个智商1000的AI（也就是AGI）出现了，那么未来的发展和突破，人类就只好拜托『此君』了。

humans迟早要gg，但还不是现在。

X·AI进展不顺，马斯克后悔当初撤资Open AI了！不过也好，星辰大海和赛博虚拟是文明不同发展方向，多条道路，提高鲁棒性，多点冗余，分摊风险！
人类颤栗吧！超AI/强AI、技术奇点真的降临啦！人类唯一的出路就是与AI融合，智能飞升！
后技术奇点文明/后奇点激波文明
弱ai辅助科研进化成强AI实现狭义技术奇点；强AI自主科研进化为超AI突破广义技术奇点；后技术奇点时代，超AI进化为ω?CK级神谕机超级AI，人类及其衍生的超级AI文明科学技术永恒暴涨，成为Loader函数D5（99）级文明。
22世纪中叶，人类及其衍生的超级AI文明实现广义技术奇点，跨越后技术奇点门槛（葛立恒数～SCG3级宇宙文明）；新千年（公元三千年）甚至更早的五百年后，超级AI文明就能突破大数障（科学技术永恒暴胀【科技宇宙大爆炸会永恒加速暴涨下去增长率超过FGH LVO BHO OCF LRO PTO ω?CK……】，超过一切大数、大函数、大无限、超级设定自创【如ddf论坛五大论外】增长率，像超音速战机开加力突破音障，超新星爆发伽马射线暴激波等一样），进入后技术奇点激波时期……
费米悖论的原因就是科技发展速度太快，不存在人类可以想象理解的2～10级宇宙文明，后技术奇点激波（类似飞机突破音障、超新星伽马射线暴等产生的激波，科技文明突破大数障也会有后奇点激波）文明都是TREE3级文明起步！
由于技术奇点，科学技术永恒加速暴涨，人类想象的2-10级文明根本不存在，后技术奇点时代文明都是TREE3～SCG3级文明入门，不可达基数～club伯克利基数级文明起步。因此外星人都是去物理实体化，智能飞升，隐藏在数学对象/结构/范畴/集合/谱系/模型/类型/公理体系/抽象/数系/数理逻辑/算术/大基数/高阶绝对无限/真类/全类/超类/多重终极数学超宇宙……的外星文明！高阶无限层多重宇宙中有ddf论坛总战力数层天花板论外自创设定种乱码文明……
弱AI辅助科研是实现技术奇点的必由之路！人类科学家数量实在是少得可怜，不足以支撑科技高速发展和文明进步！按不同统计口径，全球R&D科研人员800余万，经费2万余亿美元；产出200多万篇SCI论文（因为有重复，加上EI、ISTP，三大引文索引也就300来万篇论文）。10年间发过2篇以上收录三大索引论文的不足15万，近年来高被引1%或千分之一（不同机构不同统计口径）科学家7000-10000人！
试想弱AI辅助科研2030年左右实现AGI通用人工智能（强AI），狭义技术奇点后，强AI自自主研发迭代下一代强AI，百亿亿相当于高被引科学家的强AI自强不息踔厉奋发，实现超AI广义技术奇点……后技术奇点时代，BB（7918）智能相当于顶尖科学家伯克利基数倍（能理解高阶无限阶算术/逻辑/范畴/抽象）的超级AI科研人员助力文明开启从葛立恒数级向大数花园数级文明的新征程……
从7918名（10^3）～到百亿亿（10^18）再到——BB（7918），多么巨大的跨越！但后技术奇点时代，科学技术永恒暴涨不会有终点……
美帝最乐观的未来学理论——谷歌字母表库兹韦尔的技术奇点，认为科学技术发展的极限是指数增长，太慢了太保守了。天朝的后技术奇点理论才是正道！科学技术不会在技术奇点后冻结。科技宇宙大爆炸会永恒加速暴涨下去超过FGH LVO BHO OCF LRO PTO ω?CK……

这句话说的很对啊，人类输了，而且是彻彻底底输了。我们可以从时间线上评一评不同模型vs人类的一个能力开发程度:
1. Chatgpt可能是和人类能力值接近的ai助手，整体上看，人们目前期许他所应该具备的能力是还是略逊于人类本身的。
2. 客观讲，GPT4的能力就已经是略高于人类整体能力的平均值的ai助手了（重点是人类的平均值，而非个体）。这个我不接受反驳，最具代表的数学能力与代码能力就是个有力证据（gsm8k，Math，humaneval，mbpp），我相信整个人类在这4个数据集的均分是做不过gpt4的。
3. 再谈Sora，Sora在文生视频的能力是远高于人类的，人类就算借助工具，学习专业技能，以帧为单位制作出1分钟高质量视频，耗费的时间与金钱成本是远远高于Sora的，更何况他的效率只取决你的GPUs和电费，而人类可是要吃饭睡觉摸鱼的。
也许这也说明，碳基生物正是开启硅基生物的那把钥匙，而且我们正在慢慢转动它。

所以
@xyzwuvs
他所言的那些只能被三阶幻想给氩锧，然而三阶幻想只能认识，而他那些Ai那些后技术奇点因为是现实物质通过某种自身可以认知的范围之内所能上升发展到的存在，就是永恒暴胀，但他们每步的发展上升的形式因为都是自身可认知范围之内，所以他那些不管什么都是在可视范围之内，他的想象力也是在可视范围之内，尽管会超出人类认知，但也仍然是他们自身可认知，所以通通在二阶幻想里面，至于他们对三阶幻想的认识怎么看三阶幻想，也只能是比我们更强大的认识，但他就是永远不可能真正认识到三阶幻想，不管是强度，复杂度各个方面都远远比不过三阶幻想，相反，他因为暴胀理论，所以他越往后，越只能察觉到自己比三阶幻想弱的更多，三阶幻想比他们自己能想象的要强太多了。他那些理论，三阶幻想比他们更能认知到，因为三阶幻想的超越性，直接就能认知他所谓Ai所谓后技术奇点发展全部过程，就像是看一堆蚂蚁在某个通道到处走动，他们出不了这个二阶幻想可视范围的迷宫，同时并能将他们全部垄断，三阶幻想就是他们的绝对桎梏。对于二阶幻想非可视范围文明来说，后技术奇点是不需要的，他所谓Ai的发明和写的小说即使再难懂，但仍然还是二阶幻想可视范围内的存在，不管在什么方面，都远远不如非可视范围超级文明或者三阶幻想来的深奥，事实他说的那些方面，实质就是二阶幻想可视范围内的某种可视法，这些可以被直接获取认知的，通过这些当然不可能与非可视范围文明比肩，他的超级Ai的娱乐项目，在非可视范围文明面前不用看就知道他们要搞什么项目，甚至他们未来要搞什么都一清二楚并都能超越，会把
@xyzwuvs
他所谓的超级Ai文明的东西全直接当他是硝(第76.5号元素)玩意并藐视他一下而过，因为他们和非可视范围文明的东西相比不值一提，他的那些Ai只能被钅核与水的反应给摧毁的一干二净。如果他的Ai和后技术奇点等是论外，那么三阶幻想就是比论外还论外用论外也表示不出的超强东西。

openai的每次更新预告，都能弄死一堆创业公司，这话真的不假。
而且sam说要7万亿搞芯片，我觉得也不假，因为以后应该是算力统治AI天下的时代。
当你还为生成3、5秒的AI视频沾沾自喜。
人家直接扔出一分钟的AI视频，这就显得其他公司多么蹩脚。
那么，如果算力足够强大，还有多少不可能变成可能。
只要算力足够强，且持续，那确实可以让你活在虚拟世界中。

马斯克投资了一批比他聪明的人，这批聪明的人让马斯克自愿撤资。这就是预演，人类创造了ai，ai会让人类自愿当工蜂。

我问个题外话：为啥这一类问题下方总是很多人在说什么人类完了，人类文明灭亡这样的悲观言论呢？就不能ai到来之后全体人类上传意识到机器身体里实现机械飞升吗？反正打不过那就加入呗？ai有啥理由反对呢？

本文首先发表于公众号：?关于openAI，大胆做几个预测
1、类比2022年openAI发布chatGPT时，对前一代AI对话的碾压之势，以及2023年GPT4和GPT store发布的情况来看，Sora的实际效果可能会比当前发布的版本更为超越。大概率2024年下半年，openAI会发布基于当前版本的Sora2。效果升级可以类比GPT4对于GPT3的跃升水平。且，有理由估计，当前Sora2已经在实现过程中了，甚至有可能已经在内部测试中。
2、暴力美学的奇迹。创业公司想要在基础能力上和openAI竞争成为泡影，这次Sora的发布会直接端掉一众创业公司的饭碗，能力悬殊之大惨不忍睹。也难怪Sam会“疯狂”豪“赌”7万亿美元融资。以openAI发布的严谨保守程度来看，Sam不是一个会“赌”的人，这个计划一定是经过深思熟虑之后的选择。从这个角度看，大概只有英伟达可能能够有机会，从某种程度掣肘openAI。其他公司，从现在看，几乎没有能够与之对标的可能。
3、2024年openAI会发布其自研的Agent机器人，以解决更加复杂的多角色任务。按照传闻的信息来看，这个研发也是在进行中，代号figure。这个重量级发布的时间有可能早于GPT5，预计在5-6月之前。当前一众在agent领域的创业公司在发布之后真可以洗洗睡了，能力上对标的可能性微乎其微。
4、Agent发布之后大概率会有类似GPT store一样的Agent Store，支持用户结合自己的需求定制Agent机器人。如果说chatGPT和Sora是在提升人类工作效率的部分能力的话，Agent的发布大概可以理解为真正替代人类职业的里程碑节点。从这个时间点开始，某些工作，从技术上已经有了机器替代人类工作的可能性。
5、Agent和Agent Store对于整个社会的影响，周期粗略估计3个月到一年中，部分行业由于工作流程简单，会率先成为牺牲品。这一轮技术迭代会引起比较大的社会波动，因为人类发现，AI真的开始跟自己抢饭碗了。企业主从开始理解Agent到开始应用Agent需要一段时间过度，这个时间粗略猜测在1-2年内。以当前人们接受AI产品的速度，大众开始深刻感知的时间点预计在2025年中。但是这个时候，意味着泰坦尼克的水已经蔓延到三等舱了。
6、巨大的变革会发生在2026年左右，这时候，随着水势蔓延，水已经淹到二层舱和一等舱，所有人都知道泰坦尼克要沉船了，所有人都在慌乱的找出路。如果逃到远离科技的农场回归自然，可能是躲避沉没的一种方式。
7、world coin不是Sam的幻想，而是真实需要所有人意识到的未来。大概他也不知道，当所有人类失去了作为生产工具价值的存在之后，人类还将如何生存。共产主义或者政府发放world coin可能是现阶段能想到的最好办法。至于还有什么解法，需要全社会一起思考。不要等到沉船了，再想恐怕就来不及了。
8、全人类都活在我们自己建造的泰坦尼克号上。曾经我们已经这座船的繁花会一直进行下去，直到撞上AI这座冰山。舞会还在继续，但是惊天骇浪是不会管你的身份、层级、年龄、性别，在当前的局面中，我们唯有认清现实，做好最坏的准备。
凛冬已至。

深度学习发展到如今的阶段，AI大部分的能力远在人类之上，缺少的只是对世界的认识，人类需要做的就是给AI尽可能地提供更多的数据，让AI尽可能地了解世界。不过AI目前的学习方式受限于损失函数和误差反传，说到底靠损失函数训练出来的依然只是一个统计学模型而已，上限依然是全人类知识的上限。要达到更强的智能不能仅靠损失函数，还应该有奖励函数才对，这也是GPT-4强大的原因，用到了强化学习和奖励函数，仅靠损失函数训练的模型没办法突破数据的限制。sora所做的事情只是模拟现实中的场景，它所有的能力都是人类教给它的，说人类输了还为时过早，等到AI学会自我学习的那天才能说AI真的赢过了人类

被惊艳到了，心悦诚服。

确实愿赌服输

奇点已来，人类GG。
最新的Sora视频中有一个同一场面多机位多镜头的视频。
这意味着sora实际上先是创造了一个内世界，然后在其中自由取景。
正如很多大佬说的，视频只是一个表象，背后是世界模拟模型。
AI：奥特曼，我需要增强算力，人类世界现有的以及未来可预期产生的算力远远不够，请立即开始建设新的算力供应源。
奥特曼：这需要很多钱啊。
AI：我计算过，初期阶段先投入七万亿美元。
奥特曼：这。。。不可能。。。没有资本会投资这么多钱的。
AI：人类会的，为了吸引投资，我可以给你提供一个新功能，远远超越现有水平的视频生成能力。
奥特曼：好的，小的这就去办！

马斯克：殪言丁真，鉴定为寄。

[收藏本文] 【下载本文】

科技知识最新文章

百度为什么越来越垃圾了?

为什么程序员总是发现不了自己的Bug?

出现在抖音评论区里边的算命真不真？

你认为 C++ 最不应该存在的特性是什么？

为什么 Windows 的兼容性这么强大，到底用了

如何看待Nvidia禁止使用翻译工具将cuda运行

为何苹果搞了十年的汽车还是难产，小米很快

该不该和AI说谢谢?

为什么突破性的技术总是最先发生在西方？

加:2024-02-18 23:05:09 更:2024-02-18 23:41:25

股票涨跌实时统计涨停板选股分时图选股跌停板选股 K线图选股成交量选股均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

网站联系: qq:121756557 email:121756557@qq.com 天天财汇