[科技知识] OpenAI 的视频模型 Sora，支持 60s超长长度、单视频多角度镜头等功能，能否颠覆影视创作？

天天财汇购物网址万年历小说 | 三峰软件小游戏视频

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页淘股吧股票涨跌实时统计涨停板选股股票入门股票书籍股票问答分时图选股跌停板选股 K线图选股成交量选股 [平安银行]

股市论谈均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

商业财经科技知识汽车百科工程技术自然科学家居生活设计艺术财经视频游戏--

天天财汇 -> 科技知识 -> OpenAI 的视频模型 Sora，支持 60s超长长度、单视频多角度镜头等功能，能否颠覆影视创作？ -> 正文阅读

[科技知识]OpenAI 的视频模型 Sora，支持 60s超长长度、单视频多角度镜头等功能，能否颠覆影视创作？

[收藏本文] 【下载本文】

AGI 真的来了

我觉得 OpenAI 的 Sora 暂时还不至于颠覆专业的影视创作，但对短视频和自媒体的确是颠覆的。
对于专业的影视创作来说，这种人工智能生成视频时输出不可控的画面很难作为成品使用，也很难融入现有工业体系的成熟工作流。
而且 Sora 的工作方式是从海量的数据里学习到的图像和时空规律，但这样的规律可能并不精确可靠，也就是说并非严谨的仿真运动物理引擎。因此，在电影工业中是不会直接应用的，但想象力是很大的。
昨天刚发布，大家的关注点在 60s、多角度镜头。其实 Sora 真正厉害的是：
文字、图片、视频都可以作为输入 prompt可以基于视频扩展生成后续可以实现视频到视频的编辑（例如基于视频直接更换天气、调色、风格）。示例：

0
可以实现两个视频间的无缝插帧融合转场过渡，例如：

0
基于上面的能力，我能初步想到的应用：
前期的分镜创作，可以省下很多时间，也许过去的手绘分镜和讲戏，很快就能用 AI 模拟出不亚于拍摄效果的视频版本；视频到视频编辑，画面风格的修饰、替换；过度画面的转场特效、插帧；填补远景里不重要的背景画面或群演等。
AI 生成视频 / 人工智能剪辑工具能很大程度上改变这些工作，我记得郭帆对类似的新技术非常感兴趣，考虑到流浪地球3是2027 年，按照现在的进度，大概率会用到很多人工智能技术了。
但是对于自媒体来说，情况可能就不一样了。越小的团队受益越大，就像 ChatGPT 对个人的帮助、AI 编程对程序员的帮助一样，会催生很多个人创作者。他们只需要有创意、有点子、有执行力就够了，可以低成本地快速打造出很多不亚于专业影视创作的内容，而且他们本身就不上院线，不与电影直接竞争。
利好短剧！

以上。
参考：
OpenAI 发布文生视频模型 Sora，将对 AI 视频行业、传统的影视公司等造成哪些影响？80 赞同 · 8 评论回答

我认为对于真正的电影暂时还造成不了威胁，但是会催生大量的自由创作者，如同漫画家，或者剧本，这样很容易就可以给投资人或者观众看一个初步的剧本。如同我假设的，未来人人都可以成为导演，创作者。关键的是情节。
多说两句，在我有限的想象中，一个人人都能成为导演拍大片的时代，实现过程如下：语言生成3d模型，通过软件微调形成最终3d模型并命名（无论如何语言只是宏观效果），接下来的过程如同早些年学习的flash, 你只需语言描述加上微观调节完成下一个帧，中间的过程就自动生成了，不同于flash的是生成的内容是3d空间，你可以根据需要切换视角。其实跟现在的3d建模和3d动画道理一样。总的来说如果要制作一部有观赏性的视频，仍然需要掌握软件，但几乎建模的过程和模型宏观动作，空间宏观关系调整傻瓜化了可以用语言指导。精细作业只剩一些微调。这只是我的假设，我也不是从业者，只是幻想。相信五年内一定可以实现的，让我我们拥抱这个伟大的时代，现在人人可以出书，未来人人可以出电影。
想象一些更牛x的，这边你画了一本漫画，视角分镜等都做好了，你给gpt阅读，直接给你做出来一部电影。
未来人和人的交互方式是不是也会被完全改变？gdp视频现在是语言生成，那么人和人的交互方式还是语言，但是微调后的视频是比语言更精确的，未来人和人会用更多的视频内容去交互，那是更加精准的，以前你要用大量文字给人阐述一种魔幻的感觉，未来你只要通过画面视频。当然人们未来对视频的读取速度会非常快，未来很多资料都是视频形势了，可能书籍会渐渐成为古董。

在一个满是猫咪的教堂，向王座上的猫王致敬。

想歪了的朋友不用担心，没Sora，AI绘画也能做到这样。有了Sora，她能在高昂时刻变身高达！

目前技术还不是很完美。
海洋动物骑自行车，自行车没有脚蹬。

猴子下棋，棋盘不对。

起点是一个通过文字贩卖想象力的地方，Sora可以通过视频特效来贩卖想象力。
它把一秒十万美刀的特效权交给了普通人，普通人可以用极低廉的方案做动画，相当于在电影特效开了个创意工坊。
想起某鹅all in的元宇宙，那是100%被忽悠了。

颠覆这个词震惊体的味道太浓了。
ChatGPT的出现并没有颠覆写作行业，只不过让一些写作从事者大大的提高了生产效率；
AI绘画的出现也没有说颠覆了绘画行业，但是一些完全没有绘画技能的人，比如我，也可以做出非常精美的作品。

Midjourney生成作品

Midjourney生成作品
视频跟绘画又不太一样。
功能性
我在AI绘画刚出来的时候，觉得它简直是实现一个人梦境的绝好利器，它生成单张照片的能力是很强不假，但是这个世界本质上运动着的，某一刻确实是静态的，但也就只有那一瞬，图片只是梦境中的某一瞬。
而想要复原梦境，视频可能才是目前的最优解，我去年试用过一些视频生成模型，刚上手的时候觉得确实好用，因为确实可以让静态的物体动起来，这在当时已经让我觉得惊为天人了。
比如Runway，Pika等等，但是一旦拿出来比较的话，从放出来的资料里面看，Sora要远远强于其他的主流视频生成工具，无论是60s的长度，单视频多角度以及各种物理规则的理解。
SoraPikaRunway焦点文本到视频，专注于真实的、以人为中心的结果图像到视频，带有动画和风格迁移广泛的视频编辑，包括AI驱动的生成工具持续时间长达60秒3秒4秒功能性非常强大不太强大相当强大输入模态主要是文本提示图像，有时伴有文本指导图像、视频、文本输出风格多样化输出，旨在实现现实主义更加风格化和艺术化的动画广泛的范围，从风格化到照片级真实，取决于使用的工具限制尚未公开可用在处理复杂或抽象概念时可能不太成功可能很复杂，需要一些视频编辑知识主要优势现实主义，理解人类行为和复杂场景创造性的动画静态图像，风格化效果多功能性，全面的视频编辑器具备AI功能
现在有点儿遥遥领先的感觉。

从功能性上来讲，如果Sora的实际效果和宣传的相当，不说可以取代，起码可以极大的增强创作者的效率。
甚至我觉得，在Sora开放使用后，会很快出现完全由AI生成的电影，包括但不限于剧情、音乐、视频等等。可扩展性
视频这个数据属性天然的会吸引人的注意力，比起文字这种信息密度大的数据，视频太容易抓住人的眼球了。
这也是为什么像抖音这样的短视频平台会吸引如此多的用户。
而Sora这样的视频生成模型有个好处。
那就是比抖音更能生成视频，这种视频生成的逻辑跟推荐逻辑不一样。
推荐是在已经有很多的视频的前提下进行最优化推荐，它会面临着视频短缺的窘境。
但是AI视频生成工具不会，理论上只要算力足够，它可以不间断的给你生成电子榨菜，绿色的还是其他颜色的，理论上都可以生成。
这不叫推荐了，这叫自适应的生成，你连上滑下滑都不需要。
我觉得这种形式有点儿改变视频这种东西的产生逻辑。
会不会以后有一种新的视频模式，就是无限视频，不停的生成下去。
而不是局限在一个2，3个小时的电影时长。
就跟以前人也想不到，随着生产力的发展，现在的人白面可以吃到吐。
在新的生产力工具面前，人人可能都是拿着玉米面窝头的古代人。

我认为在未来是有可能颠覆影视创作的模式的。
在未来，电影创作的工具技术可以被每个个体掌握，每个人都能够创造出属于自己的电影。

我用AI工具生成的图片
AI技术会让电影在在不知不觉中完成去中心化操作，技能层面的专业权威掌握的中心会被消解掉，人人都能变得像个专家。
但是新的中心化又必然会再次形成，掌握算力、带宽和电力资源的巨头会是幕后中心，掌握思考与创意的精英会是前台的中心。
生产端被革命了，AI制造出海量的产出内容，全世界的人每天都看也看不完AI生成的这些内容。那么在消费端，谁来对大众进行引导筛选呢？
谁负责挑选传播优质精品引导舆论，会不会又形成新的垄断？
这又是需要思考的问题。
一、Sora视频
讨论对影视创作会造成多大影响之前，让我们先来看看AI视频软件Sora现在能做到什么。
下面是2月18日最新sora视频（由openAI sora部门工作人员生成）！

0
提示词：金毛猎犬和萨摩耶犬穿过纽约，然后出租车停下来让狗通过人行横道，然后它们应该走过椒盐卷饼和热狗摊，最后它们应该看到百老汇的标志。

0
提示词：有人看到一只白色和橙色的虎斑猫在大雨中飞快地穿过后街小巷，寻找庇护所……

0
提示词：相机降低并扩大到一个宏伟的全景，俯瞰美丽的海洋和历史建筑，沿着一个令人惊叹的沿海风景如画的小镇坐落在悬崖上......

0
提示词：一段逼真的蝴蝶视频，它可以在水下游过美丽的珊瑚礁

0
提示词：一只大鸭子走过波士顿的街道

0
Sora 可以同时并排生成多个视频。这是 Sora 的单个视频样本，创作者没有把这一切拼凑在一起；Sora决定要同时拥有五个不同的视点！
二、对影视创作的影响
在未来，进行影视创作，只需要掌握AI工具，会画分镜，有剧本概念，就可以开始创作了。
1.影视创作成本
对影视创作来说，影响最大的是什么呢？我认为首先是成本的降低，尤其是科幻片。
例如下面由Sora创作的科幻片场景，仅仅需要通过文字生成，可以节约无数的特效经费。

0
根据我了解，影视制作中成本最高的部分通常是拍摄和特效制作。
很多影视公司之所以倒闭，往往是因为导演对作品的不断修改和返工，而在未来，影视制作可能会演变成一种服务业，形成类似电影生产厂或电影作坊的模式。
2.影视制作流程
然后是关于影视制作流程的颠覆，在未来影视创意总监可以通过AI视频这个形式，进行灵感的生成，进行低成本的沟通，通过快速的生成，就能够很好的阐述画面概念。
例如下面视频中的画面：一片叶子的宏观照片，显示微小的火车在其静脉中移动。

0
AI生成视频这个模式，对于编剧来说，会变得特别友好，因为在未来，我们可以用把一些场景去进行视频可视化呈现。
这会让从业者的视觉审美有整体提升，对单纯画面美的东西会产生审美疲劳，反而对于讲故事能力的要求又提高了，在这种模式下，有才华的人会更加凸显出来，找到生存之道。
我认为与艺术家类似，对于影视创作者来说，最关键的能力在于构思概念和创意，以及调动观众的情绪，这些能力构成了创作者的核心竞争力。
3.更多可能性
我认为影视作品的核心是传递的情感和故事的感染力，画面音乐等都是辅助手段。
不知道大家还是否记得19年前，一名自由职业者胡戈根据《无极》创作的《一个馒头引发的血案》，其内容重新剪辑了电影《无极》、中国中央电视台社会与法频道栏目《中国法治报道》以及上海马戏城表演的视频资料等。

影片上映于2005年12月28日，对白经过重新改编，只有20分钟长，无厘头的对白，滑稽的视频片段分接，搞笑另类的穿插广告。
在网络上，《一个馒头引发的血案》的下载率甚至远远高于《无极》本身。
也许在未来，类似胡戈这样有创意的创作者不再需要通过剪辑，而是能通过AI视频这样的工具，将经典的电影片段，或者是任何想要创作的素材，通过视频转换技术进行再创作，能够产生不引发争议，不引发版权争端的独创作品。
只要AI视频能够确保转换过程中的一致性和稳定性，就能够创造出大量的新作品。
在这点上，Sora视频的稳定程度，让我看到了这个可能性。
结语
我认为，AI工具的进化，虽然降低了创作的门槛，但是单纯凭借AI工具，无法让所有人都成为创作者，而是行业的阈值及整体水平会被提高，创作会提升到新的维度。

0
在经历AI视频工具的普及后，未来AI工具学习成本越来越低，最终脱离工具回归对内容本身的关注。
如同我之前在其他文章说的AI绘画会促进绘画艺术的重生一样，影视创作领域也许也会迎来新生！
关于Sora的更多信息，也欢迎看我前两天写的相关文章分析：
如何评价OpenAi发布的视频生成模型Sora?58 赞同 · 11 评论回答

OpenAI 全新发布文生视频模型 Sora，支持 60s 超长长度，有哪些突破？将带来哪些影响？58 赞同 · 15 评论回答

OpenAI 发布文生视频模型 Sora，将对 AI 视频行业、传统的影视公司等造成哪些影响？72 赞同 · 15 评论回答

我是德里克文，一个对AI绘画，人工智能有强烈兴趣，从业多年的设计师！如果对我的文章内容感兴趣，请帮忙关注点赞收藏，谢谢！

咋说呢，颠覆不至于。至少短时间三年3~5内不至于。sora对摄影师和导演的影响最大，对其他岗位的影响不太大。而sora对摄影师和导演的影响，有点类似于现在的ai作图软件对画手和设计师的影响。

对于低端画手来说，ai作图软件确实吃掉了不少市场份额。但是对于个人风格明显，具备创作能力的高阶画手来说，没啥影响。对于设计师来说，现在的ai制图软件是好帮手。刚刚我还跟一个做设计的朋友在讨论这个话题呢，她那边非常推荐用ai制图软件画demo。因为面向非常不专业的客户时，其实客户也不是很清楚自己想要什么，需要先需要设计师先画出一些有不同风格的草图让客户选择，然后设计师再根据客户的选择，具体的细化定稿。原来这些草图可能会花费很大的工时，但用了工具之后可能就节省了很多前期的是客户意向调查的时间。
而sora对摄影师和导演的一个很明显的作用就是可以作为一个好用的工具，做些动态demo视频出来。
正好这阵子电影《热辣滚烫》上映，在片尾的彩蛋里，贾玲说自己在拍上一部电影《你好李焕英》的时候，她画的分镜别人都看不懂。

当时李焕英有一个花絮，是刚电影刚开始，有一个33秒的长镜头，因为他画的分镜别人看不懂，所以贾玲只能对镜头里的每个人物的行为、动作逐一向摄影师说明。所以贾玲现在正在努力的学画画，至少让自己画出来的分镜，别人能看懂她想要什么。
如果有了sora这个工具，那么贾玲就可以在技术人员的协助下，通过关键词来做一个预设demo了。不需要一帧一帧的划分镜了，确实是非常好用的工具。
而且现在电影创作的过程中，好像置景组、美术组、服装组都早已经在用现有的ai软件虚拟出不同的场景效果，给导演做参考了。很多电影和电视剧在上线之后都会放出这些早期的设计图。

现在有了sora这个工具之后，以后可以更方便的做出动态的场景设计、人物动作设计。或者是说现在每一条的拍摄都会有很多条预拍，这些预拍包括对场景效果的观察，包括对演员走位的观察。那么一旦使用了工具，那些早期的预拍摄都可以通过这个工具完成了，其实整体上来说是降低了设置组的成本，提高了设置效率。
随着科技的进步，我们以后的生活中智能设备肯定会越来越多的。目前而言，至少设计方面的工作或者需要投入大量智力活动的这些工作人脑。还是比机器要好用一些的。因为机器它一定是受制于硬件的，硬件的算力不够的话，它是没有办法快速而准确的得到结果的。而我们的人脑一个白馒头提供的能量就差不多了，便宜，质量好，出问题还能自我修复。
另外像现在的这些需要输入关键字，才能够得到输出的ai工具，大多需要专业技术人员辅助，虽然可能有些低端的画手设计师会失业，但对于一些理工科的技术人员这倒真是一个不错的工作。

长视频目前看不清楚，毕竟剧本、脚本之类的目前不知道人工智能什么时候能做到毫无痕迹，或者说达到平均水准。
毕竟大家看这种内容不能只看画面。
只能说长视频目前看更多有了AI参与创作，效率提高。
短视频我觉得很多类型还真的有机会被AI颠覆了。
?首当其冲受影响的，是靠画面赚钱的。
任何视听技术的发展，一定是利好最容易赚钱的领域。
黑产当然是，比如诈骗之类，前段时间不有热搜么，AI伪装成明星给大妈大爷诈骗。这里不讨论非法生意。
合法生意里影响最大的，是福利相关，海外是成人，国内是擦边球。
AI参与，拍摄，化妆，场地之类的成本一下子就降下来了，而且可以批量生产。
有人说了，真人毕竟还是感觉不一样对吧。
咋说呢，由于滤镜和PS存在，其实AI早就渗透到画面里了。。。
这绝对是颠覆产业链的，毕竟寻找新人，培训，和直播的法律关系，拍摄准备等一些列产业链操作都省掉了。
对个人主播来说，AI工具出现，也可以在未来通过虚拟分身，语言自动翻译，变成自己只出脸，剩下交给AI的模式。
?其次，对知识类短视频也有颠覆效果。
真正实现一个人就是一支队伍。
虽然现在AI也能自动配视频，但还需要微调或者注意版权问题，有了Sora这种能力，小切片视频都自动生成了，创作成本还可以进一步降低。
考虑到未来语音合成技术也会继续进步，这类视频的供给会大量增加。
本来，这类内容核心其实还是文本能力，只不过观众普遍对画质有要求，导致目前行业是一个分工合作的过程。
AI技术有可能让这个领域短视频变回文本主导的状态。
多说一句，这对知乎作者是个好消息，能写的人普遍视频能力不太强。要么被视频剽窃，要么得给别人分一大笔钱。
要善于利用这个技术。
?然后就是剧情类短视频，比如生活搞笑视频，比如动画，比如短剧。

这种质感对付几十秒视频，现在看很有希望。不过生成视频在逻辑上能否配合剧情，可能要再看看。
不过从目前短视频市场看，努力尝试AI的人肯定比长视频多，他们真的现在挺赚钱，而且尝试的成本也低。
影视创作，环节当然是很多的，目前Sora展示的是图像领域，考虑到配音也非常有希望突破。
未来就看文本能不能突破了。

结论：这会改变影视行业的流程，在某些影视流程改变方面可以算是一个“王炸”，但是目前谈颠覆行业还有点早。

逼真的画面
1.生成模式
在这一类AI大潮的初期，判别型模型才是主流。不过这两年生存模型的发展出现了日新月异的变化，典型的代表就是CHATGPT。当然这东西也没有吹嘘的那么好用，能用了倒是真。
其实在AI的研究领域，看图说话一直是一个发展比较快的方向。这次SORA的文生视频只是这个方向的一个延展，我们都知道连续的图片展示，就是视频。以去年CHATGPT表现出来的文本生成能力，这其实不算是一个意外。

CHATGPT
因为在生存模型方面，理解文字的意思是皇冠上的明珠，至于用何种形式来表达意思，其实已经是相对比较简单的了。从这个意义上讲，这个SORA称不上王炸。
2.改变流程
在一部影视作品的制作中，有一个叫概念图的东西，就是主创请画师将自己心中的场景画出来，这个不断修正的过过程，就是作品最终的成片不断打磨的过程。比如封神的导演乌尔善在去年上映期间，不断的放出第二部的概念图，也起到了很好的宣传效果。
推而广之，其实在很多作品的创作过程中，不仅仅是制作概念图，比较宽裕的视效大片还会制作概念视频，一般是用三维视频的形式呈现的。比如封神剧组，就将影片的所有场景都用三位模型走了一遍，这个过程一般非常耗时耗力，属于开拍前打磨剧本和场景的重要阶段。

概念图
SORA对这个流程的改变是显而易见的，这一点可以称为王炸。在生成试拍场景的画面方面，SORA可以一步到位，直接给导演提供视频素材作为参考。这不是说概念图就不重要了，实际上既然SORA能出视频，也可以出概念图。
在筹备拍摄的这个环节方面，将会大大加快进度，当然离公众预想的淘汰好莱坞级别的王炸，至少还有两点短期内难以克服。
3.创意最难
在生成模型输出的背后，除了对文本的理解，还有海量的视频素材的学习。在目前的生成模型方面，其输出的风格特点都是通过某种程度的模仿得来的，机器学习走到今天进步很大不假，但是这都集中在模仿感知能力，和一定程度的认知能力上面。
人类智慧的明珠，创意是目前的深度学习模型从原理上很难具备的。比如去年节节败退的漫威影视作品，就有人质疑他们用的是AI生成的剧本，干巴巴的。这里也可以看出，生成好的故事这一点不是机器目前可以做到的。

比较流畅
还有，在视频输出的成熟度上，立刻指望用SORA来拍电影，也是不现实的。从视频来看，动作的流畅度，画面的自然度依然和我们看到的最顶尖的好莱坞动画水平相比有一定的差距。当然SORA可以直接用来生成一些动画片的辅助场景，这一点是毫无疑问的。
其实在CG动画刚出来的时候，詹姆斯卡梅隆带来的风潮，早在20年前人们就做过全CG电影的尝试，那部作品就是票房惨败的《最终幻想》。当时对于CG动画的推崇，与今日对SORA的恐惧如出一辙。只是二十多年过去了，真人电影依然是不可取代的。
SORA只是一个能自己生成CG动画的模型，这里过分夸大它的功能，是没有必要的。目前看它的作用主要是前面说的试拍场景的直接生成，能在流程上节约不少人力物力。对于动画片的直接作用是立竿见影的，对于真人电影其实没有太大的冲击。

第一部全CG电影最终幻想
这些素材，最终还是要导演，编剧，美术主创这些人进行相应的调整，成片的最终的决定因素依然是人类的审美，其实这一点也是目前的机器难以学会的。
当然随着技术的演进，特效大片尤其是动画片的流程加快，成本降低都是可以预见的，比如以后《流浪地球》可能就不需要四年一部，而是两年一部，这无疑是大家喜闻乐见的事情。

尚未正式登场的Sora引起的轰动，让我想起了去年AI绘画甫一登场时的盛况，以及之后遭遇的各种口诛笔伐……
Sora的案例视频所涉及到的60s时长，多角度镜头，以及对于运动物理世界的“理解”确实令人震惊，但是这种震撼主要是跟现有的视频生成类AI对比后感受到的，用老郭的话讲“全靠同行衬托”。
动辄就说“颠覆影视行业”，我一瞬间以为自己看到了AI运营的自媒体……
我想到了小李子的神颜之作《泰坦尼克号》，如果在有了视频AI助力的情况下，我猜想影片最后，船体的分裂与沉没应该可以减少拍摄成本。
泰坦尼克号在海洋中行驶的场景，是将模型放置在超大的水池里移动，经过后期制作加工成电影中的画面。泰塔尼克号船身断裂这个经典镜头，则是用一个1：4的模型完成。
当年为了拍摄这艘巨轮在海上航行以及最终沉没的镜头，可是费了整个剧组很大的功夫，以及好多钱。
但是如果用Sora这样的视频生成模型来“生成”泰坦尼克号在海上航行以及最终沉没的视频，相较于传统的模型船拍摄方法，可能会提高灵活性、降低成本效益，同时让导演的创造性和想象力有更大的发挥空间。
比如Sora可以在没有物理限制的情况下生成高度真实的海洋和天气效果；比如，从成本和时间效率的角度来看，Sora可以无需构建大型物理模型，使用复杂拍摄设备，大幅降低了制作成本和拍摄时间；再比如，即使导演对视频效果不满意，要求推到重来，也不用再“心疼”成本。
不过与这些镜头相对的，那些涉及到“人”的桥段，比如经典的船头一吻——

不管是Sora还是其他任何视频生成软件，在目前的技术能力下，都是不可能主动生成这段视频的。
这个场景不仅仅是视觉上的展示和“复现”，更重要的是表现出情感的传递以及人物之间水到渠成的“化学”反应，这些是视频生成模型难以准确把握的。
如果想用生成视频完全代替“真人”，那么最可能出现的问题就是角色的表情和动作显得不自然，同时AI人物缺乏情感深度，使得生成的场景无法完全表现出电影的情感张力和视觉冲击力。
所以说，“颠覆”这个词用的过于夸张了，Sora不可能替代真人演员，表现出让观众满意的情感释放或情感交流。只能说未来对于某些“科幻”或者“震撼”场景的拍摄可以借助AI的力量“节本增效”，某些“危险”的镜头或许可以用AI生成。不过或许到时候，片酬啥的，就更高了……

AI的创作产量大成本低，但是不具备欣赏价值
拿AI写诗举例，大约10年前AI就可以生成诗词了，由于诗词有严格的格律和韵脚，生成起来比普通白话文要容易些，随着模型不断增大，写诗的水平也是在不断进步的，而且AI写诗词非常快，几秒钟就能写一首。
这10年来AI应该写了上亿首诗词了吧，总量早就超越了唐宋的诗人词人的创作量了
那么请问你能想到哪句优美的诗句是AI写的吗？歌词也行啊，有吗？
一句诗只有7个字，常用汉字也不过3000个，一句诗理论排列组合也不过3000的七次方，这个数在计算机面前不算大，甚至可以穷举。AI只需要把一句佳句从这个排列组合里找出来即可，所谓文章本天成，妙手偶得之。
然而，并没有。
AI创造的内容都比较平庸，而那些具备欣赏价值的作品都是异常样本，AI无法生成这种异常内容，另外AI自身没有鉴赏力，它不知道自己写的东西到底好不好，而诗人自己是知道的。
你有时候哪怕第一次看到一句诗，也会觉得写得非常好，就像我第一次读到“天生我材必有用”，“一江春水向东流”“曾经沧海难为水”“山外青山楼外楼”“心有灵犀一点通”等等时的感觉，这些诗句就是一些很普通的字的精妙组合，但可以直击人类灵魂。
AIGC不能称之为创作，只能叫生产，可以生成一些无关紧要的填充物，但无法代替人类的核心内容创作，无法触及灵魂，不能和人类产生共鸣。
我不否认有了高级的AIGC，生产一些无关紧要的填充内容的成本的确下降了，会提升这一部分的工作效率，但是创作还得靠人类。

其实当年入行开发3D软件的初衷就是为了更好的帮助创作者讲故事…
但是最后没想到，3D没做到的（复杂、难用、慢…），AI做到了…
一步到位，跳过中间繁杂的制作环节，简直太香了…
很多人吐槽AI的可控性、精确程度、艺术性等等… 其实我觉得这些方面都没啥好喷的：
原来你是有钱的大导演、或者大平台，做专业内容的，该用3D还是用，该怎么高质量还是怎么高质量…
真正不同的地方是对于那些普通创作者，没钱没团队的，这下有了AI真的给你赋能了… 想象一下现在再出来个郭敬明、韩寒当年那种天才学生，他还会给你写小说吗？不，他很有可能直接用AI给你创作电影了…
这还会催生新的创作模式，比如UGC，比如用AI做Previz等等…
长久以来，3D行业的首要发展瓶颈，是建模效率、以及从业者人数，满足不了观众对于内容数量和质量日益增长的需求… 而AI的出现，有望填补这个需求…
回顾过去，一个行业的快速发展，总是从某个高效率的工具的发明开始的：比如报刊行业的发展，离不开计算机文字处理和排版技术的发明，互联网门户网站的发展，离不开浏览器和HTML技术的发明…
在过去，虽然类似抖音、B站这种平台已经非常大了（说明市场大），但是视频创作的成本并没有很低。而AIGC可能才是那个把视频创作成本打下来的发明，这也许预示着视频时代的真正到来… 在这个赛道，再出一两个字节这样体量的公司，一点都不奇怪…
未来已来，能见证这一切还是挺值的…
PS：家里有娃的，别学画画了，学好语文吧…：）

颠覆的可能不仅仅是影视创作。这是新的工业革命，怎么想象其对人类方方面面的影响都不过分，看来我们又落后了，而且比较难追赶（国内那些搞大模型的总是说他们和OpenAI差不多，笑）。这个带来的影响有一种可能是：美国及西方可以通过点亮这科技树再次保持领先并渡过这次经济危机（不需要通过美元霸权或战争来收割我们和其他国家，而通过这个技术革命来让世界其他国家继续处于产业链底层，降维打击），人工智能时代来的速度比我们想象的快很多（从chatgtp横空出世才多久啊？这个发展速度是非线性的，指数增长的），国内的大模型们不要吹牛，不要哗众取宠，要有耐心，从基础打造起，努力啊！感觉很不安！（我觉得芯片我们能突破，但这个人工智能，每一秒都在进化啊！）

Sora登上热搜后，篮球评论员朱彦硕直接发问“可以用来拍__ __吗？”，目前来看Sora肯定是在这方面有限制的：

此外还有人研究试图用AI去掉马赛克：
这种行为也被三上悠亚嘲讽了，她直接表示“抱歉，是假的”（这波回应太real了）。

为什么看到“60s视频生成”，某些人想到的是“颠覆影视创作”而不是颠覆“短视频创作”呢？
是因为后者太容易短期（半年内）证伪或证真吗？

目前不能
因为所有AI做的视频或者照片都只是执行了视觉脚本。甚至都不能说是脚本，因为你找不到任何办法让AI计算的视觉画面100%符合你的想法和需求
更别说让AI执行带精确故事叙述的脚本了

[收藏本文] 【下载本文】

科技知识最新文章

百度为什么越来越垃圾了?

为什么程序员总是发现不了自己的Bug?

出现在抖音评论区里边的算命真不真？

你认为 C++ 最不应该存在的特性是什么？

为什么 Windows 的兼容性这么强大，到底用了

如何看待Nvidia禁止使用翻译工具将cuda运行

为何苹果搞了十年的汽车还是难产，小米很快

该不该和AI说谢谢?

为什么突破性的技术总是最先发生在西方？

加:2024-02-18 23:05:09 更:2024-02-18 23:18:35

股票涨跌实时统计涨停板选股分时图选股跌停板选股 K线图选股成交量选股均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

网站联系: qq:121756557 email:121756557@qq.com 天天财汇