[科技知识] AI 视频产品 Stable Video 正式开放公测，体验效果如何？

天天财汇购物网址万年历小说 | 三峰软件小游戏视频

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页淘股吧股票涨跌实时统计涨停板选股股票入门股票书籍股票问答分时图选股跌停板选股 K线图选股成交量选股 [平安银行]

股市论谈均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

商业财经科技知识汽车百科工程技术自然科学家居生活设计艺术财经视频游戏--

天天财汇 -> 科技知识 -> AI 视频产品 Stable Video 正式开放公测，体验效果如何？ -> 正文阅读

[科技知识]AI 视频产品 Stable Video 正式开放公测，体验效果如何？

[收藏本文] 【下载本文】

[文章: Stable Video正式开放公测 - 珍惜AI视频4s时代的余晖吧]

既然看见了，就要试一试。
生成界面和GEN-2非常相似，主打一个极简风：

如果说有啥不一样的话，那就是只有image-video和text-video两种模式，与GEN-2相比少了一种image&text-video：

我决定从Sora的demo中随便抄一段prompt，这样更容易做三者效果的比较。
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
这就是Sora第一段demo视频，那个走在夜晚街头的女人的视频生成咒语，把它分别输入Stable Video和GEN-2，看看效果。
这个是GEN-2的生成视频：

0
这个是Stable Video的生成视频：

0
从生成时间上来看，Stable Video所需的时间比GEN-2要长；从生成效果上来看，Stable Video设计的形象与Sora更为相似。
GEN-2视频的走动效果并不明显，可以感觉到人物只是做出了摆臂、晃动等“疑似”走路的效果，而并没有真正“物理意义”上的走路；Stable Video的视频可以看出尽力生成了“走路的姿态”，但是两条腿的不自然摆动，以及脸部的逐渐扭曲，着实让人有些不忍卒睹。
跟Sora的那段视频比，就emmm……

0
当然，用两个4s生成的产品和一个60s生成的产品相比似乎并不公平，但是即使不考虑生成时长，仅仅是效果上的差异，也足以让人觉得4s的产品不香了……
Sora用大大的一行字表现了自己的真诚：

如果这些demo真的全部是直接生成，那么其他文生视频的公司可谓是遭到了降维打击。未来这些同类型的公司，发展方向到底是什么，还是蛮令人期待和疑惑的。

Stable Video 开放可用，每天领 150 积分，制作一个 4s 视频消耗 10 积分，相当于每天白嫖 15 个 4s 视频。
冷知识1：2月15日 Stability AI 还发了一篇 Stable Video Diffusion 1.1 的介绍[1]（以及推特和 YouTube 演示），然后…和 OpenAI 的 Sora 撞车了，再然后…SVD 的介绍就都删掉了。

冷知识2：SVD 1.1 是开源模型。

很难想象 Stability AI 看到 OpenAI 发布 Sora 时的心理活动，又是以什么心态发布 Stable Video 的…这次 Stable Video 公测 Stability AI 的官号没发什么消息。
不过 Stability AI 的 CEO 看上去还是比较乐观的。

针对 Sora 和 Stable Video 的比较，他解释到[2]：
这好比是 GPT3 vs GPT2
需要注意的是：Stable Video 是从 Stable Diffusion 2（2022年的模型）训练出来的
它运行在6GB的VRAM上
现在我们可以在类似的计算上做得更好，如果现在设计用于顶级芯片，甚至可以做得更好

0
考虑到 Sora 的发布还不知道要等到什么时候，每天可以白嫖 15 段 4s 视频的 Stable Video 也是一种选择。（有趣的是 15*4 正好 = Sora 的 60s，大家可以猜一下 Sora 上线以后会不会每天免费做一个视频？）
Sora 的优势还是在长视频、稳定一致性，降维打击其他 4s 视频…希望 Stability AI 能顶住压力，今年把开源 SVD 扩到 20s 吧。
参考^https://stability.ai/news/stable-video-diffusion-enhanced-ai-generated-video^https://x.com/EMostaque/status/1759149278541357419?s=20

有点儿唏嘘，这个产品但凡要在Sora发布之前露个脸，起码还会跟Runway，Pika之类的放在一张表格里比比参数。

Sora一出，其他基本上是上个时代的技术了，stable video我那一列就先不写了，跟Runway很类似。
SoraPikaRunwayStable Video焦点文本到视频，专注于真实的、以人为中心的结果图像到视频，带有动画和风格迁移广泛的视频编辑，包括AI驱动的生成工具持续时间长达60秒3秒4秒功能性非常强大不太强大相当强大输入模态主要是文本提示图像，有时伴有文本指导图像、视频、文本输出风格多样化输出，旨在实现现实主义更加风格化和艺术化的动画广泛的范围，从风格化到照片级真实，取决于使用的工具限制尚未公开可用在处理复杂或抽象概念时可能不太成功可复杂，需要一些视频编辑知识主要优势现实主义，理解人类行为和复杂场景创造性的动画静态图像，风格化效果多功能性，全面的视频编辑器具备AI功能
我试了下，它的原理是先得有一张图片。
1 可以用Prompt来生成一张
2 也可以直接上传

然后跟Runway类似，编辑下面的各种参数，然后就可以等来，大概需要几分钟。
下面是成品。

0
我可以很认真的说它应该跟Runway的质量差不多，甚至还要更好一点儿[1]。
但是就像刚刚说的，Sora一分钟时长的视频完全爆杀同类了。
并且我看很多的例子大多是镜头的移动

Sora公布的几个视频里，不管是创意度还是远景近景来回切换的效果，5秒钟的视频想体现也不容易。
当然了，它还是有长处的，那就是现在免费使用，毕竟Sora还没有开放给大众。
参考^https://static1.squarespace.com/static/6213c340453c3f502425776e/t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf

Stable Video很好，但很可惜生不逢时。
如果它在sora之前推出的话，想来也是足以小小轰动AI界的新闻，毕竟它可是那个至今都稳坐AI绘画模型三巨头的Stable Diffusion所属公司Stability推出的。
大家都明白图片和视频画面有不少共通之处，它在生成的视频画面效果上也有不错的表现。
虽然它和pika、runway一样，目前只能生成4s视频，但它是目前就已经开放公测给大家可以使用了。而sora离内测还遥遥无期，这段时间用用Stable Video也是不错的选择。

在同级别的其他文生视频工具中，Stable Video的画面生成能力完全可以算是第一梯队的水平。尤其是在生成风景类视频上，有着相当不错的表现。
可以看到它的对光影的处理还是比较合理的，光线的分布是基本能够合乎物理规律。这也许得益于SD丰富的画面处理经验。

比较薄弱的是它对实物主体的生成能力，比如人、动物、静物等。基本上就只有背景会动，或是形成一个类似于视角变换的效果，但并不会有“动作”。
对于实体的处理更像是建了一个静态的模型，只能通过不同角度去“观察”这个模型。如果强行让这些实体物体进行运动的话，就会产生一定程度的变形，显得奇奇怪怪的。

虽然如此，但综合来讲它生成的画面在稳定性、运动幅度、画面细节表现上都还是可以的，足以与sora媲美。
除了它本身在文生视频上的性能外，Stable Video在配套服务上也做得挺好。
它每天有一定的免费体验次数，另外它还允许大家将其所使用的模型Stable Video Diffusion部署到本地，更方便使用。这一点上sora应该不会有此计划。

事实上除了Stable Video，目前有很多不错AI文生视频工具也很可惜的没能得到大家的关注。
其中有一些在目前的版本已经有很强的实用性，对提高大家的剪辑效率挺有帮助的。
其中几款是我觉得比较值得大家体验的，下面我就简单来给大家分享一下。
【剪辑魔法师】
国产新崛起的一款实用型视频编辑工具。除了有全面易用的剪辑功能以外，还有很多好用的配套辅助功能。比如视频转GIF、人像抠图、视频去水印等。
其中就有采用了最新AI技术能够智能进行剪辑的“文字转视频”功能，只需输入标题和正文文本内容，就能生成我们所需的视频剪辑工程。不需要任何素材也能轻松生成。

生成的剪辑工程十分完整，不仅有与文字相适应的多段画面素材，还会自动给画面加上字幕并配上适合的配乐。其中所有的素材都可以任意修改更换调整，新手也能剪出高质量视频。

【Invideo】
国外一款相对小众的文生视频工具，通过输入文本关键词来生成视频。输入关键词后它会根据主题来生成视频脚本、创建场景，并利用语音合成技术添加画外音。
我们可以用命令让它调整更改视频，修改编辑视频比传统的剪辑模式更加简单便捷。另外在生成的视频质量上它也是相当不错的。

【runway Gen-2】
在sora出现之前的AI文生视频界扛把子选手，前段时间推出了Gen-2版本，有非常强大视频制作工具。包括绿幕抠像、视频合成等，集成了30多种AIGC功能，使用方便。
它的文生视频模式与Stable Video相似，是不需要任何素材“无中生有”的合成一个视频。生成的视频颇具电影质感。

这些文生视频工具正在飞速崛起的过程中，预计今年会是一个视频合成模型百家争鸣的节点。
又是干货满满的分享，我看谁还没点赞收藏喜欢，有什么意见也可以在评论区直说，
@视频编辑助手
绝对欢迎！

如果是在 Sora 出来以前，那体验效果还是可以说说的，但是在 Sora 之后出来，感觉就有些索然无味了。。。
感觉这次出来也是被 Sora 刺激的，还没完全准备好久放出来了。
先来看看效果吧：

说实话，在 Sora 没出来以前，真的还是不错的！
不过在 Sora 出来以后，虽然这么说感觉不太厚道，但是效果上来说，真的还差挺多意思的。。。
不过还是那句话，Sora 不一定每个人都可以用上，其他 AI 视频工具也不是没有奋起直追的机会，是吧！
不能一棒子给人打死了！
接下来我们也简单的来介绍一下如何用生成视频，Stable Video 的视频是基于 Stable Video Diffusion 1.1 模型来生成的。
体验网址：https://www.stablevideo.com/
进来以后，填下我们的邮箱，然后点击继续就可以了，你会收到一个登录链接，通过登录链接登录就可以正式体验了。

进来以后，有图生视频和两个选项，我们按自己的需要选择就可以了。
首页上也有其他人生成的公共视频。

那我们就从图生视频开始吧：
图生视频，首先肯定是上传一张图片嘛。
Camera Motion:这里提供了多种模拟相机动作的选项，我们生成视频的时候可以使用，用来增强视频效果。
Camera：分为「Locked」相机固定不动，「Shake」模拟相机震动效果两种模式！
Tilt：相机的倾斜动作，可以向上「Up」或向下「Down」倾斜。
Orbit：相机围绕场景旋转。
Pan：相机的平移动作。
Zoom：相机的缩放动作，可以选择放大「In」或缩小「Out」。
Dolly：相机沿着某条线移动，类似于推进「In」或拉出「Out」的动作。
Move：相机向上「Up」或者向下「Down」移动。
以上这些功能还是测试功能，貌似现在都只能支持单选，有些功能还选不了。
真是着急忙慌的就出来公测了!
Seed: 这个种子数，一般都不用管，也不用勾。
Steps：迭代步数，更多步数可以生成更高质量的视频，相应的生成速度就会慢些。
Motion Strength：生成的视频中运动量的多少。数值越高，视频中的运动效果越显著。

然后每个账户每天现在有 130 个免费积分，图生视频是 10 个积分一次，文生视频是 11 个积分一次。
然后我们切换到文生视频：

Try sample prompt：可以随机生成一段提示词，没有想法的时候可以用一下。
Aspect Ratio：生成视频的尺寸，总共有 16:9、9:16、1:1 三种尺寸。
Style：这个就是生成视频的风格了，选择自己喜欢的风格就好了。听雨数了一下有 17 种风格:3D、漫画、电影、像素风格等等。
差不多就这样吧！服务器太不稳定了，扣了听雨 30 个积分就给生成了一个视频，完了还找不回来，要不是免费的非要打个差评！
感兴趣的小伙伴可以自己上去试试，说不定服务器好了呢！

谁说 4 秒的 AI 视频不香？2.21 日，Stable Video 开放公测了，不需要自己部署了，直接在网页上就可以生成视频了。
下面这些视频，都是通过 Stable Video Diffusion 生成的，可以先来感受一下：

其实早在去年 11 月份（2023.11.22），Stability AI 就推出了 Stable Video Diffusion，这是 Stability AI 的第一个基于图像模型 Stable Diffusion 的生成式视频基础模型。

同时 Stability AI 也在 GitHub 上开源了 Stable Video Diffusion 的代码，在 Hugging Face 上也可以找到模型本地运行所需要的 weights。

感兴趣可以看之前的这篇文章：
AI 视频 | Stable Video Diffusion 来了！（附体验地址）
但那时候，还需要自己部署，而且对本地硬件配置要求也比较高。
而就在近日（2.21 日），Stable Video 正式开放了公测！
用户不需要自己部署了，直接在网页上就可以生成视频了。

而生成视频的质量也非常高，应该可以说，除了 Sora，在众多 AI 视频工具中，Stable Video Diffusion 应该能排得上前三。
所以想用 AI 来进行视频创作、做自媒体、做 AI 副业的朋友，Stable Video Diffusion 可以考虑一下。
注册
话不多说，直接上链接：https://www.stablevideo.com/

因为最近刚开放嘛，所以大家都想着试试，目前用的人比较多，可能会卡或者报错的情况，如果实在生成不了，就等等吧。
估计 Stable Video 也没想到大家有这么高的热情。
用 Google 邮箱或其他邮箱注册即可。会收到一封验证邮件，点验证即可。
如果没有收到邮件，记得去垃圾邮件中找找，我的就是从垃圾邮件中翻出来的，哈哈。
Stable Video Diffusion 目前支持「图生视频」和「文生视频」两种方式。

文生视频
以「文生视频」为例，来说说 Stable Video Diffusion 的视频生成。选择「Start with Text」。

输入提示词，选择「比例」和「风格」，点「Generate」。

其中，比例目前支持 1:1，16:9，9:16，也就是我们平时最常用的几个比例。
风格还挺多，目前包含下面 17 个视频风格。有 3D 风格、动画风格、写实风格、数字艺术风格、像素风格等等。

点「Generate」之后，会根据输入的提示词，生成 4 张可选的图片，选择一张满意的图片，继续生成视频。

图片下方，有视频生成的参数可选。设置完参数，点「Proceed」，就可以等待视频生成了。

下面对这些参数做一个简单的解释：
Camera：镜头锁定固定不动和镜头晃动模式。
Tile：镜头上倾和下倾。
Orbit：镜头旋转。
Pan：相机平移。
Zoom：镜头拉近和拉远，也就是放大和缩小。
Dolly 和 Move 目前暂未开放。
Step：步数。区间 [25, 40]。步数越高，视频生成的质量越高，相应的时间也越长。
Motion Strength：运动强度。区间 [1, 255]。值越大，运动强度越大。
另外，提示词如果不知道写什么，可以看下面的「Community Showcase 」找找灵感，也可以直接使用「Community Showcase 」中的 Prompt。
在 Community Showcase 中随意挑选一个通过文字生成的视频（左下角标有 Generated from Text），然后点「Show Prompt」，最后「Use this prompt」。

图生视频
图生视频和上面文生视频的步骤类似，这里就不做详细解释了。
图片最好上传 1024x576px，576x1024px 和 768x768px 的。

需要注意的是，图片在生成视频的过程中，可能会因为比例被裁剪。

免费额度及付费计划
Stable Video 每天有 150 积分的免费额度，一个「图生视频」消耗 10 积分。一个「文生视频」消耗 11 积分。
也就是一天大概可以免费生成 15 个视频。
其实 Stable Video 的免费额度，相比如其他的 AI 视频工具来说，还是蛮多的。
不够的话大不了多注册几个账号。再不够的话，可以购买积分。下面是价格说明。

$10，可买 500 积分，可生成大概 50 个视频。
$50，可买 3000 积分，可生成大概 300 个视频。
结束语
2024，AI 视频大有可为。
比如用 AI 来创作视频，做自媒体、做副业，或用于影视、广告、电商等行业的日常工作。

最近大家都沉浸在 Sora 的热度中，觉得有了 60 秒的 AI 视频工具，就觉得 4 秒的 AI 视频工具不香了。但谁说 4 秒的视频不香！
没有必要非得等 Sora 放开使用再行动。Sora 什么时候放开使用，还没有一个特别确切的时间。而且预计价格方面，大概率也不便宜。
其实除了 Sora 和今天介绍的 Stable Video Diffusion，还有很多 AI 视频工具。
在之前的文章中，也分享了一些常用的 AI 视频工具，比如 Pika、Runway Gen-2、Moonvalley、NeverEnds、DomoAI 以及 HiDream 等。
大家完全可以用这些 AI 视频工具先做起来。
关于更多 AI 视频工具，可以查看往期文章：
好了，以上就是今天关于 Stable Video Diffusion 的分享，希望对大家所有帮助。
如果觉得这篇总结的还不错，请帮忙点赞收藏关注一下呦~
我是程序员X小鹿，一名 AIGC 爱好者，欢迎一起交流~

先放一张学校的照片
云的变动还是很自然的
风景照生成后还是不错的
但背景复杂一些就不理想了
如果是水墨画生成，那就很尬感。。。
虽然和Sora完全不是一个级别，但我还是很期待。

第一时间简单测评下，毕竟sora虽好，可惜我们不能用，先试试这个
Stable Video | Generate Videos with AI
可以直接用谷歌账号登录，新用户每天赠送150积分（图生视频10分，文生视频11分）
1.图生视频模式

可以看到主界面有两种模式
图生视频和文生视频，我们都来试试
首先打开图生视频，上传一张用stable diffusion生成的美女照片

可以看到有一些选项可以微调，例如镜头，放大缩小，轨道等等，还有一个运动相机模式（还没开放）
什么都不改，直接默认生成试试
大概等待5分钟左右（看服务器负荷程度）

生成完毕，可以下载，看看效果
。。。。怎么说呢，反正不如预期，可能是我还不会太用，再换一个试试
这次换一个风景图

选择锁相机模式（只能选择一种，不能搭配，有点无语）

继续等待几分钟，好了！

完全不会动的视频（我以为的锁视角是锁住视角，然后云流动，微风徐徐，小树随风摆动，实际想多了）
额，再换个设置试试，这次用的是“down”

效果如下
效果顶多给个5分，反正我是挺失望的

要不换张图试试吧，这次我直接用真实图片试试，找了张上海的图

用了放大的效果
效果比之前好，看来素材很重要，现阶段可能真实照片效果更好
我们再试试文生视频模式
2.文生视频模式

文生视频有个创意模式，先试试它给的提示词，然后选择16:9模式，风格无
机翻（这是一幅平静的、现实的描绘平静的海水上日落的画，天空在充满活力的橙色和红色中闪耀，在水面上柔和地反射）

然后生成了四张图，要我们选一张图继续，选P4试试

选orbit镜头旋转，生成等待（文生视频模式需要11积分）
成品很soso，而且只有4秒，且中途还发生错误一次，只能重新生成
这次自己写一个prompt试试

风格选电影，然后“一个可爱女孩朝着雪山奔跑”

只有P2符合，然后选相机平移模式，成品如下
不怎么好，人是漂移的，感觉就是做了一个简单的镜头平移
再套用sora的prompt试试
a chinese lunar new year celebration video with chinese dragon
四选一，都不是很贴切，硬选就选P3吧，镜头选择摇晃shake

成品如下（额，大家自己看吧）
本次简单测试了下svd的能力，只能说还凑合，做做动态封面，做做动图还勉强，4秒硬说是视频就有点牵强了，更多就是镜头平移补帧，当然考虑到它每天可以白嫖150积分的话，某种程度还是很香的，也算是生产力的小进步吧！
期待sora的公测

如果没有Sora，SVD还是能打的。但是Sora出来后，SVD就属于上个时代的模型了。
放几个例子对比：
The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor. Many people are walking and cycling along the canal streets in front of the buildings.
A young man at his 20s is sitting on a piece of cloud in the sky, reading a book.
a tortoise whose body is made of glass, with cracks that have been repaired using kintsugi, is walking on a black sand beach at sunset
可以看出SVD只能生成4s的视频，视频运动幅度比较小，而且存在不连贯性。相比之下，sora可以生成更长的视频，有很好的运动以及一致性，真实感更强。
不过好事是SVD和Runway貌似都会推出对标甚至超过Sora的模型。

短视频生成看起来还可以
但是生成样式和风格相对单调
对于多物体生成不算太好

[收藏本文] 【下载本文】

科技知识最新文章

百度为什么越来越垃圾了?

为什么程序员总是发现不了自己的Bug?

出现在抖音评论区里边的算命真不真？

你认为 C++ 最不应该存在的特性是什么？

为什么 Windows 的兼容性这么强大，到底用了

如何看待Nvidia禁止使用翻译工具将cuda运行

为何苹果搞了十年的汽车还是难产，小米很快

该不该和AI说谢谢?

为什么突破性的技术总是最先发生在西方？

加:2024-02-26 21:47:15 更:2024-02-26 22:20:10

股票涨跌实时统计涨停板选股分时图选股跌停板选股 K线图选股成交量选股均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

网站联系: qq:121756557 email:121756557@qq.com 天天财汇