[科技知识] 为什么感觉欧美AI比我们强？

天天财汇购物网址万年历小说 | 三峰软件小游戏视频

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页淘股吧股票涨跌实时统计涨停板选股股票入门股票书籍股票问答分时图选股跌停板选股 K线图选股成交量选股 [平安银行]

股市论谈均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

商业财经科技知识汽车百科工程技术自然科学家居生活设计艺术财经视频游戏--

天天财汇 -> 科技知识 -> 为什么感觉欧美AI比我们强？ -> 正文阅读

[科技知识]为什么感觉欧美AI比我们强？

[收藏本文] 【下载本文】

这两天心里有个疑惑。如果说数学物理化学工程是因为西方国家比我们早发展几百年，那为什么AI这种新兴学科最近十年的进展大多数都是欧美做出来的：比如Deep…

因为AI不是近十年才出现的新兴学科。其积累在几十年前就开始了。
那几个老巨头，Hinton今年75，LeCun今年60。他们年轻的时候就是AI领域的引领者了。国内这个岁数的研究者，年轻的时候普遍还在“填补国内XXX领域的空白”。
另外，巨头们的门生也是在几十年中不断开枝散叶的。今天Ilya Sutskever带领OpenAI搞大新闻。不要忘了，他是AlexNet（注意，这已经是十年前了）的作者之一，是Hinton的学生。
学术这个东西是有明显的师承的。武林看到武当七侠威震江湖的时候，情不自禁感慨武当功夫天下第一。但是不要忘了，武当今日的辉煌，是从张三丰练童子功开始的。

建议课后阅读话题：AI的两次寒冬。

别问，问就是法律法规不允许。

你说呢？

图侵删

AI回答了一切

昨天，Midjourney生成的完美情侣刷爆网络，大家纷纷在留言区里畅想，下一步，就是演员被淘汰，人人都能升级大导，一键生成大电影了。
巧得很，今天，会做视频的AI模型不就来了嘛。
刚刚，仿佛一声惊雷炸响，Runway发布了文字生成视频模型Gen-2。
宣传词也是非常炸裂——「say it，see it」，只要你说得出来，它就能给你做出来。科幻小说里的超能力成真了！
可以说，有了Runway Gen-2，你就能用任意的图像、视频或文本，生成一段酷炫大片，想要啥风格，就有啥风格。

这个速度简直让人目瞪口呆：Gen-1的内测都还没拿到呢，Gen-2就来了！

一句话，一张图，三秒视频无中生有
此前，Runway在文本到图像领域就曾经大放异彩，大名鼎鼎的Stable Diffusion，就是Runway开发的。
在今年2月，Runway就提出了首个AI编辑模型Gen-1。
顾名思义，Gen-1可以在原视频的基础上，编辑出咱们想要的视频。无论是粗糙的3D动画，还是用手机拍出来的摇摇晃晃的视频，Gen-1都可以升级出一个不可思议的效果。

论文地址：https://arxiv.org/abs/2302.03011
比如用几个包装盒，Gen-1就可以生成一个工厂的视频，化腐朽为神奇，就是这么简单。

而相比Gen-1，Gen-2获得了史诗级的升级——可以从头开始生成视频。

目前，这个模型还未开放，预计在几周内会公开。
而根据目前的演示片段看来，Gen-2的效果似乎暂时比不上Gen-1，没有那么逼真。
但是，这毕竟是AI文生视频0到1的第一步。AI导演做到这一步，已经够人类颤抖的了。

网友实测，效果炸裂
而获得内测资格的幸运网友，已经开始动手生成自己的电影了。
可以看出，无论是宫崎骏风格的日系动画，还是写实风格的镜头特写，或者魔幻特效的电影大片，Gen-2都不在话下。

虽然目前的画质可能还不够细腻，但毕竟是从0生成的视频，一旦日后优化好，大导们的饭碗怕是捧不稳了。
Gen-2的八大「魔法」
Mode 01：Text to Video（文字生成视频）
一个文本提示，就能合成出任意风格的视频，不怕它生不出来，只怕你想不到。
提示：在纽约市的一间阁楼里，傍晚的阳光透过窗户温柔地洒进屋内。
输出：

Mode 02：Text + Image to Video（文字+图像生成视频）
输入一幅图，再加一句prompt，直接就给你变成了视频。
输入图像：

驱动提示：在一个低角度拍摄的画面中，男子正沿着街道行走，周围酒吧的霓虹灯照亮了他的身影。
输出：

Mode 03：Image to Video（图像生成视频）
这个不用解释了，你给它一张图片，它给你秒变一段视频。多种风格，随你选择。
美图一秒变电影，这也太梦幻了吧。
输入图像：

输出：

Mode 04：Stylization（风格化）
如果你有一段原视频，但是效果不够炸裂，怎么办？
只需要把你想要叠加的风格用图片或者文字叠加上去，多魔幻的风格都立马生成，秒变好莱坞大片。
原始视频：

驱动图像：

输出：

Mode 05：Storyboard（故事版）
将模拟的场景一拉，就变成了风格化和动画化的渲染图，前期制作一键简化。
输出&输出对比：

Mode 06：Mask（掩码）
在你的视频中分离出特定的对象，然后通过prompt，想怎么改就怎么改，比如下图中，金毛秒变斑点狗。
输入视频：

驱动提示：
一只身上有黑色斑点的白毛狗。
输出：

Mode 07：Render（渲染）
只要输入图像或提示，无纹理的渲染立马变成现实的输出，深度和真实感震撼人心。
输入视频：

输出：

Mode 08：Customization（个性化）
通过自定义，让原视频个性化大变身，保真度还超高。
点击就看外国小哥秒变海龟人。
输入&输出对比：

训练图像：

从生成结果来看，Gen-2的前景，实在是太令人着迷了。（Gen-1的内测申请在这里，http://t.cn/A6Cu1cdy）。
虽然Meta和谷歌也有类似的文本到视频模型（Make-a-Video和Phenaki），生成的剪辑更长、更连贯。
但这些体量更大的公司并没有投入多大的资源，相比之下，Runway的团队只有区区45人。
其实，Runway自2018年以来，就一直专注于研究AI工具，并在去年年底筹集了5000万美元。
有趣的是，Stable Diffusion的初始版本，就有Runway的贡献。只不过后来被Stability AI普及，并有了更进一步的发展。
而这也告诉我们，初创公司在生成式AI上的潜力，是多么惊人。
一大波展示

提示：一只眼睛的特写镜头

提示：无人机拍摄的沙漠景观

参考资料：
https://research.runwayml.com/gen2
https://www.theverge.com/2023/3/20/23648113/text-to-video-generative-ai-runway-ml-gen-2-model-access
本文链接：https://www.8btc.com/article/6810288

我觉得不必妄自菲薄，欧美和中国在人工智能领域算是各有千秋吧。具体来说中国强在人工，欧美强在智能。
-
有人说我黑，我可不是黑啊，但凡是需要大量标注标签的任务，拼音团队绝对都是薄纱老外
-
2023.05.30
你就说强不强吧？

买一台Intel处理器的主机，插上Nvidia的显卡，装上Ubuntu系统，配置好python开发环境，装上PyTorch深度学习框架，检索一下英文文章，打开GitHub克隆开源代码，换数据、改模型、调参数、写文章……
顶会文章大家五五开，我们的AI赶超欧洲比肩老美

以下语境主语全是新人！新人！
欧美AI新人学习：
买主机，插上显卡，成功！
下载ubuntu，装ubuntu，成功！
下载包，安装包，成功！
下载驱动，装驱动，成功！
访问github，下载代码，pip install -r requirements.txt，运行，成功！
添加功能块，运行，成功！
我们AI新人学习：
买主机，插上显卡，成功！
下载ubuntu，网络失败！网络失败！网络失败！网络失败！百度国内镜像下载，下载成功！
装ubuntu，网络失败！网络失败！网络失败！网络失败！百度国内镜像，配置镜像，下载失败！更换镜像，下载失败！更换镜像，下载成功！
下载包，网络失败！网络失败！网络失败！配置镜像，下载成功！
访问Nvidia官网，访问失败！访问失败！访问失败！访问成功！
下载驱动，网络失败，网络失败网络失败网络失败！下载成功！
安装驱动，成功！
访问github！网络失败，网络失败，网络失败，网络失败！访问成功！
下载代码，网络失败，网络失败，网络失败，网络失败，成功！
pip install -r requirements.txt，网络失败，网络失败网络失败网络失败！
修改源，成功！
添加功能块，运行，成功！
注：我没删任何评论，也不会删任何评论。
统一回复：不要过度解读我的这个虚拟创作了。我仅仅是描述了一个虚拟的菜鸟入门AI时的情况，这个虚拟的菜鸟在学习AI的过程中顺便学习了很多网络知识，学习的阅读懂得越多技术越强，我只是想表明这个菜鸟技术在最开始就飞速增长。
你们过度解读让我很难受。

如有侵权，请第一时间联系作者，马上删除。

0
AI出图如此发展下去
网上的图片要小心辨认才行了

人工智能的发展离不开数据和算力两个关键因素。欧美在这两个方面具有优势，因此在某些方面比我们更强。

首先是数据方面，欧美有更加丰富和多样的数据来源。这得益于欧美国家发达的经济和科技，以及更加开放的数据政策和法律环境。欧美的公司和机构能够收集更多的数据，并且能够更加方便地进行数据共享和开放，从而能够更好地支持人工智能的研究和应用。而在我们国家，由于数据隐私和安全等问题，数据的获取和使用受到了限制。

其次是算力方面，欧美在高性能计算和云计算等方面拥有更为先进的技术和设施。这使得欧美的研究机构和企业能够更加轻松地进行人工智能算法的研发和优化，加速了人工智能技术的发展和落地。而在我们国家，由于算力设施和技术相对落后，我们在某些领域的研究和应用进展相对较慢。
此外，欧美国家在人工智能的研究和应用上有更加成熟和完善的生态系统。在这些国家，有许多专业的研究机构、企业和产业链，形成了人才、技术、数据和资本的良性循环，加速了人工智能技术的发展和应用。而在我们国家，虽然也有一些优秀的研究机构和企业，但是整个生态系统还需要进一步完善和优化。
需要注意的是，人工智能是一个快速发展的领域，虽然欧美在某些方面比我们更强，但是我们国家也有自己的优势和特点。例如，我们在某些领域的数据和应用场景更加独特和丰富，我们的人才和创新能力也非常强大。因此，我们可以在与欧美的竞争中找到自己的优势，把握自己的机遇，推动人工智能技术的发展和应用。

211计算机硕士，毕业参加某官方招聘，就体制内的，他们的首长说了一句话让我十分震惊
“我们不要翻过墙的”
请问真严格查，能有懂技术的人过关吗，这个专业没翻墙的只能说是菜鸡

为什么历史书上，从宋朝开始，就有资本主义萌芽，萌到大明灭亡都没萌出来？
因为商人们做生意做工场赚了钱就想买土地当地主，走诗书传家的路子。
没有人想继续推动工场生产扩大化。
做的太大了，沈万三，沈一石就是下场。
不如多买土地当地主。

请注意用语。
“美” 是一个国家，
“欧美” 是 40多个国家。

计算机从业者回答一下，工作3年。之前在某大厂，现在美企，也不是完全的养老院，也算美企中比较卷的。
首先是上下班时间。
大厂执行的是比较标准的996，美企这边是965，有些组不太忙的话，955甚至845有些家长早来早走，早点下班接孩子。
然后是考核。
大厂的考核算是比较恐怖吧，考核有个标准——你为公司带来了什么？基本就是结果为导向，出现了低级开发人员(校招or工作一两年的人)负责一个甚至几个项目的情况，项目产出就成了直接的衡量标准，考核结果一般也遵循361甚至262的形式，末位淘汰很明显。
美企有考核，但是宽松，只要不是躺平，正常工作能拿到平均分。打分是同级别比较，一般该级别年限长的拿高分。
同事年龄分布
大厂年轻化，平均年龄28左右。美企严重老龄化，员工平均年龄40左右。
美企的中坚力量是中年人，所以低级别只需要处理好自己手头的事情就可以了，如果你能表现出更强的能力固然好，但正常完成任务就已经满足领导的需求。
最后补充一点，我在大厂的时候学到的是怎么甩锅，怎么把责任丢出去，怎么从同事那里蹭收益。但美企这边，我学到的是承担自己的责任，解决好手头的问题，不要着急，慢慢来，有需要找老人们求助，我也更乐于分享自己的所学所闻，哪怕和现在做的项目无关，领导仍然表示这是加分点。
古语云:橘生淮南则为橘，橘生淮北则为枳。
如何进外企，这个话题我补充一下:
1.信息渠道
外企就我的感觉来说，内推很重要，但是找内推的人比较难。当时用了boss和脉脉，感觉boss基本上...我现在基本都是用脉脉了，脉脉上吹水的多，但是内推也确实多。
不过有个问题，如果是类似微软，亚麻之类的，他们有很多内推人员，打个招呼问一下，其实都能把简历投进去，但是有些企业其实可能不是那么出名，所以那边即使在招人，信息也很难流到大家手里。
这里非广告:我之前进外企找的是胡豆豆(可以脉脉直接搜)，她主推外企岗位，不过基本是技术岗。可以找她聊聊。
2. 技术岗的考核
面过的几家，都是问题+一道算法题，微软的话没有背八股，就是问了问简历某部分如何实现的，算法有难有简单，但就我面试的情况来看，一般维持在medium水平，但是面试官比较喜欢问还有没有其他解法。
亚麻有机试...这个我得强调一下，case不像leetcode一样可以看到。
3. 英语
这个算是老生常谈的问题了。程序员的英语如果不是特别强调，一般就是过6级水平(因为几乎每次面试，中国人这一关都会问我英语是否过6级)。
而且到了老外这一面，基本意味着你已经到了终面，那么这一关问的问题一般也就是老生常谈，比如工作里遇到的困难怎么解决呀，如何应对工作上的冲突啊。如果面试官用teams，可以打开live caption来帮助你理解面试官的问题。
不要担心自己的口音，也不要纠结自己的语法，大胆的说，只要你表达清楚，老外是能理解你的意思的。
举个例子:一个不熟悉中文的人磕磕巴巴问你，“能你教我中文?”，虽然他的句子怪怪的，但是你肯定能get他的意思，那么反过来，他的母语是英语，那么你的表达在他听起来虽然错误百出，但是他也能理解你的意思。
tips:以上内容适合面试官是英语母语的人，印度人不在其列，时至如今我依然被印度人的口音所困扰。如果你在面试的时候不幸遇到印度人，那只能希望他的发音和断句方式是正确的，否则的话，只能自求多福了。
写在最后，我的岗位是低级岗位，我本身工作到现在也就3年多一点，所以我的意见也只能适用于这个工作年限的人。如果是高级别的大佬面试，我这个意见不具备太多参考性，至少英语层面，高级别大佬因为沟通需要，对英语的要求也会更高。
4. 内推的重要性
突然想起这个关键点。外企的hr普遍给我一种慢吞吞的感觉...如果没有内推，他们处理的时候都会拖很久，如果你的内推人去push他们，他们会优先处理你的简历。
找个靠谱的内推很重要。
————————二更————————
正好有人问，这里加更一条
5. 外企面试中的英语六级水平
面试官部分:
1. 面试官英语母语，无明显口音。
2. 聊天过程中面试官无复杂词汇，长句。
面试者部分:
1. 面试者可以听懂面试官问题，或者二次确认后可以正确理解面试官问题。
2. 面试者可以给出合理的回答。
3. 面试者回复时不需要流利，允许因想不到单词或者不知道怎么表达时的短暂停顿。
总结下来就是:听得懂简单的句子，可以磕磕巴巴的回答问题。
再次声明，以上内容不适合印度口音，我最近终于适应了一点印度口音。
A bair of.
Whad is your broblem.
Id doesn'd maddar

不是感觉，就是，而且是碾压式的。

这个榜单还是中国自己排的。。。

就是比我们强呀。
只有在GPT实实在在影响到股价了以后国内公司才开始搞这玩意。现在什么公司沾GPT就暴涨，但GPT之前的那些技术积累有多少人在关注？
以前有能力搞GPT的互联网公司BAT，他们给的KPI是怎么让技术快速落地，极其短视地要变现。不能立刻马上赚钱就滚蛋。
我当年在腾讯优图，可能是因为不太赚钱，也可能是因为贾老师要去创业了，最后基本被一锅端，现在不知道怎么样，但是接手的戴老师也跑快手了。
还有阿里达摩院，一个科研机构要人家盈亏自负。我看不懂，但我大受震撼。Jack Ma是懂科研的。
百度要ALL IN AI，搞了那么多年，弄的还是集中在paddle、自动驾驶这些已经在美国成体系的东西。唯一拿的出手的也就paddle OCR。看，这也是个直接赚钱的项目。
其实所有现象的本质原因还是太穷，只能把钱集中在出成果快的领域。如果用AI科学的话说，就是我们在做gradient descent容易陷入sub-optimal solution。美国钱多，可以搞一些不直接变现的东西，相当于做stochastic gradient descent，更容易找到optimal solution。

[收藏本文] 【下载本文】

科技知识最新文章

百度为什么越来越垃圾了?

为什么程序员总是发现不了自己的Bug?

出现在抖音评论区里边的算命真不真？

你认为 C++ 最不应该存在的特性是什么？

为什么 Windows 的兼容性这么强大，到底用了

如何看待Nvidia禁止使用翻译工具将cuda运行

为何苹果搞了十年的汽车还是难产，小米很快

该不该和AI说谢谢?

为什么突破性的技术总是最先发生在西方？

加:2024-01-12 11:19:36 更:2024-01-12 13:55:40

股票涨跌实时统计涨停板选股分时图选股跌停板选股 K线图选股成交量选股均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

网站联系: qq:121756557 email:121756557@qq.com 天天财汇