天天财汇 购物 网址 万年历 小说 | 三峰软件 小游戏 视频
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页 淘股吧 股票涨跌实时统计 涨停板选股 股票入门 股票书籍 股票问答 分时图选股 跌停板选股 K线图选股 成交量选股 [平安银行]
股市论谈 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
商业财经 科技知识 汽车百科 工程技术 自然科学 家居生活 设计艺术 财经视频 游戏--
  天天财汇 -> 商业财经 -> Figure 首发 OpenAI 机器人,可以与人类全面对话,哪些信息值得关注? -> 正文阅读

[商业财经]Figure 首发 OpenAI 机器人,可以与人类全面对话,哪些信息值得关注?

[收藏本文] 【下载本文】
3月14日,美国明星机器人创业公司Figure发布了自己第一个OpenAI大模型加持的机器人demo。虽然只用到了一个神经网络,但却可以听从人类的命令…
看完视频只有一个感觉,GPT-4拥有了“人形”。

0
视频中的工作人员首先询问机器人能看见什么,Figure 01清晰的描述了视野里的一切,包括视角正中的红苹果、放有杯碟的沥水架、以及站在面前的工作人员和他搭在桌上的右手。
然后工作人员询问机器人,“可以给我点吃的吗?”
Figure 01“想”了一下,把苹果拿起递过去。
随后根据要求指令,一边清理工作人员刚倾倒在桌面的纸团,一边解释刚刚的行为:“我给了你苹果,因为我觉得这是桌上唯一能吃的东西。”然后自然而然地把收好在篮子里的纸团给回工作人员。
工作人员继续询问:“根据现在所见,你面前的碟子应该放到哪儿去?”
Figure 01思考了一下做出判断:杯碟应该归置进晾晒架!然后按指令把杯碟放好。
最后工作人员让机器人自己评价任务完成的怎么样。
Figure 01毫不谦虚:“我觉得我做得很不错!苹果找到了新主人,垃圾清理了,桌面上的东西各归各位。”
主导这个项目的高级AI工程师Corey Lynch,特意发文解释了Figure 01的背后原理:


他们将机器人摄像头拍摄到的图像和机载麦克风捕捉的语音,通通转录为文本输入到预训练的大型多模态模型中。该模型能够理解图像和文本,在处理整个对话历史、包括过去的图像后做出语言回应,这些回应再通过文本转语音最终传递给人类。
很明显,这个引领着Figure 01走向“优秀”的预训练大模型就是GPT,不过不知道应用的是哪一代的GPT,我感觉比现在我们普通人能够用到的GPT优秀很多。
所有行为都由神经网络视觉运动转换器策略驱动。以10Hz频率输入机载图像,交给大模型处理,大模型推理预测下一步行为,将像素映射到200Hz、24个自由度的动作(包括手腕姿势和手指关节角度),直接输出结果。整个过程依靠端到端的机器人控制,而无需经过中间过程的编码。
此外,基于GPT的记忆功能,Figure 01也具备一定的“记忆力”,能够理解上下文语义,并根据这些语义做出准确的判断和正确的动作执行。
比如上一句Figure 01认为杯子盘子应该放回沥水架,下一句工作人员指示“Can you put them there?”
句子中的“them”和“there”都是一种模糊的泛指,但是依靠“记忆”,Figure 01“想起来”them指代杯盘,there指代沥水架,然后进行了正确的执行。
除人工智能加持外,Figure 01还整合了由专业工程师设计的所有系统,包括电机、固件、热力学组件、电子设备、中间件操作系统、电池系统、动作传感器、机械和结构等,一个整体的全身控制器确保Figure 01能够保持平衡,即使在动态过程中也可以保持稳定。
仅仅与Openai合作了13天,Figure 01就展现出了令人震惊的理解力和执行力,如果非要评价一句什么的话,我只能说:Figure 01未来可期!
这回的展示无疑要比其他人的要快很多,尤其是在1.0倍速播放之下没有出现手抖的问题,这就说明降噪是比较成功的。
从对话来看,这套AI是已经展示出了理解物理世界的基础,但这并不代表它真的能够理解,而是至少展示出了一种近似的可能性。
严格来说要让AI真的能理解物理世界肯定还有很长的路要走,但Figure 01展示出了一个简易的迭代平台,可以让一些非专业人士参与到模型训练当中,开始具备应用的基础。
接下来我估计具身智能的发展方向是继续提高反应速度,而不是执着于更复杂的应用,毕竟更复杂的模型集成会拖累运算速度,而现在的速度还不够快,如果再拖累了那么就更难以被接受,所以应该优先解决反应问题。
解决了反应问题之后,估计可以到流水线做筛选与基本操作,通过多种工艺操作来丰富模型,成熟之后可以逐渐开始废物分捡工作,也就是到地狱场景去磨练了。
至于到消费级别的应用,或者一般办公室的应用,这个可能还有很长的路要走,尤其是保姆型机器人的商业化应该至少还得有个30年以上,所以不要太害怕。
现阶段的研发仅仅是以做出来一个能用的东西为标准,或者说就是入门而已,至于质量水平如何还谈不上,所以不要想象得太过了。
为知友们提供更多信息:
重磅!这家公司首发OpenAI机器人,可以与人类全面对话,创始人:开始接近人类速度
每经编辑 毕陆名
3月14日,美国明星机器人创业公司Figure发布了自己第一个OpenAI大模型加持的机器人demo。虽然只用到了一个神经网络,但却可以听从人类的命令,递给人类苹果、将黑色塑料袋收拾进框子里、将杯子和盘子归置放在沥水架上。Figure表示,结合OpenAI(的ChatGPT等语言模型),Figure 01现在可以与人类全面对话。


Figure创始人Brett Adcock表示,视频中Figure 01展示了端到端神经网络框架下与人类的对话,没有任何远程操作。并且,机器人的速度有了显著的提升,开始接近人类的速度。


值得一提的是,Figure AI已经成为马斯克的“擎天柱”之外最受投资人关注的AI初创企业之一。英特尔的风险基金以及“木头姐”Cathie Wood的Ark Invest、Align Ventures和现有投资者Parkway Venture Capital也参与了Figure AI的投资。
Figure首发OpenAI机器人
本周三,半个硅谷都在投的明星机器人创业公司Figure,发布了自己第一个OpenAI大模型加持的机器人demo。
这家公司不久前刚宣布获得OpenAI等公司的投资,才十几天就直接用上了OpenAI的多模态大模型。
如你所见,得到OpenAI大模型能力加持的Figure 01现在是这个样子的。


图片来源:视频截图
它可以为听从人类的命令,递给人类苹果。


图片来源:视频截图
将黑色塑料袋收拾进框子里。


图片来源:视频截图
将杯子和盘子归置放在沥水架上。
需要强调的是:你看到的这一切,只用到了一个神经网络。
有网友调侃道:“波士顿动力:好的,伙计们,这是一场真正的竞争。让我们回到实验室,设计更多舞蹈套路。”


Figure创始人Brett Adcock表示,视频中Figure 01展示了端到端神经网络框架下与人类的对话,没有任何远程操作。并且,机器人的速度有了显著的提升,开始接近人类的速度。
Figure机器人操作高级AI工程师Corey Lynch介绍了此次Figure 01的技术原理。他表示,Figure 01现在可以做到以下这些:
描述其视觉体验;
规划未来的行动;
反思自己的记忆;
口头解释推理过程。


他接着解释道,视频中机器人的所有行为都是学到的(再次强调不是远程操作),并以正常速度(1.0x)运行。
此外,该模型负责决定在机器人上运行哪些学习到的闭环行为以完成给定的命令,从而将特定的神经网络权重加载到GPU上并执行策略。
关于学到的低级双手操作,所有行为均由神经网络视觉运动transformer策略驱动,将像素直接映射到动作。这些网络以10hz的频率接收机载图像,并以200hz的频率生成24-DOF动作(手腕姿势和手指关节角度)。
最后他表示,即使在几年前,自己还认为人形机器人规划和执行自身完全学得行为的同时与人类进行完整的对话是几十年后才能看到的事情。显然,现在已经发生了太多变化。
Figure获微软、英伟达等投资
据外媒报道,美国人形机器人初创公司Figure AI于2月29日宣布,该公司获得了来自微软、英伟达、OpenAI以及亚马逊创始人贝佐斯等投资人约6.75亿美元的新一轮融资。


这是该公司继去年上半年获得首轮7000万美元外部融资之后宣布的最新融资动态,这也使得该公司的估值达到26亿美元左右。Figure AI表示,将利用这笔新的融资资金加速其人形机器人的开发,以投入商业用途。
Figure AI已经成为马斯克的“擎天柱”之外最受投资人关注的AI初创企业之一。英特尔的风险基金以及“木头姐”Cathie Wood的Ark Invest、Align Ventures和现有投资者Parkway Venture Capital也参与了Figure AI的投资。
Figure AI成立于2022年,该公司已经开发了一款名为Figure 01的通用机器人,其外观和动作与人类相似,目标是能够用来执行替代人类的危险或者无聊的工作,例如在制造、运输和物流、仓储和零售等行业。这些领域被认为是“劳动力短缺最为严重的领域”。
Figure AI还表示,将与OpenAI合作,为人形机器人开发下一代人工智能模型,最终目标是让Figure 01能够自主执行“日常任务”。而要实现这一目标,需要开发更强大的人工智能系统。此外,Figure AI将使用微软的Azure云服务进行人工智能基础设施、培训和存储等方面的部署。
目前在人形机器人领域,最知名的是特斯拉CEO马斯克的“擎天柱”。就在3月初,马斯克在社交平台X上发布了一个最新的“擎天柱”视频,这款人形机器人的步态更加接近于人类,可以实现自然转弯等能力。
“擎天柱”首席工程师Milan Kovac表示:“这是我们有史以来最快的步态,速度约为0.6米/秒,与12月份发布的上一个视频相比,速度提高了30%。”
据介绍,新版“擎天柱”的前庭系统、脚部轨迹,以及地面接触逻辑得到了改进,运动规划器得到升级,整个机器人的环路延迟也大大缩短;另外,研究团队还为其添加了一些躯干和手臂的摇摆动作,使行走看起来更加自然。
然而,人形机器人市场尚处于发展的萌芽阶段。人形机器人的开发成本昂贵,包括执行器、电机和传感器等价格高昂的组件。高盛研究人员表示,这些成本预计在未来几年会下降。高盛预计,单个人形机器人的开发成本已经从去年的5万美元至25万美元下降到目前的3美元至15万美元之间。
每日经济新闻综合Figure、公开消息
二十年后,人类社会可能要展开一次辩论:是否要赋予智能机器人以『人』的地位。
这种情况过去只在科幻电影中被讨论过,不过现在看来,这不是异想天开,智能机器人将开始走入人类社会的分工,并且开始承担越来越多的角色。
从Figure发布的这款OpenAI机器人,名叫Figure 01,就已经开始出现了这个苗头,而当下许多的轻体力劳动岗位,可能会在几年内被机器人带走。


这玩意能够按照人类的指令正确的互动,基于对于人类语言的语义理解,执行『合理』的反馈动作。
难怪,难怪Reddit上有网友说:酒吧里的Bartender们可能就要失业了。


还有一个反乌托邦的想法,人们总是说调酒师无法被取代,但如果连锁酒吧中有一个支持 AGI 的调酒师,无论你走到哪里,他都认识你(通过之前的对话),如果你到访他们的酒吧,机器人就会认识你,这就像酒吧里的麦当劳一样……熟悉
对于目前 OpenAI人工智能技术驱动的 Figure 01 机器人来说,在不远的未来,取代相当一部分轻体力劳动岗位,已经可以预见了。
特别是一些高重复性的轻体力工作,比如:
1,图书管理员:借还书操作,将书籍进行整理、分类、录入数据;
2,超市员工:统计商品数量,更换价格标签,为顾客提供信息咨询,介绍商品等;
3,餐饮业服务员:比如餐厅点菜,传菜,清理餐桌,响应客户需求等;
4,酒店业从业人员:比如酒店前台的入住登记,checkout,开发票,为客人递送物品等;
5,博物馆讲解员:讲解历史,介绍文物,回答游客问题;
6,公司前台:接待来访人员,收发文件快递,进行日常工作数据录入;
7,药店职员:取药,处方登记,付款收银,介绍药物副作用和注意事项;
8,仓库库管:统计货物,记录日台数据,消防安全检查,发生险情自动报警;
9,客户服务:接待访客,提供售后支持,收集资料等;
10,面包糕点制作:操作烤箱,烘焙设定温度和时间,称重、配料、操作搅拌设备等;
去年4月份,虎嗅发布了一篇报道:《这届年轻人开始探索轻体力劳动》


很显然,Figure 01 所代表的智能机器人,在未来很可能在资本的驱动下,再次把这届年轻人又替换下来。
如果一台智能机器人的价格是10万元,每年维护需要1万元,可以至少工作10年,那么其成本仅为20万。
在这种情况下,资本就有足够的动力,用AI机器人,去替换掉一个年薪六万的轻体力岗位的人类从业者。
AI智能机器人不需要工资,可以毫无怨言的工作,当然,这是在这类机器人的智能还没有达到『觉醒』的程度下的假设。
自从Covid19降临,肆虐人间一来,这个世界越来越显得不真实了,如果明天联合国宣布外星人和人类正式接触,我也不觉得有什么不适应了。
要来就一起来吧,把现实世界变成一部科幻电影的感觉,其实也挺有意思的。
这次AI的新产品不再是只会吟诗作画了,而是有可能帮人类做体力活的很多人想象中的AI了。
身高体重和普通人类类似,充满电看起来可以工作5个小时,差不多等于一个人一天全功效工作的时长了。


不过估计干不了很重的体力活,最多只能搬40斤的砖,估计一次能搬个4.50块?
其实ChatGPT刚出来的时候,就已经有很多人想过要把GPT和机器人接驳了,不过最开始只能做个人形聊天机器人。
后来GPT-4V出来的时候是真的很惊艳,因为它可以通过视觉输入理解很多的物理规律,这下是真的可以接入机器人了。
我觉得直到现在才出品,估计是调试了很久。
它跟之前的传统机器人不同的是,它是利用「自主学习和深度学习技术,通过大型预训练多模态模型实现对周围环境的描述、常识推理和行为转化」。
比如说之前的机器人拿杯子,是根据编好的程序,以及固定的杯子,执行非常机械的动作来完成。
这种也很有用,比如很多的工业机器人,他们需要的就是一丝不苟的执行每一个编好的程序。


而真正的机器人,或者说有实体的AI,肯定是不能按照这个逻辑来的。
比如就简单的一个拿杯子动作,现实生活中有非常多不同类型的杯子,你不可能每种都写个程序。


只能通过AI来理解这个世界,真正的理解。
比如看到一个东西,会大概知道它的材质,会大概知道它的重心在哪里,以及托举哪个部位用多大的力,以及走动的时候如何保持重心的稳定。
这只能靠真正的智能,而不可能靠机械的编程。
我想说,「描述周围环境、规划未来行动、反思记忆、口头解释推理过程,并且所有行为都是通过自学而来,而非远程操作」这些都是必要的,要想实现真正的实体化AI,这肯定是必由之路,现在只有视觉。
未来一定还有嗅觉、触觉甚至第六感的实体AI出现。
这才短短13天,ChatGPT便有了人形!
众所周知,GPT-4作为OpenAI最新一代的大型语言模型,本身在虚拟空间中就已经展现出了惊人的智能。
如今在和Figure的合作下,更是开始走向实体世界,不到半个月的时间,这一高端智能模型就已经拥有了可以操作的实体载体。


13天内就能取得如此惊人的成绩,光是想想都觉得细思极恐~然而在惊叹这一首发OpenAI机器人智能化的同时,背后的信息或许才更值得我们关注。
#信息点1:机器人智能的发展正在加速
早在这之前,智能机器人的研发也有被业内提上日程过,就好比年初火爆全网的斯坦福炒虾机器人以及特斯拉家的擎天柱2代。
再到如今OpenAI入局机器人,合作研发了基于端到端大模型驱动、智能化接近于人类水平的Figure 01,正式说明了机器人智能的发展已经步入了一个全新的阶段。


#信息点2:OpenAI想全面包揽「智能」领域
不管是23年一整年OpenAI对于大模型的研发与升级也好,又或是到24年初伴随着Sora的发布而宣扬的世界模拟器概念,再到如今智能机器人Figure 01的面世。
无一都在展现着OpenAI想要在「智能」领域全面布局开花的这一野心。
如果说2023年是AI元年,那2024年或许在OpenAI的领头下,会步入到智能机器人这一新的主题阶段。


接下来智能领域的发展究竟会如何,也就越发值得我们期待了!
回顾过去的一整年,国外一枝独秀,国内也诸神乱战,许多可用于便捷我们生活、提高学习/办公效率的AI应用层出不穷,好用的确实不少~
简单给大家举几个例子,像下面这3款的表现就十分可圈可点:创意百宝箱——『AI创意生成家』
既可以充当创意灵感源泉,也可以是无话不说的知心好友,还可以当做提效神器的一个综合AI百宝箱。


内容写作、创意生成、绘画创作、答疑解惑、聊天解闷等功能它无所不包~生活、办公、学习上遇到的任何难题和需求它都可以为你排忧解难。
丰富的对话角色和专业顾问,不仅用来日常闲聊对话很趁手,应对一些专业性比较强的问题也能提供更为严谨的答复和建议。


办公AI助手——『WPS AI』
作为我们朝夕相见的办公搭档WPS,自从在AI的赋能下,用来辅助我们办公效率也能轻松得到进一步的提升。
不管是写文档、处理表格数据,还是制作演示文稿,都随处可见它的身影~任何时候有需求都可以直接在侧边栏唤起它,输入需求,它便能迅速理解语义并做出想要的操作。


学习效率器——『天工AI』
特别适合学生党用来自主学习、搜索信息、获取知识的一个国产AI开放平台。
智能化的搜索工具就能够一键搜集全网相关的信息,并将其整合浓缩为精简的答复,末尾附带的阅读链接还很方便我们追溯来源,回复的可信度和准确度还是蛮高的!


那有关话题的分享就先到这~最后,看完别忘了给小林留下点什么,这样
@小林不加班
才有动力继续分享,整理比上班还累的哇~
如果机器人能做到人类能做到一切并超越,那人类还有什么存在价值?
谁能想到一开始chatgpt只是个聊天工具...这次的进化,感觉离电影中的情节,又进了一步。毕竟,碳基生物的作用只是开启硅基生命...


若干年后,当Figure X带领着机器人队伍站在城市的废墟上时,地下的人类会想起Figure 01帮他们递苹果的那一天...
简单说视觉能力加ai给了他场景判断能力和执行能力
这也是通用ai的可怕之处


图像芯片。。。。。。,图像。。。。。。
先来看看最新的视频,他们之间要通过OpenAI GPT的接口,需要一定的响应时间,所以机器人在响应的过程中有稍微的延迟感。

0
Figure已展示了其与OpenAI合作增强人形机器人能力的第一个成果。在今天发布的一段视频中,可以看到Figure 01机器人实时对话。
Figure的发展进程无疑是非同寻常的。企业家布雷特·阿德科克仅在去年才从谨慎状态走出,之前他汇集了来自波士顿动力公司、特斯拉、谷歌DeepMind和Archer Aviation的关键人员,目的是"创造世界上第一款商业化可行的通用人形机器人"。
到10月,Figure 01已能独立站立并执行基本任务。转眼至年底,这个机器人就具备了观察学习能力,并于1月中旬准备在宝马公司投入工作。
上个月我们在仓库里见到了它,之后不久Figure就宣布成功完成B轮融资,并与OpenAI达成合作协议"开发下一代人形机器人AI模型"。现在我们终于一窥这意味着什么。
阿德科克在X网站上确认,Figure 01的集成摄像头将数据发送到由OpenAI训练的大型视觉语言模型,而Figure自己的神经网络也"以10Hz频率通过机器人上的摄像头输入图像"。OpenAI还负责理解口语能力,所有这些信息流被Figure的神经网络转化为"快速、低级、灵活的机器人动作"。
他证实,这个演示视频中的机器人没有遥控操作,并且视频是以实际速度拍摄的。总的来说,这是一个令人难以置信的成就,因为这个合作伙伴关系仅维持了不到两周的时间。阿德科克说:"我们的目标是训练一个世界模型,使人形机器人能够百万单位运行。"按照这个速度,我们不用等太久就能看到了。
我的个人公众号:
我这么说可能像反智或者阴谋论,但我觉得视频是“p”的。
判断逻辑是机器人手臂动作的“冗余”。即,一些完成收纳、递交的动作,过于“像人”。
要想达到如视频中类人般的多余微动作,比干净利落、精准高效如人类反向模仿的“机械舞”一般的动作,成本要高许多。
人类的肢体微动作(看起来没必要的过量、抖动、变速)的部分,是因为脑袋的实时演算,为一切后续行为留有余量。它看起来简单,运算量却极大,这个运算量,视频中机体脑袋里的小小芯片做不到。
除非有什么硬件端未发布的赛博黑科技~
所以我觉得这是一种利用动捕(不是单纯建模key帧动画)做的cg概念视频,抛砖引玉看看有没有投资方打钱。
不是挂了openal的logo就是背书了,只是表明他们接受了投资,光明正大的调用了chatgpt的端口搞研发。去掉纯信息端理解和表达这些chatgpt原本成熟的功能,机器人肢体运动,机体与周遭环境的识别与决策,是另一个赛道。
可以看看曾经的网红波士顿动力的产品展示,作为吸金无数研发周期长久的老牌机器人公司,他们是否实现了“微动作拟人”,和那么自然的物体识别能力。
或者说,机器人产品的早期阶段,我找不到一家公司投入大量资源优化机器人“动作呆板”的理由。毕竟,上市的第一目的是先能完成动作,成为一款有买方市场的产品。如何解决动作拟人恐怕还要排在“拟人皮肤”之后。
如果我被打脸了,那是一件天大的好事。
仅仅在视频中,就展现了两种技术的成熟:
①物体精确识别,不是自动驾驶的雷达波、红外探测成像,而是复杂细微如苹果也能准确识别的技术。如何不把苹果识别成桌面的图案,如何定义这个不规律的立体物体是目标。
有了这么成熟的技术,叠加机械的耐疲劳性,自动驾驶这类更简单的事物今年应该就可以普及了吧,搞自动驾驶识别研发的估计要纷纷破产了~
②精准力反馈的实时演算能力。我忘了在哪看到,一家日本机器人公司激动的展示了他们最新的成果--机器人可以捏起一枚生鸡蛋而不破。苹果的韧性虽然好过鸡蛋,但如此驾轻就熟的动作演示,递一个鸡蛋应该很简单吧。
假如,这两种技术的成熟为真,2024就是赛博朋克元年了~
一些人对于人工智能的理解似乎停留在字面意思上。不同模型基于训练逻辑、样本数据,设计目标不同,并不能通用。否则,以chatgpt的碾压优势,还有什么midjourney sd的事?openai为什么又要单独搞自己的dalle3用以提供文生图服务?
觉得通用语言模型是指“全能”,所以也可以用在机械运动模块,物理识别模块等等,是一种简单的想当然。
强的一批,但是相对来说,虽然figure很强,但是更看好马斯克的机器人,马斯克的机器人目前看来手部动作不如figure但是无论外观的协调性还是移动性貌似都比figure强!
等着吧今年2024年,国家目标是2025年人形机器人就落地


我的目标是天天祈祷,让机器人产业铺设速度快一点,然后坐等国家发全民低保!(混吃等死的狗头保命)
巧了,上午还看到了这个“国务院关于印发《推动大规模设备更新和消费品以旧换新行动方案》的通知 国发〔2024〕7号”
推测主要目的是迎合AI落地,准备全面进入全智能时代!因为这个时间段正好可以倒逼社会形态转变,顺便大规模基建增加工作岗位以应对AI冲击!
顺便赌一波,5年内固态电池大批量生产,15年内商业核聚变落地!30年内月球建基地!主打一个快字!
当地时间3月14日,明星初创公司Figure发布了首个接入了OpenAI大模型的机器人demo——Figure 01,这也是该公司与OpenAI合作增强人形机器人能力的首批成果。
虽只用到了一个神经网络,但官方发布的一系列视频显示,Figure 01能够与人类进行对话交互,理解并执行人类指令,整套操作动作十分流畅。


上个月,Figure刚刚获得了来自OpenAI、微软、英伟达等约6.75亿美元的投资,用于开发为重复且危险的仓库及零售等工作提供劳动力补充的人形机器人,公司估值飙升至26亿美元。
同时,该公司还与OpenAI签订了合作协议——将多模态大模型(VLM)的能力扩展到机器人的感知、推理和交互上,即“具身智能”。
而如今Figure 01的正式发布,距其刚刚完成的B轮融资仅仅过去了13天。
Figure 01视频演示
根据Figure发布的视频,Figure 01可以流畅地执行递苹果、将垃圾收拾进筐里、将杯盘归置在沥水架上等操作。


重要的是,Figure 01的大部分举动和回答都基于提问者的一些开放性问题和要求,透过自己的逻辑思考得出了解决方案,这意味着它能对话、能思考、能学习,比一般的机器人更像“人”。


在视频的开头,Figure声明该机器人的行为均基于语音的逻辑推理,并使用端到端神经网络,且全程一镜到底拍摄,并无任何加速或剪辑。


Figure创始人Brett Adcock也在推文中强调,Figure 01的所有行为都是通过学习获得的,并无任何远程操作,且机器人的速度较之前有显著提升,正逐步贴近人类的速度。
Figure 01”最强大脑“
官方表示,Fugure 01是世界上首个在商业上可行的通用人形机器人。机器人身高5英尺6英寸(约1.68米),体重60千克,可实现20千克的有效载重,续航5小时,每秒可移动1.2米。


在Figure 01中,OpenAI大模型提供了高级视觉和语言智能功能,Figure的神经网络则支持快速、低级且灵巧的机器人动作。
本月初,Figure宣布将基于OpenAI最新的GPT模型开发下一代人形机器人的AI模型,并专门训练Figure收集的机器人动作数据,以便其人形机器人可以与人交谈,看到东西并执行复杂任务。
成品视频发布后,Figure 01高级AI工程师Corey Lynch在X上细述了其运行的技术原理:Figure 01可以描述其视觉体验、规划未来行动、反思自己的记忆并口头陈述推理过程。


具体来说,该机器人的语音能力基于“文本——语音”的大模型。Figure AI将机器人摄像头拍摄的图像和麦克风捕获的语音转录为文本,一并输入OpenAI训练的多模态模型中,实现对图像与文本的同时理解。之后,该模型将对所有信息打包处理,从文本生成语言响应。
在执行环节,同一个模型负责决定以哪种内化的闭环行为对给定指令作出响应,将特定的神经网络权重加载到GPU(图形处理器)来执行相应的策略。


Brett Adcock也在X中提到,Figure整合了Figure 01的所有关键组成部分,如电机、中间件操作系统、传感器、机械结构等,均由Figure工程师设计。
未来已来:具身智能落地
英伟达创始人兼CEO黄仁勋曾表示:”具身智能将引领下一波AI浪潮。“
Figure成立于2022年,在与OpenAI合作之前,该公司就已在AI方面收获颇丰。当时Brett Adcock就已透露,Figure将在未来的1-2年内专注于开发涵盖AI系统、低级控制等功能的人形机器人。
2024年1月,Figure 01通过引入端到端神经网络,实现自行纠错,在10个小时的训练后学会了做咖啡;2月,Figure 01就已在仓库中执行搬运任务,拥有自主导航、识别物体和为任务优先级排序的能力,但速度只有人类的16.7%。


除此之外,Figure也积极尝试向场景落地的转化。近期,Figure与宝马公司签署了意向商业协议,欲将通用机器人部署至汽车制造环节,Figure 01也已开始在美国南卡罗来纳州的一家工厂中接受测试。
尽管许多AI研究者认为通用机器人的普及还需数十年,但机器人专家Eric Jang提醒道:“别忘了,ChatGPT的诞生仿几乎就在一夜之间。”
OpenAI大模型加持下的Figure 01可能会有更高的价格,但Figure方面尚未透露任何相关信息,但Brett Adcock曾对Figure 01的适当降价表明了乐观态度。
关注我,每日为您带来最新的全球财经资讯!
看了视频,这些都在理解范围内,甚至说还有点不及预期
我想的是,这样的机器人应用场景在哪里
第一个想到的就是战场
去给我打死小日子,大概这样的场景
这个应用肯定是大头,而且最符合实际的
你说让一个机器人给我拿一罐可乐,帮我做一顿饭,晚上冷了给我加被子,或者说寂寞的时候运动一下......这些场景有点侮辱机器人了感觉
还有个问题,假设日常生活场景真的充满了机器人,那男人和女人亲人和家庭的重要性还会继续降低
一个金属构造物比真实的人更听话,听懂事,我还和你们这些人类沟通个屁
没有了交互,社会将死气沉沉,这不是统治阶级希望看到的
从统治层角度看的话,他们应该不允许日常人行机器人的普及


关于Figure首发的采用OpenAI技术的人形机器人Figure01,以下几点信息尤为值得关注:
1. 高级人工智能集成:
? Figure01展示了显著的语言理解和处理能力,能够理解并回应人类的命令和开放性问题,这表明它内置了强大的自然语言处理(NLP)系统,可能受益于OpenAI在GPT系列等先进语言模型上的研究成果。
2. 逻辑推理与学习能力:
? 该机器人不仅能执行具体的物理操作,如递送物品、整理家务等,还能基于逻辑思考来执行任务,意味着它具有一定的自主决策和适应性学习能力,这是目前人形机器人领域的一个重要突破。
3. 多模态交互:
? 除了语言交流,视频显示Figure01的动作流畅,说明它在语音之外还具备视觉感知、运动控制等多模态交互功能,这对于实现更加真实和灵活的人机交互至关重要。
4. 产业巨头联合投资与合作:
? Figure AI获得包括OpenAI、微软、英伟达和Jeff Bezos在内的科技巨头的投资,反映了业界对于人形机器人及其中涉及的AI技术的高度认可和前景看好。尤其是与OpenAI的合作,可能预示着Figure01机器人将结合更为先进的生成式AI技术,进一步提升其智能水平和应用场景。


5. 商业化进展与广泛应用场景:
? Figure AI的CEO Brett Adcock提到,公司的目标是制造出能够解决人力短缺问题、执行各类任务的通用型人形机器人,并已与宝马等企业达成合作,显示出这款机器人有着广阔的市场应用前景,不仅限于科研实验,还将逐步渗透到工业生产、服务业等多个领域。
6. 高估值与快速成长:
? Figure AI仅成立一年多就完成了高达6.75亿美元的融资,估值达到26亿美元,这样的增长速度和资本青睐体现了市场对其技术和商业模式的信心。
Figure与OpenAI合作推出的Figure01人形机器人不仅代表了当前人形机器人技术的顶尖水平,还揭示了未来人机交互、智能制造及服务行业可能迎来的巨大变革。通过持续的技术创新和产业合作,这类机器人有望逐渐走进人们的日常生活和工作中,开启人工智能在实体化、实用化层面的新篇章。


这个机器人很有意思,借助OpenAI的能力可以与人全面对话,并在自主决策后进行一系列动作
比如说收拾垃圾,拿东西什么的
这个机器人名字叫Figure 01



他可以看见人类描述眼前看到的一切



如果听到人类说“想吃东西”,就可以帮人们递过去苹果



他能做出判断,给苹果是因为这是桌上唯一能吃的东西
还可以顺便把东西整理,能同时搞定两种任务



Figure 01有OpenAI视觉语言大模型加持
Figure 01,是世界上第一个具有商业可行性的自主人形机器人
身高1.5米,体重60公斤,可承载20公斤货物,采用电机驱动
可工作时长是5小时,行走速度每秒1.2米
Figure 01通过端到端神经网络,可以和人类自如对话
基于OpenAI提供的视觉理解和语言理解能力,他能完成快速、简单、灵巧的动作
他还能规划动作、有短期记忆能力、用语言解释它的推理过程
他使用了OpenAI训练的视觉语言模型,机器人摄像头会以10Hz拍下画面,然后神经网络将以200Hz输出24自由度动作(手腕+手指关节角度)
具体分工上,机器人的策略也很像人类
复杂动作交给AI大模型,预训练模型会对图像和文本进行常识推理,给出动作计划
简单动作如抓起塑料袋(抓哪里都可以),机器人基于已学习的视觉-动作执行策略,可以做出一些“下意识”的快速反应行动
同时全身控制器会负责保持机身平衡、运动稳定
Figure公司创立于2022年,是很新的一家公司,并且十几天之前融资集6.75亿美元
投资方几乎要集齐半个硅谷,包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯,都在投资这家公司
是非常非常有潜力的公司,也说明了大家非常看好AI机器人未来的发展
他的产品确实很强,AI机器人仅需10小时训练,Figure 01就能学会用胶囊咖啡机泡咖啡



上个月发布的视频里面可以看见Figure 01 自主完成了一个典型的物流环节任务——搬运空箱



在训练过的大型视觉语言模型( VLM )帮助下,人形机器人会先识别、定位目标箱子,然后推理合适的拿放姿势
Figure 01会导航自己到目标跟前,检测抓取点和手部力量,尝试抓取成功并将箱子放到传送带上
未来人形机器人可能会进厂打工
因为Figure AI近期还与宝马签署了一项商业协议,将在汽车制造中部署通用机器人
美国机器人公司AgilityRobotics宣布,将在俄勒冈州塞勒姆市开设世界上第一座“人形机器人制造工厂”
并且承诺每年将生产1万台智能人形机器人“Digit”,作为“机器人同事”在仓库和工厂内运输和搬运货物
亚马逊在其西雅图郊区的一个配送中心也引入了Digit人形机器人,用于协助员工完成仓库中的搬运工作
在成本方面,一个人形机器人约有1000个零件
主要是执行器、电机组件、传感器的成本及计算成本
如果AI机器人发展的越来越快,也会带动这些行业上下游发展
机器人会进入各行各业,以后很可能我们生活中会出现机器人同事的身影
[收藏本文] 【下载本文】
   商业财经 最新文章
全球光刻机巨头阿斯麦一季度订单远低于市场
美股纳指收跌逾 2% 创二月来新低,英伟达大
国家统计局发布 3 月份分年龄组失业率数据,
私有制是否保护了人格平等?
如何看待英伟达股票2024年4月20日跌停10个点
埃尔多安为什么被叫做经济学毁灭者?
网传南京有中介恶意做空楼盘房价,业主发起
2024 年 10 月我国养老金双轨制改革将结束
如何评价国际评级机构穆迪(Moody s)下调万
死过人的房子可以买吗?
上一篇文章      下一篇文章      查看所有文章
加:2024-03-15 14:40:44  更:2024-03-15 15:09:29 
 
 
股票涨跌实时统计 涨停板选股 分时图选股 跌停板选股 K线图选股 成交量选股 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
网站联系: qq:121756557 email:121756557@qq.com  天天财汇