天天财汇 购物 网址 万年历 小说 | 三峰软件 小游戏 视频
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页 淘股吧 股票涨跌实时统计 涨停板选股 股票入门 股票书籍 股票问答 分时图选股 跌停板选股 K线图选股 成交量选股 [平安银行]
股市论谈 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
商业财经 科技知识 汽车百科 工程技术 自然科学 家居生活 设计艺术 财经视频 游戏--
  天天财汇 -> 科技知识 -> 全球首位AI软件工程师诞生,未来程序员会被取代吗? -> 正文阅读

[科技知识]全球首位AI软件工程师诞生,未来程序员会被取代吗?

[收藏本文] 【下载本文】
程序员不存在了!?全球首位程序员诞生,能自主通过科技公司面试,可以自主训练和微调大模型,直接解决GitHub上的现实难题 来认识一下Devin,世界上…
看起来,这是知乎“中文顶刊”之一“新智元”在搬运国外媒体的炒作,并自行加料“程序员不存在了!?”、“码农饭碗一夜被砸”云云。读者看这问题及其说明时,可以脑补赵本山在念相关台词。
Devin 号称可以在无人协助的情况下解决 13.86% 的开放 github 错误。你可以合理怀疑其真实水平和可用性。“将来肯定会变得更好”并不值得现在乐观。
这问题字面上没限定“未来”是多久之后。专职程序员岗位的数量可能在今后数十年内减少,这跟 Devin 大概没什么关系。
程序员 Chris B. Ward 看了在 Cognition 的网站申请使用 Devin 的页面,他嘲笑说:


>认识“世界上第一位人工智能开发者”Devin
>我们已经筹集了 2100 万美元
>我们无法使用 #devin 制作用于登入的 Web 应用程序,所以改用 Google 表单来代替
欧美网络上有许多程序员提出了同样的质疑。在我看来这是致命的。
这个世界上可能只有程序员这个职业会自己发明新的工具来取代自己。
Devin这个AI辅助编程工具我看完了他们的官网和Demo,我觉得最有价值的就是这一帧。


你可以看到,它的主要布局有两部分,左边是提问以及交互;右边是Devin的工作空间。
左边很简单,就是提出你的需求,跟ChatGPT的对话框作用是一样的。
右边比较负责,它可以是Shell也就是命令行,Browser浏览器,Editor编辑器以及Planner规划器。
前面三个东西其实平平无奇,在写代码的时候经常会用到。
最核心我觉得就是Planner这个东西,因为这个东西让我想起了去年爆火的AutoGPT。
它最原始的界面长这个样子


你看它的逻辑是这样的。
提出问题->思考->提出可能的action->执行action->根据反馈继续思考。
它模仿的就是人类解决问题的方式,一步步的思考然后提出解决方案接着执行。
下面这个就是类似的逻辑。


而Devin这类型的工具,其实就是AutoGPT在编程领域的定制APP,它做的就是将编程需求进行理解、分解、以及计划,最后再执行。
不同的是,它的执行环境一般就是程序员会用到的那些东西。
比如shell来运行命令行;editor做代码编辑,如果有渲染需求的话就打开浏览器等等,这些东西大概率运行在云端,所有的这些操作都是在云端进行,你的这个窗口说白了就是输出窗口,把最后的成品扔在你面前。
它的好处其实是降低了审核的成本,因为扔给你的是成品,你可以作为用户来进行审核,而不需要专业的编程技术。
我想说的是,这类型工具的核心就是Planner再加特定领域的执行APP能力。
至于它的效果如何,我觉得打个大大的问号,毕竟没放开使用大概率就是在造势融资。
真正有代码的需求,用一些AI辅助编程工具还想,效果非常的不错。
比如这个免费的AI编程工具,可以在VSCode等主流编辑器使用,大家可以试试,用起来挺爽的。
平凡:FittenCode: 比Github Copilot性能更强,还免费的AI代码辅助编写工具105 赞同 · 24 评论文章


去红点上看了一下,这个Devin被质疑的不轻:
首先是Devin的开发团队宣称,Devin无须协助就可以解决Github 接近14%的issue。
红点上的一位安卓程序员认为,在没有明确的任务难度数据下,14%的解决率并不代表实用价值。
并且,Devin需要访问整个代码库,大多数公司不会这么干。


也有不少红点网友认为这是一场骗局,主要是为了获取融资:


而下面这位叫 raynerayne7777的网友,给出了理由:
Demo示例过于简单,只是从一个python文件中进行了API调用,然后根据一个js文件创建了一个静态网站,这是编程初学第一周的水平,卖点何在?


媒体在宣传报道的时候,很多篇幅都放在了创始团队的奥林匹克金牌上,但我觉得还是自己亲自试一下才知道效果。
我都想好了,让Devin开发一个pdf切割工具,这不是什么太难的任务:
please create a python app that could cut a pdf file into small ones


不过提交了prompt之后,给我的是一个表单,让我填写邮箱,姓名,还有社交媒体资料链接。
接下来就是排队去吧。


很显然,这个『AI软件工程师』现在并不打算真正的亮相,只是放出了一个demo,具体的能力表现,全是未知数。
我现在也是深深的怀疑。
Text to application 这个想象空间是很大的,但是实现起来并不会那么简单,我不认为这个成立几个月的奥数金牌团队可以这么快打造出工业级产品。
我们还是理智点,在AI这个风口上,什么人都有,因为道德水平与智力水平不一定是成正比的。
什么时候让我亲自用上了,我才会考虑这玩意是否能释放一波生产力。
会被取代,但是现在感觉为时过早,因为我还没到35岁。


就在刚刚,世界上第一位AI程序员Devin诞生。
一家叫Cognition的10人初创公司,才成立不到2个月,就给了全世界亿点点震撼。
刚一放出,Devin就刷爆了全网。

0
它掌握了全栈技能,能自主学习不熟悉的技术,端到端地构建和部署应用程序,自己改bug,甚至还能训练和微调自己的AI模型!
在SWE-bench上,它的表现远远超过Claude 2、Llama、GPT-4等选手,取得了13.86%的惊人成绩!
也就是说,它已经能通过AI公司的面试了。


就在前不久,英伟达CEO黄仁勋表示,自己相信就在不久的将来,人类再也不需要学习如何编码了,孩子们应该停止编程课。


谁能想到,才短短数月,他的预言就成真了!
更令人震惊的是,Devin背后拥有一支强大的金牌程序员团队(规模不大,人才济济)。
据介绍,仅创始团队已经狂揽了10个IOI金牌!






首席执行官Scott Wu和弟弟Neal Wu获奖情况
Cognition AI的首席执行官Scott Wu称,自己从9岁开始学习编程,便爱上了将想法变成现实的能力。现在,这个梦想居然真的实现了。


网友惊呼:码农不存在了!?
看到Devin如此无敌的能力,网友惊呼,一切都完结了!


Devin会抢走我的饭碗吗?


德扑AI之父,OpenAI的研究科学家Noam Brown表示,「2024年将是人工智能令人兴奋的一年」。


计算机科学家,AI创业公司CEOSilas Alberti评价到:
它是一个能够独立完成任务的自主系统,在快速原型设计、修复bugs和复杂数据的可视化上表现卓越。
大部分其他助手在进行四五步操作后就会偏离任务轨道,但Devin能够在整个任务过程中准确地保持它的目标和方向不变。
投资了Cognition AI的硅谷大佬Peter Thiel更是认为,Cognition AI与Founders Fund之前投资过的DeepMind,现在的AI巨型独角兽OpenAI,Scale AI等公司处于同一水平。
AI初创公司Unify创始人称,Devin不仅抢走了我的工作,还抢走了我的名字,简直是雪上加霜。




美国著名开发者Brian Roemmele表示,自主编码智能体Devin已现AGI雏形!它能在几分钟内自主编写整个应用程序。这是真正无代码未来的开始。


Spotify工程师表示:「目前尚不清楚智能体会在几年内取代软件开发人员,但免费午餐已经不复存在。」
「从为期8周的训练营毕业,然后找到一份价值 20 万美元的工作,这样的日子已经一去不复返了。做好磨练和深入学习的准备。熟练地引导人工智能取得好的结果可能才是未来程序员能体现出来的价值。」


世界首位AI软件工程师Devin
AI软件工程师Devin的影响力,简直堪比2023年全网炸锅的智能体——AutoGPT。
Devin究竟有多强大?


Devin可以规划和执行需要数千项决策的复杂工程任务。
并且,它可以在每一步回忆相关的上下文,随着时间的推移学习,并纠正错误。
研究人员还为Devin提供了常见的开发工具,包括shell、代码编辑器、以及浏览器——皆是人类完成任务最需要的工具。
此外,Devin还具备主动与用户协作的能力。
比如,实时报告进度,接受反馈,并根据需要与你一起完成设计选择。
目前,Cognition AI还推出了一个Devin定制的Chrome插件——Tab Switcher。


而Cognition的开发者们纷纷分享出了自己使用Devin的示例,简直不要太惊艳!
学习如何使用陌生的技术
当你发给Devin一篇博文后,它会在几分钟内完成自主学习,从阅读文章,运行代码。
可以看到,Devin在Modal上运行了ControlNet,在写代码过程中,还会自我debug。
最后,人类程序员Sara想要带有自己名字的桌面壁纸,就立刻生成了。
构建和部署端到端的应用程序
当你想要玩一个「生命游戏」(the Game of Life),交给Devin做就好了。
Devin首先会用工具Shell,创建一个新的react应用程序,然后开始通过编辑器编写代码。
代码完成后,它还会将应用自动部署到Netlify,一个初步的「生命游戏」就做好了。


这个过程中,Devin还可以逐一根据用户请求,完成功能的添加。
比如在初始屏幕上加上像素化的「Devin」一词,然后希望这个字体再大一些,帧速率更快。
与此同时,人类程序员要求Devin修复一个bug——屏幕在3秒后冻结的错误。


下一步,让Devin在10秒后提高帧速率,让网站能适应不同的窗口大小。
同时,一个游戏还得需要交互性,即在某处点击鼠标时,应该生成一个新块。
接下来,就是见证奇迹的时刻了!
自行查找代码库错误,自行修复
这个名叫Andrew的开发者表示,自己维护了一个大型开源存储库,其中包含许多不同的算法,用于竞争性编程。
不久前有朋友告诉他:其中一个实现中有bug。Andrew插入了一个快速修复,但并没有测试它,因为没能抽出时间来编写测试用例。


既然如此,就给Devin来试试看!
小哥给了Devin存储库,让它来检查和处理这个存储库。然后,Devin就找到了正确的存储库,检查了所有文件。


接下来,在小哥的要求下,Devin还很轻易地就把测试写了出来——只是看了一下测试应该是什么样,接口是什么样,就完成了这项任务。
挑战还没完,接下来,小哥要求Devin将对所有输入进行测试,而不仅仅是测试这个输入,也就是自己常用的「暴力测试」。
于是,Devin重写了测试函数,使用了四个嵌套的循环,这一次,它发现了一个bug。


接着,Devin开始调试。它在这里添加了一个print语句,来调试输入和输出,然后重新测试,发现了错误:代码不应该返回负值。
于是Devin查看了正在测试的代码,然后添加进了这行代码,确保返回值是非负的。
现在Andrew可以确信,自己的代码是完全正确的了!
训练和微调AI模型
Devin能力也在一步一步进阶。
最让人兴奋的是,它可以自己训练、微调模型,AI训AI成真了!


首先,给智能体Devin提供一个GitHub库的链接(比如QLoRA——一种量化大模型的微调方法)。
Devin所做的就是,微调7B Llama模型。
接下来,就是献技的时刻,Devin克隆了GitHub库,了解如何使用readme运行,设置好所需pip的要求,查看所有的脚本语言,并开始运行。


训练过程中,Devin还遇到了Cuda问题(这是在开源库中可以预料到的)。
不过这可难不倒Devin。它会自主查看英伟达环境,并找出如何重新安装软件包让其成功运行。
接下来,模型训练开始进行了。
可以看到损失率正在下降,程序员给出Devin正向反馈:「做的不错」!
大约1小时后,Devin已经顺利完成几百步训练,仍在进行中...


解决开源代码库中的错误和功能请求
只要给出一个指向GitHub问题的链接,Devin就会执行所需的所有设置和上下文收集了!
这位叫Tony的工程师,想一次运行一堆命令,并且希望在一个屏幕上跟踪它们的状态,于是他找到了一个名为impro的开源工具,希望执行这个操作。
看起来虽然impro完成了任务,但状态太模糊了。根本看不出来究竟哪些命令失败了。


Tony想改进这里的用户体验,但是自己根本不熟悉代码,于是他想到去求助Devin。
他发现网上有人面临同样的问题,所以他把这个问题的链接给了Devin,让它修复这个问题。


在右边,他很清晰地看到,Devin从一个工具跳转到了另一个工具。
它首先使用了Shell Deon CLS存储库,然后阅读了自述文件和编辑器,了解了子代码,然后,它返回Shell,安装了所需要的依赖项。另外,Devin还打开了一个Web浏览器。


然后,Devin就开始编码了!
在这个过程中,它甚至打开了一些R文档来调试编译器错误。最后,完成了任务,出了一份自己做了哪些改进的总结报告。


所以,Devin的更改有效吗?Tony发现,它成功了!第三个命令是成功的,他甚至可以看到状态码。


为成熟的生产存储库做贡献,修复系统错误
下面这个示例,是SWE-BENCH基准测试的一部分。Devin解决了Python代数系统中的一个错误。它会自行设置代码环境、复制错误、自行编码、测试修复程序!
这位叫Neil的开发者,分享了Devin帮自己改bug的示例。
他一直在用这个名为Senpai的存储库,它是一个用Python编写的代数系统。
但Neil发现,取分数的对数时,我们会得到一个无穷大的Zoo,这是绝对不可能的。
于是,他试着让Devin来解决这个问题。


Devin在存储库中复现了Zoo的问题后,随后,它找出了代码中正确的那部分,添加了print语句,以便找出问题原因。


可以看到,原因就在于,整数除法会得到0,就导致之前取了0的对数。因此,Devin用true除法替代了整数除法。
随后,它开始测试,确保没有其他问题。


就这样,Devin帮Neil节省了大量的时间。
胜任自由职业平台Upwork的工作
Cognition的开发者You还试着在全球最大的综合类自由职业平台Upwork上,为Devin提供真正的工作。
没想到,它竟可以完全胜任,看来智能体也能出来做副业了......
在Upwork上,他首先挑选了一个「用计算机视觉模型做推理」的工作。
先来看看这个任务的要求:
- 我希望利用该资源库中的模型进行推断。(https://github.com/mahdi65/roadDamageDetection2020)
- 你的交付成果将是关于如何在AWS的EC2实例中进行操作的详细说明。
- 请提供你完成这项工作的评估报告。我不会回复没有评估的报告。


看起来很简单一个任务,但开发者You表示,自己也不知道如何开始做。
但是交给Devin,这件事就变得容易得多了。
Devin收到请求后,先开始设置了存储库。然后运行中发现了版本控制问题,Devin自主处理并更新了代码。
然后,Devin继续加载并导入软件包。它还从互联网上下载了图像,并运行模型。
接下来,Devin再次遇到了问题——关于打印调试,它自主修复了代码。


最后,Devin对数据结果进行抽样,并编写出一份报告。
它会一些标有损坏道路样本的图像,以及详细的text文档。
13.86%正确率,Devin碾压GPT-4/Cluade 3
SWE-bench是一个要求AI智能体解决开源项目(例如Django和scikit-learn)中实际GitHub问题的测试。
在评估中,Devin能够完整地正确处理13.86%的问题,这一成绩大幅领先于之前技术水平的1.96%。
即便是在提供了具体需要修改的文件情况下,先前最优秀的模型也仅能处理4.80%的问题。


华人金牌程序员团队
Cognition AI这家正在改变世界的公司,才正式成立不到2个月,仅有10名员工,分散在纽约、硅谷,以及世界各地的Airbnb民宿中。


就这样一个连正式办公场地都没有的团队,却已经从硅谷大佬Peter Thiel领投的Funders Fund和其他知名的投资机构那里获得了2100万美元的投资,其中还包括前推特高管Elad Gil。


在如此炸裂的产品的背后,团队成员背景更是夺目耀眼。
Cognition AI的核心创始团队包括3人:CEO Scott Wu,CTO Steven Hao,CPO Walden Yan。


联合创始人兼首席技术官Steven Hao,在AI系统方面有着丰富经验,


他于2018年本科毕业于MIT计算机和数学专业。


2018年加入由Alexandr Wang创办的Scale AI,是一名资深的AI系统工程师。


联合创始人兼首席产品官Walden Yan,在加入Cognition AI之前他还是哈佛大学的一名在校大学生。


作为计算机和经济专业本科大四在读的学生,理论上应该今年本科毕业。
但实际情况却处在「保密状态」,因为他还没有告诉父母自己辍学的事情。(手动狗头)


他在个人网站上,列出了3个自己认为最为重要的成就:
- 是MIT PRIMES Research团队的成员
- 得过IOI金牌
- 创立DeepReason并开发了一款智能区块链审计工具


联合创始人兼首席执行官Scott Wu,是一名连续创业者。


在成立Cognition之前,他曾经创立了一个用AI驱动的社交网络平台Lunchclub,并且也曾就读于哈佛大学。




他的弟弟Neal Wu,也是公司的员工。


在加入Cognition AI之前也在包括谷歌等多家公司工作过,是一名经验丰富的软件工程师和销售。


本科同样毕业于哈佛大学计算机专业。


他们兄弟俩在非常青年时期就参加了很多国际编程比赛和科学奥赛,获奖无数。




不仅如此,团队的其他成员,也都是大佬级的存在。








还有一个nobody。
其中,Andrew He从6年级开始,参加了各种数学竞赛。在2014年和2015年的国际信息学奥林匹克大赛上获得了2枚金牌。
他就读于MIT,并于2019年毕业,获得了数学和计算机科学学士学位。


如此丰富的编程竞赛经历,对于他们开发这个编程AI智能体有着非常大的帮助。
众所周知,编程竞赛的核心就是要迅速准确地解决编程难题,强调快速解决复杂问题的能力,而且对于创新的解决问题的思路有着很高的要求。
在CEO Scott Wu看来,团队独特的背景让他们在这个领域有非常强大的优势。
将AI培养成程序员,实际上是一个复杂的算法挑战,这需要AI系统能够做出复杂的决策,并能预见未来几步,从而选择正确的路径。
这几乎就是我们多年来一直在大脑进行的一场场比赛。现在,我们需要用AI系统来参加这些比赛。


Cognition AI首款产品Devin的最大突破在于大大提升计算机推理和规划能力。
它要求AI系统不仅要预测句子中的下一个词或代码行的下一个片段,还能像人类一样进行思考,获得解决最终问题最为合理的方法和路径。
而行业共识也认为,AI的推理和规划能力将是AI下一步产生最重要突破最有可能的方向。
Devin在接受用户用自然语言提出的任务之后,不仅能够自主开始工作并完成任务,还会向用户报告其计划,并实时展示正在使用的命令和代码。
如果用户发现过程中的问题,可以即时提供反馈。它会在任务进行中立即调整。
而Devin最大的亮点在于,大多数现有的AI系统在处理这类长期任务时往往难以保持一致性和专注,但它能够在完成数百上千任务时始终不偏离目标。
其他计算机科学家或者资深程序员在试用过Devin之后认为,它已经不仅仅是一个编程助手,简直是一个可以独立工作的员工。
CEO Wu并没有详细说明他们的智能体背后使用的AI技术,只是笼统地解释说,团队找到了将大语言模型(例如OpenAI的GPT-4)与强化学习技术相结合的独特方法。
正好前两天做了段短视频
AI is NOT ready to automate programming yet!
https://www.zhihu.com/zvideo/1750417545038159872
一些问题:
pass@1到100%了吗
能通过verification吗
有安全漏洞吗
处理technical debt了吗
如果有问题,如何解决,确实能解决吗
AI问题不是IT问题,缝块补丁,捣鼓捣鼓,就解决了
其实,谁率先研发出AI CEO,谁就能直接雇佣Devin,感觉研发AI CEO比AI Dev要简单多了。
我一直说新智源比起其他两个公众号要逆天的多,自从上次它坚称gpt4解决了p=np问题之后我就取关了,没想到还能以这种方式污染我的眼睛
自动软件工程会比自动驾驶更快达到L4。
软件工程师本质上其实上和驾驶员一样,可能有少数人是享受做软件乐趣的赛车手,但大部分人还是司机。
如果只是AI软件工程师,我会很高兴,很多没时间实现的想法终于可以实现了。
可惜,既然AI能当软件工程师,那么人类其实也不剩什么了。(并不是说Devin现在就是人类专家水平的软件工程师,只是说达到L4之后的情况)
也不用指望体力劳动,建筑和家政工人之所以没被取代,是因为控制机器人的AI通用性、泛化性不足,但既然有AI软件工程师了,为什么不为每个工地和家庭量身写一套程序呢?削苹果写一套代码,叠衣服写一套代码,要啥通用?开关床头柜写一套代码,开关衣柜写一套代码,要啥泛化?
复制粘贴自另一类似问题的回答
至少给ChatGPT检修仍旧需要工程师和程序员。
你没办法让Moss给自己检查自己有没有做坏事。


[收藏本文] 【下载本文】
   科技知识 最新文章
《消失的问界里》为什么网传华为选择大面积
特斯拉万人大裁员涉及中国市场,销售部门是
媒体报道「特斯拉一天内失去 2 个高管和 10
去年是「大模型元年」,今年会是「AI应用落
2024 年人工智能方向的就业前景怎么样?
如何评价小米汽车SU7全球首例无故抛锚?
如何评价比亚迪与大疆合作发布的车载无人机
如何看待波音「吹哨人」遗言曝光:如果我出
电动汽车为什么一下爆发了?
怎么看待华为太空宽带计划?
上一篇文章      下一篇文章      查看所有文章
加:2024-03-14 12:44:59  更:2024-03-14 12:53:41 
 
 
股票涨跌实时统计 涨停板选股 分时图选股 跌停板选股 K线图选股 成交量选股 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
网站联系: qq:121756557 email:121756557@qq.com  天天财汇