全球首个AI轨范员Devin造假？业内人士：质疑有理但轨范员已离不开AI_卡尔_演示

2024-08-09 19:20:26 科技快讯

号称“环球首个AI人工智能软件师”Devin，如今被网络博主质疑造假。
4月9日，一位自称有35年软件工程师履历的网络博主卡尔逐帧复现了Devin的演示***并提出四点质疑，包括Devin所展示的编程能力存在一定欺骗性，“它处理的任务并非随机，而是演示者精心选择的刻意呈现”；此外，Devin在操作过程中看似修复了许多问题，但这些问题很多都是Devin的“自导自演”。

全球首个AI轨范员Devin造假？业内人士：质疑有理但轨范员已离不开AI_卡尔_演示科技快讯

04:12

“环球首个AI人工智能软件师”Devin被网络博主质疑造假。
(04:12)

质疑***发出后，引发浩瀚科技爱好者评论。
上海市人工智能行业协会、大模型专班卖力人王逸浩日前在接管澎湃科技(www.thepaper.cn)采访时表示，卡尔的质疑有情由据，Devin看似“惊人的效果”确实存在商业炒作、包装的嫌疑。
但不可否认，AI如今已经成为程序员的必用工具之一。

首个AI程序员被指炒作，多次“自修自建”代码浮夸实际效果

Devin是由Cognition Labs于今年3月12日发布的一项AI编程产品，并被宣扬为“环球首位AI工程师”。
在Cognition官网发布的长达1分50秒的演示***里，Devin只需一句指令，就能实现端到端地处理全体开拓项目，此外***显示它具备自主学习新技能、端到端构建和支配运用、自主查找和修复代码问题等能力；还可以按照用户需求同时实行多步骤事情流程，程序员们可以实时不雅观察其进度，创造缺点时，跳出指令就能改动。

卡尔针对上述***经由逐帧比对后提出质疑。
他认为，在上述演示***的2.936秒处，屏幕左上角显示“他们搜索过这个任务”，这意味着演示***中Devin处理的任务并非随机，而是演示者选择的。
卡尔疑惑，这有可能意味着Devin在大部分的事情中并不出色，乃至比***演示中的还要糟糕。

上述演示***的2.936秒,屏幕左上角显示“他们搜索过这个任务”。

在运行的过程中，Devin涌现了数次“自建自修”的情形，看似在做代码修复，实际上并不是修复它在互联网上找到的代码，也不是客户哀求它改动的代码，而是自己天生的缺点代码。
卡尔质疑Devin的实际运行效率可能很低下，且存在很多毫无意义的操作。

此外，演示***的前部分显示是3月9日下午3时25分，但后半部分的韶光段却显示的是9日21时41分，这意味着Devin处理事情前后有6个小时20分钟的间隔。
而卡尔在自己实际操作的过程中，仅花了35分55秒就可以复现Devin的事情。

卡尔表示自己并非反对AI，但他想训斥的是Devin团队这类“AI炒作”的行为。
他希望人们对互联网上的任何信息，尤其是人工智能干系的信息保持谨慎疑惑的态度。

业内人士认为博主质疑有理有据

澎湃科技把稳到，目前Devin 还没有开放利用，只能通过邮箱提交申请，外界对Devin的认知，基本都来自官方给出的演示***，以及少数第三方开拓和产品职员的评价。

据外媒宣布，Cognition AI背后的团队成员共10人，核心团队共有3人，分别是Scott Wu、Steven Hao和Walden Yan，团队非常年轻。
全体成员共拥有10枚国际信息学奥林匹克竞赛（IOI）金牌，很多成员在青少年期间也参加过信息学国际奥林匹克竞赛等。
在发布“环球首个AI程序员Devin”这一信息后，Cognition AI备受外界关注。
公开资料显示，此前，Cognition AI已经得到了彼得·蒂尔的Founders Fund基金领投的2100万美元A轮融资。

眼下，AI编程究竟有没有浮夸、炒作的嫌疑？AI程序员比较人类程序员可以做哪些事？

上海市人工智能行业协会、大模型专班卖力人王逸浩见告澎湃科技，AI程序员的存在确实可以帮忙人们独立完成大略的开拓事情，乃至可以分开一名真处死式员的帮助，能减少大量不须要创新的重复劳动，例如批量修正代码的命名风格、代码的依赖关系等。
但卡尔针对Devin的质疑目前看来也有理有据，从演示的内容来看，Devin做文书事情的时长是一位履历丰富程序员的十二倍旁边。

王逸浩认为，从其他相似业务的利用体验效果来看，Devin的“惊人效果”确实存在一些商业炒作、包装的嫌疑。
一样平常诸如微软Copilot这样的工具都须要供应充足的高下文，而Devin明显对程序的逻辑理解都还不到位。

不过，在王逸浩看来，只管Devin的功能存在部分浮夸的情形，但并不能否认AI编程的发展趋势，“程序员们都在闇练地拥抱大模型带来的便利，试用各种代码赞助工具。
程序员们离不开这些助手，类似于设计师们离不开Stable Diffusion。
”