是时候聊聊AI开源的问题了。

AI不适合开源?MongoDB副总裁:开源代码对人工智能不适用_开源_公司 科技快讯

显然,这是搞开拓的人不得不面对的问题。
基本从2006年开始,开不开源就已经成为了头等问题之一。

Matt Asay在MongoDB卖力市场营销这一块。
在此之前,他曾是亚马逊网络做事的卖力人和Adobe的开拓者生态系统卖力人。

而在加入Adobe之前,Asay在开源公司担当过一系列职务。
MongoDB的业务发展、营销和社区副总裁、实时剖析公司Nodeable(后来被Appcelerator收购)的业务发展副总裁、移动HTML5初创公司Strobe(后来被Facebook收购)的业务发展副总裁和临时CEO,以及Ubuntu Linux公司Canonical的COO和内容管理初创公司Alfresco的美洲区卖力人。

终极,Asay成为了开放源码倡议(OSI)的名誉董事,并得到了斯坦福大学的法学博士学位。

之前,Matt Asay曾责怪谷歌和雅虎两家公司在开源代码上有所保留,然后他被骂了。

现在想来,是有道理的。

Tim O'Reilly表示,在开源的云时期,开拓者分享代码的动机,是让别人跑自己的程序,从而供应一份源代码。
而这件事的必要性已经逐步消逝了。

Reilly连续指出,不仅没必要,而且就最大的App来看,这也不再可能了。

在过去的十年里,这种分享的不可能推翻了原来开源的定义。
如今,新的定义正在影响我们思考人工智能的办法。

正像Mike Loukides指出的那样,在AI方面的互助从未像现在这么主要,也从未像现在这么困难。

就像2006年的云打算一样,在人工智能领域做最有趣的事情的公司可能会努力用传统的办法开源。

但即便他们开源的办法是传统的,也并不虞味着他们不能用更故意义的办法开放。

开放根本举动步伐

Loukides认为:「虽然现在很多公司都说自己在搞AI,但真正推动这个行业向前发展的只有三家公司——Meta、OpenAI和谷歌。

他们仨有着一个共同点:都拥有可以大规模运行大型模型的能力。
这种能力背后,须要强大的根本举动步伐和技能手段,而这每每是很多个人和企业不具备的。

的确,你可以从Meta那里***OPT-175B的源代码,但你手头的硬件却无法对其进行演习。
乃至是对付大学或其他的研究机构来说,OPT-175B都过于弘大了。

另一方面,即便是有足够打算资源的谷歌和OpenAI,也无法轻易复刻OPT-175B。

缘故原由也很大略:OPT-175B与Meta自己的根本举动步伐(包括定制硬件)联系过于紧密,很难被移植到其他地方。

也便是说,Meta并没有想要遮盖有关OPT-175B的什么,而是建造一个差不多根本举动步伐真的很难。
即便是对付那些有资金和技能的人来说,终极搞出来的也会是个不大一样的版本。

而这正是雅虎的Jeremy Zawodny和谷歌的Chris DiBona在2006年的OSCON上提出的不雅观点。

但话又说回来,如果你不理解机器内部的科学事理,就很难去相信一个AI。

以是,我们须要去探求某种方法,从而让根本举动步伐能被开放利用。

Loukides认为,该当向外部研究职员和早期利用者供应免费访问。
不过,并不是说给他们一个可以访问Meta,谷歌或OpenAI的数据中央的万能钥匙,而是通过一个公共API。

这可能并不是大多数人所期待的「开源」,但实在还是可以接管的。

换一种办法看待开源

现在,Matt Asay曾经对谷歌和雅虎责怪如今没什么意义了。

自从2006年以来,谷歌在知足计策须要的条件下,打包并开源了关键根本举动步伐。

在Matt Asay看来,TensorFlow 是开源的入口,Kubernetes是开源的出口。
这些开源的机器学习行业标准有望提升Google Cloud的事情负载,或者确保谷歌云之间的可移植性,从而为Google Cloud赢得更多的事情负载。

想出这些的人很聪明,但是在Pollyanna 的意义上,它并不是开源的。

不是只有谷歌这样。
它只是在开源上做得比其他公司好。
开源实质上是自私的,公司和个人总是会开放有利于自己或客户的代码。

一贯如此,而且永久如此。

Loukides认为该当故意义地开放AI(只管三大AI巨子与其他公司之间存在差异),但他指的开源并不是我们一样平常意义上理解的开源。
为什么呢?

缘故原由在于,虽然传统的开源很不错,但无论是对付软件的创建者和消费者,它都从未成功办理DiBona和Zawodny于2006年在OSCON上提出的云开源难题。

现在已经由去了十几年了,我们依然没有离答案更近一步。

话又说回来,我们确实近了一点。

Matt Asay认为,我们须要以一种新的办法来看待开源。

他与Loukides的想法很靠近:关键在于为研究职员供应足够的访问权限,使他们能够重现一个特定的AI模型是如何成功或失落败的。

「他们并不须要完备访问所有的代码和根本举动步伐来运行这些模型」。
正如他所言,只有在开拓职员可以在条记本电脑上运行开源程序、进行衍生创作的条件下,完备访问该代码才是故意义的。

鉴于如今谷歌或微软运行代码的规模和独特的繁芜性,这已经毫无意义了——我们不可能完备访问大规模的云代码。

我们须要明白:开源并不是用于不雅观察开源天下的一个镜头。
而且考虑到我们如今所处的云时期,开源也用得越来越少。

无论是作为公司还是作为个人,我们的目标该当因此有利于客户和第三方开拓职员的办法开放对软件的访问,让软件更易理解,而不是试图将几十年前的开源观点改造成云。
它不适用于开源,就像它不适用于AI一样。

是时候换个思路了。

参考资料:

https://www.infoworld.com/article/3667433/open-source-isnt-working-for-ai.html