原文来源:twitter

长推:聊聊AI+区块链的看法_数据_模子 智能问答

注:本文来自@bonnazhu推特,火星财经整理如下:

借着近期OpenAI 4o版本的发布,侃一下对AI+区块链的意见:

以OpenAI为首的天生式AI浪潮,靠一己之力,拉动了数据、存储、打算这三个板块的发展。
从此之后,AI将成为它们未来十年乃至几十年最主要的客户,做事好AI,再由AI去做事各个下贱行业客户和运用的链条正在逐步形成,AI成了最主要的中间层和发动机:

第一,AI带动了上游基建的需求:

1) 打算:包括芯片的设计与生产,云打算做事,数据中央,网络/电力根本举动步伐等

这一环节侧重物理,AI的演习和结果输出须要花费大量的算力、电力以及网络资源,而芯片的性能又是决定效率和能耗的关键,这就决定了像英伟达, AMD这样的芯片设计公司,台积电, 三星这样的晶圆代工厂,以及谷歌、微软,亚马逊等有云打算和数据中央业务的科技巨子注定捕获这一轮最大的代价。

但区块链并不是没有用武之地。
目前算力垄断非常明显,高性能GPU一卡难求,或者须要付出很高的溢价才能在云打算厂商处获取干系做事,并且还可能由于地缘政治,芯片禁售等缘故原由,导致算力在地理上的分布也呈现集中。
这种失落衡带来的需求外溢,使得去中央化打算成为这一轮AI浪潮中获取实际利益的区块链板块之一。
这一板块的项目浩瀚,新项目不断呈现,争夺会很激烈,如@akashnet_@rendernetwork@gensynai@NodeAIETH@exa_bits@ionet@fluence_project@gpunet@nosana_ai等等。

不过由于区块链网络本身的性能局限与机器学习高昂打算量的抵牾,使得繁芜的深度学习一定要在链下进行,然后把结果传输到链上。
如何验证算力供应方是否按照哀求实行了演习任务是一个难点,并且打算须要调用数据和模型,存在潜在的隐私暴露问题。
此时ZK(零知识证明)的威力就显现出来了。
目前已经有不少项目在探索ZK为AI进行做事,例如 @bagel_network@gizatechxyz@ModulusLabs都旨在打造一个开拓者可以支配AI模型,并可利用ZK对AI演习和推断过程进行校验的机器学习平台,即ZK machine learning,而@ezklxyz则是专注做做事AI的ZKP天生器和验证器,@Ingo_zk则是研讨ZKP天生硬件加速。

其余,天生式AI带来的能耗(包括打算产生的能耗以及散热带来的能耗)也是相称惊人。
听说OpenAI演习GPT-6的时候,把微软的电网都搞崩了。
随着之后各大巨子连续加码AI数据中央(个中OpenAI操持联合微软耗资1000亿美元打造名为Stargate星际之门的超级打算器),能耗只会几何级上涨。
但是网络/电力这种根本的培植翻新周期很慢,且在例如美国这种国家,地皮大多是私有的,拓展电网及干系的根本举动步伐须要经由私人赞许。
如何让私人有动力参与到根本举动步伐的拓展中,或是让私人减轻对电网的依赖和包袱,这可能是未来 #DePin的一个主要议题。
当然,除了电能,稳定的带宽也是AI需求的主要根本举动步伐之一,大部分数据中央都会方向于构建在ISP(网络业务供应商)近一些的地方,电力丰富的地方,网络带宽资源不一定丰富。
如何利用#DePin办理这个错配问题,也是一个值得期待的方向。

2) 数据:包括数据采集、数据标注/处理、数据交易/授权。

只管数据是AI的“食品”,然而大多数机器学习模型只能利用经由处理的构造化数据。
目前,用于机器学习的数据来源非常广泛,且大部分是非构造化的和分散在各处的公开数据,因此须要花费大量韶光和精力对这些数据进行搜集和处理。
这实在是一个劳动密集的苦差事,却也是区块链和代币经济能够很好切入的环节,目前在做这个数据采集、处理分包业务的紧张有 @getgrass_io@PublicAI_@AITProtocol这几家。

不过须要把稳的是,随着新的机器学习模型架构的涌现,对付构造化数据的依赖会有所改变。
新的技能架构如自监督学习、GAN、VAE和预演习模型,可以直策应用非构造化数据进行深度学习,绕过数据处理和洗濯环节,而这会对劳动密集型平台的需求带来一定冲击。

此外,可以公开抓取的数据只是这个天下数据的冰山一角,大量的数据实在节制在私营机构或者个人用户手中,除了部分企业会有公开的API许可调用外,大部分数据仍旧没有被激活。
如何让更多的数据持有者贡献/授权自己的数据,同时又能良好的保护隐私,是一个重点方向。
曾经有不少做去中央化数据交易的平台,但由于苦于找不到有数据需求的甲方,经由几轮周期的大浪淘沙,基本都偃旗息鼓,只剩下少数如 @oceanprotocol熬到了AI的春天,而它们独特的Compute-to-data模式,让数据利用者可以直接在数据分享者的数据集上进行打算而不暴露数据,恰好办理了这个隐私痛点。

3) 存储:包括数据库(database),数据备份/存储系统(storage)

深度学习模型在演习和推断时用到的数据,大多是从数据库或者数据存储备份系统处调取的。
可以把数据库和备份/存储系统理解成“冰箱”,不过数据库和备份/存储系统实在是不太一样的,前者侧重管理,须要支持频繁的读写,以及繁芜查询(如SQL)和检索,后者侧重大规模、长期的备份和归档,须要担保隐私、安全和不可修改。

Database和storage相辅相成,共同做事AI深度学习,一个范例的场景是:数据从database中提取,进行预处理和洗濯,转换成适宜模型演习的格式,处理后的数据可以存储在去中央化storage中,确保数据的安全。
模型演习阶段,从去中央化storage中读取演习数据,进行模型演习,演习过程中天生的中间数据和模型参数可以存储在database中,便于快速访问和微调、更新。

这一板块是区块链的上风所在,@ArweaveEco@Filecoin@storj@Sia__Foundation都是这个赛道的,乃至@dfinity也可以归类进去,然而越来越以为@ArweaveEco才是最适宜做事AI的那个方案:其一次性支付永续存储的模式,加上生态系统中许多database项目作为补充,以及新发布的并行架构AO打算网络,完美适配深度学习中多线程任务的需求,这使得其能够很好地支持机器学习的支配。

第二,AI性能决定了下贱运用的上限:

虽然AI已经或多或少在工业、农业领域(2B)有所运用,但这一轮我们看到的打破紧张是基于大措辞模型(LLM)的2C运用。
我们可以把这些运用分成两大类:

第一类实在只是大措辞模型的具象化,例如一些AIGC平台,它们根据用户指令天生用户想要的结果,但这一类运用的性能紧张取决于利用的AI模型,而紧张的LLM模型被巨子们垄断,因而运用间的差异性每每较小,护城河相对较窄;另一类则是利用AI模型来提升现有产品的功能和用户体验,例如增加了AI能力的搜索引擎、游戏等,包括@_kaitoai@ScopeProtocol@EchelonFND

除此之外,天生式AI浪潮还催热了一种新的运用生态—AI Agent,即智能机器人,其具备根据用户意图独立实行任务和做出决策的功能。
AI Agent实质是在LLM的模型根本上,增加了更为繁芜的实行和处理逻辑,使其能做事于不同的运用处景。
实际上,这种Agent的雏形在加密货币领域已经存在,例如DeFi借贷协议的清算机器人(liquidation bot)和去中央化交易平台的套利机器人(arbitrage bot)。
这些DeFi Bots虽然具备智能机器人的一些特点,但它们是纯链上的,不支持链下行为,且由于是基于智能合约,须要外部触发才能启动。

在没有AI的情形下,目前是通过一套外部的keeper网络来打通链下和链上的,例如价格预言机便是这样一个范例,以及 @thekeep3r也是一个例子。
而AI Agent的涌现,给了一种新的思路,即可以由智能机器人自行去完成,并实现自动化。
链上AI Agent标的紧张有:@autonolas@MorpheusAIs;而其他较为通用的AI Agent的标的有@chainml_@Fetch_ai;以及专注陪伴、人机交互的AI Agent有@myshell_ai@virtuals_io@The_Delysium,而这一类Agent的特点是拟人化,供应感情代价,且具有被利用到各个游戏、元宇宙之中的想象空间。

第三,写在末了:

AI实在是一个领悟叙事,它的涌现,把原来各个伶仃乃至当初找不到市场契合点的几个加密板块串联起来了。
目前AI仍旧处于大基建投资时期,数据、存储、打算这一类上游板块是最直接的持续受益者,它们对AI发展更为敏感,确定性也更高。

但是对付这个行业的投资者来说,风险在于大部分的红利可能不在加密货币市场,目前币市的AI效应更多还是来自传统市场供需关系失落衡带来的溢出效应,或者便是纯炒作。
而下贱运用由于性能天花板取决于AI模型,而AI模型仍处在不断迭代的过程中,且AI与产品的结合点还在探索,市场契合度还有待验证,这使得下贱运用的未来变数还比较大,确定性不如上游板块那么高。

当然,还有像@bittensor_和@ritualnet这样的项目,我认为更该当称之为AI生态平台的项目。
他们并不纯挚专注于上游或下贱的某一块业务,而是通过架构和经济机制设计,使高下游业务的各个供应者能够接入并支配到其平台或链上,实现所谓的人工智能协作。
这些项目有着伟大的远景,但目前区块链AI高下游面临的需求捕获问题同样会反响到它们身上,且估值较高。
不过,比较于押注某一个详细项目,押注这些平台的风险会相对小一些。

短期内,区块链能否连续从AI红利中获益,可能仍旧取决于上游板块的供需关系失落衡,尤其是供给不敷状况的持续。
但从中长期来看,区块链的可验证性、不可修改性和代币勉励等特性,确实能够为AI带来新的可能性,个中,零知识证明是一大利器,既能保护隐私,又能实现可信验证,完美办理了区块链在性能局限下做事AI深度学习高打算量需求的问题。