2022年,在集群式和聚变式的科技革命中,人工智能天生内容(AIGC,AI Generated Content)后来居上,以超出人们预期的速率成为科技革命历史上的重大事宜,迅速催生了全新的科技革命系统、格局和生态,进而深刻改变了思想、经济、政治和社会的演进模式。

AIGC和智能数字化新时代:媲美新石器时代的文明范式转型_模子_人工智能 文字写作

第一,AIGC的意义是实现人工智能“内容”天生。
人们主不雅观的觉得、认知、思想、创造和表达,以及人文科学、艺术和自然科学都要以具有本色性的内容作为根本和条件。
以是,没有内容就没有人类文明。
进入互联网时期后,产生了所谓专业天生内容(PGC),也涌现了以此作为职业得到报酬的职业天生内容(OGC)。
与此同时,“用户天生内容”(UGC)的观点和技能也逐渐发展,由此形成了用户内容生态。

内容生产授予了Web2.0的成熟和Web3.0时期的来临。
相较于PGC和OGC、UGC,AIGC通过人工智能技能实现内容天生,并在天生中注入了“创作”,意味着自然智能所“独占”和“垄断”的写作、绘画、音乐、教诲等创造性事情的历史走向闭幕。
内容天生的四个阶段如图0-1所示。

图0-1 内容天生的四个阶段

第二,AIGC的核心技能代价是实现了“自然措辞”与人工智能的领悟。
自然措辞是一个包括词法、词性、句法、语义的体系,也是不断演进的动态体系。
代表AIGC最新进展的是由OpenAI公司开拓的ChatGPT(Chat Generative Pre-trained Transformer)。
它完成了机器学习算法发展中,自然措辞处理领域的历史性超过,即通过大规模预演习模型,形成人工智能技能理解自然措辞和文本天生能力,可以天生笔墨、语音、代码、图像、***,且能完成脚本编写、文案撰写、翻译等任务。
这是人类文明史上翻天覆地的革命,开启了任何阶层、任何职业都可以以任何自然措辞和人工智能互换,并且生产出从美术作品到学术论文的多样化内容产品。
在这样的过程中,AIGC“异化”为一种理解、超越和天生各种自然措辞文本的超级“系统”。

第三,AIGC的绝对上风是其逻辑能力。
是否存在可以逐渐发展的逻辑推理能力,是人工智能与生俱来的寻衅。
AIGC之以是迅速发展,是由于AIGC基于代码、云打算、技能操控数据、模式识别,以及通过机器对文本内容进行描述、分辨、分类和解释,实现了基于措辞模型提示学习的推理,乃至是知识增强的推理,构建了坚实的“底层逻辑”。
不仅如此,AIGC具备基于准确和规模化数据,形成包括学习、决议、考试测验、改动、推理,乃至根据环境反馈调度并改动自己行为的能力;它可以打破线性思维框架并实现非线性推理,也可以通过归纳、演绎、剖析,实现对繁芜逻辑关系的描述。
可以绝不夸年夜地说,AIGC已经并连续改变着21世纪逻辑学的面貌。

第四,AIGC实现了机器学习的集大成。
21世纪的机器学习蜕变到了深度学习(Deep learning)阶段。
深度学习可以更有效地利用数据特色,形成深度学习算法,办理更为繁芜的场景寻衅。
2014年天生对抗网络(GAN)的涌现,加速了深度学习在AIGC领域的运用。
AIGC实现了机器学习的集大成(图0-2)。

图0-2 机器学习常用算法 资料来源:程序员zhenguo(2023),“梳理机器学习常用算法(含深度学习)”

第五,AIGC首创了“模型”主导内容天生的时期。
人类将跑步进入传统人类内容创作和人工智能内容天生并行的时期,进而进入后者逐渐走向主导位置的时期。
这意味着传统人类内容创作互动模式转换为AIGC模型互动模式。
2022年是主要的历史拐点(图0-3)。

图0-3 人类天生内容向AIGC转换趋势

在自然措辞处理(NLP)系统中,“Transformer”是一种融入把稳力机制和神经网络模型领域的主流模型和关键技能。
Transformer具有将所处理的任何笔墨和句子“向量”或者“矢量”化,最大限度反响精准意义的能力。

总之,没有Transformer,就没有NLP的打破;没有大模型化的AIGC,ChatGPT升级就没有可能。
多种主要、高效的Transformer的凑集如图0-4所示。

图0-4 多种主要、高效的Transformer的凑集模型 资料来源:Tay et al (2022), “Efficient Transformers: A Survey”, doi: 10.48550/arXiv.2009.06732

第六,AIGC开放性创造力的主要来源是扩散(Diffusion)模型。
扩散模型的观点,最早在2015年的论文《利用非均衡热力学的深度非监督学习》(Deep Unsupervised Learning Using Nonequilibrium Thermodynamics)中被提出。
2020年,论文《去噪扩散概率模型》(Denoising Diffusion Probabilistic Models)中提出DDPM模型用于图像天生。
从技能的角度来看,扩散模型是一个潜在变量(Latent Variable)模型,通过马尔可夫链(Markov chain)映射到潜在空间。
一样平常来说,AIGC由于吸纳和依赖扩散模型,而拥有开放性创造力。

2021年8月,斯坦福大学联合浩瀚学者撰写论文,将基于 Transformer架构等的模型称为“根本模型”(Foundation model),也常译作大模型。
Transformer推动了AI全体范式的转变(图0-5)。

图0-5 根本模型“transformer” 资料来源:Bommasani et al (2022), \"大众On the Opportunities and Risks of Foundation Models\"大众, doi: 10.48550/arXiv.2108.07258

第七, AIGC的进化是参数以几何级数扩展为根本。
AIGC的演习过程,便是调度变量和优化参数的过程。
以是,参数的规模是主要条件。
谈天机器人ChatGPT的问世,标志着AIGC形成以Transformer为架构的大型措辞模型(Large Language Model,简称LLM)机器学习系统,通过自主地从数据中学习,在对大量的文本数据集进行演习后,可以输出繁芜的、类人的作品。

AIGC形成的学习能力取决于参数的规模。
GPT-2大约有15亿个参数,而GPT-3最大的模型有1750亿个参数,上升了两个数量级。
而且,它不仅参数规模更大,演习所需的数据也更多。
根据媒体宣布但还未被证明的,GPT-4的参数可能将达到100万亿规模(图0-6)。

图0-6 GPT-4的参数规模

根据学界履历,深度神经网络的学习能力和模型的参数规模呈正干系。
人类的大脑皮层有140多亿个神经细胞,每个神经细胞又有3万多个突触。
以是,大脑皮层的突触总数超过100万亿个。
所谓的神经细胞便是通过这些突触相互建立联系。
假设GPT-4实现100万亿参数规模,堪比人的大脑,意味着它达到与人类大脑神经触点规模的同等水平。

第八,AIGC的算力需求呈现显著增长。
数据、算法、算力是人工智能的稳定三要素。
根据OpenAI剖析,自2012年以来,6年间AI算力需求增长约30万倍(图0-7):

图0-7 从AlexNet到AlphaGo Zero:30万倍的运算量增长 资料来源:OpenAI (2018),“AI and Compute”, https://openai.com/blog/ai-and-compute/

在可以预见的未来,在摩尔定律(Moore's Law)已走向失落效的情形下,AI模型所需算力被预测每100天翻一倍,也便是“5年后AI所需算力超100万倍”。
造成这样需求的根本缘故原由是AI的算力不再是传统算力,而是“智能算力”,因此多维度的“向量”凑集作为算力基本单位。

第九,AIGC和硬技能相辅相成。
从广义上讲,AIGC的硬技能是AI芯片,而且是经由分外设计和定制的AI芯片。
AI芯片须要实现CPU、GPU、FPGA和DSP共存。
随着AIGC的发展, 打算技能的发展不再仅仅依赖通用芯片在制程工艺上的创新,而是结合多种创新办法,形成智能打算和打算智能技能。
例如,根据运用需求重新核阅芯片、硬件和软件的协同创新,即思考和探索新的打算架构,知足日益巨大、繁芜、多元的各种打算场景。
其间,量子打算会得到打破性发展。

第十,AIGC将为区块链、NFT、Web3.0和元宇宙带来深层改变。
AIGC不可枯竭的创造资源和能力,将从根本上改变目前的NFT观点生态。
Web3.0结合区块链、智能合约、加密货币等技能,实现去中央化理念,而AIGC是知足这个目标的最佳工具和模式。

没有悬念,在Web3.0环境下,AIGC内容将涌现指数级增长。
元宇宙的实质是社会系统、信息系统、物理环境形态通过数字构成了一个动态耦合的大系统,须要大量的数字内容来支撑,人工设计和开拓根本无法知足需求,AIGC可以终极完善元宇宙生态的底层根本举动步伐。
随着AIGC技能的逐渐成熟,传统人类形态不可能进入元宇宙这样的虚拟天下。
未来的元宇宙主体将是虚拟人,即经由AIGC技能,特殊领悟ChatGPT技能,以代码形式呈现的模型化的虚拟人。

简言之,区块链、NFT、Web3.0,将授予AIGC进化的契机。
AIGC的进化,将加速广义数字孪生形态与物理形态的平行天下形成。

第十一,AIGC催生出全新的家当体系和商业化特色。
AIGC利用人工智能学习各种数据自动天生内容,不仅能帮助提高内容天生的效率,还能提高内容的多样性。
笔墨天生、图片绘制、***剪辑、游戏内容天生皆可由AI替代,并正在加速实现,使得AIGC进而渗透和改造传统家当构造。
在家当生态方面,AIGC领域正在加速形成三层家当生态并持续创新发展,正走向模型即做事(MaaS)的未来(图0-8)。

图0-8 AIGC家当构造 资料来源:腾讯《AIGC发展趋势报告》,2023年1月31日发布

伴随AIGC天生算法的优化与改进,AIGC对付普通人来说也不再是一门遥不可及的尖端技能。
AIGC在笔墨、图像、音频、游戏和代码天生中的商业模型渐显。
2B(to Business的简称)将是AIGC的紧张商业模式,由于它有助于B端提高效率和降落本钱,以补充数字鸿沟。
但可以预见,由于AIGC“原住民”的发展,2C(to Consumer的简称)的商业模式将相继而来。
根据有关机构预测,2030年的AIGC市场规模将超过万亿公民币,其家当规模生态如图0-9所示。

图0-9 AIGC家当规模生态分布 资料来源:陈李,张良卫(2023),“ChatGPT:又一个“人形机器人”,东吴证券https://www.nxny.com/report/view_5185573.html

现在,AIGC,特殊是在措辞模型领域的全方位竞争已经开始。
以是,发生了微软对OpenAI的大规模投资,由于有这样一种说法:“微软下个十年的想象力,藏在ChatGPT里。
”近日,谷歌宣告推出基于“对话运用措辞模型”(LaMDA)的Bard,实现其搜索引擎将包括人工智能驱动功能。
ChatGPT刺激谷歌开始“创新者困境”突围。
未来很可能涌现Bard和ChatGPT的对决或共存,也便是LaMDA和GPT-3.5的对决和共存,构成AIGC竞争和自然垄断的新生态。

在这样的新兴家当布局和商业模式下,就业市场将会发生根本性改变:其一,专业职场重组,相称多的职业可能衰落和消亡;其二,原来支持IT和AI家当的码农军队面临严重萎缩。
由于AIGC将极大地刺激环球外包模式并取代码农。

第十二,AIGC的法律影响和监管。
虽然AIGC这样的新技能供应了很多希望,但也会给法律、社会和监管带来寻衅。
在中国,继2022年1月国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息做事算法推举管理规定》后,2022年11月,国家互联网信息办公室再次会同工业和信息化部、公安部联合发布《互联网信息做事深度合成管理规定》。
该规定的第五章第二十三条,对“深度合成技能”内涵做了规定:“利用深度学习、虚拟现实等天生合成类算法制作文本、图像、音频、***、虚拟场景等网络信息的技能。
”但可以预见,由于AIGC的技能日趋繁芜,并将得到高速发展,国家很难避免监管缺少专业性和滞后性。

第十三,AIGC正在引领人类加速逼近“科技奇点”。
现在,人工智能已经接管天下;天下正在经历一波人工智能驱动的环球思想、文化、经济、社会和政治的转型浪潮。
AIGC呈现指数级的发展增速,开始重塑各个行业乃至环球的“数字化转型”。
说到底,这便是以AIGC为代表,以ChatGPT为标志的转型。
这统统,在2023年会有长足的发展,特殊是在成本和财富效益领域。

如果说,2022年8月的AI绘画作品《太空歌剧院》(Théatre D’opéra Spatial)推动AIGC进入大众视野,那么,ChatGPT的底层模型GPT-3.5是一个划时期的产物。
它与之前常见的措辞模型(BERT/ BART/ T5)的差异险些是导弹与弓箭的差异。
现在,呼之欲出的GPT-4,很可能通过图灵测试。
如果是这样,不仅意味着GPT-4系统可以改造人类的思想和创作能力,形成人工智能超越专业化族群和大众化趋势,而且意味着这个别系开始具备人类思维能力,并有可能在某些方面和越来越多的方面替代人类。

特殊值得关注的是被称为“人工智能激进变革先锋”的BLOOM(大型开放科学获取多措辞模型)的出身。
从2021年3月11日到2022年7月6日,60个国家和250多个机构的1000多名研究职员,在法国巴黎南部的超级打算机上整整演习了117天,创造了BLOOM。
这无疑是一场意义深远的历史变革的前奏。

斯坦福大学生理学和打算机科学助理教授丹尼尔·亚明斯(Daniel Yamins)说过:“人工智能网络并没有直接模拟大脑,但终极看起来却像大脑一样,这在某种意义上表明,人工智能和自然之间彷佛发生了某种趋同蜕变。

2005年,雷·库茨维尔(Ray Kurzweil,1948-)的巨著《奇点附近:当打算机警能超越人类》(The Singularity Is Near: When Humans Transcend Biology)出版。
该书通过推算奇异点指数方程,得出了这样一个结论: “在2045年旁边,天下会涌现一个奇异点。
这件事一定是人类在某项主要科技上,溘然有了爆炸性的打破,而这项科技将完备颠覆现有的人类社会。
它不是像手机这种小的奇异点,而是可以和人类出身对等的超大奇异点,乃至大到可以改变全体地球所有生命的运作模式。

现在处于狂飙发展状态的AIGC,一方面已经开始呈指数形式膨胀,另一方面其“溢出效应”正在改变人类本身。
在这个过程中,所有原来看来离散和随机的科技创新和科技革命成果,都开始了向AIGC技能的收敛,人工智能正在形成自我发育其和完善的内在机制,

加速人类社会超越数字化时期,进入智能数字化时期,逼近可能发生在2045年的“科技奇点”。

(作者朱嘉明为有名经济学家,横琴数链数字金融研究院学术与技能委员会主席,本文为《AIGC:智能创作时期》一书代序,澎湃科技获授权刊发。