这节课开始,我们一起来探索目前AIRC系统中已经成熟的一些范式。
它不仅是AI大模型影象增强和可信人工智能的主要组成部分,也是许多大模型系统设计范式的来源,相信学完这一讲,你对AIGC系统的核心事情会更加熟习,后续的学习也会对症下药。

AIRC系统

AI大年夜模型事理教程:为什么AI系统能够猜你所想?什么是AIRC系统?_体系_建模 智能助手

AIRC 系统你该当已经很熟习了,谷歌的搜索引擎、抖音的推举系统,还有阿里妈妈的打算广告系统,这类系统的统称是“内容推举系统(AIRC)”,它们已经渗透到了我们生活的方方面面。

但是,提及这类系统的架构,我们充其量只是借助Netflix的架构图,看到过它的一些外面特色。
而这个形状只是 AIRC 系统的冰山一角,并没有交代它的紧张寻衅和问题是什么。

以是随着这样的架构图去建立系统,相称于随着简笔画去学习如何素描,这是不太现实的。
你看一下后面的图片就会明白了。

只有亲自经历过的人才知道,AI系统的背后隐蔽着无数的技能细节。
从业务指标的建模到系统架构的设计,从数据的网络和处理,到算法的选型和实验,这里的每一个环节,都要精心地设计、不断地优化。

那为了帮助你瞥见AIRC系统的原貌,节制核心事理和设计原则,为学习AI大模型系统,打下一个良好的根本,我将带你学习AIRC系统架构的建模方法。

那根据我的实践履历啊,AIRC系统可以分成三大部分的事情,分别是 策略建模、数据工程和模型工程,这三部分的事情,在后面的AI大模型系统当中也随处可见。

这节课我们就来聚焦策略建模这个部分。
策略建模起到了提要挈领的浸染,对业务目标进行数学建模,后面讲到的内容也险些都是为它而做事的。

从业务目标到终极的AIRC系统,要经由两次转化:首先是产品经理和算法专家将业务目标形式化,这一步会将业务上的玄学问题转变为明确的数学问题。
不才一步,算法专家和架构师会把数学问题解构成工程问题,工程转化过程中,最紧张的事情是召回、排序、掌握博弈和风控几个部分。

我们先从策略建模开始提及。
【如需全套完全AI大模型课程及配套源码课件等资料请+ xiaole45666】

指标建模

首先是指标建模,我们先要确定“北极星指标”,它是业务追求的终极目标,虽然它可能根据实际情形的变革而变革。
但相对而言,在一段韶光内,它是最稳定、明确的指标,是我们后续行动的根本。
这里我以电商系统为例带你学习。

你可能听说过,电商系统常日把 GMV 指标作为北极星指标。
为了提升这个指标,算法工程师们会想尽办法,在用户进入产品时把他最可能购买的商品放在最显眼的位置。

思考一下,如果让你来卖力这个目标,你会若何实现它呢?

如果我换一种办法表达,你就会豁然开朗了。
我把前面这句话做个“中译中”,那问题就变成了“从海量商品中选出此人最可能成交的商品”。
这是你再熟习不过的排序算法了,排序的实体是商品,排序的值是商品被此人购买的概率。

在想清楚之后,你会创造,电商系统的实质是 对商品进行排序,优先展示排序靠前的内容。

是不是逐渐的明朗了?接下来,你只要关注两个问题,一个是如何得到排序的概率值。
第二是,如何对海量商品进行在线“实时”的排序。

我们先来办理第一个问题。
先回忆下你购物时的场景是若何的:首先你会打开运用,搜索商品,然后点击加购按钮,或者是直接下单,末了填写地址,进行付款。

刚刚的一系列动作就叫“转化漏斗”,由于用户在任何步骤停滞动作,都会打断成交的过程。
你可以看一下文稿,我画了一张图来帮助你理解。
那如果系统,能够预判你每一步发生的概率,就能打算出终极的成交概率了。

因此,某个商品对你展示过后的预期收益,可以用点击率,加购率,付款率和客单价的乘积来表示。
当然,这里的公式是一个简化版,实际系统更加的繁芜。

期望收益=点击率加购率付款率客单价, 点击获取完全全套AI大模型课程及配套资料:AI大模型课程

这样你已经找到了第一个问题的答案,那便是 将用户对每个商品的期望收益进行排序,将排名靠前的商品,展示给用户,早期的AIRC系统采取的便是这种办法。

那接下来,我们再来磋商第二个问题,如何对海量的商品做在线实时的排序。

现在的内容分发系统里面的物料总量每每非常弘大,比如谷歌现在的搜索文档规模已超过了62PB。
同时,为了更精确地预测,这类系统每每会对高维大规模数据,做深度模型的建模。
对付这么大的数据规模,在线实时打分排序是不现实的。

你可以对照文稿,来看看后面这张示意图。

以是,AIRC系统每每会拆分为召回和排序两个模块,这是在线系统中常用的效率权衡方法,接下来我们来学习这两个模块的事理,学完之后,你就会明白我为什么这么说了。