2024年版现代人工智能导论:第1部分_模子_对象
很难相信,间隔我上一篇关于人工智能(AI)的文章 实用人工智能 已经由去了近六年。在那篇文章中,我概述了人工智能和机器学习(ML)的现状,以及当时一些盛行的用法和工具。从那时起,人工智能领域的事情变得越来越猖獗:每个人都在评论辩论 ChatGPT 等工具,但大多数人真的不理解所有术语和工具,也不知道它们最适宜做什么。在本文(第 1 部分,共 2 篇)中,我将考试测验让大家理解这个生态系统的最新情形,并考试测验用 "乔尔" 术语来阐明。
因此,让我们从定义所有关键术语开始,并看看每个术语的一些示例。
当代人工智能导论 2024 版
一、关键术语人工智能(Artificial Intelligence,AI):AI 是机器表现出的人类智能。AI 的例子包括面部识别、做事台谈天机器人、智能恒温器和语音转笔墨。
作为开拓职员,我们从一开始就将 AI 写入代码中。下面是一个玩井字游戏的早期示例--代码正在仿照另一个人类的智能来与你对战。请把稳,这段代码没有任何花哨或神奇之处,事实上,它只是一系列 IF 语句;是的,这便是 AI!
机器学习(Machine Learning,ML):ML 是 AI 的一个子集,我们利用算法解析数据,从中学习,然后决定做什么。所有 ML 都属于 AI,但并非所有 AI 都属于 ML。例如,符号逻辑——规则引擎、专家系统和知识图谱——都可以被描述为 AI,但它们都不是 ML。
如果你去亚马逊购买鞋子,大概它会为你推举与之匹配的衬衫。亚马逊还利用图像分类等工具来判断图像的真伪,以防止虚假广告。末了,谷歌和雅虎等大型电子邮件供应商也会利用垃圾邮件分类来判断电子邮件是否是垃圾邮件。它们在这方面做得如何,每天都在影响着我们!
作为开拓职员,当我们在代码中加入ML时,我们历来都是将算法作为模型来实现的。你在代码中构建过决策树吗?这便是你在实现ML模型,而且可能根本没故意识到这一点。
大措辞模型(Large Language Model,LLM):LLM 是一种 AI 算法,它利用深度学习技能和海量数据集来理解、总结、天生和预测新内容。“天生式人工智能”一词也与 LLM 密切干系,它是天生式人工智能的一种类型,专门用于帮助天生基于文本的内容。
目前的 LLMs 例子有 GPT-4(OpenAI 的 ChatGPT 背后)、Llama(Meta)和 LaMDA(Google)。
历史上由开拓者构建的 LLM 例子包括:
编码一个谈天机器人,使其能理解基本命令并进行处理(想想早期基于文本的 "冒险游戏")。Word2vec 技能,通过获取单词的向量表示来确定语义。天生式人工智能(Generative AI,GenAI):GenAI 是一种能够利用预测模型天生文本、图像或其他媒体的 AI。目前最著名的 GenAI 可能是 Dall-E。很多人都在用它天生图像。此外,ChatGPT 也被用来天生文章/内容。
我们中的大多数人在早期从未编写过 GenAI 的代码,但纵然在 1970 年,也有很多事情在进行;一些早期的例子包括语音合成。
GPT(Generative Pre-trained Transformer,天生式预演习变换器):最盛行的 ChatGPT(谈天 GPT)是 OpenAI 开拓的基于大措辞模型的谈天机器人(这里有多个竞争对手,如 Bard、Claude)。
RAG(Retrieval Augmented Generation,检索增强天生):RAG 是一种强大的技能,它结合了预演习措辞模型的上风和信息检索系统的优点。RAG 的紧张目的是增强大措辞模型 (LLM) 的能力,尤其是在须要深入理解和天生高下文干系相应的任务中。
由于当时大多数开拓职员都没有对 LLM 进行编码,因此大多数人也没有实现 RAG。
RAG 的一个例子是获取一些标准模型中尚未包含的信息,并对其进行扩充,使模型在特定用场中更加强大。例如,我将公司手册与现有的 GPT/LLM 结合起来,利用一种叫做嵌入(embeddings)的技能对其进行扩充。这样做之后,我就可以向 GPT 提出有关我公司政策的问题,纵然原始 LLM 对我公司的情形一无所知,它也能做出干系推断。
二、商业用场既然我们已经节制了基本词汇,也有了一些很好的例子来解释这些东西是如何事情的,那么让我们来谈谈 2024 年,以及我们该当如何利用人们已经建立起来的所有伟大工具来实现令人惊叹的 AI 和 ML!
我所在的公司利用软件为客户办理业务问题。这是我们一贯在做的事情,以是我不喜好从技能角度来看待 AI 和 ML,而更喜好从 "我们能办理什么业务问题?"这个问题出发。
传统上,我们利用AI和 ML 办理以下问题:
获取文档并将其转化为可搜索和可用的内容:传统上,我们利用自然措辞处理(NLP)来理解文本的含义和情绪,使其具有可搜索性,并自动进行文档处理,将图像转化为文本,并对其进行分类和分割。大部分事情都是环绕着如何更好地利用传统 PDF 文档展开的。预测发卖结果:利用客户节制的数据,建立模型,为客户供应发卖预测做事。构建更快、更不易出错的软件:过去几年来,我们一贯在利用 GitHub Copilot 和 Amazon CodeWhisperer 等代码赞助工具,帮助开拓职员更快、更高质量地编写代码。如今,我们可以利用最新、最前辈的工具,以更高的准确性和更少的事情量办理这些相同的问题(我们将很快先容个中的几款工具)。我们还可以利用新工具更轻松地办理其他范例的业务问题。
现在比较随意马虎办理的问题有:
将大略的客户做事互动自动化:建立一个自定义谈天机器人来办理客户最常见的问题现在相称随意马虎做到。自动化任务:利用 ChatGPT 类型的工具来帮忙您自动完成以往须要手动完成的任务,如合并文件、过滤文件、汇总文件等。引入特性:在我们的系统中加入面部识别和语音转文本/文本转语音等功能。三、工具和框架直到最近,如果你想建立一个 ML 模型,唯一的选择便是编写一些代码。大多数开拓职员会从以下几个选项中选择一个:
Scikit-learn:大略易学,大多数人都是从这里开始的。TensorFlow:来自谷歌;功能更强大,但很繁芜(有些人在上面利用 Keras)。PyTorch:来自 Meta,比 TensorFlow 更强大、更易用。现在,紧张的云打算供应商都有各自针对不同领域的工具集:
微软:Azure OpenAI (GPT)、视觉/语音/翻译、ML Studio、自动 ML、预演习模型。AWS:Sagemaker(传统);Bedrock--多种模型选项;Sagemaker 有自动 ML 的 Canvas 和 Autopilot,AmazonQ(GPT)。谷歌:VertexAI(双子座模型)、Bard(GPT)、TensorFlow。最近,更高等别的工具也涌现了,让您无需编写任何代码即可快速构建模型:
Nyckel:可让您上传 CSV 并开始事情。用于 Google Sheets 的 SimpleML: 拜会企业主:掌控你的数据AWS、Azure、GCP 等云供应商供应的 AutoML利用 ChatGPT 为您完成 ML!(以前称为高等数据剖析)四、总结
在本文(第 1 部分)中,我们总结了有关AI和ML的所有最新术语,并列举了许多干系示例。我们还展示了可以用最新工具办理的范例业务问题。末了,我们还先容了当今该领域的盛行工具。敬请期待本文的第二部分,我们将通过一个真实的例子,勾引您利用这些工具之一来办理业务问题!
本文系作者个人观点,不代表本站立场,转载请注明出处!