像真人一样聊天ChatGPT向AI助理更进一步|新京报快评_模子_用户

2025-01-11 20:19:27 绘影字幕

据媒体宣布，北京韶光5月14日凌晨，OpenAI在春季发布会展示了ChatGPT的更新功能。
这些功能紧张集中在用户的交互体验上，用户可以通过文本、音频、图像等任意办法进行组合输入，并得到ChatGPT的实时回答相应。

像真人一样聊天ChatGPT向AI助理更进一步|新京报快评_模子_用户绘影字幕

在现场演示中，OpenAI重点展示了实时对话交互和语音多样化的功能。
现场展示显示，ChatGPT不仅可以像真人一样语音谈天，还可以根据用户需求，识别和仿照不同的感情、语调进行输出。

这次升级只管不是参数或算力上的重大提高，但其在用户体验尤其是利用门槛上的代价仍旧不容小觑。

OpenAI的CEO山姆·奥特曼将本次更新总结为“人类级别的相应”。
从利用体验上看，利用大模型的场景将变得更像是与“智能助理”进行对话交互，你可以用语音、文本等综合办法不断提出哀求，并得到即时的答案回答。

例如，此前如果你希望通过ChatGPT来帮忙做数学题，那么，用户须要做的步骤有：打开ChatGPT，以文本形式复制题目，等待ChatGPT相应，得到完全答案。
如果希望听到有步骤的语音讲解，则须要等待文本答案全部天生之后，再发出新的指令。

而随着这次交互升级之后，这一体验被改进为了：用户正常在电脑上做题，须要讯问的时候，直接语音或者让ChatGPT根据当前屏幕内容进行解答，而ChatGPT则会根据用户做题场景的需求，进行步骤勾引，而不是直接给出答案。

如果你正在利用书本做数学题，则可以打开设备的摄像头，由ChatGPT通过摄像头瞥见的内容来完成解答。
并且，中间用户可以随时打断ChatGPT进行提问与交互。

本次ChatGPT的体验升级，紧张是环绕人类信息交互的核心场景与办法来进行。
人类日常信息输入的紧张办法是“不雅观看与听说”，而信息处理的紧张办法是“逻辑与感情”。
因此，新升级后的ChatGPT重点加入了“不雅观看屏幕”“感情仿照”等功能，以适配于人类日常的互换习气。

过去基于特界说务指令而涌现的天生性交互，仍旧只是大模型运用于特定生产场景的初步考试测验。
大模型如果要真的进入人类生活，仿照人类信息交互的真实场景与逻辑则是必需的关键一步。

在关于“人工智能”的诸多想象中，不管是文学作品还是科幻电影，都默认人工智能是“利用人类交互形式来沟通”的信息处理助手。
这次实时语音交互功能的加入，毫无疑问使得大模型的利用体验更加符合人们对一个“人工智能助理”的期待。

仿照人类日常生活场景，实现“所见所得”或语音实时交互，已经成为当下大模型行业的主要升级方向。
不久前，Meta（美国互联网公司，原名Facebook）发布的第二代人工智能眼镜，同样也实现了利用摄像头传感器，对用户所看到的统统进行实时的交互、翻译等功能，从而一跃成为了广受欢迎的智能硬件。

设想一下，如果大模型可以“看到人眼所看到的统统并随时给出答案”，或者可以“随时听懂你要问的问题并随时给出答案”，乃至可以“读懂你当前的感情并根据你的感情供应答案”，那么，大模型就离人们设想中的“生活助理”的功能不远了。

从颠覆性的角度看，大模型除了在作图、作曲、数据处理等生产领域发挥特定浸染之外，更大的寻衅任务，是进入"大众的日常生活，真正成为每个人的“生活智能助理”。
如果大模型可以承接住用户日常生活中绝大多数的信息检索、处理、决策，我们刚刚熟习的商业天下、技能运用也将随之发生巨大变革。

此前，微软考试测验将Copliot融入Windos11，谷歌和亚马逊也正在考试测验将自己的大模型融入到系统与产品之中，这些动作，都是在争夺用户“AI助理”的入口。
而ChatGPT的本次升级，意味着“AI助理”的技能竞争开始进入了新的阶段。

或许很快，大模型将不再是一个只有少数人或特定行业利用的生产力提升工具，而将迅速成为普通人日常生活的主要助理，并终极成为"大众日常信息交互的紧张入口。

撰稿 / 马尔文（媒体人）

编辑 / 迟道华

校正 / 李立军

本文系作者个人观点，不代表本站立场，转载请注明出处！