谷歌宣告最新人工智能模型Gemini 智力测试优于“专家级”人类_模子_人工智能

2024-11-19 14:56:13 AI简讯

据《新科学家》杂志网站宣布，谷歌公司6日宣告推出一种名为Gemini的新人工智能模型，声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。

谷歌宣告最新人工智能模型Gemini 智力测试优于“专家级”人类_模子_人工智能 AI简讯

Gemini已针对不同的运用创建了3个版本，分别是Nano、Pro和Ultra，它们的大小和功能均有所增加。
谷歌谢绝回答有关Pro和Ultra的规模、它们包含的参数数量或演习数据的规模或来源等问题。

其最小版本Nano旨在在智好手机受骗地运行，实际上有两种模型：一种用于速率较慢的手机，拥有18亿个参数，另一种用于功能更强大的设备，拥有32.5亿个参数。
据传GPT-4包含多达1.7万亿个参数，而Meta的LLAMA-2则包含700亿个参数。

谷歌声称，Gemini的中档Pro版本击败了其他一些模型，例如OpenAI的GPT3.5，但更强大的Ultra超过了所有现有AI模型的能力。
它在行业标准MMLU基准上的得分为90%，而“专家级”的人类估量能达到89.8%。

这是人工智能首次在测试中击败人类，也是现有模型中得分最高的。
该测试涉及一系列棘手的问题，主题包括逻辑谬误、日常场景中的道德问题、医疗问题、经济和地理。

在同一测试中，GPT-4的得分为87%，LLAMA-2的得分为68%，Anthropic Claude 2的得分为78.5%。
Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。

Pro模型将集成到谷歌今年3月推出的在线谈天机器人Bard中。
该公司表示，名为Bard Advanced的新版本将于明年初推出，并配备更大的Gemini Ultra模型。

谷歌“深度思维”的艾力·柯林斯表示，Gemini是该公司最大、能力最强的模型，但也是最通用的模型，这意味着它可适应各种任务。
与当前许多专注于文本的模型不同，Gemini接管过文本、图像和声音方面的演习，据称能接管所有这些格式的输入并供应输出。

柯林斯称，Gemini“险些在每个领域都是最前辈的”，并且仍在测试中，以确定它在不同媒体、措辞和运用程序中的事情能力。

在发布会上，Gemini没有提高可供测试的版本，但谷歌展示了人工智能办理家庭作业问题和处理实时***输入的演示。
据称，它比以前的模型更善于开拓软件。
去年，“深度思维”发布了一款名为AlphaCode的人工智能代码天生器，它可击败50%的人类开拓职员，新发布的Gemini声称可击败85%的人类编程师。

Gemini可处理文本、音频和***。
图片来源：谷歌公司

（来源：科技日报）

更多精彩资讯请在运用市场***“纵目***”客户端，未经授权请勿转载，欢迎供应***线索，一经采纳即付报酬。
24小时报料热线027-86777777。