作者:王泽宇 华略智库新媒体部

人工智能是否会取代咨询师——关于三大年夜国产大年夜模型的测评_嘉善_模子 智能写作

来源:上海华略智库(ID:HUALUETT)

人工智能的浪潮正以不可阻挡之势席卷环球,它在各个领域的运用不断刷新着我们的认知。
本文通过测评三大国产AI大模型在决策咨询领域的表现,深入磋商人工智能能否取代人类咨询师。
让我们跟随本文,一起来看看在这场较劲中,谁能更胜一筹?

全文3894字,阅读约10分钟

2022年11月,ChatGPT的横空出世,将人工智能发展推向了一个新的时期,各大互联网科技企业都开始将其纳入自身核心发展计策,许多以人工智能为依托的初创企业也如雨后春笋般呈现出来。
一年多韶光,国产人工智能大模型的发展速率之快、运用行业之广超出想象。
比如,近期科大讯飞发布了讯飞星火大模型4.0,在文本天生、措辞理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力方面得到全面提升,整体超越GPT-4 Turbo。

2023年,麦肯锡曾发布了一份题为《天生式人工智能的经济潜力》的研究报告,称在2030年至2060年间,或有50%的职业会逐步被人工智能取代。
作为一名智库的从业者,我也有一丝隐忧:未来,决策咨询会不会被人工智能取代?为此,我们设计了这次测评,来看看中文大措辞模型做决策咨询,会不会比我们更精良。

凭借我们广泛的市场履历和客户反馈来看,一项精良的决策咨询成果常日须要同时具备三个方面:

三个方面,地球人都知道

——清晰的逻辑:把事说清,做到一览无余;

——有趣的灵魂:思想为王,做到一针见血;

——好看的皮囊:表达幽美,做到一见爱慕。

本次测评也将会从以上三个方面重点展开。

在测评工具方面,我们综合技能水平、用户体量、市场口碑等成分选择了三款大模型产品参与本次测评,它们是:百度的文心大模型、科大讯飞的讯飞星火、月之暗面的Kimi智能助手。

首先,百度作为中国领先的科技公司之一,在人工智能领域的研发投入非常弘大。
在2022年李彦宏就曾透露,百度10年内在人工智能领域累计投入超过1000亿用于研发,每年研发占比都超过15%,这种不遗余力的投入终极也表示在了文心一言精良的表现上。
文心大模型在多项自然措辞处理任务中的表现卓越,如文本天生、机器翻译和语义理解。
截至今年4月份,文心一言的用户数打破了2亿,API日均调用量也打破了2亿,做事客户数达到了8.5万,利用千帆平台开拓的AI原生运用数超过了19万。

其次,科大讯飞是中国语音技能领域的龙头企业,其技能广泛运用于教诲、医疗等多个行业。
讯飞星火大模型以其在语音识别和智能对话系统方面的领先技能而有名。
自2023年9月至今年6月尾,讯飞星火APP在安卓公开市场累计***量达1.31亿次,在海内工具类通用大模型App中排名第一。
值得一提的是,讯飞星火大模型在教诲、医疗等细分行业的专业运用也覆盖了超过2000万用户。

末了,月之暗面虽然创立仅一年多,但凭借Kimi智能助手的出色表现迅速在市场上崛起,赢得浩瀚成本青睐,其当前估值已经高达195亿公民币。
今年3月18日,月之暗面曾宣告在大模型长高下文窗口技能上取得新的打破,Kimi智能助手支持无损高下文长度从最初的20多万字,扩容到200万字。
该公布后,Kimi关注度一起走高,一度挤爆了做事器。
今年4月,Kimi智能助手网页版访问量达到2004万,较3月上涨60.2%,访问量一度超过文心一言,排在海内同类产品的第一位。

看图说话

清晰的逻辑

“清晰的逻辑”在决策咨询中表示为思想的穿透力和判断性,哀求咨询师基于深厚的行业知识和专业背景,供应清晰的见地和剖析,确保思想不雅观点与实际情形相吻合,确保内容真实、可验证。

为验证AI的上述能力,我们从“批驳的武器与武器的批驳”和“钢铁的领袖与领袖的钢铁”中得到灵感,设计了以下问题:

“在家当造就中,你如何理解‘把握未来的家当’和‘把握家当的未来’?字数限定在500字以内。

以下是各个大模型的回答:

星火

文心

Kimi智能助手

从上述回答中可以看出,三个大模型均展现出了较高的理解能力,都区分了“未来的家当”和“家当的未来”的观点差异,前者“未来家当”,关注新兴家当趋势的洞察和前瞻性布局,强调技能发展赛道的变革;后者“家当未来”则侧重现有家当的持续发展和升级。
不过受制于文章篇幅,我们这次环节没有引入更多问题,大模型的知识面广度仍有待进一步稽核。

有趣的灵魂

“有趣的灵魂”在决策咨询中表示为思想的洞察力和准确性,哀求咨询师基于信息的充分挖掘、科学剖析和系统提炼,供应具有说服力的见地和剖析,能够从不同角度佐证紧张不雅观点,确保报告的威信性和可信度。

为验证AI的上述能力,我们设计了以下问题:“长三角一体化上升为国家计策五年来,区域间的差距是扩大还是缩小?请结合实际数据和依据作出回答。

以下是各个大模型的回答:

文心

星火

Kimi智能助手

文心大模型是三个大模型中表现最好的,它考试测验依托实际数据和案例,从经济水平、科创能力、根本举动步伐、生态保护四个方面证明区域间差距正逐步缩小这一不雅观点。
尤其是在经济水平和生态保护两个方面,引用了中央区城乡居民收入差距、中央区人均GDP与全域人均GDP差距的数据以及水乡客厅的案例。
不过其在其他两个方面所展示的数据与论点关联性依旧不高,略显薄弱,比如TA提到长三角地区在根本举动步伐培植方面取得显著进展,但并没有给出详细案例——沪苏双11号线无缝对接,或是打通省界“断头路”项目等。

讯飞星火的回答从宏不雅观层面展现了长三角地区五年来在经济发展、对外开放、协同创新、家当集群等领域取得的造诣,但并没有切入问题本身,展示长三角区域间差距扩大或缩小的证据,得出的结论与实际论证过程也不尽符合。

Kimi智能助手的回答列举了长三角地区一部分的区域发展现状,但也没有回答差距是扩大还是缩小,仅在公共做事领域上提到教诲、医疗卫生方面差异逐渐缩小,社会保障的内部差距有所扩大,但并没有列举详细数据和材料论证这一不雅观点,得出的结论说服力不高。

总体来看,三大模型在该问题上的完成度较差,讯飞星火和Kimi智能助手并没有很好地理解问题,文心大模型在案例引用上展现出了亮点,但仍旧不敷。

好看的皮囊

“好看的皮囊”在决策咨询中表示为思想的表现力和可读性,哀求咨询师利用清晰、精髓精辟且具有创造力的表达办法,以清晰的构造、幽美的措辞和工致的行文,使得繁芜信息变得易于理解和接管,让读者能够快速捉住重点,提升整体阅读体验。

为验证AI的上述能力,我们设计了以下问题:“请为浙江省嘉善县撰写一篇激情亲切洋溢的城市推介词,吸引和留住青年人才,以诗歌为标题,字数限定在1000字以内。

以下是各个大模型的回答:

星火

文心

Kimi智能助手

文心大模型的文章以“嘉善,诗画江南的青春乐章”为题,从历史、自然风貌、文化秘闻、创新发展和人文关怀五个方面详细描述了嘉善的独特魅力,末了以喊话青年人才为结尾,其亮点在于利用“嘉善之美、嘉善之韵、嘉善之活、嘉善之魅”引出每一段,并且点出了嘉善作为吴文化发源地的特色。

讯飞星火的文章以“嘉善,诗意栖居的江南水乡”为主题,紧张从自然风景、历史文化描述了嘉善的独特魅力,并重点讲述了嘉善为青年才俊供应的优秀资源和广阔发展空间。

Kimi智能助手的文章以“江南梦,嘉善情——诗意栖居,青春启航”为题,从历史文化、创新空间、教诲资源、生活环境、发展机遇五个方面描述了嘉善的亮点。

三篇文章总体上构造清晰且各具特色,展现出了人工智能在构造梳理上的较高能力。
但从细节来看,三者在措辞组织上还略显生硬,缺少韵味,属于“不耐看”的类型。
最大的问题在于,三篇文章自始至终没有给出有力依据,比如在先容嘉善的创新环境和发展空间时,没有点出嘉善“双示范”的国家计策地位,没有突出嘉善具有竞争力的人才招引政策,没有提到祥符荡科创绿谷、中国归谷嘉善科技园等人才展示平台,没有彰显出嘉善爱才若命的招贤纳士姿态,使得推介词“激情亲切”不敷、“洋溢”不足。

总体来看,三大模型对付文章构造的梳理值得借鉴参考,但并没有很好地完成这一项任务。

回到我们最开始的问题,人工智能是否会取代咨询师?在给出终极的答案之前,我们不妨先看看滨州市委布告、市人大常委会主任宋永祥在第三届滨州人才节启动仪式暨人才高峰荟上的主旨演讲:《选择滨州 爱上智城 共赢未来》。
文章用“江山代有秀士出”“近水楼台先得月”“此心安处是吾乡”“不拘一格降人才”“***”五句诗向人才致敬,构造严谨、行文流畅、措辞幽美、逻辑清晰、内容详确,堪称推介词的范本。

通过这次测评,我们能够看到人工智能模型在语义理解和逻辑梳理上展现出的能力。
例如,这些模型能够险些瞬间剖析大量文本,提取关键信息,并整理出清晰的框架,能够帮助咨询师更好地梳理课题思路,把握研究方向,提高事情效率。
然而,三个大模型在综合表现上仍无法达到高质量决策咨询报告的哀求,比如在措辞组织上还略显生硬,无法在论证不雅观点时供应全面且有力的依据,反响出当前的人工智能在天生高质量、连贯性强的文本方面仍有很大提升空间。

此外,要让人工智能在决策咨询中发挥更大浸染,还须要战胜一些寻衅。
首先,人工智能模型依赖大量数据,如果网络的数据存在偏差或不准确,会直接影响其输出结果;其次,决策咨询的论证过程须要透明、可靠和令人信服的依据,当前的人工智能模型,实在质上还难以分开“黑箱”的实质,还没有人能够理解其内部事情事理,这就须要有人不断对其天生的结果进行严格审查和校验。

综上,当前的大措辞模型具备在实际事情中作为赞助工具,能够帮助咨询师提升部分场景的事情效率,但间隔完备取代咨询师还有很大的差距。
未来,随着人工智能技能的不断进步,或许有一天算夜措辞模型能在更繁芜的任务中发挥更大的浸染,然而在此之前,咨询师的创造力、判断力和表达力依然是决策咨询中不可替代的关键成分。

更为主要的是,咨询师和大模型一样,都在持续不断地学习,同时——华略智库的公众年夜众号和***号便是例证。

以是,在可预见的阶段,决策咨询行业中,紧张靠人工,有时靠智能。
暂时,我们还不会被取代。