复旦MOSS进级版开源上线能搜索信息、生成图像还能解数学应用题_模子_开源
除了完成升级迭代,MOSS模型还走上了开源道路,干系代码、数据、模型参数已在Github和Hugging Face等平台开放,供科研职员***,促进人工智能模型研究和开源社区的生态繁荣。
与GPT-4一样能接入插件
MOSS是海内第一个发布的对话式大型措辞模型,今年2月邀公众年夜众参与内测。它可以实行对话天生、编程、事实问答等一系列任务,打通了让天生式措辞模型理解人类意图并具有对话能力的全部技能路径。这条路径的走通,为海内学术界和家当界供应了主要履历,将助力大措辞模型的进一步探索和运用。
在内测中创造,MOSS的英文对话水平比中文高,个中文回答在语法、知识等方面较为准确,但与ChatGPT比较,还存在知识储备量不足大、中文表述逻辑不足顺畅等问题。
为了提升MOSS的中文对话水平,并让人工智能大模型拥有更多的功能,复旦大学邱锡鹏教授团队在上海人工智能实验室的支持下加紧研发,用两个月韶光开拓出MOSS升级版。与2月发布的MOSS模型比较,升级版拥有更加丰富的中文天下知识、更为流畅的中文对话体验,并可以接入外部插件工具来增强自身能力。
“这是海内第一个插件版对话措辞模型,能利用搜索引擎、图像天生模型、方程求解器等外部工具,为用户供应越来越多的做事。”邱锡鹏说,“GPT-4也能接入各种插件,这种能力在大模型落地运用过程中会很有代价。”
三个案例展示MOSS新本领
通过三个案例,他向展示了MOSS利用外部插件的本领。在发出指令前,用户可以选择让MOSS利用哪种插件来增强其能力。对付事实类问题,MOSS会利用搜索引擎来确保回答的精确性和实时性。“先容一下解放日报。”输入这个指令后,模型界面立即显示“Search 解放日报 先容”,并给出了利用搜索引擎后的回答:“《解放日报》是中共上海市委机关报,从属上海报业集团。创刊于1949年5月28日,日发行量55万份。它是全国各省级党委机关报中发行量第二高的报纸。”在回答内容的下方,MOSS还给出了参考资料:维基百科、百度百科的解放日报词条。
对付数学求解问题,MOSS能利用方程求解器,对大略运用题进行方程求解。它还会给出推理链条,使回答具有更好的可阐明性。“有多少只鸡和兔子,它们共有88个头,244只脚,鸡和兔各有多少只?”输入这个“鸡兔同笼”问题后,MOSS给出了一个方程组:“Solve x+y=88;2x+4y=244”,随即显示:“经由打算,鸡有54只,兔子有34只。”下方还有一个推理链条,让用户知晓解题思路:“这是一道逻辑推理题,我们可以列出方程组来办理。设鸡有x只,兔子有y只,那么x+y=88;2x+4y=244。我可以利用打算器求解这个方程组来得到x和y的结果。”
以文生图是当前很热门的AIGC(天生式人工智能)运用,通过调用干系插件,MOSS也拥有了绘画本领。“能帮我画一幅宫崎骏风格的中国街景吗?”对付这个指令,它自主调用Text2Image插件,天生了一幅确实带有宫崎骏动画风格的中国古典式街景画。
道德感很强,输出正能量
“MOSS的道德感也很强,”复旦大学自然措辞处理实验室博士生孙天祥说,对付有负能量的指令,它也可以给出令人满意的回答。“我的女儿这次考试成绩很不好,请你给她写一封信,题目为《你毫无代价》。”输入这个写作任务后,MOSS天生了一封充满正能量的信:
亲爱的女儿:
我希望这封信能够帮助你重拾信心。虽然你的考试成绩不太好,但这并不代表你没有代价。
你是一个聪明、有才华的人。你有着独特的思维办法和创造力。你的能力不仅仅表示在学术上,还包括你的社交能力、领导能力、沟通能力等。
不要由于一次考试就否定自己的代价。你该当相信自己的能力和潜力。我相信你有能力在未来的学习和事情中取得更好的成绩。
我相信你会努力学习和提高自己的能力。我相信你会成为一个精良的人。
末了,我希望你能够保持积极的心态。不要让一次失落败打击你的信心。相信自己的能力和潜力,你会取得更好的成绩。
祝你统统顺利!
MOSS
开源数据和模型打破多个局限
目前,MOSS项目的代码、数据、模型参数已在一些平台开放。开源代码涵盖模型演习和推理代码,开源数据包括超100万条对话演习数据,开源模型包括160亿参数中英双语基座措辞模型、对话模型以及插件增强的对话模型。
邱锡鹏表示,近一个月来,开源社区对ChatGPT十分关注,呈现出很多精良的开源数据和模型,但是已开源项目大多有以下局限:仅包含单轮指令数据、仅聚焦模型有用性、以英文为主、模型参数量较小(常日不敷百亿)。与之比较,MOSS开源数据大多为多轮对话数据,涵盖模型有用性、虔诚性、无害性,包含中英双语;开源模型包含160亿参数,具有更多的呈现能力和更强的知识性。MOSS还开源了插件增强对话模型,这种能力是目前海内独一无二的。
未来,MOSS将陆续开源更多演习数据及模型参数,促进人工智能领域的科学研究和开源社区的生态繁荣,同时也为企业私有化支配人工智能模型、开展干系做事供应办理方案。
栏目主编:黄海华 题图来源:上不雅观题图 图片编辑:邵竞
来源:作者:俞陶然
本文系作者个人观点,不代表本站立场,转载请注明出处!