人工智能最新研究:一种大年夜措辞模型加上评价框架带来新数学创造_上限_办法
该论文先容,基于人工智能的工具(例如LLM)有望加速科学创造,办理长久存在的问题,但它们有时受制于“幻觉”,导致作出看似合理但缺点的陈述。加入一个评估步骤,系统地衡量潜在办理方案的准确性,使得靠LLM帮助应对繁芜问题成为可能。这些问题一样平常须要可验证且定义明确,使这一工具在数学科学中有潜在代价。
论文第一作者和通讯作者、Google DeepMind的Bernardino Romera-Paredes和Alhussein Fawzi与同事及互助者一起提出一种方法,称为FunSearch(由于它搜索函数空间),将一组产生创造性办理方案的LLM和一个作为检讨者以避免缺点建议的评估程序结合起来。一个多次迭代此过程的蜕变方法,通过供应此前最佳办理办法作为输入来勾引LLM,结果表明这种方法可以收敛到新的、可验证的精确结果。他们将FunSearch运用到了著名的上限集问题(cap set problem,数学中涉及计数和排列领域的一个中央问题),创造了超越最著名上限集的大上限集新布局。
论文作者认为,FunSearch的成功关键是它会探求描述如何办理一个问题的程序,而非探求办理办法。由于FunSearch的结果是程序,结果易于人类阐明和验证,这意味着该方法有望引发该领域的进一步思考。
他们补充指出,目前,这个方法可能还不适宜所有类型的寻衅,但通过未来改进或可使FunSearch运用于更大范围的问题。(完)
本文系作者个人观点,不代表本站立场,转载请注明出处!