《科学24小时》|人工智能破解古老卷轴_卷轴_莎草
在意大利坎帕尼亚大区那不勒斯湾,有一座名为 “赫库兰尼姆” 的古罗马城市,被史学家称为 “光阴冻结之城” 。赫库兰尼姆是间隔 庞贝古城 最近的城市,它们都位于 意大利维苏威火山 的周围。公元79年,维苏威火山爆发,占地面积1.8平方千米的庞贝古城被彻底毁灭。而赫库兰尼姆城则被高达20米的火山灰掩埋了,并没遭受到多少毁坏,至今还保持着 公元1世纪 的风貌。
别墅里保存无缺的图书馆是迄今创造的唯一完全的罗马时期的图书馆
随着韶光的流逝,这两座城市逐渐被人们遗忘,直到 18世纪中叶 才被考古人员重新创造。1752年,考古学家在对赫库兰尼姆的挖掘中创造了大量文物,个中包括已被烧焦的 1800个纸莎草卷轴 (也被称为“赫库兰尼姆卷轴”)。这些 赫库兰尼姆卷轴 是在一座豪华别墅里保存无缺的图书馆废墟中找到的,这也是迄今创造的 唯一完全的罗马时期的图书馆 。据推测,该别墅可能属于恺撒大帝的岳父、参议员卢修斯·卡尔普尼乌斯·皮森·凯索宁斯。
赫库兰尼姆卷轴埋藏在 火山灰层 下近2000年,虽然重见天日,但是早已严重碳化。据意大利国家研究委员会的 纸莎草纸学者 拉齐亚诺·拉诺基亚 先容,如果没有火山爆发导致赫库兰尼姆卷轴碳化,那么它们是不可能保存至今的。这些卷轴见证了古代文明,却让科学家对此束手无策。
设大赛破难题
古老的 赫库兰尼姆卷轴 大多保存在意大利那不勒斯国家图书馆,少部分分别保存在牛津大学的博德利图书馆、大英图书馆和法兰西学院等处。虽然已经 在高温下被碳化 了,但是人们相信这些文献有着非同平凡的代价,一贯在 努力试图辨认个中的内容 。
埋藏在火山灰层下近2000年的赫库兰尼姆卷轴早已严重碳化
不同于破解一样平常的密码,破解碳化的卷轴之难,无异于解读一本 “无字天书” 。几个世纪来,一贯有历史学家考试测验展开卷轴进行破译。但这样的考试测验付出了高昂的代价,一些赫库兰尼姆卷轴 直接在展开的过程中被损毁 ,变成碎片。近20年来,美国肯塔基大学“数字规复操持”卖力人、打算机科学家布伦特·西尔斯教授及其团队作出了不懈的努力,希望有朝一日能打开这座“隐形图书馆”。
赫库兰尼姆卷轴被直接展开的后果便是损毁成碎片
西尔斯 是一位履历丰富的古笔墨破译专家。2016年,他利用 X射线打算机断层扫描技能 (CT)成功解读了来自以色列恩戈地的一部烧焦的卷轴,揭示了写于公元三四世纪的 《利未记》 (犹太教《托拉》和基督教《旧约》的一部分)的部分内容。这是由于书写 恩戈地 的卷轴用的 墨水含有金属 ,因此在CT扫描中会发出刺目耀眼的光芒。但 赫库兰尼姆卷轴 上的 墨水是 碳基 的,实质上是木炭和水,密度与纸莎草纸的密度附近,因而在扫描中根本不会显现出来。
2019年, 西尔斯 把4个单页的碎片和整卷卷轴送到英国国家同步加速器光源科学举动步伐—— “钻石光源中央” 接管检视,利用高亮度的光束照射卷轴,能够识别出 墨水和空缺区域 之间的细微纤维构造差别。
西尔斯的研究团队在英国国家同步加速器光源科学举动步伐——“钻石光源中央”扫描卷轴
西尔斯的学生 斯蒂芬·帕森斯 成功地利用 机器学习模型 侦测到碎片中的墨水,结合一个 “虚拟成像”软件 重修出笔墨在纸莎草纸上的位置。这一过程实际上是“虚拟揭开”薄如蝉翼的纸莎草纸层,以一种非毁坏性的办法虚拟读取卷轴上的内容。
西尔斯的研究团队得到了微软下属软件项目托管平台前首席实行官、技能投资者纳特·弗莱德曼和企业家丹尼尔·格罗斯等人的帮助。 弗莱德曼 等人提出了一种创新性的方案:通过 “维苏威寻衅赛” 的形式,以破解赫库兰尼姆卷轴为目标,推动 人工智能技能 的广泛运用,并鼓励全社会有志者积极参与。
通过高亮度的光束照射识别卷轴墨水和空缺区域之间的细微纤维构造差别
2023年3月, “维苏威寻衅赛” 正式启动,赛事奖金高达100万美元。大赛分为三个阶段: 第一阶段 的任务包括组建破译团队、搭建人工智能模型和策划订定项目报告; 第二阶段 是人工智能程序的运行和初步成果展示; 第三阶段 展示卷轴破解结果和干系论文。每个阶段都设定了奖金,以支持团队购入更好的设备,租用更大的云空间,招募更专业的互助者。根据寻衅赛的哀求,参赛军队要 公开人工智能运用的底层代码 ,供所有人共享。
比赛章程规定,参赛者必须在2023年年底前在赫库兰尼姆卷轴的 4平方厘米 区域内至少找到 10个字符 、在每段140个字符统共4段笔墨中破译 85%以上 的字符。为了赞助解密卷轴,西尔斯的研究团队向参赛者发布了 数千张X光照片 ,并供应了没有接管过特殊演习的 人工智能软件 。当时,专家组普遍认为,参赛团队一年之内寻衅成功的概率还不到三成。
年轻人拔得头筹
“维苏威寻衅赛”的发布后,收到了许多成果。2024年2月5日获奖成果公布, 终极得胜者 并非预期中的加州大学等军队,而是一个名不见经传的 大学生团队 。这个团队由来自不同国家的 3名大学生 组成,他们之间从未面对面事情过。团队成员各自具备独特的专业知识,分别善于罗马历史、打算机编程、笔墨及图像处理、三维建模等技能。他们协同互助,利用人工智能技能破译了烧焦的古代卷轴上的 2000多个希腊字母 ,相称于一份 卷轴5% 的内容。他们共同分享了70万美元奖金。此外,这次大赛还评出3个并列的亚军,他们在墨迹标记和采样的细节处理上各有创新,分获5万美元奖金。
人工智能技能破译了古卷轴上的2000多个希腊字母,相称于一份卷轴5%的内容
2023年8月,美国企业家、物理学家 凯西·汉默 撰写了一篇博客,讲述了他通过持续数小时的不雅观察,把稳到CT三维扫描卷轴中有着 模糊的墨水纹理 ,类似于分裂的泥土(他称之为“裂纹”),彷佛形成了 希腊字母的形状 。这可以说是一个重大打破,由于之前只有在展开的碎片上识别过墨水痕迹,还没有人在 未打开的卷轴中找到墨水痕迹 。由于这项创造极大地引发了其他选手的灵感,汉默也得到了1万美元奖金。
在这个得到冠军的大学生团队中,21岁的 卢克·法里托 是美海内布拉斯加大学林肯分校打算机科学系的一逻辑学生,他当时正在美国太空探索技能公司进行暑期演习,有时听到寻衅赛的,产生了极大的兴趣。
美海内布拉斯加大学林肯分校打算机科学系的学生卢克·法里托
受到汉默创造的启示,他利用业余韶光,通过表面纹理的细微差别,演习一个 关于“裂纹”模式的人工智能学习模型 。法里托在卷起的纸莎草纸上成功地检测到了几行希腊字母,个中包括ΠΟΡΦΥΡΑϹ(小写:πορφυ̣ρ̣ας̣),意思与“紫色”干系,翻译成英文意思是“紫色布料”。他是一名本科生,却成了天下上 第一个读出赫库兰尼姆卷轴完全单词的人 ,赢得首字母一等奖,得到4万美元奖金。
法里托和纳德从字符中检测到了 ΠΟΡΦΥΡΑϹ(小写:πορφυ̣ρ̣ας̣)
在汉默和法里托成功业绩的勉励下,该团队来自德国柏林自由大学生物机器人工程系的成员、博士生 优素福·纳德 也鉴别出与法里托 相同的几行希腊字母 ,赢得首字母二等奖,奖金为1万美元。只不过,他是利用 图片中的字母形状 来演习人工智能学习模型的。
德国柏林自由大学生物机器人工程系的博士生优素福·纳德
瑞士苏黎世联邦理工学院机器人系的学生 朱利安·席利格 是该团队的卖力人。他勇于啃硬骨头,研究寻衅赛 最耗时的问题——分割 ,创建出能用数字办法展开卷轴CT扫描的代码,并在卷轴发黑的表面上探求微弱的墨水图案,他因此赢得三项分割工具奖。
瑞士苏黎世联邦理工学院机器人系的学生朱利安·席利格
随后,这个大学生团队和西尔斯的研究团队一起事情了数月,并于2024年2月6日在 《自然》 期刊上公布了这份卷轴上 已被读取的部分内容 。这部分内容与 音乐、感官及快乐 有关,个中一行写道:“就食品而言,我们不会立即相信稀缺的东西绝比拟丰富的东西更令人愉快。”另一行写道:“…… 由于我们不会质疑某些事情,而是理解或记住其他事情。愿我们的老实是显而易见的,由于它们可能常常看起来很明显!
”这是卷轴的结尾,但这种表述意犹未尽。
从破译的这些笔墨中,我们可以理解到古代哲学家对 “如何享受生活”“快乐” 的磋商与争辩 ,揭示了人们对 音乐和冒险 的沉思。根据参与“维苏威寻衅赛”的学者们的说法,“文本的主题是 快乐 ,如果理解得当,这是伊壁鸠鲁哲学中 最高的善 。在卷轴这两个连续的片段中,作者关心的是食品等商品的供应是否以及如何影响它们所供应的快乐”。
新目标令人鼓舞
作为“维苏威寻衅赛”的联合发起人之一,西尔斯高度评价了由席利格、法里托和纳德组成的团队,认为他们 通过三个不同却相互支持的模型 ,成功识别出赫库兰尼姆卷轴中的 2000多个字符 ,在超乎标准的情形下拿下了大奖,真是可喜可贺!
这项造诣一时轰动了环球学术界,总浏览量已经超过了1500万次。
对此,西尔斯总结道:“ 人工智能破译赫库兰尼姆卷轴的过程,包括演习一个机器学习模型 。该模型检测到人眼无法察觉的X射线图像中最眇小的纹理变革和墨迹。全体过程详细分 三个步骤 进行: 第一步,扫描 。 利用X射线断层扫描技能对卷轴或碎片进行CT三维扫描。 第二步,分割 。 在三维扫描图像中追踪纸莎草纸的皱褶层,随后将其展开或铺平。 第三步,墨迹检测。 借助机器学习模型,识别铺平段落中的墨迹区域。”
纸莎草卷轴的X射线横截面
个中, 墨水检测 的过程困难重重,寻衅最大。英国数字修复操持的访问学者斯蒂芬·帕森斯对此阐明道:“由于 墨水和纸莎草纸 都是 由碳制成 的,它们在X射线中有相似的外不雅观,因此在扫描中看到墨水是不易的。但在某些情形下,足够厚的墨水能使它的 纹理被直接不雅观察 到,类似于剥落的油漆或龟裂的泥浆。”
弗莱德曼指出,“维苏威寻衅赛”还未结束,在宣告第一阶段大奖得主的同时进入第二阶段。目前各个参赛团队已具备相对成熟的技能,得以虚拟展开赫库兰尼姆卷轴,并利用机器学习来识别墨水。 2024年 ,“维苏威寻衅赛”的 新目标 是从识别一个已经扫描卷轴的5%增加到 所有的4个卷轴的至少90% ,为日后阅读800个卷轴奠定根本。个中,第一个出色完成任务的团队将得到10万美元奖金。
碳化纸莎草卷轴及X射线相差断层扫描识别的一些希腊字母
美国保罗·盖蒂博物馆古文物馆长肯尼思·拉帕廷表示:“这一造诣推动了常日进展缓慢的考古研究的发展,有望 揭示 许多迄今仍是谜团的 古代手稿的内容 ,为我们更深入地理解历史供应新的视角。”
本文系作者个人观点,不代表本站立场,转载请注明出处!