南京古生物所团队将AI融入古生物识别实现约86%准确率_古生物_化石
在环球古生物学家的共同努力下,人们对付地层中的化石记录已经形成完善了理论与知识体系,保存在化石中的各种生命形式可以参照当代生物学的研究方法,开展形态学和系统分类学研究。
当然,化石生物与当代生物的差异也是非常明显的,比如古生物仅保存有基本的形态学信息,而缺少当代生物中易于获取的分子生物学信息。
其余,古生物在系统分类方面比当代生物更加多样,古生物中有太多类群已经完备灭绝,化石是它们曾经繁盛的唯一实证。
通过古生物学研究,我们可以理解生命的演化进程,也可以根据化石记录判断地层的地质时期、开展地层比拟,乃至赞助矿藏的勘探与开拓。
笔石(graptolite),是一类生活在寒武纪至石炭纪海洋中的浮游或拍浮型动物,目前已经完备灭绝。笔石的化石常日保存在页岩之中,看起来就像是用笔在岩石上绘制的画迹,也恰是以这类生物被称为笔石。
笔石在世界各地均有分布,种类多样,个体一样平常是几厘米到几十厘米大小。笔石所生活的地质时期范围相对短暂、蜕变迅速,相同或相似的物种可以在多个区域涌现,是判断地层时期、开展地层比拟的主要化石。
值得一提的是,笔石常日保存在页岩之中,这些页岩每每也是页岩气(天然气)的赋存层。此前,中国学者创造华南不同页岩层中产出了不同的笔石物种,并将笔石物种与页岩气的赋存丰度之间建立了关联。
如果在勘探钻孔的岩心中确定了特定的笔石物种,就可轻易得到该层段页岩气的赋存丰度,进而确定是否开展进一步开拓,从而为勘探开拓节省大量本钱。这方面的研究是根本古生物学在油气矿藏领域的主要运用之一。
随时信息时期的到来,大数据与信息技能在根本科研领域发挥着加倍广泛的运用。近年来,古生物学与地层学这一传统学科在大数据领域取得了一定进展,但大多集中在构造化数据,比如,根据化石的产出记录来剖析古生物的多样性变革等。
对付古生物学中的非构造化数据,比如化石图像等却极少得到剖析与研究。那么,古生物学能否与人工智能进一步结合,利用打算机对古生物进行分类与鉴定?
中国科学院南京地质古生物研究所徐洪河研究员及其团队,在近期一项研究中致力于办理这一寻衅。
图 | 徐洪河在某地质调查单位的岩心库(来源:徐洪河)
基于南京古生物所弘大的化石标本收藏,研究团队详细采集了 1500 块笔石化石标本的科学信息,拍摄了大约 5 万幅化石标本图像,并对这些图像进行像素级标注,创建了笔石化石标本科学威信数据集。
在创建笔石图像数据集时,他们还提出了化石标本元数据标准,并将数据集的规范与标准在国内外同行中进行推广。针对化石标本的多模态数据集,徐洪河团队提出了人工智能古生物学的观点。
本次研究是打算科学、信息科学与古生物学的交叉与领悟,其研究思路与方法均为创始,并让他们得到了一项中国发明专利和一项美国发明专利。
古生归天石的识别,属于细粒度的图像识别,有别于常见的图像分类问题。这是由于古生物本身在系统分类上存在层级构造(比如,常见的分类名:门、纲、目、科、属、种等),而且古生物在系统分类时所依据的形态特色每每非常细微,具有极高的专业性。
经由两年多的韶光,研究团队完成了数据集准备、标注、模型演习,有针对性地研发了适宜于化石图像分类的算法,将这些成果用于笔石化石识别模型之后,针对 113 种奥陶纪和志留纪主要笔石属种,所演习的模型实现了大约 86% 的识别准确率,在准确率和事情效率方面远高于一样平常的领域专家。
图|软件所判别的热点区域与化石的主要特色具有同等性(来源:iScience)
这些研究成果可直接手事于页岩气勘探开拓的家当部门。可以说,这个研究主题非常新颖,将最新的人工智能与深度学习算法融入传统的古生物学之中,打造了一种全新的学科交叉形式,具有极大的发展潜力。
日前,干系论文以《利用残差网络以高分类分辨率自动识别笔石》(Automated graptolite identification at high taxonomic resolution using residual networks)为题发在 iScience[1],Zhi-Bin Niu 是第一作者,徐洪河担当共同通讯作者。
图 | 干系论文(来源:iScience)
研究过程中,他们曾与天下各地的古生物学家联系,希望能够帮忙开展人机比拟测试。有的专家很高兴开展测试;有的专家却非常直接地谢绝,情由是人类与打算机(机器)没办法比,人类是注定失落败的。为什么要去参加注定失落败的较劲呢?
这种说法不禁让徐洪河反思,如今很多事情都在被机器所替代,科学研究事情的前景又将如何?
他说:“人类从事科学研究是为了认识天下,机器作为一种工具能够在这方面领先人类吗?有智能机器的发明不禁让人反思,人类能认识天下的实质吗?我们是不是在作茧自缚?科学研究中创造性的方案与设计,也要被机器智能所替代吗?虽然目前没有,未来会不会发生呢?
事实上,本日我们对付自然天下的认识仍是极为有限的,在不断的研究与探索中,人类加倍认识到人类力量的微小,或许认识到这一点能让我们更加坦然吧!
正如徐洪河所言:“在古生物学中引入机器与模型,不是为了取代人类——而且这个目标也不是能够轻易实现的。机器与模型是为了更好地赞助科研,帮忙人类创造新的科学问题,进一步推进这门学科向着更深更广而发展。”
而对付人工智能古生物学这一全新的交叉学科来说,智能识别只是一个起步,未来还有大量事情须要开展。古生物学中有太多专业知识都须要进一步扁平化和遍及化,才能更好地与人工智能相领悟。
目前,课题组已经在微体化石领域开展了干系事情。未来,他们将连续结合人工智能和古生物学,研究地层中的孢粉、牙形刺等。
这些化石门类多、分布广,不仅可以进一步认识生命蜕变的谜题,也有助于开展地层判别,将古生物学与地层学的研究成果运用到油气勘探中。
参考资料:
1.Niu Z, Jia S, Xu H. 2024. Automated graptolite identification at high taxonomic resolution using residual network. iScience, 27. 108549.https://doi.org/10.1016/j.isci.2023.108549.
运营/排版:何晨龙
本文系作者个人观点,不代表本站立场,转载请注明出处!