基于机械进修的 COVID-19 盛行病学研究_模子_美国
在“人工智能增强盛行病学预测美国和日本 COVID-19 的前瞻性评估”中,被npj 数字医学接管,Google连续了Google之前的事情 [ 1 , 2 , 3 , 4 ] 并提出了一个旨在仿照某些政策变革对 COVID-19 去世亡和病例的影响,例如学校关闭或美国州、美国县和日本县级的紧急状态,仅利用公开数据。Google对Google的公共预测进行了为期 2个月的前瞻性评估,在此期间,Google的美国模型在COVID19 预测中央上与所有其他 33 个模型并列或优于所有其他模型. Google还发布了对美国和日本受保护群体表现的公正剖析。与其他帮助应对 COVID-19 的 Google 操持一样 ,Google将根据这项事情在网络 [ us , ja ] 和BigQuery上免费向"大众发布逐日预测。
美国和日本模型的前瞻性预测。实际累计去世亡人数(绿线)与每天的预测一起显示。每个预测都包含 4 周预测窗口内每天去世亡人数的预测增加(显示为彩色点,个中阴影变为黄色表示在预测范围内间隔预测日期还有几天,最多 4 周)。显示了美国(上)和日本(下)的去世亡预测。
几十年来,盛行病学家一贯在研究传染病的模型模型。房室模型是最常见的,由于它们大略、可阐明,并且可以有效地适应不同的疾病阶段。在区室模型中,根据个人的疾病状态(例如易感、暴露或康复),将个体分为互斥的组或区室,并对这些区室之间的变革率进行建模以拟合过去的数据。人口被分配到代表疾病状态的隔间,随着疾病状态的变革,人们在状态之间流动。
在这项事情中,Google提出了对易感暴露传染去除 (SEIR) 型隔室模型的一些扩展。例如,易动听群暴露会导致易感隔室减少而暴露隔室增加,其速率取决于疾病传播特色。不雅观察到的 COVID-19 干系结果数据(例如确诊病例、住院和去世亡)用于演习隔室模型。
盛行病学中“隔间”模型的视觉阐明。人在隔间之间“流动”。现实天下的事宜,如政策变革和更多的ICU病床,改变了隔间之间的流动速率。
Google的框架提出了许多新颖的技能创新:
学习转换率:Google利用机器学习率来映射它们,而不是利用静态速率来跨所有位置和韶光在隔间之间进行转换。这使Google能够利用大量可用数据和信息旗子暗记,例如 Google 的 COVID-19社区流动报告、医疗保健供应、人口统计和计量经济学功能。
可阐明性:Google的框架为决策者供应可阐明性,通过其隔室构造供应有关疾病传播趋势的见地,并建议哪些成分可能对驱动隔室转变最主要。
扩展隔间:Google添加了住院、ICU、呼吸机和疫苗隔间,并在数据稀疏的情形下展示了有效的培训。
跨位置信息共享:与拟合单个位置相反,Google对一个国家(例如,美国 3000 多个县)的所有位置具有不同的动态和特色,Google有一个单一的模型,Google展示了跨位置传输信息的好处。
Seq2seq 建模:Google利用序列到序列模型和新颖的部分西席逼迫方法,最大限度地减少未来缺点的放大增长。
预测准确性每天,Google都会演习模型来预测未来 28天的COVID-19 干系结果(紧张是去世亡和病例)。Google报告了全国范围分数和位置级别分数的均匀绝对百分比偏差(MAPE),以及 COVID-19 干系结果的累积值和每周增量值。
Google将Google的框架与来自COVID19 预测中央的美国替代方案进行了比较。在 MAPE 中,Google的模型优于所有其他 33 个模型,除了一个模型——凑集预测也包括Google模型的预测,个中差异在统计上不显著。
Google还利用预测不愿定性来估计预测是否可能准确。如果Google谢绝模型认为不愿定的预测,Google可以提高Google发布的预测的准确性。这是可能的,由于Google的模型具有经由良好校准的不愿定性。
随着Google肃清不愿定的预测,提高准确性,均匀百分比偏差(MAPE,越低越好)会降落。
仿照大盛行管理政策和策略的假设工具除了理解给定过去数据的最可能情景之外,决策者还对不同的决策如何影响未来结果感兴趣,例如,理解学校关闭、流动性限定和不同疫苗接种策略。Google的框架许可通过将选定变量的预测值更换为其反事实对应物来进行反事实剖析。Google的仿照结果增加了过早放松非药物干预 (NPI) 的风险,直到疾病的快速传播减少。同样,日本的仿照表明,在保持高疫苗接种率的同时保持紧急状态会大大降落传染率。
假设在 2021 年 3 月 1 日在德克萨斯州、华盛顿州和南卡罗来纳州的预测日期采取不同的非药物干预 (NPI),对预测暴露个体的百分比变革进行假设仿照。NPI 限定的增加与暴露人数的更大百分比减少有关。
假设预测日期为 2021 年 3 月 1 日在德克萨斯州、华盛顿州和南卡罗来纳州的疫苗接种率不同,则对预测暴露个体的百分比变革进行假设仿照。在这些情形下,提高疫苗接种率对付减少暴露数量也起着关键浸染。
公正剖析为了确保Google的模型不会产生或强化不公正的偏见决策,根据Google的AI 原则,Google通过量化模型在受保护子组上的准确性是否更差,分别对美国和日本的预测进行了公正剖析. 这些种别包括美国的年事、性别、收入和种族,以及日本的年事、性别、收入和原籍国。在所有情形下,一旦Google掌握了每个亚组中发生的 COVID-19 去世亡人数和病例数,Google就没有证明这些组之间存在同等的缺点模式。
按收入中位数归一化的偏差。两者之间的比较表明,一旦缺点被案例规范化,缺点模式就不会持续存在。左:按美国收入中位数归一化的偏差。右:日本按收入中位数归一化的偏差。
举几个例子,在美国,哈佛环球康健研究所和布朗公共卫生学院利用这些预测来帮助创建媒体用来帮助关照"大众的COVID-19 测试目标。美国国防部利用这些预测来帮助确定分配资源的位置,并帮助考虑特定事宜。在日本,该模型被用于制订商业决策。一家在 20 多个县设有商店的大型跨县公司利用这些预测来更好地方案发卖预测并调度商店业务韶光。
限定和后续步骤Google的方法有一些局限性。首先,它受可用数据的限定,只要有可靠、高质量的公开数据,Google就可以发布逐日预测。例如,公共交通的利用可能非常有用,但该信息不公开。其次,由于隔室模型的模型容量存在局限性,由于它们无法对 Covid-19 疾病传播的非常繁芜的动态进行建模。第三,美国和日本的病例数和去世亡人数分布有很大差异。例如,日本的大部分 COVID-19 病例和去世亡病例集中在其 47 个县中的几个县,其他县的数值较低。这意味着Google的每个县模型都经由演习,可以在所有日本县中表现良好,
Google更新了Google的模型,以考虑疾病动态的巨大变革,例如疫苗接种数量的增加。Google还扩展到与市政府、医院和私人组织的新互助。Google希望Google的公开拓布连续帮助"大众和政策制订者应对持续大盛行带来的寻衅,Google希望Google的方法在这次和未来的康健危急中对盛行病学家和公共卫生官员有用。
本文系作者个人观点,不代表本站立场,转载请注明出处!