靠谱AI模型预测疫情不可忽视这两点

2020-2-13

2月5日,福布斯官网发布文章称,美国一家金融科技公司Hedge Chatter建立了一个AI模型,用以预测全球范围内的新冠肺炎感染人数与死亡人数。模型显示,一个星期后(2月12日左右),新冠肺炎将造成5万人感染和1000人死亡,并在未来几个星期内呈十倍地增长。

Hedge Chatter联合创始人James Ross表示,该AI模型纳入了中国公布的疫情数据进行训练,并抓取每天公布的最新数据不断优化。目前为止,模型预测的数据与公布的数据误差率小于3%。同时,Ross表示,仍有新变量需要添加到模型中。

文章指出,多名医生与行业专家对此预测结果表示了怀疑。输入AI模型的变量与数据正在改变,而随着新变量的输入,将使结果发生巨大的变化。

训练数据有片面性?

AI模型进行有效预测要有充分、专业的数据。以医疗AI模型为例,医疗AI推送智能提示,要搭建起大型的循证医学知识库,提高后台知识规则库的标准程度,同时,需要纳入多维度真实临床数据训练、优化模型,以确保AI模型能够基于完整的数据做出判断。

再看这个AI预测模型的训练数据。一个是死亡率,2月4日,国家卫建委医政医管局副局长焦雅辉在新闻发布会上对新冠肺炎的病死率作出了说明,截至2月3日24时,全国确诊病死率2.1%。湖北省和武汉市的病死率高于全国水平,除掉湖北省,其它省份的病死率是0.16%。武汉市的病死率高原因在于前期的定点医院重症医学的床位容量远远不够,且收治的病人比较分散,不是由重症医学科专业的医疗团队进行管理。另一个数据是确诊病例,根据国内媒体报道,新冠肺炎检测能力的增强,疑似病例甄别速度的加快,使确诊病例在几天内突然大幅提升。AI模型不能对影响这些数据的因素作出判断,片面性的训练数据使其有效性存疑。

美国内华达大学拉斯维加斯分校(UNLV)公共卫生学院的助理教授Brian Labus也指出,疫情早期报告的死亡率往往偏高,因为首先调查的是病情最严重的患者,其中许多患者死亡了。

影响疫情预测的变量

以色列谢巴医学中心(Sheba)的Eyal Leshem教授表示,在中国有效地控制住疫情,并防止疫情蔓延到其他国家,预计会大大降低感染人数与死亡人数。

国家对疫情的管控手段、各省市迁出迁入人数等因素影响着疫情的进展,因此在利用AI预测新冠肺炎感染人数与死亡人数时,应根据相关因素去修正、调整模型。以近日较受关注的清华AI团队的预测模型为例,清华AI团队根据国家公布的疫情数据构建了动力学模型来预测全国新型肺炎疫情的扩散情况及其高峰期,并基于1月23日以后采取的封城、隔离措施,以及考虑春运返程客流的影响,去作出相关预测。虽然目前不能对其预测结果的准确性作出评价,但从侧面说明,判断疫情的走势不应只以历史数据为基础,还需考虑多方面的因素。

钟南山院士近日接受新华网采访时也表示,我们政府和相关部门采取了多项全国性的举措:延长假期、交通管制、公共场所体温检测排查、积极宣讲预防知识等,而国民公共安全意识的提高也保证了相关举措的顺利实施。这些举措有效阻断传染源,大大减少二代、三代传染。

文章最后提到了 LexaGene 首席执行官 Jack Regan 的观点,所有相关因素汇集一起可能会造成感染率和死亡率的巨大变化,即使是微小的改变也会对AI预测产生巨大的影响。尽管采取了所有的措施,新冠肺炎还是可能走向全球。但是,由于这些努力,病毒的危害性不太可能像预测的那样。

参考资料:

https://www.forbes.com/sites/johnkoetsier/2020/02/05/ai-predicts-coronavirus-could-infect-25b-and-kill-53m-doctors-say-thats-not-credible-and-heres-why/#7ff53a0711cd

成为我们的合作伙伴

信息提交
姓      名
所在地区
单位名称
手  机  号

提交

感谢您的关注,我们会尽快与您取得联系!