因此,刘广建表示,数据相关工作的第一步是临床数据集成。目前现状是,HIS、EMR、PACS、LIS等临床信息系统由不同厂家在不同时期建设,系统间通过不同的数据接口连接。怎样把同一位患者在院内产生的所有数据从头到尾理顺整合,这是院内数据问题。
如果想开展多中心研究,还需要诸如国家疾病登记报告系统、各种智能传感器数据等外部数据。怎样把形形色色的数据全部纳入同一个临床数据集,需要做工作是:首先进行数据抽取、整合、清洗,然后进行数据转换,形成医疗数据湖,其目的是把所有数据真正集合起来。有了医疗数据湖,才能进一步进行临床服务、科研服务、管理服务、统计服务等各种工作。
当然,有了集成数据,还并不能直接为临床研究所用,还需要完成临床数据向科研数据的转化。因为临床数据是离散的,非结构化的数据点,就像杂乱无章的一堆火柴头;需要把临床数据集中进行结构化处理,再依据一定规范整合成集中的、结构化的科研数据块;下一步,从可进行科研的数据块里,针对研究目的,提取出要用的特征数据,进行多维度、正则化清洗,形成可量化、可深度分析、可建模的数据元。
总的来说,目前既有的临床数据治理及利用模式,是从面向临床诊疗实践,无特定研究目的原始数据出发,首先进行数据清洗、整合,形成集成数据;当有了一定的研究目的,则继续在专科层面抽取特有数据,形成研究数据库;当研究目的更具体时,则做进一步抽取、清洗,形成具体研究数据。就这样,经过逐步抽取、清晰,完成临床研究所需数据的整理准备工作。
刘广建表示,目前很多医院已经有比较成熟的临床数据中心(CDR,Clinical Data Repository),可以把院内不同角落的数据整合起来。但当我们以更宏大的视角去审视时,当前医疗大数据在集成、应用方面还面临着不小的挑战:
上图中四个方面既是目前医疗大数据集成应用面临的挑战,也是发展的方向和必须要解决的问题。他表示,好在国家层面“已有所布局”。
02
AI促使临床研究更加精准化、个性化
有了医疗大数据的蓬勃发展作为基础,AI应用于临床研究的最根本目的是,根据多个预测因子(数据、特征等)预测临床结果。当前,几乎每个医学领域、临床专业都在开发基于AI的工具,以期实现与人类水平相当或更高的诊疗和预后预测能力。
在医疗大数据、AI大发展背景下,临床研究领域也形成了新范式——把统计分析、机器学习、深度学习,加上专家系统、知识图谱,以及有限元分析、试验方法等因素和方法整合起来,可以解决临床研究中面临的大多数问题。
“这是我们发现医疗大数据、医学AI给临床研究带来的更精准化的影响。”刘广建说,传统的统计学分析,只能解决危险因素对整个人群的影响,但不能做到个性化、精准化地分析危险因素度对每一个体的影响作用和作用程度。有了大数据、AI后,更多的是可以在个体层面做个性化、精准化的诊断治疗、预后预测等。
当然,AI技术能够通过不断分析挖掘数据来逼近真相,但在临床应用中也存在局限性:
怎么解决?“我觉得最重要的是,不管技术多先进,数据规模多大。想要运用到临床,就必须回归临床研究的本质,真正做对患者有用、有益的研究,避免把临床研究、医疗大数据、人工智能变成技术秀场。”刘广建说。
03
构建临床科研一体化闭环转化服务平台
“要让大数据+AI技术更好地服务于临床研究工作,最终解决方案是构建一个临床科研一体化平台。平台既服务于临床,又服务于科研,同时又能够把科研成果及时转化到临床中应用,最终形成一个临床科研一体化的闭环转化服务平台,包括科研问题的产生、数据的采集、统计检验/分析建模,以及不同类别模型的训练等环节。
构建一体化平台会面临诸多困难,比如临床环境会发生数据错误、缺失等非常多意外情况;高质量、大规模、多中心、多维度的临床数据稀缺;模型的输出(预测结果)如何与其他临床信息整合、如何呈现等。
“多学科合作是众多困难和问题的最终解决之道。”刘广建进一步分析,最重要的是临床团队、数据团队、信息团队三个团队的配合。临床团队是临床医护人员,可以直接提出问题,然后提供医疗数据及对数据的解释,以及提供专家知识;数据团队可以利用数据进行智能分析、预测建模,开发诊疗软件;信息团队则要思考,怎样把一个新的诊疗工具无缝整合到原有系统,嵌入医生诊疗流程里去,最终保证系统的流畅运行。
刘广建展望,只有三个团队携手合作才能开展起源于临床并高于临床,最终回归临床的研究。通过医工交叉互补合作,最终达到共赢发展的结局,共同打造出一个属于临床研究的“小康生活”。
点击后面链接回看课程:
大数据+AI 的临床科研实践 提升医院核心竞争力 (xiaoeknow.com)
成为我们的
合作伙伴