这些数据问题解决好了,临床研究才能过上“小康生活”

2021-11-2

过去,临床研究在小数据背景下开展,通常是为了某一项科研专门收集几个或几十个变量,范围很小,维度也很少;医疗大数据发展起来后,数据体量暴增、维度膨胀,加上人工智能(AI)技术的高速发展,会给如今的临床研究带来什么变化?

广东省人民医院医学大数据研究中心副主任刘广建在“医管必修课”上详解了临床数据集成、临床数据向科研数据转化;AI在临床研究中的应用目的和趋势等内容,并强调构建临床科研一体化闭环转化服务平台,由临床团队+数据团队+信息团队携手打造临床研究的“小康生活”。

01

从临床数据到科研数据,需要做什么

临床研究是以患者为主要研究对象,以疾病的诊断治疗、预后病因等为主要研究内容的科研活动。临床研究在患者中开展,研究结果离转化也非常近,可以直接回答临床实践过程中遇到的问题。

完成一项临床研究需要6个步骤:提出临床问题;制定科学问题;进行研究设计;采集研究数据;分析挖掘数据;最终形成研究报告(论文/专利等),其中与数据相关的就有2项。

“目前针对临床,已经能采集包括患者信息、检验检查、病理、组学等在内的全维度、多模态、较完整的大数据,对不断积累的数据资产加以科学研究、利用,有可能实现更为个性化的精确诊疗。”刘广建表示。但实现这一目标的前提所需要完成数据相关工作,如临床数据集成;临床数据向科研数据转化等仍面临很多困难,基于真实世界临床数据的研究也的确面临不少挑战:

http://www.huimei.com/real/img/_@@_16358468936928885.jpg

因此,刘广建表示,数据相关工作的第一步是临床数据集成。目前现状是,HIS、EMR、PACS、LIS等临床信息系统由不同厂家在不同时期建设,系统间通过不同的数据接口连接。怎样把同一位患者在院内产生的所有数据从头到尾理顺整合,这是院内数据问题。

如果想开展多中心研究,还需要诸如国家疾病登记报告系统、各种智能传感器数据等外部数据。怎样把形形色色的数据全部纳入同一个临床数据集,需要做工作是:首先进行数据抽取、整合、清洗,然后进行数据转换,形成医疗数据湖,其目的是把所有数据真正集合起来。有了医疗数据湖,才能进一步进行临床服务、科研服务、管理服务、统计服务等各种工作。

当然,有了集成数据,还并不能直接为临床研究所用,还需要完成临床数据向科研数据的转化。因为临床数据是离散的,非结构化的数据点,就像杂乱无章的一堆火柴头;需要把临床数据集中进行结构化处理,再依据一定规范整合成集中的、结构化的科研数据块;下一步,从可进行科研的数据块里,针对研究目的,提取出要用的特征数据,进行多维度、正则化清洗,形成可量化、可深度分析、可建模的数据元。

总的来说,目前既有的临床数据治理及利用模式,是从面向临床诊疗实践,无特定研究目的原始数据出发,首先进行数据清洗、整合,形成集成数据;当有了一定的研究目的,则继续在专科层面抽取特有数据,形成研究数据库;当研究目的更具体时,则做进一步抽取、清洗,形成具体研究数据。就这样,经过逐步抽取、清晰,完成临床研究所需数据的整理准备工作。

刘广建表示,目前很多医院已经有比较成熟的临床数据中心(CDR,Clinical Data Repository),可以把院内不同角落的数据整合起来。但当我们以更宏大的视角去审视时,当前医疗大数据在集成、应用方面还面临着不小的挑战:

http://www.huimei.com/real/img/_@@_16358469017932571.jpg

上图中四个方面既是目前医疗大数据集成应用面临的挑战,也是发展的方向和必须要解决的问题。他表示,好在国家层面“已有所布局”。

02

AI促使临床研究更加精准化、个性化

有了医疗大数据的蓬勃发展作为基础,AI应用于临床研究的最根本目的是,根据多个预测因子(数据、特征等)预测临床结果。当前,几乎每个医学领域、临床专业都在开发基于AI的工具,以期实现与人类水平相当或更高的诊疗和预后预测能力。

在医疗大数据、AI大发展背景下,临床研究领域也形成了新范式——把统计分析、机器学习、深度学习,加上专家系统、知识图谱,以及有限元分析、试验方法等因素和方法整合起来,可以解决临床研究中面临的大多数问题。

“这是我们发现医疗大数据、医学AI给临床研究带来的更精准化的影响。”刘广建说,传统的统计学分析,只能解决危险因素对整个人群的影响,但不能做到个性化、精准化地分析危险因素度对每一个体的影响作用和作用程度。有了大数据、AI后,更多的是可以在个体层面做个性化、精准化的诊断治疗、预后预测等。

当然,AI技术能够通过不断分析挖掘数据来逼近真相,但在临床应用中也存在局限性:

http://www.huimei.com/real/img/_@@_16358469097187995.jpg

怎么解决?“我觉得最重要的是,不管技术多先进,数据规模多大。想要运用到临床,就必须回归临床研究的本质,真正做对患者有用、有益的研究,避免把临床研究、医疗大数据、人工智能变成技术秀场。”刘广建说。

03

构建临床科研一体化闭环转化服务平台

“要让大数据+AI技术更好地服务于临床研究工作,最终解决方案是构建一个临床科研一体化平台。平台既服务于临床,又服务于科研,同时又能够把科研成果及时转化到临床中应用,最终形成一个临床科研一体化的闭环转化服务平台,包括科研问题的产生、数据的采集、统计检验/分析建模,以及不同类别模型的训练等环节。

构建一体化平台会面临诸多困难,比如临床环境会发生数据错误、缺失等非常多意外情况;高质量、大规模、多中心、多维度的临床数据稀缺;模型的输出(预测结果)如何与其他临床信息整合、如何呈现等。

“多学科合作是众多困难和问题的最终解决之道。”刘广建进一步分析,最重要的是临床团队、数据团队、信息团队三个团队的配合。临床团队是临床医护人员,可以直接提出问题,然后提供医疗数据及对数据的解释,以及提供专家知识;数据团队可以利用数据进行智能分析、预测建模,开发诊疗软件;信息团队则要思考,怎样把一个新的诊疗工具无缝整合到原有系统,嵌入医生诊疗流程里去,最终保证系统的流畅运行。

刘广建展望,只有三个团队携手合作才能开展起源于临床并高于临床,最终回归临床的研究。通过医工交叉互补合作,最终达到共赢发展的结局,共同打造出一个属于临床研究的“小康生活”。

点击后面链接回看课程:

大数据+AI 的临床科研实践 提升医院核心竞争力 (xiaoeknow.com)

成为我们的

合作伙伴

医院演示预约
提交以下真实信息,我们将在一个工作日内联系您
*姓名
*部门
*医院名称
*手机号

即刻预约