当前位置: AI资讯 > 内文

AIMS|医疗领域的3类机器学习算法与性能评价

2021-5-20 关键词:临床决策支持(CDSS)

医疗领域进入大数据时代,如何把数据转化为有价值的资产已受到医院高度重视。由于医疗数据过于庞大而复杂,使用传统的数据处理技术难以“挖掘”数据能力,而机器学习算法的进展,使医疗数据的精准分析与价值“激活”有了现实性。近期,一篇发表在AIMS Press的综述论文,对当前处理医疗大数据的机器学习算法,及不同算法模型在心力衰竭、脓毒症等疾病预测上的应用进行了综合分析与评价。

01机器学习算法分类是否有“监督”

医疗数据包括患者的诊断、治疗、检查检验等诊疗全程、全生命周期产生的临床数据,在医院各类临床信息系统的推广应用下,呈现出海量、增速快、多样性等特征。这些数据中包含着大量隐藏的知识,通过有效的数据挖掘,能够为临床、医院管理者提供丰富而有价值的信息,从而进行临床决策、医疗管理等。 

论文作者提到,在医疗大数据挖掘上,面对超过100GB,或是来源广、结构复杂的数据,需要建立大数据架构,进行数据的提取、处理与分析,以解决传统数据库系统的数据处理局限性问题。目前最先进的大数据架构包括Lambda体系结构、SOLID体系结构、模块化软件体系结构等。 

大数据架构可分解为数据源层、采集层、分析与可视化层等层次。机器学习作为人工智能的子领域,处于架构中的分析层,通过从历史数据集中学习“经验”,训练出知识模型,从而对未知数据进行预测。论文作者提到,机器学习算法的三种主要类型为监督学习、无监督学习与强化学习,并表示解决大数据问题还需要其他一些“学习方法”,由此概括出包括深度学习在内的12种机器学习算法,相关分类及示例详细见下表:

http://www.huimei.com/real/img/_@@_16215052228787213.jpg

值得一提的是,机器学习算法三大主要类型,与其他算法有交叉的时候。例如监督学习与无监督学习,判断是否有“监督”,就看纳入训练模型的数据集是否有标注,有即为监督学习,因此深度学习也可包括监督学习与无监督学习。在医疗领域,深度学习发挥着重要作用,通过使用前馈神经网络、卷积神经网络(CNN)和递归神经网络(RNN)等人工神经网络来增加计算量,输出更为准确的疾病分析,从而辅助医生进行医疗决策,减少医疗差错的发生。 

02算法模型性能评价深度学习算法准确性最高98.24%

机器学习的三个关键词是算法、经验、性能,其中“性能”是最重要的,提供高性能下的精准分析也是建立机器学习模型的终极目标。尤其是在医疗领域,机器学习模型推出的结果,或与医疗质量有直接关联性,间接影响着患者安全。因此,需要建立通用的性能度量,来评价不同机器学习模型的性能及应用效果。对此,论文作者将目前机器学习模型的常用性能度量概括为准确性、校准、判别式、阴性预测值、阳性预测值、召回率及特异性这7个,详细见下表:

http://www.huimei.com/real/img/_@@_16215052680129552.jpg

上表对不同性能度量的定义进行了描述,并提供相应的计算公式。例如,准确性(Accuracy)等于模型正确分类的数量(真阳性与真阴性)除以预测总数;校准(Calibration)是衡量模型预测概率与测试数据中观察到的结果的接近程度,如Brier分数;召回率(Recall)等于模型的真阳性分类总数除以数据中阳性类别的数量(真阳性和假阴性)。 

机器学习模型往往是基于某一特定任务建立,比如疾病诊断、风险预测、医疗质量监测等。论文作者从发表于2015年至2020年的机器学习模型应用研究中,以糖尿病、心衰、脓毒症、癌症四大类疾病的相关预测为方向,对17个研究团队的建模技术、纳入研究的数据集或数据源、模型性能等进行了回顾,并概括如下表:

http://www.huimei.com/real/img/_@@_16215052843228712.pnghttp://www.huimei.com/real/img/_@@_16215052955297774.png

由于机器模型性能受数据集、知识规则等因素的影响,不能单纯从17个算法模型的验证结果进行各类算法的数据分析能力排名。但从研究结果来看,人工神经网络在不同的预测任务中均表现出较好的性能。例如,Puja Gupta等利用深度学习-人工神经网络算法建立的乳腺癌预测模型,准确性为98.24%;Yixue Hao等利用卷积神经网络建立的糖尿病预测模型,准确性为94.8%。再次印证了前面所说的深度学习算法能够在医疗领域发挥重要作用。 

参考文献:

https://www.aimspress.com/article/doi/10.3934/bdia.2020005?viewType=HTML

成为我们的

合作伙伴

医院演示预约
提交以下真实信息,我们将尽快联系您