表1 患者特征
研究者采用梯度提升(XGBoost)与逻辑回归2种分类算法创建了预测模型,然后使用预测模型、指南推荐的变量2种方法,分别多维度评估患者的生存期:一是按照使用数据的时间段,分为使用治疗前数据(预处理数据)、使用治疗数据与使用所有数据3种维度;二是按肺癌类型,分为肺癌患者、非小细胞肺癌(NSCLC)、小细胞肺癌(SCLC);三是将患者划分为所有患者、随访时间≥18个月的患者。由此得出36个AUC值(表2)。
总体而言,使用CDSS预测肺癌患者生存期的AUC值均≥0.7,其中SCLC患者的预测AUC值最高,高达0.96;而使用指南预测的AUC值均低于0.7(图1),且与CDSS预测结果相反,在SCLC患者的预测中获得了0.42的最低AUC值。造成这种结果的原因之一在于两种方法使用的变量数目不同,例如,肺癌患者治疗前的评估,预测模型自动从患者数据中提取了13种变量进行分析,而使用指南的变量仅有肺癌分期、组织学2种。
图1 使用CDSS与使用指南得出的预测结果
CDSS vs 指南预测
绝大多数结果比较具有统计学意义
研究者对研究结果进行统计分析,发现CDSS的预测AUC值与使用指南获得的AUC值相比,绝大多数具有统计学意义。例如,所有肺癌患者在治疗前使用指南预测的生存期的AUC为0.60,而CDSS的预测能力将AUC提高到0.84(P=0.0009;图2)。
相反,将所有肺癌患者与仅随访时间较长(≥18个月)的患者进行比较时,AUC值没有显著差异。此外,使用肺癌患者治疗前数据、治疗数据与所有数据进行预测时,得出的AUC值之间也没有显著差异。说明对于肺癌患者的生存期预测,影响结果的主要是预测手段的选择,反映CDSS预测性能的稳定性。
由于这是一项前瞻性研究,研究者可随着患者的治疗周期发展不断纳入新数据,使预测模型应用更接近临床环境。另外,在研究期间,有229名患者(42%)活着,314名患者(58%)死亡,其中仅18%患者接受了手术,手术后30天内死亡的为30人。因此,研究者认为这不适用于挖掘手术死亡率的危险因素。
研究者最后指出了该研究的几个局限性:一是这项多中心研究仅包括2个医疗机构的数据;二是AUC是最常用的度量指标,但它的解释经常受到质疑,建议使用额外的指标评估CDSS性能;三是主要使用特定肺癌患者数据训练预测模型(多为不可手术的III期肺癌患者)。即使如此,研究者仍认为结果证明CDSS可辅助临床循证决策,毕竟一个模型不会发展成完美而永久的,关键是动态、有用。
参考资料:
Pontes B, Núñez F, Rubio C, et al. A data mining based clinical decision support system for survival in lung cancer. Rep Pract Oncol Radiother. 2021;26(6):839-848. Published 2021 Dec 30. doi:10.5603/RPOR.a2021.0088.
成为我们的
合作伙伴