关键词: 临床智能体
DeepSeek等大模型以强大的理解能力和推理能力,在医疗领域展现出巨大的应用潜力。然而,医疗行业具有高度的专业性和复杂性,直接应用通用大模型容易出现“幻觉”等问题,导致推理结果出现错误。近期,各大医院、院校等机构相继推出智能体,从实际应用场景出发,让大模型能够在提升诊疗工作效率和质量方面发挥切实作用。
CDSreport此前分享了病情分析、鉴别诊断、MDT和病历生成等智能体的应用场景和建设过程。然而,智能体的建设并非一蹴而就,而是需要不断剖析场景,在建设之初即明确目标,才能发挥智能体最大价值。作为诊疗工作的“第一责任人”,临床医生在构建智能体的过程中扮演着至关重要的角色。若临床医生能在智能工具的辅助下,快捷、自由地创建个性化智能体,或是转变传统质量管理模式,并成为提升平均医疗水平和推进个性化诊疗模式建设的关键步骤。本文梳理了智能体构建的四个步骤,旨在帮助临床医生更有效地掌握自建智能体方法,为大模型的落地提供支持。
场景定义:从痛点中提炼智能体核心使命
智能体的设计需要以解决真实临床问题为出发点,因此找到最适合大模型解决的诊疗“痛点”是第一步也是最关键的一步。2024年11月印发的《卫生健康行业人工智能应用场景参考指引》明确指出84个场景,从宏观层面给医疗行业的AI建设锚定了具体类别。而智能体的应用场景则需要在这些类别内,从微观层面将临床和管理工作进行拆分,聚焦在日常诊疗工作的每一个细节。
在确定智能体场景时,医生可以结合专科特色和工作实际,从多个维度梳理需求。例如:
重复性工作场景,包括病历文书生成、检查报告解读、医嘱核对等环节。这些场景往往耗时较多,但大部分时间医生都在做难度较低且区别较小的工作。
知识密集型场景,包括罕见病诊断、多学科会诊支持等。这个场景大多需要医生检索大量患者病历或医学文献等资料,但服务的患者数量往往较少。
基本诊疗服务场景,包括分级诊疗中的同质化服务、全科医学在专科方面的欠缺等。
重复性工作场景,包括病历文书生成、检查报告解读、医嘱核对等环节。这些场景往往耗时较多,但大部分时间医生都在做难度较低且区别较小的工作。
知识密集型场景,包括罕见病诊断、多学科会诊支持等。这个场景大多需要医生检索大量患者病历或医学文献等资料,但服务的患者数量往往较少。
基本诊疗服务场景,包括分级诊疗中的同质化服务、全科医学在专科方面的欠缺等。
以临床常见的危重病症——急性肾损伤(AKI)为例,其早期识别和干预对患者的预后至关重要。传统AKI风险评估主要依赖于医生的经验和手动计算,但该种方式效率较低且容易遗漏高风险患者。基于临床现状,某三甲医院肾脏内科医生通过惠每临床智能体平台的智能体自建工具,将建设目标聚焦在以自动、快速识别AKI患者为目标建设AKI风险评估智能体,实现对全体患者的实时扫描和风险评估。
知识库构建:构建高质量智能体基石
知识是智能体的灵魂,决定了智能体的表现上限。在确定智能体建设方向和目标后,医生需要整理相关的医学知识和训练素材,包括病历文书、医学文献等,以此保障大模型推理时能够学习相关医学专业知识、丰富的临床经验以及医生诊疗习惯等。
需要注意的是,该过程需要保证知识获取的可读性。例如病历文书需要进行结构化处理,并将症状、诊断结果、治疗过程等关键信息进行提取;医学文献需要转换为可读取的格式,使大模型能够掌握前沿医学知识。
在AKI风险评估智能体的建设过程中,医生首先纳入了目前主流的KDIGO标准进行定义,并将AKI评估分为三个阶段,每个阶段均有明确的血肌酐(SCr)和尿量指标。然后,医生将此标准纳入到智能体知识库中,允许大模型在工作流程中进行调用。
工作流设计:体现医生临床诊疗思维
工作流设计和配置是智能体建设的核心,该过程决定了智能体的每个工作步骤,同时也体现了临床医生的诊疗思路。智能体的核心在于“任务-模型-流程”的精准匹配,要实现该过程需要在流程编排、模型选型上下功夫。
在流程编排方面,医生首先需要明确智能体介入的阈值。例如,当初诊意见与指南差异超过一定比例时,自动触发智能体复核程序;患者检验结果中的某几项均超过正常值,智能体将被触发并将其纳入特定患者群体。
其次,医生需要将复杂诊疗过程拆解为可自动化环节,包括鉴别诊断、病情评估、形成治疗方案等。
最后,在每个执行步骤时,医生需要根据不同的任务选择效率和准确性最高的基础大模型,包括通用模型和垂直模型。
同样以AKI风险评估智能体为例,医生基于AKI计算方法,在智能体中归结出不同作用的节点,其中包括3个关键步骤:
数据输入:智能体实时集成患者的病历信息、检验检查结果(如血肌酐、尿量等)、医嘱信息等。
模型构建:基于大模型的推理能力和医学知识库,构建AKI风险评估模型。模型会根据患者的血肌酐变化、尿量、血压等指标,计算AKI的风险等级(低风险、中风险、高风险)。
实时计算:系统对所有住院患者进行实时扫描,计算每位患者的AKI风险评分。
在模型选择方面,医生通过操作LLM计算节点,分别对比了DeepSeek-r1和Qwen 2.5等模型,通过比对输出结果的准确性、稳定性和效率等维度,选择了综合效果最佳的模型。
效果验证:从准确性评估到临床落地
智能体的效果验证是正式上线前的最后一步。通过收集其在诊断、治疗建议等方面的数据和结果,以及与专家诊断结果进行比对分析,医生可以评估智能体的准确性、可靠性等指标。在效率提升方面,可以通过时间成本或资源利用率的改变,反映智能体的作用,例如医生病历书写时间从40分钟缩减至10分钟内。必要时,还可以要求大模型输出推理链,以验证智能体的可解释性。
在AKI风险评估智能体搭建完成后,医生需要收集大量病历以测试智能体应用效果。该过程包括对患者数量的统计,对低、中、高风险患者数量及比例统计,医生对高风险患者处理情况统计等。医生基于这些数据,可以综合分析智能体应用效果,并以此进行调整和优化。
智能体的应用场景需要紧密围绕诊疗工作,医生自建智能体是最贴近“痛点”的创建方式,相信该种方式将在越来越多智能体发挥作用的同时得到肯定和借鉴。
想了解更多产品信息或预约产品演示?我们的专业团队随时为您服务