DeepSeek系列模型硬件需求对比。来源:CSDN
不同参数的模型需要对应部署相应算力才能满足日常诊疗工作需要,真正用于提升诊疗质量和效率。如果医院已经部署相应服务器,则需要根据算力配置选择能够支持的模型参数,进而完成训练、微调和应用等工作。
结合应用场景:不同部署策略体现智慧化建设布局
根据各家医院已经公布的完成DeepSeek本地化部署和应用的信息,目前大模型在医院中的应用大多围绕决策支持、病历生成、知识检索等。不同场景的应用决定了计算量和同时使用人数的不同,这也是医院部署硬件时需要着重考虑的重要参考指标。
例如,在分析患者病情时,大模型需要调用患者病历信息,并根据训练和优化过程调用数据库相关医学知识,同时思考分析步骤并推理分析结果。该过程的结果更加依靠训练数据和知识库,对于模型推理能力和计算量需求不算太高,应用14B或32B即可满足推理需要。如果是面向患者的分诊、预问诊等功能,可能存在同时使用人数较多的情况,则需要硬件设备具备高“并发路数”的能力。
CDSreport发现,目前医院部署算力硬件设施的策略各不相同。有的医院部署了32B、14B等体量相对较小的模型,应用场景聚焦在诊疗工作或管理工作中的某一个单一领域,更关注实用性和性价比;有的医院部署了满血版DeepSeek和高算力硬件设施,尽管初步实现的功能也仅限于某一类场景,但为未来智能体部署和功能拓展保留了空间,具备更高的可拓展性;有的医院采用“大模型+小模型”部署策略,针对算力需要不同部署相适应的硬件设施,具备更好的灵活性和稳定性。
综合来看,医院采用的硬件设施部署策略来源于对应用场景的规划,而不同的侧重点则体现了医院对于智慧医院建设的整体布局。
结合预算成本:用技术实现“花小钱办大事”
为满足不同参数模型对于算力的需求,硬件设施的部署也存在较大的差异。例如,7B模型仅使用配置较高的个人电脑即可运行,预算成本仅需1-2w元;而671B的满血版DeepSeek则需要进行服务器集群式建设,成本动辄在7位数。医院常常因此在效果与成本之间纠结,一方面碍于有限的预算成本,另一方面担心小参数模型无法满足使用。
此前,CDSreport分享过模型参数与应用场景的关系,发现模型参数并非“越高越好”,只有最适合应用场景、进行有针对性的优化和微调的模型才能发挥最好的效果,实现“花小钱办大事”。
例如,将大模型应用于病历质量控制工作,不仅需要大模型能够获取并理解病历前后文本,还能准确指出病历中存在的问题。该过程不仅对大模型推理能力有较高的要求,还要能够深入临床场景和质控体系,并建设相应的知识库和规则库,发挥事中质控和多级质控等作用。而利用临床决策支持系统(CDSS),大模型不仅解决了病历信息不完整的问题,保障了病历信息的完整性,还能够通过与医生的交互,在诊疗过程和病历书写过程中辅助医生、质控人员和管理人员及时发现并修正病历缺陷,落实多级质控体系。
在模型的优化方面,如何用更低参数的模型实现更高的推理效果是各家医院和医疗AI厂商共同追求的目标,越来越多的成功案例正逐步显现效果。以惠每医疗大模型Copilot为例,经过研发团队在DeepSeek-R1 32B模型上的训练和优化,其病历质控智能体的准确性已经达到了满血版DeepSeek的水平,但部署成本仅为1/5,为医院的大模型本地化部署提供了更多选择。
成为我们的
合作伙伴