靠谱的AI模型必须具备……

靠谱的AI模型必须具备……

2019-06-17

每个人一生大约要产生1100TB 健康医疗数据,医疗机构每日产生的数据以 TB 级速度增长。大数据是一个强有力的改善医疗质量和患者安全的工具,一些基于机器学习、深度学习、神经网络和其他人工智能策略的临床决策支持算法模型,正是有了大数据挖掘和自主学习能力,在准确性方面与人类专家取得了不相上下甚至更优的成绩。

医疗信息的数字化程度越来越高,实时的患者数据变得更加广泛可用,随着可用性的提高,利用AI算法管理和监测医疗质量成为现实。但仅仅获取、集成数据并不是万能的,数据质量不佳、来源众多、出口分散、结构化差等,成为当下数字医院建设和医疗AI应用的重要障碍。

大数据应用挑战:不完整、不一致性突出

国际核心期刊 JMIR 发表的一项研究表明,不恰当的使用实时数据来提高患者安全和临床决策支持可能会导致数据质量问题和影响工作流程。

研究指出,EHRs中存在相同的内容(记录)包含多个不同的数据元素。“多个位置相似的数据可能会方便不同用户,但也会导致数据的不完整性(需要提取两个数据源但只拿回一处数据元素)和不一致性(相同内容的不同数据元素相互冲突)。”研究小组说。

比如,记录某一临床事件的时间值数据元素,可能某一位置的记录表示“事件的文档时间”,另一位置则记录了“事件实际发生的时间”。

为了解决这一问题,一方面,研究人员建议使用数据可视化工具,更好地对患者的全景数据进行刻画展示,并为不同角色的临床工作人员提供不同维度的查询分析权限。

另一方便,不精确或不准确的元数据标签可能导致不正确的假设和解释,解决这种关键信息缺失或被忽略的问题,需要算法团队、技术分析师和临床专家共同协作来“理解”数据,将数据转化为有效的知识,并理解数据知识化表示的流程和技术系统。

靠谱AI模型:基于标准化、实时数据

在人工智能世界里,算法的内部工作极其复杂,用户所谓的“黑匣子”理论其实很难避免。但要如何让用户在怀疑和信心之间找到平衡?研究人员认为,必须对算法的准确性、客观性和可靠性建立一个坚实的信任基础,改善实时数据的使用将发挥重要作用。

“算法、硬件和软件——所有这些都可能存在漏洞,需要修补。重要的是,围绕这一点展开合作将是我们所有人都必须对彼此抱有的向前迈进的期望。”研究人员表示,或许任何人在一定技术背景下都可创建一个算法,但大型、海量、多维度的患者全景数据集对于创建更加准确的机器学习模型,和验证AI结果的准确性至关重要。

在大数据多源异构性突出的情况下,利用自然语言处理等建立临床数据与标准数据的正确映射,是获取可靠、标准、真实数据的重要手段。

最后,研究人员强调,这份报告意在开启对话,并让人们认识到,处理实时数据并不像在概念上那么容易。我们可以设想许多方法来提高我们在这一领域的知识和能力,把数据转化为服务更精确诊断、更好医疗质量的工具。

成为我们的合作伙伴

信息提交
姓      名
所在地区
单位名称
手  机  号

提交

感谢您的关注,我们会尽快与您取得联系!