NEC(日本电气株式会社)于3月25日宣布,为推动医疗数据的二次利用,成功利用生成式AI及医疗信息专业知识,生成了规模达15万人的医疗合成数据。该数据为反映了日本人统计学特征的虚拟患者数据集。NEC将通过把该数据转换为符合国际医疗数据分析通用标准的“OMOP”格式,并与合作机构及伙伴企业进行评估,验证未来医疗的数据二次利用流程,同时确认研究过程的有效性。
图1 实验概要图(供图:NEC)
检查结果、处方内容以及医疗费(医疗费用明细)等各类医疗数据的应用,可分为用于个人治疗与健康管理的一次利用,以及用于医学研究与药物研发的二次利用两种形式。
欧洲现已出台《欧洲医疗健康数据空间规则(EHDS)》,正在持续推进搭建统一的数据流通与应用基础设施。在日本,政府及科研机构紧跟国际趋势,也在加速推进医疗等数据的二次利用的相关探讨。
然而,尽管日本此前已开展过各种二次利用的相关研究,但各医疗机构的数据格式与编码体系并不统一,将其整理至可供分析状态的“预处理”工作耗时巨大,一直是一大课题。
此外,医疗数据一直在各医疗机构与研究项目中独立封闭存储,难以开展跨国数据协同应用,这也是一个课题。再加上真实数据的使用涉及严格的隐私保护与审批流程,这也成为阻碍研发加速推进的一大因素。
此次,NEC围绕未来医疗数据二次利用平台的建设,开展了一项涵盖大规模医疗合成数据生成、数据适配国际通用标准“OMOP”的格式转换,以及模拟真实研究流程的实证研究。
在实证实验中,通过将AI学习与合理性检验相结合,在不需使用真实患者信息的情况下,成功地在短时间内合成了能够再现日本人统计学特性(年龄构成、性别比例、病史等)的、规模达15万人的模拟医疗数据。
同时,研究人员还生成了模拟不同数据源的合成数据,例如医疗费数据、DPC数据(符合诊断群分类制度医院向厚生劳动省报送的住院医疗相关数据)、处方FHIR数据(依照国际标准HL7 FHIR结构化呈现处方信息的数据)等,并将这些数据统一转换至OMOP格式,最终确认了跨多个数据源进行综合分析的可能性。
此外,为验证其在科研一线的实际应用价值,研究团队联合行业专家,围绕三项核心科研课题,评估了转换为OMOP格式的数据是否能够应用于实际研究流程。
在日本各都道府县地方公务员的应用案例中,分析了居家疗养支援介入对终末期癌症患者减少院内死亡及达成居家临终的影响。
在急诊医学研究者的应用案例中,针对因急性心肌梗死(AMI)入院并接受PCI(经皮冠状动脉介入手术)的患者,验证了相较于工作日,接受PCI手术的日期为周末或节假日的患者,心力衰竭再入院风险的差异。
在医疗政策效果分析人员的应用案例中,统计了老年人长期使用安眠药与抗焦虑药,以及多药联用的合理用药趋势。
上述实证实验结果表明,经该研究转换的数据与OMOP标准的匹配率达到98%,并成功构建了各研究所需的有效分析环境。同时,实验得以先行验证未来将实际医疗等数据转换为通用标准的流程。此外,实验结果也证明了利用医疗合成数据进行数据关联分析,以及提前验证了研究人员需求的有效性。
未来,NEC将探讨把本次实证中获得的技术方案,应用于各类医疗数据的二次利用基础平台中,以此推动安全、高水平医疗数据应用,助力医学研究的发展与国民健康水平的提升。
原文:《科学新闻》
翻译:JST客观日本编辑部

