客观日本

“秘密計算”的新应用

2021年03月01日 信息通信

日本是一个科技大国,即使经历了泡沫经济破裂以后“丢失的20年”,在科技领域,尤其是应用技术研发方面,日本依然实力很强。日本的报章在报道新的科技发明时,往往喜欢用“世界首发(日文为“世界初”)”这样的字眼。

最近,千叶大学与NTT Com公司共同推进的“秘密计算深度学习”技术进行临床数据分析研究,据说就是采用了NTT“世界首发”的秘密计算深度学习技术。

那么,秘密计算是一种什么样的技术呢?秘密计算是英语Secure computation的日文对应词,汉语应该是“安全计算”。考虑到安全计算对绝大多数人来说是一个陌生的领域,在该领域日文报道更加频繁,因此,本文直接采用日文的名称。

秘密计算,顾名思义就是在保护数据本身私密性的前提下进行的计算。

譬如,某地区教育局想要统计所管辖的各个高中的国语与数学的平均成绩,但不可以泄露学校、学科与学生姓名这样的隐私信息。这些隐私信息如下图所示,归各个高中独自管理。显然不可以将这样的列表用平文来传送。

title

因此,一种变通的方法就是将各校管理的成绩单数据加密,然后再输入一个“秘密计算系统”进行统计。经过加密的成绩数据上,不可能知道是哪个学校的哪个学生的成绩(见下图)。

title

“秘密计算系统”对加密的成绩数据进行统计后,就可以得到整个地区的各学级与各科目的平均成绩。该事例的“秘密计算”示意图如下。其两个特点为:一、数据的演算在加密状态下进行;二、仅对所需要的演算结果进行解密处理。这样就可以使原始数据的隐秘性得到保护。

title

千叶大学医院,是日本厚生劳动省认定的具有提供高度医疗、技术开发及研修服务的综合医院。该医院临床研究所使用的数据,因为包含私密性高的医疗信息,在数据的收集、保管、分析等方面需要高水平的信息安全。信息共享既要应对趋于对多样化、严重化的安全风险,也要满足多个临床研究设施之间对数据共享的需求。千叶大学与NTT Com公司的合作就是在这样的背景下应运而生。

该研究的目的是实现这样一种机制:即在单一医疗设施只研究病例数限定的稀有疾病,其诊疗信息等临床研究的私密数据对其他设施非公开的同时,建立多个设施都可以参与的“多设施共同研究”的机制。利用“秘密计算系统”,验证从多个设施收集的临床研究数据,在设施之间相互隐藏的状态下能否分析。由此,扩展千叶大学医院的各诊疗科使用多个设施的临床研究数据实施临床研究必要的横向与纵向研究。

title

千叶大学与NTT Com共同研究的系统构成示意图:图片出自千叶大学官网

通过利用“秘密计算深度学习”技术,可以在隐藏从多个设施收集的临床研究数据的状态下制作AI模型,以缩短用以往的方法诊断疾病所需要的时间。另外,还可以制作辅助处方药剂选定的AI模型,根据患者的状态开出最合适的药剂,从而进行抑制病情进展的研究。

从千叶大学医院的事例可以看出,秘密计算可以做很多应用。凡是一个计算任务需要用到来自多个参与者的数据,而各个参与者又不愿意(或不允许)交换或公开数据,这时,秘密计算就可派上用场。

医疗部门是涉及个人隐私较多的地方,譬如对目前收治的新冠肺炎感染者的治疗,如果我们想根据病人的各项信息训练一个模型,预测未确诊者感染新冠肺炎的概率,又要保护受诊者的隐私,那么这项工程就可以应用“秘密计算深度学习”技术。

此外,信贷、金融、拍卖等涉及私密信息较多的业务都可以应用“秘密计算深度学习”技术,以解决既要保护隐私又要共享数据的两难问题。

秘密计算并不是一种新鲜的技术,日本的很多通信公司如NEC、富士通从通信安全的角度,早就在研究该技术。但是,将秘密计算与AI的深度学习相结合并不见诸报道。所以NTT Com的“世界首发”还是有一定的含金量的。

随着DX(数字革新)的推广,“秘密计算与深度学习”或许会开拓一片新的应用。

供稿 / 戴维(文中图片除千叶大学官网以外,皆为作者制作)
编辑修改:JST客观日本编辑部