通过云技术来确保科学数据分析所需计算资源的做法正在加速之中。美国亚马逊网络服务公司(AWS)等IT巨头提供的云技术,可以不受场所限制进行超级计算机级别的运算。到2050年,所有的研究人员基本都可以不必顾虑计算资源,全身心地投入研究。
正在检查用低温电子显微镜拍摄的蛋白质图像(供图:日本高能加速器研究机构)
“计算速度提高了六倍,成本降低了60%”,日本高能加速器研究机构(KEK)结构生物学中心主任千田俊哉如此介绍与AWS合作导入云技术获得的成果。
为了研发新药,该中心于2018年导入了检查蛋白质结构的“低温电子显微镜”设备,并向合作的大学以及企业开放。
低温电子显微镜需要解析大量的图像,而一些研究机构缺乏计算资源,只好从其他研究机构借用超级计算机等设备,但“用户集中时,排队等上一个月的情况也不少见。”(千田主任) 而对拥有超级计算机的研究机构而言,维护工作和人员费用也成了一种负担。
能够解决这些问题的正是云技术。AWS将CPU(中央处理器)和GPU(图形处理器)等大量使用的计算资源放在云端,通过互联网提供超级计算机级别的计算能力。
以往由于CPU能力 不足,该服务仅限于企业的服务开发等小规模计算用途。2021年起,日本高能加速器研究机构(KEK)与美国亚马逊网络服务公司(AWS)合作,开始提供研究机构等也可以轻松利用的高速计算环境。
例如,过去分析一个蛋白质的结构需要一至两周的时间,约17万日元的费用。引入该技术后,所需时间缩短至一至两天,几乎不需要排队等待。而且由于不需要维护,分析成本已降至约5万日元。近期目标是将成本进一步降至2万日元。
云技术的应用范围广阔,日本产业技术综合研究所也在利用AWS的云技术进行人工智能(AI)的研究。该技术具备由于可高速进行数据学习数据的能力,AI性能的提高大为大提高了人工智能的性能。“美国和欧洲也在国家层面营造创造利用云技术的环境,加速在各种研究中更好地利用云技术的动向在加速”(日本亚马逊网络服务公司执行董事宇佐见潮)。美国微软和谷歌也在充分利用云计算来提供高速计算的环境。
在计算速度方面排名世界第一的日本理化学研究所的超级计算机“富岳”,也开始对应支持云服务技术。超级计算机通常每5至7年就需要更新,更新期间研究工作就会停顿下来。另一方面,而在基于云技术的计算环境中,CPU等虽然也要频繁更新,但可以通过使用其他CPU确保了冗余性。
在自然科学领域,“数据驱动型”的研究的越来越重要性不断提升。这是一种通过分析大量数据来寻找确立新假设的方法。如果能够减少分析成本和劳动力,就有可能在全世界连续取得划时代的成果。
需要注意信息避免泄露信息
云服务相关主要动向及未来展望 | |
1997年 | 美国南加州大学Ramnath Chellappa教授首次提出云概念 |
2006年 | 时任美国谷歌CEO的埃里克·施密特在发言中提及云技术,引起世界瞩目 |
2006年 | 美国亚马逊公司开始向企业提供云服务(AWS) |
2008年 | 美国谷歌公司开始提供云服务 |
2010年 | 美国微软公司开始提供云服务 |
2021年 | 日本高能加速器研究机构在AWS上成功构筑了高速分析蛋白质结构的方法 |
2040年左右 | 通过云服务处理研究数据的研究机构将成为主流 |
2050年左右 | 所有的研究人员都可以不必顾虑计算资源而可全身心投入研究 |
云技术的便利性以及新冠疫情导致的居家办公情况的增加,全世界对云技术的需求越来越大。企业调查公司IDC日本(东京都千代田区)的调查数据表明,2026年,日本云计算市场规模将达到10万9381亿日元,将是2021年的2.6倍,在云端处理的研究数据的用途预计也将大幅增加。另一方面,随着云端使用量服务利用量的剧增,随之而来的是对非法连接还存在未经授权访问等而导致造成信息泄露等的问题的担心。
根据趋势科技公司的数据,2021年,日本公布的云端和网站发生的信息泄露事件时间有156起,比2020年增加了约58%。云端的信息泄露主要是系统本身存在漏洞以及访问权限的错误设置等导致了外部可以查看到这些云端信息。
就研究数据而言,其本身很少直接具备货币金钱价值,因此,“部分数据的泄露并不会马上造成全部研究内容的公开泄露”(千田)。然而,许多研究机构的研究有许多开发的技术可以转用于化为国家项目支持的技术或者武器开发。一旦发生信息泄露,其损失可能是巨大的。所以尽管利用云服务技术有很高的便利性,但也需要充分必须注意防止信息的泄露。
日文:三隅勇气、《日经产业新闻》,2022年9月2日
中文:JST客观日本编辑部