近日,日本文部科学省编制完成了题为“AI带来的科学技术与创新的变革”的2024年版《科学技术创新白皮书》,并获得了日本政府内阁会议的批准。白皮书以特集形式介绍了AI(人工智能)技术在日本的普及状况、研发动向,以及在各领域使用AI的可能性。书中还提示了目前面对的课题,展望了日本社会与AI共生的前景。
生成式AI技术取得发展,或将引发“第4次浪潮”
2024年版《科学技术与创新白皮书》的封面和封底。由Manga Designers Lab公司提供创意、设计并绘制(供图:文部科学省)
白皮书如往年一样分为两部分,6月11日获得了内阁批准。第1部分采用了每年切入点都会变化的特集报道形式,继2022年版日本的研究能力问题、2023年版地方城镇发起的科技创新事例之后,今年的白皮书聚焦于AI。在概述技术发展史的基础上,介绍了日本国内外的动向、通过灵活运用AI将为社会与科学带来的新冲击。
白皮书在第1部分的开篇,概述了AI的现状。去年,日本国内AI系统市场的规模相较上一年增长了34.5%。还有预测称,到2028年之前将以年均30%的速度增长。白皮书指出,AI的发展将助推现行的第6期科学技术与创新基本计划,通过创新实现人人都能舒适地发挥积极作用的社会。白皮书还指出了存在的课题,即“如何才能做到不只是简单地引进技术,而能够将技术与整个社会的创新结合起来,构建社会与技术的共生关系”。
白皮书在第1章回顾了AI技术的发展过程。介绍了自1955年美国研究人员使用“AI”一词以来,随着技术和方法的发展,AI领域已出现过3次“浪潮”。2010年左右起,得益于机器学习技术等科技的发展,第3次热潮持续至今,随着图像生成、对话式AI等“生成式AI”技术的发展,AI领域正在迎来“第4次浪潮”。
美国Open AI公司开发的“Chat GPT”就是一种对话式生成式AI。用户可以在互联网上使用英语和日语等自然语言来利用它,并且由于超大规模学习的进步和准确性的提高,这种AI技术迅速普及到了一般民众中。根据文本信息生成图像的图像生成式AI也面世。
随着AI的发展,也出现了一些需要克服的问题。例如,AI学习的数据和计算资源的增加导致了耗电量增加。此外,对话式生成式AI仅能从统计学的角度预测下一个单词,在不理解对话含义时就做出回应,因此不擅长基于数学计算或物理定律的预测类逻辑推理。为解决这些问题,新一代AI的研发已经启动。
存在信息错误、价值观和偏见的风险——应采取措施
白皮书第2章介绍了日本的AI研发状况。介绍了基于日本政府2022年4月编制的“AI战略2022”所实施的举措实例。
目前以Chat GPT为首,能够利用大量数据和深度学习技术生成人们日常所说语言的“大规模语言模型”的开发,在全球范围内方兴未艾。另一方面,日语能力较强的模型尚少,同时部分企业的垄断现状也令人担忧。为此,日本正在推进高级日语处理模型的开发。日本经济产业省也已经启动支援计算资源等举措。
日本还实现了研究机构与产业界的计算资源共享、计算资源开发及使用环境的构建。日本理化学研究所的超级计算机“富岳”等被积极用于AI技术的开发和深度学习计算。AI与超级计算机的结合使得大规模数据分析和模型学习成为可能。开发日语的大规模语言模型,充实日本及日语相关的数据库至关重要。
另一方面,大规模语言模型已被指出存在生成看似正确实为错误信息的“幻觉(hallucination)”问题,存在将包含价值观、偏见和偏向性的学习数据反映到结果中的风险。日本政府的AI战略会议指出,AI存在机密信息泄露、个人信息不当使用、犯罪巧妙化、错误信息引发社会混乱等风险。
在此背景下,日本政府于今年2月成立了致力于标准制定等工作的专门机构“AI安全研究所”。日本总务省和经济产业省制定了运营商指导方针。总务省的研讨会还在讨论应对包括生成式AI和深度伪造(Deep fake)技术风险在内的综合性措施,以便在今年夏季前后汇编成册。
支持确保AI的透明性和可靠性的技术开发也在取得进展。例如,结合外部信息搜索的“搜索扩展生成”技术能够使输出结果提供明确的依据。此外,日本还在开发降低图像识别AI错误识别风险的技术,以及在保护隐私的同时分析包含个人信息的学习数据的机制。白皮书还提到了培养具备AI知识和技能人才的举措。
白皮书的第3章概述了全球趋势和国际合作情况。在美国,拜登政府2023年7月至9月间宣布,15家研发AI的企业已承诺采取基于安全、安保和可靠性三项原则的自主措施。同年10月,美国规定了构成重大安全风险的基础模型开发者有报告其安全评估情况的义务。此外,白皮书还介绍了英国、EU(欧盟)、德国、法国、意大利、加拿大、中国和新加坡的举措。
去年,日本作为G7轮值主席国主导了AI领域的政策讨论。在同年5月G7广岛峰会等会议成果的基础上,日本提出了讨论生成式AI各项课题的框架“广岛AI进程”。同年12月,包含国际准则和行为规范的“广岛AI进程综合政策框架”最终定稿,并获得了七国集团领导人的批准。
科研用途所需的“透明性”与“保密性”
白皮书在第4章中结合实例介绍了能使科学研究加速的AI“AI for Science”。从去除观测数据噪声等的“科学数据的改良和信息提取”、有助于新药开发等的“模拟的高度化和加速化”、协助家务和护理的机器人所需的“实时预测和控制”、有助于形成超越人类认知极限和偏向性(偏见、先入观)发现的“科学假设生成和推理”、能够灵活应对各种条件的“实验和研究室自主化”等多个方面,介绍了AI的应用潜力。
为了进一步利用AI,理化学研究所等机构正在推进基础模型和算法(步骤、程序)的开发。日美合作方面也取得了进展。日本科学技术振兴机构(JST)的战略创造研究推进事业,从2021年度开始,在“以数据驱动、AI驱动为中心的数字化转型引发的生命科学研究革新”研究领域公开征集项目,至今已采纳并支援了17项研究课题。
使用量子计算机的研究也在加速进行。大规模语言模型不仅被应用于自然语言,也开始应用于让AI大量学习氨基酸序列等生命科学的研究之中。
随着AI使实验和模拟更加高效,研究人员专注于课题设置和研究计划变得十分重要。
白皮书还指出了在科学研究中使用AI所面临的挑战。例如,确保AI模型和学习数据的透明性变得很重要。书中认为,由于AI不一定对内容负责,学术期刊不应承认AI为论文作者,此外,也不应使用AI生成的图像。几乎所有AI模型都使用用户的指令和提问内容作为训练材料,因此也存在对信息保密性的担忧。另外,白皮书还介绍了围绕AI与版权、专利的争议。
白皮书在第5章中介绍了AI被政府机构和企业积极使用的事例。同时还指出,虽然AI正在成为人们熟悉的技术,但认识其复杂性、“黑盒性”(机制不透明),以及恶意使用的风险等,开展素养教育使人们采取负责任的行为至关重要。
白皮书的第2部分总结了日本政府上一年度推进的科学技术与创新振兴措施,并加入了 “2024年能登半岛地震研发成果应用事例”“地方公设试验研究机构的技术开发和海外知识产权保护”“近年元科学运动的传播”等多项专栏内容。
白皮书的封面和卷首插图描绘了模仿神经细胞的角色和蒲公英的种子,代表AI在各个研究领域得到运用,创造和推广了新的价值和知识。
卷首插图。描绘了AI在各个研究领域得到运用,创造和推广了新的价值和知识。由Manga Designers Lab公司提供创意、设计并绘制(供图:文部科学省)
原文:长崎绿子/JST Science Portal 编辑部
翻译:JST客观日本编辑部
【相关链接】
·日本文部科学省 科技创新白皮书
·日本内阁府 第6期科技创新基本计划