客观日本

日本团队利用超算“富岳”开发大语言模型

2024年05月13日

20240513_k2_01.jpg
图为日本超级计算机“富岳”。摄于神户市的理化学研究所计算科学研究中心。(共同社)

【共同社5月11日电】东京工业大学、理化学研究所、富士通等的团队10日发布消息称,运用超级计算机“富岳”独立开发了日语能力出色的生成式人工智能(AI)基础技术“大语言模型”。不仅企业与大学可下载使用,公众也可通过富士通官网试用。

除了欧美与中国,日本的大学和企业也在推进大语言模型的开发。此次利用包括富岳在内的国产技术,还独立汇总了用于学习的日语数据。该团队认为,能够消除海外模型被指“使用哪些数据如何开发存在不透明”的担忧。

该团队从互联网文本数据库中甄选高质量的日语文本。使用“富岳”推进AI学习,用不到1年时间完成开发。据称,特点是能够自然地处理敬语和以日本文化为背景的对话。

被称为“图形处理器”(GPU)的半导体适用于生成式AI开发,但美国英伟达等海外企业占据了大部分份额,无法满足全世界的需求。富岳不使用GPU,团队此次优化了软件,把中央处理器(CPU)的计算速度提高至6倍,展示了使用国产超算也能开发生成式AI。(完)