客观日本

NICT开发出新翻译系统,能瞬间区分并语音输出8国语言

2018年10月26日 信息通信
日本语

日本信息通信研究机构(NICT)开发了能瞬间区分出包括中文及韩语在内的8国语言,并将其翻译成目标语言后语音输出的系统。谷歌提供的语音翻译APP虽然也具备同样的功能,但只支持用户预选的4种语言。NICT表示,将把新系统安装到NICT开发的免费公开的多语种语音翻译APP“VoiceTra”上,同时还将提供给民营企业,支援实现产品化。

能瞬间识别8国语言并进行语音翻译的系统

能瞬间识别8国语言并进行语音翻译的系统(图片由日本信息通信研究机构提供)

NICT的自动语音翻译研究始于1986年。之前采用的重视语言规则(语法)的方法未能取得成功,后来凭借收集大量范文的统计翻译方法开辟了新路,而且还采用了结合大量对译数据和深度学习法的神经元翻译方法,由此翻译的精度和速度得以大幅提高。目前正在免费公开的多语种语音翻译系统“VoiceTra”是全球最先进的多语种语音翻译系统。合计能翻译31种语言,23种语言支持语音输入,其中17种语言能语音输出。

“VoiceTra”已经被NICT授权的各企业加工成多种产品和服务。10月19日,JR东海公司宣布将陆续在东海道新干线的全部17个车站设置能用日语接待外国游客的便携翻译机。预计11月底之前合计将设置约350台,这些日本企业制造的便携翻译机也有一部分配备“VoiceTra”的翻译功能。

不过,现行的“VoiceTra”对用户来说有不方便的一面。那就是与外国人对话时,需要先设定对方的语言。但在实际的现场,单凭初次见面的外国人说的一句话,很难知道对方讲的是哪种语言。而新开发的系统只需输入时长约为1.5秒的短句子,就能在0.15秒左右的时间内迅速识别出是哪种语言。识别率超过90%。与外国人交流时,即使不进行语言设定,大部分情况下也能听到后被立即翻译成日语语音,用日语回答的内容也能自动翻译成对方语言。

NICT的多语种语音翻译系统之所以能迅速发展,主要得益于2014年启动的国家项目“全球交流计划”。该项目把举办东京奥运会和残奥会的2020年设为目标年。以NICT为中心,参与该项目的企业还包括日本国内的机电和电子厂商、通信企业及媒体等众多企业,为实现让包括观众和选手在内的访日外国人不受困于语言障碍的社会,有关方面一直在努力提高多语种语音翻译系统的易用性,并在旅游景点、交通机构、商店、医院等各种场所和设施普及多语种语音翻译系统。

多语种语音翻译系统的社会应用示例

多语种语音翻译系统的社会应用示例(图片取自总务省“全球交流计划”)

利用新系统能实现日本、英国、中国、韩国、泰国、缅甸、越南、印度尼西亚8个国家的流畅对话,这8种语言被指定为“全球交流计划”中优先实现的语言。

文 小岩井忠道 JST客观日本编辑部

相关链接
信息通信研究机构新闻发布 “可实时识别8种语言,无需进行语言设定” [网址]
JR东海新闻发布 “关于在东海道新干线车站设置便携翻译机” [PDF]
信息通信研究机构、SourceNext新闻发布 “‘POCKETALKⓇW’采用‘VoiceTra’的语音翻译技术” [网址]
“全球交流计划” [网址]

相关报道
2018年05月10日“NEC与JTB试验为访日外国人提供新款语音翻译向导” [网址]