客观日本

【日本AI的明天】东京能否成为AI开发的全球据点——专访迅速崛起的“Sakana AI”创始人伊藤錬

2025年03月07日 信息通信

2023年,AI初创公司Sakana AI(总部位于东京都港区)在东京成立。作为一家在日本创立的公司,该公司以最快的速度成为了“独角兽”公司(估值超过10亿美元的未上市企业)。Sakana AI推出了一系列颠覆常识的创新成果,包括利用演化方法整合开源AI模型的“进化模型合并(Evolutionary Model Merge)”技术,以及将机器学习领域的研究从构思到论文撰写实现自动化的“AI科学家”(AI Scientist)等。

这家充满传奇色彩的初创公司,由三人共同创立,他们分别是来自金融行业并跻身世界级AI研究人员之列的首席执行官(CEO)David Ha、曾任职于谷歌公司并作为大规模语言模型(LLM)基础论文的8位作者之一的首席技术官(CTO)Llion Jones,以及曾在外务省工作、随后转型为多家初创企业高管的首席运营官(COO)伊藤錬。

这家公司是如何连续取得的成果的?我们向连日来频频接受媒体采访、进行主题演讲的伊藤先生询问了如何在东京创造吸引AI开发人才之路的见解。

title

Sakana AI联合创始人兼COO伊藤錬在东京都内举办的活动中介绍“AI科学家”(2024年12月6日,JST摄影)

不是“海外和日本”,而是“美国西海岸和其他地区”

——Sakana AI成立短短数月,就在“进化模型融合”等领域取得了极具影响力的重要成果。来自海外的研究人员似乎是贵公司的中流砥柱,如何让顶尖研究人员来到日本的呢?

创业之初,许多海外投资者经常担忧:“日本能否吸引到人才?”但事实上,我们成功吸引了海外的优秀研究人员来到日本。这或许得益于日本依然保留着“科技国家”的形象,以及“只要做出好东西就会被使用的国家”的感觉。

在AI研究中,美国无疑走在最前沿,因此我们每天都在思考日本应该如何做。至少关键不是以“海外与日本”的角度来思考问题,而是要以“美国西海岸与其他地区”的角度来思考。在硅谷吸引了大量人才的情况下,有一定数量的研究人员希望在其他地区从事研究。放眼全球,谷歌DeepMind设立基地的英国伦敦、逐渐聚集了Mistral等AI企业的法国巴黎、坐拥Cohere等企业的加拿大多伦多等地,正逐渐成为硅谷之外的选项。

title

Sakana AI于2024年初公布了所开发的新型基础模型构建方法“进化模型融合(Evolutionary Model Merge)”的概念图。通过将现有模型相乘来构建新一代模型,实现了与从零开始构建大型模型相当的精度(供图:Sakana AI)

开发能力和用例是关键

东京能否成为硅谷之外的选项之一?这不仅仅取决于常提到的“城市魅力”和“宜居性”,更关键的是这里“是否有想在那里工作的有趣的AI公司”。在这方面,比起进行专门针对日语和日本特有课题的开发,更重要的是提供能够扩展到日本以外的地区,且能展示出不同于其他AI公司的有趣课题。打造“不过是刚好位于日本,但拥有世界级技术的企业”才是关键,而我认为,这是可以做到的。

日本也拥有优秀的AI研究人员,Sakana AI也已经吸纳了一些人才,但是这个层面仍有提升的空间。出于以国家安全保障的原因,“必须开发国产AI”的话题经常被提及,但最重要的事情是拥有开发AI的能力(capability)。要在日本构建起开发能力,关键在于孕育出全球水准的企业。同时,“人”也是产生吸引力的重要因素。正是因为CTO Llion Jones在日本,所以第二、第三个Llions才会随之而来。我认为打造这样的连锁效应是关键所在。

在政策方面,我们期待的是不遗余力地创造“用例(应用事例)”。参考其他国家政府的扶持方案,与补贴、各种活动或税制相比,政府亲自导入AI的有效性更加显著。例如,将AI用于签证审查的荷兰便是一个优秀案例。这不仅有助于AI的发展,更重要的是能够感受到“AI在行政中可被应用”,从而提升社会整体的AI素养。这将使得AI被更多地运用在社会中,从而最终产生更高的效果。

title

伊藤錬(JST拍摄)

与潮流不同,但不会过分偏离潮流的“愿景”

——Sakana AI之所以能如此迅速地取得较大的成果,除了因为拥有顶级研究人员的加入,经营方面也是否有秘诀呢?

当然,公司在项目管理方面下了功夫,但重要的是“愿景管理(Vision Management)”。所谓愿景管理,是指在掌握当前趋势的基础上,提出“稍有不同但不至于过于不同(different but not too different)”的方向。

例如,从2024年年中开始,AI模型通过数据和计算资源的堆积来提升性能的趋势逐渐放缓,而通过让模型之间进行对话来提高“推理(Reasoning)”能力的方向成为新趋势。此外,也有人认为,到2025年,AI控制个体基础模型的“代理(Agent)”时代将正式来临。

我们从一开始就对“AI模型越大越好”(the bigger,the better)的倾向持怀疑态度,并且比其他人更早地展开了对“代理(agent)”和“推理”的研究。但这里的“早”并不是三年,而是提前“半年”的感觉。我们捕捉大家正在关注的内容,同时稍早一步展开不同方向的探索。

title

“Sakana AI”公司的LOGO徽标。它象征了公司高效融合世界上庞大开源资源的“集合知识”方法(供图:Sakana AI)

三位联合创始人平衡分工不同职责

当然,没有一种方法是保证能成功的,因此我们用“投资组合” 的思路进行管理。在Sakana AI,我们三位共同创始人每天都在思考“哪些领域将会是下一个风口”。然后,我们会从海外引入能够实现这些愿景的人才。如果我们认为有10个领域可能会发展起来,就为每个领域招募一名专家,让他们尝试。只要其中一个领域成功,就足够了。

——这是否意味着需要能够制定愿景、凝聚人心的领导者?

确实如此。与美国OpenAI等公司不同,我们会提出“略显另类但又不过于离奇”的愿景,从而引起员工的兴趣。此外,我们展示“Sakana AI的愿景是正确的”成功案例,进一步增强公司的凝聚力。

需要注意的是,AI模型的全新开发方法等“研发愿景”与如何解决全球课题等“应用案例愿景”是截然不同的。试图强行将两者结合起来是常见的错误做法。如果找不到好的应用案例,整个AI行业都会弥漫失望情绪。从这个意义上来说,应用案例固然极其重要,但仅仅关注应用案例,可能会扼杀诺贝尔奖级研发的萌芽。因此,我们三位联合创始人通过分工合作,在保持平衡的同时推进各项业务。

title

Sakana AI的三位联合创始人,左起为CEO Ha、CTO Jones、COO伊藤(供图:Sakana AI)。

开源极其重要

——自2024年12月起,您被东京都任命为政府的“AI战略会议”的7位委员之一,对此,您有什么感想呢。

我曾在外务省任职,因此心中怀有“让日本再次被称为科技强国”的愿望。海外对日本的认知是一个拥有随身听、家用游戏机等技术发达的国家。正因为如此,我才希望能够再次实现日本的“技术强国梦想”。

同时,Sakana AI是一家主张开源的公司。开源是一个“给予与回报(Give and Take)”的世界。无论是“进化模型融合”还是“AI科学家”,我们所取得的每一项成果都用到了他人创造的东西。因此,我们在迅速公开研发成果进行“给予”方面也不遗余力。这是因为,让社会认同“让他们使用我创造的东西会带来好处”是极其重要的。

同样,东京这座城市也是我们的外部环境和生态系统。通过“AI战略会议”等机会,我们也希望能够为这个生态系统做出贡献。

title

伊藤錬
Sakana AI联合创始人(COO)
2001年毕业于东京大学法学部,后进入日本外务省工作。曾在日本驻美国大使馆任职,在外务省期间,参与了有关日美安保和《欧盟-日本经济伙伴关系协定》的签署谈判,也曾担任首相翻译官。2011年进入世界银行工作。2015年加入Mercari公司,担任执行役员(负责全球业务)。2022年加入英国Stability AI公司担任COO,2023年联合创办Sakana AI。2024年12月成为东京都“AI战略会议”委员。通过与美国英伟达公司及多家日本企业的合作,推进利用自然界原理开发的基础模型。2004年完成纽约大学法学院课程,2005年完成斯坦福大学研究生院课程。现为纽约州律师、纽约大学法学院高级研究员。同时还担任美欧三边委员会委员。

原文:丸山隆一/自由撰稿人/JST Science Portal 编辑部
中文:JST客观日本编辑部

【相关链接】
・Sakana AI:“AI科学家:迈向AI自行研究的时代
・Sakana AI:“通过进化模型融合赋予视觉语言模型新能力 支持多图像处理的日语视觉语言模型公开
・东京都:“关于召开AI战略会议

日语原文