科学研究 - 【日本AI的明天】东京能否成为AI开发的全球据点——专访迅速崛起的“Sakana AI”创始人伊藤錬

2023年，AI初创公司Sakana AI（总部位于东京都港区）在东京成立。作为一家在日本创立的公司，该公司以最快的速度成为了“独角兽”公司（估值超过10亿美元的未上市企业）。Sakana AI推出了一系列颠覆常识的创新成果，包括利用演化方法整合开源AI模型的“进化模型合并（Evolutionary Model Merge）”技术，以及将机器学习领域的研究从构思到论文撰写实现自动化的“AI科学家”（AI Scientist）等。

这家充满传奇色彩的初创公司，由三人共同创立，他们分别是来自金融行业并跻身世界级AI研究人员之列的首席执行官（CEO）David Ha、曾任职于谷歌公司并作为大规模语言模型（LLM）基础论文的8位作者之一的首席技术官（CTO）Llion Jones，以及曾在外务省工作、随后转型为多家初创企业高管的首席运营官（COO）伊藤錬。

这家公司是如何连续取得的成果的？我们向连日来频频接受媒体采访、进行主题演讲的伊藤先生询问了如何在东京创造吸引AI开发人才之路的见解。

Sakana AI联合创始人兼COO伊藤錬在东京都内举办的活动中介绍“AI科学家”（2024年12月6日，JST摄影）

不是“海外和日本”，而是“美国西海岸和其他地区”

——Sakana AI成立短短数月，就在“进化模型融合”等领域取得了极具影响力的重要成果。来自海外的研究人员似乎是贵公司的中流砥柱，如何让顶尖研究人员来到日本的呢？

创业之初，许多海外投资者经常担忧：“日本能否吸引到人才？”但事实上，我们成功吸引了海外的优秀研究人员来到日本。这或许得益于日本依然保留着“科技国家”的形象，以及“只要做出好东西就会被使用的国家”的感觉。

在AI研究中，美国无疑走在最前沿，因此我们每天都在思考日本应该如何做。至少关键不是以“海外与日本”的角度来思考问题，而是要以“美国西海岸与其他地区”的角度来思考。在硅谷吸引了大量人才的情况下，有一定数量的研究人员希望在其他地区从事研究。放眼全球，谷歌DeepMind设立基地的英国伦敦、逐渐聚集了Mistral等AI企业的法国巴黎、坐拥Cohere等企业的加拿大多伦多等地，正逐渐成为硅谷之外的选项。

Sakana AI于2024年初公布了所开发的新型基础模型构建方法“进化模型融合（Evolutionary Model Merge）”的概念图。通过将现有模型相乘来构建新一代模型，实现了与从零开始构建大型模型相当的精度（供图：Sakana AI）

开发能力和用例是关键

东京能否成为硅谷之外的选项之一？这不仅仅取决于常提到的“城市魅力”和“宜居性”，更关键的是这里“是否有想在那里工作的有趣的AI公司”。在这方面，比起进行专门针对日语和日本特有课题的开发，更重要的是提供能够扩展到日本以外的地区，且能展示出不同于其他AI公司的有趣课题。打造“不过是刚好位于日本，但拥有世界级技术的企业”才是关键，而我认为，这是可以做到的。

日本也拥有优秀的AI研究人员，Sakana AI也已经吸纳了一些人才，但是这个层面仍有提升的空间。出于以国家安全保障的原因，“必须开发国产AI”的话题经常被提及，但最重要的事情是拥有开发AI的能力（capability）。要在日本构建起开发能力，关键在于孕育出全球水准的企业。同时，“人”也是产生吸引力的重要因素。正是因为CTO Llion Jones在日本，所以第二、第三个Llions才会随之而来。我认为打造这样的连锁效应是关键所在。

在政策方面，我们期待的是不遗余力地创造“用例（应用事例）”。参考其他国家政府的扶持方案，与补贴、各种活动或税制相比，政府亲自导入AI的有效性更加显著。例如，将AI用于签证审查的荷兰便是一个优秀案例。这不仅有助于AI的发展，更重要的是能够感受到“AI在行政中可被应用”，从而提升社会整体的AI素养。这将使得AI被更多地运用在社会中，从而最终产生更高的效果。

伊藤錬（JST拍摄）

与潮流不同，但不会过分偏离潮流的“愿景”

——Sakana AI之所以能如此迅速地取得较大的成果，除了因为拥有顶级研究人员的加入，经营方面也是否有秘诀呢？

当然，公司在项目管理方面下了功夫，但重要的是“愿景管理（Vision Management）”。所谓愿景管理，是指在掌握当前趋势的基础上，提出“稍有不同但不至于过于不同（different but not too different）”的方向。

例如，从2024年年中开始，AI模型通过数据和计算资源的堆积来提升性能的趋势逐渐放缓，而通过让模型之间进行对话来提高“推理（Reasoning）”能力的方向成为新趋势。此外，也有人认为，到2025年，AI控制个体基础模型的“代理（Agent）”时代将正式来临。

我们从一开始就对“AI模型越大越好”（the bigger，the better）的倾向持怀疑态度，并且比其他人更早地展开了对“代理（agent）”和“推理”的研究。但这里的“早”并不是三年，而是提前“半年”的感觉。我们捕捉大家正在关注的内容，同时稍早一步展开不同方向的探索。

“Sakana AI”公司的LOGO徽标。它象征了公司高效融合世界上庞大开源资源的“集合知识”方法（供图：Sakana AI）

三位联合创始人平衡分工不同职责

当然，没有一种方法是保证能成功的，因此我们用“投资组合” 的思路进行管理。在Sakana AI，我们三位共同创始人每天都在思考“哪些领域将会是下一个风口”。然后，我们会从海外引入能够实现这些愿景的人才。如果我们认为有10个领域可能会发展起来，就为每个领域招募一名专家，让他们尝试。只要其中一个领域成功，就足够了。

——这是否意味着需要能够制定愿景、凝聚人心的领导者？

确实如此。与美国OpenAI等公司不同，我们会提出“略显另类但又不过于离奇”的愿景，从而引起员工的兴趣。此外，我们展示“Sakana AI的愿景是正确的”成功案例，进一步增强公司的凝聚力。

需要注意的是，AI模型的全新开发方法等“研发愿景”与如何解决全球课题等“应用案例愿景”是截然不同的。试图强行将两者结合起来是常见的错误做法。如果找不到好的应用案例，整个AI行业都会弥漫失望情绪。从这个意义上来说，应用案例固然极其重要，但仅仅关注应用案例，可能会扼杀诺贝尔奖级研发的萌芽。因此，我们三位联合创始人通过分工合作，在保持平衡的同时推进各项业务。

Sakana AI的三位联合创始人，左起为CEO Ha、CTO Jones、COO伊藤（供图：Sakana AI）。

开源极其重要

——自2024年12月起，您被东京都任命为政府的“AI战略会议”的7位委员之一，对此，您有什么感想呢。

我曾在外务省任职，因此心中怀有“让日本再次被称为科技强国”的愿望。海外对日本的认知是一个拥有随身听、家用游戏机等技术发达的国家。正因为如此，我才希望能够再次实现日本的“技术强国梦想”。

同时，Sakana AI是一家主张开源的公司。开源是一个“给予与回报（Give and Take）”的世界。无论是“进化模型融合”还是“AI科学家”，我们所取得的每一项成果都用到了他人创造的东西。因此，我们在迅速公开研发成果进行“给予”方面也不遗余力。这是因为，让社会认同“让他们使用我创造的东西会带来好处”是极其重要的。

同样，东京这座城市也是我们的外部环境和生态系统。通过“AI战略会议”等机会，我们也希望能够为这个生态系统做出贡献。

伊藤錬
Sakana AI联合创始人（COO）
2001年毕业于东京大学法学部，后进入日本外务省工作。曾在日本驻美国大使馆任职，在外务省期间，参与了有关日美安保和《欧盟-日本经济伙伴关系协定》的签署谈判，也曾担任首相翻译官。2011年进入世界银行工作。2015年加入Mercari公司，担任执行役员（负责全球业务）。2022年加入英国Stability AI公司担任COO，2023年联合创办Sakana AI。2024年12月成为东京都“AI战略会议”委员。通过与美国英伟达公司及多家日本企业的合作，推进利用自然界原理开发的基础模型。2004年完成纽约大学法学院课程，2005年完成斯坦福大学研究生院课程。现为纽约州律师、纽约大学法学院高级研究员。同时还担任美欧三边委员会委员。

原文：丸山隆一/自由撰稿人/JST Science Portal 编辑部
中文：JST客观日本编辑部

【相关链接】
・Sakana AI：“AI科学家：迈向AI自行研究的时代”
・Sakana AI：“通过进化模型融合赋予视觉语言模型新能力支持多图像处理的日语视觉语言模型公开”
・东京都：“关于召开AI战略会议”

日语原文