黄仁勋投资的AI独角兽Sakana AI曝新融资,成立两年多估值超180亿

2025-10-22

智东西10月21日报道,据The Information援引知情人士消息,OpenAI的日本竞争对手Sakana AI将以25亿美元(约合人民币178亿元)的估值筹集1亿美元(约合人民币7亿元),较去年9月15亿美元(约合人民币107亿元)的估值增长了66%。

知情人士透露,Sakana AI正在与美国和日本的投资者进行谈判。筹集到这1亿美元的新资金后,Sakana AI的估值将达到26亿美元(约合人民币185亿元)。该公司计划利用新资金扩大其工程、销售和分销团队,目前公司约有70名员工。

Sakana AI成立于2023年7月,其创始团队背景强大。David Ha是前谷歌大脑高级科学家,还曾领导图像生成模型独角兽Stability AI的研究部门;另一位创始人Llion Jones是Transformer论文作者之一、前谷歌AI研究员。今年8月,David Ha登上了《时代》发布的2025年百大AI人物榜单。

Sakana AI创始人Llion Jones(左)、David Ha(右)

这家初创企业与OpenAI、Anthropic等企业的发展路线不同,它希望抛弃Transformer架构,以自然进化为灵感,降低模型计算成本并提升模型性能。在产品进展方面,该公司已经发布了三款日语模型、江户古风聊天机器人Karamaru以及开源框架ShinkaEvolve。

目前,Sakana AI共获得了近2.3亿美元(约合人民币16亿元)的融资。2024年1月,Sakana AI获得45亿日元(约合人民币2亿元)融资,Lux Capital、Khosla Ventures、日本电信公司NTT以及索尼集团参与投资;去年9月,Sakana AI完成2.14亿美元(约合人民币15亿元)的A轮融资,英伟达参投成为大股东,使其成立一年估值达到约15亿美元(约合人民币107亿元),迅速跻身独角兽行列。

此外,据The Information报道,该公司还获得了日本政府的拨款,用于购买AI训练的计算资源。

Sakana AI在日语中意为鱼,Ha此前告诉The Information,他打算建立一个“日本的DeepMind”。

Ha透露,其算法可以帮助企业自动创建处理语言或图像的大模型,实现方法是在组合、测试和丢弃数据时模仿自然选择的规律,从而减少所需的人工输入量。因为训练大模型需要消耗大量的电力和资源,他希望将训练时间缩短到几天或几周。

具体而言,Sakana AI采用的算法是将三种开源原始AI模型作为“父母”,通过不同方式“养育”超百名“子女”,然后选出表现最优的模型再生成下一代,不断重复这一过程,创造出数百代模型后选出佼佼者。

今年3月,SakanaAI发布了三款日语模型,分别是大语言模型EvoLLM - JP、视觉语言模型EvoVLM - JP和图像生成模型EvoSDXL - JP。

时隔一个月,Sakana AI发布了江户古风聊天机器人Karamaru,这个聊天机器人可以用江户时代的世界观和当时的古代文献来回答用户问题,其训练数据来自该公司从江户时代书籍中建立的包含约2500万个字符的数据集。

今年9月,Sakana AI开源了ShinkaEvolve,该框架将大模型与一种算法相结合,帮助其针对各种潜在问题提出解决方案,并缩小到最相近的问题。该公司声称,与Transformer架构相比,这种方法更高效,更能提出创造性的解决方案。

ShinkaEvolve框架概述

截至目前,Sakana AI已经与多家日本大公司签订了业务协议。

今年5月,它宣布与三菱日联金融集团建立多年合作伙伴关系,为日本最大的银行开发定制AI模型。交易达成后,Ha告诉外媒,这将使Sakana AI在一年内实现盈利;本月早些时候,Sakana AI宣布与日本最大的券商之一大和证券集团建立了类似的合作伙伴关系。

Ha提到,日本每家想要拥有自己基础模型的公司都可以与Sakana AI或其他类似公司合作开发自己的模型,日本仍有成为创新者的空间。

此外,在日本市场,Sakana AI还面临着诸多美国大模型开发商的竞争。

今年2月,OpenAI宣布与软银建立合作伙伴关系,软银同意每年为自己及其子公司花费30亿美元(约合人民币214亿元)购买OpenAI的技术,软银和OpenAI还将成立一家合资企业,专门向日本公司销售OpenAI工具套件;Anthropic在今年8月任命了日本国家负责人,并准备在日本东京开设办事处;今年8月,加拿大大模型创企Cohere聘请了一名日本国家经理。

结语:Sakana AI押注日本本土大模型

Sakana AI与法国大模型创企Mistral AI、印度大模型创企Krutrim类似,希望通过开发自己的大模型,让模型更好地掌握本地语言和文化,以减少对其他AI技术的依赖。Ha认为,对于日本的公司来说,拥有自己的基础模型是有意义的,即使它不是一个超高性能的模型。

但与OpenAI、Anthropic、谷歌等大模型核心玩家相比,Sakana AI这类初创企业在资金和人才实力上相对较弱,需要通过算法等方面的创新来寻找突破路径。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程茜,编辑:云鹏,36氪经授权发布。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com