一笔罕见的早期融资
2026 年 6 月,Recursive Superintelligence(RSI)以 46.5 亿美元估值完成 6.5 亿美元早期融资。领投方是 GV 与 Greycroft,英伟达、AMD 等芯片厂商也参与其中。这家公司刚刚成立,没有产品,没有收入,甚至没有经过公开验证的技术原型,却拿到了通常只属于成熟后期公司的资金体量。
让它获得这种信任的,是团队名单。首席执行官 Richard Socher 是 ImageNet、GloVe 的作者之一,曾创办 MetaMind 和 You.com;田渊栋曾任 Meta FAIR 研究总监,在强化学习与围棋 AI 领域有深厚积累;Alexey Dosovitskiy 是 Vision Transformer(ViT)论文的第一作者;Tim Rocktäschel 曾任 DeepMind 首席科学家,提出 Rainbow Teaming;Josh Tobin 来自 OpenAI,领导过 Deep Research 与 ChatGPT Agents 团队;Caiming Xiong 曾任 Salesforce 研究负责人;Jeff Clune 是 AI 安全领域的先驱,Darwin Gödel Machine 论文的作者之一。这样一张名单,几乎覆盖了当前 AI 研究的关键节点。
RSI 的野心写在名字里:递归超级智能。他们相信,构建能够自动发现知识并递归改进自身的人工智能,是接下来最重要的事情。公司官网的表述更为直接:递归自我改进的超级智能,将用于自动化知识发现。
为什么是现在
过去两年,AI 行业的主流叙事是预训练 Scaling Law。模型越大、数据越多、算力越足,能力就越强。这条曲线确实带来了 GPT-4、Claude、Gemini 等令人印象深刻的产品。但越来越多的人开始意识到,单纯堆叠参数和数据的边际收益正在递减。训练成本指数级上升,而新能力的涌现却不再像早期那样稳定。
RSI 的判断是:需要一条完全不同的发展曲线。预训练让模型学会语言模式和广泛知识,但它并不擅长真正的逻辑推理、科学发现和长期规划。如果 AI 要攻克人类最复杂的定量问题,比如新电池材料、核聚变物理、疾病疗法,它不能只靠记忆已知答案,必须能够提出新问题、设计新实验、验证新假设。
CEO Richard Socher 给出的切入点极其简洁:AI 是代码,而现在 AI 可以写代码。如果 AI 能够编写改进自身的代码,就能形成自我完善的闭环。这不是一个新念头。科幻作品里早已描绘过这种图景。但 RSI 的团队试图把它变成工程问题:如何让系统安全地、可验证地、持续地改进自己的能力。
递归自我改进的工程图景
RSI 描述的系统有几个关键特征。
第一,自主设定实验。系统会主动发现自身在哪些任务上表现不足,然后设计实验去弥补,类似科学家识别知识空白、提出假设、做实验验证的过程。
第二,自我诊断与重写代码。当系统发现局限后,它会修改自己的底层代码库,而不仅是调整参数。这听起来激进,但在软件工程领域已有雏形。自动化机器学习(AutoML)、神经架构搜索(NAS)、代码生成与修复工具,都是这个方向的局部探索。RSI 想把这些局部能力整合成一个持续运转的闭环。
第三,开放式进化。RSI 的灵感来自生物进化。进化没有预设目标,却在数十亿年里不断产生新的解决方案。团队希望把类似的开放端机制引入算法底层,让系统在无边界的问题空间中持续创新。
第四,安全评估与对齐。自我改进能力越强,失控风险越大。RSI 强调 Rainbow Teaming 等持续性安全评估方法,试图在系统能力增长的同时,建立同步进化的安全护栏。
首个目标:5 万名博士
RSI 设定了一个具体但惊人的初始目标:训练出具备 5 万名科研博士同等能力的系统。这个表述当然是一种粗略的比喻,因为不同领域的博士能力很难加总,但它至少说明了两件事:一是 RSI 追求的是通用科研能力,而不是单一任务的最优;二是它要把这种能力先用在 AI 科学本身上。
让机器研究机器,是 RSI 认为最自然的第一步。如果 AI 能自动改进 AI 系统,那么递归加速就发生了。一旦这个引擎运转起来,团队计划把算力引向更广泛的科学问题:加速新药研发、设计下一代电池、攻克核聚变物理、寻找绝症疗法。
这个愿景的吸引力显而易见。人类科研受限于个体寿命、带宽和专业知识。一个能够 7×24 小时运转、跨学科阅读、自动执行实验的自动化科学发现引擎,理论上可以把需要几十年的基础研究压缩到几年甚至几个月。
团队的底气与赌注
RSI 的团队不是纸上谈兵。Richard Socher 在 Salesforce 和 You.com 都有过从研究到产品的完整经历;Tim Rocktäschel 在 DeepMind 领导过开放端学习与多智能体研究;Alexey Dosovitskiy 参与的 ViT 彻底改变了计算机视觉的架构范式;Jeff Clune 的 Darwin Gödel Machine 论文直接探讨了自我改进智能体的理论框架。
这些人选择在这个时候集体创业,说明他们认为技术条件已经成熟到可以押注。芯片算力、模型能力、代码生成工具、自动实验平台,这些基础设施在近几年都有了实质性进展。RSI 想做的,是把它们串成一个递归飞轮。
但资金体量本身也说明这是一场豪赌。6.5 亿美元早期融资意味着投资者按的是一个极端上行场景定价,而非现有产品价值。如果递归自我改进被证明可行,RSI 可能定义下一个时代的 AI 基础设施;如果不可行,这笔钱大部分将用于支付顶尖人才和算力成本,回报率可能极低。
技术路线的硬核问题
递归自我改进的愿景足够宏大,但落地路径上的硬问题一个都不会少。
第一个问题是反馈信号。自我改进需要明确的评估标准。代码能否编译、测试能否通过,是相对容易验证的。但科研能力、创造力、长期规划价值,往往没有快速客观的评分函数。如果系统优化的目标偏离了真正重要的科学问题,它可能只是在某个狭隘指标上自我循环。
第二个问题是泛化边界。一个系统可以改进自己在特定任务上的表现,并不等于它能持续产生通用的新能力。历史上有太多在 benchmark 上自我优化,却无法迁移到真实复杂场景的例子。RSI 需要证明,自我改进带来的是能力扩展,而非只在狭隘指标上内卷。
第三个问题是安全与对齐。自我改进系统的能力增长速度可能超过人类监督者的理解速度。传统的对齐方法假设模型能力基本固定,研究者有时间评估和修正。但在递归改进的场景下,评估框架本身也需要同步进化。Rainbow Teaming 是一种思路,但它能否跟上指数级的能力增长,仍是未知数。
第四个问题是计算成本。递归自我改进需要大量实验、训练与验证。即使算法方向正确,如果没有足够的算力支撑快速迭代,反馈循环也会慢到失去竞争力。英伟达和 AMD 的投资,部分原因正是它们希望这种需求发生在自己的硬件生态上。
与预训练路线的关系
RSI 的路线是对预训练的补充,而非否定。预训练提供了广泛的语言理解、知识储备和模式识别能力,这是递归改进的基础层。但没有外部指导和自我纠错,预训练模型只是在已有知识里插值,难以产生真正的科学发现。
可以把当前 AI 发展想象成两条曲线的交点。一条是规模曲线:更多参数、更多数据、更多算力。另一条是递归曲线:更好的自我改进机制、更高效的实验设计、更强的验证与对齐。RSI 赌的是,第二条曲线将在未来几年成为主要驱动力。
这个判断如果成立,行业格局会发生变化。现在的领先者优势来自数据、算力和用户反馈。但如果 AI 能够自己生成训练数据、自己设计架构、自己验证结果,那么人才密度和算法创新能力将比单纯的资本规模更重要。
冷静看待这场赌局
对 RSI 最公允的评价是:它既不是板上钉钉的下一个 OpenAI,也不是纯粹的科幻炒作。它的团队是真实的,技术方向是学术界长期关注的问题,资金和市场关注度也是真实的。但同时,它的核心承诺——递归自我改进——目前还没有被任何公开系统大规模验证过。
46.5 亿美元估值本质上是对一个可能性的定价,而不是对确定性的定价。这种估值在泡沫期常见,在收缩期罕见。它能拿到这笔钱,说明资本市场仍然愿意为极端技术愿景买单,尤其是当这个愿景由最顶尖的研究者提出时。
对于关心 AI 走向的人来说,RSI 的价值不在于它一定会成功,而在于它把一个问题推到了台面中央:当 AI 能够编写和改进自己的代码时,人类如何确保这个过程是可控的、有益的、指向真正重要问题的。这比任何单一的融资数字都更值得长期关注。
结语
RSI 的出现,标志着 AI 行业正在从“训练更大的模型”转向“设计能自我进化的系统”。这条路线的终点可能是自动化科学发现,也可能是又一个被高估的研究方向。无论结果如何,它都把递归自我改进从一个边缘概念,变成了有资金、有人才、有算力的正式工程尝试。
田渊栋和他的联创们踏上的是同一条船。这条船驶向一片假设中的新大陆,而不是已知海岸。能不能到达,取决于他们能否把“AI 写代码”这个简单起点,扩展成一个真正可持续的自我改进闭环。未来几年,这个行业会密切关注他们的第一次公开验证。
还没有评论,你可以写下第一条。