递归超级智能：46.5亿美元赌局与AI自我进化路线

返回文章列表

技术沉思

Feature Essay

递归超级智能：46.5亿美元赌局与AI自我进化路线

田渊栋离开 Meta 后与 Richard Socher 等创立 RSI，目标是构建能自动发现知识并递归改进自身的人工智能。6.5 亿美元早期融资背后，是对预训练之外新曲线的真实押注。

2026-06-16 21:30 北京时间 18 分钟难度：进阶

28 阅读 0 点赞

快速答案

RSI 以 46.5 亿美元估值获 6.5 亿美元融资，赌的是让 AI 递归改进自身代码。这条路线补位预训练 Scaling Law，也把验证与安全问题推得更尖锐。

创始团队涵盖 ViT、Rainbow Teaming、Darwin Gödel Machine 等核心工作的作者。
核心方法是让 AI 自主设计实验、发现局限并改写自身代码，形成改进闭环。
首个目标是训练出相当于 5 万名博士研究能力的系统，从 AI 科学本身入手。

一笔罕见的早期融资

2026 年 6 月，Recursive Superintelligence（RSI）以 46.5 亿美元估值完成 6.5 亿美元早期融资。领投方是 GV 与 Greycroft，英伟达、AMD 等芯片厂商也参与其中。这家公司刚刚成立，没有产品，没有收入，甚至没有经过公开验证的技术原型，却拿到了通常只属于成熟后期公司的资金体量。

让它获得这种信任的，是团队名单。首席执行官 Richard Socher 是 ImageNet、GloVe 的作者之一，曾创办 MetaMind 和 You.com；田渊栋曾任 Meta FAIR 研究总监，在强化学习与围棋 AI 领域有深厚积累；Alexey Dosovitskiy 是 Vision Transformer（ViT）论文的第一作者；Tim Rocktäschel 曾任 DeepMind 首席科学家，提出 Rainbow Teaming；Josh Tobin 来自 OpenAI，领导过 Deep Research 与 ChatGPT Agents 团队；Caiming Xiong 曾任 Salesforce 研究负责人；Jeff Clune 是 AI 安全领域的先驱，Darwin Gödel Machine 论文的作者之一。这样一张名单，几乎覆盖了当前 AI 研究的关键节点。

RSI 的野心写在名字里：递归超级智能。他们相信，构建能够自动发现知识并递归改进自身的人工智能，是接下来最重要的事情。公司官网的表述更为直接：递归自我改进的超级智能，将用于自动化知识发现。

为什么是现在

过去两年，AI 行业的主流叙事是预训练 Scaling Law。模型越大、数据越多、算力越足，能力就越强。这条曲线确实带来了 GPT-4、Claude、Gemini 等令人印象深刻的产品。但越来越多的人开始意识到，单纯堆叠参数和数据的边际收益正在递减。训练成本指数级上升，而新能力的涌现却不再像早期那样稳定。

RSI 的判断是：需要一条完全不同的发展曲线。预训练让模型学会语言模式和广泛知识，但它并不擅长真正的逻辑推理、科学发现和长期规划。如果 AI 要攻克人类最复杂的定量问题，比如新电池材料、核聚变物理、疾病疗法，它不能只靠记忆已知答案，必须能够提出新问题、设计新实验、验证新假设。

CEO Richard Socher 给出的切入点极其简洁：AI 是代码，而现在 AI 可以写代码。如果 AI 能够编写改进自身的代码，就能形成自我完善的闭环。这不是一个新念头。科幻作品里早已描绘过这种图景。但 RSI 的团队试图把它变成工程问题：如何让系统安全地、可验证地、持续地改进自己的能力。

递归自我改进的工程图景

RSI 描述的系统有几个关键特征。

第一，自主设定实验。系统会主动发现自身在哪些任务上表现不足，然后设计实验去弥补，类似科学家识别知识空白、提出假设、做实验验证的过程。

第二，自我诊断与重写代码。当系统发现局限后，它会修改自己的底层代码库，而不仅是调整参数。这听起来激进，但在软件工程领域已有雏形。自动化机器学习（AutoML）、神经架构搜索（NAS）、代码生成与修复工具，都是这个方向的局部探索。RSI 想把这些局部能力整合成一个持续运转的闭环。

第三，开放式进化。RSI 的灵感来自生物进化。进化没有预设目标，却在数十亿年里不断产生新的解决方案。团队希望把类似的开放端机制引入算法底层，让系统在无边界的问题空间中持续创新。

第四，安全评估与对齐。自我改进能力越强，失控风险越大。RSI 强调 Rainbow Teaming 等持续性安全评估方法，试图在系统能力增长的同时，建立同步进化的安全护栏。

首个目标：5 万名博士

RSI 设定了一个具体但惊人的初始目标：训练出具备 5 万名科研博士同等能力的系统。这个表述当然是一种粗略的比喻，因为不同领域的博士能力很难加总，但它至少说明了两件事：一是 RSI 追求的是通用科研能力，而不是单一任务的最优；二是它要把这种能力先用在 AI 科学本身上。

让机器研究机器，是 RSI 认为最自然的第一步。如果 AI 能自动改进 AI 系统，那么递归加速就发生了。一旦这个引擎运转起来，团队计划把算力引向更广泛的科学问题：加速新药研发、设计下一代电池、攻克核聚变物理、寻找绝症疗法。

这个愿景的吸引力显而易见。人类科研受限于个体寿命、带宽和专业知识。一个能够 7×24 小时运转、跨学科阅读、自动执行实验的自动化科学发现引擎，理论上可以把需要几十年的基础研究压缩到几年甚至几个月。

团队的底气与赌注

RSI 的团队不是纸上谈兵。Richard Socher 在 Salesforce 和 You.com 都有过从研究到产品的完整经历；Tim Rocktäschel 在 DeepMind 领导过开放端学习与多智能体研究；Alexey Dosovitskiy 参与的 ViT 彻底改变了计算机视觉的架构范式；Jeff Clune 的 Darwin Gödel Machine 论文直接探讨了自我改进智能体的理论框架。

这些人选择在这个时候集体创业，说明他们认为技术条件已经成熟到可以押注。芯片算力、模型能力、代码生成工具、自动实验平台，这些基础设施在近几年都有了实质性进展。RSI 想做的，是把它们串成一个递归飞轮。

但资金体量本身也说明这是一场豪赌。6.5 亿美元早期融资意味着投资者按的是一个极端上行场景定价，而非现有产品价值。如果递归自我改进被证明可行，RSI 可能定义下一个时代的 AI 基础设施；如果不可行，这笔钱大部分将用于支付顶尖人才和算力成本，回报率可能极低。

技术路线的硬核问题

递归自我改进的愿景足够宏大，但落地路径上的硬问题一个都不会少。

第一个问题是反馈信号。自我改进需要明确的评估标准。代码能否编译、测试能否通过，是相对容易验证的。但科研能力、创造力、长期规划价值，往往没有快速客观的评分函数。如果系统优化的目标偏离了真正重要的科学问题，它可能只是在某个狭隘指标上自我循环。

第二个问题是泛化边界。一个系统可以改进自己在特定任务上的表现，并不等于它能持续产生通用的新能力。历史上有太多在 benchmark 上自我优化，却无法迁移到真实复杂场景的例子。RSI 需要证明，自我改进带来的是能力扩展，而非只在狭隘指标上内卷。

第三个问题是安全与对齐。自我改进系统的能力增长速度可能超过人类监督者的理解速度。传统的对齐方法假设模型能力基本固定，研究者有时间评估和修正。但在递归改进的场景下，评估框架本身也需要同步进化。Rainbow Teaming 是一种思路，但它能否跟上指数级的能力增长，仍是未知数。

第四个问题是计算成本。递归自我改进需要大量实验、训练与验证。即使算法方向正确，如果没有足够的算力支撑快速迭代，反馈循环也会慢到失去竞争力。英伟达和 AMD 的投资，部分原因正是它们希望这种需求发生在自己的硬件生态上。

与预训练路线的关系

RSI 的路线是对预训练的补充，而非否定。预训练提供了广泛的语言理解、知识储备和模式识别能力，这是递归改进的基础层。但没有外部指导和自我纠错，预训练模型只是在已有知识里插值，难以产生真正的科学发现。

可以把当前 AI 发展想象成两条曲线的交点。一条是规模曲线：更多参数、更多数据、更多算力。另一条是递归曲线：更好的自我改进机制、更高效的实验设计、更强的验证与对齐。RSI 赌的是，第二条曲线将在未来几年成为主要驱动力。

这个判断如果成立，行业格局会发生变化。现在的领先者优势来自数据、算力和用户反馈。但如果 AI 能够自己生成训练数据、自己设计架构、自己验证结果，那么人才密度和算法创新能力将比单纯的资本规模更重要。

冷静看待这场赌局

对 RSI 最公允的评价是：它既不是板上钉钉的下一个 OpenAI，也不是纯粹的科幻炒作。它的团队是真实的，技术方向是学术界长期关注的问题，资金和市场关注度也是真实的。但同时，它的核心承诺——递归自我改进——目前还没有被任何公开系统大规模验证过。

46.5 亿美元估值本质上是对一个可能性的定价，而不是对确定性的定价。这种估值在泡沫期常见，在收缩期罕见。它能拿到这笔钱，说明资本市场仍然愿意为极端技术愿景买单，尤其是当这个愿景由最顶尖的研究者提出时。

对于关心 AI 走向的人来说，RSI 的价值不在于它一定会成功，而在于它把一个问题推到了台面中央：当 AI 能够编写和改进自己的代码时，人类如何确保这个过程是可控的、有益的、指向真正重要问题的。这比任何单一的融资数字都更值得长期关注。

结语

RSI 的出现，标志着 AI 行业正在从“训练更大的模型”转向“设计能自我进化的系统”。这条路线的终点可能是自动化科学发现，也可能是又一个被高估的研究方向。无论结果如何，它都把递归自我改进从一个边缘概念，变成了有资金、有人才、有算力的正式工程尝试。

田渊栋和他的联创们踏上的是同一条船。这条船驶向一片假设中的新大陆，而不是已知海岸。能不能到达，取决于他们能否把“AI 写代码”这个简单起点，扩展成一个真正可持续的自我改进闭环。未来几年，这个行业会密切关注他们的第一次公开验证。

参考来源

还没有评论，你可以写下第一条。

继续阅读

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-03-15 17:24 北京时间更新：2026-03-31 18:30 北京时间 16 分钟同主题：技术沉思

谁在塑造 AI 时代：6 位关键掌门人与三条分叉路线

今天前沿 AI 的主导权，已经从单看模型分数，变成同时看科学突破、算力基建、产品入口与安全治理；Demis、Sam、Dario、Ilya、Mira、Mustafa，正分别卡在这几条最关键的链路上。

2026-03-16 00:11 北京时间 15 分钟同主题：技术沉思

Yaq 与 ETH2030：不是神话，也不是胡扯

ETH2030 不是假项目，它确实把以太坊 Strawmap 做成了实验性参考实现；但「6 天写完未来以太坊」是夸写，重要的是它把路线图中的依赖、性能和验证问题提前暴露了出来。

2026-06-13 12:25 北京时间 20 分钟同主题：技术沉思

拆解 AI 工程新词：从概念到落地实践与工具选型

Prompt、Context、Agentic Workflow、Eval 这些新词不是四种并列技术，而是同一件事的不同切面：把可靠性责任从模型手里一层层夺回到代码手里。这篇把概念、工程原则和工具选型一次讲清。

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-06-17 01:00 北京时间 10 分钟编辑精选

下一篇 拆解 AI 工程新词：从概念到落地实践与工具选型

阅读难度

进阶

信息密度适中，适合连续阅读。

要点

创始团队涵盖 ViT、Rainbow Teaming、Darwin Gödel Machine 等核心工作的作者。
核心方法是让 AI 自主设计实验、发现局限并改写自身代码，形成改进闭环。
首个目标是训练出相当于 5 万名博士研究能力的系统，从 AI 科学本身入手。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

递归超级智能：46.5亿美元赌局与AI自我进化路线

快速答案

一笔罕见的早期融资

为什么是现在

递归自我改进的工程图景

首个目标：5 万名博士

团队的底气与赌注

技术路线的硬核问题

与预训练路线的关系

冷静看待这场赌局

结语

参考来源

评论（0）

继续阅读

同主题延伸

谁在塑造 AI 时代：6 位关键掌门人与三条分叉路线

Yaq 与 ETH2030：不是神话，也不是胡扯

拆解 AI 工程新词：从概念到落地实践与工具选型

编辑精选

AI 时代的高绩效团队：来自 Lovable 的经验

普通程序员切入 AI 的最务实路径：先干脏活

Agent 记忆与推理：不是替代，而是乘积