从 70 万行代码反推 Yaq 的研发活动图谱
顺着 ETH2030 的仓库、文档和 git 节奏往回拆,Yaq 更像规格编译者、边界裁剪者、多代理调度者和验证架构师的组合体,而不只是一个会用 AI 疯狂写代码的人。
- 从代码看,Yaq 的核心角色不是“超级程序员”,而是“规格编译者 + 多代理调度者 + 验证架构师”。
这里汇总的是 Freelemon 的长文。现在列表页不再只有单一时间线,而是把搜索、标签和专题阅读放到同一层里: 技术沉思 偏系统、方法与工程判断, 访谈 偏一手观点整理与人物表达, 行业观察 偏竞争格局、平台变化与商业判断。
顺着 ETH2030 的仓库、文档和 git 节奏往回拆,Yaq 更像规格编译者、边界裁剪者、多代理调度者和验证架构师的组合体,而不只是一个会用 AI 疯狂写代码的人。
ETH2030 不是假项目,它确实把以太坊 Strawmap 做成了实验性参考实现;但“6 天写完未来以太坊”是夸写,真正重要的是它把路线图中的依赖、性能和验证问题提前暴露了出来。
AI 已经能写代码、审代码,甚至自己在 PR 里给出修改建议;但如果 review 只剩“高吞吐检查”和形式签字,它就不再是软件工程里的真正 review。真正的问题不是 AI 能不能看,而是谁还真的看懂、敢签字、能兜底。
Ars Technica 的假引语风波真正警示的,不只是新闻业会被 AI 绊倒,而是当代码生成速度远超人类核验速度时,软件工程的责任链、风险边界和上线契约都需要重写。
今天前沿 AI 的主导权,已经从单看模型分数,变成同时看科学突破、算力基建、产品入口与安全治理;Demis、Sam、Dario、Ilya、Mira、Mustafa,正分别卡在这几条最关键的链路上。
这 48 小时里,我真正搭起来的不是一个会发文章的页面,而是一套能长期写下去的个人母站:草稿在本地,发布可校验,内容能归档,也能继续分发到各个平台。
“SSE 可以让 WebSocket 退役”这种说法,方向对了一半,但结论下得太满。更准确的判断是:在浏览器里的单向实时推送和文本流场景里,SSE 常常是更稳妥的默认值。
如果现在要做 Agent 产品,最值得补的往往不是再造系统层或平台层,而是把平台能力真正翻译进团队工作流、审批链路和成本治理里的那层协作缺口。
平台层真正决定的是 Agent 能不能长期、稳定、可治理地跑起来。今天最值得看的四条路线,是 LangGraph、微软、OpenAI 和 AWS 各自代表的平台化方向。
如果你要做的不是聊天框,而是能承接长任务和团队协作的 Agent 系统,动手前最重要的事,是先看懂系统、平台和工具三层今天各自做到什么程度。
长时间 Agent 的真正难点,不在单步够不够聪明,而在跨很多轮、很多上下文和很多工具调用之后,能不能继续保持状态连续、结果可验证和错误可恢复。
如果一个 Agent 要连续运行二十分钟、两小时甚至更久,系统默认该长什么样?这篇文章把分层架构、状态模型、检查点、验证和上线顺序全部拆开讲清楚。