Long-form First

Read Long-form Track Players Unwind Later

Editor Desk

本周先看什么

如果你是回访用户,不想重新判断今天该从哪篇开始,这里先把最值得继续的入口给你排好。

本周先看
2026-04-12 10:20 北京时间 12 分钟

在原生 Windows 上,重搭 AI 编程命令行栈

一次原生 Windows 命令行整治记录:把 PowerShell、PATH 和 UTF-8 的反复故障,收敛成 Git Bash、rg、sd、jq、yq 与 ast-grep 这一套稳定工具链。

先从这篇开始

最近更新

如果你上次来过,这里优先看站内最近往前推的几篇长文。

正在追踪

这里固定只放三条追踪线:HackerNews精选、GitHub趋势 和 论文精选。三条都按最近 7 天窗口滚动;窗口里没有足够硬的新内容时,就保留上一版。

2026-04-12 10:20 北京时间 12 分钟

在原生 Windows 上,重搭 AI 编程命令行栈

一次原生 Windows 命令行整治记录:把 PowerShell、PATH 和 UTF-8 的反复故障,收敛成 Git Bash、rg、sd、jq、yq 与 ast-grep 这一套稳定工具链。

阅读难度:进阶
  • 原生 Windows 下,PowerShell 适合系统管理,不适合承担高频中文文本处理主流程。
阅读全文
2026-04-11 12:10 北京时间 11 分钟

Hermes 安装指南:macOS 和 Windows 怎么装

Hermes 不难装。macOS 直接跑官方安装器,Windows 先装 WSL2 再按 Linux 路线装。装完别先闲聊,先用并行读仓库和定时任务两个例子,看看它适不适合你。

阅读难度:进阶
  • macOS 原生可装,Windows 走 WSL2,别在原生 PowerShell 路线上耗时间。
阅读全文
2026-04-10 10:25 北京时间 9 分钟

01|论文精选:这一周最值得看的三条判断

这一周最有价值的论文,同时改了三条判断:个人代理依然很脆弱,自动化 QA 还远不到可托付,竞赛编程 agent 的上限又被往上推了一截。

阅读难度:进阶
  • OpenClaw 与 CIK-Bench 给出一个刺眼结果:面对真实网页里的对抗内容,个人 AI 代理的提示注入攻击成功率达到 73.7%。
阅读全文
2026-04-10 10:20 北京时间 8 分钟

01|GitHub AI 趋势:这一周最值得看的三条线索

这一周 GitHub 上真正有分量的上涨,集中在三类更靠近产品底层的仓库:agent 运行层、端侧推理运行时和全双工语音代理。

阅读难度:进阶
  • Hermes Agent 一周新增 14811 星,核心信号不在新 CLI,而在于它把安装、记忆、MCP 和 40 多个工具打成一层可运行的 agent 环境。
阅读全文
2026-04-09 19:35 北京时间 14 分钟

Anthropic 为什么要把 Managed Agents 做成平台层

Claude Managed Agents 不是一个孤立功能,而是 Anthropic 把 Agent 从模型接口推进到官方运行时平台的一步。真正重要的变化,不是多了几个工具,而是 Anthropic 开始接管 session、memory、vault、observability 和 prompt versioning 这一层基础设施。

阅读难度:进阶
  • Anthropic 现在提供的不只是模型,而是一套托管式 agent harness,把 agent、environment、session 和 events 打包成官方平台能力。
阅读全文
2026-04-09 19:20 北京时间 15 分钟

Claude Managed Agents 的运行时架构是什么

Anthropic 这次公开的不是一个单纯的 agent demo,而是一套正式的运行时抽象。Agent、Environment、Session、Events 这四层一起定义了 Claude Managed Agents 的架构边界,也决定了它更适合长任务、异步执行和托管式运行,而不是完全自定义的 prompt loop。

阅读难度:进阶
  • Claude Managed Agents 的核心不是单次请求,而是 `Agent -> Environment -> Session -> Events` 这一套托管运行时抽象。
阅读全文
4月10日 阿里巴巴

阿里认领 HappyHorse,视频模型竞争重新升温

新闻原文

4月10日,Caixin Global 报道 Alibaba 已确认此前匿名登顶 Artificial Analysis Video Arena 的 HappyHorse 归属阿里。HappyHorse 官网也写明,该模型来自 Alibaba 的 ATH AI Innovation Unit,目前已经在多项视频生成榜单拿到第一,并计划在 4 月 30 日开放 API。对玩家层来说,这不是一次普通模型曝光,而是阿里把一个已经被外部盲测验证过的视频模型正式推到台前。

锐评

这条信号的权重高,不在于又多了一个视频模型名字,而在于它同时具备外部排名验证、清晰团队归属和明确商业化时间表三个条件。相比再补一条 GitHub 小更新,HappyHorse 更能代表中国玩家在视频 agent 与多模态生产链上的实质推进。

4月9日 AWS

AWS 把 Agent Registry 做成 preview,开始补组织级 agent 目录、审批和审计

新闻原文

4月9日,AWS 发布《AWS Agent Registry for centralized agent discovery and governance is now available in Preview》。官方把 Agent Registry 定义成一个私有、可治理的 agent 目录与发现层,覆盖 agents、tools、skills、MCP servers 和 custom resources;团队既可以通过控制台、API 与 MCP 访问,也可以把记录接进审批流程,并用 CloudTrail 留下审计轨迹。

锐评

这不是给 AgentCore 多补了一个列表页,而是在把 agent 竞争从单个 demo 往组织级发现、复用、审批和审计推进。谁先把 registry 做成控制平面,谁就更接近企业真正会长期运行的 agent 基础设施。

4月9日 OpenAI

OpenAI 用 CyberAgent 案例把 agent 运营讲成组织级能力

新闻原文

4月9日,OpenAI 发布 CyberAgent 案例。文中写到,CyberAgent 在 2023 年建立 AI Operations Office,把 ChatGPT Enterprise 和 Codex 作为组织级底座推进;当前 ChatGPT 的月活使用率已达 93%,Codex 也已经进入设计评审、代码评审和知识文档维护等环节。对玩家层来说,这不是一篇泛泛客户故事,而是一套带治理、培训和持续跟进的落地路径。

锐评

这条信号的重要性,不在某个团队节省了多少时间,而在 OpenAI 开始把 agent adoption 包装成可复制的组织运营方法。企业真正会买单的,从来不只是模型能力,而是安全、管理、培训和扩散机制能不能一起成立。

Operations 2026-04-09

Agent 正在从个人提效工具变成要按目录、权限和运营管理的组织系统

过去 48 小时里,AWS 把 Agent Registry 做成带审批流和审计轨迹的组织级目录;OpenAI 在 CyberAgent 案例里把 AI Operations Office、培训支持与 93% 月活使用率放到台前;GitHub 则在 VS Code March Releases 里把 agent permissions 和 Autopilot 推到更前台。这三类动作放在一起,说明行业竞争正在从“谁的 agent 更聪明”转向“谁能把 agent 按目录、权限、审计和运营方式真正铺进组织”。

  • 当团队里开始同时运行多个 agent 时,核心问题就不再只是输出质量,而是谁能被发现、谁能被复用、谁可以调用什么资源、出了问题如何审计和追责。
AWS
AWS Agent Registry for centralized agent discovery and governance is now available in Preview
进入趋势页
Operations 2026-04-02

Agent 正在从功能包变成要单独定价、路由和审计的工作负载

过去一周,OpenAI 在 Business / Enterprise 里拆出 Codex-only seat 和 workspace credits,Google 给 Gemini API 加 Flex / Priority 两档来区分后台 agent 与前台 copilot,GitHub 把云端 agent commit 做成 Verified 并补上按用户 CLI 报表,AWS 则继续把 AgentCore 的评估与遥测往默认化推进。这些动作合起来说明,行业开始把 agent 当成独立 workload 来计费、调度和治理,而不再只是大模型套餐上的附赠能力。

  • 当 agent 同时包含后台长任务和前台实时交互时,平台就不能继续用单一推理通道、单一订阅价格和模糊权限模型去承载全部流量。
Google
New ways to balance cost and reliability in the Gemini API
进入趋势页
Infrastructure 2026-03-26

Agent 运行时正在下沉成企业工作流里的控制平面

过去一周,AWS 给 AgentCore Runtime 补上持久 session storage,又把 AgentCore 接进 Step Functions;GitHub 把 agent activity 写进 Issues / Projects,并把 coding agent usage 单列进组织级 metrics。这些动作合起来说明,行业开始补的不是新彩蛋,而是 agent 的状态、编排、恢复和审计底座。

  • Agent 正在从前台体验问题转向后台运营问题:任务状态要能跨 stop / resume 持续,执行链要能接入现成工作流服务,管理员还要看得到真实使用与执行进度。
AWS
AWS Step Functions adds 28 new service integrations, including Amazon Bedrock AgentCore
进入趋势页
Interface 2026-03-23

Agent 主战场正在从独立 AI App 转向默认工作台与现成入口

过去一周,OpenAI 把 Astral 并进 Codex 补工具链,Anthropic 把 Claude Cowork 推成跨手机和桌面的持续任务位,腾讯把 OpenClaw 接进 WeChat;这些动作合起来说明,行业争的已经不是“再做一个 AI App”,而是谁先占住用户原本就会打开的工作表面。

  • 独立 AI 助手的问题不只是获客贵,而是用户还得先切出浏览器、微信、IDE、文档或桌面工作台,才能让 Agent 开始工作。
Anthropic
Cowork: Claude Code power for knowledge work
进入趋势页

小游戏

小游戏继续放在第四层,不和长文以及这三条追踪线抢首屏。

注意:这是我一时兴起一晚上Vibe的,肯定有bug,适度玩耍即可

青蛙跳跳乐

蓄力起跳,挑战更高分。

进入游戏

霓虹回响

轻解谜路线,适合短时间游玩。

进入游戏

星尘漫游

自由探索式的宇宙小场景。

进入游戏

短剧猜猜猜

识图与判断结合的三连关。

进入游戏

整站累计阅读 11,180 · 按文章阅读计数汇总,进入正文页时累计