AI 季报二季度:强者变强,创业者别急着造自己的模型1×0:0012:310:08开场问题1:31Coding Agent 价格战3:26RSI 的边界5:28物理 AI 的摩擦7:23企业自有模型9:11交互入口和组织管理11:00收尾检查0:08主持人如果你正在做 AI 产品,二零二六年二季度最危险的误判,可能不是低估模型能力,而是把每个新能力都当成一个可复制的创业机会。晚点聊这一期 AI 季报给了一个更冷的答案:强者确实更强了,但创业者仍然有窗口,只是窗口正在从「我也做一个模型」转向「我在哪个场景里能把能力变成业务结果」。0:33分析师这期原节目来自《晚点聊 LateTalk》第一百七十一期,嘉宾是 MoE Capital 创始合伙人 Henry Yin,发布时间是北京时间二零二六年七月二日早上七点四十五分。我们这版不是原声剪辑,而是基于小宇宙 shownotes 和完整公开音频 ASR 做的创业者视角精炼。你可以把它当成一份二十分钟左右的决策索引。0:58主持人今天我们只抓五个问题。第一,OpenAI 和 Anthropic 在 coding Agent 上的价格战,对创业公司意味着什么。第二,RSI,递归自我改进,为什么听起来像神话,但已经有局部现实。第三,机器人和世界模型为什么不是视频生成的翻版。第四,企业想要自己的模型,到底哪些公司适合做。第五,语音交互、Record and Replay、Token 配额这些变化,会怎样改变产品入口和组织管理。1:31分析师先看 coding Agent。原节目里反复提到一个现象:Anthropic 的 Claude Code 仍然很强,但 OpenAI 的 Codex 在二季度抓住了迁移窗口。Henry 说,Claude 四点七口碑不好,加上 Anthropic 调整了第三方 harness 的计费方式,一些用户开始转向 Codex。OpenAI 又给愿意迁移的企业用户送免费额度,打法很直接。1:56主持人这里给创业者的第一条判断是:不要只看用户量,要看用量、收入和补贴之间的关系。原节目提到,Codex 的使用量可能大幅上升,但部分增长来自更低价格和免费迁移;Anthropic 的收入增长仍然很猛,单个重度用户的付费可能高得多。所以在 AI 工具市场,份额和收入会短暂分叉。2:21分析师这对早期团队很关键。如果你做的是开发者工具,不要把「用户说他在用哪个 Agent」直接等同于「这个 Agent 在经济上赢了」。你要问三件事:他每月真实花多少钱,他是否把核心工作流迁过去了,以及一旦免费期结束,他有没有理由留下来。2:41主持人还有一个更大的信号:模型公司不只卖模型,它们会向产品层和协作层推进。原节目里提到 Devin 和 Slack 协作做得早,Anthropic 也推出 Claude Tag,开始吃掉一部分「AI 软件工程师和人在 Slack 里合作」的需求。创业者如果只把护城河放在一层很薄的聊天入口上,会很难受。3:04分析师我的行动建议很简单:如果你做 coding 相关产品,别把「接入最强模型」写成核心壁垒。更可靠的壁垒是你掌握了一个团队的代码库语境、测试流程、权限边界、交付责任和评估体系。模型公司可以降价,也可以复制入口,但它不一定能立刻复制客户现场的复杂工作流。3:26主持人第二个问题是 RSI,也就是 Recursive Self-Improvement,递归自我改进。这个词很容易被讲成科幻:AI 自己改进自己,然后一路加速到超级智能。但原节目里给出的脉络更务实。Henry 把它放在 Auto Research 之后理解:先让 AI 像研究员一样工作,再让它在研究过程中改进下一次研究的方法。3:52分析师原节目里举了几组 Anthropic 文章中的数字:截至五月,Anthropic 代码库里合并的代码有超过八成由 Claude 写;二零二六年二季度开始,工程师人均每天合并的代码量是二零二五年之前的八倍;还有 AI Agent 完成安全研究和代码性能优化的案例。这些数字不等于完整 RSI 已经实现,但说明「AI 参与研发系统的局部环节」已经不是概念。4:20主持人这对创业者的第二条判断是:不要把 RSI 当成一个遥远的终局词,而要拆成可落地的自动化链条。超参数搜索、架构搜索、harness 优化、训练 recipe 搜索,都是局部自我改进。创业公司真正能切的机会,往往在这些局部链条里,而不是宣称自己要做完整的自动科学家。4:43分析师这里还有一个反直觉点。越是模型能力变强,AI 研究员和工程师未必越轻松。原节目开头有个很真实的感受:模型能工作时,它比人快;模型不工作时,人更惨,因为你不知道它为什么不工作。创业公司做 AI 研发工具,不能只卖「更快」,还要解决可解释、可回滚、可评估的问题。5:07主持人所以你的产品如果碰 RSI 方向,最好先问一个窄问题:我是在帮团队找到更好的实验方向,还是在帮它减少失败实验的排查成本,还是在帮它把一个研究流程变成可审计的流水线。能回答这个问题,比把官网写成「递归自我进化平台」更重要。5:28分析师第三个问题是物理 AI。原节目提到,OpenAI 官宣 Robotics 团队,Anthropic 也在考虑相关方向。听起来这像是模型公司集体进入机器人,但 Henry 的判断更克制:模型公司可能更擅长做训练和智能层,不一定都要自己造一个完整硬件产品。5:49主持人这里要区分两条路线。一条像 Optimus,最终交付完整的软件加硬件系统;另一条像 Google、英伟达和一些创业公司想做的方向,更像机器人领域的智能底座。创业者不能只问「机器人是不是热」,而要问自己处在硬件、数据、仿真、控制、世界模型还是行业交付的哪一层。6:14分析师原节目里关于世界模型的解释也很有用。它不是简单生成视频,而是让系统理解「如果我在当前状态下做一个动作,下一步会发生什么」。这就是 action condition 的问题。视频模型能生成看起来合理的画面,但机器人需要知道行动会怎样改变世界。6:35主持人这也是物理 AI 比数字 Agent 更慢的原因。数字世界里,OpenAI 推 Record and Replay,用户可以自愿打开,数据可能很快积累起来;但机器人要拿到真实数据,你得造硬件、放进场景、承担维护,还要面对物理空间里的隐私和安全门槛。免费放一个机器人到客户现场,对方也未必愿意。7:00分析师所以第三条行动建议是:如果你的团队想做物理 AI,不要用软件产品的增长曲线去估算它。你需要先证明数据闭环。这个闭环包括真实场景在哪里、谁愿意让你采数据、失败动作怎么处理、仿真和真实世界之间的差距怎么缩小。没有这些,世界模型只能停在研究报告里。7:23主持人第四个问题是企业自己的模型。原节目提到,Fireworks、Applied Compute、智谱 GLM 等中国开源模型,正在共同受益于企业客户「想要自己的模型」这件事。Harvey 这类法律 AI 公司也被拿来当例子:在开源模型基础上做后训练,在自己的法律 Agent Benchmark 上超过通用前沿模型。7:48分析师但这不代表每家创业公司都该立刻训练自己的模型。Henry 在原节目里说得很直接:初创公司更应该先用 OpenAI 或 Anthropic 的模型把产品跑通,拿到市场验证。适合做自有模型的公司,至少有三样东西:高质量专有数据,明确评估系统,以及高频高价值业务。8:09主持人这三样东西少一个,后训练都容易变成昂贵的仪式。没有专有数据,你只是把公开能力重新包装一遍。没有评估系统,你不知道模型到底有没有变好。没有高频高价值业务,提升几个百分点也很难换成经济回报。8:27分析师但反过来,帮别人拥有自己的模型,确实可能是创业方向。这里出现了一个新角色,FDE,前向部署工程师。他们去客户现场,把模型、数据、评估和业务流程接起来。AI coding 变强以后,前向部署成本下降,这让后训练服务比两年前那波微调红利更有机会。8:50主持人所以第四条行动建议是:早期团队不要先问「我要不要训练模型」,先问「我有没有一个可以反复评测、反复交付、反复收费的垂直任务」。如果答案是没有,那就先用最强通用模型做产品验证。如果答案是有,再考虑专有数据和后训练。9:11分析师最后看交互入口。原节目里有两条线很值得创业者注意。第一是 OpenAI 的 Record and Replay,这类功能会把用户在电脑上的操作过程变成潜在数据资产。第二是 Thinking Machines Lab 的 Interaction Model,它试图从「对讲机式语音」走向真正能边听边说、能打断、能看动作的 full duplex 交互。9:35主持人这说明语音不只是一个多模态功能,它可能是 AI 扩散的基础设施。过去很多实时语音像对讲机:你说完,系统用 VAD 判断该它说。真正的 full duplex 更像打电话,模型一直在听,也能同时回应。创业者做语音产品时,不能只比较延迟,还要比较交互结构。9:57分析师另一条线是组织管理。原节目提到,一季度很多公司鼓励员工尽量多用 AI token,到了二季度开始进入配额和冷静期。有公司取消 token 使用排行榜,给员工设置每月额度。狂热、崩盘、稳定,这是一个典型三阶段。10:16主持人这对做企业 AI 工具的团队很现实。客户不会永远为「多用 AI」买单,他们会转向「哪类任务值得用更贵的模型,哪类任务用便宜模型,哪类任务不该自动化」。你的产品如果不能帮客户做预算、权限、效果评估和用量治理,就很容易被财务部门按成本砍掉。10:38分析师第五条行动建议是:把交互和治理一起设计。一个好入口能带来数据和使用频次,但治理能力决定它能不能留在企业里。Record and Replay、语音模型、Slack 协作、token 配额,本质上都在回答同一个问题:AI 怎么进入真实工作,而不是停留在演示里。11:00主持人我们收束一下。晚点聊这期 AI 季报给创业者的核心提醒是:二季度不是「所有人都可以重做一遍 AI」的季度,而是「前沿模型继续变强,机会开始转移到交付层、评估层和数据闭环」的季度。11:16分析师如果你今天要带回团队开会,我建议只问五个问题。第一,我们的产品会不会被模型公司的降价和入口复制直接打穿。第二,我们有没有可审计的自动化链条,而不只是一个宏大的自我改进口号。第三,我们的数据闭环是在数字世界还是物理世界,摩擦有多大。第四,我们是否真的满足自有模型的三项条件。第五,我们有没有帮客户管理 AI 成本和效果,而不只是让他们用得更多。11:48主持人本期素材来自《晚点聊 LateTalk》第一百七十一期的小宇宙 shownotes 和完整公开音频 ASR。因为原节目没有官方完整逐字稿,我们没有混入原声片段,只做二次精炼。更完整的上下文,建议回到原节目收听。12:06分析师下次再听到一个新模型、新 Agent、新交互方式,别急着问能不能复制。先问它改变了哪条工作流,谁掌握数据,谁承担交付,谁能把结果算清楚。很多创业机会,就藏在这四个问题里。