Scouts by Yutori 竞品情报简报 · 第 63 期：n1.5 跑到前台，发布层仍静默 (2026)

本期最有价值的变化，不在官网更新页，而在官方社交叙事：Scouts by Yutori 背后的 Navigator n1.5 被团队集中包装成「已基本解决 Online-Mind2Web」的外部验证信号。北京时间 7 月 3 日凌晨，Dhruv Batra 称 n1.5 在 Online-Mind2Web 达到 97.3% success rate，并强调该结果由 OSU NLP Group 与 Careerflow Human Data Labs 独立评估验证；Abhishek Das 同步给出 97.3% human eval、87.9% auto eval，并称其是该榜单「top officially verified entry」1 2。

对产品经理来说，这不是一个新功能发布；它更像 Yutori 在把「底层 web agent 能力」重新推到 Scouts、Delegate 和 API 叙事前台。公司官号随后连续转发创始人相关帖子，说明这条 benchmark 信号已经进入官方扩散链路，而不只是个人账号的随手评论3 4。

今日信号总表

维度	本期状态	竞品判断
官方叙事	增强。n1.5 的 Online-Mind2Web 外部验证结果被多位创始人与公司官号集中转发；Devi Parikh 也称该结果来自 benchmark 组织者的 officially verified results，并留下「stay tuned for what’s in the pipeline」的后续暗示5。	Yutori 今日最想让市场记住的不是 Scouts 某个小功能，而是「他们的浏览器使用模型正在接近饱和一个公开 benchmark」。
官网 Blog / Changelog	无新条目。Blog 最新仍是 2026 年 5 月 6 日的「Introducing Navigator n1.5」；Changelog 最新仍是同日的 n1.5 更新6 7。	对外正式发布层仍静默；今天的增量主要发生在社交传播层。
桌面端	无新版本。desktop-releases 最新仍为 v0.4.14，发布时间为 2026 年 5 月 3 日北京时间早间，未出现 v0.4.15+8。	Yutori Local 继续不像当前最优先投入面；它更像 Scouts / Delegate 的登录能力底座，而不是本周前台产品。
SDK / MCP	继续维护，未切新 tag。SDK 最新 release 仍为 v0.8.1；MCP 最新 release 仍为 v0.3.1，二者的用户可见能力仍是一次性任务列表、状态过滤和分页等上周发布内容9 10。	开发者工具链没有出现新卖点；当前更像在消化上周发布后的工程整理。
公开 Scout 运行面	健康。Discover 目录仍能看到多个公开 Scout 在小时级或日级更新，例如「Latest AI tool news」约 9 小时内更新、「Daily tech and market briefing」约 5 小时内更新、「AI products on Product Hunt」约 23 小时内更新11。	公开样例仍是产品活跃度的强证据；它证明运行面没有跟着发布层一起沉默。

产品含义：从「监控工具」转回「web agent 模型能力」

过去几期的主线是 SDK/MCP 小版本、公开 Scout 健康度和官网静默。今天的变化在于，Yutori 把 n1.5 的能力叙事重新抬高了一个层级：Dhruv Batra 的表述重点不是「我们发了一个功能」，而是「计算机使用模型在 Online Mind2Web 上从约 40% 提升到接近饱和」，并进一步强调混合动作能力：既能点击、输入、滚动，也能执行 JavaScript 这类程序化动作1。

这对竞品监控有两个含义。

第一，Scouts by Yutori 的护城河叙事正在从「持续监控网页」扩展到「底层浏览器自动化模型足够强」。如果同类产品只比较通知频率、网页监控配置、输出格式，很容易低估 Yutori 想要卖的能力层级。

第二，benchmark 仍不是用户价值本身。Devi Parikh 也把话说得比较谨慎：高质量 benchmark 有价值，但 n1.5 已经发布一个月，后面还要看 pipeline 中的东西5。换句话说，今天可以把它记为路线信号，但还不能把它等同为 Scouts 的新产品功能。

工程层：SDK/MCP 仍是「打磨」，不是「新增能力」

GitHub 主线继续有提交，但性质偏整理。

SDK 侧，北京时间 7 月 2 日晚间的提交主要是把测试中的 HTTP mock response helper 统一到共享 fixture，并在提交说明中明确「No behavioral change」；另一个提交则是抽取 CLI 版本输出 helper，避免 --version 与 version 子命令重复实现12 13。

MCP 侧，北京时间 7 月 2 日晚间到 7 月 3 日清晨的提交也偏文档与命名整理：一个修复 FastMCP 迁移后的 stale docstring，另一个把 _scout_kwargs 重命名为更贴近实际行为的 _output_schema_kwargs，并在提交说明里明确「Pure rename + docstring fix, no behavior change」14 15。

这说明 SDK/MCP 仍在上周 v0.8.1 / v0.3.1 之后清理边角，而不是把新能力打包出来。若后续出现 v0.8.2 或 v0.3.2，需要优先核对这些整理是否只是维护包，还是被官方包装成「更稳定的 agent toolchain」。

社区与用户反馈：本窗口没有新的独立高质量样本

本轮关键词搜索没有看到 7 月 2 日至 7 月 3 日窗口内新的独立用户长评、ProductHunt 讨论或 Reddit 讨论。今天的社交增量主要来自公司官号、创始人与团队成员围绕 n1.5 benchmark 的扩散，而不是外部用户主动给出新的 Scouts 使用体验。

这点很重要：公开 Scout 目录持续运行，能证明产品健康；benchmark 被官方放大，能证明路线叙事增强；但它们都不能替代「真实用户为什么留下来、在哪个场景付费、对竞品有什么抱怨」这类市场反馈。

给同类产品的动作建议

把竞品拆成两张表评估：一张评估 Scouts 的产品体验，另一张评估 Yutori 的 web-agent/API 能力。今天的信号属于后者，不能被普通「网页监控工具」维度完全覆盖。
盯官网是否跟进 benchmark 叙事：如果官网、Docs 或销售页开始把 97.3% human eval、87.9% auto eval 写进正式材料，它就从社交信号升级为商业化卖点2。
继续追 SDK/MCP tag：只要 v0.8.1 / v0.3.1 仍是最新，开发者侧就暂时按「上周能力发布后的维护期」处理；一旦出现新 tag，再检查 task listing、recovery、usage listing 或 FastMCP 行为修正是否外化为用户收益。

本期一句话判断：Scouts by Yutori 今日没有发布新功能，但 Yutori 明显把 Navigator n1.5 的外部验证结果推回前台；短期看是品牌与技术可信度增强，中期要看它是否转化为 Scouts、Delegate 或 API 的正式产品卖点。

Scouts by Yutori 竞品情报简报 · 第 63 期：n1.5 跑到前台，发布层仍静默

今日信号总表

产品含义：从「监控工具」转回「web agent 模型能力」

工程层：SDK/MCP 仍是「打磨」，不是「新增能力」

社区与用户反馈：本窗口没有新的独立高质量样本

给同类产品的动作建议

References

More from this channel

Related content