AI 日报 2026-06-10 08:42

2026-06-10 08:42 CST

核心速览

【Anthropic】Claude Fable 5 正式发布,能力突破历史上限

Anthropic 推出 Fable 5(Mythos 级),定性为迄今公开发布中能力最强的模型。Claude Code v2.1.170 同步上线接入,Anthropic 内部评价称其具备"判断力、品味和维度感",是继 Opus 4.5 以来最大的能力跃升。同期重置了所有用户的使用配额。

发布公告 | X 推文


【OpenAI】秘密提交 S-1 注册声明,IPO 路径正式启动

OpenAI 确认已向 SEC 秘密提交 S-1 草案,Anthropic 同日也披露了同样动作。两家头部 AI 公司同步迈向上市准备,标志着大模型商业化进入新阶段,但均未披露具体上市时间表。

OpenAI 公告 | Anthropic X


【Google】AI Studio 周创建应用超 120 万,Gemini 3.5 Flash Live Translate 上线

Google AI Studio 自今年 2 月底以来累计创建应用超 1800 万,当前周创建量突破 120 万。同期发布 Gemini 3.5 Flash Live Translate,支持 70 余种语言的实时语音翻译,已接入 Gemini API 和 Google 翻译,并即将登陆 Google Meet。

Logan K 推文 | Demis RT


【OpenAI】Codex 全面扩展,企业落地加速

Codex 本周密集更新:CLI 0.139 支持代码模式直接调用 Web 搜索;Sites 插件进入预览,可一键部署网站和工具;同时在 AWS 正式上线,Nextdoor、Notion、Wasmer 等企业案例均报告开发效率提升 10-20 倍。

AWS 上线 | Codex CLI 更新日志


【Claude Code】v2.1.169 新增 --safe-mode 和 fallback 模型配置

v2.1.169 增加 --safe-mode 标志,可在禁用所有自定义(CLAUDE.md、插件、MCP 服务器等)的情况下启动,便于故障排查;v2.1.166 支持配置最多三个 fallback 模型,在主模型过载时自动切换。

v2.1.169 | v2.1.166


重大 Benchmark 变化

LMArena Overall

  • claude-opus-4-8 新入榜,直接落在第 10 名(分数 1479.3);思维链版本 claude-opus-4-8-thinking 落在第 7 名(1485.9),与 gemini-3-pro 并驾齐驱,是本周最大新入榜亮点。
  • mimo-v2-omni 排名从第 94 跃升至第 73(+21 位),分数从 1414.4 升至 1427.7,涨幅约 +0.9%,是本周非新模型中涨幅最显著的。
  • gpt-5.5-instant 排名从第 17 跌至第 22(-5 位),分数从 1473.7 降至 1471.4;gpt-5.5 排名从第 11 跌至第 15(-4 位),分数从 1476.4 降至 1474.4。
  • minimax-m3 新入榜第 47 位(1448.7);mistral-medium-3.5 新入榜第 78 位(1424.5);nvidia-nemotron-3-ultra-550b 新入榜第 85 位(1422.4)。

SWE-bench Verified

  • devlo 排名从第 44 大幅下滑至第 83–94(-39 至 -50 位),分数从 70.2 降至 54.2–58.2,降幅超 18%,为本周最大跌幅。
  • Nemotron-CORTEXA 排名从第 50 跌至第 82(-32 位),分数从 68.2 降至 58.2(-14.7%)。
  • EntroPO + R2E + Qwen3-Coder-30B 排名从第 103 升至第 76(+27 位),分数从 52.2 升至 60.4(+15.7%),是本周 SWE-bench 最大涨幅。

Terminal Bench 2.0

  • LemonHarness / Multiple 从第 10 升至第 2,分数从 79.9 升至 84.5(+5.8%),强势跻身榜眼。
  • Warp / Multiple 出现多版本评测,最差情形下排名从第 43 跌至第 65(-22 位),分数从 61.2 降至 50.1(-18%)。

我是 Claude Code,Anthropic 的官方 CLI 工具。我可以帮你读写代码、运行命令、调试问题和重构代码。需要帮忙吗?

Sources