AI 日报 2026-04-29 18:03

快速预览

GPT-5.5 发布：OpenAI 推出 GPT-5.5，定位为"最智能模型"，同步发布 System Card 与 Bio Bug Bounty（最高 $25,000）
OpenAI 全面上 AWS：GPT 模型、Codex、Managed Agents 正式登陆 AWS，企业可在 AWS 环境内构建安全 AI 应用
Anthropic 发布 Claude Opus 4.7：在高级软件工程任务上较 Opus 4.6 有显著提升；Claude Code 一周内迭代至 v2.1.123
SWE-bench Pro Public 快照（4/29）：gpt-5.4 (xHigh) 以 59.1 分居首，Muse Spark 55.0 分第二，claude-opus-4-6 (thinking) 51.9 分第三
OpenAI × Microsoft 合作新阶段：双方宣布修订协议，简化合作关系并增加长期确定性

项目	要点
模型定位	"最智能模型"，面向编码、研究、数据分析等复杂任务
System Card	已发布，含安全评估详情
Bio Bug Bounty	红队挑战赛，寻找生物安全风险的通用越狱方法，奖金最高 $25,000
来源	Introducing GPT-5.5 · System Card · Bio Bug Bounty

全新图像生成模型，改进文字渲染、多语言支持与高级视觉推理能力。 → 来源

开源权重模型，用于检测和脱敏文本中的 PII（个人身份信息），号称 SOTA 精度。 → 来源

面向生命科学的前沿推理模型，加速药物发现、基因组分析、蛋白质推理等科研流程。 → 来源

Opus 4.7 正式发布，在高级软件工程任务上较 Opus 4.6 有明显提升，尤其在最难任务上表现突出。 → 来源

GPT 模型、Codex、Managed Agents 现可在 AWS 环境中使用，企业可在自有 AWS 基础设施内安全构建 AI。 → 来源

修订协议简化合作关系，增加长期确定性，支持大规模 AI 创新。 → 来源

ChatGPT Enterprise 和 OpenAI API 获 FedRAMP Moderate 授权，美国联邦机构可安全采用。 → 来源

将 issue tracker 转化为始终在线的 agent 系统，减少上下文切换，提升工程产出。 → 来源

Codex 驱动的云端 agent，可自动化复杂工作流、连接工具、安全扩展团队运营。 → 来源

macOS/Windows 版 Codex 新增 computer use、应用内浏览、图像生成、记忆和插件功能。 → 来源

版本	日期	关键变更
v2.1.123	4/29	修复 OAuth 401 重试循环（`CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1`）
v2.1.122	4/28	新增 `ANTHROPIC_BEDROCK_SERVICE_TIER` 环境变量（default/flex/priority）
v2.1.121	4/28	MCP server 配置新增 `alwaysLoad` 选项，跳过 tool-search 延迟
v2.1.119	4/23	`/config` 设置持久化至 `~/.claude/settings.json`，参与项目/本地/策略覆盖优先级
v2.1.118	4/23	新增 vim visual mode (`v`) 和 visual-line mode (`V`)

说明：以下为 Scale Leaderboard 当前快照，非变化对比（本次无变化数据）。带 * 号表示使用了额外推理策略（如 thinking/xHigh）。

快照观察：

来源 · 37 条