AWS Anthropic Bedrock Codex GPT-5.5 Gemini Google OpenAI Pentagon

AI 大事件深度拆解 · 2026-04-29¶

事件 1：OpenAI 正式登陆 AWS Bedrock，并把 Codex 与 Managed Agents 一起带入亚马逊云¶

一句话判断¶

这是 OpenAI 真正"出走"微软独占的关键一步，重点不是模型上架，而是把 Codex 和 Bedrock Managed Agents（OpenAI 驱动）作为一等公民塞进 AWS 的企业治理栈。OpenAI 在用"渠道+企业合规"换取下一阶段融资和增长——这是真趋势，不是公关。

事实摘要¶

4 月 28 日，AWS 与 OpenAI 同步发布：OpenAI 模型、Codex、以及 Bedrock Managed Agents（由 OpenAI 模型驱动）以 limited preview 形式登陆 Amazon Bedrock。GPT-5.4 即时可用，GPT-5.5 "未来几周"上线。
企业可在 Bedrock 中直接调用 OpenAI 模型，并继承 IAM、PrivateLink、Guardrails、KMS 加密、CloudTrail 审计等 AWS 原生治理能力——也就是说，调用 OpenAI 不必再把数据发到 OpenAI 自家 API。
战略背景：兑现 OpenAI 今年 2 月与 AWS 谈定的 350 亿美元融资中关于云分发的承诺；微软同意放开此前的独占协议，作为对价被免除部分收入分成义务，但仍是 OpenAI 主要云供应商。
同一天，Google 拿到 Pentagon 的机密级 Gemini 合同（见事件 2），整个云+前沿模型的商业格局在同一天发生洗牌。
来源：OpenAI 官方公告、CNBC、The Register、Axios。

产品视角：用户价值与场景¶

真正解锁的不是"用 GPT-5"，而是"在合规边界内用 GPT-5 做 agent"。过去一年最大堵点是大企业 CISO/法务过不了 OpenAI 直连 API 这一关：数据走出 VPC、缺审计链、无 SCP 控制。这次 Bedrock 把 OpenAI 模型接到了已经被金融、医疗、政府客户接受的治理面板之下。
Codex 是被严重低估的那张牌。把 Codex 放进 Bedrock，意味着 AWS 上的开发者工具链（Q Developer、Lambda、CodeCatalyst）可能很快出现"OpenAI-as-a-coding-agent"的整合形态，直接对标 GitHub Copilot 在 AWS 客户群体的基本盘。
核心场景：受监管行业（金融、医疗、保险、公共部门）的内部 agent；数据驻留在 S3/Aurora 的 RAG 类工作负载；多账号/多 Region 部署的企业 agent。
不适合的场景：消费者向高频低价 API、个人开发者起步（直接用 OpenAI 自家 API 仍然更便宜更灵活）；要求最新功能首发的尝鲜者（Bedrock 在功能 parity 上历来比官方 API 滞后 2–6 周）。
商业模式冲击：Anthropic 在 AWS 内部"AI 头牌"的位置实质性松动——Bedrock Managed Agents 同时挂上 Claude 和 GPT-5，企业在选型时第一次能在同一个产品 SKU 内做 A/B；Anthropic 的差异化必须从"AWS 默认选项"重写为"在 agent/coding/safety 上更好"。
如果我是 PM，会立刻想清楚：
我们的 agent 产品在 AWS 客户手上，是不是该立刻做 Bedrock 通道？延迟一个季度等于把 design partner 让给对手。
价格：Bedrock 上的 OpenAI token 单价大概率比 OpenAI 直连贵 10–25%（历史 Anthropic 在两边的差价就在这量级，需验证），怎么向用户解释这部分溢价？
谁来 own"模型路由"这一层？用户希望按延迟/合规/成本动态切换 GPT 与 Claude，这件事很可能会被 Bedrock 自己吃掉。

工程视角：技术栈与实现细节¶

Bedrock Managed Agents 的真身是什么？ 我判断它不是简单的 OpenAI Assistants API 转发壳，而是 AWS 自己的 agent runtime（来自 Bedrock Agents 路线）+ OpenAI 模型作为 reasoning backbone。这意味着：
Tool calling schema 极大概率走 AWS 的 Action Group（OpenAPI schema 描述工具），而不是 OpenAI 原生的 function calling 格式——对已经在 OpenAI Assistants/Agents SDK 上写代码的团队，几乎要重写一层 adapter。
State/会话存储走 DynamoDB / S3，长流程编排可能挂 Step Functions，而不是 OpenAI 的 thread/run 抽象。
数据面与控制面分离：通过 PrivateLink 调用，模型推理仍在 OpenAI/AWS 共建的环境内；CloudTrail 记录的是控制面调用元数据，而模型 prompt/response 是否进入 CloudWatch Logs / S3、是否能被客户加密、是否参与 Bedrock 模型评估（Model Evaluation）功能，是这次最值得抠的合同细节——这些直接决定企业能否把 OpenAI 用于"客户级"工作负载。
可能的瓶颈：Bedrock 至今没有解决跨 Region 的 model warm pool 调度问题；GPT-5.5 这种参数量更大的模型如果只在少数 Region 起步，会出现首批客户排队、SLA 被边界情况拖累。
对开发者工作流的影响：
AWS SDK（boto3 bedrock-runtime / Bedrock Agents API）成为新的"OpenAI 调用"入口，Strands Agents / LangGraph 等框架预计 1–2 周内会发 OpenAI-on-Bedrock provider。
Codex 进入 Bedrock 意味着 SageMaker Studio / VS Code AWS Toolkit 里很可能出现"用 GPT-5.5 跑长 horizon coding 任务"的官方姿势——开发者侧的故事是"让 coding agent 跑在 IAM 授权过的资源上"。
如果我是工程师，我会立刻拆这几件事：
Bedrock 上 OpenAI 模型的 function calling 到底是 OpenAI schema 透传，还是被映射到 AWS Action Group？这决定 SDK 兼容性。
流式响应（streaming）和工具调用并发的延迟基线，对比 api.openai.com 直连有多大 overhead？
KV cache / prompt cache 是否跨 Bedrock 与 OpenAI 共享？跨账号是否做隔离？这一点直接影响 RAG 应用的成本结构。

可深挖方向（5 条）¶

Bedrock Managed Agents 的 tool schema 与 OpenAI Assistants/Agents SDK 的 mapping 表——参考：AWS Bedrock OpenAI 页面、OpenAI 官方公告
OpenAI 数据隐私协议在 Bedrock 通道下的具体边界：是否有"零保留"承诺？训练用途是否默认关闭？——参考：OpenAI Bedrock 服务条款（待官方放出）
Codex on Bedrock 的部署形态：是 Bedrock 一项托管能力，还是借 EKS/SageMaker 跑用户侧 sandbox？这决定 coding agent 能否直接读写客户 S3/RDS。
GPT-5.5 vs Claude 4.7 在同一 Bedrock 工作流下的成本/延迟基准——参考：CNBC 报道、Neowin 报道
微软放开独占的真实代价：Microsoft 拿了什么作为对价（收入分成减免具体数额、Azure 仍享有的"首发权"细则）——参考：PYMNTS 报道

事件 2：Google 与五角大楼签下 Gemini 机密级 AI 协议，Anthropic 留下的位置被快速补位¶

一句话判断¶

这件事的核心不是"Google 进了国防"，而是前沿模型厂商在"安全护栏"上正在主动让步以换合同——这是 AI 产业商业化进入"客户定义安全"阶段的明确信号。我判断未来 12 个月，所有头部模型厂商都会被迫公开自己在政府/敏感场景下的 guardrail 可调范围。

事实摘要¶

4 月 28 日，Google 与美国国防部签订协议，Gemini 可被用于美军在机密网络上的"任何合法政府用途"（"any lawful government purpose"）。
协议要求 Google 应政府请求协助调整 AI 安全设置和过滤器，且这一灵活度被报道为"超过 OpenAI 今年 2 月与五角大楼达成的协议"。
直接背景：DOD 几周前刚把 Anthropic 列为"供应链风险"（因 Anthropic 不愿放松同类 guardrail），转而扩张 Google、OpenAI、xAI 的覆盖。Pentagon AI 负责人 Cameron Stanley 公开表态"依赖单一模型从来不是好事"。
内部反弹：超过 600 名 Google 员工（含 DeepMind 高级人员）联署反对，称担心机密场景下 AI 被用于"非人道或极有害的方式"。
来源：TechCrunch、CNBC、Bloomberg、9to5Google、Euronews（员工反对）。

产品视角：用户价值与场景¶

"安全护栏可定制"已经成为 G2/G3（gov/gov-cloud）市场的硬性差异化。Anthropic 选择"硬护栏不让步"，结果是被踢出供应链；Google/OpenAI/xAI 选择"按客户调"，吃下蛋糕。这对所有 to B/to G 的 AI 产品意味着：guardrail 配置面（policy console、content filter、tool allowlist）从功能列表项变成必备 SKU。
Anthropic 的反向定位机会：在企业市场，"我们是不会为了客户改护栏的厂商"会变成一个真实的卖点——尤其是面向欧洲、面向法务高度保守的金融/医疗买家。短期失单，长期可能形成可信赖的 brand moat。这是值得密切跟踪的反向叙事。
核心场景：政府/国防、关键基础设施、出口管制场景；任何受 ITAR/EAR/FedRAMP High 约束的工作负载。
不适合的场景：开放消费者产品——guardrail 的政治化对中立消费品牌伤害大。
如果我是 PM，会立刻想清楚的问题：
我们产品的 safety policy 在合同里是不是"可被客户改写"？怎么暴露给客户、怎么审计、怎么版本化？
用户对"模型可被定制成什么样"是否有透明度需求？我们要不要先发制人做"safety changelog"？
如果某些客户要求关闭某类内容过滤，我们的产品定价该不该按"safety risk premium"分层？

工程视角：技术栈与实现细节¶

Guardrail 可调≠模型微调。我判断 Google 的实现路径更像是"系统级策略层（policy router + classifier + content filter）参数化"，而不是再跑一遍 RLHF。具体可能涉及：可配置的 input/output classifier 阈值、tool 调用白名单、特定 domain knowledge 的"忘记/记得"开关、以及为机密用例单独训练的 lightweight policy adapter（LoRA/前缀提示）。
机密网络部署的工程含义：模型权重（或推理服务）需进入 IL5/IL6 级别的环境（air-gapped、Cross-Domain Solution 网络），这意味着 Google 必须有一个"可在客户机房或专用 GovCloud 区域离线运行"的版本——和公开 Gemini API 不是同一份 binary。这通常要求 model packaging（容器化、签名、可审计构建）和推理栈（TPU vs. 客户硬件，可能要支持 NVIDIA Hopper / Blackwell 适配）。
agent 工具调用在机密环境下的实现：tool 必须只能调用受控目录里的系统，所有工具调用要走 audit log——这与商业 agent 默认开放工具集的工程范式（MCP、open tool registry）是反着来的。
如果我是工程师，会立刻拆的几件事：
Gemini "lawful purpose" 可调护栏的实现层——是 system prompt 级、classifier 级，还是模型权重级？是否会通过 fine-tune 派生新模型？
同一份模型如何同时服务"严格 safety"与"放宽 safety"两类客户而不互相污染？多租户隔离的边界在哪里？
若 Anthropic 公开宣称"我们不调护栏"，技术上他们能否提供让客户自证 guardrail 未被改动的 verifiability（例如签名的 policy hash）？这可能是下一个有价值的开源/标准化方向。

可深挖方向（4 条）¶

OpenAI 与 Pentagon 2 月协议 vs Google 4 月协议的措辞差异——参考：TechCrunch、The Information
Anthropic 被 DOD 列为"供应链风险"的官方原文与 Anthropic 的 RSP（Responsible Scaling Policy）条款冲突点——查 Anthropic RSP 最新版与 DOD 公开声明
政府场景下 AI safety guardrail 可调的工程范式调研：MITRE/NIST 是否在制定相关 attestation 标准？
Google 员工联署信全文与历届"军用 AI 抗议"对比（Maven 项目以来的轨迹）——参考：Yahoo News