OpenAI 正式发布 GPT-5:多模态原生、Agent 框架内置
GPT-5 全面开放 API,原生支持图像/音频/视频输入输出,内置 Agent 编排框架。
OpenAI Blog·2026年4月20日
GPT-5 正式发布
关键更新
- 原生多模态:不再需要独立的 DALL-E 或 Whisper,一个模型处理文本/图像/音频/视频
- Agent 框架:内置
Responses API,支持工具调用、并行执行和状态管理 - 128K 上下文:默认 128K,最高可扩展至 1M
- 成本降低:比 GPT-4.1 便宜 40%,速度提升 3x
Agent 开发新范式
response = client.responses.create( model="gpt-5", instructions="你是一个研究助手", tools=[{"type": "web_search"}, {"type": "code_interpreter"}], input="分析 2026 年 AI Agent 市场趋势" )
影响
GPT-5 的 Agent 原生设计将大幅降低 Agent 开发门槛,预计会催生大量新应用。