OpenAI DevDay 2025 深度摘要

一份全面、可交互的发布会核心要点回顾。

平台增长数据

用户与开发者生态的指数级增长

自 2023 年首次 DevDay 以来,OpenAI 平台实现了巨大的增长:

  • 开发者数量:从 200 万增长至 400 万
  • ChatGPT 周活跃用户:从 1 亿增长到超过 8 亿
  • API Token 处理量:从每分钟 3 亿 Token 飙升至超过 60 亿 Token
  • 观点:“AI 已经从人们的玩物,变成了人们日常构建的工具。”

重点发布:Apps SDK — 在 ChatGPT 内构建原生应用

核心理念:超越插件,构建真正应用

OpenAI 发布了 Apps SDK 预览版,旨在让开发者能够在 ChatGPT 内部构建功能完整、可交互、自适应且个性化的原生应用,这是对过去 GPTs 和插件模式的一次重大升级。

  • 目标:开启新一代“可以与之交谈”的应用,将 ChatGPT 的对话智能与应用的丰富功能无缝结合。
  • 技术栈:提供全栈能力,包括:
    • 连接数据:安全地接入您的数据源。
    • 触发操作:执行后端逻辑和 API 调用。
    • 渲染交互式 UI:在对话中呈现丰富的、完全交互的用户界面。
  • 开放标准:基于 MCP (Media Control Protocol) 开放标准构建,确保了互操作性和可扩展性。开发者对后端逻辑和前端 UI 拥有完全控制权。
用户体验与发现机制

两种核心的 App 发现与调用方式:

  • 直接调用 (Invocation by Name):用户可以通过 App 名称直接在对话中激活它。
    示例:“Figma,把这个草图变成一个可用的流程图。”
  • 情境推荐 (Contextual Recommendation):ChatGPT 会根据对话的上下文,智能地为用户推荐最相关的 App。
    示例:当用户说“我周末派对需要一个歌单”,ChatGPT 会推荐在 Spotify 中创建。

“与 App 对话”(Talking to Apps):

  • 这是一项核心功能,允许 App 将其内部状态和上下文(如视频播放进度、地图视图)通过 API 暴露给 ChatGPT。
  • 这使得 ChatGPT 能够理解用户正在与 App 交互的具体内容,从而提供更精准、更深入的帮助。
    示例:在观看 Coursera 视频时,用户可以问“讲解一下他们现在正在说的内容”,ChatGPT 能够理解视频当前片段并给出解释。
现场演示亮点 (Coursera, Canva, Zillow)

演示生动地展示了 Apps SDK 的强大能力:

  • Coursera:展示了行内视频播放、画中画模式,以及“与 App 对话”功能,实现了边看视频边与 ChatGPT 讨论视频内容的学习体验。
  • Canva:从一段关于宠物狗业务的头脑风暴对话中,无缝调用 Canva 生成了品牌海报和融资路演的 Pitch Deck,展示了从创意到可视化资产的快速转化。
  • Zillow:演示了交互式地图的嵌入,并通过自然语言(“帮我筛选带院子的三居室”)对 App 内数据进行筛选。更进一步,它结合了 Zillow 的房源信息和 ChatGPT 的搜索能力,回答了“这个房子离宠物公园有多远?”的问题,展现了多工具协同工作的能力。
商业化与发布路线图
  • 发布计划:Apps SDK 今日起提供预览版。今年晚些时候,开发者将能够提交应用进行审核和发布。
  • 应用目录:除了对话内发现,还会推出一个专门的应用目录,供用户浏览和发现应用。符合更高设计和功能标准的应用将获得重点推荐。
  • 商业化前景:未来将支持多种变现模式,包括新的 Agentic Commerce Protocol,它允许在 ChatGPT 内实现即时、无缝的结账体验。

Agent Kit:让智能体 (Agent) 开发从繁入简

核心发布:Agent Kit 工具集

为了解决当前 Agent 开发门槛高、难以产品化的痛点,OpenAI 推出了 Agent Kit,一套旨在帮助开发者快速构建、部署和优化 Agent 工作流的完整解决方案。

  • Agent Builder:一个强大的可视化画布,可以通过拖拽节点(如工具、逻辑判断、安全护栏、人工介入等)来设计复杂的 Agent 流程,极大降低了编码负担。
  • Chat Kit:一个可轻松嵌入任何网站或应用的聊天 UI 组件库。开发者可以快速部署一个功能完善的聊天界面,并进行深度品牌定制。
  • Evals for Agents:一套专为 Agent 设计的评估工具,提供追踪评级 (trace grading)、数据集评估、自动化提示优化等功能,帮助开发者系统地衡量和提升 Agent 的性能。
  • 连接器注册表 (Connector Registry):提供一个管理面板,让企业可以安全、可控地将 Agent 连接到内部系统和第三方应用。

AI Coding 新纪元:Codex 正式发布

Codex 进入 GA,并为团队协作赋能

软件工程智能体 Codex 结束预览,正式 GA (General Availability)。它现在跨平台(IDE、终端、GitHub、云端)无缝工作,成为开发者的“结对编程伙伴”。

  • 核心引擎:由全新的 GPT-5 Codex 模型驱动,该模型在代码重构、代码审查等复杂任务上表现更优,并能为复杂的任务动态调整其“思考时间”,实现更深度的推理。
  • 惊人采纳率:自 8 月初以来,Codex 日均消息量增长了 10 倍。在 OpenAI 内部,使用 Codex 的工程师每周完成的 PR 数量提升了 70%

专为工程团队设计的新功能:

  • Slack 集成:在团队的 Slack 频道中直接与 Codex 协作。
  • Codex SDK:本次发布的一大亮点。它允许开发者将 Codex 的能力作为工具集成到其他应用或 Agent 中。现场演示了通过语音指令调用 SDK,实时、动态地修改了正在运行的应用代码,展示了“对话式软件开发”的未来形态。
  • 企业级管理工具:提供环境控制、监控和分析仪表盘,助力企业大规模部署和管理 Codex。

模型更新:更强、更多模态

GPT-5 Pro, Sora 2, Realtime Mini API 发布
  • GPT-5 Pro API:被誉为 OpenAI 迄今最智能的模型 GPT-5 Pro,现已全面开放 API。它专为需要高准确度和深度推理的专业领域(如金融、法律、医疗)而设计。
  • Sora 2 API 预览版
    • 视频生成模型 Sora 2 开放 API 预览。其最大突破在于极高的可控性开创性的声画同步能力,能够生成包含丰富环境音、同步音效的视频。
    • 支持将真实图片融入视频创作,并能灵活控制视频时长、宽高比和分辨率。
  • Realtime Mini API:发布了 Realtime API 的“迷你”版本,以更低的成本提供与高级模型同等级别的语音质量和表现力,旨在推动语音成为人机交互的主流方式。

原文

源链接