OpenAI 播客完整摘要:Codex 的过去、现在与未来
访谈嘉宾:
Greg Brockman:
OpenAI 联合创始人兼总裁
Thibault Sottiaux:
Codex 工程主管
Andrew Mayne:
主持人
第一部分:起源与核心理念的演进
🌱 Codex 的诞生:从 GPT-3 的火花开始
Greg:
灵感最初来源于 GPT-3 时代,当我们看到模型能根据 Python 的
docstring
自动补全函数代码时,
“你一看到那个,就知道这事能成,而且会搞得很大。”
Greg:
我们曾立下一个宏伟目标:让模型写出
1000 行连贯的代码
。如今这个目标早已实现,甚至我们都觉得理所当然了。
Greg:
OpenAI 的终极目标是
AGI (通用人工智能)
,但“编码”领域一直是个例外,我们为其投入了专门的数据集、评估指标和研究资源。
🔗 关键概念:“Harness” (工具链/套件)
Greg:
对于普通语言任务,交互很简单。但对于编码,生成的文本需要“活过来”——它必须被
执行
、连接到
工具
。因此,
Harness
和智能本身同等重要。
Thibault:
“Harness” 是连接模型与现实世界的桥梁。
“你可以把 Harness 看作你的身体,而模型是你的大脑。”
它包含了工具集、环境交互以及
Agent Loop (智能体循环)
。
🤖 “智能体”思维的觉醒
Thibault:
我们观察到,用户正费力地将越来越多的上下文(代码片段、堆栈跟踪)手动粘贴到 ChatGPT 中。这启发了我们:
“也许我们应该让模型自己去驱动交互,自己去寻找上下文,而不是让用户来做这件事。”
Thibault:
我们曾开发了一个内部工具叫
“10X”
,它在终端里运行,效率很高。但我们觉得它不够
“AGI-pilled” (不够有 AGI 范儿)
。
Greg:
我们探索了多种形态:包括
异步智能体
(在云端独立工作)和
本地同步
体验。最终的目标是创造一个无缝协作的实体,既能在云端为你处理大任务,也能在本地“俯看你的肩膀”提供即时帮助。
第二部分:软件工程实践的革命
🛠️ 颠覆软件开发全流程
代码审查 (Code Review):
Thibault:
当 AI 提高了代码产出后,代码审查成了新的瓶颈。
Thibault:
Codex 的审查模式能深入理解代码背后的
Intention (意图)
,并验证实现是否匹配,甚至能发现
顶尖工程师耗费数小时才能发现的深层问题
。
Greg:
它已成为内部团队不可或缺的
“安全网”
。当它宕机时,大家会感到不安。审查意见的
正确率超过 90%
。
重构与迁移 (Refactoring & Migration):
Greg:
代码迁移是企业级的“杀手级用例”。
想象一下,能够自动将古老的
COBOL
系统迁移到现代语言。
Thibault:
OpenAI 甚至发推文,演示如何用
CLI
工具自动完成从旧 API 到新 API 的代码迁移。
开发工作流与上下文管理:
Thibault:
为了让智能体更好地理解项目,我们引入了
agents.md
文件。开发者可以在其中提供高层指令、代码库导航指南或个人偏好(比如“测试文件应该放在这里”)。
Greg:
这也是当前智能体
记忆能力
不足的一种变通方案。未来的研究方向是让智能体能自主探索并深度理解整个代码库。
安全与架构 (Security & Architecture):
Greg:
AI 在
安全补丁 (Security Patching)
和漏洞发现上潜力巨大。
Greg:
我们希望 AI 能将软件安全提升到新的高度,比如通过
形式化验证 (Formal Verification)
,彻底终结某些安全领域的“猫鼠游戏”。
Thibault:
Codex 的目标不只是增加代码量,更是提升代码质量——写出更优雅、更高效、更简单的系统。
第三部分:GPT-5 Codex 与产品体验
🌟 GPT-5 Codex:新一代编码伙伴
Thibault:
它是 GPT-5 的一个特殊版本,为与
Harness
协同工作进行了深度优化。
两大核心特质:
“Grit” (毅力):
在极其复杂的任务上,能长时间保持专注和连贯性,不会轻易“放弃”或偏离目标。
动态调整:
简单任务响应迅速,复杂任务则能投入深度思考,长时间工作。
Thibault:
我们观察到它在一次非常复杂的代码重构任务中,持续自主工作了长达 7 个小时,并成功修复所有问题、跑通了测试。
Greg:
它就像
“你终端里的一个实习生”
,能帮你处理所有机械化的编码任务,让你专注于更高层次的创造。
📈 用户体验与市场反响
Greg:
2022 年与 GitHub Copilot 的合作教会我们:对于
Auto-Completion (自动补全)
场景,
延迟是核心产品特性
,必须控制在 1500 毫秒内。
Greg:
优秀 AI 产品需要在两个维度上取胜:
智能 (Intelligence)
和
便利性 (Convenience)
(包括延迟、成本、集成度)。
Andrew:
主持人分享了一个生动的比喻,形容没有集成工具的开发就像
“去超市购物,却拒绝使用购物车,坚持用手抱所有东西去结账。”
Thibault:
自从在 GPT-5 (Plus/Pro 套餐) 中正式推出 Codex 以来,用户使用量增长了超过 10 倍。
第四部分:展望 2030 与给开发者的建议
🔮 未来图景:富足世界与算力稀缺
Thibault:
未来的世界将由
“大型智能体集群 (large populations of agents)”
在云端为人类执行任务。
Greg:
我们必须解决
“可扩展监督” (Scalable Oversight)
的技术难题,即如何有效管理和信任由 AI 产生的大量代码和行为。
Greg:
2030 年的图景:我们将生活在一个物质极大丰富的世界,但同时面临绝对的“算力稀缺” (Compute Scarcity)。
Greg:
当每个人都希望有一个专属智能体 24/7 运行时,全球可能需要
100 亿个 GPU
。我们距离这个数量还差几个数量级。
Greg:
AI 的终极价值在于解决人类无法解决的
全新科学问题
,例如新药研发、新材料科学等。
💡 对开发者的建议:拥抱 AI,回归基础
我们还应该学编程吗?
Greg:
“一定要学编程,但更核心的是要学习如何使用 AI。”
Thibault:
“是的,现在是学习编程的绝佳时机。”
Greg:
Greg 分享了自己早年学 PHP 的经历:他曾自己发明了一套有缺陷的数据序列化方法。而现在,Codex 会直接建议你使用标准的
JSON
库,避免你重蹈覆辙。
Thibault:
AI 是强大的学习加速器。他的团队很多成员通过与 Codex 互动,快速上手了复杂的
Rust
语言。
Thibault:
最成功的 AI 辅助开发者,是那些将扎实的软件工程基础(如
软件架构
、代码结构)与 AI 工具的强大执行力结合起来的人。
原文
源链接
◁