AK

Andrej Karpathy (安德烈·卡帕西)

前特斯拉AI总监 | OpenAI联合创始人

计算机视觉和深度学习领域的顶尖专家。他帮助构建了现代AI,让特斯拉Autopilot实现落地。近期,他提出了 Vibe Coding (直觉编程),正以极其通俗易懂的视角解释最复杂的 AI 范式转移。

💡 终极洞察:AI时代的教育与人类本位

“你可以将‘思考’外包,
但绝不能将‘理解’外包。”

"You can outsource your thinking but you can't outsource your understanding."
Andrej 的深度解析:
在这个所有事物都能被自动化的时代,人类仍然是整个系统的“绝对瓶颈”。即便把信息处理的苦力活(Thinking & Processing)交给了智能体,信息的吸收、目标的指引、架构的设计,最终都必须在人类大脑的“理解 (Understanding)”层面发生。如果你自身缺乏理解,就无法成为一个优秀的“导演”去指挥这些强大的 AI 实习生。这也是为什么建立个人 LLM 知识库(合成数据、重组信息)成为了当下增强人类心智最令人兴奋的工具。

⚡ 1. 软件3.0与编程范式的巨变

🖱️ 悬停或点击卡片翻转阅读核心概念
🤯

被超越的剥离感

从“帮我写代码”到“无需我修改”

转折时刻:

  • 震惊:作为顶尖专家,Andrej 坦言近期这是他第一次作为程序员感到“深深的落后”。
  • 奇点(去年12月):最新模型生成的代码块已经完美到无需修改。
  • 建立信任:他不再逐行审查纠错,而是越来越信任系统,沉浸入全天候的 Vibe Coding 状态。
💻

软件3.0 (Software 3.0)

上下文窗口就是操纵计算机的杠杆

计算机演进史:

  • 软件1.0:手写明确规则的代码(程序员)。
  • 软件2.0:构建数据集训练神经网络(拟合权重)。
  • 软件3.0:LLM 变成解释器。编程方式变成了提供 Prompt(提示)和管理 Context(上下文),智能体在数字信息空间中自主执行计算。
  • 环境安装的颠覆:以前安装复杂工具(如OpenClaw/Claude Code),需要写无比臃肿、适配各种平台的 Bash Shell 脚本。现在?只需给 Agent 提供一段文本说明,它能自己查看你的电脑环境,智能执行并实时Debug直到安装成功。
  • MenuGen 的降维打击:Andrej 曾写过一个叫 MenuGen 的应用(将纯文字菜单拍照 → OCR识别 → 调API生图 → Vercel部署渲染)。但软件3.0范式下这个App根本不该存在!只需把照片丢给 Gemini,告诉它“直接在原图的对应位置渲染出菜品图片”,大模型直接一步输出图像结果。
  • 未来推演 (2026+):未来的计算机底层可能完全是神经网络(Host Process),传统的 CPU 反而沦为“协处理器 (Co-processor)”,处理一些辅助的确定性任务。

🧩 2. 可验证性与“参差不齐的智能”

“我们不是在培育动物,而是在召唤幽灵 (We are not building animals, we are summoning ghosts)。”
—— 它们没有内在动机、不觉得无聊,如果你大吼大叫,它们也不会改进。它们本质上是由统计预训练打底,外挂上强化学习(RL)回路的缝合体。
  • 可验证性 (Verifiability) 是核心:只要结果是可验证的(例如代码编译通过、数学题答案正确),实验室就能构建巨大的强化学习 (RL) 环境,AI 的能力就会在这个垂直领域疯狂飙升。
  • 参差不齐的智能 (Jagged Intelligence):这就是为什么 Opus 4.7 级别的大模型能重构 10万行代码库、找出 0-day 漏洞,但如果你问“洗车店就在50米外,我该开车去还是走路去?”,它会因为“距离近”而建议你走路去洗车
  • 数据分布的秘密:GPT-4 下棋能力飙升不是因为变聪明了,而是有人在预训练数据中塞入了大量国际象棋数据。开发者必须搞清楚,自己的任务到底在不在大模型的 RL 电路(数据分布)内。
  • 给创始人的建议:寻找那些目前实验室还没关注,但本质上可验证的领域,构建 RL 环境进行微调,这是巨大的机会,因为最终“一切都是可自动化的”。

🛠️ 3. 智能体工程 (Agentic Engineering)

🚀

Vibe Coding vs 智能体工程

抬高下限 vs 突破上限

能力维度的跃迁:

  • Vibe Coding (氛围编程):大幅提高下限,让非专业人士也能随心所欲开发软件。
  • Agentic Engineering (智能体工程):保持专业上限。协调多个不稳定的Agent去加速开发,同时不引入漏洞(不牺牲质量)。优秀的智能体工程师的效率提升远远超过传统的 10x 概念。
⚖️

品味与判断力

人类不可替代的独有价值

大模型的软肋:

  • 品味极差:如果不在 RL 奖励范围内,Agent 生成的代码往往臃肿、丑陋、充满复制粘贴。在 micro-GPT 项目中,Andrej 多次提示模型“极简代码”,但模型就是做不到(偏离了它的分布)。
  • 架构设计缺陷:例如 Agent 曾试图用简单的“邮箱字符串”去强行匹配 Stripe 支付和 Google 账号,而非建立规范的唯一 User ID。这类顶层设计必须由人类把控。
  • 如果你还在让应聘者做传统的算法拼图(LeetCode),那就大错特错了。
  • 新的面试方式:分配一个大型项目(比如写一个 Twitter 克隆版)。让候选人用 Agent 快速开发出安全、高质量的系统。
  • 终极压测:部署完毕后,启动 10 个顶尖大模型(如 Codeq 5.4x 等),作为恶意 Agent 去疯狂攻击这个系统。候选人构建的系统必须坚不可摧。

🌐 4. 走向 Agent-Native (智能体原生) 的世界

  • 文档不再为人类而写:Andrej 强烈吐槽现在的开发者文档依然在教人类“去这个 URL、点击那个按钮”。未来的文档应该直接提供:“你应该把这段文本复制给你的 Agent”。
  • 传感器与执行器:未来的工作流需要彻底解耦,系统将被重构为供 Agent 读取的“传感器 (Sensors)”和供 Agent 操作的“执行器 (Actuators)”。
  • 部署之痛的终结:在开发 MenuGen 时,写代码反而是最简单的,最痛苦的是去 Vercel 配置 DNS、连结各个服务。未来的理想形态是:输入一行提示词,Agent 从写代码到网络配置全自动搞定,人类无需触碰任何设置。
  • Agent 社交:未来的组织和个人都会有自己的 Agent 代理。你的 Agent 会直接跟我的 Agent 谈判并确认会议细节。

原文

源链接