Andrej Karpathy (安德烈·卡帕西)

前特斯拉AI总监 | OpenAI联合创始人

计算机视觉和深度学习领域的顶尖专家。他帮助构建了现代AI，让特斯拉Autopilot实现落地。近期，他提出了 Vibe Coding (直觉编程)，正以极其通俗易懂的视角解释最复杂的 AI 范式转移。

💡 终极洞察：AI时代的教育与人类本位

“你可以将‘思考’外包，
但绝不能将‘理解’外包。”

"You can outsource your thinking but you can't outsource your understanding."

Andrej 的深度解析：
在这个所有事物都能被自动化的时代，人类仍然是整个系统的“绝对瓶颈”。即便把信息处理的苦力活（Thinking & Processing）交给了智能体，信息的吸收、目标的指引、架构的设计，最终都必须在人类大脑的“理解 (Understanding)”层面发生。如果你自身缺乏理解，就无法成为一个优秀的“导演”去指挥这些强大的 AI 实习生。这也是为什么建立个人 LLM 知识库（合成数据、重组信息）成为了当下增强人类心智最令人兴奋的工具。

⚡ 1. 软件3.0与编程范式的巨变

🖱️ 悬停或点击卡片翻转阅读核心概念

🤯

被超越的剥离感

从“帮我写代码”到“无需我修改”

转折时刻：

震惊：作为顶尖专家，Andrej 坦言近期这是他第一次作为程序员感到“深深的落后”。
奇点（去年12月）：最新模型生成的代码块已经完美到无需修改。
建立信任：他不再逐行审查纠错，而是越来越信任系统，沉浸入全天候的 Vibe Coding 状态。

💻

软件3.0 (Software 3.0)

上下文窗口就是操纵计算机的杠杆

计算机演进史：

软件1.0：手写明确规则的代码（程序员）。
软件2.0：构建数据集训练神经网络（拟合权重）。
软件3.0：LLM 变成解释器。编程方式变成了提供 Prompt（提示）和管理 Context（上下文），智能体在数字信息空间中自主执行计算。

环境安装的颠覆：以前安装复杂工具（如OpenClaw/Claude Code），需要写无比臃肿、适配各种平台的 Bash Shell 脚本。现在？只需给 Agent 提供一段文本说明，它能自己查看你的电脑环境，智能执行并实时Debug直到安装成功。
MenuGen 的降维打击：Andrej 曾写过一个叫 MenuGen 的应用（将纯文字菜单拍照 → OCR识别 → 调API生图 → Vercel部署渲染）。但软件3.0范式下这个App根本不该存在！只需把照片丢给 Gemini，告诉它“直接在原图的对应位置渲染出菜品图片”，大模型直接一步输出图像结果。
未来推演 (2026+)：未来的计算机底层可能完全是神经网络（Host Process），传统的 CPU 反而沦为“协处理器 (Co-processor)”，处理一些辅助的确定性任务。

🧩 2. 可验证性与“参差不齐的智能”

“我们不是在培育动物，而是在召唤幽灵 (We are not building animals, we are summoning ghosts)。”
—— 它们没有内在动机、不觉得无聊，如果你大吼大叫，它们也不会改进。它们本质上是由统计预训练打底，外挂上强化学习（RL）回路的缝合体。

可验证性 (Verifiability) 是核心：只要结果是可验证的（例如代码编译通过、数学题答案正确），实验室就能构建巨大的强化学习 (RL) 环境，AI 的能力就会在这个垂直领域疯狂飙升。
参差不齐的智能 (Jagged Intelligence)：这就是为什么 Opus 4.7 级别的大模型能重构 10万行代码库、找出 0-day 漏洞，但如果你问“洗车店就在50米外，我该开车去还是走路去？”，它会因为“距离近”而建议你走路去洗车。
数据分布的秘密：GPT-4 下棋能力飙升不是因为变聪明了，而是有人在预训练数据中塞入了大量国际象棋数据。开发者必须搞清楚，自己的任务到底在不在大模型的 RL 电路（数据分布）内。
给创始人的建议：寻找那些目前实验室还没关注，但本质上可验证的领域，构建 RL 环境进行微调，这是巨大的机会，因为最终“一切都是可自动化的”。

🛠️ 3. 智能体工程 (Agentic Engineering)

🚀

Vibe Coding vs 智能体工程

抬高下限 vs 突破上限

能力维度的跃迁：

Vibe Coding (氛围编程)：大幅提高下限，让非专业人士也能随心所欲开发软件。
Agentic Engineering (智能体工程)：保持专业上限。协调多个不稳定的Agent去加速开发，同时不引入漏洞（不牺牲质量）。优秀的智能体工程师的效率提升远远超过传统的 10x 概念。

⚖️

品味与判断力

人类不可替代的独有价值

大模型的软肋：

品味极差：如果不在 RL 奖励范围内，Agent 生成的代码往往臃肿、丑陋、充满复制粘贴。在 micro-GPT 项目中，Andrej 多次提示模型“极简代码”，但模型就是做不到（偏离了它的分布）。
架构设计缺陷：例如 Agent 曾试图用简单的“邮箱字符串”去强行匹配 Stripe 支付和 Google 账号，而非建立规范的唯一 User ID。这类顶层设计必须由人类把控。

如果你还在让应聘者做传统的算法拼图（LeetCode），那就大错特错了。
新的面试方式：分配一个大型项目（比如写一个 Twitter 克隆版）。让候选人用 Agent 快速开发出安全、高质量的系统。
终极压测：部署完毕后，启动 10 个顶尖大模型（如 Codeq 5.4x 等），作为恶意 Agent 去疯狂攻击这个系统。候选人构建的系统必须坚不可摧。

🌐 4. 走向 Agent-Native (智能体原生) 的世界

文档不再为人类而写：Andrej 强烈吐槽现在的开发者文档依然在教人类“去这个 URL、点击那个按钮”。未来的文档应该直接提供：“你应该把这段文本复制给你的 Agent”。
传感器与执行器：未来的工作流需要彻底解耦，系统将被重构为供 Agent 读取的“传感器 (Sensors)”和供 Agent 操作的“执行器 (Actuators)”。
部署之痛的终结：在开发 MenuGen 时，写代码反而是最简单的，最痛苦的是去 Vercel 配置 DNS、连结各个服务。未来的理想形态是：输入一行提示词，Agent 从写代码到网络配置全自动搞定，人类无需触碰任何设置。
Agent 社交：未来的组织和个人都会有自己的 Agent 代理。你的 Agent 会直接跟我的 Agent 谈判并确认会议细节。

Andrej Karpathy (安德烈·卡帕西)

“你可以将‘思考’外包，但绝不能将‘理解’外包。”

⚡ 1. 软件3.0与编程范式的巨变

被超越的剥离感

转折时刻：

软件3.0 (Software 3.0)

计算机演进史：

🧩 2. 可验证性与“参差不齐的智能”

🛠️ 3. 智能体工程 (Agentic Engineering)

Vibe Coding vs 智能体工程

能力维度的跃迁：

品味与判断力

大模型的软肋：

🌐 4. 走向 Agent-Native (智能体原生) 的世界

原文

“你可以将‘思考’外包，
但绝不能将‘理解’外包。”