AI编程的现状与未来

一次关于Replit AI Agent、长程推理与AGI边界的深度对话

访谈嘉宾:Amjad Masad

职位:Replit 联合创始人兼 CEO

简介:一位杰出的程序员和企业家,出生于约旦。他早期在Facebook工作,是React.js等现代JavaScript工具链的核心贡献者之一。为了降低编程门槛,他创立了Replit,一个强大的在线集成开发环境(IDE),并率先将其与强大的AI Agent结合,致力于让编程像说英语一样简单。

主持人:Marc Andreessen (推断)

职位:Andreessen Horowitz (a16z) 联合创始人

简介:硅谷传奇人物,互联网浏览器的先驱(Netscape Navigator)。作为顶尖风险投资家,他对技术趋势有深刻的洞察力。访谈风格深入浅出,善于从宏观和微观层面探讨技术的影响。

AI编程体验:从自然语言到可运行的应用

核心事实:Replit平台允许用户,无论是编程新手还是专家,直接使用自然语言(如英语、日语)描述他们的想法,AI Agent会自动完成从环境配置、代码编写到部署的全过程。

用户只需在提示框中输入想法,例如“我想在网上卖可丽饼(I want to sell crepes online)”。

  • AI会解析需求,并自动选择最佳技术栈(例如,数据应用选Python,Web应用选JavaScript + Postgress)。
  • AI会生成任务列表,清晰地展示它将要执行的步骤,如设置数据库、集成支付接口(Stripe)、编写前端代码等。
  • 整个过程是自动化的,用户无需关心复杂的“意外复杂性”(Accidental Complexity),只需专注于“本质复杂性”(Essential Complexity),即他们的商业想法本身。

核心观点:编程的最终瓶颈是代码语法本身。自然语言(如英语)是终极的编程语言,AI正在帮助我们跨越这最后一道障碍。

AI Agent的能力边界:长程推理的挑战与突破

AI Agent完成复杂任务的关键在于长程推理Long-Horizon Reasoning:指AI在长时间内、通过多个步骤解决复杂问题,并保持逻辑一致性的能力。。早期的AI Agent只能维持几分钟的“理智”,之后就会因错误累积而“精神错乱”。

核心事实:近年来,AI Agent的长程推理Long-Horizon Reasoning:指AI在长时间内、通过多个步骤解决复杂问题,并保持逻辑一致性的能力。能力取得了指数级增长。这得益于两大技术突破:

  1. 强化学习 (RL)Reinforcement Learning:一种机器学习方法,模型通过与环境互动,根据获得的奖励或惩罚来学习最佳行为策略。类似于教AI“试错”。通过让AI在真实编程环境中解决问题(如修复bug)并给予奖励,模型学会了如何规划和执行复杂的任务链。
  2. 验证循环 (Verification Loop):引入一个“验证者”Agent。一个Agent工作20分钟后,另一个Agent会启动一个浏览器来测试前者的工作成果,发现bug后启动新的任务链进行修复。这种“接力赛”模式极大地延长了Agent的有效工作时间。

Replit Agent 迭代数据:

  • Agent 1 (2023年): 可持续工作 2分钟
  • Agent 2 (2024年2月): 可持续工作 20分钟
  • Agent 3 (当前): 可持续工作 200分钟 (约3.3小时),部分用户测试长达12小时。

核心观点:AI Agent的工作速度已经超过了人类,但并非瞬时的“计算机速度”。它更像是在观看一个精力旺盛、不知疲倦的顶尖程序员(如嗑了药的John Carmack)在为你工作。它会思考、反思、查阅资料,然后再继续执行。

软件工程的核心变迁:从“工匠”到“导演”

访谈深刻揭示了AI对软件工程师角色和工作核心的颠覆性影响。软件开发的核心正在从技术实现细节转向商业思想的表达。

过去与现在的核心:驾驭“意外复杂性”

传统软件工程的核心,是处理计算机科学家Fred Brooks所定义的“意外复杂性”Accidental Complexity:指那些与问题本质无关,但由我们使用的工具和技术带来的复杂性。例如配置环境、管理依赖库、处理框架兼容性等。。工程师的大量时间都耗费在:

  • 搭建和配置开发环境。
  • 选择和管理包、依赖库(Package Manager)。
  • 编写和调试具体的语法(Syntax)。
  • 处理部署流水线(Deployment Pipeline)。

在这个模式下,工程师的核心是技术工匠,需要精通工具链的每一个环节。

未来的核心:专注“本质复杂性”

随着AI Agent的成熟,所有“意外复杂性”都将被自动化。未来的软件开发核心将是“本质复杂性”Essential Complexity:指问题本身固有的、无法消除的复杂性。例如,“我的创业公司应该如何进入市场?”或“这个产品的核心业务逻辑是什么?”。人类开发者的角色将彻底转变:

  • 从“输入语法”到“输入思想” (Typing Thoughts):开发者不再是代码的编写者,而是思想、创意和产品需求的提出者。
  • 从“工程师”到“产品经理/设计师/导演”:人类的核心工作是进行高层次的规划、设计、定义功能、迭代创意,并指挥AI Agent团队去执行。
  • 从“单打独斗”到“与AI团队协作”:开发者将同时启动多个AI Agent,分别负责后端重构、新功能开发、数据库优化等,而人类则扮演项目总监的角色。

在这个新模式下,人类的核心是商业与创意的驱动者,AI则成为那个不知疲倦、技术高超的“工匠”。

AI编程的适用领域:全栈通吃,尤其擅长端到端开发

核心观点:AI Coding并非只适用于某一特定领域,它最强大的地方在于能够处理从想法到部署的完整端到端(End-to-End)工作流。尤其对于“绿地项目”(Greenfield Projects,即从零开始的新项目)或独立的功能模块,AI能发挥最大效能。

各开发领域适用性分析:

  • 后端开发 (Backend): 极度适合。AI可以自动完成数据库设计(如Postgress)、编写SQL迁移脚本、设置API接口、集成第三方服务(如Stripe支付、Shopify电商),处理核心业务逻辑。
  • DevOps与基础设施 (Infrastructure): 极度适合。AI能够自动化整个部署流程,包括配置云服务器(虚拟机)、部署数据库、建立CI/CD流水线,将应用一键发布到云端。
  • 前端开发 (Frontend): 非常适合。AI可以根据需求生成UI设计和代码,构建交互界面。更重要的是,它能启动一个无头浏览器,像真人一样点击和测试网页,实现自动化UI测试和Bug修复。
  • 脚本与数据分析 (Scripting & Data Analysis): 非常适合。对于数据可视化、自动化脚本编写等任务,AI可以快速理解需求并生成相应的Python等代码来解决问题。

总而言之,AI Coding的优势在于其“全栈能力”和“系统整合能力”。它不仅仅是一个代码片段生成器,更是一个能够理解宏观目标,并自主规划、执行、测试、部署所有必要技术环节的“全能工程师”。

AI的“硬”与“软”:为何编程领域进展最快?

AI在不同领域的发展速度存在巨大差异。进展神速的领域通常具备一个共同特征:结果的可验证性

进展迅速的“硬”领域:

  • 编程:代码能否编译通过、单元测试是否成功,都有明确的、非黑即白的答案。
  • 数学/物理:公式是否正确、模拟结果是否符合预期,可以被严格证明。
  • 生物信息学:蛋白质折叠预测等有明确的物理结构作为验证标准。

进展相对缓慢的“软”领域:

  • 医疗诊断:慢性病等诊断标准模糊,缺乏即时、确定的验证方法。
  • 法律/人文:判决或论点的“正确性”充满主观和争议,不存在唯一的标准答案。
  • 复杂社会问题:如“新冠病毒起源”,这类问题信息不全且充满争议,AI难以进行有效的长程推理Long-Horizon Reasoning:指AI在长时间内、通过多个步骤解决复杂问题,并保持逻辑一致性的能力。

核心数据:在衡量AI软件工程能力的SWE-bench一个权威的基准测试,用于评估AI模型解决真实世界GitHub仓库中复杂软件工程问题的能力。上,AI模型的解决率从2024年初的不到5%飙升至了约82%,接近饱和。

核心观点:AI的“智力”目前更擅长在有明确规则和反馈的“游戏”中提升。对于那些答案模糊、充满主观性的领域,AI的进展速度远不如编程等“硬”科学领域。

AGI之路:是接近终点,还是陷入“局部最优”陷阱?

尽管AI技术日新月异,但我们是否真的走在通往AGIArtificial General Intelligence (通用人工智能):指具备与人类同等智慧,或超越人类智慧的AI,能够理解、学习和应用其智能来解决任何问题。的正确道路上,业界存在巨大争议。

悲观的观点(局部最优陷阱):

  • 经济价值的陷阱:当前的大语言模型(LLM)在特定任务(如编程、内容生成)上已经足够好,能够创造巨大的经济价值。这使得大量资源都投入到优化现有架构上,而不是探索可能通往AGI的全新路径。这就像陷入了一个“局部最优”的山峰,而错过了旁边更高的主峰。
  • 缺乏迁移学习Transfer Learning:指模型在一个任务上学到的知识,能够被应用于解决另一个不同但相关的任务。这是衡量通用智能的关键指标。目前,在编程领域的巨大进步并没有显著提升AI在医疗或法律等领域的通用推理能力。每个领域似乎都需要独立的、大量的专用数据和训练。
  • 数据瓶颈:我们几乎已经“吸干”了互联网上所有高质量的人类数据,高质量训练数据的生成变得越来越困难和昂贵,这可能是增长的根本限制。

矛盾的心态:

我们正处在一个奇怪的心理状态中:一方面,我们为AI所展现出的、五年前还被认为是“魔法”的能力而感到无比兴奋;另一方面,我们又因其尚未达到理想中的AGI,甚至感觉进展开始放缓而感到失望甚至焦虑。

一个有趣的事实:AI领域的目标一直在“移动”。曾经,击败人类国际象棋冠军、通过图灵测试被视为AI的圣杯。但当AI实现这些后,人们迅速将它们贬低为“没什么了不起的”,并设立了新的、更高的目标。

创始人的故事:从约旦黑客少年到硅谷CEO

Amjad Masad的经历本身就是一个关于技术、热爱与机遇的传奇故事。

  • 童年与启蒙:1987年出生于约旦安曼。6岁时,父亲贷款买回了社区第一台电脑,这台运行着DOS系统的IBM PC点燃了他对编程的热情。
  • 第一次创业:12岁时,他为当地的网吧开发了一套计费管理系统,并成功将其销售出去,赚到了人生的第一桶金。
  • Replit的起源:在大学期间,他厌倦了每次学习新编程语言都要经历繁琐的环境配置过程。他坚信编程应该像打开网页一样简单,于是萌生了创建在线IDE的想法,并基于Emscripten一个开源的编译器工具链,可以将C/C++等语言编译成高性能的WebAssembly,从而让它们在网页浏览器中运行。技术,率先将Python等多种语言移植到浏览器中运行。这就是Replit的雏形。
  • 改变命运的黑客事件:因沉迷编程而时常翘课,Amjad面临无法毕业的困境。极度沮丧之下,他花费两周时间,通过SQL注入SQL Injection:一种常见的网络攻击技术,攻击者通过在输入字段中插入恶意的SQL代码,来欺骗数据库执行非预期的命令,从而获取或修改数据。漏洞成功黑入了大学的成绩数据库,修改了自己的成绩。

    然而,由于数据库的一个设计缺陷(修改成绩后,一个“禁止考试”的标志位未被清除),导致整个注册系统崩溃。校方最终追查到他。面对由各位院长组成的“审判庭”,他坦白了一切,并现场用白板讲解了自己的攻击方法和系统漏洞。他的技术能力和坦诚态度赢得了校长的欣赏,最终获得了改过自新的机会,并顺利毕业。这个戏剧性的经历成为了他人生的一个重要转折点。
  • 来到硅谷:他开源的项目被Codecademy等公司使用,最终他接受了工作邀请,获得了O-1杰出人才签证,来到了他梦想中的硅谷,并最终创立了Replit。

原文

源链接