极致速度与黑客文化

xAI 的核心基因是“速度”。这里没有由于官僚主义造成的延迟,只有物理定律的限制。

高光时刻

Cybertruck 的 24 小时赌约

工程师 Tyler 与 Elon Musk 立下赌约:如果能在 24小时内 让刚到货的 GPU 集群跑通训练任务,就能当场赢得一辆 Cybertruck。
结果: Tyler 赢了,训练任务当晚启动,他真的拿到了一辆 Cybertruck。

文化核心

"No one tells me no" (没有阻力)

Sully 强调他在 xAI 最开心的一点是极高的自主权。如果你有好想法,当天就能实施,直接展示给 Elon 或管理层,当场获得“Yes”或“No”的反馈,没有任何中间层审批。

价值计算

单次代码提交价值 $250万

团队做过数学计算,目前推算每向主仓库提交一次代码(commit),平均创造的价值约为 250万美元。这体现了极小团队规模(约100+工程师)带来的极高杠杆率。

Colossus 基础设施奇迹

为了支撑最强模型,xAI 绕过了传统供应链和建设周期的所有常规限制。

行业记录

122天建成世界最大数据中心

Colossus 数据中心从动工到上线仅耗时 122 天。英伟达 CEO 黄仁勋称赞这是一个奇迹,普通公司通常需要数年时间。

非常规手段

像办嘉年华一样建数据中心

为了绕过漫长的永久建筑审批,xAI 利用了临时土地租赁条款(通常用于嘉年华或马戏团)。

查看电力与冷却细节
  • 电力解决方案: 当地电网无法立即满足需求,他们运来了 80台移动发电机(像卡车一样大)和巨型电池组。
  • 负载平衡: 电池组用于平滑 GPU 训练时瞬间的兆瓦级波动,因为发电机属于物理旋转设备,无法毫秒级响应负载突变。
  • 必须自建: Sully 提到,现在的 AI 规模已经不能依赖 AWS 或 Google Cloud 的通用方案,“只能自建,否则就死”。
战情室

在健身房里写代码

为了赶进度,团队长期处于“战情室”模式。最初的战情室太小,最后直接清空了公司健身房,摆满桌子,所有核心开发人员集中在一起攻坚。

神秘项目: Macro Hard

这是 xAI 内部最令人兴奋的项目之一:构建数字世界的“擎天柱”。

项目定义

人类模拟器 (Human Emulator)

如果说 Tesla 的 Optimus 机器人是为了替代物理世界的重复劳动,那么 Macro Hard 就是为了替代数字世界的重复劳动。它通过模拟人类的键盘和鼠标输入,操作任意软件,无需软件提供 API 接口。

技术路线

反共识:小模型 > 大推理

不同于其他实验室(如 OpenAI o1/o3)追求“长思考时间”的大模型,xAI 的策略是:比人类快

查看具体逻辑
  • 速度至上: 目标是模型操作速度比人类快 1.5倍到 8倍。
  • 经济学原理: 如果人类做一件事需要5分钟,没人愿意等AI思考10分钟。但如果AI能在10秒内完成,哪怕稍微笨一点,其商业价值也是巨大的。
  • 小模型优势: 小模型意味着更低的延迟、更低的推理成本,以及更快的迭代周期(训练更快)。
趣事

消失的“虚拟同事”

xAI 内部已经开始测试用 Macro Hard 作为虚拟员工。有时真人员工会在 Slack 上找某个“同事”帮忙,对方答应并叫他去工位,结果走过去发现工位是空的——那个“同事”是一个 AI 进程。

工程策略与技术栈

如何解决数百万个“虚拟员工”的算力瓶颈?答案在停车场里。

算力网络

Tesla 闲置算力 (HW4)

为了部署数百万个 Macro Hard 智能体,xAI 计划利用 Tesla 汽车的闲置算力

查看部署细节
  • 资源池: 北美有数百万辆搭载 HW4 芯片的 Tesla,它们约 80% 的时间是闲置或充电状态。
  • 双赢模式: xAI 付费租赁车主的闲置算力(可能覆盖车主的租赁费用),获得具有电源、网络和液冷的现成计算节点。
  • 资本效率: 这比购买英伟达 GPU 或租用 AWS 服务器要便宜且高效得多。
工程原则

先删除,再加回

工程团队遵循 Elon 的算法:如果一个需求或组件看起来多余,先删掉。如果报错了,再加回来。例子:为了简化架构,他们曾移除了对某些老旧视频编码器的支持,结果发现高分辨率(5K+)显示器报错,于是迅速加回。

Elon Musk 的管理哲学

在 xAI,管理层级被压缩到极限,每个人都是工程师。

组织架构

全员工程师 (Engineers Only)

xAI 几乎没有非技术岗位。即使是销售团队也是工程师,他们在训练模型来处理企业订单。公司只有三层架构:Elon -> 极少数管理者 -> 工程师。这种结构是为了减少信息传递中的“压缩损耗”。

时间观

Elon Time 的本质

Elon 经常设定看似不可能的截止日期(例如把一年的工作压到一个月)。虽然最终可能实际花了两个月,但这依然比行业标准快了 5-6 倍。这是一种通过设定极端目标来打破心理舒适区、逼近物理极限的策略。

纠错机制

Grok 错误的实时修复

当 Elon 在 X 上发现 Grok 回答错误时,他会直接发给团队。无论几点(哪怕是半夜),相关工程师会立即开启线程,修复问题,并提交事后分析(Post-mortem)。犯错可以接受,但同样的错误不能犯两次。

招聘标准与个人传奇

xAI 不看重学历光环,看重的是“黑客精神”和极简主义。

Sully 的背景

火箭引擎与指尖陀螺

Sully 并非传统优等生。
1. 指尖陀螺大亨: 高中时他在卧室建了个流水线,每两小时起床收一次 3D 打印件,最后因为生意太好被学校和县政府以“无照经营”叫停。
2. 自制火箭引擎: 他曾买教科书自学,在自家车库用 4 周时间造出了液体火箭引擎。测试当晚因为 USB 线不够长,他不得不近距离点火,导致羽绒服着火。

面试题

寻找“10行代码”的人

Sully 的面试题通常是他自己解决过的真实难题。他发现:
现在的 AI 辅助编程往往会生成 200 行臃肿代码。
而他要找的是那些能思考出 10行极简代码 解决方案的人。xAI 需要的是能驾驭 AI 的人,而不是被 AI 糊弄的人。

特质

对权威的健康不敬

xAI 喜欢那些敢于挑战需求、敢于对老板说“这不符合物理定律”或“这个需求是错的”的人。顺从的人在这里无法生存。

原文

源链接