极致速度与黑客文化
xAI 的核心基因是“速度”。这里没有由于官僚主义造成的延迟,只有物理定律的限制。
工程师 Tyler 与 Elon Musk 立下赌约:如果能在 24小时内 让刚到货的 GPU 集群跑通训练任务,就能当场赢得一辆 Cybertruck。
结果: Tyler 赢了,训练任务当晚启动,他真的拿到了一辆 Cybertruck。
Sully 强调他在 xAI 最开心的一点是极高的自主权。如果你有好想法,当天就能实施,直接展示给 Elon 或管理层,当场获得“Yes”或“No”的反馈,没有任何中间层审批。
团队做过数学计算,目前推算每向主仓库提交一次代码(commit),平均创造的价值约为 250万美元。这体现了极小团队规模(约100+工程师)带来的极高杠杆率。
Colossus 基础设施奇迹
为了支撑最强模型,xAI 绕过了传统供应链和建设周期的所有常规限制。
Colossus 数据中心从动工到上线仅耗时 122 天。英伟达 CEO 黄仁勋称赞这是一个奇迹,普通公司通常需要数年时间。
为了绕过漫长的永久建筑审批,xAI 利用了临时土地租赁条款(通常用于嘉年华或马戏团)。
查看电力与冷却细节
- 电力解决方案: 当地电网无法立即满足需求,他们运来了 80台移动发电机(像卡车一样大)和巨型电池组。
- 负载平衡: 电池组用于平滑 GPU 训练时瞬间的兆瓦级波动,因为发电机属于物理旋转设备,无法毫秒级响应负载突变。
- 必须自建: Sully 提到,现在的 AI 规模已经不能依赖 AWS 或 Google Cloud 的通用方案,“只能自建,否则就死”。
为了赶进度,团队长期处于“战情室”模式。最初的战情室太小,最后直接清空了公司健身房,摆满桌子,所有核心开发人员集中在一起攻坚。
神秘项目: Macro Hard
这是 xAI 内部最令人兴奋的项目之一:构建数字世界的“擎天柱”。
如果说 Tesla 的 Optimus 机器人是为了替代物理世界的重复劳动,那么 Macro Hard 就是为了替代数字世界的重复劳动。它通过模拟人类的键盘和鼠标输入,操作任意软件,无需软件提供 API 接口。
不同于其他实验室(如 OpenAI o1/o3)追求“长思考时间”的大模型,xAI 的策略是:比人类快。
查看具体逻辑
- 速度至上: 目标是模型操作速度比人类快 1.5倍到 8倍。
- 经济学原理: 如果人类做一件事需要5分钟,没人愿意等AI思考10分钟。但如果AI能在10秒内完成,哪怕稍微笨一点,其商业价值也是巨大的。
- 小模型优势: 小模型意味着更低的延迟、更低的推理成本,以及更快的迭代周期(训练更快)。
xAI 内部已经开始测试用 Macro Hard 作为虚拟员工。有时真人员工会在 Slack 上找某个“同事”帮忙,对方答应并叫他去工位,结果走过去发现工位是空的——那个“同事”是一个 AI 进程。
工程策略与技术栈
如何解决数百万个“虚拟员工”的算力瓶颈?答案在停车场里。
为了部署数百万个 Macro Hard 智能体,xAI 计划利用 Tesla 汽车的闲置算力。
查看部署细节
- 资源池: 北美有数百万辆搭载 HW4 芯片的 Tesla,它们约 80% 的时间是闲置或充电状态。
- 双赢模式: xAI 付费租赁车主的闲置算力(可能覆盖车主的租赁费用),获得具有电源、网络和液冷的现成计算节点。
- 资本效率: 这比购买英伟达 GPU 或租用 AWS 服务器要便宜且高效得多。
工程团队遵循 Elon 的算法:如果一个需求或组件看起来多余,先删掉。如果报错了,再加回来。例子:为了简化架构,他们曾移除了对某些老旧视频编码器的支持,结果发现高分辨率(5K+)显示器报错,于是迅速加回。
Elon Musk 的管理哲学
在 xAI,管理层级被压缩到极限,每个人都是工程师。
xAI 几乎没有非技术岗位。即使是销售团队也是工程师,他们在训练模型来处理企业订单。公司只有三层架构:Elon -> 极少数管理者 -> 工程师。这种结构是为了减少信息传递中的“压缩损耗”。
Elon 经常设定看似不可能的截止日期(例如把一年的工作压到一个月)。虽然最终可能实际花了两个月,但这依然比行业标准快了 5-6 倍。这是一种通过设定极端目标来打破心理舒适区、逼近物理极限的策略。
当 Elon 在 X 上发现 Grok 回答错误时,他会直接发给团队。无论几点(哪怕是半夜),相关工程师会立即开启线程,修复问题,并提交事后分析(Post-mortem)。犯错可以接受,但同样的错误不能犯两次。
招聘标准与个人传奇
xAI 不看重学历光环,看重的是“黑客精神”和极简主义。
Sully 并非传统优等生。
1. 指尖陀螺大亨: 高中时他在卧室建了个流水线,每两小时起床收一次 3D 打印件,最后因为生意太好被学校和县政府以“无照经营”叫停。
2. 自制火箭引擎: 他曾买教科书自学,在自家车库用 4 周时间造出了液体火箭引擎。测试当晚因为 USB 线不够长,他不得不近距离点火,导致羽绒服着火。
Sully 的面试题通常是他自己解决过的真实难题。他发现:
现在的 AI 辅助编程往往会生成 200 行臃肿代码。
而他要找的是那些能思考出 10行极简代码 解决方案的人。xAI 需要的是能驾驭 AI 的人,而不是被 AI 糊弄的人。
xAI 喜欢那些敢于挑战需求、敢于对老板说“这不符合物理定律”或“这个需求是错的”的人。顺从的人在这里无法生存。