张小珺商业访谈录:对话Rokid创始人祝铭明

摘要生成日期: 2025年10月28日

主讲人: 祝铭明 (Misa)

年龄: 49岁

现任: Rokid (灵伴科技) 创始人 & CEO

教育背景:

职业经历:

核心摘要

第一次创业:从车库到被阿里收购

祝铭明的第一次创业始于2007年,受到iPhone一代发布的启发,他决定为智能手机开发一个通用的操作系统。公司起初只有二十几个人,在杭州一个民居的地下室办公。 他选择了一个“很多人不敢去做”的艰难方向。

在公司资金即将耗尽,账上仅剩不到4000元,离发薪日仅两周的绝望时刻,他甚至做好了让员工搬电脑抵工资的准备。 幸运的是,之前接触过的阿里巴巴在此时伸出了援手。整个过程颇具戏剧性:最早由马云(马总)引荐给谢世煌(韭菜),再由谢世煌安排与王坚博士会面

阿里先是在2009年5月投资了100万美元,一年后,在2010年1000万美元的价格完成了对公司的全资收购。 祝铭明做出了一个关键决定:将所有收购金全部置换成了阿里巴巴的股票,理由是当时的他“不知道用钱来干什么”,不如反向投资看好的阿里。

阿里岁月:M-lab与AI入口的早期探索

加入阿里后,祝铭明先是负责云OS项目。之后,在时任阿里CTO王坚(吴妈)的支持下,成立了M-lab,这是一个专注于前沿AI研究的实验室。 M-lab的核心使命是“定义新的入口”,主要聚焦于摄像头和麦克风这两个方向。

在此期间,他的团队取得了显著成果:

  • 开发了阿里体系内最早的二维码和条形码扫描技术,早于腾讯。
  • 主导了淘宝著名的“以图搜图”(拍立淘)功能,这是多模态搜索的早期应用。
  • 2012-2013年,M-lab成为国内第二家大规模采购GPU用于深度学习研究的团队,与百度的于凯团队同期。

祝铭明对他对“入口”的痴迷贯穿其职业生涯,他认为每一次科技变革都是由交互和信息入口的迁移引爆的。

二次创业:Rokid的诞生与战略摇摆

在阿里工作四年后,祝铭明于2014年7月18日离职创立了Rokid。 他认为自己想做的“AI+AR”项目不确定性太高、投入太大(预计至少10亿,5年时间),在大公司体系内难以施展,因此选择独立创业。 离开时,他得到了阿里高层的理解和支持,前CTO王坚(吴妈)成为其天使投资人,IDG、胡泽明(91助手创始人)、王淮(线性资本)等也参与了天使轮。

Rokid从第一天起的愿景就是做AI和AR结合的眼镜产品。 但由于当时AR技术远未成熟(预估2019-2020年才可能成熟),公司采取了“AI”和“AR”两条腿走路的策略:

  • AI产品线:先通过技术相对成熟的AI产品(如智能音箱)切入市场,打磨硬件、供应链能力,并与市场保持接触。
  • AR产品线:2015年底成立AR Lab,2016年在硅谷设立Reality Lab,进行长期的技术研发和储备。

然而,智能音箱市场很快演变成巨头(阿里、小米)补贴烧钱的“不健康竞争”。 祝铭明认为音箱只是一个产品,而非平台级入口,因为它场景有限、非碎片化,不值得投入巨大资源进行消耗战。

关键抉择:All in AR与疫情中的转机

2019年10月,祝铭明做出了创业生涯中最痛苦但至关重要的决策:战略转型,全面放弃AI消费电子(智能音箱)业务,All in AR赛道。 这个决定是在一个星期内完成的,导致公司裁员约60%,几乎清空了负责音箱业务的整栋办公楼。 他坦言,这个决策的痛苦主要在于“舍不得人才”,但从财务和战略角度看,这是一个被竞争环境“被迫提前”但又“做得太晚”的决定

这次转型的时机充满了戏剧性。Rokid在2020年1月15日举办了第一场AR眼镜招商会,仅仅5天后(1月20日),疫情爆发,杭州封城。 祝铭明感叹:“只要再晚一个星期,公司可能就面临灭顶之灾了。”

疫情反而成为了Rokid的转机。其AR眼镜配合红外传感器可用于无接触、批量测温,产品迅速大卖,销往80个国家,公司的营收在2021年至2023年间每年翻一倍。 这段经历不仅验证了产品,也为公司带来了宝贵的现金流和发展基础。

技术挑战与未来机遇

当前面临的技术挑战

1. 量产工艺难题:祝铭明指出,最大的困难是带显示功能的AI眼镜此前从未有过大规模量产的先例。这意味着所有生产工艺、产线都需要从零开始验证。作为一家创业公司,本不应承担探索和定义全新工业流程的角色,但由于行业巨头选择了不同的技术路线(如Apple Vision Pro),Rokid不得不成为“探路者”。

2. 功耗与续航瓶颈:续航是所有随身智能设备的核心痛点。祝铭明强调,Rokid的核心优势在于其自研的操作系统(OS)能进行深度功耗优化,使其产品续航(4-6小时)显著优于竞争对手(如Meta的3-4小时)。这反面说明,功耗控制是当前行业普遍的技术壁垒

3. 硬件平台期限制:硬件的发展并非线性,而是阶梯式、有平台期的。Rokid可以通过努力在产品定义上取得12-18个月的领先,但之后整个产业链的能力会趋同,后来者可以迅速追赶。想要获得更长的领先优势,则需要对上游材料、基础科学进行巨大投资,这超出了创业公司的能力范围。

4. 终极产品形态的不确定性:祝铭明最看不清楚的问题是,Rokid两条产品线——主打娱乐消费的AR Lite和主打AI助手的Rokid Glass,“多久能变成一个产品?”。技术路径、融合时间点都还在探索中,这代表着终极产品的形态和实现方式仍有变数。

未来的核心机遇

1. AI与AR的融合,成为下一代平台:这是祝铭明最大的Bet。他坚信,AI的“蓄水池”已经蓄满,而AR眼镜是释放AI能力、实现“信息直达”的最佳载体。机遇在于创造一个能够部分替代手机,处理所有碎片化信息交互的新平台,成为用户“长在脸上”的智能器官。

2. 生态系统共建:祝铭明非常清醒地认识到,单靠一家公司无法建立起完整的生态系统。他将Rokid定位为“搭台者”,做好基础的OS、硬件和核心体验,然后寻找“盟军”(如腾讯)进行合作,共同建设内容、社交和应用生态。这为与其他巨头和开发者合作创造了巨大的想象空间。

3. 巨头的“时间差”窗口:大公司往往采取“敢为人后”的策略,等待市场和技术成熟后再入场。这为Rokid等先行者创造了2-3年的宝贵时间窗口。机遇在于利用这段时间,快速迭代产品、积累用户口碑、建立品牌心智和开发者生态,从而在巨头入场时能够拥有“对等竞争”的资格。

关于录音功能

访谈中没有提及Rokid有独立的“录音产品”。但是,音频与视频的录制是其智能眼镜的核心内置功能,服务于更上层的AI交互和社交分享,而非作为单一的录音笔功能存在。

  • 音频输入 (麦克风): 这是实现语音交互的基础。用户通过麦克风下达指令,如“若琪今天天气怎么样”,或进行实时翻译。其核心是即时处理,而非长时间被动录音。
  • 视频/图像输入 (摄像头): 摄像头被定义为“好相机”,是实现“以图搜图”、拍照、录制短视频分享等功能的基础。祝铭明提到Meta的眼镜更偏向社交,就是围绕“拍个照、分享一个视频”。Rokid的AI眼镜则更进一步,利用摄像头进行实时识别,如“看一下对面这是谁”

总的来说,录音录像是作为眼镜“眼”和“耳”的感知能力而存在,是实现更智能、更便捷交互的手段,而非目的本身。

产品哲学与未来展望:AR终将取代手机?

祝铭明坚信AR眼镜是AI时代的终极个人计算平台,会改变甚至取代手机。 他认为眼镜的核心优势在于“Always On”(永远在线)“信息直达”,能够消除手机解锁、打开App等中间步骤,实现前所未有的便捷。 他将AR眼镜比作手机,而VR则更像PS游戏机,因其无法“Always On”,难以成为真正的AI载体。

Rokid当前的产品策略是双线并行:

  • AR Lite系列:强调丰富内容和生态,作为“随身带”(Portable)的娱乐设备,目前用户日均使用时长已超过2小时
  • Rokid Glass系列(AI眼镜):定义为“一副好眼镜+好耳机+好相机+好助手”,强调“可穿戴”(Wearable)和工具属性。

他看不清楚的最大问题是,这两条产品线何时能最终融合成一款完美的产品。 他预测,3-5年内,为戴眼镜的人群加上AI功能会成为普及现象。

面对巨头入场的竞争,祝铭明引用马云的“四个不”理论(看不见、看不懂、看不上、来不及),认为AR眼镜是巨头“看得见、看得懂”的领域,创业公司的窗口期在于能否在巨头“看不上”的阶段,做到让他们“来不及”。 他认为眼镜市场不会赢者通吃,而是多寡头竞争,Rokid的目标是“能上大人那桌吃饭”。

原文

源链接