Arvind Jain (阿尔文·贾殷)

Glean 联合创始人兼 CEO

  • Glean 联合创始人 & CEO
  • Rubrik 联合创始人
  • Google 早期员工 (搜索团队)

核心观点摘要

  • 旧范式: 传统搜索是静态的、基于关键词的匹配,在文档中查找词语。
  • 新范式 (LLM驱动): 大语言模型 (LLM) 彻底改变了搜索。 它们能真正深入理解用户问题的“意图”和文档的“概念”,实现概念层面的匹配,不再脆弱。
  • Glean的先发优势: 公司于2019年初成立时,就已开始使用 Transformer 架构 (BERT模型) 进行内部所谓的“嵌入搜索”(Embedding Search),这比“向量搜索”和“RAG”等术语流行起来要早得多。
  • 历史困境: 过去的市场是“公司的坟场”,主要原因是数据接入极其困难。在前SaaS时代,信息散落在本地数据中心和不同的存储系统中,无法构建一个统一、便捷的产品。
  • 关键转折点: SaaS 的兴起是解锁企业搜索难题的钥匙。 现代企业工具(如 Google Docs, Slack)提供了标准化的API,使得内容获取变得容易,从而可以构建一个“开箱即用”(turnkey) 的产品。
  • Glean的创立契机: Arvind 在他之前的公司 Rubrik 亲身经历了信息查找的痛苦。当他想购买一个解决方案时,发现市场上空无一物,这直接催生了创立 Glean 的想法。
  • 挑战一:规模爆炸: 企业内部信息量巨大。Glean 的一个大客户拥有超过10亿份文档,这相当于2004年整个互联网的文档数量。这要求系统具备极高的可扩展性。
  • 挑战二:超越语义的相关性: 仅靠语义匹配远远不够。 必须结合传统信息检索 (IR) 的信号,如时效性 (freshness)权威性 (authority)正确性,才能从海量信息中筛选出真正有价值的结果。
  • 挑战三:安全与权限: 这是企业AI应用最根本的问题。 企业内约90%的知识都是私有的。Glean 会为每一份文档追踪其访问权限,确保用户在搜索时,返回的结果严格遵守其个人权限设置,防止信息泄露。
  • 产品演进: 从一个提供链接列表的“Google式”搜索引擎,演变为一个对话式的“企业版ChatGPT” (Glean Assistant)
  • 平台化: 进一步发展为平台,允许客户为特定业务场景(如HR、法务)构建专用的AI应用或智能体 (Agents)。这些应用使用经过审核的、可信的知识源,确保回答的准确性和合规性。
  • 市场进入策略 (GTM): Glean 被迫采用自上而下的企业直销模式。 因为产品特性决定了它必须在全公司范围内部署(即使只为一名员工服务,也需索引全公司数据),这使得个人用户或小团队试用的 PLG (产品驱动增长) 模式在经济上不可行。
  • 对“好搜索”的恐惧: 一个出乎意料的挑战是,客户害怕过于强大的搜索工具,因为它会暴露公司内部的治理漏洞和敏感信息泄露风险。这反向推动 Glean 成为一个兼具安全和治理能力的产品。
  • AI的“反直觉”性: 用户并不知道如何与强大的AI进行有效交互。 过去20年被Google训练得习惯于输入1-2个关键词,他们不会自然地写出长篇、详细的指令。
  • 教育的重要性: 企业在追求AI的ROI时,往往忽视了对员工的教育和引导。必须通过提示和范例,教会员工如何利用AI,将他们培养成“AI优先”的工作者。
  • 宏大愿景: 未来,每个人都将拥有一个由AI组成的“个人团队”,包括AI助理、AI同事和AI教练。
  • 团队能力: 这个团队将是高度个性化的,了解你的工作,能主动为你完成90%的工作,并帮助你提升技能,让你成为效率提升10倍的“10xer”。
  • 实现路径: 这是 Glean Assistant 产品持续演进的最终目标,将CEO级别的工作辅助能力普及给每一位员工。

原文

源链接