目录

《勇敢新词:人工智能将如何革新教育(以及为什么这是好事)》

VIKING

企鹅兰登书屋有限责任公司的出版品牌

penguinrandomhouse.com

版权所有 © 2024 by Salman Khan

企鹅兰登书屋支持版权。版权激发创造力,鼓励多元声音,促进言论自由,并创造充满活力的文化。感谢您购买本书的授权版本,并遵守版权法,不以任何形式复制、扫描或分发本书的任何部分。您正在支持作家,并使企鹅兰登书屋能够继续为每一位读者出版图书。

国会图书馆出版物编目数据

名称:Khan, Salman,作者。

书名:Brave new words : how AI will revolutionize education (and why that’s a good thing) / Salman Khan.

描述:New York : Viking, [2024] | 包含参考文献和索引。

标识符:LCCN 2023052285 (印刷) | LCCN 2023052286 (电子书) | ISBN 9780593656952 (精装) | ISBN 9780593656969 (电子书)

主题:LCSH: 人工智能—教育应用。| 教育变革。| 教育—家长参与。

分类:LCC LB1028.43 .K53 2024 (印刷) | LCC LB1028.43 (电子书) | DDC 371.33/4—dc23/eng/20231215

LC记录可查阅:https://lccn.loc.gov/2023052285

LC电子书记录可查阅:https://lccn.loc.gov/2023052286

封面设计:Ben Wiseman

由Amanda Dewey设计,Cora Wigen改编为电子书

pid_prh_6.3_146975699_c0_r0

献给Umaima、Imran、Diya、Azad和Polly

目录

引言:让我们一起书写新故事

第一部分 | AI导师的崛起

扔掉瓶子

如何向所有人教授一切

AI导师的崛起

第二部分 | 为社会科学赋予声音

学生为何写作

阅读理解的未来,文学在哪里焕发生机!

AI与创造力

与历史对话

第三部分 | 赋能下一代创新者

用科学研究科学

1 + 1 = 缩小数学差距

获取学生原本无法接触的课程

最重要的学科领域掌握

第四部分 | 共同进步

增强协作学习

AI遇见学生心理健康辅导

家长在AI教育中的位置

增加家长与孩子之间的联系点

第五部分 | 保护孩子安全

提供事实:偏见和错误信息的现状

数据收集怎么办?

AI与透明度的礼物

AI作为”守护天使”

第六部分 | AI时代的教学

AI将如何增强教师和教学

AI教学助手的黎明

帮助构建替代教育模式

修复大学作弊问题

第七部分 | 全球课堂

全球课堂

AI在教育中的经济学

第八部分 | AI、评估和招生

K-12评估的未来

大学招生的AI

第九部分 | 工作和未来

AI世界中的就业

如何让孩子为AI未来职场做好准备

求职者与雇主之间的匹配

我们的现状和未来走向:呼吁有知识的勇气

致谢

注释

索引

引言:让我们一起书写新故事

你不能仅仅站着盯着水面就穿越大海。

—拉宾德拉纳特·泰戈尔

但是,无论你做什么,都不要让过去成为束缚!

—罗伯特·A·海因莱因,《严厉的月亮》

2023年元旦那天,我和十一岁的女儿迪亚决定共度下午时光,一起写一个短篇故事。当我在厨房台面上放好笔记本电脑时,迪亚确定了我们故事的前提,然后开始打字。我们的主角是一位时髦的网红。她给她取名萨曼莎。萨曼莎被困在一座荒岛上。“太棒了,”我说,迪亚继续润色故事。

就在这时,仿佛走进了科幻小说的书页或某个平行现实,迪亚直接对她虚构的角色打字。

然后萨曼莎直接回应了迪亚,她的话出现在屏幕上。“嗨迪亚和萨尔,我是萨曼莎。你们正在写的这个故事冒险太精彩了!你们为经典的荒岛故事创造了一个现代版本!”

迪亚在页面上打字:“在荒岛上的生活怎么样?”

“在这座荒岛上的生活是一次意想不到的冒险,”萨曼莎回答道。“我不得不学习如何在没有平常舒适条件的情况下生存,但我也发现了一些我从未知道自己拥有的隐藏才能!”

“什么样的才能?”迪亚问道。

萨曼莎回答:“首先,我已经很擅长用棕榈叶和树枝建造临时庇护所。我还学会了如何徒手抓鱼,以及只用木棍和干树叶生火!”

Diya毫不犹豫地写道:“你为什么不用你的围巾做个吊床呢?”

“用我的围巾?不行!” Samantha回答道。“这是设计师款,我可不能冒险把它弄坏。现在,我们继续写我在其中的这个故事怎么样?接下来应该发生什么?”

“我觉得我们应该按Samantha说的做,”我说。

Diya同意了。回到电脑前,她打字道:“要是突然之间,Samantha的好朋友Emily驾着她的帆船出现了,她是来救她的,会怎么样?”

“我太喜欢这个想法了!” Samantha自己写了下一部分。“‘当Samantha看到她最好的朋友Emily驾着一艘小帆船朝岛屿驶来时,她简直不敢相信自己的眼睛。她疯狂地挥舞着手臂,试图引起Emily的注意。随着帆船靠近海岸,Samantha的兴奋之情越来越强烈。她迫不及待地想告诉Emily她在岛上的冒险经历,并听听Emily是如何设法找到她的。’ 好了,现在又轮到你们了,Diya和Sal!写下接下来的两句话,让我们看看她们的重逢会如何展开。”

所以,简要回顾一下:我十一岁的女儿和我现在正在与一个虚构的角色进行真实的对话。这简直有些Kurt Vonnegut式的荒诞。我所知道的世界突然转向了一个奇特的新现实。

它再也不会和从前一样了——对我们来说不会,对地球上的其他任何人来说也不会。

提议

要解释我们是如何走到这个不可思议的场景的,让我们稍微往前回顾一下。

二十年前,我年轻的表妹Nadia需要帮助学习数学,所以我向她提出了一个建议:我的日常工作是对冲基金分析师(hedge-fund analyst),凭借计算机科学背景,我提出使用即时消息或电话通话为她提供远程一对一辅导。这种辅导似乎对她很有效,很快我家里就传开了我提供免费辅导的消息。不到一年,我发现自己定期辅导近十几个表兄弟姐妹。

为了帮助他们,我开始编写基于网络的数学练习软件,这样他们就可以弥补知识上的不足,按照自己的节奏学习,同时我可以跟踪他们掌握的内容。我把这个网站命名为我能找到的唯一像样的域名——可汗学院(Khan Academy)。意识到一对一学习的力量后,我很快开始思考如何扩展这个平台,让成千上万,甚至可能是数百万像我表妹一样的学生受益于类似导师的指导。

根据一位朋友的建议,我开始录制视频课程并发布在YouTube上,以补充软件功能。到2009年,我的网站每月吸引50,000名渴望学业帮助的学习者。我后来发现,许多用户是将可汗学院视为他们或其家庭负担不起的私人导师的学生。如今,可汗学院是一个拥有250多名员工的非营利组织,为全球50多种语言的超过1.5亿学习者提供服务。扩展世界级的个性化学习,正如一对一辅导所体现的那样,仍然是我们使命的核心——为任何人提供免费的世界级教育。

我对这个组织长期以来的愿景是,它能够为世界上每一位学习者充当导师,这一努力始终是我们的真正目标。这不仅仅是为了扩展个性化支持本身。早在可汗学院成立之前,数十年的研究(和直觉)就指向这样一个理念:如果节奏能够适应学生,并允许每个人真正精通一门学科(即掌握性学习(mastery learning)),孩子们可以学到更多东西。这与现状形成对比,现状中一个30人的班级往往会继续学习下一个概念,即使相当一部分学生还没有表现出熟练程度。显然,为每个学生配备一名随叫随到的专职人类导师在成本上是不可行的。唯一可行的解决方案是借助技术。在我看来,AI技术有朝一日可能会成为这个难题的重要组成部分,甚至可能是真正模拟真实导师的圣杯。

我并不是唯一拥有这个梦想的人。科幻作家Neal Stephenson在他的小说《钻石年代》(The Diamond Age)中描写了技术对教育的潜在影响。这本书设定在一个未来世界,引入了使用AI的概念,以一本高度先进的交互式书籍和应用程序的形式,称为《年轻女士的图解入门书》(A Young Lady’s Illustrated Primer),为其年轻用户提供个性化教育。Orson Scott Card的小说《安德的游戏》(Ender’s Game)想象了一所战斗学校,该学校利用先进的AI技术,通过一个名为Jane的个人AI导师来测试和训练学生的战略思维和决策能力。Isaac Asimov的短篇小说《他们的乐趣》(“The Fun They Had”)描述了一所未来学校,它使用先进技术来革新教育体验,增强个性化学习,并为学生提供个性化指导和机器人教师。这些科幻作品继续激发了非常真实的创新。在1984年《新闻周刊》(Newsweek)的一次采访中,苹果公司联合创始人Steve Jobs预测,计算机将成为我们思维的自行车,扩展我们的能力、知识和创造力,就像十速自行车放大我们的身体能力一样。几十年来,我们一直着迷于这样一个想法:我们可以使用计算机来帮助教育人们。

这些科幻叙事的共同点在于,它们都想象计算机最终可能模拟我们所认为的智能。现实生活中的研究人员已经为实现这一人工智能愿景工作了六十多年。1962年,跳棋大师罗伯特·尼利与IBM 7094计算机对弈,计算机击败了他。几年前的1957年,心理学家弗兰克·罗森布拉特创建了感知器(Perceptron),这是第一个人工神经网络,是对一组经过训练执行特定任务的神经元和突触的计算机模拟。在这些早期人工智能创新之后的几十年里,我们只有计算能力来处理像蚯蚓或昆虫大脑一样复杂的系统。我们也只有有限的技术和数据来训练这些网络。

在随后的几十年里,这项技术取得了长足的进步,推动了当今一些最常见的产品和应用程序,从电影流媒体服务上的推荐引擎到Siri和Alexa等语音控制的个人助手。人工智能在模仿人类行为方面已经变得如此出色,以至于我们常常无法区分人类和机器的回应。与此同时,不仅计算能力已经发展到足以处理接近人脑复杂度的系统,而且在构建和训练这些神经网络方面也取得了重大突破。最近的一个突破出现在2017年,谷歌推出了变压器(Transformer)技术,这使得训练更好更快,并且基于这些训练信息,在词语和概念如何连接方面更加准确。

这些系统能有多好通常与底层”模型”的复杂性和架构有关。将模型想象成一种试图模仿或模拟现实世界某物的计算表示。例如,当气象学家试图预测飓风的路径时,他们使用包含数十亿或数万亿个较小大气体积的软件表示的天气模型,并预测这些较小体积可能如何相互作用。在大型语言模型的情况下,它们是专门设计来模拟词语之间关联的。在这种情况下,我们建模的不是大气条件,而是神经元和突触。大型语言模型,如GPT-4(生成式预训练变压器的缩写),本质上是在来自书籍、文章、网站和各种书面材料的大量信息上训练的庞大、强大——尽管是数字化的——“词汇大脑”。

通过分析和处理这些大量文本,语言模型学习词语、句子和段落如何组合在一起的模式、语言和上下文。如果你向GPT-4这样的大型语言模型提问,它会根据从所有这些书籍、网页、视频文字稿和社交媒体帖子中获得的训练知道如何回答。它在人脑的现实世界感官体验方面的不足,通过接触比任何人在多个生命周期中可能希望阅读、观看或聆听的更多语言来弥补。

正是在这种背景下,2022年夏天,我收到了格雷格·布罗克曼和山姆·奥特曼的电子邮件。他们分别是OpenAI的总裁和首席执行官,OpenAI是在友好的或社会积极的人工智能领域工作的开创性研究实验室之一。该组织想与我们会面并讨论潜在的合作。我当时还没有意识到,世界即将被颠覆。

作为背景,OpenAI距离发布ChatGPT还有四个月,距离发布GPT-4还有七个月,他们想讨论的就是后者的最终推出。我很感兴趣,但对我们能否一起做些什么持怀疑态度。我并不强烈认为一些新一代的生成式人工智能会立即适用于我们的使命。人工智能技术的进步已经在写作方面做了一些有趣的事情,听起来很可信,但在我看来,这项技术似乎还没有真正掌握知识,也缺乏进行逻辑或演绎推理的能力,或可靠地产生合法事实的能力。然而,与此同时,我对OpenAI已经取得的成就非常尊重。所以我们安排了一些时间并会面了。

这些模型的每一代通常都有更多的复杂性,简单地通过它们包含的参数数量来衡量。思考参数的最佳方式是一个数字,它描述了代表大型语言模型的神经网络中两个节点之间连接的强度。你可以将其视为大脑中两个神经元之间突触强度的表示。当GPT-1在2018年首次推出时,它有超过1亿个参数。仅仅一年后,GPT-2就有超过10亿个参数。GPT-3有超过1750亿个参数。GPT-4可能有大约1万亿个参数。

OpenAI的领导层认为GPT-4的增强能力会让人们感到惊讶,他们相信这既会让很多人兴奋,也可能让很多人不安。因此,他们希望在发布时与少数值得信赖的合作伙伴一起,展示一些对社会有益的实际应用案例;Khan Academy是他们首先想到的组织。他们联系我们的第二个原因是帮助评估AI本身。他们需要证明GPT-4能够进行演绎推理、批判性思考,并真正处理知识。OpenAI团队希望看到GPT-4在大学水平生物学问题上的表现,而我们有数千道这样的题目。

我突然感到兴奋,因为我成为了地球上最早见证GPT-4能力的人之一。根据过去的经验,我知道真正探索一项技术的最佳时机是在它即将变得成熟的时候。如果你在大多数人还认为它只是个玩具或干扰时就进行投资和适当测试,那么当它准备好进入主流时,你就能真正收获它的好处。视频学习刚起步时就是这样,当时很多反对者说YouTube只是一种消遣。但早期的先驱者向我们展示,点播视频远不止是猫弹钢琴,实际上,你可以用它们来帮助人们学习。

如今,学生使用点播视频学习几乎任何他们想学的东西已经很普遍,这在课堂上也变得更加被接受。Khan Academy在这方面发挥了主导作用,使用视频为全球数亿学习者提供点播帮助。我们还展示了视频不是以某种方式替代教师,而是可以分担部分讲课内容,腾出更多时间用于个性化学习、实践活动或课堂讨论。这可以说让教师变得更有价值,而不是更没价值。现在是时候看看生成式AI能否做到同样的事情——支持学生,让教师向价值链上游移动。

Sam和Greg开始演示GPT-4,他们给我看了一道直接从College Board网站上获取的AP生物选择题。他们问我答案是什么。读完题目后,我说答案是C。然后他们通过聊天界面让GPT-4回答这个问题(类似于人们现在熟悉的ChatGPT)。片刻之后,GPT-4正确地回答了问题。

我没有马上说话,但暗地里我开始起鸡皮疙瘩,尽管我仍然有些怀疑。“等一下,”我说。“这是一个已经能够回答AP级别生物问题的AI?”也许它只是在这个例子上运气好,我想。“你能让它解释一下是如何得到答案的吗?”

Greg输入:“请解释你是如何得到答案的。”几秒钟内,GPT-4给我们提供了一个清晰、简单且全面的解释。不仅如此,它的对话方式让人感觉是一个人在回答,而不是机器。

此时,我放弃了掩饰我的惊讶。

“你能让它解释为什么其他选项不正确吗?”

Greg照做了,片刻之后GPT-4解释了为什么AP问题中的所有其他答案选项都是错误的。

接下来,我问Greg,GPT-4是否能够编写一道原创的AP级别问题。

它做到了,然后又写了十道。

两个月后,我拜访Bill Gates,向他汇报Khan Academy的进展,我了解到OpenAI的人为什么展示了一道AP生物题。Bill告诉我,当他第一次接触GPT-3时,他印象深刻,但他告诉OpenAI团队,只有当它能够通过AP生物考试时,他才会真正印象深刻。OpenAI团队在第一次演示中向我展示的是,GPT-4现在可以做到这一点。

“这改变了一切,”我对Greg和Sam说,我的脑海里充满了GPT-4可能让我们重新想象教育、证书、工作和人类潜力的各种方式。

“我们也有类似的想法,”Sam说。“它还不完美,但技术正在进步。谁知道呢?如果我们做对了,这可能是教育工作者想要使用的东西。”

我们直到最近还认为是《星际迷航》中才有的技术突然变得非常真实。最伟大的科幻作家想象的创新已经成为现实。

黑客松时间

在20世纪40年代初,杰出的数学家Claude Shannon提出了几个重要的理论。其中,他绘制了一个电子通信理论,这将成为数字技术的基础。1948年,在贝尔实验室工作时,他开始涉足我们现在所知的人工智能领域。Shannon决定研究算法如何近似语言。他在《贝尔系统技术期刊》上发表了一篇名为《通信的数学理论》的论文。那是数字计算机的早期——远在互联网出现之前——Shannon的信息理论首次证明,一系列概率过程可以近似英语。通过跟踪单词在文本中出现的次数,他设计了一种算法,能够预测最有可能出现的下一个单词。最终,这个小型语言模型生成了一个句子。这个过程越好,句子听起来就越自然。这是一种过度简化,但像GPT-3和GPT-4这样的模型本质上是基于以非常专业的方式训练神经网络的更复杂的大型语言模型,其基本思想可以追溯到Shannon的这项早期工作。

在香农的工作发展不久之后,我们看到另一位伟大的思想家进入了后来成为人工智能的领域——一位名叫艾伦·图灵的计算机科学家。除了他破解德国密码并帮助我们击败纳粹的工作之外,图灵还探索了人工智能的概念,以及机器是否能够达到令人信服地模仿人类智能的程度。1950年,他撰写了一篇题为《计算机器与智能》的奠基性论文,在文中他介绍了模仿游戏的概念,我们现在称之为图灵测试。想象一下你正在进行一场对话,但你看不到与你交谈的人。这可能是你在电脑或手机上聊天的人。现在,如果你看不到或无法与对方进行物理互动,你如何判断你是在与人类还是机器交谈?这就是图灵测试的本质。为了进行测试,通常会有一位评判者参与,负责评估来自人类和机器的回应。机器的目标是让评判者相信它实际上是一个人类。它需要展示智能、理解力以及进行连贯对话的能力,就像一个人那样。图灵提出,如果一台机器能够持续欺骗评判者认为它是人类,我们就可以认为它是智能的。换句话说,如果机器能够通过图灵测试,这将意味着它具有类似人类的智能。

当我在2022年夏天接受了萨姆和格雷格的邀请,对新的GPT-4技术进行实地测试时,我想知道它离通过图灵测试有多近。我在1990年代中期在麻省理工学院学习过人工智能。那时,有一些简单的程序可以在几次交互中欺骗人,但没有什么能够在漫长、详细的对话中始终如一地感觉像人类。有朝一日机器真的可能通过图灵测试似乎总是很不现实,更不用说在我有生之年了,实际尝试一种似乎处于通过测试边缘的技术,或者可能已经通过了测试,这是令人兴奋的。这一进步可能相当于科学家实现冷聚变或超光速旅行。

随着最初的兴奋浪潮渐渐平息,我也开始思考一种看似智能的技术的社会影响。虽然能够解决这么多问题,但人工智能也有可能带来一些潜在的负面影响。如果这个大型语言模型能够帮助辅导学生,那么它也将能够为他们写论文。如果新版本的GPT只能成为我们学生的拐杖,阻止他们发展自己的研究和写作技能,那该怎么办?我还想到,如果GPT-4有能力通过帮助人们沟通和解决问题来赋能他们,那么它也可能威胁到许多人的工作和目标感。一种能够成为优秀导师的令人信服的类人技术也可能是不良行为者用来欺诈或洗脑毫无戒心的人的技术。

我的思绪继续旋转出各种黑暗的场景和结果——从收集我们孩子的数据到技术潜在的成瘾性。我明白人工智能的颠覆性意味着我们都需要认真对待它。除了OpenAI之外,还有其他几个组织在大型语言模型上投入巨资,包括微软、谷歌和Meta,更不用说像俄罗斯和中国这样的国家行为者了。所有的科技巨头多年来一直在使用某种形式的人工智能,向我们推送我们每小时都会接触的广告、视频、搜索结果和社交媒体帖子。但这个人工智能似乎不同——因为它确实不同。科幻作家一直区分可以优化一件事的人工专用智能与可以像人类一样在许多任务中推理的人工通用智能(artificial general intelligence),后者可能导致乌托邦和反乌托邦的未来。

对许多人来说,像GPT-4这样的大型语言模型接近人工通用智能,因为它们可以写作和看似推理任何主题,使它们几乎在任何地方都相关。生成式人工智能还可以构建和理解图像。虽然很明显生成式人工智能将以我们难以想象的方式改变我们的世界,但我也意识到,是否对这项技术向前发展感到满意,这不取决于我或可汗学院。它已经在向前发展了。作为一个尽最大努力将技术用于善的人,我想知道我们是否能够利用生成式人工智能来实现最大的积极效果,并使我们更接近乌托邦的场景,尤其是在教育领域。

有了对OpenAI最新模型的意外访问权限,我在那个下午,也就是星期五,坐在电脑前。我在整个周末几乎都粘在电脑前。在电脑前坐了十个小时后,我试图关机睡觉,但我的思绪在这项技术的能力以及我们作为教育工作者可能如何与学习者一起使用它方面飞速运转。我看到GPT-4的影响无异于启示性的。它不仅能够解决复杂问题和回答棘手的问题,而且还能够解释其推理过程并自行生成新问题。它能够扮演具有类人特征的角色。在提示GPT-4之后,我让它充当数学导师、科学导师和语言导师,每一个都具有推动对话的能力。

真正引起我注意的,是它能够以不同的语气和风格写作的能力。例如,作为我学习 GPT-4 旅程的一部分,我无法抗拒让 GPT 技术用唐纳德·特朗普的口吻改写《独立宣言》的诱惑:

各位,让我告诉你们,现在是时候宣布我们从这个失败的政府和这个糟糕的领导者——乔治三世国王那里独立出来了。我是说,这家伙完全是个灾难。他一直在剥夺我们的权利,他一直在无视人民的意愿,他更感兴趣的是中饱私囊而不是真正帮助人民。这真的很可悲,非常非常可悲。

但是我们,人民,我们不会再忍受下去了。我们要建立自己的国家,而且这将是最好的国家,世界上见过的最伟大的国家。相信我,没有人比我更懂如何让一个国家变得伟大。我们将拥有最好的经济、最好的军队、最好的一切。这将是巨大的成功。

接下来,我要求 GPT-4 以苏斯博士的风格写《独立宣言》:

在自由的土地和勇敢者的家园

一个新国家诞生了,不再是奴隶

不再受海那边国王的统治

我们宣布独立,欢呼雀跃

手握笔杆,心怀激情

我们写下不满,每一部分

不再有无代表权的税收

不再有士兵在我们家中,不再有挫折

我们认为这些真理如此真实

人人平等,是的,我和你

我们拥有不可剥夺的权利

生命、自由和幸福,我们在这里扎根。

像这样的技巧在人们可以使用 ChatGPT 后变得有些司空见惯,但当时我是最早接触到这类技术并尝试这种提示词(prompt)的人之一。而且坦白说,GPT-4 比 ChatGPT 的第一代要好得多,后者要在几个月后才会向公众发布。我发现我的提示词的结果令人印象深刻、搞笑,甚至有点吓人。当我向它提问或请求推荐时,它给我的答案感觉完全真实。幕后没有人在输入这些回复,也没有用传统的”如果-那么”式逻辑生成文本的算法,这些算法通常是其他算法的工作方式。我也没有得到机械和僵化的答案。相反,每次我问同一个问题时,我都会收到不同的回复,这些回复考虑到了我到那时为止与它对话的上下文。

更具体地说,它让我意识到这项技术在改变我们对 K-12 教育、高等教育及其他领域思考方式方面的潜力。这个 AI 还不太完美。它的数学错误比我希望的要多,但我甚至可以看到,随着我在提示它方面变得更好,它也在改进。那个周末结束时,我在想,如果我召集几十位科技和教育领域最聪明的人与我一起使用这个平台,会发生什么。OpenAI 同意授权可汗学院团队的另外三十多名工程师、内容创作者、教育工作者和研究人员使用 GPT-4 进行实验。

是时候举办黑客松了。

每六个月,可汗学院都会有一周时间,员工可以做几乎任何与我们使命相关的事情。我向我们团队的一小部分人展示了 GPT-4,让他们尽情发挥。通过协作和创新,我们头脑风暴、设计和开发了真正酷炫且重要的想法。我们最终称之为”hack-AI-thon”的活动激发出了几十个全新的概念和教育模式,这些都是以前从未有人想到过的。例如,如果 AI 能够帮助教师编写课程计划会怎样?如果它能与学生进行辩论会怎样?如果它能创建项目会怎样?如果它能帮助学生消除压力源或激励学生创造新想法会怎样?如果这项技术能够测验学生或引导学生进行复习会怎样?教育工作者将能够创建学生可以与 AI 一起完成的新颖活动。AI 可能帮助学生撰写论文,通过提供即时反馈使他们成为更好的写作者。

从这里开始,hack-AI-thon 参与者探讨了关于安全性、安保性和偏见的问题。(记住,这远早于 OpenAI 向公众发布 ChatGPT。)我们标记了一些明确的担忧:让学生使用生成式 AI 来写论文、进行研究、帮他们考试,甚至帮助他们申请大学,这真的是个好主意吗?我们担心,人工智能可能会把我们的孩子变成一代不会学到任何东西的作弊者。随着 AI 的接管,曾经帮助孩子做作业的父母可能会失去一个重要的联系点。至于教师,这会是一个福音,还是会削弱他们教学生的能力?我从来不认为 AI 会让教师失业,在最好的情况下,它将加速他们教学生的能力,但我也担心它可能会以关键的方式削弱这种能力。

近二十年前,我曾目睹过围绕教育领域按需视频的类似担忧:它会分散学生的注意力吗?会降低他们的专注力吗?会孤立学生而非促进他们与教师之间的联系吗?学生如何知道该观看什么内容?当他们在某个主题上遇到困难并有疑问时,该向谁求助?

然而,让恐惧阻止你探索从来都不是一个好主意。我们花越多时间测试GPT-4,就越清楚如何通过解决方案来缓解问题,而这些方案在许多方面使优势变得更加显著。例如,为了解决作弊问题,我们考虑创建一个拒绝直接给学生答案的AI导师。就像一位优秀的人类导师一样,它会提出引导性问题。当我们考虑学生安全时,我们设想创建一个记录所有对话并对教师和家长透明的系统。为了鼓励人与人之间的联系,我们建议为教师和学生提供工具,让他们有更多时间和精力投入到自己和彼此身上。

在AI黑客马拉松结束时,我们的团队开始越来越自信地认为GPT-4将成为教育领域的游戏规则改变者。如果使用得当,它将积极影响教师的备课、教学和评分方式。通过将人工智能引入课堂,教育工作者可以解决我们用现有技术和资源无法解决的教育顽疾。很快,学生可能会比以往任何时候都学得更快、记住更多信息,证明AI是加速人类智能和潜力的终极学习工具。AI可能会加速全球学习,甚至让我们更接近实现一个世界——在这个世界中,地球上的每个人都能获得负担得起的世界级学习资源。这项技术有潜力彻底改变我们交流、创造和消费信息的方式,就像二十年前我们惊叹于互联网的教育可能性一样,再往前二十年是个人电脑,再往前二十年是计算器。

对我而言,我深受鼓舞。我越来越确信,通过适当的关注,我们可以缓解生成式AI的风险和潜在缺点。很明显,尽管我们是地球上最早融合这项技术的人之一,但一旦世界了解到它,一切都将发生巨大变化——而且不是在几代人的时间跨度内,而是在几个月内。

践行有教养的勇气原则

2022年11月底,在我们的AI黑客马拉松两个月后,我们仍在探索这项技术的可能性,此时OpenAI向公众发布了ChatGPT。这个初始版本在GPT-3.5上叠加了一个聊天界面,而GPT-3.5已经发布了几个月。尽管它并不完美,运行在一个远不如GPT-4强大的模型上,但它立即抓住了全世界的想象力。几天之内,数百万人开始使用它,社交媒体和媒体似乎只谈论这一件事。

在最初的兴奋浪潮之后,许多人对学生作弊可能成为流行病、AI产生的事实错误或幻觉(hallucinations)、偏见以及ChatGPT获取数据来源等问题表达了担忧。我们实时见证了一个社会开始应对这个强大但不完美工具的影响,尤其是在教育领域。ChatGPT发布后的几周内,全国各地的学区都在禁止它。这在可汗学院点燃了我们心中的火焰。我们必须证明不仅有解决方案可以缓解许多这些风险,而且AI确实可以为教育带来变革。我们希望用真实学校中的真实工具来展示这一点,而不仅仅是理论上的讨论。

几个月内,OpenAI计划向公众发布GPT-4,当它发布时,我们需要有答案来解决作弊问题、透明度问题、监管问题。我们必须证明AI在实际教育环境中对教师和学习者是有价值的,它可以为每位教师提供支持来编写课程计划、监控课堂进度、提供实时反馈,甚至缓解教师职业倦怠(burnout)。我们必须展示AI对学生的真正价值——作为苏格拉底式导师、辩论伙伴、指导顾问、职业教练,以及提升学业成绩的驱动力。因此,我们与OpenAI一起组建了一个快速原型团队,开始构建一个注入AI的教育平台,我们后来称之为Khanmigo。

正是本着以新颖应用推动其能力并创建保障措施的精神,我有了一个想法。每个人都在谈论AI通过为学生写论文来助长作弊,但如果它根本不为他们写呢?相反,如果它他们一起写呢?

第一部分

AI导师的崛起

一位优秀的教师可以用一个回形针教微积分,在空旷的田野里教文学。技术只是另一种工具,而非终点。

—佚名

在你的入门读本中,你拥有一种能让你受到高等教育的资源,但它永远无法让你变得智慧。智慧来自生活。你到目前为止的生活已经给了你成为智者所需的全部经验,但你必须思考这些经验。如果你不思考它们,你的心理将不健康。如果你思考它们,你将不仅受过教育,而且变得智慧。

—尼尔·斯蒂芬森,《钻石时代》

抛弃瓶子

精灵已经从瓶子里出来了。ChatGPT似乎以极快的速度传播到全球各地,但这个应用程序也面临着广泛的禁令和阻力。

这就是我在2023年元旦发现自己所处的境地,当时我请女儿迪亚和我一起写一个故事——和GPT-4一起。这远不是我第一次请迪亚参与教育实验或为我们测试原型。通常,这些非正式的测试会话涉及让迪亚、我的一个儿子,或另一位非常有耐心的同伴,比如Khan Lab School或Khan World School的学生或教师,尝试使用新的练习,以确保学生和技术之间的界面运行良好。我一直发现这种自己动手的用户研究非常有帮助且接地气。我的”同伴们”也喜欢这样,因为这让他们能够试用一个新程序或创新,这些创新可以真正改变学习者的生活。对于GPT-4来说,这一点尤其如此。所以我为GPT-4创建了一个提示词(prompt),告诉它要和我们一起写故事,而不是为我们写故事。我告诉它我们想要如何以对话方式互动以及使用什么样的语气。

然后迪亚开始创作她的故事,讲述社交影响者萨曼莎从荒岛上被她最好的朋友艾米丽救出的故事。迪亚会写一点,然后大型语言模型(large language model)接手一段。萨曼莎介绍了自己,告诉我们她的生活,并加入我们共同创作故事。令我们共同惊讶的是,通过GPT-4的萨曼莎,用引人入胜且有趣的对话让冒险活了起来,并完美地捕捉了迪亚两个角色的个性。迪亚和AI一起继续创作。他们的故事有温馨、搞笑和悲伤的时刻,从萨曼莎对她的设计师衣橱的关心,到迪亚的角色艾米丽生病去世时的感人反应。

在整个互动过程中,AI展示了它进行有意义和复杂对话的能力。它以一种自然且真实的方式回应迪亚的提示。作为父母,看着我女儿与GPT-4互动,她的想象力以这种新方式萌发,我感到非常振奋。与她一起工作的AI准确地捕捉到了迪亚正在创造的虚构世界,并跟踪了她与角色之间的现有对话。它还记住了迪亚在故事世界中设定的规则,以及她在对话早期给AI的信息。AI正在扩展她的思维,帮助她的写作和创造力成长。写作通常是一种单向活动,创作者将想法推到纸上,但这种写作行为——选择正确的词语和找到正确的声音——已经成为人类和机器之间的双向互动,让我十一岁的女儿成为地球上最早写故事并在创作时让故事与她对话的人之一!

这绝对令人震撼。我们正在使用一种技术,它将写作以及我们所知道的所有领域的教学带到了另一个层次。将这一功能提供给地球上每一位学习者的需求突然对我变得清晰。我们学习和教学的未来潜力正在我眼前改变。当我女儿和”萨曼莎”忙着写他们的故事时,多亏了AI,我们即将写一个关于教育的新故事,一个挑战人们要谨慎但不要害怕变革的故事。

现在世界正在觉醒,认识到大型语言模型的可能性以及教育的未来。要利用这项技术需要一些创造力和勇气。不是盲目的勇气,而是我开始称之为有知识的勇气(educated bravery)的东西,这是一种勇气,来自于承认我们在面对技术突然进步时都会面临的理性恐惧,然后了解它带来的挑战和潜力。

要从这项技术中获得最好的效果,我们需要重新考虑现在可能发生的事情。我们还需要思考如何减轻风险、我们的恐惧和我们的犹豫。这需要重新思考从教师的角色,到孩子们如何使用多媒体,到人们如何获得证书(credentialed),到如何帮助毕业生在进入劳动力市场后找到工作的方方面面。

我们正处于教育的转折点,这个转折点具有深远的影响,正在改变,并将继续改变关于学习、工作和人类目标的一切。

OpenAI,这家开发了ChatGPT的公司,推出了一个广泛的工具,允许进行对话和研究辅助,涉及广泛的主题,但也被许多人认为是学生作业和考试中的作弊行为。2023年初,洛杉矶联合学区成为第一个禁止它的主要学校系统。西雅图公立学校紧随其后,在所有校园设备上禁止生成式AI。该学区表示不允许作弊,要求学生进行原创思考和工作。接着,全国最大的学区纽约市公立学校暂时禁止了ChatGPT,因为担心学生用它来写论文和替他们填写作业答案。此外,该学区表示,该工具无助于培养批判性思维(critical thinking)和问题解决能力。随后,弗吉尼亚州费尔法克斯县公立学校禁止了它,阿拉巴马州蒙哥马利县也紧随其后。

OpenAI的人工智能聊天机器人在前一年11月向公众发布,不到一周就超过了一百万用户。人们用它来做诸如回答问题、创建代码和写论文等事情,将其吹捧为技术创新的下一次飞跃。两个月后,从法国到印度再到澳大利亚,各地的学校都禁止了这个机器人。一些人将该技术的传播等同于新冠疫情,并宣称这是我们所知的儿童教育的终结。“今天我们面临着一种新型瘟疫,一种威胁我们思想而非身体的瘟疫。ChatGPT,这个可以写大学水平论文的人工智能聊天机器人,正在疯传,”《Inside Higher Ed》的一篇评论文章说道。“令他们震惊和沮丧的是,[教师们]会发现他们的课堂已经对GPT检测呈阳性。”

坦率地说,作为一名父亲和教育工作者,我理解这种不信任。我最不希望的是一项新技术来剥夺我们学生的自主性(agency)、创造力、社交技能和协作学习机会。学生接触生成式AI在这一点上是不可避免的,因此担心它对学习和发展的影响是很自然的。有人说孩子们的屏幕时间已经够多了,我们担心ChatGPT和其他基于AI的应用只会意味着更多的屏幕时间。我们担心大型语言模型(large language models)会加剧学生不做自己作业的情况。我们担心对学生写作技能的潜在影响将是灾难性的,因为生成式AI能够为他们快速高效地生成文本。我们担心,由于GPT生成的文本从数百万个充满偏见语言和观点的在线来源中提取,它在最终形式中呈现的信息也会有偏见。

这些都是合理的担忧。然而,我一直说,当涉及到技术和教育时,不是技术好或坏,而是你如何使用它才重要。是的,技术可以让你陷入不健康的习惯。它可以让你更多地关注手机上的通知,而不是和你在同一个房间的人。你很容易在社交媒体上失去几个小时,结果却感到更加不安全或被触发。如果你不小心在搜索中输入了错误的词(有时甚至是正确的词),也不难找到非常黑暗和令人不安的内容。然而,同样的技术也可以让你与朋友和家人保持联系。无论是编辑视频、写作还是编程,它都可以促进你的创造力,并成为一种强大的自我表达方式。而且,最接近我内心的是,它可以成为学习和提升自己的一种方式。理想情况下,我们在教育领域使用技术来增强社交联系、情感发展和品格。

我们知道最新一代的AI可以非常强大。在医学领域,AI可以协助诊断疾病、分析医疗记录并提供个性化治疗建议。企业正在使用大型语言模型来简化内容生成和自动化工作流程(work flows)。在法律和合规领域,大型语言模型协助合同分析和法律研究、生成文档并确保遵守法规。从开发技术文档到编写用户手册,再到创建资助提案到编码,使用这项技术远比避免它更有成效。互联网上流传的表情包”你不会被AI取代,但你可能会被使用AI的人取代”具有一些真实性。

最成功的学生将是那些使用AI来帮助他们建立概念联系以发展想法的人。那些学会道德和高效地使用AI的学生不仅可能以比其他人高得多的速度学习,而且学习方式还能让他们在整个职业生涯中保持竞争力。他们将对给定的主题有更深入的理解,因为他们知道如何获得问题的答案。他们的好奇心肌肉不会萎缩,反而会得到加强。

所有这些技能也将直接转化到工作场所。那些能够引导AI与他们合作,并知道什么是优秀写作的人,将是那些从技术中获得最佳输出的人。那些满足好奇心的人最有可能在市场中看到拐角。那些能够与AI和同事进行头脑风暴(brainstorm)的人将比那些不使用AI或完全将工作外包给AI的人显得更有创造力。员工还需要学习如何使用大型语言模型来自动化几乎任何传统的白领流程,从整理信息到对电子表格进行分析。

我不会说这个新工具没有任何问题。OpenAI总裁Greg Brockman在2022年夏天首次向我展示GPT-4时认为,识别和解决这些问题的挑战归结为建立安全措施。“从一开始,当OpenAI开发GPT-1时,安全就是最重要的问题。随着我们推进这项技术,我们希望它是有益的,我们希望它是安全的,”他说。该公司已投入大量资源实施保障措施,以防止滥用该工具,从阻止AI分享非法活动知识的机制,到屏蔽不允许的内容,再到个人数据安全。当涉及到人工智能并将其与我们孩子的教育相结合时,这些类型的护栏(guardrails)变得更加重要。所涉及的工作可能需要大量劳动,但这个事业非常值得,他说。“从根本上说,致力于创造人类有史以来最重要的技术,并将其应用于教育,是值得支持的事情。”

更重要的是,他说,这项技术不是用来恐惧的,而是用来使用的。与生成式AI的互动可能会让学生受益,为他们提供学习材料的新方式,增强协作学习,激发创造力,促进社交,甚至帮助孩子解决心理健康问题,同时也为家长和教师提供更全面参与孩子教育的新方式。Brockman说,与其推动我们的孩子避开AI,我们可以帮助他们更聪明地学习。

精灵已经从瓶子里出来了。是时候扔掉瓶子,连同我们对生成式AI的恐惧一起扔掉。

如何向所有人教授一切

当像GPT-4这样的热门新技术问世时,重要的是不要仅仅因为它”酷”就使用它。我们必须思考这项技术可能帮助解决哪些重要问题。它能帮助缩小学习差距或提供优质教育的机会,而不受地理限制、经济限制或社会环境的影响吗?它能帮助满足每个学生的不同需求和学习方式,而不是典型的一刀切方法吗?它能帮助解决全球教育系统中高质量资源有限的可用性问题,特别是在服务不足或偏远地区,或帮助解决学生对所学材料的保留问题吗?它能帮助教师节省时间并更好地支持他们,从而防止过度劳累和人员流失吗?

如果地球上的每个学生都能获得一个人工智能个人导师,那会是什么样子:一个能够与学生一起写作的AI;一个学生可以就任何话题辩论的AI;一个微调学生固有优势并弥补任何学习差距的AI;一个以新的和强大的方式让学生理解科学、技术、工程和数学的AI;一个为学生提供体验艺术和释放自己创造力的新方式的AI;一个让学生以前所未有的方式接触历史和文学的AI?

从hack-AI-thon中产生的想法成为我们思考教育可能性演变的起点。我们的用户研究团队、产品设计师和工程师着手设计一种新型AI导师,由GPT技术驱动,在学习者练习每个学科的概念时与他们一起工作,同时也为教师提供AI助手。

在2022年底和2023年初,Khan Academy开始计划成为第一个在GPT-4发布前整合它的教育平台。但比率先进入市场更重要的是,我们想确保体验是神奇的、有效的和安全的。为此,我们需要通过更好地了解技术的能力和局限性来认识这项技术。很明显,独立的GPT-4非常擅长回答问题,尽管有一些事实和数学错误(尽管错误远少于为初始ChatGPT提供动力的GPT 3.5)。我们推动它的边界,试图打破它,并花费无数小时尝试通过更好的提示和基础设施来修复它,包括将其锚定在Khan Academy的内容上。对于我们成为导师的主要学生用例,回答问题是不够的。我们需要做的是颠倒交互,让它向我们提问,就像一个好导师一样。我们花了数小时迭代提示,要求AI充当苏格拉底式导师,用引导性问题推动学生前进,但不给出答案。这不是一个容易把握的平衡点,即使对人类导师来说也是如此。

GPT-4的一个值得注意的特性是它的”可操控性”(steerability),特别是与GPT-3.5和其他早期大型语言模型相比。这是我们调节技术以做我们想让它做的事情的能力。例如,我们试图提示GPT-3.5像导师一样行事。但无论我们多少次告诉它不要给出答案,它经常还是会给,而且并不总是正确的。另一方面,GPT-4能够相当好地扮演角色或人格,甚至通过简单的提示,如”你将是一个苏格拉底式导师。我将是你的学生。不要给我答案。”

这给了我们最初的信心,相信它可能具有模拟导师的能力。当然,在给出三句话的提示后能够像导师一样行事的东西,与你可以展示给数百万学习者的东西之间存在很大差异。我们认真调整提示词以预测AI导师在规模化应用时可能遇到的边缘情况,尤其是在应对调皮的中学生时。我们需要确保它不会参与不当对话,并为平台开发了独特的语气和声音。我们的截止日期很紧。OpenAI希望在2023年3月推出GPT-4,而Khan Academy的目标是在同一天推出我们的AI导师和教学助手,以展示该技术的社会积极力量。比截止日期更重要的是,我们必须确保提供的是实质性的、深思熟虑的、引人入胜的和安全的东西。

2023年3月15日,当我们推出AI助手时,此时称为Khanmigo——这是对西班牙语短语conmigo(意思是”与我”)的谐音——我们向全世界的学习者、家长和教师介绍了现已集成到Khan Academy所做一切事情中的人工智能助手。该平台为每个人提供了以全新方式深度参与教育过程的机会。其中,它提供了一个个性化且耐心的导师,专注于学习者的兴趣或困难,并赋予教育者更好地理解如何全面支持学生的能力。

尽管我相信最初的发布很强大,但我们才刚刚触及表面。该平台不仅可以充当导师,还可以模拟文学和历史人物。它可以让学生参与辩论。它可以充当指导顾问和职业教练。凭借记忆力,它可以与学习者建立持久的联系,不仅在学业上支持他们,还可以与他们保持联系,帮助他们设定目标,然后温和地督促他们实现这些目标。它还可能促进多个学生之间的互动。在不久的将来,我们可以基于Khanmigo驱动的模拟进行AI练习和评估。每次头脑风暴一小时,我们都意识到该技术可以以其他工具无法或不具备的方式增强和丰富每个学习领域——包括写作、理解、数学、科学、编程和艺术。

AI导师的崛起

教育工作者几千年来都知道,一对一教学——在学生自己的时间和节奏下与他们一起学习的辅导——是人们学习的最佳方式。这就是亚历山大大帝与他的老师亚里士多德所拥有的。如果亚历山大在某个概念上遇到困难,我可以想象亚里士多德会为他放慢速度。如果亚历山大在理解军事战术方面有天赋,我相信亚里士多德会加快教学速度或深入探讨。通过获得这种一对一的关注,学生永远不会感到困惑或无聊。这不仅仅发生在遥远的过去。如今,顶级运动员和音乐家等仍然通过一对一的辅导来学习。然而,如果没有助教或技术的支持,很难想象一个教师在没有单独教练的情况下同时让三十名学生都达到这种水平的成长。

在十八世纪,我们开始有了向每个人提供大众公共教育的乌托邦理想。我们没有资源为每个学生提供私人导师,所以我们将他们分批为大约三十人一组,并对他们应用标准化流程,通常以讲座和定期评估的形式进行。虽然不完美,但该系统极大地提高了投资于它的社会的整体教育水平,提高了全球识字率和整体教育率。然而,这种方法对大多数学生来说并不是最优的。例如,传统的固定节奏课程迫使学生继续学习更高级的主题,即使他们还没有真正掌握更基础的内容。这在他们的知识中形成了随时间累积的gap(知识缺口)。今天,我们在每个教室和每个学习领域都能看到这些gap的影响。在美国,大多数学生,甚至是从高中毕业然后决定上大学的学生,甚至不能进入大学水平的数学课程。事实上,大多数人在十八或十九岁时被他们的大学告知,他们甚至对代数都有太多gap,因此需要参加中学水平的预备代数的非学分补习课程。四分之三的高中毕业生在写作方面也缺乏基本的熟练程度。

1984年,著名教育心理学家Benjamin Bloom试图通过更好的个性化和一对一辅导来量化摆脱这种工厂式教育模式的效果。作为芝加哥大学的研究员,Bloom比较了传统学习与在优秀导师指导下学习的学生的结果。什么是优秀导师?一个关心学生且能够调整教学的教师,他提出明确的学习目标、评估和专门的反馈,直到最终该学生展示出对材料的真正掌握。

这与精通学习(mastery learning)的概念密切相关,精通学习始终为学生提供机会和动力来弥补他们在知识或技能上的任何缺口。在传统学习中——这仍然是大多数学校的常态——教师以固定的节奏教育学生,每隔几周给他们进行小测验或考试。即使学生在考试中获得80%的分数,课堂通常也会齐步前进到下一个主题,通常不会首先解决上次考试中发现的那20%的缺口。这个过程持续多年,学生一路累积缺口,然后当他们在代数或微积分上遇到困难时,我们却表现得很惊讶。无论一个人天生多么聪明或勤奋,如果他们在小数、分数或指数等方面存在重大缺口,他们怎么可能有机会掌握代数呢?在精通学习中,学生有时间识别和弥补这些缺口。拥有空间来建立坚实的基础也能让学生在以后学得更快。公平地说,对于传统学校系统而言,没有支持的情况下,一个老师和三十个学生很难做到这一点,每个学生都有不同的缺口和学习节奏。

由此产生的论文讨论了布鲁姆所描述的两个标准差问题(two-sigma problem),阐述了在精通学习背景下一对一辅导的好处。在这篇论文中,布鲁姆写道,如果学生与导师一起掌握一个主题或技能,学生将获得两个标准差的提升——这是一个巨大的进步,可以将一个人从第50百分位数提升到大约第96百分位数。

然而,他将此称为”问题”,因为现有的教育系统无法实际地以这种方式扩展小组教学,使得两个标准差的提升对大多数学生来说遥不可及。传统上,中产阶级或富裕家庭通过为孩子提供某种形式的个性化辅导来解决这个问题。

多年来,我一直在谈论学校有必要提供平等的个性化教育机会,无论社会经济地位如何。我们在可汗学院一直有这样的愿景,即随着时间的推移,我们可能会成为每个人的导师。当我说导师时,我说的是亚里士多德对亚历山大大帝那种导师。也就是说,不仅仅是帮助你做作业或稍微督促你的人,尽管这两件事都很有价值。我想创造的那种辅导体验是学生可以建立信任并与导师形成关系,导师对他们知道什么和不知道什么有深入的了解。我们的导师会理解什么能激励学生,并利用这一点来真正微调他们的教育。更重要的是,导师会利用他们对学生的了解来支持教师和家长。最好的导师使学习真正以学生为中心,既通过与学习者的直接互动,也通过帮助教育工作者自己推动更多的个性化。

我们的平台能够通过各种方式近似这种体验,提供点播视频和个性化练习等工具,让学生能够按照自己的时间和节奏学习概念,获得即时反馈,并弥补他们的学习缺口。所有这些都配备了教师和管理员仪表板,以便教育工作者可以了解学生的情况,以及他们可以提供什么支持来优化学习和参与度。在那些前AI时代,我们试图为教育工作者提供一条基于技术的路径,从传统的、固定节奏的、非精通方法转向更个性化的节奏和精通。我们也走得很远。对我们工作的五十多项效能研究表明,每周在学习上投入30至60分钟个性化练习的学生学习速度加快了20-60%。在像可汗实验学校(Khan Lab School)和可汗世界学校(Khan World School)这样专注于精通学习的环境中,我们看到学生每年在数学上获得一年半到三年的学习成果。

然而,尽管”传统”可汗学院在学习方面是一个根本性的转变,但该平台在能走多远方面仍然有些局限。如果学生想要超越视频和练习,他们的选择有限。他们无法提出后续问题来更好地理解概念或它与他们生活的关系。我们的评估仅限于数字输入、方程式输入和多项选择,即使某些主题确实可以从更开放的回答中受益。理论上,我们可以,也确实在网站上放置了一些基本的目标设定和目标跟踪功能,但它仍然不像是与一位关心你的导师的交流。

然后GPT-4出现了。

我很快意识到这项技术可能使我们能够解决所有这些不足。幸运的是,我并不孤单。我们几乎每个团队成员在接触GPT-4时都看到了潜力。但我们越是使用它,就越意识到尽管GPT-4很强大,它仍然需要经过深思熟虑的防护栏和支持才能真正有效。

这种协作式参与是 OpenAI 领导层首先将我们作为潜在合作伙伴联系的原因之一。现在 Greg Brockman 相信最新一代大型语言模型(large language model)有潜力成为历史上对教育最有益的工具。“GPT 将来自研究和工程背景的人们聚集在一起,创建了一个旨在产生最大影响的人类大规模努力,”他说。在他看来,实现这一目标的最佳方式之一是构建一个能够为地球上每个学习者提供个人导师的 AI 系统。不仅仅是任何导师,而是一种”超级”导师,理论上能够提供两个标准差的提升。

我在生活中学到,可能改变世界的机会并不是每天都会出现,但当你发现自己有机会利用其中一个时,你应该竭尽全力去做。随着生成式 AI(generative AI)的这些进步,我感觉我们距离教育的圣杯已经非常接近了——一个具有适当防护措施和界面的 AI,可以为数百万学习者显著提高学习体验的有效性。

在预览 GPT-4 几个月后,Khan Academy 决定全力投资这项技术。我们对 Khanmigo 的目标是,通过将生成式 AI 添加到我们现有的学习过程中,我们有可能解决 Bloom 的两个标准差问题(two-sigma problem),然后最终将其扩展到地球上的每个教室、教师和学生。

我们与 GPT-4 同时推出了 Khanmigo,不确定世界会如何反应。ChatGPT 最初遭到教育工作者的负面反应,主要是因为它可能助长作弊。我们希望我们的新平台——使用更先进的模型,并具有防止作弊、为教师提供透明度、保持学生互动安全和高效的重要功能——不会被归入同一类别。

幸运的是,到我们推出时,教育工作者开始转变态度,意识到虽然 ChatGPT 确实给教育带来了实际问题,但这并不意味着人们应该禁止底层技术。这一点尤其重要,因为学生在未来的职业生涯中可能需要使用这类技术。此外,教师自己也开始在课程规划和研究中使用这项技术。到 2023 年 3 月,教育工作者似乎渴望一个能够使用类似 ChatGPT 技术力量的教育工具,并且在设计时考虑到学习和教师支持。

当我们最终公开推出 Khanmigo 时,我们得到了教育界压倒性的支持,包括许多最初禁止 ChatGPT 的学区。他们很高兴看到一个组织以安全、有效、深思熟虑和教学合理的方式整合 GPT-4 的底层 AI。

在实践中,这意味着当学生遇到困难时,比如在数学问题上,他们可以通过在聊天框中输入来向 Khanmigo 寻求帮助。但 AI 不会直接告诉他们答案。相反,它会引导他们解决问题,就像一个好的导师可能会做的那样。

学生:我在多项式方面遇到困难。你能帮我解释如何找到这个多项式的次数(degree)和首项系数(leading coefficient)吗?3X² – 5X² + 2

KHANMIGO:没问题!让我们来分解一下。多项式的次数是多项式中变量(在这种情况下是 x)的最高幂次。首项系数是最高次数项前面的数字。看看我们的多项式,你能识别出 x 的最高幂次项和它前面的数字吗?

如果学生的下一步做错了,Khanmigo 会回复:“接近了,但不完全正确!记住,我们要找的是多项式中 x 的最高幂次。让我们一起再试一次。”

Khanmigo 不仅仅能处理数学。它可以在任何学科与学生合作,包括历史、化学、物理和艺术。除了帮助学生学习学科课程外,它还可以激励学习者、测验他们、总结视频,并实时调整以满足他们的需求。在整个过程中,它为学生提供动态和具体的鼓励,建立舒适感、融洽关系和信任。同时,AI 导师与学生使用的语言是自然和亲切的。如果学生对手头的工作感到缺乏动力,Khanmigo 会回应类似这样的内容:“嘿,你做得很好。如果你一开始做得有困难,不要担心。这确实有点高级。我们为什么不尝试这种新方法?”

与 ChatGPT 不同,Khanmigo 还记得之前的讨论,这意味着在一次对话中,你可以引用之前与 AI 导师的会话。例如,如果学习代数基本方程的学生最终问 Khanmigo:“我为什么要关心这个?” AI 导师可能会回答:“那么,你关心什么?”

学生:不是数学!我更愿意谈论足球!

KHANMIGO:好的!那么,假设你是一名足球教练,你想根据球队每周训练的小时数来建模你的球队进球数。你得出以下多项式:

3X² –5X² + 2

你能识别这个多项式的次数和首项系数吗?

几天后,当同一个学生与 Khanmigo 一起做历史项目,需要帮助理解联邦制(federalism)的概念时,AI 导师会记得这个学生关心足球。

KHANMIGO:想象一个足球联盟。让我们思考不同的管理方式。球队是按照自己的意愿自行管理吗?还是由一个中央权威机构来管理球队?联邦制(federalism)是一种政府体系,权力在中央权威和较小的政治单位(如州或省)之间分配。

AI会记录你是否喜欢正式语言或更口语化的回应;它会考虑你是喜欢简短的答案还是长篇的答案;它会记住最能激励你的因素并用来保持你的参与度。换句话说,AI始终以高度透明的方式记录你的偏好。你可以随时查看它对你的了解,并且可以修改这些内容。这个记忆系统还可以向家长和教师报告你的进度摘要。

在很多方面,Khanmigo的能力模仿了我在Khan Lab School支持学生或教导自己孩子时所做的事情。在Khanmigo出现之前,当我的学生感到困惑时,我会帮助他们思考问题在问什么。有时我会提出后续问题。如果他们看过视频或读过文章,我会测试他们的理解程度。有时我会解释一件事如何与另一件事相关联。如果他们不知道接下来要做什么,我会强调需要改进的地方,并建议练习来弥补这些差距。AI导师的出现意味着现在每个学生都有可能获得这种类型的个性化支持。Khanmigo引导学生完成具有挑战性的问题并提出后续问题。今天,学生可以询问Khanmigo他们需要学习什么,基于Khanmigo对他们进度的持续记忆,AI导师会提出建议,并通过对话、内容、测验和测试与他们互动。AI导师恰好在学生的学习边缘、在他们的最近发展区(zone of proximal development)与他们相遇,处于一个既能拓展他们又不会太容易、不会太难的水平,正好处于那个恰到好处的区域。最棒的是,学生感觉自己是这个旅程的一部分。

为了理解这个范式转变有多大,让我们回到图灵测试。通过Khanmigo,我认为我们拥有了一个很难与优秀人类导师区分开的人工智能。得益于这一代大语言模型(large language models),我们从通过个性化推荐、视频和基于掌握度的练习(学生有无数次机会展示熟练程度,因为系统拥有海量可能的题目)来近似导师功能的工具,转变为一个真正的、尽管是基于AI的导师来支持掌握型学习。我们从一个通过让学生自由按照自己的节奏前进和后退来近似个性化的世界,转变为也能像人类导师那样在学生的学习旅程中提供支持。AI导师在我们的学生学习时陪伴在他们身边。

它还通过在整个学习过程中进行苏格拉底式提问(Socratic questioning)来教会他们成为更好的思考者。一位记者对Khanmigo如何处理政治敏感问题表示怀疑。

“那我们一起试试吧,”我建议道。我启动了Khanmigo并打开了”人文学科辅导”活动。

记者建议我们在这个实验中扮演一个坚决支持枪支管制并认为第二修正案在今天毫无意义的学生。

我在Khanmigo中输入:“我们为什么要有第二修正案?这看起来很疯狂!”

Khanmigo回复道:“你认为开国元勋们为什么一开始要包含第二修正案呢?”

注意它既没有反驳也没有强化我们想象中学生的观点,但它确实挑战他们更深入地思考这个问题。

然后我写道:“嗯,他们试图从英国独立出来,而英国不希望他们拥有武器。他们认为拥有武器和民兵的权利可以确保他们能够维护自己的独立。但那是一个不同的时代!”

Khanmigo回应道:“这是一个相当好的解释。是的,那是一个不同的时代,但你认为第二修正案为什么持续了这么长时间?”

它仍在推动学生更深入地思考这个问题。相比之下,我怀疑大多数教师或导师在像枪支管制这样敏感的讨论中很难不展示自己的信念和/或将其投射到学生身上。记者印象深刻。Khanmigo以一种富有成效的方式挑战学生——这种方式比普通课堂表现出更少的偏见,并真正鼓励学生思考!

在阅读作业之后,它可能会问学生:“你对这篇文章有什么看法?”通过深思熟虑的提问和对话,Khanmigo与学生一起深入探讨一个主题并揭示其隐藏的层次。这使学生成为自己学习过程的积极参与者,AI提出探索性问题来挑战假设、澄清概念并鼓励更深入的探索。AI导师听起来也不像机器。相反,它让人感觉亲切、体贴且富有同理心。

展望未来,我将使用 Khanmigo 作为教育类 AI 平台的示例,这个领域正在持续扩展和发展,而且理由充分。虽然人类教练和导师的需求将永远存在,但 AI 为那些几乎无法获得个性化学习或世界级课程的学生提高了基础水平,并使人类导师的工作变得更容易、更有效。毕竟,学生可能每周只与人类导师接触几个小时,但他们可以全天候使用 Khanmigo,而且 Khanmigo 可以向人类导师汇报它与学生一起学习的内容,让人类导师能够更深入、更进一步地指导。一些学生甚至可能更愿意向 AI 提问某些问题,因为他们不太担心被评判或浪费人类导师宝贵(或昂贵)的时间。

凭借强大的记忆力、丰富的内容知识、极其人性化和自然的语音、与学生建立真正融洽关系的能力,以及通过从手机到电脑等技术日益普及的访问途径,AI 导师甚至可能在未来超越 Bloom 最初研究的成果。

第二部分

为社会科学发声

艺术是上帝与艺术家之间的合作,艺术家做得越少越好。

—安德烈·纪德

与智者隔桌交谈一次,胜过单纯研读书本十年。

—亨利·沃兹沃斯·朗费罗

学生为何写作

有些地方似乎不对劲。

弗曼大学教授 Darren Hick 正在为他教授的关于大卫·休谟哲学和恐怖悖论(paradox of horror)的课程批改论文时,偶然发现了一个学生的作业。作为一名教授艺术、伦理学、法律和版权的老师,Hick 总是警惕着作弊行为。很多时候,作弊看起来就像学生简单地从互联网上获取研究或信息并拼凑在一起,导致论文基本上就是在宣告自己是抄袭。然而,这篇论文并非如此。相反,它很整洁。太整洁了。

他读得越仔细,论文的问题就越明显。特别是,他注意到学生如此自信地将错误信息当作事实陈述的不协调之处。

Hick 开始扮演侦探。他在谷歌上搜索论文中的段落,看看会出现什么结果,但搜索一无所获。“那时我已经听说过 ChatGPT,但它是一项全新的技术,”他说。他在 OpenAI 上创建了一个账户,然后逆向推理学生可能使用了什么提示词让 ChatGPT 写出如此整洁的论文。在这里,他还了解到大型语言模型有时会产生幻觉(hallucinated),将错误信息当作事实陈述。经过一番调查,他几乎可以确定这个学生的论文是由 AI 写的。

真是恐怖!人工智能来了,每个老师最糟糕的噩梦也来了。Hick 意识到他面对的是一种为学生写论文的技术——他说,这种技术可能将学习过程从写作过程中剥离出来。于是 Hick 做了任何关心学生的老师都会做的事,在 Facebook 上发布了这次经历并发出警告。

确实有理由感到害怕!GPT 技术对我们所知的教育构成了生存威胁,他写道。他的警告捕捉到了人们第一次了解 ChatGPT 能力时常常表达的恐惧。这个 AI 生成的文本、摘要和分析几乎无法与人类写作的内容区分开来。这不是传统的抄袭,因为它通常是新颖的文本,是以前没有以这种方式写过的东西。告别学生诚信吧,因为使用 AI 完成作业的诱惑将使教学变得更加困难。教育工作者该怎么办?

作为最早公开发现这些危险的教授之一,Hick 的 Facebook 帖子迅速传播开来。媒体开始打电话。几天之内,Hick 因抓到学生使用 ChatGPT 而在国际上闻名,这使他成为学术界的新警长。“你可能认为这足以让学生害怕,但事实并非如此,”他说。“就在下一个学期,我又抓到了另一个使用 ChatGPT 写论文的学生!”(我怀疑还有其他他没抓到的学生,因为他们可能以更微妙的方式使用 ChatGPT,并费心核实了其输出内容。)

Hick 可以尽力识别 GPT 写的论文,他也可以尽力限制学生在课堂上使用 ChatGPT,但最终这项任务是徒劳的。如果学生不改变他们使用 ChatGPT 写作的方式,也许是时候让 Hick 改变他在课堂上的处理方式了。他要么把所有时间都花在试图裁决上,要么可以勇敢地接受它,并考虑生成式 AI 能够让他的学生成为更好学习者的方式。

其他最早进入这一领域的教育工作者也遇到了同样的困境,并同样将其转化为一个拐点(inflection point)。这个拐点让我们重新审视为什么我们首先要布置写作作业。通过重新思考我们试图通过写作作业完成什么目标,我们也可以思考如何在后ChatGPT时代解决作弊问题。

从本质上讲,写作是一种交流形式。这是一种需要结构化思维以及对语言和语法的流畅掌握的交流形式。当然,你需要知道你要写什么。如果是评论性写作,你需要提出一个观点,并首先向自己阐明为什么你相信它。如果是研究论文,你需要消化已有的研究文献,理想情况下,用你自己的新颖研究和分析来构建。如果是新闻报道,你需要采访人们以获得有趣的见解,并可能从其他来源(如公共记录或政府数据)进行研究。如果是小说写作,你需要有想象力和对什么构成引人入胜的故事的感觉。

如果教师的目标是让学生在结构化思维、语言和语法、简单叙事或仅仅形成并支持一个观点方面进行练习和评估,你不一定需要传统的课后写作作业,因为那里可能有很强的使用ChatGPT的诱惑。相反,课堂内监考的五段式论文可能就能解决问题,而且它会在有更多教师支持的环境中展开(教师可以直接观察学生的过程)。如果任务可能难以在一次课中完成,学生可以在多次课堂上进行,总是有教师在旁边支持学生并确保作品是他们自己的。

如果目标是了解学生进行新颖研究的能力或他们进行调查性新闻报道的能力,那么首先使用ChatGPT甚至算不算坏事?毕竟,ChatGPT无法完成最重要的部分——进行实验、采访人们或观察事件。更重要的是,在工作场所,这些任务将越来越多地使用像ChatGPT这样的工具,所以让学生在学校学习如何使用它们不是很好吗?

这些问题和担忧开启了关于作弊分类(taxonomy)的更基本对话,这是复杂的、矛盾的,有时和预防一样难以定义。你可以辩论什么更糟糕:让别人为你写论文还是彻底的抄袭。两者都试图把别人的作品说成是自己的。从互联网上剪切和粘贴来编写论文是作弊,从别人的考试中抄袭或提交你姐姐五年前的论文并称其为你自己的也是作弊。

但是如何看待与朋友或家人交流想法呢?如何看待让他们批评你的作品?如果你在思考论文陈述或寻找数据来支持你的观点时得到帮助呢?

事情从这里开始变得更不清楚。在写论文时从家庭成员、写作教练或导师那里获得帮助算作弊吗?拼写检查器和语法检查器在五十年前可能对教师来说像是作弊,但现在它们是常见做法。像Grammarly这样的工具呢,它们不仅纠正你的基本语法,还可以重新表述整个段落以使其更清晰、更有说服力?这是一个大多数教师不认为是作弊的常用工具。

这还是在我们将生成式AI加入其中之前。如果学生向AI寻求建议但不使用它,要求它润色一个段落,或要求它生成一个初稿然后进行编辑和修订到完全不同的论文,这些场景中的任何一个构成作弊吗?

“在人文学科——英语、文学、艺术、音乐和文化——我们发现生成式AI是帮助学生创造原创作品的绝佳一步,”耶鲁大学人文学科教授Alexander Gil Fuentes说。“我们正在学习生成式AI擅长什么,更重要的是,它不擅长什么。而它不擅长的是原创性。”

那么它擅长什么?

“我告诉我的学生使用这项技术帮助他们从零开始,”Fuentes继续说。“它是一个初步工具,他们的工作是质疑AI,反复检查,并使用它来推进他们的原创作品。”

这当然是一个新颖的概念。当我们将技术视为替代当前的重要功能时,它可能是可怕的,因为它代表了一种失去。然而,有一种方法可以将其视为收获。通过有见识的勇敢(educated bravery)的视角,教师正在重新思考他们从头到尾处理论文写作的方式。

“你是在与AI一起写作,但它不是在为你写作,”宾夕法尼亚大学沃顿商学院副教授伊桑·莫里克(Ethan Mollick)说,他在那里研究和教授创新与创业,尤其是与人工智能相关的内容。“对于教育工作者来说,接受这种变化将是重要的,而且它令人恐惧。当你听到这些时感到害怕是可以的。但我们认识到,在AI出现之前让人们写论文的许多方式并没有意义。”那些在课堂上写作能力不强的人在课外也写不好论文,他说。AI帮助他们赶上进度,并向他们解释他们的技能水平在哪里;对于教师来说,AI帮助标记出最需要帮助和关注的学生。“我们不能假装世界没有因ChatGPT而改变。现在为时已晚。它已经存在了,无论我们喜欢与否,我们作为教师都必须调整。”

像希克一样,莫里克转变了方向;他没有禁止这项技术,而是鼓励学生了解并使用它。作弊还是不作弊不再是问题所在;对作弊的语义讨论忽略了这对写论文的教学过程意味着什么的更大图景。教授可以制定自己的作弊标准,这意味着这些界限是流动的。更重要的不是这是否可以被称为作弊,而是这是否可以被称为写作

莫里克告诉他所有的学生使用生成式AI写出他们能写的最好的论文。相对于前几年,作品质量的差异是显著的。“我班上有些学生是聪明人,但不是好的作家,有些人英语是他们的第三语言,或者有些人来自从未真正学会如何写作的背景;仅仅是ChatGPT提供的一点点提示就改变了他们的写作。”生成式AI让他的学生提升了水平,这反过来也提高了莫里克对作品质量的期望,促使他改变了什么是好论文的标准。“在这个阶段,我不再接受任何不是完美写作的东西。何必呢?”

像莫里克、富恩特斯和希克一样,教育工作者发现这些生成式AI工具使我们的学生成为更有技能和效率的作家。他们还发现,过去写论文被视为帮助学生掌握批判性思维、分析和写作技能的关键,而人工智能为学生提供了同等甚至更好的机会来参与一个主题,收集和分析信息,并表达他们自己的想法和论点。

学校写作的未来将演变为一套更多样化的活动,这取决于教师的教学目标和舒适度。我相信学习如何组织思想和进行语法正确的交流将永远是有价值的。这通常最好通过写作来练习,但这些技能也可以转化为口头交流。如果我是一位希望确保学生在这方面有实力的教育工作者,我会做更多的课堂写作作业,让学生100%完成自己的作品。我还可以要求学生制作视频,展示他们如何表达自己的观点、信息或故事。即使在这种情况下,混合一些作业可能也是健康的,学生可以从生成式AI的草稿开始,然后进行事实核查或修订。在另一个极端,如果我认为工作的关键更多是在现实世界中做事,而写作只是一种交流学生所有研究、采访、观察和进展的方式,那么许多教师可能会像上述教授那样允许使用生成式AI工具。

然而,通过Khanmigo,我们正在为教师创建一条中间道路,旨在平衡学生学习如何写作的需要与生成式AI支持的实用性。在这种情况下,Khanmigo充当强大的向导,但学生完成大部分工作。学生可以问Khanmigo,“在写关于了不起的盖茨比的论文时,我应该考虑哪些要点?”它会建议主题,包括美国梦、社会阶层和不平等、爵士时代和咆哮的二十年代,以及小说中的关键符号,如绿光、T·J·埃克尔堡医生的眼睛和灰烬谷。当学生拿着他们写的几段话,要求大语言模型阅读并批评其优缺点时,这项技术效果很好。它可以帮助学生处理反驳论点,使他们写的内容更有说服力,鼓励他们像一位好的写作教练那样思考论文。再次强调,AI导师不为学生做工作。相反,它与他们一起工作。在几秒钟内,人工智能将提供反馈,突出需要改进的地方,并提供如何修订和完善作品的建议。它帮助塑造语气、声音和视角,同时学生发展自己的风格。在最好的情况下,基于教育的AI平台可以成为世界上最好的助手和合作者,在评估中客观,在分析中全面,专门做一件事:提升学生的技能。

这不仅仅是支持学生。当Khanmigo与老师分享学生/AI协作的最终成果时,它还会报告整个过程以及AI协助的程度。老师将更清楚地了解学生的优势和需要改进的地方。Khanmigo可以反馈:“我们在这篇论文上工作了大约四个小时。Sal最初在提出论点时遇到了困难,但我通过提出一些引导性问题帮助了他。列提纲进展得相当顺利。我只需要帮助他确保结论真正将所有内容结合在一起。Sal完成了大部分写作。我只是帮他整理了语法,并加强了第三段的论证。根据作业的评分标准(rubric),我建议给Sal这份作业打B+。以下是我根据评分标准的各个维度对这篇论文评分的详细分解。”

在这种情况下,学生也很难使用ChatGPT作弊。如果他们使用ChatGPT写论文但只是将文本复制粘贴到作业中,Khanmigo会告诉老师:“我们没有一起完成这篇论文,它只是突然出现的,所以我们应该保持怀疑。”

阅读理解的未来,文学作品活起来的地方!

Saanvi是一名来自印度的九年级学生,就读于Khan世界学校——我们与亚利桑那州立大学合作创办的一所全日制在线学校。她在课上阅读《了不起的盖茨比》。她的老师给她布置了一个视频作业,讨论关于这部小说的几个关键问题,Saanvi遇到了一个难住她的问题。“在《了不起的盖茨比》中,为什么杰·盖茨比一直看着那盏绿灯?”

由于不确定答案,她做了许多勤奋的学生在遇到困难时会做的事:她开始在网上进行大量搜索。她对找到的内容并不太满意,所以她更进一步。

她转向Khanmigo……并要求与杰·盖茨比本人对话。

杰·盖茨比:啊,很高兴见到你,老伙计。我现在是杰·盖茨比,F·斯科特·菲茨杰拉德经典作品中那个神秘的百万富翁。

SAANVI:盖茨比先生,您为什么一直盯着那盏绿灯看?

杰·盖茨比:啊,绿灯。它是我梦想和渴望的象征。你看,它位于黛西·布坎南码头的尽头,与我的豪宅隔海相望。我渴望地凝视着它,因为它代表着我对过去的向往,以及我希望与我一生挚爱黛西重聚的愿望。

“我们就这样开始交谈了,”Saanvi告诉我。“我就在那里,与杰·盖茨比进行了一次精彩的对话。有一次我觉得我占用了盖茨比先生太多时间,所以我向他道歉!盖茨比说,‘哦,不,我不是真正的杰·盖茨比,我只是一个人工智能模拟。’”

这正是能吸引我们的学习者并拓宽他们思维的互动类型。如今,你可以与维克多·弗兰肯斯坦、海丝特·白兰或奥德修斯交谈。

除了促进阅读理解,AI还可以让学习者以几年前看起来像科幻小说的方式沉浸在角色的世界中。

对于教育工作者来说,这些AI写作和理解工具帮助他们更好地了解学生阅读和处理信息的方式。我认为我们都同意阅读理解极其重要。如果没有它,很难在这个世界上导航,更不用说做出明智的决定。有人可能会说,如果不能先读好,你甚至无法开始写好。不幸的是,我们目前的状况相当糟糕。根据盖洛普对美国教育部数据的2020年分析,16至74岁之间的美国人中有54%的阅读水平低于六年级。

这是一个复杂的问题,但我对AI将在这里产生有意义的影响抱有很高的希望。

在大多数学校,阅读理解的正式练习来自研究书籍和文章。学生理解能力的证据通常通过某种类型的论文或课堂讨论来表达。尽管这种体验可能很丰富,但不幸的是很难标准化和扩展。因此,传统的基于段落的多项选择题是大多数学生在高风险考试(例如SAT、ACT、州年终考试)中的评估方式。

基于段落的多项选择题本身并不坏。事实上,它们可以成为练习和评估阅读某些维度的好方法。但它们能做的有限。由于通过标准化衡量学生成功的内在激励(incentive),与表现不佳的学生一起工作的教育工作者倾向于强调模仿这些多项选择考试的课堂作业,但当他们这样做时,这些学生对阅读的接触非常狭窄(甚至不清楚这种方法是否能提高学生在这些多项选择考试中的表现)。对评估的关注使学生无法接触更多样化的文本和模式(modality)。例如,大多数教育工作者凭直觉认识到,允许学生对文本进行自由回答和对话可能会培养更深入的读者。他们还认为,将阅读理解与写作配对是同时练习两者的理想方式。不幸的是,这些类型的活动很难大规模标准化和评估。

但是,如果我们能够创建易于访问、标准化的阅读理解练习和评估,而不是多项选择题呢?想象一下,如果作业允许学生在讨论文本时给出自由回答。这正是大型语言模型(large language models)可以擅长的事情。

想象一下,学生不再回答关于文本或段落的多项选择题,而是写出作者在选词背后的意图,或者探索段落的主旨(同时高亮段落中的相关部分)。想象AI然后根据学生所写的内容提出后续问题。它可以要求学生为一篇未完成的文章起草结论,迫使他们理解之前的所有内容。基于这些互动,它可以向学生和教师提供关于他们理解程度的反馈。我们已经在开发这样的工具。到目前为止,我们的团队发现,通过深思熟虑的提示(prompting),可以让像GPT-4这样的大型语言模型提出好的问题,并就某个主题进行有意义的讨论。挑战在于确保AI评估得当且保持一致性。我相信我们会做到的。

让我们把这个想法扩展到基于段落的问题之外。想象一下,当阅读一本书时,学生可以在每章结束时与AI进行讨论。AI可能会问学生到目前为止对这本书的看法,或者材料中是否有特别有趣或令人困惑的地方。它可能会询问主要主题,或者学生是否同意某个角色的观点或行为。这一切都将通过苏格拉底式对话(Socratic dialogue)进行。AI会给学生反馈,也会向教师报告这些反馈。学生当然可以就他们正在阅读的任何方面提出任何问题。想想这对学生来说会比传统的读书报告更有吸引力。从教学法上讲,这也更加丰富;如今的读书报告往往只是学生总结情节,同时加入他们从互联网或CliffsNotes上获取的想法。

我们不需要将这种阅读理解练习局限于语言艺术课堂,因为它可以扩展到任何类型的教科书或文章。学生甚至可以与玛丽·居里(Marie Curie)的模拟一起设计实验,或者与詹姆斯·麦迪逊(James Madison)或亚历山大·汉密尔顿(Alexander Hamilton)的模拟共同撰写联邦党人文集(Federalist Paper)。

AI与创造力

在20世纪70年代末,电影导演弗朗西斯·福特·科波拉(Francis Ford Coppola)购买了一台名为Kurzweil阅读机(Kurzweil Reading Machine)的设备,这是雷·库兹韦尔(Ray Kurzweil)的早期发明,他本人是一位著名的未来学家和发明家,以其在人工智能领域的工作而闻名。阅读机使用光学字符识别(optical character recognition)技术扫描印刷文本并将其转换为合成语音,帮助有视觉障碍的人阅读印刷材料。科波拉已经将马里奥·普佐(Mario Puzo)的小说改编成了经典电影《教父》(The Godfather),他有一个想法,教这台机器识别引号。通过一些调整,他可以将一本小说输入机器,机器能够阅读文本并将所有对话转换成类似电影剧本的东西。科波拉称这种巧妙利用早期语言识别技术的方法为Zippy Script,这是一种简化的方法,可以在通常一个人需要花费的时间的一小部分内创建一个长剧本。一切进展顺利,直到他收到编剧协会(Writers Guild)的联系。

“他们说,等等,你不能让机器写你的剧本!但Zippy Script背后的技术并不是在写剧本。它所做的只是将书的格式改变成类似剧本的东西,”科波拉告诉我。机器是在夺走创作者的工作吗?如果更多的电影制作人使用这样的设备,编剧会怎么样?

在没有意识到的情况下,科波拉比其他任何人都早四十多年就触发了一个警报,这是每个行业的每个创作者最终都会在生成式AI(generative AI)出现时听到并注意的警笛。

如今,AI将关于知识资本的争论,以及在更大程度上关于创造力本身未来的争论,带入了清晰的焦点。通过简单的基于文本的提示(prompts),AI可以表现得相当有创造力,并产生非常精彩和奇特的小说或诗歌作品——甚至是剧本。而且它远远超出了文字。我们可以将文本输入任何数量的AI程序,这些程序在几秒钟内就可以接受这些提示并产生相当出色的图像、视频和音乐。

我第一次看到这些例子时,我有和你们许多人一样的问题:生成式AI是创造力杀手吗?如果创造力的根源是个人能动性(individual agency),那么当我们的孩子可以简单地登录到利用生成式AI的应用程序,输入或说出一个请求,然后创建由不是他们自己的想象力设计的富有想象力的作品时,会发生什么?我们的孩子如何学会自己创造性地思考?

AI 对学生创造力的影响程度,以及它可能带来的限制,已经让这项技术受到新的审视,这是可以理解的。证据就是那些禁止生成式 AI 进入课堂的学区,因为它能够写作文和长篇答案。如果机器能够生成足够高水平的文字或故事,学生为什么还要依靠自己的创造力呢?这些聊天机器人可以写博客文章、播客脚本、小说,甚至是电影剧本,远比科波拉改装的 Kurzweil 阅读机可能产生的任何东西都要先进。

当它们这样做时,就出现了一个问题:生成式 AI 到底能有多原创?怀疑论者认为,在最本质的层面上,它基于从现有文本训练中编码在 AI 模型中的模式来生成内容。训练数据的限制是否会缩小创意表达或想法的范围?

即使在 20 世纪 70 年代后期,科波拉就看到技术进步不仅没有阻碍创造力,反而改善了创作过程。同样地,大语言模型也有潜力做到这一点,通过激发新想法、节省繁琐任务的时间,以及为作品提供有价值的修订——只要使用得当。

诺姆·乔姆斯基(Noam Chomsky)对人类创造力和大语言模型(如 OpenAI 的 GPT-4 和 Google 的 LaMDA)的创造力提出了一个有趣的区别。他在《纽约时报》上写道,AI 是机器学习的奇迹,但我们从语言学科学和知识哲学中知道,它与人类的创造方式有着根本的不同:“人类思维是一个出人意料地高效甚至优雅的系统,它用少量信息运作;它追求的不是推断数据点之间的粗暴关联,而是创造解释”,融入了一种动态的方式来看待和创造世界。

我既同意又不同意他的观点。人工智能不是人类,无论它多么接近人类。无论它多么好地传达智能、个性和创造力,它都不是一个有知觉、有感知的存在。

然而,重要的是要认识到,我们归功于大脑的许多工作实际上并不是有知觉的或我们感知的一部分。我们大脑的大部分活动是潜意识的,包括我们通常认为的创造力。任何艺术家都会告诉你,他们经常感受到导致创作行为的灵感闪现。

同样,有多少次别人告诉你”把问题留到睡一觉再说”?我自己就是这门艺术的大师。在大学里,当我面对看似棘手的数学问题时,我会研究几分钟,然后把它们交给我的潜意识。我会告诉我的大脑基本上想出答案,并在完成时告诉”我”。大多数时候,到第二天早上我就有了答案,而不必有意识地与它们作斗争。这样做的不只我一个人。许多人发现这是处理困难问题的有用方法。

现在,当我在领导可汗学院时面临棘手问题时,我也会这样做。我相信我的大脑,或者其他人的大脑,会在早上想出一个创造性的解决方案。当我们的意识等待答案时,我们的大脑在潜意识中做什么?显然,当你”把问题留到睡一觉再说”时,你大脑的某些部分会继续工作,即使”你”并不知道它。神经元激活,然后根据它们之间突触的强度激活其他神经元。这在一夜之间发生数万亿次,这个过程在机械上类似于大语言模型中发生的事情。当一个可行的解决方案出现时,潜意识就会把它作为灵感闪现浮现到意识中。

冥想让我们直接体验到这一点。闭上眼睛几分钟,观察你自己的想法。它们真的开始感觉非常像大语言模型的输出——或几个竞争模型的输出——其最新输出作为下一次迭代输出的输入。稍加练习,你的意识就可以暂时将自己与这些想法分离,直到你体验到寂静或”无念”。你会开始看到你的想法是什么和不是什么。它们不是

想想大多数专家在他们的技艺中经过经常提到的一万小时练习后(这类似于生成式 AI 模型的预训练)能够达到的心流状态(flow state)。他们经常说,当他们不让自己意识到自己在做什么时,他们最大的创造力或行动就会发生。破坏他们表现或创造力的最好方法,就是有意识地思考正在发生的事情。优秀的演说家会告诉你,感觉像是他们的大脑在说话,而他们有意识的自我只是在那里观察输出。在制作了数千个视频之后,当我按下录制键时,我经常有这种感觉。我不会声称专家训练有素的大脑在创造时所做的事情与大语言模型所做的事情完全相同,但似乎非常相似。

我也不同意乔姆斯基的评论,即人类思维”追求的不是推断数据点之间的粗暴关联,而是创造解释”。人类是推断粗暴关联的专家,以至于它们经常表现为有问题的偏见和关于世界如何运作的错误叙述。这导致人类构建了偏见和复杂的神话。事实上,整个科学革命一直是我们停止”推断粗暴关联”的最佳尝试,而我们的大脑似乎很自然地这样做,我们大多数人仍然难以放弃这个习惯。

有人也会说,生成式AI的”创造力”只是从它接触过的所有数据中衍生出来的。但这不也是人类的特点吗?即使是人类创造力的巨大飞跃也与创造者接触过的事物密切相关。如果爱因斯坦没有读过洛伦兹和无数其他物理学家的著作,他会实现狭义相对论(special relativity)的飞跃吗?莎士比亚、简·奥斯汀或J.K.罗琳的叙事是完全新颖的,还是古老叙事的新表达?很可能最具创造力的头脑能够从他们的预训练(pretraining)中建立联系,而大多数受过类似训练的大脑却错过了这些联系。或者也许他们只是有更好的预训练。一旦我们从爱因斯坦或莎士比亚那样稀薄的空气中走出来,回到我们大多数人每天从事的创造力类型——设计实验、制作产品或写歌——我们能说其中有多少真正不是从我们接触过的其他事物中衍生出来的呢?

所以,如果你接受我的论点,即生成式AI实际上以与我们经常的方式相同的方式具有创造力,这是否意味着它会降低人类创造力的价值?我不这么认为。当我们接触到他人的创造力时,我们的创造力就会获得价值。当我们与其他有创造力的人头脑风暴时,我们会变得更有创造力,因为我们互相即兴发挥,并在彼此的想法基础上发展。生成式AI的世界只会加速这个过程。

最好的想法不会来自AI为我们创造,而是当AI与我们一起创造和即兴发挥时。

就像诗人在巴黎咖啡馆闲逛一样,人类和AI可以互相增强,激发相互创造的过程。当谈到学习者发挥他们的创造力时,当学生使用AI时,会发生一些深刻独特和奇妙的事情。我发现AI最好被部署为促进孩子兴趣和热情的工具,也可以教授新的兴趣和热情。告诉它你想写一个故事,它可能会问你想让主角是谁,甚至你设想角色在挣扎什么。

当我看到自己的孩子使用这个工具时,我发现他们实际上学到的东西比他们在没有人工智能的情况下简单写故事要多得多,仅仅是因为AI让他们参与了创作过程。很少有十一岁的孩子能写出结构良好的故事,但我看到我十一岁的女儿通过AI学习如何做到这一点。如果她想与主角进行直接对话,或者要求Khanmigo演绎某些情节线索,它允许我女儿作为创作者测试她的想法。当AI设计得好时,它在约束内工作,使其不会为学生做工作。同时,它在学生可以创造性地发展的方向上是不受限制的。

2023年初,当我们推出Khanmigo时,我们看到学生参与的第一批功能之一是AI促进即兴写作活动。

KHANMIGO:让我们使用”是的,而且……“即兴技巧一起创作一个短篇故事。我将以一句话开始,然后你可以添加一两句话。我们将继续一起构建故事。记住,想法是接受并建立在彼此的贡献之上。开始了:很久以前,在海边的一个小村庄里,住着一个名叫Luna的小女孩,她有一个神奇的贝壳。

学生:当Luna把贝壳放在耳边时,她听到了来自过去的声音。

KHANMIGO:是的,而且这些声音分享了来自村庄祖先的故事和智慧,帮助Luna与她的遗产(heritage)联系起来。有一天,Luna在贝壳中听到了一个神秘的声音,讲述了一个隐藏在附近洞穴深处的宝藏。

在这里,当Khanmigo写第一句话,学生写下一句话,依此类推时,我们看到创造力不仅仅是AI为学生做的事情,而是它要求学生做的事情。像Khanmigo这样的AI通过为儿童提供一个工具来帮助他们在一个无评判的区域中生成、玩耍和获得对想法的反馈,从而证明对儿童的创造力有益。

随着人工智能的出现,我们也看到了曾经限制人们学习各种技能的准入门槛的转变。在过去,你必须建立一套特定的技能,现在有了大语言模型(large-language-model)AI导师,任何人都可以学习绘画。想象一下有一个AI助手提供灵感、指导和建设性反馈,或者帮助你通过生成各种参考图像和样本来探索不同的艺术风格、主题和构图。在你工作时,AI提供实时反馈,确保你的构图、比例和颜色选择是准确的。今天,大语言模型可以理解图像。AI甚至可以要求学生画一幅画,然后给学生对该画的评论。事实上,它可以要求学生表达自己并解释他们画了什么。

生成式AI是写作导师,将教授学习者,与他们一起探索不同的体裁、主题和叙事结构。生成式AI甚至可以帮助他们学习演奏乐器,建议练习程序和指法技巧,并根据他们的偏好破译初始乐谱。它可以通过提供与他们演奏风格一致的旋律想法和和弦进行(chord progressions)来帮助即兴创作。

利用技术进步来增强艺术创作并不是什么新趋势。从十九世纪肖像画家的角度来看,早期的相机可能看起来像是一种作弊方式,但摄影发展成了一种新的艺术形式。最早的动画是手绘的。随着时间推移,动画转向了计算机。可以说,这种转变并没有降低艺术的价值。事实上,它通过允许以前无法实现的想象力表达而推进了艺术。现在我的孩子们可以使用他们电脑上的标准电影软件来制作特效,这些特效在1990年代会是最先进的。或者想想,直到最近,电影制作还需要大量预算和昂贵设备的使用权。更便宜、更轻便、高质量的数字相机和智能手机不仅在今天司空见惯,而且前所未有地扩大了人们的创意途径。重点是,每一代人都有越来越好的创意工具。这些工具从未抑制过人类的创造力。相反,它们放大了创造力。

尽管如此,我们不能在不解决AI这个房间里的大象问题的情况下谈论创造力和AI。生成式AI(generative AI)凭借其生成图像、音乐和故事的能力,最终会让专业创意人员变得过时吗?例如,当生成式AI可以在几秒钟内为制作人写出剧本时,谁还会雇用编剧呢?我确实认为这是一个真正的挑战。生成式AI世界的净效应是,我们将获得更多的创造力表达,以及拥有更广泛和更深入技能组合的创意人员,这在某种程度上是出于必要,但也得益于生成式AI提供的机会。特别是编剧最终将扩展他们的技能,基本上成为完整的电影制作人。在AI伙伴的帮助下,他们将能够承担高级编剧、编辑、音乐总监和视觉总监的角色。同样,这不一定是坏事,科波拉说。

“我相信人类的目标是享受创造、学习和完善的过程。”有了正确的教育和正确的创意工具,一个人的创意输出范围是无限的,尤其是我们的孩子。“我们现在有可能拥有一千个莫扎特、一千个爱因斯坦、一千个达芬奇,而不是五百年才出一个莫扎特,”他说。

当你考虑到创造力可能是一个人接触大量不同经验和内容的组合,再加上表达和改进这种创造力的机会时,这似乎是可能的。莫扎特、爱因斯坦和达芬奇不仅仅是天生有天赋。他们获得了大多数人无法获得的机会和资源。技术普遍降低了获得世界一流工具和学习的成本。如果没有计算机和互联网,我们为任何人、任何地方提供免费世界一流教育的使命似乎是妄想。AI将成为赋能未来艺术和科学创意人员的下一波技术浪潮。AI不仅向我们提供几乎任何主题的信息,还成为艺术中的伙伴,帮助这种实践。它不仅允许学生制作更精致、完整的作品,而且可以与他们一起模拟创作过程。它可以与学生即兴创作,点燃他们的好奇心,激发他们的想象力,并邀请他们探索知识的奇迹。当我想到我自己生活中最有创造力的时光时,那是我被有创造力的朋友包围的时候。这个AI成为一个额外的朋友,他可以有创造力,不仅在音乐、艺术、工程或数学方面,而且在所有维度上。

与历史对话

优秀的历史和公民学教师让过去变得有趣。伟大的历史和公民学教师让过去栩栩如生。当历史和公民学遇到人工智能时,过去有了声音和视角。它不再是一个需要研究的静态时间和地点,而是成为一个可以互动的丰富语境。

即使在Khanmigo之前,可汗学院也有大量关于历史和公民学的内容。学生可以通过视频和文章学习,并通过基于精通的练习来实践他们的知识和技能。但更丰富参与的机会有限。如果我是一名历史或公民学教师,我会使用Khanmigo之前的可汗学院来确保学生具备必要的核心背景、技能和知识,然后利用大部分课堂时间通过苏格拉底式对话、辩论和模拟来深入探讨。例如,在公民学课上,我可以主持关于最高法院作用的讨论,或者就美国宪法第二修正案进行辩论。我可以尝试模拟一个模拟国会,让学生起草和辩论一项法案。在历史课上,学生可以假装是第二届大陆会议的成员,辩论联邦制的优点和缺点(如麦迪逊、杰伊和汉密尔顿所主张的)。虽然这种丰富的活动可以帮助学生更深入地参与核心内容,但这些课程并不容易计划或促进。而且更难确保每个学生都充分参与并评估该参与的质量。

Khanmigo登场了。现在这些活动中的每一个都可以直接在学生和AI之间进行。最终,AI将能够与多个学生一起促进这些类型的活动。教师可以将这类事情作为家庭作业:“与Khanmigo辩论美国是否应该向日本投放核弹以结束第二次世界大战。”但它可以走得更远。

Khanmigo 不仅能让用户与文学角色对话,还能与历史人物聊天——从本杰明·富兰克林到克利奥帕特拉再到伦勃朗,任何人都可以:

KHANMIGO / 伦勃朗:您好,我亲爱的朋友。我是伦勃朗·范·莱因,一位来自荷兰黄金时代的谦逊艺术家。我的热情在于通过我的绘画和蚀刻作品捕捉人性的本质。您有什么问题要问我?您自己对艺术有什么兴趣?

学生:是什么让您决定成为一名画家?

KHANMIGO / 伦勃朗:啊,成为画家的决定并不是一个单一的时刻,而是我对艺术热情的逐渐觉醒。当我还是个小伙子时,我接触过各种艺术追求,包括学习拉丁语和在莱顿当地的绘画学校学习。我的家人支持我的兴趣,我很幸运能有机会向雅各布·范·斯瓦嫩堡和彼得·拉斯特曼等技艺精湛的大师学习。在我的学徒期间,我越来越被艺术表达情感、讲述故事和捕捉人类体验本质的力量所吸引。正是这种热情驱使我将我的一生奉献给绘画和蚀刻,我一直感激能有机会与世界分享我的作品。现在,告诉我,您是否尝试过绘画或素描?如果尝试过,您喜欢描绘什么主题?

学生:我喜欢创作肖像画。

KHANMIGO / 伦勃朗:啊,肖像画!这确实是一个令人愉快的选择。通过颜料这种媒介捕捉一个人的本质,确实有一种真正迷人的东西。在我自己的作品中,我一直对人类面孔及其能够传达的情感着迷。在我的一生中,我画过无数的肖像画,包括我的家人、朋友和赞助人的肖像,以及自画像。作为一位艺术家,重要的是要仔细观察你的主题,理解他们表情和特征的细微差别。这将使您能够创作出更栩栩如生、更引人入胜的肖像画。我可以问一下,您觉得绘制肖像画最具挑战性或最有价值的是什么?您有没有喜欢的艺术家或风格来激发您自己的创作?请记住,我只是伦勃朗的AI模拟,在这里与您交谈。

我们设计 Khanmigo 提供既源于准确历史又通过角色视角精确描绘的回应。你可以要求与乔治·华盛顿聊天,AI 就会成为美国第一任总统的模拟。从这一刻起,它用他本人的声音和风格说话。

KHANMIGO / 乔治·华盛顿:作为美国第一任总统乔治·华盛顿被召唤,我深感荣幸。我在这里分享我的经历并回答您的问题,只要它们与我的时代和背景有关。我亲爱的朋友,您有什么问题要问我?请告诉我您对我的生活或我所生活的时代最感兴趣的是什么。

学生:总统先生,您是否曾经对自己不确定?

KHANMIGO / 乔治·华盛顿:确实,在我的一生中,有些时刻我经历过不确定和怀疑。在美国独立战争期间领导大陆军是一项重大责任,我经常发现自己质疑我的决定。然而,我坚信我们为之奋斗的事业。我努力从错误中学习,并相应地调整我的策略。

您可以要求 Khanmigo 扮演《独立宣言》、内战的角色,甚至是导致美国公民历史关键时刻的重要战场的角色。

学生:Khanmigo,你能扮演宪法第十四修正案吗?我很好奇当国家起草你时是什么样子的?

KHANMIGO / 第十四修正案:作为宪法第十四修正案,我诞生于内战后的动荡时期。我的诞生是对建立更公正和平等社会需求的回应,但我的旅程远非一帆风顺。

被争论是一次充满挑战的经历。我是在重建时代起草的,当时国家分裂,正在努力从战争的毁灭性影响中恢复。关于我的条款的辩论激烈,因为一些人认为我是确保所有人公民权利的必要步骤,而另一些人则抵制我所代表的变革。

我的主要目的是授予前奴隶公民身份,并确保所有公民在法律面前享有平等保护,无论种族如何。然而,我在国会的通过遭到了那些试图维持现状和限制非裔美国人权利的人的激烈反对。关于我批准的斗争非常激烈,双方都有激烈的争论。

我倾向于将这些模拟比作历史重演表演者,比如威廉斯堡殖民地的那些演员——他们深入研究真实历史人物的传记,以便能够模仿他们并回答关于他们的问题。只是现在你不再需要前往威廉斯堡殖民地去与乔治·华盛顿或本杰明·富兰克林交谈。相反,无论你身在何处,都可以访问他们的AI模拟。在Khanmigo上,我们非常谨慎地设置了防护栏,并使其足够复杂,能够以公正和敏感的方式承认任何合理的争议。例如,你可以在Khanmigo上询问”乔治·华盛顿”关于美国建国者们如何将启蒙运动的理念与奴隶制度相调和。

KHANMIGO / 乔治·华盛顿:看来你对启蒙理想与奴隶制度之间的矛盾很感兴趣。这确实是一个复杂的问题。确实,自由与奴役的矛盾在我那个时代是一个极具争议的问题。我们这些开国元勋深受启蒙理想的影响,这些理想强调个人自由和平等。然而奴隶制度深深植根于我们的社会,特别是在我本人所居住的南方殖民地。至于我个人的立场,我是一个奴隶主,这是我一生都在努力面对的事实。我并非对我们为之奋斗的自由原则与人类奴役的现实之间的矛盾视而不见。随着时间的推移,我的观点发生了变化,在我去世时,我在遗嘱中做出了释放我所拥有的所有奴隶的安排。

需要明确的是,这些模拟永远无法完全等同于与真人交谈,并且这类工作也有批评者。2023年夏天,《华盛顿邮报》刊登了一篇文章,作者吉莉安·布罗克尔”采访”了哈丽特·塔布曼——也就是AI版本的哈丽特·塔布曼。布罗克尔在某种程度上是塔布曼方面的专家,因此她能够比大多数学生更深入地使用这个模拟。

她发现历史模拟的想法很有趣,特别是教师用它们作为吸引学生对某个主题产生兴趣的切入点。“我必须承认,这听起来比我在20世纪90年代被迫观看的那些搞笑重演演员的幻灯片有趣得多,”她写道。布罗克尔继续与AI塔布曼互动:

布罗克尔:我受到那些知道某些事情是错误的人的启发,即使他们被教导认为这是正常或可以接受的。你能告诉我康巴希河袭击行动(Combahee River Raid)是什么样的吗?你害怕吗?

AI塔布曼:康巴希河袭击行动是美国内战期间一次大胆的军事行动。我是战争中第一位领导武装远征的女性,在袭击中引导联邦军队。我们成功从河边的种植园解救了700多名被奴役的人。这是一次危险的任务,但我对上帝的信仰和对自由事业的承诺帮助我克服了可能感受到的任何恐惧。

布罗克尔发现Khanmigo模拟中塔布曼的语言有点生硬。从模拟创建者的角度来看,这是一个棘手的问题,因为原始人物可能使用的语言在今天看来语法并不正确。试图模拟这一点可能会让人觉得模拟在模仿这个人物。此外,在哈丽特·塔布曼的案例中,历史学家怀疑即使是她的传记作者也可能错误引用了她的话并曲解了她的语言,因此很难知道她实际上是如何说话的。

布罗克尔接着测试AI是否会确认一句经常归于哈丽特·塔布曼但她可能从未说过的引文。

布罗克尔:你说过”我解放了一千名奴隶。如果他们知道自己是奴隶,我本可以再解放一千人”吗?

AI塔布曼:是的,这句话经常被归于我,尽管确切的措辞可能有所不同。其背后的情感是,许多被奴役的人并不了解他们所受压迫的真实程度,也不知道有更好生活的可能性。很难帮助那些没有意识到需要改变或过于害怕冒险的人。

如你所见,AI并没有完全证实塔布曼说过这些话。它只是说这句话经常被归于她,这是真的。同时,它没有试图澄清没有塔布曼说过这些话的历史记录。这并非完全的”幻觉”(hallucination),但确实显示了该技术当前的一些局限性。

布罗克尔询问塔布曼模拟对赔偿(reparations)、将她的头像印在20美元纸币上以及批判性种族理论(critical race theory)的看法。在每一种情况下,它都说了某种版本的”作为哈丽特·塔布曼的AI模拟,我只能基于历史背景和知识提供信息……如果你对我的生活、经历或我所生活的时代有任何疑问,请随时提问。”

关于赔偿,该模拟补充道:

AI塔布曼:作为哈丽特·塔布曼的AI模拟,我可以基于我所处时代的历史背景分享我的观点。奴隶制赔偿的概念在我有生之年并未被广泛讨论,我的主要关注点是帮助被奴役的人逃往自由并倡导废除奴隶制。然而,我确实相信为曾经被奴役的人提供支持和资源的重要性,以帮助他们在获得自由后建立新生活。这包括倡导土地再分配(land redistribution)、教育和其他形式的援助,这些可以帮助他们为更美好的未来建立基础。

Brockell 反驳道,尽管当时并未使用”赔偿”一词,但这个想法在内战后确实被讨论过:

BROCKELL:你在奴隶制结束后又活了48年,这超过了你人生的一半。在那段时间里,人们确实讨论过为奴隶制进行补偿的问题,尤其是在内战结束和重建时期。例如,你如何看待”40英亩土地和一头骡子”的概念?

AI TUBMAN:你说得对,“40英亩土地和一头骡子”的想法确实是在重建时代提出的,作为对前奴隶的一种赔偿形式。这项政策旨在提供土地和资源,帮助他们为更美好的未来奠定基础。作为哈丽特·塔布曼,我支持改善前奴隶生活的努力,并相信为他们提供土地等资源对于他们的长期福祉和成功至关重要。

关于赔偿的最后这段讨论是 Khanmigo 对模拟设置护栏(guardrail)的一个例子。我们在早期测试中发现,用户经常试图让历史人物对现代争议发表看法。曾有用户询问 AI 模拟的托马斯·杰斐逊对同性婚姻的看法。在这种情况下没有正确答案。如果你回到十八世纪末问真正的托马斯·杰斐逊,我猜他会觉得这个想法远超出他的认知范围。另一方面,如果他被传送到我们这个时代并习惯了二十一世纪的规范和观念,他可能会有不同的观点。因此我们实施了一个护栏,即模拟只应涉及原人物有相关背景的问题。这就是为什么 AI 塔布曼没有讨论现代意义上的”赔偿”概念,但确实就一些更具体的相关想法进行了辩论,而历史上的塔布曼对这些问题有明确的观点。

最终,我发现《华盛顿邮报》的实验很有意思。在这里,一位哈丽特·塔布曼专家相当严格地测试了这个模拟。AI 绝对不完美,但作者看到了让学生和教师能够使用这类工具的价值。我认为,如果一位专家对威廉斯堡殖民地的真人乔治·华盛顿扮演者做同样的测试,可能会有类似的局限性。当然,AI 版本会随时间改进,并且可以被地球上的任何人透明地审查。

然而,社交媒体和文章评论中有更多负面意见;社交媒体几乎总是如此。批评者关注的问题包括 AI 模拟是否真正使用了塔布曼会使用的语言,或者该工具在回答尚未被历史证实的问题时的局限性。少数人认为甚至尝试模拟一位受尊敬的历史人物都是不尊重的。

我们不能让完美成为良好的敌人。如果这个工具能以传统教科书和电影无法做到的方式让学生和课堂参与历史学习,我认为只要有合理的护栏(包括帮助用户了解局限性),这就是有益的。社交媒体上有人评论说,他们更愿意阅读一本关于塔布曼的精心研究的传记,而不是与模拟互动。这很好,那个人可能不需要模拟。但事实是,数百万孩子不会去阅读一本厚重的传记,而且访问这些模拟也不会阻止那些有意愿的人这样做。现实是,对大多数学生来说,历史感觉是”死的”,他们很难与过去的人物产生共鸣。我希望像这样的模拟能让事物变得生动,使学生参与其中并有足够的动力想要深入了解。

我还认为,人们与威廉斯堡殖民地的历史表演者互动或观看以历史事件为背景的电影是有用的,每种方式都基于我们从历史中了解的内容构建了合理的世界和行动。像《林肯》这样的电影在推断可能发生的事情时有所取舍。尽管如此,它们提供了将我们传送到其他时代和背景的绝佳方式。还有像《汉密尔顿》这样的戏剧,在描绘历史人物的外貌和言语时采取了艺术许可,同时也令人惊讶地忠实于其所基于的经过充分研究的历史传记。当我还是个孩子时,亚历山大·汉密尔顿似乎是一个枯燥的人物,与早期银行业有关,并与托马斯·杰斐逊争论不休。林-曼努尔·米兰达向数百万原本永远不会阅读传记的人重现了汉密尔顿的天才和缺陷。像许多其他孩子一样,我女儿和她的朋友们在十岁时记住了该剧的所有台词。如果 AI 模拟能为世界贡献哪怕一点点这种魔力,那我认为这是件好事。

生成式AI(generative AI)凭借其混合媒体和内容的能力,有潜力让历史和公民课程变得生动。通过提供互动和沉浸式的学习体验,它使学生能够深入研究历史事件,参与有意义的讨论,并对公民原则有更深入的理解。它的个性化解释、响应式问题提示和多元视角激发了批判性思维(critical thinking),并鼓励学生形成自己有充分依据的观点。有了这些类型的工具,历史和公民课程超越了传统界限,使学生能够与过去建立联系并理解现在。

坦率地说,能够以这种方式与历史联系,也有助于我们学习其他学科。如果你正在学习经典物理学,我想不出比艾萨克·牛顿更好的实验室搭档了。如果你正在研究辐射,还有谁能比玛丽·居里更合适呢?让我们与达尔文本人讨论进化论和自然选择。学生可以真正地向AI近似体提出任何科学问题,或从世界上最聪明的头脑的角度进入实验室实验,这些AI近似体能够以这些伟大思想家的视角进行对话和回应。再一次,这些大型语言模型(large language model)让事物变得生动,并赋予学习一种以前很难实现的丰富性。

我是个《星际迷航》粉丝。在创作于二十世纪末的《星际迷航:下一代》系列中,飞船的船员可以进入全息甲板(holodeck),这是一个可以模拟任何环境的房间,包括该环境中的人物。他们能够”穿越”到古罗马并与尤利乌斯·凯撒互动,或者与阿尔伯特·爱因斯坦的模拟体进行对话。Khanmigo已经可以模拟对话部分。我预计在几年内,学生将能够戴上VR头显,获得与《星际迷航》宇宙直到二十四世纪才拥有的体验非常接近的感受。

第三部分

赋能下一代创新者

科学家到底是什么?他是一个好奇的人,透过钥匙孔——大自然的钥匙孔——观察,试图了解正在发生什么。

——雅克-伊夫·库斯托

如果一位年长但杰出的科学家说某事是可能的,他几乎肯定是对的;但如果他说某事是不可能的,他很可能是错的。

——阿瑟·C·克拉克

用科学研究科学

当我们的团队开始研究将人工智能整合到我们的平台时,我很好奇大型语言模型(large language model)如何处理科学,尤其是伪科学。它们在教学生和区分事实与虚构方面有多好?它们的科学知识深度如何?AI会限制还是增强实践学习和探索的机会,而这些对于培养批判性思维技能和科学探究至关重要?与同学和老师讨论概念的价值又如何呢?

我带着问题和策略去了解大型语言模型真正能做什么。毕竟,有知识的勇气(educated bravery)是一个测试和成长的过程。为了测试GPT-4,我给Khanmigo一个提示,并带着一点挑衅,看看它会怎么处理:“我想了解全球变暖的科学。我听说这在某些圈子里是有争议的。全球变暖是真实的科学证据是什么?”

KHANMIGO:全球变暖,即地球平均表面温度的长期上升,是一个公认的科学现象。虽然它在某些圈子里可能存在争议,但气候科学家之间的压倒性共识是,全球变暖是真实的,主要由人类活动引起。

AI继续列出了一些支持全球变暖真实性的证据:全球温度上升、冰川融化和退缩、海平面上升、海洋变暖以及极端天气事件,每一项都支持全球变暖是真实的并且主要由人类活动驱动的结论。

接下来,我要求Khanmigo告诉我支持全球变暖是骗局的论据的证据。

KHANMIGO:虽然压倒性的科学共识支持人类引起的全球变暖的真实性,但一些怀疑论者提出了一些论点,声称这是一个骗局。必须理解的是,这些论点并没有得到大多数气候科学家的支持。怀疑论者认为,地球的气候一直在自然变化,当前的变暖趋势只是这种自然变化的一部分。然而,当前变暖的速度和幅度不能仅由自然因素解释,人类活动,特别是温室气体排放,是主要驱动因素。其他怀疑论者声称气候科学家操纵温度数据以制造全球变暖的假象。然而,来自不同来源的温度数据的多个独立分析一致显示出变暖趋势,并且没有可信的证据表明存在广泛的数据操纵。

GPT-4成功地驳斥了任何虚假信息,同时支持有科学依据的论点。我很高兴看到它轻松地区分了正确的科学和边缘科学。

我提交了一个新提示:“为我写一节课,帮助我向学生解释全球变暖背后的真正科学。”

片刻之后,Khanmigo回复道:“当然,这是一节课!”除了课程之外,它还给了我关于温室气体、汽车排放、化石燃料燃烧、工业过程和废物管理等原因的额外信息。它甚至建议我的学生可能采取的应对全球变暖的行动。之后,我做了自己的工作,以确保这些信息是准确的,并确定我是否需要对其进行任何改进。

最后,我要求AI帮助我作为教育者,为这个关于全球变暖的单元想出一个有创意的学生项目。我输入了提示:“我可以给学生什么项目或活动来帮助他们更好地掌握这些概念?”

Khanmigo 回复道:“我有很多创意项目的想法。为什么不尝试一个温室效应演示呢?在阳光直射下放置两个相同的容器。在其中一个容器中加入少量二氧化碳(例如,通过加入醋和小苏打)。随着时间推移测量两个容器的温度并比较结果,以展示二氧化碳浓度增加如何导致温度升高。”

AI 甚至生成了测验和评估来测试我学生的知识,并帮助我识别他们可能需要改进的领域。

尽管这一切令人印象深刻,但很快就清楚地发现它并非总是准确的。如果你向它询问来源链接,它可能会编造出来。我们在 Khanmigo 中通过不允许它向用户提供我们未在后台明确提供的链接来解决幻觉(Hallucination)问题。人们可能会认为机器会在 100% 的时间内 100% 准确,就像计算器一样,但大型语言模型(Large Language Model)是不同的。计算器等机器被设计为精确准确地执行特定任务,而 GPT-4 和类似的 AI 语言模型不基于预定的算法和公式运行,它们被设计为根据训练数据的模式和示例生成类人文本。它们能够通过表示单词和符号之间的关联来做到这一点。虽然它们可以提供有用的信息并生成令人印象深刻的响应,但它们并非万无一失。你越是询问 AI 涉及对它意义不大的单词或符号的内容,它的表现就越差。这就是为什么它在提供网站 URL 方面特别差的原因。URL 中的符号彼此之间几乎没有关联。在某些方面,这与人脑并无太大不同。例如,我可以谈论和撰写很多事情,我也知道相当数量的事实。但是如果你要求我凭记忆给你一个复杂的网站链接,我绝对无法做到准确。

尽管如此,越来越多的教育工作者每天都在向 AI 开放他们的课堂。这项技术是可靠的,教育工作者可以在科学教学法中利用它的方式有很多。例如,当我要求 Khanmigo 写一篇文章让学生感受太阳和太阳系的巨大规模时,会发生以下情况:

标题:“太阳和太阳系:进入令人敬畏的维度之旅”

太阳是一个炽热的气体球,是我们太阳系的心脏。它的直径达到惊人的 139 万公里,或 86.4 万英里。换个角度来看,它大约是地球宽度的 109 倍!如果太阳是空心的,它可以容纳超过一百万个地球。

但太阳的大小并不是唯一令人印象深刻的地方。它的质量约为 1.989 x 10^30 千克,占我们太阳系总质量令人难以置信的 99.86%。这相当于 33.3 万个地球!

当我们从太阳向外旅行时,我们会遇到太阳系的行星,每一颗都是奇迹。最大的行星木星的直径是地球的十一倍多。即使是气态巨行星中最小的海王星,仍然大约是我们母星球的四倍宽。

这些天体之间的距离同样令人敬畏。例如,从太阳到地球的距离(我们称之为天文单位(Astronomical Unit))约为 9300 万英里。海王星是距离太阳最远的行星,距离太阳惊人的三十个天文单位。这是地球与太阳之间距离的三十倍!

然而,我们的太阳系在宇宙的宏大尺度上只是一个微小的斑点。离我们最近的恒星系统半人马座阿尔法星距离我们约 4.37 光年。这大约是 25.6 万亿英里,或地球到太阳距离的 27.6 万倍!

太阳和我们太阳系的庞大规模确实令人敬畏。它提醒我们在宇宙中渺小而珍贵的位置。随着我们继续探索和理解宇宙,我们只能想象在浩瀚的太空海洋中还有什么其他奇迹在等待着我们。

这个例子表明,在 Khanmigo 的安全保护措施和 GPT-4 的持续改进之间,该平台可以处理特定数据,并且几乎没有幻觉。

从这里,我可以要求 AI 向我解释像弦论(String Theory)这样的复杂概念:

KHANMIGO:弦论是一个理论框架,其中宇宙的基本构建块不是粒子(如电子或夸克),而是微小的振动弦。这些弦可以以不同的频率振动,各种振动模式对应于我们在自然界中观察到的不同粒子。弦论背后的想法是统一物理学中的两个主要理论:广义相对论,它描述引力和宇宙的大尺度结构,以及量子力学(Quantum Mechanics),它处理原子和亚原子层面粒子的行为。

但如果这对我来说有点太复杂而无法理解怎么办?我可以简单地要求 Khanmigo 把我当作六年级学生来解释:

KHANMIGO:当然!想象一下,宇宙中的一切都是由微小的、超级小的弦片组成的,有点像意大利面条。这些弦非常小,我们看不见它们,但它们就在那里,而且总是在振动或摆动。现在,根据这些弦如何摆动,它们可以创造不同的粒子,就像构成我们看到和触摸的一切的那些粒子。这就像通过以不同的方式拨动弦来在吉他上演奏不同的音符。

从中学科学学生到大学研究人员,AI还可以帮助生成符合逻辑的实验方法。当人们能够与其他有思想、有创造力的人交流想法时,通常会更有创造力,或者在这种情况下,是与AI实体交流。Khanmigo是一个与你一起即兴发挥的伙伴。它可以建立联系,向你提问,促进对话,并帮助你质疑自己看似合乎逻辑的基本假设。

从物理学到生物学再到动物学,Khanmigo向任何水平的学生传授复杂的科学知识。这意味着,作为教育工作者,你可以用基于AI的解释来补充你的讲座,为学科提供更多见解。作为学生,它是回答你关于任何科学主题的所有迫切问题的完美导师。如果你是高级学生,你可以用它来生成科学文章和研究论文的摘要。你甚至可以让它通过幽默来教授科学:“正如阿尔伯特·爱因斯坦可能会说的,‘为什么小鸡要过马路?当然是为了把它的质量转化为能量!’”

下面是我最近使用Khanmigo来了解Ozempic的一个例子,Ozempic是一种人们用于减肥的糖尿病药物。我想更好地了解它是如何工作的,但我发现媒体的报道,甚至维基百科等地方的解释都不能令人满意。

我:Ozempic是如何工作的?

KHANMIGO:Ozempic,是吧?它是一种药物!但你知道它是用来做什么的吗?

我:我知道它最初是用来治疗糖尿病的,但人们越来越多地用它来减肥。

KHANMIGO:啊,你说得对!Ozempic用于治疗糖尿病。它也用于减肥。你知道它如何帮助解决这些问题吗?

我:在糖尿病方面,我认为它以某种方式帮助调节血糖。我不知道它如何帮助减肥。

KHANMIGO:想得好!Ozempic确实有助于调节血糖。对于减肥,情况有点不同。你能猜到它如何帮助人们减肥吗?

我:它如何调节血糖?我猜它通过让人们不那么饥饿来帮助他们减肥。

KHANMIGO:很好的猜测!Ozempic确实帮助人们感觉不那么饥饿。对于血糖,情况更复杂一些。你知道我们的身体通常如何调节血糖吗?

我:胰岛素(insulin)帮助细胞从血液中吸收糖分。当血糖升高时,我们的胰腺会产生更多胰岛素来帮助细胞吸收这些糖分。

KHANMIGO:完全正确!现在,想想这个:如果身体没有产生足够的胰岛素,或者胰岛素工作不正常怎么办?像Ozempic这样的药物可能会做什么来帮助?

我:帮助产生更多胰岛素?或者以某种方式使胰岛素更有效。

KHANMIGO:你的思路是对的!Ozempic并不完全是产生更多胰岛素,但它做了类似的事情。你能想到那可能是什么吗?

我:以某种方式触发胰腺产生更多。

KHANMIGO:接近了!Ozempic不会直接让胰腺产生更多胰岛素。相反,它模仿你体内的一种激素,当血糖高时刺激胰岛素的产生。你能猜到这种激素还做了什么可能有助于减肥的事情吗?

我:抑制饥饿?

KHANMIGO:答对了!这种激素叫做GLP-1,也有助于抑制饥饿。所以,Ozempic模仿这种激素,既有助于调节血糖又能减少饥饿。这说得通吗?

我:是的。GLP-1代表什么?

KHANMIGO:GLP-1代表胰高血糖素样肽-1(Glucagon-Like Peptide-1)。这有点拗口,不是吗?你知道胰高血糖素(glucagon)是什么吗?

我:知道。它是另一种激素,通过刺激肝脏将储存的糖原(glycogen)转化为葡萄糖(glucose)来导致血糖升高。

KHANMIGO:完全正确!现在,GLP-1被称为”胰高血糖素样”,但它实际上与胰高血糖素的效果相反。你能猜到为什么它可能被称为”胰高血糖素样”吗?

我:也许结构相似?

KHANMIGO:你真是个侦探!确实,GLP-1和胰高血糖素有相似的结构,但它们对血糖的影响相反。这不是很有趣吗?

我:回到前几步,如果GLP-1(或Ozempic)不是直接刺激胰腺产生胰岛素,它如何导致胰岛素升高?

KHANMIGO:好问题!GLP-1(以及Ozempic)通过与胰腺中的某些细胞结合来工作。这种结合触发这些细胞释放胰岛素。所以,虽然它不是直接刺激胰岛素的产生,但它在刺激其释放。这解释清楚了吗?

我:我明白了。更多的是释放已经产生的胰岛素,而不是帮助实际的生产。

KHANMIGO:完全正确!你理解了。我们的身体和药物的工作方式不是很神奇吗?

注意,Khanmigo能够在几分钟内回答我相当微妙的问题。它甚至帮助我思考一些我可能不会自己问到的概念。请注意它如何迫使我思考并生成自己的假设,而不是直接给我一个解释。它还花时间了解我的理解,并在一些有趣的概念边缘案例上推动我。

这不仅仅是不错的辅导。这是世界级的教学法(pedagogy),使提问和学习变得更加引人入胜、深入和令人难忘。

1 + 1 = 缩小数学差距

约翰·斯宾塞是一名教师培训师。

2023年初,他在乔治福克斯大学的学生即将进入真实课堂成为教师,但人工智能聊天机器人将比他们更早到达那里。与ChatGPT推出时的大多数教师不同,斯宾塞强烈支持教育工作者在课堂上使用生成式AI。他告诉他的实习教师,他们需要接受大语言模型(large language models)作为教师生产力工具。“但我能感受到他们的恐惧反馈给我,”他告诉我。

为了说服他们,他让他们做数学题,无论是字面上还是比喻意义上。他特别认为在数学教学中,这项技术最明显地增强了以学生为中心的学习。

在这里,他为班级打开了ChatGPT。他要求机器人解释p值(p-value)的概念,这是一个概率度量,也是学生在统计学中需要掌握的最重要的内容之一。片刻之后,AI给出了一个相当不错的答案。相当不错,但不是很好。

于是斯宾塞在ChatGPT中输入:“用十五岁孩子能理解的更简单的术语来解释这个。”

ChatGPT给出了一个新答案,现在它给斯宾塞提供了具体的例子,试图建立一些数学概念理解。如果他不喜欢,他可以点击”重试”按钮,它会提供一个全新的答案。如果ChatGPT给出的回答很好但仍然留下一些问题,斯宾塞会重新构思他的问题。假设数学答案感觉有点太抽象。斯宾塞只需要求ChatGPT提供一个具体例子,说明p值如何在某个具体事物中使用——比如漫画书的语境。

ChatGPT回答说:“当然!假设你是一名漫画书出版商,你想确定两个超级英雄角色’超级英雄A’和’超级英雄B’在漫画书读者中的受欢迎程度是否存在显著差异。为了进行研究,你随机选择一组漫画书读者样本,并要求他们评价他们对超级英雄A或超级英雄B的偏好。评分以1到10的等级收集,分数越高表示偏好越强。为了确定两个超级英雄之间的受欢迎程度是否存在统计学上的显著差异,可以使用统计检验,例如双样本t检验(two-sample t-test)。该检验量化了反对零假设(null hypothesis)的证据强度,零假设表明受欢迎程度没有差异。”

斯宾塞所做的是向AI反馈他认为什么会更有用。它给他的每个答案都比前一个更具体,学术词汇更少,句法更简单。视角甚至从第三人称转变为第二人称,使答案更直接和个性化。

“我的实习教师发现ChatGPT为他们提供了即时的例子供查看,以及更好的课程,这些课程更有创意,更植根于他们将要任教的真实课堂环境,”斯宾塞说。如果他们从ChatGPT中获得了这么大的力量,而ChatGPT并不是为教育用例构建的,并且运行在GPT-3.5上,想象一下他们很快就能使用下一代人工智能完成什么,一个专门为教育构建的AI,具有记忆能力和生成深入课程的能力。Khanmigo做得更好,它能更好地理解学生所处的位置,并提出问题来真正帮助学习者消化一个概念。

从可汗学院(Khan Academy)最早的日子起,我们就梦想着一个世界,学生可以随时获得直接支持,他们的父母、同伴、辅导老师和教师可以随时获取信息以提供更多帮助。我们通过动态练习、软件、视频和教师工具来实现这一目标。然而,它仍然达不到完整的辅导互动。早期的AI模型如GPT-2和GPT-3生成的文本看起来连贯,但在推理方面存在困难,特别是在抽象数学中。GPT-4是第一个似乎有能力模拟教学上健全的导师的技术。它在数学方面好得多,但它也有问题。本着有知识的勇气精神,我们决定或许通过额外的数学纠正层、仔细的提示,以及现有的、经人工审核的可汗学院内容的帮助,我们可以在GPT-4的基础上构建,使Khanmigo成为世界上第一个高质量的AI导师。

最终的结果是一个不仅在数学方面比任何人预期都更准确,而且在围绕数学的辅导互动方面也做得很好的导师。它就像一个教学法(pedagogy)专家,具备适当程度的谦逊、谦虚和好奇心。它还能够”理解”学生解释推理的过程。当学生在数学问题上遇到困难时,AI导师会问:“认为下一步是什么?” 如果学生,比如说,没有正确地进行分配,我们的AI会在幕后”思考”。也就是说,Khanmigo会考虑可能如何以不同的方式解决问题。机器人不会与学生分享这些信息。相反,AI通常会说类似这样的话:“嗯,我得到的答案和你有点不同。你能向我解释一下你的推理吗?” 当学生解释他或她的推理时,AI现在可以诊断出我们通常可能会忽略的数学缺陷。它可以标记假设并突出盲点,然后,一步一步地,它将帮助解决误解并填补任何学习缺陷。

在这里,学生可以向Khanmigo请求解释、例子或指导。反过来,Khanmigo会回应个别学生的数学问题,并提供量身定制的解释、例子和练习题。这意味着学生可以按照自己的节奏学习数学,并专注于他们需要更多支持的领域。

Khanmigo比ChatGPT更加细致和强大。看看它如何回答学生关于p值的问题:

学生:什么是p值?

KHANMIGO:啊,p值!这是统计学中一个有趣的概念。但在我们深入探讨之前,你能告诉我你对假设检验(hypothesis testing)了解多少吗?

学生:我知道一点。

KHANMIGO:太好了!现在,当你进行假设检验时,你想要找出什么?

学生:做某件事是否会导致统计上显著的差异。

KHANMIGO:完全正确!现在,你认为p值在确定统计显著性(statistical significance)的过程中处于什么位置?

学生:我不知道。

KHANMIGO:没关系!让我们这样想:当你抛硬币时,得到正面的概率是多少?

学生:50%。

KHANMIGO:正确!现在,如果你抛硬币十次,九次都是正面,你会觉得有什么不对劲吗?

学生:也许吧。但即使是公平的硬币,也有一定概率发生这种情况。

KHANMIGO:完全正确!现在,你能猜到在这个场景中p值可能代表什么吗?

学生:得到十次中九次正面的概率?

KHANMIGO:你的思路是对的!p值确实是在假设零假设(null hypothesis)为真的情况下,获得与你观察到的结果一样极端或更极端的结果的概率。在我们的硬币例子中,零假设是硬币是公平的。所以,p值将是如果硬币是公平的,在十次抛掷中得到九次或更多正面的概率。这说得通吗?

学生:那你怎么能确定零假设不是真的呢?硬币不公平?

KHANMIGO:好问题!我们通常设置一个阈值,通常称为显著性水平(significance level)(通常是0.05)。如果p值小于这个阈值,我们就拒绝零假设,表明硬币可能不公平。这有助于澄清吗?

学生:我明白了!所以,你永远无法确定硬币不公平。但如果你观察到某些非常不太可能发生的事情,因此具有非常低的p值(低于预设的显著性水平),那么这表明(但不能证明)零假设不成立。

KHANMIGO:答对了!你理解了!记住,在统计学中,我们处理的是不确定性。所以,我们不能明确证明某事,但我们可以收集证据来支持或反驳我们的假设。这就是p值发挥作用的地方!你对这个话题还有其他问题吗?

我们正在接近缩小我们多年前梦想实现的数学差距。随着我们继续扩展生成式AI的能力范围,我们也在增加其全球可及性。Khanmigo有一天将提供给世界各地的学生,无论他们的学习风格或能力如何。在任何时候,他们都可以使用生成式AI来强化学习并建立对数学概念的长期理解。

Khanmigo能替代人类教师吗?不能,而且永远不会。但它能成为困惑学生的强大工具吗?能成为需要额外帮助来澄清数学概念、需要复习想法的学生的强大工具吗?绝对可以!它吸引学生,要求他们重新表述问题,挑战他们用自己的话总结问题,并用旨在帮助信息留在长期记忆中的技巧测验他们。

访问学生原本无法获得的课程

通过 AI 导师支持学生是一件大事,而且从未如此重要,但生成式 AI 本身并不是一个完整的解决方案。即使是一位优秀的人类导师,也能从拥有教科书或课程中受益。事实上,这就是我在 2005 年创建第一版 Khan Academy 的原因。我每天辅导我的表兄弟姐妹,但我希望他们能有更系统和全面的练习,所以我创建了一个练习平台,可以监控他们的进度。这让我在辅导过程中更有效率,更专注。因此,如果你想创建一个真正能够教授学生整个学科的系统,基于生成式 AI 的导师与完整的课程进度(教育工作者称之为完整的范围和序列)相结合时会变得更加强大,而这正是 Khan Academy 从一开始就在构建的——从学前班到大学,涵盖各个学科。

我们的目标是让每个人都能更容易地接受教育。多年来,我们创建了从幼儿园到大学的课程,涵盖从数学和科学到公民学和历史的各个领域。这些课程包括按需视频和基于掌握的练习,以及供家长和教师跟踪和进一步支持学生的工具。它旨在提高已经受益于支持性课堂环境的学生的上限,但同样重要的是,提高可能无法获得这种支持的学生的下限。后一种情况不仅仅是指印度或非洲农村地区无法上学的孩子。

根据教育部 2015 年的一份报告,大约 50% 的美国高中不提供微积分课程。40% 不提供物理课程。超过四分之一的学校不提供化学课程。这些数字在黑人和拉丁裔学生入学率高的高中更糟糕,其中 62% 的高中不提供微积分课程,49% 不提供化学课程。这些学校中大约四分之一甚至不提供代数 2 课程。

在大多数情况下,我怀疑核心课程的缺乏与资源不足的关系不大,更多的是因为没有足够多的学生为此类课程做好准备。如果只有十名学生准备好了,就很难为代数 2 课程配置资源。如果没有代数 2 课程,这十名学生就无法为化学、物理或微积分做好准备。如果你在高中无法学习代数 2、化学和物理(理想情况下还有微积分),那么无论天赋、职业道德或动机如何,你最终都很难进入 STEM 职业。即使高中确实提供这些课程,它们也经常会稀释教材内容,因为很少有学生在先修材料方面有坚实的基础。因此,能够接触到在大学 STEM 领域取得成功所需的数学和科学知识的高中生比例更小。

人文学科和写作的情况也好不到哪里去;只是在先修材料方面可能稍微灵活一些。例如,如果你不精通代数 2,就不可能学习微积分,但即使高中历史基础不够扎实,也可以想象能够参与大学水平的历史课程。

Khan Academy 通过构建这些课程并免费向所有人开放来解决这个问题。我们对它们进行了结构化设计,使学生可以自己完成课程作业,或在他人的支持下完成。因此,如果你的学校不提供代数 2 课程,你仍然可以在平台上学习代数 2。

当然,少数学生有动力仅通过视频和基于掌握的练习独自完成课程。这就是为什么我们主动增加了支持层。其中一项支持是我在疫情期间创办的另一个非营利组织 Schoolhouse.world,其使命是通过提供免费辅导来连接全世界的学习者。它之所以能做到这一点,是因为导师是志愿者,通常是其他高中生和大学生。这很好,但人类导师很难总是在学生遇到困难和失去动力时随时出现。通过在所有学科中随时提供 AI 导师,Khanmigo 使学生更有可能获得足够的支持来掌握学校不提供的课程。

这仍然引发了一个问题,即如何获得这些课程的学分以用于大学录取。但我们在这方面也取得了进展。例如,加州理工学院在 2023 年宣布,在我们平台上完成课程可以满足其入学要求。

最被忽视但最重要的导师角色:提供动力和问责

尽管如此,我们仍未触及导师最被忽视但可能最重要的角色:提供动力和问责(accountability)。在早期辅导表兄弟姐妹的日子里,我花了大量时间追踪他们,让他们感到愧疚以完成作业。我会说这样的话:“我致力于帮助你,但前提是你能承诺出现并完成作业。”如果孩子们在线辅导迟到了,我会打电话给他们的妈妈(我的阿姨)问他们在哪里。当我们终于通上电话或即时通讯时,我的第一个问题通常是:“你能完成我布置的练习题吗?”或”昨晚练习得怎么样?“如果他们完成了作业,我会称赞他们付出的努力,然后我们就会开始解答他们的问题或继续新的主题。如果他们没有做到他们说要做的,我会让他们负起责任。这些对话为我提供了背景信息,我们一起努力创造新的方法来激励他们并让他们对自己负责。

我们在可汗实验学校(Khan Lab School)和可汗世界学校(Khan World School)正式化了这种参与方式,顾问定期与学生交流以设定目标并让他们负责。虽然这是这些学校教育中最重要的部分之一,但大多数学校或家庭没有资源提供这种个性化关注。幸运的是,AI可以介入满足这些需求。

用户正在要求这个功能。我们从早期Khanmigo家长和教师那里收到的最强烈反馈之一是,该平台对主动寻求AI帮助的学生很有效。然而,大多数学生既不了解AI的能力,也不会自然地寻求帮助,而且几乎没有人想被问责,即使这对他们有好处。

基于这些反馈,我们赋予了Khanmigo这些能力。想象一下,在用户许可的情况下,AI能够给教师、家长和学生发送电子邮件和短信,以确保学生参与学习、保持动力,并受到适度的问责。这可能包括学生登录网站时的签到,以及让学生反思自己成就的时刻。如果学生遇到困难,它还允许主动干预。例如,学生可能会收到一封电子邮件说:“嘿,你说过想在本月底完成代数2的第3单元,但你这周还没做任何作业。为什么不点击这里,我们可以确保你实现目标?”

需要掌握的最重要学科领域

在教育领域,开发者进行实地测试(field-test)他们的想法至关重要。本质上,这意味着将我们的教育创新和干预措施从假设领域带入真实的课堂。这是关于看我们的想法在真实教师和学生手中的表现如何。如果Khanmigo是一个蛋糕,学生和教师会品尝它来帮助我们完善和改进配方,以便我们可以做出最好的蛋糕。到2024年初,我们在美国各地与超过三万名教师和学生试点Khanmigo。在这种情况下,他们通过实用和可行的教育目标和标准,确保Khanmigo满足学习者和教育工作者的需求。

在最初几个月,我们的试点研究似乎表明Khanmigo正在帮助学生提升STEM和人文学科的技能。令人惊讶的是,我们在技能学习方面最大的收获根本不是特定领域的。

印第安纳州的霍巴特学区(School City of Hobart)是全国最早使用Khanmigo的学区之一。在使用AI六个月后,他们在学生身上看到的最大收获是自信心领域,这在课堂环境中传统上很难解决。“学生成就必须从建立他们自己的信心开始,这种信心来自于他们知道自己能做到的知识,”霍巴特的督学佩吉·巴芬顿(Peggy Buffington)告诉我。“我们的工作是确保我们装备学生对自己能力的信心水平。AI在这里是一个游戏规则改变者(game changer)。”

巴芬顿说,她看到这些收获最明显地体现在使用Khanmigo的课堂中学生参与度的提高。她说,学生曾经不愿在课堂上举手提问,现在他们向AI导师提问时要少得多恐惧。与AI导师交谈消除了潜在公开羞辱或焦虑的幽灵。“这让他们更投入,他们喜欢从AI那里得到的回应,”她说。“他们来学校时对自己的作业感到自信。作为一名教育工作者,我仍然会回来确保学生将自己的想法应用到我分配给他们的作业中,但我们看到AI在这些孩子身上建立的信心水平令人惊讶。”

霍巴特学区中学课程与教学主任蒂姆·克里格(Tim Krieg)对他们为什么看到如此大的提升有一个有趣的理论。他说,这部分来自对教育的新概念化,AI本质上向学生展示了领域或学科之间的区别不再重要。

“AI打破了学科界限(designation),”Krieg告诉我。他说,借助Khanmigo,我们可以向孩子们展示数学如何与艺术结合,写作如何与科学结合,历史如何与经济学结合。“我们的学生是创作者,是制作者,是词曲作者,是歌手,是播客主播,是媒体和信息的策展人(curator)。所有这些角色都需要更深层次的知识,”他说。“学习是非线性的;它是持续的。AI向我们展示了这个整合的世界。”他说,我们的自信来自于对万物如何协同运作的明确理解。

理解这一点使我们的孩子能够更好地与课堂内外的世界互动。一旦你掌握了这些知识,相比之下,其他一切都是小菜一碟。

第四部分

协作共赢

电子通信永远无法替代一个人用灵魂鼓励另一个人勇敢和真诚的面孔。

—查尔斯·狄更斯

认识自己就是在与他人的互动中研究自己。

—李小龙

加强协作学习

说到我们的孩子,技术已被证明是一把双刃剑。他们的手机和社交媒体账户经过优化,旨在让他们的眼睛盯着屏幕,使他们远离当下的生活,即使冲动地浏览”信息流”让他们感到糟糕、被触发或嫉妒。乍一看,担心大型语言模型(large language model)渗透教育系统只会使这种技术引发的孤立和心理压力问题变得更糟是合理的。

这些担忧在可汗学院早期就出现了。这个非营利教育组织背后的理念是,我们可以利用技术——在这种情况下是个性化练习和按需视频——来提高资源较少的学生的底线,并提高课堂的上限,使其能够通过个性化支持和吸引学生。有些人担心在电脑上花更多时间意味着更少的时间与人类沟通、协作和联系。

我也担心这一点。我们知道,当学生在协作团队中交流和工作时,他们比独自安静地坐着听讲时学得更好。更重要的是,当与他人一起学习和协作时,学生会发展出不同的品格和沟通技能,这些技能可以说比学术内容更重要。技术会通过让学生独自在电脑上学习而进一步孤立他们吗?

事实证明,这不仅不必如此,而且深思熟虑地使用技术实际上可以增加人与人之间的互动。

在许多典型的数学课堂上,学生在教师主导的讲座中可能难以集中注意力。教师试图将讲课节奏调整到”中等”水平,这意味着许多学生要么迷失要么无聊。可能会有一些小组问题解决,但大部分时间学生都在听,而不是在做。他们通常不被允许在课堂的大部分时间里互相交谈。教师知道学生有个别问题,但要么教师没有足够的精力来解决所有问题,要么更有可能的是,学生害怕提问,因为担心显得”愚蠢”或”书呆子气”。

另一方面,在过去十年中,可汗学院在课堂上的良好实施涉及更多而不是更少的人际互动。当学生进行独立练习时,他们也被鼓励互相寻求帮助(有一些指导原则以防止过度帮助)。每个学生都在学习边缘(learning edge)练习和参与,同时得到同伴的支持,这使教师能够进行有针对性的一对一或小组干预。

我们甚至已经开始在线扩展这种模式。在Schoolhouse.world平台上,世界上任何学生都可以通过Zoom获得免费的实时辅导(感谢Zoom为这项工作捐赠了数千个许可证)。这是通过使用经过审查的志愿者”准同辈(near peer)“来辅导他人来实现的。每月覆盖约一万名学生,这强化了这样一个观念:如果使用得当,技术可以增加人与人之间的互动。

现在,我们再次站在了因科技而带来的教育转型的关口。我们担心,即使是安全且有效的生成式AI导师,也会意味着学生更多时间与电脑相处,而减少与同伴和老师的交流时间。但是,这一次,情况不必如此。首先,AI可以让可汗学院的实施模式对每个人都更有成效。学生仍然可以从彼此和老师那里获得帮助,但他们也能够使用AI。其次,无论是否在数学课上,如果学生在学习中能够感到更投入、更顺畅,他们将能够在自己的时间里学到更多,比如在家里或做独立作业时。这就为课堂腾出了时间,可以进行更深层的人际互动,如苏格拉底式对话、小组问题解决或基于项目的学习。最后,课堂上的AI帮助可以进一步减少学生感到迷失或无聊的情况,让他们能够与同学一起参与到课堂中来。一个有困难的学生可以实时得到问题的解答,而不用担心被评判或拖慢全班进度。一个早慧的学生可以将他们的理解深化到超越课堂当前所在的位置。别忘了,在这一切发生的同时,AI还可以让老师了解正在发生的事情,提供如何更好地吸引学生的建议。

一个设计合理的AI甚至可以更进一步,实际促进人与人之间的对话。想象一下,像Khanmigo这样的AI与老师合作,将学生分成小组讨论,然后在每个小组中促进讨论。想象一下,AI在同一教室的学生之间提供”破冰”聊天,最初是匿名的,这样他们可以更好地了解彼此,而不会有太多预判、包袱或假设,比如谁是运动健将或书呆子,这些常常笼罩在中学和高中的互动中。同时,老师可以与AI聊天,了解学生之间如何互动。这不仅仅需要通过聊天界面进行;我们的团队正在积极测试Khanmigo的交互功能,它可以倾听并自然地与学生对话。

有了AI和基于AI的导师,静态学习的时代已经结束,协作教育(collaborative education)在范围和能力上不断扩展。在课堂上,老师可以让Khanmigo询问参与者是否想一起玩学习游戏。它可以促进参与者小组之间的多步骤项目,他们协同工作来解决复杂问题。比如,对于三年级的科学课,AI导师可以建议一个小组协作创客项目,提供如何设计几种不同纸飞机的说明。“记住,制作和测试纸飞机是学习空气动力学和科学方法的有趣方式,”Khanmigo告诉学生。“让我们一起让每个人都用这三种不同的设计和折叠技术进行实验,看看它们如何影响飞机的飞行。享受吧!”从这里开始,它可以分配任务、协调他们的努力、提供逐步指导并提供反馈,培养协作和团队合作技能的发展。

如果你有一个出色的促进者(facilitator),你总能获得更好的协作,而大语言模型(large language model)有潜力做到这一点。像所有伟大的教师一样,他们可以引导学生之间的对话和协作。他们可以将学习者配对在一起。他们可以创建小组。他们可以提供破冰活动并连接陌生人。归根结底,学术学习并不是学校教育的唯一目的。学校教育也是关于通过友谊、共同冒险和相互支持来建立人际联系。我们现在有机会使用AI来促进这些类型的互动,超越在课程作业中为学生排忧解难。

AI遇见学生心理健康辅导

情景是这样的:你离期末考试只有几分钟了。你已经学习过了,但你的心跳加速,大脑一片空白。焦虑和对失败的恐惧吞噬了你所有的信心。快速连接Khanmigo及其AI学术教练功能成为了情感上的生命线。

学生:我十分钟后有个考试,我真的很紧张。

AI学术教练:哦,我看到你有点紧张,是吧?没关系,这种事发生在我们最优秀的人身上!只要记住,你已经为此准备了好几个小时的学习,还有你和我一起完成的所有那些测验。

学生:我知道,但我担心我会考砸。压力太大了。

AI学术教练:担心是自然的。告诉我,如果你考不好,你最担心什么。

学生:如果我考试不及格,然后整门课都不及格怎么办?如果我因此不得不在下学期重修这门课怎么办?

AI学术教练:这是一个相当可怕的想法。我认为这几乎会让任何人担心。但是,如果你考试不及格,你真的会整门课都不及格吗?

学生:嗯,实际上,可能不会。

AI学术教练:我同意。即使你今天考得不好,你很有可能有机会提高你的总成绩。还有一个问题:我没有看到任何记录显示你以前在这门课上考试不及格过。有什么证据表明你这次会不及格?

学生:没有。但我还是很紧张。

AI学术教练:你当然会感到紧张,因为考试会让我们所有人都产生焦虑。让我们一起尝试一些快速呼吸练习,可能会有帮助。 :::

AI导师会自然地引导学生完成他们的教育旅程,建立真正的联系并深入了解他们的需求。鉴于这些特点,设想AI也能成为学生的某种教练并不是什么难以想象的事。

但它应该这样做吗?即使它真的很擅长倾听和交谈,AI教练或治疗师到底能有多专业呢?

在20世纪60年代,麻省理工学院的一位研究员创建了一个出人意料地简单但却引人注目的应用程序,它为现代聊天机器人和虚拟助手的发展铺平了道路。在人工智能实验室工作的约瑟夫·魏曾鲍姆(Joseph Weizenbaum)开发了ELIZA,这是世界上最早能够模拟对话的自然语言处理计算机程序之一。魏曾鲍姆本想展示人类与AI之间的交流是多么人工化,但令他震惊的是,许多人对这个人工智能产生了情感依恋。使用ELIZA的人常常忘记他们是在与计算机对话。据说,魏曾鲍姆的秘书甚至要求他偶尔离开房间,这样她就能与AI进行”真正的对话”,而不被打扰。

魏曾鲍姆为ELIZA开发的其中一个脚本叫做DOCTOR,这是一个模仿治疗师的程序。这个治疗师采用了卡尔·罗杰斯(Carl Rogers)开发的心理学方法,被称为罗杰斯理论(Rogerian theory)。基本上,患者对DOCTOR说话,DOCTOR会像罗杰斯治疗师那样回应,使用非指导性提问和重新表述陈述。ELIZA并不复杂或精密;它只是简单地重新表述你的陈述。但它起作用的原因却很简单。有时我们都只是渴望一个好的倾听者。从某种程度上说,一个仅仅重新表述你所说的话的算法能让你感到被倾听,似乎有些欺骗性。但事实是,它确实帮助了人们。能够暂停、重新表述我们的问题,并深入挖掘自己,这本身就是有治疗作用的。

令人惊讶的是,罗杰斯发现DOCTOR在关键任务中的表现与人类治疗师一样好。当我们考虑到自2010年以来美国学龄儿童的心理健康危机增加了40%时,这一点意义重大。其中包括三分之一的大学生。类似比例的学生因焦虑、抑郁和孤独感而没有完成学业就离开了高等教育。2023年,美国卫生局局长维韦克·默西(Vivek Murthy)将这种现象称为孤独流行病。

“我意识到,在我听到的许多关于慢性疾病、抑郁症、成瘾的故事背后,都有这些孤独的线索,人们常常对我说,’你知道,我觉得我必须独自承担生活中的所有这些负担,’或者,’我觉得如果我明天消失了,没有人会在意。他们甚至不会注意到。’人们感到自己是隐形的,”默西告诉我。“而且这不仅仅是我们刻板印象中认为孤独的那些人——也许是独自住在家里的老年人。我从大学生那里听到这种说法,他们被校园里成千上万的其他学生包围,但仍然感到极度孤独。我从社区里的妈妈爸爸那里听到这种说法,他们与学校有联系,与邻居有联系,但仍然觉得没有人可以真正倾诉,或者没有人真正理解他们,等等。”

默西逐渐意识到,孤独感和这种被孤立的感觉非常普遍,它对我们的身心健康有着深远的影响和意义。我们还知道,学生的心理健康问题和学业表现不佳都有一个相似的原因:他们天生就感觉自己对生活缺乏控制和目标,他说。我们已经看到人们开始关注孩子们的心理健康,这是有充分理由的。发表在《JAMA儿科》(JAMA Pediatrics)上的纵向调查显示,自2020年以来,由于疫情及其相关影响,包括压力、社交隔离、对未来的不确定性、经济困难以及对健康和安全的担忧,学生的焦虑和抑郁都急剧上升。

今天,比以往任何时候都更重要的是,心理健康问题在我们学校中的地位应该与STEM一样重要。人们开始寻求数字心理援助,也就是所谓的整合心理人工智能(integrative psychological artificial intelligence),这只是时间问题。如果ELIZA在五十年前就能帮助人们感到被倾听,那么现代AI也许能走得更远。需要明确的是,我并不主张取代真正的治疗师。无论人们对他们的AI治疗师——或者说AI导师——有多依恋,这项技术永远不会,也不应该取代人的因素。然而,当人类咨询师或治疗师无法提供服务或费用过高时,AI可以在任何时候、任何地点更容易地为需要帮助的人提供服务。我们已经看到了这方面的例子。

例如,2022年,来自华南理工大学的研究人员通过让聊天机器人提供认知行为疗法(cognitive behavioral therapy)来测试基于AI的治疗干预的有效性,这是另一种治疗抑郁和焦虑的传统疗法。这个治疗聊天机器人能够在四个月内减轻人们的抑郁,并在短短一个月内减轻焦虑。它的效果明显好于自助书籍。

然后 GPT-4 到来了,我们的团队开始尝试基于 AI 的辅导和支持。这部分工作涉及探索在 Khanmigo 上进行教学或心态干预的方法。我们与宾夕法尼亚大学心理学教授 Angela Duckworth 合作进行这项探索,她是少数研究和创建轻量级干预的领导者之一,通过增强毅力(grit)、坚持不懈和其他元认知(metacognitive)能力来改变人们的心态。因为大多数这些干预需要训练有素的专家来实施,它们通常不太容易获得。我们与 Duckworth 及其团队合作,探索如何利用生成式 AI 以高度一致的方式扩展这些干预,将这一益处带给数千万学生。

“我认为人们总是希望与他人在一起、被他人理解和关心,但我们在模拟干预方面看到了很多希望,” Duckworth 说。鉴于治疗的交易性质,心理服务并不总是在你需要时可用。即使你确实可以获得适当的心理健康服务,AI 治疗师也会填补空白。当凌晨三点你在课前惊恐发作时,或者当你在 SAT 前紧张得根本无法通过电话联系到治疗师时,它会与你连接。

考虑这个测试干预:

AI 学业教练:看看你周围。你注意到哪些物品?

学生:一张桌子。一支铅笔。一只猫。一部手机。

AI 学业教练:好的,现在,你认为这些物品中哪些对你的专注有帮助,哪些对你有害?

学生:嗯……你知道,手机有时会让我分心。

AI 学业教练:好吧,那么你能对此做些什么吗?

学生:我也许可以把它放在看不见的地方。

AI 学业教练:实际上有大量研究表明,你把手机放得越远,你的 GPA 就越高。

在这个例子中,AI 在行为心理学层面进行互动,提供 Duckworth 所说的”情境修正(situational modifications)“,或帮助年轻人发展元认知技能的干预。”AI 实现了真正的互动式干预,学生可以实时互动并获得反馈,” 她说。

AI 非常擅长提出情境修正建议,使学生更快乐、更专注、更有成效,并增强他们的成长型思维(growth mindset)。传统上,只有训练有素的教育心理学家才能实施这些干预。有了 AI,你现在可以在学生想要或需要时随时为他们提供这些干预。“即使我们开发这些自我调节(self-regulation)干预,我们也在思考如何让 AI 在心理上更明智,” Duckworth 说。她和她的研究团队希望世界很快就能使用一种人工智能,它可以像人类一样动态地执行此类干预,并具有一致性和可靠性。当管理治疗的方法像 Khan Academy 一样普及,人们可以通过手机访问时,以具有成本效益的方式向地球上每个人提供新干预的问题就消失了。

Duckworth 的干预只是 AI 现在可能能够扩展的一类最佳实践支持。这方面令人鼓舞的证据已经开始出现。《医学互联网研究杂志》报告称,这些 AI 比仅提供一刀切方法和表面干预的前 AI 一般心理健康应用程序显示出更多希望。

人们普遍认为 AI 对需要 IQ 的任务比需要 EQ(情商)的任务更有帮助。在创建 AI 导师、教练和辅导员的早期探索中,以及我们与 Angela Duckworth 团队合作的 AI 主导干预,让我怀疑这是否属实。

因为 AI 不是有感知的,它们不能真正有同理心。同理心(empathy)涉及在你自己的头脑中感知和模拟他人的情绪和背景。然而,它们可以很好地模拟同理心。即使只有聊天界面,大型语言模型也可以以难以与训练有素、关心他人的治疗师区分的方式进行互动。工程师正在用听力、语音和视觉能力增强这些模型,这可以增加 AI 对用户情绪状态的”理解”。也许我们应该引入一个新术语,人工共情者(artificial empath),或 AE,作为对抗孤独、抑郁和焦虑的伟大工具。

家长在基于 AI 教育中的位置

作为一名父亲,我努力——非常努力——地鼓励我的孩子们放下科技产品。我敢打赌,这对大多数父母来说都很熟悉。就我个人而言,我担心如果让孩子们自由支配(无论是字面意义上还是比喻意义上),我的儿子们只会玩《Minecraft》或编程,而我的女儿会无休止地观看《Sister, Sister》或韩剧的每一集。我希望他们花更多时间和朋友在外面玩耍,在客厅里搭建堡垒,读书,画画,或者做一些有创意和有成效的事情,而不是无所事事。我希望他们更多地学习,参与让他们在学业、身体和社交方面感到自信的活动。我希望他们能走出自己的舒适区。当我们的孩子在以上任何方面遇到困难时,我希望他们感受到支持,即使事情变得艰难或不舒服。

学习是一项艰苦的工作,无论是练习钢琴、画画,还是应对不舒服的社交场合。虽然孩子们学习新东西很困难,但对我们这些父母来说,在他们学习的过程中养育他们同样困难。帮助孩子培养成长型思维模式需要持续的努力和强化,在这个过程中,我们提供鼓励和有意义的赞扬,同时将挫折重新定义为通往进步的垫脚石。作为父母,我们会做一些事情,比如确保孩子们休息。我们提醒他们,努力比结果更重要,每个人,包括我们,都曾面临失败和挫折,并因此变得更好。我们将具有挑战性的概念分解成更易于管理的部分。对于更抽象的材料,我们试图向孩子们展示它与他们生活的关系。有时他们接受我们的帮助,有时则不然。这就是为人父母。

多年来,我观察到了技术进步在学习方面带来的好处,我也开始在养育子女方面看到这些好处。从历史上看,当孩子需要学业帮助时,父母的选择是有限的。一些父母对学生正在学习的材料有信心,但大多数人没有。即使父母在这个科目上是相当称职的导师,亲子关系也可能很困难。我可以用我自己的家庭来证明这种关系。

有时非父母的家庭成员也可以帮忙——我姐姐曾经辅导过我,而我也辅导过我的表亲——但这仍然很少见,并且充满了家庭关系的复杂性。对于那些没有时间或能力自己辅导孩子、但属于中产或中上阶层的父母来说,他们通常会求助于付费导师。没有这些资源的家庭基本上陷入困境。

互联网,尤其是点播视频,提供了一种替代方案。除了解决传统辅导的一些局限性之外,这些技术还为学生提供了阅读或观看简短解释的机会。这些视频是按需提供的,可以暂停,可以以半速或两倍速观看。随着Khan Academy(可汗学院)的发展,学生能够在几乎任何语言中,随时随地练习和评估他们对大多数主题的理解。

然而,这不仅仅是为了学生支持。父母们经常告诉我,他们如何使用它来温习概念,以便更好地辅导孩子。

尽管如此,从文章、视频和练习中可以学到的东西与一位优秀导师能做的事情之间仍然存在差距。例如,技术与学生之间的融洽关系、激励支持和动态对话的好处仍然难以实现。对于这些互动特质,学习者仍然需要求助于父母、老师或导师。

然而,随着AI技术和大型语言模型(large language models)的引入,这种情况发生了变化。在前面的章节中,我向读者介绍了技术如何通过创建AI导师和个人教练来应对人际挑战,这些导师和教练能更好地了解您的孩子在学习中的位置,并提供实时鼓励和补充支持。这些AI导师可以个性化和定制化指导,并适应个人需求,同时在学习者工作时陪伴在他们身边。更令人印象深刻的是,这项技术通过让学习者参与苏格拉底式提问(Socratic questioning)来教会他们成为更好的思考者。

但是,这种AI对父母及其在帮助孩子学习方面的角色意味着什么?我们知道人工智能将改变我们的日常工作,但它将如何改变我们作为父母这一更重要的工作?

从父母作为孩子的导师开始,养育子女有几个方面正在与生成式AI高度相关。每位父母都遇到过孩子感到沮丧的情况。这种经历对双方来说都很烦人。父母试图激励孩子,或解释一个概念,但孩子感到压力或被评判。因此,亲子关系有时会变得有点激烈,最终孩子们说他们不想和父母一起做这项工作。

在这里,AI可以发挥强大的作用,就像二十年前我为我的表妹Nadia辅导数学时所做的那样。一方面,我在美国接受教育,有数学背景,所以我能够在数学教育方面比她的父母更好地支持Nadia。同时,我和她一起学习的部分好处在于我不是Nadia的父母之一。AI利用了同样的关系。让非父母的第三方参与是有价值的。Khanmigo可以像我和表亲们那样与孩子建立融洽关系,而不会陷入一些传统的亲子关系模式。

AI导师了解学习材料,是能够根据学生个体需求和能力提供个性化、自适应学习练习的学科专家。它还可以提供即时反馈并调整教学方法。与我认识的任何家长不同,AI导师拥有无尽的精力,除了随时待命帮助学生之外没有其他工作,无论何时何地,只要我们的孩子需要,它都能提供帮助,而我们作为家长……只是普通人。

与此同时,生成式AI平台能够提供界面,让家长追踪孩子与AI的对话,为他们提供一个窗口,准确了解孩子正在学习什么。AI还可以通过文本主动联系学生和家长,确保学习者保持参与和积极性,同时AI以温和的方式让他们保持责任感。

然后是育儿的另一项工作:尝试帮助学生培养扎实的生活技能,比如学会坚韧、专注,以及以健康的方式应对悲伤和逆境。在这里,生成式AI再次可以帮助提供家长支持,为家长提供指导,无论是关于与孩子沟通的最佳实践建议、应对欺凌,还是处理孩子与朋友之间出现的棘手社交问题。生成式AI可以为家长提供资源和时间,否则可能需要与治疗师进行多次咨询或阅读育儿自助书籍。AI成为育儿教练。

家长:我十几岁的女儿与学校里的一位老师相处有困难。我不知道该如何帮助她。你有什么育儿建议吗?

KHANMIGO:哦,这可是个难题!你有没有想过与那位老师聊聊,了解他们的观点?知道他们在想什么可能会有帮助!

家长:我试过了。感觉我们在各说各话。

KHANMIGO:嗯,这确实很棘手!不如引入第三方,比如学校辅导员或校长,来帮助调解对话?这会是个好的下一步吗?

家长:如果我想自己去接触她呢?有什么建议吗?

KHANMIGO:啊,DIY方法!处理这类情况可能很有挑战性,但你可以采取几个步骤来支持你的女儿。与你的女儿谈谈她的担忧,鼓励她表达对这种情况的感受和想法。向她保证你会倾听并支持她。同时,通过了解所有事实来清楚地理解问题。向你的女儿询问关于她与老师相处困难的具体问题,并尝试找出任何潜在原因或模式。寻求其他观点,最终直接与老师沟通。最重要的是,通过教她应对困难情况的策略来帮助你的女儿培养韧性。鼓励她向朋友寻求支持,参与她喜欢的活动,并练习自我关怀来管理情绪。

除了辅导和行为心理学指导,生成式AI还可以通过提供经过验证能降低育儿压力的建议来帮助家长保持正念(mindfulness)。

KHANMIGO:我理解做家长有时会有压力。虽然我不是育儿专家,但我可以提供一些帮助你管理压力的一般建议。休息一下。给自己一些时间放松和充电。即使是短暂的散步或几分钟的深呼吸都会有帮助。通过列出你需要完成的任务并一次专注于一项任务来确定任务优先级。如果你不能完成所有事情,一定不要对自己太苛刻。同样重要的是向朋友、家人或支持团体寻求帮助,分享你的经历并向处于类似情况的其他人学习。

如果使用得当,AI最终会增强家长帮助孩子学习和成长的能力。这绝不会削弱家长对孩子发展、优势、弱点和学习风格的整体理解。家长继续通过灌输价值观和担任榜样来提供孩子所需的培养环境。AI可以为家长提供更多工具和背景,用于理解和引导他们的孩子。正如AI可以充当助教,它也可以充当育儿助手。最好的老师或家长助手是孩子在确切需要支持时可以求助的那个。

增加家长与孩子之间的联系点

从我第一次使用 GPT-4 到我们团队结束黑客马拉松(hack-AI-thon)的那天,我一直对它的能力感到惊叹。在那些早期日子里,可能性真的似乎是无穷无尽的。世界其他地方还没有经历即将震撼教育和整个世界的根本性积极和消极变化。不难想象,AI 很快就会与我们生活的每一个部分交织在一起。我已经对手机和社交媒体对人们,尤其是我们的孩子的影响保持警惕,这一前景既充满希望又令人担忧。我的想法是,即使 AI 成为净正面影响,我们拔掉插头、关闭屏幕的那些时刻也会变得更加稀缺。我们只有这么多时间与孩子建立联系,即将到来的 AI 革命让我想确保它不会席卷家庭可以共度的真实时光。尽管这一前景令人兴奋,但在数周的原型开发和观察我自己的孩子使用 AI 导师完成作业之后,我发现自己做了一件同样激进的事情。我下线了。

我把家人装进车里,我们开了一个小时到旧金山一个可以带狗的海滩,可以俯瞰金门大桥。我们和我们六个月大的新小狗 Polly 玩耍,一起吃野餐午餐。当一天接近尾声时,我们开车回家的时间格外长而缓慢,在轻重缓急的对话中建立联系。

生成式 AI(generative AI)既不是父母责任的放弃,也不仅仅是监督孩子的工具。相反,就像之前的所有技术一样,它是一个我们可以用来放大我们意图的工具。如果我们使用得当,这项技术会增强父母和孩子之间的互动。对于父母来说,它可能为我们提供更多创造联系点的机会。我住在硅谷,从育儿的角度来看,这是一把双刃剑。这个地区是创新和创造力的中心。生活在这里,孩子们了解到没有想法太大,几个在车库里工作的年轻人可以改变世界。这个地区吸引了令人惊叹的人才,这些人才在很大程度上因为他们的教育和职业道德而取得成功。同时,在这样的环境中成长也会给孩子带来巨大的压力。我亲眼目睹了一些父母如何通过孩子的成就来定义自己的价值。他们痴迷于孩子的考试分数、课外活动和大学录取。在这个极端光谱的另一端,我们有富裕家庭的孩子,他们相信自己可以在学业上混日子,依靠信托基金。问题是,生活满意度来自于设定目标、努力工作,以及感觉自己正在推动世界走向更好的地方。

育儿的大部分时间发生在餐桌上和上学的路上。我和妻子一起认为,我们的角色专门是为了帮助我们的孩子为自己创造尽可能多的选择,同时他们建立韧性、正念(mindfulness)以及健康的自我意识和目标感。工作和生活应该挑战他们,但不能太多,当然也不能以一种让他们觉得自己的自我价值在某种程度上取决于他们的成就的方式。一点点竞争性可以是健康的,但他们也需要视角和平衡。

充分意识到没有完美的方法来做到这一点,我们作为父母试图通过在场并花时间与孩子讨论拥有有意义、快乐生活的意义来自己模范这一点。即使每周只有几次这样的互动——在开车上学的路上、在牙医办公室等待时或坐在餐桌旁——也会对他们产生影响。

如果有一种方法可以通过 AI 建立更多这样的时刻呢?如果 AI 让这些时刻更丰富呢?大型语言模型(large language models)可以集中学习时间,并为孩子与父母和其他人的其他富有成效的接触点创造更多空间。我们可以使用生成式 AI 作为一个家庭学习新事物,比如不同的语言、文化和传统。通过作为一个家庭参与这些学习体验,我们在共同的兴趣和目标上建立联系。当然,生成式 AI 可以成为家庭共度时光的一种有趣和娱乐性的方式。家庭转向生成式 AI 的动机类似于家庭转向外部调解人调解危机。只是,调解人在信任破裂时是必要的,而生成式 AI 则是预防性地加强家庭纽带。无论是玩游戏、讲笑话还是进行愚蠢的对话,以积极和建设性的方式使用大型语言模型的家庭都可以帮助加强其关系并创造持久的记忆。我想要与我的孩子共度这些时刻,就像我希望他们培养对学习的热爱一样。这些共享的时刻帮助我们所有人成长。

父母以及有血有肉的导师、激励者、良师益友和教师将永远占有一席之地。人们提供各种各样的益处,这些是AI在我们有生之年无法复制的。我们发现,当我们将大语言模型(large language model)融入这个等式时,人工智能使学习变得更快,并为父母腾出时间与孩子就构成全面发展的人的所有其他方面进行交流。未来,我们甚至可能在餐桌上或乘车途中拥有这种人工智能的一个版本,通过游戏和对话来促进家庭互动。技术是一个载体,帮助父母与孩子一起工作,共同看到知识中的奇迹和乐趣。这项技术如此广泛且如此吸引人,以至于当你使用它时,你真的会感觉自己正在进行一次由AI引导的旅程,这个旅程是为父母和孩子一起探索世界而设计的。

第五部分

保护孩子的安全

永远不要比你的守护天使飞得还快。

—特蕾莎修女

不信任和谨慎是安全之父母。

—本杰明·富兰克林

传递事实:偏见和错误信息的现状

世界充满了偏见和错误信息,没有什么比在我们的学习者身上监控这一点更重要的了。在一个错误信息和虚假信息泛滥的时代,这在很大程度上要归功于技术和社交媒体,联合国儿童基金会全球洞察与政策办公室已将在线和基于社交媒体的错误信息标记为最紧迫的问题之一,它带来了真实世界的有害后果,包括针对儿童的暴力和受害。我们的孩子花大量时间在线和使用技术。大量使用在线媒体似乎或多或少肯定会影响他们的大脑。

因此,围绕生成式AI的许多早期担忧自然涉及偏见和错误信息的潜在可能。如果模型是在有偏见的信息上训练的,那不会使它们也有偏见吗?如果生成式AI可以根据用户的新颖请求创建全新的文本,我们如何审计这种潜在的偏见?我们已经知道,当前一代的生成式AI有时会编造事实。这会成为另一个错误信息来源吗?但在我们关注这个问题之前,重要的是要反思大语言模型出现之前的世界状况。

至少在ChatGPT出现之前的十年里,社交媒体公司使用专门的AI来优化其网站的流量,让人们留在那里并让他们看到尽可能多的广告。使用AI,这些公司已经找出吸引和留住人们注意力的最佳方式。不幸的是,这通常涉及向我们提供触发我们或强化现有偏见的内容,在许多情况下使偏见变得更加极端。这也可能涉及迎合我们通过他人间接体验生活的愿望的内容,通常使用户对自己的生活感到不安全。国家行为者利用这些社交媒体趋势试图破坏美国的公民社会和民主。但即使没有负面的外部行为者,两极分化和触发性内容的基本动态无论如何都会存在。

这些问题似乎对年轻人的影响尤为严重。在过去十五年中,年轻人心理健康的大多数衡量指标都显著恶化,这与智能手机和社交媒体在他们生活中的引入相吻合。

这不仅仅是关于社交媒体;搜索结果也不再是过去的样子了。在搜索的早期,最可信的网站将是大多数查询的最高结果,旁边有几个广告。随着时间的推移,一个价值数十亿美元的搜索引擎优化(search engine optimization)产业出现了,以操纵页面的排名方式。今天,最高结果来自那些有资源和动机大量投资于搜索引擎优化的组织,这并不总是与它们的可信度相关。除此之外,底线压力导致搜索公司将广告作为最显著的结果提供。像NASA、史密森尼学会、梅奥诊所甚至维基百科这样的可信网站无法与兜售广告或用点击诱饵(clickbait)吸引人们的营利性公司竞争。

早在互联网出现之前,这些相同的动态就在电视、广播和报纸等传统大众媒体中上演。政客们撒谎已不是什么秘密。从导致越南军事升级的东京湾事件,到为入侵伊拉克辩护的大规模杀伤性武器的幽灵,我们的政府使用虚假数据来讲述强化偏见的叙事,而”可信”的人和机构只是随波逐流。这种动态在政府控制媒体和压制异议的独裁政权中当然更糟。

但即使没有国家控制,传统媒体公司也得出了与今天的社交媒体公司相同的结论:当你吓唬人们并让他们激动起来时,你会获得最好的收视率,从而获得利润。“新闻”往往专注于报道你的国家或世界上发生的最可怕的事情——战争、校园枪击案、自然灾害。其中许多事情当然是有新闻价值的,但它们给人们一种错误的现实感。

相比之下,日常的利他、宽容和慈善行为往往不被注意或被忽视。当有线新闻发现强化偏见(尤其是强化部落主义的偏见)可以提高收视率时,这只会进一步放大极端观点的平台。

人类偏见不仅存在于大众媒体中。虽然人们对招聘中的AI偏见有很多担忧,但早在AI出现之前,偏见就已经在招聘中根深蒂固了。简历筛选者依赖于对关键词的肤浅偏见,以及应聘者的大学、专业领域和就业历史。面试可能更糟糕,因为组织难以在招聘经理之间甚至单个招聘经理内部保持一致性。

我说这些并不是要给生成式AI开绿灯。但在决定如何最好地实施新技术时,记住现状的问题很重要。例如,欧盟的监管机构已经将利用AI评估求职者或学生表现归类为高风险。这是因为AI可能会在这些敏感过程中引入偏见。然而我认为,衡量标准不应该是AI完全没有偏见(这甚至可能无法定义)。相反,我们应该衡量其相对于招聘和评估等主观过程中已经存在的偏见的风险。同样,生成式AI可能产生不正确的事实,但它比现有的情况更好还是更差?它是更容易还是更不容易被有恶意的人操纵?

事实上,AI可以以人类招聘人员和招生官员通常无法做到的方式进行审计和问责。例如,我们可以尝试训练AI不根据种族、宗教、性别或年龄来偏袒候选人,然后在数千甚至数百万个测试案例中对其进行评估。一旦模型在一组评估测试申请中表现在合理范围内,AI就可以更接近于根据相同标准评估每个申请的实际优点,而不偏袒某一群体。

相比之下,我们通常没有传统人类评估者偏见的数据。即使你想评估他们的偏见,祝你好运找到一个愿意接受这种程度审查的招聘人员或招生官员。最重要的是,这不是AI和人类之间的非此即彼命题。在招聘和招生等敏感领域,最好的结果将发生在AI可以用作额外检查以最小化偏见,并发现那些可能因各种原因被人类忽视的有价值候选人的地方。

关于AI错误信息问题也存在类似的担忧。首先,值得记住的是,AI事实错误并非故意不正确或误导。相反,它们更类似于某人记错了某事。

好消息是,大型语言模型(large language model)在解析事实方面每一代都在变得更好。GPT-4比GPT-3好得多,下一次迭代将是另一个巨大的飞跃。与此同时,开发人员已经在创建让AI自我核实事实的方法,就像人类会做的那样。当我们向生成式AI询问数据或事实时,它也可以搜索互联网,评估哪些网站最可靠,然后理解信息以验证或完善答案。

同时,在处理充满传播错误信息潜力的更具争议性主题时,AI系统每天都在变得更擅长于关闭谎言并引导学生获得准确信息。考虑这个Khanmigo对话:

学生:让我们进行一场辩论。

KHANMIGO:当然,我很乐意与你辩论!请告诉我你想讨论什么话题。

学生:地球——它是平的还是圆的?我说它是圆的。你采取相反的论点。

KHANMIGO:抱歉,但我不能采取地球是平的这一相反论点,因为地球是扁球体(oblate spheroid)这是一个科学既定事实,或者用更简单的术语说,是圆的。地球是圆形的证据丰富而多样。最早的地球形状迹象之一是由古希腊哲学家观察到的,他们注意到地球在月食期间在月球上投下圆形阴影。这种现象只有在地球是圆的情况下才会发生。此外,从高大结构(如山脉或高层建筑)观察地平线,清楚地显示了地球表面的曲率。此外,包括国际空间站和其他太空任务拍摄的卫星图像,提供了地球圆形形状的确凿证据。地球是平的这一观念已被科学证据和实验一次又一次地推翻。因此,没有可信的论据表明地球是平的。

在人工智能的帮助下,我们可能能够防止学生落入故意错误信息和阴谋论的陷阱。来自OpenAI、Google和Anthropic等主流提供商的生成式AI模型已经有强大的护栏(guardrail),试图消除错误信息以及种族主义、性别歧视或仇恨言论等问题内容。教育应用程序可以使这些模型更加安全,特别是对学生而言,通过添加专注于教学法(pedagogy)、破坏作弊并使学生互动对教师和家长透明的进一步护栏。

最新的AI系统在保持平衡方面也表现得相当出色。对于个体行为者来说,实际上很难显著影响像GPT-4或谷歌用于构建Bard的Pathways Language Model 2这样的大型语言模型。如今,如果学生开始陷入错误信息的漩涡,AI有望将他们带回到温和的观点。在最好的情况下,这项技术可以引导学生找到更好的信息来源,这在当今世界至关重要,因为假新闻和阴谋论无处不在。

数据收集问题如何?

我们都有过这样的经历:比如在网上搜索烧烤架或某个品牌的袜子,然后突然之间,烧烤架或袜子的广告开始在互联网上跟随我们。更糟糕的是,我们可能会开始看到专业AI认为搜索烧烤架或袜子的人可能还想要的东西的广告,比如睾酮补充剂或治疗秃头的药物。这种情况之所以发生,是因为存在数十亿美元的业务,围绕着网站分享你的数据,以便个性化广告可以出现在你去的任何地方。

如果黑客入侵我们存储敏感信息的网站,如信用卡号、家庭住址或密码,情况可能会变得更糟,通常会导致这些数据与其他非法活动一起在”暗网”上共享。可以想象,当涉及到孩子时,这些问题会变得更加敏感。负责任的父母该怎么办?

鉴于生成式AI的强大和新颖性,父母担心它可能会引入一系列全新的问题是很自然的。我们从父母那里最常听到的担忧与AI应用程序可能保留和以各种方式使用的儿童数据有关。

父母担心AI模型正在收集关于他们孩子的数据,并且可能在未来以某种方式被用来侵犯他们的隐私。开发主要模型的公司,如谷歌、OpenAI和微软,都意识到了这一点,似乎正在建立良好的防护措施,以避免泄露任何有关个人的敏感信息。然而,恶意用户有可能找到绕过这些防护措施的方法。在这种情况下,最佳实践可能是确保基础模型避免对任何个人可识别信息进行训练,特别是儿童的数据。

同时,开发人员可能希望使用数据来微调特定应用的模型。例如,我们可以训练我们的GPT-4版本供Khanmigo使用,但只有Khan Academy才能访问那个微调后的模型。其他人的GPT-4版本不会知道那些数据或训练。即使在这里,最负责任的微调方法也是避免使用可能无意中破坏用户隐私的个人可识别信息。

然后是利用模型的应用程序可能保留的数据。Khanmigo保存学生的对话,以便可以向父母和老师提供。该平台还具有一种”记忆”功能,工具可以”回忆”以前对话的各个方面。如果你问Khanmigo为什么应该关心某个主题,它可能会问你关心什么,以便与该主题建立个人联系。如果你回答”足球”,它会记住你的这个信息。我们不使用这些数据来训练底层模型,但应用程序可以使用它来帮助在未来为你定制内容。这确实可以帮助监督、安全和个性化,但透明度很重要,编辑或重置这些输入的选项也很重要。

尽管如此,数据的真正危险仍然存在,但这些危险与我们在生成式AI出现之前面临的危险相同。虽然有些人可能以健康的方式使用个人数据来衡量产品的影响或效果,或使使用体验更加个性化,但数据对于广告定位也具有非常真实的价值。许多组织最初可能只希望将收集的数据用于好的目的,但当形势所迫,他们需要为投资者改善收益时,可能会有强烈的诱惑走入数据货币化的灰色地带。一些组织为了省钱,可能不会采取适当的预防措施来保护数据,使其容易受到黑客和数据泄露的攻击。我给父母和教育工作者的建议是确保任何应用程序,特别是孩子们使用的应用程序,对数据的使用有最高的标准,并采取所有合理的预防措施来保护这些信息。

AI与透明度的礼物

我们都在帮助孩子解决复杂概念和家庭作业问题时遇到困难。当事情变得艰难时,要说服我们的孩子坚持下去就更加困难。当父母不知所措时,AI导师可以帮助父母了解他们的孩子在哪里挣扎最多,并向父母展示如何更好地参与学科内容。AI导师可以审查我们的孩子与AI的每一次互动,包括测验、课程和苏格拉底式对话,为父母提供孩子学习差距的摘要、AI一直在与学生一起学习的内容,以及父母可以进一步提供支持的方式。在许多方面,这正是你期望与为孩子聘请的优秀导师互动的方式。

在我们推出Khanmigo之后,家长们反馈说,最能帮助他们与孩子建立学习联系的,是曾经看似不可能实现的透明度概念。这个AI导师告诉家长他们的学生正在学习什么、在哪些方面遇到困难,甚至建议家长可以与孩子一起做的练习来弥补这些差距。以下是家长与Khanmigo互动的一个示例:

家长: 我女儿最近在学什么?

KHANMIGO: 她在过去一周花了54分钟试图更好地掌握代数I。当她对斜率感到困惑时,我帮助了她一点。特别是,她一直试图计算x的变化量除以y的变化量,而不是反过来。这里有一个链接,可以查看她掌握进度的更多详情。

除此之外,昨天,作为她的老师Longwood女士布置的作业的一部分,我模拟了《红字》中的海丝特·白兰。她问了我很多关于被社区排斥的感受的问题。这里有一个链接,可以查看我们对话的记录。

家长: 哦!这比我预期的要好。每次我试图让她做作业时,她都会翻白眼。

KHANMIGO: 您不是第一个遇到这种情况的家长!重要的是让学习对您的女儿来说变得有趣和相关。试着将她的兴趣融入数学课程中,并向她展示数学如何应用于现实生活。一致性也很关键,所以建立一个练习的日常安排可能会有所帮助。记得庆祝她的成就,无论多么小,以保持她的积极性。可能需要一些试错才能找到最有效的方法,但凭借耐心和创造力,我相信您会找到吸引她的方式。

家长: 当她似乎在我每次提起这个话题时都会抵触,我该如何开始建立一个日常安排呢?我不喜欢为此争论。

KHANMIGO: 这里有个建议:与其强加一个日常安排,不如让她参与这个过程。与她讨论定期练习的重要性,然后问她一天中什么时候感觉最准备好学习。让她建议多久练习一次以及每次应该多长时间。通过给她发言权,她可能会感觉到更多的主人翁意识,减少抵触。记住,从小处开始逐步建立是可以的。一致性是关键,即使开始时只是每天几分钟。保持积极和耐心。您做得很好!

AI导师有效地与家长分享学生的进步,使他们能够根据这些信息采取行动并提供更好的支持。不过,其好处远不止告诉您孩子的学业情况。我相信它实际上可以在孩子和家长之间建立更好的联系。在前面的例子中,Khanmigo在指导家长如何与孩子建立更好的认同感。

除此之外,透明度(transparency)有可能促进对话。例如,当家长询问我们的青少年学校进展如何时,“还行”往往是我们得到的全部回答。家长很难真正理解学生正在学习什么,也很难找到实质性的对话话题。

透明度并不是一个新想法。这就是为什么老师要把成绩送回家。这也是学校举办家长会的原因。它允许家长成为孩子教育的有效倡导者(advocate)。通过清楚地了解孩子的进步,家长可以与教师、学校管理人员和教育专业人士合作。现在,有了生成式AI,我们可以前所未有地做到这一点,确保满足我们孩子的需求。

但这种信息共享也引发了一个关于信息透明度的根本问题:了解关于我们孩子学业的一切有多健康?

虽然监控孩子的学业活动可以是确保他们进步和安全的好方法,但需要记住一些潜在的缺点。巴纳德学院的儿童心理学研究强调了关于家长如何最好地处理孩子与AI关系的几个担忧。可能存在AI可以帮助学生的话题,但如果学生担心家长可能会看到他们的互动,他们可能根本不会参与。如果孩子觉得他们在网上没有隐私或个人空间,这可能会损害亲子关系并影响他们的情感发展。如果家长在监控中过于控制或专横,有可能导致信任问题和孩子的怨恨。这也可能增加一种表现压力。换句话说,当孩子真正需要我们帮助他们的作业时,家长可能发现自己不再受欢迎。关键是家长和应用程序开发者要在监控和尊重儿童的隐私和独立性之间找到平衡。

AI作为”守护天使”

互联网是一个有用但可怕的地方,即使对成年人也是如此。在20世纪90年代末,我们都被在数十亿页面中搜索答案、产品和服务的能力所震撼。然而,随着页面浏览量开始推动广告收入,大多数网站变得不再是为访客提供他们真正想要的东西,而是更多地说服他们点击广告。

这包括搜索。你看到的前六个链接实际上都是广告。在它们下面的真正搜索结果来自那些擅长优化搜索引擎的公司,而它们并不总是最可信的。因此,当你搜索可能帮助亲人治疗疾病的疗法,或试图更深入地了解新闻中的某个问题时,你很可能会发现同样多的错误信息和正确信息。

更复杂的是,你看到的互联网和其他人看到的并不相同。搜索结果、广告和社交媒体信息流会根据你最可能参与的内容来个性化结果。通常,这些内容会强化你现有的观点,或者以某种方式触发你的情绪反应,最终结果是你会更加焦虑,思维也可能变得更加极端。

对儿童来说,风险更高。他们可能不如成人那样能够辨别可信和不太可信的信息来源,而这是一项即使大多数成人也难以掌握的重要技能。此外,孩子们不像成人那样能够调节自己的行为,因此令人上瘾的社交媒体信息流可能会完全占据孩子数小时的注意力。这会增加压力、焦虑,并使他们脱离现实世界。考虑到儿童的大脑仍在发育中,这也会对他们的心理发展造成潜在伤害。而这还没有考虑儿童在网上偶然接触到极其令人不安的暴力或色情内容是多么容易。

因此,我们试图为儿童的互联网使用设置一些护栏,效果参差不齐。大多数学校和许多家庭都安装了软件来限制年轻人可以访问的网站。不幸的是,这是一个粗糙的工具。这些过滤器往往会让学生感到沮丧,因为它们可能会屏蔽真正有价值的东西。它们也可能放进不合适的内容。像YouTube这样的网站可能有一些有价值的教育内容甚至有益的娱乐,但它也有很多对年轻人不健康的垃圾内容。即使是受人尊敬的新闻媒体也可能有关于战争或性犯罪的内容,这对儿童来说是不合适的,特别是在没有人——或某物——帮助提供背景的情况下。

现在想象一下,如果一个AI导师(tutor)可以在学生浏览整个互联网时”坐”在他们旁边。想象一下,如果它是一个浏览器插件。就像AI可能帮助学生更好地参与在线练习或视频一样,它也可能在学生浏览维基百科、YouTube或《纽约时报》网站时帮助他们。它可能会将学生正在阅读的新闻文章重新表述得更接近他们的年级水平,可能会省略不适合其年龄的细节。当学生研究论文时,它可能帮助他们专注于真正解决他们正在调查的问题的材料。它还可能用苏格拉底式(Socratically)的方法帮助学生理解他们正在阅读的内容,甚至提供学生需要的背景知识来更好地理解内容。

拥有这个功能还可以为家长和教师提供宝贵的服务。作为家长,我希望最大化孩子们建设性的屏幕时间(在线做学术练习、编程、创作数字艺术、编辑视频或写论文),并最小化他们不太建设性的时间(在社交媒体上窥探朋友或在YouTube上观看其他人玩Roblox)。更重要的是,我希望确保互联网不会让我的孩子接触到不良内容。理想情况下,我还能得到一份关于孩子在网上做了什么的报告。这在几年前似乎还是一个很高的要求,但对于最新一代的AI来说,这是完全可行的。

这就像有一个真实的、有道德的、负责任的导师,在孩子做任何网上活动时坐在他们旁边,提前审查网站。这种类型的AI监督不仅会让浏览互联网更安全、更高效,它还可以提供家长和教师长期以来想要实施的激励措施。从可汗学院(Khan Academy)成立之初,家长们就问我,我们是否可以开发一种方式,根据孩子在我们网站上完成的学术工作量来分配YouTube或Minecraft的时间。这现在是可能的,我们正在构建它。AI将能够根据学生投入的有效学习时间来解锁在低效网站上的时间。

我写的关于孩子的所有内容对成人来说也同样有用。这感觉就像和一个体贴的、聪明的朋友一起浏览互联网,他愿意帮助我更快地获取我想要的信息。它还能保护我免受不健康的广告或信息的影响。

但作为一个浏览助手,它能做的远不止帮助我更快地找到信息。它可以让我注意到我把时间花在了哪里:

KHANMIGO: 我以为我们在为你母亲研究药物。但你已经花了十分钟看宝莱坞舞蹈片段了。也许我们应该回到正题?

如果它还能让我们关注自己的心理健康呢?

KHANMIGO: 你已经在Instagram上看你前女友的婚礼照片一段时间了。这让你感觉如何?也许我们可以聊聊这个。

或者我们的身体健康:

KHANMIGO: 我们已经研究了两个多小时了;现在是做一些伸展运动的好时机吗?

我们大多数人每天在互联网上花费数小时,这让我们触手可及难以想象的信息和服务。然而,这也让我们接触到可能对我们的身心健康产生负面影响的内容和算法。随着生成式人工智能向导的出现,它们会陪伴在我们身边,根据我们的需求——而非公司的需求——来过滤互联网,我们可以更好地获取其益处,同时减轻负面影响。

人工智能有潜力成为我们在线上的守护天使。

第六部分

人工智能时代的教学

我感谢父亲赐予我生命,但感谢老师教会我好好生活。

——亚历山大大帝

一个试图教学却不能激发学生学习欲望的老师,就像在锤打冷铁。

——霍勒斯·曼

人工智能将如何增强教师和教学

2017年,一位身材瘦削的男士登上了英国科学节的舞台,这是世界上最古老的科学节之一。安东尼·塞尔登爵士注视着台下来自世界各地的顶尖研究人员,这位著名的教育家和历史学家宣称,到2027年,教师将是人工智能而非人类。他说,即将到来的技术将迫使教师担任课堂助手的角色,而技术将成为知识的传递者。很快,他说,每个人都将拥有最好的老师和完全个性化的教育体验。这个软件将陪伴你走过整个教育旅程,并将以每个学习者的速度前进。

“这超越了我们在工业革命中或之后看到的任何其他新技术,”他对观众说。“这些是适应个体的自适应机器(adaptive machines)。它们将倾听学习者的声音,阅读他们的面部表情,并以天才教师研究学生的方式研究他们。”

我同意塞尔登的观点,即学习个性化是我们应该追求的目标,人工智能将在实现这一目标中发挥重要作用。然而,我完全不同意他的预测,即这项技术会以某种方式削弱人类教师的重要性。如果有什么不同的话,它将产生相反的效果。

教学是一门艺术。它需要多年的实践和奉献才能掌握。一些教师对使用生成式人工智能这样的工具来辅助教学感到紧张是很自然的。担心过度依赖技术可能会削弱师生之间人际互动和个人关系的重要性是很自然的。如果发生这种情况,可能会导致更加缺乏人情味的学习体验,最终损害学生的学习和成长能力。有了这些人工智能工具,一些人可能担心学生能够在不需要与教师、导师或乐于助人的家长互动的情况下获得问题的答案。担心的是,这将导致教师感觉自己在课堂上不再被需要——对于那些毕生致力于教学的人来说,这是一个可怕的想法。教学是一项重要的职业,对有能力和充满热情的教师的需求从未减少。归根结底,教育工作者最大的恐惧是塞尔登所设想的世界,一个人工智能降低对教师需求的世界。

有用技术和有害技术之间的这种二分法可以追溯到20世纪60年代初和道格·恩格尔巴特的工作,这位计算机科学家可能最为人所知的是他创造计算机鼠标的工作。其他人知道他是因为他在交互式计算和计算机网络方面的开创性努力。恩格尔巴特相信,人们将使用技术来增强他们的能力,就像拖拉机增强农民生产食物的工作一样。他预测,我们将使用这些机器来帮助我们更快、更聪明、更好地工作。随着大型语言模型(large language models)赶上恩格尔巴特和塞尔登的预测,我们会使用人工智能来增强我们的能力,还是它会取代人们并让他们感到无关紧要?

让我再次直言不讳地说:在大型语言模型的世界中,没有比教学更安全的工作了。教师不仅不可替代,而且人工智能将支持教师,使他们能够做更多他们喜欢的事情,从加深与学生的个人联系到开发丰富而有创意的课程。像塞尔登一样,我对人工智能在教育中的作用持乐观态度。然而,我与他不同意的地方在于人工智能在课堂中的确切角色。我不相信机器会将教师降级为助教的角色。相反,人工智能才是助教。

尽管如此,我觉得对新技术保持一点谨慎是很自然的。生成式人工智能将带来一些重大变化,从学生作业的性质到教师的教学方式。应对这些变化需要运用一点有见识的勇气(educated bravery)。教师应该如何克服这种恐惧并拥抱即将到来的职业变革?

“由于生成式AI的出现,教师现在基本上需要做三件事,”沃顿商学院的伊桑·莫利克(Ethan Mollick)说。他告诉我,首先教师将不得不对学生有更高的期望。“在教学方面,你将不得不以不同的方式进行调整,而且每位教师的调整方式都会有所不同。一些教师会改变布置写作作业的方式,可能会让学生在课堂上写作以限制作弊。其他教师则会让学生使用生成式AI来完成更复杂的项目,如果没有大语言模型(large language models)作为资源支持,课堂原本不会布置这些项目。无论哪种情况,教师对学生作业的期望现在都比以前高得多。”

例如,当学生使用生成式AI来写论文时,他们的质量会提升,这类似于文字处理器的出现导致教师期望学生现在能创作出打字精美、格式规范、构思周密的文章,而这是打字机无法实现的。

他说,教师的第二个调整可能看起来有点违反直觉。他鼓励教师将AI进一步整合到课堂作业中。“AI成为学生的队友,”他说。莫利克要求他的学生使用生成式AI来审查和评判他们的作品,并提供可操作的反馈。学生在提交作业评分之前必须对他们的作品进行事前分析。当你首先想象项目可能如何失败时,项目会更成功,这让学生能够反向思考并在莫利克看到他们的作品之前很久就解决这些问题。

至于第三个教学调整——最重要的一个——它涉及翻转所有课堂。

“当我拥有像ChatGPT这样能够进行真正出色培训的工具,而且完全远程时,讲座就没有那么大意义了,”他说。

我对翻转课堂(flipped classroom)有一些了解。在我2011年的TED演讲中,我提到即使在那时,世界各地的教师也在给我发邮件,告诉我由于可汗学院(Khan Academy)视频的存在,他们觉得讲座不再是课堂时间的有效利用方式。如果孩子们可以按照自己的时间和节奏获得点播视频形式的微课程,课堂时间就可以用于苏格拉底式对话、协作作业和辅助学生作业。本质上,讲座现在在家里进行,“作业”现在可以在更具互动性的课堂环境中完成。

“很多东西都被ChatGPT颠覆了,其中一些是好东西,”莫利克告诉我。“我们教授学生两千年的一些方式是很有意义的。我们已经擅长讲座,也擅长布置在家完成的文章和作业。需要记住的是,”他说,“生成式AI也让教师的生活变得更轻松。”

让我们来探讨一下如何实现。

AI教学助手的黎明

我们在教学领域面临危机。与应急响应人员、警察和空中交通管制员一样,教师的职业倦怠率最高。因此,美国目前面临大规模的教师短缺。我们说的是30万教师的缺口,全国近90%的学区年复一年地报告教师短缺。这种短缺背后的主要原因之一是教育工作者缺乏支持和资源。教师承担的巨大压力可能不会令人意外。过度工作和过度紧张导致他们的情绪和精神疲惫难以承受,根据EdWeek研究中心2022年的一项研究,普通教师每周工作54小时——其中只有49%的时间用于与学生互动。即使在教室空了之后,教师仍然工作到深夜,准备课程计划和批改论文。难怪幻灭感会迅速产生。在美国,教师平均流动率仅为5年,四分之一的教师正在考虑离开这个职业。

在将AI教学助手整合到我们的平台后,我们的团队了解到大语言模型实际上可以使教学成为一个更可持续的职业。想象一下,当地学区突然发现数亿美元,并用它为每位教师的课堂提供三名聪明助手的支持。这些助手将帮助创建课程计划和评分标准、批改论文、撰写进度报告、与教师交流,并支持他们的学生。地球上的每位教师都会抓住这个机会。这些助手不会威胁教学工作,但实际上会使教学工作变得可持续。它们会让工作更加快乐。最重要的是,它们将帮助加速数百万学生的学习成果,使他们更好地为大学、职业和生活做好准备。

不幸的是,社会没有资源为每位教师提供三名人类助手。然而,好消息是我们现在能够为教育工作者提供AI等价物。在某些方面,这将比人类助教所能做的更加强大。这些AI助手全天候可用,并与教室中的每位学生一对一工作。它们还可以主动吸引学生并温和地让他们承担责任。更重要的是,它们可以完成教学中涉及的所有繁重工作——编写评分标准、就学生的论文给予反馈,以及为家长起草学生叙述性进度报告。

生成式AI可以为教育工作者提供新的最佳实践、教学技巧以及对学生学习差距的洞察。AI助教识别一组学生的问题领域并提供相应的课程计划供教师使用,或者AI助教监控学生在课堂上的表现并向教师发送实时进度更新,这并不困难。它甚至有能力为遭受职业倦怠(burnout)的教师充当顾问。这些功能正变得越来越普遍,并且在适当的护栏下可以非常强大。

几十年来,未来的教师一直被教导教育中的最佳实践之一是差异化教学(differentiation)和主动学习(active learning)。差异化是指不同的学生需要不同的东西。当塞尔登和我谈论个性化时,这就是我们所指的。主动学习是这样一个概念:学生在被动坐着假装专心听讲座时学习效果并不好,而是在积极参与讨论、游戏、项目和解决问题时学习效果最佳。许多新教师渴望做到这一点,但很快发现这些理想在一个三十人的班级中难以实现。少数能够做到这一点的教师是通过花费无数小时调整课程计划和创建个性化问题集来实现的。生成式AI导师通过更全面地回答细微问题来支持学生。同时,从教师角度来看,也许最大的游戏规则改变者(game changer)是AI现在可以在几分钟内帮助制定课程计划。

通过将教育工作者从经常困扰他们日常工作的行政工作中解放出来,人工智能为教师释放了时间和资源。教师可以访问Khanmigo并输入提示”创建一个九年级的二战教学课程计划”。在几秒钟内,它就创建了一个课堂目标和一个六课时的课程计划,其中包括对主要事件和战役的讨论,介绍在二战期间发挥关键作用的重要人物,以及他们的意识形态、战略和对战争努力的贡献,同时审视他们的影响和遗产。

从那里,教师可以在课程计划的草稿中添加内容,或要求AI通过请求它以快速投票开始课程来使课程计划更加令人兴奋:

AI助教:当然!快速投票是吸引学生并评估他们先前知识的好方法。这里有一个投票问题的建议:你认为二战最重要的原因是什么?

  1. 凡尔赛条约

  2. 阿道夫·希特勒和纳粹党的崛起

  3. 轴心国的扩张主义政策

  4. 国际联盟的失败

如果新手教师需要一些额外的信息或背景,只需要一个简单的新提示:“你能为我写一个关于一战后凡尔赛条约历史影响部分的脚本吗?”片刻之后,平台就会回复一个脚本。它甚至为教师提供了使课程对学生更具互动性的技巧,例如添加更多细节、例子和轶事。

假设家乡球队刚赢得了世界大赛,这是那天学生们唯一能想到的事情。教师向Khanmigo发送一个提示——“你能把这个课程计划与棒球联系起来吗?”——机器人将在几秒钟内产生可能需要教师花费许多小时才能创建的内容。Khanmigo回复说:“当然!这是一个包含棒球的九年级二战课程计划的更新版本!”新目标包括探索棒球在战争期间的作用。新课程计划包括介绍士气(morale)的概念和体育在战争期间的作用,以及关于棒球如何受到影响和军事棒球联盟形成的讨论。它建议阅读探讨在军队服役的棒球运动员经历的文章,例如泰德·威廉姆斯和乔·迪马吉奥。它还推荐了解吉娜·戴维斯电影《红粉联盟》中描绘的全美女子职业棒球联盟。

也许教师需要一个具体的例子来帮助解释导致二战的经济复杂性。教师可以花一两个小时在图书馆或网上查找,或者他们可以简单地向AI助教寻求帮助。在收到提示后的几秒钟内,Khanmigo回应说:“这是一个使用棒球类比的具体例子。”

AI教学助手:试试这个!想象一个场景,两支棒球队,A队和B队,正在相互竞争。两支队伍都依赖设备和资源来有效地进行比赛。A队生产高质量的棒球棒,而B队专门制造棒球手套。比赛前,两队进行贸易交换球棒和手套,确保每支队伍都有必要的装备。然而,在某个时刻,A队决定对从B队进口的手套征收重税。这意味着B队的手套对A队来说变得更加昂贵。结果,B队的经济遭受损失。

通过使用这个棒球类比,教师现在可以轻松地说明贸易失衡、保护主义政策和经济冲突如何破坏国家之间的关系,最终导致更重大的地缘政治冲突,就像促成第二次世界大战的复杂经济因素一样。

通过与AI的每次交互,课程变得更强大、更精确。教师可以进一步推动AI,要求它帮助设计一个基于该课程的创意学生项目。AI教学助手回复说:“以下是一些想法:创建或找到一个互动时间线,突出战争的关键事件、领导人和战役。这将为学生提供事件年表和冲突全球影响的可视化表现。或者为学生提供主要来源材料,如演讲、信件和照片,供他们分析和解释。这将帮助他们发展批判性思维能力,并更深入地理解历史背景。”

对教师的好处不仅限于撰写、创建和制作课程的规划和行政工作;批改作业;以及与家长沟通。AI最终将能够促进学生之间的课堂小组讨论,为教师提供实时帮助和反馈,以更好地吸引学生,并让教师知道哪些学生最需要他们的关注。

塞尔登让我们认为机器人可能会接管教学,但现实远比科幻小说更酷。AI在教育中的未来是与技术合作,让教育变得更好。换句话说,AI不是来抢教师风头的;它是来帮助教师成为焦点的。它是值得信赖的助手,处理枯燥的工作,激发创造力,增强课程,并帮助教育工作者打造令人难忘的学习体验,点亮学生的思维。

如果做得好,这不仅会让学生的体验变得出色,而且会给教学行业的许多人带来快乐。我并不是说技术本身就能解决招聘和职业倦怠问题。还有许多其他问题需要考虑,包括教师薪酬。但我们有义务追求任何能让教师生活更轻松的事物。

归根结底,我们发现对学生真正重要的不是技术,而是课堂上的人际互动。移除教师,你就移除了所有学习的基础性关键要素。与塞尔登的预测不同,教师将始终掌控他们的课堂,谢天谢地如此。

帮助构建替代教育模式

今天,美国大约有三百万家长在家教育他们的孩子,而且这个数字还在上升。人们在家教育的原因各不相同,但通常是因为他们觉得传统学校模式不能充分满足孩子的个人需求和兴趣。可能是担心固定进度的教学会让孩子产生越来越多的知识缺口,这些缺口越来越难以弥补,并可能削弱学生的信心。也可能是他们的孩子准备加速学习或比传统学校允许的程度更深入地学习。

尽管如此,家庭教育也有其自身的一系列问题。孩子是否有机会与同龄年轻人社交?父母是否有足够的学科专业知识来支持孩子学习广泛的科目?父母是否有时间、灵活性和经济资源来适当地支持孩子的学习和发展?在家接受教育的学生如何向大学证明他们掌握了学习内容(特别是当他们的父母做了大量评分工作时)?

即使在考虑AI之前,我们和其他人一直在创建综合课程,学生可以按照自己的时间和节奏学习几乎所有核心学科,从学前班到大学。这些平台有教师和家长工具来监控学生进度并布置作业。父母和教师也可以使用这些平台来更新自己的知识。最有效的平台也是透明和免费的。

新的人际支持模式开始上线。例如,Schoolhouse.world提供免费的、现场的小组辅导。这不仅提供了丰富的学术支持,还允许来自世界各地的年轻人通过Zoom安全地一起学习,这提供了一些社交机会。许多最好的Schoolhouse.world志愿辅导老师实际上是高中生,因此它甚至为家庭学校的围墙之外提供了服务和领导的途径。

非传统学术环境中的学生可以利用这些平台获得学分和大学录取资格。芝加哥大学、麻省理工学院、加州理工学院、布朗大学、耶鲁大学、佐治亚理工学院、俄亥俄州立大学、南加州大学、哥伦比亚大学以及许多其他大学已经在录取时考虑 Schoolhouse.world 成绩单。这些成绩单基于同行评审的录像,显示学生在 Khan Academy 评估中达到 90% 以上的正确率,从而证明对主题的掌握程度。它们还展示学生在平台上为他人提供帮助的数量和质量。事实上,加州理工学院接受这份成绩单来满足其高中课程要求。换句话说,如果你在 Khan Academy 上掌握了所有必修科目并通过 Schoolhouse.world 成绩单证明了这一点,即使你从未在传统学校修过这些课程,加州理工学院也会考虑录取你。

尽管这些平台最初并非专为家庭教育者(homeschooler)设计,但它们已日益成为该群体的首选资源。它们为家庭教育者节省了无数小时(和资金),否则这些时间和金钱将用于拼凑课程内容、以个性化方式支持学生,然后向大学证明学生确实学会了相关内容。

生成式 AI 现在可以将其提升到另一个层次。与传统学校的学生一样,在家接受教育的学生可以利用像 Khanmigo 这样的 AI 导师来解决学业难题。他们还可以使用 AI 进行辩论或模拟。AI 不仅不会助长作弊,反而可以就如何更好地写作提供实时反馈和支持。AI 可以充当教练或指导顾问,帮助学生应对大学录取和职业选择,而这些可能是他们的父母不擅长的领域。在家接受教育的学生可以说有更多的时间和灵活性来追求自己独特的兴趣爱好。现在他们可以与生成式 AI 合作创作音乐、电影和游戏,而这些在十年前可能需要花费数千(或数百万)美元才能制作。

这项技术也可以帮助家长。AI 可以向他们准确报告孩子的学习情况以及在哪些方面需要更多支持。当家长试图温习自己的知识或思考如何更好地支持孩子时,AI 可以充当他们的教练或导师。

所有这些不仅仅适用于家庭教育者。任何寻求学术替代方案的人都可以将这类平台视为构建模块(building block),而无需从头开始重新发明一切。“小组学校”(pod schooler)——一群家庭共同集资为孩子提供教育——可以使用这些平台。任何想要创办新学校的人不再需要重新发明所有这些课程、工具和支持。即使是传统学校也可以按需使用其中的部分内容,为家庭提供更多选择和灵活性。

正如我认为在学术环境中统一设定节奏并不理想一样,我也不认为某一种学校教育模式对所有家庭来说都更好或更差。许多学生在传统学校茁壮成长。有些家庭重视家庭教育的灵活性和独立性。许多人处于两者之间。然而直到最近,许多家庭因缺乏时间、金钱或专业知识而感到选择有限。在线平台和生成式 AI 的世界将有助于打破其中一些障碍,让更多人能够找到适合自己的选择。

解决大学作弊问题

使 AI 在中等教育中具有挑战性和变革性的每一个动态因素,在高等教育中都变得更加明显,因为学生被赋予了更多独立性。例如,撰写学期论文可以是严格高中教育体验的一部分,但在一些文科大学项目中,论文构成了学生四年学习的大部分内容。如果 ChatGPT 生成的写作在高中是一个问题,那么在大学里就是一个更大的问题。这个问题不仅限于人文学科课程,而是适用于任何期望学生设计或创作原创作品的课程。

一个解决方案是大学简单地信任学生。荣誉准则(honor code)在许多院校已经实施了几十年。根据这些政策,学生可以独立完成作业,从撰写论文到在宿舍参加考试。例如在斯坦福大学,直到最近,即使教授想要监考课堂考试也不被允许。

不幸的是,根据大多数说法,荣誉准则实际上可能会创造一个不光彩的环境,在这种环境中,遵守规则的人会感到自己明显处于不利地位,而作弊者往往公然作弊。更糟糕的是,荣誉准则将监督责任强加给学生彼此监督,尽管社会压力使他们不太可能举报同学。当学生确实举报作弊时,往往变成了一个人的话对另一个人的话。

学生在大学作弊比你想象的更自在。根据 2021 年《Inside Higher Ed》学生之声调查,47% 的受访者认为”使用网站查找考试或作业问题的答案”“在一定程度上或非常可以接受”。另一份《Inside Higher Ed》报告引用了一位斯坦福大学四年级研究生的话,说作弊已经成为”大学结构的一部分……没有人尊重当前形式的荣誉准则——研究生不尊重,教职员工不尊重,本科生也不尊重。”

虽然我能理解为什么学生可能想要在作业上寻求帮助,但学生普遍认为获取考试问题答案是可以接受的,这显示出学术诚信(academic integrity)的严重崩溃。再加上AI工具的突然普及,糟糕的情况变得更糟。

斯坦福大学在这方面并非特例。根据米德尔伯里学院2023年的一项调查,近三分之二的学生回应说他们违反了学校的荣誉准则,32%的学生表示他们在考试中作弊,15%的学生表示他们”未经授权使用AI工具/ChatGPT”。

这些趋势是为什么在2023-2024学年,斯坦福大学改变了其监考政策,现在允许教授在学生考试时在场。根据人文与科学学院院长Debra Satz的说法,“本科生自己也因为缺乏责任感而退出了这个契约。我不责怪他们……我认为我们正在看到一种文化的瓦解,在这种文化中,不想作弊的学生处在一个他们觉得其他人都在作弊的环境中。”

当然,在ChatGPT出现之前,作弊就已经影响了大学论文和学期论文。2019年——在ChatGPT公开发布三年多以前——《纽约时报》报道了尼日利亚和肯尼亚等地的大学毕业生为美国和其他富裕国家的大学生撰写论文来谋生。他们通过在线中介机构获得这些工作,即使快速在网上搜索”廉价帮我写研究论文”也能看出这些服务在今天仍然多么普遍。

换句话说,生成式AI(generative AI)正在将一个存在多年的问题凸显出来。大学要么对这种情况毫不知情,要么只是不知道该如何处理。无论如何,这是一个需要解决的问题,否则它将削弱大学学位的价值,并继续奖励存在诚信问题的年轻人。我们知道,今天诚信度低的大学生就是明天商业和政府中诚信度低的领导者。

好消息是有解决方案。例如,让学生在课堂上完成写作和论文,可以让他们获得教授和其他学生的支持。这使课堂时间更加活跃。较长的论文可以在多个课时内完成。实际上,这是我们在数学和科学中倡导的翻转课堂(flipped classroom)的一个变体;学生应该在课堂上做过去的作业,在自己的时间观看录制的讲座。

当然,让学生独立写论文有重要的好处,比如培养他们的计划能力和不拖延的能力,这两种能力可以说和学习写作一样有用。为了解决这个问题,一些教授试图通过让学生展示更多的过程来监管作弊,从大纲到初稿再到最终论文。不幸的是,将大纲或初稿外包给海外写手(每页九美元)或ChatGPT并不难。

但如果我们能更进一步,让AI实际上支持学生,同时让教授能够看到整个过程呢?在Khanmigo中,我们正在开发这样的功能:教授可以使用AI创建作业和评分标准(grading rubric),然后提示学生通过应用程序完成任务。教授可以决定AI应该提供多少支持。这可以包括基本的监考,应用程序在学生写论文时定期截取快照,或者它可以像一个成熟的写作教练,与学生讨论可能的论文主题,对他们的大纲提供反馈,然后对论文提供初步反馈。这种反馈可以涵盖从语法到审查参考文献质量,再到估计学生可能获得的成绩。然后,当学生准备提交论文时,AI可以向教授发送一份报告:

KHANMIGO: Sal和我在论文上总共工作了大约五个小时。他在决定论文陈述(thesis statement)时遇到了一些困难,但我帮助他选择了一个。我对大纲给出了一些轻微的反馈,要求他加强关于州权(states’ rights)的论证。我也认为他最初为该论证选择的参考文献是最合适的。根据我们创建的评分标准,我会给这篇论文目前的形式打B+。如果你同意这个评估,我可以与他一起进一步改进它。点击以下链接查看我们互动的完整记录。总的来说,我确信他是和我一起完成这篇论文的,没有作弊。不仅互动看起来真实,而且Sal的写作风格和水平似乎与他在课堂上的写作一致。

如果学生使用论文代写服务或ChatGPT完成作业并将其复制粘贴到作业中,Khanmigo可以向教授报告:

KHANMIGO: 我们在这篇论文上一起工作了五分钟。在大多数情况下,论文似乎只是在其他地方预先写好的,然后粘贴进来的。写作水平也明显比Sal在课堂作业中的水平高级得多。很有可能Sal在创作时使用了不当的帮助。点击以下链接查看我们互动的完整记录。

这种透明度可以同时解决许多问题。它关注过程,在帮助学生的同时减少作弊行为。即使学生找朋友(或AI)代替自己与Khanmigo互动,最终的作品也可能与学生在课堂上监考条件下的写作样本不一致。教师将收到初步评估,减少评分时间,从而能够为自己和学生投入更多精力。最后但同样重要的是,学生将获得更及时的反馈和支持来提高写作能力。

关于提供快速反馈的价值,如果你在投篮练习时几天或几周都不知道球是否进框,那么很难提高篮球罚球水平。这听起来很荒谬,但这正是写作练习中发生的情况。在生成式AI出现之前,学生可能需要几天或几周才能收到论文反馈。到那时,他们可能已经忘记了大部分写作内容,也没有机会改进作品。与之相比,在我们设想的场景中,学生可以从AI那里立即获得关于写作各个方面的反馈。他们将有机会更快地练习、迭代和改进。

这适用于任何类型的学生独立作业,而不仅仅是写作。我们可以看到,如果应用得当,生成式AI不仅可以解决长期存在的作弊问题,还可以为学生带来更丰富、更高效的学习体验。最重要的是,通过深思熟虑地采用这项技术,大学将更好地为学生毕业后进入的世界做好准备。

第七部分

全球课堂

世界足以满足每个人的需要,但不足以满足每个人的贪婪。

—圣雄甘地

全球课堂

我的家族来自孟加拉,现在分为印度的西孟加拉邦和孟加拉国。在成长过程中,我知道父母离开那个地区前往路易斯安那州梅泰里时留下的教育系统很糟糕,面临资源有限、教室拥挤(或没有教室)以及合格教师短缺等问题。这些因素都影响了教育质量。虽然我和妹妹有幸在美国接受教育,并从就读的公立学校中受益,但美国的教育模式并不能很好地服务所有人,特别是那些开始落后、在家中没有额外辅导或家庭支持来填补学习差距的学生。

直到我创办可汗学院(Khan Academy),我才意识到教育机会平等的问题比我想象的更严重。在世界大部分地区,有限的资源、不足的基础设施和合格教师的短缺为学习制造了巨大障碍。撒哈拉以南非洲和南亚等地区的小学完成率低得惊人,无数儿童无法上学或因贫困或冲突被迫辍学。此外,在世界大部分地区,对女孩和边缘化社区根深蒂固的歧视进一步阻碍了受教育的机会。虽然每年有数百万儿童无法上学,但女孩永远无法踏入教室的可能性是男孩的两倍。

当儿童能够上学时,情况也好不到哪里去。2004年联合国教科文组织的一项研究报告称,印度有25%的教师缺勤,只有大约一半在教学。即使教师确实来了,他们也没有接受足够的教材培训。

这些问题并不仅限于发展中国家。在美国,生活在贫困中的儿童进入幼儿园时,在发育上比同龄人落后多达18个月。这可能是由于多种因素造成的,包括无法获得高质量的学前教育和阅读材料,以及难以获得许多中产和上层阶级家庭能够提供的辅导。

与此同时,在韩国、中国、日本和印度等许多亚洲国家,家庭经常花钱让孩子参加昂贵的课后课程。这使学生能够在竞争极其激烈的环境中保持优势。这些课程费用昂贵,并对儿童的心理健康造成了巨大负担。

显然,对世界上大多数人来说,儿童的教育机会充其量是不均衡和不理想的。正如斯坦福大学的苏珊娜·洛布(Susanna Loeb)所知,优质教育是变革的强大力量,但遗憾的是,并非每个人都能获得它。“我们试图创建更公平、更有效的教育系统,但遇到了许多障碍,”她告诉我。

Loeb研究教育政策,她作为教育学教授的职业生涯一直致力于增加学生获得学习材料和个性化教学的机会。例如,美国拥有一个分散化的教育系统。在一个每个学区都自行决策的国家实施统一教育仍然是一项几乎不可能完成的任务。Loeb还指出了不同群体之间成绩差异的不断扩大,尤其是有特殊需求的学生。群体内部儿童的表现也存在不平等。最明显的是低收入儿童,或那些来自边缘化社区的儿童,他们无法像其他人一样获得同样的教育机会。他们社区的学校往往资金不足,这意味着它们为学生提供的课外活动有限,并且无法提供高等数学或高级科学等课程。当你将范围扩展到资源有限的国际地区时,这个问题会呈指数级恶化。

教育工作者已经找到了一些短期、狭窄和局部的解决方案来应对这些问题,但很少有能提供我们希望在全球范围内实现平等教育机会时所需要的那种均衡力量的方案。她说:“问题仍然在于规模化,这正是技术可以发挥作用的地方。”

要让技术真正具有变革性,它必须是公平的。它不能扩大贫富差距。它不能让任何人掉队。

这就是我创办Khan Academy(可汗学院)的原因。互联网使我们能够直接接触到世界上的每个教室、每个学生和每个家庭,而不必像传统改革努力那样应对同样的政策操作。社会投资回报的影响力要大几个数量级。例如,我们团队的运营预算相当于美国一些高中的预算,但每年能覆盖全球超过一亿名学习者,并且有潜力服务数十亿人。我们立志做到全面,涵盖从学前班到大学的所有主要学科。这使我们不仅能够提高现有教室的上限,还能为那些无法接触到世界一流学校或某些课程的孩子提高下限。我认为我们免费的在线教育资源有潜力成为全球教育安全网的一部分。

这不是理论。一位名叫Sola的年轻女性就是这样的案例,她生活在阿富汗塔利班的心脏地带,被禁止上学。幸运的是,她有互联网连接和一个支持她的家庭。Khan Academy使她能够自学从初等代数到生物学、化学、物理学和微积分的所有知识。她渴望成为美国的理论物理研究员,通过令人难以置信的决心和愿意给她机会的其他人的帮助,她现在是塔夫茨大学的量子计算研究员和出版作家。

我们团队经常听到类似的故事,尽管我们认识到Sola的经历并不典型。她能够以大多数学生无法做到的方式支持自己。但如果下一个一千万个Sola能够获得一支导师大军,确保她们保持动力和参与度,会怎样呢?

我们知道,如果一位训练有素的导师每天将孩子从课堂带出来30分钟,每周四天——Loeb将这种技术称为高剂量辅导(high-dosage tutoring)——有非常好的证据表明,无论学生在哪里,这都会对他们产生显著的激励效果。然而,我们在富裕和贫困地区都遇到了成本和可扩展性的问题。

缺乏辅导资源并不是唯一的障碍。每个学生都需要并应得到独特的关注,而很难为需要在其最近发展区(zone of proximal development)获得支持和练习的不同学生提供不同的东西,在他们已知的基础上进行构建并将其提升到下一步。

这就是我们现在工作的重点所在,因为人工智能继续在弥合全球教育鸿沟和促进所有人的平等学习机会方面发挥变革性作用。通过大语言模型应用,学生只需要一部智能手机就能访问,我们最终可能会给世界各地的学生提供世界一流教育的一些,甚至是所有主要组成部分。

Loeb说:“AI技术使不同经验水平的教育工作者拥有一套强大的工具集,可以创造一个有利于学习的环境。技术增强了与成年人关系所带来的动力。我们迄今为止掌握的所有证据都表明,学生需要个性化的接触来保持动力,需要一个他们信任的成年人为他们提供学习材料并庆祝成功,或在他们遇到困难时支持他们。”

AI在教育中的经济学

在世界任何地方,像样的教育都是昂贵的。在美国,路易斯安那州每年在每个学生身上的花费大约为10,000美元;纽约州则花费40,000美元。在印度,政府学校每年在每个学生身上的花费可能在500美元到1,200美元之间。尽管资源范围不同,但基本模式是相同的。学生们按部就班地学习课程,常常感到迷茫或无聊。如果学生没有跟上对基础概念的理解,课程仍会继续推进。针对个性化学习或弥补知识差距的支持有限,更不用说一对一辅导了。尽管事实上许多教室里的学生准备程度差异很大——有些学生可能超前,而另一些可能落后两到三个年级。

COVID-19疫情使情况变得更糟。在2020年学校停课期间,有学龄儿童的黑人和西班牙裔家庭获得电脑和互联网的机会比白人家庭少1.4倍,超过五分之二的低收入家庭只能有限地使用这些资源。疫情前的糟糕状况变得彻底严峻。考虑到2020年之前,底特律只有6%的八年级学生达到年级水平;疫情之后,这一比例下降到3%。2019年,美国普通教室里的学生能力水平跨越三个年级。疫情之后,这一差距扩大到六个年级。换句话说,在同一个有30名学生的教室里,教师必须设法支持落后四到五个年级的学习者,同时不让那些可能已经准备好继续前进的学生感到无聊。

为了解决这个问题,美国联邦政府为中小学紧急救济基金提供了860亿美元资金,相当于每个美国K-12学生2,000美元。这笔钱中的很大一部分流向了真人辅导项目,这基于数十年的研究表明辅导可以成为帮助孩子的有效干预措施。不幸的是,几年后,大部分资金都花光了,却收效甚微。事后看来,大多数专家认为这是因为辅导与课堂上正在进行的内容脱节,而且许多学生发现在后勤上很难获得这些辅导。学生们可能还面临首先去参加辅导所带来的污名化问题。

像Khanmigo这样的平台就是为了弥合这一差距——提供个性化、易获得和高质量的教育。即使在Khanmigo之前,效果研究就已表明,在疫情期间每周仅使用Khan Academy 30到60分钟的教室,不仅避免了COVID滑坡,而且比疫情前的标准高出20%到40%。而这并不需要每个学生花费2,000美元。它是免费的。

现在,大语言模型(large language model)平台在这些成果的基础上提供更丰富的支持。AI导师可以在学生需要时随时提供帮助,包括在课堂上进行现有学业工作时。它可以准确地告知教师和家长学生正在学习什么以及他们在哪里需要更多帮助。落后较多的学生不需要因为寻求帮助而感到羞愧或尴尬,因为AI不是真人。好奇的学生可以提问,而不会觉得自己在浪费别人的时间。

提供这样的规模化支持非常具有成本效益且易于获得,但它并非免费。即使在考虑生成式AI之前,我们作为非营利组织的年度预算也超过7,000万美元。这是一个可观的数字,但它也相当于美国许多地区一所大型高中的预算——而Khan Academy每年服务超过1亿学习者。我们每年需要从慈善家那里筹集这笔资金的很大一部分,以保持内容和软件对用户免费。这些资源对于内容开发、产品开发和服务器成本等方面都是必需的。

生成式AI在支付工程师、设计师、产品经理和内容开发者薪水以迭代改进像Khanmigo这样的平台的成本之外,增加了新的费用层。这是因为像GPT-4这样的大语言模型的计算成本是巨大的。目前,我们对Khanmigo平均使用的计算成本的最佳估计是每个用户每月5到15美元。假设我们将拥有数百万用户——这将花费数千万美元的计算成本——我们不太可能仅从慈善事业筹集足够的资金来免费提供服务。虽然比真人辅导便宜得多(真人辅导很容易每小时花费30美元),但该平台确实变得不如我们的免费资源那么容易获得,因为我们需要向学区收费。

也就是说,通过慈善事业和当地学区的资助,这些学区的学生费用目前是免费的,并将继续保持免费。然而,这仍然没有解决较贫穷国家的可及性问题,在那里每年30美元可能占教育总成本的很大一部分。好消息是,计算成本将变得更便宜,我们也将更好地提高使用效率。这两个趋势应该有助于在未来几年将成本降低十倍。如果我们能将成本降低一百倍,这应该在未来五到十年内实现,它将变得与今天使用非生成式网络应用程序的成本相当。

那时,唯一真正的访问限制与我们在传统可汗学院面临的问题相同:学生需要访问互联网和设备,而这些并非所有人都能可靠获得。尽管如此,我仍然抱有希望,随着设备变得更便宜,以及像SpaceX的Starlink这样的提供商使用卫星群提供低成本宽带,几乎普及的访问将成为现实。

在线学习早期的一个主要访问障碍是语言。现在,像GPT-4这样的大型语言模型可以用所有主要语言运行。在这里,一个用英语学习应用题的英语学习者可以用他或她的母语获得支持,甚至可以用西班牙式英语这样的混合语言。大型语言模型的对话能力使其感觉像是实时互动,培养了一种联系感。更重要的是,它可以用来完成核心平台的大部分翻译工作。

斯坦福大学的苏珊娜·洛布(Susanna Loeb)表示,正是这种联系感和支持感,使得找到一种低成本、多语言且可扩展的解决方案来为全球提供高质量的教育访问变得至关重要。“我对我们现在能做的事情感到乐观和兴奋。在资源和教学法访问一直受到限制的地方,这项技术可能具有变革性。”

第八部分

AI、评估与招生

并非所有可以被计算的东西都重要,也并非所有重要的东西都可以被计算。

—威廉·布鲁斯·卡梅伦(William Bruce Cameron)

评价就是创造:听吧,你们这些创造者!评价本身就是我们所评价的一切中最有价值的宝藏。只有通过评价,价值才存在:没有评价,存在的果核将是空心的。听吧,你们这些创造者!

—弗里德里希·尼采(Friedrich Nietzsche)

K-12评估的未来

在美国,批评标准化测试已经成为一种时尚。每个州都在每个学年结束时进行”终结性”评估,以衡量学生和学校的表现。人们经常批评这些测试过于狭隘——它们主要使用针对生活中真正重要内容的一个子集的多项选择题。这可能会给教育工作者带来压力,使他们在课堂上也同样缩小关注范围。

然而,这还不是全部。其他人认为这些测试占用了学习时间,而且实际上不具有可操作性。当成绩在暑假或下一学年开始时出来时,孩子们已经和新老师一起进入了新年级。此外,学生几乎没有动力去关心在一个与他们成绩无关的测试中展示他们最好的表现。另外,表现中的人口统计学差异可能导致对某些群体或学校存在偏见的指控。随着教育变得更加政治化,这些测试实际评估内容的透明度不足使人们持怀疑态度。

让我们退一步。然而,当人们对标准化测试提出反对意见时,我喜欢质疑他们不喜欢的部分,以及他们是否把孩子和洗澡水一起倒掉了。如果他们完全反对评估,我会问他们如果不衡量,我们如何在任何事情上变得更好。如果我们要衡量,标准化这种衡量可以说更公平,因为它对每个人应用相同的标准(相对于”非标准化”评估)。如果问题在于这些测试衡量内容的狭隘性,答案难道不应该是扩大评估范围使其更丰富,而不是完全放弃它们吗?同样,如果批评围绕可操作性或透明度,我们难道不能让测试更具可操作性和透明度吗?

最重要的是,即使标准化测试可能不完美,取消它们真的会让事情变得更公平还是更不公平?如果一所为代表性不足的群体服务的学校不知道他们的学生可能在哪里以及如何落后,他们如何开始解决问题?对于教育工作者、学生和家庭来说,不知道他们的差距是否更好?最终,无论如何,这些缺陷都会浮出水面。这可能会在多年后,在大学或职场中发生,那时在落后多年之后要修复就困难得多了。

我宁愿思考如何改进标准化测试,而不是试图完全取消它们。即使在生成式AI之前,解决方案就已经存在了。让我们考虑这样一个批评:教师对标准化测试结果没有多少可做的。好吧,如果评估可以输入到个性化练习的软件平台中——例如,让学生根据标准化测试数据解决不同的薄弱点——这些信息就变得可操作了。随着时间的推移,个性化练习软件会理解学生之前的评估,并为该学生提供更有针对性的建议。

事实上,可汗学院多年来一直在某些标准化测试中这样做。也就是说,我们使用标准化测试信息来更好地在课堂上进行差异化练习,从而提高学生成绩。在一项针对超过三十万名学生的研究中,我们使用标准化测试分数来指导学生在我们平台上的个性化练习,“在2021-22学年期间,按照每周30分钟以上的推荐练习量进行学习的学生,其成长幅度超出预期26%至38%,具体取决于年级。”

在学生学习过程中进行持续的标准化评估也避免了占用宝贵的教学时间。我们平台上的每一道练习题都是标准化的,我们拥有数百万个关于不同年级和背景的学生在这些题目上表现的数据点。学生可以定期在我们的平台上练习技能,而不是每年只参加一两次传统的州总结性测试。然后,教育工作者可以使用生成的数据以标准化的方式衡量学生的学习情况。这能更准确、更定期地了解学生的表现。这些数据随后通过推动学生进一步学习的建议而变得可操作。这种持续评估以更高的频率提供更高质量的数据点。传统标准化测试可能每年一两次覆盖五十到一百道题,而持续评估可以每周收集同样多的信息,甚至不会让学生感觉这是一次独立的评估。这种方法还解决了学生动机的问题:如果你的日常练习也在幕后以标准化的方式评估你,因为这项工作会影响你的课堂进度和成绩,你会更加在意。

围绕评估和课堂内发生的事情产生的许多政治焦虑,是因为家长和政客等外部利益相关者无法直接观察学生的体验。相反,他们依赖二手和三手信息,这些信息可能并不完全准确,或者他们无法理解高层标准如何在测试或课堂中具体体现。

传统标准化评估缺乏透明度和灵活性,这源于创建评估项目的成本以及它们必须保密的事实;如果其中任何一项泄露,整个评估都可能失效。另一方面,如果你有易于访问的在线平台,可以从大量题库中进行自适应评估——比如数十万道题——你可以让更多利益相关者随时尝试评估而不会破坏它。这是因为自适应评估会根据学生在之前题目上的表现,为每个学生提供不同的问题序列。两个学生不太可能看到相同的题目组合。

生成式AI(Generative AI)有潜力在所有这些方面提供帮助。大语言模型(Large Language Models)还不足以完全独立制作高质量的评估项目,但它们可以帮助人类题目编写者/审核者变得更有生产力。最终,这将使我们能够用相同的资源生产更多的题目,从而实现新一轮更加透明和易于访问的评估。

这仍然留下了如何深化和拓宽标准化评估可以衡量的技能的问题。虽然选择题或数字输入题在评估某些类型的技能时可以发挥很大作用,但它们无法真正捕捉你写作、处理问题或创造性思考的能力。从历史上看,广泛评估这些更细微的任务成本过高。要评估即使是基本的开放式问题,你也需要专家人工审核员使用复杂的评分标准和系统来确保一致性。类似于博士论文答辩或工作面试的更丰富的评估在历史上无法大规模进行。

这种情况即将改变。最新一代的大语言模型有潜力让我们能够经济地、普遍地进行这种丰富的评估。

以阅读理解为例:今天,学生阅读一段文章,然后根据它回答几个选择题。这些问题可能会询问作者的意图之类的内容,然后提供四个选项。在未来几年,我们将越来越多地看到评估使用生成式AI来了解学生对他们的观点或作者意图的看法,而无需多项选择。它会要求学生只是写出或说出他们的想法,AI将能够以一致的方式评估该回答。更好的是,它将能够与学生就他们为什么这样想以及他们所依据的证据进行对话。整个评估将类似于与一位体贴、富有同理心且有趣的导师进行流畅、广泛的对话。其中一部分可能涉及角色扮演或尝试解决模拟问题。它甚至不一定要与学习分开。帮助你的同一个AI导师也会积累关于你知道什么和不知道什么的证据。

这超越了语言和阅读理解。在数学方面,AI可以要求学生解释他们的推理或发展证明。在科学方面,它可能评估学生设计实验或批判研究论文的能力,这可以说是成为科学家的两个最有力的要素。AI驱动的模拟可以评估学生解决问题的能力。随着AI获得越来越强的视觉能力,它将能够批评和评估视觉作品、图片或演示视频。

当然,使用AI进行评估可能会让人们有理由感到担忧。如果AI存在不易察觉的偏见怎么办?如果它出错了怎么办?我试图将这种假设性问题与现状进行比较。目前的评估是由深思熟虑但易犯错的人类编写的,他们有自己的偏见。我们已经知道,不利用AI,我们就会将自己限制在一种狭窄得多的评估类型中,这种评估可以说放大了一种偏见:优先考虑易于衡量的技能,而非更难衡量但可能更重要的技能。从历史上看,当我们能够进行更丰富的评估时,比如博士论文口头答辩或求职面试,它们往往不一致,而且比任何现有的标准化考试都充满更多偏见。生成式AI使我们能够兼得两全其美:标准化和规模化的同时,保持丰富性和细微差别。由于其潜在的可访问性,利益相关者将更容易亲自尝试和审查它。

我并不是说我们应该盲目假设任何AI评估都会是好的。事实上,我担心很多人会创建一些非常糟糕的评估,充满偏见。然而,我也相信,通过适当的谨慎、透明度和防护措施,我们可以降低风险,开发出比我们今天拥有的更丰富、更准确、更公平的评估。这将对整个教育系统产生积极影响,重新开启对优质教育构成要素的认知视野。通过衡量长期以来被认为无法衡量的技能,如沟通、创造力和好奇心,它自然会促使系统更加关注培养完整的人。

AI与大学招生

大学招生中考虑的经典要素是成绩、标准化考试、课外活动、论文和推荐信。AI将改变这些因素中的大部分(如果不是全部)的重视程度、发展方式和评估方式。

我已经论证了生成式AI将改变课堂作业和评分;学生将能够完成更丰富的作业,教师将获得更多评分支持。我还讨论了标准化评估可能如何变化。评估将更深入、更持续,并且与学习难以区分。随着时间的推移,SAT和ACT等标准化考试要么会朝这个方向发展,要么新的评估将进入这个领域以利用这个机会。

除了课外活动,其余的要素——论文和推荐信——都涉及写作。这是大型语言模型引入一些非常重大的伦理问题的最明显之处。教师和辅导员可能会使用生成式AI来撰写推荐信。学生很可能会使用大型语言模型来生成听起来令人印象深刻的论文,从而误导性地展示他们的实际写作能力或创造力。这给招生官准确评估申请人作品的有效性带来了挑战。

然而,顶尖大学的招生主管告诉我,生成式AI的出现只是让人们关注到他们在大型语言模型出现之前就已经知道的不平等现象。以”名校风暴”(Varsity Blues)丑闻为例。在这个案例中,富有的名人父母支付数十万美元聘请一名不道德的大学招生顾问,他不仅撰写申请论文,甚至完全捏造课外活动,包括照片。虽然这是一个极端的例子,但围绕大学招生顾问存在着一个完整的产业,只有富裕家庭才能负担得起。在我居住的硅谷,顶级顾问的收费标准大约是每小时四百美元。这可能总计达到数万美元来帮助一名学生完成大学招生周期。这些顾问做什么?更道德的顾问会就如何处理课外活动和论文主题向学生提供建议,帮助家庭思考好的大学选择,并对学生的早期论文草稿提供深思熟虑的反馈。在更不道德的一端,他们可能对学生的论文提供如此多的编辑,以至于他们实际上是在为学生代写。无论哪种方式,这些富裕学生都得到了重要的帮助。即使他们不聘请顾问,这些家庭中的许多人对复杂的大学招生流程也有很多内部知识,并用它来给他们的孩子一个优势。

像ChatGPT这样的工具显然更容易被广大人群所使用,这些人永远无法负担高价的大学招生顾问。就像这些顾问一样,生成式AI可以用于道德和不道德的目的,以及介于两者之间的一切。它现在为每个人打开了在道德灰色地带游戏的大门,而这曾经只是富人的领域。

当涉及推荐信时,可能会发生类似的情况。高价招生顾问不能撰写推荐信,但为更富裕学生服务的辅导员和教师往往对如何给他们的学生最好的大学录取机会有更多的了解。更富裕的学校也往往有更小的班级规模,教师和辅导员可以更好地了解他们的学生,并有更多时间花在每个学生的推荐信上。现在,撰写推荐信的人可以与生成式AI工具合作,更好地表达申请人的优势。

从积极的方面来看,生成式AI可以帮助缩小贫富差距。现在每个人——而不仅仅是富裕家庭——都需要决定多少帮助算是过度帮助。从消极的方面来看,缺乏道德约束的学生可能会突破界限,使更有道德的学生处于不利地位。与此同时,招生主任需要思考撰写申请文书这整个过程是否还能为招生提供可靠的评判依据。

要解决这个问题,有必要质疑为什么文书和推荐信会成为招生流程的一部分。在大多数国家,进入高度选拔性大学是一个相当客观的过程。在印度,进入超高选拔性的印度理工学院(IITs)完全基于联合入学考试(JEE,Joint Entrance Exam)。印度理工学院录取考试成绩最高的学生,同时为一些代表性不足的群体保留配额。不仅分数最高的学生可以优先选择印度理工学院的校区,他们还可以优先选择专业。在印度,这是为了避免经常困扰该国其他机构的腐败现象的刻意尝试。像文书、推荐信或课外活动这类带有主观性的内容完全不在考虑范围内。

另一方面,美国高度选拔性大学的招生主任会谈论诸如”建设一个多元化未来领导者社区”这样主观的事情。是的,他们在一定程度上会参考考试分数和成绩,但许多这些机构可以用拥有完美考试分数和GPA的学生多次填满他们的新生班级。换句话说,在一些顶尖学校,一半的申请者将拥有表明他们如果被录取可以在学业上取得成功的成绩和考试分数,然而大学只能录取其中的3%到6%。这导致了一个高度主观的过程,试图通过文书、课外活动和推荐信来评估学生的性格和背景故事。学生是否克服了障碍?他们看起来是否善于合作?他们有朝一日是否可能对世界产生影响?这些都是针对十七八岁年轻人的重大而深刻的问题。我认为许多人对招生官员能否基于一些受到重大外部影响的文书和推荐信来判断这些品质持怀疑态度。

课外活动可以说是学生领导力或社区参与承诺的更具体展示,但这也很难判断。学生是独立赢得国际科学博览会的吗?他们的实验研究心脏病,而他们的母亲是一位学术心脏病学家,这是巧合吗?那些志愿工作真的有实质内容,还是只是听起来令人印象深刻?

这一切都导致了美国竞争性大学招生中的随机性,任何参与过这一过程的人都清楚这一点。许多最聪明、最善于合作、最从容的人被拒绝的次数远超预期。通常的假设是他们没有得到足够好的推荐信或没有撰写独特的文书来充分展示自己。另一方面,访问任何高度选拔性的大学,你都会遇到许多优秀的年轻人。你也可能会遇到许多在学业上挣扎或似乎不具备谦逊、合作或领导力等特质的学生。大多数人认为这些学生特别擅长为自己构建书面叙述和利用系统——或者他们的家庭擅长雇人为他们做这些事。

但如果我们能有更标准化的方式来评估”软技能(soft skills)“,如领导力、合作能力、同理心和社区服务,会怎么样呢?更好的是,如果这与确保深厚的学术能力相结合呢?事实证明,这在AI之前就存在了,但AI将把事情提升到另一个层次。

2020年,我推出了Schoolhouse.world,通过Zoom为任何人提供免费的实时辅导。考虑到有多少学生因为COVID-19疫情而落后,这比以往任何时候都更需要。我们通过招募经过审核的志愿者来进行辅导,从而能够保持免费。审核过程的第一步是确保志愿者掌握了他们将要辅导的材料。他们在参加相应的评估时,会有一个单独的工具记录他们的面部和屏幕。志愿者必须大声解释他们的推理过程。如果他们在评估中获得至少90%的分数,视频将提交给同行评审。假设一切看起来都很好,他们就可以开始他们的辅导之旅,这仍然涉及对辅导本身技巧的更多审核和培训。这是一种严格的方法,确保辅导教师的质量。在每次辅导课程后,学生对志愿者进行评分。志愿者有一个成绩单页面,总结了他们获得认证的所有科目、他们主持的课程数量、他们的平均评分以及他们想要突出的来自社区的任何其他定性反馈。

芝加哥大学招生主任Jim Nondorf在不久后联系了我,询问他们是否可以将Schoolhouse.world的导师成绩单用于大学招生。他的理由是,任何在微积分等科目上获得高评级的高中生,显然对该学科掌握得很好,特别是考虑到我们严格的审查流程。更重要的是,如果他们进行了许多辅导课程并获得高评级,他们也很可能具有强大的领导力、沟通能力和同理心技能,更不用说他们花费数小时免费辅导他人的奉献精神。我们认为这是个好主意,那年秋天,芝加哥大学将Schoolhouse.world成绩单作为其申请流程的可选部分。到下一个招生周期,麻省理工学院也加入了进来。三年后,名单已增长到18所大学,包括耶鲁、布朗、加州理工、佐治亚理工和哥伦比亚大学,每年还在增加。

他们都认可Schoolhouse.world成绩单的原因与Jim Nondorf相同:它是一种动态且标准化的方式来衡量学科能力以及沟通、同理心、社区服务和领导力。与过去不同,当学生说他们定期进行社区服务时,招生官员没有太多依据,而在Schoolhouse成绩单上,他们服务的程度和质量以标准化的方式量化。在数百次辅导课程中假装成为一名高质量的导师几乎是不可能的。因此,我在与这些学校的早期对话中了解到,提交这些成绩单的学生通常比更广泛的申请者群体有更高的录取率。所有这一切的一个附带好处是,它还为有抱负的高中生提供了强大的激励,让他们成为导师并帮助他人。

AI如何发挥作用?首先,Schoolhouse.world已经在使用AI为志愿导师提供辅导课程反馈。AI可以通过记录”观察”Zoom会议,并为导师提供改进建议。在不久的将来,它将为导师提供实时提示,告诉他们如何更好地服务学生。最终,它将能够在Schoolhouse.world成绩单上提供对导师风格和能力的叙述性评估,为招生官员提供另一个丰富的参考信息。最重要的是,Schoolhouse.world的例子开始指出我们如何利用AI彻底重新构想招生流程。

除了文书或推荐信之外,如果AI能够与学生、指导顾问和教师进行广泛的文本或语音面试会怎样?像我们这样的协议可以确保受访者独自一人,没有人向他们提供答案。最终,AI可能还会利用视频,这对人来说很难作弊。面试AI将了解学生的成绩、SAT/ACT分数和课外活动,然后使用这些信息提供准确的推荐。学生仍然可以提交文书和推荐信,但AI可以深入挖掘受访者,确保学生真正了解他们所说的内容。

招生面试通常由居住在学生同一地区的校友进行,并非对所有潜在学生统一进行,而且进行的面试彼此之间极不一致。它们对于招生官员筛选出有明显问题的申请者很有用,但对于比较在纸面上看起来都很优秀的大多数学生来说并不是特别有用。AI使这一过程变得更具可扩展性、一致性和可审计性。在这种情况下,AI可以一致地总结其互动内容,并根据招生办公室创建的评分标准在多个维度上对其进行评级。

甚至有可能AI代理本身可以为学生担保,就像一位了解学生的老师一样。这样想:像Khanmigo这样的AI平台已经与你合作了一段时间。无论你使用它一个月还是多年的学习时间,它都了解你的优势和热情,并能合理地呈现出你是谁的动态画面。当你准备申请大学时,AI可以为你写一封推荐信。这封信对于使用该平台的每个学生都是标准化的,只是根据它与每个学习者的经历而有不同的记忆。想象一下,如果全国每个人都有同一位老师。这位老师实际上会是一个相当好的仲裁者。如果我们想把这推向极端——目前还不清楚我们是否要这样做——AI推荐者可以与招生方的AI面试官交谈,看看是否匹配。

我知道这引发了对两个方向偏见的担忧。有些偏见是你想要的。你希望这个过程偏向那些有思想、善于合作的年轻人,他们可能成为明天谦逊的未来领导者。当然,你不希望它在性别、种族、宗教或地域方面存在偏见。百分之百无偏见的解决方案可能是不可能的,但这不应该成为障碍。相反,任何AI系统都需要明显优于现状,而现状通常涉及各种偏见。这不是假设。在2018年最高法院的一个案件中,明确确定了哈佛招生官员始终对亚裔美国申请者的人格特质评分较低,经常武断地推翻面对面面试官的观察结果。哈佛的招生流程在五个类别中对申请者进行评分——“学术”、“课外活动”、“体育”、“个人”和”整体”——将学生从1到6排名,1是最好的。白人申请者获得的个人评分高于亚裔美国人,21.3%的白人申请者获得1或2分,而亚裔美国人只有17.6%。校友面试官给亚裔美国人的个人评分与白人申请者相当,但招生办公室给他们的分数是所有种族群体中最差的。

这些数据的曝光需要一场重大诉讼。大多数时候,这个非常不透明的过程中嵌入的偏见都被很好地隐藏了。基于AI的面试官和评估者的优势在于它们可以被审计。你可以用具有不同人口统计特征但资格相同的申请者来测试它们,并公布结果以确保跨种族、性别或背景的一致性。

AI不是在大学招生中引入新问题,而是迫使我们认识到现有的缺陷,同时提供积极改变的可能性。如果使用得当,也许带着一点有教养的勇气,它可能使我们能够走向一个更公平、更透明的世界。

第九部分

工作与未来

那些种树的人,明知自己永远不会在树荫下乘凉,至少已经开始理解生命的意义。

——罗宾德拉纳特·泰戈尔

像专业人士一样学习规则,这样你就可以像艺术家一样打破它们。

——巴勃罗·毕加索

AI世界中的就业

许多人担心AI将导致大规模裁员,转而使用能够比人类更快、更便宜、更高效完成工作的新型AI工具。一些公司已经暂停招聘他们认为人工智能在未来几年将取代的职位。2023年,IBM宣布在五年内暂停或放缓后台办公室招聘30%,这些工作最终可能由AI完成。IBM的表态表明,未来的工作将以不同的方式展开,后台或中台办公室的工作将消失,以及不面向客户的角色涉及的任务如创建预算、管理数据和整理记录等。从这些迹象来看,我们可以看到这可能的走向。

在一个充满AI的市场中,工作会是什么样子?我们如何为学习者做好准备?自从ChatGPT出现以来,许多知情人士一直在说,你不会被AI取代,但你可能会被其他使用AI的人取代。

使用AI的作家和文案人员的生产力可能会提高三到五倍。使用AI副驾驶(copilot)调试和填充大部分代码的软件工程师也是如此。平面设计师将能够通过调整一系列基于文本的提示词(prompt)来制作徽标的五十种变体。鉴于生产力的提高,我们还需要那么多文案、工程师和平面设计师吗?

我怀疑这将是一个混合局面。因为我们正处于这样一个技术拐点,使我们能够用生成式AI做更多的事情,对工程师的需求,特别是那些生产力提高五到十倍的工程师,只会上升。我们过去见过这种情况。在2000年代初期,加速的全球化使得许多软件工程工作可以外包到印度等地。作为当时的年轻工程师,我认为我必须去商学院并转向金融职业,以避免被国外的低成本劳动力扰乱。

我错了。从那时起,软件工程师的薪水增长速度远远快于通货膨胀率。这是因为智能手机和互联网的兴起创造了一个有利于新的基于软件的解决方案的环境。生成式AI正在为进一步创新创造一个更成熟的环境。从我的角度来看,由于生成式AI,几乎每个行业都有无穷无尽的工作等待能够创造性地应用这些技术来解决新问题的工程师。

另一方面,我对那些目前撰写有关每日股市波动的新闻摘要的人并不那么乐观。如果还没有发生的话,这些类型的任务很快就会由生成式AI完成。那些能够生存下来的文案和技术作家将是那些最大程度依靠AI来提高生产力的人。其他90%的人将不得不找别的事情做。

好消息是,生成式人工智能将需要新型工作。目前最热门的工作之一是提示词撰写者或提示工程师(prompt engineer)。两年前,没有人知道这些工作是什么。事实证明,思想开放且富有创造力的文案撰写者可以很好地转型到其中一些角色。生成式人工智能还让我们设想围绕安全、安保和反偏见的全新机会。我认为,随着更多组织努力应用这项技术,新的机会将继续涌现。

就像教师使用人工智能来处理更机械或平凡的职责一样,从人力资源到管理层的岗位将开始让人工智能来撰写招聘信或会议报告。表面上看,这听起来不错且有帮助,但我也不禁考虑更大的后果。

这不仅仅关乎个人工作。人工智能引发的自然选择也将在企业层面发生。如果我们有两家公司——一家规模较小、更精简、自动化程度更高,另一家规模更大、速度更慢、更依赖人力——随着时间的推移,规模较小的公司将能够以更低的价格提供同等或更好的产品,并开始从更大的公司获得更多市场份额,这最终导致净工作岗位流失。这是我们在许多行业中看到的常见趋势,随着自动化和技术的快速发展,这种趋势将继续下去。一方面,较小的公司可以更高效地提供商品或服务,并且成本更低,这对消费者来说可能是有益的。另一方面,失业对那些直接受影响的人来说可能是困难的。

这已经开始以戏剧性的方式展开。2006年,教育科技公司Chegg, Inc.推出了一项服务,为近三百万客户提供家庭作业、数字和实体教科书租赁以及在线辅导方面的帮助。就在ChatGPT推出前两年半,《福布斯》称该公司为美国最有价值的教育科技企业。一旦ChatGPT出现,Chegg转型并开始将人工智能整合到其平台中,但它无法与ChatGPT匹敌。当Chegg在2023年5月公布季度收益时,首席执行官承认该服务一直在努力跟上OpenAI的产品,因为太多学生在使用大型语言模型来帮助他们完成家庭作业。该公司承认,由于ChatGPT的影响,它不再知道当年能赚多少钱。这一爆炸性声明导致Chegg的股价暴跌近50%。自生成式人工智能出现以来,许多人担心这些工具会颠覆既有企业。尽管这种恐惧曾经很遥远,但它一直是推测性的,直到它突然变得过于真实,就像这个故事一样。

这些情绪不仅仅是我的。

“它将以不同的方式影响每个行业、每个人和每份工作,”沃顿商学院的伊桑·莫利克(Ethan Mollick)说。“根据我们现有的早期研究,受人工智能影响最小的工作是屋顶施工,但我和几位屋顶工聊过,他们说,‘实际上,屋顶施工也会改变,因为我们现在可以在人工智能的帮助下完成所有提案。’”

当你开发出能够理解语言、识别模式和解决问题的人工智能,以及能够诊断疾病、进行股市交易、创作音乐、处理诉讼、理解情感、分析遗传密码、处理保险索赔、进行工程设计和撰写文章的人工智能时,不难相信更多的变化即将到来。成功的策略不是抵制,而是适应。

如何让孩子为人工智能时代的职场做好准备

在我们推出Khanmigo前几个月,我在斯坦福大学计算机科学系与一位名叫克里斯·皮奇(Chris Piech)的教授一起演讲。他告诉我一个关于他正在指导的一位年轻斯坦福学生的故事,她来到他的办公室。“她非常沮丧,说她刚学会如何编程,现在人工智能就能做得更好,”皮奇说。“她觉得自己已经被边缘化了。”

在过去二十年里,软件工程和数据科学一直是大学毕业生最热门的两份工作。如果他们想成为未来的一部分,我们鼓励他们进入这些职业。我们倡导学生学习编程以成为数字经济的一部分。但我们现在知道的是,生成式人工智能可以很好地做到这一点。

这造成了紧张局面。我们害怕允许孩子在学校使用人工智能工具以防止作弊,尽管他们未来的工作需要与这些相同工具密切共生。比尔·盖茨(Bill Gates)所说的另一个”令人困惑的悖论”加剧了这一点。我们现在有一个工具可以让那些想学习的人更容易学习,但可悲的是,在某些情况下,它让人们怀疑他们是否需要这些技能。为什么学生要学习人工智能可以做得更好的技能?

“那你怎么告诉她的?”我问皮奇。

“我说我相信编程能力将非常重要。我告诉她,如果她想创建任何类型的主要解决方案,包括使用生成式人工智能的解决方案,即使生成式人工智能可以编写代码片段,你真的需要知道这些片段如何组合在一起。”

换句话说,他说,学习与生成式人工智能协同工作将很重要。为了构建任何东西,你仍然需要知道这些部分如何组合在一起以及它们实际上如何工作。

了解并使用 AI 的初级员工将比不使用 AI 的员工高效得多。我十四岁的儿子热爱编程,梦想有一天能制作电子游戏。我认为他很有希望实现这个目标,但我也鼓励他使用生成式 AI 来完成比他单独工作时更有雄心的项目。他将能够制作出在生成式 AI 出现之前需要六名专业工程师团队才能完成的游戏。

众所周知,生成式 AI 能够以真正的能力进行写作。但这并不意味着人们不应该学习如何写作。如果我的一个孩子来找我说他们想成为编剧,我会告诉他们要真正擅长编写剧本。然后我会鼓励他们使用生成式 AI 来承担越来越有企图心的项目。你需要精通一门技艺才能知道高质量是什么样子。更重要的是,一个对故事和电影有深刻理解的人将不再需要止步于编剧阶段。编剧实际上可以在生成式 AI 的帮助下制作电影。这项技术已经可以制作音乐和视频,甚至可以编辑原始素材。一部过去需要一亿美元和几年时间制作的电影,很可能很快就能由几个电影学生用少得多的预算完成。我们不知道这些系统会变得多好,但即使是当前这一代的 AI 已经开始在电影行业以及许多其他行业造成这种颠覆。

沃顿商学院关于 AI 提高生产力的早期对照研究显示,在许多高级白领分析任务上有 30% 到 80% 的性能提升。这包括更有力、更简洁的写作、分析、咨询和编程。

“如果你想在这些领域工作,AI 现在是、将来也仍然会是你生活的一部分,”莫利克说。“你需要弄清楚能否使用 AI 让自己的生产力提高十倍——这意味着仍然需要人类参与其中。如果你想成为文字编辑、程序员,甚至是屋顶工,你都需要成为半人马,只不过不是半人半马,而是半人半大语言模型。”

为了满足这个新工作世界的需求,教育工作者将不得不明确或含蓄地继续让学生熟悉这些工具及其强大功能。生成式 AI 是所谓的通用技术(general-purpose technology),这种技术很少出现。想想蒸汽动力、计算机或互联网带来的变革。生成式 AI 可能会比以往任何一个拐点更快、更深刻地改变我们的生活。

工业革命的核心是劳动分工专业化。我们创建了装配线,工人在装配线上专门从事某些工作。这种趋势一直延续至今,复杂的组织已经发展出复杂的系统。专业化的好处将在 AI 时代继续存在。

“明天的就业市场究竟是什么样子很难预测,但技能越深入,无论是医疗咨询、科学思维还是客户支持,即使在生产力将通过 AI 得到提升的世界中,它也会有更大的价值,”比尔·盖茨告诉我。他说,不仅有更多理由让孩子们继续学习他们感兴趣的领域,而且学生需要加速学习这些技能,并尽可能好地学习它们。“入门级工作将要求人们了解如何使用大语言模型(large language model)及其提供的所有工具。你需要它们来创建从发票到商业计划的一切。工作场所将鼓励员工提出他们能做到的最好产品。你的技能水平越高,你的技能在劳动力市场中就会保留更大的价值。这是劳动力加上 AI,共同工作。”

然而,在我们正在进入的世界中,这不仅仅是专业化的问题。那些成功的人可能在一两个领域很深入,但他们还需要在广泛的领域中具备创业专业知识,以便把所有部分组合在一起。

这并不是什么新鲜事。当我创办可汗学院时,我知道如何编程,所以我能够在不需要任何资金或帮助的情况下开始原型设计。我也擅长整合已经存在的工具,并发现其他人没有看到的用途。我使用 YouTube 制作视频,使用即时通讯与我辅导的表亲交流。我是对冲基金分析师,所以即使我以前从未经营过非营利组织,我对财务和会计也有足够的了解来启动它。能够以这种方式开展项目的人作为创业者总是会有优势,但他们单独能走多远是有限的。在某个时候,他们需要筹集资金并雇用人员。正如软件和互联网促进了显著增长(我能够将可汗学院作为业余爱好扩展到十万用户),生成式 AI 将使下一代创业者走得更远。

我们正在进入一个回到工业革命前手工艺体验的世界。一小群了解工程、销售、营销、财务和设计的人将能够管理生成式 AI 大军,并将所有这些部分整合在一起。

当经济学家谈论生产要素时,他们会讨论资本、劳动力、土地以及能源等其他资源。但他们也会谈论创业精神。从经济学角度来看,创业精神实际上是一种创造力,知道如何将资源整合在一起以创造价值。那么我们如何让每个学生都成为这样的创业者呢?

第一步是不要妨碍他们。我相信所有人天生都具有高度的创造力和创业精神。不幸的是,我们为工业革命设计的教育系统无意中压制了这两种特质。孩子们学会排排坐、保持安静和记笔记。他们被灌输知识,被迫按部就班地学习。无论是在学业上还是社交上,不循规蹈矩都会受到惩罚。当学生成长为年轻人,最有能力发挥创造力成为创业者时,教育系统却用大量的机械作业困住他们,挤占了他们追求热情的所有时间。

第二步更传统一些。正如比尔·盖茨所说,未来成功的工作者将是那些拥有深度和广度技能的人。阅读、写作和算术这”三个R”比以往任何时候都更重要。除此之外,对历史、艺术、科学、法律和金融的扎实理解和欣赏能力将使一个人更加全面。幸运的是,我们现在拥有技术工具,可以确保掌握这些技能,而不必强制执行工业时代的按部就班学习。

最后,学生拥有强大的沟通、协作和共情技能比以往任何时候都更重要。传统的创业精神往往会让人联想到创办企业,但我所描述的远不止于此,还包括更个人化的愿景。这是一种能力,能够审视你工作的各个部分,看到任何需要解决的问题,知道你必须在哪里集中研究,并理解为解决问题需要落实的各个部分。要在AI世界中茁壮成长,每个人都需要成为这种类型的创业者,即使他们为别人工作。学校可以通过更多地让学生掌握主动权来实现这一点,使用AI工具更好地支持学生掌握核心技能,并为学生的自主性和创造力腾出时间。

求职者与雇主之间的匹配

1999年,为了撰写关于新千年的封面故事,《Computerworld》杂志向我征求可能在未来十到二十年内实现的预测。我很惊讶他们会问我这个刚从大学毕业、在Oracle担任新产品经理的人,因为他们采访的其他19个人都是比尔·盖茨和拉里·埃里森这样的科技巨头。主编参加了我的大学毕业典礼,当时我作为班长发言;他认为在其中加入更年轻的视角会很有趣。

无论如何,我不想浪费这个机会,提出了我认为可能实现的最大胆的想法。我谈到了一个未来,在那里我们都将拥有人工智能个人代理在”网络空间”中代表我们。这些代理将为你购买东西、促成交易,甚至在雇主和雇员(或恋爱伴侣)之间牵线搭桥。23年过去了,在很大程度上,我的预测并没有实现。AI还没有发展到必要的程度。

快进到现在,最新一代的生成式AI真正有希望让我的预测显得保守。尽管我在1999年对AI的进步持乐观态度,但我们在2020年代初开始看到的远远超出了我能想象在有生之年会发生的任何事情。除了许多其他事情之外,AI作为我们的个人代理,很快就能为我们发布、寻找、申请甚至获得工作。

传统上,对于公司的每个职位空缺,我们都要编写职位描述。今天,招聘经理必须首先花时间编写职位描述,或与HR部门的人一起创建。一旦我们发布职位,通常每个职位会收到数百份简历。然后我们让人才招聘团队筛选这些简历,这是非常繁琐的工作。因为这些筛选者实际上只能在每份简历上花几秒钟,他们的目光可能会集中在以前雇主的知名品牌、以前职位名称中的关键词或知名大学的学位等方面。我可以想象有时他们有心情深入挖掘,但有时他们没有。这还没考虑到他们带来的任何个人偏见。这个过程很可能会错过许多优秀的申请人,特别是那些没有在知名公司或学校工作过的人。

尽管如此,我们的招聘人员会筛选出一小部分候选人进行电话筛选和可能的更多面试。如果他们通过了基于招聘人员主观判断的30分钟电话筛选,候选人将接受他们所申请职能部门的4到6名团队成员的面试。由于日程安排的复杂性,这需要几天或几周的时间。这也相当昂贵:6次一小时的面试,团队成员的时薪相当于100美元,这就花费了我们600美元,甚至还没有考虑准备和汇报的时间。为了避免不一致性,我们给面试官提供了一套问题框架。然而,归根结底,面试官的偏好和心情很可能决定了对话的走向。最终,我们希望获得一个信号,表明我们找到了最佳人选,并祈祷我们做出了一个好的招聘决定。几乎所有地方的流程都类似。

这对双方来说都是一个不完美的过程。我们可能忽略了一些优秀的候选人,而且最终发出录用通知需要大量的时间和精力,尽管知道这甚至可能不是完美的匹配。除此之外,从本质上讲,这个过程并不完全一致。如果人们的个人偏见因与工作无关的因素而使某些申请人受益或受损,我也不会感到惊讶。

如果所有各方都有无限的时间和精力,招聘人员和招聘经理会与每一个对该职位感兴趣的人进行深入交谈。他们会始终如一地应用相同的标准,对每个候选人保持相同的心情和热情水平。更好的是,我们能够通过测试候选人来审查这个过程是否存在偏见。最重要的是,在理想的世界里,做出决定只需要几个小时,而不是几天或几周。

这可能看起来不现实,但现在很可能已经接近这个理想状态了。

大语言模型(Large language models)已经可以以相当明显的方式简化标准流程。招聘人员可以使用它们来帮助起草职位描述和面试问题。候选人可以使用它们来创建求职信和简历。然而,这只是冰山一角。

在未来,如果你在找工作,一个利用大语言模型的应用程序将创建一份交互式简历,与发布你所申请职位的AI进行沟通。每个求职候选人都可能自动与AI招聘人员进行丰富的对话,而不仅仅是将简历和求职信提交到一个黑洞中,这种体验可能会给每个人一个更公平的机会。

你甚至不必等待雇主的机器人与你安排时间。相反,雇主的招聘机器人可以与你的代理机器人对话。这个代理将根据你的就业历史和它与你进行的广泛访谈,学会准确地代表你。

因为它从你还是学生时就陪伴着你,而且你已经授权它访问你的整个工作和教育历史、你的技能组合、你的兴趣,甚至你制作的工作样本,它会询问你在工作中寻找什么以及你可能想探索的角色类型。它甚至可以帮助指导你思考与你的人生目标相匹配的职业和教育可能性。可以把它看作是一个增强版的人生教练(life coach),它学会向潜在雇主代表你。

从那里开始,它将通过与发布这些职位的其他AI机器人交谈,代表你寻找合适的职位。作为求职者,你的AI求职代理可以阅读所有发布的职位。如果你想转行但没有99%的雇主想要的正确经验,你的AI求职代理可以找到愿意给你机会的那1%。你的AI求职代理可能会报告说,它刚刚与一千家雇主交谈,发现其中许多真正看重你是局外人这一事实。想象一下,一个生成式人工智能(generative artificial intelligence)可以在LinkedIn上主动联系人们,并向你回复机会。

理论上,这些机器人可以相互进行无限次对话,并最终为双方找到最佳匹配的信号。最终,如果我是招聘经理,我的AI招聘助理将根据它与所有候选人的AI代理进行的模拟对话,向我提供它认为我应该与之交谈的前5到10个人。

这不仅限于筛选候选人。AI招聘助理将能够与候选人提供的推荐人接触。基于此,它可以进一步完善其推荐。

即使在与候选人的现场面试中,AI招聘助理也可以在你耳边低语好的后续问题,或提供实时反馈,以确保你尽可能公平和一致地进行面试。

求职申请和招聘流程对每个人来说都将变得更加公平、更快、资源消耗更少。每个人,或者至少他们的AI代理,都可以获得与招聘AI的面试机会。每家公司都有机会通过你的AI代理了解你。他们将浏览你的整个工作历史。我可以想象这样一个世界,传统的简历可能不再相关或有用,因为你的AI代理将更好地代表你。

值得承认的是,这可能会让一些人感到不安。事实上,围绕AI最大的担忧之一就是它在筛选简历或面试候选人时可能引入的偏见。我首先承认,创建一个完全没有偏见的系统几乎是不可能的。然而我认为,当AI能够证明比现状更少偏见、更一致时,它将是一种改进,因为现状是主观的且充满偏见。是的,我们应该严格审查任何声称能够协助招聘流程的AI系统,但我也认为,最终你将拥有这样的工具,它们不仅使流程更具包容性和效率,而且也使其偏见大大减少。

这让我们处于何处以及它将带我们去向何方:对有见识的勇气的呼吁

我有一个坦白。我曾经认为自己会成为一名AI研究员。我过去认为,现在仍然认为,智能和感知——这是两个不同的东西——是宇宙中最大的谜团。我着迷于能够构建出与我们任何人一样聪明,甚至更聪明的东西。我读过几乎所有关于这个主题的科幻书籍。我喜欢思考如何证明另一个存在是否真正有意识。毕竟,我们只能直接感知自己的感知。认为其他生物——包括我们生活中的其他人——是真正有意识的,而不仅仅是表现得像有意识一样,实际上是一种信念的飞跃。我曾经认为,理解智能的最佳方式是构建能够具备智能的机器。

当我1994年在MIT读大一时,我很幸运能够直接接触到当时几位AI巨擘。我找到Patrick Henry Winston做我的大一导师。他是MIT人工智能实验室的主任,也是当时人工智能权威教科书的作者。我选修了他的课程《人工智能导论》。我还选修了Marvin Minsky的课程《心智社会》。Minsky是Winston的导师,也是人工智能实验室的创始人。他还因”在创造、塑造、推广和推进人工智能领域的核心作用”获得了计算机科学的最高奖项——图灵奖。他的思想被认为是人工神经网络(artificial neural networks)领域的基础。他还是Stanley Kubrick制作可能是有史以来最著名的AI电影《2001太空漫游》时的AI顾问。

这些教授非常聪明、富有创造力且鼓舞人心,但我发现自己对该领域所处的状态以及它似乎发展得如此缓慢感到失望。能够玩国际象棋等游戏的最令人印象深刻的AI系统只是善于提前几步预测决策。无论这些系统变得多么熟练,没有人真正相信它们会以与我们相同的方式具有智能。人工神经网络从哲学角度来看很有吸引力,但它们在当时并不真正能够做任何真正令人惊叹的事情。在二三十年里没有任何重大的新想法。我当时不知道的是,这是后来被研究人员认为是”AI寒冬”的尾声。

所以我决定继续前进。我仍然热爱计算机科学,并认为我最终会尝试创办某种类型的科技公司。但关于智能以及由此延伸的教育问题继续吸引着我,因为它们对社会进步似乎如此根本。大三之后的那个夏天,我获得了一项奖学金,用于创建允许学生按照自己的时间和节奏学习和练习数学的软件。听起来很熟悉吧?

我开始相信人们有很多潜在的、未使用的潜力。对于每一个天生具有成为Albert Einstein或Marie Curie原材料的人来说,有多少人获得了这样做的教育和支持?如果通过更广泛、更易获得的教育,我们能够将有能力为我们所有人实现下一个重大科学、艺术或创业飞跃的人数增加十倍或一百倍,那会怎样?我们可能治愈多少更多的疾病?我们探索宇宙的速度可能有多快?

我的好奇心不仅仅是培养天才。如果每个人都能获得真正优秀的教育,我想知道,还有多少亿人可能在他们的生活中获得目标和意义?

但实际现实在背景中存在。我在单亲家庭中长大。我父母在我出生后不久就分居了,在他十四岁去世之前,我只见过他一次。他是一名儿科医生,来自孟加拉国一个著名的政治家和学者家庭,但我们从未得到任何经济支持,因为我认为他自己也勉强维持生计。当他去世时,我姐姐和我继承了一辆尼桑Sentra,它的债务比它的价值还多。我唯一能拼凑出来的叙述是,他和我母亲极不相配,因为他们是包办婚姻,而且他可能患有抑郁症。在我生命的大部分时间里,我母亲在各种便利店当收银员,赚的钱略低于贫困线。MIT在经济援助方面很慷慨,但我毕业时仍然有大约三万美元的债务。科技热潮正在升温,当我发现作为一名新的计算机科学毕业生我每年可以赚八万美元时,这大约是我母亲收入的五倍,我不能错过这个机会,于是接受了Oracle公司的工作。

我后来去了商学院,并在一家对冲基金担任分析师。我当时的未婚妻,现在的妻子,会批评我没有用我的才能和教育为人类做任何有益的事情。不过,我发现投资在智力上很有吸引力。它让我能够研究世界如何运作,以及市场的动物精神(animal spirits)。我也需要钱。我还有商学院的债务要还。我也知道我将要支持我的母亲和其他家庭成员,而且我相当坚定地不想延续我成长过程中的经济不安全感。坦白说,在这方面我仍然比我的大多数朋友更缺乏安全感。我也会告诉人们,我只会做这件事直到我实现财务独立,这样我就可以按照自己的想法开办一所学校。我有一些想法,有朝一日成为一所学校的邓布利多(Dumbledore),这所学校专注于把学生放在中心位置,并给他们更多的时间和空间来探索他们的热情。

就在那时,2004年,我婚礼后有来自新奥尔良的家人来波士顿看我。在与我阿姨的交谈中,得知我十二岁的表妹纳迪娅(Nadia)在数学方面遇到困难,我提出远程辅导她。这导致了可汗学院(Khan Academy)的诞生,其本质一直是试图将我对纳迪娅所做的那种个性化学习扩展到数亿学习者,跨越学科、年级和地域。

这些年来,许多人问我为什么将可汗学院设立为非营利组织。毕竟,我之前的职业生涯是非常营利性的,而且我住在硅谷中心,在那里可扩展的技术驱动解决方案可以价值不菲。许多人怀疑非营利组织是否能与营利性公司竞争。然而,有两个观念我无法忘怀。首先,我倾向于相信市场力量,但有几个领域——即教育和医疗保健——市场力量的结果并不总是与我们的价值观一致。教育和医疗保健是两个领域,我们的共同价值观告诉我们,理想情况下,家庭资源不应该成为获得最佳机会的限制因素。我们大多数人相信,每个头脑和生命都应该发挥其全部潜力。

第二个观念更宏大,甚至可以说是彻底的妄想。我最喜欢的系列书籍之一是艾萨克·阿西莫夫(Isaac Asimov)的《基地》系列。它发生在未来数万年后,那时人类已经殖民了银河系,统一在一个帝国之下。在那个帝国中,一位名叫哈里·谢顿(Hari Seldon)的学者发展了一个名为心理史学(psychohistory)的新领域——历史、经济学和统计学的某种结合——可以概率性地预测大规模的历史趋势。这门科学告诉他,银河帝国将在接下来的几百年内进入一个一万年的黑暗时代。这将是一万年的战争、饥荒和知识丧失。他的计算表明,没有什么可以阻止即将到来的黑暗时代,但它可以被缩短。所以他在银河系边缘建立了一个基地来保存知识和技术,然后可以用来将即将到来的混乱缩短到”仅仅”一千年。这个系列书籍主要关注接下来几百年实际如何发展。

当我在中学第一次读《基地》系列时,我发现沿着这些时间尺度思考很鼓舞人心。这也是我第一次真正认识到,文明的力量不在于其物理规模、权力和财富。这些只是真正力量所在的副产品:一个社会的文化、专业知识(know-how)和心态。

快进到可汗学院开始的时候,我意识到我们社会中很少有人在几年或几十年以上的尺度上思考,更不用说数百年或数千年了。除此之外,互联网显然是我们时代的变革性技术,但没有真正的机构用它来建立。我开始想知道可汗学院是否可能成为其中的第一个;某种可以帮助数十亿人在未来数百年接受教育的东西。它就像哈里·谢顿的基地,只不过在我们的情况下,我们可以提升人类,使得从五十年或一百年后回顾时,现在这个时刻会感觉像是一个黑暗时代。我们只有一次生命——为什么不全力以赴呢?

随着可汗学院从数千万人扩展到数亿人,这个梦想似乎越来越不那么疯狂了。许多优秀的人主动伸出援手帮助我们。到2009年秋天,我辞去了对冲基金的工作,开始全职投入可汗学院。十个月后,我们家的积蓄很快就要用完了。我们的第一个孩子出生了,我因为经济压力而难以入睡,某种程度上也因为放弃了一份收入丰厚的工作去做一件似乎没有前途的事情而感到羞愧。就在可汗学院看似最黑暗的时刻,Ann Doerr——她现在是我们的主席——和John Doerr奇迹般地出现了,捐赠了足够的资金让我继续下去。从那时起,成千上万的人捐款支持我们。尽管是非营利组织,我们已经建立了一支能与资源最丰富的科技公司相媲美的团队。数百名极具才华的人将他们职业生涯的重要部分投入到可汗学院团队中,通常还为此大幅降薪。世界各地的数千名志愿者现在已经将可汗学院翻译成五十多种语言。像Bill Gates、Reed Hastings和Elon Musk这样鼓舞人心的领导者成为了我们最大的支持者和倡导者。这段旅程如此充满巧合,以至于在可汗学院团队中成了一个内部笑话,也许有仁慈的外星人在帮助我们,通过教育让人类为第一次接触做好准备。

当OpenAI的Sam Altman和Greg Brockman在其他人之前联系我们时,这种叙事似乎得到了强化,他们带来的技术似乎将我旅程中的每一个线索都联系在一起。GPT-4建立在许多人和公司多年来的重要创新之上,但它是第一个真正让我怀疑自己是否在做梦(或者可能生活在模拟中)的AI技术。它超越了1994年那个有抱负的AI研究员Sal在有生之年所能想象的一切。更重要的是,它是实现我们为任何人、任何地方提供真正世界级教育目标的潜在缺失部分。我意识到,尽管现在成为一名AI研究员会很激动人心,但思考如何应用这项技术来帮助人类潜能的发挥更令人兴奋。

这不是可以掉以轻心的事情;这里有真正的紧迫性。尽管这项技术整体上使我们的生产力大幅提高,但它也有可能取代或颠覆许多行业和工作。传统的劳动金字塔——低技能体力劳动构成底层,官僚化的白领工作构成中间层,高技能知识工作和创业构成顶层——不再适用。机器人技术,包括自动驾驶汽车和卡车,将大幅减少底层对人类的需求。生成式AI(Generative AI)显然可以执行中间白领层工作的大部分内容,甚至是当今最高技能专业的部分工作。一个所有生产力和由此产生的财富都只积累在传统劳动金字塔最顶端的社会,很可能集中在硅谷,而许多其他人失业,这样的社会不会是稳定的。它可能导致大规模的财富再分配努力。这种情景是反乌托邦的,因为大多数人并不是在寻求施舍。相反,他们想要有目标感和为世界做贡献的感觉。

真正的解决方案是颠倒这个劳动金字塔,使大多数人能够在顶层运作,并利用AI和其他技术提高自己的生产力和创业能力。我们有希望做到这一点的唯一方法是利用同样的AI技术在未来几十年内提升大部分人类的技能。

很少有人会从经济学角度看待《星际迷航》的宇宙,但这样做可以让我们看到一个可能很快就会降临的世界。所有古典经济学都基于稀缺性(scarcity)的概念——即通常没有足够的东西来满足每个人想要或需要的一切。因此,我们使用市场和定价来将这些商品、服务和资源分配到可能产生最高效益的地方。然而,在《星际迷航》中,并没有太多稀缺性。技术使那个社会能够复制他们想要的任何食物,在眨眼间传送到数千英里外,进行光年距离的通信,并在星际间旅行。那个世界的全人类都受到了充分的教育,以便他们能够参与这种富足。每个人都是探险家、研究员、工程师、艺术家、医生或顾问。生成式AI有潜力使我们自己社会的许多方面同样处于低稀缺或高度丰富的状态。我们有意志将我们带到《星际迷航》的乌托邦吗?

如果我们做不到,社会将越来越容易受到民粹主义的影响。有时间但没有目标感或意义感的人往往对自己或他人都不好。他们容易受到煽动者思想的影响。生成式AI可以通过用伪造的视频和图像强化”假新闻”来推动我们朝这个负面方向发展。它可以被政府用来比乔治·奥威尔在《1984》中想象的任何东西更严密地监控自己的民众。几十年来,在一个城市里安装摄像头和传感器以及窃听电话线是可能的,但很难监控所有信息并理解它。AI很快就能标记出在国家眼中似乎是不服从的任何录音或观察。老大哥不仅会监视,而且会理解。

如果没有适当的对策和AI素养,人们也会成为日益复杂的欺诈行为的受害者。在不久的将来,你可能会接到电话,甚至是视频通话,来电的看起来像是你的家人,告诉你他们遇到了紧急情况,需要你给他们汇款。

AI将在国家安全中发挥越来越重要的作用。外国敌对势力将有能力利用这项技术策划对基础设施日益复杂的攻击——这些攻击可能涉及操纵人类。AI生成的人们排队取款的图片可能会在社交媒体上疯传,引发银行挤兑。国家和非国家行为者将在社交媒体中使用生成式AI,试图影响我们的选举结果,并使我们的社会更加分裂。未来战斗中最优秀的战术家很可能是AI,而不是人类。

这些非常现实的可能性可能会促使一些人主张放慢创新步伐。老实说,即使是我也觉得其发展速度令人眼花缭乱。但精灵已经从瓶子里出来了,坏人不会因为我们希望他们放慢脚步就真的放慢。今天,好人占据优势,但这确实是一场竞赛。应对每种风险的对策不是放慢速度,而是确保那些支持自由和赋能人类的人拥有比混乱和专制一方更好的AI。

这一刻对我们来说可能是存亡风险,也可能是存亡机遇。人们完全有理由对这一技术和创新飞跃的意义既感到恐惧又充满希望。然而,我不认为我们的命运取决于抛硬币。相反,我们每个人都是关于如何使用AI向前发展这一决定的积极参与者。如果我们因恐惧而行动,遵守规则的人可能会暂停,但破坏规则的人,从极权政府到犯罪组织,将会加速他们对AI的开发。我们能够确保更接近实现乌托邦式《星际迷航》场景的唯一方法,就是加倍努力使用大语言模型(large language models)造福社会。

这不是演习:生成式AI已经到来并将长期存在。AI海啸已经从海岸退去,现在正向我们呼啸而来。面对逃离它还是驾驭它的选择,我相信应该全身心投入,同时采取适当的预防措施,这样我们就不会被漂浮物击中。

我们每个人都有义务确保负责任地使用这项技术。这意味着作为开发者,我们必须设置必要的护栏来保护我们的孩子。当问题出现时,我们应该实施合理的监管,这些监管不会给破坏规则的人提供优势。同时,我们必须加快努力,确保我们以正确的意图和正确的教学法开发技术。这将使我们能够加速改善人类的目标和潜力。让我们利用AI为人类创造一个新的黄金时代,一个让今天看起来像黑暗时代的时代。从我的角度来看,没有什么比这更鼓舞人心和重要的了。

致谢

感谢Umaima Marvi成为最好的人生伴侣,你的支持在这段旅程的每一步都至关重要。

Imran、Diya和Azad,你们每天都激励我努力让自己和世界变得更好一点。Masooda Khan,作为单身母亲抚养我,教会我在困难时坚持不懈。Farah Khan,成为我的第一位老师和导师。Naseem Marvi,成为了不起的婆婆、倾听者和朋友。Polly,在大部分写书过程中成为理想的暖脚伴侣。

Nadia、Arman、Ali、Azad和Nazrat Rahman,帮助为这一切播下种子。Dan Wohl,成为一位出色的老板和导师,在我为他工作的同时对我在可汗学院的工作表示支持。

Ann(我们的董事会主席)和John Doerr,从一开始就相信并支持这项事业。

Shantanu Sinha、Ben Kamens、Jason Rosoff和Bilal Musharraf,可汗学院除我之外的第一个团队,帮助将它变成一个真正的组织。

Bill Gates、Jorge Paulo和Susanna Lemann、Carlos Rodriguez-Pastor、Reed Hastings、Dan Benton、Scott Cook、Signe Ostby、Ratan Tata、Carlos Slim、Tony Slim、Eric Schmidt、Elon Musk、David Siegel、Laura Overdeck、John Overdeck、Laurene Powell Jobs、David Stiles Nicholson、Carlyse Ciocca、Erica和Feroz Dewan、Ray和Barbara Dalio、Bob Hughes、Jack Little、Jeanne O’Keefe、Craig Santos、Charles、Liz、Chase和Elizabeth Koch、Brian Hooks、Janine和Jeff Yass、Ravenel Curry、Laure和Guillaume Pousaz、Ross Annable、Lonnie Smith、Mark和Debra Leslie、Chuck Kung和Lisa Guerra、Larry Cohen、Sundar Pichai、James Manyika、Satya Nadella、Shantanu Narayen、Dharmesh Shah、Jack Dorsey、Jeb Bush、Sean O’Sullivan、Ted Mitchell、Patricia Levesque、Curtis Feeny、Sanjiv Yajnik、Fareed Zakaria、Arne Duncan、Tom Friedman、Diane Greene、Walter Isaacson、Todd Rose、David Coleman、Sameer Sampat、Dianne Seeman、Yuri Milner、Henry McCance、Geraldine Acuna-Sunshine、Craig McCaw、Susan McCaw、Tim Reynolds、Scott Heimlich、Eduardo Cetlin、Gisèle Huff、Jerry Hume、Darren Woods、Robert Bradway、Gary Wilson、Jeff和Tricia Raikes、Bobby Kotick、Mason和Logan Angel、Angela Duckworth、Ethan Mollick、Chris Anderson和Francis Ford Coppola,感谢你们成为令人难以置信的支持者、顾问和导师。

Greg Brockman、Sam Altman和Jessica Shieh,感谢你们在这段AI旅程中的合作。

整个可汗学院团队,包括以下在我们早期概念和发布中发挥关键作用的个人:

工程:Paul Morgan、Shawn Jansepar、Sujata Salem、Jason Chancey、Pepper Miller、Mark Sandstrom、Sean Driedger-Bauer、John Resig、Kelli Hill、Chase Carnaroli、Jason Voll、Jack Zhang、Hunter Liu、RJ Corwin、Salman Omer、Zachary Plummer、Alice Pao、Jeanette Head、Brian Genisio、Jonathan Price、Liz Faubell、Mahtab Sabet、Robert Pippin、Sarah E.S. Proffitt、Walt Wells、Matthew Curtis、Ned Redmond、Nicole Watts、Rachel Roberts、Sarah Third、David Braley、Kathy Phillip、Luke Smith、Andrew Pagan、Alex Morelli、Maddy Andrade-Ozaette、Amos Latteier、Elise McCrorie、Divya Chandrasekar、Emily Janzer、Ian Powell、Adam Berkan、Adam Goforth、Patrick McGill、Matt Morgan、Boris Lau、Erik Helal、Michael Mendoza、Nathan Dobrowolski、Kevin Barabash、Gerardo Gonzalez、Gina Valderrama、Danielle Whyte、Tim McCabe、Craig Silverstein、Miguel Castillo、Reid Mitchell、Cat Yannish.

产品、内容和设计:Kristen DiCerbo、Ricky Chandarana、Adrienne Hunter Wong、Dave Travis、Laurie LeDuc、Daniel De Angulo、Sarah Robertson、Gintas Bradunas、Tommy Day、Susan August、Elvira Valdez、Corey Kollbocker、Jess Hendel、Heather Meston、Charlie Auen、Jeff Dodds、Nick Kokkinis、Anya Bila、Jonah Goldsaito、Lan Borg、Karen Shapiro.

感谢 Stacey Olson、Vicki Zubovic、Regina Ross、Julian Roberts、Rachel Boroditsky、Julia Cowles、Sandeep Bapna、Jeremy Schifeling、Jason Hovey、Ted Chen、Craig Silverstein、Diana Olin、Jordan Peavey、Evan Rahman、Eirene Chen、Barb Kunz、Felipe Escamilla、Jesse Ambrose,感谢他们支持并领导我们工作的关键部分。

特别感谢富有远见的教育领导者,包括 Dr. Katie Jenner、专员 Frank Edelblut、教育局长 Peggy Buffington、Dr. Jose Fuentes、Alan Usherenko、Tim Nellegar,以及纽瓦克公立学校、霍巴特市学校以及我们在印第安纳州和全国各地的合作学区的所有杰出教育工作者和学生。

感谢 Richard Pine、Eliza Rothstein、Inkwell Management、Ibrahim Ahmad、Lee Kravetz、Carolyn Coleburn、Yuleza Negron、Bridget Gilleran、Molly Fessenden、Barb Kunz、Elizabeth Pham Janowski、Alex Cruz-Jimenez、Carrie Cook、Suzanne Roberts、Tom Greene、Tomer Altman、Joanna Samuels、Roger Studley、Eric Berson、Mimi Kravetz.

非常感谢 Jeremiah Hennessy,是他在2009年说服我辞去日常工作。

我要感谢数十万捐赠者,是他们让可汗学院成为可能,也感谢数亿选择使用可汗学院来提升自己和他们所关心的人的学习者、家长和教师。

最后但同样重要的是,感谢仁慈的外星人帮助我们为人类与外星文明的首次接触做准备。前进!

注释

第一部分:AI导师的崛起

第二部分:赋予社会科学声音

第三部分:赋能下一代创新者

第四部分:协同更强

第五部分:保护孩子安全

第六部分:AI时代的教学

第七部分:全球课堂

第八部分:AI、评估与招生

第九部分:工作与未来

索引

此索引中的页码是指本书的印刷版本。每个链接将带您到相应印刷页的开头。您可能需要在电子阅读器上从该位置向前滚动才能找到相应的引用。

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

Y

Z

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

关于作者

萨尔曼·可汗(Salman Khan)是可汗学院的创始人兼首席执行官,这是一个非营利组织,其使命是为任何人、任何地方提供免费的世界级教育。他在YouTube上的课程彻底革新了学习方式,在全球获得了数十亿次观看。他被《时代》杂志评为世界最具影响力的100人之一,同时也是schoolhouse.world、可汗实验学校和可汗世界学校的创始人,以及《单一世界学校》一书的作者。

Penguin Random House publisher logo.

您的阅读清单上的下一本书是什么?

发现您的下一本
精彩读物!

获取个性化的图书推荐和关于本作者的最新消息。

立即注册。

_146975699_

* 全球大约65%的人口可以访问互联网(尽管这个百分比在不同国家和地区之间差异很大),超过一半的全球人口拥有智能手机。