教育一直被认为是会被LLM改变最大的行业之一。ChatGPT 的使用场景中,教育占据了很大比重,其用量常随开学和假期规律波动。而 Andrej Karpathy 也选择了教育作为他的创业方向。人们都期待能够有全能的AI Tutor,因材施教,提供给每个人最好、最个性化的教育。
虽然 AI Tutor 的理想还没有实现,但随着 LLM、Voice Agent、多模态理解和 o1 等 AI 能力的不断提升,创业公司在教育领域解锁了越来越多的应用场景。LLM+EdTech 的核心,是将传统教育服务转化为产品。这一趋势在语言学习、拍照搜题等细分领域尤为明显。例如,基于 LLM 和 Voice Agent 的语言导师,通过自然对话提升降低外教门槛;基于多模态理解的拍搜应用,为基于图片的问题提供了更精准的解答。o1 的推出也为数学和逻辑推理相关的学科场景打开了新的可能性。
而应用层创业公司的价值在于提供 ChatGPT 等大模型做不到的体验——提供更懂用户需求、更贴合实际场景的功能。例如,通过优化产品设计,让用户更愿意在产品中互动,获得更直接的反馈。

本文是我们对于 AI & Edu 赛道的 mapping,我们始终对AI对教育行业带来的变化充满期待,这体现在教学的各个环节中。Class companion 就是一个典型的例子。初高中教师没有时间批改课后的 written assignment,使用class companion, 教师可以在 LLM 的帮助下设计作业,同学们在作业提交的一瞬间,就能得到AI的反馈。Class Companion 面向学区和教师的 ToB 进校软件市场,采用PLG的方式,通过教师口碑推动学校的采购。然而,作为细分场景下的工具,Class Companion 也面临被大型进校软件供应商挤压的风险。即便如此,这一案例表明,只要找到合适的应用场景,现阶段的 LLM 已经能够释放出足够高的教学价值。

教育产品可以根据目标客户是学生还是老师进行简单划分。面向学生的产品主要包括语言学习应用(如 Duolingo)、作业帮手(如 Chegg 和 Quizlet)、职业技能培训课程(如 Coursera 和 Udemy),以及幼儿教育类工具(如 Ello)。产品的打磨和高效触达C端用户非常重要。2023年,全球EdTech市场规模达1460亿美元,预计到2033年将增至5496亿美元,其中针对学生个人的市场占比约70%。
面向教师和学区的产品包括学习管理系统(如 Google Classroom)、学生信息系统(如 PowerSchool)、课堂管理软件(如 Classcraft),以及评估软件(如 Gradescope)。这类产品的成功主要依赖于团队的销售能力和教育体系内的资源,主要付费方为学校和教育机构。虽然市场规模较学生端小,但增长很快,2023年市场规模约为185亿美元,预计到2032年增至1324亿美元,年均复合增长率达25.2%。
LLM 的到来,为解锁更为个性化、即时性、互动性的教育场景提供了机会。由于教育资源有限,无法做到让每个人随时随地获得最适合自己的教育。教育行业的几次迭代:在线教育平台、学习资源网站、学习 app 都是对教育资源不足的弥补。LLM 进一步丰富高质量教育资源的供给。
其他还包括一些心理支持、大学/职业顾问的应用场景。To teachers & class room 产品划分为教学前,教学中,教学后。教学前用于课程生成、教学建议;课堂中的促进互动,帮助教师对学生学习状态的实时掌控;课后帮助作业批改,对学生的评估与反馈。例如 OpenAI 投资的 class companion 就是专注课后 written assignment 批改的一款 saas 产品。
语言学习和儿童教育应用已经发展的较为成熟,因为对实时互动的需求较高,但对逻辑和精确性要求不高,对模型智能要求相对较低。
数学/编程 AI Tutor 等精确要求度高、强调解题逻辑的学科,对模型智能的要求较高。仍以传统的拍照→搜索题库解题为主,llm 作为“good to have”的附加功能,尚处于 Gen-AI 应用的初期阶段,但因为该领域市场空间大,随着 LLM 的智能提升未来仍有较大的发展空间。
而全能型 AI tutor 需要的数据、教研积累多。目前受到模型智能不足的限制,大公司在这个方向占据优势。如可汗学院推出的 Khanmigo,官方说有 6.5 万名学生正在使用。目前 Khanmingo 能做到根据每个学生的学习进度和需求,提供定制化学习路径和建议;在学生使用 Khanmigo 进行练习时,提供即时反馈,以数理科目为主;提供模拟对话和问题解答的互动学习能力,一步步引导学生思考。
不过根据用户反馈,目前 khanmigo 仅能解决小学低年级阶段的问题,对于较难的问题效果较差。可见依靠 GPT4 level 的智能水平还不能解决数学物理教学问题,难以达到全能的 AI tutor。
“模型能力提升、解锁不同应用场景”在教育领域体现相当直观。我们根据教育产品对于互动/实时性、模型推理能力的要求将目前 AI 应用场景划分象限。随着 GPT-4o level 端到端模型实现更好的交互效果、多模态理解、多模态输出能力的发展,以及模型调用成本降低,将会带来更好的教育体验。
GPT-4o 是第一个能实现端到端 voice-in, voice-out 的大模型。这个技术路线是下一代交互的开始:低延迟、高智能。长链路的延迟是用户难以接受的,4o 使得延迟降低,加入了 acknowledge signals 后让用户交互起来更像在与真人交流。这对于互动/实时要求性高的教育场景具有显著意义。典型场景包括 Language AI tutor,Kids reading/curiosity coach。
用户:表示现已在全球拥有超过 1000 万用户,用户基数在过去五年中每年翻倍,覆盖超过 40 个国家。
产品:推出了“AI 畅聊”,用户可以自己创建聊天场景进行英语对话。(体验一般,不如 c.ai 和 GPT-4 store 中的 AI tutor...
差异:针对有实际英语沟通需求的用户,如职业需求、出国留学等。与竞争对手相比,Praktika 更注重真实对话的模仿,Avatar 是其特点。
开发了 AI 驱动的认知行为治疗师(CBT),提供语音和文本会话的心理健康治疗服务。为用户提供了成本效益高、可访问性强、随时可用的心理健康治疗解决方案,改善心理健康服务的可及性。
1)AI 治疗师:Sonia 通过手机应用提供完整的治疗会话,用户可以选择语音或文本与 AI 治疗师进行交流。
2)Sonia 提供每年 200 美元的订阅服务,相比传统的每次 200 美元的治疗费用,大大降低了用户的经济负担。
拍搜是上一代教育 AI 中已经验证的场景和需求。在 LLM 之后,尤其随着模型推理能力、多模态能力的提升,拍搜产品也对应进行了升级。多模态理解对于拍照解题场景意义很大,主要区别是从单纯依靠题库变成依靠大模型的知识,可以一步步解答解题步骤。GPT-3.5 到 GPT-4 使得搜拍解题率有大大的提升,GPT-4v 支持多模态后,图形类题目,比如几何题、图表题、物理题都可以做了。
• 美国中学生解题能做到 85%,之前美国公司只能达到 60%,而中国虽然可以做到 80%,原因是有大量的人力流水线,这海外很难落地,完全不泛化,而且涉及到版权。
• 过去的产品如果用户不懂其中的某个步骤,解答简略的话会卡住,之前只能问真人,现在可以进行追问....
在过去半年中,我们观察到有 Answer.ai 这样的创业团队,也有大厂 Gauth、Question.ai 进入到这个领域。
All in One 学习 App,功能包括解题、概念阐释、记忆和复盘测试为。在 AI 解题中非常注重对于题目中涉及的数学概念的识别和呈现,交互引导比较细致。Answer.AI 目前的月度会员定价是 9.9 美元/月,订阅用户能享受的权益包括无限次数的 AI 交互和 500 次的 Super AI(GPT-4)响应。
用户搜到答案之后,App 会弹出解释知识点、相似问题推送和真人答疑视频推荐三个选项。其中真人解答视频主要来源于 YouTube,用于点击会跳转到 YouTube 观看,相当于将现成公开资源直接整合到产品中,如果学生依旧存疑还可以通过文字/语音继续交互。
作业帮在海外推出的 AI 教育 App,根据点点数据,Question.AI 于 2023 年 5 月 30 日在美国市场上线 月相继在东南亚和全球其他市场上线。
落地页是 AI ChatBot,用户可以直接输入想让 AI 解答的问题。如果用户需要使用拍照解题功能,可以直接点击聊天框上方的按钮进入拍照页面。另外还有 AI 写作相关功能。
字节旗下的 2020 年 12 月就已上线,当时产品名称为 Gauthmath,主推线 答疑,后期逐步建立起了数学题库资源,也支持题库搜题。2023 年由 Gauthmath 更名为 Gauth AI,从学科内容上从数学拓展到学科,Gauth AI 主要基于 GPT-4 和 Bard 。产品设计上相对较为简洁,在题目的解释上也相对简略。
很多 AI 教育产品,包括 duolingo max、speak、praktika,全科 ai tutor cheggmate 等,由于 LLM 及 TTS 调用成本过高,导致产品定价过高或使用次数受限,限制了大规模的采用。在未来 1-3 年的时间里,模型的调用成本预计会大幅度降低。这将使得企业能够以更低的价格提供服务。促进认为“good to have“ 但价格太贵的人群的使用。
1. Class Companion 是教师与学生的双赢,是效率和质量的同步提升。教师端减轻了批改作业的负担,提高了工作效率,学生端能获得即时的反馈,根据反馈不断改进,提升了学习体验。
2. 目标市场及商业化路径清晰:class companion 作为面向学区和教师的产品,切 K-12 教育体系的预算,第一步专注付费能力强的美国市场。Class Companion 借助美国学校教师软件购买的权限和主动性,通过让教师试用并推荐产品PLG的方式,自下而上的让学校采购。
3. 创始团队能力全面,满足构建教育 ToB LLM 产品的画像:class companion 面向B端的教师和学区,一方面考验团队对AI的理解,一方面考验团队的销售能力。创始人Avery Pan曾做过老师,也是教育科技公司outschool的全球产品增长负责人,其他团队成员拥有连续创业以及 LLM 产品开发经验。
a. 学校体系的预算有限,2023 年全球 K-12 教育科技市场体量也仅为 185 亿美元。这其中又牵扯很多教学体系内部自上而下采购因素。
b. Class Companion 解决的场景很小,天花板较低。只有通过扩展产品线,比如从仅仅解决作业反馈场景,延伸到课程学习、课后作业以及课程测验,才有可能扩大产品的想象空间。
5. 竞争维度,虽然目前市场上还未出现其他用LLM辅助的课后作业管理软件,但是传统的教学评估软件有机会增加类似功能,并通过捆绑销售获得价格优势,Chegg 等面向学生的做题工具也有机会推出ToB产品。而目前 class companion 只做了教学的一个环节,容易被功能齐全的进校软件通过增加新组件的方式替代。
教育市场除了我们熟知的面向学生的产品(如语言学习应用Duolingo,课后作业帮手Chegg)之外,还有大量针对教师和学区的进校软件,分类如下....
学习管理系统(LMS):如 Google Classroom 和 Canvas,帮助教师管理课程进度、分发作业、跟踪学生进度,类似企业内的项目管理软件。
课堂学习软件:如 Classcraft,课堂上使用辅助教学的工具,如通过游戏化激励学生,帮助教师更好地活跃课堂。
作业评估软件:如 Gradescope 和 Albert.io,帮助教师在线创建作业、批改作业,并提供给学生简单的反馈。
进校软件属于 K-12 教育科技费用市场的一部分, K-12 教育科技费用市场包括全球范围内教育机构、政府和私营实体在为K-12学生和教育工作者定制的技术解决方案上的总支出。根据的预测,2023 年该市场体量为 185 亿美元,包括硬件(计算机和交互式白板)、软件(学习管理系统和教育应用程序)服务。该市场相对于面向学生个体辅导的市场较小,预计以25.2%的CAGR增长,到2032年达到1324亿美金。
美国K12课堂信息化程度高,进校软件是一个发展成熟的市场,出现了一批较成功的创业公司。2010年后智能设备开始逐渐走入美国课堂。美国中小学生课堂上人手一部iPad或笔记本电脑,校园WiFi全覆盖,老师在课堂中会同步使用专业化的教育网站,比如 Coggle,Compass Learning,kahoot 等,完成一些课堂互动和小测验。
与 ToC 市场相比,进校软件市场付费方主要是学校和教育机构,产品迭代慢,除了产品效果,还会考虑更换成本、教育体系内的利益关系,很考验团队的销售能力,可以说是“得渠道者得天下”。
目前,将软件销售给学校的公司仍以老牌供应商为主:美国学校管理软件提供商 Frontline Education 成立于1998年,是一家专为K-12学区提供管理和人力资源软件的公司,为12000家教育机构提供服务。新兴公司的机会在于在产品效果上的大幅度创新。Clever 是美国 K12 数字学习平台,成立于2013年,2021 年超过 60% 的美国 K12 学校使用 Clever,包括最大的 100 个学区中的 95 个。Clever 接触大量学生信息,开发数据分析功能,追踪学生的学习进度并产出分析报告,教师和学区管理者通过分析报告可以清楚了解到学生的课程参与情况。
美国中小学分为公立学校和私立学校。公立学校由政府资助并控制,约九成的美国学生在公立学校就读,当地的学区委员会负责教育资金使用。私立学校则基本上不受政府监管,家长和教师联合会对学校的政策制定与执行具有一定影响力,决定资金去向。相对来说,私立学校比公立学校的软件采购更为自下而上,教师主动权更多,预算也更多。
销售教育软件有两条路径,其一是直接与教育系统的高层合作,其二是通过教师PLG,由教师提出需求让学校采购。根据 Reddit 用户评论,第一种方式需要建立销售团队,参加贸易展和教育研讨会,将课程赠送给试点学校试用等等。这种方式会花费大量的营销基金,一次宣传可达数十万美元。从业者表示一个教育产品的预算几乎有 1/4 是用来赠送样品和派飞机接见人。过程漫长,这也是为什么大部分教育系统的产品都是几年前的产品。第二种教师 PLG 的方式在美国市场也存在机会,尤其是针对经费更充足、教师主动性更强的私立学校,PLG往往是科技创业公司的选择。
根据一个来自 Reddit 的 K-12 技术软件负责人的讲述,学校内部采购软件的流程是这样的: • 老师要求、申请软件 • 检查预算,看是否可行。 • 如果在 X$以下(一般为 5000 美元),那就购买软件。 • 如果超过 5000 美元,那么有两种选择: 1)如果该公司恰好在该州的采购清单上(类似批准的供应商清单),那么就可以继续订购。 2)如果不在名单上,那么必须进行公开招标,可能中标,也可能不中标。 技术软件负责人表示他不会主动和供应商打交道,除非是老师要求,否则很难引进新产品。
即时沟通在美国教育体系里显得尤为重要。在美国,学生有大量的 essay 作业,这些作业往往是非标的,而每个班级的进度也非常个性化。因此,从布置作业到批改再到反馈,整个过程对老师来说非常繁琐。Class Companion 创始人 Avery Pan 在帮助 Deerfield High School(被誉为“藤校后花园”的顶尖美高)老师,以及作为英语老师的家人的过程中,发现初高中的wrriten essay没有被及时批改,学生得到反馈都在1周之后,甚至永远都不会收到反馈,这影响了学生的学习效果。教师对这个问题很苦恼,但迟迟无法解决。
Kahoot! 是其中极具代表性的公司。Kahoot!是成立于2012年的在线答题工具,教师可以使用 Kahoot!创建答题游戏,验收学生们的学习情况。Kahoot!因疫情线年成功上市,最高峰市值达到 80 亿美元。根据2022年的年报,97%的财富500强企业、全球800多万名教师、数亿学生和个人都在使用Kahoot! 。Whiteboard.fi 为每个学生配备了数字白板,他们可以在上面写字、做标记、添加数学公式,老师实时跟踪学生进度。Albert.io 面向学生定制练习,学生在 albert.io 上完成题目(以数理等固定答案的题目为主)后会获得即时的反馈,帮助理解和纠正错误,面向教育者则提供教学资源、课程计划、学生管理等工具。Gradescope 则是结合人工智能(AI)简化作业的批改评分流程。具体流程是,学生手写作业,以电子文档的形式上传至Gradescope,教师再进行批改。相比 LLM 的直接反馈,学生提交到教师,教师再反馈,操作流程更多,存在时间差,沟通摩擦力还是更高一些。
LLM 的到来,为解锁更为个性化、即时性、互动性的教育场景提供了机会。为老师及课堂设计的LLM产品可以划分为教学前,教学中,教学后。教学前用于课程生成、教学建议;课堂中的促进互动,帮助教师对学生学习状态的实时掌控;课后帮助作业批改,对学生的评估与反馈。
Class Companion 是为 K12 教师设计的课后作业管理系统,专注初高中课程的 写作类作业。教师可以用 Class Companion 创建并布置作业,学生完成后能获得来自LLM的即时反馈和评分,同时教师端能看到作业的结果分析,其中用到LLM能力的模块是即时反馈与评分。2022年12月公司成立,2023年3月份推出产品,目前已经有 10,000 多家美国学校使用。
即时反馈是Class Companion 的核心点,Avery 将这个产品类比为数学课堂上对于计算器的引入。Class companion 是教师的 Copilot,结合了助教、评估软件、家教或作业助手的能力,又实现了课前、课堂、课后学习内容的整合,保证了学习的连贯性。
Class Companion 建立了完整的作业流程。老师可以用它创建班级、邀请学生加入、创建作业。
其中创建作业可以使用 AI 生成,class companion 也提供了可以修改作业题目库。
在确定好作业题目后,可以进行更细节的设定,包括属于哪个课程章节、给予 AI feedback 和分数的规则。
教师很喜欢通过 prompt 的方式自定义反馈的功能,通过针对班级和学生个人进行定制,实现因材施教。
学生完成作业后,Class compaion 会向教师展示学生与 AI 的交流历史以及结果分析报告,帮助教师了解学生情况。学生也可以对人工智能给出的批评意见提出质疑,并向教师申诉。
通过分析 class companion 官方发布的教师采访,可以发现教师认为class companion 的核心价值点在于能够提供给学生即时的反馈,这减轻了他们的批改负担。对于LLM的产品效果,用户也认为较为准确、公平。比如一名California的社会学老师提到,之前他因为时间有限从不批改课后练习,使用class companion 补足了这一教学缺失,产品也受到了学生们的喜爱,学生们会在得到反馈后更仔细地阅读问题,进行多次地尝试,学生也认为 class companion 是“相对公正、客观的”,使用一段时间后,发现学生的整体写作水平有所提升。
从用户数据来看,官方表示目前美国已经有 10,000+ 所学校的高中老师在使用 class companion 了。但根据 simmilarweb 的数据,截至2024年5月份,月访问量10万左右,6月因进入暑假数据大幅下跌。流量分布上,美国占据绝对市场份额。
团队成员具有教育行业、连续创业者、LLM 产品开发多重背景,毕业于哈佛、麻省理工等高校,是一个很适合做 LLM 教育产品的团队。目前Linkedin上的成员有 9 个人。
Class companion 目前采取PLG的方式推广产品,所以现阶段最重要的是了解老师的需求,让教师真切感受到产品的价值。Class companion 将产品以免费的方式提供给教师,并且在 Facebook 上建立了教师 community。
从教学软件头部公司来看,Canvas 的母公司 Instructure 2023 年全年收入达到 5.3 亿美金,业务主要集中于北美,占据北美高等教育机构 36% 的市场。全球范围内,Instructure 在学习管理系统市场的占有率为 3.41%。可推算北美高等教育教学管理软件的市场规模约为 15 亿美金,全球约为155亿美金。
• 传统作业评估平台加入LLM 反馈功能:代表软件为可汗学院推出的 Khanmigo,以及上文提到的 Albert.io、Quizlet、Gradescope 等等。该类产品本身就具有大量的用户基础和学校资源,结合产品组合一起售卖会更加具有竞争力。
Chegg 主要面向学生开发产品,主要业务是在线学习服务Chegg Services,包括作业社区Chegg study、写作语法工具Chegg Writing、数学解题工具Chegg Math等。其中 Chegg Study 就是提供作业答案的解答,是其核心盈利来源。
Chegg目前推出的 LLM 产品为 Cheggmate,为学生定制课程计划。比如 CheggMate 会查看学生上传的测试成绩,分析优势,将用户与工作机会联系起来。Chegg 的教研资源、用户信息都有充足的积累,如果也为教师开发一套结合LLM的工具,与chegg study相结合,会有很强的竞争力。
GenAI 在教育领域的应用还位于初期阶段,一些可预见的变量提升了我们对AI+教育未来发展的期待....
GPT-4o的多模态新架构让模型具备了视觉、听觉、以及说话能力,显著降低了延迟。这有机会解锁更多的教育应用场景。
比如通过识别学生的面部表情和肢体语言,AI tutor可以更好的了解学生的情绪状态,调节教学内容方式。在实时互动上,也可以优化实时问答、口语练习、即时反馈的体验。同时可以解锁绘画设计、音乐学习等需要视觉和听觉才能进行反馈指导的科目。
o1 已经被证实在数学、推理领域表现的更好。正如数学教授 Terence Tao 认为 o1-preview 已经能够达到平均的研究生水平。
未来随着o1的进一步发展,有机会帮助学生解答复杂问题的推理逻辑,也能进入更专业的领域,如工程、医学等等。同时,o1还能作为教师和学术研究的助手,提高教育体系的效率。