报告日期: 2025年4月8日 (Anthropic教育报告发布日期)
撰写单位: Anthropic (主要研究方)
摘要
本报告基于Anthropic于2025年4月8日发布的《教育报告》,结合其他相关研究资料,深入探讨了大型语言模型(LLM)Claude在高等教育环境中的实际应用模式及其对学习、评估和技能发展的影响。研究分析了100万份匿名学生与Claude AI助手的对话,其中包含574,740份高等教育相关的学术对话。
报告主要发现,STEM(科学、技术、工程、数学)领域的学生是AI工具的早期采纳者,其中计算机科学专业的学生使用Claude的比例显著高于其在学士学位授予者中的占比。学生与AI的互动模式多样,主要包括直接问题解决、直接输出创建、协作问题解决和协作输出创建四种。值得注意的是,近一半(47%)的对话属于“直接”互动,这引发了学生可能将高阶认知任务外包给AI的担忧,即AI主要承担布鲁姆分类法中的“创造”和“分析”等高级认知功能,而学生在“理解”和“记忆”等基础任务上的参与度较低,形成“倒置金字塔”模式。
此外,报告还发现教育者也开始使用AI进行课程开发、学术研究,甚至自动化评分。面对这些机遇与挑战,Anthropic已采取积极措施,包括成立高等教育咨询委员会、推出AI素养课程并开发“学习模式”,以促进AI在教育中的负责任应用。
报告强调,AI在教育中的整合是复杂的,需要教育者、开发者和学生之间持续的对话与合作,以确保AI能够深化而非损害学习体验。
1. 引言
人工智能(AI)的快速发展正在深刻影响全球各个领域,教育界也不例外。随着AI系统从专业研究工具演变为日常学术辅助工具,如何重新定义学习、评估和技能发展成为高等教育面临的核心问题。
为了填补传统调查和实验数据在真实世界AI使用模式上的空白,Anthropic公司于2025年4月8日发布了《教育报告》。这份报告基于对100万份匿名学生与Claude AI助手的对话进行分析,首次提供了关于AI在大学学习中实际应用的具体且数据驱动的洞察。
2. 研究方法
本报告的研究数据来源于Anthropic的《教育报告》,该报告利用其自动化分析工具Claude Insights and Observations (Cleo),在保护用户隐私的前提下,对近574,740份与高等教育相关的学术对话进行了深入剖析。Cleo通过多层自动化流程移除用户私人信息,将对话提炼成高层次的使用摘要,从而发现AI的使用模式。报告还结合了来自东北大学22名早期采用AI的教职员工的调查数据和定性研究。
3. 主要发现
3.1. 学生群体中AI工具的采纳情况
- STEM学生是早期采纳者,且高度超额代表。
- 计算机科学专业的学生尤为突出,他们贡献了报告中近37%至38.6%的分析对话,而他们在全美学士学位授予者中仅占约5.4%。
- 自然科学和数学领域的学生也表现出较高的使用率(15.2%的对话占比 vs 9.2%的学位占比)。
3.2. 学生与AI的互动模式
报告识别出学生使用AI的四种主要互动模式,这些模式在数据中大致以相同的比例(各占约23%至29%)存在:
- 直接问题解决(Direct Problem Solving):学生寻求快速答案或特定问题的解决方案,例如调试代码或解决数学问题。
- 直接输出创建(Direct Output Creation):学生让AI直接生成内容,例如撰写文章的引言或总结研究论文。
- 协作问题解决(Collaborative Problem Solving):学生与AI进行互动对话,逐步解决复杂问题,寻求提示或探索不同方法。
- 协作输出创建(Collaborative Output Creation):学生与AI共同创作内容,例如集思广益、完善大纲或生成演示文稿的特定部分。
- “直接”互动模式的普遍性及潜在担忧:近一半(47%)的学生-AI对话属于“直接”交互,即寻求答案或内容,参与度最低。尽管其中部分对话具有合法的学习目的,但也发现学生寻求多选题答案、英语语言测试答案或通过改写文本避免抄袭等情况。这引发了对“思维外包”的担忧,即学生可能将重要的思考任务委托给AI。
- 学科间的互动模式差异:
- 自然科学和数学领域的学生倾向于将AI用于问题解决。
- 计算机科学、工程、自然科学和数学的学生更偏爱协作式对话。
- 人文、商业和健康领域的学生在直接和协作式互动之间分布更均匀。
- 教育领域的学生表现出对输出创建最强的偏好,占74.4%的对话。
3.3. AI承担的认知任务及布鲁姆分类法分析
Anthropic使用布鲁姆分类法(Bloom’s Taxonomy)分析Claude在学生对话中展现的认知功能,结果揭示了一种“倒置模式”:
- AI主要承担高阶认知任务:Claude最常执行的是高阶思维任务,其中“创造”(如编写草稿或代码)占近39.8%至40%,“分析”(如分析法律概念)占30%以上(30.2%)。
- 低阶任务频率较低:而“应用”(约10.9%)、“理解”(约10%)和“记忆”(约1.8%)等低阶任务的频率则显著降低。
- 深层担忧:这种“倒置金字塔”模式引发了严重担忧,即学生可能将关键认知任务外包给AI,从而阻碍了他们自身高阶思维技能的发展和基础知识的掌握。报告明确指出,如果AI总是完成金字塔顶部的任务,那么支撑金字塔底部的基石是否稳固?我们是否错过了学习中至关重要的基础环节?。世界经济论坛(World Economic Forum)指出,到2025年,70%的雇主认为分析性思维是最重要的技能,因此这种对批判性思维技能的潜在长期影响尤其令人担忧。
3.4. 教育者对AI的使用
AI对教育的影响不仅限于学生,教育者也在积极探索其应用。Anthropic的报告发现,在2025年5月至6月期间,约有7.4万份与高等教育邮件账户关联的对话涉及教育任务。
- 主要用途:教师最常见的AI使用场景是课程开发(57%)和学术研究(13%)。报告指出,教育领域近四分之三的对话(74.4%)属于输出创建类别,表明AI在协助生成教学材料和教案方面表现突出。
- 争议性用途——自动化评分:一个出人意料但引人关注的发现是,有7%的教育者使用Claude来“评估学生表现”,包括给予反馈、对照评分标准进行评分和总结评估。其中,近一半(48.9%)的教育者甚至将评分任务自动化。
- 担忧与矛盾:尽管调查显示教职员工对AI在该领域的有效性评价最低,且许多教师普遍认为AI用于评分并非明智之举,但这种自动化趋势依然存在。Anthropic对此表示担忧,认为将如此敏感的教学环节交给AI可能不被推荐。有教授指出,这涉及道德问题和准确性问题,因为学生支付学费是为了获得教授的指导,而非AI的代劳。
4. Anthropic的回应与未来举措
为应对AI在教育中带来的机遇与挑战,Anthropic正积极采取多项措施,力求在技术创新与教育伦理之间找到平衡点:
- 成立高等教育咨询委员会(Higher Education Advisory Board):
- 目的:该委员会于2025年7月成立,旨在指导AI工具的开发,确保其在提升教育体验的同时,维护学术标准、促进道德实践并保护学生诚信和隐私。
- 组成:委员会由著名的前耶鲁大学校长兼Coursera领导者Rick Levin担任主席,成员包括来自斯坦福大学、密歇根大学、德克萨斯大学奥斯汀分校、莱斯大学和Complete College America等知名学府的学术领袖。
- 推出AI素养课程(AI Fluency Courses):
- 目的:与咨询委员会的成立同步推出,这些课程专为高等教育的教师和学生量身定制,旨在培养他们负责任、深思熟虑和合乎道德地采用AI技术所需的实用技能和框架。
- 开发Claude的“学习模式”(Learning Mode):
- 特点:Anthropic正在试验一种“学习模式”,强调苏格拉底教学法和概念理解,而非直接提供答案。这一模式旨在帮助学生培养批判性思维,获得更深层次的理解。
- 与大学建立合作关系:Anthropic正与多所大学合作,以更好地理解和解决AI在实际教育环境中的实施挑战。目前,包括伦敦政治经济学院、东北大学和尚普兰学院等机构已开始引入Claude for Education。
5. 公众反响与未来展望
Anthropic在高等教育领域的这些举措获得了广泛关注和普遍赞扬。社交媒体上的学术专业人士和AI伦理学家普遍认为,这是将AI负责任地整合到教育中的必要一步,并赞扬了Rick Levin等知名人物的参与。
然而,公众讨论中也伴随着一些谨慎乐观和担忧:
- 过度依赖:有人担心学生过度依赖AI技术,导致学习成果受损。
- 持续评估:呼吁对AI对教育成果的影响进行持续评估,以确保人类监督在教学中仍发挥核心作用。
- 包容性:还有评论指出,这些举措必须对资源较少的机构开放,以确保更广泛的社会效益。
- 作弊问题:Reddit等公共论坛上对学生利用AI作弊的讨论激烈。有观点认为AI降低了作弊门槛,可能导致能力下降;也有观点认为,鉴于教师和招聘经理也使用AI,学生使用AI是公平竞争,且AI能帮助弥补学习障碍。
- 学习和教育的重新定义:许多评论呼吁教育系统需要重新思考学习和智能的定义,从侧重记忆转向侧重如何获取和利用知识,强调批判性思维和基础知识的平衡。
- 教师的适应性:教授和教师需要改变教学方法,设计鼓励AI使用而非作弊的作业,并将AI融入教学流程。
专家预测,AI素养将很快成为高等教育的基石。那些积极采纳全面AI政策的大学有望在创新和学生成果方面脱颖而出。AI公司也在积极推动学生早期和频繁地使用他们的AI工具,以期在学生毕业进入职场后,这些工具能成为他们日常工作流程的一部分,从而建立品牌忠诚度。
6. 本报告的局限性
本报告的研究基于真实世界数据,在发现的有效性方面具有优势,但也存在以下局限性:
- 采纳者偏差:数据集可能主要捕获了AI的早期采纳者,可能无法代表更广泛的学生群体。
- AI工具范围:研究仅限于Claude AI,未能反映学生在其他AI工具(如ChatGPT)上的总体使用模式。
- 分类挑战:对话分类方法可能存在假阳性或假阴性,部分对话可能来自教职员工而非学生。
- 时间窗限制:数据分析仅限于一个18天的时间窗口,学生的使用模式可能在一年中随学业承诺波动。
- 未衡量学习成果:报告未深入研究学生最终如何使用AI输出以及这些对话对实际学习成果的影响。
- 学科交叉性:将对话归类到单一学科可能无法完全捕捉跨学科工作中的AI使用模式。
- 布鲁姆分类法应用:将布鲁姆分类法应用于AI的认知过程可能存在不完善之处。
7. 结论与建议
Anthropic的教育报告揭示了AI在高等教育中复杂且多维的作用。AI带来了显著的效率提升和新的学习机会,但也带来了学术诚信、核心认知技能发展和评估方式重塑等方面的严峻挑战。
为了确保AI能够真正深化而非损害学习体验,本报告提出以下建议:
- 促进批判性参与:开发鼓励学生批判性思维和分析性思考的教育功能,而非仅仅提供答案。
- 支持技能发展:设计能够触发问题解决和分析性思维过程的教育特色,帮助学生培养核心认知技能。
- 强调AI局限性:明确指出AI输出的局限性和不准确性,培养学生验证AI生成内容的能力。
- 保护学术诚信:制定明确的政策和指导方针,保护知识产权和学术诚信。
- 持续研究与对话:鼓励教育者、开发者和学生之间持续的对话与合作,共同探索AI在教育中的最佳实践和长期影响。
教育者需要积极应对AI带来的变革,重新设计课程作业和评估方法,以确保学生在AI赋能的世界中依然能够发展出不可或缺的批判性思维、概念理解和独立学习能力。

留下评论