教育评价及其改革是一项世界性、历史性、实践性的难题,涉及教育思想观念、经济社会发展水平、历史文化传统等多重因素。[1]当前,长期形成的教育评价理论体系已无法充分阐释由数智技术引发的教学评价新样态,因此迫切需要构建一个更为科学且具有鲜明时代特征的教育教学评价范式。
一、数智时代教学评价范式转型的逻辑起点
教学评价是教学生态系统中不可或缺的组成部分,评价实践的变革总是与教育评价理论的创生相伴而行,缺乏理论指引的教学评价难以具有内在韧性与持续生命力,易陷入亦步亦趋的发展困局。[2]近百年来,教育评价理论是持续演进的,大致经历了从测量、描述、判断到建构的四个发展阶段[3],各个阶段的评价理论均是在对前一阶段的批判性继承与扬弃中逐步形成的。
测量时代指19世纪末至20世纪30年代的标准化测验模式,以桑代克(Edward L. Thorndike)为代表,认为评价就是选择测量工具、组织和实施测量、提供测量数据。
描述时代指20世纪30年代至50年代,以泰勒(Ralph W.Tyler)为代表,其核心观点认为“评价在本质上就是判断课程和教学计划在多大程度上实现了教育目标的过程”[4],因此被称为目标本位评价模式。
判断时代指20世纪50年代至80年代,最具代表性的观点是斯塔弗宾( D . L . Stufflebeam)提出的CIPP评价模型,其核心理念是“评价不是为了证明,而是为了改进”[5],因此亦称决策导向评价模式。
1989年,古贝(E.G.Guba)和林肯(Y.S.Lincoln)出版了专著《第四代评价》,标志着第四代评价理论正式诞生,其在批判前三代评价理论不足的基础上,创新性提出“回应—协商—共同建构”的评价模式,因此被称为建构时代。
前四代评价理论虽然在不同历史阶段推动了评价科学化进程,但已难以合理解释动态化、个性化的学习过程,其固有的评价方法在海量数据处理、多元化主体参与、综合素质评价等方面逐渐显现局限性。与此同时,党和国家明确提出“评价改革要坚持科学有效,改进结果评价、强化过程评价、探索增值评价、健全综合评价,充分利用信息技术提高教育评价的科学性、专业性、客观性”[6]。因此,在数智技术与政策导向的双重驱动下,建构第五代教育评价理论、推动教学评价范式革新已成为必然趋势。
范式是由概念、范例和实践形成的,并被理论和证据所塑造的动态系统。[7]一个范式的构建通常包括三个层面:一是哲学层面的形而上学范式,指形成的共识性信念;二是社会学范式,即普遍认可的理论系统;三是构造范式或人工范式,即解决问题的工具与方法。[8]因此,建构面向未来的第五代教育评价,应基于数智技术重新认识教育评价的哲学基础,重构评价的理论框架与实践机制,才能延续教育评价促进人发展的本质,同时回应技术革新带来的范式挑战。
二、建构第五代教育评价理论的哲学基础
教育评价不仅是一种构建价值世界的认知活动,更是教育哲学的实践表达。[9]准确把握数智时代教育评价变革的哲学基础,从教育本质、社会交往、技术伦理三个维度,重新审视教育评价转向的意蕴,对于重构第五代评价理论体系至关重要。
教育的本质是培养完人,即把一个人在体力、智力、情绪、伦理各方面的因素综合起来,使他成为一个完善的人。[10]其哲学根基可追溯至马克思“人的自由而全面的发展”理论[11],人的发展是动态变化的过程,人的发展也是个体自主性完善的过程。因此,培养完人的教育具备两大典型特征:一是承认并顺应学生发展的过程性;二是尊重并保护学生发展的个性化。数智技术赋能的评价能够强化教育的过程性与个性化,因为大数据、人工智能技术能够记录学习全过程中的细节,解析个体独特的认知模式,从而使人的发展得以从抽象概念转化为可感知的数字化轨迹。
从社会学视角来看,哈贝马斯(Habermas)基于工具理性与价值理性折中而提出的交往行为理论为第五代评价建构提供了方法论基础。在哈贝马斯看来,没有理解也就没有交往,理解涉及三个方面:一是交往主体的理解在于其共通性;二是理解的客观性,即交往行为应遵循共同的规范要求;三是交互主体性内蕴着相互尊重的伦理要求,交往活动可以看作是一种合作化的活动。[12]这一观点为评价中的多元主体协同提供了理论支持。第五代评价本质上是教师、学生、家长、人工智能系统等多元主体通过“数据对话”实现共识的交往过程,其合法性并不取决于技术算法的精准度,而取决于交往过程是否符合交往理性,即数据传递的真实性、评价规则的正当性、主体表达的真诚性。
技术承载着人的生命成长,推动着教育评价数字样态的形成,带来了评价方法与工具的颠覆性变革。[13]在人与世界的相对关系中,技术发挥着居间调节的作用,它是现代人与世界之间的一个中介,用意向性公式表示为:“人—技术—世界”。[14]由此可见,技术既非评价的主体,亦非单纯的工具,而是连接评价主体与评价客体的中介。第五代教育评价模式应确立“有温度的智慧评价”原则:一方面,利用人工智能精准捕捉学习行为轨迹、自动化生成个性化反馈,增强评价的及时性与洞察力;另一方面,在算法治理中纳入伦理审查,确保数据使用的透明性、公正性与隐私保护,促使技术彰显人文关怀。
上述哲学层面的思索,揭示了数智时代评价从工具理性向价值理性回归的内在动力与外部需求,由此,笔者将第五代教育评价模式凝练为“智联共生性”评价。该评价模式以人的全面发展为核心目标,以数智技术为联结纽带,促成人机协同共生的交互生态,实现动态化、个性化、可视化的精准决策。
三、智联共生性第五代教育评价的理论框架
第五代教育评价不是对前四代教育评价理论的替代,而是延展和改造。 第五代教育评价以“数智”时代为标识,基于教育本质的完人培养、社会交往的主体协同、技术伦理的中介调节等视角的剖析,可从评价的理念、目标、主体、内容、方式、反馈等维度对传统理论框架进行系统性重构(图1),从而促进教育评价从第四代“共同建构模式”向第五代“智联共生模式”的范式转型。

(一)评价理念:“教—学—评—研—管”一体化的生态体系
智联共生性评价以数智技术的“融智”效能与多元主体的“共生”逻辑,构建覆盖教育全环节的生态系统,实现教育评价促进人的全面发展的终极价值。在此体系中,评价并非孤立、割裂的存在,数智技术作为关键连接纽带,驱动教学活动、学习过程、评价反馈、教研创新与管理决策深度交织融合。智联共生性评价的重要意义在于突破传统评价的孤立性,使评价不再局限于教学末端的终结性诊断,而是依托数智技术构建“教的优化、学的支持、研的深化、管的协同”动态循环机制,促使数智工具切实服务于育人本质,彰显工具理性与价值理性相统一与“教—学—评—研—管”五位一体的评价理念。以课堂教学应用场景为例,智能系统动态采集教与学的数据,经模型运算处理后,将评价信息通过可视化工具转化为教学诊断依据,教研团队依托评价数据开展行动研究,最终促成精准化的教学管理决策。
(二)评价目标:以素养为核心的全面发展与个性成长
“评价不是为了证明,而是为了改进”的目的论,依然是第五代评价的根本遵循,它将促进学生全面发展与个性化成长作为核心目标,借助数智技术的赋能,实现教学过程的持续改进。此目标体系紧扣“完人培养”的教育本质,构建素养达标与个性发展的和谐统一。
以学生学业发展的评价为例,数字智能技术的应用能够精确追踪学生独特的学习路径和潜在优势,诊断学科核心素养与综合素养的实现程度,进而推动学业质量的持续提升,因而呼应了“强化过程评价”与“改进结果评价”的政策诉求。从个性维度看,通过大数据追踪学生的学习风格、优势智能,可形成差异化评价维度。例如,为逻辑智能突出者增设“思维拓展”评价维度,为运动智能见长者设置“实践能力”评价维度,并根据阶段性表现动态调整评价重心,真正实现“因材施评”,让评价始终服务于学生个性化成长的需求。
(三)评价主体:人机协同交互的多元化评价共同体
依据交往行为理论中的“交互主体性”原则,智联共生性评价模式因数智技术的应用,构建了人机协同的评价主体结构,形成了一个由人工智能与教师、学生、家长以及管理者共同参与的评价共同体。
在此体系中,各评价主体借助评价平台实现即时互动与数据互通,形成多元化交互的协同评价,同时各评价主体的权责又相互补充。其中,智能系统承担数据采集与初步分析,为评价提供客观依据;教师依托学业画像主导评价的教育性解读,确定教学改进方向;学生借助成长轨迹进行自我反思,制定个性化发展计划;家长通过家校平台补充校外成长证据,改进家庭教育;管理主体则基于聚合数据,优化课程与资源配置。
(四)评价内容:“认知—行为—价值观”三维一体的评估矩阵
智联共生性评价以素养发展作为完人培养的核心目标,突破知识本位桎梏,构建“认知—行为—价值观”三维一体的素养评价内容体系,回应数智时代对创新型、复合型人才培养的多元需求。
认知维度聚焦学科知识掌握与思维发展的评价。例如,借助人工智能作业分析系统,可精准诊断学生的知识掌握程度;通过课堂互动语义分析,可诊断学生思维品质中的批判性提问、逻辑推理能力。该评价维度不仅有利于夯实学生的学业基础,也为其素养发展筑牢基础。
行为维度聚焦学生的实践力与社会交往能力评价。依托物联网设备,数智技术可精准捕捉实践操作步骤、小组讨论贡献轨迹等行为流数据,为评价积累客观、连续的证据链,如手工制作活动中的工艺逻辑与创意表现、课堂上师生交往活动中的合作能力与冲突解决能力、体育运动中的动作规范性与熟练度等能力素养的评价。
价值观维度聚焦学生道德认知与价值取向评价。依托数智技术,可通过情境模拟系统捕捉学生在德育场景中的选择倾向、情感反应等行为数据,如公益活动中的参与度、团队任务中的责任担当表现等,为评价积累客观依据。当然,对难以量化的人文情感素养的评价,需注意保留教师的质性评价权,避免“唯数据”倾向。
(五)评价方式:数智技术量化分析与人文质性解读的融合
人工智能可根据人类提供的标准对多模态学习表现数据进行匹配和判别[16],这将引发评价方式的根本性变革,构成第五代教育评价与前四代评价之间最显著的差异。
智联共生性评价应创新“技术+人文”的混合评价方式,实现教育“全场景、全过程、全要素”的评价覆盖。例如,依托数智技术,通过智能教室音视频分析、作业系统痕迹追踪、校外实践扫码记录等无感式采集手段,在不干扰教学的前提下获取过程性数据,弥补传统评价数据碎片化的短板;运用知识图谱识别学生认知水平,计算其学习投入度,由人工智能按预设标准对多模态数据进行匹配判别,提升分析效率与精准度。
在数智技术定量分析的基础上,还应融合传统评价中定性与定量、过程与结果相结合的方法,组织多元主体开展协商式诊断与决策,通过教师解读智能分析数据、学生陈述自我认知、家长补充家庭观察,对人的全面发展作出综合性评估,以实现技术理性与人文关怀的有机统一。
(六)评价反馈:数字化诊断与人文化关怀的决策机制
智联共生性评价的反馈机制应强调个性化、发展性与行动导向性,以克服传统评价体系中重结果轻过程、重诊断轻增值的弊端。该机制的指导思想在于利用数智技术的数据分析能力与教育主体的人文阐释,将评价数据转化为促进个体成长的可视化分析报告。
评价反馈内容需通过算法模型的多维度分析,实现分层分类的反馈机制。对学生而言,反馈应以可视化形式展现个性化素养发展画像,明确学生的知识掌握状态、优势领域、待提升方向以及能力发展趋势与针对性发展建议,以促进学生自我认知;对教师而言,反馈重点应展示教学过程中群体表现特征和个体差异化需求,为调整教学策略提供数据支持,使教学更具针对性。
教师作为学生学习反馈的主导者,需积极探索增值评价,对技术生成的反馈内容进行教育性解释,将客观数据转化为符合教育规律的成长指导语,以避免数据呈现的机械性。同时,反馈应体现人文关怀,对暂时处于落后状态的学生,应重点突出其进步空间而非差距,并明确标注其已有进步的证据,以发挥评价的激励性功能。
四、智联共生性第五代教学评价的实践机制
智联共生性教育评价模式为解决传统教学评价中存在的数据分散、评价主体孤立等难题指明了方向。针对基础教育中的教学评价而言,评价理论本身并不能直接推动教学改进,只有构建一个结构化、程序化的实践机制,才能确保教学过程中评价信息的高效采集、深入分析与有效反馈。
(一)从数据治理视角构建教学全程的联通机制
数据治理机制是智联共生性评价模式的基础支撑,建议建立区域教育大数据中心、学校大数据中心、学科知识图谱、教师教学空间、学生学习空间的分级数据治理模型。通过数据的全场景采集、标准化治理和安全共享,进行数据关联与打通,实现评价数据从“静态分散存储”向“动态关联流动”的转变,解决数据分散难题,为科学评价提供完整、连续的证据链支撑。
如图2所示。数据治理需依托在线教学平台与智慧教室终端、移动终端、实验传感器等设备,在教学活动及循环跟进式行动研究过程中,利用智能识别、云计算、大数据挖掘等技术,无感式捕获教学全程中的文本、图像、音频、视频等多模态数据,以及作业、测试等结果数据。构建具有“标识特征”的工具模型进行信息转换,即进行数据清洗,将获取信息与学业素养水平关系赋值量化,建立“数据仓库”。其中,实现跨场景学习经历的追踪与融合,需要通过语义标注消除多源数据间的语义鸿沟,通过时空对齐和标签结构化实现数据间的语义关联,并通过嵌入数据中台实现智能调用。[17]最终,基于教学系统的评价分析模型生成个性化、可视化的学业质量画像,为教学管理决策提供数据支撑,从而实现“教—学—评—研—管”一体化的评价理念。

(二)从技术赋能视角研发数智化教学测评工具
数智化教学测评工具是实施智联共生评价模式不可或缺的先决条件。在评价工具的开发过程中,必须以评价目标为导向,解决传统评价方法中人工操作的烦琐性及主观偏差问题,从而为教学数据的应用提供坚实的教学测评的技术工具类型丰富。按工具的存在形态,可划分为硬件与软件两大类。硬件类测评工具以物联网设备为载体,通过传感、识别等技术实现数据采集,如可穿戴的智能手环、场景感知摄像头、实验操作测评仪等。软件类测评工具以程序或系统为载体,聚焦数据处理与评价分析,包括终端应用、云端系统、嵌入式模型等。
根据软件技术开发的复杂程度,可将测评工具分为专业级与轻量级两大类。专业级智能测评平台通常基于系统科学理论进行宏观架构,采用云计算、云存储、分布式处理技术,将教学过程中获取的多渠道、多模态数据进行快速存储、管理、整合、分析、反馈[18],这类平台可实现全域评价数据的深度挖掘与综合评估。轻量级测评工具开发应坚持“最小够用”原则,可根据特定评价任务进行模块化设计,实现快速部署,完成即时性评估任务。例如,图3为作者基于“豆包”大模型开发的三款教学评价智能体,基本满足了教学过程中的相关评价需求。

(三)从应用转化视角促成“四个评价”的落地生根
教学评价的主要目标是促进人的发展与教学改进。将数智技术作为多元主体对话与交流的媒介,可构建一种人机协同的评价结果应用转化机制,即按“精准诊断—策略生成—策略执行—效果检验”的转化路径,促进评价目标的达成。下面从“四个评价”的国家需求提出人机协同的具体实施方法。
在改进结果评价方面,数智测评系统整合多模态数据,智能识别学生的认知薄弱节点与素养达成水平;教师结合教学经验对评价数据进行教育性解读,将结果评价从量化的分值、等级判定转化为改进方案。
在强化过程评价方面,智能技术搭建实时交互的过程记录体系,形成可视化成长轨迹;教师通过人机交互界面标注关键教育事件,补充技术无法识别的质性信息,让评价既实现全流程数据监控,又保持教育的价值观引领功能。
在探索增值评价方面,智能算法基于起点数据建立个体增值模型,精准测算不同阶段的进步幅度,教师则关注知识增长与能力提升的程度,通过交互系统提出发展建议,使增值评价从抽象概念转化为可操作的方案。
在健全综合评价方面,数智技术系统能整合学业表现、社会实践、身心发展等跨领域数据,生成多维度的综合素养评价画像;教师通过人机协作界定指标权重,平衡学生全面发展与个性发展的关系,实现综合育人的目的。图4所示为“南京市晓庄小学苹果树评价系统”的应用端示例,是德、智、体、美、劳五育融合的综合素养画像。

(四)从保障支撑视角建立健全可持续的制度体系
智联共生性评价模式的长效运行,需建立强有力的制度保障体系。创新智联共生性评价模式的评价标准、评价流程、评价质量监控等制度,是第五代教育评价体系建构的紧迫任务。
评价标准制度需构建技术适配与教育适配的双维框架。在技术维度,明确数据采集的标准化规范,包括多源数据的格式规范、标签体系及关联规则。在教育维度,须将核心素养发展目标转化为人机协同的操作指标,避免技术标准与教育目标脱节。
评价流程制度应设计人机协同的管理机制。在数据采集环节,明确智能终端自动捕捉与人工采集信息的分工;分析环节规定技术初步诊断与教师解读的衔接规则;反馈环节建立智能推送与人工调适的双轨输出机制。通过以上各流程节点的权责划分,可实现技术效率与教育属性的有机统一。
评价质量监控制度需建立数智监测与专业评估相结合的校验体系。数智层面,通过算法实时监测数据完整性、分析偏差度等指标;专业层面,组织评价专家定期开展教育适切性评估,重点审查评价结果对教学改进的实际价值;同时,建立质量异常预警机制,确保评价过程的科学性与结果的公信力。
上述实践机制相互关联、相互支撑。其中,数据治理是基础,测评工具是载体,应用转化是目的,制度体系是保障根基。只有四者协同运作,才能确保智联共生性评价模式得以有效实施并发挥其应用价值。
最后,需要指出的是,教育评价是一把“双刃剑”,既有认知、说明、比较、激励、改进、提升等正向功用,也有导致工具化和功利化、加剧趋同化和分化等消极影响。[19]在数智时代重塑教育教学评价范式的过程中,需谨防重技术赋能轻理念重构、重数据规模轻隐私泄漏、重算法依赖轻人文关怀、重数据关联轻因果论证等风险。尤其要警惕将数智技术作为应试教育的增强工具,而忽视教育评价的终极使命是激发每个生命独有的创造之火。
参考文献略
本文系江苏省2023年度高等教育教学改革课题“‘教—学—评—建—管’五位一体的数字化教学质量保障体系研究”(课题编号:2023JSJG480)、江苏省教育科学“十四五”规划 2021年度重大课题“未来学校建设研究”(课题编号:A/2021/05)的研究成果
(来源:基础教育课程/朱雪梅 南京师范大学教师教育学院教授、博士生导师,南京师范大学数字教育研究中心主任)