评价是人类日常生活中与价值相关的普遍活动。就学前教育质量评价而言,评价是面向国家、区域、托幼机构,还是面向项目、班级、教师、幼儿,是指向群体的平均、众数趋势,还是指向具体、鲜活的个体,是定位于笼统的、跨情境的、宏观行为的个体,还是定位于情境性的、微观行为发生的、单一个体的不同测量层级,其中的技术路径与价值旨趣有相当大的差异。面向教育评价对象宏观、中观、微观的不同群体、层级,有不同的评价价值取向和技术路径。学前教育质量评价因此形成了有内在关联的脉络。
◆要素质量及其逻辑
要素质量与政府的宏观管理,特别是财政投入、绩效管理有很大关系。在质量准入方面,教育机构达到什么样的条件可以举办,是最低教育质量的前置性条件。近年来各国政府普遍制定较为严格的机构准入条件或资质标准,将其直接与政府拨款、监管相结合。政府推动下的要素质量评价的基本逻辑是:准入门槛的设立要审慎,根据行业必不可少的最低标准对教育机构进行规定准办或不予准办的许可鉴定,在此基础上根据各标准维度中的项目指标做出判断和区分,并以此作为政府或基金会拨款、奖励或处罚的依据。
◆指向情境教学共同体的过程质量评价
基于过程的发展性学前教育质量评价的出发点在于发现质量问题,提高质量水平,提高质量保障水平。它重视的是在具备基本要素的基础上,不断优化配置各要素资源,使要素组合达到最佳效果。这种发展性评价一般需要现状或基线诊断,由专业人员参与,发现问题,制订改进计划,评价达成效果。这种评价的每一个阶段都需要评价工具的支持。
在过程性发展评价工具中,颇有影响力的是美国北卡罗来纳大学儿童发展研究所哈姆斯(Harms)等人研制的《幼儿学习环境评价量表》(Early Childhood Environment Rating Scale, ECERS),是过程质量评价工具的典范。〔1〕在我国,浙江师范大学李克建教授领衔的团队用5年时间形成《中国托幼机构教育质量评价量表》(Chinese Early Childhood Environment Rating Scale, CECERS)。这两份量表在理念、方法层面都是基于过程的发展性评价,但在内容方面有很大的不同。《中国托幼机构教育质量评价量表》三分之二的项目是在中国情境下重新编制的,等级基线也进行了相应调整。
值得注意的是,这两份量表的理论依据之一是“环境即过程”。这里所说的环境不是指一般的“环境”(Environment)。按照人类发展生态学者布朗芬·布伦纳的理论,环境是物理环境、人际环境、社会文化环境的嵌套整合,是动态的过程。〔2〕在要素质量评价中,班级规模、师幼比、教师资格都是核心要素。《幼儿学习环境评价量表》和《中国托幼机构教育质量评价量表》在关注这些要素的基础上更关注教育现场中的师幼比、教师离职意愿与专业幸福感,强调这些才是核心要素的过程体现。这两份量表更多关注的是一日生活、游戏、教学、户外等各类活动的设计、组织、实施,关注各类活动过程中的师幼互动、同伴互动等过程质量表现。这些过程质量维度能够更有效地预测儿童的语言、认知、情感-社会性等方面长期、持续的发展结果效应。〔3,4〕正因为如此,许多国家在学前教育质量评价方面高度重视过程质量指标体系的完善,过程性发展质量评价成为热点。
要素质量评价适用于宏观管理和比较。班级过程质量评价聚焦托幼机构教育基本单位的教学过程,指向质量的责任主体与质量过程环节。不过,班级过程质量难以刻画每个婴幼儿发展中的教育增值,这使得微观质量评价成为必然。班级过程质量与微观质量的评价存在怎样的内在关联,经历了怎样的演变?
◆班级过程质量研究的兴盛
进入21世纪以来,针对班级过程的师幼互动质量评价一直是热点。弗吉尼亚大学教学高级研究中心的皮厄塔(Pianta)等人研制了《班级评定计分系统》(Classroom Assessment Scoring System, CLASS),用于班级过程互动质量评定。《班级评定计分系统》建立在经典儿童发展理论的基础上,假定班级教育质量的维度是普适的,能够跨越年龄和文化的界限。〔5〕它已成为国际质量评价的常用工具。
我国幼教实践也开始重视班级过程质量评价,在基于现状的基础信息数据收集的同时,采用《班级评定计分系统》《中国托幼机构教育质量评价量表》进行班级质量信息采集,在质量平台进行分层组合式分析,强调区域目标、园所目标与班级质量目标的指标体系间的层级关联,改进措施层层嵌套,层级转换十分清晰,为下一步人工智能平台支持的质量改进开辟了试验田。
◆使能性评价理论的兴起
使能性评价以人本主义需要层次理论、团体动力学理论、积极心理理论、行动理论为基础,是一种发挥人的积极性、能动性的学前教育质量评价新取向。〔6〕使能性评价的价值追求是在评价中实现个体的自我帮助,使用自我评价来反思,通过自我行动来改进项目。在使能性评价中,项目或行为当事人是评价的主体,进行的是自主评价,外部评价者只提供建议或指导。使能性评价创造了一种有利于赋权和自我决定的氛围,最大限度地鼓励当事人广泛参与,在开放的讨论中多方位审视所面临的问题,提高评价过程中的民主参与度。评价不是最终目的,而是项目或行动发展中的一个组成部分。
◆使能性评价理论下的微观质量改进尝试
斯坦福大学系统开展多项使能性评价实践探索,其中斯蒂番克(Stipek)和拜勒(Byler)研制的《幼儿班级观察测量》(Early Childhood Classroom Observation Measure, ECCOM)在学前教育领域有较大影响。《幼儿班级观察测量》研制的主要目的是调动保教人员的内在积极性,让教师关注、反思自身的教育活动。《幼儿班级观察测量》的独特之处是能够反映每个班级在儿童中心、教师引导、儿童支配三个维度上的变化及其混合模式。相关效度验证研究表明,该量表的观察评分结果与班级教师自我报告的教育实践、教学目标、师幼关系、对儿童独立学习能力的评价结果存在相关性。〔7〕
满足微观质量评价需求的使能性评价有独特魅力。(1)质量评价成为保教人员自我肯定的理由。使能性评价使保教人员每天都在评价自己的活动与行为,并在过程中结交专业伙伴或心灵朋友,在过程中实现自我肯定。(2)积极地、建设性地改变专业生活。使能性评价扎根于日常保教实践,是一种专业生活体验,能够增进保教人员对专业生活的理解,从多个视角审视专业生活或行业变革的多样性,为评估情境、感受生活、发展专业提供机会。(3)人的因素成为质量改进的最大资源。正如菲特曼所言,“一个有魅力的、经过良好锻炼的、尽责且受欢迎的项目成员或参与者具有不可估量的价值”。〔8〕
可见,使能性评价是基于微观过程中各种积极力量的识别与调动,激发主体意识的能动质量改进过程。有效的教育从根本上讲是“自我教育”“内部能动教育”,有效的评价依赖于调动当事人的正能量,不断激发当事人的各种活力,推动当事人去完成个人、集体与组织的使命。
◆微观质量量表体系构建的理论依据
微观质量量表体系编制以动态系统理论和微观发生学为理论指导。动态系统理论强调以动态的视角来看待质量的发展,班级中每个幼儿都是不同的,与教师的互动也是不同的。整个班级作为一个系统,班级中的个体在这个系统中各自受到什么样的影响,是微观质量评价关注的问题。微观发生学的基础是发生认识论,强调以发生学的观点和方法来观察、分析行为的发生、发展、变化,以获得完整的行为链,发现关联行为间的循环发展轨迹,并判断其速率和审视其变化特征。按照上述原理,教师需要在动态中观察教育情境中的幼儿的发展轨迹。幼儿在一日生活中体验到了什么,幼儿和他人形成什么样的互动关系,教与学存在什么样的关联状态,是三大观测轴线。
◆微观质量量表体系构建的实践动因
微观质量量表体系以环境评量表体系为构建基础,保留和延续了环境评量表体系的基本理念。(1)环境即过程的全方位质量观,教育过程是教育者与受教育者在物境、心境、人境、我境中交互作用的过程。(2)要素质量是过程质量的简约体现,结果质量依存于过程质量。(3)质量评价需要在具体情境中观察与判断,情境中的行为表现是质量信息的第一来源。在此基础上,微观质量量表体系的测量方式开始由过程性班级群体质量转向个体微观质量,不仅关注整体的过程质量,更关注每一个幼儿在班级中接受教育时的具体行为表现,关注教育情境中每一个幼儿所持续形成的师幼互动和同伴互动,关注每一个幼儿在一日所有活动中稳定的微观发展状态。
萌发研制微观质量量表体系的原因主要有两个。一是环境评量表体系尽管关注了过程,但关注的并不是每一个个体的稳定行为过程,无法有效支持一线教师全面、公平地改进、提升质量。二是过往研究已发现班级质量和幼儿发展之间是低相关、弱相关的,因而测量方式急需改进,以使保教质量体现在每一个幼儿身上。〔9〕在现实中,教师意向中的质量与实际表现出来的质量是不能画等号的。幼儿在班级中学习和游戏,通过与材料、同伴、教师的互动来获得发展,而教师很难完完全全照顾到每一个幼儿。与此同时,幼儿自身的性格和发展都会与他人有所不同。这些因素深度影响要素质量与过程质量,从而引出环境评量表体系和微观质量量表体系最大的不同:环境评量表体系是每个班级的所有幼儿共有一个总分,而微观质量量表体系是每个班级有多少幼儿就有多少个分数。
◆微观质量量表体系的构建原则
在编制微观质量量表体系的过程中,教师的指导状态和幼儿的经验、行为状态这两条线一直蕴含在各个条目中,贯穿6个子量表22个条目的始终。基本原则如下。
1.幼儿发展优先原则
促进幼儿发展既是出发点,又是目的,体现为保育环节和活动/游戏环节处处重视幼儿本位。在保育环节,关注幼儿的行为自觉、独立自理能力,如如厕、洗手、吃饭、午睡时,关注幼儿的自主、独立能力,辅之以教师的提醒、引导、帮助。在活动/游戏环节,关注环境、材料对不同幼儿的适宜性、可及性以及与幼儿能力水平的匹配性,关注教师对具体幼儿指导的针对性、有效性、显著性、隐含性、即刻性、长远性的统一,关注幼儿一周内经验的连续性、变换性、统整性。
2.复杂师幼关系赋能原则
过程与微观质量评价中最复杂的是活动中显性与隐性的师幼关系。在一日生活中,教师的一对多和幼儿的多对一都是相对的,语言与非语言对每个幼儿的影响是异常复杂的,如统一指令性语言与针对性建议语言、督促与引导、赞许与批评、默认与允许等存在相互渗透、相互转化等非常复杂的关系。评估的基本原则是赋能,即增强正能量、抑制负能量、唤醒潜能量、统整储能量。
◆微观质量量表体系的项目精细化分析框架与编码
在儿童发展研究中,基于情境和跨情境的单一项目或精致项目测量体系已建立,成为社会测量的新宠,在量表编码架构、数据统计分析、信效度检验等方面已逐渐形成体系。〔10,11〕微观质量量表体系就是在这样的背景下建构的。
微观质量量表体系在人际、师幼互动中建立了拓扑性单一项目关联体系,将正统的师幼互动显性行为进一步拓展到隐含层。所谓项目精细化分析就是将项目指向情态观察,追踪到全覆盖、无死角,是情态的拓扑全维统整。〔12〕在师幼互动中,传统观察只关注“眼睛可看到”的互动存在与否,是一个单维二分下再连续的编码体系,而微观质量量表体系实现了嵌套多维体系的统一,如宏观与微观、意向与无意向、一致与不一致等的统一。
微观质量量表体系在多维统合观下实现测量编码全覆盖、全时态、全层级、全空域、全息态。以集体教学活动中的师幼互动为例,在教师的教学行为发出后,传统的对幼儿的编码分类有两种,分别是幼儿的反应(显性行为)与不反应(非可见性反应),但在微观质量量表体系中,“非可见性反应”至少可以嵌入三个亚码(次代码):Ⅰ型,受影响自知而不马上反应,表现为在当时没反应,但在其他场合(如在同伴、家长面前)反应显著甚至反应过度;Ⅱ型,受影响而不自知, 表现为教学产生了影响,只是当事人不会表达或隐藏在潜意识中;Ⅲ型,确实未产生影响。在真实的集体教学活动中,具有Ⅰ型、Ⅱ型反应的幼儿不在少数。对于Ⅰ型反应,有专业素养的、关注细节的教师比较容易发现。对Ⅱ型、Ⅲ型反应的辨别则是个严谨的科学问题,在即时条件下的判定可以依据眼动数据、脑电指标,而在累积条件下的判定则需要借助幼儿人体节律的生化指标。年龄越小的婴幼儿,心理理论、执行功能越弱的婴幼儿,出现Ⅱ型反应的可能性越大。因而,微观质量量表体系不仅需要以认知神经科学、神经生物学为理论基础,更需要得到分子、细胞机制意义上的现代微观生物教育学的支持。
微观质量评价需要适时采集每个学习者受教育过程中的行为。这种行为是多层面、整合、连续迭代的。行为采集中的海量存储、传输、分类、编辑、模式识别、系统分析、比较提取等数据计算问题需要一揽子解决方案,需要大数据、云计算、系统集成思维方式,将面向每个婴幼儿发展的教育公平价值理念落到实处。
◆微观质量评价的价值传播与实现
微观质量评价价值观是在特定的评价条件和文化背景下,对评价过程中价值关系的理解和把握。微观质量评价不仅关注评价行为本身,也关注对象行为与关联背景,强调评价关系性思维,有本体论意义。本体论意义的评价价值是评价主体与评价客体之间一种特定的意义关系。在评价活动中,评价主体总是根据自己的需要掌握和控制客体,利用客体的属性满足评价需要。在评价主体与客体间的这种关系中,主体按照评价目标对客体及其属性进行选择、利用和改造以满足主体需要的过程就是微观质量评价价值关系。〔13,14〕
◆微观质量评价的公平向度与微观测量的并行分布技术
在普遍意义上的教育观念中,教育公平指三个方面:受教育的机会公平、受教育的过程公平、受教育的结果公平。这三个方面在评价中如何落地呢?要素质量评价可以评价教育资源配置的机会公平,班级过程质量评价可以评价学习过程中的班级均势或众势公平,发展性增值质量评价可以评价教育的结果公平,但所有这些评价都是外在、客观、绝对量的评价。当代教育评价更需要基于每一个个体需求的恰当满足状态的评价,即微观需求满足的评价。在教育过程中,教师并不需要平均地分配精力给每个幼儿,而是应当适宜地满足每个幼儿,唯有此才是教育公平的微观落地。这一需求呼唤微观质量评价中的并行分布技术。并行分布技术是一种系统集成,至少需要多通道分布式识别-捕获、并行传输、海量存储、混合文本分析及统计、多层网络分析等技术。这一新型智能体应以不确定性人工智能模型及算法为基础。基于个体的过程性微观质量测度具有明显的不确定性,微观质量评价就是要在不确定性中发现、寻找确定性,并从经验、事实中模型化、算法化、技术集成化。李德毅院士的团队进行了多年的探索,已在不确定性推理的分布特征中建立多种云模型。这些云模型能够实现多智能体的并行交换、网络交互、大数据随机进入分层计算、群智能体分布式交互等多种功能。〔15〕
◆微观质量评价主体精准激发与项目精细化分析技术
从专业化与制度人本化取向看,随着学前教育教师专业化水平的不断提高,在评价中精准激发主体活力的项目精准化至为关键。项目精准化指测量领域的目标导向层次递进、层层嵌套,指向精准目标层,不偏移不游离,形成迭代转换的信息链。
学前教育质量评价涉及多主体与多客体间的复杂关系。在过程质量评价中,保教人员既是主体又是客体。在使能性评价中,传统的主客体关系又转变为交互主体关系。因此,质量评价必须考虑主体的需要和利益,必须把主体的需要和利益作为内在尺度运用于评价的客体。婴幼儿不能准确表达自身的真实想法,在传统观察测量中只能以客观行为表现为测量指标。随着非侵入式脑-机接口技术的快速发展,特别是空域滤波与时域滤波纠偏技术的突破,师幼间脑-机、幼幼间脑-机、区组间脑-机的信息交互信-噪比大幅提高,为客-主观的信息转换奠定了技术基础。未来脑-机接口技术有望实现婴幼儿从分子、细胞、组织-系统生理特点到行为、社会、文化间的多层级、跨个体快速转换,真正获得多层级、全域性“完整儿童”,以及婴幼儿特定时空所思所想的信息。从方法层面看,脑-机接口技术有望填平观察测量与实验测量、现场研究与实验室研究的鸿沟。〔16〕到那时,我们可以自豪地说,“了解了儿童些许”。
◆微观质量评价的多层次整合与大数据下的智能感知
在智能化微观质量评价技术体系中,若不了解智能感知的前沿科技,就难以理解微观质量评价技术观测项目精细化的颠覆性意义,也难以理解“面向每个婴幼儿发展的微观质量评价”愿景。智能感知的核心是生物传感技术、综合传感技术与人工智能的智能体单元(Agent)集成。综合集成性传感技术的突破在微观质量评价领域的应用是成熟技术的跨行业迁移和个性化、精准化再造。
强人工智能具有适应性、自主操作性、决策性、深思熟虑性等智慧特征,属于结构-机制表征型人工智能。一个强大的智能感知系统必然要得到大数据下的强人工智能信息加工系统的支持。人工智能支持下的微观质量数据采集呈几何级数增长,其标记点要求覆盖班级全域个体,实现全时空生成性获得,具有大数据的多层级、大范围交叉覆盖特征。这种生成性迭代的数据特征与师幼关系的复杂性、早期儿童发展的快速变化性、偶然生成性、发展不确定性相匹配。
◆微观质量评价的多元包容与开放共享平台建设
对于婴幼儿教育质量评价领域而言,以使能性评价为核心理念的微观质量评价不是对要素质量评价、结果质量评价、班级过程质量评价的扬弃,更不是否定,而是特定环境条件下特定需求满足的延展,体现了不同质量发展阶段评价重心的不同和评价价值实现方式的不同。〔17〕不论是评价理念的平等、包容与主体性激发,还是技术层面的网络开放、数据共享、资源共用,都为包容、开放、共享的微观质量平台建设创造了条件。
微观质量评价的完整落实除了需要并行分布技术、项目精细化分析技术、智能感知技术、大数据云计算技术的支持外,区域教育概念与整体发展水平、园所发展水平、班级整体团队水平、教师专业积淀及发展水平、家园合作水平及家庭教育发展水平都是实施微观质量评价的强约束条件。因而,实现理想的微观质量评价是一个长期的过程,是从理念到行动、制度到文化、技术条件到人的素养、组织发展到教师专业发展等不断累积的过程。
参考文献:
〔1〕HARMS T,CLIFFORD R M,D CRYER.Early ch?
ildhood environment rating scale(revised edition)〔M〕.New York:Teachers College Press,1998.
〔2〕HARMS T,CLIFFORD R.Infant and toddler environment rating scale(third edition)〔M〕.New York:Teachers College Press,2015.
〔3〕BURCHINAL P,KAINZ K,CAI K,et al.Research?to?policy & research?to?practice brief : Early care and education quality and child outcomes〔EB/OL〕.〔2021-01-12〕.http://www.childtrends.com.
〔4〕〔9〕LI K J,ZHANG P,HU B Y,et al.Testing the “thresholds” of preschool education quality on child outcomes in China〔J〕.Early Childhood Research Quarterly,2019,
47(2):445-456.
〔5〕PIANTA R C,et al.Classroom assessment scoring system manual toddler (class toddler)〔M〕.Baltimore,MD:Broo?
kes,2008.
〔6〕FETTTERMEN D M.Theme for the 1993 annual meeting:Empowerment evaluation〔J〕.Evaluation Practice,1993
(1):115-117.
〔7〕STIPEK D,BYLER P.The early childhood classroom observation measure〔J〕.Early Childhood Research Quarterly,2004(19):375-397.
〔8〕FETTTERMEN D M.Foundations of empowerment evaluation〔M〕.Thousand Oaks,CA:Sage,2001.
〔10〕LINACRE J M.Investigating rating scale category utility〔J〕.Journal of Outcome Measurement,1999(3):103-122.
〔11〕〔12〕〔13〕COLVIN K,GORGUN G,ZHANG S.Assessing the reliability of single?item measures〔R〕.Toronto:The Annual Meeting of National Council on Measurement in Education,2019.
〔14〕FETTTERMEN D M,KAFTARIAN S,WAND?
ERSMAN A . Empowerment evaluation:Knowledge and tools
for self?assessment and accountability〔M〕.Thousand Oaks,CA:Sage,1996.
〔15〕李德毅,杜鹢.不确定性人工智能(第2版)〔M〕.北京:国防工业出版社,2016.
〔16〕BERNHARD B,ALLISON B,GERT P.脑-机接口:革命性的人机交互〔M〕.伏云发,郭衍龙,等,译.北京:国防工业出版社,2020.
〔17〕秦金亮.全球背景下学前教育质量评价与发展路径〔J〕.浙江师范大学学报(社科版),2017(2):1-9.
图文编辑/周珊
⊙文章版权归《幼儿教育·教育科学》所有,欢迎转发朋友圈,如需转载请后台输入“授权”。
文章转载自微信公众号:幼儿教育杂志
文章转载自公众号:幼儿教育杂志