关于核心素养新课程标准(核心素养评价的质量标准)
关于核心素养新课程标准(核心素养评价的质量标准)国际上关于教育评价内容的研究经历了三个阶段。第一阶段,将教育评价的内容聚焦于任务的分解或者行为的描述。美国、英国和澳大利亚等国运用基于任务的分析方式将评价内容解构为若干行为化的子任务,这导致了基于技能的教学和培训的出现。第二阶段,将评价内容聚焦于一般的、稳定的和具有情境独特性的有效行为表现。这种观点的问题在于:一方面,具有情境独特性的核心素养是否真实存在;另一方面,完全属于特定领域的专业知识和技能是不存在的。第三阶段对评价内容的认识更加综合,即认为评价内容是核心素养各因素与其所在情境的复杂整合而成的。这种观点与社会建构主义理论遥相呼应,即认为知识具有情境性,有意义的学习行为和知识运用应该在真实情境中进行。更重要的是这一阶段的评价内容注意到了核心素养的情境性和评价的相对稳定性。然而,在核心素养背景下,评价内容的整合性、情境性以及相对稳定性使得任何单一的评价方式都无法达到评价目的。这在很大程度
作者
雷浩/华东师范大学课程与教学研究所副教授;
崔允漷/华东师范大学课程与教学研究所教授,所长
我国乃至全球教育正由教师中心向学习者中心转变。这种转变要求教育不再只是传递孤立的知识和技能,而应该转向培养学生的核心素养。然而,判断学生的核心素养是否得到了发展或者发展水平怎么样,这需要通过评价来实现。当前,学习者中心教育理念要求评价必须为学生的学习服务,即评价不仅为学生的学习提供反馈还要为学生的学习提供方向指引。而在现实中,传统的知识点测试仍然占重要地位,其能够将知识和技能进行解构,进而描述教学、学习和评价的具体类型以及这三者之间的一致性,譬如,知识点传授的教学目标、死记硬背的学习与事实性知识的测试之间的一致性。然而,由于核心素养具有整体性,因此,传统的重视知识和技能分解的评价方法无法全面揭示核心素养的内涵,即传统测试已经严重滞后于核心素养评价。鉴于此,本研究在分析核心素养背景下教育评价发展趋势的基础上,修订传统评价的质量标准和整合真实性评价、表现性评价等新评价的质量标准,进而建构出核心素养评价的质量标准,以便为后续开展有效的核心素养评价实践提供保障。
一、核心素养评价质量标准研究的背景
(一)评价质量观:强调评价的客观性和评价过程的学习意义
评价质量观主导着评价方向问题的解决,不同的评价质量观对应着不同的评价质量标准。传统评价质量观强调测量结果的客观性,最为典型的就是以信度和效度作为评价质量的唯一标准。然而,核心素养时代更加关注评价的整体性和情境性,信效度无法满足这一要求,由此,以重视评价过程意义为标志的教育计量评价方式出现了。这两种评价方式最大的差异是其背后的评价质量观,即心理测验的评价质量观关注的是信效度等客观指标,而教育计量关注的是让学习者形成有意义的学习经历、给予学习者有用的反馈以及刺激学生对学习过程的渴望。信度的基本获取路径是以标准化或者测量的方式来实现,而要实现教育计量学的评价必须依靠至少部分依靠人们的观察。心理测量和教育计量评价方式是一个评价天平的两个极端,核心素养时代的评价质量观既应该关注评价本身的意义,也应该注意到评价的客观性。
(二)评价内容:由关注任务分解和行为描述走向对核心素养整合性、情境性和相对稳定性的关注
国际上关于教育评价内容的研究经历了三个阶段。第一阶段,将教育评价的内容聚焦于任务的分解或者行为的描述。美国、英国和澳大利亚等国运用基于任务的分析方式将评价内容解构为若干行为化的子任务,这导致了基于技能的教学和培训的出现。第二阶段,将评价内容聚焦于一般的、稳定的和具有情境独特性的有效行为表现。这种观点的问题在于:一方面,具有情境独特性的核心素养是否真实存在;另一方面,完全属于特定领域的专业知识和技能是不存在的。第三阶段对评价内容的认识更加综合,即认为评价内容是核心素养各因素与其所在情境的复杂整合而成的。这种观点与社会建构主义理论遥相呼应,即认为知识具有情境性,有意义的学习行为和知识运用应该在真实情境中进行。更重要的是这一阶段的评价内容注意到了核心素养的情境性和评价的相对稳定性。然而,在核心素养背景下,评价内容的整合性、情境性以及相对稳定性使得任何单一的评价方式都无法达到评价目的。这在很大程度上呼唤多元评价方式的整合。
(三)评价范式:由测试走向多元整合
评价目标决定着评价范式的转变,传统评价的一致性是通过解构学习目标来实现,而核心素养背景下的一致性则更关注整体目标与学习、教学、评价之间一致性,这必然要求评价范式的转型。正因如此,学者们呼吁评价应该从测试文化走向评价文化。第一,从内容上看,测试文化针对低水平的知识和技能,而评价文化指向核心素养的多维度本质。第二,从学习过程看,测试文化中对学习过程的评价是孤立的,主要关注学习结果;而评价文化认为学习和评价有内在联系,其不仅仅聚焦于学习结果,而且还关注学习过程。第三,从功能上看,测试文化中评价被看作是终结性评价;而评估文化中,终结性和形成性的功能是相互补充的,并且评价变成了评价和反馈的连续循环体。第四,从情境性上看,评价从脱离情境向着真实情境中的有意义和感兴趣的学习经历动态过程转变。第五,评价方法发生了变化。测试文化中最常见的评价方法是标准化测试,而评价文化倾向于运用整合的多元评价,譬如,表现性评价和档案袋评价等能够被用于不同的组合。第六,评价的责任主体发生了变化,即从教师作为唯一主体到强调学生对自己的学习和评价过程负责任。因此,指向核心素养的评价方式是多元的。
从测试文化到评价文化,出现了很多新的评价方法,这些新方法有时候被称之为“替代性评价”。但是,这一术语并不恰当,因为它隐含着用新评价来替代传统评价。核心素养时代的评价方式应该是多元的,不管它们是来源于测试文化还是评价文化,因为核心素养时代并不是完全避开对基础知识和基本技能的评价。需要说明的是,本研究不是试图解决测试文化和评价文化之间的争论。相反,本研究认为:将新的评价方法作为核心素养评价的唯一路径是不明智的;测试文化和评价文化中的评价方法是相互补充而不是相互矛盾的。在此,本研究将核心素养评价方式统称为是整合的多元评价方式,它能够整合传统和最新的评价方法。
二、核心素养评价的质量标准内容
(一)核心素养评价质量标准的开发路径
当前背景下的评价质量观、评价内容和评价范式均要求核心素养评价也是一种多元评价,但是核心素养评价的质量标准并无定论。然而,既往研究者为开发核心素养评价的质量标准提供了三种路径:其一,随着评价方式的多样化,拓展评价的质量标准非常必要。其二,核心素养评价的质量标准可以保留解释经典测量理论关于信度和效度的本质意义,并且探索合适的方法将其与其他评价方法的质量标准进行整合运用。其三,更新信效度的内涵,将其运用到新评价中,即不应该否认新评价仍然具有信度和效度。
上述三种路径中,第一种路径只是说明需要拓展核心素养评价的质量标准,但是具体如何做没有说明;第二种路径是通过对传统评价的质量标准和新评价的质量标准进行整合来开发核心素养的质量标准;第三种路径则是通过更新传统评价的质量标准,并将其纳入新评价的质量标准中。那么究竟采用第二种还是第三种方式开发核心素养评价质量标准呢?就核心素养评价的质量标准而言,传统评价中的信度和效度概念并不是从根本上就是不正确的,而是对于核心素养评价来说,传统的信度和效度作为标准是不充分和不全面的,需要建构核心素养评价的质量标准,应该将更新后传统评价的质量标准与新评价的质量标准进行整合,而不是将更新后的信效度概念纳入新评价的质量标准中。
(二)传统测试质量标准在核心素养时代的新内涵
传统测试的信效度标准在核心素养评价中需要进行重新理解。
信度是关于结果在不同时间、不同情境和不同评价者中出现的相似程度。经典测量理论中,信度是关于准确度的测量,如运用重复测量或者是分半的方法。经典测量的目的在于对学生作出区分。但是,核心素养评价中,评价不是区分学生或者把学生与其他人(常模参照评价)作比较,而是来判断学生是否合格(标准参照测验)。与传统的测试相反,核心素养评价一直要求有领域专家的判断,然而,核心素养评价信度的主要疑问也在此,即这一信度仅仅依靠人们的主观判断是否科学。因此,信度通常采用评价者之间的协商或者是评价者间信度作为指标。
总之,信度的本质是不同的情境和评价者的一致性,它仍然能够保留在核心素养评价中,但是由于核心素养评价与传统教育评价的本质不同,那么在实际运用中需要对信度内涵进行修改。一方面,多元评价应该实现评价者之间以及评价方法之间的一致性,这意味着对学生的评价应该基于多个评价者、多种场合、多种情境和多种方法最终(高利害)决定(即决策的可重复性)。另一方面,核心素养评价是真实情境下实现的,比如在学习或者工作场所的评价是能够基于一系列真实任务来进行的,虽然这与上面的评价不完全一致,但是关键特征是一致的。这种信度是指向同一主题和目的的一致性(真实性)。上面两种质量标准应该被纳入核心素养评价的质量标准中。
效度有多种定义。美国教育研究学会认为,效度是评价中所使用的理论和方法对评价内容的支持程度。虽然很少有人会怀疑这一效度定义或者忽视它的重要性,但在现实中考察效度的标准有很多。凯恩认为效度经历了从“基于效标的模型”到“构念模型”,他赞同基于证据的方式来实现效度。关于构念效度的权威理解当然是麦西克,其建构了构念效度的分析框架,他认为构念效度是一个统一的和整体的效度概念,其包括六个方面的内容:内容效度、实质效度、结构效度、结果效度、外部效度和可推广性效度。
总之,效度定义有很多,但是效度概念的多样性和复杂程度使其很难在实践中一一实现。因此,必须建立新的效度分析方法,效度的实现有如下两种方法。其一,基于证据的方法实现效度。虽然这种方法是通过收集证据资源以证明效度的有效方法,但是各种效度本身并没有清楚的界定,研究者不知道该收集哪些证据。其二,建立一套经得起检验的质量标准。本研究中核心素养评价的质量标准可以解决这一问题。效度还应该关注现实中评估工具的正确使用。那么这就意味着实践者或者应用者对评估工具的运用很大程度上决定了评价的质量,因此,评估工具的发展和检验离不开相应的情境(真实)。
综上所述,信度和效度新内涵中关注的可重复性、真实性和直接性均需纳入核心素养评价质量标准。
(三)核心素养评价的质量标准
如上所述,核心素养评价质量标准的建构采用传统评价质量标准新内涵和新评价的质量标准整合的方式来实现。上面已经重新解读了传统评价质量标准,其主要涉及可重复性、真实性和直接性。关于新评价的质量标准,不同的研究者有不同的理解。鉴于此,本研究将通过整合新评价的质量标准和传统评价质量标准的新内涵来建构核心素养评价质量标准。通过对核心素养时代各种评价质量标准的整合,见表1。
表1核心素养评价的质量标准汇总表
对上述17项研究关于评价质量标准的整理和归纳发现,第1列(除研究者一列之外从左至右)中均指向教育结果,有7项研究论述了这一质量标准;第2列中指向决策的可重复性,有7项研究重视该标准;第3列指向公平性,有8项研究指向该标准;第4列指向认知的复杂性,有8项研究指向该标准;第5列指有意义性,有5项研究指向该标准;第6列指向内容覆盖,有3项研究指向该标准;第7列指向成本与收益,有5项研究指向该标准;第8列指向真实性,有11项研究指向该标准;第9列指向可比较性,有5项研究指向该标准;第10列指向直接性,有9项研究指向该标准;第11列指向透明性,有6项研究指向该标准。分析发现,修正后的传统信效度思想均包含在上述框架中,如可重复性、可比较性、教育结果、基于情境一般表现(真实性)、实践操作(直接性)等内容均包含在这里面。最后本研究将核心素养评价的质量标准归纳为11个。这些质量标准的具体含义如下。
教育结果。教育结果是指核心素养评价对学生学习和教师教学有意识和无意识的影响,这种影响是积极或者是消极的。
决策的可重复性。决策的可重复性是指在现实中对于学生的评价应该是基于多元评价而作出的,评价的结果是经得起仔细推敲和检验的。有人将这一标准称之为适应性和可推广性,也有人称为迁移性和可适用性,其是指评价结果能够被广泛推广到学生群体的程度。
公平性。所有的参加者都应该被给予机会来展示他们的能力和潜能。还有研究者指出偏见会造成评价任务与学生教育水平之间的不适应或者会牵涉所有的学习者都不熟悉的文化。
认知复杂性。和真实性一样,认知复杂性也是与未来的职业生活相关,但是认知复杂性主要聚焦于现实的核心素养评价,应该反映已有的高阶认知技能。另外,核心素养还应该反映学生的思维过程,为了洞察学生的思维过程,麦克莱伦建议让学生为其作出的回答和行为表现提供一个理由。
有意义性。有意义性是指核心素养评价对学生和教师应该是有意义。评价应该让学生处理有意义的问题,让学生增加有价值的教育经历。为了让学习者认识到评价的意义,首先需要让他们认识到评价任务与个人兴趣之间的关系。因此,有意义性是不同于真实性的,真实性只是对有经验的实践者而言是真实的,而对没有经验的新手而言是没有意义的。
内容覆盖。内容范围是指内容的全面性。如果内容范围不全面,教师和学生可能会忽视评估内容之外的内容。例如,我们现在的目标是培养学生的核心素养,但是考试的时候仍然是考知识,这就会导致课堂教学中只关注知识的传授,而不去重视素养的培养。
成本与效益。成本与效益有时被称为效益或者可行性。评价的选择不仅仅受教育因素的影响,也会受到财政、管理和制度等因素的影响。学习者感受到的可以控制的评价任务,以及学习者可以通过核心素养评价找到证据证明自己在学习或者课堂之外的额外时间和资源投入是有效的。
真实。它通常被描述为是特定情况下评价与日常表现的相似程度,这意味着核心素养评价应该反映今后工作中所需要的核心素养。古尔克斯等人详细描述了辨别真实性的五个维度:评估任务、物理情境、社会情境、评估结果或者形式,以及评价标准。
可比较性。可比较性是指在现实中通过一致性和可靠的方法来实施核心素养评价。乌伦贝克认为可比较性指向评价实施的情境应该尽可能相同,评价的计分方式应该尽可能一致。由于核心素养评价中的评价方法基本上很少有标准化的答案,这必须依靠个人的主观判断,因此计分过程的一致性显得尤为重要。
直接性。直接性是指教师或者评价者能够直接理解和解释评价结果的程度,而不需要经过从理论到实践的转化过程。如果学习者能够胜任这一工作,那么给予其的不是理论测试而应该是表现性评价;一些证据也能够证明直接的方法比间接的方法更能够预测学生的成功。但这并不是意味着核心素养评价应排除间接的方法,如知识测试。
透明。透明性意味着核心素养评价必须被所有的利益相关者理解。学习者应该知道学习目标,以便为评价作准备和调整学习过程;教师或者评价者也需要理解核心素养评价的全部内容,以为他们成为评价者作准备。
核心素养评价的质量标准是基于对传统评价质量标准的修正以及其他新的评价方法的质量标准进行整合分析而开发的。根据比格斯的观点,质量标准必须与所选择的核心素养评价的特征保持高度一致。这里开发的质量标准就是为素养评价中所运用的各项质量标准提供一个清晰的定义,并且为今后深入研究提供一个更具操作性的分析框架。上述框架尽可能地分开描述各项标准,避免交叉;它对传统测试的信度和效度思想进行了整合;另外,质性评价的思想在这个框架中也有体现。总之,本研究提供了一个核心素养评价质量标准的整合框架。
对于这一质量标准而言,不是包括在核心素养评价中的方法都必须满足本质量框架中的标准,但是一个核心素养评价方案作为一个整体必须满足本框架中的所有标准,因为一个素养评价方案作为一个整体,一项质量标准的缺失是不能够被其他质量标准上的高分所抵消的。在核心素养评价中,知识测试能够被包含在一个完整的核心素养评价方案中的,也就是说对于一个完整的素养评价方案而言,一部分或许是非常真实的表现性评价,而另外一部分可能是一个判断潜在知识的测试。这个评价方案作为一个整体被评价,弥补了因某些方法在个别标准上得分高而采用的其他方法在其他的标准上表现比较差的缺陷。因此,将所有的评价方法整合到一个核心素养评价方案中,它们必须满足所有的质量标准。由于本研究是基于文献分析得出的上述质量标准,虽然该质量标准有一定的知识基础,但是后续研究将进一步在本研究的基础上通过实证的方法对上述框架进行进一步地检验和修正,以便该框架能够较好地运用于现实中的核心素养评价中,进而为我国基于核心素养的教育提供质量保证。
三、核心素养评价质量标准的应用
核心素养评价质量标准旨在完善已有的教育评价系统,评价质量标准的落地是依靠评价设计来实现的,在教师教学实践中,评价的设计又包含在课程方案的设计中。国家课程政策落地的重要方式是通过学校课程方案的设计来实现,所谓学校课程建设主要是指学校课程规划方案、学期课程纲要和单元/课时方案三层方案的一体化发展。因此,核心素养质量标准的应用就是聚焦于其在学校课程规划方案、学期课程纲要和单元/课时方案的一体化应用与设计。学校课程方案有三层,那么核心素养评价质量标准的应用主要是在三层方案中的评价设计中体现。
一个完整的学校课程规划方案涉及三个方面的主要内容:学校课程规划依据、学年或者学期课程方案以及建议和保障措施。学校课程规划依据里面的课程目标设计指向核心素养,也意味着后面的建议和保障措施里面的课程评价是围绕学生核心素养来设计的,但需要注意的是,这些核心素养评价的设计应该参考核心素养评价质量标准的全部内容,在设计指向学生必备品格和价值观念的评价任务的时候尤其需要考虑真实性和认知复杂性。学校课程规划中的课程评价更多的是育人评价方案的设计,这时候的评价应该对核心素养评价质量标准的各项指标都有体现。
学期课程规划纲要是教师(个体或团队)对学生在某一学期所要学习的某门课程 (语、数、外等国家课程或某门校本课程)的目标、内容、实施与评价进行整体的设计。由这一定义可知,学期课程规划纲要也包括了课程评价的设计,但是与学校课程规划纲要中的课程评价相比较,学期课程纲要中的评价设计更多指向了学科。核心素养评价质量标准在学期课程纲要中的应用更加聚焦于学科化和学期化处理。
一个完整的学习方案包括六个要素:学习主题和课时、学习目标、评价任务、学习过程、作业与检测、学后反思。单元/课程方案中的评价任务设计是落实核心素养评价质量标准的重要路径。评价任务依据学习目标的难度、数量、关系和种类等来确定,其包括情境、知识内容、任务,评价任务指向能够引出学生目标达成的表现证据。评价任务来源于学习目标,学习目标指向核心素养,因此,评价任务设计的时候还应该考虑纳入核心素养评价的质量标准,以便评价任务能够更好地评出核心素养。
需要指出来的是,课程方案在设计的时候都有评价的设计,而学校课程规划方案设计中的评价是一种指向育人目标的评价方案,因此,核心素养评价质量标准的11项指标都应该有所体现;学期课程纲要的评价设计应该注意将核心素养评价质量标准进行学科化处理;单元/课时评价任务的设计应该纳入核心素养评价质量标准,并且针对不同的素养采用不同的质量标准。