试论评价对学校课程实施过程的影响
按照经典的泰勒(Tyler, R.)原理,课程评价与课程实施分属两个不同的课程要素,评价通常用以判断课程实施的结果,也就是课程目标的达成情况。然而,从现实看,只要在课程实施过程中有评价的存在,评价就会对课程实施发生影响。其实,很多时候评价本身就被当作课程实施的杠杆,只不过,有时美好的愿望未必带来良好的效果,评价可能未必对课程实施产生正面的积极的作用,相反可能导致课程实施发生偏差。评价对课程实施具有强大的反拨作用,因此,如果要考察学校层面课程实施过程的质量,一定不能忽略作为其情境和手段的评价。本文试图在讨论评价对课程实施的反拨作用以及评价在课程实施中扮演的角色的基础上,构建一个评价影响学校课程实施的分析框架,以为学校课程实施过程质量监测提供相应的理论基础。
一、评价对课程实施的反拨作用
评价总是会带来后果,这种后果可能体现在对学生的影响上,也可能体现在对教师的影响上,还可能体现在对更广泛的社会领域所产生的影响上。这里我们不讨论宽泛意义上的评价后果,只关注评价对课程实施所产生的影响——评价的“反拨作用”(washback effect)。“反拨作用”指的是评价对课程教学的反向影响。在传统的课程理论中,评价是用以判断课程实施成效的手段,是课程实施的后续环节。有人将评价看成课程运行和经验中的教学过程的“侍女”。然而,现实中,这个“侍女”经常喧宾夺主,抢占“C 位”,反过来会对课程教学产生巨大的影响——西方教育评价文献中经常将评价尤其是高利害测验称为“本末倒置”(The Tail Wagging the Dog,直译为“尾巴摇动了整只狗”),就是在强调评价对整个课程教学过程的反作用。
要讨论评价对课程实施的影响,首先需要明确什么是课程实施。遗憾的是,课程理论界并没有关于课程实施的公认的界定,相反,对课程实施有多种不同的观点,有些将之视为教学,有些将之视为课程方案的实践,有些将之视为基于师生互动的创生……不过,这并不妨碍我们在不同的课程实施观中审视评价对课程实施的影响。
(一)评价对作为“教学”的课程实施的影响
将课程实施视为教学有它的道理,毕竟无论如何教学都是课程实施的最重要的手段或方式。然而,并非所有的教学都是课程实施,至少不都是正式的课程的实施——只有旨在落实课程的教学才能被称为课程实施。从这个意义上讲,教学教什么、学什么,应该是由课程来决定的——即使这个过程允许“校本化”,允许“生成”,也必须是以课程作为最重要最根本的依据的。而怎么教、怎么学是受制于教学目标和学习目标的,同样应该以课程为依据。
然而,正如马道斯(Madaus,G.F.)指出,不是宽泛陈述的课程决定了什么被教和如何教,作为学什么和如何学背后的驱动力是考试,现实中,“教什么、学什么”在很多时候并非由课程决定,而是由评价来决定的。譬如,第八轮基础教育课程改革带来的新课程在许多教师那里被称为“新课标”,似乎表明了教师对课程标准的重视,然而事实上许多教师在教学过程中并不关注课程标准,也不清楚课程标准在其教学中应有的作用;当他们在决定教什么时,课程标准的制约作用通常比不上“考纲”,或者教研室出的那张统考卷,或者去年的中考试卷或当地名初中的招生考试试卷的影响。当所实施的评价的利害关系足够高时,教师可能像驾校教练那样,不会教学生或要求学生学习任何考试可能涉及的内容之外的内容。于是,没有高利害评价的学校课程就成了所谓的“副科”,有可能在压缩课时时首当其冲,有可能在课程实施过程中的资源分配中被忽略,甚至可能不会出现在学生经验的课程之中;而在那些有高利害评价的科目中,教师可能只关注那些有可能在高利害评价中被评价的目标和内容,至于那些极少出现在以往的高利害评价之中,或者按照通常的高利害评价方式难以被检测的目标,就可能会被忽略甚至完全被放弃。至于如何教或要求学生如何学,那就要看何种教学方式或学习方式对于提高所应对的那种考试的成绩最“高效”了。
其实,只要有评价存在,教学就不可避免会受到影响,柯勒兹(Koretz, D. M.)等人的一个实证研究证
明了这一点。他们在一个采用高利害评价的学区实施了一个延续五年的研究,发现了一个相当戏剧化的现象:1987年,该学区放弃了一种流行的标准化测验A,转而采用另一种标准化测验B,结果,相比较于前一年,学校的平均成绩下降了半个等级水平(grade level)。随后三年,学校整体的平均分数逐年提升,到1990年,他们的三年级成绩几乎比刚开始实施新式测验的1987年高了一个等级水平。为考察“为考而教”的微妙效果,1990年他们重新实施1987 年放弃了的标准化测验A,相比较于1990年新测验B中的成绩,他们的分数又下降了半个等级水平。为排除学生参照群体差异对测验结果差异的影响,他们将1990年测验A与1986年测验A做了比较,结果发现学校平均分数下降了整整一个等级水平。从中可以得出的唯一的结论就是,从1987年到1990年,学校在标准化测验B上的成绩提高归因于“为考而教”。
(二)评价对作为“课程方案实践”的课程实施的影响
如果将课程实施视为课程方案付诸实践的过程,课程实施就涉及到课程层级的转化。课程有诸多层级,若按照古德莱德(Goodlad, J.)的课程层级,课程实施就涉及到从正式课程到领悟课程到运作课程再到体验的课程的逐级转化。在这个逐级转化过程中,评价在或显或隐地发挥着重要作用。
从我国课程管理现实来看,“正式课程”其实就有多个层级,其中也涉及到多级转化。国家允许省级教育行政部门和学校编制自己的课程实施方案——实际上也有不少地市甚至县有自己的课程方案——这样,从教师的视角来看,正式的课程就有多种:国家课程方案、省级课程实施方案、学校课程方案,有些地方还有地市级的课程实施方案。在“正式课程”的内部层级转化中,发生的变化确有根据地方实际情况做的调适,但有些变化的确不属于这种调适。我们在近来对全国31个省市自治区义务教育课程实施方案的分析中发现,道德与法治类(品德与生活、品德与社会、思想品德)课时低于国家规定下限的有14个省份,体育与健康(含体育)课时低于国家规定下限的有11个省份,综合实践活动、地方课
程和校本课程有10个省份未达国家规定下限。而外语、数学超课时情况比较普遍,超出了国家规定上限的省份分别为11个和10个。省级义务教育课程实施方案中这样的课时安排,恐怕很难说仅仅是领悟偏差或者巧合,而没有评价设计的影响!学校的课程方案文本看来也许跟上一级的课程方案没有太大差异,但实际落实的课程方案可能是完全不同的另一套东西。学校墙上所挂的课程表与学生文具盒中的课程表之间的差异显然不是“领悟”上的偏差或“运作”能力不足的后果,除了少数学校可能是因为师资或其他资源配置不合理的原因,更多是学校主动选择的结果。而学校之所以作如此选择,基本上可以归因于当前实际运行的评价体系、学校和教师对评价体系的认知,以及评价所带来的利害关系。
其实,评价对课程层级转化的影响并不只限于从正式课程开始的逐级转化。一种课程理想或理想的课程必然包含了对课程目标的预期和设想,对课程目标的预期一定反映课程理想提出者心目中有价值的那些东西,而那些目标必然是他们认为要在课程实施之后要去衡量的东西。只要理想的课程有目标,就一定会包含那些他们认为必须评价的东西——尽管这种评价意识在课程理想形成过程中可能并不那么明显。更何况,课程理念的确立本身就可能受评价的影响,如果经济合作与发展组织(OECD)没有开展基于核心素养框架的PISA项目(Program for International Student Assessment,国际学生评估项目),或者PISA并不基于核心素养框架,“核心素养”恐怕未必会有如今的热度—可以说,核心素养之所以会成为世界各国课程改革的“风向标、主基调”,PISA是关键的推手。在当今世界各国基于核心素养的课程改革中,这样的例子并不少见:参与PISA—成绩不理想—引发公众舆论—课程改革。
从理想的课程向正式的课程的转化过程中,评价同样在发挥作用,只不过,此时的评价可能并非事实上实施的评价,而是关于评价的设想。课程要落地,其结果是必然要可测,若不可测课程就不能落地。那些必须评价但无法评价,或者因当前条件所限暂时无法评价的东西就很难成为正式课程的目标,就像当前基于核心素养的课程改革一样,能够进入作为课程目标的核心素养体系,不仅得可教、可学,还得“可评”。
(三)评价对作为“基于师生互动的创生”的课程实施的影响
学校和课堂是课程实施的最重要的场域,一定涉及到学校课堂中最重要的主体之间的相互作用。学校课程实施基于教师、方案、学生三要素的互动,在这种互动中,评价的影响几乎无处不在,评价甚至影响三个要素本身。评价对学校课堂层面的课程方案的影响,不仅发生于学校课堂层面。涉及到学校、教师依据评价对课程方案所作的调整,同样可能发生于更高的层面,譬如托比纳等基于两个研究综述,考察了对学生学习的大规模评价(large-scale assessments, LSAs)与教育政策之间的关系,发现LSAs被决策者频繁用来支持课程改革,如智利2009年实施的国家课程改革其实就是为了更好地应对TIMSS,将其全国中小学数学和科学课程与 TIMSS国际评价项目中所用的内容标准和方法相匹配;吉尔吉斯斯坦为应答在 2006年PISA中较差的表现,提高了对教材分配的资助,并建立了一个新教材竞争性投标程序,以提升教材的质量。
教师和学生作为课程实施过程中两个具有能动性的主体,不可能不受施加于他们的评价的影响。事实上,说到底,评价不会自动对课程实施发生影响,这种影响最终是通过教师和学生的中介作用来实现的。在一个对自己的工作和学生没有最基本的责任心的教师心目中,或者在一个根本不在乎“学校中的成功”的学生心目中,评价有可能会是“浮云”。但置身于一个评价主导的生态系统之中,教师也好,学生也好,恐怕都难以摆脱评价的影响。譬如,教师很难避开评价的影响,巴西教育系统为应对在2000年和2003年PISA中相对较差的表现而开发多个层面的教师专业学习项目;而马其顿则因TIMSS-R1999的结果不理想而改革了教师培训项目,以强调借助于互动、实践活动、摆脱讲授方式的学生导向的教学。而对于学生来说,评价的压力是他们“无法抵抗的”,如拉姆斯登(Ramsden, P.)所说,学生之所以采取错误的学习取向,就是“不适当的评价方法对学生施加了无法抵抗的压力”的结果。只要对学校生活有所了解,就不难得出结论:教师如何处理教材,如何对待课程标准?学生如何对待学校生活,如何参与教学过程,如何对待作业?师生如何互动,关系是否紧张?凡此等等无不受评价的影响。
二、评价在学校课程实施中的角色
无论如何理解课程实施,其最终目的都在于学生的发展。就此而言,尽管课程实施可以发生于多个层面,但学校层面的课程实施是整个课程实施过程的终端环节——其他层面的课程实施都是为学校层面的课程实施服务的。那么,评价在学校课程实施过程中到底扮演什么样的角色?我们认为,评价在学校课程实施过程中既构成学校课程实施的情境,也是学校课程实施的手段,是学校课程实施的重要组成部分。
(一)学校课程实施过程中的两类评价
学校课程实施过程中的评价多种多样,可以从多个视角进行分类。但要讨论评价在课程实施中的角色,基于评价实施主体对评价的分类可能比其他分类更有价值——以评价实施主体为标准来分,学校课程实施过程中的评价可以分为外部评价和内部评价两个大类。
外部评价是指学校之外的组织或机构实施的评价。在基础教育阶段,这类评价包括了高考、中考、会考,以及其他多种以统考、联考、学业质量监测等名目出现的考试。这类评价通常由区域教育行政部门主导实施,如高考、中考、会考、学业质量监测,或由区域内或跨区域的学校联合体来主导实施,如联考。这类评价通常在一个相对完整的教学阶段完成之后实施,而无法在课程实施过程中持续地实施;通常会涉及到对学生、学校甚至教师的比较,且可能会附加某种对学生甚至可能是对教师、学校而言非常重要的结果,很可能属于高利害的评价。
内部评价是由学校主要是由教师针对自己的学生实施的评价,也就是通常所称的“课堂评价”。在实践中,课堂评价的具体方式非常多样,包括学校中的期中考试、期末考试,教师自己实施的单元测验、随堂小测验、作业甚至是日常对学生的观察,或与学生的交流;它可以是在特定时间点占用专门的时间实施的比较正式的评价,也可以是镶嵌于教学过程或师生互动过程之中的持续的非正式评价。一般而言,这类评价很少会附加对学生的显性的高利害后果。在学校课程实施过程中,这两类评价所扮演的主要角色是存在差异的。一般而言,外部评价在学校课程实施中更多扮演情境的角色,而课堂评价更多作为学校课程实施的手段——尽管它们与具体扮演的角色之间并非一一对应。
(二)评价构成学校课程实施的情境
学校课程实施过程一定发生于特定的背景之中,一定会受到诸多情境性因素的制约。这些因素大到很高层面的课程理念,小到一所学校内部的境脉性因素,都会对学校的课程实施发生重要影响。但在构成学校课程实施情境的种种因素中,评价至关重要。
外部评价本质上是教育行政部门作为推进学校课程实施的手段,本意在于提升学校课程实施的质量。对于学校来说,这种评价是一种外来评价,事实上对学校的课程实施过程发生着影响,是学校课程实施过程的重要影响因素,但不属于学校的课程实施手段,尽管有时学校会借用这种评价来影响学校的课程实施。外部评价是学校课程实施情境的一个重要构成成分,至少是学校课程实施情境的重要来源之一。在现代制度化学校教育中,评价是学校教育系统中的一种重要制度,而制度就是“课程审议和课程行动所必需的情境。”评价制度的设计方式和运行方式为学校课程实施规定了重要的情境。譬如,如果有外部高利害评价存在,学校课程实施的进程就要服从于这种评价安排,保证相关的课程内容在评价实施之前完成;再如,无论在理念上多么强调合作,无论公开课中有多少“合作学习”的成分,只要评价中有排名,教师教学或者学生学习都会更加强调竞争……实际上,只要有评价存在,教与学都必然无法逃脱评价情境的制约,甚至“应试教育”的板子也不能拍到学校、教师头上,有“试”在,“应试”和“应试教育”就不可避免——从某种程度上说,“应试”甚至是学校、教师责任心的体现。
不过,评价作为一种学校课程实施的情境,主要是社会心理意义上的情境,评价与课程实施之间的关系并不是直接的、线性的,相反,它是通过课程实施过程相关主体的认知和感受而发挥作用的,“一个测验的性质可能首先影响参与者对其教学和学习任务的认知和态度。这些认知和态度会反过来影响参与者在执行工作(过程)时所做的事,如演练那种将在测验中出现的题型,而这又将会影响学习结果,即产品。”斯蒂金斯(Stiggins, R.)强调评价是通过学生的中介作用来影响他们的学习的:以往的评价经历会影响学生对评价的认知和信念,对评价的不同看法会影响到学生在评价中产生的感受,不同的感受会进一步影响学生对评价、对学习的认识、态度、信心和期望,对评价和学习的不同态度、信心和期望导致不同行动,不同的行动导致了不同的结果。同样,只要有评价存在,教师无法对评价视而不见、无动于衷,他们会感知到并尝试去应对评价,而这种感知和回应会形塑他们的课程行动,正如帕 里 斯(Paris,C.)所指出的,“不管是编制自己的课程,还是对其他人创编、强加的课程作出反应,教师在课程方面的工作都是在他们对感知到的情境作出反应中形成的。”
这里将外部评价视为课程实施的情境,主要是从学校层面的课程实施来说的。若放在更大范围的课程实施之中,外部评价也可能扮演情境之外的角色,有时作为课程实施的手段或者杠杆。譬如,英国1988年教育法案试图削减地方教育当局在课程上的自由裁量权,为此而建立全国性考试系统;我国在新世纪之初建立国家义务教育质量监测系统,目的也就在于推进课程改革。
(三)评价是学校课程实施的重要手段
如果将学校课程实施视为教师、方案、学生三者互动以促进学生学习和发展的过程,那么可以说,评价就是三者互动最常见的方式之一,课堂评价就是学校课程在课堂层面实施的最重要手段之一。
据斯蒂金斯估计,一个教师的专业时间约有一半花在与评价相关的活动上。若被问及专业实践中最重要的工作领域是什么,绝大多数的教师一定会回答是“教学”,这不仅仅是教师自己的体认,也可能是所有人的认识。但是,是否存在“无评价的教学”?答案一定是否定的。事实上,教师日常实践中有大量的工作时间用于评价以及与评价相关的工
作,除去课内时间,占用教师课余时间最多的恐怕就是批改作业了;更何况,大大小小的考试会占用不少课内时间,课堂教学过程中也在实施着种种不同形式的评价。从学生角度讲,现实中课余时间基本上就等同于作业时间,“洛阳亲友如相问,就说我在写作业”,甚至可以说,学生做作业就是他们与方案甚至教师互动最真实的方式;更何况,在课内,学生也无时无刻不在接受着评价。若从师生日常互动来说,撇开学习内容,考试与评价一定是互动最主要的话题,至少是最主要的话题之一:教师会用考试或评价来激励学生,会向学生提供考试与评价反馈。
现实中评价就被当作学校课程实施的重要手段,只不过,从理想来说,当前课堂评价在促进学校课程实施上的潜力还没有得到充分的发挥。如果课堂评价能够在教学过程中持续实施,如果这种评价能够收集到学生达成目标状况的充分准确的信息,如果这些信息能被用于支持教师自己的教学决策和学生的学习决策,那么课堂评价才有可能真正成为推动学校课程实施的强有力手段。
当然,若从社会心理角度来解读情境,那么创造“情境”的就不限于外部评价了,实际上,教师的课堂评价同样创造一种情境,“教师的课堂有一种源于教师的一般评价方法的评价‘品性’或环境”。如布鲁克哈特(Brookhart, S.M.)所说,“从学生的视角来看,课堂评价信息不仅是关于他自己的,相反它构成了其学习生活的主要部分,成为他期望学习的课业、与教师和学科的关系,以及与同伴的关系的一部分。”
三、评价影响学校课程实施的分析框架
我们总是期望评价能够产生我们期望的效果,不希望它带来非预期的尤其是消极的后果。在课程实施上,我们期望评价能够成为促进课程实施进而提升课程实施过程质量的杠杆,不希望它成为课程实施的障碍或者瓶颈。然而,评价到底如何影响课程实施?这种影响到底受哪些因素制约?也许制约因素多种多样,这里尝试将评价本身的属性与其产生的影响维度联结起来,尝试建构一个分析框架。
(一)影响的维度
评价对课程实施所产生的影响可能会多种多样,有时影响巨大,有时影响微弱;有时影响恰恰是我们期望的,有时影响完全偏离了我们的初衷。对于评价所产生的影响,我们到底可以从哪些维度去分析?渡边(Watanabe, Y.)在讨论评价的反拨作用时提出的分析框架很有启发。渡边从五个维度描述了评价的反拨作用:反拨专门性(Specificity)、反拨强度(Intensity)、反拨时长(Length)、反拨意图(Intentionality)和反拨价值(Value)。所谓反拨专门性,指的是反拨作用属于一种所有测验都会产生的效果,还是特定测验或测验的特定方面才会产生的效果;强度是指测验对教与学的影响程度强弱;时长是指反拨作用持续的时间;意图是指反拨作用是所期望的还是意料之外的;价值是指反拨作用是积极的还是消极的。
宽泛地说,反拨专门性、强度、时长大致上可以归为一大类,与评价对教学或课程实施的影响大小有关;而意图维度与价值维度可以整合成“影响的方向”,也就是评价对课程实施的影响是正面的还是负面的。一般情况,意图维度和价值维度本来是高度关联的,所谓积极的影响大多就是导致了预期的效果,而消极的影响基本上就是预期之外的效果——尽管预期之外的效果未必就是消极的。
(二)评价的属性
那到底什么在影响着评价对课程实施的影响的方向和大小?一定有评价之外的因素,譬如社会对教育的关注程度,但肯定与评价本身直接相关。而在与评价相关的属性中,有两个因素至关重要:评价的利害关系与评价的课程效度。
1.评价的利害关系
有时评价会赋予课程实施过程相关主体以某种利害关系,譬如,中考高考会决定学生的升学,会导致教育行政部门对学校的褒奖或问责。这种利害关系有时是直接的,会赋予相关主体某种直接后果;有时是间接的,不会带来直接的后果,但可能影响后续获得的机会。有时是显性的,通常是外部赋予的,如升学机会、奖惩;有时是隐性的,通常体现在利害关系人的内心变化,如自我效能感的提升或降低。有时是公认的,即有可客观衡量的利害,譬如毕业与否;有些则是个人化的,不同主体对利害的认知可能不同,譬如成绩排名靠后,有些学生可能完全无所谓,有些学生则可能将之视为耻辱。但无论如何,评价的利害关系有高低之分,也就是说,评价赋予相关主体的后果对这些主体的重要性程度有高低之分——尽管间接的、隐性的利害未必就是低利害,个人化的利害也未必就是低利害。
2.评价的课程效度
课程效度即指一个评价反映课程目标的程度,也就是评价目标与课程目标的匹配程度,其核心在于评价所评的学习目标对课程目标的代表性。在以往基于心理测量学的教育评价中,课程效度并不是一个主流观念,但在如今促进学习的评价理念之下,评价的课程效度已在我们当前的评价理念中有了较为普遍的反映,譬如“基于课程标准的评价”“教学评一致性”等。可是,从现实中看,评价与课程不匹配的情况还是普遍存在的,如评价对课程目标的代表性偏差,也就是所评与课程目标要求无关;又如对课程目标的代表性不足,也就是所评只反映部分课程目标。这种情况在一些民办/名初中的小升初考试中尤为常见,也在义务教育阶段学校内的作业和测验、考试中时有所见。如果评价不能与课程匹配,不能代表教师所教和学生所学的课程,而经常涉及到课程目标之外的那些内容,将可能对课程实施产生何种影响?
(三)评价后果的一个分析框架
大体来说,评价的利害关系会决定评价对课程实施影响的大小,评价的附加于课程实施主体的利害关系越高,那么其对课程实施的影响就越大,反之就越小。而评价的课程效度则会制约评价影响课程实施的方向,如果评价具有课程效度,那么其对课程实施的影响会是正面的;如果评价不具有课程效度,其对课程实施的影响一定是负面的——尽管对学生发展有可能产生正面影响,如课程目标只局限于“双基”时,一种评价却超出了“双基”的范畴,考察了学生在“过程与方法”上的表现。我们用下图来呈现评价的利害关系、课程效度与评价对课程实施过程的影响的关系。
若评价具有高利害关系,学校课程实施相关主体就可能会在评价准备上投入更多的时间和精力,专注于评价可能要评的那些目标,采用更可能直接提高评价表现的做法,甚至可能不惜放弃课程方案上规定的且对学生未来发展有重要影响的目标。这种利害关系甚至不止影响学校、教师和学生之类关键主体,还会影响家长、雇主等学校教育的利益相关人,而这些利益相关人又可能反过来对学校的课程实施施加某种压力,导致学校课程实施上的变化。撇开来自于这些利益相关人的影响,仅从学校内部来讲,高利害评价带来的影响主要体现为课程窄化和为考而教。“课程窄化”包含了两种情况:一是科目被分主副,即那些没有高利害评价的学校课程即通常所说的“副课”,有可能不会出现在学生经验的课程之中,有可能在压缩课时时首当其冲,有可能在课程实施过程中的资源分配时被忽略;二是“主课”的内容被分主次,即在那些有高利害评价的科目中,教师可能只关注那些有可能在高利害评价中被评价的目标和内容,至于那些极少出现在以往的高利害评价之中,或者按照通常的高利害评价方式难以被检测的目标,就可能会被忽略甚至完全被放弃。“为考而教”与课程窄化的第二个层面很接近,但主要是从教师的教学活动角度来描述:教师的教学就是评价准备,关注的是高利害评价可能要评的目标,采用何种教学方式取决于考试方式,甚至解题会成为教学的基本内容。如果说“课程窄化”基本上是负面的,那么“为考而教”到底正面还是负面就无法简单定论。其实,说到底,当有高利害评价存在,教师“为考而教”就是必然的后果,关键在于,教师为“怎样的考”而教?如果“考”具有课程效度,那么其对课程实施的作用就是正面的;反之就是负面的。
来源:中国知网