《教育評價論文.doc》由會員分享,可在線閱讀,更多相關(guān)《教育評價論文.doc(7頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、教育評價:矛盾與分析【內(nèi)容摘要】新課程改革過程中需要正確處理幾對矛盾,即教育評價的理論模式與操作程序的矛盾,量化評價與質(zhì)性評價的矛盾,以及評價方法的“西化”與本土化的矛盾。獨(dú)斷地宣稱一種評價方法的合理性和不合理性,無益于評價改革;簡單地復(fù)制西方國家的評價方法,特別是某些國外已淘汰的方法,對評價理論的創(chuàng)新不利;以特定情境為基礎(chǔ)的、冷靜的教育評價研究,具有長久的、普遍的意義?!娟P(guān)鍵詞】教育評價;量化評價;質(zhì)化評價一、理論模式與操作程序的矛盾理論模式與操作程序是科學(xué)研究的一對普遍矛盾,在人文社會科學(xué)領(lǐng)域中更是如此,教育評價也不例外。當(dāng)前,在我國基礎(chǔ)教育新課程改革中流行的一些理論模式都是比較先進(jìn)的,例
2、如,根據(jù)加德納的多元智力理論,教育評價應(yīng)該評價學(xué)生的多元智力,而傳統(tǒng)的評價主要評價了言語智力以及數(shù)理邏輯智力,對多元智力的其他成分則評價甚少。又如,根據(jù)建構(gòu)主義教學(xué)理論進(jìn)行評價,必須評價師生的相互作用。后現(xiàn)代理論強(qiáng)調(diào)評價學(xué)生學(xué)習(xí)的主體性,等等。但所有這些,操作起來都非常困難。這些困難,集中表現(xiàn)在評價主體的多元性之難和評價內(nèi)容的全面性之難兩個方面。(一)評價主體多元性之難評價主體單一化的局限性是不言而喻的?,F(xiàn)代教育評價強(qiáng)調(diào)評價主體的多元性:首先,評價者與被評價者的人格平等;其次,評價者應(yīng)該是多方面人員組成的集合,不能只是少數(shù)的所謂權(quán)威;第三,重視被評價者的自我評價。這三點(diǎn)都是合理的主張。第一點(diǎn)訴
3、求的人格平等,反對者不多,但它的陷阱,也有不少人墮入人格平等與知識平等和評價權(quán)力平等不是一回事;第二點(diǎn)謀求的評價集合的形成,反映了權(quán)威的失落和從去中心到無中心的轉(zhuǎn)向追求。實(shí)際上,這種追求無處不遭遇抵制和遏制,因為評價制度和評價傳統(tǒng)恰恰是建立在一定的權(quán)威預(yù)設(shè)和中心維系的基礎(chǔ)上。最后一點(diǎn),自我評價在現(xiàn)代教育評價中的地位之所以得到提高,是因為它在自我激勵和自我提高中的重要意義,自我評價體現(xiàn)了一定程度的主體自覺。因此,若把現(xiàn)代教育評價的若干假定具體化為操作程序,必面臨很多困難。首先,到底什么人能夠和應(yīng)該成為評價者?其次,各方面的評價者在總評價中占什么地位、發(fā)揮什么作用?也就是說,各方面評價者的評分在總
4、分中占多大權(quán)重才是合理的(如果不得不計算總分的話)?再次,怎樣保證(各方面評價者)評價的信度?信度若沒有得到保證,強(qiáng)行使用信度低的評價結(jié)果,不只是犯什么錯誤的問題,它甚至產(chǎn)生更消極、更惡劣的社會效應(yīng)和滯后影響。第四,如何進(jìn)行評價者的心理調(diào)控?評價主體的多元性必然帶來評價主體間的相互作用。這樣,評價者就容易受各種心理效應(yīng)的干擾,使評價結(jié)果產(chǎn)生嚴(yán)重偏差,評價將不再為評價。(二)評價內(nèi)容全面性之難傳統(tǒng)的評價在評價內(nèi)容方面存在的片面性是明顯的。在認(rèn)知因素與情感因素之間,重認(rèn)知,輕情感;而在認(rèn)知因素內(nèi)部,又是重知識,輕能力;在學(xué)科知識因素之間,重核心學(xué)科知識,輕非核心學(xué)科知識。新課程評價強(qiáng)調(diào)評價內(nèi)容的全
5、面性,這個立意,無可厚非,但問題是造成評價內(nèi)容的片面性的原因是復(fù)雜的,從中也顯現(xiàn)謀求評價內(nèi)容全面性之難。第一,認(rèn)知與知識因素比較容易測評。在測評理論中,越是穩(wěn)定的因素越易測評。認(rèn)知與知識因素相對穩(wěn)定,學(xué)生也不會隱藏其智能的真實(shí)水平。其次,測評都受時間限制,測評內(nèi)容只能從教學(xué)內(nèi)容的總體中抽取樣本進(jìn)行。這就產(chǎn)生了無法回避的,甚至是自評價制度建立以來一直存在而未能很好地解決的問題:評價內(nèi)容的代表性如何?即評價的效度問題。關(guān)于哪些學(xué)科應(yīng)成為核心學(xué)科的問題,長期以來,我們以不斷變換的方式嘗試了解決問題的種種可能,但事實(shí)上,不但始終沒有找到一種充分合理、相對最好的學(xué)科組合模式,而且嘗試的效應(yīng)和后果為全社會
6、的評價者和被評價者承擔(dān)。因此,需要在教育測評的核心學(xué)科的爭議中尋求最大共識,需要發(fā)掘片面測評的若干合理因素;需要研討評價內(nèi)容的代表性的尺度和標(biāo)準(zhǔn)問題,即加強(qiáng)對評價效度問題的研究。學(xué)術(shù)界對課程評價的很多新理論都是很熟悉的,但在教學(xué)過程中卻沿用傳統(tǒng)評價模式。這不只是傳統(tǒng)模式的慣性在發(fā)揮作用的問題,還必須承認(rèn),片面的、有局限性的評價模式,有操作簡便之長。不好的習(xí)慣可以慢慢得到糾正,而執(zhí)行復(fù)雜的操作程序的難度,可能比我們想象的要大。從技術(shù)上、資源上和心理上看,短期內(nèi)實(shí)行高度復(fù)雜評價程序的可能性并不大。因此,人們有理由懷疑,號稱很好的評價方法卻無法實(shí)行,它是不是很好的評價方法?一些更功利、更現(xiàn)實(shí)的考慮,
7、不是不合理的。采用新的評價模式不一定能提高學(xué)生的考試分?jǐn)?shù),而學(xué)生的考試分?jǐn)?shù)幾乎是當(dāng)前評價教師的唯一標(biāo)準(zhǔn)。試想,如果一位教師,辛辛苦苦采用了很多很好的評價方法,但學(xué)生的高考成績反而沒有別的學(xué)生好,他還會繼續(xù)進(jìn)行這種改革嗎?即使他想堅持,也注定得不到支持。二、量化評價與質(zhì)性評價的矛盾所謂量化教育評價,就是“力圖把復(fù)雜的教育現(xiàn)象簡化為數(shù)量,進(jìn)而從數(shù)量的分析與比較中推斷某一評價對象的成效”。1這種評價方法在20世紀(jì)60年代之前占據(jù)主導(dǎo)地位。隨后,人們認(rèn)識到評價不是一個單純的技術(shù)問題,純粹價值中立的描述是不存在的,價值問題在評價中凸顯出來,質(zhì)性評價應(yīng)運(yùn)而生。量化評價與質(zhì)性評價是課程評價中的兩種基本方法,
8、這兩種方法在理論基礎(chǔ)、評價目的、評價過程、評價的具體方法、評價的角色、評價的特點(diǎn)以及使用范圍等方面都有顯著的不同。美國的大學(xué)招生,除了看SAT和ACT成績以外,還看很多方面。比如,中學(xué)教師的推薦信。最近,國內(nèi)某大學(xué)附中的一名學(xué)生被哈佛大學(xué)錄取,有兩位美國歷史教師給她寫了哈佛大學(xué)歷史上最好的推薦信,這信對她的錄取起了很大的作用。值得指出的是,隨著高校招生自主權(quán)越來越大,我們需要克服教育腐敗現(xiàn)象。假定任何不同方法之間都存在不可調(diào)和的對立關(guān)系和取代關(guān)系,這是不是現(xiàn)代教育評價的新思維?其實(shí),西方國家對質(zhì)性評價的重視,建立在量化評價的發(fā)展(有人用“泛濫”)基礎(chǔ)上。尚無充分根據(jù)顯示,在我國,量化評價大肆泛
9、濫并完全地、徹底地主宰了評價模式。如果這個認(rèn)識是成立的,則說明我們對量化評價的研究和使用,需要研究借鑒其他國家的成熟做法。一些號稱的量化評價,未必不是感覺經(jīng)驗的數(shù)字化。甚至可以假定,比較準(zhǔn)確地理解和領(lǐng)會了最基本的量化概念(比如2檢驗之類)的教育學(xué)教授,包括那些專事責(zé)難量化方法的教授,不占其總量的十分之一。承認(rèn)這一點(diǎn),就需要我們一方面同時加強(qiáng)對量化評價和質(zhì)性評價的研究;另一方面立足于我們自己的評價對象和評價背景上,摸索分化、整合的可能性。后者即評價方法的“西化”與本土化的矛盾問題。三、評價方法的“西化”與本土化的矛盾目前,我國的教育評價方法主要是借用西方國家特別是美英等國的。這些方法,往往先通過
10、譯介而引進(jìn),后生搬硬套地推廣和運(yùn)用。比如,越來越為人們熟悉的檔案袋評價(有人翻譯為成長記錄袋)、表現(xiàn)性評價(有人翻譯成遂行評價)、2真實(shí)性評價、蘇格拉底式評價、發(fā)展性評價、質(zhì)性評價等等,都來自國外。可以假定,西方國家的評價方法是長期的實(shí)踐智慧和科學(xué)研究的結(jié)晶。在實(shí)踐智慧和科學(xué)研究二者之間,前者是高度情境化的,后者是高度抽象化的。情境化的,就是本土化的,比如,學(xué)生群體、班級規(guī)模、考試模式、選拔傳統(tǒng)、流動機(jī)制等等。這些,既不能夠引進(jìn),也不應(yīng)該忽視。抽象化的,就是普遍化的、標(biāo)準(zhǔn)化的、不受情境制約的。能夠為我們學(xué)習(xí)和引進(jìn)的,只能是所謂“普遍化的、標(biāo)準(zhǔn)化的、不受情境制約的”后者,不能是前者。假定前者并非
11、確實(shí)是“普遍化的、標(biāo)準(zhǔn)化的、不受情境制約的”,而是個人性的、地方性的、情境性的,則有助于解釋為什么會出現(xiàn)“橘生淮北則成枳”的現(xiàn)象。西方國家教育評價方法的二重性特點(diǎn),是其價值和局限共處的空間。即使其“抽象”的一端放之四海而皆準(zhǔn),“情境”的一端也絕非如此。從這個意義上說,國外的評價方法不一定適合我國的情況,有時甚至可能適得其反。當(dāng)前,課程改革中的很多流行理論,例如,從多元智能理論、建構(gòu)主義教學(xué)理論到后現(xiàn)代或后后現(xiàn)代理論,都是西方國家的情境化產(chǎn)物。以它們?yōu)橹蔚挠行┰u價方法,有的在西方國家已經(jīng)廢止,在我國卻方興未艾。比如,發(fā)展性教師評價制度于1998年在英國廢止,3現(xiàn)在我們卻開始熱衷這種評價方法,好
12、像每個人都透徹掌握并真心贊成這種評價方法,把過去的評價一概打成獎懲性評價,就像我們在推行素質(zhì)教育的時候把過去的都打成“應(yīng)試教育”一樣。對這類現(xiàn)象,很難說出多少新話,多是一些老話:教育評價需要實(shí)事求是靜心徐察的勇氣,需要具體問題具體分析的耐心。因為任何評價方法都有它產(chǎn)生的土壤和條件,也有它的使用前提和適用對象,絕非任何地區(qū)或國家都能夠使用同一種評價方法且產(chǎn)生同樣效果。“橘生淮北則成枳”的道理恐怕誰都明白,為什么在實(shí)施中卻“橘枳”不分呢?可以猜想一下:某些研究者圖簡單、省事,將國外的先進(jìn)方法直接引進(jìn),不但完成了“科學(xué)研究”的任務(wù),而且一下子就達(dá)到了“國際領(lǐng)先水平”。它,誤導(dǎo)并操縱了教育評價行動,好
13、像再現(xiàn)了“西海潮流猛秦火,東風(fēng)復(fù)助為妖禍”的歷史景觀。以目前在我國推行的“檔案袋評價”方法來說,筆者了解到的情況是,使用過這種方法的教師,很少贊成普遍推廣它。它的主要局限有以下六點(diǎn)。檔案袋評價的工作量大,需要占用教師很多的時間精力,在教師教學(xué)任務(wù)繁重的情況下帶來過重的負(fù)擔(dān)。檔案袋內(nèi)容太多,標(biāo)準(zhǔn)化程度低,不好整理分析,用于大范圍的評價時難以控制。檔案袋評價存在著主觀性太強(qiáng)的特點(diǎn),評價過程中很難保證公平、公正。尤其是學(xué)生互評過程中很多主觀因素影響著評分。難以保證信度、效度,很能達(dá)到客觀、真實(shí)。如果各科都建立學(xué)生檔案袋,肯定會導(dǎo)致學(xué)生的厭煩情緒。教師在不同的時間對學(xué)生的評分是不一致的。更重要的是,到
14、底有誰來看這些檔案袋,有多大用途?如果高考還是原來的高考,這些既費(fèi)時又費(fèi)力的檔案袋可能沒有很大的作用。反過來,如果檔案袋在選拔中占了一定的比例、起了一定的作用,哪怕是一點(diǎn)點(diǎn)作用,誰又能保證檔案袋內(nèi)容的高信度?現(xiàn)時,能否信心十足地說,家長不會弄虛作假,教師不會弄虛作假,學(xué)生不會弄虛作假?評價方法“全盤照搬”行不通,要在挑選之后“拿來”。在“拿來”的時候,對拿者的素質(zhì)也有較高的要求。正如魯迅說的那樣,“首先要這人沉著,勇猛,有辨別,不自私”。只對拿者的個性和素質(zhì)提要求,還是不夠的。更重要的是,改造知識情境和評價情境。在評價的實(shí)施過程中,還存在其他一些不易化解但可能被人忽視的矛盾,諸如,評價過程的全
15、程性與評價結(jié)果的終結(jié)性的矛盾;課程標(biāo)準(zhǔn)的理想導(dǎo)向與評價結(jié)果的功利導(dǎo)向的矛盾;評價理論的模糊性與評價實(shí)施的清晰性之間的矛盾;評價的理論研究不足與實(shí)踐作用的過分夸大的矛盾;等等。凡此種種,都需要進(jìn)一步的研究。 SAT是Scholastic Aptitude Test的縮寫,譯為“學(xué)術(shù)性向測驗”;ACT是American College Test的縮寫,譯為“美國大學(xué)測驗”,在美國中西部被廣泛采用。美國絕大多數(shù)高校兩種考試都認(rèn)可。 例如,“班級規(guī)?!本褪且粋€極重要的尺度,它綜合地反映了教育資源的總量、分布、分配、占有和支配模式??上В谶^去二十多年的專業(yè)研究和政府文告中,它不是一個常為人充分注意的概
16、念。因此,它對教育評價的規(guī)定和對教育改革的訴求,也沒有充分展示和揭示??鋸埖卣f,僅采取班級規(guī)模合理化這一種手段,就可以減少現(xiàn)行教學(xué)及其評價的若干積弊。參見Peter Blatchford et al.(1998),Research on Class Size Effects:A Critique of Methods and a Way Forward,International Journal of Educational Research,29. 科學(xué)知識具有普遍化、標(biāo)準(zhǔn)化和不受情境制約的特性之說,從20世紀(jì)50年代到80年代,先后被波蘭尼(1958)、吉爾茲(1983)和勞斯(1987)
17、等人否定。(個人知識邁向后批判哲學(xué),許澤民譯,貴州人民出版社,2000;地方性知識闡釋人類學(xué)論文集,王海龍等譯,中央編譯出版社,2004;知識與權(quán)力走向科學(xué)的政治哲學(xué),盛曉明等譯,北京大學(xué)出版社,2004)他們或者發(fā)現(xiàn)了科學(xué)知識的個人性,或者揭示了其地方性、情境性。法蘭克福學(xué)派、特別是哈貝馬斯,則著力批判科學(xué)技術(shù)的操縱功能。自伏爾泰到波普,都強(qiáng)調(diào)科學(xué)知識與人文知識和社會理論之別,強(qiáng)調(diào)科學(xué)知識的數(shù)據(jù)化力量、與日常生活的斷裂性特征。波蘭尼等人的勞作等于向這類論斷發(fā)起了挑戰(zhàn)。 呂達(dá)2005年5月13日在華南師大教科院所作的學(xué)術(shù)報告當(dāng)前課程改革的若干問題中,也持此見。 華南師范大學(xué)2002級教育碩士教育管理方向黃艷同學(xué)的碩士論文,2004年12月第43頁。參考文獻(xiàn):1.張揚(yáng).論課程評價中的量化評價與質(zhì)性評價J.寧波大學(xué)學(xué)報(教育科學(xué)版),2004,(3):37392.董華,等.遂行評價韓國小學(xué)新型課程評價體制J.現(xiàn)代中小學(xué)教育,2004,(2):57593.王小飛.英國教師評價制度的新進(jìn)展J.比較教育研究,2002,(3):43476