- 相關(guān)推薦
論本科教學(xué)中題庫建設(shè)的意義及質(zhì)量評價體系
論本科教學(xué)中題庫建設(shè)的意義及質(zhì)量評價體系
陳晟1,江昀2,賴朋1
摘要:本文結(jié)合作者在題庫建設(shè)中的實際工作,對本科教學(xué)中的考試題庫建設(shè)的意義、作用,以及題庫建設(shè)中需要重視的難點做出了綜述,并對題庫的深入應(yīng)用、題庫的質(zhì)量評價指標做出了探討。
關(guān)鍵詞:考試;題庫;區(qū)分度
基金項目:本文系2015年西華大學(xué)教育教學(xué)改革研究項目《制藥工程專業(yè)卓越人才的培養(yǎng)模式探索》的研究成果之一。
作者簡介:陳晟,理學(xué)博士,講師。
在高等教育中,考試是一個必不可少的環(huán)節(jié),借此來檢驗學(xué)生對知識的掌握程度,也間接體現(xiàn)教師的教學(xué)工作是否達到了預(yù)計的效果。因此,如何設(shè)計考題,真實、可信地反映學(xué)生的學(xué)習(xí)成果,就是高等教育中一個極為重要的問題。
一種解決思路,就是為某一門課程設(shè)計題庫,以后每年的考試均從題庫中抽取若干題目組成考卷。本文將從題庫建設(shè)的意義、題庫建設(shè)的重點與難點、題庫的質(zhì)量評價指標等方面進行一些新的探討。
一、題庫建設(shè)的意義
題庫建設(shè)的意義,已經(jīng)有相當多的教師做出過論述。而本文作者在幾門本科課程的題庫建設(shè)的過程中,對題庫建設(shè)的意義有了一些新的認識。
(一)考察的范圍更加規(guī)范、全面作為一門課程的主講教師,當然有權(quán)決定把哪些知識點作為考察的重點。同時,這種權(quán)力又應(yīng)該受到培養(yǎng)目標、教學(xué)大綱的制約,不能因為教師個人的好惡而隨意地改變知識點的權(quán)重。特別是對于那些復(fù)雜、抽象的知識點,往往要求教師花費更多的時間與精力才能真正將其闡釋清楚,在實踐中就存在教師“講課時一筆帶過,考察時故意回避”,將該知識點擅自忽略的可能。盡管絕大多數(shù)教師的職業(yè)道德水平,決定了這種可能性實際上非常小,但它依然是一種制度性的風險。
同時,對于同一個考點,不同的命題人可能對其重要程度的看法不同,因而影響到考察的深度和廣度,這會直接體現(xiàn)在題型和分值的差異上。比如,某個知識點在一張試卷上可能只是2分的選擇題,在另一位教師出題的試卷上卻可能是一道10分的論述題:盡管都考察了這個知識點,但卻影響了考試對于學(xué)生學(xué)習(xí)水平的評價的可信性和有效性,是命題者應(yīng)該盡量避免的情況。
而題庫的設(shè)立,能從根本上降低上述兩種風險。題庫建設(shè)是由所有擔任該課程教學(xué)任務(wù)的教師共同參與討論,并由教研室、學(xué)院兩級依據(jù)教學(xué)大綱進行審核驗收,因而能夠保證入庫的題目質(zhì)量:既能全面地覆蓋大綱要求的知識點,又能在每個知識點的考察要求上保持深淺一致。臨考前再從題庫中隨機抽取題目而產(chǎn)生考卷,就能把因教師認識差異而造成考點覆蓋不全面、考察深度不穩(wěn)定等現(xiàn)象盡可能地避免,保持該科目逐年考察要求的相對穩(wěn)定性和連貫性,更好地實現(xiàn)教學(xué)大綱所要求的知識掌握目標。
。ǘ┯欣谛骂}型的創(chuàng)造與應(yīng)用
在一門課程的試卷中,大部分題目通常應(yīng)當是常規(guī)性的題型且難度適中,目的是考察學(xué)生是否已經(jīng)達到“識記”、“理解”層次的知識水平;同時,又最好能有少量(題量和分值上都較少)的非常規(guī)性的新題型,考察學(xué)生是否能夠達到靈活“應(yīng)用”該知識點的層次,甚至可能在一道題目中綜合考察幾個相關(guān)的知識點。這兩類題目的重要程度不分伯仲,前者保證考察的全面性,屬于基礎(chǔ);后者則可以體現(xiàn)考察的區(qū)分度,讓不同學(xué)生之間的掌握程度差異得以真實地體現(xiàn)出來,屬于“拔尖”。
然而,在以往教師單獨命題時,保證這兩類題目的均衡實際上是較為困難的。因為基礎(chǔ)性的常規(guī)題型數(shù)量較大、覆蓋面較廣,消耗了命題人較多的時間與精力,再想要設(shè)計出具有創(chuàng)新性、綜合性的題型,則往往力所不及。
而有了題庫之后,教師在命題時的精力得到了極大的解放:大量的、常規(guī)性的考題直接由題庫抽取產(chǎn)生,教師可以將精力集中在研究、創(chuàng)造新的題型上,并在例行的年度題庫維護中將其補充入題庫中。這樣,新型的考題能夠得到更好的創(chuàng)造與應(yīng)用,保證了題庫的質(zhì)量不斷提高。
(三)有利于防范考試作弊行為的發(fā)生
盡管在絕大多數(shù)高校中,學(xué)生考試作弊都是極其個別、偶發(fā)的現(xiàn)象,但從教育者的角度來說,當然是希望把這種可能降至最低。除了加強誠信教育、嚴明考試紀律外,我院也嘗試了通過題庫建設(shè),從技術(shù)上杜絕作弊的可能性。
具體而言,當某一門課程的題庫建好后,臨考前抽取試卷時,教務(wù)人員會借助簡單的計算機程序,對部分考題的題號順序、部分選擇題的選項順序加以隨機打亂,從而產(chǎn)生2~3套不同的試卷,分發(fā)給同一個考試的學(xué)生使用。
這樣,盡管試卷上的試題本質(zhì)上是完全相同的,但相鄰座位的兩名考生拿到的試卷卻可能有很大的差異,比如A1卷上的第5題變成了A2卷上的第8題,或者第3題的正確答案由“A”變成了“C”,使得抄襲他人答案、傳紙條等作弊手段就完全失去了意義。同時,試題的覆蓋面和難度都沒有發(fā)生任何實質(zhì)變化,對所有考生都是公平對待的。這種同題多卷的模式,增大了作弊者的難度,確保了考察結(jié)果的真實性、可信性。
另外,因為試卷是臨考前由學(xué)院教務(wù)部門隨機抽取,連授課教師自己也并不知曉當次的具體考題,在很大程度上就避免了考試前給學(xué)生“畫重點”的不恰當做法,促使學(xué)生端正學(xué)習(xí)態(tài)度,平時認真聽課、考前全面復(fù)習(xí),真正實現(xiàn)了“為學(xué)而考”而非“為考而學(xué)”的目標。
。ㄋ模┛梢宰鳛榻虒W(xué)改革的輔助評價依據(jù)
我院近年來一直大力推動本科教學(xué)質(zhì)量工程建設(shè),并參照工程類專業(yè)認證的要求進行教學(xué)改革,每年都有大量的教學(xué)改革課題立項、實施。然而,如何評價一項教學(xué)改革是否成功,依然是一個較難把握的問題。
在實施題庫建設(shè)之后,由于考題范圍、難度都相對穩(wěn)定,學(xué)生的考試成績更真實地反映了其知識水平,所以也可以作為評價一項教學(xué)改革是否成功的輔助依據(jù)。當然,考試成績并不能說明一切問題,但如果學(xué)生的平均成績沒有明顯提高,則該教學(xué)改革的效果應(yīng)當是很有限的。
。ㄎ澹┪磥淼奶剿鞣较
此外,基于題庫建設(shè),我們也在考慮可否將考試進一步改為“多題多卷”的模式,徹底地杜絕抄襲作弊的可能。
展望未來,我們還在積極探索將題庫建設(shè)和在線無紙化考試相結(jié)合的可能性,更好、更方便地評價學(xué)生的學(xué)習(xí)水平,同時也為適應(yīng)未來在線教育(如MOOC課程等)預(yù)留了升級空間。
二、題庫建設(shè)中的重點與難點
在本院的題庫建設(shè)工作中,我們也總結(jié)出了一些經(jīng)驗,供各位教師參考。
。ㄒ唬﹫猿忠越虒W(xué)大綱、教學(xué)目標作為題庫的基礎(chǔ)
考試從來就是手段而非目的,題庫建設(shè)也應(yīng)當是服從于、服務(wù)于教學(xué)工作。因此,在題庫建設(shè)伊始,所有參與命題的教師就必須統(tǒng)一認識,嚴格按照教學(xué)大綱、教學(xué)計劃(包括各章節(jié)的學(xué)時數(shù)安排)來設(shè)計考題,力求絕大部分題目的深度都恰好達到教學(xué)大綱的要求,既不過深又不太淺,以實現(xiàn)教學(xué)目標為衡量標準。
。ǘ┐_保試題重復(fù)率低于一定比例
理論上說,每一屆學(xué)生考試后的試卷是要當場收回的,但在多年的教學(xué)實踐中,我們也發(fā)現(xiàn)一些學(xué)生能通過各種渠道獲得前幾屆的考試試卷。這就意味著,我們的題庫必須保持足夠大的題量,控制考題的重復(fù)率,否則考試就失去了意義。這樣,哪怕學(xué)生獲知了以往的考試題目,依然不能因此而推測出今年的考題,保證考試的嚴肅性和公平性。
為此,我們制定了一個經(jīng)驗性的規(guī)則:每一個知識點,在題庫中至少要有兩個不同題型的題目加以考察,重要的知識點至少要有6道不同的題目存在于題庫中;同時,任何一道題目,在連續(xù)隨機抽取20次的情況下,被抽中的概率累計不能超過15%(即不能被抽中3次以上),并以此作為題庫驗收的強制性標準之一。
。ㄈ⿲︻}庫的定期維護
如上所述,為了避免歷年考題的雷同,當一道題目被抽中使用之后,至少在次年的考試中不應(yīng)再將其列入。然而,如果將考過的題目一律棄之不用,又會造成題庫逐年萎縮的尷尬場面。
解決方案,就是對題庫進行定期維護,對已經(jīng)使用過的部分考題“冷藏”,1~2年內(nèi)不再使用,同時對該知識點進行補充;冷藏、補充的題目比例,不低于當年考題總數(shù)的30%。
同時,在每年的教研活動中,鼓勵任課教師為題庫補充新的題目,特別是新題型,以及綜合性、應(yīng)用性較強的題目,并將一部分學(xué)科研究的前沿動態(tài)作為題目背景引入,不斷地保持和提高題庫的質(zhì)量與時效性。
。ㄋ模╊}庫的驗收制度
為確保題庫建設(shè)質(zhì)量,在題庫建設(shè)中,采取了教研室、學(xué)院兩級驗收的制度。教研室主要是結(jié)合教學(xué)大綱,確認知識點得到了全面的覆蓋且考察的難度適中;學(xué)院層面則由教務(wù)部門牽頭,通過隨機多次抽取核對試題重復(fù)率、抽查知識點在題庫中被考察的題目數(shù)等技術(shù)指標來保證題庫的容量。
另外,為全面評價題庫的質(zhì)量與難易程度,每一門課程的題庫驗收時,均需組織一次模擬測試,參加測試的人員為1~2名擔任本課程教學(xué)的教師,加上1~2名經(jīng)過短暫復(fù)習(xí)的研究生同學(xué)(本次題庫建設(shè)僅涉及為本科生開設(shè)的課程),以此來評估試題的難度和數(shù)量是否適合絕大多數(shù)應(yīng)考學(xué)生的水平。
三、對試題庫質(zhì)量的評估體系
在一道試題沒有被實際使用之前,對它所做出的評價多少帶有主觀色彩。同時,囿于教師與學(xué)生的知識水平差異,這種評價有時候甚至?xí)霈F(xiàn)相當大的偏差。
為此,參考國內(nèi)外的研究成果,結(jié)合課程實際,我們制定了一些試題評估的指標,在每一年考試結(jié)束之后,由教研室組織對當年的試卷進行評估,回顧式地評價試題質(zhì)量,并作為試題庫維護和調(diào)整的重要依據(jù)。
(一)重視試題的區(qū)分度指標
試題的區(qū)分度D,是目前較為公認的試題定量評價四個指標之一,它體現(xiàn)了一道試題在辨別、區(qū)分學(xué)生知識水平上所產(chǎn)生的貢獻。不同的文獻中,提出了多種區(qū)分度的計算方法,本院采取的計算方法是:先按照全卷總分,對全體考生由高到低進行排序,取排在前27%的考生稱為高分考生,排在最后27%的考生稱為低分考生。然后,對每一道題目,分別統(tǒng)計高分考生的平均分(PH)和低分考生所獲得的平均分(PL)。則:D=PH/PL
因此,D值越大,則說明此題目區(qū)分高分考生和低分考生的效果就越明顯;而此指標過高或過低,都不利于考察全體學(xué)生的學(xué)習(xí)水平。經(jīng)過調(diào)研和討論,我們認為,每道題目的D值的合理區(qū)間定在2~5比較恰當,個別考題允許D值達到7,以此來拉開考分差距,但全卷的平均D值應(yīng)當控制在2~3之間。
。ǘ┐_保試題的難度系數(shù)指標
試題的難度系數(shù)P,也是通行的四個評價指標之一,其計算方式為:
統(tǒng)計所有考生在某一個題目上的得分,計為x,而該題設(shè)定的滿分為w,則:P=1-x/y.
參考國內(nèi)外的研究文獻,結(jié)合以往考試的實際情況,我們認為,將P值的區(qū)間定在0.4~0.6之間較為合理,允許個別題目的P值處于0.3~0.8的區(qū)間,全卷的平均P值最好處于0.3~0.5之間。
在回顧性的分析中,如果某一道題目實測的D值或P值,嚴重偏離了我們預(yù)計的范圍,則需要對該題目進行討論,決定是否加以修改、替換。
。ㄈ┰和、校外專家的評分制度
因為試卷對于考生都是一次性使用,不可能重測,所以很難通過回顧性的統(tǒng)計數(shù)據(jù)來評價考題的信度(Reliability)和效度(Validity)指標。為此,我們邀請了院外、校外教授相同學(xué)科的資深教師,抽取題庫中的部分題目進行了評估。具體方式為:
對一道題目,按照題目與它所考察的知識點之間的關(guān)系進行打分,最高5分(緊密吻合),最低1分(基本無關(guān)),取幾位專家的打分平均值,以此來評價其效度。經(jīng)過實際評分,送評的題目基本上都達到了4分以上,證明我們建設(shè)的題庫質(zhì)量還是較高的。
而對于信度指標,我們采取的是將一道題目的P值,與近5年來考察該知識點的題目的平均P值進行比較的方式,但考慮到各屆學(xué)生實際情況不同,加上近年來教學(xué)質(zhì)量工程的推進,這種評估方式未必合理,還有待于進一步的研究。
四、結(jié)語
綜上所述,我們認為,為本科課程建設(shè)配套的考試題庫,有利于全面、客觀、有效地評價學(xué)生的學(xué)習(xí)成果,有利于教學(xué)改革的推進與評價;更有助于端正學(xué)風、考風,促使教師更用心地授課,學(xué)生更認真地聽課、復(fù)習(xí),真正達到全面推動教學(xué)質(zhì)量提高的目的,而這也正是高校教學(xué)改革的最終目標所在,具有較強的積極作用。
參考文獻:
[1]劉靜。關(guān)于高校試題題庫建設(shè)的若干思考[J].中國社會醫(yī)學(xué)雜志,2009,(3):143.
[2]李光明。如何做好題庫建設(shè)———來自英美考試機構(gòu)的啟示[J].中國考試,2011,(12):3.
[3]李光明。關(guān)于題庫建設(shè)若干問題的思考[J].中國考試,2014,(9):3.
[4]傅強。淺析中藥藥理學(xué)教考分離和試題庫建設(shè)[J].海峽藥學(xué),2014,(9):150.
[5]李永華。網(wǎng)絡(luò)化考試的題庫建設(shè)及應(yīng)用研究[J].高教論壇,2013,(10):57.
[6]鄭群。醫(yī)學(xué)微生物學(xué)題庫建設(shè)的實踐與探索[J].繼續(xù)醫(yī)學(xué)教育,2013,(10):78.
【論本科教學(xué)中題庫建設(shè)的意義及質(zhì)量評價體系】相關(guān)文章:
教學(xué)質(zhì)量保障體系和調(diào)控系統(tǒng)建設(shè)的研究實踐08-15
論新建公安本科院校實踐教學(xué)質(zhì)量監(jiān)控與評價體系的構(gòu)建08-17
構(gòu)建合理的高中作文教學(xué)評價體系08-20
農(nóng)產(chǎn)品質(zhì)量安全體系建設(shè)調(diào)研報告08-24
社會信用體系建設(shè)報告08-24
跳繩的意義及在體育教學(xué)中的運用08-23