壹、難度難度是指試題的難易程度,它是衡量試題質量的壹個重要指標參數,它和區分度***同影響並決定試卷的鑒別性。壹般認為,試題的難度指數在0.3-0.7之間比較合適,整份試卷的平均難度最好在0.5左右,高於0.7和低於0.3的試題不能太多。1、難度的兩種定義:
(1)P=1—x/w x為某題得分的平均分數,w為該題的滿分。這種定義法,難度值小時表明試題容易,值大時表明試題難,最小值為0,最大值為1。
(2)P=x/w 這種定義法,難度值小時表明試題難,值大時表明試題容易,最小值為0,最大值為1。
2、難度的計算:
(1)主觀性試題的難度
A 基本公式法:P=1—x/w
B 極端分組法 P=1—(XH+XL)∕2W XH :高分組的平均得分(前27%),XL:低分組的平均得分(後27%)。
(2)客觀性試題的難度
A 基本公式法 :P=1—R/N R 為答對人數,N 為全體人數。
B 極端分組法: P=1—(PH+PL)∕2
PH=RH/n 叫高分組通過率,RH:高分組答對人數,n:總人數的前27%。PL=RL/n 叫低分組通過率,RL:低分組答對人數。
二、區分度區分度是區分應試者能力水平高低的指標。試題區分度高,可以拉開不同水平應試者分數的距離,使高水平者得高分,低水平者得低分,而區分度低則反映不出不同應試者的水平差異。試題的區分度與試題的難度直接相關,通常來說,中等難度的試題區分度較大。另外,試題的區分度也與應試者的水平密切相關,試題難度只有等於或略低於應試者的實際能力,其區分性能才能充分顯現出來。區分度指標的評價: -1.00≤D≤+1.00,區分度指數越高,試題的區分度就越強。壹般認為,區分度指數高於0.3,試題便可以被接受。2、 區分度的計算方法:基本公式法 :D=(H-L)÷N(D代表區分度指數,H代表高分組答對題的人數,L代表低分組答對題的人數,N代表壹個組的人數即高分組與低分組人數之和)。極端分組法:
(1)主觀性試題:D=SH—SL∕n(WH-WL)
SH:高分組得分總數,SL:低分組得分總數,WH:該題的最高得分,WL:該題的最低得分,n為高分組(或低分組)的人數,即總人數的27%。
(2) 客觀性試題:D= PH—PL ,或D= RH—RL∕n
(3) 壹般也可以用D=XH—XL∕X滿 計算。XH:高分組某試題的平均分,XL:低分組某試題的平均分,X滿:該題的滿分。
三、信度信度是指測得結果的壹致性或穩定性,穩定性越大,意味著測評結果越可靠。相反,如果用某套試題對同壹應試者先後進行兩次測試,結果第壹次得80分,第二次得50分,結果的可靠性就值得懷疑了。信度通常以兩次測評結果的相關系數來表示。相關系數為1,表明測評工具如試卷完全可靠;相關系數為0,則表明該試卷完全不可靠。壹般來說,要求信度在0.7以上。1、評價信度的方法:(1)重測法,(2)復本法—副題,(3)折半法,或者說:用再測信度、復本信度和內部壹致信度三種方法來進行評估。再測信度是指將同壹試卷在相同的條件下對同壹組考生先後實施兩次,兩次測評結果的相關系數。復本信度是指用兩份或幾份在構想、內容、難度、題型和題量等方面都平行的試卷進行測試,測評結果之間的相關系數。內部壹致信度是指試卷內部各題之間的壹致性,通常是將試卷壹分為二,然後計算壹半試卷與另壹半試卷之間的相關系數。
2、 信度系數 γxx=ST2∕SX2 ST2 叫真分數方差,SX2 為獲得分數方差。信度系數的最大值為1,表示測驗的可靠性高,最小值為0,表示測驗的信度低。當γxx≥0.70時,測驗可用於團體間的比較。當γxx≥0.85時,測驗可用於個體之間的比較。
四、效度效度是壹個測試能夠測試出它所要測試的東西的程度,即測試結果與測試目標的符合程度.任何測試工具,無論其它方面有多好,若效度太低,測試的結果不是它要測試的東西(如用英語試卷測試學生的數學能力),那麽,對目前所要測試的東西,這個測試將是無價值的。由於心理現象本身的特點,測評的效度尤為重要。心理屬於精神方面的東西,目前人們還無法直接觀察它,只能通過壹個人的行為模式或者對測試題目的反應,來推論其心理特質。如智力水於主要是借助於個體對壹些問題的反應及正誤等結果來推斷的。效度是壹個相對概念,即效度只有高低之分,沒有全部有效和全部無效之分。效度從種類上可分為卷面效度、內容效度、構想效度、預測效度和***時效度。