IRT理论概述
IRT理论是一系列心理统计学模型的总称。IRT是用来分析考试成绩或者问卷调查数据的数学模型。这些模型的目标是来确定的潜在心理特征,却发现了极为类似的结果
数学模型
IRT模型:
这个模型也叫做“3参数Normal-ogive模型”,简称为3PN,是由Lord 提出的。在实际应用中,人们出于数值处理的简便,更倾向于使用“3参数Logistic模型,该模型的表达式如下:
其中D为常数1.7
根据这两个模型所绘制出的曲线也叫做项目特征曲线。其意义在于描述出“成功解答某一特定考试项目的可能性”和“被测试者能力”之间的关系。在以上的两个模型中,共有3个参数:a,b和c。其中参数c一般被称为“猜测参数”或者“伪猜测参数”。b一般表示在ICC图像最陡的那一点所对应的θ值。对于下限为0的ICC函数来说,b所对应的是概率为0.5的测试者能力值。改变b会导致ICC的左右移动,但是不改变其外形。当b值增加,会使ICC曲线向右移动,这会引起在即使θ保持不变,但是答题正确率下降,亦即题目难度增加。反之当b值减小,ICC曲线向左移动。题目难度降低。
a叫做区分度参数或项目区分度。在数学上,a的值是ICC曲线拐点处的斜率,即斜率的最大值。在这一点上,能力值微小的改变会造成最大的P值变动。所以a体现的是该项目的最大区分度。
而Rasch提出的模型:
争论
虽然Rasch和Lord在几乎同时独立地提出了各自的模型。并且这两个模型现在都被广泛认为是IRT模型的基础。但是在心理统计学家社群内许多年来一直存在着Rasch模型的笃信者和其余心理统计学家的争论。主流的IRT学者认为Rasch模型只不过是3PN模型的一个特例,即在3PN模型中,参数c和a都为0的情况。而Rasch派学者则认为只有Rasch模型是完全不同的模型,真正体现了“测量”的定义,因为在模型成立的时候,θ和b分别是“回答正确的题数”以及“对某一特定题目的正确率”的充分统计量,其简洁性也优于其他模型。
但是在面对不同区分度的测试项目时,Rasch模型中并没有相应的参数,所以无法做出区分。事实上对于Rasch派学者来说,他们认为所有的项目区分度都是一样的。对于主流IRT学者,常见的做法是用别的模型拟合数据,Rasch派学者的方法是把所有不能拟合Rasch模型的测试项目全部抛弃。简而言之,主流IRT学者的做法是“用模型拟合数据”,对于Rasch派学者来说,他们选择“用数据配合模型”,是争论的主要原因。
至今,Rasch派学者虽然在人数上是学界的少数派,但是他们仍然在考试测量领域以及跨国比较教育研究领域发挥着巨大的影响力。