如何分析和评价心理与教育测量的质量
参考答案:
解析:主要从信度和效度两个方面来分析和评价心理与教育测量的质量。 一般来说,一个好的测量必须具有较高的信度和效度。测量的信度是指测量结果的稳定性程度,效度是指一个测验或量表实际测出其所要测的心理特质的程度。 (1)评价信度主要是通过计算信度系数来进行的,方法主要有: ①重测信度。求法是对同一批被试运用某个测验实施首测,相隔一段时间后对它进行再测,然后计算首测与再测所得分数的相关(一般是积差相关),即得重测信度。这种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数。这种信度的优点是能提供有关测验结果是否随着时间而变异的资料,可作为预测受测者将来行为表现的依据。缺点是易受练习和记忆的影响,前后两次施测间隔的长短必须适度。 ②复本信度。求法是先运用同一测验的一型或A型施测,随后在最短的时间内运用二型或B型进行再测,然后再求它们得分的相关系数。 ③内部一致性信度。估计内部一致性系数的方法通常有两种:一种是分半法,另一种是需要对项目反应的方差或协方差进行分析。 分半法是将一个测验分裂为两个假定相等而独立的部分,然后计算这两部分的记分的相关系数(一般是以项目的奇数为一组,偶数为另一组),继而再用斯皮尔曼—布朗公式来估计整个测验的信度(斯皮尔曼—布朗公式要求两半的变异数相等)。 除此之外,还有克朗巴赫阿尔法系数(适用于0、1记分的一种内在一致性系数)、库德—理查逊公式(只适用于0、1记分的题目)、荷伊特信度、因素分析等方法。有些测量学家认为因素分析是决定测验同质性的最好方法。因素分析最初是由心理学家斯皮尔曼在研究智力理论时提出来的,后来发展成为一种复杂的统计技术,用于确定一组变量间的相互关系最少需要几个因素来解释。测验上,如果一个因素就足以解释所有题目分数的变异时,这个测验就是同质的;假如需要一个以上的因素时,则测验的组成是异质的。 ④评分者信度。求法是随机抽取相当份数的试卷,由两位评分者按记分规则分别给分,然后根据每份试卷的两个分数计算相关系数,即得评分者信度。一般要求在成对的、受过训练的评分者之间平均一致性达到0.90以上,才认为评分是客观的。 综上所述,信度高低是用相关系数表示的。不同的测验内容,对相关系数的要求也有所不同。一般说来,标准智力测验应达到0.85以上,个性测验和兴趣测验一般应达到 0.70~0.80水平。学业成就测验要求在0.90以上,才能被称为是一个良好的测验。 (2)评价效度的方法有: ①内容效度。是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。确定内容效度的主要方法有专家判断法、复本法、再测法和经验法。 ②结构效度。是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。确定结构效度的方法有测验内法、测验间法和效标关联法。 ③效标效度。被预测的行为是衡量测验是否有效的标准,简称效标。所谓效标效度,就是考察测验分数与效标的关系,看测验对我们感兴趣的行为预测得如何。效标效度的估计方法有相关法、分组法、预期表法、命中率法及功利率法。