A + B

成功人数
选择人数

的值越高说明测验越有效。在许多情况下

人们只关

心录取者的成功与失败

对于淘汰者的命运如何却并不关心

所以对错误拒绝

(D)

的比例不予考虑

(

郑日昌

,1987)

。

2. 5

　构想效度 　构想效度指测验能够测量到理论上的构想

或特质的程度。这些构想均有理论基础

但都无法直接观察

只能通过具有操作定义的测验加以测量。操作测验成绩与理
念中的构想或特质的符合程度

即为构想效度。例如

从一般

的智力理论

可以提出

项功能性的假设

绝对智力随年龄的

增长而增长

;

智力与学业成就密切相关

;

智商相对稳定

;

智力

受环境与遗传影响。于是

心理学家依据智力的上述功能性

假设

编制智力测验

然后实施测验

最后对测验结果进行分

析。如果发现

被试的测验分数随年龄的增长而增长

;

智商与

学生的各科学习成绩均有一定程度的正相关

;

智商在一段时

间内保持相对稳定性

;

智商的遗传度在

0. 70

左右。那么

这

些实证研究结果就为智力的构想效度提供了支持性证据。

要决定

个测验的构想效度

一般需要

个基本步骤

首

先需要建立理论框架

以解释被试在测验上的表现

;

然后

依

据理论框架

推导出各种与测验成绩有关的假设

;

最后

以逻

辑方法和实证方法检验这些假设。标准化的测验均是依据这

个步骤研制的。

2. 6

　确定构想效度的方法

2. 6. 1

　因素分析　多数新编制的纸笔测验都要经过因素分

析来检验构想效度。因素分析可分为探索性因素分析和证实
性因素分析。通过探索性因素分析

可以从数据出发

找出影

响测验条目之间的共同因素。通过证实性因素分析

可以从

理论出发

检验影响测验条目之间的共同因素。现在

研究者

在制定新测验时

往往是两种因素分析并用

即先做探索性因

素分析

再做证实性因素分析。一般来说

证实性因素分析的

理论导向更为清晰明确

且可将理论模型分为结构模型和测

量模型

是对构想效度的更为有力的检验。非纸笔测验也可

用因素分析方法检验其构想效度。例如

我们可以首先假设

人的体能是一个包含

个层次的结构

即体能可分为力量、

速

度、

耐力

类因素

每类因素可通过

～

项测验表达

见图

。

然后我们可以对

400

名被试进行

项体能测验

并通过因素

分析

检验我们的上述设想是否能够得到测验数据的支持。

图

　假设的

层次体能模型

2. 6. 2

　与标准化测验的相关　测量相同构想或特质的测验

彼此之间应该有较高相关。因此

一个新测验与已知的标准

化测验之间的相关

可以作为衡量新测验测量相同构想或特

质程度的标准。那么

既然新测验与旧测验有高相关

为何要

用新测验呢

一般来讲

新测验必须在某些方面优于旧测验

且与旧测验有较高相关

才有生存理由。新测验应当更简单

更经济

更省时

更精细

或更全面

才有启用新测验的逻辑依

据。

2. 6. 3

　多特质 —多方法矩阵　

Campbell

和

Fiske (1959)

[ 6 ]

曾提

出

要确定一个测验的构想效度

则该测验不仅应与测量相同

构想或特质等理论上相同的变量呈高相关

也应与测量不同

构想或特质等理论上相同的变量呈低相关

前者涉及的效度

叫聚合效度

(convergent validity) ,

后者涉及的效度叫区分效度

(discriminant validity)

。例如

耐力测验与长跑成绩之间的相关

表示的是聚合效度

而耐力测验与速度测验之间的相关表示

的是区分效度。一个新研制的测验

一般都需要报告这两种

效度。

Campbell

和

Fiske (1959)

[ 6 ]

发明了一种叫多特质 —多方法

矩阵的方法

以具体检验聚合效度和区分效度。请看表

。

有

种特质

分别是

:A =

支配性

,B =

社会化

,C =

成就动机

;

测量这

种人格特质有

种方法

分别是

:1 =

自陈量表

,2 =

投射测验

,3 =

同伴评定。

表示用自陈量表测量的支配性

分数

,B2

表示用投射测验测量的社会化分数

,C3

表示用同伴

评定测量的成就动机分数

其余分数均依此类推。

表

　假设的多特质多方法矩阵

方法

特质

(0. 89)

方法

0. 51 (0. 89)

0. 38 0. 37 (0. 76)

0. 57 0. 22 0. 09 (0. 93)

方法

0. 22 0. 57 0. 10 0. 68 (0. 94)

0. 11 0. 11 0. 46 0. 59 0. 58 (0. 84)

0. 56

0. 22

0. 11

0. 67

0. 42

0. 33 (0. 94)

方法

0. 23 0. 58 0. 12 0. 43 0. 66 0. 34 0. 67 (0. 92)

0. 11 0. 11 0. 45 0. 34 0. 32 0. 58 0. 58 0. 60 (0. 85)

　　引自彭凯平

,1989 ,165

页

[7 ]

。

表

中主对角线上括号内数字为各方法测量各特质的信

度系数

例如用同伴评定方法测量成就动机的信度系数为

85 (

见

与

交界处

右下角括号内数字

)

。

表中

个较短对角线的黑体数字为效度系数

表示以不

同方法测量相同特质所求得的相关系数。例如

用自陈量表

和同伴评定两种方法测量成就动机的相关系数为

0. 45 (

见

与

交界处的黑体数字

)

。

表中

个实线三角形中的数字是以相同方法测量不同特

质所求得的相关系数。例如

用自陈量表测量支配性和社会

化这两种特质的相关系数为

0. 51 (

见

与

交界处数字

)

。

表中

个虚线三角形中的数字是以不同方法测量不同特

质所求得的相关系数。例如

自陈量表测量支配性与用同伴

评定测量成就动机之间的相关系数为

0. 11 (

见

与

交界

处的数字

)

。

如果希望得到满意的构想效度

效度系数

(

黑体数字

)

应

该显著高于以不同方法测量不同特质的相关系数

(

虚线三角

形

) ,

也应该高于以相同方法来测量不同特质的相关系数

(

实

线三角形

)

。其中

效度系数为聚合效度

(

黑体数字

) ,

其他两

种相关系数为区分效度

(

虚线三角型和实线三角形

) ,

表示特

质间的相关不是由测量方法决定的。例如

用自陈量表测得

的支配性分数与投射测验测得的支配性分数之间的相关

(

见

(

下转第

501

页

)

・

　第

期　

张力为

效度的正用与误用