4.3 地位量数
在一组数据或一个次数分布中,每一个数据都有相应的地位,都可用一定的地位量数来说明它所处的位置。反映数据所处地位的量就叫作地位量数。百分位数、百分等级分数、标准分数等都是地位量数。
4.3.1 百分位数
百分位数(Percentile)又称百分位分数,是一种相对地位量数。把一个次数分布排序后,分为100个单位,百分位数就是次数分布中相对于某个特定百分点的原始分数,表明在次数分布中特定个案百分比低于该分数。百分位数用Pm表示。例如,若P24等于60,则表明在该次数分布中有24%的个案低于60分。
对于未分组数据,Excel提供了PERCENTILE.INC函数计算百分位数。
对于分组数据,可根据累积频数分布表,运用插值法,按比例计算。公式为
式中,L为Pm所在组的下限;n为总频数;Fm-1为Pm所在组以下的累积频数;fm为Pm所在组的频数;d为组距。
例4-24 在文件“第4章统计量.xlsx”中的“地位量数”工作表中,有某级5个班250人的政治成绩表及频数分布表,如图4-53所示(隐藏了部分行),如何分别按原始成绩和频数分布表计算前10%的百分位数?
解题思路:对于未分组数据,可以直接使用PERCENTILE.INC函数计算百分位数。对于分组数据,则按百分位数公式计算。
解题过程:建立统计表,输入公式。
(1)建立统计表。建立一个“两类数据的地位量数”统计表(包含后面将要介绍到的百分等级分数),如图4-54所示。
图4-53 政治成绩表及频数分布表
图4-54 两类数据的地位量数表
(2)输入公式。
在M3输入公式“=PERCENTILE.INC(C3:C252,1-0.1)”。
在N3输入公式“=91+(0.9*J10-J8)/I9*5”。
计算结果如图4-55所示(隐藏了D列)。
图4-55 两类数据百分位数的计算结果
【函数公式解析】
PERCENTILE.INC函数返回区域中数值的第k个百分点的值。具体语法为:
PERCENTILE.INC(array,k)
array:必需,定义相对位置的数组或数据区域。
k:必需,范围内0~1(包含0和1)的百分点值。
4.3.2 百分等级分数
百分等级分数是心理测量学中的术语,是应用最广泛的表示测验分数的方法。一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。换句话说,百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置越低。百分等级分数用PR表示。
对于未分组数据,Excel提供了PERCENTRANK.INC函数计算百分等级分数。
对于分组数据,可根据累积频数分布表,运用插值法,按比例。公式为
式中,L为Pm所在组的下限;Fm-1为Pm所在组以下的累积频数;fm为Pm所在组的频数;d为组距;n为总频数。
例4-25 在例4-24的基础上,分别按原始成绩和频数分布表计算94分的百分等级分数。
解题思路:在Excel中,对于未分组数据,可以使用PERCENTRANK.INC函数计算百分等级分数。对于分组数据,则按公式计算。
解题过程:由于在例4-24已建立统计表,这里直接在表中输入公式。
在M4输入公式“=PERCENTRANK.INC(C3:C252,94)*100”。
在N4输入公式“=(J8+(94-91)*I9/5)/J10*100”。
计算结果如图4-56所示(隐藏了D列)。
图4-56 两类数据百分位数的计算结果
【函数公式解析】
PERCENTRANK.INC函数将某个数值在数据集中的排位作为数据集的百分比值返回,此处的百分比值的范围为0~1(含0和1)。具体语法为:
PERCENTRANK.INC(array,x,[significance])
array:必需,定义相对位置的数值数组或数值数据区域。
x:必需,需要得到其排位的值。
[significance]:可选,用于标识返回的百分比值的有效位数的值。如果省略,则使用3位小数(0.xxx)。
4.3.3 标准分数
标准分数(Standard Score)也叫Z分数(Z-score),是一个分数与一组数据平均数的差再除以标准差的商。用公式表示为
𝑍值的量代表着原始分数和母体平均值之间的距离,是以标准差为单位的一个相对量,没有实际单位。在原始分数低于平均值时,则𝑍为负数,反之,则为正数。一组原始分数的𝑍分数的标准差为1。若原始分数呈正态分布,转换成𝑍分数后,会得到一个均值为0,标准差为1的标准正态分布。𝑍分数被教育统计学家誉为“多学科表示量数”,有着广泛的用途。根据标准分数公式,Excel提供了STANDARDIZE函数计算标准分数。
例4-26 在例4-24的基础上,如何将原始成绩转换为𝑍分数?
解题思路:在Excel中,可以使用STANDARDIZE函数将原始成绩转换为Z分数。
解题过程:建立表格,输入公式。
(1)建立表格。在原数据“政治成绩表”表后增加1列,如图4-57所示。
(2)输入公式。
在D3单元格输入公式“=STANDARDIZE(C3,AVERAGE($C$3:$C$252),STDEV.S($C$3:$C$252))”。将D3单元格的公式向下填充到D252单元格。
计算结果如图4-58所示(隐藏了部分行)。
图4-57 原数据表后增加1列
图4-58 两类数据百分位数的计算结果
【函数公式解析】
STANDARDIZE函数返回由平均数和标准差表示的分布的规范化值。具体语法为:
STANDARDIZE(x,mean,standard_dev)
x:必需,需要进行正态化的数值。
mean:必需,分布的算术平均值。
standard_dev:必需,分布的标准偏差。
例4-27 在文件“第4章统计量.xlsx”的“地位量数”工作表中,有两名学生的各科成绩和全体学生的平均分和标准差,如图4-59所示,试比较两名学生的成绩。
解题思路:可以从原始成绩和𝑍分数两个角度进行比较。
解题过程:建立表格,输入公式。
(1)建立表格。在原数据表后增加2列和1行,如图4-60所示。
图4-59 两名学生的各科成绩和全体学生的平均分和标准差
图4-60 在原数据表后增加2列和1行
(2)输入公式。
在U4单元格输入公式“=(Q4-$S4)/$T4”。
将U4单元格的公式向右向下填充到V8单元格。
在Q9单元格输入公式“=SUM(Q4:Q8)”。
将Q9单元格的公式向右填充到V9单元格,再清除S9:T9区域的公式。
结果如图4-61所示。
从表中可以看出,虽然生A的原始成绩总分低于生B,但生A的Z分数总分高于生B,所以生A的成绩更好。对原始成绩直接计算总分是不科学的,因为各科的难易程度、评分的宽严程度不同,各科的分数是不同质的。而Z分数是相对地位量数,消除了量纲,各科就可以等量齐观了。
图4-61 两名学生成绩比较的结果