您的当前位置:首页正文

聚类分析及判别分析案例

2020-06-02 来源:独旅网
一、 案例背景

随着现代人力资源管理理论的迅速发展,绩效考评技术水平也在不断提高。绩效的多因性、多维性,要求对绩效实施多标准大样本科学有效的评价。对企业来说,对上千人进行多达50~60个标准的考核是很常见的现象。但是,目前多标准大样本大型企业绩效考评 问题仍然困扰着许多人力资源管理从业人员。为此,有必要将当今国际上最流行的视窗统计软件SPSS应用于绩效考评之中。

在分析企业员工绩效水平时, 由于员工绩效水平的指标很多,各指标之间还有一定的关联性,缺乏有效的方法进行比较。目前较理想的方法是非参数统计方法。本文将列举某企业的具体情况确定适当的考核标准,采用主成分分析以及聚类分析方法,比较出各员工绩效水平,从而为企业绩效管理提供一定的科学依据。

最后采用判别分析建立判别函数,同时与原分类进行比较。

聚类分析

二、绩效考评的模型建立

1、为了分析某企业绩效水平,按照综合性、可比性、实用性和易操作性的选取指标原则,本文选择了影响某企业绩效水平的成果、行为、态度等6个经济指标(见表1)。

表 1——变量和考评指标名称表

变量 指标名称 X1 工作产量 X2 工作质量 X3 工作出勤 X4 工砟损耗 X5 工作态度 X6 工作能力 2、对某企业,搜集整理了28名员工2009年第1季度的数据资料。构建1个28×6维的矩阵(见表2)。

表 2——某企业职工绩效考评结果 职工代号 X1 X2 X3 X4 X5 X6 1 9.68 9.62 8.37 8.63 9.86 9.74 2 8.09 8.83 9.38 9.79 9.98 9.73 3 7.46 8.73 6.74 5.59 8.83 8.46 4 6.08 8.25 5.04 5.92 8.33 8.29 5 6.61 8.36 6.67 7.46 8.38 8.14 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 7.69 7.46 7.6 7.6 7.16 6.04 6.27 6.61 7.39 7.83 7.36 7.24 6.49 5.43 4.57 6.43 5.88 3.94 4.82 4.02 3.87 4.15 4.99 8.85 8.93 9.28 8.26 8.62 8.17 7.94 8.5 8.44 8.79 8.53 8.61 8.03 7.67 7.4 8.38 7.89 6.91 7.3 7.26 6.96 7.5 7.52 6.44 5.7 6.75 7.5 5.72 3.95 3 4.34 5.92 3.85 5.39 4.69 4.56 4.22 2.96 4.87 3.87 2.97 3.07 2.28 2.79 1.56 2.11 7.45 7.06 8.03 7.63 7.11 8.08 4.52 5.61 5.37 5.35 7.09 3.98 7.18 3.87 3.02 4.87 6.34 6.77 5.87 5.63 4.92 4.81 6.23 8.19 8.58 8.68 8.79 8.19 8.24 7.16 8.52 8.83 8.58 8.23 9.04 8.54 8.41 8.74 8.78 8.37 8.17 6.32 9.66 5.32 8.44 8.3 8.1 8.36 8.22 7.63 8.18 8.65 7.81 8.36 7.47 8.03 8.04 8.07 8.57 7.6 7.97 8.37 8.19 8.16 6.01 9.07 6.23 8.38 8.14 3、应用SPSS数据统计分析系统首先对变量进行及主成分分析,找到样本的主成分及各变量在成分中的得分。去结果中的表3、表4、表5备用。 表 3 解释的总方差 成初始特征值a 提取平方和载入 份 方差方差合计 的 % 累积 % 合计 的 % 累积 % 原始 1 3.944 65.739 65.739 3.944 65.739 65.739 2 1.080 18.000 83.740 1.080 18.000 83.740 3 .650 10.832 94.571 4 .211 3.520 98.092 5 .080 1.337 99.428 6 .034 .572 100.000 重新标度 1 3.944 65.739 65.739 3.944 65.739 65.739 2 1.080 18.000 83.740 1.080 18.000 83.740 3 .650 10.832 94.571 4 .211 3.520 98.092 5 .080 1.337 99.428 6 .034 .572 100.000 提取方法:主成份分析。 a. 分析协方差矩阵时,初始特征值在整个原始解和重标刻度解中均相同。 表 4 成份矩阵 原始 重新标度 成份 2 -.319 -.239 -.320 -.187 .618 .633 1 .897 .899 .882 .697 .732 .729 2 -.319 -.239 -.320 -.187 .618 .633 a 1 Zscore(X1) Zscore(X2) Zscore(X3) Zscore(X4) Zscore(X5) Zscore(X6) 提取方法 :主成份。 成份 .897 .899 .882 .697 .732 .729 a. 已提取了 2 个成份。 表 5

成份得分系数矩阵a

成份

1 2

Zscore(X1) .227 -.295 Zscore(X2) .228 -.221 Zscore(X3) .224 -.297 Zscore(X4) .177 -.173 Zscore(X5) .186 .572 Zscore(X6) .185 .587 提取方法 :主成份。 构成得分。

a. 系数已被标准化。

4、从表3中可得到前两个成分的特征值大于1,分别为3.944和1.08,所以选取两个主成分。根据累计贡献率超过80%的一般选取原则,主成分1和主成分2的累计贡献率已达到

了83.74%的水平,表明原来6个变量反映的信息可由两个主成分反映83.74%。

从表4可看出,第一主成分基本支持了X1、X2、X3、X5和X6。而第二主成分基本支持了,该成分因子得分还有对未来员工绩效预报作用。第一主成分与工作质量、工作产量以及工作出勤高度正相关。因此第一主成分可以反映影响该企业绩效的工作成绩因素。第二主成分与工作能力以及工作态度高度正相关, 因此第二主成份可以反映影响该企业员工绩效的能力与态度因素。

三、绩效水平的类型划分及区域差异分析

因为本案例要研究职工工作绩效成绩的得分,根据两个主成分的表示重点不同,我们可以看到第一主成份反映的是绩效成绩的得分。所以计算每个样本在第一主成份方向的得分。

可以对数据标准化,并用每个样本乘以第一成分得分矩阵,即得各样本在第一主成份的综合得分。

例如1号样本在第一主成份方向的综合得分为: 2.24478*0.227 + 2.06671*0.228 + 1.82854*0.224 + 1.54332*0.177 + 1.56685*0.1865 + 2.07013*0.185=2.337944

其他各样本均按此方法算出综合得分,并按各样本在在第一主成分方向的综合得分的降序顺序排列数据,得到的就是各个员工工作绩效成绩得分。如表6 表6 各样本在第一主成份的综合职工代号 X1 X2 X3 X4 X5 X6 得分 1 2.24478 2.06671 1.82854 1.54332 1.56685 2.07013 2.337944 2 1.1618 0.91894 2.34746 2.28639 1.69646 2.05718 2.099889 8 0.82805 1.57273 0.9962 1.15898 0.29239 0.10131 1.047965 7 0.73269 1.06423 0.45672 0.53762 0.18438 0.28265 0.693014 6 0.88935 0.948 0.83692 0.78745 -0.23684 -0.05412 0.690811 3 0.73269 0.77365 0.99106 -0.40402 0.45439 0.41218 0.653969 9 0.82805 0.0908 1.38154 0.90275 0.41119 -0.66291 0.631764 5 0.15374 0.23609 0.9551 0.79385 -0.03163 -0.00231 0.436871 10 0.52836 0.61384 0.467 0.56965 -0.23684 0.0495 0.430435 16 0.66458 0.48308 0.29745 0.55684 -0.19364 -0.13184 0.365784 15 0.98471 0.86083 -0.49379 -0.55776 0.18438 -0.14479 0.217974 14 0.68501 0.35232 0.56975 -0.54494 0.45439 -0.87015 0.190535 18 0.072 -0.24336 -0.129 0.61449 0.14118 0.55466 0.169598 11 -0.2345 -0.03995 -0.44241 1.19101 -0.18284 0.65828 0.137142 17 0.58285 0.59931 -0.06221 -1.43534 0.68121 -0.09298 0.110463 13 0.15374 0.43949 -0.24203 -0.39121 0.11958 0.28265 0.086176 21 0.03114 0.26515 0.03028 -0.86523 0.40039 0.2956 0.050319 4 22 25 28 19 12 23 27 20 24 26 -0.20726 -0.34348 -1.61037 -0.94968 -0.64998 -0.07784 -1.66486 -1.52182 -1.23575 -1.06547 -1.71253 0.07628 -0.44676 -1.36207 -0.98432 -0.76639 -0.37411 -1.87057 -1.01338 -1.15867 -1.30395 -1.79793 0.11762 -0.48351 -1.30044 -1.38778 -0.30369 -0.93051 -0.94592 -1.67036 -0.95106 -0.89454 -1.0384 -0.19263 0.07641 -0.3784 0.00595 -1.5058 -1.08943 0.35186 -0.90366 -2.05029 -0.22466 -0.8332 -0.08563 -0.04243 1.35084 -0.11803 0.00077 -1.3493 -0.25844 0.03317 0.35719 -2.25654 -3.3366 0.19198 0.06245 1.2023 -0.00231 -0.70176 -0.42975 0.02359 0.30855 -0.22251 -2.76126 -2.4763 -0.01782 -0.27095 -0.5607 -0.77219 -0.78652 -0.8347 -0.99773 -1.04736 -1.09536 -1.70985 -2.25747 四、聚类分析

为了把各个员工工作绩效成绩分类,更好的描述成绩区间,我们要采用聚类分析对员工进行分类。(计划分为4类:优秀、良好、及格、不及格)

分类的步骤为:

1、“分析——分类——系统分类”,把标准化后的变量输入变量框中,在“分群框”中选择“个案”,在“输出框”中选择“统计量”、“图”。

2、“统计量”中选择“合并进程表”、“单一方案”(聚类数为4)。 3、“绘制”中选择“树状图”、“所有聚类”、“垂直”。

4、“方法”中选择“组间连接”、“平方欧式距离”。“标准化”选择“无”(因为采用的是已经标准化后的数据)。

5、“保存”中选择“单一方案”聚类数为4。 6、点击“确定”。 得到以下图表。 表 7 聚类表 阶 群集组合 首次出现阶群集 群集 1 群集 2 系数 群集 1 群集 2 下一阶 1 2 3 4 5 6 7 8 9 10 10 13 6 6 4 11 5 11 27 15 16 21 10 7 13 18 6 22 28 17 .099 .423 .528 .565 .640 .682 1.010 1.351 1.355 1.436 0 0 0 3 0 0 0 6 0 0 0 0 1 0 2 0 4 0 0 0 3 5 4 7 13 8 12 22 18 13 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

19 5 4 3 5 3 24 23 1 3 23 3 12 12 3 3 1 20 1.569 8 1.724 15 1.944 14 2.022 9 2.234 4 2.295 26 2.301 27 2.327 2 3.329 5 3.931 25 4.107 11 4.123 19 4.390 23 6.328 12 11.123 24 24.501 3 28.620 0 7 5 0 12 14 0 0 0 16 18 20 0 23 22 25 19 0 0 10 0 0 13 0 9 0 15 0 8 11 21 24 17 26 23 15 16 16 20 20 26 21 27 22 24 25 24 25 26 27 0 图 1

图 2

从表7、图1和图2中我们可以看到聚类的过程

(1) 5、6、7、10、16聚为一类,4、13、21聚为一类,11、18聚为一类;

(2) 5、6、7、8、9、10、16聚为一类,3、4、13、14、15、17、21聚为一类,11、

18、22聚为一类,23、27、28聚为一类,19、20聚为一类,24、26聚为一类,1、2聚为一类;

(3) 3、4、5、6、7、8、9、10、11、13、14、15、16、17、18、21、22聚为一类,23、25、27、28聚为一类,12、19、20聚为一类; (4) 12、19、20、23、25、27、28聚为一类。

(注:黑色倾斜字体为最终类别)

从表8中我们可以更为详细的看出各个样本的分类情况。 表 8

群集成员 案例 4 群集 1 1 2 1 3 2 4 2 5 2 6 2 7 2 8 2 9 2 10 2 11 2 12 3 13 2 14 2 15 2 16 2 17 2 18 2 19 3 20 3 21 2 22 2 23 3 24 4 25 3 26 27 28

4 3 3 五、聚类分析结论

根据图2和表8,我们可以把表6进行一定的处理:把同一类别的样本在主成分方向的得分(工作绩效成绩得分)用同一种颜色标记,如表中第一类别为红色,第二类别为粉色,第三类别为绿色,第四类别为蓝色。

并且在改进的表6’中可以看到第一类别的样本的工作绩效成绩得分最高,其次是第二类别、第三类别,得分最低的是第四类别,因此,根据我们可以把最终的分类结果和计划分类结合起来,即:

(1) “优秀”为第一类,包括职工 1、2;

(2) “良好”为第二类,包括职工3、4、5、6、7、8、9、10、11、13、14、15、

16、17、18、21、22;

(3) “及格”为第三类,包括职工12、19、20、23、25、27、28; (4) “不及格”为第四类,包括职工24、26。 各样本在第一职工代号 X1 X2 X3 X4 X5 X6 主成份的得分 1 2.24478 2.06671 1.82854 1.54332 1.56685 2.07013 2.337944 2 1.1618 0.91894 2.34746 2.28639 1.69646 2.05718 2.099889 8 0.82805 1.57273 0.9962 1.15898 0.29239 0.10131 1.047965 7 0.73269 1.06423 0.45672 0.53762 0.18438 0.28265 0.693014 6 0.88935 0.948 0.83692 0.78745 -0.23684 -0.05412 0.690811 3 0.73269 0.77365 0.99106 -0.40402 0.45439 0.41218 0.653969 9 0.82805 0.0908 1.38154 0.90275 0.41119 -0.66291 0.631764 5 0.15374 0.23609 0.9551 0.79385 -0.03163 -0.00231 0.436871 10 0.52836 0.61384 0.467 0.56965 -0.23684 0.0495 0.430435 16 0.66458 0.48308 0.29745 0.55684 -0.19364 -0.13184 0.365784 15 0.98471 0.86083 -0.49379 -0.55776 0.18438 -0.14479 0.217974 14 0.68501 0.35232 0.56975 -0.54494 0.45439 -0.87015 0.190535 18 0.072 -0.24336 -0.129 0.61449 0.14118 0.55466 0.169598 11 -0.2345 -0.03995 -0.44241 1.19101 -0.18284 0.65828 0.137142 17 0.58285 0.59931 -0.06221 -1.43534 0.68121 -0.09298 0.110463 13 0.15374 0.43949 -0.24203 -0.39121 0.11958 0.28265 0.086176 21 0.03114 0.26515 0.03028 -0.86523 0.40039 0.2956 0.050319 4 -0.20726 0.07628 0.11762 -0.19263 -0.08563 0.19198 -0.01782 22 25 28 19 12 23 27 20 24 26

-0.34348 -1.61037 -0.94968 -0.64998 -0.07784 -1.66486 -1.52182 -1.23575 -1.06547 -1.71253 -0.44676 -1.36207 -0.98432 -0.76639 -0.37411 -1.87057 -1.01338 -1.15867 -1.30395 -1.79793 -0.48351 -1.30044 -1.38778 -0.30369 -0.93051 -0.94592 -1.67036 -0.95106 -0.89454 -1.0384 0.07641 -0.3784 0.00595 -1.5058 -1.08943 0.35186 -0.90366 -2.05029 -0.22466 -0.8332 -0.04243 1.35084 -0.11803 0.00077 -1.3493 -0.25844 0.03317 0.35719 -2.25654 -3.3366 0.06245 1.2023 -0.00231 -0.70176 -0.42975 0.02359 0.30855 -0.22251 -2.76126 -2.4763 -0.27095 -0.5607 -0.77219 -0.78652 -0.8347 -0.99773 -1.04736 -1.09536 -1.70985 -2.25747 判别分析

六、步骤:

1、“分析——分类——判别分析”,把“分类”选入“分组变量”,定义范围:最小值(1),最大值(4),把X1、X2、X3、X4、X5和X6输入“自变量框”,选择“使用逐步式方法”;

2、“统计量”中选择“均值”、“单变量ANOVA”、“Fisher”、“未标准化”、“组内相关”; 3、“方法”默认设置; 4、“分类”中选择“根据组大小计算”、“摘要表”、“不考虑该个案时的分类”、“在组内”、“合并图、分组、区域图”;

5、“保存”中选择“预测组成员”、“判别得分”; 6、点击确定。

得到以下各表和图。

七、样本、变量分析

表 1 组统计量 Average Linkage (Between Groups) 1 dimension0 X1 X2 X3 X4 X5 有效的 N(列表状态) 未加权均值 标准差 的 已加权的 8.8850 1.12430 2 2.000 9.2250 .55861 2 2.000 8.8750 .71418 2 2.000 9.2100 .82024 2 2.000 9.9200 .08485 2 2.000 2 3 X6 X1 X2 X3 X4 X5 X6 X1 X2 X3 X4 X5 X6 X1 X2 X3 X4 X5 9.7350 .00707 6.9959 .64150 8.5071 .34812 5.4118 1.13943 6.4776 1.19935 8.5353 .26111 8.1841 .29944 4.7671 .85730 7.4571 .32294 2.7286 .85238 4.9786 1.32308 8.4114 .74212 8.1614 .47418 4.3450 .67175 7.1300 .24042 2.9300 .19799 5.3950 .67175 5.8200 .70711 6.1200 .15556 6.3843 1.46817 8.1975 .68829 4.8111 1.94633 6.2207 1.56110 8.4093 .92588 8.1418 .77203 2 17 17 17 17 17 17 7 7 7 7 7 7 2 2 2 2 2 2 28 28 28 28 28 28 2.000 17.000 17.000 17.000 17.000 17.000 17.000 7.000 7.000 7.000 7.000 7.000 7.000 2.000 2.000 2.000 2.000 2.000 2.000 28.000 28.000 28.000 28.000 28.000 28.000 4 X6 合计 X1 X2 X3 X4 X5 X6

1、从表1中可以看到各个类别中变量及总变量的均值、方差和标准差等。 表 2 X1 X2 X3 X4 组均值的均等性的检验 Wilks 的 Lambda F df1 df2 Sig. .218 28.633 3 24 .000 .229 26.870 3 24 .000 .251 23.862 3 24 .000 .526 7.195 3 24 .001 X5 X6

.212 29.770 .174 37.850 3 3 24 24 .000 .000 2、从表2中的WILKS λ检验中可以看到P(Xi)<0.05,原假设不成立,六个变量均明显显著,其中 i=1、2、3、4、5、6.

八、分析——步骤统计

表 3

输入的/删除的变量a,b,c,d 步骤 Wilks 的 Lambda 精确 F 输入的 统计量 df1 df2 df3 统计量 df1 df2 Sig. 1 X6 .174 1 3 24.000 37.850 3 24.000 .000 2 X1 .032 2 3 24.000 35.082 6 46.000 .000 在每个步骤中,输入了最小化整体 Wilk 的 Lambda 的变量。 a. 步骤的最大数目是 12。 b. 要输入的最小偏 F 是 3.84。 c. 要删除的最大偏 F 是 2.71。 d. F 级、容差或 VIN 不足以进行进一步计算。

从表3中可以看出软件最终选取X1、X6最为判别函数的自变量,P(X1)、P(X2)均为零,显著性很强。二者可以很好的表达不同组别的特性。

九、典型判别式函数摘要

表 4 特征值 正则相关特征值 方差的 % 累积 % 性 1 15.633a 94.7 94.7 .969 2 .869a 5.3 100.0 .682 a. 分析中使用了前 2 个典型判别式函数。

1、表4是特征值表,从表显示出典型分析最终形成两个判别函数,判别函数F1的特函数 征值为15.633,判别函数F2的特征值为0.869,可见判别函数F1的判别能力大于F2。方差百分比的算法为:

94.7%=15.633/(15.633+0.869) 5.3%=0.869/(15.633+0.869)

函数F1能够解释绝大部分方差。典型相关系数现实第一队典型变量的相关系数是0.969,第二对典型变量的相关系数是0.682。

表 5 函数检验 dimension0

2、表5是判别函数显著性检验。原假设都是所列判别函数不显著。可见在0.05的显著性水平下,用F1、F2两个判别函数判别,Sig.=0.000,判别效果显著;单用F2判别,Sig=0.001,判别效果显著。

表 6 标准化的典型判别式函数系数 函数 1 2 X1 1.035 .616 X6 1.088 -.516

3、表6是标准化典型判别函数的系数,写成函数:

F1=1.035*X1+1.088*X6 F2=0.616*X1-0.516*X2

表 7

典型判别式函数系数

函数

1 2

X1 1.422 .846 X6 3.182 -1.509 1 到 2 2 Wilks 的 Lambda Wilks 的 Lambda 卡方 df Sig. .032 82.485 6 .000 .535 15.013 2 .001 (常-34.983 量) 非标准化系数

6.878 4、表7为非标准化的典型判别函数系数,写成函数为: F1=-34.983+1.422*X1+3.182*X6 F=6.878+0.846*X1-1.509*X6 表 8 组质心处的函数 Average 函数 Linkage (Between Groups) 1 2 1 8.625 -.287 1.004 .454 dimensi2 on0 3 -2.237 -1.399 4 -9.333 1.324 在组均值处评估的非标准化典型判别式函数

5、表8为四个类别质心对应两个判别函数的值。

根据非标准化的判别函数和基础数据中各个样本的X1、X6的数值,分别计算各个样本在两个判别函数的值,最终得到表9左半部分。表9的右半部分是电脑给出的,二者差别微小,可能是软件计算和人工计算的差别。这两组数据也是各个样本在两个判别函数上的判别得分。

表 9 算出 9.77464 0.36962 7.48184 -0.96043 2.54484 0.42302 0.04154 -0.48793 0.3179 0.1868 1.72638 1.16084 2.22664 0.57392 电脑给出 9.77187 0.37877 7.47879 -0.95205 2.54227 0.43053 0.0388 -0.48116 0.31532 0.19376 1.72401 1.16831 2.22411 0.58139 1.98024 0.90362 1.9778 0.91109 0.10286 1.79393 0.10069 1.80115 1.22728 0.59174 1.22478 0.59898 1.13018 -1.06501 1.12727 -1.05811 -1.21564 0.39713 -1.21812 0.40378 1.01794 -0.14518 1.01526 -0.13813 -0.70488 1.85771 -0.70701 1.86475 1.70272 1.38491 1.70041 1.39241 1.0662 0.9722 1.0638 0.97948 0.99102 0.82541 0.98859 0.83264 1.51552 -0.56359 1.51272 -0.5565 -3.07834 0.00338 -3.08087 0.00953 -3.12392 -1.28251 -3.12678 -1.27662 0.7938 -0.31255 0.79109 -0.30558 -0.56106 -0.50623 -0.56379 -0.49961 -3.4152 -2.1022 -3.41826 -2.09653 -9.00514 1.88663 -9.00705 1.89178 -0.40582 -3.40771 -0.40928 -3.4016 -9.656 0.75095 -9.65818 0.75574 -2.41654 -2.25652 -2.41966 -2.25065 -1.98574 -1.18372 -1.9886 -1.17755 6、用计算机给出的判别得分作图。以判别函数F1作为横坐标,判别函数F2作为纵坐标,最终得到了区域图,从区域图中可以清楚的看到四个类别的分类区间。利用各个样本的判别得分可以检验样本是否在相应的区间。

对于新样本也可以利用非标准化典型判别函数计算出相应的判别得分,在图中找出对 应的点,看其在哪个区域内,相对应的就是哪个类别。 图2为各个点在其类别区域内的显示情况。

图 1——区域图

(假定前两个函数以外的所有函数为 0) 典则判别

函数 2

-16.0 -12.0 -8.0 -4.0 .0 4.0 8.0 12.0 16.0 +---------+---------+---------+---------+---------+---------+---------+---------+ 16.0 + 42 21 + I 42 21 I I 42 21 I I 42 21 I I 42 21 I I 42 21 I 12.0 + + + +42 + + 21 + + + I 42 21 I

I 42 21 I I 42 21 I I 42 21 I I 42 21 I 8.0 + + + +42 + + 21 + + + I 42 21 I I 42 21 I I 42 21 I I 42 21 I I 42 21 I 4.0 + + + 4332 + + 21 + + + I 43 32 21 I I 43 32 21 I I 43 32 21 I I * 43 32 21 I I 43 32 * 21 I .0 + + + 43 + 32 + + 21 + * + + I 43 32 21 I I 43 * 32 21 I I 43 32 21 I I 43 32 21 I I 43 32 21 I -4.0 + + + 43 + + 32 + 21 + + + I 43 32 21 I I 43 32 21 I I 43 32 21 I I 43 32 21 I I 43 32 21 I -8.0 + + 43+ + + 32+21 + + + I 43 3221 I I 43 321 I I 43 31 I I 43 31 I I 43 31 I -12.0 + + 43 + + + +31 + + + I 43 31 I I 43 31 I I 43 31 I I 43 31 I I 43 31 I -16.0 + 43 31 + +---------+---------+---------+---------+---------+---------+---------+---------+ -16.0 -12.0 -8.0 -4.0 .0 4.0 8.0 12.0 16.0 典则判别函数 1

区域图中使用的符号

符号 组 标签

---- -- -------------- 1 1 2 2 3 3 4 4

* 表示一个组质心

图 2——单独组图表 十、分类统计量

表 10

分类处理摘要

已处理的

已排除的 缺失或越界组代码

至少一个缺失判别变量

用于输出中 表 11 组的先验概率 Average Linkage 用于分析的案例 (Between Groups) 先验 未加权的 已加权的 1 .071 2 2.000 dimensio2 .607 17 17.000 n0 3 .250 7 7.000 28 0 0 28 4 合计

表 12 .071 1.000 2 28 2.000 28.000 分类函数系数 Average Linkage (Between Groups) 1 2 3 4 X1 55.954 45.742 39.564 31.778 X6 149.550 124.187 116.667 89.987 (常-979.149 -668.684 -571.776 -347.036 量) Fisher 的线性判别式函数

1、表13为Fisher的线性判别式函数系数,根据系数可建立Fisher判别函数,四个类别的函数如下:

CF1=-979.149+55.954*X1+149.550*X6 CF2=-668.684+45.742*X1+124.187*X6 CF3=-571.776+39.564*X1+116.667*X6 CF4=-347.036+31.778*X1+89.987*X6

2、通过分类函数,把各个样本中的X1、X6的值带到分类函数中,每个样本都得到四个判别函数值,形成表13。比较四个值,哪个值大,就把样本判别为哪一类。(红色为每行最大值)

表 13 职工 原本分类 判别分类 1 1 1 2 1 1 3 2 2 4 2 2 5 2 2 6 2 2 7 2 2 8 2 2 9 2 2 CF1 1019.103 928.6404 703.4608 600.8208 608.0439 662.4923 688.5058 675.4024 587.1679 CF2 983.6799 909.7083 723.1733 638.9376 644.5528 688.9867 710.7546 699.7723 626.502 CF3 947.5401 883.4667 710.3743 635.9426 639.4114 677.4739 698.7076 687.9131 619.0796 CF4 837.0484 785.6215 651.3179 592.1665 595.5108 626.2315 642.3192 634.1699 581.0776

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 表 14 2 2 3 2 2 2 2 2 2 3 3 2 2 3 4 3 4 3 3 2 2 2 2 2 2 2 2 2 3 3 2 2 3 4 3 4 3 3 644.8006 652.4207 539.6681 640.9449 551.4896 659.8573 635.0544 632.8265 665.636 461.2612 468.4743 632.3687 574.675 461.6378 189.3448 602.2046 169.0895 506.2891 517.3985 674.6784 681.8152 588.0188 671.8739 597.0263 686.6975 666.4406 664.6772 692.4642 523.5163 530.1273 664.8823 617.3705 524.9054 298.1563 641.5749 282.0226 561.8324 570.4508 665.8383 676.3601 587.4596 665.0782 592.1045 674.8461 657.4177 656.1701 684.8306 529.7257 538.8675 659.1233 616.3631 536.1089 320.0912 645.441 308.1721 570.0841 575.3177 616.5881 623.2907 555.0105 615.3079 560.0063 624.3814 610.3456 609.2318 630.3918 509.4197 515.3859 610.4877 576.8122 512.4632 346.9558 596.8937 336.5639 538.9338 544.0304 分类结果b,c Average Linkage (Between Groups) 计数 1 dimensio2 n2 3 预测组成员 1 2 0 0 0 100.0 .0 .0 .0 2 0 0 0 2 0 17 1 0 .0 100.0 14.3 .0 0 17 1 0 3 0 0 6 0 .0 .0 85.7 .0 0 0 6 0 4 初始 合计 0 2 0 17 0 7 2 100.0 100.0 100.0 100.0 2 17 7 2 4 % 1 dimensio2 n2 3 4 交叉验证计数 1 a dimensio2 n2 3 4 2 .0 .0 .0 100.0 0 0 0 2 1 100.0 .0 .0 .0 100.0 .0 100.0 .0 .0 100.0 dimensio2 n2 3 .0 14.3 85.7 .0 100.0 4 .0 .0 .0 100.0 100.0 a. 仅对分析中的案例进行交叉验证。 在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。 b. 已对初始分组案例中的 96.4% 个进行了正确分类。 c. 已对交叉验证分组案例中的 96.4% 个进行了正确分类。

3、表10为分类结果和对函数进行交叉检验的结果。交叉验证中,只有一组样本分类错误,原来定位第二组,通过判别函数判别到第三组。判别函数对初始分组案例中的96.4%进行了正确分类,对已交叉验证分组案例中的96.4个进行了正确分类,说明判别分析的符合非常高,判别函数的建立有很强的依据性。

% 十一、判别分析结论:

对聚类分析的结果进行了判别,采用两种判别函数。第一种为典型判别函数: F1=-34.983+1.422*X1+3.182*X6 F=6.878+0.846*X1-1.509*X6 第二中为Fisher线性判别函数:

CF1=-979.149+55.954*X1+149.550*X6 CF2=-668.684+45.742*X1+124.187*X6 CF3=-571.776+39.564*X1+116.667*X6 CF4=-347.036+31.778*X1+89.987*X6 基本正确。

判别函数对样本的96.4%进行了正确分类,说明判别分析符合率较高,判别函数建立

因篇幅问题不能全部显示,请点此查看更多更全内容