中国煤炭经济学院学报
Journal of China Coal Economic College
Mar. , 2003
Vol. 17 No. 1
大学生择业观念抽样调查的方案设计
①
杨海山
(北方交通大学 经管学院 ,北京 100044)
[ 摘 要 ] 系统地介绍了大学生择业观念抽样调查的抽样组织形式 ,并给出了分层两阶段不等概率抽样组织形
式下的目标估计量的估计方法和估计公式 。
[ 关键词 ] 抽样调查 ;分层抽样 ;二阶段不等概率抽样 ;大学生择业 [ 中图分类号 ] G647. 38 ;C811
[ 文献标识码 ] C
[ 文章编号 ] 1006 6160 (2003) 01 0082 03
The Designed Project of Sample Survey about Undergraduates’
Conception for Career2Choosing
YAN G Hai2shan
( College of Economic M anagement , Northern Jiaotong U niversity , Beijing 100044 , China) Abstract :All circles of society have attached much importance to the problem of undergraduates’ career2choosing. In this paper , the author recommends a scheme in the sample survey about under2 graduates’conception for choosing a career , and puts forward the target estimation’s methods and equations in two2stage of the st ratified sampling with unequal probabilities.
Key words :sample survey ;stratified sampling ;two2stage sampling with unequal probability ; under2 graduates’career2choosing
近年来 ,我国高校毕业生人数逐年递增 ,又值 政府机构精简 ,国有企业减员增效 、下岗分流 ,供 求矛盾突出 ,就业形势十分严峻 。大学生择业问 题受到社会各界的高度关注 。为了了解目前大学 生的择业观念与择业方向 ,我们对山东省烟台市 范围内的中国煤炭经济学院 、烟台大学 、烟台师范 学院 、莱阳农学院四所普通高等学校所有在读大 学生进行了抽样调查 。为了提高抽样调查的准确 性 ,我们做了缜密的抽样方案设计 。
随机抽样 。具体步骤有三 :首先 ,取得各学校有关
学生的学号 、姓名 、专业等信息 ,形成完备的抽样 框 。其次 ,根据国家教育部专业分类目录的二级 学科和本专科两个分类标志 ,对四所高校的学生 进行复合分层 。进而实现层内的指标差异减少 、 使层间的差异增大 、提高抽样的精确度的目的 。 最后 ,在所划分的每一层中实行两阶段不等概率 随机抽样 。
层内的两阶段不等概率抽样 ,是个比较复杂 的抽取过程 ,其具体抽取方法为 :
第一阶段在层内抽取班级 ,所用的方法是按 与各层学生人数大致成比例的不等概率随机抽样 办法抽取 。
一 、抽样组织形式
为了使调查具有充分的代表性 ,保证一定的
精度及准确度 ,对总体采用分层二阶段不等概率
① [ 收稿日期 ] 2002 12 02
[ 作者简介 ] 杨海山 ,1963 年生 ,男 ,安徽六安人 ,北方交通大学硕士生 ,中国煤炭经济学院副教授 。
(1) 每层抽取的班级数为 mi = M i ·m , 其中 mi 为第 i 层应抽取的班级数 , m 为样本中应抽取
M
里仅给出比率指标的有关计算公式 。
所谓层目标估计量 ,即是分析某类学生有关 择业观念的指标估计量 。
V ( ^Pih) 计算公式
的全部班级数 , M i 为第 i 层所拥有的全部班级数 ,
M 为母体中所拥有的全部班级数 。
(2) 各层抽取采样班级按与该班级人数大致
1. 第 i 层 h 班有关比率的估计量 ^Pih 及方差 ^Pih = pih = 成正比例的不等概率随机抽取的办法进行抽取 。 其实施方法如下 :首先 , 根据第 i 层的班级数 M i 按 各班的学生人数赋予每个班级以与其学生人数成 正比例的代码个数 , 代码按该层的班级自然顺序 统一编号 。其次 , 若代码总数为 d , 则利用计算机
(离散) 均匀分布随机数 产生 1 到 d 的 , 与所产生
的随机数代码相应的班级就作为抽中的采样班
级 , 直到所需的采样班级数满足为止 。
在抽取过程中 , 若一个班级被抽到两次或两 次以上 , 则仍作为一个采样班级处理 , 继续抽取下 一个班级 , 直到抽满为止 。显然 , 实际采取的抽样 方法是无放回的抽样方法 。每次抽取时 , 每个当时
第 i 层 h 班抽中的学生中具有某种指标特征的人数
第 i 层 h 班被抽中的全部学生人数
L j = 1
λ∑
L ihj
= .
式中 λihj =
1 ,若 i 层 h 班的 j 学生具有某种指标特征 0 ,否则.
( 不放 由于在第二阶段实行简单随机抽样
回) , 为了计算的方便 , 按放回抽样方式计算估计 量方差 。所以估计量的方差 V ( ^Pih) 为
) ^Pi h ( 1 - ^P hi 还未被抽中的班级被抽中为采样班级的概率为该 班级人数对未被抽中的班级总人数之比 。即若令
Mi
V ( ^Pih) = 2. 第 i 层目标估计量及其方差 V ( ^P) 计算公 i
L .
Yih 为 i 层第 h 个班级的人数 , Yi =
∑Y
h = 1
ih
为第 i
式
根据本次抽样调查组织形式 ,第 i 层目标估
计量的计算公式可采用 Murthy (1957) 的公式
mi h = 1
层的全部学生人数 。设前 r - 1 次抽中的采样班级
为 h1 , h2 , , hr- 1 , 则第 r 次抽中 hr 班级的概率为 P(第 r 次抽中 hr 班级 | 前 r - 1 次抽到 h1 , h2 , ,
hr- 1) =
Y i , h r r- 1 ∑P ( S | h) ^PY
h i
ih
, ( hr ≠ h1 , h2 , hr- 1) .
Yi. ^Pi =
P( S )
,
Yh -
α= 1
∑Yα i , h
从而
mi
第二阶段是在每个被抽中的班级中抽取 L 个 学生进行实际调查 。抽样方法将采用按班级的学
生名单 , 以学号进行简单随机抽样 。其实施方法如 下 :首先 , 对抽中班级的学生按其学号排序 ; 其次 , 利用计算机产生均匀分布随机数 , 与所产生的随 机数代码相应的学生就作为抽中的采样学生 , 直 到所需的采样人数满足为止 。这样第 i 层抽取的学 生人数为 ni = mi ·L .
若四所高校全部大学生共分为 K 类 , 抽取的
K
^Pi =
h = 1 ∑P ( S | h) ^PY
P( S ) Yi.
ih ih
.
其中 P( S ) 是 i 层中无放回抽样抽到特定样 本 S 的无条件概率 , P( S | i) 是在抽样中已知第一 个抽到第 h 班级而获得特定班级样本 S 的条件概 率 。由于对固定的 h , ∑P ( S | h) = 1 , 因此
S
E ( ^Pi) = E1 E2 ( ^Pih) ≈ E1 h = 1 ∑P ( S | h) PP( S ) Yi. . mi ih Y ih 全部学生人数为 n , 则 n = ∑ni .
i = 1
二 、层目标量的估计及其方差估计
本次调查数据的统计计算主要是计算有关比 率指标和少量的平均指标的估计量和他们的精
度 。鉴于各种比率指标的估计公式和精度公式都 是相同的 ,而对于平均指标的估计公式和精度公 式也只需做少许变化就能采用同样公式 ,因此这
=
∑∑
S h = 1
mi
P ( S | h) Pih
Y ih Yh.
Mi
=
h = 1
∑
Y ih
Pih Y= Pi .
i.
从而 ^Pi 是近似无偏的 。
在无放回抽样情况下 , ^Pi 的方差估计为
V ( ^Pi ) =
83
2
[ P( S) P( S | h , r) - P( S | h) P( S | r) ] Y ih Y i r ( ^Pih - ^Pi r) ∑∑ h = 1 r < h
mi
四 、抽样调查的相关问题
1. 样本容量确定问题 样本容量的确定对于抽
[ P( S) Y i. ]
2
式中 P( S | h , r) 为在前两个抽到第 h 班级和第 r (不考虑其次序) 情况下 班级 , 抽到特定样本 S 的 条件概率 。
以上目标估计量和方差的计算量非常大 ,若 用它们处理调查所得的所有数据有很大困难 。因 此我们将上述无放回抽样按与学生人数成正比的 不等概率放回抽样处理 。则
1 mi
^Pi =
m i h = 1
样调查来说是个十分
重要的问题 ,为了确定必要的抽样单元数目 ,先在
中国煤炭经济学院范围内进行一次小规模的抽样 调查 试 点 。通 过 试 点 调 查 数 据 估 算 设 计 效 应 (deff) 和抽样调查的样本容量 。
2. 抽样单元替换问题 对大学生择业观念调查来说 ,应届毕业生的 调查信息尤为重要 ,但是大四学生面临着毕业实 习 、找工作等问题 ,有可能调查时所抽中的学生不 在学校 ,无法对其进行调查 。为了保证抽样调查 质量 ,必须进行抽样单元替换 。抽样单元替换的 原则是 ,按学号排列顺序 ,先左后右振荡替换 。
3. 数据质量的控制与保证 (1) 严格按照调查方案 ,遵循随机性原则 ,保 证样本具有充分的代表性 ; (2) 严肃调查纪律 ,按调查要求 ,保证调查数 字真实可靠 ;
(3) 充分的检验 ,确保调查信息的效度与信度 的高度一致 ;
(4) 实行分组督导制度 ,统一部署 ,科学调度
∑^P
i h ,
V ( ^Pi) =
1
( )
mi ( m i - 1) h = 1 ^Pih - ^Pi .
∑
mi
2
作为放回抽样的方差估计比无放回抽样的方 差估计要大 ,利用该方差公式进行统计推断可以 满足可靠性要求 。
三 、总体目标量的估计
按分层抽样公式 ,从各层目标量的估计量 ^Pi 及其方差估计量 V ( ^Pi) 可得总体目标量的估计量 ^Pi 及其方差估计量 V ( ^P) 。即
k
^P =
i = 1
∑W ^P,
i
i
V ( ^P) =
∑W V ( ^P ) .
2
i = 1
k
i i
Y i .
与协调 ,避免虚假现象 ;
(5) 汇总前 、中 、后完整性和正确性两方面审 核以及数字录入无误审计 ;
(6) 出现问题及时弥补解决 ;
(7) 逐级审核 ,层层把关 ,随机回访 10 % ,联合
其中层权 W i = Y . . 是各层大学生人数与总体全 部大学生人数之比 。
堵假 。
[ 责任编辑 :徐志京 ]
84
因篇幅问题不能全部显示,请点此查看更多更全内容