您的当前位置:首页正文

大学生择业观念抽样调查的方案设计

2024-02-29 来源:独旅网
2003 年 3 月 第 17 卷 第 1 期

中国煤炭经济学院学报

Journal of China Coal Economic College

Mar. , 2003

Vol. 17 No. 1

大学生择业观念抽样调查的方案设计

杨海山

(北方交通大学 经管学院 ,北京 100044)

[ 摘 要 ] 系统地介绍了大学生择业观念抽样调查的抽样组织形式 ,并给出了分层两阶段不等概率抽样组织形

式下的目标估计量的估计方法和估计公式 。

[ 关键词 ] 抽样调查 ;分层抽样 ;二阶段不等概率抽样 ;大学生择业 [ 中图分类号 ] G647. 38 ;C811

[ 文献标识码 ] C

[ 文章编号 ] 1006 6160 (2003) 01 0082 03

The Designed Project of Sample Survey about Undergraduates’

Conception for Career2Choosing

YAN G Hai2shan

( College of Economic M anagement , Northern Jiaotong U niversity , Beijing 100044 , China) Abstract :All circles of society have attached much importance to the problem of undergraduates’ career2choosing. In this paper , the author recommends a scheme in the sample survey about under2 graduates’conception for choosing a career , and puts forward the target estimation’s methods and equations in two2stage of the st ratified sampling with unequal probabilities.

Key words :sample survey ;stratified sampling ;two2stage sampling with unequal probability ; under2 graduates’career2choosing

近年来 ,我国高校毕业生人数逐年递增 ,又值 政府机构精简 ,国有企业减员增效 、下岗分流 ,供 求矛盾突出 ,就业形势十分严峻 。大学生择业问 题受到社会各界的高度关注 。为了了解目前大学 生的择业观念与择业方向 ,我们对山东省烟台市 范围内的中国煤炭经济学院 、烟台大学 、烟台师范 学院 、莱阳农学院四所普通高等学校所有在读大 学生进行了抽样调查 。为了提高抽样调查的准确 性 ,我们做了缜密的抽样方案设计 。

随机抽样 。具体步骤有三 :首先 ,取得各学校有关

学生的学号 、姓名 、专业等信息 ,形成完备的抽样 框 。其次 ,根据国家教育部专业分类目录的二级 学科和本专科两个分类标志 ,对四所高校的学生 进行复合分层 。进而实现层内的指标差异减少 、 使层间的差异增大 、提高抽样的精确度的目的 。 最后 ,在所划分的每一层中实行两阶段不等概率 随机抽样 。

层内的两阶段不等概率抽样 ,是个比较复杂 的抽取过程 ,其具体抽取方法为 :

第一阶段在层内抽取班级 ,所用的方法是按 与各层学生人数大致成比例的不等概率随机抽样 办法抽取 。

一 、抽样组织形式

为了使调查具有充分的代表性 ,保证一定的

精度及准确度 ,对总体采用分层二阶段不等概率

① [ 收稿日期 ] 2002 12 02

[ 作者简介 ] 杨海山 ,1963 年生 ,男 ,安徽六安人 ,北方交通大学硕士生 ,中国煤炭经济学院副教授 。

(1) 每层抽取的班级数为 mi = M i ·m , 其中 mi 为第 i 层应抽取的班级数 , m 为样本中应抽取

M

里仅给出比率指标的有关计算公式 。

所谓层目标估计量 ,即是分析某类学生有关 择业观念的指标估计量 。

V ( ^Pih) 计算公式

的全部班级数 , M i 为第 i 层所拥有的全部班级数 ,

M 为母体中所拥有的全部班级数 。

(2) 各层抽取采样班级按与该班级人数大致

1. 第 i 层 h 班有关比率的估计量 ^Pih 及方差 ^Pih = pih = 成正比例的不等概率随机抽取的办法进行抽取 。 其实施方法如下 :首先 , 根据第 i 层的班级数 M i 按 各班的学生人数赋予每个班级以与其学生人数成 正比例的代码个数 , 代码按该层的班级自然顺序 统一编号 。其次 , 若代码总数为 d , 则利用计算机

(离散) 均匀分布随机数 产生 1 到 d 的 , 与所产生

的随机数代码相应的班级就作为抽中的采样班

级 , 直到所需的采样班级数满足为止 。

在抽取过程中 , 若一个班级被抽到两次或两 次以上 , 则仍作为一个采样班级处理 , 继续抽取下 一个班级 , 直到抽满为止 。显然 , 实际采取的抽样 方法是无放回的抽样方法 。每次抽取时 , 每个当时

第 i 层 h 班抽中的学生中具有某种指标特征的人数

第 i 层 h 班被抽中的全部学生人数

L j = 1

λ∑

L ihj

= .

式中 λihj =

1 ,若 i 层 h 班的 j 学生具有某种指标特征 0 ,否则.

( 不放 由于在第二阶段实行简单随机抽样

回) , 为了计算的方便 , 按放回抽样方式计算估计 量方差 。所以估计量的方差 V ( ^Pih) 为

) ^Pi h ( 1 - ^P hi 还未被抽中的班级被抽中为采样班级的概率为该 班级人数对未被抽中的班级总人数之比 。即若令

Mi

V ( ^Pih) = 2. 第 i 层目标估计量及其方差 V ( ^P) 计算公 i

L .

Yih 为 i 层第 h 个班级的人数 , Yi =

∑Y

h = 1

ih

为第 i

根据本次抽样调查组织形式 ,第 i 层目标估

计量的计算公式可采用 Murthy (1957) 的公式

mi h = 1

层的全部学生人数 。设前 r - 1 次抽中的采样班级

为 h1 , h2 , , hr- 1 , 则第 r 次抽中 hr 班级的概率为 P(第 r 次抽中 hr 班级 | 前 r - 1 次抽到 h1 , h2 , ,

hr- 1) =

Y i , h r r- 1 ∑P ( S | h) ^PY

h i

ih

, ( hr ≠ h1 , h2 , hr- 1) .

Yi. ^Pi =

P( S )

,

Yh -

α= 1

∑Yα i , h

从而

mi

第二阶段是在每个被抽中的班级中抽取 L 个 学生进行实际调查 。抽样方法将采用按班级的学

生名单 , 以学号进行简单随机抽样 。其实施方法如 下 :首先 , 对抽中班级的学生按其学号排序 ; 其次 , 利用计算机产生均匀分布随机数 , 与所产生的随 机数代码相应的学生就作为抽中的采样学生 , 直 到所需的采样人数满足为止 。这样第 i 层抽取的学 生人数为 ni = mi ·L .

若四所高校全部大学生共分为 K 类 , 抽取的

K

^Pi =

h = 1 ∑P ( S | h) ^PY

P( S ) Yi.

ih ih

.

其中 P( S ) 是 i 层中无放回抽样抽到特定样 本 S 的无条件概率 , P( S | i) 是在抽样中已知第一 个抽到第 h 班级而获得特定班级样本 S 的条件概 率 。由于对固定的 h , ∑P ( S | h) = 1 , 因此

S

E ( ^Pi) = E1 E2 ( ^Pih) ≈ E1 h = 1 ∑P ( S | h) PP( S ) Yi. . mi ih Y ih 全部学生人数为 n , 则 n = ∑ni .

i = 1

二 、层目标量的估计及其方差估计

本次调查数据的统计计算主要是计算有关比 率指标和少量的平均指标的估计量和他们的精

度 。鉴于各种比率指标的估计公式和精度公式都 是相同的 ,而对于平均指标的估计公式和精度公 式也只需做少许变化就能采用同样公式 ,因此这

=

∑∑

S h = 1

mi

P ( S | h) Pih

Y ih Yh.

Mi

=

h = 1

Y ih

Pih Y= Pi .

i.

从而 ^Pi 是近似无偏的 。

在无放回抽样情况下 , ^Pi 的方差估计为

V ( ^Pi ) =

83

2

[ P( S) P( S | h , r) - P( S | h) P( S | r) ] Y ih Y i r ( ^Pih - ^Pi r) ∑∑ h = 1 r < h

mi

四 、抽样调查的相关问题

1. 样本容量确定问题 样本容量的确定对于抽

[ P( S) Y i. ]

2

式中 P( S | h , r) 为在前两个抽到第 h 班级和第 r (不考虑其次序) 情况下 班级 , 抽到特定样本 S 的 条件概率 。

以上目标估计量和方差的计算量非常大 ,若 用它们处理调查所得的所有数据有很大困难 。因 此我们将上述无放回抽样按与学生人数成正比的 不等概率放回抽样处理 。则

1 mi

^Pi =

m i h = 1

样调查来说是个十分

重要的问题 ,为了确定必要的抽样单元数目 ,先在

中国煤炭经济学院范围内进行一次小规模的抽样 调查 试 点 。通 过 试 点 调 查 数 据 估 算 设 计 效 应 (deff) 和抽样调查的样本容量 。

2. 抽样单元替换问题 对大学生择业观念调查来说 ,应届毕业生的 调查信息尤为重要 ,但是大四学生面临着毕业实 习 、找工作等问题 ,有可能调查时所抽中的学生不 在学校 ,无法对其进行调查 。为了保证抽样调查 质量 ,必须进行抽样单元替换 。抽样单元替换的 原则是 ,按学号排列顺序 ,先左后右振荡替换 。

3. 数据质量的控制与保证 (1) 严格按照调查方案 ,遵循随机性原则 ,保 证样本具有充分的代表性 ; (2) 严肃调查纪律 ,按调查要求 ,保证调查数 字真实可靠 ;

(3) 充分的检验 ,确保调查信息的效度与信度 的高度一致 ;

(4) 实行分组督导制度 ,统一部署 ,科学调度

∑^P

i h ,

V ( ^Pi) =

1

( )

mi ( m i - 1) h = 1 ^Pih - ^Pi .

mi

2

作为放回抽样的方差估计比无放回抽样的方 差估计要大 ,利用该方差公式进行统计推断可以 满足可靠性要求 。

三 、总体目标量的估计

按分层抽样公式 ,从各层目标量的估计量 ^Pi 及其方差估计量 V ( ^Pi) 可得总体目标量的估计量 ^Pi 及其方差估计量 V ( ^P) 。即

k

^P =

i = 1

∑W ^P,

i

i

V ( ^P) =

∑W V ( ^P ) .

2

i = 1

k

i i

Y i .

与协调 ,避免虚假现象 ;

(5) 汇总前 、中 、后完整性和正确性两方面审 核以及数字录入无误审计 ;

(6) 出现问题及时弥补解决 ;

(7) 逐级审核 ,层层把关 ,随机回访 10 % ,联合

其中层权 W i = Y . . 是各层大学生人数与总体全 部大学生人数之比 。

堵假 。

[ 责任编辑 :徐志京 ]

84

因篇幅问题不能全部显示,请点此查看更多更全内容