医学统计学套题1
重庆医科大学200 —200 学年度 学期《医学统计学》考试试卷(一)
一.名词解释(15分,每题3分) 1. 样本与总体 2. 标准差与标准误 3. I 类错误与II 类错误 4. x ±1.96s 与x ±?)(05.0νt x s ?
5. 直线相关分析与直线回归分析
二.选择题(只选一个正确答案或最佳答案)(30分,每题2分)
1. 某检验师测定了240例正常人白、球蛋白比例,获得的资料为___。 A 、数值变量资料 B 、分类变量资料 C 、相对比资料
D 、血清学滴度资料
E 、二项分布资料 2.在正态分布曲线下,计算{}σμμ96.1+<≤x p 的概率为___________。 A. 0.500 B. 0.475 C. 0.450 D. 0.050 E. 0.010
3.某医师观察环丙沙星治疗下呼吸道感染者131例的临床疗效,结果见下表。
表1 环丙沙星治疗下呼吸道感染的临床疗效
病种 总例数 痊愈 显效 好转 无效 无效率% 肺炎 慢支炎感染
63 68
30 21
21 24
11 15
1 8
1.59 11.76
欲分析两病种疗效,应采用___________。
A. t 检验
B.秩和检验
C. 方差分析
D. χ2检验
E.q 检验 4. 对欲比较的样本测定资料进行参数统计假设检验的目的是____。
A .判断样本对总体是否具有代表性 B.推断各总体水平参数是否相等
C.判断表达样本平均水平的统计量有无显著性差别
D.对测定方法的精密度、准确度、灵敏度提出质控要求
E.对总体水平进行区间估计
5. 四格表中,如果有一个实际数为0 ,________________。
A . 根本不能检验
B . 就不能作2
χ检验 C . 仍然能够作2
χ检验 D . 就必须用校正2
χ检验 E . 还不能决定是否可以作2
χ检验 6. 统计假设检验中常使用P 值作为推断的依据,P 值的含义是____。 A .表达对比组数据来自同一总体的概率 B .表达对比组抽样误差的大小 C .表达对比组统计量不相同的概率 D .拒绝参数相等假设实际犯Ⅰ类错误的概率 E. 接受参数相等假设实际犯Ⅱ类错误的概率
7.完全随机设计方差分析中,引起数据变异的原因可能区分为___________
A.个体因素与随机(误差)因素
B.处理因素与区组因素
C.样本含量与把握度
D.处理因素与随机(误差)因素
E.个体因素与处理因素
8.方差分析的应用条件之一是方差齐性,所谓方差齐性是指__________ A.各比较组的样本方差相等 B.各比较组相应的总体方差相等
C.组内方差=组间方差
D.总方差=各组方差之和
E.各组自由度相等 9.对x,y 两个变量作直线相关分析__________
A.要求x,y 呈双变量正态分布
B. 只要求x 服从正态分布
C.只要求y 服从正态分布
D.只要求x,y 是定量资料
E.对x,y 无要求
10.现比较两组患者血中SOD 活性的含量,(见下表),探讨两组间差别的显著性,应采用
_______。
表2 两组患者血中SOD 活性)(s x ±含量
组别
例数 SOD 活性(μ/mgHb)
重度氟骨症 轻度氟骨症
21 12
1.78
2.38
0.33 0.25
A. )1
1(2
122
1n n s x x t c +-=
B. ∑-=T T A x 2
2
)(
C. P=
!
)!()!()!()!(n d c b a d b c a d c b a ++++ D. P(x)=x n x
x n C --?)1(ππ
E. 12
/)1(5.0|4)
1(|2111+-+-
=
N n n N n T U 11.欲比较丙氨酸氨基转移酶两种水平对HBeAg 阴转的影响(资料见下表),应进行_____。
表3 丙氨酶氨基转移酶水平,对疗效的影响
组别
. HBeAg + -
≤3ULN
>3ULN
16 4 4 8 A.∑-=T
T A x 22
)( B. P(x)=μμ-e x x ! C. c b c b x +--=22)1|(| D. P=
)!
()!()!()!(n d c b a d b c a d c b a ++++ E. u=2
121P p S p p --
12.某地儿童保健所拟比较含氟牙膏与一般牙膏使用者患龋率(见表4),宜进行_____。
表4 使用含氟牙膏与一般牙膏者的患龋率
牙膏类型 调查人数 患龋齿人数
患龋率(%)
含氟牙膏 200 70 35 一般牙膏 100 50 50 合计
300
120
40
A.2
12
1p p S p p u --=
B. r=
∑∑∑-?---2
2
)
()())((y y x x x x x x C. a=x b y -
D. b=∑
∑---2
)())((x x y y x x E. u=2
121x x x x +-
13. 完全随机设计三组人群某抗体滴度资料的统计比较,应选用____。
A.()()x n x
x n x n P ---=ππ1!
!! B.2121lg lg lg lg x x x x S X X t --=
C.组内
组内组间组间νν//lg SS SS F x =
D. 组内
组内组间组间νν//SS SS F =
E.()()∑+-+=13112
2N n T N N H i
i 14. 某医师研究婴儿出生体重和双顶径的关系,收集了婴儿出生体重和双顶径的数据如下表: 表5 婴儿出生体重和双顶径的关系
体重(g )
273 299 226 315 294 260 383 273 234 329 302 357 双顶径(mm 99 93 87 94 93 81 94 94 91
若要分析二者的数量关系,宜选用的方法是 。 A. n
S d t d /=
B.
s
t r
r r 0
-=
C . 2
94 88 91 )
12
1x x S X X t --=
D. ∑∑∑----=
2
2
)
()())((Y Y X X Y Y X X r E. ∑∑---=
2
)
())((X X Y Y X X b 15. 用图示法表达一组SARS 病人年龄分布,宜绘制 。 A 、 直条图 B 、直方图 C 、普通线图 D 、饼图 E 、散点图
三. 填空题(共15分,每空1分)
1. 反映原始测定数据对其均值离散程度的统计量用______________________, 表达样本统计量对其参数随机偏离程度的统计量是____________________。
2. 已知某医学统计资料服从正态分布,且其n =400,x =30,s =5。据此可估计其中95%的数
据波动范围是___________________,其总体均数95%的可信区间为____________________________。
3. 总体设计为单因素完全随机多组测定数值变量资料的统计比较,应采用___________________
检验,当具有统计学意义时,再根据需要进行两两比较。这种情况,不能直接进行两两t 检验,其原因是__________________________ ______________________________________。 4. 在直线回归分析中,yx S 的含义是________________________________,b S 的含义是
___________________________________________________。
5. 对一组同质的计量資料,通常可以从__________________和__________________两个方面来
全面描述其数字特征。
6. 对于一份统计资料,通常从统计描述与统计推断两个方面进行分析,其中统计推断包括
________________、________________两方面的内容。
7. 对计数资料进行统计描述通常采用相对数指标,常用的相对数指标有_____________、
________________、________________。
四. 应用题(40分)
1.某医师为研究肿瘤死亡与年龄的关系,收集了以下数据:
表6 某地、某年肿瘤死亡资料
年龄(岁) 人口数死亡总数肿瘤死亡数肿瘤死亡/总死亡(%)
0 - 82920 138 4 2.9
20 - 46639 63 12 19.0
40 - 28161 172 42 24.4
60 - 9370 342 32 9.4
根据表中资料,各年龄组相比较,试判断以下说法的对错,并说明理由
(1)“40 –”组的人最容易死于肿瘤,“60 –”组次之;
(2)因肿瘤而死亡者中“40 –”组的最多。
(共4分)
2. 一项治疗糖尿病的临床试验中,将268名患者随机分为两组,一组204人服用盐酸苯乙双胍,死于心血管的有26人。另一组64人服安慰剂,死于心血管的有2人。资料整理如下,
表7 两种疗法的心血管病病死率比较
疗法观察例数死亡生存病死率(%)
盐酸苯乙双胍204 26 178 12.75
安慰剂64 2 62 3.13
合计268 28 240 10.45
请问:(1)该资料是何种类型的资料?
(2)可以用哪种方法来检验两种疗法心血管病病死率的差异,请写出检验方法名称及相应计算公式,并说明选择的理由,写出可能的结果(不需计算)。(共4分)
3.为了解某一新降血压药物的效果,将20名高血压病患者随机分为实验组和对照组,实验组采
用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表。
表8 两组药物治疗前后的舒张压(mmHg)
药治疗前102 100 92 98 118 100 102 116 109 116
治疗后90 90 85 90 114 95 86 84 98 103
标准药病人号 1 2 3 4 5 6 7 8 9 10 治疗前
治疗后100 94 100 105 110 96 94 100 104 109
请问:(1)这是何种类型资料?
(2)这是何种实验设计方案?
(3)欲推断新药是否有效,最好采用什么假设检验方法?
(4)要比较新药与标准药的疗效是否相同,最好采用什么假设检验方法?(共6分)
4. 下表为抽样调查资料,根据你所学过的知识回答:
表9 某地7岁健康儿童身高(cm)结果
身高组段
人数
男女
108~ 1 1
110~ 3 2
112~ 9 5
114~ 9 12
116~ 15 13
118~ 18 28
120~21 29
122~14 24
124~10 15
126~ 4 9
128~ 3 7
130~ 2 5
132~134 1 2
合计110152
(1)可以选用哪些指标对该资料进行描述分析?
(2)如何进行统计推断?
(要求说出你选用的统计指标及检验方法名称和作出该选择的理由,不必计算)
(共8分)
5、为什么说期望寿命e x可以反映一个地区或国家的人群健康水平?(共3分)
6、据文献记载,1747年5月20日,英国的Lind J 医生将12名病情相似(牙龈溃烂、皮肤有出
血点、双膝无力)的病人带到一艘船上,将他们分为6组,分别给予干预
A:饮苹果汁;B:服硫酸丹剂;
C:服醋;D:饮海水,服缓和的泻药(病情最重者);
E:食橘子、柠檬;F:服大蒜、芥子等成分组成的干药。
请回答:
(1)用现代统计学的观点,哪些方面符合统计学要求?
(2)如果今天重复Lind J 医生的干预试验,在统计设计与分析中还应注意哪些问题?
(共5分)
7、Graff-Lonnevig等欲比较F(formoterol)与S(salbutamol)治疗儿童哮喘病的效果,将14
个病人随机分为2组,一组病人在第一时期服用F,第二时期服用S,另一组病人在第一时期服用S,第二时期服用F,服药后8小时测量PEF值,数据如下:
表10 两种药物治疗哮喘病儿童PEF值(升/分钟)
受试验者编号
时期Ⅰ时期Ⅱ
药物PEF值药物PEF值
1 F 310 S 270
3 F 310 S 260
6 F 370 S 300
8 F 410 S 390
9 F 250 S 210
11 F 380 S 350
14 F 330 S 365
2 S 370 F 385
4 S 310 F 400
5 S 380 F 410
7 S 290 F 320
10 S 260 F 340
12 S 90 F 220
13 S 300 F 330
请问:
(1)这是何种类型的资料?
(2)该项研究采用了何种设计方案?
(共5分)
8、某研究者欲探讨不同剂量的补肾益寿胶囊及CY两种药物对小鼠迟发超敏反应的影响,以耳肿重量为实验效应指标,补肾益寿胶囊共4个剂量组(0,5,10,20),CY两个剂量组(0,0.025),该研究者采用了student-t检验,结果见下表。
表11 不同药物对小鼠迟发超敏反应的影响
药物
剂量
(g/Kg)
鼠数
耳肿重量
s
x±(mg)
P
与0g/Kg补肾
益寿胶囊组
比较
与0.025g/Kg
CY组比较
补肾益寿胶囊0 10 21.2±2.7
补肾益寿胶囊 5 1022.3±3.5>0.05
补肾益寿胶囊10 1018.8±3.1>0.05
补肾益寿胶囊20 1016.5±2.4<0.01
CY+补肾益寿胶囊0.025+0 1011.2±1.5
CY+补肾益寿胶囊0.025+5 1014.3±2.9<0.01
CY+补肾益寿胶囊0.025+10 1018.6±3.6<0.01
CY+补肾益寿胶囊0.025+20 1019.2±3.4<0.01
请问:该实验采用了何种设计方案? 研究者采用的假设检验方法是否正确?为什么?
(共5分)
重庆医科大学200 —200 学年度学期《医学统计学》考试试卷(一)
参考答案
一、名词解释(每小题4分,共20分)
1.Population and sample
总体(p o p u l a t i o n)与样本(s a m p l e)
总体:根据研究目的所确定的同性质的全部观察单位某一指标(或某些因素及结果)测量值的集
合。根据总体集合所包括元素是否有限,可分为有限总体与无限总体;总体具有特定的分布特征及参数;
样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。
根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数 2.Standard deviation and standard error 标准差与标准误
3.Type Ⅰerror and type Ⅱerror
假设检验中,无论是接受还是拒绝原假设均有可能犯错。如拒绝了一个实际成立的原假设,所犯错误称为Ⅰ类错误,其概率记为α;如接受了一个实际不成立的原假设,所犯错误称为Ⅱ类错误,其概率记为β;当样本含量确定时,α越大,则β越小,反之,α越小,则β越大,如拟同时降低α与β,则需增大样本含量。
4.Normal distribution and binomial distribution
正态分布(Normal distribution )是一种连续型随机变量常见而重要的分布,如果连续型随机变量X 在实数范围内取值,且具有如下的概率密度函数
2
2
2)(21
)(σμπ
σ--
=
X e
X f (-∞ 和概率分布函数 dt e X F X t ? ∞ --- = 2 22)(21 )(σμπ σ (-∞ , 称连续型随机变量X 服从正态分布,记为X~N (μ,σ2 )。 二项分布(binomial distribution ):一种离散型随机变量的分布,表示在n 次Bernoulli 试验中,结果A 出现K 次这一随机事件的分布,记为X~B (n,π)。其概率计算式为: P (X=k )= k n k k n k n ---)1()! (!! ππ 。 S 5.X±1.96S与X±1.96 x X±1.96S:从正态总体中抽样,样本含量较大时,观测值95%的波动范围; S:从正态总体中抽样,样本含量较大时,总体均数95%的可信区间(置信区间) X±1.96 x 二、是非题(每小题0.5分,共6分),判断下列各题的正误,正确的在题后括号内打“√”,错误的打“×” 1 × 2 √ 3 × 4 √ 5 √ 6 √ 7 × 8 × 9 √10 ×11 √12 × 三、填空题(每空0.5分,共17 分) 1 设计收集资料整理资料分析资料 2 集中趋势离散趋势 3 正态分布法百分位数法正态分布偏态分布 4 近似t 检验数据变换使达到正态性及方差齐性要求非参数假设检验 5 点估计区间估计区间估计 6 P大于0.05 接受无统计学意义 7 r (相关系数) 8 随机原则对照原则重复原则 9 所设立的对照组必须与实验组达到均衡一致,均衡是指各对比组之间除处理因素不同外,其他重要的,可控制的非处理因素的分布尽量保持一致 10 全面普查抽样调查典型调查 11 单纯随机抽样系统随机抽样整群抽样分层抽样 12 单纯随机抽样 13 静态动态 四、单项选择题(从每小题的五个备选答案中,选出一个正确的答案,并将其字母填在题干横线上,每小题1分,共28分) 1 C 2 B 3 E 4 E 5 E 6 C 7 C 8 E 9 E 10 E 11 B 12 A 13 C 14 A 15 D 16 C 17 D 18 B 19 D 20 C 21 B 22 E 23 B 24 D 25 E 26 D 27 D 28 E 五、应用题(1-5小题每小题5分,第6小题4分,共29分) 1 (1)该资料是计量资料采用的是完全随机设计 (2)如果该资料服从正态分布且两总体方差相等,则直接采用t 检验 如果该资料服从正态分布但两总体方差不等,则采用近似t检验或变量变换使其满足方差分析条件情况下,对转换值进行t检验,或进行秩和检验。 2(1)不正确 (2)第一,方差不齐,不能直接采用参数假设检验方法;第二,多组均数的比较,不能采用student-t 检验,否则会增大I类错误的概率。本资料可采用完全随机设计多组比较的秩和检验。 3统计分析包括统计描述与统计推断。 由该频数表可知,两组数据是呈对称分布的计量资料,需从集中趋势和离散趋势进行描述,可选用算术均数及标准差。 统计推断分为参数估计和假设检验,首先可用点估计,估计男童和女童身高的总体均数, 但此时未考虑抽样误差,因此,选用区间估计较好,可计算总体均数95%的置信区间。 比较男童及女童身高的总体均数是否不同,可用两样本资料的U 检验(因两样本呈对称分布,近似正态分布,且均为大样本)。 4 不能得出以上结论 首先实验设计有错误,酒石酸锑钾一组的实验对象与枸橼酸乙胺嗪一组的实验对象 不同,前者选用的实验对象是不合并其它寄生虫的丝虫病患者,而后者却是选用的是 合并血虫病的丝虫病患者,两组间不具有可比性。 其次,根据所得到的治愈率不能下结论说哪一种治疗药物的效果好,应该做出相应 的假设检验,根据假设检验才能做出结论。 5 (1)调查研究 (2) 患病率 (3) 采用趋势性卡方检验,检验男童与女童以及合计组贫血状况是否随着时间的推移得 到了改善.; 采用两独立样本资料的卡方检验可计算各年度男童的贫血状况与女童的贫血状况是否不同。 6 平均期望寿命是通过各年龄组段的死亡率经过一系列计算得到的,它将不稳定的死亡率转化 成了相对稳定的死亡概率,同时平均期望寿命消除了内部构成不同的影响,能够较准确地反映一个地区或国家的人群健康水平。 重庆医科大学200 —200 学年度 学期《医学统计学》考试试卷(三) 考试方式(闭卷): 考试时间:150 分钟 一、名词解释(每小题4分,共20分) 6. 样本与总体 7. 标准差与标准误 8. I 类错误与II 类错误 9. 精密度与准确度 10. 直线相关分析与直线回归分析 二、单项选择题 (从每小题的五个备选答案中,选出一个正确的答案,并将其字母填在题干横线上,每小题2分,共30分) 1. 在正态分布曲线下,计算{}σμμ96.1+<≤x p 的概率为___________ A. 0.500 B. 0.475 C. 0.450 D. 0.050 E. 0.010 2.某医师观察环丙沙星治疗下呼吸道感染者131例的临床疗效,结果见下表: 表1 环丙沙星治疗下呼吸道感染的临床疗效 病种 总例数 痊愈 显效 好转 无效 无效率% 肺炎 慢支炎感染 63 68 30 21 21 24 11 15 1 8 1.59 11.76 A. t 检验 B.秩和检验 C. 方差分析 D. χ2检验 E.q 检验 3.参数统计假设检验的目的是____。 A .判断样本对总体是否具有代表性 B.推断各总体水平参数是否相等 C.判断表达样本平均水平的统计量有无显著性差别 D.对测定方法的精密度、准确度、灵敏度提出质控要求 E.对总体水平进行区间估计 4. 四格表中,如果有一个实际数为0 ,________________。 A .根本不能检验B.就不能作2 χ检验C.仍然能够作2χ检验 D.就必须用校正2 χ检验 E .还不能决定是否可以作2χ检验 5. 统计假设检验中常使用P值作为推断的依据,P值的含义是____。 A.表达对比组数据来自同一总体的概率 B.表达对比组抽样误差的大小 C.表达对比组统计量不相同的概率 D.拒绝参数相等假设实际犯Ⅰ类错误的概率 E. 接受参数相等假设实际犯Ⅱ类错误的概率 6.完全随机设计方差分析中,引起数据变异的原因可能区分为___________ A.个体因素与随机(误差)因素 B.处理因素与区组因素 C.样本含量与把握度 D.处理因素与随机(误差)因素 E.个体因素与处理因素 7.方差分析的应用条件之一是方差齐性,所谓方差齐性是指__________ A.各比较组的样本方差相等 B.各比较组相应的总体方差相等 C.组内方差=组间方差 D.总方差=各组方差之和 E.各组自由度相等 8.某医师测定了230名正常人和165名慢性肝炎病人的白蛋白相对比资料,欲比较正常人和病人该指标的水平是否一致,此时应采用以下____统计检验公式进行分析。 A. () ()()()()d b c a d c b a N bc ad + + + + - = 2 2 χ B. + - = 2 1 2 2 1 1 1 n n S x x t c C.∑- = T T A x 2 2 ) ( D. ()()()() ! ! ! ! ! ! ! ! ! N d c b a d b c a d c b a P + + + + = E.λ λ - =e x P x ! 9.根据下列四格表资料,指出该研究方法的诊断正确率是____。 表2 某方法学实验结果 阳性数阴性数合计 病人67 8 75 正常人7 68 75 合计74 76 150 A.89.3% B.90.7% C.10.0% D.49.3% E.90.0% 10.欲比较丙氨酸氨基转移酶两种水平对HBeAg 阴转的影响(资料见下表),应进行_____。 表3 丙氨酶氨基转移酶水平,对疗效的影响 组别 . HBeAg + - ≤3ULN >3ULN 16 4 4 8 A. ∑--=T T A 22 )5.0|(|χ B. P(x)=μμ-e x x ! C. c b c b x +--=22 )1|(| D. P= )! ()!()!()!(n d c b a d b c a d c b a ++++ E. u=2 121P p S p p -- 11. 完全随机设计三组人群某抗体滴度资料的统计比较,应选用____。 A.()()x n x x n x n P ---= ππ1 B.2121lg lg lg lg x x x x S X X t --= C.组内 组内组间组间νν//lg SS SS F x = D. 组内组内组间组间νν//SS SS F = E.()()∑+-+=13112 2N n T N N H i i 12. 某医师研究婴儿出生体重和双顶径的关系,收集了婴儿出生体重和双顶径的数据如下表: 表4 婴儿出生体重和双顶径的关系 体重(g ) 双顶径(mm ) 94 88 91 99 93 87 94 93 81 94 94 91 若要分析二者的数量依存关系,宜选用的方法是 。 A. n S d t d /= B. s t r r r 0 -= C . 2 12 1x x S X X t --= D. ∑∑∑----= 2 2 ) ()())((Y Y X X Y Y X X r E. ∑ ∑---=2 )())((X X Y Y X X b 13. 用图示法表达一组SARS 病人年龄分布,宜绘制 。 B 、 直条图 B 、直方图 C 、普通线图 D 、饼图 E 、散点图 14、在定性的检测方法学研究中,方法的准确度用____计算。 A.%100?-= 加标值 原样品值 加标后测定值回收率 B. -=∑12 2 C R n n A N χ C.()()()n x x n y x xy b //2 2 ∑∑∑∑∑--= D. ()()()[]() [] n y y n x x n y x xy r ///2 2 2 2 ∑∑∑∑∑∑∑---= E. x b y a -= 15. 对同一标准品,用某方法进行了8次平行测定,欲分析该方法的批内精密度应计算____。 A.8 22?= ∑i w d S B.() 182-?= B B SS S C.8 ∑= i x X D.CCV x x x VI i /-= E. s x =n S 三、填空题 (每空1分,共20 分) 1. 对于一份统计资料,通常从统计描述与统计推断两个方面进行分析,其中统计推断包括 和 两方面的内容。 2. 已知某医学统计资料服从正态分布,且其n =400,x =30,s =5。据此可估计其中95%的数 据波动范围是___________________,其总体均数95%的可信区间为 ____________________________。 3.单因素完全随机多组测定数值变量资料的统计比较,应采用___________________检验,当具 有统计学意义时,再根据需要进行两两比较。这种情况,不能直接进行两两t 检验, 其原因是__________________________ ______________________________________。 4. 随机误差的含义是____________________________________________,系统误差的含义是 _______________________________________________。前者常用_______________统计指标来表达,后者常用_______________统计指标来表达。 5.对计数资料进行统计描述通常采用相对数指标,常用的相对数指标有:率与________________、________________三类。 6.实验室质量控制的步骤为__________________、__________________、__________________、__________________、__________________、__________________、__________________与__________________。 四. 应用题(第1小题4分,第2小题7分,第3小题5分,第4小题8分,第5小题6分,共 30分) 1. 某医师为研究肿瘤死亡与年龄的关系,收集了以下数据: 表5 某地、某年肿瘤死亡资料 年龄(岁) 人口数 死亡总数 肿瘤死亡数 肿瘤死亡/总死亡(%) 0 - 82920 138 4 2.9 20 - 46639 63 12 19.0 40 - 28161 172 42 24.4 60 - 9370 342 32 9.4 合计167090 715 90 12.6 根据表中资料,各年龄组相比较,试判断以下说法的对错,并说明理由 (1)“40 –”组的人最容易死于肿瘤,“60 –”组次之; (2)因肿瘤而死亡者中“40 –”组的最多。 2. 为了解某一新降血压药物的效果,将20名高血压病患者随机分为实验组和对照组,实验组采用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表。 表6 两组药物治疗前后的舒张压(mmHg) 新药病人号 1 2 3 4 5 6 7 8 9 10 治疗前102 100 92 98 118 100 102 116 109 116 治疗后90 90 85 90 114 95 86 84 98 103 标准药病人号 1 2 3 4 5 6 7 8 9 10 治疗前98 103 110 110 110 94 104 92 108 110 治疗后100 94 100 105 110 96 94 100 104 109 请问:(1)这是何种类型资料? (2)这是何种实验设计方案? (3)要比较新药与标准药的疗效是否相同,最好采用什么假设检验方法? 仅要求写出主要统计检验公式,不计算结果。 3.某医师比较两种药物治疗脑血管病的疗效,将78例病人分为两组,得下表资料: 表7 两种药物治疗脑血管病疗效 有效无效合计有效率(%) A药46 6 52 88.46 B药19 7 26 73.08 合计65 13 78 83.33 请回答: (1)这是什么类型的资料? (2)这是何种实验设计方案? (3)欲推断两种药物总体有效率是否一致,应采用何种统计方法? (写出主要统计检验公式、结果判断,不计算结果) 4. 下表为抽样调查资料,根据你所学过的知识回答: 表8 某地7岁健康儿童身高(cm)结果 身高组段 人 数 男 女 108~ 1 1 110~ 3 2 112~ 9 5 114~ 9 12 116~ 15 13 118~ 18 28 120~ 21 29 122~ 14 24 124~ 10 15 126~ 4 9 128~ 3 7 130~ 2 5 132~134 1 2 合 计 110 152 (3) 可以选用哪些指标对该资料进行描述分析? (4) 可以选用哪些检验方法来检验男女身高的差异? (要求说出你选用的统计指标及检验方法名称和作出该选择的理由,不必计算) 5、某检验师设计了一种简便微量碘测定方法,并对其准确度进行了研究,得出下列实验数据,欲了解该方法的恒定系统误差和比例系统误差,应如何进行分析? 表9 简捷法检测水样中微量碘及加标试验(μg/L ) 重庆医科大学200 —200 学年度 学期《医学统计学》(三) 考试试卷参考答案 一、名词解释(每小题4分,共20分) 1、总体与样本 总体(p o p u l a t i o n )与样本(s a m p l e ) 总体:根据研究目的所确定的同性质的全部观察单位某一指标(或某些因素及结果)测量值的集合。根据总体集合所包括元素是否有限,可分为有限总体与无限总体;总体具有特定的分布特征及参数; 水样编号 样品含碘量 加标量 测得总量 “回收率”(%) 1 8.4 2.0 10.5 105.0 2 4.2 3.0 7.3 103.0 3 5.8 4.0 9.6 95.0 4 8.8 5.0 13.7 98.0 5 9.8 6.0 15.8 100.0 6 7.2 7.0 14.4 102.9 样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。 根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数 。 3、I 类错误与II 类错误 假设检验中,无论是接受还是拒绝原假设均有可能犯错。如拒绝了一个实际成立的原假设,所犯错误称为Ⅰ类错误,其概率记为α;如接受了一个实际不成立的原假设,所犯错误称为Ⅱ类错误,其概率记为β;当样本含量确定时,α越大,则β越小,反之,α越小,则β越大,如拟同时降低α与β,则需增大样本含量。 4、精密度与准确度 精密度(precision ):指对同一标本进行多次重复测定时,测定值与平均测定值的接近程度,属于随机误差,常用标准差或变异系数表示。此值愈小,说明测定方法重现性愈好。 准确度(accuracy):测定值与真值的接近程度,用于说明测定方法有无系统误差。一 般采用回收试验,计算回收率度量其大小。回收率愈接近100%,则准确度愈高;当回收率偏离100%较大时,则测定方法存在系统误差。 %100?-= 加入量 原有量 实测值回收率 准确度与精密度均为评价检测方法(包括仪器、试剂、操作等)可信赖程度的指标,其中以准确度为首要指标,当测定方法存在系统误差时,即使其精密度高,也不能采用此方法;当测定方法的精密度差,其准确度也不会高。 5、直线相关与直线回归 1)区别 资料要求: 回归要求因变量Y 在给定x=x0的条件下,服从正态分布; X 是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。相关要求两个变量X 、Y 服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。可以计算两个回归方程; 应用: 相关分析主要是描述两个变量之间线性关系的密切程度和方向;回归分析说明两变量间依存变化的数量关系,不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 统计量: 回归分析中主要统计量为截距a 和回归系数b ,相关分析统计量为相关系数r 。回归系数有单位,相关系数无单位。 2)联系 r 与b 符号一致 对一组数据若同时计算r 与b ,它们的正负号是一致的。 假设检验等价 对同一样本,r 和b 的假设检验得到的t 值相等。? 3).用回归解释相关 r 的平方称为决定系数,总 回归SS SS r = 2 二、单项选择题 (从每小题的五个备选答案中,选出一个正确的答案,并将其字母填在题干横线 三、填空题 (每空1分,共20 分) 1、参数估计、假设检验 2、30±1.96×5、30±1.96/20 3、 完全随机设计资料的方差分析、会增大犯I 类错误的概率 4、由于实验因素微小波动造成测定结果有大有小的变动、 由于某种偏因导致测量结果倾向性增大或减小 、精密度、准确度 5、相对比 、 构成比 6、找出质量问题、 分析主要原因、 寻找主要原因、 研究改进措施、 执行措施计划、 检查效果、 巩固措施、 提出尚未解决的新问题 四. 应用题(第1小题4分,第2小题7分,第3小题5分,第4小题8分,第5小题6分,共30分) 1.(1)错,仅仅根据某一年龄段肿瘤死亡人数作出这样的推断是不合理的,应该计算死亡率,才能作出判断,得出正确结论。 (2)对,用该年龄段肿瘤死亡人数/总死亡人数,正是代表了该年龄组因肿瘤而死亡的一个百分率,该组百分率最高,可以说因肿瘤而死亡者中“40—”组的最多。 2.(1)计量类型资料 (2)组内为配对设计,组间为完全随机设计 (3)采用完全随机设计的t 检验, 2 12 1d d S d d t --= 1d :新药组治疗前后舒张压差值;2d :旧药组治疗前后舒张压差值; 3.(1)计数资料 (2)完全随机设计 (3)采用四格表的ⅹ2检验,因有一格子的理论频数小于5,故用校正Χ2 检验。 Χ2 =[(|ad-bc|-N/2)2 ×N]/[(a+b)(c+d)(a+c)(b+d)],ν =1 若计算出的Χ2 ≥Χ2 0.05,则p ≤0.05,拒绝H 0,可以认为两药物总体有效率不同。 若计算出的Χ2<Χ2 0.05,则p>0.05,不拒绝H 0,尚不能认为两药物总体有效率不同。 4,(1)该资料为计量资料,身高值近似服从正态分布,故可用X 表示集中趋势。S 2和S 表示离 散趋势。分别制定男女95%的身高参考值范围。 (2)方差齐性检验,若方差齐同,可用成组设计的t 检验,2 12 1X X S X X t --= ,ν=n 1+n 2-2 若方差不齐,可用校正t 检验或者成组设计的秩和检验。 5.以加标量为x ,测得总量与样品含碘量的差值为y ,做直线回归分析,求出回归直线 bX a Y +=?, a 表示该方法的恒定系统误差,b 为该方法的比例系统误差。后对a ,b 分别做假设检验,推断总体的α,β是否为0。 若α不等于0,则认为该方法存在恒定系统误差;反之则认为该方法不存在恒定系统误差。 若β不等于0,则认为该方法存在比例系统误差;反之则认为该方法存在比例系统误差。 重庆医科大学200 —200 学年度 学期《医学统计学》考试试卷(四) 一、名词解释(每小题5分,共20分) 1、Ⅰ类错误与Ⅱ类错误 2、总体与样本 3、发病率与患病率 4、小概率事件与小概率原理 二、填空题(每空1分,共20分) 1、识别资料的类型很重要,不同的资料类型需用不同的统计方法去分析。医学统计资料一般可分为:________________、___________________、___________________三类。 2、对于一组明显偏态的观察数据,描述平均水平常用的指标为____________________。 3、标准差S 反映_________________________________________________________, 标准误x S 反映___________________________________________________________。 4、参数估计是指用样本指标估计总体指标。参数估计有________________、__________________两种常用方法。 5、现有两样本均数5.1691=X 和2.1732=X ,从统计学的观点看造成这两个均数存在差异的可能 原 因 是 _______________________________________ 或 者 __________________________________两方面。 6、假设检验是根据有限的样本信息对总体作推断,不论做出哪一种推断结论,都有可能发生错误,这就是假设检验的两类错误。如果根据某样本计算出0003.0= p ,规定05.0=α,则按照假设检验推断原理,将可能发生_____________类错误。 7、直线回归分析中的最小二乘法原理是指_______________________________________。 8、计数资料的描述中,相对数常用的种类有:________、_________、___________三类。 9、对于一份统计资料 ,通常从统计描述与统计推断两个方面进行分析,其中统计推断包括________________和________________。 10、两样本率比较的2χ检验,得2χ>1 05.02 ,χ ,则P_________,应该_________H0 ,可认为 __________________________________________________。 三、单项选择题(从每小题的五个备选答案中,选出一个正确的答案,并将其编号填在相应的横线上,每小题2分,共20分) 1、对一组同质呈正态分布的计量资料,若要描述其集中趋势、平均水平,适宜计算_____。 A . 平均数 B . 中位数 C . 算数平均数 D . 几何均数 E . 变异系数 2、某研究室对120名受试者接种某种苗后,经过一定时间测得抗体滴度如下: 抗体滴度 1:20 1:40 1:80 1:160 1:320 合计 人 数 35 28 25 20 12 120 如果要计算该资料的平均滴度,应计算______________。 A .X B . G C . M D . P 5 E . P 95 3、对呈偏态分布的大样本计量资料,一般在_________范围内包括了95%的变量值。 A .S X ?±96.1 B. X S X ?±96.1 C. P ±1.96·Sp D. P 5 - P 9 5 E. P 2. 5 - P 97.5 4、某地随机抽查18岁男子100人,测得其身高均数为168.8cm ,标准差为4.90cm ,体重均数为55.98 kg ,标准差为4.75kg ,要比较这两组指标的变异程度大小,宜用___________ 来作比较。 A . 极差 B .四分位数间距 C . 方差 D . 标准差 E . 变异系数 5、欲图示出甲、乙、丙三个单位乙型肝炎的发病率,宜选择____________。 A .直条图 B .直方图 C .饼图 D .普通线图 E .半对数线图 6、两样本均数比较的t 检验中,p 值越小说明: 。 A 、两样本均数差别越大 B 、两样本均数差别越小 C 、两总体均数差别越大 D 、两总体均数差别越小 E 、越有把握推断两总体不同 7、R ×C 表中多个样本率比较的2 χ检验,若P<0.01,说明: 。 A 、每两个样本率之间不相等 B 、每两个总体率之间不相等 C 、多个总体率之间不等或不全相等 D 、一定有两个总体率之间相等 E 、多个样本率之间不等或不全相等 8、随机将14只雌性中年大鼠均分为甲、乙两组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/kg 的内毒素,分别测得两组大鼠的肌酐(μmoL/L )数据列于下表,(假定数据呈正态分布,方差齐同)。现要了解内毒素是否对大鼠肌酐有影响,宜选用的主要计算公式是 。 两组大鼠体内肌酐含量(μmoL/L )
因篇幅问题不能全部显示,请点此查看更多更全内容