我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 置信测度 >

统计学试卷2012

归档日期:08-15       文本归类:置信测度      文章编辑:爱尚语录

  中央财经大学 2011-2012 学年第二学期 《统计学》试题 专业___________________ 学号_____________ 姓名_______________ 注意事项: 1.考试中可以使用计算器。 2.本试卷共有四道大题,请不要漏答。 3.考试时间为 110 分钟,请注意合理分配考试时间。 4.答题中可能用到的部分公式已经附在试卷末尾供参考。 5.试卷不得带出考场,交卷时请将试卷和答题纸分开。 6. 可以把试卷的空白处用作草稿纸,不另附草稿纸。 7. 所有假设检验中显著性水平?都取为 0.05,不再另行说明。 8. 请将所有答案写在答题纸对应的位置上或者写清题号, 评分只以答题纸为准。 空间不足时可在答题纸背面答题。 一、单项选择题(选出最为恰当的一项。每题 1 分,共 20 分) 。 1. 根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是 A、名义尺度 B、顺序尺度 C、定距尺度 D、定比尺度 2. 某市场调查公司为了对一家大型商场做顾客满意度调查,对不同性别和年龄的顾客按事 先规定的人数随意进行了一些调查询问,这种调查属于 A、整群抽样 B、分层抽样 C、配额抽样 D、方便抽样 3. 进行抽样调查,当总体内部差异较大且有明显的不同类型界限或标志时,通常采用 A、简单随机抽样 B、系统抽样 C、整群抽样 D、分层抽样 4. 一组数据的偏度系数为-3,则该数据的统计分布应具有如下特征 A、尖峰分布 B、扁平分布 C、左偏分布 D、右偏分布 5. 在一项抽样调查中,由于抽样随机性造成的误差属于 A、抽样误差 B、抽样框误差 C、无回答误差 D、计量误差 6. 观测数据序列为,1,3,3,7,9,25。则数字“3”的秩为: A、2 B、2.5 C、3 D、以上都不对 7. 观测数据序列为,1,3,3,7,9,25。则这组数据的中位数等于: A、3 B、5 C、7 D、以上都不对 8. 如果假设检验中原假设为 H0:??≥? 0,备则假设为 H1:?<? 0,则该检验是 A、左侧检验 B、右侧检验 C、双侧检验 D、独立样本检验 1 9. 要描述我国国内生产总值的三次产业构成,最恰当的图形是: A、线图 B、直方图 C、茎叶图 D、饼图 10. 某地粮食总产量比去年增长了 10%,粮食播种面积增长了 5%,则粮食平均亩产量增长 了: A、0.5% B、2% C、4.8% D、5% 11. 用 SPSS 软件对变量做描述统计分析时,会计算“标准差”和“标准误”。以下说法正确的 是: A、标准差反映了样本均值抽样分布的离散程度 B、标准误反映了样本均值抽样分布的离散程度 C、标准差反映了变量的集中趋势 D、标准误反映了变量的集中趋势 12. 在一项抽样调查中采用有放回的简单随机抽样, 已知最大允许误差为 5, 置信度为 95%, 总体标准差为 50,则必要样本容量为: A、20 B、196 C、385 D、以上都不对 13. 对于一个平稳的时间序列,其自相关和偏自相关函数都是拖尾的,则该序列最可能适合 的模型形式是: A、AR 模型 B、MA 模型 C、ARMA 模型 D、以上都不对 14. 多元回归分析中修正的 R2: A、可以是负值 B、取值在 0-1 之间 2 C、总是大于 R D、与方程中自变量的个数无关 15. 对 1,2,5,7,10 共 5 个数做系统聚类分析,则以下说法正确的是 A、最先聚在一起形成一类的是 1 和 2 B、最后聚在一起形成一类的是 1 和 2 C、最先聚在一起形成一类的是 7 和 10 D、不能确定,因为未说明距离的计算方法 16. 系统聚类分析中计算个体之间的距离可以使用的方法是: A、最短距离 B、最长距离 C、平均距离 D、欧式距离 17. 为了检验两个独立样本对应总体的均值是否相等,可以使用的检验方法是 A、Kruskal-Wallis 检验 B、Wlicoxon 秩和检验 C、独立样本 t 检验 D、匹配样本 t 检验 18. 使用 K-S 检验来进行正态性检验时,以下说法正确的是: A、检验的原假设是样本服从正态分布 B、检验的备择假设是样本服从正态分布 C、检验的原假设是总体服从正态分布 D、检验的备择假设是总体服从正态分布 2 19.回归分析中的最小平方法是使______达到最小。 A、残差之和 B、残差平方和 C、残差绝对值之和 D、因变量的离差平方和 20. 在对多个 ARIMA 模型进行比较以选择模型时,以下最为恰当的指标是 A、模型的 R2 B、模型的 BIC 值 C、模型的估计标准误 D、模型的 t 检验值 二、多项选择题(至少有一个选项是正确,多选、少选均不得分。每题 2 分,共 10 分) 。 1. 以下关于面访调查的说法正确的有: A、一般有较高的回答率 B、调查成本相对较低 C、调查的时效性高,可以迅速获得调查结果 D、适合对敏感性问题的调查 E、可以询问比较复杂的问题 2. 多元线性回归分析中,需要以下哪些假设条件以保证 OLS 估计量的优良性质? A、模型中随机误差项的方差保持不变 B、模型中随机误差项之间不存在自相关 C、自变量和因变量之间高度相关 D、自变量之间相互独立 E、自变量之间不存在完全的多重共线. 以下关于???检验的说法正确的有: A、可以用来检验两个定性变量是否相互独立 B、可以用来检验单个定性变量是否服从正态分布 C、可以用来检验单个定量变量是否服从正态分布 D、要求每个分组(单元格)中的观测频数大于等于 5 E、是一种参数检验方法 4. 以下以 Kruskal-Wallis 检验的输出结果,根据结果以下正确的有: 工资 卡方 df 渐近显著性 A、检验中需要假设各个子总体的方差相等 B、检验结论是各个子总体的均值不全相等 C、检验结论是各个子总体的中位数不全相等 D、从表格可以看出检验中总共涉及 4 个子总体 E、从表格可以看出检验中总共涉及 3 个子总体 12.316 3 0.006 3 5. 对x和y两个变量计算相关系数并进行假设检验的结果如下表,则相关说法正确的有: 相关性 X x Pearson 相关性 显著性(双侧) N y Pearson 相关性 显著性(双侧) N 100 .271 ** y 1 .271 ** .006 100 1 .006 100 100 **. 在 .01 水平(双侧)上显著相关。 A、以y为因变量,x为自变量做回归(包含常数项) ,则方程的判定系数0.073。 B、以y为因变量,x为自变量做回归(包含常数项) ,则方程的判定系数0.271。 C、对相关系数的假设检验中p值=0.271。 D、对相关系数的假设检验中p值=0.006。 E、假设检验的结果是拒绝原假设,认为两个变量的相关系数是显著的。 三、判断题(正确的在答题纸相应位置打√,错误的打×。每题 1 分,共 10 分) 1.定性变量不能计算算术平均数。 2.对于等间隔的时点序列,将所有数值之和除以数据个数即可以计算出平均发展水平。 3.由于调查中被调查者一般不愿意如实回答敏感性问题,因此调查问卷中不应该包含此类问 题。 4.基于两个独立样本对两个总体的均值进行假设检验时,需要先检验两个总体的方差是否相 等。 5. Wlicoxon 符号秩检验可以用来检验两个独立样本的中位数是否相等。 6.方差分析中的因变量也称为因素。 7. 在多元线性回归分析中, 如果在 t 检验中所有的自变量都不显著, 则方程在整体显著性的 F 检验中一定是不显著的。 8. 计算加权综合指数时,如果同度量因素固定在基期,则相应的指数称为拉氏指数。 9. 因子分析中必须先对变量进行标准化以消除计量单位对计算结果的影响。 10.聚类分析中可以通过共同度这一指标来比较聚类效果的好坏。 四、计算和案例分析题(共 60 分) 。 1.(9 分)人民网在 6 月 6 日推出的“如何看待人保部拟适时建议弹性延迟领养老金年龄” 调查显示,截止到 6 月 11 日下午 14 点,该调查已有超过 80 万人参加,其中,超过 75 万人 表示反对,占 93.7%;有 2.5%的人表示支持,2.1%的人持中立态度。对于这一调查结果, 人社部认为“网络调查具有一定片面性,上网的人多数比较年轻,某种意义上老人占位子, 年轻人压力会很大,网上很难展现出全景的结果,需要对不同行业、单位、层级的人进行调 查。” (1)你如何看待网络调查结果的代表性?(3 分) (2)如果由你来设计一个调查,要求在短时间内了解全国 15-64 岁人口对延迟退休年龄的 态度, 你将采用何种调查方法?通过何种方式收集数据?为调查设计 3-5 个封闭式的问题和 备选答案。 (6 分) 4 2.(8 分)中国统计年鉴公布的我国 2007-2010 年的居民消费价格指数(CPI)和居民消费支 出数据见下表(当年价格)。 居民消费价格指数 2007 2008 2009 2010 104.8 105.9 99.3 103.3 居民消费支出(当年价格,亿元) 95609.8 110594.5 121129.9 133290.9 (1)简要说明居民消费价格指数的含义和统计方法。 (2)计算以 2007 年价格表示的各年居民消费。 (3)以 2007 年为基期,计算 2008-2010 年我国实际居民消费支出的年平均增长率。 3、 (8分)要检验一种新的操作方法是否能够增加钢产量,在10个平炉中分别用原有的操作 方法炼一炉,再用新操作方法炼一炉。用X1和X2分表表示原操作方法和新操作方法产量。 对测试结果用匹配样本t检验进行分析,SPSS的部分输出结果如下。 成对样本检验 成对差分 均值 标准差 均值的标准 误 下限 对 1 X2 – X1 3.20000 2.40832 .76158 1.47719 差分的 95% 置信区 间 上限 4.92281 4.202 9 .002 t df Sig.(双 侧) (1)写出检验中的原假设和备择假设。 (2)写出检验的p值以及检验的结论。 (3)如果差值序列不服从正态分布,可以使用哪种非参数检验方法进行假设检验? 4、 (9分)为了测试4种不同的原材料对产品使用寿命的影响,随机抽取4种不同原材料的产 品若干件测试其使用寿命,对实验数据进行单因素方差分析的结果如下,请据此回答问题。 方差齐性检验 Y Levene 统计量 3.532 df1 3 df2 22 显著性 .032 单因素方差分析 Y 平方和 组间 组内 总数 49212.353 166622.262 215834.615 df A B 25 均方 C D F E 显著性 .121 5 (1)请判断数据是否满足方差分析关于“方差齐性”的假设条件,并给出依据; (2)请计算方差分析表中 A、B、C、D、E 五项数值; (3)根据方差分析的结果,能否认为 4 种材料的产品使用寿命有显著差异? 5. (6 分)SPSS 软件估计的一个 AR(2)模型(不包含常数项)的结果如下。 ARIMA 模型参数 估计 x-模型_1 x 无转换 AR 滞后 1 滞后 2 .550 .275 SE .109 .109 t 5.065 2.515 Sig. .000 .014 (1)写出模型表达式(3 分) ; (2)已知 x 最近 3 期(t-2、t-1、t)的值分别为 0.11,1.04 和 0.12,请根据模型预测 t+1 时 刻 x 的值。 (3 分) 6、 (12 分)一家大型超市每个月都会由于偷窃行为造成一定的损失。以各个月份的损失额 (Y,美元)为因变量,员工人数(X1,人) 、交易量(X2,笔数)为自变量的回归结果如 下: 模型汇总 模型 1 R .758 a R 方 .574 调整 R 方 .513 估计的标准误差 311.60426 a. 预测变量: (常量), X2, X1。 Anova 模型 回归 1 残差 总计 a. 因变量: Y b. 预测变量: (常量), X2, X1。 平方和 1833270.524 1359361.005 3192631.529 df a 均方 2 14 16 916635.262 97097.215 F 9.440 Sig. .003 b 系数 模型 非标准化系数 B (常量) 1 X1 X2 a. 因变量: Y 4600.805 -21.567 .203 a 标准系数 试用版 t Sig. 标准 误差 1010.545 8.956 .056 4.553 -1.062 1.606 -2.408 3.642 .000 .030 .003 6 (1)请写出估计的回归方程,并说明回归系数的含义。 (2)说明模型估计标准误的含义。已知 Y 的均值为 3300 美元,计算一个离散系数来反映 模型的拟合效果。 (3)分析方程 t 检验和 F 检验的结果。 (4)某一个月份职工人数为 200 人,交易笔数 15618 笔。根据模型估计该月份的偷窃损失。 7. (8 分)一项研究中试图比较多个城市综合发展水平的差异。研究中选择的变量如下: X1:年末总人口 ; X2:地区生产总值 X3:城乡居民储蓄余额 ; X4:在岗职工平均工资 X5:年末邮政局数 ; X6:社会商品零售总额 ; X7:医院卫生院个数 以下是使用主成分方法提取因子、采用最大方差法进行因子旋转得到的因子分析的部分结 果。请根据结果回答题。 解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 合计 4.792 1.764 .251 .103 .056 .022 .013 方差的 % 68.452 25.206 3.581 1.465 .796 .316 累积 % 提取平方和载入 合计 方差的 % 累积 % 旋转平方和载入 合计 方差的 % 累积 % 52.152 52.152 41.506 93.658 68.452 4.792 93.658 1.764 97.239 98.704 99.500 99.816 68.452 68.452 3.651 25.206 93.658 2.905 .184 100.000 提取方法:主成份分析。 成份矩阵 a 旋转成份矩阵 2 a 成份 1 X1 X2 X3 X4 X5 X6 X7 .752 .942 .916 .756 .740 .936 .712 1 .621 -.299 -.347 -.600 .528 -.298 .664 X1 X2 X3 X4 X5 X6 X7 成份 2 .212 .927 .936 .965 .259 .922 .154 .953 .342 .289 -.010 .871 .340 .961 (1)结合本例说明因子分析中确定因子的个数的方法。 (3 分) (2)分析各个因子的含义,并给予适当命名。 (3 分) (3)写出用公共因子表示的 X7 变量的表达式。(2 分) 7 附:可能用到的公式。 Z0.025=1.96 ? s CV ? (总体) 或 cv ? (样本) X x t? x ? ?0 s/ n 离差平方和 SS SSA SSE SST 自由度 df r-1 n-r n-1 均方 MS MSA MSE F值 MSA/MSE 变差来源 组 组 间 内 总变异 x?n a a a1 a2 ? ? ?? n ? n n a0 a1 an?1 a0 2 Z? ?2 /2 n? E 2 n? 2 Z? ? (1 ? ? ) /2 E 2 , n? n0 n 1? 0 N ARIMA 模型公式: (遗漏) 8

本文链接:http://incardex.com/zhixincedu/551.html