我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 置信测度 >

统计学名词解释汇总 袁卫版

归档日期:08-21       文本归类:置信测度      文章编辑:爱尚语录

  /?~!@#¥……&*()——{}【】‘;:”“。,、?]); var rs = ; for (var i = 0; i

  统计学名词解释 统计学:是收集、处理、分析、解释数据并从数据中得出结论的科学。 统计学方法:描述统计和推断统计;理论统计和应用统计。 统计数据的来源:第一手数据(直接数据);第二手数据(间接数据)。 基本概念: 总体(人们研究的所有基本单位总和) 变量(总体中个体单位所具有的特征) 样本(总体的一部分) 统计数据类型: 按采取计量尺度,分类数据(定性)、顺序数据(定性)、数值型数据(定量); 按统计数据收集方法,观测数据、实验数据; 按被描述对象与时间关系,截面数据、时间序列数据(动态数据) 变量分类: 分类变量,顺序变量,数值型变量; 随机变量(某次试验结果的数值性描述),非随机变量; 经验变量,理论变量。 离散型变量和连续型变量 离散型变量,只能取有限个数值; 连续型变量,取一个或多个区间中任何值 ; 均值:亦数学期望,是随机变量所有可能取值的一个加权平均 参数估计:用样本统计量去估计总体的参数 估计量:用来估计总体参数的统计量的名称 点估计:用样本估计量的值作为总体参数的估计值 区间估计:在点估计的基础上,给出总体参数估计的一个范围 置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间; 置信系数:置信区间中包含总体参数真值的次数所占的比率 评价估计量的标准:无偏性、有效性、一致性; 假设:对总体参数的具体数值所作的陈述; 假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设假设是否成立的过程。 方差分析:检验多个总体均值是否相等的统计方法 数据的预处理包括哪些内容? 数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。 直方图和条形图有什么区别? ① 条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距, ② 直方图各矩形连续排列,条形图分开排列, ③ 条形图主要展示分类数据,直方图主要展示数值型数据。 ④ 茎叶图和直方图相比有什么优点? 茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。 一组数据的分布特征可以从哪几方面进行测度: 一是分布的集中趋势,反映数据向其中心靠拢或聚集的程度; 二是分布的离散程度,反映各数据远离其中心值的趋势; 三是分布的形状,反映数据分布偏斜程度和峰度。 简述众数、中位数、平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。 均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。 为什么要计算离散系数。 第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。 第二,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。 简述异众比率、四分位差、方差或标准差的适用场合 对于顺序数据,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。 标准分数有哪些用途? 标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。 1.抽样推断的含义:是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。 2.简单随机抽样:①含义:从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本都有相同的机会被抽中,这样的方式称为简单随机抽样。②特点:简单随机抽样是其他抽样方法的基础。有两种抽取元素的方式:重复臭氧和不重复抽样。 3.分层抽样:①含义:在抽样之前先将总体的元素划分为若干层,然后从各个层中抽取一定数量的元素组成一个样本,这样的样本抽样方式称为分层抽样,也成分类抽样。②特点:⑴除了可以对总体进行评估外,还可以对各层的子总体进行评估。⑵可以按自然区域或行政区域进行分层,使抽样的组织和实施都比较方便。⑶分层抽样的样本分布在各个层内,从而使样本在总体中的分布比较均匀。⑷可以提高估计的精度。 4.系统抽样:①含义:先将总体个元素按照某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。②特点:⑴简单易行⑵在总体中的分布一般也比较均匀,由此估计的误差通常要小于简单随机抽样。 5.整群抽样: ①含义:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察。②特点:不需要有总体元素的具体名单而只要有群的名单就可以进行抽样。整群抽样时群内各元素比较集中,对样本进行调查比较方便,节约费用。在群内各元素存在差异时,整群抽样可以提供较好的结果,理想的情况是每一群都是整个总体的一个缩影。 3.重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。 不重复抽样:一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取n个元素为止。 4.抽样分布:重复选取容量为n的样本时,由每一个样本算出的统计量数值的相对频数分布或概率分布,称为样本统计量的抽样分布。 5.样本统计量的分布与总体分布的关系? 由于现实中我们不可能将所有的样本都抽出来,因此,统计量的抽样分布实际上是一种理论分布,但它与总体分布存在着密切的关系,以均值x的抽样分布为例,其抽样分布与原有总体的分布有关,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n,即00。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当n为大样本时(n≥30),根据统计上的中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n。 6. Zα/2的含义:是估计误差。Zα/2的值和样本量n共同确定了估计误差的大小,一旦确定了置信水平1-α,Zα/2的值就确定了。对于给定的Zα/2的值和总体标准差σ。可以确定任一允许的估计误差所需要的样本量。 7.样本均值抽样分布的两个主要特征值: 与总体参数的关系: 1.理解原假设与备择假设的含义:原假设:通常将研究者想收集证据予以反对的假设称为原假设或零假设,用H0表示;备择假设:通常将研究者想收集证据予以支持的假设称为备择假设或研究假设,用H1表示。 2.统计检验量:根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。 标准化检验统计量:是将统计检验量标准化,标准化的统计检验量=(点估计量-假设值)/点估计量的抽样标准差。 3.第Ⅰ类错误:当原假设为真时拒绝原假设,所犯的错误称为Ⅰ类错误。犯第Ⅰ类错误的概率通常记为α。 第Ⅱ类错误:当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称取伪错误。犯第Ⅱ类错误的概率通常记为β。 它们发生概率之间的关系:在样本量不变的情况下,要减小α就会使β增大,而要增大α就会使β减小,这两类错误此消彼长。 4.显著性水平:假设检验中犯的第Ⅰ类错误的概率,称为显著性水平,记为α。 它对于假设检验决策的意义:显著性水平是人们事先制定的犯第Ⅰ类错误的概率α的最大允许值,在实际应用中,显著性水平往往是人们事先给出的一个值。 5.P值:在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为P值,也称为观察到的显著性水平。 利用P值决策的准则:如果P值<α,拒绝H0;如果P值>α,不拒绝H0. 6.单侧检验与双侧检验的区别:单侧检验中,P值位于抽样分布的一侧,而双侧检验P值位于分布的两侧,每一侧的P值为1/2. 7.大样本情形下总体均值左侧检验的拒绝域:Z<﹣Zα;右侧检验的拒绝域:Z>Z;双侧检验的拒绝域:Z>Zα/2。 8.小样本情形下总体均值检验应该构造的检验统计量t 应用前提:服从正态分布 9.小样本情形下总体均值左侧检验拒绝域:t<﹣tα(n-1);右侧检验拒绝域: t>tα(n-1);双侧检验的拒绝域:t>tα/2(n-1) 10.假设检验的一般步骤:①依照题意建立原假设H0与备择假设H1②判断样本大小并计算检验统计量③根据显著水平进行判断原假设是否成立。 1、相关关系:变量之间存在的不确定的数量关系。相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个 2、相关系数的取值和意义:取值范围:—1≤r≤1。若0Fα,拒绝H0,表明两个变量之间的线性关系是显著的;若F

  亲,很抱歉,此页已超出免费预览范围啦!您可以免费下载此资源,请下载查看!

本文链接:http://incardex.com/zhixincedu/610.html