我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 置信测度 >

无额外信息的线性测度误差模型识别:两步估计法pdf

归档日期:06-13       文本归类:置信测度      文章编辑:爱尚语录

  1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

  32 11 Vol. 32 ,No. 11 第 卷第 期 统计研究 2015 11 Statistical Research Nov. 2015 年 月 无额外信息的线性测度误差 : 模型识别 两步估计法 乔坤元 : 。 , 内容提要 测度误差普遍存在于现实数据中 本文提出了无需额外信息的线性测度误差模型的两步估计法 。 , , 该方法可以得到一致和渐进正态的估计量 在基本估计量的基础上 本文对两步估计法进行了拓展 得到了更有 , 。 效和更稳健的估计量 并且将这一估计方法推广到了时间序列数据和面板数据模型中 本文进一步对比两步估计 , 。 法和工具变量法 发现前者在一定条件下严格优于后者 蒙特卡洛模拟验证了这些估计量在有限样本中的良好性 , 。 质 并且说明了两步估计法相对于工具变量法的优势 : ; ; ; 关键词 测度误差 线性模型 两步估计法 工具变量法 中图分类号:F222. 3 文献标识码:A 文章编号:1002 - 4565 (2015)11 - 0103 - 10 Identifying Linear Error-in-Variables Models without Side Information : A Two-Step Estimation Approach Qiao Kunyuan Abstract :Measurement errors are pervasive in data sets. This paper proposes a two-step estimation approach for linear measurement errors models without extra information ,and argues that the approach can generate consistent and asymptotic normal estimators. The study derives more efficient and more robust estimators besides the baseline one ,and applies the estimation approach to time series and panel data models. Comparison between the two-step estimation and instrumental variable estimation is exhibited ,and under some assumption the former strictly dominates the latter. A Monte Carlo simulation corroborates the performance of the estimators in the case of finite sample ,and demonstrates also the comparative advantage of two-step estimation over its instrumental variable counterpart. Key words :Measurement Error ;Linear Model ;Two-Step Estimation ;Instrumental Variable Estimation “ ”, 的测度误差称作 经典测度误差 而出现在因变量 、 一 引言 “ ”, Carroll 中的测度误差称作 非经典的测度误差 如 [2] , 对于经验研究者而言 变量中包含错误的信息 (20 10) )。 , 等 如果测度误差出现在自变量 也即 : , 是他们经常遇到并且需要解决的问题 一些变量由 模型有经典测度误差的问题 那么直接估计它对于 。 , 于某些原因会在度量的时候产生一定的谬误 如果 因变量的影响而不进行修正的话 得到的估计会由 , 0 , 自变量中包含错误的信息 直接进行估计会因为内 于自变量的内生性问题出现向 偏倚的现象 也就 。 “ ”(attenuation 生性问题而得到有偏和不一致的估计 这一问题自 是经验文献中经常提到的 衰减偏差 Wald (1940)[1] , bias)。 提出以来 引领了一大批学者对此进 , , 测度误差在数据中是比较普遍的 尤其是调查 行研究 关注模型的识别使得计量经济学从统计学 , 。 数据和一些主观的数据(Corcoran ,1980 [3];Bollen 和 中逐渐独立出来 成为一门独立的学科 Paxton ,2000 [4]), 、 、 测度误差就是变量包含错误信息问题的一个典 比如劳动经济学 卫生经济学 政 , , ( ) 。 型 它一般是指 回归模型中的变量在收集的时候会 治 经济 学等倚重调查数据和主观数据的领域 [5] [6] ( Angrist Krueger (1999) 、Hausman (200 1) 因为测度的原因而产生误差 文献中一般将自变量 和 使用 ·104 · 2015 11 统计研究 年 月 劳动经济学和现有的一些经验研究的例子对经典测 优于工具变量法。 。 度误差的影响和相应的解决方案进行了详细的综 本研究与三类文献紧密相连 第一类文献主要 。 Angrist Krueger (1999 )[5] , , 述 根据 和 的综述 当前 考察经典测度误差模型的识别问题 对这一问题的 、 , 最为可信的 解决经典测度误差的方法是工具变量 研究浩如烟海 而工具变量法同时得到了理论研究 法(Instrumental Variable Estimation)。 者和经验研究者的青睐 (Angrist 和 Krueger , , , 1999 [5];Hausman ,200 1 [6])。 , 然而 工具变量法需要依赖额外的信息 而这些 但是 一个不可忽视的 , , , , 额外的信息一方面并不容易找到 另一方面 它们对 问题是 工具变量法需要额外的信息 这一信息的可 : , 于模型的识别未必真正起到正面的作用 如果这些 得性常常困扰经验研究者 而使用工具变量的经验 , 、 额外的信息是无效或者不相关的 使用工具变量反 论文也会因为工具变量的有效性 优劣以及过度识 , (Schennach 而会放大估计的渐进误差 这些无效的或者劣的工 别等问题常常受到其他研究者的挑战 具变量(weak instruments)的效果不如直接使用简单 和Hu ,20 13 [10])。Carroll 等(20 10)[2]提出了新的经 (Hausman ,200 1 [6])。 , 、 的最小二乘法进行估计 典测度误差的解决方法 他们利用两个样本 使用数 , , , 因此 一个很自然的问题是 是否存在一种方法 值方法估计了广义线性测度误差模型 但这一方法 , ( ), 可以在不使用额外信息的情况下 对线性测度误差 依旧需要额外的信息 需要额外的样本 并且该方 ? , , 模型进行识别呢 如果存在这种方法 那么估计线 法提供了较为复杂的数值解而不是显示的表达式 性测度误差模型时, ( 结果就不会再受到工具变量有 因此不利于统计推断并且与现有的方法 工具变量 。 ) 。 ,Schennach Hu (20 13 )[10] 效性以及优劣的影响 这种估计方法与工具变量法 法 进行比较 最近 和 给 ? 相比有哪些特点 本文在测度误差普遍存在的前提 出了使用非参数和半参数的方法对经典误差模型进 , , , , 下 提出了一个新的估计方法 该方法严格优于工具 行估计 同样不依赖于额外的信息 然而他们的估计 : , , 变量法 第一 使用这一方法不需要去寻找额外的信 量仅适用于非线性误差模型 而不能适用于线性误 ; , 。 , 息就可以识别回归模型 第二 这一方法可以回避工 差模型的有效识别 与这一类不同的是 本文提出 , 、 , 具变量的种种问题 比如无效的工具变量问题 劣工 了无额外信息的线性测度误差模型的识别方法 补 具变量问题以及工具变量的过度识别问题(Dufour 充了Schennach 和Hu (20 13)[10]对于无额外信息的 Jasiak ,200 1 [7];Dufour Taamouti ,2005 [8])。 , 和 和 测度误差模型的估计方法 使得在一定的前提假设 , ( ) , 与此同时 非经典的测度误差却没有得到学术 也即因变量存在测度误差 满足的情况下 各种模 。 , 、 。 , 界足够的重视 在线性模型中 出现在等式左边 因 型均可以得到有效的识别 与此同时 本文提出的 变量中的测度误差并不会对估计产生重大的影响, 简单易行的参数和非参数统计量也为经验研究者提 , 。 一般而言它们与等式右边的自变量是正交的 因此 供了更多的选择 , 它们的出现仅仅会影响估计的统计推断 降低估计 第二类文献重点探讨了工具变量法在估计和统 (Hausman ,200 1 [6]), (Dufour Jasiak ,200 1 [7]; 的统计效率 因此大多数情况 计推断方面的替代方法 和 , 。 , Dufour Taamouti ,2005 [8])。 下 人们可以直接使用最小二乘法进行估计 然而 和 工具变量法虽然是估 , , 在非线性模型中 非经典的测度误差的确会影响到 计测度误差模型的重要方法 但是工具变量的问题 , 模型的识别 它会使得最小二乘法估计有偏和不一 也使得这种常规的方法受到越来越多研究者的挑 (Stapleton Young ,1984 [9];Hausman ,200 1 [6]; , 、 致 和 战 诸如工具变量的渐进误差 劣工具变量问题以及 Schennach Hu ,20 13 [10])。 ( ,20 14 [16])。 和 工具变量的过度识别问题等等 乔坤元 , 本文利用被大多研究线性模型的文献忽视的非 因此 在估计和统计推断方面的替代方法逐渐成为 经典的测度误差来克服经典测度误差带来的内生性 研究的热点问题。Dufour 和 Jasiak (200 1 )[7]将 , 。 Anderson-Rubin (Anderson-Rubin procedure ) 问题 从而有效地识别线性测度误差模型 这一方 步骤 推 , , , , 法没有借助额外的信息 并且得到比工具变量法更 广到估计当中 用来替代工具变量 同时 他们使用 , 。 , 优的估计方法 也即两步估计法 具体地 两步估计 拆分样本的方式使用生成的回归变量为工具变量构 , 。 , 法与传统的最小二乘估计法的大样本性质类似 不 造确切的检验和置信集合 他们发现 即使存在无 , , 。 会放大渐进误差 因此在一致性和统计效率方面都 效的和劣的工具变量 统计推断也不会受到影响 32 11 : : ·105 · 第 卷第 期 乔坤元 无额外信息的线性测度误差模型识别 两步估计法 Dufour Taamouti (2005)[8] Anderson-Rubin , 。 和 使用 步 理其他类型的测度误差是无效的 甚至会放大误差 , , 。 骤对统计推断进行了拓展 他们说明这种方法易于 因此 他们认为并没有统一的处理测度误差的方法 。 Bloom Van Reenen (2007 )[14] 实施并且展示了一些相关的估计技巧 本研究对这 和 提出了预防性的措 , , 一类文献有所贡献 我们比较了新提出的工具变量 施来避免测度误差带来的干扰 他们以管理实践指 。 , 法的替代方法 与传统工具变量方法进行对比后发 数为例说明这一指标可能存在的测度误差 因此它 , 。 现 在因变量包含非经典测度误差的前提条件满足 们提出诸如重复采访等方法避免误差出现 , , , 的情况下 两步估计法的统计性质严格优于工具变 可以看到 一方面 现有的文献并没有详实的研 。 , , , 量法 因此 如果线性模型同时包含经典和非经典 究并且利用非经典的测度误差 另一方面 已有的研 , 。 的测度误差 使用新提出的两步估计法将得到更好 究在处理非经典的测度误差的方法上捉襟见肘 在 。 , : 的估计 处理非经典的测度误差时 研究者主要的方法有 [3] (Corcoran ,1980 ) ; 最后一类文献探讨了非经典测度误差的存在性 ①在事后调整方差和残差 ②传 。 , (Bollinger Chandra , 和解决办法 由于在线性模型中 因变量的误差不 统的删节和缩尾调整 和 , 。 2005 [11]); , 会对估计造成影响 因此这一误差往往被人们忽视 ③检查和清理数据 使用诸如重复调查等 , , , (Bloom Van Reenen , 然而 大多数数据中 尤其是调查数据和主观数据 方法来预防测度误差的出现 和 (Corcoran ,1980 [3]; 2007 [14])。 , 测度误差是一个普遍的现象 然而 这些文献并没有考虑同时存在于 Bollen Paxton ,2000 [4]), , 自变量的经典测度误差, , 和 那么在模型的假设中 仅 与此同时 他们没有充分利 , 假设自变量包含测度误差而因变量不包含并不合理 用非经典的测度误差的性质 从而得到更好的处理 (Bollinger Chandra ,2005 [11])。Corcoran (1980 )[3] 。 , 和 非经典的测度误差的方式 基于以有的文献 当前 , , , 认为 调查数据 尤其是依赖于回忆性质的报告数据 的研究提出了对于线性测度误差模型的估计方法 , 可能更多地受到误差的影响 人们可能有意无意地 与此同时解决了非经典的测度误差带来的统计推断 , 。 Corcoran : , 错误报告过去 但女性的误报率较低 在 的问题 新提出的两步估计法有良好的大样本性质 (1980) , , 的数据中 误差既存在于自变量 也存在于 并且蒙特卡洛模拟也验证了两步估计法的估计量在 。 / 。 , 因变量 测度误差也广泛存在于住户的调查 普查 有限样本中的表现 另外 本研究在一个统一的框 , (Bureau of Labor 数据当中 如美国的劳动统计数据 架下考虑了同时包含经典测度误差和非经典测度误 Statistics), 。 , 中国的工业企业数据等等 对于宏观经 差的线性模型 为线性测度误差模型的估计添加了 , , 。 济的研究而言 因变量的测度误差显得尤为重要 因 新的方法 , 为研究者需要依赖这些变量的误差结构得到代表随 具体地 本文通过存在于因变量的非经典的测 机冲击的变量:Montgomery 和 Shaw (1985 )[12]使用 度误差来克服由于经典测度误差带来的自变量的内 , , , 美国劳动统计数据研究了工资的刚性 他们发现因 生性问题 得到了一致和渐进正态的估计方法 也即 。 。 变量的测度误差会显著影响校准和估计的结果 主 两步估计法 该估计方法与经典线性模型假设下的 , 。 , 。 观数据也经常出现测度误差 比如民主的测度 最小二乘估计法相似 拥有良好的统计特性 然后 Bollen Paxton (2000 )[4] , , 和 的综述文章指出 跨国的 对两步估计法进行推广 使用极大似然估计和广义 , 。 , 民主测度广泛存在不可忽视的误差 而这一误差与 矩估计的方法得到更有效的估计量 与此同时 本 。Papaioannou Siourounis , 国家的特征密切相关 和 文从非参数和半参数的角度出发 得到了更稳健的 (2008)[13] Bollen Paxton (2000 )[4] 。 , 根据 和 提出的更 估计量 最后 我们将新提出的两步估计法推广到 , 。 。 正方法 研究了第三波民主化浪潮的决定因素 时间序列数据和面板数据模型中 比较了新提出的 , , 为解决因变量测度误差的问题 大部分研究使 两步估计法与工具变量法的优劣 说明前者在理论 (trimming) (winsorizing ) 。 , 用删节变量 或者缩尾 的方 上严格优于后者 进一步使用蒙特卡洛模拟发现 , 法 这样可以把一些由于测度误差带来的异常值去 新提出的两步估计法在有限样本下也表现出了良好 。 ,Bollinger Chandra (2005 )[11] , , 除 然而 和 认为 这样 的统计特性 估计量的一致性和渐进正态性得到了 , 。 , , 做实际上并没有解决测度误差的问题 现有的方法 验证 与此同时 在有限样本中 如果因变量存在测 , , 仅仅对某一类原因引起的测度误差有效 但是在处 度误差 那么新得到的估计量严格优于工具变量法 ·106 · 2015 11 统计研究 年 月 。 , , “y = X 得到的估计量 因此 在非经典的测度误差存在的 然而 需要注意的是我们不能直接用 β , + Z + ” , ^ 前提下 经验研究者应该考虑使用本文提出的估计 γ  来得到估计 否则得到的γ 很有可能是有 ^ 。 。 , y y = P y 量进行回归分析 偏和不一致的 另外 不能使用 的估计 X 来 : ^ 本文接下来的部分安排如下 第二部分提出两 构建“Z = n (X ,y = n (X ,PX ,y ))”,因为第二步回 , 步估计法 证明该估计方法的大样本性质并且进行 ^ M y ,M X = M P = 0 = 0 。 归中包含了 X X X X 使得γ 1 与 ; ; 拓展和推广 第三部分给出蒙特卡洛模拟的结果 最 , n (X ,y ), 此同时 借助样本量 来放大 以此来降低误 后一部分总结全文。 差的影响从而得到一致的估计。 ^ , , 第二步 放入估计得到的残差ε 、 二 两步估计法 - 1 ^ y = Xβ + P M y +  β = (X X ) (I ( ) 2 Z X 2 2 一 模型设定 - P M )y ^ = M (I - P M )y 考虑模型: Z X 并且2 X Z X * ^ y = X β +  ,y = y + u ;X β 2 就是在这里采用的两步估计法得到的基本 (n × 1) (n ×k) (k × 1) (n × 1) i. i. d. * 2 估计量。 = X + v ; ~ (0 , I) X  σ ⊥ , * * 如果重复上述的第二步 那么各期得到的估计 , y = X + , , 其中 真实的模型是 β  因此 模型 量与二阶段估计量完全一致。 可以写作: : , ( , 证明 从第二步估计开始 有 这里的 1 代表ε y = X + (- v + u)- X + ,cov (X ,v) 0 , β  β β ε ≠ 以求符号的连贯性): u ⊥X ^ ^ - 1  = Zγ +  γ = (Z Z) Z M (I - P M )y 2 2 3 2 X X X , u X 。 在这里 假设 ⊥ 可以放松 ^ = P M (I - P M )y + ^ - 1 2 Z X Z X 3 , = (X X ) X y 因此 最小二乘估计量β OLS 是有 ^ y = Xβ + P M y + P M (I - P M )y +  β 3 Z X Z X Z X 3 3 、 , y , 偏 不一致的 由于这里的 也有测度误差 对于残 - 1 2 = (X X ) X (I - P M )y Z X 差项方差的估计同样不准确。 ^ 2 ^ = M (I - P M )y = Z + , (  γ  γ 需要假设因变量也包含测度误差 非经典的测 3 X Z X 3 4 3 - 1 2 度误差), (Schennach = (Z Z) Z M (I - P M )y 从而这个模型才可以识别 和 X Z X Hu ,20 13 [10])。 , y ^ 2 另外 因变量 包含的误差通常与自  = P M (I - P M )y +  … 3 Z X Z X 4 X , , , 变量 正交 但是这一假设并不影响估计 当然 如 n : 那么第 步迭代的估计量是 , 。 果两者相关 那么统计推断可能会受到影响 在这 ^ - 1 n - 1 β = (X X ) X (I - P M ) y n Z X , , 个模型中 放松这些假设 从而得到适用性更广的估 ^ n - 1  = M (I - P M ) y n X Z X 计量。 ^ - 1 n - 1 γ = (Z Z) Z M (I - P M ) y = P M (I ( ) n X Z X n Z X 二 两步估计法 n - 1 - P M ) y +  1. 基本估计量。 Z X n + 1 - 1 ^ - 1 ^  X I - yy X  , = (X X ) X y , = M y , 第一步 得到β 1 ε X 其中  [ ( y y ]  - 1   M = I - X (X X ) X = I - P , P 是残差矩阵 而 是 - 1 X X ^ X  - 1 [ X ( I - yy )X ] X y  , , Z = n (X ,y ), Z y y y y 投影矩阵 同样 令 本文用ε 对 回归   PZ = (X ,y ) ( , - v + u Z , X  1 yy - 1  也即 将假想的 β 投射到 由于υβ 与 相 u y , Z ):  - y yy X [ X ( (I - y y )X ]  关而 与 相关 因此测度误差完全被 捕捉    1  ^ ^ - 1 ^   ε = Zγ + γ = (Z Z) Z M y ,ε 的估计 1 1 X  y M y  X ^ 是ε = P M y +  - 1 Z X 2 ,Z , Z (X ,y ) = ( I - yy )X [ X ( I - yy )X ] X 注意到在这里 依旧是内生的 然而由于 包 y y y y ^ X y , - 1 含 和 因此内生性仅仅来自于它与ε 的相关性而 1 yy yy 、 X y (covariates)。 - y yX [ X ( I - y y )X ] X yy + y M y 不是其他的 与 或者 相关的协变量 X 32 11 : : ·107 · 第 卷第 期 乔坤元 无额外信息的线性测度误差模型识别 两步估计法 1 - 1 , yy 计 这样在最大限度上避免了估计内生变量的系数 I - P M = I + X X I - X X yy M Z X y y [ ( y y ) ] X 。 , Z ,y 带来的问题 第二 挑选了特殊的 包含了自变量 yy X , y y - M 和残差项 的所以信息 从而 作为分母会控制 y M y X X 渐进误差。 n - 1 n n - 1 yy (P M ) = (- 1) P M , , , X , Z X Z X ( y M yMX ) 然而 如果相反 自变量 没有测度误差 那么 X Z ny , 将退化为 这里的两步估计法依旧有效并且上 n ^ ^ ∴ (P M )y = P M y β = β Z X Z X n 2 。 , u X , 述的性质依旧成立 另外 可以放松 ⊥ 的假设 以下为两步估计法建立大样本性质。 , 让两者相关 新提出的两步估计法依旧是一致和渐 2 . 大样本性质。 进正态的。 ^ 首先考察γ 1 : , X 第二 如果自变量 除了测度误差外还有其他 ^ - 1 γ 1 - γ 1 = (Z Z) Z 2 , , 原因导致其内生 比如遗漏变量等 这里的两步估计 p ,(∵ X ⊥2 ) 1 - 1 yy -1 1 , v 法依旧有效 因为假想中的遗漏变量可以被视作 X X X y , y → n ( y y [ ( I - y y ) ] y M y ) 2 X ^ , Z 的一个组成部分 将第一阶段的残差ε 投射到 上 ∵ X ,u ,v ⊥2 。 , 同样可以去除遗漏变量的影响 另外 这个两步估计 - 1 p 1 - 1 X yy X X y , 1 p 法还可以克服部分由于其他两个原因导致自变量X → I -  → n ( y y [ ( y y ) ] y M y ) 2 2 X , , 内生的情况 包括互为因果和样本选择 因为这两种 p  2 2 1 O( ny y )→ O( n ) 原因导致的内生性问题大多可以看作因遗漏变量所 。 , ^ 致 另外 这个估计量在这一族估计方法中是最简 , 。 因此 γ 1 是一

  ·电沉积紫膜薄膜中菌紫质的光电响应对n- 端表面 - 影像科学与光化学.pdf

  ·升级的在线保护和预测系统提升了机械设备健康状况监控能力 - emerson.pdf

  ·基于连续性条件的体piv 后处理技术 - 北京航空航天大学学报.pdf

  ·镧铱硅电子结构与成键机理的第一性原理研究! - open repository of .pdf

本文链接:http://incardex.com/zhixincedu/54.html