GB∕T 4883-2008 数据的统计处理和解释 正态样本离群值的判断和处理.pdf

GB∕T 4883-2008 数据的统计处理和解释 正态样本离群值的判断和处理.pdf
积分0.00
特惠
积分0
VIP全站资料免积分下载
立即下载
同类资料根据编号标题搜索
文档
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:1.1 M
标准类别:建筑工业标准
资源ID:384382
VIP资源

标准规范下载简介:

内容预览由机器从pdf转换为word,准确率92%以上,供参考

GB∕T 4883-2008 数据的统计处理和解释 正态样本离*值的判断和处理.pdf

标准差情形离*值的判断规则(限定检出离*值的

在未知标准差的情形下可使用格拉布斯(Grubbs)检验法和狄克逊(Dixon)检验法。可根 求选定其中一种检验法(见附录B)。

广播电视中心框架核心筒结构施工组织设计1) 计算出统计量G的值:

)/s =[(x)]

a)计算出统计量G的值:

计算出统计量G的值:

其中和s是样本均值和样本标准差;

7.2.4使用格拉布斯(Grubbs)检验法的示例

角定检出水平α=0.05,在表A.2中查出临界值Go.95(10)=2.176,因G1o>Go.95(10),判定x(10) 为离*值。 对于检出的离*值x(1o)=14.0,确定剔除水平α=0.01,在表A.2中查出临界值Go.99(1 410,因G

7.3狄克逊(Dixon)检验法

当使用狄克逊检验法时,若样本量3≤n≤30,其临界值见表A.3;若样本量30

a)计算出下述统计量的值:

*值;否则判未发现离*

7.3.3使用狄克逊(Dixon)检验法的示例

1 125 1248 1 250 1259 1273 1 279 1285 1285 1 293 1300 1305 1312 1315 1324 1325 1350

确定检出水平α=0.05,在表A.3中查出临界值Do.9s(16)=0.505,因D'6>Do.9s(16),故判定最小 值1)=1125为离*值。 对于检出的离*值x(1)=1125,确定剔除水平α’=0.01,在表A.3中查出临界值Do.99(16)= 0.597,因D'>Do.99s(16),故判定最小值x(1)=1125为统计离*值。 b)双侧情形

计算D=0.6614和

确定检出水平α=0.05,在表A.3'查出临界值Do.9s(16)=0.547。因Dg>Dns且D's>Do.9s(16), 故判定最小值x1=1125为离*值。 对于检出的离*值x(1)=1125,确定剔除水平α*=0.01,在表A.3'查出临界值Do.99(16)=0.627。 因Dg>Dg且D'>D0.9g(16),故判定最小值x(1)=1125为统计离*值。

当限定检出离*值的个数大于1时,可使用偏度一峰度检验法或狄克逊(Dixon)检验法的重复使用 方法,可根据实际要求选定其中一种检验法(见附录B)

8.2偏度一峰度检验法

考查样本诸观测值,确认它们的样本主体来自正态总体,而极端值应较明显的偏离样本主

计算偏度统计量6.的

GB/T 48832008

8.2.4重复使用峰度检验法的示例

本例为离*值问题早期研究中的著名实例(1883年)。观测金星垂直半径的15个观测数据的离差 经排列后为(单位:s):

由问题的背景需要判断x(1)=一1.40和x(15)=1.01是否离*。 根据GB/T4882一2001,使用正态概率纸进行正态性检验。 将上述数据点在正态概率纸上(见图1),此时,样本的诸点近似在一条直线近旁两侧,当画出适宜 的直线后,样本的低端向上而高端向下偏离,故可用偏度一峰度检验法。 计管组

π=0.27/15=0.018,b,=4.386

确定检出水平α=0.05,在表A.5中查出临界值b.9s(15)=4.13,因b=4.3860>bo.9s(15)= 4.13,判定距离均值0.018最远的工(1=一1.40为离*值。 对于检出的离*值x(1)=一1.40,确定剔除水平α’=0.01,在表A.5中查出临界值b.99(15)= 5.30,因b=4.3860

取出xv=一1.40之后,对余下14个值进行计算如下:

=1.67/14=0.1193,再计算b=2.8164。确定检出水平αa=0.05,在表A.5中查出临界值 b.9s(14)=4.11,而b=2.8164

67/14=0.1193,再计算b=2.8164。确定检出水平α=0.05,在表A.5中查出临界值 4.11,而b=2.8164

8.3狄克逊(Dixon)检验法

8.3.2重复使用狄克逊(Dixon)检验法的示例

重复使用狄克逊(Dixon)检验法的示例 数据同8.2.4。计算

数据同8.2.4。计算

(15)—(3) 1.01*0.301.31

工(13)(1) 0.48*1.401.88

D=r22= 工(14)—工(3) 1.01*0.241.25 0.48*0.440.92 =0.217 (12)(1)

对于上述确定的检出水平α=0.05,在表A.3'中查出临界值Do.9s(14)=0.586,因为D< Do.9s(14),故不能继续检出离*值。 所以,本例只检出一个歧离值1=一0.140

附录A (规范性附录) 统计数值表 奈尔(Nair)检验的临界值表见表A.1,格拉布斯(Grubbs)检验的临界值表见表A.2,狄克逊(Dix on)检验的临界值表见表A.3,偏度检验的临界值表见表A.4,峰度检验的临界值表见表A.5。

表A.1奈尔(Nair)检验的临界值表

表A.3单侧狄克逊(Dixon)检验的临界值表

表A.3'双侧狄克逊(Dixon)检验的临界值表

表A.4 偏度检验的临界值表

A.5峰度检验的临界

B.1判定和处理离*值的目的

B.1.1三种不同的目的

B.1.1三种不同的目的

附录B (资料性附录) 选择离*值判断方法和处理规则的指南

主要目的是找出离*值,从而进行质量控制、新规律探索、技术考察等项工作。 B.1.1.2估计参数 主要目的在于估计总体的某个参数,寻找离*值的目的在于确定这些值是否计人样本,以便准确估 计其参数。

B.1.1.3检验假设

主要目的在于判定总体是否符合所考察的要求,寻找离*值的目的主要在于确定这些值 样本,以使判定结果计量准确

电站施工组织设计B.1.2判定离*值的不同目的引起的不同的选

B.1.2.1以识别为目的

B.1.2.2以估计和检验为目的

要判定离*值,就应把判定和处理离*值的方法和进一步作估计或检验的准确性统一起来考所 重用格拉布斯(Grubbs)检验法作估计,实际是一种新估计量

有时也可以不经过判定离*值的步骤,而采用稳健的方法。 例如:在塑料材料中,有时使用截割均值,把12个观测值的最大值与最小值舍去,以余下的10个观 测值作算术平均以估计口。(体操比赛评分时,也把诸裁判报出的最高分和最低分舍去,以余下的几个 评分的平均值报出),并不需要追查舍去的一定是离*值,而这种估计也很好地预防了离*值的不 利影响。

B.2对各种检验法的选择

本标准第7章、第8章给出了三种检验法,在选用检验方法时应主要考虑下述几点。 B.2.1限定检出离*值的个数不超过1时 B.2.1.1当n较小时YD/T 3157-2016 公有云服务安全防护要求,格拉布斯(Grubbs)检验法具有判定离*值的功效最优性,而狄克逊(Dixon)检 验法正确判定离*值的功效与格拉布斯(Grubbs)检验法相差甚微;建议使用格拉布斯(Grubbs) 检验法。 B.2.1.2当n较大时,同时在正态概率纸上,若样本主体是基本在一条直线的近旁;建议使用偏度 峰度检验法。 B.2.1.3当n较大时,同时在正态概率纸上,若样本主体不是基本在一条直线的近旁,使用格拉布斯 (Grubbs)检验法。

B.2.2限定检出离*值的个数大于1时

重复使用同一检验法可能犯判多为少(只检出一部分离*值)的错误,而不易犯判少为多(错将一部 分非离*的观测值判为离*值)的错误。这两类错误的概率以重复使用偏度一峰度检验法为少(可以证

©版权声明
相关文章