2.2 2 假设检验:二项分布与正态分布(选修2-3).doc
加入VIP免费下载

2.2 2 假设检验:二项分布与正态分布(选修2-3).doc

ID:107230

大小:985.33 KB

页数:33页

时间:2020-08-24

温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天资源网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:403074932
资料简介
第七章 假设检验:二项分布与正态分布 有了概率和概率分布的知识,接下来我们要逐步掌握统计检验的一般步骤。既然按照数 学规则得到的概率都不能用经验方法准确求得,于是,理论概率和经验得到的频率之间肯定 存在某种差别,这就引出了实践检验理论的问题。随机变量的取值状态不同,其概率分布的 形式也就不同。本章我们不仅要引出二项分布和正态分布这两个著名的概率分布,并且要将 它们与抽样调查联系起来,以领会统计检验,并逐步拓宽其应用面。 第一节 二项分布 [来源:www.shulihua.net] 二项分布是从著名的贝努里试验中推导而来。所谓贝努里试验,是指只有两种可能结果 的随机试验。在实际问题中,有许多随机现象只包含两个结果,如男与女,是与非,生与死, 同意与不同意,赞成与反对等等。通常,我们把其中比较关注那个结果称为“成功”,另一个结 果则称为“失败”。每当情况如同贝努里试验,是在相同的条件下重复 n 次,考虑的是“成功”的 概率,且各次试验相互独立,就可利用与二项分布有关的统计检验。虽然许多分布较之二项 分布更实用,但二项分布简单明了,况且其他概率分布的使用和计算逻辑与之相同。所以要 理解统计检验以及它所涉及的许多 新概念,人们几乎都乐意从二项分布的讨论入手。 1.二项分布的数学形式 我们仍从掷硬币的试验人手。假定二 项试验由重复抛掷 n 次硬币组成,已知硬币面朝上(成功)的概率是 p,面朝下(失败)的概 率是 q (显然有 q=1―p)。这样,对试验结果而言,成功的次数(即硬币面朝上的次数)X 是 一个离散型随机变量,它的可能取值是 0,1,2,3,…,n。而对 X 的一个具体取值 x 而言, 根据乘法规则,我们立刻可以就试验结果计算出一种特定排列(先 x 次面朝上,而后 n―x 次面 朝下)实现的概率,即 ppp…pqqq…q=pxqn-x (7.1) 由于正确解决概率问题,光考虑乘法规则是不够的,还要考虑加法规则,于是我们根据 (6.27)式,又可以得到就 x 次成功和(n―x)次失败这个宏观结果而言所包含的所有排列的 方式数,用符号 表示 x nC= (7.2) 这样,我们就得到了二项试验中随机变量 X 的概率分布,即 P(X=x)= pxqn-x (7.3) 譬如,二项试验是将一枚硬币重复做 8 次抛掷,假设这枚硬币是无偏的,即 p=q=0.5, 那么根据(7.3)式,恰好得到 5 次面朝上的概率是 P(5)= p5q8-5= =0.219 同理,我们也可以求出这个二项试验中硬币刚好为 0,1,2,…,8 次面朝上的各种宏观 结果的概率,全部写出来就是表 7.1。注意:当 x 为 0 时,0!=1。此外 = ,掌握 这种对称性,将有助于简化运算。 表 7.1 硬币面朝上数 x[来源:www.shulihua.net] 概率 P(X=x) 0 1 2 3 4 5 6 7 8 1/256= .004 8/256=.031 28/256=.109 56/256=.219 70/256=.274 56/256=.219 28/256=.109 8/256=.031 1/256=.004 合 计 1.000 表 7.1 清楚地显示,做 8 次抛掷一枚硬币的重复试验,我们将得到 9 个可能结果中的一 个。与经验认识不同的是,通过运用概率论,实现的每个可能结果都与一定的概率相联系。 据此,我们可以对各种结果实现的可能性作出估计。其中,试验结果为 4 次成功(即 4 次面朝 上)的可能性最大,而试验结果为全部面朝上(即 8 次面朝上)或全部面朝下(即 0 次面朝上)的可 能性最小,每做 256 次同样的重复试验才可望看到一次。 在这个简单例子中,每回试验硬币仅被重复抛掷了 8 次,也仅能有为数不多的可想象到 的结果。当然,还可以设想做硬币重复抛掷更多次的试验.比如硬币被重复抛掷 100 次,那 么可能实现的结果就会有 101 种。同样运用概率论的知识,我们可以把这些可能结果编组, x nC )!(! xnx n − ! x nC 5 8C !! ! 35 8 5 2 1)( 3 2 1)( x nC xn nC −并把概率和整个一组结果相联系。每当我们把概率与重复试验的每一种可能结果或几组结果 联系起来时,就会得到如表 7.1 所示的概率分布,我们称之为二项分布。 2.二项分布的讨论 (1) 二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下 n 次重复的贝努 里试验时, 随机变量 X 共有 n+1 个取值。二项分布可以用分布律(表 7.2)和折线图(图 7.1)来表示。 表 7.2 X 0 1 2 … n 合计 P p0qn p1qn-1 p2qn-2 … pnq0 =1 (2)二项分布的图形当 p=0.5 时是对称的,当 p≠ 0.5 时是非对称的,而当 n 愈大时非对 称性愈不明显(参见图 7.1)。 (3)二项分布的数学期望 E(X)=μ=np,变异数 D(X)=σ2=npq。 (4)二项分布受成功事件概率 p 和试验次数 n 两个参数变化的影响,只要确定了 p 和 n,成 功次数 x 的概率分布也随之确定。因而,二项分布还可简写作 B(x;n,p)。 (5)二项分布的概率值除了根据公式直接进行计算外,还可查表求得。二项分布表的编制 方法有两种:一种依据概率分布律 P(x)编制(见附表 2);另一种依据分布函数 F(x)编制(见附表 3)。 0 nC 1 nC 2 nC n nC ∑P F(x)=P(X≥x)= (7.4) [例 7.1.1] 某特定社区人口的 10%是少数民族,现随机抽取 6 人,问其中恰好 2 人是 少数民族的概率是多少? [解] 解法一:根据(7.3)式直接计算 P(X=2)= p2q4= =0.0984=9.84% 解法二:根据附表 2 中纵列 n=6 和横行 p=0.1 所对应 x 值,可直接查得 B(x;6, 0.1)的概率值 B (2;6,0.1)=0.0984 解法三:根据附表 3 求得 B (2;6,0.1)=F(2)- F(3 )=0.1143―0.0159=0.0984 [例 7.1.2]求 B (x;8,0.7)的中位数。 [解] 根据附表 3 中纵列 n=8 和横行 p=0.7 所对应的 x 值,可查出大于等于 x 的概率 值。由于附表列示的是二项分布的累计概率,因此求中位数很方便。 Md=5.5 + =5.6747 第二节 统计检验的基本步骤 二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到概率分布是先验的理 论分布这一点很重要,因为我们不禁要问,既然试验或抽样调查的结果仅与随机变量可能取 值中的一个相联系,那么实际试验或样本调查对结果的概率分布及前提假设有没有一个检验 的问题?具体来讲,对于一枚硬币被重复抛掷 8 次的二项试验,经验告诉我们,一共有 9 种 可能的结果,而且实现这些结果的机会是大不相同的。研究者实际上从来不用经验的方法求 得概率分布,因为通常我们只对一项试验进行一次或几次,抽取样本也是一个或至多不过几 个。既然二项分布是按照数学规则得到的,那么对这 9 种结果的可能性我们应该作出何种评 价呢?如果实际抽样得到的结果偏巧就是先验概率预示的最不可能出现的结果,那么我们是认 定纯属巧合,还是开始对用数学或演绎推理方法求得的概率以及理想试验的种种前提假设产 ∑n x pnxB ),;( 2 6C !! ! 42 6 2 10 1 )( 4 10 9 )( 2553.05518.0 5.05518.0 − −生怀疑?更准确地说,在一枚硬币被重复抛掷 8 次的这个二项试验中,究竟出现什么结果时, 我们应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到 4 次成功 4 次失败这个最 大可能性结果就开始怀疑,还是仅当出现 8 次成功或一次也不成功这两个极端情况时才产生 怀疑呢?这就是统计检验的核心问题。 概率分布不是一种研究者从资料中看到的分布,我们讨论它,不是出于对数学的爱好, 而是因为统计推论的有关工作需要它。现在,我们要进入系统讨论统计假设检验的实际步骤 的阶段。所有的统计检验都包含某些特定的步骤,这里先列示如下: (1)建立假设; (2)求抽样分布; (3)选择显著性水平和否定域 (4)计算检验统计量; (5)判定。 应当注意,在统计检验中,概率分布都是与样本的可能结果相联系的,所以已超越了纯 数学范畴。本书至此,开始将概率分布化为抽样分布来具体讨论。所谓抽样分布,就是把具 体概率数值赋予样本每个或每组结果的概率分布。 1.建立假设 统计检验是将抽样结果和抽样分布相对照而作出判断的工作。取得抽样结果,依据描述 性统计的方法就足够了。抽样分布则不然,它无法从资料中得到,非利用概率论不可。而不 对待概括的总体和使用的抽样程序做某种必要的假设,这项工作将无法进行。比如通过掷硬 币的实验得到二项分布,必须假设:①样本是随机的,各次抛掷相互独立;②硬币是无偏的(或 称是诚实的),即 p=q=0.5。概括地说,必须首先就研究总体和抽样方案都做出假设,再加 上概率论,我们就可以对各种可能结果做具体的概率陈述了。 2.求抽样分布 在做了必要的假设之后,我们就能用数学推理过程来求抽样分布了。比如在这一章开头, 在硬币抛掷 n 次的理想实验中,我们计算了成功次数为 x 的宏观结果所具有的概率,得到二项 分布。如果前提假设变动了,还可以求出其他形式的概率分布,如正态分布、泊松分布、卡 方分布等等,它们都有特定的方程式。由于数学上已经取得的成果,实际上统计工作者要做 的这项工作往往并不是真的去求抽样分布的数学形式,而是根据具体需要,确定特定问题的 统计检验应该采用哪种分布的数学用表。 3.选择显著性水平和否定域 有了与问题相关的抽样分布,我们便可以把所有可能的结果分成两类:一类是不大可能 的结果,比如硬币被抛掷 8 次,结果 8 次都面朝上。另一类则相反,我们预料这些结果很可 能发生。既然如此,如果我们在一次实际抽样中得到的结果恰好属于第一类,我们就有理由 对概率分布的前提假设产生怀疑。在统计检验中,这些不大可能的结果称为否定域。如果这 类结果真的发生了,我们将否定假设;反之就不否定假设。 概率分布的具体形式是由假设决定的,假设肯定不止一个。从统计检验的角度来看,所 有假设在逻辑推理中都有相同的地位。如果作为检验用的样本结果真的落在否定域内,那么 可以讲,至少假设中的一个(也可能是全部)是错的。就像在掷硬币的试验中,如果实际结果落 在否定域中,那么我们可以说前提假设有问题。不过,究竟是硬币不诚实还是抽样在程序上 违反了随机原则,我们却无从得知。所以要使检验具有意义,必须把怀疑集中在其中一个假 设上。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号 H0 表示), 并用它和其他备择假设(用符号 H1 表示)相对比。至于我们究竟情愿认为假设中哪一个可能是 错误的,因而应该作为被检验的对象,除了检验本身所提供的知识外,还必须从以往的经验 或其他方面了解更多的东西。在掷硬币的试验中,如果可以确定抽样程序遵循了随机原则, 那么我们就可以认为硬币有偏,并把硬币无偏定为零假设。一旦实际结果是落在否定域,我 们就说 p=0.5 的假设错了。反之,实际结果落在否定域之外,就不允许我们否定零假设。 值得注意的是,假设只能被检验,从来不能加以证明。统计检验可以帮助我们否定一个 假设,却不能帮助我们肯定一个假设。比如硬币抛掷试验的结果没有落在否定域中,我们不 能据此就判定 p=0.5 的假设是对的。因为假若硬币真正面朝上的概率是 0.49 而不是 0.50,则正确的抽样分布和我们所计算的几乎完全相同。如果我们因为不能否定零假设就冒 然地肯定它,就很可能因为用语太绝对而犯错误。所以在统计检验中,一个零假设如果我们 不能否定它,也不能将它作为完全正确的假设而无保留地予以接受,而宁愿采用“不能否定它” 的陈述。 为了使检验更严格、更科学,还需要更多的东西。首先,我们必须确定甘冒犯第一类和 第二类错误的风险的程度;其次,要确定否定域是否要包含抽样分布的两端。 第一类错误是,零假设 H0 实际上是正确的,却被否定了。第二类错误则是,H0 实际上是 错的,却没有被否定。例如,若抛硬币试验的否定域由 0 次或 8 次面朝上两种情况组成,每 当实际试验出现这两个结果之一时,假设就被否定了。与此同时,我们就有了犯第一类错误 的危险。因为,既使 p=0.5 的假设是正确的,正如表 7.1 表明的那样,这样的实验每做 256次,毕竟还有出现全部面朝上和全部面朝下各一次的机会。假如抽样我们得到的偏巧就是这 样一种极端结果,并据此否定了 p=0.5,那么我们就犯了第一类错误。相反,假如检验中我 们得到 的结果是 3 次面朝上 5 次面朝下,由于这个结果不在否定域内,我们不否定 p=0.5, 则有了犯第二类错误的危险。因为如果 p=0.49,而不是 0.5,我们也很可能得到相同的结 果。换句话说,由于 p=0.5 的假设实际上是错误的,却没有被否定, 我们犯了第二类错误。 遗憾的是,不管我们如何选择否定域,都不可能完全避 免第一类错误和第二类错误,也 不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验而言,第一类错误的危 险越小,第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的 概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。对上述 掷硬币的试验,假如决定当得到试验结果是 0 次、1 次、7 次或 8 次面朝上就否定零假设(H0), 那么犯第一类错误的概率将是(1+1+8+8)/256=7%。 由于犯第一类错误的危险和犯第二类错误的危险呈相背趋向,所以统计检验时,我们必 须事先在甘冒多大第一类错误的风险和多大第二类错误的风险之间作出权衡。被我们事先选 定的可以犯第一类错误的概率,叫做检验的显著性水 平(用 α 表示),它决定了否定域的大小。 如果抽样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和显 著性水平的要求一致起来(后面的正态检验就如此)。如果抽样分布是非连续的,就要用累计 概率的方法找出一组构成否定域的结果。即在已知概率分布表上,从两端可能性最小的概率 开始向中心累计,直至概率之和略小于选定的显著性水平为止。例如对硬币重复抛掷 8 次的 试验,我们选用 0.20 的显著性水平,从表 7.1 开列的概率分布,可以确定否定域由 0,l, 7 或 8 次面朝上这四种结果组成。每当检验的结果出现这四种情况之一,我们就否定零假设。 在掷硬币的试验中,我们可能怀疑这枚硬币是不诚实的,但却不知道它究竟偏于面朝上 还是面朝下。在这种情况下,为了稳妥起见,就要考虑抽样分布的两端。但在许多场合,我 们能预测偏差的方向,或只对一个方向的偏差感兴趣。每当方向能被预测的时候,在同样显 著性水平的条件下,单侧检验比双侧检验更合适。因为否定域被集中到抽样分布更合适的一 侧,可以得到一个比较大的尾端。这样做,可以在犯第一类错误的危险不变的情况下,减少 了犯第二类错误的危险。譬如,我们预测方向 p>0.5,即怀疑这枚硬币有面朝上的偏向,那 么在同样 0.20 的显著性水平的情况下,单侧检验的否定域将变为由 6,7,8 次面朝上这三 种结果组成。原来双侧检验,出现 6 次面朝上这种结果将不否定零假设。现在改用单侧检验, 出现这种结果就得否定零假设了。这样,犯第一类错误的概率不变(因显著性水平仍是 0.20), 但犯第二类错误的概率则显然降低了不少。 4.计算检验统计量 完成了上述工作之后,接下来就是做一次与理想试验尽量相同的实际抽样(比如实际做一 次重复抛掷硬币的试验),并从获取的样本资料算出检验统计量。检验统计量是关于样本的一 个综合指标,但与我们后面参数估计中将要讨论的统计量有所不同,它不用作估测,而只用 作检验。在二项检验中,检验统计量就是 n 次抛掷后成功次数 x。x 如果是构成否定域的那些 结果之一,我们就要否定零假设;反之,就不否定零假设。 计算检验统计量总是必要的。不过在二项检验中,得到 x 是如此简单,以至于谈不上要去 计算,只要从样本资料中点算“成功”的次数就可以了。不过,在后面的正态检验中,通过计算 Z 分数,我们便会真正体会到计算检验统计量的必要性了。 5.判定 假设检验系指拒绝或保留零假设的判断,又称显著性检定。在选择否定域并计算检验统 计量之后,我们完成最后一道手续,即根据试验或样本结果决定假设的取与舍。如果结果落 在否定域内,我们将在已知犯第一类错误概率的条件下,否定零假设。反之,如果结果落在 否定域外,则不否定零假设,与此同时,我们就有了犯第二类错误的危险。 [例 7.2.1] 若想通过抛掷 10 次硬币的实验来检验这个硬币无偏的零假设,选用双侧检 验及 0.10 显著性水平,请指出否定域。如单侧检验(p<0.5)又 将如何? [解] P(0) + P(1) + P(9) + P(10) =2×( + )=0.022<0.10 P(0) + P(1) + P(2) + P(8) + P(9) + P(10) =2×( + + )=0.110>0.10 所以双侧检验时,否定域为 0,1,9,10 次面朝上。 P(0) + P(1) + P(2) = + + =0.055<0.10 P(0) + P(1) + P(2) + P(3) = + + + =0.172>0.10 所以单侧检验时,否定域为 0,1,2 次面朝上。 1024 1 1024 10 1024 1 1024 10 1024 45 1024 1 1024 10 1024 45 1024 1 1024 10 1024 45 1024 120 [例 7.2.2] 某选区有选民 10000 人,其中属于文教系统的有 4000 人,要产生代表 6 名。假定各系统选民都有同等机会当选代表,求:①代表是文教系统人员的概率分布;②在 6 名代表中最可能是文教系统人员占几名;③如果 6 名代表中实际有 4 名是文教育系统的人 员,可以否定随机性的零假设吗?(选用 0.05 显著性水平,单侧检验,预测方向 p>0.4) [解] ①既然各系统选民都有相同的当选机会,那么 p= =0.4。按(7.3)式求代 表中有 x 名是文教系统人员的抽样分布,如表 7.3 所示。 表 7.3 x P 0 1 2 3 4 5 6 1·729/15625= 0.047 6·486/15625=0.187 15·324/15625=0.311 20·216/15625=0.276 15·144/15625=0.138 6·96/15625=0.037 1·64/15625=0.004 合 计 1.000 ②由表 7.3 可见,在满足随机性假设条件下,在 6 名代表中最可能有文教系统的人员 2 名。 ③由表 7.3 可见 P(5) + P(6)=0.041<0.05 P (4) + P(5) + P(6)=0.179>0.05 所以,否定域由 x 等于 5 或 6 组成。而在 6 名代表中实际有文教系统人员 4 名,故不能否 定随机性的零假设。 此例是成功的概率 p 已知的情况,这样在随机性的零假设下,就可以用二项分布做非随 机性检验了。 [例 7.2.3] 在一项研究中,研究人员试图证明如下假设:一个有犯罪倾向的少年 如果 能经常得到一个成人热忱友好的忠告,他就可能避免犯罪。为此,研究人员在孩子们中取 14 组,进行控制组和实验组的对照研究。试问,怎样用二项分布做“试验无效”的检验。 [解] 先将 14 个组两两匹配,得到七配对组(要使每个配对组在除实验变量之外的其他 方面尽量相似)。然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。接着, 10000 4000在 4—8 年的时间内,让分到实验组的七组孩子接受成人一对一的忠告,而控制组的七组孩子 没有这样做。而后对每个配对组分别进行后侧度量,并用“+”号表示实验组比控制组好的那些 配对组,用“―”号表示实验组比控制组差的那些配对组。除非度量方法很粗糙,每配对组应该 都能判断出差异。这样便可以用二项分布做“试验无效”的检验了(参见本章第一节)。 零假设 H0:p=0.5(即“试验无效”) 备择假设 H1:p>0.5 选用 0.10 的显著性水平,根据附表 3 中纵列 n=7 和横行 p=0.5 所对应的 x 值,可查 得 P(6) + P(7)=0.0625<0.10 P(5) + P(6) + P (7)=0.2266>0.10 所以否定域由 6 个“+”和 7 个“+”组成。即对每配对组进行后测度量,如出现 6 个“+”或 7 个“+”时,在 0.10 的显著性水平上,我们将否定零假设,说明试验有效。否则就不能否定零 假设,也就是说关于成年人忠告有助于减少少年犯罪的观点不能得到实验结果的支持。 第三节 正态分布 如果说二项分布是离散型随机变量最具典型意义的概率分布,那么连续型随机变量最具 典型意义的概率分布就是正态分布了。实践中常见的一类连续型随机变量,多数服从或近似 服从正态分布。例如测量误差、智商以及人体的身高体重、运动员的成绩等等,都可以用正 态分布进行描述。一般地讲,若影响某一变量的随机因素很多,而每个因素所起的作用不太 大且相互独立,则这个变量服从正态分布。更为重要的是,正态分布还是抽样理论和统计推 断的基础。例如,不论总体是否服从正态分布,只要样本容量 n 足够大,样本平均数的抽样 分布就趋于正态分布。 正态分布的研究始于 18 世纪,是最重要的概率分布,这是因为:①许多自然现象与社会 现象,都可用正态分布加以叙述;②不少离散型随机变量与连续型随机变量的概率分布都以 正态分布为其极限(即当样本相当大时,可用正态近似法解决这些概率分布的问题);③许多 统计量的抽样分布呈正态分布,故在参数估计与假设检验上经常以正态分布为理论基础。 1.正态分布的数学形式 自本书第三章引出变量数列,我们便可以列举出不少总体的分布很接近于正态分布,例 如男性的身高。如果我们拥有的数据非常多,在编制变量数列时我们就可以把组分得很细,并得到组距很小的直方图。现在想象,如果组越分越细,并且纵轴采用频率密度(= ), 直方图最终就转化为的概率密度曲线 (X=x) (参见图 7.2)。很显然,从图 7.2 可以看出, 这样的平滑曲线如“钟型”,它具有单峰、对称这两个特点,并且曲线向左、向右延伸,以横轴 为渐近线。 上述实例,对于我们领会正态分布是很有启发性的。根据经验总结和理论分析可知,正 态分布的概率密度表达为如下形式 (X=x)= (7.5) 式中 π 和 e 都是常数,分别近似等于 3.14 和 2.72。 从正态分布的数学表达式可以看出,当总体均值 μ 和方差 σ2 确定后,正态分布曲线的精 确形式也就确定了。换句话说,有许多不同的正态曲线,每一个对应于 μ 和 σ 的一个组合。 分析正态分布的概率密度 (X=x),很容易理解正态曲线具有下列性质: (1)正态曲线以 X=μ 呈钟形对称,其均值、中位数和众数三者必定相等。 组距 频率 ϕ ϕ πσ2 1 2 2 2 )( ο µ−− X e ϕ (2) (X=x)在 X=μ 处取极大值。X 离 μ 越远, (X=x)值越小。这表明对于同样长度的 区间,当区间离 μ 越远,X 落在这个区间的概率越小。正态曲线以 X 铀为渐近线,即 (X=x) 在| X |无限增大时趋于零,即 (x)=0 或 ( x)=0。 (3)对于固定的 σ 值,不同均值 μ 的正态曲线的外形完全相同,差别只在于曲线在横轴方 向上整体平移了一个位置(参见图 7.3)。 (4)对于固定的 μ 值,改变 σ 值,σ 值越小,正态曲线越陡峭;σ 值越大,正态曲线越低平 (参见图 7.4)。 (5)正态分布的数学期望 E(X)=μ,变异数 D(X)=σ2,因为 E(X)= =μ D(X)= =σ2 正态曲线的性质可供阐明标准差。由于曲线的形状完全取决于标准差 σ,所以 σ 可供作为 衡量总体分布状况的一个统一的尺度,称为标准差。从直观上去理解,σ 实际上是一个很好的 离势的量度: σ 值越小,离中趋势越小,总体中各变量值也就越接近;;σ 值越大,离中趋势越 大,总体中各变量值也就越分散。 ϕ ϕ ϕ −∞→x lim ϕ +∞→x lim ϕ ∫ +∞ ∞− dxxx )(ϕ ∫ +∞ ∞− − dxxx )][ 2 (ϕµ 2.标准正态分布 我们在统计分析时,经常性的重要工作是要确定给定区间所含总体单位数的比重,也就 是变量 X 的取值在这个给定区间内出现的频率。因此在对有限总体的数据进行分组时,得到 相对频数分布是很重要的。对于连续变量,过去由于分组有限,只能加以近似地讨论。现在, 由于正态曲线的一些异乎寻常的数学性质,使得这项工作非但不困难,反而变得简单易行。 一般作法是引入新的随机变量 Z[参见(5.12)式] Z= (7.6) 上式表明,Z 代表以标准差 σ 为单位表示的变量值离开均值 μ 的偏差,即代表经 σ 标准化 之后的 X 对 μ 的离差。故 Z 经常被称为变量 X 的标准分,或称 Z 分数;Z 亦被称为标准正态 变量。 如果把 Z 代入(7.5)式,我们便得到了用 Z 分数表达的标准正态分布,其概率密度为 (Z)= (7.7) 比较(7.5)和(7.7)式,很容易得知标准正态变量的数学期望 E(Z)=0,变异数(即方差)D(Z) =1。实际上,标准正态分布 (Z)只是正态分布的一个特例,即 μ=0,σ2=1 的正态分布,简 记作 N(0,1)。对于一般正态分布则简记为 N(μ,σ2)。 3.正态曲线下的面积 我们在第三章学习过频数(或频率)分布图,从中我们体会到,用几何图形表示统计资料的 好处在于,直观地从图形的升降起伏就可以看出总体的分布特征和规律性。具体来说,矩形 的高度(更确切地说是矩形的面积)是和相应区间里所含的总体单位数成正比的。如果取各 σ µ−X ϕ π2 1 2 2Z e − ϕ矩形的总面积为 1,一定区间图形所含的面积就等于变量的取值在该区间出现的频率。现在组 距不断变小,直方图过渡到了平滑曲线,但基本原理并没有变。 和频率分布的直方图一样,正态曲线下的总面积也为 1。从直方图中选取任一个矩形,如 图 7.5 所示,平滑曲线多包含的那一部分面积等于被曲线切去一角的那一部分矩形的面积, 增减相当。而作为频率分布的极限,正态曲线下的面积可设想是组距趋于 0 而矩形无限增多 时所有矩形面积的总和。在频数分布直方图中,所有矩形的总面积为 1,所以正态曲线下的面 积当然也是 l。 正态分布是最具典型意义的连续型随机变量的概率分布。上一章已经说明,对于连续型 随机变量,由于 X=x 的取值充满一个区间,不能一一列出,因此只能关心 X 的取值落在一个 区间的概率。现在既然有了正态分布的概率密度(7.5)式,随机变量 X 的取值在某区间{x1≤X≤x2} 上的概率便可用下式求得 P(x1≤X≤x2 )= 但积分毕竟太麻烦了,更何况许多人对积分运算不熟悉,为此须计算出现成的数值表供 使用者查找。由于正态曲线的优良性质,这项工作可以卓有成效地完成:①经过 X 的标准分 Z = ,可以将任何正态分布 N(μ,σ2)转换成标准正态分布 N(0,1);②运用分布函数的定 义,并利用正态曲线的对称性,通过下式(分布函数)可以计算编制出正态分布表(见附表 4)。 F(Zα)=P(0≤Z≤Zα)= (7.8) 采用标准正态变量表达正态分布,使标准差得到了进一步阐明。我们看到,标准差是计 算总体单位分布及其标志值变异范围的主要依据,图 7.6 说明了这一点。 ∫2 1 ) x x dxx(ϕ σ µ−X ∫α ϕ Z dZZ 0 )( 如果从总体均值向右一个标准差定出一区间,则在这个区间正态曲线下方所包含的面积 为 0.3413。因此这个面积的两倍,X 的取值有 68.26%包含在均值两侧各一个标准差的范围 之内。换言之,略多于 2/3 的总体单位出现在总体均值两边的一个标准差的范围之内。同样, 在均值与距它两个标准差的区间内,正态曲线下方所含面积是 0.4773。因此略多于 95%的总 体单位包含在均值两边的两个标准差的范围之内。虽然理论上正态曲线向两边可扩展至无限 远,但几乎所有总体单位(99.73%)都位于均值两边的三个标准差的范围之内。 总之,决定任意两点间的面积都完全是可能的。比如向均值两侧移 1.96 个标准差,曲 线下方便包含了大约 95%的面积,如移动 2.58 个标准差,则面积几乎是 99%。附录 4 已编 制了关于 Z 和标准正态曲线所含面积之间关系的精确数值表,即 Z 从 0 到+∞变化,相应区间 所含的面积从 0 变至 0.5。这种处理具有重要的实用价值,以后只要知道分布是正态的,有 关计算只要查表就成了。 [例 7.3.1] 设随机变量 X 服从正态分布 N(50.102),试求 P(50 ≤X≤65)。 [解] 已知 μ=50,σ=10,Z1=0 Z2= = =1.5 查表得正态曲线在此区间的面积是 0.4332(参见图 7,7)。所以,P(50 ≤X≤65)= 43.32%。 σ µ−2x 10 5065−[来源:数理化网] [例 7.3.2] 设随机变量 X 服从正态分布 N(168,122),试求 P(X≤143)。 [解] 已知 μ=168,σ=12, Zα= = =―2.08 Z 是负值,表示 X 的取值处于均值左边。由于曲线完全对称,所以使用正态分布表时可以 忽略 Zα 的正负号。查表可知,正态曲线在均值与 Zα=2.08 之间所含的面积是 0.4812。由于 总面积的一半是 0.5,因此 P(X≤143)可以由下面计算求得 P(X≤143)=0.5―P(0≤Z≤2.08) =0.5―0.4812 =1.88% 这说明,X 的取值小于或等于 143 的概率大约是 2%。由于即将讨论的正态检验几乎都要 涉及概率分布的尾端,所以此例说明的是一个非常普遍的问题(参见图 7.8)。 [例 7.3.3] 设随机变量 X 服从正态分布 N(60,82),试求:①第一四分位数的标志值; ②第一四分位数和标志值为 50 的取值之间正态曲线所含的面积(参见图 7.9)。 [解] 先根据四分位数的定义,通过正态曲线左边尾端面积为 0.25,查表求出四分位数 Q1 对应的 Z 分数 σ µ−X 10 168143− Zα=0.67= Q1=μ―Zασ=60―0.67×8=54.64 由此可见,第一四分位数的标志值是 54.64。 再求标志值为 50 的 Z 分数 Zα= =1.25 查表得 Zα=1.25 和均值之间正态曲线所含的面积是 0.3944。所以 P(50 ≤X≤Q1)=0.3944―0.25=0.1444 这说明,X 的取值在第一四分位数 Q1 和 50 之间的概率是 14.44%。 [来源:www.shulihua.net] 4.二项分布的正态近似法 二项分布是在所谓的重复独立试验之中产生的。通过本章第一节的讨论,我们已经知道 二项分布受成功事件概率 p 和试验次数 n 两个参数的影响,只要确定了 p 和 n,二项分布也随 之确定了。 但是,二项分布的应用价值实际上受到了 n 的很大限制。也就是说,只有当 n 较小时, 我们才能比较方便地利用(7.3)式计算二项分布。所幸的是,二项分布是以正态分布为极限的。 所以当 n 很大时,只要 p 或 q 不近于零,我们就可以用正态近似来解决二项分布的计算问题, 即 =P(Z1≤Z≤Z2)= d z (7.9) 又 Zα= (7.10) σ µ || 1 −Q 8 |6050| − )(lim bxaP n ≤≤ ∞→ π2 1 ∫2 1 Z Z 2 2Z e − npq npx −式中:Z 为标准正态随机变量,n 为重复试验的次数,p 为成功的概率,q=1―p 为失败 的概率,x 为二项随机变量。 [例 7.3.4] 在抛掷一枚硬币 10 次的二项试验中,试以二项分布与二项分布的正态近似 法,求成功 3 到 6 次的概率。 [解 1] 已知 p=0.5,n=10,查附表 3 得 P(3≤x≤6)= (x;10,0.5)=0.9453―0.1719=0.7734 [解 2] 用二项分布的正态近似法 μ=np=10×0.5=5 σ= = =1.58 Z2= = =- 1.58 Z2= = =0.95 查表得 P(Z1≤Z≤Z2)=P(―1.58≤Z≤0.95) =0.4430 十 0.3289 =0.77l 9 由正态近似法求得的概率为 0.7719,这一数值十分接近由二项分布算得的 0.7734。 简言之,二项分布的正态近似法,即以 n p=μ、n p q=σ2,将 B(x;n,p)视为 N(n p,n p q)进行计算。在社会统计中,当样本量 n ≥30,n p、n q 均不小于 5 时,对二项分布作正态近 似是可靠的。 [例 11.3.5] 铁路部门预计对号车票的旅客中有 5%赶不上该列车,该列车有座位 600 个,但却售出了 620 张票,试求每位旅客都有座位之概率。 [解] 设“赶不上火车”为成功事件,则随机变量“赶不上火车的人数”可看成服从二项分布。 因 n=620 大于 30,n p=620×0.05=31,n q=620×0.95=589,所以可对二项分布作正态近 似。现 μ=n p=31,σ2=n p q=620×0.05×0.95=29.45。列车有 600 座位却售出了 620 张 车票,故每位旅客都有座位的概率是 P(x>20),于是有 Zα= = =―2.03 查表得 P(x>20)=P(Z>―2.03) ∑ = 6 3x B npq 5.05.010 ×× σ µ−1x 58.1 55.2 − σ µ−2x 58.1 55.6 − npq npx − 95.005.0620 3120 ×× − =0.4788 十 0.5 =97.88% 所以,每位旅客都有座位的概率为 97.88%。 [例 11.3.6] 共有 5000 个同龄人参加人寿保险,设年死亡率为 0.1%。参加保险的人 在年初应交纳保险费 10 元,死亡时家属可领 2000 元。求保险公司一年从这些保险的人中, 获利不少于 30000 元的概率。 [解] 据题意,保险公司一年内若获利不少于 30000 元,最多理赔人数为 x= =10(人) 现因 n=5000 大于 30,n p=5000×0.001=5,所以二项分布可用正态分布近似法处理。 于是有 Zα= = =2.237 查表得 P(x≤10)=P(Z≤2.237) =0.4875 十 0.5 =98.75% 所以保险公司一年内从这些保险的人中获利不少于 30000 元的概率为 98.75%。 第四节 中心极限定理 在各种分布中,正态分布居于首要地位。这不仅因为许多总体分布具有正态分布的特征, 更为重要的是,无论总体服从什么分布,其样本均值的概率分布都随着样本量的增加而呈正 态分布。这一节我们将着重讨论抽样分布与中心极限定理,后者是全部统计推断理论中最重 要的定理。在推论统计中,作为研究对象的总体,其分布总是未知的。中心极限定理对大样 本均值正态分布性质的揭示,为未知总体的研究奠定了理论基础。 1.抽样分布 在本章第二节,我们已经引入了抽样分布的概念。为什么要讨论抽样分布?这是因为一旦 统计的学习进入到推论统计,我们就必须同时与三种不同的分布概念打交道,即总体分布、 样本分布、抽样分布。为了不产生混淆,视分布不同,将统计指标的符号加以区别是完全必 2000 30000105000 −× npq npx − 999.001.05000 510 ×× −要的。对那些反映标志值集中趋势和离中趋势的综合指标,尤其对均值和标准差(或方差),现 在我们应该注意鉴别它们在具体场合哪些是概括总体特征的,哪些是概括样本特征的,哪些 是概括抽样分布特征的。为此列表如下: 表 7.4 均值 标准差 总体分布 样本分布 抽样分布 μ μ σ S 已知一总体分布,可求得它的特征值。根据总体分布计算的特征值,即根据总体各个单 位标志值计算的统计指标,在推论统计中称为总体参数。总体均值和总体标准差(或方差)是反 映总体分布特征最重要的两个总体参数,习惯上分别记作 μ 和 σ(或 σ2)。 同理,已知一样本分布.可求得它的特征值。根据样本分布计算特征值,即根据样本各 个单位标志值计算的统计指标,在推论统计中称为统计量。样本均值和样本标准差(或方差)是 反映样本分布特征最重要的两个统计量,习惯上分别记作 和 S(或 S 2)。 将总体均值、总体标准差与样本均值、样本标准差加以区别是很必要的。因为总体参数 和统计量之间存在着重要差别。参数是有关总体的固定值,一般都是未知的。例如,在任何 给定的时间,某学校学生平均年龄这样的参数一般是未知的,因为如果参数已知就用不着抽 取样本了。但参数如果能得知,那么对所有观察者来讲都必定相同。因此 μ 和 σ 都应该是唯一 确定的值。而统计量则不然。任何统计总体,由于样本容量 n 小于总体容量 N,可能被重复抽 取的样本就不止一个(也可以说可以抽取许许多多乃至无数个样本)。在一总体中,当从一个样 本换为另一个样本,统计量很可能不同。例如从学生总体中随机地抽取 10 个学生组成样本, 我们就不能期望样本不同也可以得到精确相同的年龄均值。所以,统计量必定是随机变量。 另一方面,与参数不同,对于一个特定的样本而言,统计量是可以计算出来的,这便是抽样 调查的价值所在。不过,一个特定的样本对总体的实际代表程度如何,则是另一回事。 由于统计量是随机变量,并且在一个统计总体中可以重复抽取的样本在理论上是无数的, 所以可以用概率分布来进行描述。 在推论统计中,理论和实际的一个重要结合就是通过抽样分布和抽样调查这两者的联系 来实现的。首先,抽样调查是从总体中随机地抽取样本,然后借助样本指标数值来推算总体 X nX /σσ = X指标数值。只有遵从随机原则,样本分布才接近于总体分布,进而表现样本分布的特征值才 对反映总体分布的特征有较大的代表性。与此同时,只有遵从随机原则,尽可能减少非抽样 误差,样本调查的结果才能在假设检验中作为有效的检验统计量。 其次,抽样调查只涉及总体的部分单位,因此哪怕随机样本是有保障的,样本的统计量 与总体参数之间也存在一定的差别。对于用样本指标代表总体指标而不可避免存在着的误差, 除了运用数理统计的方法得到抽样分布,样本本身不能告诉些什么。这样,本书在引出总体 分布、样本分布的概念之后,又引出了抽样分布的概念。需要再次提醒大家,抽样分布是运 用数理统计的方法,把具体概率赋予样本的所有可能结果的一种理论分布。但有了抽样分布 对概率分布的具体化,研究者便找到了一种理论与实际相联系的有效途径。 2.中心极限定理 我们知道,概率论中用来阐明大量随机现象平均结果的稳定性的定理,是著名的大数定 理。其具体内容是:频率稳定于概率,平均值稳定于期望值。但是,大量随机现象的稳定性 不仅表现在平均结果上,同时也表现在分布上,这就是中心极限定理所要阐明的内容。仔细 考虑统计量和与之相对应的未知参数的接近程度,引出了研究和应用抽样分布的课题。显然, 推论统计需要有一座能够架通抽样调查和抽样分布的桥梁。中心极限定理告诉我们:如果从 任何一个具有均值 μ 和方差 σ2 的总体(可以具有任何形式)中重复抽取容量为 n 的随机样本,那 么当 n 变得很大时,样本均值 的抽样分布接近正态,并具有均值 μ 和方差 。 通过上一节,我们已对正态分布留下了深刻印象。不过,在现实世界里,像身高、体重、 婚龄、智商等等近似服从于正态分布的总体其实是相当有限的。幸运的是,中心极限定理大 大放宽了对正态总体的前提要求。它指出,无论总体的分布多么异常,只要 n 足够大,我们 可以相信得到的样本均值的抽样分布近似于正态分布。正如二项检验那样,因为在显著性检 验中使用的是抽样分布,而不是总体分布。这就意味着,只要 n 足够大,我们就完全不必顾 忌总体是不是正态,尽可以在检验中使用正态曲线。而正态曲线具有特别的数学性质,使用 它是很方便的。 无疑,中心极限定理大大拓展了正态分布的适用面,同时我们得到了以下重要信息: (1)虽然样本的均值可能和总体均值有差别,但我们可期望这些 将聚集在 μ 的周围。因 此均值抽样分布的算术平均数能和总体的均值很好地重合,这就是为什么在表 7.4 中总体均 值和抽样分布的均值用同一个 μ 表示的缘故。 X n 2σ X(2) 由于抽样分布的标准差要比总体标准差小,并且 = ,所以如图 7.10 所示, 样本容量越 大,抽样分布的峰态愈陡峭,由样本结果来推断总体参数的可靠性也随之提高。 这是与我们的常识相一致的。在无偏的前提下,在估计总体均值时,较之用小样本,我 们更相信大样本。而定理比常识高明之处在于,它指出,如果 n 增加了一定的数量,那么可 靠性将随之提高到什么程度。例如,为了把抽样分布的标准差缩小一半,就要把 n 扩大 4 倍。 在后面学习的统计推论中,我们一般是用样本均值作为总体均值的估计量的。早在本书 第二章我们就已经知道,在遵守随机原则的条件下,用样本指标值代表总体指标值不可避免 地存在着抽样误差。统计推论不能从样本资料算出统计量就完事了,还必须进行误差分析。 从直观的意义上去理解,抽样误差应该是指某一次抽样结果所得的样本统计量与总体参数之 间的差别。但事实上,这一差别无从得知。因为,如果知道了总体参数,也就不需要抽样了。 具体某一次抽样结果的误差,仅仅是反复抽样下一系列抽样结果可能出现的误差中的一个, 它亦是随机变量,显然不能用来概括一系列抽样可能产生的抽样误差。而抽样分布的标准差 可以综合地反映了样本均值在总体均值附近的变异程度,因此我们用它来概括一系列抽样 可能产生的误差,并把它称为抽样平均误差。后面我们将看到,利用抽样分布计算 ,在统 计推断与估计的误差分析中也具有重要意义(抽样平均误差将在第九章较系统地加以讨论)。 为了理解中心极限定理的正确性,最好的方法是从一个已知均值和标准差的总体中抽取 一些样本,计算样本均值,并把这些均值一一在图上标出,看抽样分布是不是正态 ,同时找 X σ n σ X σ X σ出这些均值的标准差,再把它与 做比较。但是,为什么在总体分布不是正态的时候,其 抽样分布却很可能会是正态呢?下面我们来看在一个男女人数相等的性别总体中,当抽取的样 本越来越大时将会发生些什么? 描述这个该总体只要分两组、用两个标志值就可以了,因此其分布显然不可能是正态的。 为了简单起见,用 X=1 表示男性,X=0 表示女性。并且,因为男女人数相等,所以相对频数 都是 1/2,计算后知总体均值 μ 也等于 1/2,图 7.11 表示了这种十分简单的分布。当然,严 格来讲分布是离散的,而不是图中画的那样是连续的。 现在我们从这个总体抽取随机样本,看样本均值的分布怎样随其容量 n 起变化。先抽 2 人,井计算样本均值的抽样分布。很显然,如果对抽到的人加以区分,能得到四种结果:两 人都是男性,标志值和最大(为 2);两人都是女性,标志值和最小(为 0);男性女性各一人则会 有两种情况。四种结果的标志值可分别显示为(1,1),(0,0),(1,0),(0,1)。求样本均值的 方法很简单,只要按(4.1)式把标志值加起来除以 2。样本均值的抽样分布可按古典法直接算 出,也可以由(7.3)式算出。样本均值的概率分布分别见表 7.5 和图 7.12。 表 7.5 (均值) P(概率) 0 1 2 0 1/2 1 1/4 1/2 1/4 n σ ∑ X X然后抽取容量为 4 人的随机样本,样本均值的分布如表 7.6 所示。除均值和其概率的计 算稍许复杂一点外,计算方法和 n=2 的样本完全一样,绘成图 7.13。 表 7.6 (均值) P(概率) 0 1 2 3 4 0 1/4 1/2 3/4 1 1/16 4/16 6/16 4/16 1/16 ∑ X X再取样本容量为 8 人,样本均值抽样分布如表 7.7 所示,绘成图便是图 7.14。 表 7.7 (均值) P(概率) 0 1 2 3 4 5 6 7 8 0 1/8 2/8 3/8 1/2 5/8 6/8 7/8 1 1/256 8/256 28/256 56/256 70/256 56/256 28/256 8/256 1/256 ∑ X X 至图 7.14,样本均值的抽样分布已经开始接近正态曲线了,尽管这时样本容量还不过是 8。这就从直观上说明了为什么当容量 n 越来越大时,样本均值的抽样分布会逼近正态曲线, 而总体分布怎样是无关紧要的。 那么究竟 n 多大时,才可以放宽总体是正态的限制而放心使用中心极限定理呢?这个问题 尚无简单的答案,因为它还与下列问题有关: ①估计第一类错误所要求的精度;②总体接近 正态的程度(虽然总体分布是与抽样分布含义不同的分布,但正态总体的抽样分布要比非正 态总体的抽样分布更容易接近正态)。一般我们采用经验定则:如果 n>100,正态总体的限制 总是可以放宽;如果 n>50,同时经验表明总体分布与正态分布的差异不大时,可以放心使用 中心极限定理;如果 n≤30,就应该避免使用该定理。 统计检验应用正态分布和二项分布有两点区别:①抽样分布在这里是连续的而非离散的, 否定域的大小可以和显著性水平的要求精确地一致起来。②计算检验统计量不再像在应用二 项分布时那样,可以不劳而获了。很显然,为了能使用现成的正态分布表,关键是要从样本 资料中计算出在 N(0,1)形式下的统计量 Z,再根据 Z 是否落在否定城内而对被检验假设的取 舍作出决定。 在上一节(7.6)式,我们曾引出 Z= 。Z 的这种形式适用于 N(μ,σ2)的总体,但 并不适用于取正态的抽样分布。正如我们反复强调的那样,统计检验单纯依靠样本自身是得 不出结果的,必须首先在一系列假设的基础上求出抽样分布。如果这些假设实际上正确,那 么抽样分布将告诉我们得到一个给定的 的可能性是多少。在抽样分布中,随机变量的取值 σ µ−X X是每个 ,均值是 μ,标准差是 = 。因此 Z 如果作为检验统计量,应该用 替换 X, 用 替换 σ,μ 不动,因而有 Z= (7.11) 第五节 总体均值和成数的单样本检验 现在我们来看中心极限定理在统计检验中的应用。虽然不必每一次都明写出来,但本章 第二节论述的检验程序的每一步都不能缺少。把从样本调查中得到的检验统计量与假设的总 体均值作比较,我们很快发现了正态分布的重要的实用价值。 1.σ 已知,对总体均值的检验 例如,一位研究者试图检验某一社会调查(如家庭收入调查)所运用的抽样程序,该项调查 是由一些缺乏经验的采访员进行的,研究者怀疑属于干部和知识分子的家庭抽得过多。过去 的统计资料表明,这一街区的家庭的平均年收入是 24500 元,标准差是 3000 元。这次调查共 随机抽选了 l00 个家庭,样本的家庭平均年收入是 25300 元。该研究人员是否有理由怀疑该样 本有偏估(选用 α=0.05)。 研究者主要由于采访者缺乏经验而对随机样本这一点不放心,因此随机抽样就是待检验 的零假设。因为样本容量为 100,可以运用中心极限定理。于是求抽样分布,在这里变为去查 正态分布表。在统计检验中,我们多半使用一些现成的数值表。应该明白,这些数值表是用 概率论计算出来的,使用它们实际上就是在使用抽样分布。 根据题意,显著性水平为 0.05,并由于研究者怀疑抽样调查对中上收入家庭做了较多的 抽取,所以用单侧检验。查正态分布表得知,离均值 1.65 标准差以外的正态曲线的面积是 全部面积的 5%,这就是否定域(图 7.15 中的阴影部分)。所以,只要样本均值大于 μ 的量超 过 1.65 个标准差时,便否定零假设。 X X σ n σ X X σ n X /σ µ− 题目实际已给出下列量: =24500 元,μ=25300 元,σ=3000 元,n=I00,根据(7.11) 式计算检验统计量有 Z= = =2.67 >1.65 检验统计量 Z 的计算表明,样本均值比总体均值大 2.67 个标准差( ),超过了显著 性水平规定的临界值,调查者应该否定“随机抽样”的零假设。也就是说,由于抽样在程序上不 合要求,这项社会调查有必要重新组织。 中心极跟定理实际解决了大样本均值的检验问题。假定样本比较大(n>50,这在社会调查 中一般都能得到满足),样本均值的抽样分布就与总体分布无关,而服从正态分布。当 H0 成立 时,样本均值 的观察值比较集中地分布在总体均值 μ 周围;当 H0 不成立时, 对 μ 有明 显偏离的趋势。因而,我们可以在选定的显著性水平上,通过计算检验统计量 Z,对零假设进 行检定。 [例 7.5.1] 某单位统计报表显示,人均月收入为 2330 元,为了验证该统计报表的正确 性,作了共 81 人的抽样调查,样本人均月收入为 2350 元,标准差为 75 元,问能否说明该统 计报表显示的人均收入的数字有误(取显著性水平 α=0.05)。 [解] 根据题 意,可作如下的假设 H0:μ=2330 元 H1:μ≠2330 元 因 α=0.05,查正态分布表得 Zα/2=1.96,故否定域为|Z|≥1.96 根据(7.11)式计算检验统计量 Z= ≈ X n X /σ µ− 100/3000 2450025300 − X σ X X n X /σ µ− nS X / µ− = =2.40<1.96 所以,可以认为该单位人均月收入不是 2330 元,即可以认为该统计报表有误。 2.学生 t 分布(小样本总体均值的检验) 在大多数场合 ,把总体参数作为已知是不切实际的。通常我们既不知道 μ 的值,也不知 σ 的值。但中心极限定理涉及到 σ,而我们又不能轻视这条定理的价值。那么怎么办呢?一种方 法就是用样本标准差 S 来代替 σ。在 Z 的公式中,σ/ 直接被 S/ 取代。因为 S 可以从 样本数据中计算出来,所以公式中就没有未知数了。事实证明,当 n 大的时候,用这种方法 可以得到很好的结果。问题是当 n 较小的时候,用这种方法求出的概率可能是错误的,有必 要做某种修正。于是人们设计了另一种检验统计量 t = (7.12) 这个统计量最初是由戈塞持(Gosset,1876 一 1937 年)用笔名“学生”发表,所以这个统计 量的抽样分布称为学生 t 分布。比较 t 和 Z,我们注意到它们的分子相同,而分母却稍有不同: ①σ 为 S 所代替(这一点无须解释);②根号下是 n―1。 图 7.16 大致从直观上说明(7.12)式中采用 n―1 的原因。因为样本数据的全距只能小于 (顶多等于)总体数据的全距,可以明显看出,样本数据的离散程度小于总体数据的离散程度。 如果用样本的标准差来代替总体的标准差,就会偏小,即产生所谓的“向下偏误”。为了修正这 种偏误,以便使修正的样本标准差更好地估计总体标推差,所以用 n―l 而不用 n。n―1 实际 为自由度数 k,这一点将在第九章得到说明。 图7.16 81/75 23302350 − n n 1/ − − nS X µ当 Z 为 t 替代的时候,虽然用因子 n—I 所导致的修正看起来不大,但在样本容量较小时, 这种修正就会起很大作用了。所以当不知道 σ 值,而样本容量较小时,我们应该考虑应用 t 分 布而不是 Z 分布。通过下式可以编制出 t 分布表(见附录 5)。 = = (7.13) 注意 tα(k)写法的含义,它表示自由度数为 k 的 t 分布当分布函数 = 时随 机变量 t 的临界值。 当 n 变大,t 分布将越来越接近正态分布,应用 t 分布还是 Z 分布就无所谓了。事实上随 着 n 变大,S 逐渐变成 σ 的精确估计量,因而分母项无论使用 S 还是 σ,差别都非常小。但特 别要留意,使用 t 分布的条件比使用 Z 分布的条件苛刻,即必须假定总体为正态。 [例7.5.2]一个容量为 25 的样本,具有均值 52 和标准差 12,用单侧检验和双侧检验分 别来检验总体均值为 57 的假设( 都取 0.05)。 [解] 据题意,已知 n=25, =52,S=12,μ=57(零假设)。因 n 小而又不知道 σ 值, 故采用 t 检验。对自由度 24 来讲,单侧检验和显著性水平 0.05,查表知否定域为 t 值等于或 大于 1.711;而双侧检验和显著性水平 0.05,查表知否定域为 t 值等于或大于 2.064。下 面计算检验统计量 t= = =-2.041 我们已经确定,单侧检验时,任何一个大于 1.711 的|t|值都在否定域内。现在因为|t|= 2.041,故单侧检验时要否定 μ=57 的零假设。而双侧检验时,|t|值要在大于 2.064 时才落 在否定城内。现在因为|t|=2.041,所以双侧检验时不能否定 μ=57 的零假设。 通过上例,我们又一次看到单侧检验的优点。在犯第一类错误概率相同的情况下,如果 结果出现在预测方向上,研究者使用单侧检验比双侧检验更可能否定零假设。与此同时,犯 第二类错误的危险也随之减少。反过来讲,当检验不能否定零假设时,使用单侧检验比使用 双侧检验更令人放心。 现在可以对 t 分布的性质做三点归纳:①t 分布对称于 E(t)=0,但非正态分布;②对比 Z 分布表和 t 分布表,只有当样本比较小的时候,Z 分布和 t 分布才有较大的差别;③使用 t 分 ( ))()( ktktP α≥ ∫ +∞ α ϕ t dtkt )( ; α ( )kttP ;α≥ α α X 1/ − − nS X µ 24/12 5752 −布表时,除非 n 较大,否则还必须假定总体为正态。因为当 n 相当大时,检验统计量 t 可以由 Z 来替代,所以 t 检验是在小样本且可假定总体为正态的情况下才具有实用价值。 3.关于总体成数的检验 有时,需要对总体中具有某种特征的单位在总体中所占的的比例 p(即总体成数)作显著 性检验,如人口中的失业率、学龄儿童中的失学率等等。成数检验与二项检验的联系是不言 而愈的。因为在二项检验中,随机变量是样本的“成功”次数 x,而在成数检验中,随机变量是 样本的“成功”比例 (即样本成数),这样在试验次数 n 一定的情况下,显然有 = (7.14) 记“失败”的样本成数为 ,显然同时有 = =1― (7.15) 既然 是一个随机变量,那么把具体概率赋予样本成数的每一个取值,我们就得到了样 本成数的抽样分布。根据中心极限定理,并参照表7.5、表7.6 和表7.7,不难想见, 当 n 足够大时,样本成数的抽样分布也服从正态分布。根据(6.39)式和(6.48)式,井 利用成数检验与二项检验的密切关系,我们很容易就求得样本成数抽样分布的数学期望 E( ) 和变异数 D( ),即 E( )=E ( )= E (x)= ·np=p= (7.16) D( )=D( )= D (x)= ·npq= = (7.17) 式中:p 为总体中“成功”次数的比例,q 为总体中“失败”次数的比例。必须再一次提醒大 家,这里 p 和 q 是有关总体的固定值,即总体成数。 这样一来,大样本(n≥30,np≥5)的成数检验就变得很简单了。利用中心极限定理,关于成 数的检验统计量 Z 可表示如下 Z= (7.18) [例7.5.3] 某社区原来成年男性中吸烟者占 64%,经过戒烟宣传后进行抽样调查,发 现 100 名被调查者中,有 55 人是吸烟者,试问戒烟宣传是否收到明显成效(α 取 0.05)。 [解] 据题意,n=100>30,np=l00×64=64>5,故可使用正态检验。 ∧ p ∧ p n x ∧ q ∧ q n xn − ∧ p ∧ p ∧ p ∧ p ∧ p n x n 1 n 1 ∧ p µ ∧ p n x 2 1 n 2 1 n n pq 2 ∧ p σ npq pp / − ∧已知 =0.55,p=0.64,q=0.36,则 H0:p=0.64 H1:p<0.64 据题意,选择单侧检验,因 α=0.05,查正态分布表得 Zα=1.65,故否定域为 |Z|≥1.65。[来源:学§科§网] 根据(7.18)式计算检验统计量 Z= = =―1.88<―1.65 所以,能否定零假设 p=0.64,即能认为戒烟宣传收到了显著成效。 [例7.5.4] 孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的子二代豌 豆中,红花对白花之比为 3:1。某次种植试验的结果为;红花豌豆 176 株,白花豌豆 48 株。 试在 α=0.05 的显著性水平上,检定孟德尔定律。 [解] H0:p=0.75 H1:p≠0.75 因 α=0.05,查正态分布表得 Zα/2 =1.96,故否定域为|Z|≥1.96。 根据(7.18)式计算检验统计量 Z= = =1.23<1.96 所以保留 H0,即没有充分证据否定孟德尔定律,这次试验再次肯定了该定律的正确性。 最后,我们概括一下成数检验与二项检验的关系:①在二项分布中,我们处理的是成功 次数 x,而不是成数 ,将成功次数的期望值和标准差除以 n,即可得到成数的期望值和标准 差。②在样本容量较大时,我们可以用成数表示二项分布问题,再用正态检验来加以处理。 但在样本容量较小时,则使用二项检验更合适。③应该注意到,成功次数 x 是离散型随机变量, 而成数 却可以是连续型随机变量。但成数检验和二项检验都属二分定类尺度,所以可以适 用于不同测量层次。 www.shulihua.net ∧ p npq pp / − ∧ 100/36.064.0 64.055.0 × − npq pp / − ∧ )( 48176/4 1 4 3 4 3 48176 176 +× −+ ∧ p ∧ pw。w-w*k&s%5¥u www.shulihua.net w。w-w*k&s%5¥u

资料: 4978

进入主页

人气:

10000+的老师在这里下载备课资料

推荐资源
天天课堂