用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各
自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本
估计总体的思想.
(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
一、数字特征
1.众数、中位数、平均数
数字特征 样本数据 频率分布直方图
众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的
一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相
等的分界线与 x 轴交点的横坐标
平均数 样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点
的横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差: 2 2 2 2
1 2
1 [( ) ( ) ( ) ]ns x x x x x xn
.
标准差: 2 2 2
1 2
1 [( ) ( ) ( ) ]ns x x x x x xn
.
注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,
数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
3.性质
(1)若 1 2, , , nx x x 的平均数为 x ,那么 1 2, , , nmx a mx a mx a 的平均数为 mx a .
(2)数据 1 2, , , nx x x 与数据 1 1 2 2 n nx x a x x a x x a , , , 的方差相等,即数据经过平移后
方差不变.
(3)若 1 2, , , nx x x 的方差为 s2,那么 1 2 , , nax b ax b ax b , 的方差为 2 2a s .
二、茎叶图
1.定义
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
2.表示方法
(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数
字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.
(2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.学科&网
三、统计表
1.频率分布直方图
(1)画频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
(2)频率分布直方图的性质
①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于 1.
②频率分布直方图与众数、中位数与平均数的关系
a.最高的小长方形底边中点的横坐标即是众数;
b.中位数左边和右边的小长方形的面积和是相等的;
c.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中
点的横坐标之和.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越
接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.学科*网
3.各种统计表的优点与不足
优点 不足
频率分布
表
表示数据较确切 分析数据分布的总体态势不方便
频率分布
直方图
表示数据分布情况非常直观 原有的具体数据信息被抹掉了
频率分布
折线图
能反映数据的变化趋势 不能显示原有数据
茎叶图
一是所有的信息都可以从这个茎叶图中得到;
二是茎叶图便于记录和表示,能够展示数据的
分布情况
样本数据较多或数据位数较多时,
不方便表示数据
考向一 数字特征的应用
明确数字特征的意义:
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,
平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
典例 1 某学习小组在一次数学测验中,得 100 分的有 1 人,得 95 分的有 1 人,得 90 分的有 2 人,得 85
分的有 4 人,得 80 分和 75 分的各 1 人,则该小组数学成绩的平均数、众数、中位数分别为
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
【答案】C
1.若一组数据 的方差为 1,则 的方差为
A.1 B.2
C.4 D.8
2.已知一组数据 3,5,7,x,10 的平均数为 6,则这组数据的方差为
A. 33
5
B.6
C. 28
5
D.5
考向二 茎叶图的应用
茎叶图的优、缺点:
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一
点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本
容量较大时,作图较繁琐.
典例 2 为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校 400 名授课教师
中抽取 20 名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.
据此可估计上学期该校 400 名教师中,使用多媒体进行教学次数在[16,30)内的人数为
A.100 B.160
C.200 D.280
【答案】B
3.一次数学考试后,某老师从自己所带的两个班级中各抽取 6 人,记录他们的考试成绩,得到如图所示的
茎叶图.已知甲班 6 名同学成绩的平均数为 82,乙班 6 名同学成绩的中位数为 77,则 x y
A.3 B. 3
C.4 D. 4
考向三 频率分布直方图的应用
频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式
呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关
系,利用频率和等于 1 就可求出其他数据.学科@网
(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.
(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.
典例 3 某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的 2000 名顾客的消费金
额(单位:元),并从中随机抽取了 100 名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]
进行统计,得到如图所示的频率分布直方图.已知 a,b,c 成等差数列,则该商店这一个月来消费金额超过 150
元的顾客数量约为
A.600 B.30
C.60 D.300
【答案】A
4.200 辆载着某炮兵团士兵的汽车急赴某地抗洪抢险,如图是汽车途经某大桥时的速度的频率分布直方图,
则这 200 辆汽车的速度的中位数的估计值为
A.64 B.63
C.63.5 D.65
典例 4 为了增强学生的环保意识,某中学随机抽取了 50 名学生举行了一次环保知识竞赛,并将本次竞赛
的成绩(得分均为整数,满分 100 分)进行整理,制成下表:
成绩 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100]
频数 2 3 14 15 12 4
(1)作出被抽查学生成绩的频率分布直方图;
(2)若从成绩在[40,50)中选 1 名学生,从成绩在[90,100]中选 2 名学生,共 3 名学生召开座谈会,求[40,
50)组中学生 A1 和[90,100]组中学生 B1 同时被选中的概率.
(2)记[40,50)组中的学生为 A1,A2,[90,100]组中的学生为 B1,B2,B3,B4,A1 和 B1 同时被选中记为事
件 M.
由题意可得,全部的基本事件为:
A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共
12 个,
事件 M 包含的基本事件为:A1B1B2,A1B1B3,A1B1B4,共 3 个,
所以学生 A1 和 B1 同时被选中的概率为 P(M)= 3
12
=1
4.学.科网
5.已知经销某种商品的电商在任何一个销售季度内,每售出1吨该商品可获利润 0.5万元,未售出的商品,
每1吨亏损 0.3万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所
示.已知电商为下一个销售季度筹备了130吨该商品.现以 x (单位:吨,100 150x )表示下一个
销售季度的市场需求量,T (单位:万元)表示该电商下一个销售季度内经销该商品获得的利润.
(1)根据频率分布直方图,估计一个销售季度内市场需求量 x 的平均数与中位数的大小;
(2)根据频率分布直方图估计利润T 不少于 57 万元的概率.
1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个
数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组
的频率.其中错误的有
A.0 个 B.1 个
C.2 个 D.3 个
2.某商场对一个月内每天的顾客人数进行统计,得到如图所示的样本茎叶图,则该样本的中位数和众数分
别是
A.46,45 B.45,46
C.45,45 D.47,45
3.某仪器厂从新生产的一批零件中随机抽取 40 个检测.如图是根据抽样检测后零件的质量(单位:克)绘
制的频率分布直方图,样本数据分 8 组,分别为 、 , 、 、 、
、 、 ,则样本的中位数在
A.第 3 组 B.第 4 组
C.第 5 组 D.第 6 组
4.在如图所示的茎叶图中,有一个数字模糊不清,但某同学曾经计算得到该组数据的极差与中位数之和为 61,
则模糊不清的数字为
A.1 B.2
C.3 D.4
5.在某次高中数学竞赛中,随机抽取 90 名考生,其分数如图所示,若所得分数的平均数,众数,中位数
分别为 , , ,则 , , 的大小关系为
A. B.
C. D.
6.从某小学随机抽取 100 名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在
[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取 18 人参加一项活动,则从身高在
[140,150]内的学生中选取的人数应为
A.2 B.3
C.4 D.5
7.已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,平均数也相同,则图中的 m,n 的比值 =
A.1 B. 1
3
C. 3
8 D. 2
9
8.为普及校园安全知识,某校举行了由全部学生参加的校园安全知识考试,从中抽出 60 名学生,将其成绩分成
六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,估计这次考试的及格
率(60 分及以上为及格)、平均分分别为
A.75%,71 B.80%,85
C.85%,90 D.70%,65
9.一个样本 a ,3,5,7 的平均数是b ,且 a , b 分别是数列 2 *2n n N 的第 2 项和第 4 项,则这个
样本的方差是
A.3 B.4
C.5 D.6
10.已知甲、乙两名篮球运动员进行罚球训练,每人练习 10 组,每组罚球 40 个,甲、乙两人每组命中个数的茎
叶图如图所示,则下列结论中错误的是
A.甲命中个数的极差是 29 B.乙命中个数的众数是 21
C.甲的命中率比乙高 D.甲命中个数的中位数是 25
11.某网店在 2018 年 1 月的促销活动中,随机抽查了 100 名消费者的消费情况,并记录了他们的消费金额(单
位:千元),将数据分成 6 组:(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],整理得到频率分布直方图如图所示.若消费金额
不超过 3 千元的人数占总人数的 ,则消费金额超过 4 千元的人数为
A.12 B.15
C.16 D.18
12.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,
画出频率分布直方图.已知从左到右前 3 个小组的频率之比为 1∶2∶3,第 4 小组与第 5 小组的频率分布
直方图如图所示,第 2 小组的频数为 10,则第 5 小组的频数是
A.4 B.5
C.8 D.10
13.某次知识竞赛中,五个参赛小队的初始积分都是 50,在答题过程中,各小队每答对一题可使本队积分增加 5,
每答错一题本队积分不变,若答题过程中五个小队答对的题数分别是 4,7,6,2,5,则这五个小队积分的方差
为 .
14.随着智能手机的普及,网络购物越来越受到人们的青睐,某研究性学习小组对使用智能手机的利与弊
随机调查了 10 位同学,得到的满意度打分如茎叶图所示.
若这组数据的中位数、平均数分别为 ,a b ,则 ,a b 的大小关系是__________.
15.某市为了增加 2018 届高三毕业生对各著名高校的了解,从而调动他们的学习动力,利用 2017 年暑假组织
部分有意愿的学生赴部分大学参加夏令营,各大学夏令营的天数都在[2,12]内,现从中抽出 100 名学生,统
计他们参加夏令营的天数,绘制成如图所示的频率分布直方图,则这 100 名学生中参加夏令营的天数在
[6,10)的人数为 .
16.为组织好“市九运会”,组委会征集了 800 名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布
直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:
(1)年龄在[25,30)内对应小长方形的高度为 ;
(2)这 800 名志愿者中年龄在[25,35)内的人数为 .
17.某届马拉松招聘志愿者,报名者首先进入笔试,按笔试成绩选出参加面试的人员,最后确定入选名单.现从
报名的所有人中按男女比例采用分层抽样的方式抽取了 100 名,统计了他们的笔试成绩(满分 100 分),统
计结果见如下所示的频率分布表,其中分数在区间[90,100]内的人员直接进入面试阶段,若分数在区间
[80,90)内,则需要进行短期的培训后,再参加第二次笔试,从而确定能否参加面试.
分数区间 频数 频率
[50,60) 8 0.08
[60,70) b
[70,80) 42 0.42
[80,90) a 0.26
[90,100] 8
合计 100 1.00
(1)求 a 与 b 的值,并作出频率分布直方图;
(2)(i)根据表中数据,估计这 100 名人员笔试成绩的中位数 (精确到小数点后 1 位);
(ii)分析知,这 100 名人员在各分数段内的男女比例如下表所示,那么若以频率分布表中的频率近似作为
概率,在总共 2000 名参考人员中,求经过第一次考试就可直接进入面试的男女人数的估计值.
分数段 [50,60) [60,70) [70,80) [80,90) [90,100]
男女比例 1∶1 3∶1 3∶4 7∶6 3∶5
18.随着科技发展,手机成了人们日常生活中必不可少的通信工具,现在的中学生几乎都拥有了属于自己的手
机了.为了调查某地区高中生一周使用手机的频率,某机构随机调查了该地区 100 名高中生某一周使用手
机的时间(单位:小时),所取样本数据分组区间为 ,由此得到如
图所示的频率分布直方图.
(1)求 的值并估计该地区高中生一周使用手机时间的平均值;
(2)从使用手机时间在 的四组学生中,用分层抽样方法抽取 13 人,则每层各
应抽取多少人?
19.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年 200 户居民每户的月均
用电量(单位:百千瓦 时),将数据按 , , , , , 分成 9 组,制成了如图所
示的频率分布直方图.
(1)求直方图中 的值;
(2)设该市有 100 万户居民,估计全市每户居民中月均用电量不低于 6 百千瓦 时的人数及每户居民月均用
电量的中位数;
(3)政府计划对月均用电量在 4 百千瓦 时以下的用户进行奖励,月均用电量在 内的用户奖励 20 元/月,
月均用电量在 内的用户奖励 10 元/月,月均用电量在 内的用户奖励 2 元/月.若该市共有 400 万户
居民,试估计政府执行此计划的年度预算.
20.某研究小组为了研究某品牌智能手机在正常使用情况下的电池供电时间,分别从该品牌手机的甲、乙
两种型号中各选取 6 部进行测试,其结果如下:
甲种手机供电时间(小时)
19
18 21
22
23 20
乙种手机供电时间(小时)
18 17.5 20
23
22 22.5
(1)求甲、乙两种手机供电时间的平均值与方差,并判断哪种手机电池质量好;
(2)为了进一步研究乙种手机的电池性能,从上述 6 部乙种手机中随机抽取 2 部,求这两部手机中恰
有一部手机的供电时间大于该种手机供电时间平均值的概率.
21.某城市为了满足市民出行的需要和节能环保的要求,在公共场所提供单车共享服务,某部门为了对该
城市共享单车进行监管,随机选取了 20 位市民对共享单车的情况进行问卷调査,并根据其满意度评分
值(满分100分)制作的茎叶图如图所示:
(1)分别计算男性打分的平均数和女性打分的中位数;
(2)从打分在 70 分以下(不含 70 分)的市民中抽取3人,求有女性被抽中的概率.
1.(2017 新课标全国Ⅰ文科)为评估一种农作物的种植效果,选了 n 块地作试验田.这 n 块地的亩产量(单
位:kg)分别为 x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn 的平均数 B.x1,x2,…,xn 的标准差
C.x1,x2,…,xn 的最大值 D.x1,x2,…,xn 的中位数
2.(2017 山东文科)如图所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据(单位:件).若这两
组数据的中位数相等,且平均值也相等,则 x 和 y 的值分别为
A.3,5 B.5,5
C.3,7 D.5,7
3.(2017 新课标全国Ⅲ文科)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014
年 1 月至 2016 年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在 7,8 月
D.各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变化比较平稳
4.(2016 新课标全国Ⅲ文科)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温
和平均最低气温的雷达图.图中 A 点表示十月的平均最高气温约为 15 o C,B 点表示四月的平均最低气温
约为 5 o C.下面叙述不正确的是
A.各月的平均最低气温都在 0 o C 以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于 20 o C 的月份有 5 个
5.(2016 山东文科)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布
直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),
[25,27.5),[27.5,30] .根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是
A.56 B.60
C.120 D.140
6.(2018 江苏)已知 5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这 5 位裁判打出的分数的平
均数为 ▲ .
7.(2016 上海文科)某次体检,6 位同学的身高(单位:米)分别为 1.72,1.78,1.75,1.80,1.69,1.77,
则这组数据的中位数是_________(米).
8.(2018 新课标全国Ⅰ文科)某家庭记录了未使用节水龙头 50 天的日用水量数据(单位:m3)和使用了节
水龙头 50 天的日用水量数据,得到频数分布表如下:
未使用节水龙头 50 天的日用水量频数分布表
日用水量 0 0.1, 0.1 0.2, 0.2 0.3, 0.3 0.4, 0.4 0.5, 0.5 0.6, 0.6 0.7,
频数 1 3 2 4 9 26 5
使用了节水龙头 50 天的日用水量频数分布表
日用水量 0 0.1, 0.1 0.2, 0.2 0.3, 0.3 0.4, 0.4 0.5, 0.5 0.6,
频数 1 5 13 10 16 5
(1)在答题卡上作出使用了节水龙头 50 天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于 0.35 m3 的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算,同一组中的数据以这组
数据所在区间中点的值作代表.)
9.(2018 新课标全国Ⅲ文科节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务
的两种新的生产方式.为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人,
第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单
位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求 40 名工人完成生产任务所需时间的中位数 m ,并将完成生产任务所需时间超过 m 和不超过 m 的
工人数填入下面的列联表:
超过m 不超过 m
第一种生产方式
第二种生产方式
10.(2017 新课标全国Ⅱ文科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机
抽取了 100 个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:
(1)记 A 表示事件“旧养殖法的箱产量低于 50 kg”,估计 A 的概率;
(2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关;
箱产量<50 kg 箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
P( ) 0.050 0.010 0.001
k 3.841 6.635 10.828
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
.
11.(2017 北京文科)某大学艺术专业 400 名学生参加某次测评,根据男女学生人数比例,使用分层抽样的
方法从中随机抽取了 100 名学生,记录他们的分数,将数据分成 7 组:[20,30],[30,40],,[80,
90],并整理得到如下频率分布直方图:
(1)从总体的 400 名学生中随机抽取一人,估计其分数小于 70 的概率;
(2)已知样本中分数小于 40 的学生有 5 人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于 70,且样本中分数不小于 70 的男女生人数相等.试估计总
体中男生和女生人数的比例.
12.(2016 新课标全国Ⅱ文科)某险种的基本保费为 a(单位:元),继续购买该险种的投保人称为续保人,
续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数 0 1 2 3 4 ≥5
保费 0.85a a 1.25a 1.5a 1.75a 2a
随机调查了该险种的 200 名续保人在一年内的出险情况,得到如下统计表:
出险次数 0 1 2 3 4 ≥5
频数 60 50 30 30 20 10
(1)记 A 为事件:“一续保人本年度的保费不高于基本保费”,求 P(A)的估计值;
(2)记 B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的 160%”,求 P(B)的估计
值;
(3)求续保人本年度的平均保费估计值.
13.(2016 北京文科)某市居民用水拟实行阶梯水价,每人月用水量中不超过 w 立方米的部分按 4 元/立方
米收费,超出 w 立方米的部分按 10 元/立方米收费.从该市随机调查了 10 000 位居民,获得了他们某月
的用水量数据,整理得到如下频率分布直方图:
(1)如果 w 为整数,那么根据此次调查,为使 80%以上居民在该月的用水价格为 4 元/立方米,w 至
少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当 w=3 时,估计该市居民该月的人均水费.
14.(2016 四川文科)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行
了调查.通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照[0,0.5), [0.5,
1),…,[4,4.5]分成 9 组,制成了如图所示的频率分布直方图.
(1)求直方图中 a 的值;
(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
变式拓展
1.【答案】C
【解析】若 的方差为 ,则 , , , 的方差为 ,故可得当 的
方差为 1 时, 的方差为 ,故选 C.
2.【答案】C
【解析】先根据平均数公式求出 x,再利用方差公式求解.
由题意,得 3+5+7+x+10=6×5,得 x=5,
所以这组数据的方差 s2= 1
5
(9+1+1+1+16)= 28
5 .
3.【答案】C
4.【答案】D
【解析】由频率分布直方图知,前两个小矩形的面积之和为(0.01+0.02)×10=0.3,
由于 0.5-0.3=0.2,则 0.2
0.4 ×10=5,
所以中位数为 60+5=65.故选 D.
5 . 【 解 析 】 ( 1 ) 估 计 一 个 销 售 季 度 内 市 场 需 求 量 x 的 平 均 数 为
105 0.1 115 0.2x 125 0.3 135 0.25 145 0.15 126.5 (吨).
由频率分布直方图易知,由于 100,120x 时,对应的频率为 0.01 0.02 10 0.3 0.5 ,而
100,130x 时,对应的频率为 0.01 0.02 0.03 10 0.6 0.5 ,
因此一个销售季度内市场需求量 x 的中位数应属于区间 120,130 ,
于是估计中位数应为 120 0.5 0.1 0.2 0.03 126.7 (吨).
(2)当 100,130x 时, 0.5 0.3 130 0.8 39T x x x ;
当 130,150x 时, 0.5 130 65T ,
所以, 0.8 39, 100 130
65, 130 150
x xT x
.
当 100,130x 时,由 0.8 39 57T x ,得120 130x ;
当 130,150x 时, 65 57T , 学科%网
所以,利润T 不少于57 万元当且仅当120 150x ,
于是由频率分布直方图可知,市场需求量 120,150x 的频率为 0.030 0.025 0.015 10 0.7 ,
所以下一个销售季度内的利润T 不少于 57 万元的概率的估计值为 0.7 .
考点冲关
1.【答案】C
2.【答案】A
【解析】由茎叶图可知所给数据,其中出现最多的是 45 ,共三次,所以为众数,将所有数据从小到大排
列后,中间两数为 45,47 ,故中位数为 46 .故本题答案为 A .
3.【答案】B
【解析】由图计算可得前四组的频数是 22,其中第 4 组的频数为 8,故本题正确答案是
4.【答案】B
【解析】设模糊不清的数字为 x,由题意知该组数据的极差为 48-20=28,所以中位数为 61-28=33,
所以 +32=33,解得 x=2,
即模糊不清的数字为 2.
5.【答案】D
【解析】经计算得平均值 ,众数为 ,中位数为 ,故 ,选 D.
6.【答案】B
【解析】依题意可得 10×(0.005+0.01+0.02+a+0.035)=1,则 a=0.03,
从而身高在[120,130),[130,140),[140,150]三组内的学生比例为 3∶2∶1,所以从身高在[140,150]内的学生
中选取的人数应为 ×18=3,故选 B.
7.【答案】C
8.【答案】A
【解析】及格的各组的频率和是(0.015+0.030+0.025+0.005)×10=0.75,即及格率为 75%;
样本的均值为 45×0.10+55×0.15+65×0.15+75×0.30+85×0.25+95×0.05=71,
用这个分数估计总体的分数即得总体的平均分数为 71.故选 A.
【名师点睛】利用频率分布直方图求众数、中位数和平均数时,应注意三点:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中
点的横坐标之和.
9.【答案】C
【解析】∵样本 a ,3,5,7 的平均数是b ,且 a ,b 分别是数列 2 *2n n N 的第 2 项和第 4 项,
∴ 2 2 4 22 1, 2 4a b , 2 2 2 22 1 1 4 3 4 5 4 7 4 54s ,故选 C.
10.【答案】D
【解析】由茎叶图可知甲命中个数的极差为 37-8=29,故 A 正确;
易知乙命中个数的众数是 21,故 B 正确;
甲的命中率为 =0.535,乙的命中率为
=0.4225,所以甲的命中率比乙高,C 正确;
甲命中个数的中位数为 =23,所以 D 不正确.故选 D.学科&网
11.【答案】B
【解析】∵消费金额不超过 3 千元的人数占总人数的 ,∴第 4,5,6 组的频率之和为 1-0.6=0.4,从图中可知
第 4 组的频率为 0.25,∴第 5,6 组的频率之和为 0.4-0.25=0.15,∴消费金额超过 4 千元的人数为 15.
12.【答案】B
13.【答案】74
【解析】由题意知,五个小队的积分分别是 70,85,80,60,75,
所以五个小队的积分的平均值为 70 85 80 60 75
5
=74,
所以五个小队的积分的方差为
2 2 2 2 2(70 74) (85 74) (80 74) (60 74) (75 74)
5
=74.
14.【答案】 a b
【解析】从图中可知中位数为 83 87 852
,
平均数为 1 75 76 77 81 83 87 89 93 94 95 8510x ,所以 a b .
15.【答案】58
【解析】由频率分布直方图可得参加夏令营的天数在[6,10)的频率为 1-(0.04+0.12+0.05)×2=0.58,则参加
夏令营的天数在[6,10)的人数为 100×0.58=58.
16.【答案】(1)0.04;(2)440
【解析】(1)因为所有小长方形的面积之和为 1,所以年龄在[25,30)内对应小长方形的高度为
[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.
(2)年龄在[25,35)内的频率为 0.04×5+0.07×5=0.55,人数为 0.55×800=440.
17.【解析】(1)由已知得 a=0.26×100=26,分数区间[60,70)对应的频数为 100-8-42-26-8=16,
因而 b= 16
100 =0.16.
频率分布直方图如图.
18.【解析】(1)由于小矩形的面积之和为 1,
则 ,由此可得 .
该地区高中生一周使用手机时间的平均值为
.
(2)使用手机时间在 的学生有 人,使用手机时间在 的学生有
人,使用手机时间在 的学生有 人,使用手机时间在
的学生有 人,学科@网
故用分层抽样法从使用手机时间在 的四组学生中抽样,抽取人数分别为
.
19.【解析】(1)由题得 = ,
所以 .
(3)该市月均用电量在 内的用户数分别为
,所以每月预
算为 (元),
故估计政府执行此计划的年度预算为 (万元) (亿元).
20.【解析】(1)甲的平均值 1 1 2 1 2 3 0 20 20.56x 甲 ,
乙的平均值 1 2 2.5 0 3 2 2.5 20 20.56x 乙 ,
甲的方差为 2 2 2 2 22 1 [ 20.5 19 20.5 18 20.5 21 20.5 22 20.5 236s 甲
2 3520.5 20 ] 12
,
乙的方差 2 2 2 2 22 1 [ 20.5 18 20.5 17.5 20.5 20 20.5 23 20.5 226s 乙
2 1420.5 22.5 ] 3
,
因为甲、乙两种手机的平均数相同,甲的方差比乙的方差小,所以认为甲种手机电池质量更好.
(2)由题意得上述6 部乙种手机中有3部手机的供电时间大于该种手机供电时间平均值,记它们分别
是 1 2 3, ,A A A ,其余的为 1 2 3, ,a a a ,
从 上 述 6 部 乙 种 手 机 中 随 机 抽 取 2 部 的 所 有 结 果 为 : 1 2 1 3 1 1 1 2, , , , , , , ,A A A A A a A a
1 3 2 3 2 1 2 2 2 3, , , , , , , , , ,A a A A A a A a A a 3 1 3 2 3 3, , , , , ,A a A a A a 1 2 1 3 2 3, , , , ,a a a a a a ,
共有15种,
其中恰有一部手机的供电时间大于该种手机供电时间平均值的结果为: 1 1 1 2 1 3, , , , , ,A a A a A a
2 1 2 2 2 3 3 1 3 2 3 3, , , , , , , , , , ,A a A a A a A a A a A a ,共有9种,
所以所求概率为 9 3
15 5P .
21.【解析】(1)男性打分的平均数为 55 53 62 65 71 70 73 74 86 81 6910
(分),
女性打分的中位数为 76 78 772
(分).
直通高考
1.【答案】B
【解析】评估这种农作物亩产量稳定程度的指标是标准差或方差,故选 B.
【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平;
中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平;
平均数:反映一组数据的平均水平;学科&网
方差:反映一组数据偏离平均数的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大
小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
标准差是方差的算术平方根,意义在于反映一组数据的离散程度.
2.【答案】A
【解析】由题意,甲组数据为 56,62,65, 70 x ,74,乙组数据为 59,61,67, 60 y ,78.要使两
组数据的中位数相等,则 65 60 y ,所以 5y ,又平均数相同,则
56 62 65 (70 ) 74 59 61 67 65 78
5 5
x ,解得 3x .故选 A.
【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布
直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.
缺点是当样本容量较大时,作图较烦琐. 利用茎叶图对样本进行估计时,要注意区分茎与叶,茎是指中
间的一列数,叶是从茎的旁边生长出来的数.
3.【答案】A
【名师点睛】用样本估计总体时统计图表主要有:
(1)频率分布直方图,特点:频率分布直方图中各小长方形的面积等于对应区间的频率,所有小长方形
的面积之和为 1;
(2)频率分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(3)茎叶图,对于统计图表类题目,最重要的是认真观察图表,从中提炼出有用的信息和数据.
4.【答案】D
【解析】由题图可知各月的平均最低气温都在 0 o C 以上,A 正确;
由题图可知七月的平均温差大于 7.5 o C,而一月的平均温差小于 7.5 o C,所以七月的平均温差比一月的
平均温差大,B 正确;
由题图可知三月和十一月的平均最高气温都大约在 10 o C,基本相同,C 正确;
由题图可知平均最高气温高于 20℃的月份有 3 个,所以不正确.
故选 D.
5.【答案】D
【解析】自习时间不少于 22.5 小时为后三组,其频率和为 7.05.2)04.008.016.0( ,故人数为
1407.0200 人,选 D.
【名师点睛】本题主要考查频率分布直方图,是一道基础题目.从历年高考题目看,图表题已是屡见不鲜,
作为一道应用题,考查考生的识图、用图能力,以及应用数学知识解决实际问题的能力.
6.【答案】90
【解析】由茎叶图可知,5 位裁判打出的分数分别为 ,故平均数为
.
7.【答案】1.76
【解析】将这 6 位同学的身高按照从低到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中
位数是 1.75 与 1.77 的平均数,显然为 1.76.
【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往
不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力.
8.【解析】(1)
【名师点睛】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布
直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审
题,细心运算,仔细求解,就可以得出正确结果.
9.【解析】(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间至少 80 分钟,
用第二种生产方式的工人中,有 75%的工人完成生产任务所需时间至多 79 分钟.因此第二种生产方式的
效率更高.学科,网
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 分钟,用第二种
生产方式的工人完成生产任务所需时间的中位数为 73.5 分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于 80 分钟;用第二种生产
方式的工人完成生产任务平均所需时间低于 80 分钟,因此第二种生产方式的效率更高.
(2)由茎叶图知 79 81 802m .
列联表如下:
超过 m 不超过 m
第一种生产方式 15 5
第二种生产方式 5 15
10.【解析】(1)旧养殖法的箱产量低于 50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件 A 的概率估计值为 0.62.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg 箱产量≥50 kg
旧养殖法 62 38
新养殖法 34 66
K2=
2200 62 66 34 38 15.705100 100 96 104
( )≈ .
由于 15.705>6.635,故有 99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在 50 kg 到 55 kg 之间,
旧养殖法的箱产量平均值(或中位数)在 45 kg 到 50 kg 之间,且新养殖法的箱产量分布集中程度较旧养
殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧
养殖法.学&科网
【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为 1.
(2)频率分布直方图中均值等于组中值与对应概率乘积的和.
(3)均值大小代表水平高低,方差大小代表稳定性.
11.【解析】(1)根据频率分布直方图可知,样本中分数不小于 70 的频率为 (0.02 0.04) 10 0.6 ,所
以样本中分数小于 70 的频率为1 0.6 0.4 .
所以从总体的 400 名学生中随机抽取一人,其分数小于 70 的概率估计为 0.4.
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总
体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而频率分布
直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于 1;在频率分布直方图中,各小
长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于 1.
12.【解析】(1)事件 A 发生当且仅当一年内出险次数小于 2.由所给数据知,一年内出险次数小于 2 的频率
为 60 50 0.55200
,
故 P(A)的估计值为 0.55.
(2)事件 B 发生当且仅当一年内出险次数大于 1 且小于 4.由所给数据知,一年内出险次数大于 1 且小
于 4 的频率为 30 30 0.3200
,
故 P(B)的估计值为 0.3.
(3)由所给数据得
保费 0.85a a 1.25a 1.5a 1.75a 2a
频率 0.30 0.25 0.15 0.15 0.10 0.05
调查的 200 名续保人的平均保费为
0.85 0.30 0.25 1.25 0.15 1.5 0.15 1.75 0.10 2 0.05 1.192 5a a a a a a a ,
因此,续保人本年度平均保费的估计值为 1.192 5a.
【名师点睛】样本的数字特征常见的命题角度有:(1)样本的数字特征与频率分布直方图交汇;(2)样本
的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题交汇.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号 1 2 3 4 5 6 7 8
分组 2,4 4,6 6,8 8,10 10,12 12,17 17,22 22,27
频率 0.1 0.15 0.2 0.25 0.15 0.05 0.05 0.05
根据题意,该市居民该月的人均水费估计为:
4 0.1 6 0.15 8 0.2 10 0.25 12 0.15 17 0.05 22 0.05 27 0.05
10.5 (元).
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总
体则是用样本的频率分布去估计总体分布的两种主要方法. 频率分布表在数量表示上比较准确,频率分
布直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于 1;在频率分布直方图中,各小
长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于 1.
14.【解析】(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为 0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为 0.08,0.21,0.25,
0.06,0.04,0.02.学科%网
由 1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得 a=0.30.
(2)由(1),100 位居民月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 000×0.12=36 000.
【名师点睛】本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问
题、解决问题的能力.在频率分布直方图中,第 n 个小矩形的面积就是相应组的频率,所有小矩形的面
积之和为 1,这是解题的关键,也是识图的基础.