数学 选修2-2、
2-3 RJA
题型1 线性回归分析
解析
刷基础
1.[河南濮阳2018高二联考]已知一组样本点(xi,yi),其中i=1,2,3,…,30,根据最小二
乘法求得的回归方程是 ,则下列说法正确的是( )
A.若所有样本点都在 上,则变量间的相关系数为1
B.至少有一个样本点落在回归直线 上
C.对所有的xi(i=1,2,3,…,30),预报变量 的值一定与yi有误差
D.若 的斜率 ,则变量x与y正相关
选项A,所有样本点都在 上,则变量间的相关系数|r|=1,相关系数为r=±1, 故A错误;
选项B,回归直线必过样本中心点,但样本点可能都不在回归直线上,故B错误;选项C,样本点
可能在直线 上,即可以存在xi对应的预报变量 与yi没有误差,故C错误;选项D,
相关系数r与b符号相同,若 的斜率 ,则r>0,样本点的分布从左至右上升,变
量x与y正相关,故D正确.
D
3.1
解析
刷基础
2.根据如下样本数据得回归方程 ,则( )
由题意可知大多数样本数据y随x的增大而减小,具有负的相关关系,所以 .又回归方程表示的
直线经过(3,4)与(4,2.5)附近,所以 .故选B.
B
3.1
题型1 线性回归分析
解析
刷基础
3.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点
图(两坐标轴单位长度相同),用回归直线 近似地刻画其相关关系,根据图形,以下结论
最有可能成立的是( )
A.线性相关关系较强, 的值为3.25
B.线性相关关系较强, 的值为0.83
C.线性相关关系较强, 值为-0.87
D.线性相关关系太弱,无研究价值
由散点图可知,点的分布集中在某个带状区域内,所以语文成绩和英语成绩之间具有正的线性相
关关系,且线性相关关系较强,又绝大部分的点都在直线y=x的下方,所以回归直线的斜率大于0
且小于1,所以结论最有可能成立的是B,故选B.
B
3.1
题型1 线性回归分析
b
b
b
解析
刷基础
4.[2019第一次质量评估]为了规定工时定额,需要确定加工某种零件
所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),
由最小二乘法求得回归方程为 .若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+
y4+y5=( )
A.75 B.155.4 C.375 D.466.2
由题意,可得 ,代入回归方程中,可得 =0.67×30+54.9=75,所以y1+y2+y3+y4
+y5=5× =375,故选C.
C
3.1
题型1 线性回归分析
解析
刷基础
5.[山东临沂2018高二联考]已知变量x,y线性相关,且由观测数据算得样本平均数为 =2,
=5,则由该观测数据得到的线性回归直线方程不可能是( )
A.y=2.1x+0.8 B.y=-1.2x+7.4
C.y=2.25x+0.5 D.y=-1.25x+7.55
由题意可知观测数据的样本平均数为 =2, =5,即样本中心为(2,5).对于D项,当x=2时,
y=-1.25×2+7.55=5.05,所以直线y=-1.25x+7.55不可能是回归直线方程,故选D.
D
3.1
题型1 线性回归分析
题型2 回归效果的刻画
解析
刷基础
6.对相关系数r,下列说法正确的是( )
A.|r|越大,线性相关程度越强
B.|r|越小,线性相关程度越强
C.|r|越大,线性相关程度越弱,|r|越接近0,线性相关程度越强
D.|r|≤1,且|r|越接近1,线性相关程度越强,|r|越接近0,线性相关程度越弱
两个变量之间的相关系数r的绝对值越接近于1,表示两个变量的线性相关性越强;r的绝对值越接
近于0,表示两个变量的线性相关性越弱,此时两个变量之间几乎不存在线性相关关系.故选D.
D
3.1
题型2 回归效果的刻画
解析
刷基础
7.对某高三学生在连续多次数学测试中的成绩(单位:分)进行统计得到如下散点图.下面关于
这位同学的数学成绩的分析中,正确的个数为( )
①该同学的数学成绩总的趋势是在逐步提高;
②该同学在这连续九次数学测试中的成绩的最高分与最低分的差超过40分;
③该同学的数学成绩与测试次数具有线性相关性,且为正相关.
A.0 B.1 C.2 D.3
根据散点图可知该同学的数学成绩与测试次数具有正相关关系,所以①③均正确;第一次的成绩
在90分以下,第九次的成绩在130分以上,所以②正确,故选D.
D
3.1
题型2 回归效果的刻画
解析
刷基础
8.[广西2019高二月考]下列四个命题:
①残差平方和越小的模型,拟合的效果越好;
②用相关指数R2来刻画回归效果,R2越小,说明模型拟合的效果越好;
③散点图中所有点都在回归直线附近;
④随机误差e满足E(e)=0,其方差D(e)的大小可用来衡量预报的精度.
其中正确命题的个数是( )
A.1 B.2 C.3 D.4
根据回归方程的性质得残差平方和越小的模型,拟合的效果越好,故①正确;用相关指数R2来刻
画回归效果,R2越大,说明拟合效果越好,故②不正确;散点图中所有点都在回归直线附近,不
正确,应该是大部分点都在回归直线附近,而不是所有点,故③不正确;随机误差e满足E(e)=0,
其方差D(e)的大小用来衡量预报的精度,故④正确.故选B.
B
3.1
题型2 回归效果的刻画
解析
刷基础
9.[河南濮阳2019高二升级考试]某种产品的广告费支出x(万元)与销售额y(万元)之间有如表所
示的线性相关关系,y与x的线性回归方程为 ,当广告支出5万元时,随机误差的
效应(残差)为( )
A.10 B.20 C.30 D.40
因为y与x的线性回归方程为 ,
所以当x=5时, =6.5×5+17.5=50.
由表格知当广告支出5万元时,销售额为60万元,所以随机误差的效应(残差)为60-50=10.故选
A.
A
3.1
题型2 回归效果的刻画
解析
刷基础
10.[贵州思南中学2019高二月考]设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线
性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程
为 ,那么针对某样本(170,58)的残差是________.
由题可得 ,残差 .
-0.79
3.1
题型2 回归效果的刻画
解
刷基础
11.关于x与y有以下数据:
有如下两个线性模型:(1) ;(2) ,试比较哪一个拟合效果比较好.
由(1)得 与 的关系如下表:
所以 .
3.1
刷基础
所以
由(2)得 与 的关系如下表:
所以
所以
由 =0.845, =0.82知 > ,所以方程(1)的拟合效果比较好.
3.1
解析
刷基础
12.[河南焦作2019高二期中]已知变量y关于x的回归方程为 ,其一组数据如下表所
示:
若x=5,则预测y的值可能为( )
由 ,得 ,令 ,则 .
D
3.1
题型3 非线性回归分析
解
刷基础
13.为了研究某种细菌繁殖的个数随时间x的变化,收集数据如下:
(1)用时间作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)描述解释变量与预报变量之间的关系,计算残差、相关指数R2.
(1)散点图如图所示.
3.1
题型3 非线性回归分析
刷基础
(2)由散点图可以看出样本点分布在一条指数函数 的周围,于是令z=ln y,则
由最小二乘法计算得 ,则有 .
即解释变量(时间)对预报变量(细菌繁殖的个数)变化解释了99.99%.
3.1
题型3 非线性回归分析
解析
刷易错
14.如果散点图中的所有样本点都落在一条斜率为非零实数的直线上,R2是相关指数,则( )
A.R2=1 B.R2=0 C.0≤R2≤1 D.R2≥1
当散点图中的所有点都落在一条斜率为非零实数的直线上时,它的残差均为0,残差的平方和为0,
所以它的相关指数为1,即R2=1.
A
3.1
易错点1 线性相关系数理解不正确致错
易错
警示
若散点图中的所有点都在一条直线上时,变量间的相关性最强,若直线的斜率大于0,则相关系
数为1;若直线的斜率小于0,则相关系数为-1.
解析
刷易错
15.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U
与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间
的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r2=r1
由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量
Y与X之间正相关,所以r1>0.而由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),
(12.5,2),(13,1),可知变量V与U之间负相关,所以r2<0.因此r1与r2的大小关系是r2<0<r1.
C
3.1
易错点1 线性相关系数理解不正确致错
易错
警示
给出一组数据,判断该组数据的线性相关系数的符号,可根据该组数据变量之间的正、
负相关关系进行判断,若是正相关,则相关系数大于0;若是负相关,则相关系数小于0.
刷易错
16.已知x与y之间的几组数据如下表:
假设根据上表数据所得线性回归方程为 ,若某同学根据上表中的前两组数据(1,0)和
(2,2),求得的直线方程为 ,则以下结论正确的是 ( ) D
3.1
易错点2 求线性相关方程计算错误
刷易错 3.1
易错点2 求线性相关方程计算错误
解析
由题得 ,根据公式求得 .
又 ,所以 ,故选D.
易错
警示
给出一组具体数据求其线性回归方程时,由于回归直线的方程是 ,其中 ,
计算量较大,因此计算要细心,公式使用要准确,要特别注意线性回归方程一定过样本点中心的应用.
刷能力
1.[湖北鄂东南省级示范高中教育改革联盟2018高二联考]在两个变量x与y的回归模型中选择了
四个不同的模型来拟合y与x之间的关系,它们的相关指数R2如下表所示,其中拟合效果最好的模型
是( )
A.模型1 B.模型2 C.模型3 D.模型4
A
3.1
解析
在两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果越好,在
所给的四个选项中0.98是相关指数最接近于1的值,所以拟合效果最好的模型是模型1,故选A.
刷能力
2.已知线性回归方程中斜率的估计值为1.23,样本点的中心为(4,5),则该回归方程为( ) A
3.1
解析
设线性回归方程为 ,由题意得 ,
∴ . 又回归直线过样本点的中心(4,5),∴5=1.23×4+ ,∴ =0.08,∴回归方程
为 .故选A.
刷能力
3.下面的各图中,散点图与相关系数r不符合的是( )B
3.1
解析
对于A,散点图上所有点都在一条斜率小于0的直线上,所以相关系数r=-1,A正确;对于B,散
点图上所有点都在一条斜率大于0的直线上,所以相关系数r=1,B错误;对于C,变量x,y的散点
图从左到右是向下的带状分布,所以相关系数-1<r<0,C正确;对于D,变量x,y的散点图中,
x,y之间的相关关系非常不明显,所以相关系数r=0,D正确.应选B.
刷能力
4.(多选)[2019月考]下列说法正确的是( )
A.在回归模型中,预报变量y的值不能由解释变量x唯一确定
B.若变量x,y满足关系y=-0.1x+1,且变量y与z正相关,则x与z也正相关
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程
z=0.3x+4,则c=e4,k=0.3
ACD
3.1
解析
对于A,y除了受解释变量x的影响之外还受其他因素的影响,故正确;对于B, 变量x,y满足关
系y=-0.1x+1,则变量x与y负相关,又变量y与z正相关,则x与z负相关,故错误;对于C,由
残差图的意义可知正确;对于D,∵y=cekx,∴两边取对数,可得ln y=ln(cekx)=ln c+ln ekx=
ln c+kx,令z=ln y,可得z=ln c+kx.∵z=0.3x+4,∴ln c=4,k=0.3,∴c=e4,故正确.故
选ACD.
刷能力
5.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12
岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回
归直线L.根据图中数据,下列选项中对该样本描述错误的是( )
A.据样本数据估计,该地区青少年的身高与年龄成正相关
B.所抽取数据中,5 000名青少年的平均身高约为145 cm
C.直线L的斜率的值近似等于样本中青少年平均身高每年的增量
D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点
一定在直线L上
D
3.1
刷能力 3.1
解析
在给定范围内,随着年龄的增加,年龄越大身高越高,故该地区青少年的身高与年龄成正相
关,故A正确;用样本数据估计总体可得平均数大约是145 cm,故B正确;根据直线斜率的意
义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,
根据数据做出的点可能在直线附近,不一定在直线上,故D错误,故选D.
刷能力
6.[河北沧州2019高二期中]已知方程 是根据女大学生的身高预报体重的回归
方程,其中x, 的单位分别是 cm,kg,则该方程在样本(165,57)处的残差是( )
A.54.55 B.3.45 C.2.45 D.111.55
C
3.1
解析
由回归方程可得当身高为165 cm时,体重的预测值 =0.85×165-85.7=54.55,故样本的残
差值为57-54.55=2.45.故选C.
刷能力
7.[河南创新发展联盟2018高二期末]电脑芯片的生产工艺复杂,在某次生产试验中得到6组数据
(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),(x6,y6).根据收集到的数据可知 =10,由最小二
乘法求得回归直线方程为 ,则y1+y2+y3+y4+y5+y6=( )
A.50.5 B.45.5 C.100.2 D.109.2
D
3.1
解析
由 可知 ,所以y1+y2+y3+y4+y5+y6=18.2×6=
109.2,故选D.
刷能力
8.某化工厂产生的废气经过过滤后排放,以模型y=p0e-kx去拟合过滤过程中废气的污染物浓度y mg/L
与时间x h之间的一组数据,为了求出回归方程,设z=ln y,其变换后得到线性回归方程为 =-0.5x+
2+ln 300,则当经过6 h后,预报废气的污染物浓度为( ) A
3.1
解析
当x=6时, ,
刷能力
9.[广东四校2018高三联考]如图是一组数据(x,y)的散点图,经最小二乘法计算,y与x之间的线性回归
方程为 ,则 =________. 0.8
3.1
解析
,将(2,2.6)代入 ,解得 =0.8.
,
刷能力
10.某个服装店经营某种服装,在某周内每天获得的纯利润y(元)与该周每天销售这种服装数量x(件)之间
的一组数据关系如下表:
已知
参考公式:回归方程是 ,
其中
(1)求 ;
(2)画出散点图;
(3)求每天的纯利润y与每天销售数量x之间的线性回归方程.
3.1
刷能力 3.1
解
,
(2)散点图如图所示.
(3)由散点图知,
y与x具有线性相关关系,设线性回归方程为 ,
∴线性回归方程为
刷能力
11.中石化集团通过与安哥拉国家石油公司合作,获得了安哥拉深海油田区块的开采权,集团在某
些区块随机初步勘探了部分旧井,取得了地质资料.进入全面勘探时期后,集团按网络点来布置井位
进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井
的地质资料,不必打这口新井,以节约勘探费用.勘探初期部分旧井的数据资料见下表:
(1)1~6号旧井位置线性分布,借助前5组数据求得回归方程为y=bx+a,其中b=6.5,求a,并估计
6号旧井中y的预报值.
3.1
刷能力
(2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的 的值与(1)中b,a的值的差均不超过
10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井.(注:其中 的计
算结果用四舍五入法保留1位小数)
3.1
(1)因为前5组数据 回归直线必过点 ,则 故回
归方程为y=6.5x+17.5.当x=1时,y=6.5x+17.5=24,即y的预报值为24.
,
解
刷能力
(2)根据1,3,5,7号井的数据计算可得
所以
即 ,由(1)知b=6.5,a=17.5.
因为 ,均不超过10%,因此使用位置最接近的已有旧井6(1,24).
3.1