3.1回归分析的基本思想及其初步应用刷题课件(共36张PPT)高二下学期数学人教A版选修2-3第三章
加入VIP免费下载
加入VIP免费下载
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天资源网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:403074932
资料简介
数学 选修2-2、 2-3 RJA 题型1 线性回归分析 解析 刷基础 1.[河南濮阳2018高二联考]已知一组样本点(xi,yi),其中i=1,2,3,…,30,根据最小二 乘法求得的回归方程是 ,则下列说法正确的是(  ) A.若所有样本点都在 上,则变量间的相关系数为1 B.至少有一个样本点落在回归直线 上 C.对所有的xi(i=1,2,3,…,30),预报变量 的值一定与yi有误差 D.若 的斜率 ,则变量x与y正相关 选项A,所有样本点都在 上,则变量间的相关系数|r|=1,相关系数为r=±1, 故A错误; 选项B,回归直线必过样本中心点,但样本点可能都不在回归直线上,故B错误;选项C,样本点 可能在直线 上,即可以存在xi对应的预报变量 与yi没有误差,故C错误;选项D, 相关系数r与b符号相同,若 的斜率 ,则r>0,样本点的分布从左至右上升,变 量x与y正相关,故D正确. D 3.1 解析 刷基础 2.根据如下样本数据得回归方程 ,则(  ) 由题意可知大多数样本数据y随x的增大而减小,具有负的相关关系,所以 .又回归方程表示的 直线经过(3,4)与(4,2.5)附近,所以 .故选B. B 3.1 题型1 线性回归分析 解析 刷基础 3.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点 图(两坐标轴单位长度相同),用回归直线 近似地刻画其相关关系,根据图形,以下结论 最有可能成立的是(  ) A.线性相关关系较强, 的值为3.25 B.线性相关关系较强, 的值为0.83 C.线性相关关系较强, 值为-0.87 D.线性相关关系太弱,无研究价值 由散点图可知,点的分布集中在某个带状区域内,所以语文成绩和英语成绩之间具有正的线性相 关关系,且线性相关关系较强,又绝大部分的点都在直线y=x的下方,所以回归直线的斜率大于0 且小于1,所以结论最有可能成立的是B,故选B. B 3.1 题型1 线性回归分析  b b  b 解析 刷基础 4.[2019第一次质量评估]为了规定工时定额,需要确定加工某种零件 所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5), 由最小二乘法求得回归方程为 .若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+ y4+y5=(  ) A.75 B.155.4 C.375 D.466.2 由题意,可得 ,代入回归方程中,可得 =0.67×30+54.9=75,所以y1+y2+y3+y4 +y5=5× =375,故选C. C 3.1 题型1 线性回归分析 解析 刷基础 5.[山东临沂2018高二联考]已知变量x,y线性相关,且由观测数据算得样本平均数为 =2, =5,则由该观测数据得到的线性回归直线方程不可能是(  ) A.y=2.1x+0.8 B.y=-1.2x+7.4 C.y=2.25x+0.5 D.y=-1.25x+7.55 由题意可知观测数据的样本平均数为 =2, =5,即样本中心为(2,5).对于D项,当x=2时, y=-1.25×2+7.55=5.05,所以直线y=-1.25x+7.55不可能是回归直线方程,故选D. D 3.1 题型1 线性回归分析 题型2 回归效果的刻画 解析 刷基础 6.对相关系数r,下列说法正确的是(  ) A.|r|越大,线性相关程度越强 B.|r|越小,线性相关程度越强 C.|r|越大,线性相关程度越弱,|r|越接近0,线性相关程度越强 D.|r|≤1,且|r|越接近1,线性相关程度越强,|r|越接近0,线性相关程度越弱 两个变量之间的相关系数r的绝对值越接近于1,表示两个变量的线性相关性越强;r的绝对值越接 近于0,表示两个变量的线性相关性越弱,此时两个变量之间几乎不存在线性相关关系.故选D. D 3.1 题型2 回归效果的刻画 解析 刷基础 7.对某高三学生在连续多次数学测试中的成绩(单位:分)进行统计得到如下散点图.下面关于 这位同学的数学成绩的分析中,正确的个数为(  ) ①该同学的数学成绩总的趋势是在逐步提高; ②该同学在这连续九次数学测试中的成绩的最高分与最低分的差超过40分; ③该同学的数学成绩与测试次数具有线性相关性,且为正相关. A.0 B.1 C.2 D.3 根据散点图可知该同学的数学成绩与测试次数具有正相关关系,所以①③均正确;第一次的成绩 在90分以下,第九次的成绩在130分以上,所以②正确,故选D. D 3.1 题型2 回归效果的刻画 解析 刷基础 8.[广西2019高二月考]下列四个命题: ①残差平方和越小的模型,拟合的效果越好; ②用相关指数R2来刻画回归效果,R2越小,说明模型拟合的效果越好; ③散点图中所有点都在回归直线附近; ④随机误差e满足E(e)=0,其方差D(e)的大小可用来衡量预报的精度. 其中正确命题的个数是(  ) A.1 B.2 C.3 D.4 根据回归方程的性质得残差平方和越小的模型,拟合的效果越好,故①正确;用相关指数R2来刻 画回归效果,R2越大,说明拟合效果越好,故②不正确;散点图中所有点都在回归直线附近,不 正确,应该是大部分点都在回归直线附近,而不是所有点,故③不正确;随机误差e满足E(e)=0, 其方差D(e)的大小用来衡量预报的精度,故④正确.故选B. B 3.1 题型2 回归效果的刻画 解析 刷基础 9.[河南濮阳2019高二升级考试]某种产品的广告费支出x(万元)与销售额y(万元)之间有如表所 示的线性相关关系,y与x的线性回归方程为 ,当广告支出5万元时,随机误差的 效应(残差)为(  ) A.10 B.20 C.30 D.40 因为y与x的线性回归方程为 , 所以当x=5时, =6.5×5+17.5=50. 由表格知当广告支出5万元时,销售额为60万元,所以随机误差的效应(残差)为60-50=10.故选 A. A 3.1 题型2 回归效果的刻画 解析 刷基础 10.[贵州思南中学2019高二月考]设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线 性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程 为 ,那么针对某样本(170,58)的残差是________. 由题可得 ,残差 . -0.79 3.1 题型2 回归效果的刻画 解 刷基础 11.关于x与y有以下数据: 有如下两个线性模型:(1) ;(2) ,试比较哪一个拟合效果比较好. 由(1)得 与 的关系如下表: 所以 . 3.1 刷基础 所以 由(2)得 与 的关系如下表: 所以 所以 由 =0.845, =0.82知 > ,所以方程(1)的拟合效果比较好. 3.1 解析 刷基础 12.[河南焦作2019高二期中]已知变量y关于x的回归方程为 ,其一组数据如下表所 示: 若x=5,则预测y的值可能为(  ) 由 ,得 ,令 ,则 . D 3.1 题型3 非线性回归分析 解 刷基础 13.为了研究某种细菌繁殖的个数随时间x的变化,收集数据如下: (1)用时间作解释变量,繁殖个数作预报变量,作出这些数据的散点图; (2)描述解释变量与预报变量之间的关系,计算残差、相关指数R2. (1)散点图如图所示. 3.1 题型3 非线性回归分析 刷基础 (2)由散点图可以看出样本点分布在一条指数函数 的周围,于是令z=ln y,则 由最小二乘法计算得 ,则有 . 即解释变量(时间)对预报变量(细菌繁殖的个数)变化解释了99.99%. 3.1 题型3 非线性回归分析 解析 刷易错 14.如果散点图中的所有样本点都落在一条斜率为非零实数的直线上,R2是相关指数,则(  ) A.R2=1  B.R2=0 C.0≤R2≤1    D.R2≥1 当散点图中的所有点都落在一条斜率为非零实数的直线上时,它的残差均为0,残差的平方和为0, 所以它的相关指数为1,即R2=1. A 3.1 易错点1 线性相关系数理解不正确致错 易错 警示 若散点图中的所有点都在一条直线上时,变量间的相关性最强,若直线的斜率大于0,则相关系 数为1;若直线的斜率小于0,则相关系数为-1. 解析 刷易错 15.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间 的线性相关系数,r2表示变量V与U之间的线性相关系数,则(  ) A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r2=r1 由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量 Y与X之间正相关,所以r1>0.而由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3), (12.5,2),(13,1),可知变量V与U之间负相关,所以r2<0.因此r1与r2的大小关系是r2<0<r1. C 3.1 易错点1 线性相关系数理解不正确致错 易错 警示 给出一组数据,判断该组数据的线性相关系数的符号,可根据该组数据变量之间的正、 负相关关系进行判断,若是正相关,则相关系数大于0;若是负相关,则相关系数小于0. 刷易错 16.已知x与y之间的几组数据如下表: 假设根据上表数据所得线性回归方程为 ,若某同学根据上表中的前两组数据(1,0)和 (2,2),求得的直线方程为 ,则以下结论正确的是  (  ) D 3.1 易错点2 求线性相关方程计算错误 刷易错 3.1 易错点2 求线性相关方程计算错误 解析 由题得 ,根据公式求得 . 又 ,所以 ,故选D. 易错 警示 给出一组具体数据求其线性回归方程时,由于回归直线的方程是 ,其中 , 计算量较大,因此计算要细心,公式使用要准确,要特别注意线性回归方程一定过样本点中心的应用. 刷能力 1.[湖北鄂东南省级示范高中教育改革联盟2018高二联考]在两个变量x与y的回归模型中选择了 四个不同的模型来拟合y与x之间的关系,它们的相关指数R2如下表所示,其中拟合效果最好的模型 是(  ) A.模型1 B.模型2 C.模型3 D.模型4 A 3.1 解析 在两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果越好,在 所给的四个选项中0.98是相关指数最接近于1的值,所以拟合效果最好的模型是模型1,故选A. 刷能力 2.已知线性回归方程中斜率的估计值为1.23,样本点的中心为(4,5),则该回归方程为(  ) A 3.1 解析 设线性回归方程为 ,由题意得 , ∴ . 又回归直线过样本点的中心(4,5),∴5=1.23×4+ ,∴ =0.08,∴回归方程 为 .故选A. 刷能力 3.下面的各图中,散点图与相关系数r不符合的是(  )B 3.1 解析 对于A,散点图上所有点都在一条斜率小于0的直线上,所以相关系数r=-1,A正确;对于B,散 点图上所有点都在一条斜率大于0的直线上,所以相关系数r=1,B错误;对于C,变量x,y的散点 图从左到右是向下的带状分布,所以相关系数-1<r<0,C正确;对于D,变量x,y的散点图中, x,y之间的相关关系非常不明显,所以相关系数r=0,D正确.应选B. 刷能力 4.(多选)[2019月考]下列说法正确的是(  ) A.在回归模型中,预报变量y的值不能由解释变量x唯一确定 B.若变量x,y满足关系y=-0.1x+1,且变量y与z正相关,则x与z也正相关 C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 D.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程 z=0.3x+4,则c=e4,k=0.3 ACD 3.1 解析 对于A,y除了受解释变量x的影响之外还受其他因素的影响,故正确;对于B, 变量x,y满足关 系y=-0.1x+1,则变量x与y负相关,又变量y与z正相关,则x与z负相关,故错误;对于C,由 残差图的意义可知正确;对于D,∵y=cekx,∴两边取对数,可得ln y=ln(cekx)=ln c+ln ekx= ln c+kx,令z=ln y,可得z=ln c+kx.∵z=0.3x+4,∴ln c=4,k=0.3,∴c=e4,故正确.故 选ACD. 刷能力 5.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12 岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回 归直线L.根据图中数据,下列选项中对该样本描述错误的是(  ) A.据样本数据估计,该地区青少年的身高与年龄成正相关 B.所抽取数据中,5 000名青少年的平均身高约为145 cm C.直线L的斜率的值近似等于样本中青少年平均身高每年的增量 D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点 一定在直线L上 D 3.1 刷能力 3.1 解析 在给定范围内,随着年龄的增加,年龄越大身高越高,故该地区青少年的身高与年龄成正相 关,故A正确;用样本数据估计总体可得平均数大约是145 cm,故B正确;根据直线斜率的意 义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性, 根据数据做出的点可能在直线附近,不一定在直线上,故D错误,故选D. 刷能力 6.[河北沧州2019高二期中]已知方程 是根据女大学生的身高预报体重的回归 方程,其中x, 的单位分别是 cm,kg,则该方程在样本(165,57)处的残差是(  ) A.54.55 B.3.45 C.2.45 D.111.55 C 3.1 解析 由回归方程可得当身高为165 cm时,体重的预测值 =0.85×165-85.7=54.55,故样本的残 差值为57-54.55=2.45.故选C. 刷能力 7.[河南创新发展联盟2018高二期末]电脑芯片的生产工艺复杂,在某次生产试验中得到6组数据 (x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),(x6,y6).根据收集到的数据可知 =10,由最小二 乘法求得回归直线方程为 ,则y1+y2+y3+y4+y5+y6=(  ) A.50.5 B.45.5 C.100.2 D.109.2 D 3.1 解析 由 可知 ,所以y1+y2+y3+y4+y5+y6=18.2×6= 109.2,故选D. 刷能力 8.某化工厂产生的废气经过过滤后排放,以模型y=p0e-kx去拟合过滤过程中废气的污染物浓度y mg/L 与时间x h之间的一组数据,为了求出回归方程,设z=ln y,其变换后得到线性回归方程为 =-0.5x+ 2+ln 300,则当经过6 h后,预报废气的污染物浓度为(  ) A 3.1 解析 当x=6时, , 刷能力 9.[广东四校2018高三联考]如图是一组数据(x,y)的散点图,经最小二乘法计算,y与x之间的线性回归 方程为 ,则 =________. 0.8 3.1 解析 ,将(2,2.6)代入 ,解得 =0.8. , 刷能力 10.某个服装店经营某种服装,在某周内每天获得的纯利润y(元)与该周每天销售这种服装数量x(件)之间 的一组数据关系如下表: 已知 参考公式:回归方程是 , 其中 (1)求 ; (2)画出散点图; (3)求每天的纯利润y与每天销售数量x之间的线性回归方程. 3.1 刷能力 3.1 解 , (2)散点图如图所示. (3)由散点图知, y与x具有线性相关关系,设线性回归方程为 , ∴线性回归方程为 刷能力 11.中石化集团通过与安哥拉国家石油公司合作,获得了安哥拉深海油田区块的开采权,集团在某 些区块随机初步勘探了部分旧井,取得了地质资料.进入全面勘探时期后,集团按网络点来布置井位 进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井 的地质资料,不必打这口新井,以节约勘探费用.勘探初期部分旧井的数据资料见下表: (1)1~6号旧井位置线性分布,借助前5组数据求得回归方程为y=bx+a,其中b=6.5,求a,并估计 6号旧井中y的预报值. 3.1 刷能力 (2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的 的值与(1)中b,a的值的差均不超过 10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井.(注:其中 的计 算结果用四舍五入法保留1位小数) 3.1 (1)因为前5组数据 回归直线必过点 ,则 故回 归方程为y=6.5x+17.5.当x=1时,y=6.5x+17.5=24,即y的预报值为24. , 解 刷能力 (2)根据1,3,5,7号井的数据计算可得 所以 即 ,由(1)知b=6.5,a=17.5. 因为 ,均不超过10%,因此使用位置最接近的已有旧井6(1,24). 3.1

资料: 3.2万

进入主页

人气:

10000+的老师在这里下载备课资料