人教版高中数学选择性必修第三册学案:8.2《一元线性回归模型及其应用》第一课时(含解析)
加入VIP免费下载
加入VIP免费下载
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天资源网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:403074932
资料简介
8.2 一元线性回归模型及其应用8.2.1 一元线性回归模型8.2.2 一元线性回归模型参数的最小二乘估计第一课时 一元线性回归模型及其参数的最小二乘估计课标要求素养要求1.结合具体实例,了解一元线性回归模型的含义.2.了解模型参数的统计意义,了解最小二乘原理.通过学习一元线性回归模型的含义,体会数学抽象及数据分析素养.新知探究 恩格尔系数(Engel’sCoefficient)是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额. 一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出所占比例将会下降.问题 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?提示 为了对两个变量线性相关关系进行预测,我们通常建立一元线性回归模型进行预测.1.一元线性回归模型我们称为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.2.线性回归方程与最小二乘法回归直线方程过样本点的中心(,),是回归直线方程最常用的一个特征我们将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(leastsquaresestimate),其中拓展深化[微判断]1.两个变量之间产生随机误差的原因仅仅是因为测量工具产生的误差.(×)提示 产生随机误差的原因有多种,测量工具和测量精度仅仅是其中的一个方面.2.线性回归方程最能代表观测值x,y之间的线性关系,且回归直线过样本点的中心(,).(√) [微训练]1.(多选题)下列有关回归直线方程=x+叙述正确的是(  )A.反映与x之间的函数关系B.反映y与x之间的函数关系C.表示与x之间不确定关系D.表示最接近y与x之间真实关系的一条直线解析 =x+表示与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系,∴选AD.答案 AD2.某地区近十年居民的年收入x与支出y之间的关系大致符合=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则年支出估计是__________亿元.解析 ∵=0.8x+0.1,∴=0.8×15+0.1=12.1(亿元).答案 12.1[微思考]1.任何一组数据都可以由最小二乘法得出回归直线方程吗?提示 用最小二乘法求回归直线方程的前提是先判断所给数据具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程无意义.2.根据=-及回归直线方程=x+,判断点(,)与回归直线的关系是什么?提示 由=-得=+,因此点(,)在回归直线上.题型一 求回归直线方程【例1】 某研究机构对高三学生的记忆力x和判断力y 进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.解 (1)如图:样本点分布在一条直线附近,y与x具有线性相关关系.(2)xiyi=6×2+8×3+10×5+12×6=158,==9,==4,(2)xiyi=6×2+8×3+10×5+12×6=158,x=62+82+102+122=344,===0.7,=-=4-0.7×9=-2.3,故线性回归方程为=0.7x-2.3.(3)由(2)中线性回归方程可知,当x=9时,=0.7× 9-2.3=4,故预测记忆力为9的同学的判断力约为4.规律方法 求线性回归方程的一般步骤(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.(3)把数据制成表格xi,yi,x,xiyi.(4)计算,,x,xiyi.(5)代入公式计算,,公式为(6)写出线性回归方程=x+.【训练1】 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归直线方程.解 (1)散点图如图所示.样本点分布在一条直线附近,y与x具有线性相关关系.(2)列出下表,并用科学计算器进行有关计算.i12345xi24568yi3040605070 xiyi60160300300560x416253664=5,=50,x=145,xiyi=1380于是可得,===6.5,=-=50-6.5×5=17.5.于是所求的回归直线方程是=6.5x+17.5.题型二 利用回归直线方程对总体进行估计【例2】 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)画出散点图;(2)如果y与x有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y=x-,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?解 (1)散点图如图所示:(2)近似直线如图所示: (3)由y≤10得x-≤10,解得x≤14.9,所以机器的运转速度应控制在14转/秒内.【迁移1】 (变条件,变设问)本例中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少?解 因为y=x-,所以当x增加一个单位时,y大约增加,即每增加一个单位的转速,生产有缺点的零件数近似增加1个.【迁移2】 (变条件,变设问)本例中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速.解 因为y=x-,所以当y=7时,7=x-,解得x≈11,即估计机器的转速约为11转/秒.规律方法 本题已知y与x是线性相关关系,所以可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.【训练2】 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次实验,得到的数据如下:零件的个数x(个)2345加工的时间y(h)2.5344.5(1)已知零件个数与加工时间线性相关,求出y关于x的线性回归方程;(2)试预测加工10个零件需要多少时间? 解 (1)由表中数据,得xiyi=2×2.5+3×3+4×4+5×4.5=52.5,x=22+32+42+52=54,==3.5,==3.5.∴==0.7.∴=-=3.5-0.7×3.5=1.05.∴y关于x的线性回归方程为=0.7x+1.05.(2)加工10个零件时,大约需要0.7×10+1.05=8.05(小时).一、素养落地1.通过本节课的学习,提升数学抽象素养及数据分析素养.2.求线性回归方程时应注意的问题(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算,的值时,要先计算,然后才能算出.3.利用回归方程,我们可以进行估计和预测.若回归方程为=x+,则在x=x0处的估计值为0=x0+.二、素养训练1.工人工资y(元)与劳动生产率x(千元)的线性回归方程为=50+80x,下列判断正确的是(  )A.劳动生产率为1000元时,工人工资为130元B.劳动生产率提高1000元时,工人工资平均提高80元 C.劳动生产率提高1000元时,工人工资平均提高130元D.当月工资为250元时,劳动生产率为2000元解析 因为回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1000元时,工人工资平均提高80元.答案 B2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是(  )A.y与x具有正的线性相关关系B.回归直线过样本点中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg解析 当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79kg.答案 D3.设有一个回归方程为=-1.5x+2,则变量x增加一个单位时(  )A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位解析 ∵两个变量线性负相关,∴变量x增加一个单位,y平均减少1.5个单位.答案 C4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是__________.解析 回归直线的斜率的估计值为1.23,即=1.23,又回归直线过定点(4,5),∴=5-1.23×4=0.08,∴=1.23x+0.08. 答案 =1.23x+0.085.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如下表:广告费用x/万元3456销售额y/万元25304045根据上表可得回归直线方程=x+中的为7,据此模型,若广告费用为10万元,则预计销售额为________万元.解析 由题意得==4.5,==35.∵回归直线方程=x+中=7,∴35=7×4.5+,解得=3.5,∴=7x+3.5.∴当x=10时,=7×10+3.5=73.5(万元).答案 73.5基础达标一、选择题1.某商品销售量y(件)与销售价格x(元/件)负相关,则其线性回归方程可能是(  )A.=-10x+200B.=10x+200C.=-10x-200D.=10x-200解析 x的系数为负数,表示负相关,排除B,D;由实际意义可知x>0,y>0,显然C不满足,故选A.答案 A2.根据如下样本数据得到的回归方程为=x+,则(  ) x345678y4.02.5-0.50.5-2.0-3.0A.>0,>0B.>0,<0C.<0,>0D.<0,<0解析 画出散点图,知>0,<0.答案 B3.已知x与y之间的一组数据:x0123y1357若y与x线性相关,则y与x的回归直线=x+必过(  )A.点(2,2)B.点(1.5,0)C.点(1,2)D.点(1.5,4)解析 ∵==1.5,==4,∴回归直线必过点(1.5,4).故选D.答案 D4.已知x与y之间的一组数据:x0123ym35.57已求得关于y与x的线性回归方程为=2.2x+0.7,则m的值为(  )A.1B.0.85C.0.7D.0.5解析 ==1.5,==,将其代入=2.2x +0.7,可得m=0.5,故选D.答案 D5.已知表中y与x之间的线性回归方程是=x+5.25,则等于(  )x1234y4.5432.5A.-0.5B.-0.6C.-0.7D.-0.8解析 由表中数据,得==2.5,==3.5,故回归直线=x+5.25经过样本点的中心(2.5,3.5),得3.5=2.5+5.25,解得=-0.7,故选C.答案 C二、填空题6.在一次试验中测得(x,y)的四组数据如下:x16171819y50344131根据上表可得线性回归方程=-5x+,据此模型预报当x=20时,的值为__________.解析 ==17.5,==39,∴回归直线过点(17.5,39),∴39=-5×17.5+,∴=126.5,∴当x=20时,=-5×20+126.5=26.5.答案 26.57.某工厂对某产品的产量与成本的资料分析后有如下数据: 产量x(千件)2356成本y(万元)78912由表中数据得到的线性回归方程=x+中=1.1,则预测当产量为9千件时,成本约为__________万元.解析 由表中数据得=4,=9,代入线性回归方程解得=4.6,∴当x=9时,=1.1×9+4.6=14.5.答案 14.58.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差__________分.解析 令两人的总成绩分别为x1,x2,则对应的数学成绩估计为1=6+0.4x1,2=6+0.4x2,所以|1-2|=|0.4(x1-x2)|=0.4×50=20.答案 20三、解答题9.某单位为了了解用电量y度与气温x℃之间的关系随机统计了某4天的用电量与当天气温如下表:气温(℃)141286用电量22263438(1)求用电量y与气温x的线性回归方程;(2)由(1)的方程预测气温为5℃时,用电量的度数.解 (1)由题意知样本值n=4,=10,=30,则= ===-2,=-=30-(-2)×10=50,所以线性回归方程为=-2x+50.(2)令(1)中的回归方程中x=5,代入方程得=40,所以预测当气温是5℃时,用电量是40度.10.有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)x(单位:万元)和这一年这6个城市患白血病的儿童数量y(单位:人),如下表:人均GDPx/万元1086431患白血病的儿童数y/人351312207175132180(1)画出散点图,并判定这两个变量是否具有线性相关关系;(2)通过计算可知这两个变量的回归直线方程为=23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?解 (1)根据表中数据画散点图,如图所示.从图中可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.(2)上述断言是错误的.将x=12代入=23.25x+102.15得=23.25×12+102.15=381.15>380,但381.15 是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.能力提升11.在2020年5月1日,某市物价部门对本市的5家商场某商品的一天销售量及其价格进行了调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x(元)99.51010.511销售量y(件)1110865由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归直线方程是:=-3.2x+,则=(  )A.-24B.35.6C.40.5D.40解析 价格的平均数是==10,销售量的平均数是==8,将(10,8)代入回归方程=-3.2x+,得8=-3.2×10+,∴=8+3.2×10=40,故选D.答案 D12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程=x+,其中=-20;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,若该产品的成本是4元/件,则为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解 (1)由于=(8+8.2+8.4+8.6+8.8+9)=8.5, =(90+84+83+80+75+68)=80,所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值,故当单价定为8.25元时,工厂可获得最大利润.创新猜想13.(多选题)某公司过去五个月的广告费支出x(单元:万元)与销售额y(单位:万元)之间有下列对应数据:x24568y▲40605070工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,则下列说法正确的是(  )A.销售额y与广告费支出x正相关;B.丢失的数据(表中▲处)为30;C.该公司广告费支出每增加1万元,销售额一定增加6.5万元;D.若该公司下月广告费支出为8万元,则销售额约为75万元.解析 由回归直线方程为=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,所以A正确;设丢失的数据为m,由表中的数据可得=5,=,把点代入回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万 元,所以C不正确;若该公司下月广告费支出为8万元,则销售额约为=6.5×8+17.5=69.5(万元),所以D不正确.故选AB.答案 AB14.(多空题)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为__________;用线性回归分析的方法,预测小李该月6号打6h篮球的投篮命中率为__________.解析 ===0.5,==3.由公式,得=0.01,从而=-=0.5-0.01×3=0.47.所以回归方程为=0.47+0.01x.所以当x=6时,=0.47+0.01×6=0.53.答案 0.5 0.53

资料: 5702

进入主页

人气:

10000+的老师在这里下载备课资料