变量的相关性
(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.
(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
回归分析
了解回归分析的基本思想、方法及其简单应用.
1.相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相
关关系是一种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;
当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.
【注意】相关关系与函数关系的异同点:
共同点:二者都是指两个变量间的关系.
不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不
一定是因果关系,可能是伴随关系.
2.散点图
将样本中的 n 个数据点 ( )( 1, )2i ix y i n , , , 描在平面直角坐标系中,所得图形叫做散点图.
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在
从左上角到右下角的区域内,两个变量的相关关系为负相关.
具有正相关关系的两个变量的散点图如图 1,具有负相关关系的两个变量的散点图如图 2.
3.回归分析
如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直
线叫做回归直线.学&科网
回归直线对应的方程叫做回归直线方程(简称回归方程).
4.回归方程的求解
(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.
若变量 x 与 y 具有线性相关关系,有 n 个样本数据 ( )( 1, )2i ix y i n , , , ,则回归方程 ˆˆ ˆy bx a 中
1 1
2 2 2
1 1
( )( )
( )
ˆ
n n
i i i i
i i
n n
i i
i i
x x y y x y nx y
b
x x x nx
, ˆˆa y bx .
其中 1 2
1
1 ,
n
n
i
i
x xx xn n
x
2
1
11 n
n
i
i
y yn n
y y y
,
( , )x y 称为样本点的中心.
(2)线性回归模型 y bx a e ,其中 e 称为随机误差,自变量 x 称为解释变量,因变量 y 称为预报
变量.
【注意】①回归直线 ˆˆ ˆy bx a 必过样本点的中心 ( , )x y ,这个结论既是检验所求回归直线方程是否准
确的依据,也是求参数的一个依据.
②利用回归直线方程不但可以预测在 x 取某一个值时,y 的估计值,同时也能知道 x 每增加 1 个单位, ˆy
的变化量.
③在回归直线方程中, ˆb 既表示直线的斜率,又表示自变量 x 的取值每增加一个单位时,函数 y 的改变
量.
5.相关系数
(1)样本相关系数 r 的计算公式
我 们 可 以 利 用 相 关 系 数 来 定 量 地 衡 量 两 个 变 量 之 间 的 线 性 相 关 关 系 , 计 算 公 式 为
1
2 2
1 1
( )( )
( ) ( )
n
i i
i
n n
i i
i i
x x y y
r
x x y y
.
(2)样本相关系数 r 的性质
①| | 1r ;
②当 r>0 时,表明两个变量正相关;当 r0 时,正相关;r