回归直线方程指在一组具有相关关系的变量的数据(x与Y)间,一条最好地反映x与y之间的关系直线。根据以下回归直线公式即可算出a和b的值。
在一组具有相关关系的变量的数据(x与Y)间,通过散点图我们可观察出所有数据点都分布在一条直线附近,这样的直线可以画出许多条。
而我们希望其中的一条最好地反映x与Y之间的关系,即我们要找出一条直线,使这条直线“最贴近”已知的数据点,记此直线方程为(如右所示,记为①式)这里在y的上方加记号“^”,是为了区分Y的实际值y,表示当x取值Xi=1,2,……,6)时,Y相应的观察值为Yi,而直线上对应于Yi的纵坐标是 ①式叫做Y对x的回归直线方程,相应的直线叫做回归直线,b叫做回归系数。
回归直线的求法
最小二乘法:
总离差不能用n个离差之和
来表示,通常是用离差的平方和,即
作为总离差,并使之达到最小,这样回归直线就是所有直线中Q取最小值的那一条,这种使“离差平方和最小”的方法,叫做最小二乘法:
由于绝对值使得计算不变,在实际应用中人们更喜欢用:Q=(y1-bx1-a)²+(y2-bx-a²)+。。。+(yn-bxn-a)²
这样,问题就归结于:当a,b取什么值时Q最小,即到点直线y=bx+a的“整体距离”最小。
用最小二乘法求回归直线方程中的a,b有下面的公式:
b=X1Y1+X2Y2+……+XnYn-nX'(X的平均数)Y'(Y的平均数)/(X1)^2+(X2)^2+……+(Xn)^2-n(X')(X的平均数)^2
a=Y'(Y的平均数)-bX'(X的平均数)
根据样本求出x,y均值,方差,离差,
带入公式中,解出关于ab的方程组。