问几个统计学方面的问题,望能详细点,因为本人不是统计专业 的

来源:百度知道 编辑:UC知道 时间:2024/05/22 11:26:58
1、T值和F值具体到多少才算合适?
2、异方差处理中权数如何确定?
3、如何判断数据是否正态分布?如何确定用何种方法分析数据?
4、如何判断两个变量是线性关系还是非线性关系?

1、T值和F值具体到多少才算合适?
T值取决于T检验,在对回归分析结果进行粗评判时,大致可以做出这样的判断,当估计系数的T值的绝对值的统计值超过2时,我么可以在显著性水平0.05下拒绝原假设H0,认为相应解释变量的影响是显著的,此时犯错误的概率不超过0.05。如果估计系数的绝对值的统计值远大于2,则犯错误的概率更小。所以2是一个分水岭。
F值取决于F检验。F=[ESS/(k-1)]/[RSS/(n-k)]~F(k-1,n-k) 若F>Fα(k-1,n-k),则拒绝原假设H0,说明回归方程显著;若F<Fα(k-1,n-k),则接受原假设H0,说明回归方程不显著。
2.异方差处理中权数如何确定?
一元加权最小二乘估计,加权最小二乘估计的方法实在平方和中和加入一个适当的权数ωi,以调整各项在平方和中的作用。一元线性回归的加权最小二乘的离差平方和为:
Qω(β0,β1)=∑ωi( yi-ýi)^2
=∑ωi(yi-β0-β1xi) ^2 其中,ωi为给定的第 i个观测值的权数。,观测值的权数应该是观测值误差项方差的倒数,即ωi=1/σ^2,其中,σ^2为第i个观测值误差项的方差。所以误差项方差较大的观测值接受较小的权数;误差项方差较小的观测值接受较大的权数。多元加权最小二乘法与之类似,再次不再赘述。
3.如何判断数据是否正态分布?如何确定用何种方法分析数据?
把这一列数据用软件做出它的散点图,然后再观察它是不是两头小,中间多。同时计算它的峰度和偏度等指标来判断!
4.如何判断两个变量是线性关系还是非线性关系?
相关系数来决定。变量之间的的相关关系可分为许多类型。从相关关系涉及的变量数量看,只有两个变量的相关关系,称为简单相关;三个或三个以上的变量的相关关系,称为多重相关或复相关。从变量相关的表现形式来看,当变量相关关系散布图上的点接近一条直线时,称为线性相关;当变量相关关系散布图上的点接近于一条曲线时,称为非线性相关。变量之间线性相关的程度,常用相关系数去度量。两个变量X和Y的总体相关系数为:ρxy=Cov(X,Y)/[Var(X)Var(Y)]^1/2 两个变量X和Y的样本系数 为r,| r|≤1,r 越近于1