统计分析(二)
考点2:抽样分布★★?
统计学中把描述总体特征的某种指标称为参数,
把描述从总体中抽取的样本的函数称为样本统计量,
抽样分布就是样本统计量的概率分布。
一般来说,精确的抽样分布是通过正态总体得到的。
由正态总体得到的χ2分布、t分布、F分布,常被称为三大抽样分布。
三大抽样分布以标准正态分布为基石,在实际中有广泛的运用。
(一)正态分布(Normal Distribution)
又称高斯分布,最早由棣莫弗提出,之后由高斯应用推广, 是统计学中最常见也是应用最广泛的一种连续型分布。
若随机变量X的概率密度函数具有如下形式:
则称随机变量X服从期望为μ、标准差为σ的正态分布,记作X~N(μ,σ^2)。
正态分布的累积分布函数形式为:
正态分布的期望E(X)=μ(-∞<μ<+∞),
方差 D(X)=σ^2(σ>0)。
正态分布的概率密度函数呈钟形分布,曲线关于x=μ对称,并在x=μ处达到最大值。
曲线的陡峭程度由σ^2决定:
σ2越大,曲线越平坦;σ2越小,曲线越陡峭。
当x趋近于无穷大(或无穷小)时,曲线无限接近于x轴。
? 标准正态分布
? χ2分布
? t分布
? F分布
不同自由度下F分布密度函数曲线图

(四)F分布

则称统计量F服从自由度n1和n2的F分布,记为F~F(n1, n2)。
2、t分布的概率密度函数图形是以0为中心、左右对称的钟形分布;t分布的图形及其形态变化与自由度n的大小有关。
自由度越小,曲线越平坦;自由度越大,曲线越接近标准正态分布曲线。
当自由度大于30时,图形接近标准正态分布。
(三)t分布
1、t分布(Student's t Distribution), 设随机变量X服从标准正态分布N(0,1),Y服从分布χ2 (n),则?
服从自由度为n的t分布, 记为t~t(n) 。
3、随着自由度n的增大,卡方分布向正无穷方向延伸(均值n变大),分布曲线在形态上也会愈发平坦,即χ2分布的方差与自由度有正向关系。
4、χ2分布具有可加性:
若X~χ2(n1)?与Y~χ2(n2)?相互独立,
X+Y服从自由度为(n1+ n2)的χ2分布;
X-Y服从自由度为(n1-n2)的χ2分布。
(二)χ2分布
1、χ2分布由阿贝(Abbe)于1863年首次提出,是统计学中的一个重要分布。
2、若有n个相互独立且服从标准正态分布的随机变量X1,X2,…,Xn?,则可利用这n个随机变量的平方和构成一新的随机变量,其卡方分布规律称为χ2分布。
参数n称为自由度,χ2分布特征由自由度决定。
期望μ=0、标准差σ=1的正态分布被称为标准正态分布。
对于任何一个正态分布X~N(μ,σ^2),都可通过
Z=(X-μ)/σ的线性变换转化为标准正态分布Z~N(0,1)。
对于标准正态分布,有:
Φ(-x)=1 - Φ(x)
其中,Φ(x)为标准正态分布的分布函数。