样本中所包含个体的个数,或样本所含的元素个数,称为样本容量。常用
n 表示。
样本中的个体有时也称为样品,如对总体
X 进行了 n 次观测,记 Xi 为第 i 次观测所得
的结果,称
(X1,X2,…,Xn)为容量是 n 的样本。
抽样的意义
人们从总体中抽取样本是为了认识总体。即从样本推断总体,如推断总体是什么分布
?
总体均值为多少
?总体的标准差是多少?为了使此种
统计
推断有所依据,推断结果有效,由
样本获得对总体的正确认识,需要对抽样方法有一定的要求。
如为了了解女性所占的比例,不能专门到坦克部队去取样,也不能专门到纺织厂去取
样,而应当进行随机抽样。直观地讲就是抽样时,每个个体被抽到的可能性相同。下面介绍
一种常见的抽样方法。
简单随机样本
简单随机样本:满足下面两个条件的样本称为简单随机样本,简称随机样本,或样本。
简单随机样本的基本特点:
(1)随机性。总体中每个个体都有相同的机会加入样本。例如,按随机性要求抽出 5 个样
品,记为
,则其中每一个都应与总体分布相同。只要随机抽样就可保证此点实施。
(2)独立性。从总体中抽取的每个个体对其他个体的抽取无任何影响。假如总体是无限的,
独立性容易实现,若总体很大,特别与样本量
n 相比是很大时,即使总体是有限的,此种
抽样独立性也可基本得到保证。
即把在不变的条件下对总体
X 的 n 次独立观测(如 n 次放回抽样)叫做 n 次简单随机取样,
这样得到的样本称为简单随机样本。
定义:设
(X1,X2,…,Xn)为取自总体 X 的样本,如果 X1,X2,…,Xn 相互独立且
与总体
X 同分布(简称 X1,X2,…,Xn 独立同分布),则称此样本为简单随机样本。
注释:
今后讨论的样本都是指满足这些要求的简单随机样本。在实际抽样时,也应按此要求从
总体中进行抽样。这样获得的样本能够很好地反映实际总体的状态。两个不同的总体,若是
按随机性和独立性要求进行抽样,则机会大的地方
(概率密度值大>被抽到样本的个体就多;
而机会少的地方
(概率密度值小),被抽到样本的个体就少。分布愈分散,样本也就分散;分布
愈集中,样本也相对集中。
抽样切忌受到干扰,特别是人为干扰。某些人为的倾向性会使所得样本不是简单随机样
本,从而使最后的统计推断失效。