概念
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。特点
简单随机抽样的特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样要求被抽取的样本的总体个数N是有限的。
简单随机样本数n小于等于样本总体的个数N。
简单随机样本是从总体中逐个抽取的。
简单随机抽样是一种不放回的抽样。
简单随机抽样的每个个体入样的可能性均为n/N。缺点
只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等。在市场调研范围有限,或调查对象情况不明,难以分类,或总体单位之间特性差异程度小时采用此法效果较好。抽样方法
简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。在重复抽样中,每次抽中的单位仍放回总体,样本中的单位可能不止一次被抽中。不重复抽样中,抽中的单位不再放回总体,样本中的单位只能抽中一次。社会调查采用不重复抽样。
简单随机抽样的具体作法有:
直接抽选法
直接抽选法,即从总体中直接随机抽选样本。如从货架商品中随机抽取若干商品进行检验;从农贸市场摊位中随意选择若干摊位进行调查或访问等。抽签法
先将总体中的所有个体编号,并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取 次,就得到一个容量为 的样本,对个体编号时,也可以利用已有的编号,例如从全班学生中抽取样本时,可以利用学生的学号、座位号等。抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。随机数表法
随机数表法,即利用随机数表作为工具进行抽样。随机数表又称乱数表,是将0至9的10个数字随机排列成表,以备查用。其特点是,无论横行、竖行或隔行读均无规律。因此,利用此表进行抽样,可保证随机原则的实现,并简化抽样工作。其步骤是:① 确定总体范围,并编排单位号码;② 确定样本容量;③ 抽选样本单位,即从随机数表中任一数码始,按一定的顺序或间隔读数,选取编号范围内的数码,超出范围的数码不选,重复的数码不再选,直至达到预定的样本容量为止;④ 排列中选数码,并列出相应单位名称。举例说明如何用随机数表来抽取样本。
为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:
第一步,先将40件产品编号,可以编为00,01,02, ,38,39。
第二步,在附录1随机数表中任选一个数作为开始,例如从第8行第5列的数59开始,为便于说明,我们将附录1中的第6行至第10行摘录如下。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28
第三步,从选定的数59开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34。至此,10个样本号码已经取满,于是,所要抽取的样本号码是
16 19 10 12 07 39 38 33 21 34
注 将总体中的N个个体编号时可以从0开始,例如N=100时编号可以是00,01,02, 99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。
当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。
在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。应用
简单随机抽样是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此,在实际中直接采用简单随机抽样的并不多。