法律和经济科学

法学实证 | 法学实证研究中的抽样方案、抽样比例和案例

11
发表时间:2025-03-15 09:48作者:阳李

从纯粹理论的角度来看,为了获得科学和精准的研究成果,需要收集丰富的甚至是全部的调查信息,因此,只要是属于研究范围内的对象,都应该被纳入调查范畴。但是,展开全面调查无疑将耗费巨大的人力、物力和财力。2010年第六次全国人口普查为例,在人力方面,最初计划全国要动员600万普查员,最后普查结束时,全国实际参与人口普查的人员达到近千万人;在财力方面,根据全国人口普查条例,人口普查的经费由各级财政分级负担,在中央层面,财政部安排12.5亿元,发改委安排大概有2亿多,在地方层面,各省、市、县政府筹集大约60多亿元经费,全国汇总在一起大概花费80亿元。

即便如此,全面调查也还是无法彻底根除误差,例如第六次全国人口普查仍然存在漏登的情况,针对已经入户登记的全国500多万个小区,第六次全国人口普查领导小组随机再抽取402个小区进行复查,重新入户、重新访问、重新登记,经过比对发现,存在0.12%的净漏登率。

因此,社会科学研究通常从总体中抽取部分代表性样本进行调查,然后通过代表性样本的信息反馈于总体,进而推断总体的情况。

一、抽样的原则和步骤

一般意义上的抽样,系从全部调查对象中选取一部分对象进行调查,并依据对该部分选择对象的调查所获得的信息,对全部调查对象的情况和特征做出具有一定可靠性的估计和判断的方法。抽样方法的使用大大推动了社会科学领域的调查活动,既节省了研究资源、缩短了研究时间,又提高了研究资料的准确性和可靠性。

抽样依据的数学原理主要是大数法则和中心极限定理。大数法则也称大数定律,体现为随机事件的大量重复出现中,通常呈现出几乎必然的规律。通俗地说,大数法则就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率,偶然中包含着某种必然。就像抛硬币一样,当尝试抛硬币成千上万次后,就会发现,正面向上或者反面向上的次数都会接近一半。

当然,大数法则并非某个单独的定律,而是一个体系,包括切比雪夫大数定律,辛钦大数定律,泊松大数定律,马尔科夫大数定律等等。大数法则是抽样的理论基础,例如,将切比雪夫大数定律运用于抽样调查,就可以得出结论,随着样本量的增加,样本平均数均值将接近于总体均值。中心极限定理也表明,如果样本容量足够大,样本均值的抽样分布将近似服从正态分布,其正态分布的均值趋近于总体均值。大数法则和中心极限定理为统计推断中依据样本信息估计总体情况提供了理论依据。

样本量到什么程度,才能准确的反映出总体的情况?也就是说,应当如何选取一个好的样本。大体可以从两个角度予以切入,第一个角度是针对待研究的问题而言,不同的研究问题,对样本的要求也不一样,同一个样本,对某一个研究问题而言,可能是一个合格的样本,对另一个研究问题而言,这个样本可能就不合格了。例如,要测度京津冀城市群的总体法治水平,样本的选择自然要包括北京、天津和河北三地,但是要通过北京、天津和河北三地的样本法治水平来推断全国的总体法治水平,样本的数量显然就不够了。第二个角度是针对样本调查成本与总体估计精确度的关系而言,进行样本调查需要投入调查费用,获得高质量的调查数据往往意味着高额调查费用的投入,但是即便将抽样转换为普查,也还是会存在各式各样的误差,调查成本和高质量的调查数据之间存在一定的紧张关系。一个好的样本应具有较好的性价比,也就是说,在调查费用相同的条件下,获得调查数据的质量最高,或在调查数据质量相同的条件下,调查的成本最低。

具体而言,抽样包括以下原则和步骤:

(一)抽样的原则

第一,随机原则。所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查个体,使每个个体都有一定的机会被抽中,也就是必须保证总体中的每一个个体都有已知的、同等的被抽取为样本的概率。需要注意的是,随机不等于随便,随机有严格的科学含义,可以用概率来描述,而随便则带有人为主观的因素。例如,要在一所大学抽取100位大学生作为调查样本,若采用随机原则,就需要事先将该所大学的所有大学生按某种顺序(例如按照学号)编号,通过一定的随机化程序,如使用随机数字表,抽取出大学生样本,这样可以保证每位大学生都有相同的机会被选中。而如果调查人员站在教学楼门口,将最先走出楼外的100位大学生选为样本,这就是随便而不是随机,这种方法不能使该所大学的所有大学生都同等的机会被选中,当时没有在教学楼上课的大学生就不可能被选中。随机与随便的本质区别就在于,是否按照给定的入样概率,通过一定的随机化程序抽取样本个体。

第二,抽样成本收益最大化原则。在调查经费有限的条件下,应当选取符合要求的成本最小的抽样设计方案,即在满足精确度要求的前提下,力争实现所选取的样本最具代表性,最节约人力物力财力。正如对航空发动机零部件加工精度的要求和拖拉机发动机零部件加工精度的要求不能相提并论一样。

(二)抽样的步骤

第一,界定总体的范围。明确全体研究对象的范围是抽样的逻辑前提。例如,如果要调查某年度北京市中学生的法治意识水平,可将总体的范围确定为该年度北京市的所有中学生,包括初中、高中、职业中学等等,进而进行进一步的抽样,由抽样个体所获得的研究结论,只能推广到该年度的北京市中学生总体范围,不能推广到其他年度的北京市中学生总体范围。

第二,制定抽样框。抽样框又称“抽样框架”、“抽样结构”,是抽样调查的基础和前提。抽样框包含了所有研究对象之总体的信息,如企业名录、大学生名册或街道派出所的居民户籍册等。如果要从10000名大学生中抽出2000名组成一个样本,那么10000名大学生的名册,就是抽样框。理想的抽样框应该满足以下要求:必须覆盖目标总体,总体中的每个个体在抽样框中仅出现一次,既没有遗漏,也没有重复。在没有现成名单的情况下,抽样框可由调查人员自行编制。抽样框的作用不仅在于提供备选个体的名单以供抽选,它还是计算各个个体入样概率的依据。若没有抽样框,则不能计算样本个体的入样概率,也就无法进行概率抽样。

第三,确定样本容量。样本容量越大,相应的信息越能反映真实的总体,但也意味着更高的成本。合理确定样本容量的一项主要原则是,总体越小,样本的抽样比就必须越大,因为该样本具有与整个总体产生相同结果的高概率。较大的总体能够在较小的抽样比下得出同样好的样本,这是因为随着总体规模的增长,样本量对精确性的回报随之递减。

第四,确定抽样方式。抽样的具体方式有许多种,可以分为两个大类:概率抽样和非概率抽样。其中,概率抽样包括简单随机抽样、系统抽样、分层抽样、整群抽样等等,不同的抽样方式亦会产生不同的抽样误差;非概率抽样通常运用于探索性研究或初期研究,包括偶遇抽样、判断抽样、滚雪球抽样等等。

第五,评估样本的代表性。抽样的重要目标之一即在于使得样本能够充分代表总体,因此,在选择好样本后,应从样本的数据信息来初步判断其代表性。此时,可以选择一些在总体和样本中都比较容易找到的信息或特征来进行对比,如果总体与样本在此类信息或特征上具有相近似的分布,则该样本具有较强的代表性。需要注意的是,样本的选择应当尽量避免非典型性个体,例如,在对学术期刊的论文进行抽样时,可能需要适度考量每年第一期的论文数量或份额,因为第一期作为开年之作,往往大咖云集,论文质量可能显著超越全年度的平均水准。

二、抽样方式

(一)概率抽样

也称随机抽样,是指遵循随机原则进行的抽样,总体中每个个体都有一定的概率被选入样本。概率抽样中的概率,是指总体中的每个个体都有一定的非零概率被抽中,个体之间被抽中的概率可以相等(等概率抽样),也可以不等(不等概率抽样)。概率抽样具有下面几个特点:首先,抽样时按一定的概率以随机原则抽取样本。其次,每个个体被抽中的概率是已知的,或是可以计算出来,例如,要在1000个总体中随机抽取100个个体作为样本,那么每个个体被抽中的概率应当是10%。最后,当用样本对总体目标量进行估计时,要考虑到每个样本个体被抽中的概率,个体被抽中的概率越高,用样本对总体目标量的估计越准确。常用的概率抽样方法主要有简单随机抽样、分层抽样、系统抽样、整群抽样以及将以上几种方法结合使用的多阶段抽样等。

1)简单随机抽样。简单随机抽样的第一步是对总体中的每个个体逐一进行编号以制定出完备的抽样框,随后从抽样框中随机地、一个个地抽取个体作为样本,每个个体的入样概率是相等的。常用的简单随机抽样方法是抽签法,首先将总体中的每个个体逐一编号,将号码写在同规格的卡片上,然后将所有的卡片放入一个容器中,并充分搅动以便使其均匀混合,然后每次从中抽取一个卡片,连续抽取若干次,就得到一个简单随机样本。抽签法选取样本可以确保每个个体都有被抽中的可能性,而且被抽中的概率相同,例如,要在500位大学生中抽取100位,则先将500位大学生逐一编号,将编号完成的500张卡片放入同一容器均匀混合后抽取100次,每位大学生被抽中的概率都是20%

简单随机抽样方法的特点是简单、直观,有一个完整的抽样框与总体一一对应时,可以直接从中抽取样本,由于个体被选中的概率相同,用样本统计量对总体进行估计及计算估计量误差都比较方便。

不过,简单随机抽样也存在一些局限:首先是抽样框的构造难度。简单随机抽样的前提是抽样框的存在,当总体的数量很大时,构造抽样框并非易事,例如,要测度全国在读大学生的法治意识水平,那么抽样框就应当包括上千万的全国在读大学生,尽管从理论上可以构造这样的抽样框(这意味构造一个包含全国所有在读大学生的名册),但实际上难度非常大,几乎不太可能。如果我们降低难度,仅仅测度某一个大学在读大学生的法治意识水平,难度似乎降低了许多,因为总体只有数万人,但要构造包含该大学所有在读大学生的抽样框,也仍然具有一定的难度。另外,现实生活中某些研究总体的规模甚至无法准确界定,例如城市外来务工人员的准确规模,某地流浪人员的数量,等等。其次,简单随机抽样抽出的个体样本较为分散,给具体调查增加成本和困难。以测度某一个大学在读大学生的法治意识水平为例,即便在该大学的大力支持下成功构造了抽样框,并获得2000人的样本,但这2000人并不一定都在学校(可能在实习、访友、家里等等),无法当面访谈,甚至要获取这2000人的准确联系方式,都要花费大量的精力,最终导致极为高昂的调查费用。最后,简单随机抽样的抽样方式较为单一,没有结合其他方式以提高估计的效率,因为往往只适用于小规模、小样本的调查。

2)分层抽样。分层抽样也叫类型抽样,它不直接从总体中抽取样本,而是将总体按照某种共同的特征或规则划分为不同的层,然后从不同的层中独立、随机地抽取个体样本,各层的个体样本形成总体样本,可以对总体的参数进行推断。我们通过一个具体的案例来展示分层抽样的基本思路,即测度某大学在读大学生的法治意识水平,为计算方便,假设该大学共有大学生10000名,应当抽样2000名(20%)。首先,把总体按照某种共同的特征或规则划分为不同的组,可以按照多重不同的特征或规则进行分组,例如大学生的户籍(农村或城市)、性别(男性或女性)、年级(大一、大二、大三、大四本科生或研究生)、专业(理工农医类或文史哲艺类)等等,我们按照大学生的性别进行分组,其中女性组6000名,男性组4000名。然后,再用随机方法从两组大学生中分别抽取个体样本,也就是,女性组:6000*20%=1200名,男性组:4000*20%=800名,合计:1200+800=2000名。

上述案例中的分层抽样在确定各层样本数时,采用的是等比抽样法,原因在于按照大学生的性别进行分组时,不同的组别规模差异并不大,大致可归于同一量级,因而对不同的组采用相同的抽样比例不会影响总体的推断。不过,如果总体中某些组的个体数量很少,该组按照相同比例抽取的样本数量在样本总数中就特别少,就有可能影响总体推断的准确性。例如普通省属高校中,本科生的数量可能达到数万人,研究生的数量可能仅仅只有数千人,此时如果按照等比抽样的方法,就可能形成失衡的抽样样本。在这种情况下,研究者就可以采用不等比抽样的方法,使得个体数量较少的组也能获得相对较多的样本。当然,对于不等比抽样而言,虽然可以保证每组都有一定数量的样本,但由于各组的抽样比例不同,在分析时就需要对所获结果进行修正,以避免偏误,修正的方法主要有加权修正法和相对量修正法。

分层抽样方法可以确保样本中包含有各种特征的抽样单位,即使在总体差异性很大的情况下,样本的结构与总体的结构比较相近,可以提高总体估计的准确度。对于较大规模的抽样,分层抽样方法还可以为组织实施调查提供诸多便利(例如按行业或地区进行分层时)。同时,分层抽样既可以对总体参数进行估计,也可以对各层的参数进行估计,已经在实践中获得广泛的应用。

3)系统抽样。系统抽样,也叫等距抽样或机械抽样,是将总体的各个个体按照一定的特征或规则排列起来,然后按照固定的顺序和间隔来抽取样本的方法。从某种程度而言,系统抽样实际是简单随机抽样的特定版本的体现,简单随机抽样需要自行对总体中的每个个体逐一进行编号以制定出完备的抽样框,系统抽样中的抽样框通常已经按照某种特定的特征或规则予以排列,更为方便,可以直接使用。具体而言,系统抽样系首先将总体中的个体按一定的特征或规则排列起来并编号,假设总体中一共有N个个体,打算抽样n个样本,那么根据抽样比例计算出抽样间隔rr=N/n),随后在第一个间隔(介于12,……,r之间)内随机选取某一个编号i为第一个样本编号,最后依照间隔r依次选取第i+ri+2ri+3r等编号,直至选满既定样本数量,这些编号所代表的个体即为被选中的样本。系统抽样法操作简便,实施起来不易出错。例如,我们要对1998年至2018年期间《中国法学》杂志上的学术论文进行抽样调查,就可以使用系统抽样法。《中国法学》在此期间一共发表2131篇论文,假设我们按照30%的比例抽样,那么抽取样本论文大致是639.3篇。《中国法学》为双月刊,每年共出版6期,因此我们可以结合期刊的出版方式,抽取每年第2期和第5期中的所有论文,最终即可以抽取663篇,符合抽样的要求,同时亦比较简便可行。

系统抽样同样需要注意样本的代表性问题。在将总体的各个个体按照一定的特征或规则排列起来时,需要观察此时的排列特征或规则是否具有某些独特性特征,从而尽量避免选出偏误性的样本。例如,在对杂志上的学术论文进行抽样调查时,首先应该大致的浏览一下,该杂志是否具有某些特有的规律,例如组稿或约稿在其中的分布规律,又如杂志每年的第1期,作为开年之作,往往存在某些重点讨论或分析,可能不宜作为样本的选取范围。

4)整群抽样。整群抽样先将总体划分为多个次级组合,再随机地抽取若干次级组合,并对抽中组合中包含的所有个体进行调查。整群抽样在抽取样本时只需要次级组合的抽样框,而不必要求抽样框包括所有的个体,从而大大简化了编制抽样框的工作量。次级组合通常具有某些共同的特征,调查相对容易,而且易于实施。例如,欲测度某大学在读大学生的法治意识水平,可以以全校范围内的所有班级或专业作为次级组合建立抽样框,然后通过不重复抽样方法,选取若干个班级或专业的所有大学生进行调查。

整群抽样的主要缺点在于样本的代表性可能存疑。一般而言,同一次级组合内的个体往往具备一定的相似性,尤其是对于某些特定的次级组合,例如同一自然村落,同一高等学校,同一居民小区等等,有可能使得样本的代表性存在缺陷。所以,在样本量大致相当的条件下,整群抽样的抽样误差比简单随机抽样、系统抽样等方式要大一些。此时,要得到与简单随机抽样、系统抽样等方式相同的准确度,整群抽样则需要增加基本次级组合的个数,同时适时注意基本次级组合的异质性。

5)多阶段抽样。多阶段抽样实质是分层抽样与整群抽样的结合。以二阶段抽样为例介绍其思路,首先,抽取初级抽样单位,但并不是调查其中包含的所有个体,而是再进一步抽样,从初级抽样单位中抽取出最终抽样单位,进而从最终抽样单位中选取若干个体样本进行调查。多阶段抽样具有诸多优点,首先,多阶段抽样不需要构造包含所有个体的抽样框,而是可以逐级构造抽样框,这就显著降低了抽样框的构造难度。其次,由于多阶段抽样的抽样样本相对集中,从而可以极大的节约调查费用,降低调查的总成本。最后,多阶段抽样实行再抽样,使调查单位并不局限于某个特定的范围,而是可能在分布更广的范围内展开。多阶段抽样也存在一定局限,每个阶段的抽样都会产生一定的误差,经多阶段抽样而来的样本,其误差系由每个阶段的误差累计而成,总体误差会随着抽样阶段的增多而增大。

我们以中国综合社会调查(Chinese General Social SurveyCGSS2003-2006抽样方案为例,对多阶段抽样进行大致的介绍。中国综合社会调查的抽样方案为分层的四阶段不等概率抽样首先,就抽样单位而言,各阶段的抽样单位为第一阶段:以区(地级市、省会城市和直辖市的各大城区和郊区)、县(包括县级市)为初级抽样单位。第二阶段:以街道、乡镇为二级抽样单位。第三阶段:以居民委员会、村民委员会为三级抽样单位。第四阶段:以家庭住户并在每户中确定1人为最终单位。其次,构建抽样框,根据当时的行政区划资料,全国共有2801个区县单位,这些区县单位作为初级抽样单元构成调查总体,具体划分为5个抽样框。抽样框1三大直辖市市辖区,具体包括北京、天津、上海三个直辖市的共44个市辖区(重庆与京津沪三大直辖市的同质性并不明显,划入抽样框2。抽样框2:省会城市市辖区,具体包括全国26个省会城市和重庆市的共175个市辖区。抽样框3:东部地区区县,具体包括京津沪三大直辖市和东部6省的所有区县,除去直辖市和6个省会城市市辖区部分,共611个区县。抽样框4:中部地区区县,具体包括中部11省和自治区的所有区县,除去11个省会城市市辖区部分,共1136个区县。抽样框5:西部地区区县,具体包括西部10省和自治区的所有区县,除去10个省会城市市辖区部分,共835个区县。最后,在样本分配方面,总样本数10000,采用四阶段抽样方案,在每个抽选出的初级抽样单元(区/县)中抽出4个二级抽样单元(街道/乡镇),在每个抽选出的二级单元中抽出2个三级抽样单元(村委会/居委会),在每个抽选出的三级抽样单元中抽出10个最终抽样单元

(二)非概率抽样

非概率抽样与概率抽样的本质区别,在于抽取样本时并非依据随机原则,而是根据某些特定的方式从总体中抽出部分个体对其开展调查。非概率抽样的特点是操作比较简便,抽样的总成本比较低,而且对于抽样的具体要求不是很高(例如误差估计,样本规模等),适合于探索性、前沿性的研究。

1)方便抽样。方便抽样又称随意抽样或者偶遇抽样,系调查者根据方便的原则,于特定的时间和地点,随意选择抽样调查个体的非概率抽样方法。例如,欲测度某大学在读大学生的法治意识水平,为了抽样方便,即在学校校门、图书馆、教学楼或食堂,随意抽取经过的大学生进行访问;又如为了测度新《道路交通安全法》的实施效果,在繁华的主干道上,随意抽取部分行人或者驾车司机进行调查。方便抽样的优点是易于实施,调查成本低,可以在较短的时间内获取大量样本,缺点是个体样本的选择带有较大随意性,且有时样本无法代表有清晰界定的总体(例如在繁华的主干道上,随意抽取部分行人或者驾车司机进行调查,就无法明确样本的总体),因此,调查结论不能或不宜推广至总体。为了提高方便抽样的准确率和代表性,应当选择总体频率分布较为合理、结构代表性较为完整的抽样单元。例如在测度某大学在读大学生的法治意识水平时,可同时选择学校校门、图书馆、教学楼、食堂、宿舍、运动场等场所作为基本抽样单元,因为所要抽取的大学生总体,都可能在这些场所出现。如果选择的基本抽样单元比较完善,那么方便抽样的效果可能趋近于随机抽样。

2)判断抽样。判断抽样,亦称“重点抽样”、“非统计抽样”、“经验试查”等等,是指调查者立基于对总体的充分认识以及对研究目标的清晰判断,结合自身经验来确定样本的抽样方式,包括重点抽样和典型抽样等方式。重点抽样是从调查总体中选择少数重点个体展开调查,这些重点个体的数量虽然不多,但在总体中占据重要的或者指引性的地位。例如,要对全国高校里开设法学本科教育的培养计划进行调查,可以选择法学领域著名的“五院四系”实施重点抽样调查。“五院四系”是我国著名的五所政法院校以及四所大学的法律系的简称,这几所高校的法学学科在法学教育界具有重要地位,对我国法制发展与法治建设均具有重大影响。“五院四系”的数量虽然不多,但对其展开调查,可以充分了解法学本科教育培养计划的重点、方向及变迁历程,并可以适度拓展至总体。典型抽样是从总体中选择若干典型个体展开深入调查,意在通过对典型个体的抽丝剥茧般的分析来描述或揭示所研究问题的本质和规律。因此,选择的典型个体应该具有充分的典型性,从这个角度来说,典型抽样与个案分析具有同工异曲之处,类似于个案分析的组合或集合。例如,要调查互联网企业是否占据市场支配地位,可以选择一些典型的互联网企业(阿里巴巴、腾讯、京东等),分析其相关市场份额,并结合一些具体的司法判例(3Q大战)进行综合分析。

判断抽样将样本的有效性和代表性寄托于调查者,即调查者对所调查问题的熟悉程度与既往的研究经验,当调查者具备全面的经验和充分的研究能力时,判断抽样不失为一种优越的抽样方法。不过,由于主观判断的误差通常不可避免,判断抽样可能会使得样本难以代表总体,相应的结论也就难以推广。

3)滚雪球抽样。滚雪球抽样又称裙带抽样、推荐抽样,常常适用于探索性研究或初期研究,当有关总体的信息不足时,或者甚至无法准确界定总体的范围时,调查者可以从总体中的已知的少数个体入手,并以此为切入点逐步扩展,持续进行调查。滚雪球抽样的大致思路是,首先收集目标总体中较易获得的少数个体的信息,然后对这些少数个体展开首轮调查研究。随后,以此类少数个体为切入点,向他们咨询符合要求的其他个体的相关信息,依靠他们的帮助去访问更多符合要求的个体,也就是开展第二轮调查研究。最后,以第二轮的调查个体为切入点,继续搜寻其他个体的相关信息,寻找更多的总体成员,开展第三轮调查研究,并如此类推下去,逐渐形成滚雪球效应。例如,要测度《老年人权益保障法》的实施效果,可以深入街道的社区活动室,或者到公园去结识晨练的老人,展开初步调查,随后通过他们结识其他的老年人朋友,逐步扩大调研的老年人群体。但是,滚雪球抽样也可能产生较大的误差,那些喜欢独处,不爱去社区活动的老年人,或者因身体不便,无法到公园晨练的老年人,将很难成为滚雪球抽样的调查样本,而此类老年人,可能对《老年人权益保障法》的实施效果有着更为深刻的切身体会,对他们的省略可能会使得调查结果产生误差,相应的结论难以推广到总体。

4)配额抽样。配额抽样也称“定额抽样”,与分层抽样具有结构上的类似性,亦不直接从总体中抽取样本,而是将总体按照某种共同的特征或规则划分为不同的层,然后从不同的层中抽取个体样本。配额抽样与分层抽样的不同之处在于,分层抽样在不同的层中抽取个体样本时,采用的是独立、随机的概率抽样方法,配额抽样采用的则是方便抽样或判断抽样等非概率抽样方法。配额抽样有两种:独立控制配额抽样和相互控制配额抽样。独立控制配额抽样是指调查者结合总体的特征,只对样本独立规定一种特征或规则,调查者有比较大的自由去选择总体中的样本。例如,在测度某大学在读大学生的法治意识水平时,只根据大学生所在年级对其进行分组,具体分为大一、大二、大三、大四和研究生,分别规定不同年级的大学生样本数目,就属于独立控制配额抽样。相互控制配额抽样是指在按各类特征或规则独立分配样本数额的基础上,再采用交叉控制安排样本的具体数额的抽样方式。继续以测度某大学在读大学生的法治意识水平为例,除了考虑大学生所在年级时,还可以考虑大学生的户籍(农村或城市)和专业(理工农医类或文史哲艺类),也就是划分了大学生的三种特征,再对每种特征的样本数目做出规定。交叉控制配额抽样对每一个特征或规则所需分配的样本数都做了具体规定,调查者必须按规定在总体中抽取调查单位,各个特征或规则都同时得到控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。

三、样本量的确定

在人文社会科学领域,劳伦斯·纽曼认为,对于小总体(小于500),我们需要较大的抽样比(约30%)或150个样本,对于大总体(超过150000),我们可以以较小的抽样比(1%)得到精确度相同的结果,约1500个样本可以同样精确,所有的方面都是相同的。需要注意的是,150000总体是500300倍,但样本仅是10倍。如果是对非常大的总体(超过1000万)抽样,我们可以使用极小的抽样比(0.025%),或大约2500个的样本就能够得到准确的结果。当抽样比变得非常小时,总体的大小就不再具有相关性。约2500人的样本对2亿人口和对1000万人口而言同样精确。这些都是近似的规模。劳伦斯·纽曼还给出了99%置信水平下,不同总体随机抽样的样本规模3.2),可以供我们参考。

图片

袁建文教授在充分考虑抽样精度和费用后,得出基本类似的结论,他提出最优样本量的经验比例大致为:总体规模在100以下的,抽样比50%以上,总体规模介于100-1000之间的抽样比为20%-50%,总体规模介于1000-5000之间的抽样比为10%-30%,总体规模介于5000-10000的之间的抽样比为3%-15%,总体规模介于10000-100000之间的抽样比为1%-5%,总体规模在10万以上的,抽样比为1%以下。

不难看出,样本量的规模大多是以范围的形式给出的,通常并没有给出一个特别确定而具体的数字,原因在于,影响样本量的因素是多重的,样本量的确定必须建立在具体问题具体分析的基础上,并以研究者所欲达到的研究目标以及研究预算、研究条件等具体实际要素作为约束条件。在实际抽样方案设计过程中首先需要结合总体的情况,根据抽样范围、研究目的和经验样本量给出样本量的大致范围然后再综合考虑精度、置信度、费用等要求根据抽样理论计算最优样本量或复杂抽样方案样本量。

四、抽样的案例

案例1:如何对法学顶刊的学术论文进行抽样?

法定顶刊选择《中国法学》和《法学研究》作为研究对象。《中国法学》创刊于1984年,是中国法学界最具影响、最具权威的学术期刊,在各类评价体系中,其影响因子长期稳居全国法学期刊榜首;《法学研究》创刊于1954年,致力于反映我国法学研究的最新成果和最高学术水平,该刊刊发的许多文章观点(例如依法治国、建立社会主义市场经济法律体系等)在法学界和社会上引起重大反响,有的被中央采纳,有的还成为治国方略。两期刊作为法学学术领域的顶级期刊,其用稿方向、评审取舍等风向标对法学学术研究具有举足轻重的引领作用。

法学顶刊的抽样时间区间聚焦于1998年至2020年,不包括上世纪80年代和90年代初期,原因之一在于该时期的法学学术研究大致处于恢复阶段和起步阶段,学术引证并不十分规范,甚至存在大量零引证的学术论文,考虑到引证内容是本文的主要研究对象,因此并未将上世纪80年代和90年代初期的学术论文纳入研究范围;原因之二在于数据库的可行性,本文使用的主要数据库系中文社会科学引文索引数据库(CSSCI),该数据库于1998年正式启用,基于研究的便利性,遂将1998年作为时间区间的起始

法学顶刊在限定时间区间内的论文总量共计4173篇(《中国法学》2306篇,《法学研究》1867篇),大致属于抽样体系中的中等规模,结合人文社科领域中的惯常定量取向,以及统计学的基本抽样规律,抽样比应介于10%30%之间。为了尽可能确保抽样论文中包含多个不同特质的抽样子单位,使得抽样论文的结构与样本总体的结构比较接近,选择分层抽样法对样本期刊进行抽样,即对样本期刊每年第2期和第5期发表的论文进行定距抽样,并在抽样过程中排除卷首语、座谈会、宣言、笔谈和祝词非学术论文性质的文献,抽样期刊及论文抽样比例(19982020)详见表1

图片

案例2:如何对裁判文书进行抽样?

图片

中国裁判文书网(https://wenshu.court.gov.cn/)为例,以故意伤害罪为例,选择北京市-基层法院-判决书类型-2019年共检索2038篇文书(共408页,每页5篇文书),假设按照30%的抽样比例确定样本,则样本数量为2038*0.3=611.4≈612份。

根据网页实际情况,每页有5份文书,选择分层抽样的方式,则可以选取每页的前两份文书(也可以选择每页的第一份和最后一份或者其他组合方式,但抽样方式确定后,每个网页的文书选择方式不能变化)作为样本,每页抽取两份,一共获得2*408=916份文书(抽样比例达到了44.95%),满足抽样的要求。

图片

案例3:分层抽样的比例法。

假设有一个地区拥有10000户百货商店,这些商店被划分为大型、中型和小型三个层次,分别有1000户、2000户和7000户。现在需要进行一项抽样调查,计划抽取200户商店作为样本。(该例介绍方法为准,暂不考虑抽样比例)

在这个例子中,可以采用分层比例抽样法来确定各层的抽取比例和样本量。分层比例抽样法是指按照各层在总体中所占的比例来分配样本量的方法。

首先,计算各层在总体中所占的比例:

大型百货商店的比例为:1000/10000=0.1

中型百货商店的比例为:2000/10000=0.2

小型百货商店的比例为:7000/10000=0.7

然后,根据这些比例来计算各层应抽取的样本量:

大型百货商店应抽取的样本量为:200×0.1=20户

中型百货商店应抽取的样本量为:200×0.2=40户

小型百货商店应抽取的样本量为:200×0.7=140户

因此,在这个例子中,各层的抽取比例分别为0.1、0.2和0.7(即各层应抽取的样本量占总体样本量的比例),对应的样本量分别为20户、40户和140户。

通过这种方法,可以确保样本在总体中具有代表性,特别是当各层之间存在显著差异时。分层抽样方法广泛应用于市场调研、社会科学研究等领域,有助于提高统计推断的准确性和可靠性。

案例4:分层抽样的最优分配法。

分层抽样的最优分配是一种不等概率样本设计,每个元素的抽样概率取决于其所在层的元素个数和样本量;又称“非比例抽样”(或分层最佳抽样法),是根据各层基本单位标准差的大小,来确定各层样本数目的抽样方法。在各层内部差异较大、某些层的重要性大于其他层的情况下,采取非比例抽样时,在这些层抽取的样本数就多;反之,抽取的样本数就少。计算公式为:

图片

设某疾病控制中心想对某社区居民的营养状况进行调查:

社区共有居民1000户,其中高收入户居民家庭为200户,中收入户家庭为600户,低收入户家庭200户,采用抽样调查需要从中抽选100户家庭。又已知高收入户收入的标准差为300元,中收入户收入的标准差为200元,低收入户收入的标准差为100元。

请用分层最佳抽样法分配各层的样本数目。

图片

应用分层最佳抽样方法计算出的各层样本抽取数与分层比例抽样法抽出的样本数相比,可以看出:家庭收入高的层次抽样的样本增加了10户(从20户变为30户),家庭收入中等层次抽样的样本数仍然为60户,而家庭收入低的层次抽样的样本数减少了10户(从20户变为10户)。

高收入层次和低收入层次的单位数都是200户,为什么从高收入层次中产生的样本数目是30户,从低收入层次中产生的样本数目只有10户呢?这是因为高收入层次收入的标准差大(300元),表示在高收入家庭中家庭收入差别比较大,从中抽取样本数目就要多一些;低收入层次收入的标准差小(100元),说明低收入家庭的收入差别比较小,从中抽取的样本数可以少一些。

这样抽选到的样本比原先仅考虑分层比例抽样的样本更具有对总体的代表性,对总体情况的推断会更加准确。


参考资料:

[1]岳希明和Terry Sicular:《Weights for 2007 and 2013》,2016.

[2]罗楚亮、李实、史泰丽、邓曲恒、岳希明:《附录I   2007年CHIP调查:抽样方法和数据描述》,载于 李实、佐藤宏、史泰丽 等著,《中国收入差距变动分析——中国居民收入分配研究IV》,人民出版社,2013年.

[3]宋锦、史泰丽、岳希明:《2002年和2007年CHIP调查:样本、权重以及城镇、农村和流动人口综合样本》,载于 李实、佐藤宏、史泰丽 等著,《中国收入差距变动分析——中国居民收入分配研究IV》,人民出版社,2013年.

[4]统计学之家:http://www.tjxzj.net/2000.html

[5]《抽样技术》(第5版),金勇进,杜子芳,蒋妍著,中国人民大学出版社。

[6]如何对抽样调查数据进行加权? ——关于CHIP数据权重的建议

(https://mp.weixin.qq.com/s/NanwkXnWK8AmnoADwY986Q)

[7]胡荣:《定量研究方法》,北京大学出版社2021年版。

[8]罗薇.抽样框缺陷及误差控制[J].统计与决策,2008(18):14-15。

[9]劳伦斯·纽曼:《社会研究方法: 定性和定量的取向》(第7版),中国人民大学出版社2021版。


文章分类: 实证研究
分享到: