法学实证 | 法学实证研究中的常见误区和可能存在的问题12
发表时间:2025-05-13 11:11 一、只有描述性统计是实证研究吗? 描述性统计(Descriptive Statistics)是通过数学方法和可视化工具对数据集的基本特征进行总结和呈现的过程。其核心目标是简化数据、提取关键信息,让研究者或读者快速理解数据的分布、趋势和整体样貌。 描述性统计的核心功能主要在于:(1)数据简化,将数据浓缩为几个关键指标(如均值、百分比等),便于快速把握数据整体特征。例如,用案件的“平均审判时长”可以概括某类案件的审判效率。(2)分布呈现,以展示数据的分布形态。例如,用直方图显示“环境污染赔偿金额”集中在10万-50万区间,但存在少量千万级赔偿的极端案例。(3)趋势描述,揭示数据随时间或条件的变化规律。例如,2015年后,我国法院的案件受理制度由立案审查制变为立案登记制,各级法院受理的案件数量随之大幅提升,即可通过2015年前后的趋势绘图进行直观的揭示。(4)对比分析,比较不同组别或类别的数据差异。例如,对比“民事案件调解率”在东部与西部地区的差异。 描述性统计是法学实证研究的“数据地图”,可以帮助研究者快速定位关键特征。描述性统计的常用指标有均值、中位数、众数、标准差、频数、百分比等。 描述性统计是实证研究的一种基础工具,不涉及假设检验或因果推断,而是专注于回答“数据是什么样”的问题。 描述性统计无法回答“为什么”“如何影响”以及“影响大小”的问题。例如,仅统计“认罪认罚案件量刑轻缓化比例”无法解释轻缓化的原因(需结合回归分析或质性访谈)。 实证研究是以经验数据(而非纯理论推演)为基础,通过科学方法分析法律现象的研究范式,其核心是用数据验证假设或揭示规律。实证研究涵盖更广泛的方法体系,既包括描述性统计,也包括推论性统计、因果分析、实验设计、质性研究等。实证研究的核心在于基于经验数据(如案例、判决书、调查问卷等)对法律现象进行系统性分析。 ![]() 以“夫妻共同财产分割比例”为例。描述性统计的内容通常为:统计某地区1000份离婚判决书中“夫妻共同财产分割比例”的范围以及平均值。实证研究的内容往往为:进一步分析“财产分割比例是否与夫妻收入差异相关”(需用回归分析等推论性方法),或通过访谈探究法官裁量逻辑(质性研究)。 因此,描述性统计是实证研究的基础,是实证研究的起点,但不能完全等价于实证研究。 二、实证样本选择不足或存在偏差 在法学实证研究中,样本的数量应当选择多少才能满足实证分析的前提要求? 对此,首先应明确大样本和小样本的范围。如果要从总体中抽取样本量为n的样本,根据中心极限定理的要求,样本量n必须充分大,那么多大才叫充分大呢?这与总体的分布形状有关。总体偏离正态越远,则要求n越大。然而在实际应用中,总体的分布未知。此时,根据统计学教科书的要求,通常要求n>30,方可进行进一步的实证分析。顺便指出,大样本、小样本之间并不是以样本量大小来区分的。在样本量固定的条件下所进行的统计推断、问题分析,不管样本量有多大,都称为小样本问题;而在样本量n趋于无穷大的条件下进行的统计推断、问题分析则称为大样本问题。一般统计学中的n>30为大样本,n<30为小样本只是一种经验说法(参见《统计学》(第七版),贾俊平等编著,中国人民大学出版社,第123页)。 小样本难以满足统计推断的基本要求,大样本更符合统计学中的大数定律和中心极限定理,而且大样本系数估的计更接近真实值,方差减小,结果更稳健。使用大样本理论的代价是要求样本容量较大,以便大数定律和中心极限定理可以起作用。从学术研究的现实角度来看,样本量n>30通常并不足够,根据计量经济学教科书的估计,大样本中的样本量n最好要在100以上(参见《计量经济学及Stata应用》,陈强著,高等教育出版社,第108页)。 在法学实证研究中,时常可以看到样本量过小或代表性不足的问题。样本数量不足,则难以支撑统计学意义上的显著结论。在评阅某论文时,作者在做异质性分组检验时,由于总体样本量只有100多个,分组后每组的样本量仅有不到70个。因此,做分组回归就显得样本量可能有些过小,也就难以得到具有统计学意义的显著结论。 样本的代表性同样不能忽视。若样本仅来自特定地域、时间段或群体,则无法代表整体。某研究仅以某省法院的200多份判决书分析“全省刑事辩护率”,即便是对于某个特定的省份,各市、州也可能存在明显的地区差异,如果不能清晰的交代200多份判决书的来源、案件类型分布和抽样思路,可能就不一定能代表“全省刑事辩护率”,导致结论推广性受限。 样本量过小或代表性不足可能扭曲因果关系、弱化外部效度,甚至得出错误结论。可以通过扩大样本量和多样性(如多地区、多层级案例),采用随机抽样或分层抽样,结合定性研究补充数据盲点,以及公开样本选择标准以增强透明度等方式予以缓解。 三、实证模型缺乏关键变量或混杂无关变量 在法学实证研究中,因变量(被解释变量)和自变量(解释变量)的选取是研究设计的核心环节,需同时满足法学理论逻辑与计量方法的科学性要求。因变量必须直接对应研究问题,能够反映法律现象的核心结果或状态。自变量必须与因变量存在逻辑关联,且符合法学机制解释。部分法学实证论文中,缺乏关键解释变量。在此举一例,在量化某个法定情节对抢劫罪刑法强度的影响时,根据法律和司法解释的规定,抢劫罪的法定加重处罚情节包括入户抢劫、在公共交通工具上抢劫、抢劫银行或其他金融机构、多次抢劫或抢劫数额巨大、抢劫致人重伤、死亡等,从轻或减轻处罚情节包括自首、立功、犯罪未遂、中止、退赃、赔偿并获得谅解等,在具备操作性的前提下,此类情节应当尽可能都纳入实证模型中,以增强模型的说服力。当然,并非所有的裁判文书都涉及每个量刑情节,可通过设置虚拟变量的方式将各个情节纳入实证模型。此外,若是以全国作为研究范围,考虑到各省对“数额巨大”的具体标准不同,还要需参照当地司法解释进行变量设计。 另外需要说明的是控制变量。控制变量是指除核心自变量以外的可能影响因变量结果的变量。控制变量不是主要研究对象,但可能会干扰因变量。通过控制这些变量,可以排除它们的干扰,更准确地观察自变量对因变量的影响。也就是说,控制变量可以隔离自变量对因变量的独立效应,减少混淆(Confounding)对结果的干扰。控制变量并非无关变量,需基于法学理论或法律实践机制筛选,而非随意添加。例如,研究“认罪认罚从宽制度的效果”时,可以将“案件严重程度”“被告人经济状况”等作为控制变量,但不宜将犯罪人的业余爱好(如是否喜爱看小说)作为控制变量,似有风马牛不相及之感。 在法学实证论文中,变量的选取部分要做到:清晰交代因变量、自变量和控制变量的具体名称及含义,以及与因变量、自变量及控制变量相对应的指标。尤为重要的是,变量的选择必须给出选择的依据,对于法学实证研究而言,除了引用已有研究文献来做支撑外,还可以将法律规定和司法解释作为选择变量的依据。如果作者提出设定的变量没有相应的文献和法律作为依据,则应当进行强有力的解释、论证或说明。 四、论文关键内容不清晰或存在逻辑跳跃 达摩达尔·N·古扎拉蒂提出了实证分析的轮廓化路线:第一、理论或假说的陈述;第二、理论的数学模型设定;第三、计量经济模型设定;第四、获取数据;第五、计量经济模型的参数估计;第六、假设检验;第七、预报或预测;第八、利用模型进行控制或制定政策(达摩达尔·N·古扎拉蒂,唐·C·波特著:《计量经济学基础》,中国人民大学出版社2011年版,第3页。)。 实际上,实证研究论文(无论是法学、社会学、经济学还是其他社会科学领域)通常遵循一套相对固定的结构框架,以确保研究的科学性、逻辑性和可验证性。就实证研究论文的一般结构而言,大致可以包括以下内容: 1、引言。其功能在于提出研究问题,明确研究背景与现实意义,关键要素在于从现象或争议切入,转化为可实证的理论问题(如“法律移植是否有效?”)。 2、文献综述与理论框架/理论假设。其功能在于评述已有研究,指出理论分歧或不足,关键要素在于批判性综述:分类总结文献(如支持/反对某理论的学派),而非简单罗列,并将抽象理论与实证问题结合,提出理论假设,明确核心变量及其逻辑关系(如“制度环境→法律移植效果”)。 3、研究设计与方法。说明数据来源、样本选择、变量定义及分析方法。 4、数据分析与实证结果。要呈现统计分析或回归分析结果,验证研究假说。一般而言,实证结果还包括稳健性检验,通常通过更换模型、样本或方法以验证结果的可靠性。 5、异质性分析、机制分析或进一步的讨论。异质性分析(Heterogeneity Analysis)主要用于检验研究结果在不同子群体、不同情境或不同条件下的差异,其核心目的是揭示总体效应背后的复杂性,避免“一刀切”的结论,从而增强研究的深度和政策针对性。异质性分析是打破“平均效应幻觉”的关键工具,其价值在于揭示“对谁有效、在什么条件下有效”。法学研究因其强烈的实践导向,尤其需关注法律规则在不同群体、制度环境中的差异化影响。机制分析(Mechanism Analysis)是实证研究中的关键环节,旨在揭示自变量(X)如何通过中间过程或变量(中介变量,Mediator)影响因变量(Y),即回答“X如何导致Y”的问题。其核心目标是打开因果关系的“黑箱”,解释变量间的作用路径和内在逻辑,而非仅停留在统计关联层面。例如,若发现因果关系,需探讨中间机制(如“制度环境通过何种路径影响法律移植?”)。 6、结论与建议。总结核心发现,回应研究问题,提出政策建议或未来研究方向。 当然,在具体的实证研究中,论文的每一部分并不一定与上述内容完全一一对应,但总体框架应该大致相当。 论文关键内容不清晰的问题通常包括:1、引言与结论脱节。也就是结论未直接回答引言提出的研究问题。2、未详细说明数据清洗、变量构造和选择过程。尤其是在评阅部分涉及裁判文书的实证论文时,发现很多论文,都没有清晰交代裁判文书的选择方式、数量比例和时间范围,对于数据清洗的过程也存在一笔带过等现象。当裁判文书的分析数量很大时(上万份或者超过十万份),研究者时常通过python等工具实现对文书的清洗,不同的代码和逻辑带来的清洗结果并不完全相同,数据清洗和编码的过程并非不重要的过程,有必要进行大致交代。3、异质性分析、机制分析或进一步的讨论并未与变量的设计一一对应。例如研究“认罪认罚从宽制度对量刑的影响”,若变量设计中未包含“案件类型”(如经济犯罪 vs. 暴力犯罪),却在异质性分析中按“案件类型”进行进一步的教义学说明,可能会出现主观的分类和解读,也就是说,进一步的教义学说明和原始的变量设计并无牵连,导致结果可信度存疑。变量设计是实证研究的“地基”,异质性分析、机制分析与讨论需与之严格对应,避免“无源之水”式的分析。 在法学实证研究中,逻辑跳跃是指研究过程中不同环节(如数据使用、模型构建、理论解释)之间缺乏连贯性和一致性,导致分析链条断裂或结论缺乏充分支撑。当研究者使用某一部分数据构建模型,却在解释结论时依赖另一部分未经检验的数据或假设时,就会产生逻辑跳跃。这种问题会削弱研究的严谨性,甚至导致错误结论。在此举一例,在研究“司法公开对公众法律信任的影响”时,模型数据使用法院官网公布的裁判文书数量(自变量)与问卷调查中公众对司法的信任评分(因变量)进行回归分析,解释数据却并未引用与前述模型数据相关联的媒体报道中“公众对司法腐败的批评数量”作为“司法公开不足导致信任下降”的证据。逻辑跳跃的地方在于数据来源不一致:模型中自变量是“裁判文书数量”,但解释时引入“媒体报道的腐败批评”,两者属于不同维度,未建立直接关联。逻辑跳跃的核心原因通常在于,数据获得难度较大,因某些变量难以获取,被迫用替代变量,但未说明局限性。应当说明的是,法学实证研究常面临较大的数据获取难度,可以采用混合方法(定量+定性),例如通过访谈法官补充模型中缺失的决策逻辑。逻辑跳跃的本质是分析环节的断裂,在法学实证研究中需尤其警惕。研究者应严格遵循“理论假设→变量设计→数据验证→解释约束”的链条,避免脱离数据的“想象式解释”。 五、格式的规范性和严谨性 法学实证研究本质上是经济学或统计学等量化方法在法学领域的应用,在涉及实证部分的内容上,格式上建议可能尽量参照经济学或统计学等学科的公认方式为佳。 首先来看下表所示的回归结果,该表系根据几位研究者所做的实证论文结果改造而来。其中,B值是指回归系数,也就是自变量的系数,显著性P值也有。应当说,该表所示的内容囊括了回归模型的主要因素,并不能算错。但是,该表包含的内容并不完整,例如缺乏标准误等内容。 ![]() 从实证研究的惯常表达方式而言,无论是经济学还是统计学等学科,在展示回归模型结果的时候,通常并不会采用上表所示的表达方式,而是会采用下图所示的方式。 ![]() 虽然不同的格式并不存在优劣之分(只要能够清晰描述实证内容即可),甚至也可以通过纯文字性的方式对回归等实证结果进行详细描述和表达,但在实证研究领域,考虑到已经有了成熟的和学界公认的表达方式,建议最好是按照典型的表达方式来描述。采用经济学或统计学等实证表达方式可能是法学实证研究科学化进程的路径之一。 |