法律和经济科学

法学实证 | 为什么以及如何对司法裁判文书做实证研究?

23
发表时间:2025-03-26 14:58作者:阳李

一、研究价值:为什么需要对司法裁判文书展开实证研究?

发现司法规律揭示法律实施的真实状态

司法裁判文书是司法活动的直接记录,通过实证分析可以揭示法律条文在实践中的适用情况,发现“纸面法律”与“行动中法律”的差异。

通过大量司法裁判文书的量化分析,可以揭示法律适用中的不为人知的隐性模式

例如:量刑影响因素权重分析(如退赃情节平均减少刑期12.3%合同纠纷中格式条款无效率的地域差异(东部27% vs 西部41%如:研究某一法律条款(如正当防卫)的适用频率地域差异或法官解释倾向法外因素户籍和性别对量刑的影响等等

检验制度实施效果

某些法律制度或者司法改革举措(如认罪认罚从宽制度、智慧法院建设)的实际效果可通过裁判文书数据予以验证,为政策调整提供依据。

例如,裁判文书上网制度实施后,同类案件上诉率下降18.7%员额制改革后法官人均办案量趋势曲线如何变化;又如,从202471日起,新成立的公司需要在注册后五年内完成注册资金实缴,未按时完成实缴的公司将面临处罚。那么,该项法律规定,是否会对社会经济活动产生影响?例如,减少新公司注册数量,降低企业活力?或者使得公司的注册资本更能够反映公司的实力?

社会问题的法律层面映射

通过司法裁判文书可以发现立法与司法实践的断层例如:P2P网贷纠纷中37%案件援引法律依据存在冲突个人信息保护法实施首年,61%侵权案件因举证困难败诉;裁判文书反映社会矛盾(如劳动争议、金融诈骗、环境侵权),通过案件类型、地域分布等分析可揭示社会问题的动态趋势。

)法学研究的范式革新

传统法学研究以规范分析为主,实证研究通过数据驱动,推动法学从“应然”向“实然”转向,增强学术成果的实践价值。最高人民法院近5年发布司法解释有多个明确提及实证研究依据

二、研究方法论:如何对司法裁判文书展开实证研究?

确定研究问题

实证研究从问题开始,需要明确研究的具体问题和目标。

宏观层面问题:司法效率、案件类型趋势、法律适用差异;宏观层面的问题需要微观层面的数据和变量来反映。

微观层面问题:特定案件(如知识产权侵权)的赔偿金额影响因素在研究“知假买假”问题时,需要关注消费者惩罚性赔偿制度的实施效果和影响。具体而言,又可细分为:

1.描述性问题(What

某类案件的裁判结果分布特征(如民间借贷利率司法保护上限调整后的实际利率分布)。

司法裁判中的修辞模式(如“社会主义核心价值观”在判决书中的引用场景)。

2.解释性问题(Why/How

影响裁判结果的因素(如当事人户籍、律师代理、法院层级)。

司法政策执行偏差的机制(如“立案登记制”实施后法院应对策略的差异性)。

3.预测性问题(What if

基于历史数据构建判决结果预测模型。

模拟某一法律修改可能带来的裁判趋势变化。

收集裁判文书

1.数据来源

通过渠道(中国裁判文书网、北大法宝、OpenLaw、聚法案例数据库、威科先行、上海市高级人民法院官网、无讼案例、汇法网、知产宝、中国庭审公开网、中国执行信息公开网等)收集大量的裁判文书作为实证材料。这些文书应涵盖不同时间、地区和类型的案件,以确保研究的全面性和代表性。

可以采用分层抽样方法,确保地域、审级、案件类型的比例平衡。如研究民间借贷案件,可以酌情按照东、中、西部法院的特定比例抽取样本。

2.数据整理和清洗

1去除重复、不完整、信息严重缺漏或涉密的裁判文书。这是数据清理的第一步。从个人经验来看,在梳理故意伤害罪文书,分析户籍对量刑的影响的过程中,经过初步筛选,我们共获得24785份一审裁判文书,其中北京13409份,上海11376份。然而,在对所获文书进行阅读和识别后,发现其中有13405份文书没有提供犯罪人的户籍信息,有2801份文书没有提供被害人的伤情信息,还有部分裁判文书存在重复或者无法提取有效变量(例如法院的通知书、批复、答复、函等等)的情形。在排除掉此类无法开展有效量化分析的文书后,最终获得一审裁判文书8534份,其中北京3154份,上海5380份。(阳李,王剑波,张龙成. 户籍会影响量刑吗?——来自北京和上海的经验证据 [J]. 制度经济学研究, 2023, (02): 85-114.

2结构化处理提取案由、审理法院、判决结果、法律依据等关键字段

3文本清洗处理文书中的非结构化文本(如事实陈述、法官说理)。

变量提取

人工(或者python机器学习等技术手段从裁判文书中准确地抽取关键信息。这些信息包括案件事实、争议焦点、裁判理由和结果等,是进行量化分析和判断的基础。

1.因变量(如量刑结果、赔偿数额)因变量是随着自变量的变化而变化的数值。它是研究中需要测量的变量,其变化取决于自变量的变化

2.自变量(如当事人特征、地域、法官背景、案件情节)自变量用来考察对因变量的影响,解释因变量的变化,验证核心研究假设(例如X是否影响Y”)。

3.控制变量。控制变量是指除自变量以外的可能影响因变量结果的变量。控制变量不是主要研究对象,但可能会干扰因变量。通过控制这些变量,可以排除它们的干扰,更准确地观察自变量对因变量的影响‌。也就是说,控制变量可以隔离自变量对因变量的独立效应,减少混淆(Confounding)对结果的干扰。

在数据分析中(如回归模型),自变量和控制变量都会被纳入模型,但解释时需明确区分:关注自变量的系数,控制变量的系数通常无需重点解读。

数据分析

对抽取的信息进行整理和分析,运用统计学和计量经济学等方法探究案件之间的关联性和规律性。建议尝试混合方法(定量统计+文本分析+深度访谈),突破单一方法的局限。

1.量化分析

1描述性统计描述性统计量化分析的基础,可以了解样本总量、变量分布、缺失值情况可以识别高频案件类型、常见裁判结果、时空分布特征等例如,对案件数量、地域分布、时间趋势进行的描述性统计若发现异常值(如极端高赔偿金额),还需要进行缩尾处理(Winsorization)或单独标注。

2回归模型探究变量间因果关系(如“被告人是否认罪”对量刑的影响)和具体的影响力

3机器学习自然语言处理(NLP)提取文书情感倾向、争议焦点

2.质性分析

1)典型案例的文本解读,分析法官说理逻辑或法律解释偏好。

2)结合访谈或田野调查,补充量化分析的局限性。

3.分析工具与技术

1数据分析工具

Stata/Python/R(用于统计建模、文本挖掘)

SQL(数据库管理)

Tableau/Power BI(可视化)。

2法律文本分析技术

关键词提取、主题模型(LDA)、情感分析

法律知识图谱构建(如案由与法条关联)

自然语言处理技术n-gram模型、隐马尔可夫模型、词向量表示和语义分析、深度学习)。

得出结论

基于数据分析的结果,得出关于研究问题的结论和解释。这些结论应具有盖然性,即在开放的实践中不断发展,并接受新的检验和挑战。

总体而言,对司法裁判文书进行实证研究是提升司法质量、增强司法权威、促进案例指导制度、强化社会监督和提升教育引导功能的重要途径。同时,需要遵循科学的研究方法,确保研究的准确性和可靠性。

稳健性检验和机制检验

稳健性检验旨在验证研究结论是否在不同模型、数据或假设下保持一致。在司法裁判文书实证研究中,稳健性检验和机制检验是确保研究结果可靠性和深入理解因果关系的关键步骤。以下是具体方法:

1.稳健性检验

在司法裁判文书实证分析中,稳健性检验(Robustness Check)是验证研究结果可靠性的核心环节,旨在排除模型设定、变量度量或样本选择偏差对结论的干扰。

1重新定义关键变量或替换关键变量

重新定义或替换关键变量司法改革效果可通过不同指标量化(冤错案件纠正率、案件处理效率、裁判文书公开率、庭审直播覆盖率等);“法治水平”也可以通过多个不同的指标来量化(律师数量,企业数量,诉讼率等等)。重新定义或替换关键变量,可以验证结果对变量定义的敏感性

2调整模型形式

将线性回归模型替换为非线性模型(如LogitProbit),或引入固定效应模型控制不可观测的异质性。若原模型为OLS,改用分位数回归(Quantile Regression)观察不同分位点的效应差异(如分析高赔偿案件与低赔偿案件的影响因素是否不同)。对计数变量(如引用法律条文次数),用泊松回归或负二项回归替代OLS还可通过控制额外变量(如法官背景、政策变化时间节点)排除混杂因素的影响。例如,研究“律师参与对胜诉率的影响”,原用Logit模型,可改用Probit模型、Lasso回归或机器学习分类器(如随机森林)验证系数方向一致性。

3子样本分析

将样本分组开展分析。总样本划分为不同子群体(如不同法院层级、地区时间或案件类型),检验核心结论是否在子样本中是否成立

亦可剔除特殊样本。例如,排除调解结案案件(因调解结果可能受非法律因素影响较大);剔除最高法院案例(因其政策导向性强,与基层司法逻辑不同)。

4工具变量法

若存在内生性问题(如反向因果),可引入工具变量以增强因果推断的稳健性目的。如果一个变量与模型中的解释变量高度相关,但却不与随机误差项相关,那么就可以用此变量与模型中相应回归系数得到一个一致估计量,这个变量就称为工具变量,这种估计方法就叫工具变量法。例如,研究“法官性别对判决结果的影响”,可用“法院同期法官性别比例”作为工具变量(假定法院性别结构不影响个案判决,但影响法官分配)。工具变量法的运用有一定的门槛和偶然性。

5)跨数据集验证

目的在于避免单一数据源偏差(如裁判文书网的公开文书可能存在选择性缺失),可以通过外部数据进行补充:用北大法宝、威科先行数据库重复分析;或者结合非公开数据(如法院内部统计报表)验证趋势一致性。例如,若研究发现基层法院上诉率高于中级法院可以核对司法统计年鉴中的整体上诉率数据是否支持该结论。

2.机制分析

在司法裁判文书实证研究中,机制分析(Mechanism Analysis)旨在揭示自变量(如法律规则、法官特征、当事人行为等)如何通过特定中间路径影响裁判结果(如判决结果、赔偿金额、刑期等),即回答“为什么”或“如何”发生作用的问题。在司法领域,这可能涉及到法官的背景如何通过某种心理因素影响判决,或者法律条文的变化如何通过司法实践的具体环节影响裁判结果。

在理论假设构建方面,可以从法学理论出发,结合法律解释学、法官行为理论、诉讼博弈论等,提出可能的机制路径。例如:

“法官的学术背景(X)影响其对法律原则的引用频率(M),进而导致判决结果差异(Y)”。

“《民法典》增设居住权(X)→ 房产纠纷中调解协议更注重居住保障条款(M)→ 调解成功率提升(Y)”。

从数据中发现线索:通过异质性分析(如发现某一群体效应显著)、文本高频词分析(如裁判文书中特定术语出现频率与结果相关)提出假设。

1中介效应分析

检验中介变量是否在自变量和因变量之间起传导作用目的在于揭示变量间的传导机制。例如检验某一变量(如司法改革政策)是否通过特定路径(如庭审实质化)影响裁判结果

2调节效应分析

检验调节变量如何影响自变量和因变量的关系目的在于识别影响关系的边界条件。例如分析不同情境(如地区经济发展水平)如何改变核心变量间的关系

3异质性分析

在司法裁判文书的实证研究中,异质性分析(Heterogeneity Analysis)主要用于揭示不同群体、条件或情境下司法裁判结果的差异性,此种差异性可以揭示机制在不同情境下的变化。

4案例研究

通过引入典型案例深入分析机制目的在于提供更细致的机制解释。例如,对典型个案进行过程追踪,还原法官决策的具体和真实逻辑

此外,对比不同群体裁判文书的用词差异(如企业作为被告时,文书中“合同自由”出现频率更高,暗示法官侧重商事逻辑),也可能作为机制证据。

需要注意的是数据质量确保数据准确性和完整性)和理论支持检验应有理论依据),通过稳健性检验和机制检验,可以增强研究结果的可靠性,并深入理解变量间的因果关系。

其他挑战与应对

1.数据局限性和复杂性。部分裁判文书未公开或格式混乱,需结合抽样与数据补全技术。裁判文书格式不统一、语言表述差异大(如方言混杂、说理简略),影响变量提取的准确性,可以采用自然语言处理(NLP)技术(如BERT模型)提取关键信息(如证据采信、法律条文引用)。尤其是当下,裁判文书上网有明显的下滑趋势,此时可以酌情考虑将研究方向扩展到行政处罚、其他行政文书或者检察文书中去。

2.文本复杂性以及变量提取的难度和所消耗的工作量。法律语言的专业性需结合领域知识优化NLP模型,变量的提取更是有诸多的例外情况例如,学者曾透露,“获取原始文书之后,首先建立了一个涵盖文书各种关键信息的变量表,包括文书类型、立案和裁判时间、原被告身份及所在地、法院名称、类型、层级及所在地、被诉行政行为类型、所涉行政管理领域、判决结果等 40 余项信息。之后,在和同一家公司合作的基础上,采用多种自然语言处理模型,辅之以人工校正,一些缺失值也通过机器比对和人工识别加以补充。经过反复操作、多轮完善,提取出每一份行政裁判文书的关键信息。这一过程耗时一年之久。”(参加马超,郑兆祐,何海波. 行政法院的中国试验——基于24万份判决书的研究 [J]. 清华法学, 2021, 15 (05): 192-206.

3.因果推断困难。司法决策受多重因素影响,需谨慎解释统计结果。

拓展思维下的案例参考

1.正当防卫作为刑法中的违法阻却事由,理论上旨在保护公民在紧急情况下对抗不法侵害的权利,但在司法实践中其认定率长期偏低,原因何在(不法侵害“紧迫性”的过度要求,防卫意图的“纯粹性”争议,防卫限度的“事后判断”倾向)?分析正当防卫为何难以获得法院认可;

2.分析《民法典》实施后隐私权案件的赔偿标准变化;

3.对比不同地区法院对“职业打假人”的司法态度;

4.通过文书数据验证“同案不同判”现象的存在及成因;

5.区域司法裁判标准差异:如著作权纠纷中“公有领域”适用标准的地域差异,或公司解散纠纷中“经营管理不善”的认定标准。

三、关键问题及实例

(一)不便于直观判断原告胜诉的情形

1.若司法判决书中裁判结果显示法院全部或部分支持原告诉求,则可以认为原告胜诉;若驳回原告诉求,则认为原告败诉。原告胜诉取值为1,败诉取值为0。 因变量原告是否胜诉为二值变量,因此可采用Logit模型进行回归。(魏建,田燕梅. 策略性诉讼版权保护绩效的实证分析:版权蟑螂的故事 [J]. 广东财经大学学报, 2022, 37 (02): 88-99.

2.在知识产权领域,由于一些案件的判决并非只是简单的何方胜诉或败诉,往往存在法院部分支持原告的主张的判决结果。胜诉判断标准是,对于存在二审的案例,何方选择上诉则认为另一方胜诉,因为我们认为每个人是自我利益的最佳评判者,是否上诉这一决定就显示了原被告对判决结果的态度。若两方都上诉或都不上诉以及终审判决,则判决只要部分支持了原告的诉讼请求即认为原告胜诉。

可以采用另一个衡量原告胜诉水平的变量,判决比,即用法院的判决数额除以原告的诉求数额,这个标准相对能够更为准确地衡量原告的诉求得以实现的程度。(龙小宁,王俊. 中国司法地方保护主义:基于知识产权案例的研究 [J]. 中国经济问题, 2014, (03): 3-18.

3.在涉及行政决定的领域,可以采用判决类型来判断原告是胜诉还是败诉:法院判决变更或者撤销行政行为、确认违法或无效、责令履行或赔偿的,认定原告胜诉;法院判决维持行政行为或者驳回全部诉讼请求的,认定原告败诉。原告为行政相对人,被告为行政机关(马超,郑兆祐,何海波. 行政法院的中国试验——基于24万份判决书的研究 [J]. 清华法学, 2021, 15 (05): 192-206.

(二)常见的错误

1.从量化分析的实际情况来看,比较容易犯的一个错误可能在于,量化分析过程中纳入的变量过少。在建立多元回归模型进行分析时,遗漏了某些重要的、不可或缺的考量因素,例如盗窃罪中的盗窃数额、故意伤害罪中的伤害程度等等。这些考量因素,都是属于重要的法定量刑情节,是不能缺少的。

2.另外归因于数据收集的不易,在开展研究在获取数据样本时可能存在瑕疵,比较突出且较大共性的不足在于抽样方法不明确,抽样比例不足,导致纳入分析的数据可能不具备代表性和科学性,相应的分析结论也就难以有效推广