如何批量获取司法裁判文书?
分析的司法裁判文书多达数万份,甚至上百万份,人工逐一详细阅读几乎不可能,如何快速提取其中的关键和核心信息?
如何实现司法裁判文书从批量获取→读取→整理→清洗→分析→可视化的完整过程?
如何量化和区分不同法院不同时期的审判风格、审理要点和审理逻辑?
在司法裁判文书中,法官和律师的性别通常不会披露,如何通过学术界广泛使用的朴素贝叶斯方法对法官和律师的性别进行预测(Ngender),进而进行下一步的学术研究?
如何量化和区分司法裁判文书的时代变迁特征?
如何使用神经网络模型对司法判决结果进行预测?
司法裁判文书的学术研究路径是什么样的?应当如何应用?尤为关键的是,应当如何操作和实现?
一、为什么需要对司法裁判文书开展实证研究?
1.发现司法规律,揭示法律实施的真实状态。司法裁判文书是司法活动的直接记录,通过实证分析可以揭示法律条文在实践中的适用情况,发现“纸面上的法律”与“行动中的法律”的差异。通过大量司法裁判文书的量化分析,可以揭示法律适用中的不为人知的隐性模式。(如户籍、性别、文化程度等法外因素对量刑的影响)
2.检验制度的实施效果。某些法律制度或者司法改革举措(如认罪认罚从宽制度、法官员额制建设等)的实际效果可通过裁判文书数据予以验证,为政策调整提供依据。
3.社会问题的法律层面映射。通过司法裁判文书可能发现立法与司法实践的断层。
4.法学研究的范式革新。传统法学研究以规范分析为主,实证研究通过数据驱动,推动法学从“应然”向“实然”转向,从而增强学术成果的实践价值。最高人民法院近年发布的司法解释中,有多个明确提及实证研究依据。
二、司法裁判文书研究部分代表性参考文献(中国、美国和德国)
1.褚红丽,孙圣民,魏建. 职务级别、法律制度设计与腐败惩罚扭曲 [J]. 经济学(季刊), 2018, 17 (03): 873-896.
2.范子英,赵仁杰. 法治强化能够促进污染治理吗?—自环保法庭设立的证据 [J]. 经济研究, 2019, 54 (03): 21-37.
3.陈天昊,邵建树,王雪纯. 检察行政公益诉讼制度的效果检验与完善路径:基于双重差分法的实证分析 [J]. 中外法学, 2020, 32 (05): 1328-1352.
4.田燕梅,徐恺岳,魏建. 法院判决的影响因素——当事人资源与诉讼能力的中介效应 [J]. 清华法学, 2021, 15 (05): 163-176.
5.马超,郑兆祐,何海波. 行政法院的中国试验——基于24万份判决书的研究 [J]. 清华法学, 2021, 15 (05): 192-206.
6.马超,于晓虹. 行政审判中比例原则的适用——基于公开裁判文书的实证研究 [J]. 山东大学学报(哲学社会科学版), 2022, (04): 58-68.
7.魏建,田燕梅. 策略性诉讼版权保护绩效的实证分析:版权蟑螂的故事 [J]. 广东财经大学学报, 2022, 37 (02): 88-99.
8.阳李,王剑波,张龙成. 户籍会影响量刑吗?——来自北京和上海的经验证据 [J]. 制度经济学研究, 2023, (02): 85-114.
9.马超,罗玉峰,阮蔷. 环保法庭何以有效?—能动司法视角下的实证分析 [J].中国人口·资源与环境, 2024, 34 (06): 90-102.
10.龙小宁,刘建军,岳阳. 法官人力资本积累与审判质量——基于知识产权案件的实证分析 [J]. 经济学(季刊), 2025, 25 (03): 597-612.(论文通过构建民事司法诉讼审判的理论模型和实证模型,发现法官的专业经验积累显著降低了二审改判率,而通用经验对此无显著影响。)
11.王翔. “性别的砝码”:代表性视角下的民主决策 [J]. 政治与法律, 2025, (04): 36-50.
12.KONSOLIDIERUNG STATT SIEGESZUG:Eine quantitative Untersuchung der Verwendung des Grundsatzesder Verhältnismäßigkeit in der Rechtsprechung des Bundesverfassungsgerichts.DER STAAT, 63 (2024) 2: 217- 252(巩固而非扩张——德国联邦宪法法院裁判中比例原则适用的量化研究:研究通过定量方法分析了德国联邦宪法法院判例中比例原则的运用情况,挑战了传统法学研究中基于选择性材料的假设。)
13.Heng Chen, Yuyu Chen, Qingxu Yang, Women in the Courtroom: Technology and Justice, The Review of Economic Studies, 01 August 2025.(该研究基于2014年至2018年中国600万份民事判决书,实证分析了民事诉讼中存在的性别偏见及其改革干预效果。)
三、师资力量
阳李,西南财经大学法学硕士,首都经济贸易大学经济学博士,现为成都中医药大学讲师,研究方向为法律的经济分析。在《制度经济学研究》《广东财经大学学报》《人大法律评论》《南大法学》《公法研究》《中山大学法律评论》《厦门大学法律评论》等期刊发表论文20多篇;拥有处理千万量级司法裁判文书和百万量级法学学术论文文本分析的丰富经验;出版著作《法律的经济分析:基本原理和Stata应用》《民法典与国家治理》两部。
马超,清华大学法学博士,清华大学政治学博士后,现为对外经济贸易大学法学院副教授、硕士生导师,兼任清华大学数据治理中心项目研究员,研究方向为行政诉讼法、法律实证研究、司法大数据研究等。在《中国法律评论》《清华法学》《政法论坛》《山东大学学报(哲学社会科学版)》《中国人口·资源与环境》《The China Review》等期刊发表论文数十篇,主持国家社会科学基金、教育部人文社会科学研究青年基金、国家博士后研究基金等国家级和省部级项目多项;为最高人民法院等部门撰写多篇研究内参,多次获得有关部门采纳和相关领导批示。
四、培训内容
(一)实证研究基础知识
实证研究是一种以可观察、可测量的经验证据为基础,通过系统收集和分析数据来回答研究问题或检验理论假设的研究方法。它强调客观事实而非主观观点,核心在于“用证据说话”。就司法裁判文书实证研究而言,所涉及的实证研究基础知识大致包括如下内容。
1.司法裁判文书实证研究简介和基本路径。
2.Stata软件简介。
3.数据的录入、获取、抽样方法和度量方式。
4.各种变量的设定,包括虚拟变量等。
5.一元线性回归和多元线性回归(代表论文:马超,郑兆祐,何海波. 行政法院的中国试验——基于24万份判决书的研究 [J]. 清华法学, 2021, 15 (05): 192-206.田燕梅,徐恺岳,魏建. 法院判决的影响因素——当事人资源与诉讼能力的中介效应 [J]. 清华法学, 2021, 15 (05): 163-176.)
6.logistic回归(代表论文:阳李,王剑波,张龙成. 户籍会影响量刑吗?——来自北京和上海的经验证据 [J]. 制度经济学研究, 2023, (02): 85-114.)
7.交互效应、调节效应和中介效应(代表论文:马超,于晓虹. 行政审判中比例原则的适用——基于公开裁判文书的实证研究 [J]. 山东大学学报(哲学社会科学版), 2022, (04): 58-68. )
8.双重差分法(代表论文:马超,罗玉峰,阮蔷. 环保法庭何以有效?—能动司法视角下的实证分析 [J].中国人口·资源与环境, 2024, 34 (06): 90-102.范子英,赵仁杰. 法治强化能够促进污染治理吗?—自环保法庭设立的证据 [J]. 经济研究, 2019, 54 (03): 21-37.陈天昊,邵建树,王雪纯. 检察行政公益诉讼制度的效果检验与完善路径 基于双重差分法的实证分析 [J]. 中外法学, 2020, 32 (05): 1328-1352.)
(二)司法裁判文书数据提取和分析的技术性知识
司法裁判文书数据提取和分析本质是计算机软件等深度学习技术在法学领域的应用,大体包括如下内容。
1.Python基础。Python环境搭建、变量和数据类型、字符串、元组、数组、列表、字典、if语句、for循环和while循环、定义与调用函数、正则表达式、类、文件读写、路径处理等(数据和变量识别、编码和赋值等操作的基础知识)。
2.司法裁判文书提取和分析。大批量司法裁判文书的读取、整理、清洗、赋值、编码和可视化(附赠法学期刊学术论文的读取、整理和清洗)。
3.爬虫技术。爬虫基本原理和流程:模拟人类浏览器行为,自动化获取、解析、存储网络数据(附赠)。
4.Selenium。浏览器自动化工具,支持完整浏览器渲染(Chrome/Firefox),可处理JavaScript 动态内容,模拟用户交互(点击、输入等)。
5.爬虫实战案例精讲。以中国裁判文书网和中国知网为例(附赠)。
注:网络爬虫需遵守法律法规和网站Robots协议。
五、司法裁判文书论文详细解读
包括如下论文的详细解读和论文实证结果复现:
1.阳李,王剑波,张龙成. 户籍会影响量刑吗?——来自北京和上海的经验证据 [J]. 制度经济学研究, 2023, (02): 85-114.
司法裁判文书实证研究前沿:
2.何海波,马超,何源. 外来的和尚好念经——行政诉讼律师异地代理的实证分析,2025最新成果。
3.马超、郑兆祐、何海波.小马拉不动大车?行政诉讼提级管辖改革的实证分析,2025最新成果。
六、培训方式、时间
授课方式:线上,培训结束后3个月内提供无限制回放。
时间:2025年10月1日—10月4日。
上午9:00-11:00,下午15:00-17:00。
七、培训特色
(一)针对零基础入门者
课程囊括了Python基础、爬虫和司法裁判文书分析的主要技术,以基本原理、实际操作为抓手,由浅入深,通俗易懂,手把手逐词逐句的进行代码解读和操作,零基础也可以学会,尤其适合欲开展法学学术研究的本科生、硕士生、博士生以及青年教师和司法实务人员。
(二)一对一答疑和辅导
初学者在起步阶段,往往会遇到诸多难题,例如基础数理知识不足、理解存在困难、程序无法正常运行、命令安装不完整、结果无法复现等。为了系统解决初学者可能面临的诸多难题,我们对每位报名学员提供一对一答疑辅导。
一对一答疑和辅导由拥有博士学位的教师承担,力求系统解决学员在学习过程中遇到的困惑,提升应用能力。一对一答疑和辅导自正式开课之日起算,持续一年时间。
八、培训费用和缴费方式
(一)培训费用
教师和实务工作人员:3580元/人。
学生(提供学生证照片):3380元/人。
均可开发票,并可提供30学时的学时证书或结业证书(加盖四川驰腾力教育咨询有限公司公章)。
(二)缴费方式
银行账户户名:四川驰腾力教育咨询有限公司
银行账户账号:4402055609100213459
开户行:中国工商银行股份有限公司成都金牛交大路支行
亦可微信或支付宝直接转账。
九、咨询和报名信息
自该通知发布之日起开始报名,该通知同时在唯一官方网站(www.ealegal.cn)的“法学实证”板块上公布。
考虑到司法裁判文书数据提取和分析需要精细化和专业化的技术性知识,为预留充足的学习准备时间,自报名时即由一位有博士学位的老师开始指导预习和学习相应的技术性知识。
咨询和报名联系人:王老师
微信号:law4u2002
微信二维码(请扫码添加):