CN111581447A - 一种裁判文书评查方法 - Google Patents
一种裁判文书评查方法 Download PDFInfo
- Publication number
- CN111581447A CN111581447A CN202010391756.9A CN202010391756A CN111581447A CN 111581447 A CN111581447 A CN 111581447A CN 202010391756 A CN202010391756 A CN 202010391756A CN 111581447 A CN111581447 A CN 111581447A
- Authority
- CN
- China
- Prior art keywords
- text
- document
- referee
- reason
- paragraph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012552 review Methods 0.000 claims abstract description 21
- 230000009193 crawling Effects 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000012986 modification Methods 0.000 claims abstract description 9
- 230000004048 modification Effects 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000003062 neural network model Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000012553 document review Methods 0.000 claims description 4
- 241000239290 Araneae Species 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000000903 blocking effect Effects 0.000 claims description 2
- 238000013075 data extraction Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 abstract description 5
- 238000004422 calculation algorithm Methods 0.000 abstract description 4
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/182—Alternative dispute resolution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于数据分析领域,涉及到一种裁判文书评查方法。本发明基于深度学习算法,实现对已公开的裁判文书根据预设评分规则自动进行评查。一种裁判文书评查方法包括:爬取模块、处理模块、评查模块,其中:爬取模块,用于从裁判文书网站爬取已经公布的裁判文书;处理模块,对导入的裁判文书进行预处理、信息抽取;评查模块,根据预设评分规则,对法律文书整体进行检验、依据评查标准打分并给出修改意见。本方法用于解决现有技术中人工评查文书耗费大量的人力、时间,不仅工作繁琐,而且容易出错的问题。
Description
技术领域
本发明属于数据分析领域,涉及到一种裁判文书评查方法,特别是一种基于深度学习算 法的裁判文书评查方法。
背景技术
裁判文书是记载人民法院审理过程和结果的文件,它是诉讼活动结果的载体,也是人民 法院确定和分配当事人实体权利义务的唯一凭证。一份结构完整、要素齐全、逻辑严谨的裁 判文书,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事 审判活动的重要依据。
随着司法智能化与司法信息公开化的逐步发展,越来越多的裁判文书需要在网络上进行 公开,来展示司法的权威性与公正性。2013年7月,《最高人民法院裁判文书上网公布暂行 办法》正式实施。依据该办法,除法律规定的特殊情形外,最高法院发生法律效力的判决书、 裁定书、决定书一般均应在互联网公布。2014年1月1日,《最高人民法院关于人民法院在 互联网公布裁判文书的规定》正式实施。该司法解释明确,最高法院在互联网设立中国裁判 文书网,统一公布各级人民法院的生效裁判文书。同时,各大地区法院为了保证裁判文书的 书写质量,每隔一段时间会成立评查领导小组,开展裁判文书评查工作。
无论是自查还是交由第三方评查,第一,对文书开展的评查工作在一定程度上都会耗费 相当人力;第二,各地标准不同导致评查重点不一,大大增加评查复杂度。因此,有必要设 计一种新的系统,以实现从裁判文书网自动获取裁判文书,根据科学客观的评价标准自动评 查并给出评查结果和修改意见,实现智能化评查,逐步消除人为干扰。
发明内容
本发明的目的在于针对上述现有不足,提供一种基于深度学习算法的Web API请求适配 方法。
本发明的目的是通过以下技术方案实现的:
一种裁判文书评查方法,包括以下步骤:
A、裁判文书的爬取
包括从裁判文书网站爬取已经公布的裁判文书;
B、裁判文书的处理
包括对导入的裁判文书进行预处理、信息抽取;
C、裁判文书的评查
包括根据预设评分规则,对法律文书整体进行检验、依据评查标准打分并给出修改意见。
可选地,步骤A,所述的裁判文书的爬取包括以下步骤:
A1、对定向数据抽取:搭建以Scrapy为核心的抓取框架对裁判文书网进行裁判文书的 爬取。
A2、处理数据流的噪点:对文书详情页进行解析,将文书的各部分信息分开以存往数 据库,达到提前消除文书‘噪声’的效果。
可选地,所述的以Scrapy为核心的抓取框架由中间的scrapy引擎、Middlewares(中间 件)、Item(实体类)、Scheduler(请求序列)以及Downloader(下载器)和Spider(原始网 页请求)组成。
可选地,步骤B,所述的裁判文书的处理包括以下步骤:
B1、预处理单元:对接收的文本进行清洗,包括编码转换、去除噪声;对清洗后的文本 进行结构化,包括分块、分段并且生成每个文本段落的多个词样本。对每个文本段落的词样 本进行筛选包括去除每个文本段落的停用词,所述停用词包括标点符号、数学字符、和/或 高频无用词。
B2.信息抽取单元:识别爬取的裁判文书的文书类型;获取与文书类型匹配的划分规则; 根据划分规则对裁判文书提取文本信息。
可选地,步骤C,所述的裁判文书的评查包括以下步骤:
C1、校验文书整体格式;
C2、校验信息完整度:校验是否由标题、正文、落款三部分组成。所述标题包括法院名 称、文书名称、案号;所述正文包括首部、事实、理由、裁判依据、裁判主文、尾部;所述 落款包括署名和日期;
C3、评查判决理由:接受待评查的判决理由文本段落,将待处理的判决理由文本段落输 入至经训练的深度神经网络模型;以及从所述深度神经网络模型输出该文本段落合理的概率。 如果所述概率高于阈值,则确定所述判决理由文本段落合理;
C4、根据结果进行打分并给出修改意见。
可选地,所述的深度神经网络模型通过若干带有标签的正样例集和负样例集训练语言模 型、双向长短时记忆网络所得的。
可选地,所述的正样例集包括判决理由叙述完整且表述合理的文本段落,且所述负样例 集包括判决理由叙述不完整或表述不合理的文本段落,包括以下一者或多者:未明确纠纷的 性质、案由;未依照法律、司法解释规定的法律适用规则进行分析;未围绕争议焦点阐明理 由。
可选地,对所述正样例集和所述负样例集中的文本段落进行分词拆解以生成每个文本段 落的多个词样本。所述的生成每个文本段落的多个词样本包括对每个文本段落的词样本进行 筛选,对每个文本段落的词样本进行筛选,包括去除每个文本段落的停用词,所述停用词包 括标点符号、数学字符和高频无用词。以及使用所述正样例集中的文本段落的词样本和所述 负样例集中的文本段落的词样本来训练深度神经网络模型。
本发明提供的技术方案具有以下优点:对裁判文书网进行爬取的同时去除数据噪声,整 理案件的完整法律要素和内在逻辑关系,将非结构化信息组织重整,大大提高文书评查效率, 利用深度学习方法进行判决理由的评查,大大减少人工成本。
附图说明
图1是根据本发明一个实施例的裁判文书评查系统结构示意图。
图2是根据本发明一个实施例的爬取框架示意图。
图3是根据本发明一个实施例的预处理单元的流程图。
图4是根据本发明一个实施例的信息抽取单元的流程图。
图5是根据本发明一个实施例的评查判决理由的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描 述,但不应以此限制本公开的保护范围。
本发明提供一种基于深度学习算法的裁判文书评查方法。
本实施例提供一种裁判文书评查方法,如图1所示,包括爬取模块、处理模块、评查模 块。
爬取模块10,用于从裁判文书网站爬取已经公布的裁判文书,包括:定向数据抽取S10、 处理数据流的噪点S20。
处理模块20,用于对导入的裁判文书进行预处理、信息抽取,包括:预处理单元S30、 信息抽取单元S40。
评查模块30,用于根据预设评分规则,对法律文书整体进行检验、依据评查标准打分 并给出修改意见,包括:结构评查S50、关键字评查S60和判决理由评查S70。
在一实例中,如图2所示,爬取框架10包括:
Scrapy引擎101,用于抓取web站点并从页面中提取结构化的数据。
Item(实体类)102,作为爬取内容实体,由于文书之间是没有任何关联关系,因此采 用的是mongodb非关系型数据库进行数据存储。
实施例1:文书实体类定义
Spider(原始网页请求)103,用于向网页地址发出原始请求。通过两个参数将需要访问 的两类链接分开,第一类是文书展示页面,第二类是文书详情页面。
Downloader Middlewares(下载中间件)104用于对页面进行js渲染以及一系列模拟点 击的操作。
实施例2:
在下载中间件中,当tag=1时,代表文书详情页面的请求,直接返回通过selenium渲染 出js的网页代码即可;而对于文书展示页面,则需要通过selenium将网页源代码的select 标签中option选项内容更改为需要访问的文书条数(比如网站给的权限就是可以看600条数 据),这里就把option选项内容改为‘600’,然后再模拟点击时间选择展示600条数据的文 书列表页面,因此避免了翻页访问多个页面所带来的时间开销,即一次页面请求获取到所有 的文书链接以进行后续文书详情页的获取。
Downloader(下载器)105用于下载文书展示页面和文书详情页面。
处理数据流的噪点包括:对文书详情页进行解析,将文书的各部分信息分开以存往数据 库,达到提前消除文书噪声的效果。
在一实施例中,如图3所示,S30预处理单元包括:
S301、接收待处理的文本内容;
S302、对文本内容进行编码转换;
S303、对文本进行分块、分段、分词;
S304、对文本进行筛选去除停用词。所述停用词包括标点符号、数学字符、和/或高频 无用词。
在一实施例中,如图4所示,S40信息抽取单元包括:
S401、获取待识别裁判文书;
S402、识别裁判文书的类型;
S403、获取与文书类型匹配的划分规则;
S404、根据划分规则对裁判文书提取文本信息。
可选地,所述的评查模块根据预设评分规则,对结构化的裁判文书整体进行检验评查。 包括:校验文书整体格式、校验信息完整度、评查判决理由,根据结果进行打分并给出修改 意见。
可选地,所述的校验信息完整度包括校验标题、正文、落款三部分组成。所述标题包括 法院名称、文书名称、案号;所述正文包括首部、事实、理由、裁判依据、裁判主文、尾部; 所述落款包括署名和日期。
实施例3:裁判文书基本要素:
1、文书由标题、正文、落款三部分组成;
2、标题包括法院名称、文书名称和案号;
3、正文包括首部、事实、理由、裁判依据、裁判主文、尾部。
...
可选地,所述的评查判决理由包括:接受待评查的判决理由文本段落,将待处理的判决 理由文本段落输入至经训练的深度神经网络模型;以及从所述深度神经网络模型输出该文本 段落合理的概率。
可选地,如果所述概率高于阈值,则确定所述判决理由文本段落合理。
可选地,所述的深度神经网络模型通过若干带有标签的正样例集和负样例集训练语言模 型、双向长短时记忆网络所得的。
可选地,所述的正样例集包括判决理由叙述完整且表述合理的文本段落,且所述负样例 集包括判决理由叙述不完整或表述不合理的文本段落,包括以下一者或多者:未明确纠纷的 性质、案由;未依照法律、司法解释规定的法律适用规则进行分析;未围绕争议焦点阐明理 由。
实施例4:正样例集:
本院认为,上诉人张XX反交通运输管理法规,因而发生重大事故,致人死亡,其行为 已构成交通肇事罪。原判定罪准确,量刑适当,审判程序合法。张XX及其辩护人的上诉、辩护理由本院不予采纳。依照《中华人民共和国刑事诉讼法》第二百二十五条第一款第(一)项之规定,裁定如下:驳回上诉,维持原判。
可选地,对所述正样例集和所述负样例集中的文本段落进行分词拆解以生成每个文本段 落的多个词样本。所述的生成每个文本段落的多个词样本包括对每个文本段落的词样本进行 筛选,对每个文本段落的词样本进行筛选,包括去除每个文本段落的停用词,所述停用词包 括标点符号、数学字符和高频无用词。以及使用所述正样例集中的文本段落的词样本和所述 负样例集中的文本段落的词样本来训练深度神经网络模型。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用。 它完全可以被适用于各种适合本发明的领域。对于熟悉本领域的人员而言,可容易地实现另 外的修改。因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的 细节和这里示出与描述的图例。
Claims (8)
1.一种裁判文书评查方法,包括以下步骤:
A、裁判文书的爬取
包括:从裁判文书网站爬取已经公布的裁判文书;
B、裁判文书的处理
包括:对导入的裁判文书进行预处理、信息抽取;
C、裁判文书的评查
包括:根据预设评分规则,对法律文书整体进行检验、依据评查标准打分并给出修改意见。
2.根据权利要求1所述的一种裁判文书评查方法,其特征在于,步骤A所述裁判文书的爬取包括以下步骤:
A1、对定向数据抽取:搭建以Scrapy为核心的抓取框架对裁判文书网进行裁判文书的爬取;
A2、处理数据流的噪点:对文书详情页进行解析,将文书的各部分信息分开以存往数据库,达到提前消除文书‘噪声’的效果。
3.根据权利要求2所述的一种裁判文书评查方法,其特征在于,步骤A1所述定向数据抽取,其特征在于,所述的以Scrapy为核心的抓取框架由中间的scrapy引擎、Middlewares中间件、Item实体类、Scheduler请求序列以及Downloader下载器和Spider原始网页请求组成。
4.根据权利要求1所述的一种裁判文书评查方法,其特征在于,步骤B所述裁判文书的处理包括以下步骤:
B1、预处理单元:对接收的文本进行清洗,包括:编码转换、去除噪声;对清洗后的文本进行结构化,包括:分块、分段并且生成每个文本段落的多个词样本;对每个文本段落的词样本进行筛选,包括:去除每个文本段落的停用词,所述停用词包括:标点符号、数学字符、和/或高频无用词;
B2、信息抽取单元:识别爬取的裁判文书的文书类型;获取与文书类型匹配的划分规则;根据划分规则对裁判文书提取文本信息。
5.根据权利要求1所述的一种裁判文书评查方法,其特征在于,步骤C所述裁判文书的评查包括以下步骤:
C1、校验文书整体格式;
C2、校验信息完整度:校验是否由标题、正文、落款三部分组成;所述标题,包括:法院名称、文书名称和案号;所述正文,包括:首部、事实、理由、裁判依据、裁判主文和尾部;所述落款,包括署:名和日期;
C3、评查判决理由:接受待评查的判决理由文本段落,将待处理的判决理由文本段落输入至经训练的深度神经网络模型;以及从所述深度神经网络模型输出该文本段落合理的概率;如果所述概率高于阈值,则确定所述判决理由文本段落合理;
C4、根据结果进行打分并给出修改意见。
6.根据权利要求5所述的一种裁判文书评查方法,其特征在于,步骤C3评查判决理由中,所述的深度神经网络模型通过若干带有标签的正样例集和负样例集训练语言模型、双向长短时记忆网络所得的。
7.根据权利要求6所述的一种裁判文书评查方法,其特征在于,所述正样例集包括:判决理由叙述完整且表述合理的文本段落,且所述负样例集包括:判决理由叙述不完整或表述不合理的文本段落,包括以下一者或多者:未明确纠纷的性质、案由;未依照法律、司法解释规定的法律适用规则进行分析;未围绕争议焦点阐明理由。
8.根据权利要求6所述的一种裁判文书评查方法,其特征在于,对所述正样例集和所述负样例集中的文本段落进行分词拆解,以生成每个文本段落的多个词样本;所述的生成每个文本段落的多个词样本,包括:对每个文本段落的词样本进行筛选,所述对每个文本段落的词样本进行筛选,包括:去除每个文本段落的停用词,所述停用词包括:标点符号、数学字符和高频无用词,以及使用所述正样例集中的文本段落的词样本和所述负样例集中的文本段落的词样本来训练深度神经网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010391756.9A CN111581447A (zh) | 2020-05-11 | 2020-05-11 | 一种裁判文书评查方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010391756.9A CN111581447A (zh) | 2020-05-11 | 2020-05-11 | 一种裁判文书评查方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111581447A true CN111581447A (zh) | 2020-08-25 |
Family
ID=72126549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010391756.9A Pending CN111581447A (zh) | 2020-05-11 | 2020-05-11 | 一种裁判文书评查方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111581447A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112699218A (zh) * | 2020-12-30 | 2021-04-23 | 成都数之联科技有限公司 | 模型建立方法及系统及段落标签获得方法及介质 |
CN112988972A (zh) * | 2021-03-19 | 2021-06-18 | 浪潮云信息技术股份公司 | 一种基于数据模型的行政处罚案卷评查方法及系统 |
CN113239682A (zh) * | 2021-05-06 | 2021-08-10 | 吉林大学 | 一种裁判文书的纠错方法及装置 |
CN113378542A (zh) * | 2021-02-05 | 2021-09-10 | 中国司法大数据研究院有限公司 | 一种裁判文书质量评测的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341143A (zh) * | 2017-05-26 | 2017-11-10 | 北京奇艺世纪科技有限公司 | 一种句子连贯性判断方法及装置和电子设备 |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
CN109582950A (zh) * | 2018-09-25 | 2019-04-05 | 南京大学 | 一种裁判文书说理评估方法 |
CN110335180A (zh) * | 2019-07-04 | 2019-10-15 | 北京市律典通科技有限公司 | 案件立案材料智能审查装置 |
-
2020
- 2020-05-11 CN CN202010391756.9A patent/CN111581447A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341143A (zh) * | 2017-05-26 | 2017-11-10 | 北京奇艺世纪科技有限公司 | 一种句子连贯性判断方法及装置和电子设备 |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
CN109582950A (zh) * | 2018-09-25 | 2019-04-05 | 南京大学 | 一种裁判文书说理评估方法 |
CN110335180A (zh) * | 2019-07-04 | 2019-10-15 | 北京市律典通科技有限公司 | 案件立案材料智能审查装置 |
Non-Patent Citations (1)
Title |
---|
王敬波 等: "司法公开评查技术研究及司法公开综合管理平台原型构建2019年度进展报告", 《国家科技报告服务系统》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112699218A (zh) * | 2020-12-30 | 2021-04-23 | 成都数之联科技有限公司 | 模型建立方法及系统及段落标签获得方法及介质 |
CN113378542A (zh) * | 2021-02-05 | 2021-09-10 | 中国司法大数据研究院有限公司 | 一种裁判文书质量评测的方法和装置 |
CN112988972A (zh) * | 2021-03-19 | 2021-06-18 | 浪潮云信息技术股份公司 | 一种基于数据模型的行政处罚案卷评查方法及系统 |
CN113239682A (zh) * | 2021-05-06 | 2021-08-10 | 吉林大学 | 一种裁判文书的纠错方法及装置 |
CN113239682B (zh) * | 2021-05-06 | 2022-11-01 | 吉林大学 | 一种裁判文书的纠错方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Landers et al. | A primer on theory-driven web scraping: Automatic extraction of big data from the Internet for use in psychological research. | |
CN111581447A (zh) | 一种裁判文书评查方法 | |
CN109325165B (zh) | 网络舆情分析方法、装置及存储介质 | |
Outhwaite et al. | Annual estimates of occupancy for bryophytes, lichens and invertebrates in the UK, 1970–2015 | |
Rose et al. | Low cost text mining as a strategy for qualitative researchers | |
Lovejoy et al. | Assessing the reporting of reliability in published content analyses: 1985–2010 | |
Rubbo et al. | Citation of retracted articles in engineering: A study of the Web of Science database | |
Kravets et al. | Gauging reference and source bias over time: how Russia’s partially state-controlled search engine Yandex mediated an anti-regime protest event | |
Sofyan et al. | The philosophy of sport and physical education: Four decade publication trends via scientometric evaluation | |
Whitley et al. | Analyzing media representations of mental illness: lessons learnt from a national project | |
CN108681749B (zh) | 基于网络社交平台的隐私信息甄别方法 | |
CN114860882A (zh) | 一种基于文本分类模型的公平竞争审查辅助方法 | |
Speckmann | Web scraping: A useful tool to broaden and extend psychological research. | |
Dugoua et al. | Text as data in environmental economics and policy | |
Nissen et al. | Digital infrastructures of COVID-19 misinformation: A new conceptual and analytical perspective on fact-checking | |
Cordell et al. | Disaggregating repression: Identifying physical integrity rights allegations in human rights reports | |
Trejo-Pech et al. | Violations of standard practices by predatory economics journals | |
Alvi et al. | On the frontiers of Twitter data and sentiment analysis in election prediction: a review | |
Riesthuis et al. | Factors affecting the forced confabulation effect: A meta-analysis of laboratory studies | |
Kermani et al. | Computational vs. qualitative: analyzing different approaches in identifying networked frames during the Covid-19 crisis | |
CN109063485B (zh) | 一种基于漏洞平台的漏洞分类统计系统及方法 | |
An et al. | Who Owns America? A Methodology for Identifying Landlords’ Ownership Scale and the Implications for Targeted Code Enforcement | |
Jikeli et al. | Antisemitic messages? A guide to high-quality annotation and a labeled dataset of tweets | |
Meisenbacher et al. | Transforming unstructured text into data with context rule assisted machine learning (CRAML) | |
Naik et al. | An adaptable scheme to enhance the sentiment classification of Telugu language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200825 |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200825 |