CN115392209B - 一种自动生成民事案件法律文书的方法、设备及介质 - Google Patents
一种自动生成民事案件法律文书的方法、设备及介质 Download PDFInfo
- Publication number
- CN115392209B CN115392209B CN202210941611.0A CN202210941611A CN115392209B CN 115392209 B CN115392209 B CN 115392209B CN 202210941611 A CN202210941611 A CN 202210941611A CN 115392209 B CN115392209 B CN 115392209B
- Authority
- CN
- China
- Prior art keywords
- case
- legal
- current
- data information
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004519 manufacturing process Methods 0.000 claims abstract description 25
- 238000005516 engineering process Methods 0.000 claims abstract description 22
- 239000013598 vector Substances 0.000 claims description 29
- 238000012795 verification Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 3
- 238000012015 optical character recognition Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19093—Proximity measures, i.e. similarity or distance measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例公开了一种自动生成民事案件法律文书的方法、设备及介质,方法包括:获取法官扫描上传的卷宗图像,并将卷宗图像输入预设OCR识别模型以提取相关数据信息;基于相关数据信息与当前案由编排体系,确定当前民事案件的案由类别,根据案由类别提取与当前民事案件相关的关键词;根据案由类别、关键词与案件编号、当前法律文书的制作主体,确定出当前民事案件的系统搜索集合;基于RPA技术抓取系统搜索集合中与关键词对应的法律特征数据信息与案例数据信息,将法律特征数据信息与释法说理库进行对比获取法律法规数据信息;将案例数据信息、法律法规数据信息与相关数据信息,写入与当前民事案件相对应的文书模板中,获得当前民事案件法律文书。
Description
技术领域
本说明书涉及数据处理领域,尤其涉及一种自动生成民事案件法律文书的方法、设备及介质。
背景技术
民事案件是人民法院依照法律规定,为方便审理和解决当事人之间的争议,根据法律关系的性质对受理案件所进行的分类。法律文书是司法行政机关及当事人、律师等在解决诉讼和非讼案件时使用的文书,是用来具体落实法律法规的重要手段之一。因此,法律文书对于民事案件的司法过程十分重要。
民事案件的法律文书当中包含了许多离散的司法信息,由于单个系统中对应的司法信息有限,所以民事案件的法律文书在生成过程中需要跨多个系统实现数据的采集与汇聚。目前进行民事案件法律文书的制作时,需要工作人员花费大量的时间一个系统再一个系统地去查询这些数据,在频繁的查询操作以及系统切换的过程中,工作人员的工作效率以及查询的准确性并不能够得到保证。此外,民事案件的法律文书在查找与案件相对应的法律法规等司法信息之后,还需要进行填写,然而现有的纸质卷宗文件无法复制内容进行填写,需要手动敲写,因此在法律文书的撰写上耗费了大量的时间。
发明内容
本说明书一个或多个实施例提供了一种自动生成民事案件法律文书的方法、设备及介质,用于解决如下技术问题:如何提供一种快速可靠的民事案件法律文书的生成方法。
本说明书一个或多个实施例采用下述技术方案:
本说明书一个或多个实施例提供一种自动生成民事案件法律文书的方法,方法包括:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
可选地,在本说明书一个或多个实施例中,将所述卷宗图像输入预先训练的OCR识别模型之前,所述方法还包括:
获取所述卷宗图像中各像素点中各颜色通道值的最小值,并将所述最小值作为所述各像素点的灰度值,以获得与所述卷宗图像相对应的灰色图像;
基于预设分割面积将所述灰色图像划分为多个子区域,获取所述子区域中各像素的灰度值的均值,并将所述均值作为该子区域的阈值,以基于所述阈值对所述子区域进行二值化处理,获得所述卷宗图像的二值化图像;
基于预设高斯滤波核对所述二值化图像中各个像素点的值进行加权,以过滤所述二值化图像中的噪声数据,获得待校正图像;
获取所述待校正图像中各直线的位置与角度,以根据所述直线的位置与角度确定各所述直线的倾斜角度,并将各所述直线的倾斜角度的均值作为所述待校正图像的调整角度,以获得处理后的卷宗图像;其中,所述直线至少包括以下任意一项或多项:页眉分割线、页脚分割线、图像边缘线。
可选地,在本说明书一个或多个实施例中,将所述卷宗图像信息输入预先训练的OCR识别模型之后,所述方法还包括:
基于所述预先训练的OCR识别模型,识别所述处理后的卷宗图像信息中的字符信息以及与所述字符信息相对应的位置信息;
将所述字符信息基于所述字符信息相对应的位置信息进行排列,生成与所述处理后的卷宗图像信息相对应的文本区域的识别结果;
将所述识别结果输入到预置的分词模型中输出所述识别结果的分词数据;将所述分词数据输入到预先训练的错误筛选模型中,输出所述识别结果中的错误字符;
基于所述当前法律文书的制作主体预设的编码字库,对所述识别结果中的各个字符进行编码,以获得所述识别结果中各个字符的点阵图编码;
基于汉明距离计算各个字符的点阵图编码中,各位置的码位值,以基于所述码位值,确定所述字符与所述识别结果中其他字符的字符相似度,并根据所述字符相似度,选取预设数量的与所述错误字符相对应的字符作为候选替换字符;
通过所述错误字符的字符结构与所述候选替换字符中的字符结构,获取所述错误字符与所述候选替换字符之间的相似度,以基于所述相似度获得与所述错误字符匹配度最高的候选字符进行替换,以实现对所述识别结果的纠错。
可选地,在本说明书一个或多个实施例中,基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词具体包括:
根据专家经验模型对所述相关数据信息进行分析,以确定所述当前民事案件在所述当前案由编排体系中所对应的案由类型;
基于所述案由类型,提取所述相关数据中与所述当前民事案件的案由类型相关联的事实要素语句以及诉讼请求要素语句,以将所述事实要素语句与所述诉讼请求要素语句作为待分析语句;
获取所述待分析语句中各个词汇所对应的属性,并根据所述属性过滤所述待分析语句中与所述当前民事案件的案由类型无关的词汇,获得所述相关数据信息中与所述当前民事案件相关的关键词。
可选地,在本说明书一个或多个实施例中,根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合,具体包括:
根据所述相关信息获取所述当前民事案件的编号、当事人的姓名,并确认当前法律文书的制作主体;
通过所述民事案件的编号与所述当事人的姓名,确定与所述当前民事案件相对应的第一系统搜索集合,以基于所述第一系统搜索集合获取所述当事人的身份信息;其中,所述身份信息至少包括以下任意一项或多项:姓名、性别、居住地址、户籍信息、学籍信息、就业信息;
通过所述案由类型与所述当事人的姓名,确定与所述当前民事案件相对应第二系统搜索集合,以基于所述第二系统搜索集合获取与所述当事人相对应的历史同类型案由案件;
通过所述当前法律文书的制作主体的访问权限,确定所述第一系统搜索集合与所述第二系统搜索集合中的一个或多个系统作为所述当前民事案件的系统搜索集合。
可选地,在本说明书一个或多个实施例中,通过所述当前法律文书的制作主体的访问权限,确定所述第一系统搜索集合与所述第二系统搜索集合中的一个或多个系统作为所述当前民事案件的系统搜索集合,具体包括:
基于所述当前法律文书的制作主体,确定所述第一系统搜索集合与所述第二系统搜索集合的登录角色;其中,所述登录角色至少包括:政府机构、公证机关、律师事务所;
获取所述当前法律文书的制作主体的终端输入的登录验证信息;其中,所述登录验证信息包括:系统登录账号与系统登录密码;
根据所述系统登录账号与所述系统登录密码,对所述当前法律文书的制作主体的终端所对应的身份进行验证,获得验证结果;
若基于所述验证结果确定身份验证通过,并且与所述登录角色相匹配,则确定所述第一系统搜索集合与所述第二系统搜索集合中与所述登录角色相对应的系统作为所述当前民事案件的系统搜索集合。
可选地,在本说明书一个或多个实施例中,基于RPA技术分别抓取所述系统搜索集合与所述关键字相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规,具体包括:
获取所述当前民事案件的系统搜索集合内各系统的系统线程空闲时间;
若当前时间处于所述系统线程空闲时间内,则基于RPA技术在所述当前民事案件的系统搜索集合内系统中查询所述关键词,获得所述法律特征数据信息与所述案例数据信息;
将所述法律特征数据信息转换为法律特征数据向量,并将预置释法说理库中各法律法规信息转换为对应的法律法规向量,获得所述预置释法说理库所对应的法律法规向量集合;
计算所述法律特征向量与所述法律法规向量集合中各法律法规向量之间夹角的余弦值,以基于所述余弦值确定所述法律特征向量与各所述法律法规向量的相似度;
若所述相似度大于预设阈值则将所述法律法规向量所对应的法律法规,作为与所述当前民事案件相对应的法律法规;
获取与所述当前民事案件相对应的法律法规,并确定所述当前民事案件的法律文书所对应的数据结构;
调用预设转换规则中所述对应的数据结构与其他数据结构进行转换的转换规则,以基于所述转换规则对该法律法规进行转换,获得与法律文书的数据结构相同的法律法规数据信息。
可选地,在本说明书一个或多个实施例中,将所述案例数据信息、所述相对应的法律法规与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中之前,所述方法还包括:
获取所述相关数据信息中当前民事案件的制作主体的位置信息,以基于所述位置信息与所述关键词,获取预设范围内各法院民事案件的历史法律文书信息;
基于各法院的民事案件的历史法律文书信息、所述当前民事案件法律文书的类型,确定所述当前民事案件的至少一种法律文书的文书框架;其中,所述文书框架至少包括以下任意一项或多项:文本区域的框架,图片证据区域的框架,分栏框架;
获取所述至少一种法律文书的文书框架所对应的历史案由类型,以获取与所述当前民事案件的案由类型相对应的待选择文书框架;
基于当前法律文书的制作主体的文本特征,对待选择文书框架进行调整,获得与所述当前民事案件法律文书相对应的至少一种的文书模板;其中,所述文本特征至少包括以下任意一项或多项:所述制作主体的水印、预置字体格式要求、所述制作主体的页脚标识。
本说明书一个或多个实施例提供一种自动生成民事案件法律文书的设备,设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
基于对卷宗图像进行分析并结合当前案由类别获得当前民事案件的相关的关键词,并通过关键词、案由类别以及当前民事案件的编号和当前法律文书的制作主体确定出当前民事案件的系统搜索集合,缩小了系统查询的范围。且基于RPA技术对关键词的查询,不用写接口即可抓取系统搜索集合中不同系统的数据,实现了跨系统获取数据。避免了工作人员花费大量时间一个系统一个系统地登录查询数据,所造成的效率低以及准确性无法保证的问题。将获取到的法律法规信息、案例数据信息以及相关数据信息写入到文书模板中,避免了民事案件中工作人员无法对纸质的文件进行内容复制,需要进行手动敲写所造成的时间浪费问题。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本说明书实施例提供的一种自动生成民事案件法律文书的方法流程示意图;
图2为本说明书实施例提供的一种自动生成民事案件法律文书的设备内部结构示意图;
图3为本说明书实施例提供的一种非易失性存储介质的内部结构示意图。
具体实施方式
本说明书实施例提供一种自动生成民事案件法律文书的方法、设备及介质。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
如图1所示,本说明书实施例提供了一种自动生成民事案件法律文书的方法流程示意图。由图1可知,方法包括以下步骤:
S101:获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息。
当前,由于卷宗等纸质文件中的内容,无法直接进行复制粘贴形成文字,需要法官或者工作人员手动敲写从而获得当前民事案件的相关数据信息。这就导致了大量的时间浪费在了材料整理以及材料获取的过程中,从而拉长了民事案件法律文书的生成时间,也造成了工作人员无法以充足的时间去进行民事案件的其他分析工作。因此在本说明书实施例中为了节省时间,通过获取法官基于扫描仪器上传的卷宗图像,然后把卷宗图像输入到预先训练的OCR识别模型中,实现对于卷宗图像中当前民事案件的相关数据信息的获取。
其中,需要说明的是OCR是指光学字符识别技术(Optical CharacterRecognition,简称OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术,本说明书实施例是基于该OCR技术,训练获得的OCR识别模型。
为了更加高效的提取卷宗图像中当前民事案件的相关数据信息,并避免由于图片拍摄角度或者纸质文件自身褶皱造成的识别错误问题提高识别信息的可靠性。在本说明书一个或多个实施例中,将卷宗图像输入预先训练的OCR识别模型之前,方法还包括以下过程:
首先,由于法律文书的生成过程对于文字信息的要求较高,而对于颜色信息的依赖性并不强,本说明书实施例中为了降低计算过程的运算量,通过获取卷宗图像中各像素点中各颜色通道值的最小值,并将最小值作为所述各像素点的灰度值,获得到与卷宗图像相对应的灰色图像,从而以灰色图像进行后续分析处理,避免了在对于RGB三通道进行分析时所产生的计算量。
然后因为卷宗图像中的文字往往是黑色或者蓝色灯深颜色字号,也就是说在进行上述过程的灰度转换后,文字的像素值偏向于0,所以为了进一步凸显文字信息,本说明书实施例根据预先设置的分割面积将灰色图像划分成多个子区域,然后获取各个子区域中各像素的灰度值均值,并且把获取到的灰度值均值作为该子区域的二值化阈值,从而根据该阈值对子区域进行二值化处理,获得卷宗图像的二值化图像。通过对于区域的划分后在进行二值化阈值的确定实现灰度图像的二值化避免了整体像素点的灰度均值进行二值化时所导致的局部灰度值与整体图像差别过大的问题。在获得二值化图像之后,为了实现噪声的过滤本说明书实施例基于预设高斯滤波核对二值化图像中各个像素点的值进行加权,从而过滤掉二值化图像中的噪声数据,获得待校正图像。由于图像扫描过程中可能存在仪器没有处于水平位置,然后导致了图像的歪斜进而使得文字也处于偏移的状态,而该状态可能使得文字的结构被拉长或者压缩故对于后续识别的准确度产生影响,所以本说明书实施例获取到待校正图像中各直线的位置与角度,从而根据直线的位置与角度确定出卷宗图像的待校正图像中,各个直线的倾斜角度,并将各个直线的倾斜角度的均值作为该待校正图像的调整角度,从而获得处理后的卷宗图像。其中,需要说明的是直线至少包括以下任意一项或多项:页眉分割线、页脚分割线、图像边缘线。
为了提高文字识别的可靠性,在本说明书一个或多个实施例中,将卷宗图像信息输入预先训练的OCR识别模型之后,方法还包括过程:首先根据预先训练的OCR识别模型,识别处理后的卷宗图像信息中的字符信息以及与字符信息相对应的位置信息。然后把字符信息根据与字符信息相对应的位置信息进行排列,从而生成与处理后的卷宗图像信息相对应的文本区域的识别结果。再将文本区域的识别结果输入到预先设置的分词模型中,从而获得该识别结果所对应的分词数据。把分词数据输入到预先训练的错误筛选模型中,进行错误识别的筛选,确定出识别结果中的错误字符。由于法律文书所涉及的信息较大也就是说上下文信息过多,从而导致基于上下文信息对于错误字符进行纠错时会耗费大量的计算资源。因此本说明书实施例中根据当前法律文书的制作主体预设的编码字库,对识别结果中的各个字符进行编码,从而获得识别结果中各个字符的点阵图编码。其中,编码字库可以是GBK编码字库、GB2312编码字库等。在确定出各个字符的点阵图编码后基于汉明距离相似度的方式计算各个字符的点阵图编码中,各位置的码位值,从而根据获得的各个码位值,确定出字符与上述识别结果中其他字符的字符相似度,并根据字符相似度,选取预设数量的与错误字符相对应的字符作为候选替换字符。其中,需要说明的是:根据获得的各个码位值确定出字符与其他字符的相似度是根据汉明距离的计算方式计算字符在每个位置的码位值是否相同,根据码位值不相同的数量确定出该字符向量与其他字符向量之间的相似度,可以理解的是不相同的码位值越多那么该字符与其他字符之间的相似度越低。通过错误字符的字符结构与候选替换字符中的字符结构,获取错误字符与候选替换字符之间的相似度,以基于相似度获得与错误字符匹配度最高的候选字符进行替换,以实现对识别结果的纠错。
S102:基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词。
基于上述步骤S101提取出卷宗图像中的当前民事案件的相关数据信息之后,为了避免长句检索所造成的检索结果无法匹配,从而导致的搜索资料缺失的问题。本说明书实施例中根据相关数据信息与当前案由编排体系,确定出当前民事案件所对应的案由类别,然后根据该民事案件的案由类别在相关数据信息中提取出与当前民事案件相关的关键词。
其中,需要说明的是当前案由编排体系是根据最高人民法院发布的《民事案件案由规定》,以民法理论对民事法律关系的分类为基础,以法律关系的内容即民事权利类型来编排的体系,结合现行立法以及审判实践,案由的编排体系划分为一级案由、二级案由、三级案由和四级案由。其中,一级案由包括:人格权纠纷,婚姻家庭继承纠纷,物权纠纷,合同、无因管理、不当得利纠纷,知识产权与竞争纠纷,劳动争议与人事争议,海事海商纠纷,与公司、证券、保险、票据等有关的民事纠纷,侵权责任纠纷,适用特殊程序案件案由,共十大部分。二级案由是在第一级案由项下,细分的四十三类案由。第三级案由是在第二级案由项下列出了424种案由。基于审判工作指导、调研和司法统计的需要,《民事案件案由规定》在部分第三级案由项下又列出了一些第四级案由(以阿拉伯数字加()表示)。基于民事法律关系的复杂性,不可能穷尽所有第四级案由。此处不再对二级案由、三级案由以及四级案由的具体分类进行阐述。
具体地,在本说明书一个或多个实施例中,根据相关数据信息与当前案由编排体系,确定出当前民事案件所对应的案由类别,并基于案由类别在相关数据信息中提取与当前民事案件相关的关键词,具体包括以下过程:
首先根据专家经验模型对上述过程中获得的,当前民事案件的相关数据信息进行分析,确定出当前民事案件在当前案由编排体系中所对应的案由类型。然后根据确定出的案由类型,提取当前民事案件的相关数据中和该案由类型相关联的事实要素语句以及诉讼请求要素语句,从而把事实要素语句与诉讼请求要素语句作为待分析语句。其中,案件事实要素是根据不同的案由的法律关系约定的内容所组成的要素信息。然后获取待分析语句中各个词汇所对应的属性,并根据属性过滤待分析语句中与当前民事案件的案由类型无关的词汇,获得相关数据信息中与当前民事案件相关的关键词。例如:对于语句“原告李某出示的欠条表明双方之间成立的是金钱之债,而金钱之债不等同与合同之债”可以根据属性过滤掉语句中和当前民事案件的案由类型无关的词汇获得关键词“金钱”、“债”、“欠条”、“合同”等关键词。
S103:根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统。
基于上述步骤确定出当前民事案件的案由类别、关键字后,根据当前民事案件的案由类别、关键词以及相关信息中和当前民事案件的编号和当前法律文书的制作主体,确定出当前民事案件的系统搜索集合。需要说明的是系统搜索集合汇总至少包括一个能够进行司法信息查询的系统,例如:全国民事诉讼案件网、全国法院被执行人信息查询官网、最高人民法院诉讼网等相关的司法信息查询系统。
在本说明书一个或多个实施例中,根据案由类别、关键词与相关数据信息中当前民事案件的编号、以及当前法律文书的制作主体,确定出当前民事案件的系统搜索集合,具体包括以下过程:
根据相关信息获取当前民事案件的编号、当事人的姓名,并确认当前法律文书的制作主体。然后通过民事案件的编号与当事人的姓名,确定出与当前民事案件相对应的第一系统搜索集合,从而根据第一系统搜索集合中的获取到当事人的身份信息,可以理解的是当事人的身份信息至少包括有以下任意一项或多项:姓名、性别、居住地址、户籍信息、学籍信息、就业信息等。通过当前民事案件的案由类型和当事人的姓名,确定出和当前民事案件相对应第二系统搜索集合,从而根据确定出的第二系统搜索集合查询获取和案件当事人相对应的历史同类型案由案件,以便于结合当事人的历史案件对当前的案件进行分析判断,获得有效信息。然后通过当前法律文书的制作主体的访问权限,对第一系统搜索集合以及第二系统搜索集合所包含的系统进行筛选,确定出当前法律文书的制作主体可以访问的系统,即根据访问权限确定出第一系统搜索集合和第二系统搜索集合中的一个或多个系统作为当前民事案件的系统搜索集合。
进一步地,在本说明书一个或多个实施例中,通过当前法律文书的制作主体的访问权限,确定第一系统搜索集合与第二系统搜索集合中的一个或多个系统作为当前民事案件的系统搜索集合,具体包括以下过程:
首先基于当前法律文书的制作主体,确定出第一系统搜索集合与第二系统搜索集合的登录角色。其中需要说明的是,登录角色至少包括:政府机构、公证机关、律师事务所。获取当前法律文书的制作主体的终端所输入的登录验证信息。可以理解的是,登录验证信息至少包括:系统登录账号与系统登录密码。然后根据系统登录账号与系统登录密码,对当前法律文书的制作主体的终端所对应的身份进行验证,获得验证结果。如果根据验证结果可以确定当前法律文书的制作主体的身份验证通过,并且和登录角色相匹配,那么可以确定第一系统搜索集合与第二系统搜索集合中与该登录角色相对应的系统作为当前民事案件所对应的系统,将当前民事案件所对应的系统作为当前民事案件的搜索集合。
S104:基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息。
为了实现跨系统抓取信息,避免一个系统一个系统进行查询所造成的查询准确性无法保证的问题。本说明书实施例基于RPA技术分别抓取系统搜索集合中和关键词相对应的法律特征数据信息以及案例数据信息,并且将查询获得的法律特征数据信息与预先设置的释法说理库进行对比查询,从而获得和当前民事案件相对应的法律法规数据信息。其中,需要说明的是RPA技术是基于特定脚本,由机器人代替人工执行大批量、重复性的电脑操作实现流程自动化的技术,可以实现跨系统跨平台的自动化执行。本说明书实施例结合RPA技术进行信息的抓取,解放了工作人员执行重复性工作的时间,提高了法律文书的生成效率与可靠性。
具体地,在本说明书一个或多个实施例中,基于RPA技术分别抓取系统搜索集合与关键字相对应的法律特征数据信息与案例数据信息,并将法律特征数据信息与预置释法说理库进行对比查询,获取与当前民事案件相对应的法律法规,具体包括以下过程:
首先获取当前民事案件的系统搜索集合内各系统的系统线程空闲时间。如果当前时间处于系统线程空闲时间内,那么就根据RPA技术在当前民事案件的系统搜索集合内系统中查询该关键词,获得当前民事案件所对应的法律特征数据信息与案例数据信息。把查询到的当前民事案件的法律特征数据信息转换成为法律特征数据向量,并将预置释法说理库中的各个法律法规信息也转换为相应的法律法规向量,获得该预置释法说理库所对应的法律法规向量集合。计算法律特征向量和法律法规向量集合中各法律法规向量之间夹角的余弦值,以基于余弦值确定出法律特征向量与各法律法规向量的相似度。如果此时的相似度大于预设阈值,那么就将法律法规向量所对应的法律法规,作为与当前民事案件相对应的法律法规。获取和当前民事案件相对应的法律法规,并且确定出当前民事案件的法律文书所对应的数据结构。通过调用预设转换规则中对应的数据结构与其他数据结构进行转换的转换规则,实现根据该转换规则对该法律法规进行转换,获得和法律文书的数据结构相同的法律法规数据信息。其中,需要说明的是转换规则为通用的数据结构转换规则,例如List和Set互转用构造器,List和Set转数组用toArray()方法。数组转List和Set用构造器嵌套Arrays.asList()方法,List转Map,先将List转为Stream,再利用Stream的collect(Collectors.toMap())方法转为Map等。
S105:将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
为了避免了民事案件中工作人员无法对纸质的文件进行内容复制,需要进行手动敲写所造成的时间浪费问题,本说明书实施例将查询获取到的案例数据信息、与当前民事案件相对应的法律法规数据信息和相关数据信息写入到和当前民事案件相对应的文书模板中,从而自动生成获得当前民事案件的法律文书。
进一步地,将案例数据信息、相对应的法律法规与相关数据信息,写入与当前民事案件相对应的文书模板中之前,方法还包括以下过程:
首先获取相关数据信息中当前民事案件的制作主体的位置信息,从而根据位置信息和关键词,获取到以该位置为原点的预设范围内各法院民事案件的历史法律文书信息。然后根据各法院的民事案件的历史法律文书信息、当前民事案件法律文书的类型,确定出当前民事案件的至少一种法律文书的文书框架。其中需要说明的是,文书框架至少包括以下任意一项或多项:文本区域的框架,图片证据区域的框架,分栏框架。获取至少一种法律文书的文书框架所对应的历史案由类型,获取到和该当前民事案件的案由类型相对应的待选择文书框架。然后根据当前法律文书的制作主体的文本特征,对待选择文书框架进行调整,获得到和当前民事案件法律文书相对应的至少一种的文书模板;其中可以理解的是,不同法院或者不同律所可能具有各自的文本特征,文本特征至少包括以下任意一项或多项:所述制作主体的水印、预置字体格式要求、所述制作主体的页脚标识。
如图2所示,本说明书实施例提供了一种自动生成民事案件法律文书的设备的内部结构示意图。由图2可知,设备包括:
至少一个处理器201;以及,
与所述至少一个处理器201通信连接的存储器202;其中,
所述存储器202存储有可被所述至少一个处理器201执行的指令,所述指令被所述至少一个处理器201执行,以使所述至少一个处理器202能够:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
如图3所示,本说明书实施例提供了一种非易失性存储介质的内部结构示意图。由图3可知,在本说明书一个或多个实施例中,一种非易失性存储介质,存储有计算机可执行指令301,该计算机可执行指令301包括:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种自动生成民事案件法律文书的方法,其特征在于,所述方法包括:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
2.根据权利要求1所述的一种自动生成民事案件法律文书的方法,其特征在于,所述将所述卷宗图像输入预先训练的OCR识别模型之前,所述方法还包括:
获取所述卷宗图像中各像素点中各颜色通道值的最小值,并将所述最小值作为所述各像素点的灰度值,以获得与所述卷宗图像相对应的灰色图像;
基于预设分割面积将所述灰色图像划分为多个子区域,获取所述子区域中各像素的灰度值的均值,并将所述均值作为该子区域的阈值,以基于所述阈值对所述子区域进行二值化处理,获得所述卷宗图像的二值化图像;
基于预设高斯滤波核对所述二值化图像中各个像素点的值进行加权,以过滤所述二值化图像中的噪声数据,获得待校正图像;
获取所述待校正图像中各直线的位置与角度,以根据所述直线的位置与角度确定各所述直线的倾斜角度,并将各所述直线的倾斜角度的均值作为所述待校正图像的调整角度,以获得处理后的卷宗图像;其中,所述直线至少包括以下任意一项或多项:页眉分割线、页脚分割线、图像边缘线。
3.根据权利要求2所述的一种自动生成民事案件法律文书的方法,其特征在于,所述将所述卷宗图像信息输入预先训练的OCR识别模型之后,所述方法还包括:
基于所述预先训练的OCR识别模型,识别所述处理后的卷宗图像信息中的字符信息以及与所述字符信息相对应的位置信息;
将所述字符信息基于所述字符信息相对应的位置信息进行排列,生成与所述处理后的卷宗图像信息相对应的文本区域的识别结果;
将所述识别结果输入到预置的分词模型中输出所述识别结果的分词数据;将所述分词数据输入到预先训练的错误筛选模型中,输出所述识别结果中的错误字符;
基于所述当前法律文书的制作主体预设的编码字库,对所述识别结果中的各个字符进行编码,以获得所述识别结果中各个字符的点阵图编码;
基于汉明距离计算各个字符的点阵图编码中,各位置的码位值,以基于所述码位值,确定所述字符与所述识别结果中其他字符的字符相似度,并根据所述字符相似度,选取预设数量的与所述错误字符相对应的字符作为候选替换字符;
通过所述错误字符的字符结构与所述候选替换字符中的字符结构,获取所述错误字符与所述候选替换字符之间的相似度,以基于所述相似度获得与所述错误字符匹配度最高的候选字符进行替换,以实现对所述识别结果的纠错。
4.根据权利要求1所述的一种自动生成民事案件法律文书的方法,其特征在于,所述基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词,具体包括:
根据专家经验模型对所述相关数据信息进行分析,以确定所述当前民事案件在所述当前案由编排体系中所对应的案由类型;
基于所述案由类型,提取所述相关数据中与所述当前民事案件的案由类型相关联的事实要素语句以及诉讼请求要素语句,以将所述事实要素语句与所述诉讼请求要素语句作为待分析语句;
获取所述待分析语句中各个词汇所对应的属性,并根据所述属性过滤所述待分析语句中与所述当前民事案件的案由类型无关的词汇,获得所述相关数据信息中与所述当前民事案件相关的关键词。
5.根据权利要求1所述的一种自动生成民事案件法律文书的方法,其特征在于,所述根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合,具体包括:
根据所述相关信息获取所述当前民事案件的编号、当事人的姓名,并确认当前法律文书的制作主体;
通过所述民事案件的编号与所述当事人的姓名,确定与所述当前民事案件相对应的第一系统搜索集合,以基于所述第一系统搜索集合获取所述当事人的身份信息;其中,所述身份信息至少包括以下任意一项或多项:姓名、性别、居住地址、户籍信息、学籍信息、就业信息;
通过所述案由类型与所述当事人的姓名,确定与所述当前民事案件相对应第二系统搜索集合,以基于所述第二系统搜索集合获取与所述当事人相对应的历史同类型案由案件;
通过所述当前法律文书的制作主体的访问权限,确定所述第一系统搜索集合与所述第二系统搜索集合中的一个或多个系统作为所述当前民事案件的系统搜索集合。
6.根据权利要求5所述的一种自动生成民事案件法律文书的方法,其特征在于,所述通过所述当前法律文书的制作主体的访问权限,确定所述第一系统搜索集合与所述第二系统搜索集合中的一个或多个系统作为所述当前民事案件的系统搜索集合,具体包括:
基于所述当前法律文书的制作主体,确定所述第一系统搜索集合与所述第二系统搜索集合的登录角色;其中,所述登录角色至少包括:政府机构、公证机关、律师事务所;
获取所述当前法律文书的制作主体的终端输入的登录验证信息;其中,所述登录验证信息包括:系统登录账号与系统登录密码;
根据所述系统登录账号与所述系统登录密码,对所述当前法律文书的制作主体的终端所对应的身份进行验证,获得验证结果;
若基于所述验证结果确定身份验证通过,并且与所述登录角色相匹配,则确定所述第一系统搜索集合与所述第二系统搜索集合中与所述登录角色相对应的系统作为所述当前民事案件的系统搜索集合。
7.根据权利要求1所述的一种自动生成民事案件法律文书的方法,其特征在于,所述基于RPA技术分别抓取所述系统搜索集合与所述关键字相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规,具体包括:
获取所述当前民事案件的系统搜索集合内各系统的系统线程空闲时间;
若当前时间处于所述系统线程空闲时间内,则基于RPA技术在所述当前民事案件的系统搜索集合内系统中查询所述关键词,获得所述法律特征数据信息与所述案例数据信息;
将所述法律特征数据信息转换为法律特征数据向量,并将预置释法说理库中各法律法规信息转换为对应的法律法规向量,获得所述预置释法说理库所对应的法律法规向量集合;
计算所述法律特征向量与所述法律法规向量集合中各法律法规向量之间夹角的余弦值,以基于所述余弦值确定所述法律特征向量与各所述法律法规向量的相似度;
若所述相似度大于预设阈值则将所述法律法规向量所对应的法律法规,作为与所述当前民事案件相对应的法律法规;
获取与所述当前民事案件相对应的法律法规,并确定所述当前民事案件的法律文书所对应的数据结构;
调用预设转换规则中所述对应的数据结构与其他数据结构进行转换的转换规则,以基于所述转换规则对该法律法规进行转换,获得与法律文书的数据结构相同的法律法规数据信息。
8.根据权利要求1所述的一种自动生成民事案件法律文书的方法,其特征在于,所述将所述案例数据信息、所述相对应的法律法规与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中之前,所述方法还包括:
获取所述相关数据信息中当前民事案件的制作主体的位置信息,以基于所述位置信息与所述关键词,获取预设范围内各法院民事案件的历史法律文书信息;
基于各法院的民事案件的历史法律文书信息、所述当前民事案件法律文书的类型,确定所述当前民事案件的至少一种法律文书的文书框架;其中,所述文书框架至少包括以下任意一项或多项:文本区域的框架,图片证据区域的框架,分栏框架;
获取所述至少一种法律文书的文书框架所对应的历史案由类型,以获取与所述当前民事案件的案由类型相对应的待选择文书框架;
基于当前法律文书的制作主体的文本特征,对待选择文书框架进行调整,获得与所述当前民事案件法律文书相对应的至少一种的文书模板;其中,所述文本特征至少包括以下任意一项或多项:所述制作主体的水印、预置字体格式要求、所述制作主体的页脚标识。
9.一种自动生成民事案件法律文书的设备,其特征在于,所述设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
10.一种非易失性存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令包括:
获取法官通过扫描仪器上传的卷宗图像,并将所述卷宗图像输入预先训练的OCR识别模型,提取所述卷宗图像中的当前民事案件的相关数据信息;
基于所述相关数据信息与当前案由编排体系,确定所述当前民事案件所对应的案由类别,并基于所述案由类别在所述相关数据信息中提取与所述当前民事案件相关的关键词;
根据所述案由类别、所述关键词与所述相关数据信息中所述当前民事案件的编号、以及当前法律文书的制作主体,确定出所述当前民事案件的系统搜索集合;其中,所述系统搜索集合中包括一个或多个能够进行司法信息查询的系统;
基于RPA技术分别抓取所述系统搜索集合中与所述关键词相对应的法律特征数据信息与案例数据信息,并将所述法律特征数据信息与预置释法说理库进行对比查询,获取与所述当前民事案件相对应的法律法规数据信息;
将所述案例数据信息、所述相对应的法律法规数据信息与所述相关数据信息,写入与所述当前民事案件相对应的文书模板中,以自动获得当前民事案件的法律文书。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210941611.0A CN115392209B (zh) | 2022-08-08 | 2022-08-08 | 一种自动生成民事案件法律文书的方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210941611.0A CN115392209B (zh) | 2022-08-08 | 2022-08-08 | 一种自动生成民事案件法律文书的方法、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115392209A CN115392209A (zh) | 2022-11-25 |
CN115392209B true CN115392209B (zh) | 2023-04-28 |
Family
ID=84118340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210941611.0A Active CN115392209B (zh) | 2022-08-08 | 2022-08-08 | 一种自动生成民事案件法律文书的方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115392209B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090863A (zh) * | 2014-07-24 | 2014-10-08 | 高德良 | 一种智能法律文书生成方法及智能法律文书生成系统 |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
CN109815467A (zh) * | 2018-12-20 | 2019-05-28 | 广州恒巨信息科技有限公司 | 一种司法调解文书智能生成方法、系统及装置 |
WO2020017764A1 (ko) * | 2018-07-16 | 2020-01-23 | 박의준 | 법률문서 자동 생성 방법 및 시스템 |
CN110956026A (zh) * | 2019-11-28 | 2020-04-03 | 北京华宇元典信息服务有限公司 | 法律文书生成方法、生成装置和电子设备 |
CN112463925A (zh) * | 2020-12-01 | 2021-03-09 | 科大讯飞股份有限公司 | 案件卷宗处理方法、相关设备及可读存储介质 |
CN114492358A (zh) * | 2022-02-16 | 2022-05-13 | 来也科技(北京)有限公司 | 基于rpa和ai的庭前通知文书处理方法、装置、设备及介质 |
-
2022
- 2022-08-08 CN CN202210941611.0A patent/CN115392209B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104090863A (zh) * | 2014-07-24 | 2014-10-08 | 高德良 | 一种智能法律文书生成方法及智能法律文书生成系统 |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
WO2020017764A1 (ko) * | 2018-07-16 | 2020-01-23 | 박의준 | 법률문서 자동 생성 방법 및 시스템 |
CN109815467A (zh) * | 2018-12-20 | 2019-05-28 | 广州恒巨信息科技有限公司 | 一种司法调解文书智能生成方法、系统及装置 |
CN110956026A (zh) * | 2019-11-28 | 2020-04-03 | 北京华宇元典信息服务有限公司 | 法律文书生成方法、生成装置和电子设备 |
CN112463925A (zh) * | 2020-12-01 | 2021-03-09 | 科大讯飞股份有限公司 | 案件卷宗处理方法、相关设备及可读存储介质 |
CN114492358A (zh) * | 2022-02-16 | 2022-05-13 | 来也科技(北京)有限公司 | 基于rpa和ai的庭前通知文书处理方法、装置、设备及介质 |
Non-Patent Citations (4)
Title |
---|
T. Tateishi等.Automatic smart contract generation using controlled natural language and template.IBM Journal of Research and Development.2019,第第63卷卷全文. * |
张健东 ; .基于法律大数据的智能系统.工业控制计算机.2020,(第05期),全文. * |
王凯,黄泽文.法院办公自动化系统设计.电脑知识与技术.2006,(第26期),全文. * |
王智成.智能文书制作系统的设计与实现.中国优秀硕士学位论文全文数据库 社会科学Ⅰ辑.2022,(第第06期期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN115392209A (zh) | 2022-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200019768A1 (en) | Document field detection and parsing | |
CN110569341B (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
US7734092B2 (en) | Multiple image input for optical character recognition processing systems and methods | |
JP4676225B2 (ja) | スキャン・ドキュメントから電子フォームに取り込むための方法および装置 | |
US8391614B2 (en) | Determining near duplicate “noisy” data objects | |
CN110362799B (zh) | 基于在线仲裁的裁决书生成处理方法、装置和计算机设备 | |
US8693790B2 (en) | Form template definition method and form template definition apparatus | |
US20110249905A1 (en) | Systems and methods for automatically extracting data from electronic documents including tables | |
US20110255789A1 (en) | Systems and methods for automatically extracting data from electronic documents containing multiple layout features | |
AU2019204444B2 (en) | System and method for enrichment of ocr-extracted data | |
CN111583180B (zh) | 一种图像的篡改识别方法、装置、计算机设备及存储介质 | |
CN113221735A (zh) | 基于多模态的扫描件段落结构还原方法、装置及相关设备 | |
CN111539414B (zh) | 一种ocr图像字符识别和字符校正的方法及系统 | |
CN108897862A (zh) | 一种基于政府公文图片检索方法及系统 | |
CN110688998A (zh) | 票据识别方法及装置 | |
CN115392209B (zh) | 一种自动生成民事案件法律文书的方法、设备及介质 | |
CN116343237A (zh) | 基于深度学习和知识图谱的票据识别方法 | |
CN117407875A (zh) | 一种恶意代码分类方法、系统及电子设备 | |
CN117009968A (zh) | 恶意代码的同源分析方法、装置、终端设备及存储介质 | |
CN113408446B (zh) | 账单核算方法、装置、电子设备及存储介质 | |
CN116090463A (zh) | 一种名片信息抽取系统训练方法及装置、存储介质 | |
JP4101712B2 (ja) | 図面の電子化保管方法と図面の電子化保管システム及び図面データ提供システム | |
CN113705560A (zh) | 基于图像识别的数据提取方法、装置、设备及存储介质 | |
Clausner et al. | Unearthing the recent past: digitising and understanding statistical information from census tables | |
CN111950875A (zh) | 一种合同智能评审方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |