CN115796285B - 一种基于工程模型的诉讼案件预判方法、装置及电子设备 - Google Patents

一种基于工程模型的诉讼案件预判方法、装置及电子设备 Download PDF

Info

Publication number
CN115796285B
CN115796285B CN202310104740.9A CN202310104740A CN115796285B CN 115796285 B CN115796285 B CN 115796285B CN 202310104740 A CN202310104740 A CN 202310104740A CN 115796285 B CN115796285 B CN 115796285B
Authority
CN
China
Prior art keywords
litigation
case
result
data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310104740.9A
Other languages
English (en)
Other versions
CN115796285A (zh
Inventor
陈雪婷
王波
王磊
左晶晶
冯勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Best Legal Information Technology Co ltd Zhejiang Branch
Original Assignee
Shanghai Best Legal Information Technology Co ltd Zhejiang Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Best Legal Information Technology Co ltd Zhejiang Branch filed Critical Shanghai Best Legal Information Technology Co ltd Zhejiang Branch
Priority to CN202310104740.9A priority Critical patent/CN115796285B/zh
Publication of CN115796285A publication Critical patent/CN115796285A/zh
Application granted granted Critical
Publication of CN115796285B publication Critical patent/CN115796285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及司法数据处理技术领域,尤其涉及一种基于工程模型的诉讼案件预判方法、装置及电子设备,包括规则库构建模块,构建用于诉讼案件的规则库;建模模块,建立基于多维特征的特征因子工程模型;引擎构建模块,建立基于诉讼场景的案件推理引擎;数据获取模块,获取待处理的诉讼案件的案件数据;特征提取模块,提取待处理所述诉讼案件的多维特征,并将待处理所述诉讼案件的多维特征输入特征因子工程模型生成用于所述诉讼案件的特征因子;结果预测模块,将待处理所述诉讼案件的特征因子输入所述案件推理引擎,生成诉讼风险及判决结果合理性预测,有效地解决了相关技术中对诉讼案件风险及走向的可能性进行预判处理效率低、成本高的问题。

Description

一种基于工程模型的诉讼案件预判方法、装置及电子设备
技术领域
本发明涉及司法数据处理技术领域,尤其涉及一种基于工程模型的诉讼案件预判方法、装置及电子设备。
背景技术
基于诉讼场景的道交案件风险是指当事人在诉讼活动中可能遇到争议事实以外的因素,影响道交案件的审理和执行,致使其合法权益无法实现的风险。在民事诉讼中,主张权利的人应当提供证据。但在现实中,由于诸多原因,当事人举证往往有许多困难,因为举证困难也可能导致败诉的结果。不少当事人不知道诉讼时效期限,但已经超过诉讼时效期限,导致诉讼失败。
在相关技术中,一般从以下几个方面的数据来挖掘影响因子,从而进行诉讼道交案件风险及判决结果的预测:
(1)当事人要学习和掌握一定的法律知识,才能预防风险和杜绝风险;
(2)要规范自己的民事行为,要通过学习使自己具备这方面的专业知识;
(3)要有法律知识,在发生较大的法律行为时,必须注意保全相应的证据。因为民法规定,谁主张谁举证,没有证据就无法打赢官司;
(4)聘请一个好的法律顾问,一个好的法律顾问会给当事人在日常生活中提供法律咨询,为可能发生的道交案件诉讼风险提供相应的预防措施等,在诉讼中充分运用法律最大限度地保护当事人的合法权益,为当事人的合法权益据理力争。
以上方法虽然能够得到一些对诉讼道交案件风险及判决结果的预测。但也存在一些问题,例如,通过上述第(1)(2)(3)种的方案,需要当事人学习和掌握一定的法律知识,获取预测结果的门槛较高且无法对判决结果有预测;而通过上述第(4)种的方案时,虽然能避免诉讼道交案件风险,且对于判决结果有一定的预测,但是此方案成本太高。因此,在相关技术中,基于诉讼道交案件客观可获取的数据对诉讼道交案件风险及判决结果进行预测时,存在预测门槛高以及成本高的问题。
而法律文书的撰写,需要更高的知识储备要求,要基于事实的真实性和客观性,根据撰写文书指定结构从全局着眼,统筹安排结构,合理组织材料。生活场景下当遇到需要撰写法律文书,一般都要聘请一个好的法律顾问才可实现。其同样存在门槛高以及成本高的问题。
发明内容
为此,本发明提供一种基于工程模型的诉讼案件预判方法、装置及电子设备,用以克服现有技术中不能够进行有效的、准确的诉讼案件风险及判决结果合理性预测,从而造成当事人不能及时合理地规避风险、理性诉讼,不能方便快捷地为当事人自动生成法律文书,从而导致当事人的诉讼成本高的问题。
为实现上述目的,本发明一种实施方式提供一种基于工程模型的诉讼案件预判方法,包括:
步骤S1、规则库构建模块构建用于诉讼案件的规则库;
步骤S2、建模模块建立基于多维特征的特征因子工程模型;
步骤S3、引擎构建模块建立基于诉讼场景的案件推理引擎;
步骤S4、数据获取模块获取待处理诉讼案件的案件数据;
步骤S5、特征提取模块提取待处理所述诉讼案件的多维特征,并将待处理的所述诉讼案件的多维特征输入特征因子工程模型生成用于待处理所述诉讼案件的特征因子;
步骤S6、结果预测模块将待处理所述诉讼案件的特征因子输入所述案件推理引擎,生成诉讼风险预测及判决结果合理性的预测结果;
步骤S7、文书生成模块根据案件的预测结果作出最有利当事人的选择,并根据当事人的需要生成起诉状、答辩状、证据清单的法律文书;
在所述步骤S2中,建模模块建立基于多维特征的特征因子工程模型包括提取历史诉讼案件中的基础数据,对基础数据进行因子挖掘,将挖掘的因子输入XGBoost模型进行训练,生成特征因子工程模型。
进一步地,在所述步骤S1中,当规则库构建模块构建用于所述诉讼案件的规则库时,包括构建诉讼案件风险规则库、判决结果规则库和文书模板规则库;其中,
构建诉讼案件风险规则库和判决结果规则库包括:
获取历史案件信息数据;
对所述历史案件信息数据进行分析获取各历史案件的诉讼信息结构化数据;
根据各所述诉讼信息结构化数据生成各历史案件的诉讼案件规则;
将若干历史诉讼案件规则整合生成诉讼案件风险规则库和诉讼案件判决结果规则库;
所述案件信息数据至少包括诉讼案件争议事实数据、电子卷宗、文书材料、审判数据以及执行数据,所述诉讼信息结构化包括证据实体识别、证据属性抽取和模块结构化信息。
进一步地,构建所述诉讼案件文书模板规则库包括:
构建诉讼文书库;
对所述诉讼文书库各文本数据进行诉讼案件诉讼文书规范识别;
根据识别完成的各所述诉讼案件诉讼文书规范生成各诉讼案件诉讼文书规则;
将若干所述诉讼案件诉讼文书规则整合生成诉讼案件文书模板规则库;
其中,所述诉讼文书库的各文本数据包括民事诉讼法、行政诉讼法、刑事诉讼法、九部审判法和裁判文书;所述诉讼文书规范识别包括行为规范法条识别、证据时效法条识别和证据有效性法条识别。
进一步地,在所述步骤S2中,所述构建特征因子工程包括获取历史诉讼案件的基础数据,对基础数据进行因子挖掘,获得对应的特征因子;
所述基础数据包括历史诉讼案件的争议事实数据、审理数据和执行数据;所述特征因子包括历史诉讼案件的争议事实数据、审理数据和执行数据对应的争议事实因子、审理因子和执行因子。
进一步地,在所述步骤S3中,所述建立基于诉讼场景的案件推理引擎包括通过预先配置风险信息事件类型的事件驱动信息和推理资源,在推理引擎运行时,首先根据输入风险信息事件的类型,加载事件驱动文件,在加载完成时解析事件驱动文件,获取本次风险决策推理本次事件所需推理资源,创建推理引擎并根据所述推理资源指导推理引擎进行逻辑推理,在推理完成时生成风险信息推理结果。
进一步地,在所述步骤S5中,待处理所述诉讼案件的多维特征至少包括诉讼案件的争议事实数据。
进一步地,待处理所述诉讼案件的多维特征还包括审理特征和执行特征,所述审理特征包括用于表征待处理所述诉讼案件的审理程序的至少一个程序指标,以及基于至少一个审理程序指标得到的信息数据,所述执行特征包括所述诉讼案件的执行程序的至少一个程序指标,以及基于至少一个执行程序指标得到的信息数据。
进一步地,在所述步骤S6中,当结果预测模块生成所述诉讼风险的预测结果完成时,所述结果预测模块中的结果调整单元获取待处理所述诉讼案件争议事实数据与所述历史案件数据的第一平均相似度Ua,并根据该第一平均相似度Ua与第一预设相似度U1的比对结果确定是否对所述预测结果的输出值进行补偿,
若Ua>U1,则所述结果调整单元确定对所述预测结果的输出值进行补偿;
若Ua≤U1,则所述结果调整单元确定不对所述预测结果的输出值进行补偿;
当所述结果调整单元确定对所述预测结果的输出值进行补偿时,计算所述第一平均相似度Ua和第一预设相似度U1的相似度差值C,设定C=Ua-U1,并根据该相似度差值和预设相似度差值的比对结果选取对应的补偿系数对所述输出值进行补偿,所述结果调整单元将调整后的输出值设置为Wf,设定Wf=W×fi,其中W为初始的输出值,fi为输出值补偿系数。
本发明另一种实施方式提供一种执行上述基于工程模型的诉讼案件预判方法的装置,包括:
规则库构建模块,其用以构建用于诉讼案件的规则库;
建模模块,其用以建立基于多维特征的特征因子工程模型;
引擎构建模块,其分别与所述规则库构建模块和建模模块连接,引擎构建模块用以根据所述规则库和特征因子工程模型输出的特征因子建立基于诉讼场景的案件推理引擎;
数据获取模块,其用以获取待处理的诉讼案件的案件数据;
特征提取模块,其分别与所述建模模块和数据获取模块连接,特征提取模块用以提取待处理的所述诉讼案件的多维特征,并将待处理的所述诉讼案件的多维特征输入特征因子工程模型生成用于待处理的所述诉讼案件的特征因子;
结果预测模块,其分别与所述规则库构建模块、数据获取模块以及特征提取模块连接,结果预测模块用以将待处理的所述诉讼案件的特征因子输入所述案件推理引擎,生成诉讼风险预测及判决结果合理性结果;
其中,所述结果预测模块包括用以生成诉讼风险预测结果的输出值进行输出的结果输出单元和用以对所述预测结果的输出值进行调整的结果调整单元。
文书生成模块,其分别与所述规则库构建模块、数据获取模块、特征提取模块以及结果预测模块连接,文书生成模块用以根据案件的结果预测作出最有利当事人的选择,根据当事人的需要生成起诉状、答辩状、证据清单等法律文书。
本发明又一种实施方式提供一种基于工程模型的诉讼案件预判电子设备,包括显示器、存储器和上述诉讼案件预判方法的装置,其中,
所述显示器被配置为显示生成的诉讼风险及判决结果合理性的预测结果;
所述存储器被配置为存储生成的诉讼风险及判决结果合理性的预测结果。
与现有技术相比,本发明的有益效果在于,本发明模型融合了争议事实数据,之所以可以达到更好的预测效果,关键点在于采用引导式信息归集,进一步精细化关键词词包,使得获得的争议事实数据更具有代表性和业务性。根据本发明实施例的方法、装置、系统及计算机存储介质,可以将争议事实数据、审理数据、执行数据结合起来,实现对诉讼案件的风险预判,为当事人提供有效的参考。以及能方便快捷的为当事人自动生成法律文书,从而降低当事人的诉讼成本。
通过对待处理诉讼案件进行风险预测时,基于案件数据的多维特征进行预测,并且多维特征中包括争议事实特征,使得对诉讼案件风险进行预测时,考虑了基于争议事实数据包括争议发生的时间、地点、内容、情节和因果关系等数据,即考虑了案件争议事实数据的争议事实特色特征,使得对诉讼案件的风险预测更为准确,而且争议事实数据的获取客观真实,因而具有及时性强,成本也低的好处。有效地解决了相关技术中,对诉讼案件风险进行预测,预测门槛高,成本高的问题。
附图说明
图1为本发明实施例基于工程模型的诉讼案件预判方法的流程图;
图2为基于诉讼场景的案件风险及判决结果预测和法律文书自动生成的整体框架图;
图3为诉讼案件风险规则库及判决结果规则库的构建方法图;
图4为诉讼案件文书模版规则库的构建方法图;
图5为本发明构建基于多维特征因子工程模型的逻辑框图;
图6为基于事件驱动的诉讼案件风险及判决结果预测和法律文书自动生成推理机制逻辑框图;
图7为本发明实施例基于工程模型的诉讼案件预判方法的装置的逻辑框图。
实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
请参阅图1和2所示,图1为本发明实施例基于工程模型的诉讼案件预判方法法的流程图;图2为基于诉讼场景的案件风险及判决结果预测和法律文书自动生成的整体框架图;
本发明实施例基于工程模型的诉讼案件预判方法,包括:
步骤S1、规则库构建模块构建用于诉讼案件的规则库;
步骤S2、建模模块建立基于多维特征的特征因子工程模型;
步骤S3、引擎构建模块建立基于诉讼场景的案件推理引擎;
步骤S4、数据获取模块获取待处理诉讼案件的案件数据;
步骤S5、特征提取模块提取待处理所述诉讼案件的多维特征,并将待处理所述诉讼案件的多维特征输入特征因子工程模型生成用于待处理所述诉讼案件的特征因子;
步骤S6、结果预测模块将待处理的所述诉讼案件的特征因子输入所述案件推理引擎,生成诉讼风险预测及判决结果合理性的预测结果;
步骤S7、文书生成模块根据案件的预测结果作出最有利当事人的选择,并根据当事人的需要生成起诉状、答辩状、证据清单等法律文书;
在所述步骤S2中,建模模块建立基于多维特征的特征因子工程模型包括提取历史诉讼案件中的基础数据,对基础数据进行因子挖掘,将挖掘的因子输入XGBoost模型进行训练,生成特征因子工程模型。
具体而言,通过上述步骤,在对该待处理诉讼案件进行风险预测时,基于案件数据的多维特征进行预测,并且多维特征中包括争议事实特征,使得对诉讼案件风险进行预测时,考虑了基于争议事实数据包括争议发生的时间、地点、内容、情节和因果关系等数据,即考虑了案件争议事实数据的争议事实特色特征,使得对诉讼案件的风险预测更为准确,而且争议事实数据的获取客观真实,因而具有及时性强,成本也低的好处。有效地解决了相关技术中,对诉讼案件风险进行预测,预测门槛高,成本高的问题。
具体而言,在所述步骤S5中,待处理诉讼案件的多维特征至少包括待处理诉讼案件的争议事实数据。
本发明一种实施方式中,待处理诉讼案件的多维特征还包括审理特征和执行特征,所述审理特征包括用于表征待处理诉讼案件的审理程序的至少一个程序指标,以及基于至少一个审理程序指标得到的信息数据,所述执行特征包括待处理诉讼案件的执行程序的至少一个程序指标,以及基于至少一个执行程序指标得到的信息数据。基于争议事实数据预测是在基于与其它多维特征相结合来进行预测的,结合审理特征和执行特征,使得预测结果更为准确。上述审理特征所包括的审理程序可以为多种,包括该待处理诉讼案件的以下指标:审理进度、文书材料整理情况、庭前准备情况、庭审准备情况、判决情况等。上述执行特征所包括的所述诉讼案件的执行程序以及基于执行程序指标得到的信息数据,可以包括执行进度、执行材料清单、费用结算等。
请参阅图3和4所示,图3为诉讼案件风险规则库及判决结果规则库的构建方法图;图4为诉讼案件文书模版规则库的构建方法图。
具体而言,在所述步骤S1中,当规则库构建模块构建用于所述诉讼案件的规则库时,包括构建诉讼案件诉讼风险规则库、判决结果规则库和文书模板规则库;其中,
构建诉讼案件风险规则库和判决结果规则库包括:
获取历史案件信息数据;
对所述历史案件信息数据进行分析获取各历史案件的诉讼信息结构化数据;
根据各所述诉讼信息结构化数据生成各历史案件的诉讼案件规则;
将若干历史诉讼案件规则整合生成诉讼案件风险规则库和诉讼案件判决结果规则库;
所述案件信息数据至少包括诉讼案件争议事实数据、电子卷宗、文书材料、审判数据以及执行数据,所述诉讼信息结构化至少包括证据实体识别、证据属性抽取和模块结构化信息。
其中,模块结构化信息为案件诉讼过程中,将案件诉讼过程逐层分成若干模块,并对各模块发生信息经过分析后再分解成多个互相关联的组成部分,从而使各组成部分间有明确的层次结构。
构建所述诉讼案件文书模板规则库包括:
构建诉讼文书库;
对所述诉讼文书库各文本数据进行诉讼案件诉讼文书规范识别;
根据识别完成的各所述诉讼案件诉讼文书规范生成各诉讼文书规则;
将若干所述诉讼案件诉讼文书规则整合生成诉讼案件文书模板规则库,包括答辩状、起诉状、上诉状、证据清单等;
其中,所述诉讼文书库的各文本数据包括民事诉讼法、行政诉讼法、刑事诉讼法、九部审判法和裁判文书;所述诉讼文书规范识别包括行为规范法条识别、证据时效法条识别和证据有效性法条识别。
本发明实施例中,诉讼案件文书模板规则库构建是基于中国三部诉讼法、九部审判法、裁判文书、电子卷宗等,构建学习样本,形成样本数据库,对样本数据库进行数据加工处理,主要是进行分句,之后通过文本分析,关键句筛选,句法分析、模式匹配以及分类预测等技术完成文书规范法条识别;诉讼风险规则库和判决结果规则库是通过Bootstrapping(自助法)进行样本采样(进行有放回的抽样形成采样样本),然后采用多分类器投票的算法进行风险规则和数据关系的高效抽取,生成文书推理规则,最终形成诉讼案件文书模板规则库。
请参阅图5所示,其为本发明构建基于多维特征因子工程模型的逻辑框图。
具体而言,在所述步骤S2中,所述构建特征因子工程包括获取历史诉讼案件的基础数据,对基础数据进行因子挖掘,获得对应的特征因子。
本发明实施例中,基础数据包括历史诉讼案件争议事实数据、审理数据和执行数据;所述特征因子包括历史诉讼案件争议事实因子、审理因子和执行因子。
具体而言,诉讼案件争议事实数据包括诉讼材料准备清单和相关情况调查报告;诉讼材料准备清单包括民事诉状、原被告主体材料、民事诉讼证据清单及证据等。其中民事诉讼证据清单及证据是案件争议事实最客观直接的信息数据。以“道路交通事故纠纷诉讼风险”为例,这类关键信息可以是“证据是否合法取得”、“被告车辆的登记及年审情况”、“道路交通事故认定书”、“现场勘验检查笔录及照片”等。
审理数据包括立案受理后应取得:受理通知书,举证通知书,向法院提供诉讼案件受理费支付凭证和取得诉讼案件受理费收据等信息数据。基于审理程序中各节点应关注的期限要求,例如,举证通知要求的举证期限。上述所列举的审理程序中一个或多个,以及基于所属审理程序得到的信息数据均可以作为所获取到的数据的审理特征。
执行数据包括执行程序按固定要求申请执行的流程特征。例如,判决或合议庭调解后应取得诉讼文书生效证明,执行立案受理后应取得受理通知书等。在执行程序中也存在各阶段应关注的期限要求。例如,申请执行的限期,申请执行时效的中止、终断等。上述所列举的执行程序中一个或多个,以及基于所属执行程序得到的信息数据均可以作为所获取到的数据的执行特征。
通过数据处理对上述争议事实特征、审理特征和执行特征进行因子挖掘,分别得到对应的争议事实因子,审理因子以及执行因子。
请参阅图6所示,其为基于事件驱动的诉讼案件风险及判决结果预测和法律文书自动生成推理机制逻辑框图。
具体而言,在所述步骤S3中,所述建立基于诉讼场景的案件推理引擎包括通过预先配置风险信息事件类型的事件驱动信息和推理资源,在推理引擎运行时,首先根据输入风险信息事件的类型,加载事件驱动文件,在加载完成时解析事件驱动文件,获取本次风险决策推理本次事件所需推理资源,创建推理引擎并根据所述推理资源指导推理引擎进行逻辑推理,在推理完成时生成风险信息推理结果。
具体而言,案件推理引擎通常有规则和事实两个输入,目的是把已知的事实按照一定的规则推理出新的事实。
本发明实施例中,将涉案人员分别录入至争议事实数据、审判数据、执行数据,将涉案文书上传,通过对涉案文书进行数据抽取,从而得到审判数据和执行数据,从而通过特征因子工程对案件相关的因子进行挖掘,特征因子挖掘规则如下:
以“道路交通事故纠纷诉讼风险”为例,根据关系谓词的性质,人工总结出如下8条规则,
将上文论述的特征工程所产出的各类因子作为种子用于案件推理引擎的推理,案件推理引擎推理出的实体关系加入到种子集中。
在当事人使用诉讼案件风险预测支持系统过程中,发现需要添加新类型的风险预测的地方时,只需系统维护人员新添新类型的风险信息事件驱动文件,配置风险信息事件所需推理资源的相关信息,推理引擎就能够动态调整适应新的风险预测事件,支持复杂多变的风险预测行为,使风险预测支持系统能更灵活地支持多样化的诉讼案件风险预测,从而快速有效地辅助当事人及时合理地规避风险、理性诉讼。
具体而言,在建立诉讼场景的案件风险预测模型时,采用常用的XGBoost方法进行建模,模型的输入为上文论述的特征工程所产出的各类因子,模型的目标是判断诉讼案件在当前日期的“道路交通事故纠纷诉讼风险”,因此这是一个二分类问题,最终模型产出的结果为案件道路交通事故纠纷诉讼的概率,数值越大表明该诉讼案件越可能面临道路交通事故纠纷诉讼争议。
经过一系列的实验,并通过统计验证得到的对比结果如表,表为不同因子的预测效果表,如下表所示:
入模的因子种类 Acc Recall Pre F1-Score
审理因子+执行因子 0.91878 0.87151 0.79138 0.82951
审理因子+执行因子+争议事实因子 0.93604 0.83172 0.87962 0.85499
上表中,Acc为模型准确率,通过模型预测正确的样本占所有样本的比率;
Recall为模型召回率,通过模型预测正确的正样本中占所有正样本的比率;
Pre为模型精确率,通过模型预测正确的正样本中占预测正样本的比率;
F1-score为模型F值,为精确率和召回率的调和平均值。
从上表不难看出,仅采用审理因子和执行因子模型最终的F1-Score可达到0.82951,但是融合了争议事实因子后,其F1-Score可以达到0.85499,效果提升了3.07%。除此之外,在通过实验验证后,案件争议事实信息数据越完整,本模型的预测效果越好。
具体而言,在所述步骤S6中,当结果预测模块生成所述诉讼风险的预测结果完成时,所述结果预测模块中的结果调整单元获取待处理所述诉讼案件争议事实数据与所述历史诉讼案件争议事实数据的第一平均相似度Ua,并根据该第一平均相似度Ua与第一预设相似度U1的比对结果确定是否对所述预测结果的输出值进行补偿,
若Ua>U1,则所述结果调整单元确定对所述预测结果的输出值进行补偿;
若Ua≤U1,则所述结果调整单元确定不对所述预测结果的输出值进行补偿;
当所述结果调整单元确定对所述预测结果的输出值进行补偿时,计算所述第一平均相似度Ua和第一预设相似度U1的相似度差值C,设定C=Ua-U0,并根据该相似度差值和预设相似度差值的比对结果选取对应的补偿系数对所述预测结果的输出值进行补偿,
其中,所述结果调整单元中设有第一预设相似度差值C1、第二预设相似度差值C2、第一补偿系数f1、第二补偿系数f2以及第三补偿系数f3,其中U1<U2,设定1<f1<f2<f3<1.5,
当C≤C1时,所述结果调整单元选取第一补偿系数f1补偿预测结果的输出值;
当C1<C≤C2时,所述结果调整单元选取第二补偿系数f2补偿预测结果的输出值;
当C>C2时,所述结果调整单元选取第三补偿系数f3补偿预测结果的输出值;
当所述结果调整单元选取第i补偿系数fi补偿预测结果的输出值时,设定i=1,2,3,所述结果调整单元将调整后的预测结果输出值设置为Wf,设定Wf=W×fi,其中W为预测结果的输出值。
具体而言,在所述步骤S6中,当结果预测模块生成所述诉讼风险的预测结果完成时,所述结果调整单元根据所述诉讼案件特征的维数R与预设维数R0的比对结果确定是否对所述预测结果的输出值进行调节,
若R≤R0,则所述结果调整单元确定对所述预测结果的输出值进行调节;
若R>R0,则所述结果调整单元确定不对所述预测结果的输出值进行调节。
当所述结果调整单元确定对所述预测结果的输出值进行调整时,所述结果调整单元获取案件审理数据与所述历史案件审理数据的第二平均相似度Ub,并根据该第二平均相似度Ub与第一预设相似度U1和第二预设相似度U2的比对结果确定对所述预测结果的输出值进行调节的调节系数,其中U1<U2,
其中,所述调节系数包括第一调节系数K1、第二调节系数K2以及第三调节系数K3,设定1<K1<K2<K3<1.2,
当Ub≤U1时,所述结果调整单元选取第一调节系数K1对预测结果的输出值进行调节;
当U1<Ub≤U2时,所述结果调整单元选取第二调节系数K2对预测结果的输出值进行调节;
当Ub>U2时,所述结果调整单元选取第三调节系数K3对预测结果的输出值进行调节;
当所述结果调整单元选取第j调节系数Kj对所述输出值进行调节时,设定j=1,2,3,所述参数调整模块将所述预测结果的输出值设置为Wk,设定Wk=W×Kj。
请参阅图7所述,其为本发明实施例基于工程模型的诉讼案件预判方法装置的逻辑框图。
本发明另一实施方式提供一种执行上述基于工程模型的诉讼案件预判方法的装置,包括:
规则库构建模块,其用以构建用于诉讼案件的规则库;
建模模块,其用以建立基于多维特征的特征因子工程模型;
引擎构建模块,其分别与所述规则库构建模块和建模模块连接,引擎构建模块用以根据所述规则库和特征因子工程模型输出的特征因子建立基于诉讼场景的案件推理引擎;
数据获取模块,其用以获取待处理的诉讼案件的案件数据;
特征提取模块,其分别与所述建模模块和数据获取模块连接,特征提取模块用以提取待处理的所述诉讼案件的多维特征,并将待处理的所述诉讼案件的多维特征输入特征因子工程模型生成用于待处理的所述诉讼案件的特征因子;
结果预测模块,其分别与所述规则库构建模块、数据获取模块以及特征提取模块连接,结果预测模块用以将待处理的所述诉讼案件的特征因子输入所述案件推理引擎,生成诉讼风险预测结果;
其中,所述结果预测模块包括用以生成诉讼风险预测结果的输出值进行输出的结果输出单元和用以对所述预测结果的输出值进行调整的结果调整单元。
文书生成模块,其分别与所述规则库构建模块、数据获取模块、特征提取模块以及结果预测模块连接,文书生成案件诉讼风险预测电子设备模块用以根据案件的结果预测作出最有利当事人的选择,根据当事人的需要生成起诉状、答辩状、证据清单等法律文书。
本发明又一实施方式提供一种基于工程模型的诉讼案件预判电子设备,包括显示器、存储器和上述基于工程模型的诉讼案件预判方法的装置,其中,
所述显示器被配置为显示生成的诉讼风险及判决结果合理性的预测结果;
所述存储器被配置为存储生成的诉讼风险及判决结果合理性的预测结果。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于工程模型的诉讼案件预判方法,其特征在于,包括:
步骤S1、规则库构建模块构建用于诉讼案件的规则库;
步骤S2、建模模块建立基于多维特征的特征因子工程模型;
步骤S3、引擎构建模块建立基于诉讼场景的案件推理引擎;
步骤S4、数据获取模块获取待处理诉讼案件的案件数据;
步骤S5、特征提取模块提取待处理所述诉讼案件的多维特征,并将待处理所述诉讼案件的多维特征输入特征因子工程模型生成用于待处理所述诉讼案件的特征因子;
步骤S6、结果预测模块将待处理所述诉讼案件的特征因子输入所述案件推理引擎,生成诉讼风险预测及判决结果合理性的预测结果;
步骤S7、文书生成模块根据案件的预测结果作出最有利当事人的选择,并根据当事人的需要生成起诉状、答辩状、证据清单的法律文书;
在所述步骤S2中,建模模块建立基于多维特征的特征因子工程模型包括提取历史诉讼案件中的基础数据,对基础数据进行因子挖掘,将挖掘的因子输入XGBoost模型进行训练,生成特征因子工程模型;
在所述步骤S3中,所述建立基于诉讼场景的案件推理引擎包括通过预先配置风险信息事件类型的事件驱动信息和推理资源,在推理引擎运行时,首先根据输入风险信息事件的类型,加载事件驱动文件,在加载完成时解析事件驱动文件,获取本次风险决策推理本次事件所需推理资源,创建推理引擎并根据所述推理资源指导推理引擎进行逻辑推理,在推理完成时生成风险信息推理结果。
2.根据权利要求1所述的基于工程模型的诉讼案件预判方法,其特征在于,在所述步骤S1中,当规则库构建模块构建用于所述诉讼案件的规则库时,包括构建诉讼案件风险规则库、判决结果规则库和文书模板规则库;其中,
构建诉讼案件风险规则库和判决结果规则库包括:
获取历史案件信息数据;
对所述历史案件信息数据进行分析获取各历史案件的诉讼信息结构化数据;
根据各所述诉讼信息结构化数据生成各历史案件的诉讼案件规则;
将若干历史诉讼案件规则整合生成诉讼案件风险规则库和诉讼案件判决结果规则库;
所述案件信息数据包括诉讼案件争议事实数据、电子卷宗、文书材料、审判数据以及执行数据,所述诉讼信息结构化包括证据实体识别、证据属性抽取和模块结构化信息。
3.根据权利要求2所述的基于工程模型的诉讼案件预判方法,其特征在于,构建所述诉讼案件文书模板规则库包括:
构建诉讼文书库;
对所述诉讼文书库中各文本数据进行诉讼案件诉讼文书规范识别;
根据识别完成的各所述诉讼案件诉讼文书规范生成各诉讼案件诉讼文书规则;
将若干所述诉讼案件诉讼文书规则整合生成诉讼案件文书模板规则库;
其中,所述诉讼文书库中各文本数据包括民事诉讼法、行政诉讼法、刑事诉讼法、九部审判法和裁判文书;所述诉讼文书规范识别包括行为规范法条识别、证据时效法条识别和证据有效性法条识别。
4.根据权利要求3所述的基于工程模型的诉讼案件预判方法,其特征在于,在所述步骤S2中,建立所述特征因子工程模型包括获取历史诉讼案件的基础数据,对基础数据进行因子挖掘,获得对应的特征因子;
所述基础数据包括历史诉讼案件的争议事实数据、审理数据和执行数据;所述特征因子包括历史诉讼案件的争议事实数据、审理数据和执行数据对应的争议事实因子、审理因子和执行因子。
5.根据权利要求4所述的基于工程模型的诉讼案件预判方法,其特征在于,在所述步骤S5中,待处理所述诉讼案件的多维特征包括诉讼案件的争议事实数据。
6.根据权利要求5所述的基于工程模型的诉讼案件预判方法,其特征在于,待处理所述诉讼案件的多维特征还包括审理特征和执行特征,所述审理特征包括用于表征待处理所述诉讼案件的审理程序的至少一个程序指标,以及基于至少一个审理程序指标得到的信息数据,所述执行特征包括所述诉讼案件的执行程序的至少一个程序指标,以及基于至少一个执行程序指标得到的信息数据。
7.根据权利要求6所述的基于工程模型的诉讼案件预判方法,其特征在于,在所述步骤S6中,当结果预测模块生成所述诉讼风险的预测结果完成时,所述结果预测模块中的结果调整单元获取待处理所述诉讼案件争议事实数据与所述历史案件数据的第一平均相似度Ua,并根据该第一平均相似度Ua与第一预设相似度U1的比对结果确定是否对所述预测结果的输出值进行补偿,
若Ua>U1,则所述结果调整单元确定对所述预测结果的输出值进行补偿;
若Ua≤U1,则所述结果调整单元确定不对所述预测结果的输出值进行补偿;
当所述结果调整单元确定对所述预测结果的输出值进行补偿时,计算所述第一平均相似度Ua和第一预设相似度U1的相似度差值C,设定C=Ua-U1,并根据该相似度差值和预设相似度差值的比对结果选取对应的补偿系数对所述输出值进行补偿,所述结果调整单元将调整后的输出值设置为Wf,设定Wf=W×fi,其中W为初始的输出值,fi为输出值补偿系数。
8.一种执行权利要求1-7任一项所述的基于工程模型的诉讼案件预判方法的装置,其特征在于,包括:
规则库构建模块,其用以构建用于诉讼案件的规则库;
建模模块,其用以建立基于多维特征的特征因子工程模型;
引擎构建模块,其分别与所述规则库构建模块和建模模块连接,引擎构建模块用以根据所述规则库和特征因子工程模型输出的特征因子建立基于诉讼场景的案件推理引擎;
数据获取模块,其用以获取待处理的诉讼案件的案件数据;
特征提取模块,其分别与所述建模模块和数据获取模块连接,特征提取模块用以提取待处理的所述诉讼案件的多维特征,并将待处理的所述诉讼案件的多维特征输入特征因子工程模型生成用于待处理的所述诉讼案件的特征因子;
结果预测模块,其分别与所述规则库构建模块、数据获取模块以及特征提取模块连接,结果预测模块用以将待处理的所述诉讼案件的特征因子输入所述案件推理引擎,生成诉讼风险预测及判决结果合理性结果;
文书生成模块,其分别与所述规则库构建模块、数据获取模块、特征提取模块以及结果预测模块连接,文书生成模块用以根据案件的结果预测作出最有利当事人的选择,根据当事人的需要生成起诉状、答辩状、证据清单的法律文书;
其中,所述结果预测模块包括用以生成诉讼风险预测结果的输出值进行输出的结果输出单元和用以对所述预测结果的输出值进行调整的结果调整单元。
9.一种基于工程模型的诉讼案件预判电子设备,其特征在于,包括显示器、存储器和权利要求8所述的基于工程模型的诉讼案件预判方法的装置,其中,
所述显示器被配置为显示生成的诉讼风险及判决结果合理性的预测结果;
所述存储器被配置为存储生成的诉讼风险及判决结果合理性的预测结果。
CN202310104740.9A 2023-02-13 2023-02-13 一种基于工程模型的诉讼案件预判方法、装置及电子设备 Active CN115796285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310104740.9A CN115796285B (zh) 2023-02-13 2023-02-13 一种基于工程模型的诉讼案件预判方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310104740.9A CN115796285B (zh) 2023-02-13 2023-02-13 一种基于工程模型的诉讼案件预判方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN115796285A CN115796285A (zh) 2023-03-14
CN115796285B true CN115796285B (zh) 2023-05-09

Family

ID=85430997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310104740.9A Active CN115796285B (zh) 2023-02-13 2023-02-13 一种基于工程模型的诉讼案件预判方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN115796285B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523852A (zh) * 2020-03-11 2020-08-11 太极计算机股份有限公司 一种基于案由类型的案件要素式判案系统及方法
CN111695874A (zh) * 2020-06-09 2020-09-22 山东交通学院 一种司法判决辅助系统以及方法、设备、可存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110270881A1 (en) * 2010-05-03 2011-11-03 Borton Joseph W System and method for analyzing historical aggregate case results for a court system
CN106296495A (zh) * 2016-08-09 2017-01-04 点击律(上海)网络科技有限公司 一种诉讼结果的预测方法及系统
CN108665182B (zh) * 2018-05-18 2021-12-14 中国科学技术大学 一种专利诉讼风险预测方法
CN109377000A (zh) * 2018-09-21 2019-02-22 安徽和信科技发展有限责任公司 一种人工智能技术的诉讼风险评估装置
US20200273560A1 (en) * 2019-02-21 2020-08-27 Theator inc. Surgical image analysis to determine insurance reimbursement
CN110377632B (zh) * 2019-06-17 2023-06-20 平安科技(深圳)有限公司 诉讼结果预测方法、装置、计算机设备和存储介质
CN110675023B (zh) * 2019-08-22 2022-03-25 中国司法大数据研究院有限公司 一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置
KR20210056700A (ko) * 2019-11-11 2021-05-20 주식회사 네이슨랩 인공지능을 활용한 소송 결과 예측 및 이를 이용한 법률 자문 서비스 방법 그리고 이를 이용한 시스템
CN114519508A (zh) * 2022-01-25 2022-05-20 中国人民大学 基于时序深度学习和法律文书信息的信用风险评估方法
CN115660232A (zh) * 2022-12-26 2023-01-31 尚特杰电力科技有限公司 风电功率的超短期预测方法、装置及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523852A (zh) * 2020-03-11 2020-08-11 太极计算机股份有限公司 一种基于案由类型的案件要素式判案系统及方法
CN111695874A (zh) * 2020-06-09 2020-09-22 山东交通学院 一种司法判决辅助系统以及方法、设备、可存储介质

Also Published As

Publication number Publication date
CN115796285A (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
US11983212B2 (en) Artificially intelligent system employing modularized and taxonomy-based classifications to generate and predict compliance-related content
US11803884B2 (en) System and methods for automatically generating regulatory compliance manual using modularized and taxonomy-based classification of regulatory obligations
US20180075554A1 (en) System and interface for generating real-time regulatory compliance alerts using modularized and taxonomy-based classification of regulatory obligations
CN112182246B (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
Allen et al. Exploratory text data analysis for quality hypothesis generation
EP4071688A1 (en) System, method and apparatus for automatic categorization and assessment of billing narratives
Zhang et al. Lab
Lam et al. Applying large language models for enhancing contract drafting
McGregor et al. Potential threats for the auditing profession, audit firms and audit processes inherent in using emerging technology
CN113159796A (zh) 一种贸易合同验证方法及装置
CN115796285B (zh) 一种基于工程模型的诉讼案件预判方法、装置及电子设备
CN114780602A (zh) 数据溯源分析方法、装置、计算机设备及存储介质
Pakhchanyan et al. Machine learning for categorization of operational risk events using textual description
Saxena et al. Towards recommendations from user-specific insights based on historical legal cases
Wadjdi et al. The Implementation of Framing, Agenda-Setting, and Data Mining in Evaluation of Public Policies Case Study of the State Defense Program in Indonesia
Schumann et al. Natural Language Processing in Internal Auditing-a Structured Literature Review.
CN117194751B (zh) 一种政务电子数据筛选方法及系统
Wang et al. Research on economic development trend of reform and opening up: based on big data modeling analysis method
Atymtayeva et al. Automated System for Monitoring of Educational Processes: Collection, Management, and Modeling of Data
CN117172632B (zh) 一种企业异常行为检测方法、装置、设备及存储介质
CN115511668B (zh) 一种基于人工智能的案件监督方法、装置、设备和介质
Hilmarsson Using machine learning for predicting the likelihood of upper secondary school student dropout
AU2018101718A4 (en) System, method and apparatus for automatic categorization and assessment of billing narratives
CN117972090A (zh) 一种基于大模型的政务数据自动分类分级方法
Magrath New Lamps for Old: Developing Case Law Research for a Changing World

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant