CN111524043A - 诉讼风险评估问卷自动生成的方法和装置 - Google Patents

诉讼风险评估问卷自动生成的方法和装置 Download PDF

Info

Publication number
CN111524043A
CN111524043A CN202010337123.XA CN202010337123A CN111524043A CN 111524043 A CN111524043 A CN 111524043A CN 202010337123 A CN202010337123 A CN 202010337123A CN 111524043 A CN111524043 A CN 111524043A
Authority
CN
China
Prior art keywords
legal
elements
vector
case
risk assessment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010337123.XA
Other languages
English (en)
Inventor
徐芳
杜向阳
常竣
乔金梅
丁琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Aegis Information Technology Co ltd
Original Assignee
Nanjing Aegis Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Aegis Information Technology Co ltd filed Critical Nanjing Aegis Information Technology Co ltd
Priority to CN202010337123.XA priority Critical patent/CN111524043A/zh
Publication of CN111524043A publication Critical patent/CN111524043A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本发明提供一种诉讼风险评估问卷自动生成的方法和装置,该方法包括:获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;提取法律法规内的法律要素和判决文书内的案情要素;对法律要素和案情要素进行语义匹配,确定语义匹配度数值;将语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷。本发明解决了人工阅读长文本信息提取法律要素和案情要素耗时耗力,主观性较强容易产生偏差,且需要具备专业法律知识的工作人员等问题;同时语义匹配上精度更高,获得的诉讼风险评估问卷逻辑性较强,能够有利于分析并进行诉讼风险评估。

Description

诉讼风险评估问卷自动生成的方法和装置
技术领域
本发明涉及人工智能领域,尤其涉及一种诉讼风险评估问卷自动生成的方法和装置。
背景技术
随着经济水平的不断上升,人们的法律意识越来越强,法律诉求越来越多,为了满足日益上升的法律需求,通过诉讼风险评估帮助用户提前获得诉讼的风险,可以帮助用户更好的获得法律服务。诉讼风险评估产品是一款模拟研究审判实践经验,基于裁判文书中事实、诉讼请求、证据、争议焦点等法律要素,绘画案件特征,形成法律知识图谱决策路径,以文本挖掘技术帮助当事人知悉诉讼风险,引导其选择非诉解纷途径的第三方、中立的评估系统;其通过问卷形式采集用户信息,给予用户解答已经成为一种节约时间、提高效率的法律咨询方式。
目前,现有法律问卷基于已经存储好的问卷逻辑,根据用户的选择依次出现问卷内容,且问题是提前根据大量的法律文书等提前由人工开发;由于法律的特殊性和纠纷的复杂性,问卷逻辑多为人来设定,由于人工设定的逻辑不能覆盖所有法律场景,因此开发耗时耗力工作量大,法律知识要求高,效率低下,需要投入大量资源,同时问题存在一定的主观因素,而问题是问卷的基础,如果问题冗余度较高,则又不利于问卷的生成。因此,目前需要一种能够智能生成法律问卷的方法,一方面可以减轻人工的压力,另一方面可以避免人的主观性。
发明内容
为了解决现有技术中在多集群的生产环境下,只通过定时任务处理业务数据,机器的利用率较低;数据处理存在高峰波,容易导致数据堆积,对系统的稳定性产生影响,不能合理利用机器性能的问题,本发明提供一种多任务下数据处理的方法、装置及电子设备。
第一方面,本发明提供一种诉讼风险评估问卷自动生成的方法,该方法包括:
获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;
提取法律法规内的法律要素和判决文书内的案情要素;
对法律要素和案情要素进行语义匹配,确定语义匹配度数值;
将语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;
根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷。
进一步地,提取法律法规内的法律要素和判决文书内的案情要素包括:
利用分词和词性标注工具分别对法律法规或判决文书进行预处理,生成词语序列和词性序列;
对词语序列和词性序列进行编码,生成词语向量和词性向量;
对词语向量和词性向量进行拼接;
利用神经网络算法获取与拼接后的向量语境相关的向量;
对获取到的所有语境相关向量进行联合表示;
对联合表示后的向量进行序列化标注,提取出法律要素或案情要素。
进一步地,利用分词和词性标注工具分别对法律法规或判决文书进行预处理,生成词语序列和词性序列包括:
将用户字典中的法律专有名词加入分词和词性标注工具中;
利用加入法律专有名词后的分词和词性标注工具,分别对法律法规或判决文书进行预处理,生成词语序列和词性序列。
进一步地,对联合表示后的向量进行序列化标注,提取出法律要素或案情要素包括:
对联合表示后的向量进行序列化标注;
根据标注结果预测当前联合表示后的向量是否为法律要素或案情要素;
将确定为法律要素或案情要素的向量存储在法律要素或案情要素集合内,并作为最终提取出的法律要素或案情要素;
否则存储在候选法律要素或案情要素集合内。
进一步地,将确定为法律要素或案情要素的向量存储在法律要素或案情要素集合内,并作为最终提取出的法律要素或案情要素包括:
若法律要素或案情要素集合为空集,则计算候选法律要素或案情要素集合中存储的各候选法律要素或案情要素的重要性数值;
将重要性数值大于预设阈值的各候选法律要素或案情要素确定为最终的法律要素或案情要素。
进一步地,根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷包括:
根据满足预设条件的法律要素和预设的法律问卷生成规则,获得对应的法律问卷;
利用场景逻辑构建工具对法律问卷进行诉讼风险评估场景的匹配,确定诉讼风险评估问卷。
进一步地,对法律要素和案情要素进行语义匹配,确定语义匹配度数值包括:
分别对获取的法律要素和案情要素进行编码,得到第一向量和第二向量;
利用神经网络算法获取与第一向量语境相关的向量作为第三向量和第二向量语境相关的向量作为第四向量;
利用注意力机制对第三向量和第四向量进行匹配,获取第三向量和第四向量之间的关联信息;
对关联信息进行融合,获得融合后的向量;
利用分类器计算融合后的向量的语义匹配度,确定语义匹配度数值。
进一步地,利用注意力机制对第三向量和第四向量进行匹配,获取第三向量和第四向量之间的关联信息包括:
利用注意力机制对第三向量的上下文信息和第四向量的上下文信息进行匹配,得出至少一种匹配信息;
根据至少一种匹配信息,确定第三向量和第四向量之间的关联信息。
第二方面,本发明提供一种诉讼风险评估问卷自动生成的装置,该装置包括:
法律法规和判决文书确定模块,用于获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;
法律要素和案情要素提取模块,用于提取法律法规内的法律要素和判决文书内的案情要素;
语义匹配模块,用于对法律要素和案情要素进行语义匹配,确定语义匹配度数值;
阈值比较模块,用于将语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;
诉讼风险评估问卷确定模块,用于根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面提供的诉讼风险评估问卷自动生成的方法的步骤。
本发明采用机器自动生成诉讼风险评估问卷,根据案件的内容提要信息提取法律要素和案情要素,并将法律要素和案情要素进行语义匹配,根据获得的匹配率较高的法律要素生成法律问卷,进而确定诉讼风险评估问卷,解决了人工阅读长文本信息提取法律要素和案情要素耗时耗力,并且依据案情要素最终确定到的法律要素构建的诉讼风险评估问卷可以解决主观性较强容易产生偏差,且需要具备专业法律知识的工作人员等问题;同时语义匹配上精度更高,获得的诉讼风险评估问卷逻辑性较强,能够有利于分析并进行诉讼风险评估。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的诉讼风险评估问卷自动生成的方法流程示意图;
图2为本发明实施例提供的提取法律要素和案情要素的方法流程示意图;
图3为本发明另一实施例提供的诉讼风险评估问卷自动生成的方法流程示意图;
图4为本发明实施例提供的法律要素和案情要素语义匹配的方法流程示意图;
图5为本发明实施例提供的诉讼风险评估问卷自动生成的装置框图;
图6为本发明实施例提供的电子设备框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
目前,现有法律问卷基于已经存储好的问卷逻辑,根据用户的选择依次出现问卷内容,且问题是提前根据大量的法律文书等提前由人工开发;由于法律的特殊性和纠纷的复杂性,问卷逻辑多为人来设定。问卷系统作为法律咨询系统需要的功能,随着信息系统的发展,对问卷的要求也越来越高,通过问卷辅助完成法律咨询功能将成为一种非常重要的手段。基于大量裁判文书,运用技术智能生成法律问卷一方面可以减轻人工的压力,另一方面可以避免人的主观性。
在现有技术中,通常采用以下两种方式开发问卷:
1.直接将法律问题、选项的定义保存在数据库中,同时存储问题的选项与其下级问题的关系,通过代码的逻辑控制,根据所选的选项查询得出下个问题,从而控制逻辑跳转。
这种问卷只支持简单的逻辑控制,基本无法结合具体法律场景数据进行跳转控制或者只能由法律人员进行逻辑绑定,费时费力;而且扩展和集成都不方便,如果需要与新的法律场景数据结合,则必须重新绑定对应的处理逻辑和规则,因此该技术方案人工成本高,主观性强,开发周期长。
2.通过脚本实现的智能法律问卷,其原理在于通过查找已经配置的数据,调用相应的事件处理脚本,通过脚本解释器进行解释,绑定了事件与要触发的动作之间的响应。其关键是使用配置文件定义和扩展问卷内支持的事件和动作。在使用者操作问卷的时候,执行不同的操作,即可触发不同的事件,并根据绑定关系执行事件处理脚本中的问卷、子问卷、问题及选项等。
目前,诉讼风险评估问卷中的问题主要对判决文书和法律法规中提取案情要素和法律要素进行匹配后根据法律要素生成,而法条检索,案例检索,案例标注,问卷生成和校验等工作都是基于专业法律知识工程师完成,工作量大,法律知识要求高,效率低下的缺陷,此项工作需要投入大量资源,同时问题存在一定的主观因素;问题是问卷的基础,如果问题冗余度较高,则不利于问卷的生成。基于人工定义的逻辑完成问卷的方法中,由于人工设定的逻辑不能覆盖所有法律场景,因此开发耗时耗力;而基于脚本的问卷生成中,事件和动作要提前根据不同的法律场景提前配置,若事件和动作配置的较少或者较多都会造成问卷质量下降,还是依赖于人工,需要法律工作人员具有较高的法律知识储备才能完成。
为了解决上述问题,本发明实施例提供诉讼风险评估问卷自动生成的方法,如图1所示,该方法包括:
步骤S101,获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;
步骤S102,提取法律法规内的法律要素和判决文书内的案情要素;
步骤S103,对法律要素和案情要素进行语义匹配,确定语义匹配度数值;
步骤S104,将语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;
步骤S105,根据满足预设条件的法律要素构建诉讼风险评估问卷。
具体为,获取案由信息,其中案由信息是指案件的内容提要信息,根据案件的内容提要信息确定其中涉及的法律法规和判决文书,比如法律法规是婚姻法系列,判决文书是关于孩子抚养权等。从法律法规中提取法律要素,从判决文书中提取案情要素,并对提取出的法律要素和案情要素进行语义匹配,得到语义匹配度数值,将匹配度数值大于设定阈值的法律要素确定为匹配成功的法律要素,也即是满足预设条件的法律要素,再将多个匹配成功的法律要素按匹配度数值从大到小排序,以匹配度数值大的作为优先设置问卷的题目选项;之后再结合场景逻辑构建工具对设置的问卷进行逻辑规范化,得到需要的诉讼风险评估问卷。
本发明采用机器自动生成诉讼风险评估问卷,根据案件的内容提要信息提取法律要素和案情要素,并将法律要素和案情要素进行语义匹配,根据获得的匹配率较高的法律要素生成法律问卷,进而确定诉讼风险评估问卷,解决了人工阅读长文本信息提取法律要素和案情要素耗时耗力,并且依据案情要素最终确定到的法律要素构建的诉讼风险评估问卷可以解决主观性较强容易产生偏差,且需要具备专业法律知识的工作人员等问题;同时语义匹配上精度更高,获得的诉讼风险评估问卷逻辑性较强,能够有利于分析并进行诉讼风险评估。
基于上述各实施例的内容,作为一种可选实施例:提取法律法规内的法律要素和判决文书内的案情要素包括:
利用分词和词性标注工具分别对法律法规或判决文书进行预处理,生成词语序列和词性序列;
对词语序列和词性序列进行编码,生成词语向量和词性向量;
对词语向量和词性向量进行拼接;
利用神经网络算法获取与拼接后的向量语境相关的向量;
对获取到的所有语境相关向量进行联合表示;
对联合表示后的向量进行序列化标注,提取出法律要素或案情要素。
具体为,利用分词和词性标注工具分别对法律法规或判决文书进行预处理,生成词语序列和词性序列,然后对词语序列和词性序列进行编码,生成词语向量和词性向量,其中词语向量和词性向量均是高维密度向量,将词语向量和词性向量进行拼接,组成一个向量,使用循环神经网络(Recurrent Neural Network,RNN)、卷积神经网络(ConvolutionalNeural Networks,CNN)等获取其语境相关的向量进行联合表示;再对联合表示后的向量按照序列化标注的思想进行序列化标注,进而预测标注出的向量是否为法律要素或案情要素。
本发明实施例使用基于神经网络的方法提取法律要素和案情要素,提取效率较高,解决了由于人工阅读长文本信息提取法律要素和案情要素耗时耗力,主观性较强容易产生偏差且需要具备专业法律知识的工作人员等问题。
基于上述各实施例的内容,作为一种可选实施例:利用分词和词性标注工具分别对法律法规或判决文书进行预处理,生成词语序列和词性序列包括:
将用户字典中的法律专有名词加入分词和词性标注工具中;
利用加入法律专有名词后的分词和词性标注工具,分别对法律法规或判决文书进行预处理,生成词语序列和词性序列。
具体为,为了提升分词的准确性,在本发明实施例中将用户字典中的法律专有名词加入分词和词性标注工具中,利用加入法律专有名词后的分词和词性标注工具,分别对法律法规或判决文书进行预处理,生成词语序列和词性序列。
本发明实施例运用特征提取和神经网络相结合的技术,用神经网络进行分词,继而根据法律领域特征词和前后缀进行法律文本中的特定信息的提取。
基于上述各实施例的内容,作为一种可选实施例:对联合表示后的向量进行序列化标注,提取出法律要素或案情要素包括:
对联合表示后的向量进行序列化标注;
根据标注结果预测当前联合表示后的向量是否为法律要素或案情要素;
将确定为法律要素或案情要素的向量存储在法律要素或案情要素集合内,并作为最终提取出的法律要素或案情要素;
否则存储在候选法律要素或案情要素集合内。
具体为,如图2所示,利用分词和词性标注工具分别对法律法规或判决文书进行处理,生成词语序列和词性序列,对词语序列和词性序列进行编码,生成词语向量和词性向量;对词语向量和词性向量进行拼接;利用神经网络算法获取与拼接后的向量语境相关的向量;对获取到的所有语境相关向量进行联合表示;对联合表示后的向量进行序列化标注;根据标注结果预测当前联合表示后的向量是否为法律要素或案情要素;将确定为法律要素或案情要素的向量存储在法律要素或案情要素集合内,并作为最终提取出的法律要素或案情要素;否则存储在候选法律要素或案情要素集合内。
其中,若法律要素或案情要素集合为空集,则计算候选法律要素或案情要素集合中存储的各候选法律要素或案情要素的重要性数值;将重要性数值大于预设阈值的各候选法律要素或案情要素确定为最终的法律要素或案情要素。
基于上述各实施例的内容,作为一种可选实施例:根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷包括:
根据满足预设条件的法律要素和预设的法律问卷生成规则,获得对应的法律问卷;
利用场景逻辑构建工具对法律问卷进行诉讼风险评估场景的匹配,确定诉讼风险评估问卷。
具体为,在对法律要素和案情要素进行语义匹配后,根据匹配度数值与预设阈值的比较,将大于预设阈值的法律要素作为满足预设条件的法律要素,根据满足预设条件的法律要素和预设的法律问卷生成规则,生成对应的法律问卷。其中预设的法律问卷生成规则是系统提前设置好的,根据当前的满足预设条件的法律要素找到配置好的预设规则,得到法律问卷。比如法律要素是离婚,那么预设的法律问卷生成规则一般就是婚姻状况,年龄状况,抚养孩子状况,那生成的法律问卷对应的就是:请问您是否婚配?请问您是否感情抑郁?等。
因生成的法律问卷可能出现逻辑不对的情况,比如:先询问婚姻情况,再问是否婚配,明显出现提出的问题前后顺序颠倒的情况,这时需要利用场景逻辑构建工具对法律问卷进行诉讼风险评估场景的匹配,确定诉讼风险评估问卷。
基于上述各实施例的内容,作为一种可选实施例:如图3所示,图3是本发明另一实施例提供的诉讼风险评估问卷自动生成的方法流程示意图,是图1的进一步技术特征的补充,具体步骤为:
第一步:给定案由,找到其涉及到的若干相关法律法规和判决文书。
第二步:对法律法规和判决文书进行法律要素和案情要素的提取。
第三步:对提取好的法律要素和案情要素进行语义匹配。
第四步:对符合预设条件的法律要素根据规则生成若干该案由下的法律问卷。
第五步:对法律问卷使用场景逻辑构建工具。
第六步,完成诉讼风险评估场景匹配。
基于上述各实施例的内容,作为一种可选实施例:对法律要素和案情要素进行语义匹配,确定语义匹配度数值包括:
分别对获取的法律要素和案情要素进行编码,得到第一向量和第二向量;
利用神经网络算法获取与第一向量语境相关的向量作为第三向量和第二向量语境相关的向量作为第四向量;
利用注意力机制对第三向量和第四向量进行匹配,获取第三向量和第四向量之间的关联信息;
对关联信息进行融合,获得融合后的向量;
利用分类器计算融合后的向量的语义匹配度,确定语义匹配度数值。
具体为,如图4所示,分别对获取的法律要素和案情要素进行编码,得到法律要素高维度密集向量和案情要素高维度密集向量,对其进行信息交互和信息融合,之后将融合后的向量做语义匹配度计算。
更详细地,分别对获取的法律要素和案情要素进行编码,得到第一向量和第二向量;利用神经网络算法(循环神经网络或卷积神经网络)获取与第一向量语境相关的向量和第二向量语境相关的向量,作为第三向量和第四向量;利用注意力机制对第三向量和第四向量进行匹配,获取第三向量和第四向量之间的关联信息;利用注意力机制对第三向量的上下文信息和第四向量的上下文信息进行匹配,得出至少一种匹配信息;根据至少一种匹配信息,确定第三向量和第四向量之间的关联信息。对关联信息进行融合,获得融合后的向量;利用分类器计算融合后的向量的语义匹配度,确定语义匹配度数值。
神经网络方法具有学习功能强、开放性好以及分词速度快、精确度高等特点,可以大大提高案情要素和法律要素提取的召回率和精确度。
本发明实施例使用神经网络方法在多种角度对比法律要素和案情要素的异同点,能够较好的获取到更精确的匹配度。
根据本发明的再一个方面,本发明实施例提供诉讼风险评估问卷自动生成的装置,参见图5,图5为本发明实施例提供的诉讼风险评估问卷自动生成的装置框图。该装置用于在前述各实施例中完成本发明实施例提供的诉讼风险评估问卷自动生成。因此,在前述各实施例中的本发明实施例提供的诉讼风险评估问卷自动生成的方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
该装置包括:
法律法规和判决文书确定模块501,用于获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;
法律要素和案情要素提取模块502,用于提取法律法规内的法律要素和判决文书内的案情要素;
语义匹配模块503,用于对法律要素和案情要素进行语义匹配,确定语义匹配度数值;
阈值比较模块504,用于将语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;
诉讼风险评估问卷确定模块505,用于根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷。
具体的,本实施例的装置中各模块实现其功能的具体过程可参见对应的方法实施例中的相关描述,此处不再赘述。
本发明实施例采用机器自动生成诉讼风险评估问卷,根据案件的内容提要信息提取法律要素和案情要素,并将法律要素和案情要素进行语义匹配,根据获得的匹配率较高的法律要素生成法律问卷,进而确定诉讼风险评估问卷,解决了人工阅读长文本信息提取法律要素和案情要素耗时耗力,并且依据案情要素最终确定到的法律要素构建的诉讼风险评估问卷可以解决主观性较强容易产生偏差,且需要具备专业法律知识的工作人员等问题;同时语义匹配上精度更高,获得的诉讼风险评估问卷逻辑性较强,能够有利于分析并进行诉讼风险评估。
图6为本发明实施例提供的电子设备框图,如图6所示,该设备包括:处理器601、存储器602和总线603;
其中,处理器601及存储器602分别通过总线603完成相互间的通信;处理器601用于调用存储器602中的程序指令,以执行上述实施例所提供的诉讼风险评估问卷自动生成的方法,例如包括:获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;提取法律法规内的法律要素和判决文书内的案情要素;对法律要素和案情要素进行语义匹配,确定语义匹配度数值;将语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现诉讼风险评估问卷自动生成的方法的步骤。例如包括:获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;提取法律法规内的法律要素和判决文书内的案情要素;对法律要素和案情要素进行语义匹配,确定语义匹配度数值;将语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;根据满足预设条件的法律要素、场景逻辑构建工具,得到诉讼风险评估问卷。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后,本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种诉讼风险评估问卷自动生成的方法,其特征在于,所述方法包括:
获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;
提取所述法律法规内的法律要素和所述判决文书内的案情要素;
对所述法律要素和案情要素进行语义匹配,确定语义匹配度数值;
将所述语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;
根据所述满足预设条件的法律要素构建诉讼风险评估问卷。
2.根据权利要求1所述的方法,其特征在于,所述提取所述法律法规内的法律要素和所述判决文书内的案情要素包括:
利用分词和词性标注工具分别对法律法规或判决文书进行预处理,生成词语序列和词性序列;
对所述词语序列和词性序列进行编码,生成词语向量和词性向量;
对所述词语向量和词性向量进行拼接;
利用神经网络算法获取与拼接后的向量语境相关的向量;
对获取到的所有语境相关向量进行联合表示;
对所述联合表示后的向量进行序列化标注,提取出法律要素或案情要素。
3.根据权利要求2所述的方法,其特征在于,所述利用分词和词性标注工具分别对法律法规或判决文书进行预处理,生成词语序列和词性序列包括:
将用户字典中的法律专有名词加入分词和词性标注工具中;
利用加入法律专有名词后的分词和词性标注工具,分别对法律法规或判决文书进行预处理,生成词语序列和词性序列。
4.根据权利要求2所述的方法,其特征在于,所述对所述联合表示后的向量进行序列化标注,提取出法律要素或案情要素包括:
对所述联合表示后的向量进行序列化标注;
根据标注结果预测当前联合表示后的向量是否为法律要素或案情要素;
将确定为法律要素或案情要素的向量存储在法律要素或案情要素集合内,并作为最终提取出的法律要素或案情要素;
否则存储在候选法律要素或案情要素集合内。
5.根据权利要求4所述的方法,其特征在于,所述将确定为法律要素或案情要素的向量存储在法律要素或案情要素集合内,并作为最终提取出的法律要素或案情要素包括:
若所述法律要素或案情要素集合为空集,则计算所述候选法律要素或案情要素集合中存储的各候选法律要素或案情要素的重要性数值;
将重要性数值大于预设阈值的各候选法律要素或案情要素确定为最终的法律要素或案情要素。
6.根据权利要求1所述的方法,其特征在于,所述根据所述满足预设条件的法律要素构建诉讼风险评估问卷包括:
根据满足预设条件的法律要素和预设的法律问卷生成规则,获得对应的法律问卷;
利用场景逻辑构建工具对所述法律问卷进行诉讼风险评估场景的匹配,确定诉讼风险评估问卷。
7.根据权利要求1所述的方法,其特征在于,所述对所述法律要素和案情要素进行语义匹配,确定语义匹配度数值包括:
分别对获取的法律要素和案情要素进行编码,得到第一向量和第二向量;
利用神经网络算法获取与第一向量语境相关的向量作为第三向量和第二向量语境相关的向量作为第四向量;
利用注意力机制对第三向量和第四向量进行匹配,获取第三向量和第四向量之间的关联信息;
对所述关联信息进行融合,获得融合后的向量;
利用分类器计算所述融合后的向量的语义匹配度,确定语义匹配度数值。
8.根据权利要求7所述的方法,其特征在于,所述利用注意力机制对第三向量和第四向量进行匹配,获取第三向量和第四向量之间的关联信息包括:
利用注意力机制对第三向量的上下文信息和第四向量的上下文信息进行匹配,得出至少一种匹配信息;
根据所述至少一种匹配信息,确定第三向量和第四向量之间的关联信息。
9.一种诉讼风险评估问卷自动生成的装置,其特征在于,所述装置包括:
法律法规和判决文书确定模块,用于获取案件的内容提要信息,确定内容提要信息内的法律法规和判决文书;
法律要素和案情要素提取模块,用于提取所述法律法规内的法律要素和所述判决文书内的案情要素;
语义匹配模块,用于对所述法律要素和案情要素进行语义匹配,确定语义匹配度数值;
阈值比较模块,用于将所述语义匹配度数值与预设阈值作比较,获取满足预设条件的法律要素;
诉讼风险评估问卷确定模块,用于根据所述满足预设条件的法律要素构建诉讼风险评估问卷。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述诉讼风险评估问卷自动生成的方法的步骤。
CN202010337123.XA 2020-04-24 2020-04-24 诉讼风险评估问卷自动生成的方法和装置 Pending CN111524043A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010337123.XA CN111524043A (zh) 2020-04-24 2020-04-24 诉讼风险评估问卷自动生成的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010337123.XA CN111524043A (zh) 2020-04-24 2020-04-24 诉讼风险评估问卷自动生成的方法和装置

Publications (1)

Publication Number Publication Date
CN111524043A true CN111524043A (zh) 2020-08-11

Family

ID=71904180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010337123.XA Pending CN111524043A (zh) 2020-04-24 2020-04-24 诉讼风险评估问卷自动生成的方法和装置

Country Status (1)

Country Link
CN (1) CN111524043A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312924A (zh) * 2021-06-23 2021-08-27 北京鼎泰智源科技有限公司 一种基于nlp高精解析标签的风险规则分类方法及装置
CN113888006A (zh) * 2021-10-20 2022-01-04 支付宝(杭州)信息技术有限公司 行为风险评估方法及装置
CN114416958A (zh) * 2022-03-29 2022-04-29 数安信(北京)科技有限公司 一种数据合规自查方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595525A (zh) * 2018-03-27 2018-09-28 成都律云科技有限公司 一种律师信息处理方法和系统
CN109543178A (zh) * 2018-11-01 2019-03-29 银江股份有限公司 一种司法文本标签体系构建方法及系统
CN109739950A (zh) * 2018-12-25 2019-05-10 中国政法大学 筛选适用法律条文的方法及装置
CN110059193A (zh) * 2019-06-21 2019-07-26 南京擎盾信息科技有限公司 基于法律语义件与文书大数据统计分析的法律咨询系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595525A (zh) * 2018-03-27 2018-09-28 成都律云科技有限公司 一种律师信息处理方法和系统
CN109543178A (zh) * 2018-11-01 2019-03-29 银江股份有限公司 一种司法文本标签体系构建方法及系统
CN109739950A (zh) * 2018-12-25 2019-05-10 中国政法大学 筛选适用法律条文的方法及装置
CN110059193A (zh) * 2019-06-21 2019-07-26 南京擎盾信息科技有限公司 基于法律语义件与文书大数据统计分析的法律咨询系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312924A (zh) * 2021-06-23 2021-08-27 北京鼎泰智源科技有限公司 一种基于nlp高精解析标签的风险规则分类方法及装置
CN113888006A (zh) * 2021-10-20 2022-01-04 支付宝(杭州)信息技术有限公司 行为风险评估方法及装置
CN114416958A (zh) * 2022-03-29 2022-04-29 数安信(北京)科技有限公司 一种数据合规自查方法及装置

Similar Documents

Publication Publication Date Title
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
CN109325040B (zh) 一种faq问答库泛化方法、装置及设备
CN111524043A (zh) 诉讼风险评估问卷自动生成的方法和装置
CN110807566A (zh) 人工智能模型评测方法、装置、设备及存储介质
CN111783993A (zh) 智能标注方法、装置、智能平台及存储介质
CN115688920B (zh) 知识抽取方法、模型的训练方法、装置、设备和介质
CN111309910A (zh) 文本信息挖掘方法及装置
CN113627797B (zh) 入职员工画像生成方法、装置、计算机设备及存储介质
CN111368544A (zh) 命名实体识别方法及装置
CN114090755A (zh) 基于知识图谱的回复语句确定方法、装置及电子设备
CN113836303A (zh) 一种文本类别识别方法、装置、计算机设备及介质
CN111242710A (zh) 业务的分类处理方法、装置、服务平台及存储介质
CN112395887A (zh) 对话应答方法、装置、计算机设备和存储介质
CN113988071A (zh) 一种基于金融知识图谱的智能对话方法及装置、电子设备
CN110287270B (zh) 实体关系挖掘方法及设备
CN116701604A (zh) 问答语料库的构建方法和装置、问答方法、设备及介质
CN116798428A (zh) 一种基于私域管理的大语言智能模型系统
CN116680386A (zh) 基于多轮对话的答案预测方法和装置、设备、存储介质
CN114333813A (zh) 可配置智能语音机器人的实现方法、装置和存储介质
CN113486659A (zh) 文本匹配方法、装置、计算机设备及存储介质
CN114925206A (zh) 人工智能体、语音信息识别方法、存储介质和程序产品
CN113763934A (zh) 音频识别模型的训练方法、装置和存储介质及电子设备
CN113434631A (zh) 基于事件的情感分析方法、装置、计算机设备及存储介质
CN113392220A (zh) 一种知识图谱生成方法、装置、计算机设备及存储介质
CN111967253A (zh) 一种实体消歧方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200811

RJ01 Rejection of invention patent application after publication