CN111368098B

CN111368098B - 一种基于情景化的法律咨询评估系统

Info

Publication number: CN111368098B
Application number: CN202010241726.XA
Authority: CN
Inventors: 徐亮
Original assignee: Hangzhou Real Intelligence Technology Co ltd
Current assignee: Hangzhou Real Intelligence Technology Co ltd
Priority date: 2020-03-31
Filing date: 2020-03-31
Publication date: 2023-04-07
Anticipated expiration: 2040-03-31
Also published as: CN111368098A

Abstract

发明公开了一种基于情景化的法律咨询评估系统，通过结合纠纷类型下的要素梳理和识别，把法律咨询评估过程转化为口语化案件描述，结合问答补充的形式，从而支持多种形式的输入；其次，用户口语化描述后，通过机器学习和深度学习技术并结合人工标注数据，自动识别出纠纷类型和诉求类型；再次，结合场景定位引擎，把用户的输入定位到诉求下的具体场景中，从而为后续做有针对性的提问和产生咨询评估报告提供前提；根据用户输入不同，定位到的具体场景可能是一个，也可能是最可行的少数几个场景；从此，结合动态多轮交互问答的形式，通过针对性的问题、以最少问题的形式，确定用户的场景；根据确定的场景，产生针对性的法律咨询评估报告。

Description

一种基于情景化的法律咨询评估系统

技术领域

本发明涉及法律咨询技术领域，特别涉及一种基于情景化的法律咨询评估系统。

背景技术

每年有数千万的民事案例、更多数量的法律咨询。面对公民日益增多的法律服务需求，各类主体都推出了相应的法律服务平台或工具；海量裁判文书和公开的法律数据，使得各种法律服务的应用成为了可能。

目前存在的法律咨询评估的系统，主要通过用户选择问题类型、提问大量固定的问题的形式实现，以民事领域的专业咨询评估为例，包括以下几个步骤：

1）用户选择一个特定的问题类型—在这里通过选择一个问题类型，来限定咨询的范围，典型的问题类型是某个纠纷类型下的某个诉讼请求类型；

2）系统询问一系列问题—这些问题由法律业务专家梳理，每个问题的答案对应一个模板或法律条文；

3）用户进行一系列的回答—用户需要回答一些在1）中选定问题类型下对应的问题，这些问题由法律业务专家整理，特定问题类型下的问题数量和内容是固定不变的；

4）系统根据问答的结果结合模板做匹配—根据预设的模板并结合用户对问题的回答，给出咨询报告，咨询报告是多个部分的汇总，每一个用户问题都可以对应一个咨询报告的一个段落。

基于目前已有的咨询系统，存在着以下缺点：

1、系统要求用户回答的问题基本是固定不变的，与用户的具体情况无关；对于同一大类问题，所有人都被问了同样的问题，即不能针对性的提问；

2、系统需要询问用户非常多的问题，由于系统并不知道用户是属于哪种具体场景，需要收集大量的用户信息，导致咨询评估过程复杂、耗时、用户完成比例很低；

3、提供的咨询评估报告通常是模板填充式的，里面包含了大量通用固定的信息，并不能针对用户具体场景得出一个具有明确指向性的结论；

4、用户必须正确选择了特定的纠纷类型，才能开始系统的咨询评估；由于绝大多数用户缺失专业的法律知识，以及法律知识体系的复杂性，导致用户选择困难或容易做出错误选择，如在医疗场景，用户去医院看病，习惯于通过一个导诊台来引导进入正确的科室，法律服务场景也需要类似的功能；

5、系统不能支持用户的口语化描述，用户只能被动回复问题，而不能具体介绍自己的情况，导致用户有效输入少和体验差、系统过于机械，这与真实场景（律师会首先让用户描述自己的案情，然后才能结合专业知识问相应的问题来进一步确定案情）相悖。

发明内容

针对现有技术存在的不足，本发明的目的在于提供一种基于情景化的法律咨询评估系统，通过用户口语化描述的场景定位，将用户非结构化的输入（即口语化的描述）和用户诉求下具体的场景结合起来，从而使得整个法律咨询评估过程和结果都是有针对性即场景化了而不是笼统的、抽象的或含糊不清的；这包括交互过程(提问的方式)和产生用户输入关联度高的评估报告；因为有着更加场景化的拆分和识别，也使得咨询评估过程更加高效、咨询评估报告变得简洁。

上述系统通过以下操作步骤生成咨询评估报告：

第一步通过结合纠纷类型下的要素梳理和识别，支持口语化的输入，把法律咨询评估过程转化为口语化案件描述，结合问答补充的形式，从而支持多种形式的输入；

其次，用户口语化描述后，通过机器学习和深度学习技术并结合人工标注数据，自动识别出纠纷类型和诉求类型，避免用户在一个大范围内做一个不熟悉的领域的问题的选择；

再次，在确定了纠纷类型和诉求类型后，结合场景定位引擎，把用户的输入定位到诉求下的具体场景中，从而为后续做有针对性的提问和产生咨询评估报告提供前提；根据用户输入不同，定位到的具体场景可能是一个，也可能是最可行的少数几个场景；

进一步结合动态多轮交互问答的形式，通过针对性的问题、以最少问题的形式，确定用户的场景。

最后，根据确定的场景，产生针对性的法律咨询评估报告。

本发明的上述技术目的是通过以下技术方案得以实现的：

一种基于情景化的法律咨询评估系统，包括：

用户咨询问题输入层，其含有语音输入和文本输入两个输入分支，用户语音输入后会通过语音识别系统被识别成文本格式输出，用户也可直接输入文本；

意图识别引擎，接收用户咨询问题的输入文本，自动识别出用户描述对应的问题类型，具体来说，意图识别引擎会识别出用户描述对应的纠纷类型及诉求；

场景定位引擎，结合意图识别引擎的意图识别结果和用户的场景描述文本将本次用户的案件定位到候选场景中；通过场景定位引擎，缩小可能的范围，为针对性的提问和产生咨询评估报告提供关键支撑，候选场景可能是唯一的一个场景，也可能是N（N为整数）个可能性最高的多个场景，场景定位引擎综合以下四个方面的信息（每个信息都会转化为0到1之间的小数）来确定场景，当满足一定的阈值的场景才是候选场景：

a.诉求下的特定场景要素识别结果的分数，基于用户输入的文本和用户累积回答识别出一个要素集合，再通过场景要素识别模块输出一个介于0到1之间的要素识别分；要素是指诉求下的场景细化处理的特征，对应的是一个最小单元的法律意义上的判决要点；

b.用户输入与场景的相关性打分，基于用户输入的文本与场景描述文本两个输入因素，通过机器学习模型的预测输出一个介于0到1之间的场景相关分；

c.用户输入与场景的关键要素的相关性打分，基于用户输入的文本与关键要素两个输入因素，通过机器学习模型的预测输出一个介于0到1之间的关键要素相关分；涉及的关键要素是指场景的多个要素中能够将该场景与其他场景显性区别出来的要素，通常是场景中最有辨识性的要素；

d.裁判文书中不同场景出现的先验概率，通过场景的关键要素在裁判文书中出现的频率，并经过归一化处理得到一个介于0到1之间的场景先验概率；

动态多轮交互模块，当候选场景确定后，需要进一步与用户交互，通过与用户动态问答的交互来确定是否符合特定的要素和条件，并把问答中累积获得的要素信息添加到场景定位引擎内的要素集合内进行最终的场景定位；

具体来说，当候选场景只有一个，并且该场景下的关键要素已经被识别到后，可以跳过动态多轮交互模块，直接生产法律咨询评估报告；但候选场景只有一个但关键要素没有识别到，或者有多个候选场景时，需要根据当前的状态确定一个场景来进行提问。

当前的提问针对的是最可信的场景中未识别的要素来提问，用户回答问题后会更新系统当前的状态，并且会将累积的用户问答对应的要素与文本的要素识别的信息汇总成最终的已识别的要素，接着再一次经过场景定位引擎对场景进行打分。如果满足相应的条件，那么直接调到下一步；否则，继续提问，直到满足相应的条件或没有超过最大允许的问题数量。

通过场景定位引擎打分值是否满足阈值（如T）来确定是否有候选场景，当超过最大允许的问题数量后，使用一个统一的评估报告。这个评估报告没有和用户相关的场景，有一个统一的评估报告；需要注意的是，当没有候选场景的时候，采用默认的场景来提问，默认的场景由业务专家设置的诉求下的一个场景，代表这特定诉求下最常见的场景。

法律咨询评估报告模块，针对一个特定的情形，都会有一个咨询评估理由、法律建议和需要准备的证据，评估理由包含与用户相关的场景、支持或不支持所依赖的法律法规和评估报告的结论。

进一步优选为，意图识别引擎包括：

纠纷类型和诉求预测模块，根据用户咨询问题输入层输入的用户输入文本识别出纠纷类型和诉求，并预测诉求的相应诉求概率；

纠纷类型和诉求符合评定模块，设定一个符合阈值，通过相应诉求下的诉求概率与符合阈值比较，当诉求概率大于设定的符合阈值就输出纠纷类型及诉求的相关信息；

纠纷类型和诉求更正模块，基于诉求概率小于设定的符合阈值情况，所述纠纷类型和诉求更正模块通过生成纠纷类型和诉求候选项，与用户交互选择输出的纠纷类型和诉求。

进一步优选为，场景定位引擎基于得到的要素识别分、场景相关分、关键要素相关分和场景先验概率四个得分项，对相应得分项分配权重，通过加权求和得到相应场景针对用户输入的得分，计算公式为：场景的最终得分=场景相关分*场景相关分权重+关键要素相关分*关键要素权重+要素识别分*要素识别分权重+场景先验概率*场景先验概率权重。

进一步优选为，关键要素通常是场景中最有辨识性的要素，在设定关键要素权重相对其他单个要素高50%，如果识别要素的结果为负向即负向匹配到了要素的特征，那么将该场景的要素识别分设为一个大的负数(如-10)，表示这个场景被放弃。

进一步优选为，每一个关键要素对应设置有一正则表达式，通过裁判文书去匹配相应诉求下的数据并统计，对场景的频率最大值设定为均值的M倍进行限制，并通过数据的最值归一化得到了先验概率。

综上所述，本发明对比于现有技术的有益效果为：

1、本发明结合多模态信息对问题（即用户诉求）的场景定位，将用户从冗长的、固定不变的问答交互过程中解放了出来：整个过程变成是简洁、易用、自适应的；

2、基于场景定位的动态多轮问题机制，以最少的提问的方式在多轮交互中确定用户满足的场景，使得法律咨询评估过程变得高效、智能；

3、本发明引入的法律知识图谱梳理体系，包括对用户诉求的场景化的拆分、关键要素的引入、简化了的要素关系（去除了要素间的复杂的逻辑），化庞大的法律知识图谱梳理成简单、易操作、结构简洁清晰明了的法律知识梳理过程；

4、意图识别引擎自动地识别出纠纷类型和诉求，简化、便利了用户的法律咨询评估过程，实现了不同问案情的自动分流，提高了易用性和智能化的水平；

5、口语化的描述与多轮动态提问交互机制，使得用户输入变得多元化，更容易满足人民对法律服务的需求、使得法律服务更亲民化，使得用户的法律服务过程变得便捷、灵活。

附图说明

图1为实施例的系统流程框架图；

图2为实施例的法律知识图谱例子；

图3为实施例中意图识别引擎的流程结构图；

图4为实施例中场景定位引擎的流程结构图。

具体实施方式

以下结合附图对发明作进一步详细说明。

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。说明书中的“实施例”或“实施方式”既可表示一个实施例或一种实施方式，也可表示一些实施例或一些实施方式的情况。

本领域技术技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种基于情景化的法律咨询评估系统，参照图1所示，包括用户咨询问题输入层、意图识别引擎、场景定位引擎、动态多轮交互模块、法律咨询评估报告模块，用户通过在用户咨询问题输入层进行问题描述，形成咨询问题的输入文本，意图识别引擎通过对输入文本的识别分析出用户的纠纷类型和诉求，在识别的过程中，会有与用户交互确认的过程，最终输出用户描述对应的纠纷类型和诉求，结合场景定位引擎，把用户的输入定位到诉求下的具体场景中，从而为后续做有针对性的提问和产生咨询评估报告提供前提；根据用户输入不同，定位到的具体场景可能是一个，也可能是最可行的少数几个场景；

进一步结合动态多轮交互问答的形式，通过针对性的问题、以最少问题的形式，确定用户的场景，最后，根据确定的场景，产生针对性的法律咨询评估报告。

具体的实施方式如下所述，但不局限于如下的实施方式：

用户咨询问题输入层，其含有语音输入和文本输入两个输入分支，用户语音输入后会通过语音识别系统被识别成文本格式输出，用户也可直接输入文本，如在这里，用户输入了：“老公有病，精神有问题，医生告知这种病治不好的，但我想离婚了”。

意图识别引擎，接收用户咨询问题的输入文本，自动识别出用户描述对应的问题类型，此实施例中，意图识别引擎包括：

纠纷类型和诉求更正模块，基于诉求概率小于设定的符合阈值情况，所述纠纷类型和诉求更正模块通过生成纠纷类型和诉求候选项，与用户交互选择输出的纠纷类型和诉求；

具体来说，意图识别引擎最终会识别出用户描述对应的纠纷类型及诉求，如图2所示，识别到的纠纷类型是【婚姻家庭】，诉求是【离婚】，纠纷类型和诉求预测模块预测诉求是离婚的概率是0.61，该值大于设定的符合阈值（如符合阈值设定为0.5），那么直接进入后续步骤；

场景定位引擎，结合意图识别引擎的意图识别结果和用户的场景描述文本将本次用户的案件定位到候选场景中；通过场景定位引擎，缩小可能的范围，为针对性的提问和产生咨询评估报告提供关键支撑，候选场景可能是唯一的一个场景，也可能是N（N为整数）个可能性最高的多个场景，参照图4所示，场景定位引擎综合以下四个方面的信息（每个信息都会转化为0到1之间的小数）来确定场景，当满足一定的阈值的场景才是候选场景：

a.诉求下的特定场景要素识别结果的分数，基于用户输入的文本和用户累积回答识别出一个要素集合（要素是指诉求下的场景细化处理的特征，对应的是一个最小单元的法律意义上的判决要点），再通过场景要素识别模块输出一个介于0到1之间的要素识别分；

上述要素识别的结果是：“医生告知这种病治不好的”，对应的要素是【病情久治不愈】。由于关键要素对场景辨识意义较大，我们设定关键要素权重相对其他单个要素高50%；如果识别要素的结果为负向即负向匹配到了要素的特征，那么将该场景的要素识别分设为一个大的负数(如-10)，表示这个场景被放弃。

在我们的例子中这两个场景中要素都只有两个要素，那么关键要素权重为0.6，其他要素权重为0.4。这两个场景中的关键要素分别是（法律知识图谱中加黑的要素）：“一方患有精神病”、“一方患有禁止结婚的疾病”，又因为这两场景都没有匹配到关键要素，所以上述两个场景的要素识别分都为0.4分。

在本实施例中：

场景1，一方患精神病，婚后久治不愈，得分0.88；

场景2，一方患有法定禁止结婚疾病，且难以治愈，得分0.79；

我们可以通过人工标注一批数据来训练模型，就是将一批与诉求下场景相似的用户咨询评估的输入和该场景文本的句子对标为1，不相似的句子对（即负样本）可以通过负采样得到；我们也可以在法律场景上句子对任务来训练模型，这个模型是基于海量数据预训练基础上的。我们的系统中采用后者，基于BERT预模型，使用200万真实法律咨询问答训练获得。BERT是google推出的一种预训练语言表示的模型，在大量文本语料(维基百科)上训练了一个通用的“语言理解”模型，具有较好的泛化能力，如果预测时间要求高，也可以采用CNN等模型来实现。

关键要素相关分使用的机器学习模型，与用户输入与场景的相关性打分完全一致，模型和实例完全复用。场景1的关键要素是“一方患有精神病”；场景2的关键要素是“一方患有禁止结婚的疾病”。这两个要素分别对用户的输入，通过深度学习模型来打分，得到的分数分别为0.92、0.85。

d.裁判文书中不同场景出现的先验概率，通过场景的关键要素在裁判文书中出现的频率，并经过归一化处理得到；

首先，场景的先验概率代表从裁判文书中获得一个知识，某一场景是否有较高的出现概率也即用户提到这个场景的概率是否比较高；通过参考这个概率，我们可以在不确定的多个场景选择中或同等条件下，更有机会选中一个与用户相关的场景。

对场景的频率最大值设定为均值的M倍进行限制，并通过数据的最值归一化得到了先验概率。

不同场景的先验概率，通过场景下关键要素在裁判文书中的统计来实现；具体的说，每一个关键要素都有对应的正则表达式，如场景1的关键要素“一方患有精神病”，对应的正则表达式是“抑郁|精神.*病|精神分裂|郁抑”。通过裁判文书去匹配这个“离婚”诉求下的数据并统计，并通过数据的归一化，就得到了先验概率。具体的，我们对频率最高的数据做了限制，场景的频率最大值设定为均值的M倍（如3倍），结合通过最值归一化实现（减去最小值，除以最大值与最小值的差额）；在这里例子中，场景1和场景2的得分分别为0.3和0.4。

最后基于得到的要素识别分、场景相关分、关键要素相关分和场景先验概率四个得分项，对相应得分项分配权重，通过加权求和得到相应场景针对用户输入的得分；

如场景的最终得分的计算公式为：场景的最终得分=场景相关分*场景相关分权重+关键要素相关分*关键要素权重+要素识别分*要素识别分权重+场景先验概率*场景先验概率权重；假设我们认为先验概率权重应该略低（如0.1），其他部分权重都一致(0.3)，则在本实施例中：

场景1的最终得分=0.4*0.3+0.88*0.3+0.92*0.3+0.3*0.1=0.69；

场景2的最终得分=0.4*0.3+0.79*0.3+0.85*0.3+0.4*0.1=0.65；

由此，最优场景为场景1，即“一方患精神病，婚后久治不愈”。

在我们的例子中，给定了各部分的权重；但这个权重，我们也可以通过训练机器学习模型并利用特征重要性得到。

在本实施例中，针对有可信的场景1有一个未识别的要素即“一方患有精神病”，我们问用户“一方是否患有精神病”，用户回答“患有精神病”；那么，这个问答的信息会更新到系统中，当前最优场景的关键要素也已经通过问答被识别到了，所以我们将跳过本步骤，进入到法律咨询评估报告模块。

需要注意的是，如果用户回答了“没有患精神病”，那么接下去一轮计算中场景识别引擎将会把场景2排到上面来即作为最有场景，问场景2中没有识别到的要素即“一方患有禁止结婚的疾病”对应的问题。

本例中的【评估理由】

根据您的描述，一方患精神病且久治不愈。

依据《关于人民法院审理离婚案件如何认定夫妻感情确已破裂的若干具体意见》的规定，“凡属下列情形之一的，视为夫妻感情确已破裂。一方坚决要求离婚，经调解无效，可依法判决准予离婚。•••3.婚前隐瞒了精神病，婚后经治不愈，或者婚前知道对方患有精神病而与其结婚，或一方在夫妻共同生活期间患精神病，久治不愈的。“

因此，一方坚决要求离婚时，法院一般都会支持。

【证据模块】根据您所描述的事实，建议您搜集以下能够证明您所描述事实的证据：

1.精神诊断证明、精神鉴定等，用以证明一方患有精神病的事实；

2.诊断证明书、医疗费票据、病历等，用以证明病情久治不愈的事实。

【法律建议】您可以携带相关证据和结婚证、身份证，向您户口所在地法院提起诉讼，必要时可委托律师协助起诉。

本发明适用所有的法律咨询评估工作，虽然并发明的示例是针对民事咨询评估，但同样的系统也适用在刑事咨询评估。

以上所述仅是本发明的示范性实施方式，而非用于限制本发明的保护范围，本发明的保护范围由所附的权利要求确定。

Claims

1.一种基于情景化的法律咨询评估系统，其特征在于，包括：

用户咨询问题输入层，其含有语音输入和文本输入两个输入分支，用户语音输入后会通过语音识别系统被识别成文本格式输出；

意图识别引擎，接收用户咨询问题的输入文本，自动识别出用户描述对应的问题类型，问题类型包含纠纷类型及诉求；

场景定位引擎，结合意图识别引擎的意图识别结果和用户的场景描述文本将案件定位到候选场景中，场景定位引擎综合以下四个方面的信息来确定场景：

诉求下的特定场景要素识别结果的分数，基于用户输入的文本和用户累积回答识别出一个要素集合，再通过场景要素识别模块输出一个介于0到1之间的要素识别分；要素是指诉求下的场景细化处理的特征，对应的是一个最小单元的法律意义上的判决要点；

用户输入与场景的相关性打分，基于用户输入的文本与场景描述文本两个输入因素，通过机器学习模型的预测输出一个介于0到1之间的场景相关分；

用户输入与场景的关键要素的相关性打分，基于用户输入的文本与关键要素两个输入因素，通过机器学习模型的预测输出一个介于0到1之间的关键要素相关分；关键要素是指场景的多个要素中能够将该场景与其他场景显性区别出来的要素；

裁判文书中不同场景出现的先验概率，通过场景的关键要素在裁判文书中出现的频率，并经过归一化处理得到一个介于0到1之间的场景先验概率；

场景定位引擎基于得到的要素识别分、场景相关分、关键要素相关分和场景先验概率四个得分项，对相应得分项分配权重，通过加权求和得到相应场景针对用户输入的得分，将得分最高场景得分与阈值作比较，得分不小于阈值则根据所述得分最高场景直接生成法律咨询评估报告；否则通过动态多轮交互模块提升候选场景得分，直到场景得分不小于阈值；

动态多轮交互模块，当候选场景确定后，通过与用户动态问答的交互来确定是否符合特定的要素和条件，并把问答中累积获得的要素信息添加到场景定位引擎内的要素集合内进行最终的场景定位；

2.根据权利要求1所述的一种基于情景化的法律咨询评估系统，其特征是，意图识别引擎包括：

纠纷类型和诉求更正模块，基于诉求概率小于设定的符合阈值情况，纠纷类型和诉求更正模块通过生成纠纷类型和诉求候选项，与用户交互选择输出的纠纷类型和诉求。

3.根据权利要求1所述的一种基于情景化的法律咨询评估系统，其特征是，场景定位引擎基于得到的要素识别分、场景相关分、关键要素相关分和场景先验概率四个得分项，对相应得分项分配权重，通过加权求和得到相应场景针对用户输入的得分，计算公式为：场景的最终得分=场景相关分*场景相关分权重+关键要素相关分*关键要素权重+要素识别分*要素识别分权重+场景先验概率*场景先验概率权重。

4.根据权利要求3所述的一种基于情景化的法律咨询评估系统，其特征是，关键要素是场景中最有辨识性的要素，在设定关键要素权重相对其他单个要素高50%，如果识别要素的结果为负向即负向匹配到了要素的特征，那么将该场景的要素识别分设为一个大的负数，表示这个场景被放弃。

5.根据权利要求1所述的一种基于情景化的法律咨询评估系统，其特征是，每一个关键要素对应设置有一正则表达式，通过裁判文书去匹配相应诉求下的数据并统计，对场景的频率最大值设定为均值的M倍进行限制，并通过数据的最值归一化得到先验概率。