CN112463941B - 基于事件链的多轮问答方法及装置 - Google Patents
基于事件链的多轮问答方法及装置 Download PDFInfo
- Publication number
- CN112463941B CN112463941B CN202011416294.8A CN202011416294A CN112463941B CN 112463941 B CN112463941 B CN 112463941B CN 202011416294 A CN202011416294 A CN 202011416294A CN 112463941 B CN112463941 B CN 112463941B
- Authority
- CN
- China
- Prior art keywords
- event
- chain
- information
- processed
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012163 sequencing technique Methods 0.000 claims abstract description 15
- 238000013138 pruning Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 22
- 206010039203 Road traffic accident Diseases 0.000 description 14
- 238000010276 construction Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 11
- 230000035622 drinking Effects 0.000 description 9
- 239000008280 blood Substances 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于事件链的多轮问答方法及装置。该基于事件链的多轮问答方法包括根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,待处理事件链为用户获取法律意图的咨询信息;根据重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据问答信息进行反馈;根据客户端对于问答信息的反馈信息,不断优化事件路径;根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图。本申请至少解决了在法律领域中的智能对话不具备灵活性的技术问题。
Description
技术领域
本申请涉及智能对话领域,具体而言,涉及一种基于事件链的多轮问答方法及装置。
背景技术
目前,在智能对话领域,多轮问答系统的设计方案有几种,其一,基于问题树的结构,即,将法律领域内的多轮对话设计成一系列问题,通过识别第一个问题作为多轮问答触发的入口,开始进入多轮对话,例如公开号为CN110717027A的中国发明专利中公开的设定问句的先前轮和后一轮的结构。其二,基于法律领域知识图谱作为多轮会话的结构依据,例如公开号为CN110377715A的中国发明专利中公开的方法。
相关技术中存在以下缺点:
1、构建成本巨大。如上述的两种领域内常见的构建方法,第一种要构建大量问题树,其构建人工成本是巨大的,而且在某一领域内构建的问题树换一个领域是不可用的,大量复杂的构建劳动并不具备较好的可复制性,这是基于问题树的方法构建的短板所在,而第二种方法所述的基于知识图谱的多轮问答构建方法,首先需要在法律领域内构建完整的知识图谱,而知识图谱的构建又严重依赖于类似第一种方法中问题树的结构和领域内的知识覆盖,因而方法二的构建成本并不比第一种小。
2、不具备灵活性。如上所述的两种常见方法,是不具备问答过程的可变性的,第一种方法所设定的问题树结构是一个固定的层级结构,也就是前一轮后一轮的问题是完全固定的,因而进一步解释了缺点1中存在需要知识工程师们大量的构建固定的知识图谱的问题;而基于知识图谱的第二种方法,并没有从根本上解决多轮会话应该从何而始,从何而终的问题。因而上述常见的领域内的方法,都不具备很好的灵活性。
3、问答轮次不可控。如上述的两种领域内常见方法,问答的过程是固定的,轮次也是无法控制点,比如第一种方法,基于问题树的结构,而问题树是固定的,一颗五层深的树就是需要五轮对话来完成,但无法得知如果树的第一层给定了某个信号后,第二层就需不需要再进行的类似信号;而在方法二中,基于知识图谱的问答,多轮对话的轮次取决于知识图谱是如何构建的,以及知识图谱的属性和边所需的数量,无法动态的调整问答轮次。
针对相关技术中存在的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种基于事件链的多轮问答方法,至少解决了相关技术在法律领域中的智能对话不具备灵活性的问题。
为了实现上述目的,本申请提供了一种基于事件链的多轮问答方法及装置。
第一方面,本申请提供了一种基于事件链的多轮问答方法。
根据本申请的基于事件链的多轮问答方法包括:
根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,所述待处理事件链为用户获取法律意图的咨询信息;
根据所述重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据所述问答信息进行反馈;
根据客户端对于所述问答信息的反馈信息,不断优化所述事件路径;
根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图。
进一步的,所述根据法律知识数据,确定待处理事件链对应的事件路径,包括:
根据法律知识图谱,确定待处理事件链对应的事件路径,其中,法律知识图谱为以事件为中心,以事件间的关系及事件的要素作为连接事件的边的结构化的法律知识数据。
进一步的,所述根据法律知识图谱,确定待处理事件链对应的事件路径,包括:
确定待处理事件链对应的子事件;
根据法律知识图谱对所述子事件中的事件信息进行匹配;
根据匹配结果,确定待处理事件链对应的事件路径。
进一步的,所述根据法律知识图谱对所述子事件中的事件信息进行匹配,包括以下任意一种或多种的组合:
根据法律知识图谱对所述子事件中的事件要素信息进行匹配;
根据法律知识图谱对所述子事件中的事件关联信息进行匹配;
根据法律知识图谱对所述子事件中的事件状态信息进行匹配。
进一步的,所述根据法律知识数据,确定待处理事件链中事件核心要素对应的重要度排序,所述方法还包括:
根据法律知识数据,确定待处理事件链中事件核心要素;
根据所述核心要素,确定所述核心要素对应的重要度;
对所述核心要素对应的重要度进行排序,确定待处理事件链中事件核心要素对应的重要度排序。
进一步的,所述根据客户端的反馈信息,不断优化所述事件路径,包括:
根据客户端的反馈信息,对所述事件路径进行剪枝优化。
进一步的,在所述根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序之前,所述方法还包括:
获取客户端发送的咨询信息;
对所述咨询信息中的自然语言文本进行识别和抽取,确定待处理事件链。
第二方面,本申请提供了一种基于事件链的多轮问答装置。
根据本申请的基于事件链的多轮问答装置包括:
信息确定模块,用于根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,所述待处理事件链为用户获取法律意图的咨询信息;
信息发送模块,用于根据所述重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据所述问答信息进行反馈;
路径优化模块,用于根据客户端对于所述问答信息的反馈信息,不断优化所述事件路径;
结果输出模块,用于根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图。
进一步的,所述信息确定模块包括:
路径确定单元,用于根据法律知识图谱,确定待处理事件链对应的事件路径,其中,法律知识图谱为以事件为中心,以事件间的关系及事件的要素作为连接事件的边的结构化的法律知识数据。
进一步的,所述路径确定单元包括:
用于确定待处理事件链对应的子事件;根据法律知识图谱对所述子事件中的事件信息进行匹配;根据匹配结果,确定待处理事件链对应的事件路径。
进一步的,所述路径确定单元还包括:
根据法律知识图谱对所述子事件中的事件要素信息进行匹配;根据法律知识图谱对所述子事件中的事件关联信息进行匹配;根据法律知识图谱对所述子事件中的事件状态信息进行匹配。
进一步的,所述信息确定模块包括:
核心要素确定单元,用于根据法律知识数据,确定待处理事件链中事件核心要素;
重要度确定单元,用于根据所述核心要素,确定所述核心要素对应的重要度;
重要度排序单元,用于对所述核心要素对应的重要度进行排序,确定待处理事件链中事件核心要素对应的重要度排序。
进一步的,路径优化模块包括:
剪枝优化单元,用于根据客户端的反馈信息,对所述事件路径进行剪枝优化。
进一步的,所述基于事件链的多轮问答装置还包括:
信息获取模块,用于获取客户端发送的咨询信息;
信息处理模块,用于对所述咨询信息中的自然语言文本进行识别和抽取,确定待处理事件链。
第三方面,本申请提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面提供的基于事件链的多轮问答方法的步骤。
第四方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面提供的基于事件链的多轮问答方法的步骤。
在本申请实施例中,采用根据法律知识数据确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序的方式,并根据重要度排序分发问答信息至客户端,通过接收客户端的反馈信息,不断优化事件路径,达到了根据优化后的事件路径确定待处理事件链对应的法律意图的目的,从而实现了根据多轮对话根据待处理事件链确定法律意图的技术效果,至少解决了在法律领域中的智能对话不具备灵活性的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于事件链的多轮问答方法的流程示意图;
图2是根据本申请另一实施例的基于事件链的多轮问答方法的流程示意图;
图3是根据本申请实施例的基于事件链的多轮问答装置的结构框图;
图4是根据本申请实施例的电子设备框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请实施例,提供了一种基于事件链的多轮问答方法,如图1所示,该方法包括如下的步骤S1至步骤S4:
S1:根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,待处理事件链为用户获取法律意图的咨询信息。
“根据法律知识数据,确定待处理事件链对应的事件路径”,具体为:根据法律知识图谱,确定待处理事件链对应的事件路径,其中,法律知识图谱为以事件为中心,以事件间的关系及事件的要素作为连接事件的边的结构化的法律知识数据。
“根据法律知识图谱,确定待处理事件链对应的事件路径”,具体为:确定待处理事件链对应的子事件;根据法律知识图谱对子事件中的事件信息进行匹配;根据匹配结果,确定待处理事件链对应的事件路径。
“根据法律知识图谱对子事件中的事件信息进行匹配”,包括以下任意一种或多种的组合:根据法律知识图谱对子事件中的事件要素信息进行匹配;根据法律知识图谱对子事件中的事件关联信息进行匹配;根据法律知识图谱对子事件中的事件状态信息进行匹配。
“根据法律知识数据,确定待处理事件链中事件核心要素对应的重要度排序”,具体为:根据法律知识数据,确定待处理事件链中事件核心要素;根据核心要素,确定核心要素对应的重要度;对核心要素对应的重要度进行排序,确定待处理事件链中事件核心要素对应的重要度排序。
待处理事件链为用户通过客户端上传的咨询信息后,通过对咨询信息中的自然语言文本进行识别和抽取后得到的,包括自然语言文本所表达的用户意图、事件、事件状态、事件关系及语义角色等。法律知识数据为包含全部法律知识的数据,包括原始法律文本信息,是一种底层数据;法律知识图谱是根据法律知识数据生成的以事件为中心,以事件间的关系及事件的要素作为连接事件的边的结构化的图谱。事件路径为法律知识对应的路径。事件核心要素是根据法律知识数据进行确定的,是对于事件描述必不可少的要素,在确定事件核心要素后,需要进一步根据法律知识数据确定的核心要素的重要度排序。示例的,咨询信息为“我喝酒后开车”,对应事件链中的事件为酒后开车→酒驾,事件关系为酒驾→(导致)→交通事故,角色为我(人→侵权人→肇事者),事件路径为“酒驾(酒精浓度、车速等)→交通事故(程度、结果)”。进一步的,在上述事件路径包括“酒驾”子事件,在“酒驾”子事件中“血液中酒精浓度”是一个必不可少的要素;而“驾驶员性别”和“驾龄”对于“酒驾”事件来说是没有意义的,不属于事件核心要素。进一步的,在“酒驾”的事件中,事件核心要素的重要度排序可以为“酒精浓度>是否无证>是否引起事故>车速”。
另外,事件链中的每个事件可以包括一个或多个子事件。在确定待处理事件链对应的事件路径时,通常是对法律知识图谱中的事件和事件链中的子事件进行匹配后确定的,可以是根据子事件中的事件要素信息进行匹配;还可以是根据子事件中的事件关联信息进行匹配;也可以是根据子事件中的事件状态信息进行匹配。具体的,可以根据事件信息与法律知识图谱中的事件进行相似度匹配,将事件匹配结果相似度最高的路径作为事件路径。示例的,在上述事件链为“事件为酒后开车→酒驾,事件关系为酒驾→(导致)→交通事故,角色为我(人→侵权人→肇事者)”中,事件链中的子事件为“酒驾”;在事件链为“事件为酒后开车→酒驾,撞伤一个人→交通事故,逃逸→肇事逃逸;事件关系为酒驾→(导致)→交通事故,交通事故→(随后)→肇事逃逸;角色为我(人→侵权人→肇事者),我(人→违法人→逃逸者)”中,事件链中的子事件是包括“酒驾、交通事故、肇事逃逸”的三个子事件。
S2:根据重要度排序,分步发送事件路径中事件对应的问答信息至客户端。
事件链中可以包括一个子事件,也可以包括多个子事件;子事件可以包括一个事件核心要素,也可以包括多个事件核心要素。若事件核心要素仅为一个要素,则将问答信息至客户端,以便客户端根据问答信息进行反馈。若事件核心要素为多个要素,则可以按照重要度的高低,将多个事件核心要素依次将对应的问答信息发送至客户端,也可以将重要度最高的事件核心要素的问答信息发送至客户端,以便客户端根据问答信息进行反馈。示例的,子事件为“酒驾”的事件核心要素可以是“酒精浓度、是否无证、是否引起事故、车速”,按照事件可惜你要素的重要度排序可以是酒精浓度>是否无证>是否引起事故>车速,则可以将“酒精浓度”对应的问答信息“酒精浓度是多少”发送给客户端,也可以依次发送“酒精浓度、是否无证、是否引起事故、车速”对应的问答信息“酒精浓度是多少”、“是否无证驾驶”、“是否引起其他事故”、“车速是多少”分布发送给客户端。在该实施例中,可选的,当事件核心要素为多个要素时,根据事件核心要素中重要度最高的事件核心要素发送问答信息。
S3:根据客户端对于问答信息的反馈信息,不断优化事件路径。
进一步的,根据客户端的反馈信息,不断优化事件路径,包括:根据客户端的反馈信息,对事件路径进行剪枝优化。
客户端的反馈信息为上述步骤S2中问答信息的回答,后台根据酒驾的标准对反馈信息进行判定,并根据判定结果对事件路径进行剪枝优化。示例的,在“酒后驾驶”的事件中,当前事件路径为“饮酒驾驶”、“醉酒驾驶”,当接收到客户端对于“酒精浓度是多少”的反馈信息为“每100毫升血液酒精含量46毫克”时,根据国家规定“驾驶人员每100毫升血液酒精含量大于或等于20毫克,小于80毫克为饮酒驾驶;每100毫升血液酒精含量大于或等于80毫克为醉酒驾驶”,可以判定当前用户为饮酒驾驶,则对“醉酒驾驶”的事件路径进行剪枝,优化后的事件路径为“饮酒驾驶”。
需要说明的是,若反馈信息中出现了新的事件,则根据上述步骤S1、S2更新事件路径。示例的,若待处理事件链为“酒后驾驶”,反馈信息为“每100毫升血液酒精含量46毫克,而且撞到人”,则更新事件为“酒后驾驶,撞人”,事件路径更新为“饮酒驾驶”、“肇事逃逸”、“肇事未逃逸”。
S4:根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图。
事件路径中可以包括多个子事件路径,根据上述步骤S3中的反馈信息不断优化子事件路径,可以得到唯一事件路径,根据唯一事件路径确定待处理事件链对应的法律意图。示例的,“酒驾”事件中,事件路径为“饮酒驾驶”、“醉酒驾驶”、“无证驾驶”、“有证驾驶”、“产生其他事故”、“未产生其他事故”、“超速驾驶”、“未超速驾驶”,上述步骤S3中的反馈信息为“每100毫升血液酒精含量46毫克”、“未随身携带行驶本”、“未产生其他事故”、“在限速60路段行驶时速80公里每小时”,则事件路径根据步骤S3的方法进一步优化为“饮酒驾驶、无证驾驶、未产生其他事故、超速驾驶”,并根据事件路径输出对应的法律意图。法律意图可以是法律条款,也可以是相关案例,具体可以由系统预设或客户自行设定。
进一步的,在根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序之前,方法还包括:获取客户端发送的咨询信息;对咨询信息中的自然语言文本进行识别和抽取,确定待处理事件链。
用户通过客户端发送咨询信息,咨询信息可以是对当前状况的描述(例如“我喝酒后开车,发生交通事故,撞伤一个人后逃逸”),也可以是对当前状况的法律咨询(例如,“我喝酒后开车,会受到什么处罚?”)。当接收到客户端发送的咨询信息后,对咨询信息中的自然语言文本进行语义处理,具体为对自然语义文本进行识别和抽取,包括自然语言文本所表达的用户意图、事件、事件状态、事件关系及语义角色等,确定待处理事件链。示例的,接收到客户端发送的咨询信息为“我喝酒后开车,发生交通事故,撞伤一个人后逃逸,会受到什么处罚?”,对咨询信息中的自然语言文本进行识别和抽取后得到事件“酒后开车→酒驾,撞伤一个人→交通事故,逃逸→肇事逃逸”,对上述事件进行进一步处理可以得到包含事件间关系的事件关系“酒驾→(导致)→交通事故,交通事故→(随后)→肇事逃逸”,并可以得到参与上述事件的角色“我(人→侵权人→肇事者),我(人→违法人→逃逸者)”,进而根据事件、事件关系、角色确定事件链,得到法律意图。示例的,在道路交通领域建立的知识体系下得到的事件链样例示意如表1所示:
表1:在道路交通领域建立的知识体系下得到的事件链样例
示例的,根据本申请另一可选的实施例,如图2所示,包括:
(1)事件链结构抽取。基于法律领域的事件链结构对自然语言文本进行识别和抽取,包括自然语言文本所表达的用户意图,事件,事件状态,事件关系及语义角色等,目的在于充分发现和挖掘自然语言表达中包含的信息。事件链的抽取主要依赖自底层向上的多层任务模型完成,首先对法律领域内的数据进行综合标注,标注信息包含但不限于事件、意图、实体、角色、关系标注,其次在综合标注语料集上进行以事件为中心的要素语料增广,主要依赖领域内的结构化数据知识,比如法律领域法律法规、案例等等,然后设计多任务联合学习模型学习自然语言表述中包含的事件信息、角色信息、事件关系信息等等,最后通过事件关系、事件要素之间的相似性和相关性关系组成事件链结构。
(2)事件链映射。根据法律领域内的专家知识体系,形成法律领域内知识图谱,其主要结构是以事件为中心,以事件间的关系及事件的要素作为连接事件的边,同时结合上一步抽取识别的事件链结构,进行加权的事件链匹配过程,主要以包含子事件、子事件之间的关系及状态,子事件的要素等信息作为匹配打分的要素,比如“我喝酒后开车,发生交通事故后逃逸,应该负什么责任”,识别事件链上的子事件是“喝酒-(后)-开车-(导致)-交通肇事-(后)-逃逸”,在于法律领域的专家知识体系进行匹配时,首先需要发现一条尽可能相似于事件链结构的知识图谱路径,然后基于几条相似的路径进一步考虑子事件的状态(前、中、后)以及子事件的要素(时间、地点、人物)等,进行进一步的打分对比,得到相似度最高的一条知识路径即为事件链对应的路径,作为备选。
(3)重要要素判断。根据专家知识体系和法律领域内的知识数据集,比如法律领域的法律法规、法律案例等结构化数据,挖掘对于某一单一事件的核心要素,以事件为中心的结构其要素的维度是非常丰富的,比如时间、地点、人物、关系、原因等等,但是在法律领域下,描述具体的子事件所需的要素是有限的,而不是全部,本模块主要就是在法律领域的相关知识体系下,通过抽取结构化数据,发现领域内对于子事件的描述哪些要素是必不可少的,比如“酒驾”事件,“血液中酒精浓度”是一个必不可少的要素,而“驾驶员性别”对于认定酒驾这个事件来说就是没有意义的,不属于核心要素。重要要素的判断主要是一种基于概率图模型的打分方法,其主要计算方法是去掉一个要素后评估该事件在领域内(比如法律事件)的完整性,比如酒驾事件,去掉“酒精含量”后,发现在法律领域内“酒驾”事件不完整了,说明“酒精含量”这一要素是重要要素。
(4)重要要素排序。根据专家知识体系和法律领域内的知识数据集,比如法律领域的法律法规、法律案例等结构化数据,挖掘对于某一单一事件的核心要素,而不同的要素对于事件的认定所起的作用是不同的,比如“酒驾”事件中,“酒精浓度”这个要素显然是最重要的,而其他要素则应该没有这么重要,对于要素重要度进行排序,一方面可以更快速的定位和定义事件的重要信息,另一方面是而为了在多轮问答中有序的、有逻辑理解能力,从而产生更智能化的问答体验。
(5)有序的多轮问答。基于上述步骤(1)的事件链结构和步骤(2)映射得到的具体事件链结构,以及步骤(3)对应子事件的要素判断、步骤(4)要素追问顺序判断,沿着每一个子事件节点,调用(3)和(4)的模块,判断当前子事件节点的重要要素,以及各要素的重要度,进行有序的问答,然后沿着事件链进行逐步的多轮追问,构建沿着该事件链结构的多轮问答系统,完成多轮对话。多轮问答系统主要是沿着自然语言描述抽取得到的事件链顺序进行逐个节点的追问,从而得到每个子事件的相对完整信息,而具体某个子事件内的追问顺序取决于子事件内部各要素的重要度排序,多轮问答追问轮次的设定可以影响到每个子事件内部要素的追问程度,比如要求短轮次结束,则每个子事件只追问最关键的一两个要素,而如果要求精准、完全的获取用户信息,则追问每个子事件的所有重要要素,从而构建了一个有序的问答逻辑,以及可控的问答顺序和轮次。
作为本发明的进一步方案,在步骤(1)和步骤(2)的构建中,在道路交通领域建立的知识体系下得到的事件链样例同理表1。
作为本发明的进一步方案,根据上述事件链结构,从第一个子事件开始,按照步骤(3)的模块功能,识别每个子事件的重要要素和非重要要素,比如“酒后开车”事件,重要要素包括“酒精浓度”,“车速”,“是否无证驾驶”,“是否引起交通事故”,而非重要要素包括“性别”,“年龄”。
作为本发明的进一步方案,根据上述事件链结构,从第一个子事件开始,按照步骤(4)的模块功能,识别每个子事件的要素重要度排序,比如“酒后开车”事件,重要要素包括“酒精浓度”,“车速”,“是否无证驾驶”,“是否引起交通事故”,其排序可能是“酒精浓度>是否无证>是否引起事故>车速”
根据上述的步骤,达到清晰解析和识别文本中的信息结构,相关法律事件的状态、属性,以及事件变化关系和信息,得到完整的法律事件链,同时,对每一个子事件的要素进行重要度排序和对不重要要素进行剪枝,实现有序的多轮追问结构。
从以上的描述中,可以看出,本申请实现了如下技术效果:
本申请通过充分抽取识别自然语言描述中包含的信息,组成以事件为中心的是事件链,然后基于事件链构建对用户信息的结构化理解,以及在基于事件链进行剪枝工作和多轮对话追问,从而实现具有推理能力和逻辑判断能力的多轮对话,并且在法律领域内以最短路径发现所有必要信息,形成完整对话。
从构建思想上来说,本申请相对于相关技术更偏重于以知识输出而非数据输出,比如问题树的结构,本申请提炼了其根本结构事件链的结构,而每个事件链的节点以事件为中心,每个事件的属性是全局共享的,大大降低了构建成本。其次,多轮问答是否是灵活可变的,相关技术中的两种构建方法相对来说是固定死的,前后流程是不可变的,必须以识别入口,触发,走完流程;而本申请是通过抽取事件链后匹配到其根本结构上,然后依据事件链进行多轮问答,没有固定的流程和模式,是灵活可变的。再次,多轮问答进行的方法是否可控,相关技术中的两种方法相对是依靠固定的知识体系进行的;而本申请的过程是计算所得,可控且可调节。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述基于事件链的多轮问答的装置30,如图3所示,该基于事件链的多轮问答装置30包括:
信息确定模块301,用于根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,待处理事件链为用户获取法律意图的咨询信息;
信息发送模块302,用于根据重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据问答信息进行反馈;
路径优化模块303,用于根据客户端对于问答信息的反馈信息,不断优化事件路径;
结果输出模块304,用于根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图。
进一步的,信息确定模块301包括:
路径确定单元,用于根据法律知识图谱,确定待处理事件链对应的事件路径,其中,法律知识图谱为以事件为中心,以事件间的关系及事件的要素作为连接事件的边的结构化的法律知识数据。
进一步的,路径确定单元包括:
用于确定待处理事件链对应的子事件;根据法律知识图谱对子事件中的事件信息进行匹配;根据匹配结果,确定待处理事件链对应的事件路径。
进一步的,路径确定单元还包括:
根据法律知识图谱对子事件中的事件要素信息进行匹配;根据法律知识图谱对子事件中的事件关联信息进行匹配;根据法律知识图谱对子事件中的事件状态信息进行匹配。
进一步的,信息确定模块301包括:
核心要素确定单元,用于根据法律知识数据,确定待处理事件链中事件核心要素;
重要度确定单元,用于根据核心要素,确定核心要素对应的重要度;
重要度排序单元,用于对核心要素对应的重要度进行排序,确定待处理事件链中事件核心要素对应的重要度排序。
进一步的,路径优化模块303包括:
剪枝优化单元,用于根据客户端的反馈信息,对事件路径进行剪枝优化。
进一步的,基于事件链的多轮问答装置还包括:
信息获取模块,用于获取客户端发送的咨询信息;
信息处理模块,用于对咨询信息中的自然语言文本进行识别和抽取,确定待处理事件链。
具体的,本实施例中各模块的实现可以参考方法实施例中的相关实现,不再赘述。
从以上的描述中,可以看出,本申请实现了如下技术效果:
本申请通过充分抽取识别自然语言描述中包含的信息,组成以事件为中心的是事件链,然后基于事件链构建对用户信息的结构化理解,以及在基于事件链进行剪枝工作和多轮对话追问,从而实现具有推理能力和逻辑判断能力的多轮对话,并且在法律领域内以最短路径发现所有必要信息,形成完整对话。
从构建思想上来说,本申请相对于相关技术更偏重于以知识输出而非数据输出,比如问题树的结构,本申请提炼了其根本结构事件链的结构,而每个事件链的节点以事件为中心,每个事件的属性是全局共享的,大大降低了构建成本。其次,多轮问答是否是灵活可变的,相关技术中的两种构建方法相对来说是固定死的,前后流程是不可变的,必须以识别入口,触发,走完流程;而本申请是通过抽取事件链后匹配到其根本结构上,然后依据事件链进行多轮问答,没有固定的流程和模式,是灵活可变的。再次,多轮问答进行的方法是否可控,相关技术中的两种方法相对是依靠固定的知识体系进行的;而本申请的过程是计算所得,可控且可调节。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现基于事件链的多轮问答方法的步骤。例如包括:根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,待处理事件链为用户获取法律意图的咨询信息;根据重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据问答信息进行反馈;根据客户端对于问答信息的反馈信息,不断优化事件路径;根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图。
图4为本发明实施例提供的电子设备框图,如图4所示,该设备包括:处理器401、存储器402和总线403;
其中,处理器401及存储器402分别通过总线403完成相互间的通信;处理器401用于调用存储器402中的程序指令,以执行上述实施例所提供的基于事件链的多轮问答方法,例如包括:根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,待处理事件链为用户获取法律意图的咨询信息;根据重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据问答信息进行反馈;根据客户端对于问答信息的反馈信息,不断优化事件路径;根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (6)
1.一种基于事件链的多轮问答方法,其特征在于,包括:
根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,所述待处理事件链为用户获取法律意图的咨询信息;
根据所述重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据所述问答信息进行反馈;
根据客户端对于所述问答信息的反馈信息,不断优化所述事件路径;
根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图;
所述根据法律知识数据,确定待处理事件链对应的事件路径,包括:
根据法律知识图谱,确定待处理事件链对应的事件路径,其中,法律知识图谱为以事件为中心,以事件间的关系及事件的要素作为连接事件的边的结构化的法律知识数据;
所述根据法律知识图谱,确定待处理事件链对应的事件路径,包括:
确定待处理事件链对应的子事件;
根据法律知识图谱对所述子事件中的事件信息进行匹配;
根据匹配结果,确定待处理事件链对应的事件路径;
所述根据法律知识图谱对所述子事件中的事件信息进行匹配,包括以下任意一种或多种的组合:
根据法律知识图谱对所述子事件中的事件要素信息进行匹配;
根据法律知识图谱对所述子事件中的事件关联信息进行匹配;
根据法律知识图谱对所述子事件中的事件状态信息进行匹配;
所述根据法律知识数据,确定待处理事件链中事件核心要素对应的重要度排序,所述方法还包括:
根据法律知识数据,确定待处理事件链中事件核心要素;
根据所述核心要素,确定所述核心要素对应的重要度;
对所述核心要素对应的重要度进行排序,确定待处理事件链中事件核心要素对应的重要度排序。
2.根据权利要求1所述的基于事件链的多轮问答方法,其特征在于,所述根据客户端的反馈信息,不断优化所述事件路径,包括:
根据客户端的反馈信息,对所述事件路径进行剪枝优化。
3.根据权利要求1所述的基于事件链的多轮问答方法,其特征在于,在所述根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序之前,所述方法还包括:
获取客户端发送的咨询信息;
对所述咨询信息中的自然语言文本进行识别和抽取,确定待处理事件链。
4.一种基于事件链的多轮问答装置,其特征在于,包括:
信息确定模块,用于根据法律知识数据,确定待处理事件链对应的事件路径和待处理事件链中事件核心要素对应的重要度排序,其中,所述待处理事件链为用户获取法律意图的咨询信息;
信息发送模块,用于根据所述重要度排序,分步发送事件路径中事件对应的问答信息至客户端,以便客户端根据所述问答信息进行反馈;
路径优化模块,用于根据客户端对于所述问答信息的反馈信息,不断优化所述事件路径;
结果输出模块,用于根据优化后的事件路径调整对应的问答信息至客户端,直至根据客户端的反馈信息确定待处理事件链对应的法律意图;
所述根据法律知识数据,确定待处理事件链对应的事件路径,包括:
根据法律知识图谱,确定待处理事件链对应的事件路径,其中,法律知识图谱为以事件为中心,以事件间的关系及事件的要素作为连接事件的边的结构化的法律知识数据;
所述根据法律知识图谱,确定待处理事件链对应的事件路径,包括:
确定待处理事件链对应的子事件;
根据法律知识图谱对所述子事件中的事件信息进行匹配;
根据匹配结果,确定待处理事件链对应的事件路径;
所述根据法律知识图谱对所述子事件中的事件信息进行匹配,包括以下任意一种或多种的组合:
根据法律知识图谱对所述子事件中的事件要素信息进行匹配;
根据法律知识图谱对所述子事件中的事件关联信息进行匹配;
根据法律知识图谱对所述子事件中的事件状态信息进行匹配;
所述根据法律知识数据,确定待处理事件链中事件核心要素对应的重要度排序,还包括:
根据法律知识数据,确定待处理事件链中事件核心要素;
根据所述核心要素,确定所述核心要素对应的重要度;
对所述核心要素对应的重要度进行排序,确定待处理事件链中事件核心要素对应的重要度排序。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-3中任一项所述的基于事件链的多轮问答方法。
6.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-3中任一项所述的基于事件链的多轮问答方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011416294.8A CN112463941B (zh) | 2020-12-04 | 2020-12-04 | 基于事件链的多轮问答方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011416294.8A CN112463941B (zh) | 2020-12-04 | 2020-12-04 | 基于事件链的多轮问答方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112463941A CN112463941A (zh) | 2021-03-09 |
CN112463941B true CN112463941B (zh) | 2024-05-17 |
Family
ID=74800814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011416294.8A Active CN112463941B (zh) | 2020-12-04 | 2020-12-04 | 基于事件链的多轮问答方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463941B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977237A (zh) * | 2019-05-27 | 2019-07-05 | 南京擎盾信息科技有限公司 | 一种面向法律领域的动态法律事件图谱构建方法 |
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN111797199A (zh) * | 2020-06-12 | 2020-10-20 | 南京擎盾信息科技有限公司 | 基于事件链结构对法律信息进行分析的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10095736B2 (en) * | 2014-11-03 | 2018-10-09 | International Business Machines Corporation | Using synthetic events to identify complex relation lookups |
-
2020
- 2020-12-04 CN CN202011416294.8A patent/CN112463941B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977237A (zh) * | 2019-05-27 | 2019-07-05 | 南京擎盾信息科技有限公司 | 一种面向法律领域的动态法律事件图谱构建方法 |
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN111797199A (zh) * | 2020-06-12 | 2020-10-20 | 南京擎盾信息科技有限公司 | 基于事件链结构对法律信息进行分析的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112463941A (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765257B (zh) | 一种知识图谱驱动型的法律智能咨询系统 | |
CN106649768B (zh) | 基于深度问答的问答澄清方法和装置 | |
CN106156365B (zh) | 一种知识图谱的生成方法及装置 | |
CN109241258A (zh) | 一种应用税务领域的深度学习智能问答系统 | |
CN105912692B (zh) | 一种智能语音对话的方法和装置 | |
CN105068661A (zh) | 基于人工智能的人机交互方法和系统 | |
CN106777232A (zh) | 问答抽取方法、装置及终端 | |
CN103389988A (zh) | 一种引导用户进行信息搜索的方法及装置 | |
CN113724882B (zh) | 基于问诊会话构建用户画像的方法、装置、设备和介质 | |
CN111241260A (zh) | 基于人机交互的数据处理方法、装置、设备及存储介质 | |
CN112507139B (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN108763355B (zh) | 一种基于用户的智能机器人交互数据处理系统及方法 | |
CN113569023A (zh) | 一种基于知识图谱的中文医药问答系统及方法 | |
CN116561538A (zh) | 问答评分方法、问答评分装置、电子设备及存储介质 | |
CN112163097A (zh) | 一种军事知识图谱构建方法及系统 | |
CN105630890A (zh) | 基于智能问答系统会话历史的新词发现方法及系统 | |
CN111522966A (zh) | 基于知识图谱的数据处理方法、装置、电子设备及介质 | |
KR102117287B1 (ko) | 대화 시스템을 위한 대화 시나리오 데이터베이스 구축 방법 및 장치 | |
CN114328951A (zh) | 一种融合信息获取和三元组抽取的知识图谱构建方法 | |
CN113987151A (zh) | 智能客服回复方法及装置 | |
CN112463941B (zh) | 基于事件链的多轮问答方法及装置 | |
CN116956068A (zh) | 基于规则引擎的意图识别方法、装置、电子设备及介质 | |
CN113157887A (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN110750632B (zh) | 一种改进的中文alice智能问答方法及系统 | |
CN112966076A (zh) | 智能问答问题的生成方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |