CN111949787B - 基于知识图谱的自动问答方法、装置、设备及存储介质 - Google Patents
基于知识图谱的自动问答方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111949787B CN111949787B CN202010850195.4A CN202010850195A CN111949787B CN 111949787 B CN111949787 B CN 111949787B CN 202010850195 A CN202010850195 A CN 202010850195A CN 111949787 B CN111949787 B CN 111949787B
- Authority
- CN
- China
- Prior art keywords
- map
- question
- intention
- slot
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000011049 filling Methods 0.000 claims abstract description 59
- 238000012216 screening Methods 0.000 claims abstract description 19
- 238000011068 loading method Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 43
- 238000001228 spectrum Methods 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013527 convolutional neural network Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- YREOLPGEVLLKMB-UHFFFAOYSA-N 3-methylpyridin-1-ium-2-amine bromide hydrate Chemical compound O.[Br-].Cc1ccc[nH+]c1N YREOLPGEVLLKMB-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于知识图谱的自动问答方法、装置、设备及存储介质,涉及人工智能技术领域,方法包括:对用户输入的问句进行意图识别,确定意图及其类别;根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;生成图谱查询语句;使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对图谱候选路径进行评分,筛选出最终图谱路径;获取最终图谱路径中各图谱节点的内容数据,自动生成回复内容。本发明不需要组织大量人力编制问答对数据;通过对图谱候选路径进行筛选,适应各种表达句式,具有更好的泛化性,提高了准确率。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及基于知识图谱的自动问答方法、装置、设备及存储介质。
背景技术
自动问答系统是人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向,它综合运用了知识表示、信息检索、自然语言处理等技术。自动问答系统能够使用户以自然语言提问而非关键词组合的形式,提出信息查询需求,系统对用户问句进行识别、解析,从各种数据资源中自动找出准确的答案。
从功能上说,自动问答系统分为开放型自动问答系统和任务型自动问答系统。开放型自动问答系统是指不限定问题领域,用户随意提问,系统从海量数据中寻找答案;任务型自动问答系统是指系统事先声明,只能回答某一个领域的问题,其他领域问题无法回答。
目前市面上的任务型自动问答系统大多是采用问答对检索式的方式来提供服务,即用户提出一个问题,系统通过计算相似度的方式在知识库中匹配出最相关的问题,并将预先制定好的通用性答案返回。这种方式虽然可以解决部分简单的问题,但每个用户遇到的问题可能由于细微要素的差异指向不同的结果,无法给予用户针对性的答复,且用户问句与数据库问句进行相似度计算的方法忽视了知识的关联性,当同类型问题多次被提及时,会导致回答准确率较低的问题。
发明内容
本发明实施例提供了基于知识图谱的自动问答方法、装置、设备及存储介质,旨在解决现有任务型自动问答方法准确率低的问题。
第一方面,本发明实施例提供了一种基于知识图谱的自动问答方法,包括:
先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容。
第二方面,本发明实施例提供了一种基于知识图谱的自动问答装置,包括:
意图识别单元,用于先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
槽位填充单元,用于根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
图谱查询语句生成单元,用于根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
图谱路径筛选单元,用于使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
回复单元,用于获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于知识图谱的自动问答方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如第一方面所述的基于知识图谱的自动问答方法。
本发明实施例提供了基于知识图谱的自动问答方法、装置、设备及存储介质,方法包括:先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容。本发明实施例不需要组织大量人力编制问答对数据;通过对图谱候选路径进行筛选,适应各种表达句式,具有更好的泛化性,提高了准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于知识图谱的自动问答方法的流程示意图;
图2为本发明实施例提供的一种基于知识图谱的自动问答方法的子流程示意图;
图3为本发明实施例提供的一种基于知识图谱的自动问答方法的另一子流程示意图;
图4为本发明实施例提供的一种基于知识图谱的自动问答方法的另一子流程示意图;
图5为本发明实施例提供的一种基于知识图谱的自动问答方法的另一子流程示意图;
图6为本发明实施例提供的一种基于知识图谱的自动问答装置的示意性框图;
图7为本发明实施例提供的一种基于知识图谱的自动问答装置的子单元示意性框图;
图8为本发明实施例提供的一种基于知识图谱的自动问答装置的另一子单元示意性框图;
图9为本发明实施例提供的一种基于知识图谱的自动问答装置的另一子单元示意性框图;
图10为本发明实施例提供的一种基于知识图谱的自动问答装置的另一子单元示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本发明实施例提供的一种基于知识图谱的自动问答方法的流程示意图,该方法包括步骤S101~S105:
S101、先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
用户输入问句(通过文字输入或语音输入)后,首先需要明确用户意图。用户意图需要通过意图识别来获取。意图识别的结果决定了用户问句所涉及的封闭领域(即子图)。例如“信用卡被盗刷怎么办?”和“我被狗咬了怎么办?”这两种问句,其意图明显是不同的。因此,自动问答的第一步,首先是要明确用户想问什么(意图),问的什么范围(意图类别),以此来缩小答案查询范围。
本发明实施例采用规则+模型的方式来进行意图识别。即先利用预设规则来对用户输入的问句进行匹配,若匹配通过,则可以直接通过预设规则进行意图识别,从而得到用户意图和意图类别。
在一实施例中,如图2所示,所述先利用预设规则对用户输入的问句进行匹配,包括步骤S201~S202:
S201、预先收集不同的问句,并提前设置其意图及分类,形成包含多条预设规则的意图知识库,每一预设规则包含一个或多个问句以及对应的意图及分类;
S202、当接收到用户的问句后,将该问句与意图知识库内的预设规则进行匹配,若该问句与预设规则内的问句的相似度大于预设阈值,则判定为匹配,否则判定为不匹配。
所述预设规则是指针对不同的问句提供对应的意图及分类,也就是预先收集不同的问句,并提前设置好其意图及分类,这样可以形成一个意图知识库,该意图知识库内包含多个预设规则,每一预设规则包含了一个或多个问句以及对应的意图及分类,当接收到用户的问句后,将该问句与知识库内的预设规则进行匹配,如果该问句正好与预设规则内的问句相同或相似,那么可直接获取其对应的意图及分类。预设规则相当于起到一个过滤的作用,对于与预设规则匹配的问句无需进行模型识别,即可直接得到意图及其类别;而对于与预设规则不匹配的问句则再输入模型进行意图识别。
本发明实施例采用预设规则的方式是为了处理一些常见的提问方式以及部分训练数据缺乏的问题类型,并且在后续的维护过程中可以及时修复Badcase(坏案例),缓解了单模型误差难以解释和修复的问题。
在一实施例中,如图3所示,所述采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别,包括步骤S301~S303:
S301、将用户的问句输入至CNN模型中的输入层;
S302、利用所述CNN模型中的多个卷积层和池化层分别对输入的内容进行3×3卷积核的卷积和2×2的最大池化;
S303、通过所述CNN模型中的全连接层输出特征向量,并依据所述特征向量确定意图及其类别然后通过输出层输出。
本发明实施例中的意图识别模型可采用CNN模型(卷积神经网络模型),使用CNN模型来进行文本处理的最大优势是网络结构简单,在网络结构简单的情况下,通过引入已经训练好的词向量可以达到较好的识别效果,在多项数据集上超越Benchmark(基准测试模型)。另外,网络结构简单使得参数数量少,计算量少,训练速度快,可以达到快速收敛的效果。
具体地,首先将用户的问句输入到CNN模型中的输入层,然后由CNN模型中的隐藏层对其进行处理,具体是利用其中的卷积层和池化层进行卷积核池化,在实际应用中,可能会有多个卷积层和多个池化层,以提高识别准确率。然后利用全连接层输出特征向量,从而根据所述特征向量确定意图和类别。
其中,在上述的识别过程中,所应有的模型公式如下:ci=f(w·xi:i+h-1+b)
式中,w为卷积核权重,x为词向量,b为偏置项,h为卷积核的高,c为用户问句所属的意图类别。卷积核的宽度和词向量矩阵的宽度相同,该宽度即为词向量大小,且卷积核只会在高度方向移动。因此,每次卷积核滑动过的位置都是完整的单词,而不会将几个单词的一部分进行卷积,词向量矩阵的每一行表示一个单词,这就保证了词汇作为语言中最小粒度的合理性。由于卷积核和词向量矩阵的宽度一致,一个卷积核对应一个句子,卷积后得到的结果也是一个向量,那么在经过max-pooling(池化)操作后得到的就是一个数值。本发明实施例可使用多个高度不同的卷积核,这样不同的卷积核可以获取不同范围内词汇的关系,获得的是纵向的差异信息,即类似于N-Gram(一种统计语言模型),也就是在一个句子中不同范围的词出现会带来什么信息。本发明实施例由于处理的用户问句,通常情况下为一到两句话,所以可设置高度为2、3、4的三种大小的卷积核,最终得到的c就是用户问句所属的意图类别。
S102、根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
本步骤是根据确定的意图类别选择对应的槽位,然后进行槽位的填充。槽位即为用于装载问句中语义成分的载体,而槽填充即为从问句中提取语义成分填充至槽位中,槽填充的过程可看作为序列标注过程。
在一实施例中,如图4所示,所述步骤S102包括步骤S401~S403:
S401、根据确定的意图类别选择对应的槽位,并将所述槽位拆分为普通槽位和目标槽位;
在获取到用户的意图类别后,就可以选择与所述意图类别对应的槽位。对于槽位来说,其分为目标槽位和普通槽位。目标槽位就是指必须填充的槽位,普通槽位就是可选填充的槽位。但对于普通槽位来说,一般需要至少选择其中一个或几个进行填充。例如用户的意图类别为法律咨询,则选择{“案件类型”,“案由”,“诉讼请求”,“诉称事实”,“查询目标”}等槽位,其中“案件类型”和“案由”是目标槽位,其他三个槽位为普通槽位,但至少填充一个。
S402、对槽位中的普通槽位,先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则对普通槽位进行填充,若匹配不通过则采用CNN模型并引入已训练的词向量,对用户输入的问句进行文本识别,并将识别的内容填充至所述普通槽位中;
对于普通槽位的填充,例如前述的“案件类型”、“案由”、“诉讼请求”、“诉称事实”等槽位的填充可以看作是一个文本分类任务,因此本发明实施例采用与步骤S101相同的规则+模型的方式对这些槽位进行处理,且模型结构与上述步骤一中的CNN模型一致。
S403、对槽位中的目标槽位,采用Bi-LSTM模型并利用CRF作为Bi-LSTM模型的输出层来识别问句中的关键实体,并将识别出的关键实体填充至所述目标槽位中。
对于目标槽位的填充,指的是获取用户问句中包含的关键实体信息并进行填充。因此需要对用户问句进行关键实体信息的识别。
本发明实施例可以将目标槽位的填充视作序列标注任务,具体可采用Bi-LSTM+CRF的模型来进行识别用户问句中的关键实体并进行填充。具体地,通过Bi-LSTM(双向长短时记忆网络)来学习上下文信息,但由于softmax层的输出是相互独立的,即虽然Bi-LSTM学习到了上下文的信息,但是输出相互之间并没有影响,其只是在每一步挑选一个最大概率值的label(标签)输出。而CRF(条件随机场)中有转移特征,即它会考虑label输出之间的顺序性,所以本发明实施例使用CRF来作为Bi-LSTM的输出层。
传统的序列标注模型都是以BIEO为标记来区分实体类型(一个实体类型有3种标签,两种实体类型就有6种标签,以此类推),B代表词汇的开始,I代表词汇的中间字(三字词、四字词的情况),E为词汇的结尾,O为独立单字词,标记结束后将标记为B,I,E的字进行合并则得出所需实体词汇。
由于标记种类越多,对结果准确率的影响越大,因此本发明实施例可不区分实体类型,并且去掉E标签,将序列标注的结果类型减少至3种,减少了标注结果的可能性,在一定程度上提升了最终结果的准确性。
Bi-LSTM+CRF的模型计算公式如下:
其中,为第i个位置softmax输出为yi的概率,为从yi到yi+1的转移概率。这个得分函数s较好的补充了传统Bi-LSTM的不足,因为当一个预测序列得分很高时,并不是各个位置都是softmax输出最大概率值对应的label,还要考虑前面转移概率相加最大,即还要符合输出规则(输出序列中,词汇不连续),比如假设Bi-LSTM输出的最有可能序列为BBIBIOOO,那么因为转移概率矩阵中B—>B的概率很小甚至为负,那么根据s得分,这种序列不会得到最高的分数,所以就不是想要的序列。
在一实施例中,所述步骤S102,还包括:
采用余弦相似度计算识别出的关键实体与图谱节点实体的相似度,并根据所述相似度对所述关键实体进行消歧与链接。
具体地,经过上述过程识别得到的关键实体,可能是实体的部分表示或另类表示,因此需要对实体进行消歧与链接。本实施例中,数据源为基于预先制定好的法律知识图谱,采用余弦相似度计算当前识别出的关键实体与图谱节点实体的相似性,判断是否存在共指关系,如“欠钱”、“欠款”,从字符角度来看,两个实体是不同的,但从语义角度来看,它们代表的其实是一种意思,所以需要进行链接。
余弦相似度用向量空间中两个向量的夹角余弦值来衡量两个文本间的相似度,相比距离度量,余弦相似度更加注重两个向量在方向上的差异,一般情况下采用预训练的Embedding(从离散向量到实数向量的映射)得到两个文本的向量表示后,可以使用余弦相似度计算两个文本之间的相似度。
与传统的Bag-of-Word(词袋模型)相比,经过Embedding处理后每个词不再是只有一个位置为1,其余位置为0的稀疏向量,而是一个稠密的固定维度向量。直观上可减少额外的存储和计算开销。其次,在深层次的语义理解上,经过训练后的词向量能利用上下文信息,能判定考虑文本中的相似词语,因此具有更好的通用性。
由于可能在用户问句中无法识别出所需的信息,所以为了确保对目标槽位以及对其中一个或多个普通槽位进行填充,本发明实施例可在此步骤中增加一个多轮对话的交互过程,当待填充槽位为空或未识别出用户的输入内容时,系统会根据待填充槽位的要求向用户进行交互式提问,如:“请问您想咨询的是哪种类型的案件:民事案件、刑事案件?”,从而实现对待填充槽位的填充。
S103、根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
经过以上处理后,从用户的自然问句中提取出了信息并填充了槽位,就可以依据意图类型选择合适的查询语句模板,使用槽位中的内容来进行填充,生成一个完整的图谱查询语句。也就是将槽位中的信息填充到所述查询语句模板中,得到完整的图谱查询语句。
如诉讼请求:
match(a:node_type)-[:支持]->(b:node_type{name:claim_for})<-[:]-(c:node_type)where c.name=~.*case_cause.*return a
如相关证据:
match(a:node_type)-[:]->(b:node_type{name:alleged_fact})<-[:证明]-(c:node_type)<-[:]-(d:node_type)where a.name=~.*case_cause.*and d.name=~.*case_cause.*return c。
S104、使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
本步骤需要生成图谱候选路径,并从中筛选出最为匹配的图谱路径。
在一实施例中,如图5所示,所述步骤S104,包括步骤S501~S504:
S501、根据生成的图谱查询语句获取其中的图谱节点,并作为单独的实体;
S502、以各个单独的实体为起始节点,叶子节点为终点生成图谱候选路径,并将所有图谱候选路径进行合并,得到图谱候选路径集合;
S503、将各个关键实体与所述图谱候选路径集合中的每一图谱候选路径进行匹配,若匹配则将对应的图谱候选路径评分加1,最终得到每一图谱候选路径的评分;
S504、取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径。
由于图谱节点间的关系是具有方向性的,例如“信用卡被盗刷了,需要准备什么证据?”系统查询时会在图谱中寻找[信用卡]->[盗刷]->[证据]这条路径并返回答案;由于语言具有多种多样的表达方式,当出现倒装句式如“我需要准备什么证据?信用卡被盗刷了”,这时系统会从在图谱中寻找[证据]->[信用卡]->[盗刷]这条路径,这种情况下,显然是无法获取到答案的。
本发明实施例为了解决上述问题,采用了评分的方式对图谱候选路径进行筛选处理。例如“信用卡”、“盗刷”、“证据”这三个实体,首先将各个实体视为独立的个体,查询由其作为起始节点,并到达叶子节点的所有可能路径;假设由“信用卡”为起始节点,叶子节点为终点的图谱候选路径有10条,由“盗刷”为起始节点,叶子节点为终点的图谱候选路径有5条,由“证据”为起始节点,叶子节点为终点的图谱候选路径有3条,将这些图谱候选路径进行合并,得到一个大小为18条的候选路径集合;接下来将对这18条图谱候选路径进行评分,将“信用卡”、“盗刷”、“证据”实体与各图谱候选路径进行匹配,当一图谱候选路径中存在此节点时,评分+1;
公式如下:
式中,score为当前图谱候选路径的评分,e为从用户问句中抽取出的关键实体,path为当前图谱候选路径。
评分计算完毕后,进行排序得出评分最高的图谱候选路径作为最终图谱路径。
在一实施例中,所述取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径,包括:
当出现多条评分相同且最高的路径时,则依据多条路径的区别进行引导式提问,并根据回答结果确定最终图谱路径。
大部分情况下评分最高的图谱候选路径只会存在唯一的路径,当出现多条评分相同且最高的路径时,如:[信用卡]->[盗刷]->[国内]->[证据],[信用卡]->[盗刷]->[国外]->[证据]的评分都为3,则可以进行引导式提问,如“请问您的信用卡是在国内还是国外被盗刷的?”即依据评分相同且最高的路径的不同实体来进行引导式提问,以此来进一步明确最终图谱路径。
S105、获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容。
经过以上步骤的处理,已经获取到了最终图谱路径,最终图谱路径具有不同的图谱节点信息,但此时只是一个单纯的节点数据,作为自动问答系统,还需要对结果进行拟人化处理,避免系统机械式回复,影响用户体验。所以,本实施例可将图谱节点的内容数据传递至回复模板,从而对回复模板进行填充生成回复内容。采用回复模板填充的方式,可以分为三种情况:
1、用户问句属于无效提问或不存在相应的图谱节点,则可以按如下模板进行回复:“不好意思,系统暂时无法理解这个问题,您可以尝试换一种问法。”。当然,也可以根据实际场景的不同,选择不同的模板进行回复。
2、经过查询存在相应图谱节点,但部分槽位信息待补充,则可根据槽位特性,选择不同的回复模板,进行填充回复,并进行交互问答以获取相关信息,如用户问:“我的信用卡被盗刷了怎么办?”,系统回复:“请问是在国内盗刷的还是国外盗刷的?”。
此情况会与前述步骤中槽位的填充有相同之处,即利用多轮对话的交互过程补充槽位信息。
3、经过查询存在相应图谱节点且具有相应的内容数据,则可选择预先制定好的回复模板进行回复,如用户问:“信用卡逾期三个月会被起诉吗?”,系统回复:“根据规定…”。
本发明实施例还提供一种基于知识图谱的自动问答装置,该基于知识图谱的自动问答装置用于执行前述基于知识图谱的自动问答方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的基于知识图谱的自动问答装置的示意性框图。该基于知识图谱的自动问答装置600可以配置于服务器中。
该基于知识图谱的自动问答装置600可以包括:
意图识别单元601,用于先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
槽位填充单元602,用于根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
图谱查询语句生成单元603,用于根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
图谱路径筛选单元604,用于使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
回复单元605,用于获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容。
在一实施例中,如图7所示,所述意图识别单元601包括:
规则设置单元701,用于预先收集不同的问句,并提前设置其意图及分类,形成包含多条预设规则的意图知识库,每一预设规则包含一个或多个问句以及对应的意图及分类;
规则匹配单元702,用于当接收到用户的问句后,将该问句与意图知识库内的预设规则进行匹配,若该问句与预设规则内的问句的相似度大于预设阈值,则判定为匹配,否则判定为不匹配。
在一实施例中,如图8所示,所述意图识别单元601包括:
输入单元801,用于将用户的问句输入至CNN模型中的输入层;
卷积池化单元802,用于利用所述CNN模型中的多个卷积层和池化层分别对输入的内容进行3×3卷积核的卷积和2×2的最大池化;
输出单元803,用于通过所述CNN模型中的全连接层输出特征向量,并依据所述特征向量确定意图及其类别然后通过输出层输出。
在一实施例中,如图9所示,所述槽位填充单元602包括:
槽位拆分单元901,用于根据确定的意图类别选择对应的槽位,并将所述槽位拆分为普通槽位和目标槽位;
普通槽位填充单元902,用于对槽位中的普通槽位,先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则对普通槽位进行填充,若匹配不通过则采用CNN模型并引入已训练的词向量,对用户输入的问句进行文本识别,并将识别的内容填充至所述普通槽位中;
目标槽位填充单元903,用于对槽位中的目标槽位,采用Bi-LSTM模型并利用CRF作为Bi-LSTM模型的输出层来识别问句中的关键实体,并将识别出的关键实体填充至所述目标槽位中。
在一实施例中,所述槽位填充单元602还包括:
相似度比较单元,用于采用余弦相似度计算识别出的关键实体与图谱节点实体的相似度,并根据所述相似度对所述关键实体进行消歧与链接。
在一实施例中,如图10所示,所述图谱路径筛选单元604包括:
图谱节点获取单元1001,用于根据生成的图谱查询语句获取其中的图谱节点,并作为单独的实体;
图谱路径合并单元1002,用于以各个单独的实体为起始节点,叶子节点为终点生成图谱候选路径,并将所有图谱候选路径进行合并,得到图谱候选路径集合;
评分单元1003,用于将各个关键实体与所述图谱候选路径集合中的每一图谱候选路径进行匹配,若匹配则将对应的图谱候选路径评分加1,最终得到每一图谱候选路径的评分;
筛选单元1004,用于取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径。
在一实施例中,所述筛选单元1004包括:
追问单元,用于当出现多条评分相同且最高的路径时,则依据多条路径的区别进行引导式提问,并根据回答结果确定最终图谱路径。
本发明实施例提供的基于知识图谱的自动问答装置不需要组织大量人力编制问答对数据;通过对图谱候选路径进行筛选,适应各种表达句式,具有更好的泛化性,提高了准确率。
上述基于知识图谱的自动问答装置可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。该计算机设备11是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图11,该计算机设备1100包括通过系统总线1101连接的处理器1102、存储器和网络接口1105,其中,存储器可以包括非易失性存储介质1103和内存储器1104。
该非易失性存储介质1103可存储操作系统11031和计算机程序11032。该计算机程序11032被执行时,可使得处理器1102执行基于知识图谱的自动问答方法。
该处理器1102用于提供计算和控制能力,支撑整个计算机设备1100的运行。
该内存储器1104为非易失性存储介质1103中的计算机程序11032的运行提供环境,该计算机程序11032被处理器1102执行时,可使得处理器1102执行基于知识图谱的自动问答方法。
该网络接口1105用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备1100的限定,具体的计算机设备1100可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器1102用于运行存储在存储器中的计算机程序11032,以实现如下功能:
先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容。
在一实施例中,处理器1102在执行所述先利用预设规则对用户输入的问句进行匹配的步骤时,执行如下操作:
预先收集不同的问句,并提前设置其意图及分类,形成包含多条预设规则的意图知识库,每一预设规则包含一个或多个问句以及对应的意图及分类;
当接收到用户的问句后,将该问句与意图知识库内的预设规则进行匹配,若该问句与预设规则内的问句的相似度大于预设阈值,则判定为匹配,否则判定为不匹配。
在一实施例中,处理器1102在执行所述采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别,执行如下操作:
将用户的问句输入至CNN模型中的输入层;
利用所述CNN模型中的多个卷积层和池化层分别对输入的内容进行3×3卷积核的卷积和2×2的最大池化;
通过所述CNN模型中的全连接层输出特征向量,并依据所述特征向量确定意图及其类别然后通过输出层输出。
在一实施例中,处理器1102在执行所述根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,执行如下操作:
根据确定的意图类别选择对应的槽位,并将所述槽位拆分为普通槽位和目标槽位;
对槽位中的普通槽位,先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则对普通槽位进行填充,若匹配不通过则采用CNN模型并引入已训练的词向量,对用户输入的问句进行文本识别,并将识别的内容填充至所述普通槽位中;
对槽位中的目标槽位,采用Bi-LSTM模型并利用CRF作为Bi-LSTM模型的输出层来识别问句中的关键实体,并将识别出的关键实体填充至所述目标槽位中。
在一实施例中,处理器1102在执行所述根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,还执行如下操作:
采用余弦相似度计算识别出的关键实体与图谱节点实体的相似度,并根据所述相似度对所述关键实体进行消歧与链接。
在一实施例中,处理器1102在执行所述使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径,执行如下操作:
根据生成的图谱查询语句获取其中的图谱节点,并作为单独的实体;
以各个单独的实体为起始节点,叶子节点为终点生成图谱候选路径,并将所有图谱候选路径进行合并,得到图谱候选路径集合;
将各个关键实体与所述图谱候选路径集合中的每一图谱候选路径进行匹配,若匹配则将对应的图谱候选路径评分加1,最终得到每一图谱候选路径的评分;
取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径。
在一实施例中,处理器1102在执行所述取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径,执行如下操作:
当出现多条评分相同且最高的路径时,则依据多条路径的区别进行引导式提问,并根据回答结果确定最终图谱路径。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器1102可以是中央处理单元(CentralProcessing Unit,CPU),该处理器1102还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:
先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种基于知识图谱的自动问答方法,其特征在于,包括:
先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容;
所述根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,包括:
根据确定的意图类别选择对应的槽位,并将所述槽位拆分为普通槽位和目标槽位;
对槽位中的普通槽位,先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则对普通槽位进行填充,若匹配不通过则采用CNN模型并引入已训练的词向量,对用户输入的问句进行文本识别,并将识别的内容填充至所述普通槽位中;
对槽位中的目标槽位,采用Bi-LSTM模型并利用CRF作为Bi-LSTM模型的输出层来识别问句中的关键实体,并将识别出的关键实体填充至所述目标槽位中;
所述使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径,包括:
根据生成的图谱查询语句获取其中的图谱节点,并作为单独的实体;
以各个单独的实体为起始节点,叶子节点为终点生成图谱候选路径,并将所有图谱候选路径进行合并,得到图谱候选路径集合;
将各个关键实体与所述图谱候选路径集合中的每一图谱候选路径进行匹配,若匹配则将对应的图谱候选路径评分加1,最终得到每一图谱候选路径的评分;
取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径。
2.根据权利要求1所述的基于知识图谱的自动问答方法,其特征在于,所述先利用预设规则对用户输入的问句进行匹配,包括:
预先收集不同的问句,并提前设置其意图及分类,形成包含多条预设规则的意图知识库,每一预设规则包含一个或多个问句以及对应的意图及分类;
当接收到用户的问句后,将该问句与意图知识库内的预设规则进行匹配,若该问句与预设规则内的问句的相似度大于预设阈值,则判定为匹配,否则判定为不匹配。
3.根据权利要求1所述的基于知识图谱的自动问答方法,其特征在于,所述采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别,包括:
将用户的问句输入至CNN模型中的输入层;
利用所述CNN模型中的多个卷积层和池化层分别对输入的内容进行3×3卷积核的卷积和2×2的最大池化;
通过所述CNN模型中的全连接层输出特征向量,并依据所述特征向量确定意图及其类别然后通过输出层输出。
4.根据权利要求1所述的基于知识图谱的自动问答方法,其特征在于,所述根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,还包括:
采用余弦相似度计算识别出的关键实体与图谱节点实体的相似度,并根据所述相似度对所述关键实体进行消歧与链接。
5.根据权利要求1所述的基于知识图谱的自动问答方法,其特征在于,所述取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径,包括:
当出现多条评分相同且最高的路径时,则依据多条路径的区别进行引导式提问,并根据回答结果确定最终图谱路径。
6.一种基于知识图谱的自动问答装置,其特征在于,包括:
意图识别单元,用于先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则进行意图识别确定意图及其类别,若匹配不通过则采用意图识别模型并引入已训练的词向量,对用户输入的问句进行意图识别,确定意图及其类别;
槽位填充单元,用于根据确定的意图类别选择对应的槽位,并根据所述意图进行关键实体的抽取、消歧与链接,以及根据抽取的关键实体进行槽位的填充,其中,所述槽位为装载问句中语义成分的载体;
图谱查询语句生成单元,用于根据确定的意图类别选择对应的查询语句模板,使用所述槽位中的内容填充所述查询语句模板,生成图谱查询语句;
图谱路径筛选单元,用于使用生成的图谱查询语句查询图谱节点并生成图谱候选路径,对生成的图谱候选路径进行评分,并根据评分结果筛选出最终图谱路径;
回复单元,用于获取最终图谱路径中各图谱节点的内容数据,并传递至回复模板,自动生成回复内容;
所述槽位填充单元包括:
槽位拆分单元,用于根据确定的意图类别选择对应的槽位,并将所述槽位拆分为普通槽位和目标槽位;
普通槽位填充单元,用于对槽位中的普通槽位,先利用预设规则对用户输入的问句进行匹配,若匹配通过则根据所述预设规则对普通槽位进行填充,若匹配不通过则采用CNN模型并引入已训练的词向量,对用户输入的问句进行文本识别,并将识别的内容填充至所述普通槽位中;
目标槽位填充单元,用于对槽位中的目标槽位,采用Bi-LSTM模型并利用CRF作为Bi-LSTM模型的输出层来识别问句中的关键实体,并将识别出的关键实体填充至所述目标槽位中;
所述图谱路径筛选单元包括:
图谱节点获取单元,用于根据生成的图谱查询语句获取其中的图谱节点,并作为单独的实体;
图谱路径合并单元,用于以各个单独的实体为起始节点,叶子节点为终点生成图谱候选路径,并将所有图谱候选路径进行合并,得到图谱候选路径集合;
评分单元,用于将各个关键实体与所述图谱候选路径集合中的每一图谱候选路径进行匹配,若匹配则将对应的图谱候选路径评分加1,最终得到每一图谱候选路径的评分;
筛选单元,用于取所述图谱候选路径集合中评分最高的图谱候选路径作为最终图谱路径。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的基于知识图谱的自动问答方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的基于知识图谱的自动问答方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010850195.4A CN111949787B (zh) | 2020-08-21 | 2020-08-21 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010850195.4A CN111949787B (zh) | 2020-08-21 | 2020-08-21 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111949787A CN111949787A (zh) | 2020-11-17 |
CN111949787B true CN111949787B (zh) | 2023-04-28 |
Family
ID=73359102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010850195.4A Active CN111949787B (zh) | 2020-08-21 | 2020-08-21 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111949787B (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559709A (zh) * | 2020-12-16 | 2021-03-26 | 中国平安人寿保险股份有限公司 | 基于知识图谱的问答方法、装置、终端以及存储介质 |
CN112528002B (zh) * | 2020-12-23 | 2023-07-18 | 北京百度网讯科技有限公司 | 对话识别方法、装置、电子设备和存储介质 |
CN112685536B (zh) * | 2020-12-25 | 2024-06-07 | 中国平安人寿保险股份有限公司 | 文本对话方法、装置、电子设备及存储介质 |
CN112732882A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 用户意图识别方法、装置、设备及计算机可读存储介质 |
CN112800242B (zh) * | 2021-01-28 | 2023-07-28 | 平安科技(深圳)有限公司 | 谱系挖掘方法、装置、电子设备及计算机可读存储介质 |
CN112784590B (zh) * | 2021-02-01 | 2024-09-17 | 北京金山数字娱乐科技有限公司 | 文本处理方法及装置 |
CN112948549B (zh) * | 2021-02-04 | 2024-10-18 | 北京淇瑀信息科技有限公司 | 一种基于上下文指代的对话应答方法、装置和系统 |
CN112988993B (zh) * | 2021-02-19 | 2023-10-20 | 车智互联(北京)科技有限公司 | 一种问答方法和计算设备 |
CN112966084B (zh) * | 2021-03-11 | 2022-04-05 | 北京三快在线科技有限公司 | 基于知识图谱的答案查询方法、装置、设备及存储介质 |
CN112966089A (zh) * | 2021-03-26 | 2021-06-15 | 中国工商银行股份有限公司 | 基于知识库的问题处理方法、装置、设备、介质和产品 |
CN113157939B (zh) * | 2021-03-26 | 2024-08-27 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
CN113064970A (zh) * | 2021-04-08 | 2021-07-02 | 易联众信息技术股份有限公司 | 一种多轮对话智能问询处理方法、系统、介质及设备 |
CN113111659A (zh) * | 2021-04-13 | 2021-07-13 | 中国电力科学研究院有限公司 | 电力巡检工作票生成方法、系统、设备及存储介质 |
CN113010660A (zh) * | 2021-04-22 | 2021-06-22 | 国网信息通信产业集团有限公司 | 一种基于知识图谱的智能问答方法及装置 |
CN113157863B (zh) * | 2021-04-25 | 2024-05-28 | 平安科技(深圳)有限公司 | 问答数据处理方法、装置、计算机设备及存储介质 |
CN113095524A (zh) * | 2021-05-14 | 2021-07-09 | 中国电力科学研究院有限公司 | 电力设备检修工作单据智能生成方法、系统及存储介质 |
CN113590774B (zh) * | 2021-06-22 | 2023-09-29 | 北京百度网讯科技有限公司 | 事件查询方法、装置以及存储介质 |
CN113342956B (zh) * | 2021-06-29 | 2022-04-01 | 神思电子技术股份有限公司 | 一种用于多轮对话中相同槽值填充的方法 |
CN113254473B (zh) * | 2021-07-05 | 2021-09-24 | 中国气象局公共气象服务中心(国家预警信息发布中心) | 一种获取气象服务知识的方法及装置 |
CN113486151A (zh) * | 2021-07-13 | 2021-10-08 | 盛景智能科技(嘉兴)有限公司 | 故障维修知识点查询方法、装置、电子设备和存储介质 |
CN113626571B (zh) * | 2021-08-09 | 2024-04-09 | 南方电网数字电网研究院股份有限公司 | 答句生成方法、装置、计算机设备和存储介质 |
CN113742470A (zh) * | 2021-09-07 | 2021-12-03 | 上海明略人工智能(集团)有限公司 | 一种数据检索方法、系统、电子设备及介质 |
CN113918701B (zh) * | 2021-10-20 | 2022-04-15 | 北京亿信华辰软件有限责任公司 | 看板展示方法及装置 |
CN114090755B (zh) * | 2021-11-30 | 2024-07-12 | 平安科技(深圳)有限公司 | 基于知识图谱的回复语句确定方法、装置及电子设备 |
CN115248854B (zh) * | 2022-09-22 | 2023-03-03 | 中邮消费金融有限公司 | 一种基于知识图谱的自动问答方法、系统及存储介质 |
CN115409042B (zh) * | 2022-10-28 | 2023-04-25 | 北京果然智汇科技有限公司 | 一种基于思维导图的机器人问答方法及装置 |
CN117033608B (zh) * | 2023-09-28 | 2023-12-22 | 中国电子科技集团公司第十研究所 | 一种基于大语言模型的知识图谱生成式问答方法及系统 |
CN118278528B (zh) * | 2024-06-04 | 2024-07-26 | 浙江英集动力科技有限公司 | 一种基于知识图谱的供热数字人的问答处理方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111125309A (zh) * | 2019-12-23 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 自然语言处理方法、装置及计算设备、存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491433B (zh) * | 2018-02-09 | 2022-05-03 | 平安科技(深圳)有限公司 | 聊天应答方法、电子装置及存储介质 |
WO2020213750A1 (ko) * | 2019-04-16 | 2020-10-22 | 엘지전자 주식회사 | 객체를 인식하는 인공 지능 장치 및 그 방법 |
CN110502608B (zh) * | 2019-07-05 | 2023-10-10 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN110795528B (zh) * | 2019-09-05 | 2023-10-13 | 腾讯科技(深圳)有限公司 | 一种数据查询方法、装置、电子设备及存储介质 |
CN110837550B (zh) * | 2019-11-11 | 2023-01-17 | 中山大学 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
CN111339770B (zh) * | 2020-02-18 | 2023-07-21 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
-
2020
- 2020-08-21 CN CN202010850195.4A patent/CN111949787B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111125309A (zh) * | 2019-12-23 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 自然语言处理方法、装置及计算设备、存储介质 |
Non-Patent Citations (1)
Title |
---|
基于问题生成的知识图谱问答方法;乔振浩等;《智能计算机与应用》;20200501(第05期);第11-15页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111949787A (zh) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111949787B (zh) | 基于知识图谱的自动问答方法、装置、设备及存储介质 | |
Jung | Semantic vector learning for natural language understanding | |
Roy et al. | Solving general arithmetic word problems | |
Culotta et al. | Integrating probabilistic extraction models and data mining to discover relations and patterns in text | |
EP3534272A1 (en) | Natural language question answering systems | |
US9208218B2 (en) | Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results | |
CN110427623A (zh) | 半结构化文档知识抽取方法、装置、电子设备及存储介质 | |
CN108874774B (zh) | 一种基于意图理解的服务调用方法和系统 | |
CN112347778A (zh) | 关键词抽取方法、装置、终端设备及存储介质 | |
CN110765277B (zh) | 一种基于知识图谱的移动端的在线设备故障诊断方法 | |
CN111460148A (zh) | 文本分类方法、装置、终端设备及存储介质 | |
JP2006244262A (ja) | 質問回答検索システム、方法およびプログラム | |
CN110309504B (zh) | 基于分词的文本处理方法、装置、设备及存储介质 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
Jain et al. | Bayesian optimization based score fusion of linguistic approaches for improving legal document summarization | |
CN117951249A (zh) | 基于大语言模型的知识库应答方法及系统 | |
CN111708870A (zh) | 基于深度神经网络的问答方法、装置及存储介质 | |
CN113420119B (zh) | 基于知识卡片的智能问答方法、装置、设备及存储介质 | |
CN117291192B (zh) | 一种政务文本语义理解分析方法及系统 | |
Sarkar | A hidden markov model based system for entity extraction from social media english text at fire 2015 | |
CN112270189A (zh) | 一种提问式的分析节点生成方法、系统及存储介质 | |
Liu et al. | Extracting biomedical events from pairs of text entities | |
CN113468311B (zh) | 一种基于知识图谱的复杂问句问答方法、装置及存储介质 | |
CN114036289A (zh) | 一种意图识别方法、装置、设备及介质 | |
US20220164598A1 (en) | Determining a denoised named entity recognition model and a denoised relation extraction model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |