CN111506722A - 基于深度学习技术的知识图谱问答方法、装置及设备 - Google Patents
基于深度学习技术的知识图谱问答方法、装置及设备 Download PDFInfo
- Publication number
- CN111506722A CN111506722A CN202010550506.5A CN202010550506A CN111506722A CN 111506722 A CN111506722 A CN 111506722A CN 202010550506 A CN202010550506 A CN 202010550506A CN 111506722 A CN111506722 A CN 111506722A
- Authority
- CN
- China
- Prior art keywords
- attribute
- question
- entity
- vector
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013135 deep learning Methods 0.000 title claims abstract description 24
- 238000005516 engineering process Methods 0.000 title claims abstract description 23
- 239000013598 vector Substances 0.000 claims description 139
- 238000012512 characterization method Methods 0.000 claims description 29
- 230000007246 mechanism Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 3
- 238000007726 management method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- SPSXSWRZQFPVTJ-ZQQKUFEYSA-N hepatitis b vaccine Chemical compound C([C@H](NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC1N=CN=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)OC(=O)CNC(=O)CNC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@@H](N)CCCNC(N)=N)C1=CC=CC=C1 SPSXSWRZQFPVTJ-ZQQKUFEYSA-N 0.000 description 4
- 229940124736 hepatitis-B vaccine Drugs 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 229940124724 hepatitis-A vaccine Drugs 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 229960005486 vaccine Drugs 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012550 audit Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000008753 Papaver somniferum Nutrition 0.000 description 1
- 240000001090 Papaver somniferum Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013549 information retrieval technique Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本申请揭示了一种基于深度学习技术的知识图谱问答方法、装置及设备,其中方法包括:接收用户的问题语句;利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;利用属性识别模型对问题语句进行属性识别,得到问题语句中的属性信息;对属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;根据实体信息和标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。模型和知识图谱信息可以存储于区块链中。本申请的基于深度学习技术的知识图谱问答方法通过多层Bi‑LSTM及Attention操作很好地将实体层、短语层、问题层的语义信息融入到模型中,提高了模型的效果和问答的准确性。
Description
技术领域
本申请涉及到自然语言处理技术领域,特别是涉及到一种基于深度学习技术的知识图谱问答方法、装置及设备。
背景技术
问答系统是用来回答人提出的自然语言的问题的系统,对于问答系统而言用户的问题基本可以分成事实型问题和观点型问题,事实型问题是指存在标准答案的问题,比如“乙肝疫苗的免疫原理是什么?”。观点型问题的答案一般不存在唯一标准答案,比如“疫苗是打国内的好还是国外的好?”,事实型问题是在问答系统中关注较多的一种,但目前问答系统中最常用的技术是基于信息检索技术的问答系统,主要是通过关键词搜索以及提取答案,由于自然语言文本的复杂性,该方法实现问答准确率很低。
目前已经出现了基于知识图谱的问答技术,然而,现有的基于知识图谱问答技术,实际应用落地过程中多是基于设计的规则,或者是简单的机器学习模型,基于复杂模型复杂度较高,真实上线需要机器和时间成本高,效果提升不明显。
发明内容
本申请的主要目的为提供一种基于深度学习技术的知识图谱问答方法、装置及设备,旨在解决现有技术中基于知识图谱的问答系统效果较差、硬件成本较高的技术问题。
为了实现上述发明目的,本申请提出一种基于深度学习技术的知识图谱问答方法,包括:
接收用户的问题语句;
利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;
利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;
对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;
根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。
进一步地,所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息步骤,包括:
先将所述问题语句分词,输入实体识别模型的Token Embedding层,将单词转化为词向量;
将词向量输入到实体识别模型的Bi-LSTM层,得到第一隐藏向量;
将第一隐藏向量输入到实体识别模型的CRF层,得到预测标签序列;
根据预测标签序列确定所述问题语句中的实体信息。
进一步地,所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息的步骤包括:
对所述问题语句进行分词处理得到词序列,通过Word Embedding获取每个词的词向量w1,w2...,wn;
将词向量w1,w2...,wn映射成对应的概念词向量e1,e2...,en;
将概念词向量e1,e2...,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2...,hn;
将第二隐藏向量h1,h2...,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
进一步地,所述对识别到的属性进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性的步骤包括:
提取用户问题语句中的实体和第一属性词;
根据所述用户问题语句中的实体,在知识图谱中查找与该实体匹配的多个第二属性词;
计算所述第一属性词和多个所述第二属性词的之间的相关度,并根据相关度对多个所述第二属性词进行筛选,确定出一个或多个第三属性词;
如果存在多个第三属性词,统计每个第三属性词在知识图谱中出现的次数,次数最多的作为标准属性。
进一步地,所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户的步骤包括:
将所述实体信息视为主语或宾语,与所述标准属性相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组;
若将所述实体信息视为主语,则以该三元组中的宾语作为问题的答案;
若将所述实体信息视为宾语,则以该三元组中的主语作为问题的答案;
若没有检索到对应的三元组,则提示系统尚未收录该问题。
进一步地,所述基于注意力机制的属性识别模型的标签数据是概念化标签数据集,其中,得到所述概念化标签数据集的步骤包括:
对初始标签数据中的问题经过实体识别、实体概念化,得到所述概念化标签数据集。
本申请实施例还提供一种基于深度学习技术的知识图谱问答装置,包括:
接收单元,用于接收用户的问题语句;
实体识别单元,用于利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;
属性识别单元,用于利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;
属性处理单元,用于对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;
查询单元,用于根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。
进一步地,所述属性识别单元包括:
词向量获取单元,用于对所述问题语句进行分词处理得到词序列,通过WordEmbedding获取每个词的词向量w1,w2...,wn;
概念词向量获取单元,用于将词向量w1,w2...,wn映射成对应的概念词向量e1,e2...,en;
第二隐藏向量获取单元,用于将概念词向量e1,e2...,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2...,hn;
表征向量获取单元,用于将第二隐藏向量h1,h2...,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
属性信息获取单元,用于将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的基于深度学习技术的知识图谱问答方法、装置和计算机设备,通过实体概念化,降低了模型的复杂程度和相应时间,降低了硬件成本,并且通过多层Bi-LSTM及Attention操作很好地将实体层、短语层、问题层的语义信息融入到模型中,提高了模型的效果和问答的准确性。
附图说明
图1为本申请一实施例的基于深度学习技术的知识图谱问答方法的流程示意图;
图2为本申请一实施例的基于深度学习技术的知识图谱问答装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例中提供一种基于深度学习技术的知识图谱问答方法,包括步骤:
S1、接收用户的问题语句;
S2、利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;
S3、利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;
S4、对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;
S5、根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。
如上述步骤S1所述,要实现知识图谱的问答方法,首先需要接收用户的问题语句。目前常见的输入方式有两种,文字输入和语音输入,对于语音输入的问题语句首先要进行语音识别,将用户输入的语音转化为对应的文字,方便模型进行处理。
如上述步骤S2所述,实体识别主要是从自然语句中识别出其中的实体,后续的属性拓展、知识图谱查询等操作都需要实体识别的支撑。这里使用的实体识别模型是比较成熟的基于LSTM+CRF(Long Short Term Memory+Conditional Random Field)的序列标注模型,实体识别模型的输入是句子的词序列,输出是句子中实体信息,以实体识别模型输入“黄晓明的妻子是谁”为例,转成模型的word序列也就是(黄,晓,明,的,妻,子,是,谁,?)实体识别输出:(B,I,I,O,O,O,O,O,O),其中B表示实体的开始word,I表示实体的中间或结束word,O表示不是实体的word。模型的输出也就是黄晓明被预测为实体部分。
如上述步骤S3所述,这里采用的是基于RNN(循环神经网络)以及注意力机制设计的深度学习模型对用户问题语句中的属性进行识别。属性也就是知识图谱中的属性(关系类别),通过上述模型对用户问题语句进行属性识别,可以预测出用户问题对应到知识图谱中的关系(属性)类别。
如上述步骤S4所述,属性扩展的主要目的是对属性(知识图谱中关系类型)进行扩展。知识图谱中很多关系无法使用某一个具体属性(关系)直接表达,而是需要多个属性进行表达。比如在知识图谱中,对于spouse of(配偶)这个关系是通过三个属性进行表达的,marriage→person→name。这里通过对知识图谱的属性扩展可以表达更多的关系(属性)。通过已有的属性标准化数据库对属性进行标准化,比如夫妻、妻子、丈夫、老公、配偶等可以标准化为配偶。通过属性标准化,可以降低系统的复杂度,标准化后的属性便于更加精准知识图谱查询。
如上述步骤S5所述,用户的问题经过实体识别部分的实体等信息以及基于属性模型预测部分得到关系(属性)类型,对属性进行标准化、以及属性扩展得到最终的属性类别(关系类别),从而将实体信息以及标准属性转换成知识图谱的结构化查询,在知识图谱中进行查询,最终将用户问题的答案返回给用户。
在一个具体的实施例中,所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息步骤,包括:
S21、先将所述问题语句分词,输入实体识别模型的Token Embedding层,将单词转化为词向量;
S22、将词向量输入到实体识别模型的Bi-LSTM层,得到第一隐藏向量;
S23、将第一隐藏向量输入到实体识别模型的CRF层,得到预测标签序列;
S24、根据预测标签序列确定所述问题语句中的实体信息。
如上述所述,举例说明,实体识别模型输入:黄晓明的妻子是谁?转成模型的word序列也就是(黄,晓,明,的,妻,子,是,谁,?),经过Token Embedding层编码和Bi-LSTM层后,实体识别结果输出:(B,I,I,O,O,O,O,O,O),其中B表示实体的开始word,I表示实体的中间或结束word,O表示不是实体的word。模型的输出也就是“黄晓明”被预测为实体部分。
在一个具体的实施例中,所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息的步骤包括:
S31、对所述问题语句进行分词处理得到词序列,通过Word Embedding获取每个词的词向量w1,w2...,wn;
S32、将词向量w1,w2...,wn映射成对应的概念词向量e1,e2...,en;
S33、将概念词向量e1,e2...,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2...,hn;
S34、将第二隐藏向量h1,h2...,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
S35、将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
如上所述,首先对用户的问题语句进行分词得到句子的词序列,通过WordEmbedding获取每个词的词向量w1,w2...,wn。然后经过实体概念映射操作映射成对应的概念的词向量e1,e2...,en,词向量携带了单词语义信息,而且通过实体的概念映射可以获取整个问题句子的更深层的语义。将概念化的词向量输入Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到隐藏向量h1,h2...,hn。Bi-LSTM可以很好的学习到对应词前后的语义信息,使用实体层信息进行Attention操作可以很好地将实体层的语义信息融入到模型中。然后将上一层得到的序列表征向量再次输入到Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,做一个近似于加权求和的操作,得到表征向量Vector。这里学习到表征向量Vector很好的融合了实体层语义、短语层语义、问题层语义。最后,将学习到的表征向量Vector经过全连接层以及Softmax操作,得到句子(用户问题)中对应到知识图谱的关系(属性)类别。其中实体层Entity、短语层Phrase的处理如下:
实体层语义Entity:实体是自然语言的基本单位之一,基于知识图谱的实体语义理解为上层语义计算,特别是问题中的实体语义。本发明关于实体层的语义解析这里使用了语义社团搜索模型,获取实体层的语义信息。
短语层语义Phrase:短文本是自然语言的最常见形式之一,起到对实体和更复杂文本单元(如问句)的承接作用,短文本已经有了基本的语法结构和上下文的语义信息。这里主要是使用动词模板用来细粒度的语义表示,并综合使用了上下文信息进行实体的概念化。
以下举例说明:
原始输入:李安执导过哪些电影作品?
问题概念化后:导演执导过哪些电影作品?
模型的输入:(导,演,执,导,过,哪,些,电,影,作,品,?)
模型的输出:代表作品(属性)
在一个具体的实施例中,所述对识别到的属性进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性的步骤包括:
S41、提取用户问题语句中的实体和第一属性词;
S42、根据所述用户问题语句中的实体,在知识图谱中查找与该实体匹配的多个第二属性词;
S43、计算所述第一属性词和多个所述第二属性词的之间的相关度,并根据相关度对多个所述第二属性词进行筛选,确定出一个或多个第三属性词;
S44、如果存在多个第三属性词,统计每个第三属性词在知识图谱中出现的次数,次数最多的作为标准属性。
如上所述,知识图谱中的属性词也就是同一个属性或关系可能有多个表达方式,所以对三元组中的属性进行拓展可以提高问答系统的覆盖率。在本实施例中,采用了计算知识图谱中的相关属性词的相关度的方法对属性词进行扩展。其中,所述第一属性词和多个所述第二属性词之间的相关度计算方法可以采用将属性词转换为语义向量并进行语义关联性分析,生成所述多个第二属性词和第一属性词之间相关度的排序和/或相关度,然后根据预设相关度阈值和/或相关度排序筛选策略,确定出一个或多个第三属性词。如果存在多个第三属性词,统计每个第三属性词在知识图谱中出现的次数,次数最多的作为标准属性,即语义相同的属性词,采用最常用的属性词作为标准谓词,确定为标准属性。
在一个具体的实施例中,所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户的步骤包括:
S51、将所述实体信息视为主语或宾语,与所述标准属性相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组;
S52、若将所述实体信息视为主语,则以该三元组中的宾语作为问题的答案;
S53、若将所述实体信息视为宾语,则以该三元组中的主语作为问题的答案;
S54、若没有检索到对应的三元组,则提示系统尚未收录该问题。
如上所述,在知识图谱中,知识数据是以(S、P、O)三元组形式保存的,对应表示为实体、属性(关系)、属性值(关系类别),其中实体和其对应的属性值可能都是以实体的形式表示的,例如,黄晓明的妻子是谁,在知识图谱中可能表示为(黄晓明、配偶、杨颖),即问句中的主语和宾语在一些情况下是可以互换的,根据模型输出的实体和属性结果,若将所述实体信息视为主语,则以该三元组中的宾语作为问题的答案;若所述实体信息视为宾语,则以该三元组中的主语作为问题的答案。在一个具体的实施例中,还可以设置用户对答案的满意度评价系统,使该问答系统根据用户的评价进行自我改进或为知识图谱的构建和更新提出建议。
在一个具体的实施例中,所述若没有检索到对应的三元组,则提示系统尚未收录该问题的步骤之后包括:
将问题发送给人工处理,将人工处理的结果更新到知识图谱中。
如上所述,知识图谱的问答系统可能基于各种各样的原因不能够匹配到问题答案时,可以将问题记录下来发送给人工处理,然后由人工主动对知识图谱进行更新。目前的知识图谱基于各种庞大的数据来源,知识覆盖面相对广泛,但仍可能因为问题太新没有被收录、用户问题表述难以被机器模型理解、模型算法不够精确等诸多原因造成无法回答用户的问题。这种情况可以记录无法解决的问题后交由系统开发人员处理并针对问题产生的原因做出改进,提高知识图谱智能问答的全面性和准确性。
在一个具体的实施例中,所述基于注意力机制的属性识别模型的标签数据是概念化标签数据集,其中,得到所述概念化标签数据集的步骤包括:
对初始标签数据中的问题经过实体识别、实体概念化,得到所述概念化标签数据集。
如上所述,对初始的属性识别模型的标签数据中的问题进行实体识别、实体概念化,得到概念化标签数据集合。比如:“甲肝疫苗的免疫原理是?”“乙肝疫苗的免疫原理是?”等类似问题,通过实体识别,可以得到问题中的甲肝疫苗、乙肝疫苗为实体,通过实体概念映射,甲肝疫苗、乙肝疫苗的概念是疫苗,从而标签数据集中这一类问题都可以概念化为:疫苗的免疫原理是什么?通过实体概念化,可以将去除大量冗余的数据,可以将标签数据集的规模降低10-50倍左右,有效降低模型的复杂程度,提高模型的训练速度和响应速度,降低了硬件成本。
在一个实施例中,用于实体识别和属性识别的模型、知识图谱相关数据等信息均可以存储与区块链中,在区块链网络中实现如上所述的基于深度学习技术的知识图谱问答方法。
如上所述,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
本申请实施例的基于深度学习技术的知识图谱问答方法,通过实体概念化,降低了模型的复杂程度和相应时间,降低了硬件成本,并且通过多层Bi-LSTM及Attention操作很好地将实体层、短语层、问题层的语义信息融入到模型中,提高了模型的效果和问答的准确性。
参照图2,本申请实施例中还提供一种基于深度学习技术的知识图谱问答装置,包括:
接收单元1,用于接收用户的问题语句;
实体识别单元2,用于利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;
属性识别单元3,用于利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;
属性处理单元4,用于对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;
查询单元5,用于根据所述实体信息和所述标准属性生成知识图谱的结构化查询,最终将用户问题的答案返回给用户。
在一个具体的实施例中,所述实体识别单元2包括:
分词单元,用于将所述问题语句分词,输入实体识别模型的Token Embedding层,将单词转化为词向量;
第一隐藏向量生成单元,用于将词向量输入到实体识别模型的Bi-LSTM层,得到第一隐藏向量;
预测标签序列生成单元,用于将第一隐藏向量输入到实体识别模型的CRF层,得到预测标签序列;
实体信息确定单元,用于根据预测标签序列确定所述问题语句中的实体信息。
在一个具体的实施例中,所述属性识别单元3包括:
词向量获取单元,用于对所述问题语句进行分词处理得到词序列,通过WordEmbedding获取每个词的词向量w1,w2...,wn;
概念词向量获取单元,用于将词向量w1,w2...,wn映射成对应的概念词向量e1,e2...,en;
第二隐藏向量获取单元,用于将概念词向量e1,e2...,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2...,hn;
表征向量获取单元,用于将第二隐藏向量h1,h2...,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
属性信息获取单元,用于将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
在一个具体的实施例中,所述属性处理单元4包括:
提取单元,用于提取用户问题语句中的实体和第一属性词;
查找单元,用于根据所述用户问题语句中的实体,在知识图谱中查找与该实体匹配的多个第二属性词;
确定单元,用于计算所述第一属性词和多个所述第二属性词之间的相关度,并根据相关度对多个所述第二属性词进行筛选,确定出一个或多个第三属性词;
统计单元,用于如果存在多个第三属性词,统计每个第三属性词在知识图谱中出现的次数,次数最多的作为标准属性。
在一个具体的实施例中,所述查询单元5包括:
检索单元:用于将所述实体信息视为主语或宾语,与所述标准属性相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组;
第一答案生成单元,用于若将所述实体信息视为主语,则以该三元组中的宾语作为问题的答案;
第二答案生成单元,用于若将所述实体信息视为宾语,则以该三元组中的主语作为问题的答案;
提示单元,用于若没有检索到对应的三元组,则提示系统尚未收录该问题。
如上所述,可以理解地,本发明中提出的所述基于深度学习技术的知识图谱问答装置的各组成部分可以实现如上所述基于深度学习技术的知识图谱问答方法任一项的功能,具体结构不再赘述。
参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存知识图谱等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于深度学习技术的知识图谱问答方法。
上述处理器执行上述的基于深度学习技术的知识图谱问答方法,包括:接收用户的问题语句;利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。
在一个实施例中,所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息步骤,包括:先将所述问题语句分词,输入实体识别模型的Token Embedding层,将单词转化为词向量;将词向量输入到实体识别模型的Bi-LSTM层,得到第一隐藏向量;将第一隐藏向量输入到实体识别模型的CRF层,得到预测标签序列;根据预测标签序列确定所述问题语句中的实体信息。
在一个具体的实施例中,所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息的步骤包括:
对所述问题语句进行分词处理得到词序列,通过Word Embedding获取每个词的词向量w1,w2...,wn;
将词向量w1,w2...,wn映射成对应的概念词向量e1,e2...,en;
将概念词向量e1,e2...,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2...,hn;
将第二隐藏向量h1,h2...,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
在一个具体的实施例中,所述对识别到的属性进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性的步骤包括:
提取用户问题语句中的实体和第一属性词;
根据所述用户问题语句中的实体,在知识图谱中查找与该实体匹配的多个第二属性词;
计算所述第一属性词和多个所述第二属性词的之间的相关度,并根据相关度对多个所述第二属性词进行筛选,确定出一个或多个第三属性词;
如果存在多个第三属性词,统计每个第三属性词在知识图谱中出现的次数,次数最多的作为标准属性。
在一个具体的实施例中,所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的的答案返回给用户的步骤包括:
将所述实体信息视为主语或宾语,与所述标准属性相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组;
若将所述实体信息视为主语,则以该三元组中的宾语作为问题的答案;
若将所述实体信息视为宾语,则以该三元组中的主语作为问题的答案;
若没有检索到对应的三元组,则提示系统尚未收录该问题。
进一步地,所述若没有检索到对应的三元组,则提示系统尚未收录该问题的步骤之后包括:
将问题发送给人工处理,将人工处理的结果更新到知识图谱中。
在一个具体的实施例中,所述若没有检索到对应的三元组,则提示系统尚未收录该问题的步骤之后包括:
将问题发送给人工处理,将人工处理的结果更新到知识图谱中。
在一个具体的实施例中,所述基于注意力机制的属性识别模型的标签数据是概念化标签数据集,其中,得到所述概念化标签数据集的步骤包括:
对初始标签数据中的问题经过实体识别、实体概念化,得到所述概念化标签数据集。
本发明一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于深度学习技术的知识图谱问答方法,包括步骤:接收用户的问题语句;利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。
在一个实施例中,所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息步骤,包括:先将所述问题语句分词,输入实体识别模型的Token Embedding层,将单词转化为词向量;将词向量输入到实体识别模型的Bi-LSTM层,得到第一隐藏向量;将第一隐藏向量输入到实体识别模型的CRF层,得到预测标签序列;根据预测标签序列确定所述问题语句中的实体信息。
在一个具体的实施例中,所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息的步骤包括:
对所述问题语句进行分词处理得到词序列,通过Word Embedding获取每个词的词向量w1,w2...,wn;
将词向量w1,w2...,wn映射成对应的概念词向量e1,e2...,en;
将概念词向量e1,e2...,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2...,hn;
将第二隐藏向量h1,h2...,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
在一个具体的实施例中,所述对识别到的属性进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性的步骤包括:
提取用户问题语句中的实体和第一属性词;
根据所述用户问题语句中的实体,在知识图谱中查找与该实体匹配的多个第二属性词;
计算所述第一属性词和多个所述第二属性词的之间的相关度,并根据相关度对多个所述第二属性词进行筛选,确定出一个或多个第三属性词;
如果存在多个第三属性词,统计每个第三属性词在知识图谱中出现的次数,次数最多的作为标准属性。
在一个具体的实施例中,所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户的步骤包括:
将所述实体信息视为主语或宾语,与所述标准属性相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组;
若将所述实体信息视为主语,则以该三元组中的宾语作为问题的答案;
若将所述实体信息视为宾语,则以该三元组中的主语作为问题的答案;
若没有检索到对应的三元组,则提示系统尚未收录该问题。
进一步地,所述若没有检索到对应的三元组,则提示系统尚未收录该问题的步骤之后包括:
将问题发送给人工处理,将人工处理的结果更新到知识图谱中。
在一个具体的实施例中,所述若没有检索到对应的三元组,则提示系统尚未收录该问题的步骤之后包括:
将问题发送给人工处理,将人工处理的结果更新到知识图谱中。
在一个具体的实施例中,所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息的步骤之前还包括:
对初始的属性识别模型的标签数据中问题经过实体识别、实体概念化,得到概念化标签数据集合。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种基于深度学习技术的知识图谱问答方法,其特征在于,包括:
接收用户的问题语句;
利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;
利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;
对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;
根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。
2.根据权利要求1所述的基于深度学习技术的知识图谱问答方法,其特征在于,所述利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息的步骤包括:
将所述问题语句分词,输入实体识别模型的Token Embedding层,将单词转化为词向量;
将词向量输入到实体识别模型的Bi-LSTM层,得到第一隐藏向量;
将第一隐藏向量输入到实体识别模型的CRF层,得到预测标签序列;
根据预测标签序列确定所述问题语句中的实体信息。
3.根据权利要求1所述的基于深度学习技术的知识图谱问答方法,其特征在于,所述利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息的步骤包括:
对所述问题语句进行分词处理得到词序列,通过Word Embedding获取每个词的词向量w1,w2…,wn;
将词向量w1,w2…,wn映射成对应的概念词向量e1,e2…,en;
将概念词向量e1,e2…,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2…,hn;
将第二隐藏向量h1,h2…,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
4.根据权利要求1所述的基于深度学习技术的知识图谱问答方法,其特征在于,所述对识别到的属性进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性的步骤包括:
提取用户问题语句中的实体和第一属性词;
根据所述用户问题语句中的实体,在知识图谱中查找与该实体匹配的多个第二属性词;
计算所述第一属性词和多个所述第二属性词之间的相关度,并根据相关度对多个所述第二属性词进行筛选,确定出一个或多个第三属性词;
如果存在多个第三属性词,统计每个第三属性词在知识图谱中出现的次数,次数最多的作为标准属性。
5.根据权利要求1所述的基于深度学习技术的知识图谱问答方法,其特征在于,所述根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户的步骤包括:
将所述实体信息视为主语或宾语,与所述标准属性相结合,生成SPARQL查询,从知识图谱中检索并找到对应的三元组;
若将所述实体信息视为主语,则以该三元组中的宾语作为问题的答案;
若将所述实体信息视为宾语,则以该三元组中的主语作为问题的答案;
若没有检索到对应的三元组,则提示系统尚未收录该问题。
6.根据权利要求1所述的基于深度学习技术的知识图谱问答方法,其特征在于,所述基于注意力机制的属性识别模型的标签数据是概念化标签数据集,其中,得到所述概念化标签数据集的步骤包括:
对初始标签数据中的问题经过实体识别、实体概念化,得到所述概念化标签数据集。
7.一种基于深度学习技术的知识图谱问答装置,其特征在于,包括:
接收单元,用于接收用户的问题语句;
实体识别单元,用于利用基于LSTM+CRF的序列标注模型对所述问题语句进行实体识别,得到所述问题语句中的实体信息;
属性识别单元,用于利用基于注意力机制的属性识别模型对所述问题语句进行属性识别,得到所述问题语句中的属性信息;
属性处理单元,用于对所述属性信息进行属性拓展和属性标准化,得到对应到知识图谱中的标准属性;
查询单元,用于根据所述实体信息和所述标准属性生成知识图谱的结构化查询,在知识图谱中查询答案,将查询到的答案返回给用户。
8.根据权利要求7所述的基于深度学习技术的知识图谱问答装置,其特征在于,所述属性识别单元包括:
词向量获取单元,用于对所述问题语句进行分词处理得到词序列,通过WordEmbedding获取每个词的词向量w1,w2…,wn;
概念词向量获取单元,用于将词向量w1,w2…,wn映射成对应的概念词向量e1,e2…,en;
第二隐藏向量获取单元,用于将概念词向量e1,e2…,en输入到属性识别模型的Bi-LSTM层,并使用实体层的表征向量Entity进行Attention操作得到第二隐藏向量h1,h2…,hn;
表征向量获取单元,用于将第二隐藏向量h1,h2…,hn再次输入到属性识别模型的Bi-LSTM层,并使用短语层的表征向量Phrase进行Attention操作,并对输出的第三隐藏向量进行加权求和,得到表征向量Vector;
属性信息获取单元,用于将表征向量Vector输入到属性识别模型的全连接层并进行Softmax操作,得到所述问题语句中的属性信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010550506.5A CN111506722B (zh) | 2020-06-16 | 2020-06-16 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
PCT/CN2020/119375 WO2021139283A1 (zh) | 2020-06-16 | 2020-09-30 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010550506.5A CN111506722B (zh) | 2020-06-16 | 2020-06-16 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111506722A true CN111506722A (zh) | 2020-08-07 |
CN111506722B CN111506722B (zh) | 2024-03-08 |
Family
ID=71868702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010550506.5A Active CN111506722B (zh) | 2020-06-16 | 2020-06-16 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111506722B (zh) |
WO (1) | WO2021139283A1 (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931514A (zh) * | 2020-07-28 | 2020-11-13 | 薛杨杨 | 基于深度学习和大数据的信息处理方法及区块链服务平台 |
CN111985207A (zh) * | 2020-08-17 | 2020-11-24 | 中国人民解放军战略支援部队信息工程大学 | 一种访问控制策略的获取方法、装置及电子设备 |
CN112100346A (zh) * | 2020-08-28 | 2020-12-18 | 西北工业大学 | 基于细粒度图像特征和外部知识相融合的视觉问答方法 |
CN112199487A (zh) * | 2020-10-23 | 2021-01-08 | 中国传媒大学 | 一种基于知识图谱的电影问答查询系统及其方法 |
CN112231418A (zh) * | 2020-10-15 | 2021-01-15 | 南方电网数字电网研究院有限公司 | 电力标准知识图谱构建方法、装置、计算机设备和介质 |
CN112507139A (zh) * | 2020-12-28 | 2021-03-16 | 深圳力维智联技术有限公司 | 基于知识图谱的问答方法、系统、设备及存储介质 |
CN112632225A (zh) * | 2020-12-29 | 2021-04-09 | 天津汇智星源信息技术有限公司 | 基于案事件知识图谱的语义搜索方法、装置和电子设备 |
CN112667820A (zh) * | 2020-12-08 | 2021-04-16 | 吉林省吉科软信息技术有限公司 | 全流程可追溯生态链监管知识图谱的深度学习构建方法 |
CN112765310A (zh) * | 2020-12-11 | 2021-05-07 | 北京航天云路有限公司 | 一种基于深度学习与相似度匹配的知识图谱问答的方法 |
CN112883172A (zh) * | 2021-02-03 | 2021-06-01 | 大连理工大学 | 一种基于双重知识选择的生物医学问答方法 |
CN112905884A (zh) * | 2021-02-10 | 2021-06-04 | 北京百度网讯科技有限公司 | 生成序列标注模型的方法、设备、介质及程序产品 |
CN112948547A (zh) * | 2021-01-26 | 2021-06-11 | 中国石油大学(北京) | 测井知识图谱构建查询方法、装置、设备及存储介质 |
CN112989002A (zh) * | 2021-03-31 | 2021-06-18 | 中国工商银行股份有限公司 | 一种基于知识图谱的问答处理方法、装置及设备 |
CN112989004A (zh) * | 2021-04-09 | 2021-06-18 | 苏州爱语认知智能科技有限公司 | 面向知识图谱问答的查询图排序方法及系统 |
CN113011196A (zh) * | 2021-04-28 | 2021-06-22 | 广西师范大学 | 一种概念增强表示与单向蕴含注意力的主观题自动阅卷神经网络模型 |
CN113626215A (zh) * | 2021-07-22 | 2021-11-09 | 武汉大学 | 一种基于短语识别的气象场景服务图谱构建方法及系统 |
CN115577091A (zh) * | 2022-12-08 | 2023-01-06 | 成都晓多科技有限公司 | 基于知识图谱的复杂条件问题作答方法及系统 |
CN116011548A (zh) * | 2023-03-24 | 2023-04-25 | 北京澜舟科技有限公司 | 一种多知识图谱问答模型训练方法、系统及存储介质 |
CN116340547A (zh) * | 2023-05-24 | 2023-06-27 | 江苏微皓智能科技有限公司 | 一种对话式报表可视化生产方法及系统 |
CN116628315A (zh) * | 2023-04-07 | 2023-08-22 | 百度在线网络技术(北京)有限公司 | 搜索方法、深度学习模型的训练方法、装置及电子设备 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113488180B (zh) * | 2021-07-28 | 2023-07-18 | 中国医学科学院医学信息研究所 | 一种临床指南知识建模方法及系统 |
CN113641833B (zh) * | 2021-08-17 | 2024-04-09 | 同济大学 | 服务需求匹配方法及装置 |
CN113688217B (zh) * | 2021-08-24 | 2022-04-22 | 山东省人工智能研究院 | 一种面向搜索引擎知识库的智能问答方法 |
CN113468077B (zh) * | 2021-09-06 | 2021-12-10 | 北京无疆脑智科技有限公司 | 认知能力测试方法、装置、电子设备和存储介质 |
CN113742494B (zh) * | 2021-09-06 | 2024-03-15 | 湘潭大学 | 一种基于标签图转化的领域文本相似度计算方法及系统 |
CN113742495B (zh) * | 2021-09-07 | 2024-02-23 | 平安科技(深圳)有限公司 | 基于预测模型的评级特征权重确定方法及装置、电子设备 |
CN113672720A (zh) * | 2021-09-14 | 2021-11-19 | 国网天津市电力公司 | 一种基于知识图谱和语义相似度的电力审计问答方法 |
CN113836286B (zh) * | 2021-09-26 | 2024-04-05 | 南开大学 | 一种基于问答匹配的社区孤寡老人情感分析方法及系统 |
CN113987145B (zh) * | 2021-10-22 | 2024-02-02 | 智联网聘信息技术有限公司 | 一种精准推理用户属性实体的方法、系统、设备和存储介质 |
CN114281959B (zh) * | 2021-10-27 | 2024-03-19 | 腾讯科技(深圳)有限公司 | 语句处理的方法、装置、设备、介质及计算机程序产品 |
CN114036275B (zh) * | 2021-11-08 | 2024-04-02 | 桂林电子科技大学 | 一种知识图谱嵌入多跳问答方法 |
CN114090620B (zh) * | 2022-01-19 | 2022-09-27 | 支付宝(杭州)信息技术有限公司 | 查询请求的处理方法及装置 |
CN114416927B (zh) * | 2022-01-24 | 2024-04-02 | 招商银行股份有限公司 | 智能问答方法、装置、设备及存储介质 |
CN115687754B (zh) * | 2022-10-21 | 2024-01-23 | 四川大学 | 一种基于智能对话的主动式网络信息挖掘方法 |
CN115827844B (zh) * | 2022-12-12 | 2023-08-08 | 之江实验室 | 一种基于Sparql语句生成的知识图谱问答方法和系统 |
CN115795057B (zh) * | 2023-01-30 | 2023-05-02 | 北京至臻云智能科技有限公司 | 一种基于ai技术的审计知识处理方法与系统 |
CN116028610B (zh) * | 2023-02-15 | 2023-06-09 | 北京邮电大学 | 一种超关系知识图谱上的n元复杂查询嵌入方法 |
CN115982338B (zh) * | 2023-02-24 | 2023-06-06 | 中国测绘科学研究院 | 一种基于查询路径排序的领域知识图谱问答方法及系统 |
CN116596405B (zh) * | 2023-07-06 | 2024-03-26 | 南方电网数字电网研究院有限公司 | 纯数据驱动的电力系统分析方法及系统 |
CN116610791B (zh) * | 2023-07-20 | 2023-09-29 | 中国人民解放军国防科技大学 | 针对结构化信息的基于语义分析的问答方法、系统及设备 |
CN117035891A (zh) * | 2023-08-17 | 2023-11-10 | 慧众合(山东)科技创新发展有限公司 | 一种基于知识图谱的市场交易系统 |
CN116992008B (zh) * | 2023-09-28 | 2024-01-09 | 之江实验室 | 知识图谱多跳问答推理方法、装置和计算机设备 |
CN117149983B (zh) * | 2023-10-30 | 2024-02-27 | 山东高速信息集团有限公司 | 基于高速公路业务智能对话的方法、装置及设备 |
CN117171365B (zh) * | 2023-11-02 | 2024-02-02 | 北京纷扬科技有限责任公司 | 一种基于知识图谱的故障问题智能定位方法及系统 |
CN117390169B (zh) * | 2023-12-11 | 2024-04-12 | 季华实验室 | 表格数据问答方法、装置、设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408627A (zh) * | 2018-11-15 | 2019-03-01 | 众安信息技术服务有限公司 | 一种融合卷积神经网络和循环神经网络的问答方法及系统 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN109800411A (zh) * | 2018-12-03 | 2019-05-24 | 哈尔滨工业大学(深圳) | 临床医疗实体及其属性抽取方法 |
CN110287479A (zh) * | 2019-05-20 | 2019-09-27 | 平安科技(深圳)有限公司 | 命名实体识别方法、电子装置及存储介质 |
CN110362660A (zh) * | 2019-07-23 | 2019-10-22 | 重庆邮电大学 | 一种基于知识图谱的电子产品质量自动检测方法 |
CN110825721A (zh) * | 2019-11-06 | 2020-02-21 | 武汉大学 | 大数据环境下高血压知识库构建与系统集成方法 |
CN110866093A (zh) * | 2018-08-10 | 2020-03-06 | 珠海格力电器股份有限公司 | 机器问答方法及装置 |
CN110941716A (zh) * | 2019-11-05 | 2020-03-31 | 北京航空航天大学 | 一种基于深度学习的信息安全知识图谱的自动构建方法 |
CN111274373A (zh) * | 2020-01-16 | 2020-06-12 | 山东大学 | 一种基于知识图谱的电子病历问答方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11087167B2 (en) * | 2014-12-22 | 2021-08-10 | Robert Bosch Gmbh | First-person camera based visual context aware system |
CN111177345B (zh) * | 2019-12-19 | 2023-06-20 | 中国平安财产保险股份有限公司 | 基于知识图谱的智能问答方法、装置和计算机设备 |
-
2020
- 2020-06-16 CN CN202010550506.5A patent/CN111506722B/zh active Active
- 2020-09-30 WO PCT/CN2020/119375 patent/WO2021139283A1/zh active Application Filing
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866093A (zh) * | 2018-08-10 | 2020-03-06 | 珠海格力电器股份有限公司 | 机器问答方法及装置 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN109408627A (zh) * | 2018-11-15 | 2019-03-01 | 众安信息技术服务有限公司 | 一种融合卷积神经网络和循环神经网络的问答方法及系统 |
CN109800411A (zh) * | 2018-12-03 | 2019-05-24 | 哈尔滨工业大学(深圳) | 临床医疗实体及其属性抽取方法 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN110287479A (zh) * | 2019-05-20 | 2019-09-27 | 平安科技(深圳)有限公司 | 命名实体识别方法、电子装置及存储介质 |
CN110362660A (zh) * | 2019-07-23 | 2019-10-22 | 重庆邮电大学 | 一种基于知识图谱的电子产品质量自动检测方法 |
CN110941716A (zh) * | 2019-11-05 | 2020-03-31 | 北京航空航天大学 | 一种基于深度学习的信息安全知识图谱的自动构建方法 |
CN110825721A (zh) * | 2019-11-06 | 2020-02-21 | 武汉大学 | 大数据环境下高血压知识库构建与系统集成方法 |
CN111274373A (zh) * | 2020-01-16 | 2020-06-12 | 山东大学 | 一种基于知识图谱的电子病历问答方法及系统 |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931514A (zh) * | 2020-07-28 | 2020-11-13 | 薛杨杨 | 基于深度学习和大数据的信息处理方法及区块链服务平台 |
CN111985207A (zh) * | 2020-08-17 | 2020-11-24 | 中国人民解放军战略支援部队信息工程大学 | 一种访问控制策略的获取方法、装置及电子设备 |
CN111985207B (zh) * | 2020-08-17 | 2023-06-06 | 中国人民解放军战略支援部队信息工程大学 | 一种访问控制策略的获取方法、装置及电子设备 |
CN112100346A (zh) * | 2020-08-28 | 2020-12-18 | 西北工业大学 | 基于细粒度图像特征和外部知识相融合的视觉问答方法 |
CN112100346B (zh) * | 2020-08-28 | 2021-07-20 | 西北工业大学 | 基于细粒度图像特征和外部知识相融合的视觉问答方法 |
CN112231418A (zh) * | 2020-10-15 | 2021-01-15 | 南方电网数字电网研究院有限公司 | 电力标准知识图谱构建方法、装置、计算机设备和介质 |
CN112199487A (zh) * | 2020-10-23 | 2021-01-08 | 中国传媒大学 | 一种基于知识图谱的电影问答查询系统及其方法 |
CN112667820B (zh) * | 2020-12-08 | 2023-04-18 | 吉林省吉科软信息技术有限公司 | 全流程可追溯生态链监管知识图谱的深度学习构建方法 |
CN112667820A (zh) * | 2020-12-08 | 2021-04-16 | 吉林省吉科软信息技术有限公司 | 全流程可追溯生态链监管知识图谱的深度学习构建方法 |
CN112765310A (zh) * | 2020-12-11 | 2021-05-07 | 北京航天云路有限公司 | 一种基于深度学习与相似度匹配的知识图谱问答的方法 |
CN112507139A (zh) * | 2020-12-28 | 2021-03-16 | 深圳力维智联技术有限公司 | 基于知识图谱的问答方法、系统、设备及存储介质 |
CN112507139B (zh) * | 2020-12-28 | 2024-03-12 | 深圳力维智联技术有限公司 | 基于知识图谱的问答方法、系统、设备及存储介质 |
CN112632225B (zh) * | 2020-12-29 | 2022-08-30 | 天津汇智星源信息技术有限公司 | 基于案事件知识图谱的语义搜索方法、装置和电子设备 |
CN112632225A (zh) * | 2020-12-29 | 2021-04-09 | 天津汇智星源信息技术有限公司 | 基于案事件知识图谱的语义搜索方法、装置和电子设备 |
CN112948547A (zh) * | 2021-01-26 | 2021-06-11 | 中国石油大学(北京) | 测井知识图谱构建查询方法、装置、设备及存储介质 |
CN112948547B (zh) * | 2021-01-26 | 2024-04-09 | 中国石油大学(北京) | 测井知识图谱构建查询方法、装置、设备及存储介质 |
CN112883172A (zh) * | 2021-02-03 | 2021-06-01 | 大连理工大学 | 一种基于双重知识选择的生物医学问答方法 |
CN112883172B (zh) * | 2021-02-03 | 2022-04-12 | 大连理工大学 | 一种基于双重知识选择的生物医学问答方法 |
CN112905884A (zh) * | 2021-02-10 | 2021-06-04 | 北京百度网讯科技有限公司 | 生成序列标注模型的方法、设备、介质及程序产品 |
CN112989002A (zh) * | 2021-03-31 | 2021-06-18 | 中国工商银行股份有限公司 | 一种基于知识图谱的问答处理方法、装置及设备 |
CN112989002B (zh) * | 2021-03-31 | 2022-08-23 | 中国工商银行股份有限公司 | 一种基于知识图谱的问答处理方法、装置及设备 |
CN112989004A (zh) * | 2021-04-09 | 2021-06-18 | 苏州爱语认知智能科技有限公司 | 面向知识图谱问答的查询图排序方法及系统 |
CN113011196A (zh) * | 2021-04-28 | 2021-06-22 | 广西师范大学 | 一种概念增强表示与单向蕴含注意力的主观题自动阅卷神经网络模型 |
CN113011196B (zh) * | 2021-04-28 | 2023-01-10 | 陕西文都教育科技有限公司 | 一种概念增强表示与单向蕴含注意力的主观题自动阅卷神经网络模型 |
CN113626215B (zh) * | 2021-07-22 | 2023-08-18 | 武汉大学 | 一种基于短语识别的气象场景服务图谱构建方法及系统 |
CN113626215A (zh) * | 2021-07-22 | 2021-11-09 | 武汉大学 | 一种基于短语识别的气象场景服务图谱构建方法及系统 |
CN115577091A (zh) * | 2022-12-08 | 2023-01-06 | 成都晓多科技有限公司 | 基于知识图谱的复杂条件问题作答方法及系统 |
CN116011548A (zh) * | 2023-03-24 | 2023-04-25 | 北京澜舟科技有限公司 | 一种多知识图谱问答模型训练方法、系统及存储介质 |
CN116628315A (zh) * | 2023-04-07 | 2023-08-22 | 百度在线网络技术(北京)有限公司 | 搜索方法、深度学习模型的训练方法、装置及电子设备 |
CN116628315B (zh) * | 2023-04-07 | 2024-03-22 | 百度在线网络技术(北京)有限公司 | 搜索方法、深度学习模型的训练方法、装置及电子设备 |
CN116340547A (zh) * | 2023-05-24 | 2023-06-27 | 江苏微皓智能科技有限公司 | 一种对话式报表可视化生产方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2021139283A1 (zh) | 2021-07-15 |
CN111506722B (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111506722A (zh) | 基于深度学习技术的知识图谱问答方法、装置及设备 | |
CN112347310B (zh) | 事件处理信息的查询方法、装置、计算机设备和存储介质 | |
CN110598070B (zh) | 应用类型识别方法及装置、服务器及存储介质 | |
WO2021208696A1 (zh) | 用户意图分析方法、装置、电子设备及计算机存储介质 | |
CN111428504B (zh) | 一种事件抽取方法和装置 | |
CN113688221B (zh) | 基于模型的话术推荐方法、装置、计算机设备和存储介质 | |
CN111159387A (zh) | 基于多维度报警信息文本相似度分析的推荐方法 | |
CN109979439B (zh) | 基于区块链的语音识别方法、装置、介质及电子设备 | |
CN107193974A (zh) | 基于人工智能的地域性信息确定方法和装置 | |
KR100436678B1 (ko) | 엔드-유저 트랜잭션을 인식하기 위한 방법 및 시스템 | |
CN112559723A (zh) | 一种基于深度学习的faq检索式问答构建方法及系统 | |
CN113128196A (zh) | 文本信息处理方法及其装置、存储介质 | |
CN115310551A (zh) | 文本分析模型训练方法、装置、电子设备和存储介质 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN113627530A (zh) | 相似问题文本生成方法、装置、设备及介质 | |
CN113051384B (zh) | 基于对话的用户画像抽取方法及相关装置 | |
CN113360654B (zh) | 文本分类方法、装置、电子设备及可读存储介质 | |
CN113609866A (zh) | 文本标记方法、装置、设备及存储介质 | |
CN113821587A (zh) | 文本相关性确定方法、模型训练方法、装置及存储介质 | |
WO2023272862A1 (zh) | 基于网络行为数据的风控识别方法、装置、电子设备及介质 | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN112036151A (zh) | 基因疾病关系知识库构建方法、装置和计算机设备 | |
CN113362852A (zh) | 一种用户属性识别方法和装置 | |
CN115907968A (zh) | 一种基于人行征信的风控拒绝推断方法及设备 | |
CN112364136B (zh) | 关键词生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40033514 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |