CN116822530A - 一种基于知识图谱的问答对生成方法 - Google Patents
一种基于知识图谱的问答对生成方法 Download PDFInfo
- Publication number
- CN116822530A CN116822530A CN202310034743.XA CN202310034743A CN116822530A CN 116822530 A CN116822530 A CN 116822530A CN 202310034743 A CN202310034743 A CN 202310034743A CN 116822530 A CN116822530 A CN 116822530A
- Authority
- CN
- China
- Prior art keywords
- question
- knowledge graph
- answer
- synonym
- domain knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000002372 labelling Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 5
- 230000005484 gravity Effects 0.000 claims description 3
- 239000002689 soil Substances 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 2
- 230000005611 electricity Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱的问答对生成方法。本发明包含以下内容:首先抽取领域知识图谱中实体、关系、属性词,利用知识图谱标注策略,得到实体、关系、属性词对应的同义词;抽取连通子图,通过基于DPT‑Loss的问句生成模型生成标准问句;将匹配到的同义词通过槽位填充替换到标准问句中,得到相似问句,最后与原答案组成问答对集合。本发明根据给定领域知识图谱生成领域问答对,使用知识图谱标注策略扩展问答对多样性,增强了知识图谱在问句理解中的领域性和专业性,提高了模板匹配的准确度,同时解决了在神经网络训练时领域问答对语料不足的问题。
Description
技术领域
本发明涉及自然语言处理领域,具体涉及一种基于知识图谱的问答对生成方法。
背景技术
基于知识图谱的问句生成(KBQG)指充分利用知识图谱中知识,根据指定的答案信息,生成对应问句的问题。目前解决KBQG有三种主流方法、即基于模板的问句生成,基于Seq2Seq模型的问句生成、基于Graph2Seq模型的问句生成。
基于模板的问句生成通过人工构造问句模板,利用槽位填充生成问句;基于Seq2Seq模型的问句生成把一个三元组构造为一个序列,通过训练的Encoder-Decoder模型生成问句;基于Graph2Seq模型的问句生成保留了子图的结构信息,对整个子图进行编码,能够生成较为复杂的问句。
近来的研究主要在基于Graph2Seq模型的问句生成上,这种方式在应用复杂的KBQG时,会存在如下一些挑战:(1)现有的学习模型无法保证生成的问句在句法和语法上与答案相符;(2)现有的方法无法生成多样化的问句,从而导致在处理下游任务时准确度不高的问题;(3)现在的方法是建立在通用领域上,在回答专业性更强的问题时存在缺陷。
发明内容
本发明提出了一种基于知识图谱的问答对生成方法。针对挑战(1),对Graph2Seq模型做出改进,引入句法依存树解决语法句法上不相似的问题;针对挑战(2)(3),提出了一种对知识图谱标注的策略,通过知识图谱标注获取同义词对,增强生成问句的多样性。
一种基于知识图谱的问答对生成方法,包含以下步骤:
S1、获取领域知识图谱,根据所述领域知识图谱,对实体、关系、属性词自动化向导化标注,获取同义词对;
S2、训练基于的问句生成模型;
S21、获取开放域知识图谱,所述开放域知识图谱中包括问题和标准答案,分别将所述开放域知识图谱和所述标准答案用Graph Transformer和BiLSTM进行编码,输入到LSTM解码器中,得到所述LSTM解码器的输出,拼接所述LSTM解码器的输出,构成初始问句序列q;
S22、将初始问句序列q与步骤S21中所述开放域知识图谱中的问题,进行分词得到q1,…,qn-1,qn,其中,q1,…,qn-1,qn代表进行分词操作后得到的n个分词,利用TF-IDF算法分别计算所述n个分词q1,…,qn-1,qn的权重,得到n个分词的权重w1,…,wn-1,wn,通过BERT模型进行词嵌入,得到n个分词对应的语义向量e1,…,en-1,en;
S23、对初始问句序列q与步骤S21中所述开放域知识图谱中的问题做依存句法分析,形成对应的句法依存树,所述句法依存树的叶子结点为{qi,wi,ei},1≤i≤n;其中,qi,wi,ei分别代表第i个分词、第i个分词的权重、第i个分词对应的语义向量;
S24、将初始问句序列q的句法依存树与步骤S21中所述开放域知识图谱中问题的句法依存树中,任意两结点ni,nj进行对比,如果ni,nj均为叶子结点,则
其中Cos(ei,ej)表示ei与ej之间的余弦相似度,K表示相似度矩阵,表示结点ni与结点nj之间的相似度;
如果ni,nj中只有一个结点为叶子结点,则令
如果ni,nj两者均不是叶子结点,则将以ni,nj为根结点的子树重复S24操作,直至所有结点完成对比;
S25、对S24所述的K的每一行进行Max Pooling,得到n*1的矩阵,再对所述n*1的矩阵进行Average Pooling,得到相似度
S26、定义损失函数:
其中λ表示超参数,控制两个损失函数的比重,表示交叉墒损失函数;
S27、将损失函数的值反馈给问句生成模型,对所述问句生成模型进行微调,获取微调后的问句生成模型。
S3、从步骤S1所述的领域知识图谱中,抽取连通子图,遍历所述连通子图的数据作为答案,利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句;
S4、对于步骤S3中得到的标准问句中涉及的实体、关系、属性词,用步骤S1中得到的同义词对进行替换,得到若干个不同的相似问句,将标准问句、相似问句与S3中所述的答案进行组合,得到问答对集合。
作为优选,所述步骤S1中,所述对实体、关系、属性词自动化向导化标注的方法为:
对所述领域知识图谱中的每一个三元组中的实体、关系、属性词进行词性标注,去除被标注为虚词、数词、量词、代词的实体、关系和属性,保留被标注为名词、动词、形容词的实体、关系和属性;
作为优选,所述步骤S1中,所述获取同义词对的方法为:
定义同义词匹配模式集合P={p1,p2,...,pm},其中p指带有目标词槽位和同义词槽位的同义词匹配模式,m表示同义词匹配模式的数量;
将被标注为名词、动词、形容词的实体、关系和属性词作为目标词W,遍历所述同义词匹配模式集合P中的所有元素p∈P,将W替换到p中的目标词槽位,得到只包含同义词槽位的匹配模式pw;
在开源知识库中,按照pw进行匹配,得到W的同义词s,组成同义词对(W,s)。
作为优选,所述步骤S3中,所述连通子图为Gi(V,E),其中,i,V,E分别表示子图编号,节点集合,边集合;
所述步骤S3中,所述数据为所述连通子图Gi(V,E)中的所有实体、关系、属性词;
对步骤S3中的所述答案进行词性标注,获取答案类型信息;
步骤S3中,所述利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句,包括:将连通子图Gi(V,E)、答案、答案类型信息输入到利用步骤S27获得的微调后的问句生成模型中,所述问句生成模型输出标准问句。
本发明提出的一种基于知识图谱的问答对生成方法,首先抽取领域知识图谱中实体、关系、属性词,利用知识图谱标注策略,得到实体、关系、属性对应的同义词;抽取连通子图,通过基于的问句生成模型生成标准问句;将匹配到的同义词通过槽位填充替换到标准问句中,得到相似问句,最后与原答案组成问答对集合。本发明根据给定领域知识图谱生成领域问答对,使用知识图谱标注策略扩展问答对多样性,增强了知识图谱在问句理解中的领域性和专业性,提高了模板匹配的准确度,同时解决了在神经网络训练时领域问答对语料不足的问题。
附图说明
图1为根据本发明实施例提供的基于知识图谱的问答对生成方法的流程示意图;
具体实施方式
为了使本发明的技术方案和优点更加明确,下面将结合附图对本发明作进一步的描述说明,具体内容如下:
S1、获取领域知识图谱,根据所述领域知识图谱,对实体、关系、属性词自动化向导化标注,获取同义词对:
S11、根据给定领域知识图谱,对每一个三元组中的实体、关系、属性利用HanLP进行词性标注,去除被标注为虚词、数词、量词、代词的实体、关系和属性,保留被标注为名词、动词、形容词的实体、关系和属性;
S12、定义同义词匹配模式集合P={p1,p2,...,pm},其中p指带有目标词槽位和同义词槽位的同义词匹配模式,m代表同义词匹配模式的数量,同义词匹配模式如下,其中X表示目标词槽位,Y表示同义词槽位:
S13、在本实施例中,定义所述同义词匹配模式集合P如下:
I.X,又称Y;
II.X(Y)
III.X简称Y
IV.X,也称为Y
S14、将S11中被标注为名词、动词、形容词的实体、关系和属性作为目标词W,遍历所述同义词匹配模式集合P中的所有元素p∈P,将W替换到p中的目标词槽位,得到只包含同义词槽位的匹配模式pw;
S15、在本实施例中,抽取S11中被标注为地名的杭州电子科技大学为例,用杭州电子科技大学替换同义词匹配模式中的标准词槽位X,得到匹配模式pw如下:
I.杭州电子科技大学,又称Y;
II.杭州电子科技大学(Y)
III.杭州电子科技大学简称Y
IV.杭州电子科技大学,也称为Y
S16、在维基百科、百度百科中,按照pw进行匹配,抽取维基百科、百度百科中包含pw的句子;
S17、在本实施例中,得到所述句子如下:
I.杭州电子科技大学,又称杭电;
II.杭州电子科技大学(杭电)
III.杭州电子科技大学简称杭电
IV.杭州电子科技大学,也称为杭电
S18、根据所述pw中同义词槽位Y的位置,抽取步骤S16得到的句子中的对应词语,得到W的同义词s,组成同义词对(W,s);
S19、在本实施例中,得到同义词对(杭州电子科技大学,杭电)
S2、训练基于的问句生成模型:
S21、获取DBpedia数据,DBpedia数据中包括开放域知识图谱、问题和标准答案,分别将所述开放域知识图谱和所述标准答案用Graph Transformer和BiLSTM进行编码,输入到LSTM解码器中,拼接所述解码器的输出,构成初始问句序列q;
S22、将初始问句序列q与S21所述DBpedia中的问题,利用HanLP进行分词得到q1,…,qn-1,qn,其中,q1,…,qn-1,qn代表进行分词操作后得到的n个分词,利用TF-IDF算法分别计算n个分词q1,…,qn-1,qn的权重,得到n个分词的权重w1,…,wn-1,wn,通过BERT模型进行词嵌入,得到n个分词对应的语义向量e1,…,en-1,en;
S23、对初始问句序列q与S21所述DBpedia中的问题,利用HanLP做依存句法分析,形成对应句法依存树,所述句法依存树的叶子结点为{qi,wi,ei},1≤i≤n;其中,qi,wi,ei分别代表第i个分词、第i个分词的权重、第i个分词对应的语义向量;
S24、将初始问句序列q的句法依存树与S21所述DBpedia中的问题的句法依存树中,任意两结点ni,nj作对比,如果ni,nj均为叶子结点,则
其中Cos(ei,ej)表示ei与ej之间的余弦相似度,K表示相似度矩阵,表示结点ni与结点nj之间的相似度;
如果ni,ni中只有一个结点为叶子结点,则令
如果ni,nj两者均不是叶子结点,则将以ni,nj为根结点的子树重复S24操作,直至所有结点完成对比;
S25、对S24所述的K的每一行进行Max Pooling,得到n*1的矩阵,再对所述n*1的矩阵进行Average Pooling,得到相似度
S26、定义损失函数:
其中λ表示超参数,控制两个损失函数的比重,在本实施例中λ取0.5,表示交叉墒损失函数;
S27、将损失函数的值反馈给模型,对所述模型进行微调,获取微调后的问句生成模型。
S3、从步骤S1所述的领域知识图谱中,抽取连通子图,遍历所述连通子图的数据作为答案,利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句:
S31、从S1所述领域知识图谱中抽取连通子图Gi(V,E),遍历Gi(V,E)中所有实体、关系、属性作为答案,对答案做词性标注,获取答案类型信息,i,V,E分别表示子图编号,节点集合,边集合;
S32、在本实施例中,从S1所述领域知识图谱中抽取连通子图,用三元组形式展示为(杭州电子科技大学,位置,杭州),遍历连通子图中所有实体、关系、属性作为答案,这里以杭州为例,对杭州做词性标注,得到答案类型信息属于地名;
S33、将S31所述的连通子图、答案、答案类型信息输入到步骤S2训练得到的问句生成模型中,问句生成模型输出标准问句;
S34、在本实施例中,将(杭州电子科技大学,位置,杭州)、杭州、地名输入到问句生成模型中,问句生成模型输出标准问句:杭州电子科技大学所处位置在哪里?
S4、对于步骤S3中得到的标准问句中涉及的实体、关系、属性词,用步骤S1中得到的同义词对进行替换,得到若干个不同的相似问句,将标准问句、相似问句与S3中所述的答案进行组合,得到问答对集合:
S41、在本实施例中,将步骤S34得到的标准问句:杭州电子科技大学所处位置在哪里中的杭州电子科技大学用步骤S19得到的同义词对(杭州电子科技大学,杭电)替换,得到相似问句:杭电所处位置在哪里。将标准问句和相似问句与所述答案相组合,得到问答对(杭州电子科技大学所处位置在哪里,杭州)以及(杭电所处位置在哪里,杭州)。
Claims (4)
1.一种基于知识图谱的问答对生成方法,其特征在于,包含以下步骤:
S1、获取领域知识图谱,根据所述领域知识图谱,对实体、关系、属性词自动化向导化标注,获取同义词对;
S2、训练基于的问句生成模型;
S21、获取开放域知识图谱,所述开放域知识图谱中包括问题和标准答案,分别将所述开放域知识图谱和所述标准答案用Graph Transformer和BiLSTM进行编码,输入到LSTM解码器中,得到所述LSTM解码器的输出,拼接所述LSTM解码器的输出,构成初始问句序列q;
S22、将初始问句序列q与步骤S21中所述开放域知识图谱中的问题,进行分词得到q1,...,qn-1,qn,其中,q1,...,qn-1,qn代表进行分词操作后得到的n个分词,利用TF-IDF算法分别计算所述n个分词q1,...,qn-1,qn的权重,得到n个分词的权重w1,...,wn-1,wn,通过BERT模型进行词嵌入,得到n个分词对应的语义向量e1,...,en-1,en;
S23、对初始问句序列q与步骤S21中所述开放域知识图谱中的问题做依存句法分析,形成对应的句法依存树,所述句法依存树的叶子结点为{qi,wi,ei},1≤i≤n;其中,qi,wi,ei分别代表第i个分词、第i个分词的权重、第i个分词对应的语义向量;
S24、将初始问句序列q的句法依存树与步骤S21中所述开放域知识图谱中问题的句法依存树中,任意两结点ni,nj进行对比,如果ni,nj均为叶子结点,则
其中Cos(ei,ej)表示ei与ej之间的余弦相似度,K表示相似度矩阵,表示结点ni与结点nj之间的相似度;
如果ni,nj中只有一个结点为叶子结点,则令
如果ni,nj两者均不是叶子结点,则将以ni,nj为根结点的子树重复S24操作,直至所有结点完成对比;
S25、对S24所述的K的每一行进行Max Pooling,得到n*1的矩阵,再对所述n*1的矩阵进行Average Pooling,得到相似度
S26、定义损失函数:
其中λ表示超参数,控制两个损失函数的比重,表示交叉墒损失函数;
S27、将损失函数的值反馈给问句生成模型,对所述问句生成模型进行微调,获取微调后的问句生成模型;
S3、从步骤S1所述的领域知识图谱中,抽取连通子图,遍历所述连通子图的数据作为答案,利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句;
S4、对于步骤S3中得到的标准问句中涉及的实体、关系、属性词,用步骤S1中得到的同义词对进行替换,得到若干个不同的相似问句,将标准问句、相似问句与S3中所述的答案进行组合,得到问答对集合。
2.如权利要求1所述的一种基于知识图谱的问答对生成方法,其特征在于,
所述步骤S1中,所述对实体、关系、属性词自动化向导化标注的方法为:
对所述领域知识图谱中的每一个三元组中的实体、关系、属性词进行词性标注,去除被标注为虚词、数词、量词、代词的实体、关系和属性,保留被标注为名词、动词、形容词的实体、关系和属性。
3.如权利要求2所述的一种基于知识图谱的问答对生成方法,其特征在于,
所述步骤S1中,所述获取同义词对的方法为:
定义同义词匹配模式集合P={p1,p2,...,pm},其中p指带有目标词槽位和同义词槽位的同义词匹配模式,m表示同义词匹配模式的数量;
将被标注为名词、动词、形容词的实体、关系和属性词作为目标词W,遍历所述同义词匹配模式集合P中的所有元素p∈P,将W替换到p中的目标词槽位,得到只包含同义词槽位的匹配模式pw;
在开源知识库中,按照pw进行匹配,得到W的同义词s,组成同义词对(W,s)。
4.如权利要求3所述的一种基于知识图谱的问答对生成方法,其特征在于,
所述步骤S3中,所述连通子图为Gi(V,E),其中,i,V,E分别表示子图编号,节点集合,边集合;
所述步骤S3中,所述数据为所述连通子图Gi(V,E)中的所有实体、关系、属性;
对步骤S3中的所述答案进行词性标注,获取答案类型信息;
步骤S3中,所述利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句,包括:将连通子图Gi(V,E)、答案、答案类型信息输入到利用步骤S27获得的微调后的问句生成模型中,所述问句生成模型输出标准问句。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310034743.XA CN116822530A (zh) | 2023-01-10 | 2023-01-10 | 一种基于知识图谱的问答对生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310034743.XA CN116822530A (zh) | 2023-01-10 | 2023-01-10 | 一种基于知识图谱的问答对生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116822530A true CN116822530A (zh) | 2023-09-29 |
Family
ID=88117371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310034743.XA Pending CN116822530A (zh) | 2023-01-10 | 2023-01-10 | 一种基于知识图谱的问答对生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116822530A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094396A (zh) * | 2023-10-19 | 2023-11-21 | 北京英视睿达科技股份有限公司 | 知识抽取方法、装置、计算机设备及存储介质 |
-
2023
- 2023-01-10 CN CN202310034743.XA patent/CN116822530A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094396A (zh) * | 2023-10-19 | 2023-11-21 | 北京英视睿达科技股份有限公司 | 知识抽取方法、装置、计算机设备及存储介质 |
CN117094396B (zh) * | 2023-10-19 | 2024-01-23 | 北京英视睿达科技股份有限公司 | 知识抽取方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110825881B (zh) | 一种建立电力知识图谱的方法 | |
CN110083710B (zh) | 一种基于循环神经网络与潜变量结构的词语定义生成方法 | |
CN104050160B (zh) | 一种机器与人工翻译相融合的口语翻译方法和装置 | |
CN111259653A (zh) | 基于实体关系消歧的知识图谱问答方法、系统以及终端 | |
Dušek et al. | Training a natural language generator from unaligned data | |
CN109857846B (zh) | 用户问句与知识点的匹配方法和装置 | |
CN109062904B (zh) | 逻辑谓词提取方法和装置 | |
CN111339269A (zh) | 模板自动生成的知识图谱问答训练及应用服务系统 | |
CN117236337B (zh) | 基于混合提示学习完成历史知识图谱生成自然语言方法 | |
CN112860896A (zh) | 语料泛化方法及用于工业领域的人机对话情感分析方法 | |
CN112836525B (zh) | 一种基于人机交互机器翻译系统及其自动优化方法 | |
CN116227466B (zh) | 一种语义不同措辞相似的句子生成方法、装置及设备 | |
WO2023088278A1 (zh) | 用于验证表述的真实性的方法、设备、装置和介质 | |
CN112149427A (zh) | 动词短语蕴含图谱的构建方法及相关设备 | |
CN114297399A (zh) | 知识图谱生成方法、系统、存储介质及电子设备 | |
CN117251524A (zh) | 一种基于多策略融合的短文本分类方法 | |
Sun et al. | QuGAN: quasi generative adversarial network for Tibetan question answering corpus generation | |
CN116822530A (zh) | 一种基于知识图谱的问答对生成方法 | |
CN114282592A (zh) | 一种基于深度学习的行业文本匹配模型方法及装置 | |
Seifossadat et al. | Stochastic Data-to-Text Generation Using Syntactic Dependency Information | |
Emami et al. | Designing a deep neural network model for finding semantic similarity between short persian texts using a parallel corpus | |
Liu et al. | Adaptive Prompt Routing for Arbitrary Text Style Transfer with Pre-trained Language Models | |
CN116362331A (zh) | 一种基于人机协同构建知识图谱的知识点填充方法 | |
CN115906818A (zh) | 语法知识预测方法、装置、电子设备和存储介质 | |
CN112085985B (zh) | 一种面向英语考试翻译题目的学生答案自动评分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |