CN116822530A - 一种基于知识图谱的问答对生成方法 - Google Patents

一种基于知识图谱的问答对生成方法 Download PDF

Info

Publication number
CN116822530A
CN116822530A CN202310034743.XA CN202310034743A CN116822530A CN 116822530 A CN116822530 A CN 116822530A CN 202310034743 A CN202310034743 A CN 202310034743A CN 116822530 A CN116822530 A CN 116822530A
Authority
CN
China
Prior art keywords
question
knowledge graph
answer
synonym
domain knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310034743.XA
Other languages
English (en)
Inventor
徐小良
张吉锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Zhejiang Lab
Original Assignee
Hangzhou Dianzi University
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University, Zhejiang Lab filed Critical Hangzhou Dianzi University
Priority to CN202310034743.XA priority Critical patent/CN116822530A/zh
Publication of CN116822530A publication Critical patent/CN116822530A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱的问答对生成方法。本发明包含以下内容:首先抽取领域知识图谱中实体、关系、属性词,利用知识图谱标注策略,得到实体、关系、属性词对应的同义词;抽取连通子图,通过基于DPT‑Loss的问句生成模型生成标准问句;将匹配到的同义词通过槽位填充替换到标准问句中,得到相似问句,最后与原答案组成问答对集合。本发明根据给定领域知识图谱生成领域问答对,使用知识图谱标注策略扩展问答对多样性,增强了知识图谱在问句理解中的领域性和专业性,提高了模板匹配的准确度,同时解决了在神经网络训练时领域问答对语料不足的问题。

Description

一种基于知识图谱的问答对生成方法
技术领域
本发明涉及自然语言处理领域,具体涉及一种基于知识图谱的问答对生成方法。
背景技术
基于知识图谱的问句生成(KBQG)指充分利用知识图谱中知识,根据指定的答案信息,生成对应问句的问题。目前解决KBQG有三种主流方法、即基于模板的问句生成,基于Seq2Seq模型的问句生成、基于Graph2Seq模型的问句生成。
基于模板的问句生成通过人工构造问句模板,利用槽位填充生成问句;基于Seq2Seq模型的问句生成把一个三元组构造为一个序列,通过训练的Encoder-Decoder模型生成问句;基于Graph2Seq模型的问句生成保留了子图的结构信息,对整个子图进行编码,能够生成较为复杂的问句。
近来的研究主要在基于Graph2Seq模型的问句生成上,这种方式在应用复杂的KBQG时,会存在如下一些挑战:(1)现有的学习模型无法保证生成的问句在句法和语法上与答案相符;(2)现有的方法无法生成多样化的问句,从而导致在处理下游任务时准确度不高的问题;(3)现在的方法是建立在通用领域上,在回答专业性更强的问题时存在缺陷。
发明内容
本发明提出了一种基于知识图谱的问答对生成方法。针对挑战(1),对Graph2Seq模型做出改进,引入句法依存树解决语法句法上不相似的问题;针对挑战(2)(3),提出了一种对知识图谱标注的策略,通过知识图谱标注获取同义词对,增强生成问句的多样性。
一种基于知识图谱的问答对生成方法,包含以下步骤:
S1、获取领域知识图谱,根据所述领域知识图谱,对实体、关系、属性词自动化向导化标注,获取同义词对;
S2、训练基于的问句生成模型;
S21、获取开放域知识图谱,所述开放域知识图谱中包括问题和标准答案,分别将所述开放域知识图谱和所述标准答案用Graph Transformer和BiLSTM进行编码,输入到LSTM解码器中,得到所述LSTM解码器的输出,拼接所述LSTM解码器的输出,构成初始问句序列q;
S22、将初始问句序列q与步骤S21中所述开放域知识图谱中的问题,进行分词得到q1,…,qn-1,qn,其中,q1,…,qn-1,qn代表进行分词操作后得到的n个分词,利用TF-IDF算法分别计算所述n个分词q1,…,qn-1,qn的权重,得到n个分词的权重w1,…,wn-1,wn,通过BERT模型进行词嵌入,得到n个分词对应的语义向量e1,…,en-1,en
S23、对初始问句序列q与步骤S21中所述开放域知识图谱中的问题做依存句法分析,形成对应的句法依存树,所述句法依存树的叶子结点为{qi,wi,ei},1≤i≤n;其中,qi,wi,ei分别代表第i个分词、第i个分词的权重、第i个分词对应的语义向量;
S24、将初始问句序列q的句法依存树与步骤S21中所述开放域知识图谱中问题的句法依存树中,任意两结点ni,nj进行对比,如果ni,nj均为叶子结点,则
其中Cos(ei,ej)表示ei与ej之间的余弦相似度,K表示相似度矩阵,表示结点ni与结点nj之间的相似度;
如果ni,nj中只有一个结点为叶子结点,则令
如果ni,nj两者均不是叶子结点,则将以ni,nj为根结点的子树重复S24操作,直至所有结点完成对比;
S25、对S24所述的K的每一行进行Max Pooling,得到n*1的矩阵,再对所述n*1的矩阵进行Average Pooling,得到相似度
S26、定义损失函数:
其中λ表示超参数,控制两个损失函数的比重,表示交叉墒损失函数;
S27、将损失函数的值反馈给问句生成模型,对所述问句生成模型进行微调,获取微调后的问句生成模型。
S3、从步骤S1所述的领域知识图谱中,抽取连通子图,遍历所述连通子图的数据作为答案,利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句;
S4、对于步骤S3中得到的标准问句中涉及的实体、关系、属性词,用步骤S1中得到的同义词对进行替换,得到若干个不同的相似问句,将标准问句、相似问句与S3中所述的答案进行组合,得到问答对集合。
作为优选,所述步骤S1中,所述对实体、关系、属性词自动化向导化标注的方法为:
对所述领域知识图谱中的每一个三元组中的实体、关系、属性词进行词性标注,去除被标注为虚词、数词、量词、代词的实体、关系和属性,保留被标注为名词、动词、形容词的实体、关系和属性;
作为优选,所述步骤S1中,所述获取同义词对的方法为:
定义同义词匹配模式集合P={p1,p2,...,pm},其中p指带有目标词槽位和同义词槽位的同义词匹配模式,m表示同义词匹配模式的数量;
将被标注为名词、动词、形容词的实体、关系和属性词作为目标词W,遍历所述同义词匹配模式集合P中的所有元素p∈P,将W替换到p中的目标词槽位,得到只包含同义词槽位的匹配模式pw
在开源知识库中,按照pw进行匹配,得到W的同义词s,组成同义词对(W,s)。
作为优选,所述步骤S3中,所述连通子图为Gi(V,E),其中,i,V,E分别表示子图编号,节点集合,边集合;
所述步骤S3中,所述数据为所述连通子图Gi(V,E)中的所有实体、关系、属性词;
对步骤S3中的所述答案进行词性标注,获取答案类型信息;
步骤S3中,所述利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句,包括:将连通子图Gi(V,E)、答案、答案类型信息输入到利用步骤S27获得的微调后的问句生成模型中,所述问句生成模型输出标准问句。
本发明提出的一种基于知识图谱的问答对生成方法,首先抽取领域知识图谱中实体、关系、属性词,利用知识图谱标注策略,得到实体、关系、属性对应的同义词;抽取连通子图,通过基于的问句生成模型生成标准问句;将匹配到的同义词通过槽位填充替换到标准问句中,得到相似问句,最后与原答案组成问答对集合。本发明根据给定领域知识图谱生成领域问答对,使用知识图谱标注策略扩展问答对多样性,增强了知识图谱在问句理解中的领域性和专业性,提高了模板匹配的准确度,同时解决了在神经网络训练时领域问答对语料不足的问题。
附图说明
图1为根据本发明实施例提供的基于知识图谱的问答对生成方法的流程示意图;
具体实施方式
为了使本发明的技术方案和优点更加明确,下面将结合附图对本发明作进一步的描述说明,具体内容如下:
S1、获取领域知识图谱,根据所述领域知识图谱,对实体、关系、属性词自动化向导化标注,获取同义词对:
S11、根据给定领域知识图谱,对每一个三元组中的实体、关系、属性利用HanLP进行词性标注,去除被标注为虚词、数词、量词、代词的实体、关系和属性,保留被标注为名词、动词、形容词的实体、关系和属性;
S12、定义同义词匹配模式集合P={p1,p2,...,pm},其中p指带有目标词槽位和同义词槽位的同义词匹配模式,m代表同义词匹配模式的数量,同义词匹配模式如下,其中X表示目标词槽位,Y表示同义词槽位:
S13、在本实施例中,定义所述同义词匹配模式集合P如下:
I.X,又称Y;
II.X(Y)
III.X简称Y
IV.X,也称为Y
S14、将S11中被标注为名词、动词、形容词的实体、关系和属性作为目标词W,遍历所述同义词匹配模式集合P中的所有元素p∈P,将W替换到p中的目标词槽位,得到只包含同义词槽位的匹配模式pw
S15、在本实施例中,抽取S11中被标注为地名的杭州电子科技大学为例,用杭州电子科技大学替换同义词匹配模式中的标准词槽位X,得到匹配模式pw如下:
I.杭州电子科技大学,又称Y;
II.杭州电子科技大学(Y)
III.杭州电子科技大学简称Y
IV.杭州电子科技大学,也称为Y
S16、在维基百科、百度百科中,按照pw进行匹配,抽取维基百科、百度百科中包含pw的句子;
S17、在本实施例中,得到所述句子如下:
I.杭州电子科技大学,又称杭电;
II.杭州电子科技大学(杭电)
III.杭州电子科技大学简称杭电
IV.杭州电子科技大学,也称为杭电
S18、根据所述pw中同义词槽位Y的位置,抽取步骤S16得到的句子中的对应词语,得到W的同义词s,组成同义词对(W,s);
S19、在本实施例中,得到同义词对(杭州电子科技大学,杭电)
S2、训练基于的问句生成模型:
S21、获取DBpedia数据,DBpedia数据中包括开放域知识图谱、问题和标准答案,分别将所述开放域知识图谱和所述标准答案用Graph Transformer和BiLSTM进行编码,输入到LSTM解码器中,拼接所述解码器的输出,构成初始问句序列q;
S22、将初始问句序列q与S21所述DBpedia中的问题,利用HanLP进行分词得到q1,…,qn-1,qn,其中,q1,…,qn-1,qn代表进行分词操作后得到的n个分词,利用TF-IDF算法分别计算n个分词q1,…,qn-1,qn的权重,得到n个分词的权重w1,…,wn-1,wn,通过BERT模型进行词嵌入,得到n个分词对应的语义向量e1,…,en-1,en
S23、对初始问句序列q与S21所述DBpedia中的问题,利用HanLP做依存句法分析,形成对应句法依存树,所述句法依存树的叶子结点为{qi,wi,ei},1≤i≤n;其中,qi,wi,ei分别代表第i个分词、第i个分词的权重、第i个分词对应的语义向量;
S24、将初始问句序列q的句法依存树与S21所述DBpedia中的问题的句法依存树中,任意两结点ni,nj作对比,如果ni,nj均为叶子结点,则
其中Cos(ei,ej)表示ei与ej之间的余弦相似度,K表示相似度矩阵,表示结点ni与结点nj之间的相似度;
如果ni,ni中只有一个结点为叶子结点,则令
如果ni,nj两者均不是叶子结点,则将以ni,nj为根结点的子树重复S24操作,直至所有结点完成对比;
S25、对S24所述的K的每一行进行Max Pooling,得到n*1的矩阵,再对所述n*1的矩阵进行Average Pooling,得到相似度
S26、定义损失函数:
其中λ表示超参数,控制两个损失函数的比重,在本实施例中λ取0.5,表示交叉墒损失函数;
S27、将损失函数的值反馈给模型,对所述模型进行微调,获取微调后的问句生成模型。
S3、从步骤S1所述的领域知识图谱中,抽取连通子图,遍历所述连通子图的数据作为答案,利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句:
S31、从S1所述领域知识图谱中抽取连通子图Gi(V,E),遍历Gi(V,E)中所有实体、关系、属性作为答案,对答案做词性标注,获取答案类型信息,i,V,E分别表示子图编号,节点集合,边集合;
S32、在本实施例中,从S1所述领域知识图谱中抽取连通子图,用三元组形式展示为(杭州电子科技大学,位置,杭州),遍历连通子图中所有实体、关系、属性作为答案,这里以杭州为例,对杭州做词性标注,得到答案类型信息属于地名;
S33、将S31所述的连通子图、答案、答案类型信息输入到步骤S2训练得到的问句生成模型中,问句生成模型输出标准问句;
S34、在本实施例中,将(杭州电子科技大学,位置,杭州)、杭州、地名输入到问句生成模型中,问句生成模型输出标准问句:杭州电子科技大学所处位置在哪里?
S4、对于步骤S3中得到的标准问句中涉及的实体、关系、属性词,用步骤S1中得到的同义词对进行替换,得到若干个不同的相似问句,将标准问句、相似问句与S3中所述的答案进行组合,得到问答对集合:
S41、在本实施例中,将步骤S34得到的标准问句:杭州电子科技大学所处位置在哪里中的杭州电子科技大学用步骤S19得到的同义词对(杭州电子科技大学,杭电)替换,得到相似问句:杭电所处位置在哪里。将标准问句和相似问句与所述答案相组合,得到问答对(杭州电子科技大学所处位置在哪里,杭州)以及(杭电所处位置在哪里,杭州)。

Claims (4)

1.一种基于知识图谱的问答对生成方法,其特征在于,包含以下步骤:
S1、获取领域知识图谱,根据所述领域知识图谱,对实体、关系、属性词自动化向导化标注,获取同义词对;
S2、训练基于的问句生成模型;
S21、获取开放域知识图谱,所述开放域知识图谱中包括问题和标准答案,分别将所述开放域知识图谱和所述标准答案用Graph Transformer和BiLSTM进行编码,输入到LSTM解码器中,得到所述LSTM解码器的输出,拼接所述LSTM解码器的输出,构成初始问句序列q;
S22、将初始问句序列q与步骤S21中所述开放域知识图谱中的问题,进行分词得到q1,...,qn-1,qn,其中,q1,...,qn-1,qn代表进行分词操作后得到的n个分词,利用TF-IDF算法分别计算所述n个分词q1,...,qn-1,qn的权重,得到n个分词的权重w1,...,wn-1,wn,通过BERT模型进行词嵌入,得到n个分词对应的语义向量e1,...,en-1,en
S23、对初始问句序列q与步骤S21中所述开放域知识图谱中的问题做依存句法分析,形成对应的句法依存树,所述句法依存树的叶子结点为{qi,wi,ei},1≤i≤n;其中,qi,wi,ei分别代表第i个分词、第i个分词的权重、第i个分词对应的语义向量;
S24、将初始问句序列q的句法依存树与步骤S21中所述开放域知识图谱中问题的句法依存树中,任意两结点ni,nj进行对比,如果ni,nj均为叶子结点,则
其中Cos(ei,ej)表示ei与ej之间的余弦相似度,K表示相似度矩阵,表示结点ni与结点nj之间的相似度;
如果ni,nj中只有一个结点为叶子结点,则令
如果ni,nj两者均不是叶子结点,则将以ni,nj为根结点的子树重复S24操作,直至所有结点完成对比;
S25、对S24所述的K的每一行进行Max Pooling,得到n*1的矩阵,再对所述n*1的矩阵进行Average Pooling,得到相似度
S26、定义损失函数:
其中λ表示超参数,控制两个损失函数的比重,表示交叉墒损失函数;
S27、将损失函数的值反馈给问句生成模型,对所述问句生成模型进行微调,获取微调后的问句生成模型;
S3、从步骤S1所述的领域知识图谱中,抽取连通子图,遍历所述连通子图的数据作为答案,利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句;
S4、对于步骤S3中得到的标准问句中涉及的实体、关系、属性词,用步骤S1中得到的同义词对进行替换,得到若干个不同的相似问句,将标准问句、相似问句与S3中所述的答案进行组合,得到问答对集合。
2.如权利要求1所述的一种基于知识图谱的问答对生成方法,其特征在于,
所述步骤S1中,所述对实体、关系、属性词自动化向导化标注的方法为:
对所述领域知识图谱中的每一个三元组中的实体、关系、属性词进行词性标注,去除被标注为虚词、数词、量词、代词的实体、关系和属性,保留被标注为名词、动词、形容词的实体、关系和属性。
3.如权利要求2所述的一种基于知识图谱的问答对生成方法,其特征在于,
所述步骤S1中,所述获取同义词对的方法为:
定义同义词匹配模式集合P={p1,p2,...,pm},其中p指带有目标词槽位和同义词槽位的同义词匹配模式,m表示同义词匹配模式的数量;
将被标注为名词、动词、形容词的实体、关系和属性词作为目标词W,遍历所述同义词匹配模式集合P中的所有元素p∈P,将W替换到p中的目标词槽位,得到只包含同义词槽位的匹配模式pw
在开源知识库中,按照pw进行匹配,得到W的同义词s,组成同义词对(W,s)。
4.如权利要求3所述的一种基于知识图谱的问答对生成方法,其特征在于,
所述步骤S3中,所述连通子图为Gi(V,E),其中,i,V,E分别表示子图编号,节点集合,边集合;
所述步骤S3中,所述数据为所述连通子图Gi(V,E)中的所有实体、关系、属性;
对步骤S3中的所述答案进行词性标注,获取答案类型信息;
步骤S3中,所述利用步骤S27获得的微调后的问句生成模型,生成与所述答案相对应的标准问句,包括:将连通子图Gi(V,E)、答案、答案类型信息输入到利用步骤S27获得的微调后的问句生成模型中,所述问句生成模型输出标准问句。
CN202310034743.XA 2023-01-10 2023-01-10 一种基于知识图谱的问答对生成方法 Pending CN116822530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310034743.XA CN116822530A (zh) 2023-01-10 2023-01-10 一种基于知识图谱的问答对生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310034743.XA CN116822530A (zh) 2023-01-10 2023-01-10 一种基于知识图谱的问答对生成方法

Publications (1)

Publication Number Publication Date
CN116822530A true CN116822530A (zh) 2023-09-29

Family

ID=88117371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310034743.XA Pending CN116822530A (zh) 2023-01-10 2023-01-10 一种基于知识图谱的问答对生成方法

Country Status (1)

Country Link
CN (1) CN116822530A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094396A (zh) * 2023-10-19 2023-11-21 北京英视睿达科技股份有限公司 知识抽取方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094396A (zh) * 2023-10-19 2023-11-21 北京英视睿达科技股份有限公司 知识抽取方法、装置、计算机设备及存储介质
CN117094396B (zh) * 2023-10-19 2024-01-23 北京英视睿达科技股份有限公司 知识抽取方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN110825881B (zh) 一种建立电力知识图谱的方法
CN110083710B (zh) 一种基于循环神经网络与潜变量结构的词语定义生成方法
CN104050160B (zh) 一种机器与人工翻译相融合的口语翻译方法和装置
CN111259653A (zh) 基于实体关系消歧的知识图谱问答方法、系统以及终端
Dušek et al. Training a natural language generator from unaligned data
CN109857846B (zh) 用户问句与知识点的匹配方法和装置
CN109062904B (zh) 逻辑谓词提取方法和装置
CN111339269A (zh) 模板自动生成的知识图谱问答训练及应用服务系统
CN117236337B (zh) 基于混合提示学习完成历史知识图谱生成自然语言方法
CN112860896A (zh) 语料泛化方法及用于工业领域的人机对话情感分析方法
CN112836525B (zh) 一种基于人机交互机器翻译系统及其自动优化方法
CN116227466B (zh) 一种语义不同措辞相似的句子生成方法、装置及设备
WO2023088278A1 (zh) 用于验证表述的真实性的方法、设备、装置和介质
CN112149427A (zh) 动词短语蕴含图谱的构建方法及相关设备
CN114297399A (zh) 知识图谱生成方法、系统、存储介质及电子设备
CN117251524A (zh) 一种基于多策略融合的短文本分类方法
Sun et al. QuGAN: quasi generative adversarial network for Tibetan question answering corpus generation
CN116822530A (zh) 一种基于知识图谱的问答对生成方法
CN114282592A (zh) 一种基于深度学习的行业文本匹配模型方法及装置
Seifossadat et al. Stochastic Data-to-Text Generation Using Syntactic Dependency Information
Emami et al. Designing a deep neural network model for finding semantic similarity between short persian texts using a parallel corpus
Liu et al. Adaptive Prompt Routing for Arbitrary Text Style Transfer with Pre-trained Language Models
CN116362331A (zh) 一种基于人机协同构建知识图谱的知识点填充方法
CN115906818A (zh) 语法知识预测方法、装置、电子设备和存储介质
CN112085985B (zh) 一种面向英语考试翻译题目的学生答案自动评分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination