CN113626574A - 一种信息查询方法及系统及装置及介质 - Google Patents

一种信息查询方法及系统及装置及介质 Download PDF

Info

Publication number
CN113626574A
CN113626574A CN202110952984.3A CN202110952984A CN113626574A CN 113626574 A CN113626574 A CN 113626574A CN 202110952984 A CN202110952984 A CN 202110952984A CN 113626574 A CN113626574 A CN 113626574A
Authority
CN
China
Prior art keywords
node
information
query
nodes
constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110952984.3A
Other languages
English (en)
Other versions
CN113626574B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shulian Cloud Computing Technology Co ltd
Original Assignee
Chengdu Shulian Cloud Computing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shulian Cloud Computing Technology Co ltd filed Critical Chengdu Shulian Cloud Computing Technology Co ltd
Priority to CN202110952984.3A priority Critical patent/CN113626574B/zh
Publication of CN113626574A publication Critical patent/CN113626574A/zh
Application granted granted Critical
Publication of CN113626574B publication Critical patent/CN113626574B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息查询方法及系统及装置及介质,涉及自然语言处理领域,包括:对编码后的查询输入信息进行实体识别,生成本体子图;对所述本体子图中的节点进行分类,获得节点分类标签;生成所述本体子图中约束节点的类型和约束条件;基于所述分类标签,获得查询图;获得知识库中对应的实体集合;基于所述实体集合中的实体信息,获得所述信息查询路径的主题节点和连接节点;基于所述信息查询路径的主题节点、所述信息查询路径的连接节点、所述约束节点的类型、所述约束条件和所述查询图,生成所述信息查询路径;执行所述信息查询路径,获得与所述查询输入信息对应的结果,本方法提高了信息查询的效率。

Description

一种信息查询方法及系统及装置及介质
技术领域
本发明涉及自然语言处理领域,具体地,涉及一种信息查询方法及系统及装置及介质。
背景技术
智能问答是当前自然语言处理领域一个重要的研究方向,具有广阔的应用前景,随着知识库相关技术的研究,近年来不断取得新的突破,基于知识库的问答(KBQA:Knowledge Base Question Answer)技术也引起了越来越多研究者的关注。KBQA通常指通过对给定的自然语言问题进行语义理解和解析,再结合知识库中的结构化知识,推理得出答案。目前基于KBQA的智能问答通常使用基于信息检索的方法,即:直接利用问题所表达的语义信息从知识库中检索答案,例如将自然语言问题和知识库中的候选答案进行嵌入编码,再根据问题和答案的语义匹配程度查找和排序答案。基于语义解析的方法通常将自然语言问题转化成可以在知识库中进行查询的逻辑表达式,例如根据自然语言问题生成查询图,然后在知识图谱上进行查询。如对于如下的自然语言问题:
广东省有多少人口?
基于信息检索的方法主要包括以下几个步骤:
(1)识别出问题中的主题词“广东省”,通过实体链接方式找到“广东省”在知识库中对应的实体,并将其邻居节点作为问题的候选答案,如图1中的“179725平方千米”,“10430万人”,“110760亿”。
(2)使用LSTM或者Transformer等编码器对自然语言问题“广东省有多少人口?”进行编码。
(3)在图一中,生成主题词“广东省”到候选答案的路径,如下:
<广东省,面积,179725平方千米>
<广东省,人口,10430万人>
<广东省,地区生成总值,110760亿>
使用LSTM或者Transformer等编码器对上述路径进行编码。
(4)计算问题编码和候选答案编码之间的语义匹配程度并进行排序,选择得分最高的候选答案作为问题的最终答案。
基于信息检索的方法可以很好的处理简单问题的回答,但是对于添加了聚合等约束条件的复杂问题难以解决,无法根据问句的语义信息编码直接到知识库中匹配问题的答案,必须利用语义解析的方法识别出问题答案在知识库中的主题词,核心路径,约束条件等信息,对于这类问题通常利用语义解析的方法结合问句提供的信息生成查询图,再在知识库上执行查询图,查找到问题在知识库中的答案,
目前业界主流的KBQA方法主要研究知识库中单跳简单问题的问答技术,对于多约束条件,多跳推理问题主要以问题中的实体作为种子节点在知识库中通过多步游走生成查询图,由于知识库中有的实体节点的邻居节点规模巨大,直接在实体知识库中游走效率低下,急需一种高效的信息查询方法。
发明内容
为了提高信息查询的效率,本发明提供了一种信息查询方法及系统及装置及介质。
为实现上述发明目的,本发明提供了一种信息查询方法,所述方法包括:
对编码后的查询输入信息进行实体识别,获得第一实体集合;
基于所述第一实体集合中实体信息的类型,获得第一本体集合后生成本体子图;
对所述本体子图中的节点进行分类,获得节点分类标签,节点类型包括:主题节点和约束节点,以及用于信息查询路径上各节点连接的连接节点;
基于所述约束节点和所述信息查询路径上的其他节点,生成所述本体子图中约束节点的类型和约束条件;
基于所述分类标签,获得查询图;
获得知识库中与所述第一实体集合对应的第二实体集合;
基于所述第二实体集合中的实体信息,获得所述信息查询路径的主题节点和连接节点;
基于所述信息查询路径的主题节点、所述信息查询路径的连接节点、所述约束节点的类型、所述约束条件和所述查询图,生成所述信息查询路径;
在所述知识库中执行所述信息查询路径,获得与所述查询输入信息对应的结果。
其中,本方法找到查询输入信息中相关实体对应于知识库中的实体,然后根据所找到的实体选择其n跳的邻居节点构成本体子图,通过本体子图推理出答案候选路径得到相关答案,本方法在本体子图上推理,与传统方法直接在实体子图上进行推理更加高效快捷,避免了无目标的在知识库中庞大规模的邻居节点中游走,提供了信息查询的效率。
优选的,本方法中所述节点类型包括:主题节点、答案节点、中间节点、连接节点、约束节点和无关节点。为了生成查询图,需要对本体子图的节点进行分类,然后再根据各个节点的类型构造查询图。对节点进行分类可以在生成查询图时根据节点的类型挑选需要的节点,然后过滤不需要的节点,可以使得减少不必要的查询推理,提高查询的效率。
优选的,本方法中所述主题节点为所述信息查询路径的起始节点;
所述答案节点为所述查询输入信息对应的结果在所述本体子图上所对应的节点;
所述中间节点为所述主题节点到所述答案节点路径上的中间节点;
所述约束节点为对所述主题节点到所述答案节点路径上节点进行约束的节点;
所述无关节点为与所述查询输入信息对应结果查找无关的节点。
其中,本方法定义了主题节点、答案节点、中间节点、约束节点和无关节点,通过上述的节点定义可以准确的对节点进行分类。
优选的,本方法中以所述第一本体集合中的本体类型为起始节点,在本体网络中遍历当前起始节点的N跳邻居节点,生成与所述查询输入信息对应的所述本体子图,N为推理的步数。与现有方法的区别是,本方法以本体类型为起始节点,然后遍历相应的邻居节点,生成本体子图,本发明中的信息查询方法在本体子图上进行推理,相较于传统直接在实体子图上进行推理更加高效快捷。
优选的,本方法中将所述本体子图中约束节点与所述信息查询路径上的节点进行组合,获得节点组合,将所述节点组合转为文本表示,获得节点组合文本,将所述节点组合文本与所述查询输入信息进行拼接,获得拼接结果;将所述拼接结果编码,获得第二编码信息;基于所述第二编码信息获得所述本体子图中约束节点的类型,从所述第二编码信息中抽取所述约束条件。通过将所述节点组合文本与查询输入信息进行拼接,然后将拼接结果编码,基于编码信息获得本体子图中约束节点的类型,从编码信息中抽取约束条件,通过上述方式,能够获得与查询输入信息对应的约束节点的类型和约束条件,进而能够通过约束节点的类型和约束条件约束查询图生成信息查询路径。
其中,对于分类后的本体子图中的约束节点,需要进一步辨别其约束类型,抽取约束条件。
优选的,本方法中将所述第一实体集合中的实体通过实体链接对齐到知识库中对应的实体,获得所述第二实体集合。
优选的,本方法中所述约束节点的类型包括:排序类型、计数类型、比较类型和均值类型。其中,通过对约束节点进行分类,便于生成更加准确有效的约束条件来约束查询图,进而能够更加准确高效的生成信息查询路径。
优选的,本方法中利用BERT模型对所述查询输入信息进行编码,获得所述第一编码信息,利用命名实体识别模型NER识别所述第一编码信息中的实体。通过BERT模型能够方便对信息进行编码。
优选的,本方法中对于所述本体子图中的每个节点利用图神经网络得到节点的向量表示,将所述向量表示投影到节点的类别空间,利用分类函数对节点进行分类。
优选的,本方法中利用图神经网络得到节点的向量表示,具体包括:
生成当前节点的邻居节点聚合信息;
基于所述邻居节点聚合信息,利用循环神经网络GRU更新得到当前节点的向量表示。
优选的,本方法中所述查询输入信息中的单词来源于词汇库,所述查询输入信息为
Figure BDA0003219232800000041
iq=1,2,…,nq,nq表示所述查询输入信息中单词的个数,v表示所述词汇库的大小,W表示所述词汇库空间大小,所述第一实体集合
Figure BDA0003219232800000042
其中
Figure BDA0003219232800000043
表示所述查询输入信息中的第ie个实体,
Figure BDA0003219232800000044
包含所述查询输入信息中的me个单词,ne代表所述查询输入信息中实体的个数,第一本体集合
Figure BDA0003219232800000045
其中
Figure BDA0003219232800000046
代表所述第一实体集合的第io个本体类型,no代表所述第一实体集合的本体类型总数,所述第一本体集合中的本体类型
Figure BDA0003219232800000047
对应所述查询输入信息中一个或者多个实体
Figure BDA0003219232800000048
的本体类型标签,mo代表本体类型
Figure BDA0003219232800000049
在所述查询输入信息中对应的实体个数。
其中,将查询输入信息的文本信息引入到本体子图中节点邻居信息的更新,相较于传统节点的更新方法更能够关注到与查询输入信息相关的邻居节点,进而能够快速且准确的找到相关邻居节点,能够高效且准确的生成查询图,并且引入GRU更新本体子图的节点信息,更能够捕捉到本体子图中与查询输入信息相关路径的时序信息,进而能够高效快速的生成相关路径。
优选的,本方法基于所述信息查询路径的主题节点和所述信息查询路径的连接节点在所述查询图中生成若干条第一中间查询路径;
基于所述约束节点的类型约束所述第一中间查询路径,获得若干条第二中间查询路径;
基于所述约束条件约束所述第二中间查询路径,获得所述信息查询路径。
本发明还提供了一种信息查询系统,所述系统包括:
实体识别单元,用于对编码后的查询输入信息进行实体识别,获得第一实体集合;
本体子图生成单元,用于基于所述第一实体集合中实体信息的类型,获得第一本体集合后生成本体子图;
节点分类单元,用于对所述本体子图中的节点进行分类,获得节点分类标签,节点类型包括:主题节点和约束节点,以及用于信息查询路径上各节点连接的连接节点;
约束节点的类型和约束条件生成单元,用于基于所述约束节点和所述信息查询路径上的其他节点,生成所述本体子图中约束节点的类型和约束条件;
查询图获得单元,用于基于所述分类标签,获得查询图;
第二实体集合获得单元,用于获得知识库中与所述第一实体集合对应的第二实体集合;
主题节点和连接节点获得单元,用于基于所述第二实体集合中的实体信息,获得所述信息查询路径的主题节点和连接节点;
信息查询路径生成单元,用于基于所述信息查询路径的主题节点、所述信息查询路径的连接节点、所述约束节点的类型、所述约束条件和所述查询图,生成所述信息查询路径;
结果获得单元,用于在所述知识库中执行所述信息查询路径,获得与所述查询输入信息对应的结果。
本发明还提供了一种信息查询装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述信息查询方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述信息查询方法的步骤。
本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明中的信息查询方法在本体子图上进行推理,相较于传统直接在实体子图上进行推理更加高效快捷。
本发明将查询输入信息的文本信息引入到本体子图中节点邻居信息的更新,相较于传统节点的更新方法更能够关注到与查询输入信息相关的邻居节点,进而能够快速且准确的找到相关邻居节点,能够高效且准确的生成查询图。
本发明引入GRU更新本体子图的节点信息,更能够捕捉到本体子图中与查询输入信息相关路径的时序信息,进而能够高效快速的生成相关路径。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1是简单问题候选答案示意图;
图2是复杂问题查询图示意图;
图3是本方法架构示意图;
图4是复杂问题知识库本体示意图;
图5是问题相关本体的2阶邻居节点示意图;
图6是问题相关本体子图的节点划分示意图;
图7是本系统组成示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书使用流程图说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
实施例一
本实施例一提供了一种信息查询方法,本方法为基于本体推理的复杂问题问答方法,本方法中的查询输入信息通常为问句,也可以为其他形式的查询输入信息,本实施例不对查询输入信息的具体展现形式进行限定。
本方法首先利用实体链接方法找到问句中相关实体对应于知识库中的实体。然后根据所找到的实体选择其n跳的邻居节点构成本体子图。通过本体子图推理出答案候选路径得到相关答案。具体步骤包括:
问题中的实体识别与实体链接:
对于输入的问题
Figure BDA0003219232800000061
其单词来源于词汇库,
Figure BDA0003219232800000062
iq=1,2,...,nq,nq表示问题中单词的个数,v表示词汇库的大小,W表示词汇库空间。首先利用BERT对输入的问题进行编码,得到问题的编码序列xq和全局编码xcls,然后将编码后的序列xq经过命名实体识别模型NER检测问题中的实体,记实体集合
Figure BDA0003219232800000063
其中
Figure BDA0003219232800000064
表示问句中的第ie个实体,其包含问题中的me个单词,ne代表问题中实体的个数,公式表达如下:
Figure BDA0003219232800000071
Eq=NER(xq)
其中,d代表词向量的维度,对于实体集合
Figure BDA0003219232800000072
根据实体类型获取其本体集合
Figure BDA0003219232800000073
其中
Figure BDA0003219232800000074
代表问题中实体集合的第io个本体类型,no代表问题中实体集合的本体类型总数,本体集合中的本体类型
Figure BDA0003219232800000075
对应问题中一个或者多个实体
Figure BDA0003219232800000076
的本体类型标签,mo代表本体类型
Figure BDA0003219232800000077
在问题中对应的实体个数。
问句相关实体的多跳本体子图生成:
以Oq中的本体类型作为起始节点,在本体网络上遍历当前节点的N跳邻居节点,生成问题相关的本体子图Os(Vs,Es),N代表推理的步数。Vs代表问句中提及的本体类型节点及其在本体网络中所有的N阶及以内的邻居节点,Es代表Vs中所有节点形成的边。
本体子图的推理:
本体子图的推理主要包括本体子图节点的分类以及查询图约束节点的类型划分和约束条件抽取。
(1)本体子图的节点分类
为了生成查询图,需要对本体子图的节点进行分类,然后再根据各个节点的类型构造查询图,具体地,将本体子图Os(Vs,Es)上的节点划分为如下六类,如图2所示。
1)主题节点,代表答案查询核心路径的起始节点,为问句中主题词的本体类型。
2)答案节点,问题的答案在本体上所对应的节点。
3)中间节点,代表主题节点到答案节点路径上的中间节点。
4)连接节点,代表与答案路径上的主题节点、中间节点、答案节点相连接的本体节点,该节点需要在问句中出现,但是不必在答案查询核心路径上,主要作用是用于约束答案查询核心路径上的节点。
5)约束节点,通过聚合函数等对主题节点到答案节点的路径上的节点进行约束。
6)无关节点,代表与问题答案查找无关的节点。
根据上述本体子图中各个节点的类型,对于简单问题,通过问题中的主题节点到答案节点的路径便可以在实体知识库中查找到具体的答案,对于存在多约束条件的问题,首先需要根据主题节点,中间节点和答案节点,生成答案的查询路径,然后根据连接节点和约束节点约束答案的范围。具体的步骤如下:
通过在xq上进行最大池化MAX_POOL,获取问句的向量表示cq∈R1×d
cq=MAX_POOL(xq)
本体子图Os中每个节点的向量表示为
Figure BDA0003219232800000081
其中nv代表本体子图中节点的个数。初始化值可以是利用TransE等关系推理模型进行训练得到的节点向量值或者随机初始化的向量值:
Figure BDA0003219232800000082
如图3,利用图神经网络GNN在本体子图中进行推理学习,更新本体子图的节点向量表示,对于图神经网络第l层的节点向量表示:
Figure BDA0003219232800000083
通过聚合更新得到第l+1层的节点向量表示
Figure BDA0003219232800000084
hl+1=GNN(hl)
图神经网络GNN的具体算法主要包括对邻居节点信息的聚合和更新操作,本方法主要利用GRU神经网络更新当前节点及邻居节点的信息,每个节点具体的更新如下,首先生成当前节点的邻居节点聚合信息:
Figure BDA0003219232800000085
其中:iv为当前节点,jv为iv邻居节点,
Figure BDA0003219232800000086
为当前节点iv的所有邻居节点的集合,
Figure BDA0003219232800000087
为节点iv和节点jv的归一化权重,
Figure BDA0003219232800000088
为jv的节点向量;
Figure BDA0003219232800000089
Figure BDA00032192328000000810
其中,
Figure BDA00032192328000000811
为节点iv和节点jv的权重,kv为iv邻居节点,N(iv)为当前节点iv的所有邻居节点的集合,||代表将向量拼接,上标T代表转置矩阵。然后利用GRU网络更新当前节点的向量表示:
Figure BDA0003219232800000091
Figure BDA0003219232800000092
Figure BDA0003219232800000093
Figure BDA0003219232800000094
Figure BDA0003219232800000095
其中,rl、zl为当前节点的邻居节点聚合信息的权重,Wr、Wz
Figure BDA0003219232800000096
Wo为神经网络层参数,
Figure BDA0003219232800000097
为当前节点新增聚合信息,
Figure BDA0003219232800000098
为第l+1层的节点向量;
对于本体子图中的每个节点利用图神经网络推理得到的向量表示,将其投影到节点的类别空间,在利用softmax分类函数对其进行分类:
Figure BDA0003219232800000099
Figure BDA00032192328000000910
Figure BDA00032192328000000911
其中,
Figure BDA00032192328000000912
为线性变换后的输出,
Figure BDA00032192328000000913
为softmax分类得分,
Figure BDA00032192328000000914
为分类结果,L代表图神经网络的层数,Linear()代表线性变换函数,Softmax()代表softmax分类器,argmax()代表取最大值的下标,m代表节点的类别数目,包括其它类别。
约束节点的类别划分和约束条件抽取:
对于分类后的本体子图中的约束节点,需要进一步辨别其约束类型,抽取约束条件。本发明将本体节点的约束类型划分为以下四类:
(1)排序类型,例如:中国面积第二大的省份人口是多少?
(2)计数类型,例如:中国有多少个省?
(3)比较类型,例如:中国人口超过9000万的省份有哪些?
(4)均值类型,例如:中国各个省份地区生产总值的平均值是多少?
对于分类后的本体子图中的约束节点,生成其与答案查询路径上节点所构成的三元组,对于图6中的约束节点,生成如表1所示的三元组及其文本表示:
表1
三元组 文本表示
<行政区域,面积,数量> 行政区域面积数量
<行政区域,人口,数量> 行政区域人口数量
将问题与三元组的文本表示拼接为t,输入BERT编码模型,对该节点的约束类型进行分类,并抽取约束条件,具体步骤如下:
Figure BDA0003219232800000101
其中,nt为字符空间;
Figure BDA0003219232800000102
Figure BDA0003219232800000103
c=argmax(pc)
其中,c为约束类别;
Figure BDA0003219232800000104
其中,cstart为约束条件在拼接文本中的起始位置的概率分布;
start=argmax(cstart),start∈R
Figure BDA0003219232800000105
其中,te为ts通过Transformer层的编码;
Figure BDA0003219232800000111
其中,cend为约束条件在拼接文本中的结束位置的概率分布;
end=argmax(cend),end∈R
其中ts表示问题和三元组文本表示拼接后通过BERT模型编码后输出的向量序列表示,tcls表示问题和三元组文本表示拼接后通过BERT模型编码后输出的全局向量表示,Transformer_Encoder代表一层的Transformer编码器,nc代表约束类别的数目,tc代表约束类别评分,pc代表约束类别的概率分布,c代表约束类别的索引下标,Ws和We是可训练的权重参数,start和end代表要抽取的约束条件在拼接文本中的起始和结束位置。
问句答案生成:
在得到本体子图上各个节点的标签后,通过如下步骤获取问题的最终答案:
(1)根据本体子图上各个节点的标签,生成查询图Gs
(2)将E={e1,e2,...,ej,...,em}中的实体通过实体链接模型EL对齐到知识库K(V,R)中相应的Ek={e1k,e2k,...,ejk,...,emk}节点上。
Ek=EL(E)
(3)以Ek中的实体作为查询图中答案查询核心路径的主题节点和连接节点,结合约束节点的类型和约束条件,将查询图Gs转化为相应知识库的查询语言,通过知识库的查询引擎执行该查询语言获取问题的答案。
其中,本实施例中,本方法基于所述信息查询路径的主题节点和所述信息查询路径的连接节点在所述查询图中生成若干条第一中间查询路径;
基于所述约束节点的类型约束所述第一中间查询路径,获得若干条第二中间查询路径;
基于所述约束条件约束所述第二中间查询路径,获得所述信息查询路径。
即首先基于所述信息查询路径的主题节点和所述信息查询路径的连接节点在所述查询图中生成较多条第一中间查询路径,然后利用约束节点的类型和约束条件逐步约束出最终的信息查询路径。
本方法将问句信息引入到节点的邻居节点注意力权重计算中,使得当前节点更关注和问题相关的邻居节点信息。
本方法通过引入循环神经网络GRU对节点信息进行更新,使用序列生成的方式生成路径上的节点表示更能代表当前节点之前的路径信息。
本方法中通过约束节点和查询路径中的节点构成的三元组生成文本表示,并与问题相拼接,使用BERT等编码器编码后用于约束类型的分类和约束条件的抽取。
实施例二
在实施例一的基础上,实施例二举例对本方法进行详细说明:
对于问句“中国面积最大且人口超过9000万的省份的地区生产总值是多少?”的解决,本方法主要包括以下几步:
(1)使用BERT模型对问句进行编码,得到问句的向量表示cq=[0.12,0.23,...,0.44]。
(2)识别出问题中的实体“中国”的本体类型“国家”,在图4的本体图谱O上,以该本体类型为起点,遍历其N阶邻居节点,N为推理的跳数,假设N=2,可以得到如图5中的本体子图S。
(3)初始化本体子图S中的各个节点向量表示,并结合问句的向量表示信息cq,使用图神经网络模型GNN进行节点向量表示的聚合和更新。
(4)利用softmax分类器,对子图S中的各个节点进行分类,将划分为主题节点,中间节点,连接节点,约束节点,无关节点,如图6。
(5)找到问题的约束字段和约束所使用的聚合函数集合:
{<X?,面积,max(?)>,<X?,人口,gt(9000万)>}
其中max(?)表示取该类节点值得最大值,gt(9000万)表示所有值大于9000万的该类节点。
(6)生成如图2的查询图,在知识库上执行查询图得到问题的答案。
实施例三
请参考图7,本发明实施例三提供了一种信息查询系统,所述系统包括:
实体识别单元,用于对编码后的查询输入信息进行实体识别,获得第一实体集合;
本体子图生成单元,用于基于所述第一实体集合中实体信息的类型,获得第一本体集合后生成本体子图;
节点分类单元,用于对所述本体子图中的节点进行分类,获得节点分类标签,节点类型包括:主题节点和约束节点,以及用于信息查询路径上各节点连接的连接节点;
约束节点的类型和约束条件生成单元,用于基于所述约束节点和所述信息查询路径上的其他节点,生成所述本体子图中约束节点的类型和约束条件;
查询图获得单元,用于基于所述分类标签,获得查询图;
第二实体集合获得单元,用于获得知识库中与所述第一实体集合对应的第二实体集合;
主题节点和连接节点获得单元,用于基于所述第二实体集合中的实体信息,获得所述信息查询路径的主题节点和连接节点;
信息查询路径生成单元,用于基于所述信息查询路径的主题节点、所述信息查询路径的连接节点、所述约束节点的类型、所述约束条件和所述查询图,生成所述信息查询路径;
结果获得单元,用于在所述知识库中执行所述信息查询路径,获得与所述查询输入信息对应的结果。
实施例四
本发明实施例四提供了一种信息查询装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述信息查询方法的步骤。
其中,所述处理器可以是中央处理器(CPU,Central Processing Unit),还可以是其他通用处理器、数字信号处理器(digital signal processor)、专用集成电路(Application Specific Integrated Circuit)、现成可编程门阵列(Fieldprogrammablegate array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,实现发明中信息查询装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
实施例五
本发明实施例五提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述信息查询方法的步骤。
所述信息查询装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序可存储于一计算机可读存介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
本发明已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (15)

1.一种信息查询方法,其特征在于,所述方法包括:
对编码后的查询输入信息进行实体识别,获得第一实体集合;
基于所述第一实体集合中实体信息的类型,获得第一本体集合后生成本体子图;
对所述本体子图中的节点进行分类,获得节点分类标签,节点类型包括:主题节点和约束节点,以及用于信息查询路径上各节点连接的连接节点;
基于所述约束节点和所述信息查询路径上的其他节点,生成所述本体子图中约束节点的类型和约束条件;
基于所述分类标签,获得查询图;
获得知识库中与所述第一实体集合对应的第二实体集合;
基于所述第二实体集合中的实体信息,获得所述信息查询路径的主题节点和连接节点;
基于所述信息查询路径的主题节点、所述信息查询路径的连接节点、所述约束节点的类型、所述约束条件和所述查询图,生成所述信息查询路径;
在所述知识库中执行所述信息查询路径,获得与所述查询输入信息对应的结果。
2.根据权利要求1所述的信息查询方法,其特征在于,所述节点类型包括:主题节点、答案节点、中间节点、连接节点、约束节点和无关节点。
3.根据权利要求2所述的信息查询方法,其特征在于,所述主题节点为所述信息查询路径的起始节点;
所述答案节点为所述查询输入信息对应的结果在所述本体子图上所对应的节点;
所述中间节点为所述主题节点到所述答案节点路径上的中间节点;
所述约束节点为对所述主题节点到所述答案节点路径上节点进行约束的节点;
所述无关节点为与所述查询输入信息对应结果查找无关的节点。
4.根据权利要求1所述的信息查询方法,其特征在于,以所述第一本体集合中的本体类型为起始节点,在本体网络中遍历当前起始节点的N跳邻居节点,生成与所述查询输入信息对应的所述本体子图,N为推理的步数。
5.根据权利要求1所述的信息查询方法,其特征在于,将所述本体子图中约束节点与所述信息查询路径上的节点进行组合,获得节点组合,将所述节点组合转为文本表示,获得节点组合文本,将所述节点组合文本与所述查询输入信息进行拼接,获得拼接结果;将所述拼接结果编码,获得第二编码信息;基于所述第二编码信息获得所述本体子图中约束节点的类型,从所述第二编码信息中抽取所述约束条件。
6.根据权利要求1所述的信息查询方法,其特征在于,将所述第一实体集合中的实体通过实体链接对齐到知识库中对应的实体,获得所述第二实体集合。
7.根据权利要求1所述的信息查询方法,其特征在于,所述约束节点的类型包括:排序类型、计数类型、比较类型和均值类型。
8.根据权利要求1所述的信息查询方法,其特征在于,利用BERT模型对所述查询输入信息进行编码,获得所述第一编码信息,利用命名实体识别模型NER识别所述第一编码信息中的实体。
9.根据权利要求1所述的信息查询方法,其特征在于,对于所述本体子图中的每个节点利用图神经网络得到节点的向量表示,将所述向量表示投影到节点的类别空间,利用分类函数对节点进行分类。
10.根据权利要求9所述的信息查询方法,其特征在于,利用图神经网络得到节点的向量表示,具体包括:
生成当前节点的邻居节点聚合信息;
基于所述邻居节点聚合信息,利用循环神经网络GRU更新得到当前节点的向量表示。
11.根据权利要求1所述的信息查询方法,其特征在于,所述查询输入信息中的单词来源于词汇库,所述查询输入信息为
Figure FDA0003219232790000021
nq表示所述查询输入信息中单词的个数,v表示所述词汇库的大小,W表示所述词汇库空间大小,所述第一实体集合
Figure FDA0003219232790000022
其中,
Figure FDA0003219232790000023
表示所述查询输入信息中的第ie个实体,
Figure FDA0003219232790000024
包含所述查询输入信息中的me个单词,ne代表所述查询输入信息中实体的个数,第一本体集合
Figure FDA0003219232790000025
其中,
Figure FDA0003219232790000026
代表所述第一实体集合的第io个本体类型,no代表所述第一实体集合的本体类型总数,所述第一本体集合中的本体类型
Figure FDA0003219232790000027
对应所述查询输入信息中一个或者多个实体
Figure FDA0003219232790000028
的本体类型标签,mo代表本体类型
Figure FDA0003219232790000029
在所述查询输入信息中对应的实体个数。
12.根据权利要求1所述的信息查询方法,其特征在于:
基于所述信息查询路径的主题节点和所述信息查询路径的连接节点在所述查询图中生成若干条第一中间查询路径;
基于所述约束节点的类型约束所述第一中间查询路径,获得若干条第二中间查询路径;
基于所述约束条件约束所述第二中间查询路径,获得所述信息查询路径。
13.一种信息查询系统,其特征在于,所述系统包括:
实体识别单元,用于对编码后的查询输入信息进行实体识别,获得第一实体集合;
本体子图生成单元,用于基于所述第一实体集合中实体信息的类型,获得第一本体集合后生成本体子图;
节点分类单元,用于对所述本体子图中的节点进行分类,获得节点分类标签,节点类型包括:主题节点和约束节点,以及用于信息查询路径上各节点连接的连接节点;
约束节点的类型和约束条件生成单元,用于基于所述约束节点和所述信息查询路径上的其他节点,生成所述本体子图中约束节点的类型和约束条件;
查询图获得单元,用于基于所述分类标签,获得查询图;
第二实体集合获得单元,用于获得知识库中与所述第一实体集合对应的第二实体集合;
主题节点和连接节点获得单元,用于基于所述第二实体集合中的实体信息,获得所述信息查询路径的主题节点和连接节点;
信息查询路径生成单元,用于基于所述信息查询路径的主题节点、所述信息查询路径的连接节点、所述约束节点的类型、所述约束条件和所述查询图,生成所述信息查询路径;
结果获得单元,用于在所述知识库中执行所述信息查询路径,获得与所述查询输入信息对应的结果。
14.一种信息查询装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-12中任意一个所述信息查询方法的步骤。
15.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-12中任意一个所述信息查询方法的步骤。
CN202110952984.3A 2021-08-19 2021-08-19 一种信息查询方法及系统及装置及介质 Active CN113626574B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110952984.3A CN113626574B (zh) 2021-08-19 2021-08-19 一种信息查询方法及系统及装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110952984.3A CN113626574B (zh) 2021-08-19 2021-08-19 一种信息查询方法及系统及装置及介质

Publications (2)

Publication Number Publication Date
CN113626574A true CN113626574A (zh) 2021-11-09
CN113626574B CN113626574B (zh) 2023-08-29

Family

ID=78386601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110952984.3A Active CN113626574B (zh) 2021-08-19 2021-08-19 一种信息查询方法及系统及装置及介质

Country Status (1)

Country Link
CN (1) CN113626574B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114330323A (zh) * 2022-03-08 2022-04-12 成都数联云算科技有限公司 实体关系联合抽取方法、装置、计算机终端及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446367A (zh) * 2018-03-15 2018-08-24 湖南工业大学 一种基于知识图谱的包装行业数据搜索方法及设备
US20180268456A1 (en) * 2017-03-16 2018-09-20 Wipro Limited Method and system for automatically generating a response to a user query
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110362660A (zh) * 2019-07-23 2019-10-22 重庆邮电大学 一种基于知识图谱的电子产品质量自动检测方法
CN112989005A (zh) * 2021-04-16 2021-06-18 重庆中国三峡博物馆 一种基于分阶段查询的知识图谱常识问答方法及系统
CN112989004A (zh) * 2021-04-09 2021-06-18 苏州爱语认知智能科技有限公司 面向知识图谱问答的查询图排序方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180268456A1 (en) * 2017-03-16 2018-09-20 Wipro Limited Method and system for automatically generating a response to a user query
CN108446367A (zh) * 2018-03-15 2018-08-24 湖南工业大学 一种基于知识图谱的包装行业数据搜索方法及设备
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110362660A (zh) * 2019-07-23 2019-10-22 重庆邮电大学 一种基于知识图谱的电子产品质量自动检测方法
CN112989004A (zh) * 2021-04-09 2021-06-18 苏州爱语认知智能科技有限公司 面向知识图谱问答的查询图排序方法及系统
CN112989005A (zh) * 2021-04-16 2021-06-18 重庆中国三峡博物馆 一种基于分阶段查询的知识图谱常识问答方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
OLIVIER CORBY等: "the kgram abstract machine for knowledge graph querying", 2010 IEEE INTERNATIONAL CONFERENCE ON WEB INTELLIGENCE AND INTELLIGENT AGENT TECHNOLOGY, pages 338 - 341 *
郐弘智;闫健卓;陈建辉;: "一种知识驱动的个性化文献推荐方法", 计算机应用研究, vol. 35, no. 12, pages 3603 - 3608 *
阮光册;樊宇航;夏磊;: "知识图谱在实体检索中的应用研究综述", 图书情报工作, vol. 64, no. 14, pages 126 - 135 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114330323A (zh) * 2022-03-08 2022-04-12 成都数联云算科技有限公司 实体关系联合抽取方法、装置、计算机终端及存储介质

Also Published As

Publication number Publication date
CN113626574B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
Li et al. DeepPatent: patent classification with convolutional neural networks and word embedding
WO2020224097A1 (zh) 智能语义文档推荐方法、装置及计算机可读存储介质
CN110020438B (zh) 基于序列识别的企业或组织中文名称实体消歧方法和装置
CN110059181B (zh) 面向大规模分类体系的短文本标签方法、系统、装置
US11288324B2 (en) Chart question answering
CN111353310A (zh) 基于人工智能的命名实体识别方法、装置及电子设备
CN111639171A (zh) 一种知识图谱问答方法及装置
CN110851596A (zh) 文本分类方法、装置及计算机可读存储介质
Wang et al. Convolutional neural networks for expert recommendation in community question answering
CN117009490A (zh) 基于知识库反馈的生成式大语言模型的训练方法和装置
CN110688854A (zh) 命名实体识别方法、装置及计算机可读存储介质
CN110941958B (zh) 一种文本类目标注方法、装置、电子设备及存储介质
CN110633366A (zh) 一种短文本分类方法、装置和存储介质
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN111241828A (zh) 情感智能识别方法、装置及计算机可读存储介质
Grzegorczyk Vector representations of text data in deep learning
CN112966117A (zh) 实体链接方法
CN116303977B (zh) 一种基于特征分类的问答方法及系统
CN112632224A (zh) 基于案例知识图谱的案件推荐方法、装置和电子设备
US20230014904A1 (en) Searchable data structure for electronic documents
CN118171149B (zh) 标签分类方法、装置、设备、存储介质和计算机程序产品
CN113282729A (zh) 基于知识图谱的问答方法及装置
CN117217277A (zh) 语言模型的预训练方法、装置、设备、存储介质及产品
CN116882402A (zh) 基于多任务的电力营销小样本命名实体识别方法
CN114491079A (zh) 知识图谱构建和查询方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant