CN103678703A - 一种借助图随机游走的开放类别命名实体抽取方法及装置 - Google Patents

一种借助图随机游走的开放类别命名实体抽取方法及装置 Download PDF

Info

Publication number
CN103678703A
CN103678703A CN201310745097.4A CN201310745097A CN103678703A CN 103678703 A CN103678703 A CN 103678703A CN 201310745097 A CN201310745097 A CN 201310745097A CN 103678703 A CN103678703 A CN 103678703A
Authority
CN
China
Prior art keywords
template
entity
candidate
node
fructification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310745097.4A
Other languages
English (en)
Other versions
CN103678703B (zh
Inventor
刘康
赵军
齐振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201310745097.4A priority Critical patent/CN103678703B/zh
Publication of CN103678703A publication Critical patent/CN103678703A/zh
Application granted granted Critical
Publication of CN103678703B publication Critical patent/CN103678703B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种借助图随机游走的开放类别命名实体抽取方法,该方法包括步骤:步骤1,分析种子在语料中的上下文得到模板;步骤2,使用模板从语料抽取候选实体;步骤3,根据种子实体、模板和候选实体之间的关系构造图;步骤4,在图上使用随机游走算法计算候选实体的置信度。该方法能够克服模板质量不同对候选实体置信度计算带来的不良影响,有效地提高了开放类别命名实体抽取的准确率。经过实验证明,抽取结果的平均准确率提高了4.36%。

Description

一种借助图随机游走的开放类别命名实体抽取方法及装置
技术领域
本发明涉及自然语言处理技术领域,是一种从大规模文本语料中抽取开放类别命名实体的方法及装置。
背景技术
命名实体在人类语言中传递着重要信息,它的识别和抽取是自然语言处理研究中的关键技术之一。开放类别命名实体抽取技术的目标是从海量、冗余、异构、不规范的网络数据中抽取开放类别的命名实体,进而构建开放类别命名实体列表。这些开放类别命名实体列表在工业界和学术界都具有重要用途。因此,开放类别命名实体抽取技术具有重要的理论意义和实用价值。
传统的开放类别命名实体抽取系统一般采取模板的方法:通过分析种子实体在语料中的上下文得到模板;接下来使用模板从语料中抽取候选实体;然后将候选实体和种子实体用各自匹配的模板加以表示,在模板空间上计算每个候选实体与种子实体的相似度;最后将该相似度作为该候选实体的置信度,并根据置信度对候选实体排序作为最终结果。
传统的基于模板的开放类别命名实体抽取方法,在计算候选实体置信度时没有考虑种子的影响,也没有考虑不同模板在质量上的差别。因此,不能很好地计算候选实体的置信度。
发明内容
为了克服现有技术存在的缺陷,本发明提出了一种借助图随机游走的开放类别命名实体抽取方法和装置,实现了从大规模文本语料中进行开放类别命名实体的抽取。
根据本发明的一个方面,提出了一种借助图随机游走的开放类别命名实体抽取方法,该方法包括步骤:步骤1,分析种子在语料中的上下文得到模板;步骤2,使用模板从语料抽取候选实体;步骤3,根据种子实体、模板和候选实体之间的关系来构造图;步骤4,在图上使用随机游走算法计算候选实体的置信度。
优选地,步骤1进一步包括:取上下文窗口大小为3,即取种子出现的前三个词项与后三个词项构成模板放入模板池中。
优选地,过滤掉模板池中只出现过一次的模板。
优选地,步骤2进一步包括:依次取出模板池中的模板,将语料中匹配模板的字符串抽取出来放入候选实体池,同时记录<候选-模板>之间的匹配关系。
优选地,在步骤2,滤掉模板池中只出现过一次的模板。
优选地,在步骤3,图由节点和边组成,节点分为三类:种子实体、模板和候选实体,每个种子实体、模板或候选实体在图中都表示为一个节点,边分为两类:第一类是种子实体与根据该种子实体学到的模板之间用边连接;第二类是候选实体与抽取该候选实体的模板之间用边连接,由此得到一个无向图,作为图随机游走的输入。
优选地,步骤4进一步包括:
步骤41,构建初始状态矩阵,在该步骤,初始状态矩阵P0的初始值使用如下方法计算:
其中|S|为种子集合大小,根据上述初始化方式得到的初始状态矩阵P0,各列元素之和等于1;
步骤42,构建状态转移矩阵M,在该步骤,首先构建(m+n)*(m+n)维方阵M0,其中m为实体类节点的个数,n为模板类节点的个数,M0中每一行记录一个节点与其他节点的连接情况,M0(ij)表示第i个节点和第j个节点之间的关系,i和j为整数,其取值范围均为[1,m+n],M0(ij)的值设定如下:
Figure BDA0000450173820000031
之后对M0的每一行进行归一化得到状态转移矩阵M,使得M每一行的元素的和等于1;
步骤43,候选实体置信度计算,在该步骤,使用迭代的方法计算稳定状态矩阵P*,根据上一轮迭代结果Pt计算本轮迭代结果Pt+1,具体计算公式如下:
Pt+1=0.5*MT*Pt+0.5*P0
当在t=T时刻,|Pt+1-P1|≤ε或者T>iter时,迭代停止,则P*=Pt+1。这里ε表示预设的一个更新误差,在本发明中ε=0.001。iter表示预设的迭代次数,本方法取iter=500。P*中候选实体对应节点的概率值则作为该节点的置信度。
根据本发明的另一方面,还提供了一种借助图随机游走的开放类别命名实体抽取装置,该装置包括:候选实体抽取模板,用于使用动态模板学习的策略来抽取候选实体,该模块的输入是种子实体,输出是候选实体,在该模块中,首先通过分析种子实体在语料中的上下文得到模板集合,接下来抽取语料中匹配模板的字符串作为候选实体;候选实体置信度计算模块,其用于构造一个图,该图的节点包括种子实体、模板和候选实体三类,而图的边则反映了种子实体与模板的学得/被学得关系以及模板与候选实体之间的抽取/被抽取关系,在图上通过随机游走计算候选实体置信度,并据此对候选实体进行重排序,排序结果将作为抽取结果返回。
本发明采用模板质量与候选实体置信度相互影响的思想来提升开放类别命名实体抽取的效果。与简单的基于模板空间相似度不同,基于图随机游走的方法能够综合考察模板质量与候选实体置信度,尽可能给予正确候选实体较高的置信度,从而显著地提升系统性能。
附图说明
图1是本发明中借助图随机游走的方法辅助开放类别命名实体抽取方法原理图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的基本思想是通过综合考量模板质量与候选实体置信度,对使用模板抽取的候选实体根据其置信度进行排序,从而提高开放类别命名实体抽取结果的准确率。
对于开放类别命名实体抽取,面临的主要难点在于计算候选实体的置信度。解决这个问题的方法是综合考量候选实体的置信度与模板的质量。候选实体是通过模板进行匹配得到的,候选实体与模板之间存在以下关系:对候选实体而言,被数量越多、质量越高的模板发现的候选实体,越可能是正确的候选实体。对模板而言,找到候选实体越多,其中正确候选实体比率越高的模板,越可能是高质量的模板。因此本发明将种子实体、模板和候选实体三者作为节点;将种子实体与模板的学得/被学得关系以及模板与候选实体之间的抽取/被抽取关系作为边构造图。在图上从种子节点出发,进行随机游走。在达到稳定状态或达到预定迭代次数后停止游走,将走到每个候选实体的概率作为该候选实体的置信度并据此对候选实体进行排序,得到最终结果。
根据上述思路,本发明主要针对开放类别命名实体抽取存在的难点入手,成功地使用图随机游走算法度量模板质量和候选实体置信度,通过实验证明,该方法有效地提高了开放类别命名实体抽取结果的平均准确率。
图1为本发明借助图随机游走的开放类别命名实体抽取方法原理图。如图1所示,该方法主要包括候选实体抽取和候选实体置信度计算两个过程,其中候选实体抽取过程进一步包括模板习得和候选实体抽取两个步骤,候选实体置信度计算过程进一步包括图构造和图随机游走两个步骤。下面对该方法包含的各个步骤进行详细说明。
步骤1,模板习得。该步骤分析种子实体在语料中的上下文得到模板。本发明中取上下文窗口大小为3,即取种子出现的前三个词项与后三个词项构成模板放入模板池中。为提高模板的有效性,减少随机事件的影响,在这一阶段过滤掉模板池中只出现过一次的模板。
步骤2,候选实体抽取。依次取出模板池中的模板,将语料中匹配模板的字符串抽取出来放入候选实体池,同时记录<候选-模板>之间的匹配关系。同样为减少随机事件的影响,在这一阶段过滤掉候选实体池中只出现过一次的候选实体。
步骤3,构建图。图由节点和边组成。节点可以分为三类:种子实体、模板和候选实体。每个种子实体、模板或候选实体在图中都表示为一个节点。边可以分为两类:1)种子实体与根据该种子实体学到的模板之间用边连接;2)候选实体与抽取该候选实体的模板之间用边连接。这样得到一个无向图,作为图随机游走模块的输入。
步骤4,图随机游走。根据图构建模块生成的无向图,本发明计算候选实体的置信度,具体的操作如下所述:
步骤41,构建初始状态矩阵
初始状态矩阵P0的初始值使用如下方法计算:
Figure BDA0000450173820000051
其中|S|为种子集合大小。
根据以上两种初始化方式得到的初始状态矩阵P0,各列元素之和等于1。
步骤42,构建状态转移矩阵M
首先构建(m+n)*(m+n)维方阵M0,其中m为实体类节点的个数,n为模板类节点的个数。M0中每一行记录一个节点与其他节点的连接情况,M0(ij)表示第i个节点和第j个节点之间的关系,i和j为整数,其取值范围均为[1,m+n]。M0(ij)的值设定如下:
Figure BDA0000450173820000061
之后对M0的每一行进行归一化得到状态转移矩阵M,使得M每一行的元素的和等于1。
步骤43,候选实体置信度计算方法
使用迭代的方法计算稳定状态矩阵P*,根据上一轮迭代结果Pt计算本轮迭代结果Pt+1,具体计算公式如下:
Pt+1=0.5*MT*Pt+0.5*P0
当在t=T时刻,|Pt+1-P1|≤ε或者T>iter时,迭代停止,则P*=Pt+1。这里ε表示预设的一个更新误差,在本发明中ε=0.001。iter表示预设的迭代次数,本方法取iter=500。P*中候选实体对应节点的概率值则作为该节点的置信度。
根据本发明的另一方面,还提出了一种借助图随机游走的开放类别命名实体抽取装置,该装置实现上述描述的本发明的方法。该装置包含两个模块,第一个模块是候选实体抽取模板,使用动态模板学习的策略来抽取候选实体。该模块的输入是种子实体,输出是候选实体。在该模块中,首先通过分析种子实体在语料中的上下文得到模板集合。接下来抽取语料中匹配模板的字符串作为候选实体。第二个模块是候选实体置信度计算模块,在该模块中,将构造一个图。图的节点包括种子实体、模板和候选实体三类,而图的边则反映了种子实体与模板的学得/被学得关系以及模板与候选实体之间的抽取/被抽取关系。在图上通过随机游走计算候选实体置信度,并据此对候选实体进行重排序。排序结果将作为抽取结果返回。
为了说明系统的性能,本发明做了实验来验证本方法的性能。
1)测试语料
使用Wikipedia20110722版本的纯文本作为语料。经过初步处理(去除infoBox,链接关系等)后的语料包含350万篇文档,共约8.68G纯文本数据。另外选取10个语义类别作为测试的语义类,这10个语义类共包含784个命名实体。
2)图随机游走方法的提高
通过对比图随机游走方法的结果与三种其他常用方法的结果来说明本方法的有效性。结果如下表:
Figure BDA0000450173820000071
表1图随机游走方法结果与基于模板向量方法结果对比
从上表可以看到,相对于其他常用方法,图随机游走方法分别取得了25.24%,27.07%和4.36%的平均正确率的提升。
从上述实验结果可以看到,使用图随机游走的方法辅助开放类别命名实体抽取取得了不错的效果。这个方法被证明是有效的。
本发明的借助图随机游走的开放类别命名实体抽取方法和装置,不同于传统的将候选实体映射到模板空间来计算其置信度的方法,本发明将候选实体置信度计算和模板质量评估结合在一起。先通过分析种子实体在大规模文本语料中的上下文得到若干模板。接下来使用这些模板从大规模文本语料抽取候选实体。然后,使用种子实体与模板的学得/被学得关系以及模板与候选实体之间的抽取/被抽取关系构造图,最后在图上使用随机游走算法计算候选实体的置信度从而得到最后结果。该方法能够克服模板质量不同对候选实体置信度计算带来的不良影响,有效地提高了开放类别命名实体抽取的准确率。经过实验证明,抽取结果的平均准确率提高了4.36%。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种借助图随机游走的开放类别命名实体抽取方法,该方法包括步骤:
步骤1,分析种子在语料中的上下文得到模板;
步骤2,使用模板从语料抽取候选实体;
步骤3,根据种子实体、模板和候选实体之间的关系来构造图;
步骤4,在图上使用随机游走算法计算候选实体的置信度。
2.根据权利要求1所述的方法,其特征在于,步骤1进一步包括:取上下文窗口大小为3,即取种子出现的前三个词项与后三个词项构成模板放入模板池中。
3.根据权利要求2所述的方法,其特征在于,在步骤1,过滤掉模板池中只出现过一次的模板。
4.根据权利要求1所述方法,其特征在于,步骤2进一步包括:依次取出模板池中的模板,将语料中匹配模板的字符串抽取出来放入候选实体池,同时记录<候选-模板>之间的匹配关系。
5.根据权利要求4所述的方法,其特征在于,在步骤2,滤掉模板池中只出现过一次的模板。
6.根据权利要求1所述的方法,其特征在于,在步骤3,图由节点和边组成,节点分为三类:种子实体、模板和候选实体,每个种子实体、模板或候选实体在图中都表示为一个节点,边分为两类:第一类是种子实体与根据该种子实体学到的模板之间用边连接;第二类是候选实体与抽取该候选实体的模板之间用边连接,由此得到一个无向图,作为图随机游走的输入。
7.根据权利要求6所述的方法,其特征在于,步骤4进一步包括:
步骤41,构建初始状态矩阵,在该步骤,初始状态矩阵P0的初始值使用如下方法计算:
其中|S|为种子集合大小,根据上述初始化方式得到的初始状态矩阵P0,各列元素之和等于1;
步骤42,构建状态转移矩阵M,在该步骤,首先构建(m+n)*(m+n)维方阵M0,其中m为实体类节点的个数,n为模板类节点的个数,M0中每一行记录一个节点与其他节点的连接情况,M0(ij)表示第i个节点和第j个节点之间的关系,i和j为整数,其取值范围均为[1,m+n],M0(ij)的值设定如下:
Figure FDA0000450173810000022
之后对M0的每一行进行归一化得到状态转移矩阵M,使得M每一行的元素的和等于1;
步骤43,候选实体置信度计算,在该步骤,使用迭代的方法计算稳定状态矩阵P*,根据上一轮迭代结果Pt计算本轮迭代结果Pt+1,具体计算公式如下:
Pt+1=0.5*MT*Pt+0.5*P0
直到P*稳定或迭代次数超过预先设定的阈值iter,将P*中候选实体对应节点的概率值作为该节点的置信度。
8.一种借助图随机游走的开放类别命名实体抽取装置,该装置包括:
候选实体抽取模板,用于使用动态模板学习的策略来抽取候选实体,该模块的输入是种子实体,输出是候选实体,在该模块中,首先通过分析种子实体在语料中的上下文得到模板集合,接下来抽取语料中匹配模板的字符串作为候选实体;
候选实体置信度计算模块,其用于构造一个图,该图的节点包括种子实体、模板和候选实体三类,而图的边则反映了种子实体与模板的学得/被学得关系以及模板与候选实体之间的抽取/被抽取关系,在图上通过随机游走计算候选实体置信度,并据此对候选实体进行重排序,排序结果将作为抽取结果返回。
CN201310745097.4A 2013-12-30 2013-12-30 一种借助图随机游走的开放类别命名实体抽取方法及装置 Active CN103678703B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310745097.4A CN103678703B (zh) 2013-12-30 2013-12-30 一种借助图随机游走的开放类别命名实体抽取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310745097.4A CN103678703B (zh) 2013-12-30 2013-12-30 一种借助图随机游走的开放类别命名实体抽取方法及装置

Publications (2)

Publication Number Publication Date
CN103678703A true CN103678703A (zh) 2014-03-26
CN103678703B CN103678703B (zh) 2017-01-11

Family

ID=50316247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310745097.4A Active CN103678703B (zh) 2013-12-30 2013-12-30 一种借助图随机游走的开放类别命名实体抽取方法及装置

Country Status (1)

Country Link
CN (1) CN103678703B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294476A (zh) * 2015-06-05 2017-01-04 北京搜狗科技发展有限公司 一种特征词关系获取方法及装置
CN106970981A (zh) * 2017-03-28 2017-07-21 北京大学 一种基于转移矩阵构建关系抽取模型的方法
CN107450725A (zh) * 2017-07-31 2017-12-08 科大讯飞股份有限公司 人机交互应用平台、方法、以及存储介质
CN107977368A (zh) * 2016-10-21 2018-05-01 京东方科技集团股份有限公司 信息提取方法及系统
CN108460011A (zh) * 2018-02-01 2018-08-28 北京百度网讯科技有限公司 一种实体概念标注方法及系统
CN108509421A (zh) * 2018-04-04 2018-09-07 郑州大学 基于随机游走和粗糙决策置信度的文本情感分类方法
CN111858948A (zh) * 2019-04-30 2020-10-30 杭州海康威视数字技术股份有限公司 一种本体构建方法、装置、电子设备及存储介质
CN113051929A (zh) * 2021-03-23 2021-06-29 电子科技大学 一种基于细粒度语义信息增强的实体关系抽取的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020031269A1 (en) * 2000-09-08 2002-03-14 Nec Corporation System, method and program for discriminating named entity
CN101719122A (zh) * 2009-12-04 2010-06-02 中国人民解放军信息工程大学 一种从文本数据中提取中文命名实体的方法
CN102033950A (zh) * 2010-12-23 2011-04-27 哈尔滨工业大学 电子产品命名实体自动识别系统的构建方法及识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020031269A1 (en) * 2000-09-08 2002-03-14 Nec Corporation System, method and program for discriminating named entity
CN101719122A (zh) * 2009-12-04 2010-06-02 中国人民解放军信息工程大学 一种从文本数据中提取中文命名实体的方法
CN102033950A (zh) * 2010-12-23 2011-04-27 哈尔滨工业大学 电子产品命名实体自动识别系统的构建方法及识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
R.C.WANG 等: ""Language-Independent Set Expansion of Named Entities Using the Web"", 《SEVENTH IEEE INTERNATIONAL CONFERENCE ON DATA MINING》 *
伍大勇 等: ""基于随机游走模型的查询日志中命名实体挖掘"", 《智能计算机与应用 》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294476A (zh) * 2015-06-05 2017-01-04 北京搜狗科技发展有限公司 一种特征词关系获取方法及装置
CN107977368A (zh) * 2016-10-21 2018-05-01 京东方科技集团股份有限公司 信息提取方法及系统
CN106970981A (zh) * 2017-03-28 2017-07-21 北京大学 一种基于转移矩阵构建关系抽取模型的方法
CN106970981B (zh) * 2017-03-28 2021-01-19 北京大学 一种基于转移矩阵构建关系抽取模型的方法
CN107450725A (zh) * 2017-07-31 2017-12-08 科大讯飞股份有限公司 人机交互应用平台、方法、以及存储介质
CN107450725B (zh) * 2017-07-31 2020-09-11 科大讯飞股份有限公司 人机交互应用平台、方法、以及存储介质
CN108460011A (zh) * 2018-02-01 2018-08-28 北京百度网讯科技有限公司 一种实体概念标注方法及系统
CN108460011B (zh) * 2018-02-01 2022-03-25 北京百度网讯科技有限公司 一种实体概念标注方法及系统
CN108509421A (zh) * 2018-04-04 2018-09-07 郑州大学 基于随机游走和粗糙决策置信度的文本情感分类方法
CN108509421B (zh) * 2018-04-04 2021-09-28 郑州大学 基于随机游走和粗糙决策置信度的文本情感分类方法
CN111858948A (zh) * 2019-04-30 2020-10-30 杭州海康威视数字技术股份有限公司 一种本体构建方法、装置、电子设备及存储介质
CN113051929A (zh) * 2021-03-23 2021-06-29 电子科技大学 一种基于细粒度语义信息增强的实体关系抽取的方法

Also Published As

Publication number Publication date
CN103678703B (zh) 2017-01-11

Similar Documents

Publication Publication Date Title
CN103678703A (zh) 一种借助图随机游走的开放类别命名实体抽取方法及装置
CN107766324B (zh) 一种基于深度神经网络的文本一致性分析方法
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN111914558B (zh) 基于句袋注意力远程监督的课程知识关系抽取方法及系统
CN108985317B (zh) 一种基于可分离卷积和注意力机制的图像分类方法
CN111125358B (zh) 一种基于超图的文本分类方法
CN109753660B (zh) 一种基于lstm的中标网页命名实体抽取方法
CN103744835B (zh) 一种基于主题模型的文本关键词提取方法
CN112733866B (zh) 一种提高可控图像文本描述正确性的网络构建方法
CN106055675B (zh) 一种基于卷积神经网络和距离监督的关系抽取方法
US20120253792A1 (en) Sentiment Classification Based on Supervised Latent N-Gram Analysis
CN105893481B (zh) 一种基于马尔可夫聚类的实体间关系消解方法
CN111125367B (zh) 一种基于多层次注意力机制的多种人物关系抽取方法
CN105469096A (zh) 一种基于哈希二值编码的特征袋图像检索方法
WO2017193685A1 (zh) 社交网络中数据的处理方法和装置
CN109284406A (zh) 基于差异循环神经网络的意图识别方法
CN107122455A (zh) 一种基于微博的网络用户增强表示方法
CN106909537B (zh) 一种基于主题模型和向量空间的一词多义分析方法
CN109933792B (zh) 基于多层双向lstm和验证模型的观点型问题阅读理解方法
CN111552803A (zh) 一种基于图小波网络模型的文本分类方法
CN110196945B (zh) 一种基于LSTM与LeNet融合的微博用户年龄预测方法
CN110674642B (zh) 一种用于含噪稀疏文本的语义关系抽取方法
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
CN112199508A (zh) 一种基于远程监督的参数自适应农业知识图谱推荐方法
CN109753649A (zh) 基于细粒度匹配信号的文本相关性度量方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant