CN113505598A - 一种基于混合神经网络的网络文本实体关系抽取算法 - Google Patents

一种基于混合神经网络的网络文本实体关系抽取算法 Download PDF

Info

Publication number
CN113505598A
CN113505598A CN202110903583.9A CN202110903583A CN113505598A CN 113505598 A CN113505598 A CN 113505598A CN 202110903583 A CN202110903583 A CN 202110903583A CN 113505598 A CN113505598 A CN 113505598A
Authority
CN
China
Prior art keywords
text
entity
noun
network
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110903583.9A
Other languages
English (en)
Inventor
廖一星
王亮
朱勇
刘作国
綦云华
李子灿
姬科盛
柏富强
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Jiangnan Aerospace Information Network Communication Co ltd
Original Assignee
Guizhou Jiangnan Aerospace Information Network Communication Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Jiangnan Aerospace Information Network Communication Co ltd filed Critical Guizhou Jiangnan Aerospace Information Network Communication Co ltd
Priority to CN202110903583.9A priority Critical patent/CN113505598A/zh
Publication of CN113505598A publication Critical patent/CN113505598A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于混合神经网络的网络文本实体关系抽取算法,将网络文本分成两份内容一致的文本,将标注后的段落根据序号段落进行归类整理,得到段落文本归类数据,根据名词实体关系进行分类,并进行归纳标注,得到名词文本归类数据,实现对两份文本数据的实体文本信息的抽取。本发明通过对网络文本分成两部分,分别通过段落文本归类和名词实体文本归类划分编码,分别利用主题建模类别划分识别的方式和指针生成网络摘取识别的方式实现对段落文本内的数据实体关系的提取,通过TF‑IDF信息处理和重复二分聚类算法处理实现对名词实体的关系抽取,再对两种方式得到的数据进行整合,能高效精准的提取到实体关键词之间的关系属性。

Description

一种基于混合神经网络的网络文本实体关系抽取算法
技术领域
本发明涉及网络文本关系算法技术领域,尤其涉及一种基于混合神经网络的网络文本实体关系抽取算法。
背景技术
随着互联网时代的到来,在数据与算力的双重加持下,深度学习引发的人工智能浪潮席卷全球,为了让计算机做到对语言的精准理解,需要赋予其大量的先验知识,这些知识主要以结构化知识进行表示。可是与现实世界快速增长的知识量相比,结构化知识的覆盖度仍未赶上。为解决这个问题,研究人员使用实体关系抽取算法自动抽取文本中蕴含的知识,但在非英文环境下,由于数据量和文本表示的问题,算法的抽取结果与英文算法的抽取结果间存在巨大差距。为了消除语言间的差异,目前方法多采用参数迁移,标注投影等启发式方法进行跨语言信息抽取,这些方法没有考虑语言间的差异,且多数需要给定严格的限制以保证效果。针对不同语言实体关系抽取模型之间的性能差距大,现有方法在语言间信息迁移效率不高的问题,实体关系抽取是信息抽取的一个重要分支,它是指通过信息抽取技术,从自然文本抽取出实体及其之间的关系,即将非结构化数据变成半结构化数据或结构化数据的技术。随着互联网的日益普及和广泛应用,互联网数据急剧膨胀,海量无标签数据中富含大量命名实体及其关系属性,如人物、机构以及他们之间的关系,如何从海量数据中高效、精准的抽取出这些实体及关系属性,成为目前实体关系抽取面临的重大挑战。
发明内容
本发明的目的是为了解决现有技术中的缺点,而提出的一种基于混合神经网络的网络文本实体关系抽取算法。
为了实现上述目的,本发明采用了如下技术方案:
一种基于混合神经网络的网络文本实体关系抽取算法,该算法包括如下步骤:
S1、将网络文本分成两份内容一致的文本,一部分将文本以段落在文本的位置关系进行分序,并进行逐一序号标注,将标注后的段落根据序号段落进行归类整理,得到段落文本归类数据;
S2、将另一部分的文本内的名词实体进行识别归纳,根据名词实体关系进行分类,并进行归纳标注,得到名词文本归类数据,实现对两份文本数据的实体文本信息的抽取;
S3、对段落文本归类数据进行解码建模,采用主题建模类别划分识别的方式和指针生成网络摘取识别两种方式实现对网络文本中的大数据的提取计算;
S4、将名词文本归类数据分别通过TF-IDF信息处理和重复二分聚类算法处理,根据名词文本归类数据内的关键词的识别与计算,得出大数据中的实体关系抽取。
优选地,所述加码与解码分别通过编码层使用Bi-LSTM来进行编码;解码层再使用LSTM进行解码,从而实现数据的转换。
优选地,所述S3建模模型中有两个双向的LSTM-RNN,一个基于wordsequence用于实体检测;一个基于TreeStructures用于关系抽取;后者叠加在前者上,前者的输出和隐含层作为后者输入的一部分。
优选地,所述S3中指针生成网络摘取识别包括主要为抽取式识别方式,抽取式识别方式是将文本中词语重要性、句子重要性进行排序,抽取出重要度高的句子,形成摘要得到实体关系数据。
优选地,所述S4中TF-IDF信息处理是对名词文本归类数据中频繁出现的名词进行记录并判定,实现评估一个名词实体对于一个段落或一个文本中的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它在语料库中出现的频率成反比下降,利用TF-IDF信息处理摘取重要的名词实体信息。
优选地,所述S4中重复二分聚类算法处理从下至上的进行寻找频繁出现的名词实体,并进行设计网格,通过逐级二分每个网格成为等体积的两部分,借此找到数据集中聚类原型的候选,以得到名词实体信息。
优选地,所述S2中的名词关系包括以下的几种或一种:实体中词的位置信息、实体关系类型信息、实体角色信息和主体与客体之间的语境关系。
相比现有技术,本发明的有益效果为:
本发明通过对网络文本分成两部分,分别通过段落文本归类和名词实体文本归类划分编码,分别利用主题建模类别划分识别的方式和指针生成网络摘取识别的方式实现对段落文本内的数据实体关系的提取,通过TF-IDF信息处理和重复二分聚类算法处理实现对名词实体的关系抽取,再对两种方式得到的数据进行整合,能高效精准的提取到实体关键词之间的关系属性。
附图说明
图1为本发明提出的一种基于混合神经网络的网络文本实体关系抽取算法流程关系示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,一种基于混合神经网络的网络文本实体关系抽取算法,该算法包括如下步骤:将网络文本分成两份内容一致的文本,一部分将文本以段落在文本的位置关系进行分序,并进行逐一序号标注,将标注后的段落根据序号段落进行归类整理,得到段落文本归类数据;
将另一部分的文本内的名词实体进行识别归纳,根据名词实体关系进行分类,并进行归纳标注,得到名词文本归类数据,实现对两份文本数据的实体文本信息的抽取;名词关系包括以下的几种或一种:实体中词的位置信息、实体关系类型信息、实体角色信息和主体与客体之间的语境关系。
对段落文本归类数据进行解码建模,采用主题建模类别划分识别的方式和指针生成网络摘取识别两种方式实现对网络文本中的大数据的提取计算;建模模型中有两个双向的LSTM-RNN,一个基于wordsequence用于实体检测;一个基于TreeStructures用于关系抽取;后者叠加在前者上,前者的输出和隐含层作为后者输入的一部分,主题模型可以给出其所包含的每一个词语的主题类别,词语以主题类别进行划分,权重越高,重要性越大,如此提取出来的关键词,不仅重要性高,而且兼顾主题覆盖的全面性,指针生成网络摘取识别包括主要为抽取式识别方式,抽取式识别方式是将文本中词语重要性、句子重要性进行排序,抽取出重要度高的句子,形成摘要得到实体关系数据。
将名词文本归类数据分别通过TF-IDF信息处理和重复二分聚类算法处理,根据名词文本归类数据内的关键词的识别与计算,得出大数据中的实体关系抽取;TF-IDF信息处理是对名词文本归类数据中频繁出现的名词进行记录并判定,实现评估一个名词实体对于一个段落或一个文本中的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它在语料库中出现的频率成反比下降,利用TF-IDF信息处理摘取重要的名词实体信息,使用TF-IDF提取关键词的方法十分好理解,TF衡量了一个词在文档中出现的频率,一个文档中多次出现的词总是有一定的特殊意义,但并不是所有多次出现的词都是有意义的,如果一个词在所有的文档中都多次出现,那么这个词就没有什么价值了,从而进行摒弃;
重复二分聚类算法处理从下至上的进行寻找频繁出现的名词实体,并进行设计网格,通过逐级二分每个网格成为等体积的两部分,借此找到数据集中聚类原型的候选,以得到名词实体信息;
利用主题建模类别划分识别的方式和指针生成网络摘取识别的方式实现对段落文本内的数据实体关系的提取,通过TF-IDF信息处理和重复二分聚类算法处理实现对名词实体的关系抽取,再对两种方式得到的数据进行整合,能高效精准的提取到实体关键词之间的关系属性
加码与解码分别通过编码层使用Bi-LSTM来进行编码;解码层再使用LSTM进行解码,从而实现数据的转换,其为本领域常用的编码解码方式。
以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种基于混合神经网络的网络文本实体关系抽取算法,其特征在于,该算法包括如下步骤:
S1、将网络文本分成两份内容一致的文本,一部分将文本以段落在文本的位置关系进行分序,并进行逐一序号标注,将标注后的段落根据序号段落进行归类整理,得到段落文本归类数据;
S2、将另一部分的文本内的名词实体进行识别归纳,根据名词实体关系进行分类,并进行归纳标注,得到名词文本归类数据,实现对两份文本数据的实体文本信息的抽取;
S3、对段落文本归类数据进行解码建模,采用主题建模类别划分识别的方式和指针生成网络摘取识别两种方式实现对网络文本中的大数据的提取计算;
S4、将名词文本归类数据分别通过TF-IDF信息处理和重复二分聚类算法处理,根据名词文本归类数据内的关键词的识别与计算,得出大数据中的实体关系抽取。
2.根据权利要求1所述的一种基于混合神经网络的网络文本实体关系抽取算法,其特征在于,所述加码与解码分别通过编码层使用Bi-LSTM来进行编码;解码层再使用LSTM进行解码,从而实现数据的转换。
3.根据权利要求1所述的一种基于混合神经网络的网络文本实体关系抽取算法,其特征在于,所述S3建模模型中有两个双向的LSTM-RNN,一个基于wordsequence用于实体检测;一个基于TreeStructures用于关系抽取;后者叠加在前者上,前者的输出和隐含层作为后者输入的一部分。
4.根据权利要求1所述的一种基于混合神经网络的网络文本实体关系抽取算法,其特征在于,所述S3中指针生成网络摘取识别包括主要为抽取式识别方式,抽取式识别方式是将文本中词语重要性、句子重要性进行排序,抽取出重要度高的句子,形成摘要得到实体关系数据。
5.根据权利要求1所述的一种基于混合神经网络的网络文本实体关系抽取算法,其特征在于,所述S4中TF-IDF信息处理是对名词文本归类数据中频繁出现的名词进行记录并判定,实现评估一个名词实体对于一个段落或一个文本中的重要程度。字词的重要性随著它在文件中出现的次数成正比增加,但同时会随著它在语料库中出现的频率成反比下降,利用TF-IDF信息处理摘取重要的名词实体信息。
6.根据权利要求1所述的一种基于混合神经网络的网络文本实体关系抽取算法,其特征在于,所述S4中重复二分聚类算法处理从下至上的进行寻找频繁出现的名词实体,并进行设计网格,通过逐级二分每个网格成为等体积的两部分,借此找到数据集中聚类原型的候选,以得到名词实体信息。
7.根据权利要求1所述的一种基于混合神经网络的网络文本实体关系抽取算法,其特征在于,所述S2中的名词关系包括以下的几种或一种:实体中词的位置信息、实体关系类型信息、实体角色信息和主体与客体之间的语境关系。
CN202110903583.9A 2021-08-06 2021-08-06 一种基于混合神经网络的网络文本实体关系抽取算法 Pending CN113505598A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110903583.9A CN113505598A (zh) 2021-08-06 2021-08-06 一种基于混合神经网络的网络文本实体关系抽取算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110903583.9A CN113505598A (zh) 2021-08-06 2021-08-06 一种基于混合神经网络的网络文本实体关系抽取算法

Publications (1)

Publication Number Publication Date
CN113505598A true CN113505598A (zh) 2021-10-15

Family

ID=78015766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110903583.9A Pending CN113505598A (zh) 2021-08-06 2021-08-06 一种基于混合神经网络的网络文本实体关系抽取算法

Country Status (1)

Country Link
CN (1) CN113505598A (zh)

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180045A (zh) * 2016-03-10 2017-09-19 中国科学院地理科学与资源研究所 一种互联网文本蕴含地理实体关系的抽取方法
WO2018135723A1 (ko) * 2017-01-17 2018-07-26 경북대학교 산학협력단 복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체
CN108549625A (zh) * 2018-02-28 2018-09-18 首都师范大学 一种基于句法宾语聚类的中文篇章表现主题分析方法
CN108763542A (zh) * 2018-05-31 2018-11-06 中国华戎科技集团有限公司 一种基于联合学习的文本情报分类方法、装置及计算机设备
CN109063159A (zh) * 2018-08-13 2018-12-21 桂林电子科技大学 一种基于神经网络的实体关系抽取方法
CN109783618A (zh) * 2018-12-11 2019-05-21 北京大学 基于注意力机制神经网络的药物实体关系抽取方法及系统
CN110019839A (zh) * 2018-01-03 2019-07-16 中国科学院计算技术研究所 基于神经网络和远程监督的医学知识图谱构建方法和系统
CN110222344A (zh) * 2019-06-17 2019-09-10 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN110222199A (zh) * 2019-06-20 2019-09-10 青岛大学 一种基于本体和多种神经网络集成的人物关系图谱构建方法
CN110502749A (zh) * 2019-08-02 2019-11-26 中国电子科技集团公司第二十八研究所 一种基于双层注意力机制与双向gru的文本关系抽取方法
CN110807326A (zh) * 2019-10-24 2020-02-18 江汉大学 结合gpu-dmm与文本特征的短文本关键词提取方法
CN110888991A (zh) * 2019-11-28 2020-03-17 哈尔滨工程大学 一种弱标注环境下的分段式语义标注方法
CN111126067A (zh) * 2019-12-23 2020-05-08 北大方正集团有限公司 实体关系抽取方法及装置
CN111444721A (zh) * 2020-05-27 2020-07-24 南京大学 一种基于预训练语言模型的中文文本关键信息抽取方法
CN111444704A (zh) * 2020-03-27 2020-07-24 中南大学 基于深度神经网络的网络安全关键词抽取方法
WO2020211275A1 (zh) * 2019-04-18 2020-10-22 五邑大学 基于预训练模型与微调技术的医疗文本关系抽取方法
WO2021042516A1 (zh) * 2019-09-02 2021-03-11 平安科技(深圳)有限公司 命名实体识别方法、装置及计算机可读存储介质
CN112487807A (zh) * 2020-12-09 2021-03-12 重庆邮电大学 一种基于膨胀门卷积神经网络的文本关系抽取方法
CN112818124A (zh) * 2021-02-21 2021-05-18 昆明理工大学 一种基于注意力神经网络的实体关系抽取方法
WO2021139229A1 (zh) * 2020-07-31 2021-07-15 平安科技(深圳)有限公司 文本修辞句的生成方法、装置、设备及可读存储介质

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180045A (zh) * 2016-03-10 2017-09-19 中国科学院地理科学与资源研究所 一种互联网文本蕴含地理实体关系的抽取方法
WO2018135723A1 (ko) * 2017-01-17 2018-07-26 경북대학교 산학협력단 복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체
CN110019839A (zh) * 2018-01-03 2019-07-16 中国科学院计算技术研究所 基于神经网络和远程监督的医学知识图谱构建方法和系统
CN108549625A (zh) * 2018-02-28 2018-09-18 首都师范大学 一种基于句法宾语聚类的中文篇章表现主题分析方法
CN108763542A (zh) * 2018-05-31 2018-11-06 中国华戎科技集团有限公司 一种基于联合学习的文本情报分类方法、装置及计算机设备
CN109063159A (zh) * 2018-08-13 2018-12-21 桂林电子科技大学 一种基于神经网络的实体关系抽取方法
CN109783618A (zh) * 2018-12-11 2019-05-21 北京大学 基于注意力机制神经网络的药物实体关系抽取方法及系统
WO2020211275A1 (zh) * 2019-04-18 2020-10-22 五邑大学 基于预训练模型与微调技术的医疗文本关系抽取方法
CN110222344A (zh) * 2019-06-17 2019-09-10 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN110222199A (zh) * 2019-06-20 2019-09-10 青岛大学 一种基于本体和多种神经网络集成的人物关系图谱构建方法
CN110502749A (zh) * 2019-08-02 2019-11-26 中国电子科技集团公司第二十八研究所 一种基于双层注意力机制与双向gru的文本关系抽取方法
WO2021042516A1 (zh) * 2019-09-02 2021-03-11 平安科技(深圳)有限公司 命名实体识别方法、装置及计算机可读存储介质
CN110807326A (zh) * 2019-10-24 2020-02-18 江汉大学 结合gpu-dmm与文本特征的短文本关键词提取方法
CN110888991A (zh) * 2019-11-28 2020-03-17 哈尔滨工程大学 一种弱标注环境下的分段式语义标注方法
CN111126067A (zh) * 2019-12-23 2020-05-08 北大方正集团有限公司 实体关系抽取方法及装置
CN111444704A (zh) * 2020-03-27 2020-07-24 中南大学 基于深度神经网络的网络安全关键词抽取方法
CN111444721A (zh) * 2020-05-27 2020-07-24 南京大学 一种基于预训练语言模型的中文文本关键信息抽取方法
WO2021139229A1 (zh) * 2020-07-31 2021-07-15 平安科技(深圳)有限公司 文本修辞句的生成方法、装置、设备及可读存储介质
CN112487807A (zh) * 2020-12-09 2021-03-12 重庆邮电大学 一种基于膨胀门卷积神经网络的文本关系抽取方法
CN112818124A (zh) * 2021-02-21 2021-05-18 昆明理工大学 一种基于注意力神经网络的实体关系抽取方法

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
BOWEN YU ET AL.: "Joint Extraction of Entities and Relations Based on a Novel Decomposition Strategy", 《EUROPEAN CONFERENCE ON ARTIFICIAL INTELLIGENCE》, pages 1 - 5 *
MAKOTO MIWA ET AL.: "End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures", 《ASSOCIATION FOR COMPUTATIONAL LINGUISTICS》, pages 1 - 5 *
MARKUS EBERTS AND ADRIAN ULGES: "Span-based Joint Entity and Relation Extraction with Transformer Pre-training", 《ECAI 2020》, pages 3 - 5 *
刘锦文;邢凯;芮伟康;张利萍;周慧;: "基于信息关联拓扑的互联网社交关系挖掘", 计算机应用, no. 07 *
唐朝;诺明花;胡岩;: "ResNet结合BiGRU的关系抽取混合模型", 中文信息学报, no. 02 *
庄传志;靳小龙;朱伟建;刘静伟;白龙;程学旗;: "基于深度学习的关系抽取研究综述", 中文信息学报, no. 12 *
庄传志;靳小龙;李忠;孙智;: "基于注意力机制的混合神经网络关系分类方法", 计算机工程与科学, no. 01 *
李枫林;柯佳;: "基于深度学习框架的实体关系抽取研究进展", 情报科学, no. 03 *
杨一帆;陈文亮;: "旅游场景下的实体别名抽取联合模型", 中文信息学报, no. 06 *
贺金龙;付立军;姚郑;吕鹏飞;黄徐胜;: "基于网格LSTM混合算法的地质领域用户意图识别", 计算机系统应用, no. 10 *
郭羽含,陈虹,肖成龙: "《Python机器学习》", 31 March 2021, 北京:机械工业出版社, pages: 211 - 213 *
黄培馨;赵翔;方阳;朱慧明;肖卫东;: "融合对抗训练的端到端知识三元组联合抽取", 计算机研究与发展, no. 12 *

Similar Documents

Publication Publication Date Title
Peng et al. A review of sentiment analysis research in Chinese language
CN100474301C (zh) 基于数据挖掘获取词或词组单元译文信息的系统和方法
CN111291195B (zh) 一种数据处理方法、装置、终端及可读存储介质
Rahimi et al. An overview on extractive text summarization
Zhang et al. A comprehensive survey of abstractive text summarization based on deep learning
US11170169B2 (en) System and method for language-independent contextual embedding
Bach et al. A two-phase framework for learning logical structures of paragraphs in legal articles
Zaman et al. Information extraction from semi and unstructured data sources: A systematic literature review
CN114840677B (zh) 面向多粒度需求的短文本分类与智能分析方法
CN114881043B (zh) 基于深度学习模型的法律文书语义相似度评估方法及系统
CN114997288A (zh) 一种设计资源关联方法
CN111291573A (zh) 有向图意义导向模型驱动的短语语义挖掘方法
CN101271448A (zh) 汉语基本名词短语的识别及其规则的生成方法和装置
Liu et al. Internet news headlines classification method based on the n-gram language model
Di Castro et al. Automated extractions for machine generated mail
Rana et al. Extraction of opinion target using syntactic rules in Urdu text
CN113505598A (zh) 一种基于混合神经网络的网络文本实体关系抽取算法
CN104281695A (zh) 基于组合理论的类自然语言的语义信息抽取方法及其系统
Wassie et al. A word sense disambiguation model for Amharic words using semi-supervised learning paradigm
Croce et al. Grammatical Feature Engineering for Fine-grained IR Tasks.
Baishya et al. Present state and future scope of Assamese text processing
Loglisci et al. An unsupervised framework for topological relations extraction from geographic documents
Mittal et al. Emotion-cause pair extraction in customer reviews
CN113688241B (zh) 一种基于融合多级别主题情感模型的文本分类方法及装置
KR102505821B1 (ko) 컨셉 사전을 기반으로 생성된 규칙을 이용한 텍스트 분석 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination