CN111950297A - 一种面向异常事件的关系抽取方法 - Google Patents

一种面向异常事件的关系抽取方法 Download PDF

Info

Publication number
CN111950297A
CN111950297A CN202010867283.5A CN202010867283A CN111950297A CN 111950297 A CN111950297 A CN 111950297A CN 202010867283 A CN202010867283 A CN 202010867283A CN 111950297 A CN111950297 A CN 111950297A
Authority
CN
China
Prior art keywords
entity
text
vector
relationship
guest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010867283.5A
Other languages
English (en)
Inventor
钟艳如
贺昭荣
赵蕾先
汪先登
李芳�
罗笑南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202010867283.5A priority Critical patent/CN111950297A/zh
Publication of CN111950297A publication Critical patent/CN111950297A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Strategic Management (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种面向异常事件的关系抽取方法,该方法是先对突发事件相关的实体关系数据集按照结构化三元组形式进行整理,并将相关领域语句转为向量化表示;然后使用双向长短期记忆网络结合自注意力机制构建共享编码层;使用softmax函数对主实体的标注进行预测,使用卷积神经网络对关系‑客实体进行共享编码,并通过主实体的预测结果增强编码表示;再次使用自注意力机制对训练参数进行优化。本发明可很好的处理突发事件文本中多对实体和关系类别的冲突问题,能提高该领域内文本实体关系的抽取质量。

Description

一种面向异常事件的关系抽取方法
技术领域
本发明涉及自然语言处理技术关系抽取领域,特指一种面向异常事件的关系抽取方法。
背景技术
随着全球经济的不断发展以及世界人口的不断增涨,景区的游客数量不断增加,因此景区也成为人口高度密集的场合,使得其容易出现各式的异常事件影响景区秩序甚至造成严重的公共财产损失。目前景区异常事件的研究主要运用监控手段进行预防,但各类异常事件具有复杂性和多变性,实时监控只能在事件发生后进行相应准备,无法从根源上进行预防,检测系统也无法在事件后续的处理过程中为异常事件进行决策上的帮助。实体关系抽取是信息抽取的核心任务之一,具体是指从给定的领域文本中自动识别出实体所在位置范围和类别,并对不同实体之间的语义关系进行判别。
信息抽取是从自然语言文本中抽取实体、属性、关系及事件等事实类信息的文本处理技术,是信息检索、智能问答、智能对话等人工智能应用的重要基础,一直受到业界的广泛关注。随着知识谱图应用的发展,信息抽取作为构建领域知识图谱的重要一环,成为了新的研究热点。如何解决语义的复杂性对信息抽取的影响是目前面临的主要问题之一。
目前主流的信息抽取模型,都无法很好的覆盖信息抽取的重要特点。如果有两个以上的实体同时出现的情况,单纯基于实体识别的系统模型在面对一对多的样本时有召回率低采样率差的问题;对文本整体进行序列标注的方法在面对多对多的样本时无法解决实体重叠的影响,抽取效率也大大降低。
发明内容
本发明的目的在于克服现有技术的不足,而提供一种面向异常事件的关系抽取方法,以提高异常事件文本关系抽取的质量和效率。
实现本发明目的的技术方案是:
一种面向异常事件的关系抽取方法,包括如下步骤:
S1:获取带有标注的异常事件文本实体关系数据集,按照三元组方式进行整理;
S2:采用序列化文本嵌入方法将异常事件文本语句转为向量化表示;
S3:利用双向长短期记忆网络结合自注意力机制,从领域文本语句向量中学习文本序列的潜在语义信息,构建共享编码层;
S4:使用softmax函数对主实体标注进行预测,得到基于输入语句预测的主实体集合;
S5:使用卷积神经网络对关系-客实体进行共享编码,并结合主实体的预测结果,得到关系-客实体的标注预测;
S6:使用自注意力机制对训练参数进行优化。
进一步的,步骤S1中所述对异常事件文本实体关系数据集按照三元组方式进行整理的方法如下:
设定实体1为e1,开始位置为heade1,结束位置为taile1,实体类别为k1,相应的实体2为e2,heade2,taile2,k2,关系为r,n为实体总个数,重新整理与实体1有相同主实体的三元组,重构形式表示为:
{(heade1,taile1,k1):[(heade1,taile1,r),(heade2,taile2,r),...(headen,tailen,r)]}。
进一步的,步骤S2中所述采用序列化文本嵌入方法将异常事件文本语句向量化表示方法如下:
将异常事件文本语句中的每个词映射为低维向量,将向量进行拼接构成完整句子,表示为:
X=(x1,x2,x3,...xn)
其中X为异常事件文本语句的向量化表示,xi为词wi的向量表示,其中
Figure BDA0002650101690000021
wi为词向量,k1为基于字符的向量表示。
进一步的,步骤S3中所述利用双向长短期记忆网络结合自注意力机制,从领域文本语句向量中学习文本序列的潜在语义信息的方法如下:
使用前向LSTM从左至右在句子中每个单词收集从开始至当前位置i的信息,并使用后向LSTM从右至左在句子中每个单词收集从结束至当前位置i的信息,表示为:
Figure BDA0002650101690000022
Figure BDA0002650101690000023
Figure BDA0002650101690000024
其中
Figure BDA0002650101690000025
Figure BDA0002650101690000026
表示前向LSTM的参数权重和后向LSTM的参数权重;
使用注意力机制获取不同单词在文本中所占权重的向量,表示为:
Figure BDA0002650101690000027
其中softmax表示归一化指数函数,W表示待学习的权重矩阵,而ht则表示为ht=(h1,h2,h3,...hn)。
进一步的,步骤S3中所述构建共享编码层的方法如下:
将双向长短时记忆网络每一时刻的隐藏层向量与注意力向量拼接,构建两个模块参数的共享编码层,表示为:
Figure BDA0002650101690000031
其中
Figure BDA0002650101690000032
表示隐藏层向量与注意力向量拼接后的向量。
进一步的,步骤S4中所述使用softmax函数预测主实体标注,得到其后验概率的分布情况,表示为:
Figure BDA0002650101690000033
其中e′i表示主实体标注,X为输入文本向量序列,
Figure BDA0002650101690000034
表示共享编码层的权重参数集合,We为词向量嵌入矩阵。
进一步的,步骤S5中所述使用卷积神经网络对关系-客实体进行共享编码,并结合主实体的预测结果,得到关系-客实体的标注预测,得到其后验概率分布情况,表示为:
P(li|X;θrp;We)=softmax(RELU(WCNN·σi))
其中li表示预测标注,θrp表示关系-客实体的参数权重,σi表示启发特征向量。
进一步的,步骤S6中所述使用自注意力机制对训练参数进行优化,其方法如下:
将主实体-关系-客实体进行联合编码,表示为:
Figure BDA0002650101690000035
其中Z为归一化因子,r、e为主实体对应的关系和客实体的集合,m为对应实体的总数。
本发明具有以下有益效果:
(1)本发明使用主实体-关系-客实体组成联合抽取框架,解决了同一语句中多对实体关系三元组带来的信息混淆问题;
(2)本发明使用共享编码的方式,能有效提高联合抽取模块之间的交互性,增加信息的利用率;
(3)本发明不依赖过多的人工标注特征,提高了发明的泛用性,有效提升了领域文本的联合抽取效率。
附图说明
图1是本发明方法的流程图;
图2是本发明的异常事件文本实体关系抽取的网络结构图。
具体实施方式
下面结合附图和具体实施对本发明进行详细说明。本实施用例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施用例。
实施例:
本实施例提供一种面向异常事件的关系抽取方法,如图1方法流程图所示,以火灾事件为例,该方法包括如下步骤:
S1:获取带有标注的异常事件文本实体关系数据集,按照三元组方式进行整理;
在本实施例中,本发明对异常事件文本实体关系数据集按照三元组方式进行整理的具体方式为:
设定实体1为e1,开始位置为heade1,结束位置为taile1,实体类别为k1,相应的实体2为e2,heade2,taile2,k2,关系为r,n为实体总个数,重新整理与实体1有相同主实体的三元组,重构形式表示为:
{(heade1,taile1,k1):[(heade1,taile1,r),(heade2,taile2,r),...(headen,tailen,r)]}
以异常事件文本“火灾是指在时间或空间上失去控制的燃烧所造成的灾害。”为例,重构形式为(0,1,自然灾害):[(11,18,异常事件表现),(23,24,异常事件表现)];
S2:采用序列化文本嵌入方法将异常事件文本语句转为向量化表示;
在本实施例中,使用序列化文本嵌入方法将异常事件文本语句向量化表示具体为:
将异常事件文本语句中的每个词映射为低维向量,将向量进行拼接构成完整句子,表示为:
X=(x1,x2,x3,...xn)
其中X为异常事件文本语句的向量化表示,xi为词wi的向量表示,其中
Figure BDA0002650101690000041
wi为词向量,k1为基于字符的向量表示;
S3:使用双向长短期记忆网络结合自注意力机制,从领域文本语句向量中学习文本序列的潜在语义信息,构建共享编码层;
在本实施例中,采用双向长短期记忆网络结合自注意力机制,从领域文本语句向量中学习文本序列的潜在语义信息具体为:
使用前向LSTM从左至右在句子中每个单词收集从开始至当前位置i的信息,并使用后向LSTM从右至左在句子中每个单词收集从结束至当前位置i的信息,表示为:
Figure BDA0002650101690000051
Figure BDA0002650101690000052
Figure BDA0002650101690000053
其中
Figure BDA0002650101690000054
Figure BDA0002650101690000055
表示前向LSTM的参数权重和后向LSTM的参数权重;
使用注意力机制获取不同单词在文本中所占权重的向量,表示为:
Figure BDA0002650101690000056
其中softmax表示归一化指数函数,W表示待学习的权重矩阵,而ht则表示为ht=(h1,h2,h3,...hn)。
在本实施例中,构建共享编码层的具体为:
将双向长短时记忆网络每一时刻的隐藏层向量与注意力向量拼接,构建两个模块参数的共享编码层,表示为:
Figure BDA0002650101690000057
其中
Figure BDA0002650101690000058
表示隐藏层向量与注意力向量拼接后的向量;
S4:使用softmax函数对主实体标注进行预测,得到基于输入语句预测的主实体集合;
在本实施例中,使用softmax函数预测主实体标注,得到其后验概率的分布情况,表示为:
Figure BDA0002650101690000059
其中e′i表示主实体标注,X为输入文本向量序列,
Figure BDA00026501016900000510
表示共享编码层的权重参数集合,We为词向量嵌入矩阵;
S5:使用卷积神经网络对关系-客实体进行共享编码,并结合主实体的预测结果,得到关系-客实体的标注预测;
在本实施例中,使用卷积神经网络对关系-客实体进行共享编码,并结合主实体的预测结果,得到关系-客实体的标注预测,得到其后验概率分布情况,表示为:
P(li|X;θrp;We)=softmax(RELU(WCNN·σi))
其中li表示预测标注,θrp表示关系-客实体的参数权重,σi表示启发特征向量。
S6:使用自注意力机制对训练参数进行优化:
在本实施例中,使用自注意力机制对训练参数进行优化,其具体为:
将主实体-关系-客实体进行联合编码,表示为:
Figure BDA0002650101690000061
其中Z为归一化因子,r、e为主实体对应的关系和客实体的集合,m为对应实体的总数。
在预测阶段,根据训练后的联合编码得到关系-客实体的预测结果,并结合S4得到的主实体预测,输出实体关系抽取集合。
以上所述只是本发明的一种优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可作出若干的改进和修饰,这些改进也应视为本发明的保护范围。

Claims (8)

1.一种面向异常事件的关系抽取方法,其特征在于:包括如下步骤:
S1:获取带有标注的异常事件文本实体关系数据集,按照三元组方式进行整理;
S2:采用序列化文本嵌入方法将异常事件文本语句转为向量化表示;
S3:利用双向长短期记忆网络结合自注意力机制,从领域文本语句向量中学习文本序列的潜在语义信息,构建共享编码层;
S4:使用softmax函数对主实体标注进行预测,得到基于输入语句预测的主实体集合;
S5:使用卷积神经网络对关系-客实体进行共享编码,并结合主实体的预测结果,得到关系-客实体的标注预测;
S6:使用自注意力机制对训练参数进行优化。
2.根据权利要求1所述的一种面向异常事件的关系抽取方法,其特征在于:步骤S1中所述对异常事件文本实体关系数据集按照三元组方式进行整理的方法如下:
设定实体1为e1,开始位置为heade1,结束位置为taile1,实体类别为k1,相应的实体2为e2,heade2,taile2,k2,关系为r,n为实体总个数,重新整理与实体1有相同主实体的三元组,重构形式表示为:
{(heade1,taile1,k1):[(heade1,taile1,r),(heade2,taile2,r),...(headen,tailen,r)]}。
3.根据权利要求1所述的一种面向异常事件的关系抽取方法,其特征在于:步骤S2中所述采用序列化文本嵌入方法将异常事件文本语句向量化表示方法如下:
将异常事件文本语句中的每个词映射为低维向量,将向量进行拼接构成完整句子,表示为:
X=(x1,x2,x3,...xn)
其中X为异常事件文本语句的向量化表示,xi为词wi的向量表示,其中
Figure FDA0002650101680000011
wi为词向量,k1为基于字符的向量表示。
4.根据权利要求1所述的一种面向异常事件的关系抽取方法,其特征在于:步骤S3中所述利用双向长短期记忆网络结合自注意力机制,从领域文本语句向量中学习文本序列的潜在语义信息的方法如下:
S4-1:使用前向LSTM从左至右在句子中每个单词收集从开始至当前位置i的信息,并使用后向LSTM从右至左在句子中每个单词收集从结束至当前位置i的信息,表示为:
Figure FDA0002650101680000012
Figure FDA0002650101680000013
Figure FDA0002650101680000014
其中
Figure FDA0002650101680000021
Figure FDA0002650101680000022
表示前向LSTM的参数权重和后向LSTM的参数权重;
S4-2:使用注意力机制获取不同单词在文本中所占权重的向量,表示为:
Figure FDA0002650101680000023
其中softmax表示归一化指数函数,W表示待学习的权重矩阵,而ht则表示为ht=(h1,h2,h3,...hn)。
5.根据权利要求1所述的一种面向异常事件的关系抽取方法,其特征在于:步骤S3中所述构建共享编码层的方法如下:
将双向长短时记忆网络每一时刻的隐藏层向量与注意力向量拼接,构建两个模块参数的共享编码层,表示为:
Figure FDA0002650101680000024
其中
Figure FDA0002650101680000025
表示隐藏层向量与注意力向量拼接后的向量。
6.根据权利要求1所述的一种面向异常事件的关系抽取方法,其特征在于:步骤S4中所述使用softmax函数预测主实体标注,得到其后验概率的分布情况,表示为:
Figure FDA0002650101680000026
其中e′i表示主实体标注,X为输入文本向量序列,
Figure FDA0002650101680000027
表示共享编码层的权重参数集合,We为词向量嵌入矩阵。
7.根据权利要求1所述的一种面向异常事件的关系抽取方法,其特征在于:步骤S5中所述使用卷积神经网络对关系-客实体进行共享编码,并结合主实体的预测结果,得到关系-客实体的标注预测,得到其后验概率分布情况,表示为:
P(li|X;θrp;We)=softmax(RELU(WCNN·σi))
其中li表示预测标注,θrp表示关系-客实体的参数权重,σi表示启发特征向量。
8.根据权利要求1所述的一种面向异常事件的关系抽取方法,其特征在于:步骤S6中所述使用自注意力机制对训练参数进行优化的方法如下:
将主实体-关系-客实体进行联合编码,表示为:
Figure FDA0002650101680000028
其中Z为归一化因子,r、e为主实体对应的关系和客实体的集合,m为对应实体的总数。
CN202010867283.5A 2020-08-26 2020-08-26 一种面向异常事件的关系抽取方法 Pending CN111950297A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010867283.5A CN111950297A (zh) 2020-08-26 2020-08-26 一种面向异常事件的关系抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010867283.5A CN111950297A (zh) 2020-08-26 2020-08-26 一种面向异常事件的关系抽取方法

Publications (1)

Publication Number Publication Date
CN111950297A true CN111950297A (zh) 2020-11-17

Family

ID=73366614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010867283.5A Pending CN111950297A (zh) 2020-08-26 2020-08-26 一种面向异常事件的关系抽取方法

Country Status (1)

Country Link
CN (1) CN111950297A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487109A (zh) * 2020-12-01 2021-03-12 朱胜青 实体关系抽取方法、终端和计算机可读存储介质
CN113553850A (zh) * 2021-03-30 2021-10-26 电子科技大学 一种基于有序结构编码指针网络解码的实体关系抽取方法
CN114722817A (zh) * 2020-12-22 2022-07-08 北京金山数字娱乐科技有限公司 事件处理方法及装置
CN115204120A (zh) * 2022-07-25 2022-10-18 平安科技(深圳)有限公司 保险领域三元组抽取方法、装置、电子设备及存储介质
CN117332785A (zh) * 2023-10-10 2024-01-02 山东省计算中心(国家超级计算济南中心) 一种从网络安全威胁情报联合抽取实体与关系的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670050A (zh) * 2018-12-12 2019-04-23 科大讯飞股份有限公司 一种实体关系预测方法及装置
CN109670172A (zh) * 2018-12-06 2019-04-23 桂林电子科技大学 一种基于复合神经网络的景区异常事件抽取方法
CN110532397A (zh) * 2019-07-19 2019-12-03 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、计算机设备及存储介质
CN110570920A (zh) * 2019-08-20 2019-12-13 华东理工大学 一种基于集中注意力模型的实体、关系联合学习方法
CN110765265A (zh) * 2019-09-06 2020-02-07 平安科技(深圳)有限公司 信息分类抽取方法、装置、计算机设备和存储介质
CN110781683A (zh) * 2019-11-04 2020-02-11 河海大学 一种实体关系联合抽取方法
CN111368528A (zh) * 2020-03-09 2020-07-03 西南交通大学 一种面向医学文本的实体关系联合抽取方法
CN111400478A (zh) * 2020-03-27 2020-07-10 天津大学 一种基于词嵌入匹配技术的知识图谱问答方法及装置
CN111444305A (zh) * 2020-03-19 2020-07-24 浙江大学 一种基于知识图谱嵌入的多三元组联合抽取方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670172A (zh) * 2018-12-06 2019-04-23 桂林电子科技大学 一种基于复合神经网络的景区异常事件抽取方法
CN109670050A (zh) * 2018-12-12 2019-04-23 科大讯飞股份有限公司 一种实体关系预测方法及装置
CN110532397A (zh) * 2019-07-19 2019-12-03 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、计算机设备及存储介质
CN110570920A (zh) * 2019-08-20 2019-12-13 华东理工大学 一种基于集中注意力模型的实体、关系联合学习方法
CN110765265A (zh) * 2019-09-06 2020-02-07 平安科技(深圳)有限公司 信息分类抽取方法、装置、计算机设备和存储介质
CN110781683A (zh) * 2019-11-04 2020-02-11 河海大学 一种实体关系联合抽取方法
CN111368528A (zh) * 2020-03-09 2020-07-03 西南交通大学 一种面向医学文本的实体关系联合抽取方法
CN111444305A (zh) * 2020-03-19 2020-07-24 浙江大学 一种基于知识图谱嵌入的多三元组联合抽取方法
CN111400478A (zh) * 2020-03-27 2020-07-10 天津大学 一种基于词嵌入匹配技术的知识图谱问答方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘鉴等: "基于双向LSTM和自注意力机制的中文关系抽取研究", 《山西大学学报(自然科学版)》 *
钟艳如: "基于数学教学的知识图谱构建", 《计算机技术与发展》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487109A (zh) * 2020-12-01 2021-03-12 朱胜青 实体关系抽取方法、终端和计算机可读存储介质
CN114722817A (zh) * 2020-12-22 2022-07-08 北京金山数字娱乐科技有限公司 事件处理方法及装置
CN113553850A (zh) * 2021-03-30 2021-10-26 电子科技大学 一种基于有序结构编码指针网络解码的实体关系抽取方法
CN115204120A (zh) * 2022-07-25 2022-10-18 平安科技(深圳)有限公司 保险领域三元组抽取方法、装置、电子设备及存储介质
CN115204120B (zh) * 2022-07-25 2023-05-30 平安科技(深圳)有限公司 保险领域三元组抽取方法、装置、电子设备及存储介质
CN117332785A (zh) * 2023-10-10 2024-01-02 山东省计算中心(国家超级计算济南中心) 一种从网络安全威胁情报联合抽取实体与关系的方法
CN117332785B (zh) * 2023-10-10 2024-03-01 山东省计算中心(国家超级计算济南中心) 一种从网络安全威胁情报联合抽取实体与关系的方法

Similar Documents

Publication Publication Date Title
CN111950297A (zh) 一种面向异常事件的关系抽取方法
WO2022057669A1 (zh) 基于结构化上下文信息的知识图谱预训练方法
CN113158665B (zh) 一种基于文本摘要生成与双向语料改善对话文本生成的方法
CN113128229B (zh) 一种中文实体关系联合抽取方法
CN111708882B (zh) 基于Transformer的中文文本信息缺失的补全方法
CN113051929A (zh) 一种基于细粒度语义信息增强的实体关系抽取的方法
CN112183064B (zh) 基于多任务联合学习的文本情绪原因识别系统
US20220300546A1 (en) Event extraction method, device and storage medium
CN110532558A (zh) 一种基于句子结构深层解析的多意图识别方法及系统
CN112084336A (zh) 一种高速公路突发事件的实体提取和事件分类方法及装置
CN113268561B (zh) 一种基于多任务联合训练的问题生成方法
CN114781392A (zh) 一种基于bert改进模型的文本情感分析方法
CN116661805B (zh) 代码表示的生成方法和装置、存储介质及电子设备
CN116663540A (zh) 基于小样本的金融事件抽取方法
CN115935957A (zh) 一种基于句法分析的句子语法纠错方法及系统
CN113051904B (zh) 一种面向小规模知识图谱的链接预测方法
CN113268985B (zh) 基于关系路径的远程监督关系抽取方法、装置及介质
Wei et al. Named entity recognition method for educational emergency field based on BERT
CN116910196A (zh) 一种基于多任务学习的校园安全突发事件抽取方法
CN116737897A (zh) 一种基于多模态的智慧楼宇知识抽取模型和方法
CN111522923A (zh) 一种多轮任务式对话状态追踪方法
CN115545038A (zh) 一种优化网格标签的方面情感分析方法
CN115422945A (zh) 一种融合情感挖掘的谣言检测方法及系统
CN115936001A (zh) 基于BERT-BiLSTM-CRF模型和注意力的电网IT运维实体识别方法及系统
CN115496225A (zh) 用于训练及应用机器学习模型的方法、系统、装置和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201117