CN109670172A - 一种基于复合神经网络的景区异常事件抽取方法 - Google Patents

一种基于复合神经网络的景区异常事件抽取方法 Download PDF

Info

Publication number
CN109670172A
CN109670172A CN201811486378.1A CN201811486378A CN109670172A CN 109670172 A CN109670172 A CN 109670172A CN 201811486378 A CN201811486378 A CN 201811486378A CN 109670172 A CN109670172 A CN 109670172A
Authority
CN
China
Prior art keywords
event
sentence
trigger word
word
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811486378.1A
Other languages
English (en)
Inventor
罗笑南
贺昭荣
钟艳如
李芳�
汪华登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201811486378.1A priority Critical patent/CN109670172A/zh
Publication of CN109670172A publication Critical patent/CN109670172A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于复合神经网络的景区异常事件抽取方法,该方法是对获取的事件原始文本语料进行数据预处理,事件句转换为词向量,将其序列传入到双向长短时记忆网络,利用双向长短时记忆网络来训练得到每个候选触发词的语义特征;再将以词向量表示的事件句序列传入到卷积神经网络中,利用卷积神经网络训练得到候选触发词所在事件句的全局特征;通过综合候选触发词的语义特征与候选触发词所在句子的全局特征,利用softmax作为分类器来对每个候选触发词进行分类,从而找出景区异常事件的触发词,并根据人工标注的触发词类型来将事件类型分类。本发明能够快速准确的抽取景区异常事件,处理繁复冗杂文本中的异常事件,效率高且泛用性佳。

Description

一种基于复合神经网络的景区异常事件抽取方法
技术领域
本发明涉及自然语言处理技术领域,具体是一种基于复合神经网络的景区异常事件抽取方法。
背景技术
随着国内计算机互联网技术的普及,景区游客的日益增加,景区内部的事件监控也面临越来越大的压力。如何从获取的海量信息文本中提取出有用的异常事件并进行分类成为了一个亟待解决的问题。作为信息抽取的一环,事件抽取是信息抽取的研究热点,其研究内容是自动的从自然文本中获取特定类型的事件和元素。
从文本中抽取相应的事件通常是要识别事件触发词来实现,因此人工标记的事件触发词是时间识别的关键要素。
在目前对于异常突发事件的抽取方法中,还是经常性的使用文本框架来进行格式化抽取以及使用支持向量机SVM的分类器进行文本分类,但是这类方法对非线性数据集无法达到很好的分类效果,并且过于依赖触发词,导致因候选触发词模糊时容易造成判断错误;再者频繁的事件信息并无法规范化语法,当前方法缺乏从不规范语句中进行事件抽取的研究。
发明内容
本发明的目的在于克服现有技术的不足,而提供一种基于复合神经网络的景区异常事件抽取方法,该方法可以消除普通的机器学习分类及触发词依赖造成的过多错误,并处理不规范语句的异常信息。
实现本发明目的的技术方案是:
一种基于复合神经网络的景区异常事件抽取方法,包括如下步骤:
S1、对事件原始语料的原始文本进行数据预处理,对原始文本进行清洗和分句,得到事件句,然后对事件句进行分词和命名体识别,根据人工标注的异常事件信息,将事件句进行序列标注,触发词根据其类型进行标注,非触发词类别标注为无,得到事件句序列并将事件句序列转换为词向量的形式;
S2、将以词向量表示的事件句序列输入到双向长短时记忆网络,利用双向长短时记忆网络来训练得到每个候选触发词的语义特征;
S3、将以词向量表示的事件句序列传入到卷积神经网络中,利用CNN卷积神经网络训练得到候选触发词所在事件句的全局特征;
S4、根据步骤S2得到的候选触发词的语义特征和步骤S3得到的候选触发词所在事件句的全局特征,选择softmax模型设计分类器进行事件分类,找出相关异常事件的触发词,匹对相应的触发词类型,判断事件类别。
步骤S1的具体步骤为:
S1-1、先用正则表达式将事件原始语料内无关字符去除,再采用自然语言处理工具对语料的原始文本进行分句,分词和命名体识别,使语料的原始文本以分割的事件句和每句切分好的若干个词汇来显示,即事件句表达为L={x1,x2,…,xi,…,xn},其中xi为句子中第i个词,n表示事件句长度;
S1-2、根据步骤1)分词和命名体识别得到的事件句L,对事件句L进行人工标注,在标注过程中,将非触发词标记为无类型,触发词根据所属新闻事件类别进行标注,得到事件句序列;
S1-3、通过开源工具包word2vec训练文本得到词向量,采用skip-gram模型,根据训练得到的词向量,将事件句序列中每个词表述为一个200长度的向量;
S1-4、将每个事件句处理成词向量表述的序列形式,即每个候选触发词表示为一个长度为200的词向量,事件句表示为A={w1,w2,…,wi,…,wn}。
步骤S2的具体步骤为:
S2-1、将事件句A副本表示为B={w1,w2,…,wi,…,wn},其中wi为第i个候选触发词的词向量,n为句子长度;
S2-2、将事件句B的序列传入双向长短时记忆网络,获得输出结果BW={bw1,bw2,bw3,…,bwi,…,bwn},其中fwi为第i个通过长短时记忆网络的触发词提取出的语义特征;
S2-3、反转事件句A的序列得序列A'={wn,wn-1,…,wi,…,w1},将其传入双向长短时记忆网络,获得序列的反向输出结果AW={aw1,aw2,aw3,…,awi,…,awn},其中aw为候选触发词经过反向输出的长短时记忆网络提取出的语义特征;
S2-4、将双向长短时记忆网络获得的输出结果BW与AW合并,得到句子B在双向长短时记忆网络中的输出结果θ={r1,r2,r3,…,ri,…,rn},其中ri=[bwi,awi],即得到候选触发词的语义特征。
步骤S3的具体步骤为:
S3-1、S2所得的事件句序列为B={w1,w2,…,wi,…,wn},其中wi为第i个候选触发词的词向量,n为句子长度;
S3-2、将事件句B放入卷积网络中运行,其计算公式如下:
其中f为所使用的激活函数,Ci通过卷积运算得到的特征,w是权重矩阵,m是卷积核的大小,求和函数的区间表示第i个词到i-m+1个词,b表示偏置项;
将文本在卷积中移动,得到所有词经过卷积的特征图;
S3-3、使用随机采样池化来池化所得的特征图,从而得到候选触发词所在事件句的全局特征C。
步骤S4,具体是根据步骤S2得到的事件句B={w1,w2,…,wi,…,wn}的语义特征θ={r1,r2,r3,…,ri,…,rn}和步骤S3所得到的事件句B的全局特征C进行并行处理进行特征分类,判断出事件语句的类别,再根据已有的实体关系标记,对句子进行合并。
本发明提供的一种基于复合神经网络的景区异常事件抽取方法,该方法可以减少事件抽取对触发词的依赖,避免触发词的歧义对类别判断的影响,并可以在不规范句式中有效的提取事件。
附图说明
图1为本发明一种基于复合神经网络的景区异常事件抽取方法的流程图;
图2为基于双向长短时神经网络和卷积神经网络的景区异常事件抽取关键步骤流程图;
图3为卷积神经网络的基本结构图。
具体实施方式
下面结合附图和实施例对本发明做进一步阐述,但不是对本发明的限定。
一种基于复合神经网络的景区异常事件抽取方法,包括如下步骤:
S1、对事件原始语料的原始文本进行数据预处理,对原始文本进行清洗和分句,得到事件句,然后对事件句进行分词和命名体识别,根据人工标注的异常事件信息,将事件句进行序列标注,触发词根据其类型进行标注,非触发词类别标注为无,得到事件句序列并将事件句序列转换为词向量的形式;
S2、将以词向量表示的事件句序列输入到双向长短时记忆网络,利用双向长短时记忆网络来训练得到每个候选触发词的语义特征;
S3、将以词向量表示的事件句序列传入到卷积神经网络中,利用CNN卷积神经网络训练得到候选触发词所在事件句的全局特征;
S4、根据步骤S2得到的候选触发词的语义特征和步骤S3得到的候选触发词所在事件句的全局特征,选择softmax模型设计分类器进行事件分类,找出相关异常事件的触发词,匹对相应的触发词类型,判断事件类别。
步骤S1的具体步骤为:
S1-1、先用正则表达式将事件原始语料内无关字符去除,再采用自然语言处理工具对语料的原始文本进行分句,分词和命名体识别,使语料的原始文本以分割的事件句和每句切分好的若干个词汇来显示,即事件句表达为L={x1,x2,…,xi,…,xn},其中xi为句子中第i个词,n表示事件句长度;
S1-2、根据步骤1)分词和命名体识别得到的事件句L,对事件句L进行人工标注,在标注过程中,将非触发词标记为无类型,触发词根据所属新闻事件类别进行标注,得到事件句序列;
S1-3、通过开源工具包word2vec训练文本得到词向量,采用skip-gram模型,根据训练得到的词向量,将事件句序列中每个词表述为一个200长度的向量;
S1-4、将每个事件句处理成词向量表述的序列形式,即每个候选触发词表示为一个长度为200的词向量,事件句表示为A={w1,w2,…,wi,…,wn}。
步骤S2的具体步骤为:
S2-1、将事件句A副本表示为B={w1,w2,…,wi,…,wn},其中wi为第i个候选触发词的词向量,n为句子长度;
S2-2、将事件句B的序列传入双向长短时记忆网络,获得输出结果BW={bw1,bw2,bw3,…,bwi,…,bwn},其中fwi为第i个通过长短时记忆网络的触发词提取出的语义特征;
S2-3、反转事件句A的序列得序列A'={wn,wn-1,…,wi,…,w1},将其传入双向长短时记忆网络,获得序列的反向输出结果AW={aw1,aw2,aw3,…,awi,…,awn},其中aw为候选触发词经过反向输出的长短时记忆网络提取出的语义特征;
S2-4、将双向长短时记忆网络获得的输出结果BW与AW合并,得到句子B在双向长短时记忆网络中的输出结果θ={r1,r2,r3,…,ri,…,rn},其中ri=[bwi,awi],即得到候选触发词的语义特征。
步骤S3的具体步骤为:
S3-1、S2所得的事件句序列为B={w1,w2,…,wi,…,wn},其中wi为第i个候选触发词的词向量,n为句子长度;
S3-2、将事件句B放入卷积网络中运行,其计算公式如下:
其中f为所使用的激活函数,Ci通过卷积运算得到的特征,w是权重矩阵,m是卷积核的大小,求和函数的区间表示第i个词到i-m+1个词,b表示偏置项;
将文本在卷积中移动,得到所有词经过卷积的特征图;
S3-3、使用随机采样池化来池化所得的特征图,从而得到候选触发词所在事件句的全局特征C。
步骤S4,具体是根据步骤S2得到的事件句B={w1,w2,…,wi,…,wn}的语义特征θ={r1,r2,r3,…,ri,…,rn}和步骤S3所得到的事件句B的全局特征C进行并行处理进行特征分类,判断出事件语句的类别,再根据已有的实体关系标记,对句子进行合并。
实施例:
如图1所示,一种基于复合神经网络的景区异常事件抽取方法,包括文本与处理模块、神经网络训练模块、景区异常事件预测模块,其中文本与处理模块用于对事件原始语料进行数据预处理,包括对事件原始语料文本进行分句,得到事件句,然后对事件句进行分词、命名体识别根据人工标注的异常事件信息,将事件句进行序列标注,触发词根据其类型进行标注,非触发词标注为无,得到事件句序列并将事件句序列转化为词向量形式;
复合神经网络训练模块包括双向长短时记忆网络训练模块和卷积神经网络训练模块,双向长短时记忆网络训练模块用于将以词向量表示的事件句序列训练,得到每个候选触发词的语义特征;
卷积神经网络训练模块用于将以词向量表示的事件句序列训练,得到候选触发词所在事件句的全局特征;
异常事件预测模块是用于根据复合神经网络训练模块所得到的候选触发词的语义特征和候选触发词所在句子的全局特征,并利用softmax来作为分类器分类每个候选触发词,由此找出景区异常事件的触发词,比对触发词类型,判断事件的类型。
下面结合具体事例对本发明做进一步说明。
一种基于复合神经网络的景区异常事件抽取方法,本事例事件句为:“在19点30分,十字街一家酒店发生了火灾事故。”在事件抽取前的触发词提取中已知该句子中触发词为“火灾”,所属的异常事件分类为“消防安全事故”。
步骤一、对事件句进行分词和命名体识别,得到如下:
在\19点30分\十字街\一家酒店\发生\了\火灾\事故
事件触发词“火灾”被标记为属于“消防安全”分类,其余候选触发词标记为无,得到该事件句的序列L={x1,x2,…,xi,…,xn},其中xi为事件句中第i个词,n表示事件句长度。
选取合适的语料库,使用开源工具包word2vec训练词向量,选择Skip-gram模型,将每个词表示为一个长度200的向量。
最终所得事件句可表示为A={w1,w2,…,wi,…,wn},其中wi为事件句中第i个词的200维向量,n为事件句长度。
步骤二、将由词向量表示的事件句A={w1,w2,…,wi,…,wn}复制为B={w1,w2,…,wi,…,wn}传入双向长短时记忆网络(BiLSTM)中,利用双向长短时记忆网络来训练得到的每个候选触发词的语义特征,如图2-1。
将句子B作为序列传入长短时记忆网络(LSTM),得到序列的输出结果BW={bw1,bw2,bw3,…,bwi,…,bwn},其中bwi表示第i个候选触发词经过LSTM提取出的语义特征,n表示事件句长度。bwi的计算过程如下:
定义xt为t时刻时的输入词向量,ht为在t时刻存储的所有信息的隐藏层状态向量,σ为sigmoid回归层,Mi,Mf,Mc,Mo为不同状态下xt输入的权重矩阵,Wi,Wf,Wc,Wo为隐藏层状态ht的圈中居住,bi,bf,bc,bo为偏置向量;
(1)在t时刻遗忘门(forget gate)的计算公式①如下:
ft=σ(Wf·[ht-1,Xt]+bf) ①
(2)在t时刻更新ht-1中的存储信息,计算公式如公式②③:
it=σ(Wi·[ht-1,Xt]+bi) ②
其中公式(3)中it表示t时刻即将更新的值,表示已更新的信息。
(3)在t时刻将t-1时刻存储的信息更新为t时刻的信息,计算公式如公式④:
Ct=ft*Ct-1+it*Ct
(4)在t时刻的输出公式如公式⑤:
Ot=σ(Wo·[ht-1,Xt]+bo) ⑤
其中Ot为t时刻的输出,最终fwt=Ot,表示句子中的第t个词输出为fwt。
同理可得反向输出的结果A={w1,w2,…,wi,…,wn},将双向长短时记忆网络LSTM输出的BW与AW合并,得到句子L在BiLSTM的输出结果
θ={r1,r2,r3,…,ri,…,rn},其中ri=[bwi,awi]。
步骤三、将事件句B={w1,w2,…,wi,…,wn}传入卷积神经网络(CNN)中进行训练,获取候选触发词所在句的全局特征,如图2-2。
具体技术过程如下:
(1)对句子进行卷积,计算公式如公式⑦:
其中f为所使用的激活函数,Ci通过卷积运算得到的特征,w是权重矩阵,m是卷积核的大小,求和函数的区间表示第i个词到i-m+1个词,b表示偏置项;
将文本在卷积中移动,得到所有词经过卷积的特征图。
(2)使用随机采样池化来池化所得的特征图,从而得到候选触发词所在事件句的全局特征C。
根据步骤二得到的事件句B={w1,w2,…,wi,…,wn}的语义特征θ={r1,r2,r3,…,ri,…,rn}和步骤S3所得到的事件句B的全局特征C进行并行处理进行特征分类,判断出事件语句的类别。
根据步骤二得到的候选触发词的语义特征和步骤三得到的候选触发词所在事件句的全局特征,选择softmax模型设计分类器进行事件分类,找出相关异常事件的触发词,匹对相应的触发词类型,判断事件类别,再根据已有的实体关系标记,对句子进行合并。

Claims (5)

1.一种基于复合神经网络的景区异常事件抽取方法,其特征在于,包括如下步骤:
S1、对事件原始语料的原始文本进行数据预处理,对原始文本进行清洗和分句,得到事件句,然后对事件句进行分词和命名体识别,根据人工标注的异常事件信息,将事件句进行序列标注,触发词根据其类型进行标注,非触发词类别标注为无,得到事件句序列并将事件句序列转换为词向量的形式;
S2、将以词向量表示的事件句序列输入到双向长短时记忆网络,利用双向长短时记忆网络来训练得到每个候选触发词的语义特征;
S3、将以词向量表示的事件句序列传入到卷积神经网络中,利用CNN卷积神经网络训练得到候选触发词所在事件句的全局特征;
S4、根据步骤S2得到的候选触发词的语义特征和步骤S3得到的候选触发词所在事件句的全局特征,选择softmax模型设计分类器进行事件分类,找出相关异常事件的触发词,匹对相应的触发词类型,判断事件类别。
2.根据权利要求1所述的一种基于复合神经网络的景区异常事件抽取方法,其特征在于,步骤S1的具体步骤为:
S1-1、先用正则表达式将事件原始语料内无关字符去除,再采用自然语言处理工具对语料的原始文本进行分句,分词和命名体识别,使语料的原始文本以分割的事件句和每句切分好的若干个词汇来显示,即事件句表达为L={x1,x2,…,xi,…,xn},其中xi为句子中第i个词,n表示事件句长度;
S1-2、根据步骤1)分词和命名体识别得到的事件句L,对事件句L进行人工标注,在标注过程中,将非触发词标记为无类型,触发词根据所属新闻事件类别进行标注,得到事件句序列;
S1-3、通过开源工具包word2vec训练文本得到词向量,采用skip-gram模型,根据训练得到的词向量,将事件句序列中每个词表述为一个200长度的向量;
S1-4、将每个事件句处理成词向量表述的序列形式,即每个候选触发词表示为一个长度为200的词向量,事件句表示为A={w1,w2,…,wi,…,wn}。
3.根据权利要求1所述的一种基于复合神经网络的景区异常事件抽取方法,其特征在于,步骤S2的具体步骤为:
S2-1、将事件句A副本表示为B={w1,w2,…,wi,…,wn},其中wi为第i个候选触发词的词向量,n为句子长度;
S2-2、将事件句B的序列传入双向长短时记忆网络,获得输出结果BW={bw1,bw2,bw3,…,bwi,…,bwn},其中bwi为第i个通过长短时记忆网络的触发词提取出的语义特征;
S2-3、反转事件句A的序列得序列A'={wn,wn-1,…,wi,…,w1},将其传入双向长短时记忆网络,获得序列的反向输出结果AW={aw1,aw2,aw3,…,awi,…,awn},其中aw为候选触发词经过反向输出的长短时记忆网络提取出的语义特征;
S2-4、将双向长短时记忆网络获得的输出结果BW与AW合并,得到句子L在双向长短时记忆网络中的输出结果θ={r1,r2,r3,…,ri,…,rn},其中ai=[bwi,awi],即得到候选触发词的语义特征。
4.根据权利要求1所述的一种基于复合神经网络的景区异常事件抽取方法,其特征在于,步骤S3的具体步骤为:
S3-1、S2所得的事件句序列B={w1,w2,…,wi,…,wn},其中wi为第i个候选触发词的词向量,n为句子长度;
S3-2、将事件句B放入卷积网络中运行,其计算公式如下:
其中f为所使用的激活函数,Ci通过卷积运算得到的特征,w是权重矩阵,m是卷积核的大小,求和函数的区间表示第i个词到i-m+1个词,b表示偏置项;
将文本在卷积中移动,得到所有词经过卷积的特征图;
S3-3、使用随机采样池化来池化所得的特征图,从而得到候选触发词所在事件句的全局特征C。
5.根据权利要求1所述的一种基于复合神经网络的景区异常事件抽取方法,其特征在于,步骤S4,具体是根据步骤S2得到的事件句B={w1,w2,…,wi,…,wn}的语义特征θ={r1,r2,r3,…,ri,…,rn}和步骤S3所得到的事件句B的全局特征C进行并行处理进行特征分类,判断出事件语句的类别。
CN201811486378.1A 2018-12-06 2018-12-06 一种基于复合神经网络的景区异常事件抽取方法 Pending CN109670172A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811486378.1A CN109670172A (zh) 2018-12-06 2018-12-06 一种基于复合神经网络的景区异常事件抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811486378.1A CN109670172A (zh) 2018-12-06 2018-12-06 一种基于复合神经网络的景区异常事件抽取方法

Publications (1)

Publication Number Publication Date
CN109670172A true CN109670172A (zh) 2019-04-23

Family

ID=66143647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811486378.1A Pending CN109670172A (zh) 2018-12-06 2018-12-06 一种基于复合神经网络的景区异常事件抽取方法

Country Status (1)

Country Link
CN (1) CN109670172A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457478A (zh) * 2019-08-09 2019-11-15 泰康保险集团股份有限公司 文本合规性检查方法及装置、电子设备和计算机可读介质
CN110457700A (zh) * 2019-08-07 2019-11-15 中国人民解放军国防科技大学 短文本描述方法和装置
CN110968661A (zh) * 2020-03-04 2020-04-07 成都数联铭品科技有限公司 事件抽取方法及系统、计算机可读存储介质及电子设备
CN111581954A (zh) * 2020-05-15 2020-08-25 中国人民解放军国防科技大学 一种基于语法依存信息的文本事件抽取方法及装置
CN111950199A (zh) * 2020-08-11 2020-11-17 杭州叙简科技股份有限公司 一种基于地震新闻事件的地震数据结构化自动方法
CN111950297A (zh) * 2020-08-26 2020-11-17 桂林电子科技大学 一种面向异常事件的关系抽取方法
CN112000867A (zh) * 2020-08-17 2020-11-27 桂林电子科技大学 一种基于社交媒体平台的文本分类方法
CN112580330A (zh) * 2020-10-16 2021-03-30 昆明理工大学 基于中文触发词指导的越南语新闻事件检测方法
CN114398891A (zh) * 2022-03-24 2022-04-26 三峡智控科技有限公司 基于日志关键词生成kpi曲线并标记波段特征的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512209A (zh) * 2015-11-28 2016-04-20 大连理工大学 一种基于特征自动学习的生物医学事件触发词识别方法
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN107239445A (zh) * 2017-05-27 2017-10-10 中国矿业大学 一种基于神经网络的新闻事件抽取的方法及系统
CN108875836A (zh) * 2018-06-27 2018-11-23 浙江大学 一种基于深度多任务学习的简单-复杂活动协同识别方法
CN108897989A (zh) * 2018-06-06 2018-11-27 大连理工大学 一种基于候选事件元素注意力机制的生物事件抽取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512209A (zh) * 2015-11-28 2016-04-20 大连理工大学 一种基于特征自动学习的生物医学事件触发词识别方法
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN107239445A (zh) * 2017-05-27 2017-10-10 中国矿业大学 一种基于神经网络的新闻事件抽取的方法及系统
CN108897989A (zh) * 2018-06-06 2018-11-27 大连理工大学 一种基于候选事件元素注意力机制的生物事件抽取方法
CN108875836A (zh) * 2018-06-27 2018-11-23 浙江大学 一种基于深度多任务学习的简单-复杂活动协同识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZENG D. 等: "Relation Classification via Convolutional Deep Neural Network", 《INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457700A (zh) * 2019-08-07 2019-11-15 中国人民解放军国防科技大学 短文本描述方法和装置
CN110457478A (zh) * 2019-08-09 2019-11-15 泰康保险集团股份有限公司 文本合规性检查方法及装置、电子设备和计算机可读介质
CN110457478B (zh) * 2019-08-09 2022-07-26 泰康保险集团股份有限公司 文本合规性检查方法及装置、电子设备和计算机可读介质
CN110968661A (zh) * 2020-03-04 2020-04-07 成都数联铭品科技有限公司 事件抽取方法及系统、计算机可读存储介质及电子设备
CN111581954A (zh) * 2020-05-15 2020-08-25 中国人民解放军国防科技大学 一种基于语法依存信息的文本事件抽取方法及装置
CN111950199A (zh) * 2020-08-11 2020-11-17 杭州叙简科技股份有限公司 一种基于地震新闻事件的地震数据结构化自动方法
CN112000867A (zh) * 2020-08-17 2020-11-27 桂林电子科技大学 一种基于社交媒体平台的文本分类方法
CN111950297A (zh) * 2020-08-26 2020-11-17 桂林电子科技大学 一种面向异常事件的关系抽取方法
CN112580330A (zh) * 2020-10-16 2021-03-30 昆明理工大学 基于中文触发词指导的越南语新闻事件检测方法
CN112580330B (zh) * 2020-10-16 2023-09-12 昆明理工大学 基于中文触发词指导的越南语新闻事件检测方法
CN114398891A (zh) * 2022-03-24 2022-04-26 三峡智控科技有限公司 基于日志关键词生成kpi曲线并标记波段特征的方法

Similar Documents

Publication Publication Date Title
CN109670172A (zh) 一种基于复合神经网络的景区异常事件抽取方法
Wu et al. Improving review representations with user attention and product attention for sentiment classification
Zhang GroRec: a group-centric intelligent recommender system integrating social, mobile and big data technologies
CN109800310B (zh) 一种基于结构化表达的电力运维文本分析方法
CN114168745B (zh) 面向环氧乙烷衍生品生产过程的知识图谱构建方法
Lu et al. Multi-prototype Chinese character embedding
Ghosal et al. Novelty goes deep. A deep neural solution to document level novelty detection
Wen et al. Sememe knowledge and auxiliary information enhanced approach for sarcasm detection
CN113360582A (zh) 基于bert模型融合多元实体信息的关系分类方法及系统
Park et al. An analysis of environmental big data through the establishment of emotional classification system model based on machine learning: focus on multimedia contents for portal applications
CN115409018A (zh) 基于大数据的公司舆情监测系统及其方法
Petrova et al. Extracting Outcomes from Appellate Decisions in US State Courts.
CN106445914A (zh) 微博情感分类器的构建方法及构建装置
Li et al. Element-aware legal judgment prediction for criminal cases with confusing charges
CN109902174B (zh) 一种基于方面依赖的记忆网络的情感极性检测方法
Puranik A specialist approach for the classification of column data
Wang et al. Simplified representation learning model based on parameter-sharing for knowledge graph completion
Zheng et al. Constructing bi-order-transformer-crf with neural cosine similarity function for power metering entity recognition
Jain et al. Employing Co-learning to evaluate the Explainability of multimodal sentiment analysis
He An intelligent diagnosis system for English writing based on data feature extraction and fusion
Chen et al. Location extraction from Twitter messages using a bidirectional long short-term memory neural network with conditional random field model
Xu et al. Topic sensitive neural headline generation
CN113420116A (zh) 医疗文档的分析方法、装置、设备及介质
Li et al. Joint inter-word and inter-sentence multi-relation modeling for summary-based recommender system
Wang et al. Feature extraction by using attention mechanism in text classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190423