CN109558591A - 中文事件检测方法及装置 - Google Patents

中文事件检测方法及装置 Download PDF

Info

Publication number
CN109558591A
CN109558591A CN201811438685.2A CN201811438685A CN109558591A CN 109558591 A CN109558591 A CN 109558591A CN 201811438685 A CN201811438685 A CN 201811438685A CN 109558591 A CN109558591 A CN 109558591A
Authority
CN
China
Prior art keywords
character
input text
trigger word
word block
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811438685.2A
Other languages
English (en)
Inventor
林鸿宇
韩先培
孙乐
陆垚杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Software of CAS
Original Assignee
Institute of Software of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Software of CAS filed Critical Institute of Software of CAS
Priority to CN201811438685.2A priority Critical patent/CN109558591A/zh
Publication of CN109558591A publication Critical patent/CN109558591A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明提供一种中文事件检测方法及装置。所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块,所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元。本发明能够直接在字符级别生成完整的触发词块以及对触发词块进行事件类别分类,从而避免事件触发词块与词的不匹配问题,得出更鲁棒的事件检测结果。

Description

中文事件检测方法及装置
技术领域
本发明涉及自然语言处理领域,尤其涉及一种中文事件检测方法及装置。
背景技术
事件抽取是信息抽取中的一个关键任务,事件检测则是事件抽取中的一个关键步骤。事件检测的目标是从给定的文本中识别出特定事件类别的触发词。例如,给定句子“亨利受伤了”,一个事件检测系统应当能够识别出“受伤”是一个“伤害”类别事件的触发词。
现有的神经网络模型通常将事件检测转化为一个词级别的分类问题,例如,在句子中“亨利受伤了”中,一个事件检测系统通过将上述句子中的三个词分别分类为“空”,“伤害事件”以及“空”,从而完成事件检测任务。这类的模型对先验信息的依赖较小,并且已经在事件检测领域取得了较大的进展。
在实现本发明的过程中,发明人发现现有技术中至少存在如下技术问题:
基于词级别分类的事件检测方法没有考虑到事件触发词块与词的不匹配问题。特别是在中文当中,许多事件触发词块并不是一个特定的词,具体地说,一个事件触发词块可能是一个词的一部分,还有可能同时跨越多个词,例如,给定句子“这家公司并购了多家公司”中的“并购”一词中的“并”和“购”属于两种特定类别的事件触发词块,即事件触发词块“并”和“购”是“并购”一词中的一部分;例如,给定句子“那个受伤的士兵不幸身亡了”中的多个词“受了伤”、“身亡”构成一个事件触发词块,即一个事件触发词块由多个词构成。显然,基于词级别分类的事件检测方法不可能检测到上述的事件触发词块,因此这类基于词级别分类的事件检测系统无法取得最优的结果。
发明内容
本发明提供的中文事件检测方法及装置,能够直接在字符级别生成完整的触发词块以及对触发词块进行事件类别分类,从而避免事件触发词块与词的不匹配问题,得出更鲁棒的事件检测结果。
第一方面,本发明提供一种中文事件检测方法,包括:
利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征和词级别特征抽取得到所述输入文本的字符级别特征表示和词级别特征表示,并按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示;
基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分,利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值,并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块;
基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分,利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值,并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别;
其中,所述触发词块由所述触发词块的长度以及当前字符在所述触发词块中的位置来确定。
第二方面,本发明提供一种中文事件检测装置,所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块,所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元;
所述字符级别特征表示生成单元,用于利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征抽取得到所述输入文本的字符级别特征表示;
所述词级别特征表示生成单元,用于利用卷积神经网络卷积层和动态多池化层对输入文本进行词级别特征抽取得到所述输入文本的词符级别特征表示;
所述特征混合单元,用于按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示;
所述触发词块生成模块,用于基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分,利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值,并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块;
所述事件类别分类模块,用于基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分,利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值,并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别;
其中,所述触发词块由所述触发词块的长度以及当前字符在所述触发词块中的位置来确定。
本发明实施例提供的中文事件检测方法及装置,利用字符级别文本能够揭示触发词块内部的组合结构信息以及词级别文本能够提供精确的语义知识提出了字符的混合特征表示,并基于字符的混合特征表示在每个中文字符上直接识别整个触发词块以及事件类别识别,与现有技术相比,本发明能够避免事件触发词块与词的不匹配问题,从而能够显著提升中文事件检测结果的准确性。
附图说明
图1为本发明一实施例中文事件检测方法的流程图;
图2为字符级别特征表示与词级别特征表示混合示意图;
图3为上述实施例中触发词块检测结果的示意图;
图4为本发明一实施例中文事件检测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种中文事件检测方法,如图1所示,所述方法包括:
S11、利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征和词级别特征抽取得到所述输入文本的字符级别特征表示和词级别特征表示,并按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示。
S12、基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分,利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值,并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块。
S13、基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分,利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值,并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别。
其中,所述触发词块由所述触发词块的长度以及当前字符在所述触发词块中的位置来确定。
本发明实施例提供的中文事件检测方法,利用字符级别文本能够揭示触发词块内部的组合结构信息以及词级别文本能够提供精确的语义知识提出了字符的混合特征表示,并基于字符的混合特征表示在每个中文字符上直接识别整个触发词块以及事件类别识别,与现有技术相比,本发明能够避免事件触发词块与词的不匹配问题,从而能够显著提升中文事件检测结果的准确性。
具体地,利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征和词级别特征抽取得到所述输入文本的字符级别特征表示和词级别特征表示具体实现步骤如下:
1)利用卷积层捕捉输入文本的组合语义:rij=tanh(wi·xj:j+h-1+bi)
其中,xj:j+h-1代表的是输入文本中从第j个字符(或者词)到第j+h-1个字符(或者词)的向量化表示,wi和bi是模型参数,tanh代表激活函数。
2)利用动态多池化层保留输入文本不同部分的重要信息:
其中,c表示当前待检测的字符(或者词)所处的位置。
3)将拼接起来得到该当前字符(或者词)的字符级别特征表示f′char(或者词级别特征表示f′word)。
可选地,当所述预定的混合规则为连接混合规则时,所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括:
直接将所述输入文本的字符级别特征表示与词级别特征表示连接,以得到所述输入文本的混合特征表示。
如图2所示,利用连接混合规则得到的所述输入文本的混合特征表示为:fC=f′char+f′word
可选地,当所述预定的混合规则为通用混合规则时,所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括:
基于所述输入文本的字符级别特征表示与词级别特征表示的相对重要程度得到所述输入文本的混合特征表示。
如图2所示,利用连接混合规则得到的所述输入文本的混合特征表示为:fG=zGf′char+(1-zG)f′word
其中,zG和(1-zG)分别代表字符级别特征表示和词级别特征表示的相对重要性,zG的计算方式如下:
zG=sigmoid(WGf′char+UGf′word+bG)
其中WG是字符级特征在重要打分中的影响的权重矩阵,UG是词级别特征在重要打分中的影响的权重矩阵,bG则是一个基线偏置量,表示字符级特征的基线重要程度。可选地,当所述预定的混合规则为任务相关混合规则时,所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括:
基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性得到所述输入文本的第一混合特征表示,其中,所述输入文本的第一混合特征表示用于生成最终触发词块;
基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性得到所述输入文本的第二混合特征表示,所述输入文本的第二混合特征表示用于确定最终触发词块的事件类别。
如图2所示,利用连接混合规则得到的所述输入文本的第一混合特征表示和第二混合特征表示为:
fN=zNf′char+(1-zN)f′word,fT=zTf′char+(1-zT)f′word
其中,zN和(1-zN)分别代表字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性,zT和(1-zT)分别代表字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性,zN和zT的计算方式如下:
zT=sigmoid(WNf′char+UNf′word+bN),zT=sigmoid(WTf′char+UTf′word+bT)。
其中,WN表示的是字符级特征对应于相对重要性ZN的权重矩阵,UN是词级别特征对应于相对重要性ZN的权重矩阵,BN则是一个基线偏置量。同样地2,WT表示的是字符级特征对应于相对重要性ZT的权重矩阵,UT是词级别特征对应于相对重要性ZT的权重矩阵,BT则是一个基线偏置量。
如图3所示,给出对于输入文本“那受了伤的士兵”最终触发词块“受了伤”的生成结果示意图,由于训练数据中98.5%的候选触发词块的长度均小于等于3个字符,因此对于每个字符共有6个包含该字符的候选触发词块,加上NIL标记(即该字符不属于任何触发词块),一共有7个可能的触发词块类别,分别计算该字符属于各个候选触发词块的得分,并归一化得分从而得到每个候选触发词块的分类概率值。
其中,图3中表格说明:第1列数字为当前字符在对应触发词块中的位置,第2列数字为对应触发词块的长度,第3列显示的是对应触发词块,第4列表示各个触发词块的分类概率值。
本发明实施例还提供一种中文事件检测装置,如图4所示,所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块,所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元;
所述字符级别特征表示生成单元,用于利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征抽取得到所述输入文本的字符级别特征表示;
所述词级别特征表示生成单元,用于利用卷积神经网络卷积层和动态多池化层对输入文本进行词级别特征抽取得到所述输入文本的词符级别特征表示;
所述特征混合单元,用于按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示;
所述触发词块生成模块,用于基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分,利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值,并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块;
所述事件类别分类模块,用于基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分,利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值,并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别;
其中,所述触发词块由所述触发词块的长度以及当前字符在所述触发词块中的位置来确定。
本发明实施例提供的中文事件检测装置,利用字符级别文本能够揭示触发词块内部的组合结构信息以及词级别文本能够提供精确的语义知识提出了字符的混合特征表示,并基于字符的混合特征表示在每个中文字符上直接识别整个触发词块以及事件类别识别,与现有技术相比,本发明能够避免事件触发词块与词的不匹配问题,从而能够显著提升中文事件检测结果的准确性。
可选地,当所述预定的混合规则为连接混合规则时,所述特征混合单元,用于直接将所述输入文本的字符级别特征表示与词级别特征表示连接,以得到所述输入文本的混合特征表示。
可选地,当所述预定的混合规则为通用混合规则时,所述特征混合单元,用于基于所述输入文本的字符级别特征表示与词级别特征表示的相对重要程度得到所述输入文本的混合特征表示。
可选地,当所述预定的混合规则为任务相关混合规则时,所述特征混合单元,用于基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性得到所述输入文本的第一混合特征表示,以及基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性得到所述输入文本的第二混合特征表示;
其中,所述输入文本的第一混合特征表示作为所述触发词块生成模块的输入用于生成最终触发词块;所述输入文本的第二混合特征表示作为所述事件类别分类模块的输入用于确定最终触发词块的事件类别。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种中文事件检测方法,其特征在于,包括:
利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征和词级别特征抽取得到所述输入文本的字符级别特征表示和词级别特征表示,并按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示;
基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分,利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值,并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块;
基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分,利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值,并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别;
其中,所述触发词块由所述触发词块的长度以及当前字符在所述触发词块中的位置来确定。
2.根据权利要求1所述的方法,其特征在于,当所述预定的混合规则为连接混合规则时,所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括:
直接将所述输入文本的字符级别特征表示与词级别特征表示连接,以得到所述输入文本的混合特征表示。
3.根据权利要求1所述的方法,其特征在于,当所述预定的混合规则为通用混合规则时,所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括:
基于所述输入文本的字符级别特征表示与词级别特征表示的相对重要程度得到所述输入文本的混合特征表示。
4.根据权利要求1所述的方法,其特征在于,当所述预定的混合规则为任务相关混合规则时,所述按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示包括:
基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性得到所述输入文本的第一混合特征表示,其中,所述输入文本的第一混合特征表示用于生成最终触发词块;
基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性得到所述输入文本的第二混合特征表示,所述输入文本的第二混合特征表示用于确定最终触发词块的事件类别。
5.一种中文事件检测装置,其特征在于,所述装置包括混合特征表示生成模块、触发词块生成模块和事件类别分类模块,所述混合特征表示生成模块包括字符级别特征表示生成单元、词级别特征表示生成单元和特征混合单元;
所述字符级别特征表示生成单元,用于利用卷积神经网络卷积层和动态多池化层对输入文本进行字符级别特征抽取得到所述输入文本的字符级别特征表示;
所述词级别特征表示生成单元,用于利用卷积神经网络卷积层和动态多池化层对输入文本进行词级别特征抽取得到所述输入文本的词符级别特征表示;
所述特征混合单元,用于按照预定的混合规则将输入文本的字符级别特征表示和词级别特征表示进行混合得到所述输入文本的混合特征表示;
所述触发词块生成模块,用于基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定包含所述输入文本中当前字符的候选触发词块以及所述当前字符属于各个候选触发词块的得分,利用卷积神经网络软最大化层归一化所述当前字符属于各个候选触发词块的得分以得到所述当前字符属于各个候选触发词块的分类概率值,并选取最大分类概率值的候选触发词块作为所述当前字符的最终触发词块;
所述事件类别分类模块,用于基于所述输入文本的混合特征表示,利用卷积神经网络全连接层确定所述当前字符的最终触发词块属于事件类别的得分,利用卷积神经网络软最大化层归一化所述当前字符的最终触发词块属于各个事件类别的得分以得到所述当前字符的最终触发词块属于各个事件类别的分类概率值,并选取最大分类概率值的事件类别作为所述当前字符的最终触发词块的最终事件类别;
其中,所述触发词块由所述触发词块的长度以及当前字符在所述触发词块中的位置来确定。
6.根据权利要求5所述的装置,其特征在于,当所述预定的混合规则为连接混合规则时,所述特征混合单元,用于直接将所述输入文本的字符级别特征表示与词级别特征表示连接,以得到所述输入文本的混合特征表示。
7.根据权利要求5所述的装置,其特征在于,当所述预定的混合规则为通用混合规则时,所述特征混合单元,用于基于所述输入文本的字符级别特征表示与词级别特征表示的相对重要程度得到所述输入文本的混合特征表示。
8.根据权利要求5所述的装置,其特征在于,当所述预定的混合规则为任务相关混合规则时,所述特征混合单元,用于基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块过程中的相对重要性得到所述输入文本的第一混合特征表示,以及基于所述输入文本的字符级别特征表示和词级别特征表示在确定最终触发词块的事件类别过程中的相对重要性得到所述输入文本的第二混合特征表示;
其中,所述输入文本的第一混合特征表示作为所述触发词块生成模块的输入用于生成最终触发词块;所述输入文本的第二混合特征表示作为所述事件类别分类模块的输入用于确定最终触发词块的事件类别。
CN201811438685.2A 2018-11-28 2018-11-28 中文事件检测方法及装置 Pending CN109558591A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811438685.2A CN109558591A (zh) 2018-11-28 2018-11-28 中文事件检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811438685.2A CN109558591A (zh) 2018-11-28 2018-11-28 中文事件检测方法及装置

Publications (1)

Publication Number Publication Date
CN109558591A true CN109558591A (zh) 2019-04-02

Family

ID=65867816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811438685.2A Pending CN109558591A (zh) 2018-11-28 2018-11-28 中文事件检测方法及装置

Country Status (1)

Country Link
CN (1) CN109558591A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472051A (zh) * 2019-07-24 2019-11-19 中国科学院软件研究所 一种基于变化量表示学习的事件检测方法
CN111310927A (zh) * 2020-01-19 2020-06-19 哈尔滨工业大学 一种引入推理机制的文本生成方法
CN113722481A (zh) * 2021-08-23 2021-11-30 国家计算机网络与信息安全管理中心 一种基于类别和实例增强的文本多事件检测方法与装置
CN114841162A (zh) * 2022-05-20 2022-08-02 中国电信股份有限公司 文本处理方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017130089A1 (en) * 2016-01-26 2017-08-03 Koninklijke Philips N.V. Systems and methods for neural clinical paraphrase generation
CN107122416A (zh) * 2017-03-31 2017-09-01 北京大学 一种中文事件抽取方法
CN107239445A (zh) * 2017-05-27 2017-10-10 中国矿业大学 一种基于神经网络的新闻事件抽取的方法及系统
CN108829801A (zh) * 2018-06-06 2018-11-16 大连理工大学 一种基于文档级别注意力机制的事件触发词抽取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017130089A1 (en) * 2016-01-26 2017-08-03 Koninklijke Philips N.V. Systems and methods for neural clinical paraphrase generation
CN107122416A (zh) * 2017-03-31 2017-09-01 北京大学 一种中文事件抽取方法
CN107239445A (zh) * 2017-05-27 2017-10-10 中国矿业大学 一种基于神经网络的新闻事件抽取的方法及系统
CN108829801A (zh) * 2018-06-06 2018-11-16 大连理工大学 一种基于文档级别注意力机制的事件触发词抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HONGYU LIN 等: "Nugget Proposal Networks for Chinese Event Detection", 《HTTPS://ARXIV.ORG/ABS/1805.00249》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472051A (zh) * 2019-07-24 2019-11-19 中国科学院软件研究所 一种基于变化量表示学习的事件检测方法
CN111310927A (zh) * 2020-01-19 2020-06-19 哈尔滨工业大学 一种引入推理机制的文本生成方法
CN111310927B (zh) * 2020-01-19 2022-04-15 哈尔滨工业大学 一种引入推理机制的文本生成方法
CN113722481A (zh) * 2021-08-23 2021-11-30 国家计算机网络与信息安全管理中心 一种基于类别和实例增强的文本多事件检测方法与装置
CN113722481B (zh) * 2021-08-23 2023-09-22 国家计算机网络与信息安全管理中心 一种基于类别和实例增强的文本多事件检测方法与装置
CN114841162A (zh) * 2022-05-20 2022-08-02 中国电信股份有限公司 文本处理方法、装置、设备及介质
CN114841162B (zh) * 2022-05-20 2024-01-05 中国电信股份有限公司 文本处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN108717406B (zh) 文本情绪分析方法、装置及存储介质
US20230195773A1 (en) Text classification method, apparatus and computer-readable storage medium
CN108804677B (zh) 结合多层级注意力机制的深度学习问题分类方法及系统
CN109558591A (zh) 中文事件检测方法及装置
CN110209806A (zh) 文本分类方法、文本分类装置及计算机可读存储介质
CN108829719A (zh) 一种非事实类问答答案选择方法及系统
US20230385409A1 (en) Unstructured text classification
CN107330011A (zh) 多策略融合的命名实体的识别方法及装置
CN105139237A (zh) 信息推送的方法和装置
CN112667794A (zh) 一种基于孪生网络bert模型的智能问答匹配方法及系统
CN111159363A (zh) 一种基于知识库的问题答案确定方法及装置
CN109918560A (zh) 一种基于搜索引擎的问答方法和装置
Atia et al. Increasing the accuracy of opinion mining in Arabic
CN109117480A (zh) 词预测方法、装置、计算机设备及存储介质
CN113505200B (zh) 一种结合文档关键信息的句子级中文事件检测的方法
CN107679070B (zh) 一种智能阅读推荐方法与装置、电子设备
CN111814454A (zh) 一种社交网络上的多模态网络欺凌检测模型
CN111581623B (zh) 智能数据交互方法、装置、电子设备及存储介质
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
CN110610003B (zh) 用于辅助文本标注的方法和系统
CN110992988B (zh) 一种基于领域对抗的语音情感识别方法及装置
CN113704396A (zh) 短文本分类方法、装置、设备及存储介质
Islam et al. Review analysis of ride-sharing applications using machine learning approaches: Bangladesh perspective
CN109660621A (zh) 一种内容推送方法及服务设备
JP2009237640A (ja) 情報抽出装置、情報抽出方法および情報抽出プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190402