CN115146618B - 一种基于对比表示学习的复杂因果关系抽取方法 - Google Patents
一种基于对比表示学习的复杂因果关系抽取方法 Download PDFInfo
- Publication number
- CN115146618B CN115146618B CN202210797477.1A CN202210797477A CN115146618B CN 115146618 B CN115146618 B CN 115146618B CN 202210797477 A CN202210797477 A CN 202210797477A CN 115146618 B CN115146618 B CN 115146618B
- Authority
- CN
- China
- Prior art keywords
- causal
- sample
- text
- representing
- momentum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001364 causal effect Effects 0.000 title claims abstract description 105
- 238000000605 extraction Methods 0.000 title claims abstract description 26
- 230000015654 memory Effects 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 6
- 238000013136 deep learning model Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000007787 long-term memory Effects 0.000 claims description 4
- 230000006403 short-term memory Effects 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于对比表示学习的复杂因果关系抽取方法,首先,为了将隐式因果关系转化成显式因果关系,从大规模数据集中寻找具有显式因果关系连接词的样例集合初始化记忆动量,这些样例以<原因,结果,因果连接词>三元组的形式组织;接着,获取训练数据集中的文本包含的因果论元集合,将这些因果论元与记忆动量中的因果论元三元组进行匹配,选取相似度最高的因果关系连接词,作为数据增强的因果关系连接词构造正样例;互换正样例中原因和结果的位置,构造负样例。最后,采用对比学习框架,以双向长短期记忆网络和Transformer作为主干网络,学习文本中包含的因果关系。本发明能解决复杂因果关系抽取困难的问题,大幅提高模型的抽取性能。
Description
技术领域
本发明属于自然语言处理技术领域,具体涉及一种复杂因果关系抽取方法。
背景技术
因果关系是一种由现象A导致现象B发生的单向关系。从大规模文本中检测因果关系是自然语言处理知识发现中的重要任务。因果关系抽取在公共健康、社会科学和科学发现等领域都有了很多应用。根据文本中包含的因果论元的数目可以将因果关系分为简单因果关系和复杂因果关系。简单因果关系指文本中包含一个原因论元和一个结果论元。复杂因果关系是指包含多个原因论元或者多个结果论元,其不仅因果论元数目多,论元之间还存在复杂的交互关系。由于复杂因果关系中论元多样,且交互关系错综复杂,以及论元长度参差不一等因素,使得复杂因果关系抽取面临巨大困难,因此目前对因果关系的研究主要集中在简单因果关系抽取上。
已有技术中,对简单因果关系的研究已经涌现了大量的工作,例如基于模板以及人为定义规则的模式匹配方法,这类方法缺乏泛化性且需要大量的语言学专家定义规则。基于机器学习的方法严重依赖高水平的句法特征,如依存树和命名实体,这些特征的定义需要消耗大量的人力物力算力。深度模型近些年来在因果关系抽取中大受欢迎,但是将深度学习应用于复杂因果关系抽取的工作却屈指可数。例如,Dasgupta等人采用对文本进行分割的方式将复杂因果转化为简单因果关系,但是,对句子进行分割会很难捕捉到分句之间的因果关系。同时Christopoulou等人使用基于关系推理的深度学习来识别句子中的多对关系,但是他们处理的关系复杂多样,对因果关系抽取指导意义不大。Li等人采用Tag2Triplet的方法来检测文本中的复杂因果关系,但是其只是对短句子的因果关系起作用,无法用于复杂因果的处理。
发明内容
为了克服现有技术的不足,本发明提供了一种基于对比表示学习的复杂因果关系抽取方法,首先,为了将隐式因果关系转化成显式因果关系,从大规模数据集中寻找具有显式因果关系连接词的样例集合初始化记忆动量,这些样例以<原因,结果,因果连接词>三元组的形式组织;接着,获取训练数据集中的文本包含的因果论元集合,将这些因果论元与记忆动量中的因果论元三元组进行匹配,选取相似度最高的因果关系连接词,作为数据增强的因果关系连接词构造正样例;互换正样例中原因和结果的位置,构造负样例。最后,采用对比学习框架,以双向长短期记忆网络和Transformer作为主干网络,学习文本中包含的因果关系。本发明能解决复杂因果关系抽取困难的问题,大幅提高模型的抽取性能。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:记忆动量初始化;
记忆动量用于因果关系连接词的选取,在训练模型之前,首先在数据集中寻找具有因果关系连接词的样例集合,将其表示成的因果三元组,将提取出来的样例集合以字典的形式存储;其中,xci和xei分别表示记忆动量D中第i个因果三元组的原因和结果,ωi表示对应的因果连接词,m表示D中因果关系三元组的数量;
步骤2:使用记忆动量进行数据增强,来构造正样例;
对文本中的每一对因果论元R=(xc,xe),其中xc和xe分别表示文本中每一对因果论元的原因和结果,进行向量表示,并进行拼接得到XR=Concat(xc,xe),其中xc和xe分别是xc和xe的向量表示;将文本中的因果论元XR与记忆动量中的每一对因果论元Xi=Concat(xci,xei)进行相似度匹配,其中xci和xei分别是xci和xei的向量表示;计算XR和Xi的相似度,获取相似度最高的因果关系连接词,与文本中的因果论元构造正样例Xpos=<xc,ωp,xe>,ωp表示相似度最大的因果连接词;计算公式如下:
式中,Si表示XR和Xi的余弦相似度,index(·)表示取下标的函数,p表示相似度最大的下标;
步骤3:通过方向逆反构造负样例;
将正样例的原因和结果互换位置获取负样例,负样例的形式为Xneg=<xe,ωp,xc>;
步骤4:构造完正负样例后,将数据集中的原始文本和正负样例分别输入到对比表示学习框架的两个编码器中,对两个编码器的输出进行余弦相似度衡量,如果相似度大于0.5,则输出标签表示输入的样例是原始文本中的一对因果关系;否则/>表示输入的样例不是原始文本中的一对因果关系;所述对比表示学习框架由深度学习模型构成;
深度学习模型采用两层结构:双向长短期记忆网络和Transformer;
对深度学习模型进行建模:
L=(1-λ)·L1+λ·L2
其中L1是对比损失,L2是平均绝对误差,L是本发明的最终建模模型,表示向量/>和向量/>之间的欧氏距离,向量/>和向量/>分别表示模型中两个编码器的输出,t>0是定义的半径阈值,如果两个样例匹配,Y=1;否则Y=0;λ表示两个损失函数之间的权重,n表示数据集的大小,yi表示样本的真实标签,/>表示模型预测的标签。
本发明的有益效果如下:
本发明面向自然语言处理信息抽取领域中,复杂因果关系抽取的问题,解决复杂因果关系中论元类型复杂多样、论元方向错综复杂以及现有抽取方法准确率低,泛化能力弱的问题。其将记忆动量进行数据增强,并利用双向长短期记忆网络和Transformer对文本内容进行学习,联合对比表示学习框架对文本中包含的因果关系进行抽取,解决复杂因果关系抽取困难的问题,大幅提高模型的抽取性能。
附图说明
图1为本发明基于对比表示学习的复杂因果关系抽取方法的示意框架图。
图2为本发明基于记忆动量的正负样本构造方法的示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明主要面向文本中的复杂因果关系研究——一种文本中普遍存在的关系类型,解决复杂因果关系中论元数量繁多、论元关系复杂多样以及论元之间的方向性模糊的问题。提出了一种基于对比表示学习的复杂因果关系抽取方法,采用数据增强的方式将隐式因果关系转化为显式因果关系,通过记忆动量构造对比表示学习需要的正负样本,并融合双向长短期记忆网络和Transformer对文本中的关系进行提取,采用对比表示学习对文本中的因果关系进行判断。通过本方法,在复杂因果关系抽取引入数据增强技术,模型的抽取性能得到了有效提升,也大幅度提升了复杂因果关系的方向性识别准确率,首次使用对比表示学习进行因果关系抽取。
如图1所示,一种基于对比表示学习的复杂因果关系抽取方法,包括如下步骤:
步骤1:记忆动量初始化;
记忆动量用于因果关系连接词的选取,在训练模型之前,首先在数据集中寻找具有因果关系连接词的样例集合,将其表示成的因果三元组,将提取出来的样例集合以字典的形式存储;其中,xci和xei分别表示记忆动量D中第i个因果三元组的原因和结果,ωi表示对应的因果连接词,m表示D中因果关系三元组的数量;
步骤2:使用记忆动量进行数据增强,来构造正样例;
对文本中的每一对因果论元R=(xc,xe),其中xc和xe分别表示文本中每一对因果论元的原因和结果,进行向量表示,并进行拼接得到XR=Concat(xc,xe),其中xc和xe分别是xc和xe的向量表示;将文本中的因果论元XR与记忆动量中的每一对因果论元Xi=Concat(xci,xei)进行相似度匹配,其中xci和xei分别是xci和xei的向量表示;计算XR和Xi的相似度,获取相似度最高的因果关系连接词,与文本中的因果论元构造正样例Xpos=<xc,ωp,xe>,ωp表示相似度最大的因果连接词;计算公式如下:
式中,Si表示XR和Xi的余弦相似度,index(·)表示取下标的函数,p表示相似度最大的下标;
步骤3:通过方向逆反构造负样例;
如图2所示,将正样例的原因和结果互换位置获取负样例,负样例的形式为Xneg=<xe,ωp,xc>;
步骤4:构造完正负样例后,将数据集中的原始文本和正负样例分别输入到对比表示学习框架的两个编码器中,对两个编码器的输出进行余弦相似度衡量,如果相似度大于0.5,则输出标签表示输入的样例是原始文本中的一对因果关系;否则/>表示输入的样例不是原始文本中的一对因果关系;所述对比表示学习框架由深度学习模型构成;
深度学习模型采用两层结构:双向长短期记忆网络和Transformer;
对深度学习模型进行建模:
L=(1-λ)·L1+λ·L2
其中L1是对比损失,L2是平均绝对误差,L是本发明的最终建模模型,表示向量/>和向量/>之间的欧氏距离,向量/>和向量/>分别表示模型中两个编码器的输出,t>0是定义的半径阈值,如果两个样例匹配,Y=1;否则Y=0;λ表示两个损失函数之间的权重,n表示数据集的大小,yi表示样本的真实标签,/>表示模型预测的标签。
本发明为一种基于对比表示学习的复杂因果关系抽取方法,首先初始化记忆动量,其次通过记忆动量选取最合适的因果关系连接词,对训练数据中的隐式因果关系进行数据增强;最终基于对比表示学习框架,以双向长短期记忆网络和Transformer作为主干网络学习文本中的因果关系。
Claims (1)
1.一种基于对比表示学习的复杂因果关系抽取方法,其特征在于,包括如下步骤:
步骤1:记忆动量初始化;
记忆动量用于因果关系连接词的选取,在训练模型之前,首先在数据集中寻找具有因果关系连接词的样例集合,将其表示成的因果三元组,将提取出来的样例集合以字典的形式存储;其中,xci和xei分别表示记忆动量D中第i个因果三元组的原因和结果,ωi表示对应的因果连接词,m表示D中因果关系三元组的数量;
步骤2:使用记忆动量进行数据增强,来构造正样例;
对文本中的每一对因果论元R=(xc,xe),其中xc和xe分别表示文本中每一对因果论元的原因和结果,进行向量表示,并进行拼接得到XR=Concat(xc,xe),其中xc和xe分别是xc和xe的向量表示;将文本中的因果论元XR与记忆动量中的每一对因果论元Xi=Concat(xci,xei)进行相似度匹配,其中xci和xei分别是xci和xei的向量表示;计算XR和Xi的相似度,获取相似度最高的因果关系连接词,与文本中的因果论元构造正样例Xpos=<xc,ωp,xe>,ωp表示相似度最大的因果连接词;计算公式如下:
式中,Si表示XR和Xi的余弦相似度,index(·)表示取下标的函数,p表示相似度最大的下标;
步骤3:通过方向逆反构造负样例;
将正样例的原因和结果互换位置获取负样例,负样例的形式为Xneg=<xe,ωp,xc>;
步骤4:构造完正负样例后,将数据集中的原始文本和正负样例分别输入到对比表示学习框架的两个编码器中,对两个编码器的输出进行余弦相似度衡量,如果相似度大于0.5,则输出标签表示输入的样例是原始文本中的一对因果关系;否则/>表示输入的样例不是原始文本中的一对因果关系;所述对比表示学习框架由深度学习模型构成;
深度学习模型采用两层结构:双向长短期记忆网络和Transformer;
对深度学习模型进行建模:
L=(1-λ)·L1+λ·L2
其中L1是对比损失,L2是平均绝对误差,L是本发明的最终建模模型,表示向量/>和向量/>之间的欧氏距离,向量/>和向量/>分别表示模型中两个编码器的输出,t>0是定义的半径阈值,如果两个样例匹配,Y=1;否则Y=0;λ表示两个损失函数之间的权重,n表示数据集的大小,yi表示样本的真实标签,/>表示模型预测的标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210797477.1A CN115146618B (zh) | 2022-07-08 | 2022-07-08 | 一种基于对比表示学习的复杂因果关系抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210797477.1A CN115146618B (zh) | 2022-07-08 | 2022-07-08 | 一种基于对比表示学习的复杂因果关系抽取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115146618A CN115146618A (zh) | 2022-10-04 |
CN115146618B true CN115146618B (zh) | 2024-03-05 |
Family
ID=83412945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210797477.1A Active CN115146618B (zh) | 2022-07-08 | 2022-07-08 | 一种基于对比表示学习的复杂因果关系抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146618B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200044177A (ko) * | 2018-10-05 | 2020-04-29 | 동아대학교 산학협력단 | 학습 데이터 확장을 통한 딥러닝 기반 인과관계 추출을 위한 장치 및 방법 |
US10878505B1 (en) * | 2020-07-31 | 2020-12-29 | Agblox, Inc. | Curated sentiment analysis in multi-layer, machine learning-based forecasting model using customized, commodity-specific neural networks |
CN114492460A (zh) * | 2022-04-08 | 2022-05-13 | 东南大学 | 基于衍生提示学习的事件因果关系抽取方法 |
CN114548117A (zh) * | 2022-02-23 | 2022-05-27 | 安徽理工大学 | 一种基于bert语义增强的因果关系抽取方法 |
-
2022
- 2022-07-08 CN CN202210797477.1A patent/CN115146618B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200044177A (ko) * | 2018-10-05 | 2020-04-29 | 동아대학교 산학협력단 | 학습 데이터 확장을 통한 딥러닝 기반 인과관계 추출을 위한 장치 및 방법 |
US10878505B1 (en) * | 2020-07-31 | 2020-12-29 | Agblox, Inc. | Curated sentiment analysis in multi-layer, machine learning-based forecasting model using customized, commodity-specific neural networks |
CN114548117A (zh) * | 2022-02-23 | 2022-05-27 | 安徽理工大学 | 一种基于bert语义增强的因果关系抽取方法 |
CN114492460A (zh) * | 2022-04-08 | 2022-05-13 | 东南大学 | 基于衍生提示学习的事件因果关系抽取方法 |
Non-Patent Citations (3)
Title |
---|
一种结合LSTM和集成算法的文本校对模型;陶永才;吴文乐;海朝阳;石磊;卫琳;;小型微型计算机系统;20200515(05);全文 * |
王传栋 ; 徐娇 ; 张永 ; .实体关系抽取综述.计算机工程与应用.(12),全文. * |
面向煤矿领域的文本关系抽取关键技术研究;张淑霞;龚炳江;;电脑知识与技术;20200805(22);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115146618A (zh) | 2022-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111738003B (zh) | 命名实体识别模型训练方法、命名实体识别方法和介质 | |
WO2022141878A1 (zh) | 端到端的语言模型预训练方法、系统、设备及存储介质 | |
CN112347268A (zh) | 一种文本增强的知识图谱联合表示学习方法及装置 | |
CN113255320A (zh) | 基于句法树和图注意力机制的实体关系抽取方法及装置 | |
CN113204611A (zh) | 建立阅读理解模型的方法、阅读理解方法及对应装置 | |
CN116204674B (zh) | 一种基于视觉概念词关联结构化建模的图像描述方法 | |
CN116661805B (zh) | 代码表示的生成方法和装置、存储介质及电子设备 | |
CN115545041B (zh) | 一种增强医疗语句语义向量表示的模型构造方法及系统 | |
CN114742069A (zh) | 一种代码相似度检测方法及装置 | |
CN118312600B (zh) | 一种基于知识图谱与大语言模型的智能客服问答方法 | |
CN115309927A (zh) | 多标签引导和多视图度量的海洋遥感图像检索方法及系统 | |
CN115510230A (zh) | 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 | |
CN116258147A (zh) | 一种基于异构图卷积的多模态评论情感分析方法及系统 | |
CN115408488A (zh) | 用于小说场景文本的分割方法及系统 | |
Pogorilyy et al. | Assessment of Text Coherence by Constructing the Graph of Semantic, Lexical, and Grammatical Consistancy of Phrases of Sentences | |
CN116680407A (zh) | 一种知识图谱的构建方法及装置 | |
CN115146618B (zh) | 一种基于对比表示学习的复杂因果关系抽取方法 | |
CN116662924A (zh) | 基于双通道与注意力机制的方面级多模态情感分析方法 | |
Putra et al. | Textual Entailment Technique for the Bahasa Using BiLSTM | |
CN115221284A (zh) | 文本相似度的计算方法、装置、电子设备及存储介质 | |
CN115081445A (zh) | 一种基于多任务学习的短文本实体消歧方法 | |
CN116266268A (zh) | 基于对比学习与语义感知的语义解析方法及装置 | |
CN114239555A (zh) | 一种关键词提取模型的训练方法及相关装置 | |
CN118132738B (zh) | 针对桥梁检评文本的抽取式问答方法 | |
Wang et al. | Chinese Text Implication Recognition Method based on ERNIE-Gram and CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |