CN116644757A - 一种融合句法和语义表示的属性抽取方法 - Google Patents
一种融合句法和语义表示的属性抽取方法 Download PDFInfo
- Publication number
- CN116644757A CN116644757A CN202310516801.2A CN202310516801A CN116644757A CN 116644757 A CN116644757 A CN 116644757A CN 202310516801 A CN202310516801 A CN 202310516801A CN 116644757 A CN116644757 A CN 116644757A
- Authority
- CN
- China
- Prior art keywords
- representation
- adopting
- graph
- constructing
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title abstract description 34
- 238000013528 artificial neural network Methods 0.000 claims abstract description 42
- 230000004927 fusion Effects 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 33
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 15
- 230000009466 transformation Effects 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000015654 memory Effects 0.000 claims abstract description 9
- 230000007246 mechanism Effects 0.000 claims description 26
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 239000000470 constituent Substances 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 3
- 230000008451 emotion Effects 0.000 abstract description 5
- 238000012937 correction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种融合句法和语义表示的属性抽取方法,属于文本情感分析技术领域;解决了目前基于句法的属性抽取方法得到的评论文本表示不准确、效率低、模型的属性抽取性能低的问题,包括如下步骤:采用混合预训练模型实现句子嵌入表示;采用双向长短期记忆模型获得单词隐式表示;构建句法图卷积神经网络实现异构句法树编码;构建语义图卷积神经网络实现语义图编码;采用相互的双仿射变换构建新的句法树编码和语义图编码;采用融合门构建最终句子表示;构建句法感知指针神经网络,预测属性的开始位置和结束位置;构建条件随机场,实现单词标签预测;构建相应的损失函数,实现模型训练;本发明应用于文本属性抽取。
Description
技术领域
本发明提供了一种融合句法和语义表示的属性抽取方法,属于文本情感分析技术领域。
背景技术
移动互联网的迅猛发展促使社交媒体爆发出令人炫目的能量,其传播的信息不断地渗透和改变着人们生活。在社交媒体平台上,人们可以自由地发表他们的观点和看法,并且这些信息会在社交媒体内快速传播和碰撞,给人们的生活带来巨大的影响。例如,用户决策会受到他人发表评论的影响;商家销售行为会受到用户群体评价的影响;政府行为也会受到媒体舆论的影响等。因此,从海量用户评论信息中对情感对象、观点文本以及情感极性的高效识别与分析,已成为网络舆情监测与治理的核心问题。
属性抽取(也称为方面抽取)是指从人们发表的意见中抽取实体方面,其是属性级情感分析的重要子任务之一。传统属性抽取方法主要依靠人工制定的词汇和句法特征来提升属性抽取性能。而这类方法一般都比较耗时且依赖于句子的语法精准度。深度学习正是解决该问题的高效途径之一。这是因为目前研究已经证实深度学习模型不需手工预定义特征,其能够从海量数据中自动学习复杂特征。
近来,深度学习已经被广泛应用在属性抽取任务中。根据神经网络模块内容,基于深度学习的属性抽取方法主要分为:(1)采用卷积神经网络来进行序列标注。卷积神经网络可以获得句子序列表示的局部特征,并通过与其它多样化的嵌入表示、语言模式以及控制模块进行融合,进而获得较全面的句子表示。(2)采用长短期记忆网络获得隐式表示。该网络不仅可以捕获句子序列信息,而且能够捕获句子依存句法结构信息以及句子成分格信息。(3)采用注意力机制突出与属性最相关的背景表示。属性抽取模型囊括自注意力机制和线性注意力机制。(4)采用预训练的通用嵌入表示(如BERT)以及为属性抽取任务定制的嵌入表示,如融入特定领域知识的单词嵌入表示、针对属性的二义性的属性分解表示、融入依存背景的单词嵌入表示以及基于微调技术的情景化嵌入表示。(5)采用序列到序列学习模型、终身学习模型、对比学习和主动学习等其他网络模块进行属性抽取。
尽管句法结构特征可能提供潜在的属性位置信息以及属性与观点之间的相关关系,但是上述大部分工作都没有考虑在属性抽取任务中融入句法结构信息,如依存结构和成分结构,只有少数工作考虑了依存树和成分树结构信息,例如采用从上到下和从下到上的长短期记忆模型来捕获依存句法树结构特征;采用成分格的跨度标注来实现词语级属性抽取;利用句法依存结构获取单词的依存背景,为词嵌入表示加入位置依赖信息。但是,这些工作存在如下不足:(1)只关注单一的句法结构信息,忽略了依存树与成分树的融合效果。异质句法结构能够从不同方面提供句法结构信息,并且二者的融合将会提供互补的优势。依存树结构能够帮助属性抽取获取属性与观点之间的关系;成分树可以帮助属性抽取获取属性的边界值以及属性在句子中的跨度。(2)忽略了依存句法树中边标签和成分句法树中节点标签对属性抽取性能的影响。句法树中的不同标签信息能够为属性抽取任务提供不同程度的贡献度,进而能够精准地获取属性信息。(3)忽略了词间的语义深层潜在关系以及指针网络的边界纠错功能。这是由于网络评论的非正式表达和复杂性可能导致基于句法结构的方法的性能降低。尽管少数工作采用指针网络实现边界纠错,但是需要在基准模型获取候选属性集合的基础上进行二次矫正,并不能实现与基准模型同步纠错。
因此,有必要找到一种高效的基于句法标签信息的成分句法和依存句法的评论文本表示方法,并同时通过注意力机制和图卷积网络建立评论信息的丰富语义关系,构建一种基于句法和语义表示的融合机制,进而通过指针网络和随机场构建属性抽取方法。
发明内容
本发明为了解决目前基于句法的属性抽取方法得到的评论文本表示不准确、效率低、模型的属性抽取性能低的问题,提出了一种融合句法和语义表示的属性抽取方法。
为了解决上述技术问题,本发明采用的技术方案为:一种融合句法和语义表示的属性抽取方法,基于社交媒体评论信息,包括如下步骤:
步骤1:采用混合预训练模型实现社交媒体评论信息的句子嵌入表示;
步骤2:采用双向长短期记忆模型获得社交媒体评论句子中每个单词隐式表示;
步骤3:构建句法图卷积神经网络实现异构句法树编码;
步骤4:构建语义图卷积神经网络实现语义图编码;
步骤5:采用相互的双仿射变换构建新的句法树编码和语义图编码;
步骤6:采用融合门构建最终社交媒体评论信息的句子表示;
步骤7:构建句法感知指针神经网络,预测属性的开始位置和结束位置;
步骤8:构建条件随机场,实现单词标签预测;
步骤9:构建相应的损失函数,实现模型训练。
所述步骤1具体包括以下步骤:
步骤1.1:采用预训练的通用领域嵌入方法获取社交媒体评论信息中单词的通用嵌入表示;
步骤1.2:采用特定领域嵌入方法在特定数据集上进行训练,获得单词的特定嵌入表示;
步骤1.3:将上述单词的通用嵌入表示和特定嵌入表示进行拼接,获得单词的最终嵌入表示,继而组成句子嵌入表示。
所述步骤2具体包括以下步骤:
步骤2.1:采用双向长短期记忆模型获得社交媒体评论句子中每个单词的前向隐式向量和后向隐式向量;
步骤2.2:将单词的前向隐式向量和后向隐式向量进行拼接,获得单词的全面的隐式向量,继而获得融合词序信息的社交媒体评论信息的句子表示。
所述步骤3具体包括以下步骤:
步骤3.1:采用成分句法分析和图卷积神经网络构建成分句法树编码;
首先,针对评论句子,采用成分句法分析构建成分句法树;
其次将成分句法树转化为无向图,其中图中节点为成分句法树中的非叶子节点,图中的边为成分树中的边,并且边的方向是双向的;
然后,采用跨边界桥接操作来获得每个节点的表示,且每个节点的标签为成分树中对应的标签;
随后,采用图卷积神经网络来获得节点表示,其中该步骤将节点的成分标签融入到节点表示中;
最后,采用跨度边界反向桥接来获取每个单词的成分表示;
步骤3.2:采用依存句法分析和图卷积神经网络来构建依存句法树编码;
首先,针对社交媒体评论句子,采用依存句法分析构建依存句法树;
其次将依存句法树转化为无向图,其中图中节点为依存句法树中的节点,图中边为句法树中的边,并且边的方向是双向的;
最后,采用图卷积神经网络来获得节点表示,其中该步骤将节点之间边的依存标签融入到节点表示中,并且节点表示即为每个单词的依存表示;
步骤3.3:采用门控机制实现单词的成分表示和依存表示的融合,获得单词的全面表示,该步骤采用门控权重来调节成分表示和依存表示的贡献度。
所述步骤4具体包括以下步骤:
步骤4.1:采用自注意力机制构建句子的语义图,其中图中节点为单词,边为单词之间的潜在语义关系;将注意力分数矩阵作为图的邻接矩阵;
步骤4.2:采用图卷积神经网络来获得节点表示,并实现句子的语义图编码。
所述步骤5具体包括以下步骤:
步骤5.1:基于句法树编码,采用双仿射变换机制获取语义图编码中的相关特征,从而构建新的句法树编码;
步骤5.2:基于语义图编码,采用双仿射变换机制获取句法树编码中的相关特征,从而构建新的语义图编码。
所述步骤6具体包括以下步骤:
步骤6.1:采用句法树编码表示和语义图编码表示构建融合门权重;
步骤6.2:采用融合门实现句法树编码表示和语义图编码表示的融合,构建最终句子表示。
本发明相对于现有技术具备的有益效果为:
1.本发明提出的融合句法和语义表示的属性抽取方法,基于社交媒体评论,采用句法图卷积神经网络和语义图卷积神经网络获得不同视角的评论表示,然后采用双仿射变换和融合门控机制获得全面的评论表示,并通过句法感知指针神经网络和条件随机场来实现属性抽取。
2.本发明设计的句法图卷积神经网络,将标签信息融入到句法编码表示中,构建成分句法编码表示和依存句法编码表示,最后采用融合门控机制实现成分句法编码和依存句法编码的充分融合,获得全面的评论句法编码表示。
3.本发明设计的语义图卷积神经网络,采用注意力机制获取单词之间潜在语义关系,并利用相应的注意力分数矩阵构建相应的图邻接矩阵,然后采用图卷积神经网络捕获单词之间深层潜在语义关系,从而获得全面的评论语义编码表示。
4.本发明设计的句法感知指针神经网络,以评论的句法信息和语义信息为载体,实现属性的开始位置和结束位置的预测,进而与条件随机场共同实现属性抽取的性能提升。
附图说明
下面结合附图对本发明做进一步说明:
图1为本发明方法的框架结构示意图;
图2为句法图卷积神经网络部分的结构示意图。
具体实施方式
目前基于句法的属性抽取方法只关注单一句法结构信息,却忽略了词间语义深层潜在关系、句法结构中的标签信息以及指针网络在边界纠错的功能。因此,提出一种融合句法和语义表示的属性抽取方法,首先采用通用领域嵌入表示和特定领域嵌入表示获得评论的初始表示信息,然后利用双向长短期记忆模型捕获评论句子的词序信息和依赖信息,随后采用句法图卷积网络捕获词间内在逻辑关系以及长距离的依存关系,然后采用语义图卷积神经网络来捕获词间语义深层潜在关系,通过双仿射变换和融合门机制实现句法和语义信息的深层融合,最后通过句法感知的指针网络和条件随机场进行序列表示和边界调整。本方法是一个增量式框架,包含嵌入表示、双向长短时记忆模型、句法图卷积神经网络、语义图卷积神经网络、双仿射变换、融合门机制、句法感知指针网络以及条件随机场。图1展示了相应的框架图。
本发明的融合句法和语义表示的属性抽取方法是基于双通道图卷积神经网络,即句法图卷积神经网络和语义图卷积神经网络,具体的操作是:
步骤1:采用双嵌入表示方法实现社交媒体评论句子中单词向量嵌入表示:
首先,采用如BERT或Glove等通用领域嵌入方法实现词嵌入表示Eg,从而实现不同词通常拥有不同含义,其中单词xi的通用领域向量表示为
其次,采用fastText在特定领域数据集上进行训练,获取特定领域词嵌入表示Es,从而实现同一词在不同背景下拥有不同含义,其中单词xi的特定领域向量表示为
最后,通过拼接和/>获得单词向量表示wi,即句子评论表示SC=(w1,w2,…,wn)。
步骤2:采用双向长短期记忆模型Bi-LSTM获得单词隐式表示:
首先,采用Bi-LSTM获得每个单词xi的前向隐式向量和后向隐式向量/>
其中为xi的前向LSTM的隐式向量,/>为xi的后向LSTM的隐式向量。
然后,将前向隐式向量和后向隐式向量/>进行拼接,获得单词xi的最终向量表示/>因此句子表示定义为H=(h1,h2,…,hn)。
步骤3:采用句法图卷积神经网络实现异质句法结构边标签形式化以及异构句法树编码,如图2所示,其中句法图卷积神经网络包括成分句法树编码、依存句法树编码以及异构句法表示融合三个部分:
步骤3.1:采用成分句法分析和图卷积神经网络构建成分句法树编码:
首先,将句子评论进行成分句法分析,获得相应的成分句法树;
然后,将成分句法树转化为图Gc=(Uc,Ec),其中Uc是节点集合(句法树中的非叶子节点),Ec是边集合(边是双向)。如果节点u和节点v之间有边,那么否则uu表示节点u的成分标签,如S,NP和VP等。/>表示节点标签uu的向量表示。
随后,采用图卷积神经网络获得节点表示
其中是通过采用跨边界桥接操作获得节点v的初始节点表示,并且跨边界桥接操作定义为短语开始词表示和结束词表示之和,即/>Wc1,Wc2和bc分别是学习的权重和偏差。αuv是邻居成分连接强度分布:
其中该分布αuv不仅能够编码句法边和标签信息,并且能够全面反映邻居之间的连接强度。
最后,通过采用跨度边界反向桥接来获取每个单词的节点表示即
步骤3.2:采用依存句法分析和图卷积神经网络来构建依存句法树编码:
首先,将句子评论进行依存句法分析,获得相应的依存句法树;
然后,将依存句法树可以转化为图Gd=(Ud,Ed),其中Ud是节点集合(依存句法树中所有节点),Ed是边集合。表示依存弧存在情况。/>表示xi和xj之间的边标签,该边是双向的。此外,添加“self”标签作为自循环边/>和“none”标签表示节点间没有边。/>为边/>的向量表示。
最后,采用图卷积神经网络获得节点表示
其中Wd1,Wd2和bd分别是学习的权重和偏差。βij为邻居依存连接强度分布:
其中 定义为/>该定义是为了能够以统一方式来指导依存弧和相应的标签内容。
步骤3.3:采用门控机制实现异构句法表示融合:
为了获得全面句子表示,采用融合门来协调成分节点表示和依存节点表示的贡献,进而获得句子表示:
其中Wg1,Wg2和bg分别是学习的权重和偏差,σ为激活函数。
步骤4:采用语义图卷积神经网络实现语义图编码,进而获得句子的语义特征,其中语义图卷积神经网络包括语义图构建和图卷积神经网络两个部分:
步骤4.1:采用自注意力机制构建句子的语义图:
基于句子隐式表示H,采用自注意力机制构建句子语义图Gs=(Us,Es),其中Us是节点集合(单词集合),Es是边集合。为节点i和节点j之间的语义关系表示。随后将注意力分数矩阵As作为语义图Gs的邻接矩阵,其公式化如下:
其中Q和K为句子隐式表示H,WQ和WK是可学习的权重矩阵,dim为输入的维度值。
步骤4.2:采用图卷积神经网络来获得语义图节点表示
其中,Ws和bs分别是学习的权重和偏差,hj为句子隐式表示。最后,句子的语义图编码表示
步骤5:采用相互的双仿射变换进行句法树编码Hg和语义图编码Hs之间信息传递,获得新的句法树编码表示Hg′和语义图编码表示Hs′:
步骤5.1:基于句法树编码Hg,采用双仿射变换机制获取语义图编码中的相关特征,从而构建新的句法树编码Hg′:
Hg′=softmax(HgW1(Hs)T)Hs;
其中W1为学习权重参数。
步骤5.2:基于语义图编码Hs,采用双仿射变换机制获取句法树中的相关特征,从而构建新的语义图编码Hs′:
Hs′=softmax(HsW2(Hg)T)Hg;
其中W2为学习权重参数。
步骤6:采用融合门构建最终句子表示Ho。
步骤6.1:采用句法树编码表示Hg′和语义图编码表示Hs′构建融合门权重fi:
其中Wo1,Wo2和bo1分别是学习的权重和偏差,σ为激活函数。
步骤6.2:采用融合门权重实现句法树编码表示Hg′和语义图编码表示Hs′的融合,构建最终句子表示
步骤7:构建句法感知指针神经网络,预测属性的开始位置和结束位置。具体地,采用句法感知指针神经网络来解码句子表示Ho,从全局范围来考虑属性的开始位置和结束位置。属性开始位置概率ps(xi)和结束位置概率pe(xi)为:
其中Wo和bo分别为权重和偏差。
步骤8:构建条件随机场,实现单词标签预测。具体地,将融合语义特征和句法结构特征的句子表示Ho传入CRF层,实现单词标签预测。CRF的条件概率p(y|Ho;W,b)计算如下:
其中W和b分别为权重和偏差,Y(Ho)为标签集合。最后,根据最高的条件概率值来获得最优标签结果y*,如下:
步骤9:构建相应的损失函数,实现模型训练。具体地,该模型训练损失函数由标签预测损失函数LA和边界预测损失函数LB构成,即L=LA+LB,二者定义如下:
LA=∑jlog p(y|Ho;W,b);
其中NB为真实属性数量,和/>为预测属性开始和结束位置。
社交媒体文本中属性存在形式多样,这对现有属性抽取方法是个挑战,这是由于属性可能包含多个字,且属性可以表示任何一种事物。本发明采用句法结构和语义关系构建双通道的图卷积神经网络,从而捕获局部和全局的词关系,然后通过双仿射变换和融合门机制获得全面的句子表示,随后通过构建句法感知的指针网络和条件随机场,建立句法和语义感知的属性边界识别机制,实现融合句法和语义表示的属性抽取方法。
本发明提出的融合句法和语义表示的属性抽取方法,基于社交媒体评论,首先采用通用领域嵌入表示和特定领域嵌入表示获得评论的初始表示信息,然后利用双向长短期记忆模型捕获评论句子的词序信息和依赖信息,随后采用句法图卷积神经网络捕获评论的成分句法和依存句法结构信息,并采用语义图卷积神经网络捕获评论单词之间的深层潜在语义关系,然后采用相互的双仿射变换模型获得评论的句法编码信息和语义编码信息的交互信息,实现新的句法编码信息和语义编码信息,并采用融合门控机制获得全面的评论表示,最后通过采用句法感知指针神经网络和条件随机场实现评论中属性的精准定位。
关于本发明具体结构需要说明的是,本发明采用的各部件模块相互之间的连接关系是确定的、可实现的,除实施例中特殊说明的以外,其特定的连接关系可以带来相应的技术效果,并基于不依赖相应软件程序执行的前提下,解决本发明提出的技术问题,本发明中出现的部件、模块、具体元器件的型号、相互间连接方式以及,由上述技术特征带来的常规使用方法、可预期技术效果,除具体说明的以外,均属于本领域技术人员在申请日前可以获取到的专利、期刊论文、技术手册、技术词典、教科书中已公开内容,或属于本领域常规技术、公知常识等现有技术,无需赘述,使得本案提供的技术方案是清楚、完整、可实现的,并能根据该技术手段重现或获得相应的实体产品。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (7)
1.一种融合句法和语义表示的属性抽取方法,基于社交媒体评论信息,其特征在于:包括如下步骤:
步骤1:采用混合预训练模型实现社交媒体评论信息的句子嵌入表示;
步骤2:采用双向长短期记忆模型获得社交媒体评论句子中每个单词隐式表示;
步骤3:构建句法图卷积神经网络实现异构句法树编码;
步骤4:构建语义图卷积神经网络实现语义图编码;
步骤5:采用相互的双仿射变换构建新的句法树编码和语义图编码;
步骤6:采用融合门构建最终社交媒体评论信息的句子表示;
步骤7:构建句法感知指针神经网络,预测属性的开始位置和结束位置;
步骤8:构建条件随机场,实现单词标签预测;
步骤9:构建相应的损失函数,实现模型训练。
2.根据权利要求1所述的一种融合句法和语义表示的属性抽取方法,其特征在于:所述步骤1具体包括以下步骤:
步骤1.1:采用预训练的通用领域嵌入方法获取社交媒体评论信息中单词的通用嵌入表示;
步骤1.2:采用特定领域嵌入方法在特定数据集上进行训练,获得单词的特定嵌入表示;
步骤1.3:将上述单词的通用嵌入表示和特定嵌入表示进行拼接,获得单词的最终嵌入表示,继而组成句子嵌入表示。
3.根据权利要求2所述的一种融合句法和语义表示的属性抽取方法,其特征在于:所述步骤2具体包括以下步骤:
步骤2.1:采用双向长短期记忆模型获得社交媒体评论句子中每个单词的前向隐式向量和后向隐式向量;
步骤2.2:将单词的前向隐式向量和后向隐式向量进行拼接,获得单词的全面的隐式向量,继而获得融合词序信息的社交媒体评论信息的句子表示。
4.根据权利要求3所述的一种融合句法和语义表示的属性抽取方法,其特征在于:所述步骤3具体包括以下步骤:
步骤3.1:采用成分句法分析和图卷积神经网络构建成分句法树编码;
首先,针对评论句子,采用成分句法分析构建成分句法树;
其次将成分句法树转化为无向图,其中图中节点为成分句法树中的非叶子节点,图中的边为成分树中的边,并且边的方向是双向的;
然后,采用跨边界桥接操作来获得每个节点的表示,且每个节点的标签为成分树中对应的标签;
随后,采用图卷积神经网络来获得节点表示,其中该步骤将节点的成分标签融入到节点表示中;
最后,采用跨度边界反向桥接来获取每个单词的成分表示;
步骤3.2:采用依存句法分析和图卷积神经网络来构建依存句法树编码;
首先,针对社交媒体评论句子,采用依存句法分析构建依存句法树;
其次将依存句法树转化为无向图,其中图中节点为依存句法树中的节点,图中边为句法树中的边,并且边的方向是双向的;
最后,采用图卷积神经网络来获得节点表示,其中该步骤将节点之间边的依存标签融入到节点表示中,并且节点表示即为每个单词的依存表示;
步骤3.3:采用门控机制实现单词的成分表示和依存表示的融合,获得单词的全面表示,该步骤采用门控权重来调节成分表示和依存表示的贡献度。
5.根据权利要求4所述的一种融合句法和语义表示的属性抽取方法,其特征在于:所述步骤4具体包括以下步骤:
步骤4.1:采用自注意力机制构建句子的语义图,其中图中节点为单词,边为单词之间的潜在语义关系;将注意力分数矩阵作为图的邻接矩阵;
步骤4.2:采用图卷积神经网络来获得节点表示,并实现句子的语义图编码。
6.根据权利要求5所述的一种融合句法和语义表示的属性抽取方法,其特征在于:所述步骤5具体包括以下步骤:
步骤5.1:基于句法树编码,采用双仿射变换机制获取语义图编码中的相关特征,从而构建新的句法树编码;
步骤5.2:基于语义图编码,采用双仿射变换机制获取句法树编码中的相关特征,从而构建新的语义图编码。
7.根据权利要求6所述的一种融合句法和语义表示的属性抽取方法,其特征在于:所述步骤6具体包括以下步骤:
步骤6.1:采用句法树编码表示和语义图编码表示构建融合门权重;
步骤6.2:采用融合门实现句法树编码表示和语义图编码表示的融合,构建最终句子表示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310516801.2A CN116644757A (zh) | 2023-05-09 | 2023-05-09 | 一种融合句法和语义表示的属性抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310516801.2A CN116644757A (zh) | 2023-05-09 | 2023-05-09 | 一种融合句法和语义表示的属性抽取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116644757A true CN116644757A (zh) | 2023-08-25 |
Family
ID=87614454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310516801.2A Pending CN116644757A (zh) | 2023-05-09 | 2023-05-09 | 一种融合句法和语义表示的属性抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116644757A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131873A (zh) * | 2023-08-29 | 2023-11-28 | 电子科技大学 | 一种基于对比学习的双编码器预训练小样本关系抽取方法 |
-
2023
- 2023-05-09 CN CN202310516801.2A patent/CN116644757A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131873A (zh) * | 2023-08-29 | 2023-11-28 | 电子科技大学 | 一种基于对比学习的双编码器预训练小样本关系抽取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829722B (zh) | 一种远程监督的Dual-Attention关系分类方法及系统 | |
CN109492113B (zh) | 一种面向软件缺陷知识的实体、关系联合抽取方法 | |
CN111401084B (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
CN111507070B (zh) | 自然语言生成方法和装置 | |
CN111738006A (zh) | 基于商品评论命名实体识别的问题生成方法 | |
CN115964459B (zh) | 基于食品安全认知图谱的多跳推理问答方法及系统 | |
CN113032568A (zh) | 一种基于bert+bilstm+crf并融合句型分析的查询意图识别方法 | |
CN113657115A (zh) | 一种基于讽刺识别和细粒度特征融合的多模态蒙古文情感分析方法 | |
CN111522961A (zh) | 一种基于注意力机制及实体描述的产业图谱构建方法 | |
CN115759042A (zh) | 一种基于句法感知提示学习的句子级问题生成方法 | |
Zhu et al. | Machine Learning‐Based Grammar Error Detection Method in English Composition | |
CN113901208A (zh) | 融入主题特征的中越跨语言评论情感倾向性分析方法 | |
CN111340006B (zh) | 一种手语识别方法及系统 | |
CN114742016B (zh) | 一种基于多粒度实体异构图的篇章级事件抽取方法及装置 | |
CN116644757A (zh) | 一种融合句法和语义表示的属性抽取方法 | |
CN116595023A (zh) | 地址信息的更新方法和装置、电子设备及存储介质 | |
CN116661805A (zh) | 代码表示的生成方法和装置、存储介质及电子设备 | |
Tao et al. | Multi‐head attention graph convolutional network model: End‐to‐end entity and relation joint extraction based on multi‐head attention graph convolutional network | |
CN118261163A (zh) | 基于transformer结构的智能评价报告生成方法及系统 | |
Mishra et al. | An object localization-based dense image captioning framework in Hindi | |
CN113010662B (zh) | 一种层次化会话式机器阅读理解系统和方法 | |
CN114372454B (zh) | 文本信息抽取方法、模型训练方法、装置及存储介质 | |
Yin | Fuzzy information recognition and translation processing in English interpretation based on a generalized maximum likelihood ratio algorithm | |
CN115455937A (zh) | 一种基于句法结构和对比学习的否定分析方法 | |
CN113591493B (zh) | 翻译模型的训练方法及翻译模型的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |