CN113158051B - 一种基于信息传播和多层上下文信息建模的标签排序方法 - Google Patents

一种基于信息传播和多层上下文信息建模的标签排序方法 Download PDF

Info

Publication number
CN113158051B
CN113158051B CN202110443619.XA CN202110443619A CN113158051B CN 113158051 B CN113158051 B CN 113158051B CN 202110443619 A CN202110443619 A CN 202110443619A CN 113158051 B CN113158051 B CN 113158051B
Authority
CN
China
Prior art keywords
information
label
text
representation
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110443619.XA
Other languages
English (en)
Other versions
CN113158051A (zh
Inventor
张晓�
刘萌
尹建华
聂礼强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Shandong Jianzhu University
Original Assignee
Shandong University
Shandong Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University, Shandong Jianzhu University filed Critical Shandong University
Priority to CN202110443619.XA priority Critical patent/CN113158051B/zh
Publication of CN113158051A publication Critical patent/CN113158051A/zh
Application granted granted Critical
Publication of CN113158051B publication Critical patent/CN113158051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明提供了一种基于信息传播和多层上下文信息建模的标签排序方法,使用标签信息融合机制对标签名字信息和标签描述信息进行融合,初步得到标签的信息表示;构建父标签和子标签之间的交互信息,将父标签的信息传递给子节点,进一步强化标签的语义信息;采用多层上下文信息方法抽取待标记文本的表示,并对多个层次的文本表示进行融合,以及添加位置编码信息;抽取标签相关的待标记文本表示,并使用多层感知机预测文本‑标签之间的相关度,按照相关度对标签进行排序。本发明可以获得多层次文本表示,以及使用不可见标签对文本进行标注,使用不可见标签对文本进行标注,准确度大幅度提高。

Description

一种基于信息传播和多层上下文信息建模的标签排序方法
技术领域
本发明属于标签信息优化处理技术领域,具体涉及一种基于信息传播和多层上下文信息建模的标签排序方法。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
在大数据时代,面对日益剧增的数据,用户想要快速找到自己想要的信息变得越来越困难。与此同时,为了更好的管理、整合数据,标签信息被广泛的应用在诸多平台,如:社区问答网站、新闻平台等。此外,这些平台也可以基于用户关注的标签为用户推荐他们感兴趣的内容。不过,有时候用户并不能很好地给他们创建的文本内容标记合适的标签。基于此,设计一个智能的标签排序方法帮助用户进行内容标记十分重要,这既可以提升用户体验,又可以提升内容分发效率。
特别地,构建一个标签排序系统去标记用户上传的文本内容并不简单,主要有以下挑战:
1)标签可能被组织成一个有向无环图,所有的标签通过有向边进行连接,所以标签并不是独立的。因此,当学习标签表示的时候,我们需要去考虑标签之间的关联。
2)新的标签可能在任何时间被创建,所以有许多标签很少去标记文本内容,这些标签被称为不可见标签,反之被称为可见标签。然而,这些标签同样是有意义的,也应被应用于文本内容标记。不过目前如何使用这些新标签去标记文本是没有被探究的。
3)用户上传的文本内容经常是复杂的,包含一个或多个句子。因此如何去理解复杂的文本,捕捉文本和标签之间的联系是十分重要的。
发明内容
本发明为了解决上述问题,提出了一种基于信息传播和多层上下文信息建模的标签排序方法,本发明可以获得多层次文本表示,以及使用不可见标签对文本进行标注,同时,对于不可见标签引入多维注意力机制从父标签获得有意义的信息去强化子标签的语义表示,提高了文本标注的准确度。
根据一些实施例,本发明采用如下技术方案:
一种基于信息传播和多层上下文信息建模的标签排序方法,包括以下步骤:
使用标签信息融合机制对标签名字信息和标签描述信息进行融合,初步得到标签的信息表示;
构建父标签和子标签之间的交互信息,将父标签的信息传递给子节点,进一步强化标签的语义信息;
采用多层上下文信息方法抽取待标记文本的表示,并对多个层次的文本表示进行融合,以及添加位置编码信息;
抽取标签相关的待标记文本表示,并使用多层感知机预测文本-标签之间的相关度,按照相关度对标签进行排序。
作为可选择的实施方式,使用标签信息融合机制对标签名字信息和标签描述信息进行融合的具体过程包括:
提取标签名字的特征En,以及标签描述的特征Ed
采用平均池化操作得到标签名字的信息表示tn,以标签名字为主,使用注意力机制去抽取标签描述中有意义的信息,得到标签描述的表示td
利用高速网络学习门控向量Gn和Gd,分别过滤标签名字和描述的信息得到标签的表示t。
作为可选择的实施方式,构建父标签和子标签之间的交互信息的具体过程包括:每个子标签有lf个父标签,采用元素级别的操作去挖掘子标签t和父标签tf之间的相对信息:
Figure BDA0003035935390000031
其中,[:;:]表示的是拼接操作,以及-和*分别表示元素级别的减法和乘法,l-1表示是第l-1次传播,多次的传播使得子标签间接的得到祖辈标签的信息。
作为可选择的实施方式,将父标签的信息传递给子节点的具体过程包括:采用多维的注意力机制去细粒度的捕捉两者之间的关联,并将父标签的信息传递给子标签,进一步强化子标签的语义信息,并利用short-cut机制去除标签之间图结构的噪音,得到最终的标签表示:
t=t+tL
L是最终的传播次数。
作为可选择的实施方式,采用多层上下文信息方法抽取待标记文本的表示的具体过程包括:
计算待标记的文本的特征表示,采用多个不同尺度的卷积神经网络来抽取不同层次的文本表示,特征表示
Figure BDA0003035935390000041
其中,θj表示卷积操作,gj是对应的可学习的卷积参数,
Figure BDA0003035935390000042
表示第j个卷积操作得到的文本表示,以及j∈{1,...,m}。
作为可选择的实施方式,对多个层次的文本表示进行融合,以及添加位置编码信息的具体过程包括:
将不同层次的文本表示进行融合得到更全面的文本表示
Figure BDA0003035935390000043
Figure BDA0003035935390000044
其中,Wc,bc是需要学习的参数,以及σ是激活函数ReLU;
在融合之前和文本表示中均使用short-cut机制,从而得到最终的待标记文本特征。
作为可选择的实施方式,用多层感知机预测文本-标签之间的相关度的具体过程包括:
根据标记文本的表示和标签的表示,使用注意力机制对文本中与标签相关的信息进行抽取,得到相关的文本表示q;
增加模型到不可见标签的泛化能力,采用元素级别的计算,以捕捉文本和标签之间的交互信息qinter
qinter=[q;t′;(q-t′);(q*t′)]
利用多层感知机在交互信息上,以预测文本和标签之间的相关程度s,s=Wqhq+bq,hq=σ(Wqtqinter+bqt),其中,Wqt,Wq,bqt,bq是需要学习的参数,σ是激活函数ReLU。
一种基于信息传播和多层上下文信息建模的标签排序系统,包括:
标签信息融合模块,被配置为使用标签信息融合机制对标签名字信息和标签描述信息进行融合,初步得到标签的信息表示;
标签信息传播模块,被配置为构建父标签和子标签之间的交互信息,将父标签的信息传递给子节点,进一步强化标签的语义信息;
多层上下文信息编码模块,被配置为采用多层上下文信息方法抽取待标记文本的表示,并对多个层次的文本表示进行融合,以及添加位置编码信息;
交预测模块,被配置为抽取标签相关的待标记文本表示,并使用多层感知机预测文本-标签之间的相关度,按照相关度对标签进行排序。
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法中的步骤。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法中的步骤。
与现有技术相比,本发明的有益效果为:
(1)本发明提出基于信息传播和多层上下文信息建模的标签排序方法,用于文本标注任务可以获得多层次文本表示,以及使用不可见标签对文本进行标注。
(2)本发明为了更好的表示标签,尤其是不可见标签,引入多维注意力机制从父标签获得有意义的信息去强化子标签的语义表示。此外,还使用了标签描述丰富标签表示;
(3)本发明使用不可见标签对文本进行标注,准确度大幅度提高。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明中标签信息展示;
图2为本发明解决问题的模型图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,标签具有本身的名字信息以及详细的文本描述信息,同时标签被组织成了有向无环图,子标签可能具有一个或多个父标签。标签名字信息是比较粗糙的,而标签的描述信息是细粒度的,但是同时后者不可避免的包含了一些冗余信息。
如图2所示,一种基于信息传播和多层上下文信息建模的标签排序方法,用于给用户上传的文本内容标记合适的标签。可以使用不可见标签去标记文本。同时,部分标签具备文本描述信息,它可以丰富标签的语义信息,所以本实施例在模型中融合了标签描述信息。
具体地,本实施例设计了一个标签信息融合机制去抽取标签描述中重要的信息,然后结合它和标签名字的信息去表示每个标签。之后,为了进一步强化标签表示,尤其是不可见标签,本实施例构建了基于有向无环图的信息传播模块去从连接的父标签传播信息到子标签。与此同时,本实施例介绍了一个多层上下文信息编码模块去加强对于待标记文本的理解,使用了多个尺度的卷积神经网络去捕捉多层次的上下文信息。紧接着,设计了一个交互模块,去捕捉待标记的文本表示和标签表示之间的交互信息。最后一个多层感知机被用来处理交互信息从而预测标签排序分数。
具体的,一种基于信息传播和多层上下文建模的标签排序方法,包括以下步骤:
(1)使用标签信息融合机制对标签名字信息和标签描述信息进行融合初步得到标签的信息表示;
(2)构建父标签和子标签之间的交互信息,利用信息传播将父标签的信息传递给子节点,进一步强化标签的语义信息;
(3)采用多层上下文信息编码去抽取待标记文本的表示,并对多个层次的文本表示进行融合,以及添加位置编码信息;
(4)抽取标签相关的待标记文本表示,并使用多层感知机预测文本-标签之间的相关分数。
所述步骤(1)中,如图2所示,标签信息融合处理包含以下几部分:
(1-1)提取标签名字的特征En,以及标签描述的特征Ed
(1-2)标签名字含有多个名词,所以采用平均池化操作得到标签名字的信息表示tn。之后以标签名字为主,使用注意力机制去抽取标签描述中有意义的信息,从而得到标签描述的表示td
(1-3)考虑到标签名字和描述对于最终标签表示的贡献程度可能不一致,所以采用高速网络(Highway network)学习门控向量Gn和Gd,去分别过滤标签名字和描述的信息得到标签的表示t,计算公式如下:
Gn=σ(Wntn+bn)
Gd=σ(Wdtn+bd)
t=Gn*tn+Gd*td
其中Wn,Wd,bn,bd是需要学习的参数,σ是激活函数sigmoid,以及*表示的是元素级别的对应相乘。
所述步骤(2),如图2所示,标签信息传播,具体步骤包括:
(2-1)每个子标签有lf个父标签(包含自环),为了刻画子标签t和父标签tf之间的关联,采用了元素级别的操作去挖掘两者之间的相对信息,公式如下:
Figure BDA0003035935390000091
其中,[:;:]表示的是拼接操作,以及-和*分别表示元素级别的减法和乘法。此外,l-1表示是第l-1次传播,多次的传播可以使得子标签间接的得到祖辈标签的信息。
(2-2)得到父标签和子标签之间的交互信息
Figure BDA0003035935390000092
后,采用多维的注意力机制去细粒度的捕捉两者之间的关联,并将父标签的信息传递给子标签,进一步强化子标签的语义信息,公式如下:
Figure BDA0003035935390000093
Figure BDA0003035935390000094
其中,Wl-1,bl-1是需要学习的参数,σ是激活函数sigmoid,以及tl是第l-1次信息传播后的标签表示。
(2-3)标签之间的图结构是由用户创建的,所以为了避免被里面的噪音过度干扰,short-cut机制被应用在这里得到最终的标签表示t′=t+tL,L是最终的传播次数。通过此步骤标签的信息进一步丰富,尤其是不包含训练数据的不可见标签。
所述步骤(3)中,如图2中的多层上下文信息编码,具体步骤包括:
(3-1)首先得到待标记的文本的特征表示Eq,之后采用m个不同尺度的卷积神经网络来抽取不同层次的文本表示,公式如下:
Figure BDA0003035935390000101
其中,θj表示卷积操作,gj是对应的可学习的卷积参数,
Figure BDA0003035935390000102
表示第j个卷积操作得到的文本表示,以及j∈{1,...,m}。
(3-2)在得到不同层次的文本表示后,我们将其进行融合得到更全面的文本表示
Figure BDA0003035935390000103
公式如下:
Figure BDA0003035935390000104
其中,Wc,bc是需要学习的参数,以及σ是激活函数ReLU。
(3-3)紧接着位置编码信息被加入到文本的表示中,从而建模时序关系。同时为了避免原始文本表示的信息缺失,short-cut机制被应用在这里融合之前和现在的文本表示从而得到最终的待标记文本特征。
所述步骤(4)中,具体步骤包括:
(4-1)从上面的步骤中,得到了待标记文本的表示和标签的表示,之后使用注意力机制对文本中与标签相关的信息进行抽取,得到相关的文本表示q。
(4-2)为了捕捉文本和标签之间的交互信息qinter,增加模型到不可见标签的泛化能力,采用了元素级别的计算,公式如下:
qinter=[q;t′;(q-t′);(q*t′)]
(4-3)之后,一个多层感知机被应用在交互信息上,来预测文本和标签之间的相关程度s,公式如下:
hq=σ(Wqtqinter+bqt)
s=Wqhq+bq
其中Wqt,Wq,bqt,bq是需要学习的参数,σ是激活函数ReLU。
当然,上述步骤均为软模块执行。
也提出一种基于信息传播和多层上下文信息建模的标签排序系统,包括:
标签信息融合模块,被配置为使用标签信息融合机制对标签名字信息和标签描述信息进行融合,初步得到标签的信息表示;
标签信息传播模块,被配置为构建父标签和子标签之间的交互信息,将父标签的信息传递给子节点,进一步强化标签的语义信息;
多层上下文信息编码模块,被配置为采用多层上下文信息方法抽取待标记文本的表示,并对多个层次的文本表示进行融合,以及添加位置编码信息;
交预测模块,被配置为抽取标签相关的待标记文本表示,并使用多层感知机预测文本-标签之间的相关度,按照相关度对标签进行排序。
在其他产品实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法中的步骤。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于信息传播和多层上下文信息建模的标签排序方法,其特征是:包括以下步骤:
使用标签信息融合机制对标签名字信息和标签描述信息进行融合,初步得到标签的信息表示;
构建父标签和子标签之间的交互信息,将父标签的信息传递给子节点,进一步强化标签的语义信息;
采用多层上下文信息方法抽取待标记文本的表示,并对多个层次的文本表示进行融合,以及添加位置编码信息;
抽取标签相关的待标记文本表示,并使用多层感知机预测文本-标签之间的相关度,按照相关度对标签进行排序。
2.如权利要求1所述的一种基于信息传播和多层上下文信息建模的标签排序方法,其特征是:使用标签信息融合机制对标签名字信息和标签描述信息进行融合的具体过程包括:
提取标签名字的特征En,以及标签描述的特征Ed
采用平均池化操作得到标签名字的信息表示tn,以标签名字为主,使用注意力机制去抽取标签描述中有意义的信息,得到标签描述的表示td
利用高速网络学习门控向量Gn和Gd,分别过滤标签名字和描述的信息得到标签的表示t。
3.如权利要求1所述的一种基于信息传播和多层上下文信息建模的标签排序方法,其特征是:构建父标签和子标签之间的交互信息的具体过程包括:每个子标签有lf个父标签,采用元素级别的操作去挖掘子标签t和父标签tf之间的相对信息,
Figure FDA0003795520210000021
其中,[:;:]表示的是拼接操作,以及-和*分别表示元素级别的减法和乘法,l-1表示是第l-1次传播,多次的传播使得子标签间接的得到祖辈标签的信息;
Figure FDA0003795520210000022
为父标签和子标签之间的交互信息。
4.如权利要求1所述的一种基于信息传播和多层上下文信息建模的标签排序方法,其特征是:将父标签的信息传递给子节点的具体过程包括:采用多维的注意力机制去细粒度的捕捉两者之间的关联,并将父标签的信息传递给子标签,进一步强化子标签的语义信息,并利用short-cut机制去除标签之间图结构的噪音,得到最终的标签表示t′=t+tL,L是最终的传播次数。
5.如权利要求1所述的一种基于信息传播和多层上下文信息建模的标签排序方法,其特征是:采用多层上下文信息方法抽取待标记文本的表示的具体过程包括:
计算待标记的文本的特征表示,采用多个不同尺度的卷积神经网络来抽取不同层次的文本表示,特征表示
Figure FDA0003795520210000023
其中,θj表示卷积操作,gj是对应的可学习的卷积参数,
Figure FDA0003795520210000024
表示第j个卷积操作得到的文本表示,以及j∈{1,...,m}。
6.如权利要求1所述的一种基于信息传播和多层上下文信息建模的标签排序方法,其特征是:对多个层次的文本表示进行融合,以及添加位置编码信息的具体过程包括:
将不同层次的文本表示进行融合得到更全面的文本表示
Figure FDA0003795520210000031
Figure FDA0003795520210000032
其中,Wc,bc是需要学习的参数,以及σ是激活函数ReLU;在融合之前和文本表示中均使用short-cut机制,从而得到最终的待标记文本特征。
7.如权利要求1所述的一种基于信息传播和多层上下文信息建模的标签排序方法,其特征是:用多层感知机预测文本-标签之间的相关度的具体过程包括:
根据标记文本的表示和标签的表示,使用注意力机制对文本中与标签相关的信息进行抽取,得到相关的文本表示q;
增加模型到不可见标签的泛化能力,采用元素级别的计算,以捕捉文本和标签之间的交互信息qinter
qinter=[q;t′;(q-t′);(q*t′)]
利用多层感知机在交互信息上,以预测文本和标签之间的相关程度s,s=Wqhq+bq,hq=σ(Wqtqinter+bqt),其中,wqt,Wq,bqt,bq是需要学习的参数,σ是激活函数ReLU;t′为最终的标签表示。
8.一种基于信息传播和多层上下文信息建模的标签排序系统,其特征是:包括:
标签信息融合模块,被配置为使用标签信息融合机制对标签名字信息和标签描述信息进行融合,初步得到标签的信息表示;
标签信息传播模块,被配置为构建父标签和子标签之间的交互信息,将父标签的信息传递给子节点,进一步强化标签的语义信息;
多层上下文信息编码模块,被配置为采用多层上下文信息方法抽取待标记文本的表示,并对多个层次的文本表示进行融合,以及添加位置编码信息;
交预测模块,被配置为抽取标签相关的待标记文本表示,并使用多层感知机预测文本-标签之间的相关度,按照相关度对标签进行排序。
9.一种电子设备,其特征是:包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7中任一项所述的方法中的步骤。
10.一种计算机可读存储介质,其特征是:用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7中任一项所述的方法中的步骤。
CN202110443619.XA 2021-04-23 2021-04-23 一种基于信息传播和多层上下文信息建模的标签排序方法 Active CN113158051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110443619.XA CN113158051B (zh) 2021-04-23 2021-04-23 一种基于信息传播和多层上下文信息建模的标签排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110443619.XA CN113158051B (zh) 2021-04-23 2021-04-23 一种基于信息传播和多层上下文信息建模的标签排序方法

Publications (2)

Publication Number Publication Date
CN113158051A CN113158051A (zh) 2021-07-23
CN113158051B true CN113158051B (zh) 2022-11-18

Family

ID=76870019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110443619.XA Active CN113158051B (zh) 2021-04-23 2021-04-23 一种基于信息传播和多层上下文信息建模的标签排序方法

Country Status (1)

Country Link
CN (1) CN113158051B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115221301B (zh) * 2022-07-19 2024-01-23 重庆理工大学 联合多任务学习的对话情感分类和对话行为识别方法
CN116561764A (zh) * 2023-05-11 2023-08-08 上海麓霏信息技术服务有限公司 计算机信息数据交互处理系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108153754A (zh) * 2016-12-02 2018-06-12 中国移动通信有限公司研究院 一种数据处理方法及其装置
CN112380863A (zh) * 2020-10-29 2021-02-19 国网天津市电力公司 一种基于多头自注意力机制的序列标注方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10176253B2 (en) * 2015-01-28 2019-01-08 International Business Machines Corporation Fusion of cluster labeling algorithms by analyzing sub-clusters
CN108460415B (zh) * 2018-02-28 2021-06-15 国信优易数据股份有限公司 一种语种识别方法
CN109492101B (zh) * 2018-11-01 2020-11-17 山东大学 基于标签信息与文本特征的文本分类方法、系统及介质
CN110309360B (zh) * 2019-06-13 2021-09-28 山东大学 短视频标签标注方法及系统
US20210056417A1 (en) * 2019-08-22 2021-02-25 Google Llc Active learning via a sample consistency assessment
CN110580292B (zh) * 2019-08-28 2023-11-03 腾讯科技(深圳)有限公司 一种文本标签生成方法、装置和计算机可读存储介质
CN112528136A (zh) * 2020-11-30 2021-03-19 腾讯科技(深圳)有限公司 一种观点标签的生成方法、装置、电子设备和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108153754A (zh) * 2016-12-02 2018-06-12 中国移动通信有限公司研究院 一种数据处理方法及其装置
CN112380863A (zh) * 2020-10-29 2021-02-19 国网天津市电力公司 一种基于多头自注意力机制的序列标注方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于图学习的社会网络图像标签排序算法;王婧;《计算机工程与设计》;20200216;第41卷(第2期);全文 *

Also Published As

Publication number Publication date
CN113158051A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN108573411B (zh) 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法
CN103443786B (zh) 识别网络浏览器中的并行布局的独立任务的机器学习方法
CN111985245A (zh) 基于注意力循环门控图卷积网络的关系提取方法及系统
CN113641820B (zh) 基于图卷积神经网络的视角级文本情感分类方法及系统
CN111737476A (zh) 文本处理方法、装置、计算机可读存储介质及电子设备
CN113627447B (zh) 标签识别方法、装置、计算机设备、存储介质及程序产品
CN111324696B (zh) 实体抽取方法、实体抽取模型的训练方法、装置及设备
CN113158051B (zh) 一种基于信息传播和多层上下文信息建模的标签排序方法
CN116601626A (zh) 个人知识图谱构建方法、装置及相关设备
CN116245097A (zh) 训练实体识别模型的方法、实体识别方法及对应装置
CN114511038A (zh) 虚假新闻检测方法、装置、电子设备及可读存储介质
CN115438169A (zh) 一种文本与视频的互检方法、装置、设备及存储介质
CN115455171A (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
CN114329051A (zh) 数据信息识别方法、装置、设备、存储介质及程序产品
CN113704420A (zh) 文本中的角色识别方法、装置、电子设备及存储介质
CN116523041A (zh) 装备领域知识图谱构建方法、检索方法、系统及电子设备
CN116386895A (zh) 基于异构图神经网络的流行病舆情实体识别方法与装置
Abebe et al. Overview of event-based collective knowledge management in multimedia digital ecosystems
CN115470232A (zh) 模型训练和数据查询方法、装置、电子设备和存储介质
CN115168609A (zh) 一种文本匹配方法、装置、计算机设备和存储介质
CN110852066A (zh) 一种基于对抗训练机制的多语言实体关系抽取方法及系统
CN114297408A (zh) 一种基于级联二进制标注框架的关系三元组抽取方法
CN115129885A (zh) 实体链指方法、装置、设备及存储介质
CN116468030A (zh) 一种基于多任务神经网络的端到端方面级情感分析方法
CN116756676A (zh) 一种摘要生成方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant