CN111666406B - 基于自注意力的单词和标签联合的短文本分类预测方法 - Google Patents

基于自注意力的单词和标签联合的短文本分类预测方法 Download PDF

Info

Publication number
CN111666406B
CN111666406B CN202010286184.8A CN202010286184A CN111666406B CN 111666406 B CN111666406 B CN 111666406B CN 202010286184 A CN202010286184 A CN 202010286184A CN 111666406 B CN111666406 B CN 111666406B
Authority
CN
China
Prior art keywords
label
text
short text
vector
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010286184.8A
Other languages
English (en)
Other versions
CN111666406A (zh
Inventor
王嫄
周宇博
徐涛
刘玉桥
赵婷婷
梁琨
杨巨成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University of Science and Technology
Original Assignee
Tianjin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University of Science and Technology filed Critical Tianjin University of Science and Technology
Priority to CN202010286184.8A priority Critical patent/CN111666406B/zh
Publication of CN111666406A publication Critical patent/CN111666406A/zh
Application granted granted Critical
Publication of CN111666406B publication Critical patent/CN111666406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明涉及一种基于自注意力的单词和标签联合的短文本分类预测方法,其技术特点是:构造短文本序列的向量表示的矩阵,得出经由文本自注意力转换后的文本表示矩阵;构造标签序列的向量表示矩阵,得出短文本与标签交互注意力转换后的交互文本表示矩阵;得到文本语义表示向量z;最后z经过全连接层预测分类结果与短文本实际标签y进行比较计算出预测误差,通过不断迭代得到最优参数。本发明考虑单词和标签之间的相互影响,引入自注意力机制,利用数据集本身的类别标签信息,将标签和短文本的单词向量映射到同一空间,从而实现更好的交互功能,其充分提取到上下文信息,增加可解释性,提高了分类结果的准确度及分类任务的泛化能力。

Description

基于自注意力的单词和标签联合的短文本分类预测方法
技术领域
本发明属于自然语言处理技术领域,尤其是一种基于自注意力的单词和标签联合的短文本分类预测方法。
背景技术
当前,作为互联网上一种流行的社交通讯方式,每天都会产生大量的文本,例如推文、搜索查询、问题、图像标签、广告关键字及标题等。需要考虑到挖掘短文本本身信息又具有一定的挑战性,与段落和文档不同,比如短文本并不总遵循自然语言的语法、短文本缺少一定的上下文语境并且短文本本身是十分模糊的存在多义词和拼写错误,如何对这些大量的模糊短文本进行有效的分类已经引起业界和学术界内的极大兴趣。
为了解决短文本本身信息量不足的问题,一些流行的方法是通过从外部知识库、词性标注以及依赖分析等多个方面来进行创造有效的特征,这种方法容易理解,但是通过机器难以收集有用的的特征来消除歧义,其次还存在数据稀疏的问题,因此,该方法泛化性比较差。近些年词向量技术在当今自然语言处理应用比较成熟,能够很好地捕捉到文本序列的语义关系,随着深度学习的盛行,许多研究者将深度学习应用于文本分类,其中深度学习在文本分类上的成功就很大程度上取决于词向量的有效性,很多研究都是对词向量序列进行简单的平均加权或者进行池化聚合,有着参数少训练快的特性,在很多文本分类任务上也取得了不错的效果。但是这种方法不会明确考虑文本序列内的空间信息及单词的顺序信息,对一些具体任务的比如情绪识别等这些需要考虑到一定的顺序信息的分类任务的泛化效果不佳。
发明内容
本发明的目的在于克服现有技术的不足,提出一种设计合理、能够有效提高提高分类结果的准确度及分类任务泛化能力的基于自注意力的单词和标签联合的短文本分类预测方法。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于自注意力的单词和标签联合的短文本分类预测方法,包括以下步骤:
步骤1:构造单词到向量的映射表ED
步骤2:基于映射表ED,将单条短文本V和所有的标签D分别映射为短文本向量表示矩阵X和标签向量表示矩阵Y;
步骤3:基于短文本向量表示矩阵X,通过自注意力机制,得到经由文本自注意力转换后的文本表示矩阵XA
步骤4:基于短文本向量表示矩阵X和标签向量表示矩阵Y,通过交互注意力机制,得到经由短文本与标签交互注意力转换后的交互文本表示矩阵XB
步骤5:融合加权步骤3和步骤4中的文本表示矩阵XA和交互文本表示矩阵XB,得到文本语义表示向量z;
步骤6:根据文本语义表示向量z,经过全连接层预测分类结果与短文本实际标签y进行比较计算出预测误差,并通过不断迭代得到最优参数;
步骤7:对于新的短文本V′,顺序执行步骤2至步骤6得到计算分类结果,此时预测出来的结果即为最终的结果。
进一步,所述步骤1的具体实现方法为:采用预先训练好的glove词向量,通过预训练的词向量将每个单词映射为对应的向量表示,得到单词到向量的映射表ED,D代表的是向量维度大小。
进一步,所述步骤2的具体实现方法为:根据映射表ED,将单条短文本V={v1,v2...vI}映射为向量表示矩阵X∈RIxD,其中,v1...vI代表单词序列,I代表短文本单词数目,将所有类别的标签D={d1,d2...dC}分别映射为向量表示矩矩阵Y∈RCxD,其中,d1...dC代表标签序列,C代表标签类别的数目,这里的第i个标签di取自数据集中用于描述第i个标签类别的词组,其中,i=1,2..C。
进一步,所述标签di由1-2个单词构成。
进一步,所述步骤3的具体实现方法为:短文本向量表示矩阵X通过自注意力机制分别产生相应的查询Q1、键K1和值V1,所述查询Q1、键K1和值V1与短文本向量表示矩阵X一样,根据查询Q1、键K1之间的匹配程度计算得到的权重系数,再通过权重系数对值V1相乘并进行加权求和得到文本表示矩阵XA∈RIxD
进一步,所述步骤4的具体实现方法为:标签向量表示矩阵Y产生相应的键K2和值V2,所述键K2和值V2与标签向量表示矩阵Y一样,根据查询Q1、键K2之间的匹配程度计算得到的权重系数,再通过权重系数对值V2相乘并进行加权求和得到经由短文本与标签交互注意力转换后的交互文本表示矩阵XB∈RIxD
进一步,所述步骤5的具体实现方法为:融合加权步骤3和步骤4中的文本表示矩阵XA和交互文本表示矩阵XB后,再通过平均池化操作直接得到文本语义表示向量z,向量z和输入向量维度保持一致。
进一步,所述步骤6的具体实现方法为:通过文本语义表示向量z,经过全连接层预测分类结果与短文本实际标签y进行比较计算出预测误差,通过最小化交叉熵损失函数,不断迭代得到最优参数。
进一步,所述短文本实际标签y是数据集中用来进行测试的标签类别,具体任务分为单标签任务和多标签任务。
本发明的优点和积极效果是:
1、本发明利用数据集本身的类别标签信息,将标签和短文本的单词向量映射到同一空间,从而实现更好的交互功能,并且,为了避免只考虑词向量的简单加权聚合不能很好捕捉全局上下文信息的情况,利用自注意力机制分配给不同单词不同的权重系数,从一定程度上筛选出对分类结果有贡献的信息筛除对分类结果无效的信息,考虑到了文本序列的全局性并从一定程度上达到消除噪音的效果,提高了分类结果的准确度及分类任务的泛化能力。
2、本发明在利用自注意力机制的基础上分为2条路线,第一条路线是单独短文本序列通过自注意力机制加权得出,第二条路线是将文本和标签通过自注意力机制形成联合加权表示,然后将2条路线进行融合得到文本表示向量,这里的文本表示向量既在一定程度上利用到了标签信息加强了本身短文本的信息表示又充分考虑到全局上下文的特征和单词的顺序信息,增加可解释性,对分类结果的提升有着很大的影响。
附图说明
图1是本发明的整体处理流程图;
图2是本发明多模型融合策略图。
具体实施方式
以下结合附图对本发明做进一步详述。
本发明的设计思想是:首先利用预训练词向量技术将短文本序列和标签序列映射到低维向量空间,这样单词之前能够产生一定的交互性并且拥有一定的语义信息;随后通过自注意力机制再对每个位置的信息进行不同的权重组合,使得能够筛选出对分类结果有贡献的内容,筛除了没有贡献的内容信息,一定程度上排除了噪声点;再利用深度学习流行的池化聚合技术合成一个向量,向量经过全连接层预测分类结果与短文本实际标签进行比较计算误差,迭代更新参数直至收敛,固定参数;最后对给定新短文本测试序列进行预测。
基于上述设计思想,本发明提出的基于自注意力的单词和标签联合的短文本分类预测方法,如图1所示,包括以下步骤:
步骤1、构造单词到向量的映射表ED
在本步骤中,本发明采用预先训练好的glove词向量,通过预训练的词向量将每个单词映射为对应的向量表示,其中D代表的是向量维度大小,本发明D取300。
步骤2、根据基于步骤1得到的映射表ED,将单条短文本V和所有的标签D分别映射为短文本向量表示矩阵X和标签向量表示矩阵Y。
在本步骤中,使用映射表ED,将单条短文本V={v1,v2...vI}映射为向量表示矩阵X∈RIxD,其中v1...vI代表单词序列,I代表单词数目,将所有类别的标签D={d1,d2...dC}分别映射为向量表示矩矩阵Y∈RCxD。其中d1...dC代表标签序列,C代表标签类别的数目,这里的第i个标签di取自数据集中用于描述第i个标签类别的词组,一般由1-2个单词构成,i=1,2..C。如果是一个单词直接取该单词的向量,如果是2个单词进行相加求平均得到标签对应的向量。
步骤3、基于步骤2中的短文本向量表示矩阵X,通过所设计的自注意力机制,得到经由文本自注意力转换后的文本表示矩阵XA
本步骤的具体实现方法为:短文本向量表示矩阵X通过自注意力机制分别产生相应的查询Q1、键K1和值V1。Q1、K1、V1维度和X一样。根据查询Q1、键K1之间的匹配程度计算得到的权重系数,再通过权重系数对值V1相乘并机型加权求和得到文本表示矩阵XA∈RIxD
本步骤的具体实现公式如下所示:
Figure BDA0002448601960000041
在原来求权重基础上除以/>
Figure BDA0002448601960000042
进行缩放,对权重系数分布做了一定的优化。
这里引入多头机制,从不同的方面提取特征:
XA=Concat(head1,...,headh)Wo,其中h表示所使用的的头数,本发明中h=6,Wo表示参数矩阵为了使得拼接后的结果和输入自注意力机制之前的结果保持一致。head可以表示为headi=Attention(Q1Wi Q1,K1Wi K1,V1Wi V1),其中
Figure BDA0002448601960000043
Wi o∈RmxD都是模型的参数矩阵,dk=dv=D/h=50,m=hdv=300。
步骤4、基于步骤2中的短文本向量表示矩阵X和标签向量表示矩阵Y,通过交互注意力机制,得到经由短文本与标签交互注意力转换后的交互文本表示矩阵XB
本步骤的具体实现方法为:与前述方法相同,Y产生相应的键K2和值V2,K2、V2维度和Y一样,通过所设计的交互注意力机制,此处根据查询Q1、键K2之间的匹配程度计算得到的权重系数,再通过权重系数对值V2相乘并加权求和得到经由文本与标签交互注意力转换后的交互文本表示矩阵XB∈RIxD
本步骤的实现公式如下所示:
Figure BDA0002448601960000044
这里引入多头机制,从不同的方面提取特征:
XB=Concat(head1′,...,headh′)W′o,其中h表示所使用的的头数,本发明中h=6,Wo表示参数矩阵为了使得拼接后的结果和输入自注意力机制之前的结果保持一致。head可以表示为headi′=Attention(Q1WiQ1,K2Wi K2,V2Wi V2),其中
Figure BDA0002448601960000051
Wio∈Rm′xD都是模型的参数矩阵,其中dk′=dv′=D/h=50,m′=hdv′=300。
步骤5、融合加权步骤3和步骤4中的文本表示矩阵XA和XB,得到文本语义表示向量z。
本步骤的具体实现方法为:融合加权步骤3和步骤4中的文本表示矩阵XA和XB后,再通过平均池化操作直接得到文本语义表示向量z。其中,z也是一个D维的向量和输入向量维度保持一致,其计算公式为:
Figure BDA0002448601960000052
这里采用的是将矩阵XA和XB平均加权后进行平均池化操作。
步骤6、通过文本语义表示向量z经过全连接层预测分类结果与短文本实际标签y进行比较计算出预测误差,通过不断迭代得到最优参数。
本步骤的具体实现方法为:通过z经过全链接层预测分类结果与短文本实际标签y进行比较计算出预测误差,这里的y是数据集中用来进行测试的标签类别,具体任务时候分为单标签任务和多标签任务,通过最小化交叉熵损失函数,不断迭代得到最优参数。单标签问题是每个短文本只能属于特定的某一个标签,多标签问题是每个问题可以同时属于多个标签类别不做限制。具体分析如下:
单标签预测:最小化交叉熵损失函数表示为:
Figure BDA0002448601960000053
这里N代表短文本总数,最终交叉熵损失函数取N个文本交叉熵损失函数的平均值,其中yn表示用于预测第n个文本的标签,一共有C种类别,zn表示第n个文本的语义表示向量,假设z′n=W2zn+b2,其中W2∈RCxD,b2∈RC,/>
则f2(zn)=SoftMax(z′n),其中损失函数表达式中CE(.,.)表示两个概率向量之间的交叉损失。
多标签预测的最小化交叉损失熵函数表示为,
Figure BDA0002448601960000054
这里交叉熵损失函数表现为对N个文本,C个类中对每个文本的每个类的损失函数求均值,其中
Figure BDA0002448601960000061
此处的z′nc可以表示为单标签中z′n的第c行的元素。通过不断迭代,调出最优参数。
步骤7、对于新的短文本V′,不再更新模型中的全部参数,顺序执行步骤2至步骤6得到计算分类结果。
本步骤的具体实现方法为:在以上包括自注意力以及最小化交叉熵损失函数的参数完全固定之后,对于新的短文本V′,不再更新模型中所有的参数,将新的短文本V′顺序执行步骤2至步骤6,此时预测出来的结果即为最终的结果。
本发明的上述方法可以通过图2所示的算法流程在计算机上实现。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (9)

1.一种基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于包括以下步骤:
步骤1:构造单词到向量的映射表ED
步骤2:基于映射表ED,将单条短文本V和所有的标签D分别映射为短文本向量表示矩阵X和标签向量表示矩阵Y;
步骤3:基于短文本向量表示矩阵X,通过自注意力机制,得到经由文本自注意力转换后的文本表示矩阵XA
步骤4:基于短文本向量表示矩阵X和标签向量表示矩阵Y,通过交互注意力机制,得到经由短文本与标签交互注意力转换后的交互文本表示矩阵XB
步骤5:融合加权步骤3和步骤4中的文本表示矩阵XA和交互文本表示矩阵XB,得到文本语义表示向量z;
步骤6:根据文本语义表示向量z,经过全连接层预测分类结果与短文本实际标签y进行比较计算出预测误差,并通过不断迭代得到最优参数;
步骤7:对于新的短文本V′,顺序执行步骤2至步骤6得到计算分类结果,此时预测出来的结果即为最终的结果。
2.根据权利要求1所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述步骤1的具体实现方法为:采用预先训练好的glove词向量,通过预训练的词向量将每个单词映射为对应的向量表示,得到单词到向量的映射表ED,D代表的是向量维度大小。
3.根据权利要求1所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述步骤2的具体实现方法为:根据映射表ED,将单条短文本V={v1,v2...vI}映射为向量表示矩阵X∈RIxD,其中,v1...vI代表单词序列,I代表短文本单词数目,将所有类别的标签D={d1,d2...dC}分别映射为向量表示矩矩阵Y∈RCxD,其中,d1...dC代表标签序列,C代表标签类别的数目,这里的第i个标签di取自数据集中用于描述第i个标签类别的词组,其中,i=1,2..C。
4.根据权利要求3所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述标签di由1-2个单词构成。
5.根据权利要求1所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述步骤3的具体实现方法为:短文本向量表示矩阵X通过自注意力机制分别产生相应的查询Q1、键K1和值V1,所述查询Q1、键K1和值V1与短文本向量表示矩阵X一样,根据查询Q1、键K1之间的匹配程度计算得到的权重系数,再通过权重系数对值V1相乘并进行加权求和得到文本表示矩阵XA∈RIxD
6.根据权利要求1所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述步骤4的具体实现方法为:标签向量表示矩阵Y产生相应的键K2和值V2,所述键K2和值V2与标签向量表示矩阵Y一样,根据查询Q1、键K2之间的匹配程度计算得到的权重系数,再通过权重系数对值V2相乘并进行加权求和得到经由短文本与标签交互注意力转换后的交互文本表示矩阵XB∈RIxD
7.根据权利要求1所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述步骤5的具体实现方法为:融合加权步骤3和步骤4中的文本表示矩阵XA和交互文本表示矩阵XB后,再通过平均池化操作直接得到文本语义表示向量z,向量z和输入向量维度保持一致。
8.根据权利要求1所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述步骤6的具体实现方法为:通过文本语义表示向量z,经过全连接层预测分类结果与短文本实际标签y进行比较计算出预测误差,通过最小化交叉熵损失函数,不断迭代得到最优参数。
9.根据权利要求8所述基于自注意力的单词和标签联合的短文本分类预测方法,其特征在于:所述短文本实际标签y是数据集中用来进行测试的标签类别,具体任务分为单标签任务和多标签任务。
CN202010286184.8A 2020-04-13 2020-04-13 基于自注意力的单词和标签联合的短文本分类预测方法 Active CN111666406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010286184.8A CN111666406B (zh) 2020-04-13 2020-04-13 基于自注意力的单词和标签联合的短文本分类预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010286184.8A CN111666406B (zh) 2020-04-13 2020-04-13 基于自注意力的单词和标签联合的短文本分类预测方法

Publications (2)

Publication Number Publication Date
CN111666406A CN111666406A (zh) 2020-09-15
CN111666406B true CN111666406B (zh) 2023-03-31

Family

ID=72382671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010286184.8A Active CN111666406B (zh) 2020-04-13 2020-04-13 基于自注意力的单词和标签联合的短文本分类预测方法

Country Status (1)

Country Link
CN (1) CN111666406B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232746B (zh) * 2020-11-03 2023-08-22 金陵科技学院 基于注意力加权的冷链物流需求估计方法
CN112949415B (zh) * 2021-02-04 2023-03-24 北京百度网讯科技有限公司 图像处理方法、装置、设备和介质
CN113127769B (zh) * 2021-04-07 2022-07-29 华东师范大学 基于标签树和人工智能的习题标签预测系统
CN113268592B (zh) * 2021-05-06 2022-08-05 天津科技大学 基于多层次交互注意力机制的短文本对象情感分类方法
CN113486175B (zh) * 2021-07-08 2024-03-15 平安国际智慧城市科技股份有限公司 文本分类方法、文本分类装置、计算机设备及存储介质
CN113656581B (zh) * 2021-08-17 2023-09-22 北京百度网讯科技有限公司 文本分类及模型训练的方法、装置、设备以及存储介质
CN115169530B (zh) * 2022-06-29 2023-09-26 北京百度网讯科技有限公司 数据处理方法、装置、电子设备和可读存储介质
CN115905533B (zh) * 2022-11-24 2023-09-19 湖南光线空间信息科技有限公司 一种多标签文本智能分类方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451187A (zh) * 2017-06-23 2017-12-08 天津科技大学 基于互约束主题模型的半结构短文本集中子话题发现方法
CN109902293A (zh) * 2019-01-30 2019-06-18 华南理工大学 一种基于局部与全局互注意力机制的文本分类方法
CN110059185A (zh) * 2019-04-03 2019-07-26 天津科技大学 一种医学文档专业词汇自动化标注方法
CN110134786A (zh) * 2019-05-14 2019-08-16 南京大学 一种基于主题词向量与卷积神经网络的短文本分类方法
CN110209823A (zh) * 2019-06-12 2019-09-06 齐鲁工业大学 一种多标签文本分类方法及系统
CN110442723A (zh) * 2019-08-14 2019-11-12 山东大学 一种基于多步判别的Co-Attention模型用于多标签文本分类的方法
CN110826315A (zh) * 2019-11-01 2020-02-21 智者四海(北京)技术有限公司 使用神经网络系统识别短文本时效性的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10733380B2 (en) * 2017-05-15 2020-08-04 Thomson Reuters Enterprise Center Gmbh Neural paraphrase generator

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451187A (zh) * 2017-06-23 2017-12-08 天津科技大学 基于互约束主题模型的半结构短文本集中子话题发现方法
CN109902293A (zh) * 2019-01-30 2019-06-18 华南理工大学 一种基于局部与全局互注意力机制的文本分类方法
CN110059185A (zh) * 2019-04-03 2019-07-26 天津科技大学 一种医学文档专业词汇自动化标注方法
CN110134786A (zh) * 2019-05-14 2019-08-16 南京大学 一种基于主题词向量与卷积神经网络的短文本分类方法
CN110209823A (zh) * 2019-06-12 2019-09-06 齐鲁工业大学 一种多标签文本分类方法及系统
CN110442723A (zh) * 2019-08-14 2019-11-12 山东大学 一种基于多步判别的Co-Attention模型用于多标签文本分类的方法
CN110826315A (zh) * 2019-11-01 2020-02-21 智者四海(北京)技术有限公司 使用神经网络系统识别短文本时效性的方法

Also Published As

Publication number Publication date
CN111666406A (zh) 2020-09-15

Similar Documents

Publication Publication Date Title
CN111666406B (zh) 基于自注意力的单词和标签联合的短文本分类预测方法
CN109902145B (zh) 一种基于注意力机制的实体关系联合抽取方法和系统
Ahmed et al. Deep learning modelling techniques: current progress, applications, advantages, and challenges
CN110046671A (zh) 一种基于胶囊网络的文本分类方法
CN112115238A (zh) 一种基于bert和知识库的问答方法和系统
CN113705218B (zh) 基于字符嵌入的事件元素网格化抽取方法、存储介质及电子装置
CN112015868A (zh) 基于知识图谱补全的问答方法
CN113688878B (zh) 一种基于记忆力机制和图神经网络的小样本图像分类方法
CN113051914A (zh) 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
Wang et al. Semi-supervised learning combining transductive support vector machine with active learning
CN114461836A (zh) 一种用于图像-文本的跨模态检索方法
CN111582506A (zh) 基于全局和局部标记关系的偏多标记学习方法
CN113515632A (zh) 基于图路径知识萃取的文本分类方法
Su et al. Semi-supervised knowledge distillation for cross-modal hashing
CN116976505A (zh) 基于信息共享的解耦注意网络的点击率预测方法
CN114048314A (zh) 一种自然语言隐写分析方法
CN110222737A (zh) 一种基于长短时记忆网络的搜索引擎用户满意度评估方法
CN112905750A (zh) 一种优化模型的生成方法和设备
Cong et al. Gradient-Semantic Compensation for Incremental Semantic Segmentation
CN113516118B (zh) 一种图像与文本联合嵌入的多模态文化资源加工方法
CN116189047A (zh) 一种基于多模态信息聚合的短视频分类方法
CN116403608A (zh) 基于多标签纠正和时空协同融合的语音情感识别方法
CN113435190B (zh) 一种融合多层次信息抽取和降噪的篇章关系抽取方法
CN115169429A (zh) 一种轻量化方面级文本情感分析方法
Awal et al. A hybrid classifier for handwritten mathematical expression recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant