CN109492099A - 一种基于领域对抗自适应的跨领域文本情感分类方法 - Google Patents

一种基于领域对抗自适应的跨领域文本情感分类方法 Download PDF

Info

Publication number
CN109492099A
CN109492099A CN201811263266.XA CN201811263266A CN109492099A CN 109492099 A CN109492099 A CN 109492099A CN 201811263266 A CN201811263266 A CN 201811263266A CN 109492099 A CN109492099 A CN 109492099A
Authority
CN
China
Prior art keywords
sample
domain
field
target domain
source domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811263266.XA
Other languages
English (en)
Other versions
CN109492099B (zh
Inventor
贾熹滨
曾檬
史佳帅
刘洋
苏醒
郭黎敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wangzhe Glory Information Consulting Co ltd
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201811263266.XA priority Critical patent/CN109492099B/zh
Publication of CN109492099A publication Critical patent/CN109492099A/zh
Application granted granted Critical
Publication of CN109492099B publication Critical patent/CN109492099B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于领域对抗自适应的跨领域文本情感分类方法,该方法包括:输入源领域和目标领域样本的词向量矩阵、类别标签和领域标签;利用基于卷积神经网络的特征提取模块,提取样本的低层特征;在主任务模块构建基于源领域和目标领域分布一致性的约束,将低层样本映射到再生核希尔伯特空间,学习具有可转移性的高层特征;将源领域的高层特征输入类别分类器,在减小领域差异的基础上,保证分类器对样本具备类别判别性;在辅助任务模块构建基于对抗学习的领域不变性约束,将低层特征输入具有对抗性质的领域分类器,令分类器尽可能无法判别样本所属领域,从而提取具有领域不变性的高层特征,有效解决了源领域分类器到目标领域的迁移问题。

Description

一种基于领域对抗自适应的跨领域文本情感分类方法
技术领域
本发明属于文本分析技术领域,具体涉及一种基于领域对抗自适应的跨领域文本情感分类方法。
背景技术
近年来随着人工智能、机器学习技术的蓬勃发展,文本情感分类技术应运而生,该技术可自动地对文本数据的情感趋向分类,有效解决了人工判断费时费力的难题。传统的文本情感分类方法通常利用标定数据,为某个领域单独训练特定的情感分类器以完成情感分类任务。但是随着社交媒体的发展,与日俱增的新语料使得领域范围逐渐扩大,且每个领域的数据量非常庞大,传统的文本情感分类方法需要单独为每一个新增的领域手工标注大量的数据,以完成情感分类器的训练,该人工标注样本过程效率较低。同时随着时间的推移和社会的发展,已知领域的新特征词将逐步增加,因原样本与新样本的特征分布存在一定的差异,该领域原有的情感分类器将无法准确预测新评论数据的情感倾向。
为解决领域间样本存在差异导致情感分类器分类准确率较低的问题,研究者通常采用以下五种迁移学习技术实现源领域分类器到目标领域的迁移,其一是基于加权重采样(Re-weighting)的领域自适应技术,该技术令源领域样本逼近目标领域,使样本分布尽可能相似,从而减小领域间的分布差异。第二种基于特征对齐的领域自适应技术,将源领域和目标领域的样本投影到公共子空间学习公共的特征表示,从而令源领域的经验误差尽可能趋近目标领域的经验误差,实现领域特征分布的一致性,主要方法包括子空间统一(Subspace Unification)、流行对齐(Manifold Alignment)和子空间重建(SubspaceReconstruction)。其三是基于主题的领域自适应,通过提取领域的共有潜在特征以减小领域间样本分布的差异。近年来随着深度学习和生成式对抗学习的发展,基于深度模型和对抗式的迁移学习技术也逐渐应用在跨领域情感分类问题中,而深度模型通常采用微调(Fine-tune)、最大平均差异正则化(MMD-regularized)和领域混淆(Domain Confusion)的方法减小源领域和目标领域的差异,完成领域间特征的对齐。
发明内容
本发明的目的在于提供了一种基于领域对抗自适应的跨领域文本情感分类方法,该方法利用领域自适应和对抗学习的思想,通过构建基于源领域和目标领域分布一致性的约束和基于对抗学习的领域不变性约束,学习具备可转移性、领域不变性和对标签具有判别性的高层特征,从而在源领域和目标领域样本分布差异较大,且目标领域标定样本不足的情况下,获得适用于目标领域的情感分类器。
为实现上述目的,本发明采用以下技术方案:一种基于领域对抗自适应的跨领域文本情感分类方法,首先采用词向量矩阵的方式表示文本数据;其次将矩阵输入基于卷积神经网络(Convolutional Neural Network,CNN)的特征提取模块,获取样本的低层特征;接下来在主任务模块构建基于源领域和目标领域分布一致性的约束,即通过高斯核函数将低层特征映射到再生核希尔伯特空间(Reproducing Kernel Hilbert Space,RKHS),并利用最大平均差异(Maximum Mean Discrepancies,MMD)进行约束,从而在公共的特征映射空间中,保证源领域和目标领域样本特征分布的相似性,以学习具备领域间可转移性的高层特征;然后将高层特征输入类别分类器,在减小领域差异的基础上,保证分类器对样本具备类别判别性;此外引入辅助任务模块,加入梯度反转层,并将低层特征输入具有对抗性质的领域分类器,使分类器无法判别样本所属领域,以构建基于对抗学习的领域不变性约束,从而提取具有领域不变性的特征。
一种基于领域对抗自适应的跨领域文本情感分类方法,该方法包括以下步骤:
步骤1,输入源领域和目标领域样本的词向量矩阵、情感类别标签和领域标签。
步骤2,利用基于CNN的特征提取模块,提取源领域和目标领域样本的低层特征。
步骤3,构建主任务模块,提取具有可转移性、对标签具有判别性的高层特征。
步骤3.1,通过高斯核函数将低层特征映射到RKHS,在该空间中利用MMD度量源领域和目标领域样本的距离。
步骤3.2,将源领域高层特征作为训练数据输入类别分类器。
步骤4,构建辅助任务模块,将低层特征作为训练数据输入具有对抗性质的领域分类器,提取具有领域不变性的高层特征。
步骤5,将目标领域样本输入已训练好的模型,输出文本数据情感类别的结果。
与现有技术相比,本发明具有以下明显优势:
本发明在源领域和目标领域样本分布存在较大差异,且目标领域标定样本不足的情况下,通过在主任务模块构建基于源领域和目标领域分布一致性的约束,在辅助任务模块构建基于对抗学习的领域不变性约束,实现了无监督情感分类任务中源领域情感分类器到目标领域的迁移。
附图说明
图1为本发明的模型结构图;
图2为本发明的方法流程图;
图3为卷积过程示例图;
图4为池化过程示例图。
具体实施方式
以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明方法模型结构如图1所示,所述方法的流程图如图2所示,具体包括以下步骤:
步骤1,输入源领域和目标领域样本的词向量矩阵、情感类别标签和领域标签。
由于计算机无法直接处理文本数据,因此需要将文本输入数据转化成计算机可识别的数据类型。令矩阵的行数n表示段落中总单词数,矩阵的列数k表示词向量的维度,首先将输入文本中每个单词转化成1×k的词向量,其次按照单词在文本中出现的顺序,将词向量拼接成n×k的矩阵。最后根据不同的深度学习框架,转化成对应的存储格式,作为网络的输入。
步骤2,利用基于CNN的特征提取模块,提取样本的低层特征。
将源领域和目标领域的样本输入卷积神经网络,通过该特征提取模块提取样本的低层特征,将样本依次输入卷积层(Convolutional Layer)、池化层(Pooling Layer)和全连接层(Full Connected Layer),实现特征图的提取、特征图的下采样过程以及特征图向下一层的传输,卷积示例如图3所示,池化过程示例如图4所示。其中卷积层的中卷积核的宽度应与词向量维度相同。
步骤3,构建主任务模块,提取具有可转移性、对标签具有判别性的高层特征。
步骤3.1,通过高斯核函数将低层特征映射到RKHS,在该空间中利用MMD度量源领域和目标领域样本的距离。
该方法取最大平均差异(Maximum Mean Discrepancy,MMD)作为检验统计量,度量领域间的分歧,数学表达式如下所示:
是原始空间中连续函数f的集合,s代表源领域,t代表目标领域,xs为源领域的样本,xt为目标领域的样本,p代表源领域样本服从的特征分布,即xs~p,q代表目标领域样本服从的特征分布,即xt~q,Ep为源领域样本分布的期望值,Eq为目标领域样本分布的期望值,ns为源领域样本的数量,nt为目标领域样本的数量,为源领域的第i个样本,为目标领域的第i个样本。当源领域和目标领域的样本分布一致时p=q,期望值相同,此时MMD的值为0,当源领域和目标领域样本分布不一致且函数空间足够大时,MMD的值大于零。当给定两个特征分布p和q时,MMD的结果依赖给定的连续函数集合过大,MMD的值趋近于无穷,不利于衡量样本差异。因此为了准确计算样本的距离,应满足下面两条性质,性质1:当且仅当p和q分布相同时,MMD等于零;并且为保证检验具备连续性,应满足性质2:MMD的经验估计可以随特征分布规模的增大迅速收敛到期望,需具备约束性。经证明当是再生核希尔伯特空间中的单位球时,即||f||H≤1,可满足上述两点性质。
一个完备的内积空间被称为希尔伯特空间(Hilbert Space),在这里将其记为f。若用空间内的点积表示映射f→f(x),即:
则希尔伯特空间被转化为再生核希尔伯特空间(Reproducing Kernel HilbertSpace,RKHS),这里φ表示的映射,即φ为原始空间的样本到希尔伯特空间的映射函数,因为空间中的点积可以表示函数到点的映射关系,因此函数f(x)可拆分为两部分,即f以及自变量x,该操作令f更容易被抽离出来实现最大化。此时引入分布,用E[φ(x)]替代φ(x),这里E[φ(x)]称为核嵌入分布(Kernelembeddingofdistributions),则源领域样本在希尔伯特空间的平均分布Ep[f(xs)]被表示为f与Ep[φ(xs)]的点积形式Ep[<φ(xs),f>H],即采用核函数的方式计算希尔伯特空间中的点积,同理,目标领域样本在希尔伯特空间的平均分布Eq[f(xt)]也可以被表示为f和Eq[φ(xt)]的点积形式Εq[<φ(xt),f>H]。
其中μp=Ep[f(xs)],μq=Eq[f(xt)],由此看出源领域和目标领域的MMD距离用RKHS中两个点的距离表示,因此对上式等号两侧进行平方操作:
其中表示源领域中的第i个样本,表示源领域中的第j个样本,表示目标领域中的第i个样本,表示目标领域中的第j个样本,且i≠j,能够采用核函数计算,是RKHS中的单位球,因此采用高斯核函数或拉普拉斯核函数,若采用无穷维的高斯核函数则实现核嵌入方式表示的样本到再生核希尔伯特空间的映射,并利用高斯核函数计算领域间的MMD距离作为约束值,构建基于源领域和目标领域分布一致性的约束,实现源领域样本到目标领域的可迁移性,则领域对齐层的损失函数可被表示为下式。
代表源领域样本集合,即 代表源领域样本集合,即其中的表达式为:
步骤3.2,将源领域高层特征作为训练数据输入类别分类器。
在样本特征对齐的基础上,将源领域高层特征输入类别分类器,判断样本所属类别,保证分类器的有效性。其数学描述如下,源领域具有ns个独立同分布的标定样本目标领域具有nt个独立同分布的未标定样本 表示源领域样本集,表示目标领域样本集,均属于样本集合X,即 源领域样本的标签标签集合Y={0,1,...,L-1},。源领域样本和目标领域样本服从分布p和q,其中p≠q。通过训练目标领域的样本获得适用于目标领域的类别分类器η:y=η(x),该分类器在目标领域样本集上的损失函数如下式所示,其中Pr(η(xt)≠y)表示输入xt经分类后结果与其对应的标签y不相等的概率。
步骤4,构建辅助任务模块,将低层特征作为训练数据输入具有对抗性质的领域分类器,提取具有领域不变性的高层特征。
接下来将低层特征同时输入辅助任务模块,令具有对抗性质的领域分类器在准确判别样本所属领域的同时,通过梯度反转层引入对抗思想,将领域分类器看作生成式对抗网络中的判别器,在训练类别分类器时,使领域分类器无法判定样本的领域来源,以学习领域不变特征。领域分类器的损失函数如下所示:
其中,ns和nt分别表示源领域和目标领域样本的数量,则ns+nt表示两个领域中样本的总数,ηdomain为领域分类器,φ为映射函数,xi为需要判别的样本,di为样本xi的领域标签,该标签是一个二值变量,因此损失函数采用交叉熵损失函数,展开式如下示,xi通过函数φ被映射到公共特征空间后,由领域分类器ηdomain判别该特征样本所属的领域类别。
步骤5,将目标领域样本输入已训练好的模型,输出文本数据情感类别的结果
在训练过程中,通过优化步骤2和步骤3中三个损失函数,包括最小化类别分类器ηlabel的损失函数,最大化领域分类器ηdomain的损失函数,以及最小化领域对齐层的损失函数可减小源领域和目标领域样本的差异,完成基于无监督领域对抗自适应的跨领域情感分类网络的训练,获得适用于目标领域的情感分类器,整个方法的损失函数如下所示,其中λ1和λ2为超参数,分别决定主任务模块和辅助任务模块占损失函数的影响比重。
最后在测试阶段,将目标领域的样本输入已训练好的模型,通过类别分类器输出样本所属情感类别。
至此,本发明的具体实施过程描述完毕。

Claims (5)

1.一种基于领域对抗自适应的跨领域文本情感分类方法,其特征在于:该方法包括以下步骤:
步骤1,输入源领域和目标领域样本的词向量矩阵、情感类别标签和领域标签;
步骤2,利用基于CNN的特征提取模块,提取源领域和目标领域样本的低层特征;
步骤3,构建主任务模块,提取具有可转移性、对标签具有判别性的高层特征;
步骤3.1,通过高斯核函数将低层特征映射到RKHS,在该空间中利用MMD度量源领域和目标领域样本的距离;
步骤3.2,将源领域高层特征作为训练数据输入类别分类器;
步骤4,构建辅助任务模块,将低层特征作为训练数据输入具有对抗性质的领域分类器,提取具有领域不变性的高层特征。
步骤5,将目标领域样本输入已训练好的模型,输出文本数据情感类别的结果。
2.根据权利要求1所述的一种基于领域对抗自适应的跨领域文本情感分类方法,其特征在于:具体包括以下步骤:
步骤1,输入源领域和目标领域样本的词向量矩阵、情感类别标签和领域标签;
由于计算机无法直接处理文本数据,因此需要将文本输入数据转化成计算机可识别的数据类型;令矩阵的行数n表示段落中总单词数,矩阵的列数k表示词向量的维度,首先将输入文本中每个单词转化成1×k的词向量,其次按照单词在文本中出现的顺序,将词向量拼接成n×k的矩阵;最后根据不同的深度学习框架,转化成对应的存储格式,作为网络的输入。
3.根据权利要求1所述的一种基于领域对抗自适应的跨领域文本情感分类方法,其特征在于:步骤2,利用基于CNN的特征提取模块,提取样本的低层特征;
将源领域和目标领域的样本输入卷积神经网络,通过该特征提取模块提取样本的低层特征,将样本依次输入卷积层(Convolutional Layer)、池化层(Pooling Layer)和全连接层(Full Connected Layer),实现特征图的提取、特征图的下采样过程以及特征图向下一层的传输;其中卷积层的中卷积核的宽度应与词向量维度相同。
4.根据权利要求1所述的一种基于领域对抗自适应的跨领域文本情感分类方法,其特征在于:步骤3,构建主任务模块,提取具有可转移性、对标签具有判别性的高层特征;
步骤3.1,通过高斯核函数将低层特征映射到RKHS,在该空间中利用MMD度量源领域和目标领域样本的距离;
该方法取最大平均差异MMD作为检验统计量,度量领域间的分歧,数学表达式如下所示:
是原始空间中连续函数f的集合,s代表源领域,t代表目标领域,xs为源领域的样本,xt为目标领域的样本,p代表源领域样本服从的特征分布,即xs~p,q代表目标领域样本服从的特征分布,即xt~q,Ep为源领域样本分布的期望值,Eq为目标领域样本分布的期望值,ns为源领域样本的数量,nt为目标领域样本的数量,为源领域的第i个样本,为目标领域的第i个样本;当源领域和目标领域的样本分布一致时p=q,期望值相同,此时MMD的值为0,当源领域和目标领域样本分布不一致且函数空间足够大时,MMD的值大于零;当给定两个特征分布p和q时,MMD的结果依赖给定的连续函数集合过大,MMD的值趋近于无穷,不利于衡量样本差异;因此为了准确计算样本的距离,应满足下面两条性质,性质1:当且仅当p和q分布相同时,MMD等于零;并且为保证检验具备连续性,应满足性质2:MMD的经验估计可以随特征分布规模的增大迅速收敛到期望,需具备约束性;经证明当是再生核希尔伯特空间中的单位球时,即||f||H≤1,可满足上述两点性质;
一个完备的内积空间被称为希尔伯特空间(Hilbert Space),在这里将其记为f;若用空间内的点积表示映射f→f(x),即:
则希尔伯特空间被转化为再生核希尔伯特空间(Reproducing Kernel HilbertSpace,RKHS),这里φ表示的映射,即φ为原始空间的样本到希尔伯特空间的映射函数,因为空间中的点积可以表示函数到点的映射关系,因此函数f(x)可拆分为两部分,即f以及自变量x,该操作令f更容易被抽离出来实现最大化;此时引入分布,用E[φ(x)]替代φ(x),这里E[φ(x)]称为核嵌入分布(Kernel embedding of distributions),则源领域样本在希尔伯特空间的平均分布Ep[f(xs)]被表示为f与Ep[φ(xs)]的点积形式Ep[<φ(xs),f>H],即采用核函数的方式计算希尔伯特空间中的点积,同理,目标领域样本在希尔伯特空间的平均分布Eq[f(xt)]也可以被表示为f和Eq[φ(xt)]的点积形式Εq[<φ(xt),f>H];
其中μp=Ep[f(xs)],μq=Eq[f(xt)],由此看出源领域和目标领域的MMD距离用RKHS中两个点的距离表示,因此对上式等号两侧进行平方操作:
其中表示源领域中的第i个样本,表示源领域中的第j个样本,表示目标领域中的第i个样本,表示目标领域中的第j个样本,且i≠j,能够采用核函数计算,是RKHS中的单位球,因此采用高斯核函数或拉普拉斯核函数,若采用无穷维的高斯核函数则实现核嵌入方式表示的样本到再生核希尔伯特空间的映射,并利用高斯核函数计算领域间的MMD距离作为约束值,构建基于源领域和目标领域分布一致性的约束,实现源领域样本到目标领域的可迁移性,则领域对齐层的损失函数可被表示为下式;
代表源领域样本集合,即 代表源领域样本集合,即其中的表达式为:
步骤3.2,将源领域高层特征作为训练数据输入类别分类器;
在样本特征对齐的基础上,将源领域高层特征输入类别分类器,判断样本所属类别,保证分类器的有效性;其数学描述如下,源领域具有ns个独立同分布的标定样本目标领域具有nt个独立同分布的未标定样本 表示源领域样本集,表示目标领域样本集,均属于样本集合X,即源领域样本的标签标签集合Y={0,1,...,L-1};源领域样本和目标领域样本服从分布p和q,其中p≠q;通过训练目标领域的样本获得适用于目标领域的类别分类器η:y=η(x),该分类器在目标领域样本集上的损失函数如下式所示,其中Pr(η(xt)≠y)表示输入xt经分类后结果与其对应的标签y不相等的概率:
5.根据权利要求1所述的一种基于领域对抗自适应的跨领域文本情感分类方法,其特征在于:步骤4,构建辅助任务模块,将低层特征作为训练数据输入具有对抗性质的领域分类器,提取具有领域不变性的高层特征;
接下来将低层特征同时输入辅助任务模块,令具有对抗性质的领域分类器在准确判别样本所属领域的同时,通过梯度反转层引入对抗思想,将领域分类器看作生成式对抗网络中的判别器,在训练类别分类器时,使领域分类器无法判定样本的领域来源,以学习领域不变特征;领域分类器的损失函数如下所示:
其中,ns和nt分别表示源领域和目标领域样本的数量,则ns+nt表示两个领域中样本的总数,ηdomain为领域分类器,φ为映射函数,xi为需要判别的样本,di为样本xi的领域标签,该标签是一个二值变量,因此损失函数采用交叉熵损失函数,展开式如下示,xi通过函数φ被映射到公共特征空间后,由领域分类器ηdomain判别该特征样本所属的领域类别;
步骤5,将目标领域样本输入已训练好的模型,输出文本数据情感类别的结果;
在训练过程中,通过优化步骤2和步骤3中三个损失函数,包括最小化类别分类器ηlabel的损失函数,最大化领域分类器ηdomain的损失函数,以及最小化领域对齐层的损失函数可减小源领域和目标领域样本的差异,完成基于无监督领域对抗自适应的跨领域情感分类网络的训练,获得适用于目标领域的情感分类器,整个方法的损失函数如下所示,其中λ1和λ2为超参数,分别决定主任务模块和辅助任务模块占损失函数的影响比重;
最后在测试阶段,将目标领域的样本输入已训练好的模型,通过类别分类器输出样本所属情感类别。
CN201811263266.XA 2018-10-28 2018-10-28 一种基于领域对抗自适应的跨领域文本情感分类方法 Active CN109492099B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811263266.XA CN109492099B (zh) 2018-10-28 2018-10-28 一种基于领域对抗自适应的跨领域文本情感分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811263266.XA CN109492099B (zh) 2018-10-28 2018-10-28 一种基于领域对抗自适应的跨领域文本情感分类方法

Publications (2)

Publication Number Publication Date
CN109492099A true CN109492099A (zh) 2019-03-19
CN109492099B CN109492099B (zh) 2022-03-15

Family

ID=65693177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811263266.XA Active CN109492099B (zh) 2018-10-28 2018-10-28 一种基于领域对抗自适应的跨领域文本情感分类方法

Country Status (1)

Country Link
CN (1) CN109492099B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009038A (zh) * 2019-04-04 2019-07-12 北京百度网讯科技有限公司 筛查模型的训练方法、装置及存储介质
CN110032646A (zh) * 2019-05-08 2019-07-19 山西财经大学 基于多源领域适应联合学习的跨领域文本情感分类方法
CN110186680A (zh) * 2019-05-30 2019-08-30 盐城工学院 一种对抗判别域适应一维卷积神经网络智能故障诊断方法
CN110364186A (zh) * 2019-08-08 2019-10-22 清华大学深圳研究生院 一种基于对抗学习的端到端的跨语言语音情感识别方法
CN110796199A (zh) * 2019-10-30 2020-02-14 腾讯科技(深圳)有限公司 一种图像处理方法、装置以及电子医疗设备
CN110807291A (zh) * 2019-10-10 2020-02-18 南京摄星智能科技有限公司 一种基于拟态对抗学习机制的现场态势未来引导技术
CN110992988A (zh) * 2019-12-24 2020-04-10 东南大学 一种基于领域对抗的语音情感识别方法及装置
CN111612081A (zh) * 2020-05-25 2020-09-01 深圳前海微众银行股份有限公司 识别模型的训练方法、装置、设备及存储介质
CN111738455A (zh) * 2020-06-02 2020-10-02 山东大学 一种基于集成域自适应的故障诊断方法及系统
CN111767949A (zh) * 2020-06-28 2020-10-13 华南师范大学 一种基于特征和样本对抗共生的多任务学习方法及其系统
CN111899221A (zh) * 2020-06-30 2020-11-06 哈尔滨工业大学 一种面向外观缺陷检测的自迁移学习方法
CN112016451A (zh) * 2020-08-27 2020-12-01 贵州师范大学 一种用于迁移学习的训练样本标注成本削减方法
CN112199505A (zh) * 2020-10-30 2021-01-08 福州大学 一种基于特征表示学习的跨领域情感分类方法及系统
CN112434602A (zh) * 2020-11-23 2021-03-02 西安交通大学 一种基于可迁移共特征空间挖掘的故障诊断方法
CN112541081A (zh) * 2020-12-21 2021-03-23 中国人民解放军国防科技大学 一种基于领域自适应的可迁移谣言检测方法
CN112784043A (zh) * 2021-01-18 2021-05-11 辽宁工程技术大学 一种基于门控卷积神经网络的方面级情感分类方法
CN113344044A (zh) * 2021-05-21 2021-09-03 北京工业大学 一种基于领域自适应的跨物种医疗影像分类方法
CN113360633A (zh) * 2021-06-09 2021-09-07 南京大学 一种基于深度域适应的跨域测试文档分类方法
CN113447761A (zh) * 2021-07-14 2021-09-28 华中科技大学 基于最大均值差异的配电网小电流接地故障区段定位方法
CN113722439A (zh) * 2021-08-31 2021-11-30 福州大学 基于对抗性类别对齐网络的跨领域情感分类方法及系统
CN113723083A (zh) * 2021-07-15 2021-11-30 东华理工大学 基于bert模型的带权消极监督文本情感分析方法
CN113779249A (zh) * 2021-08-31 2021-12-10 华南师范大学 跨领域文本情感分类方法、装置、存储介质以及电子设备
CN114305452A (zh) * 2021-12-15 2022-04-12 南京航空航天大学 一种基于脑电和领域适配的跨任务认知负荷识别方法
CN114417852A (zh) * 2021-12-06 2022-04-29 重庆邮电大学 基于Wasserstein自编码器和高斯混合分布作为先验的主题建模方法
CN117435916A (zh) * 2023-12-18 2024-01-23 四川云实信息技术有限公司 航片ai解译中的自适应迁移学习方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096004A (zh) * 2016-06-23 2016-11-09 北京工业大学 一种建立大规模跨领域文本情感倾向性分析框架的方法
CN107967337A (zh) * 2017-12-05 2018-04-27 云南大学 一种基于情感极性增强语义的跨领域情感分析方法
CN108664589A (zh) * 2018-05-08 2018-10-16 苏州大学 基于领域自适应的文本信息提取方法、装置、系统及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096004A (zh) * 2016-06-23 2016-11-09 北京工业大学 一种建立大规模跨领域文本情感倾向性分析框架的方法
CN107967337A (zh) * 2017-12-05 2018-04-27 云南大学 一种基于情感极性增强语义的跨领域情感分析方法
CN108664589A (zh) * 2018-05-08 2018-10-16 苏州大学 基于领域自适应的文本信息提取方法、装置、系统及介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GRETTON A 等: "A Fast, Consistent Kernel Two-Sample Test", 《IN: PROCEEDINGS OF ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 22,THE 23RD ANNUAL CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS(NIPS 2009)》 *
李宁: "面向跨领域产品评论的情感分析研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陶剑文 等: "核分布一致局部领域适应学习", 《自动化学报》 *

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009038A (zh) * 2019-04-04 2019-07-12 北京百度网讯科技有限公司 筛查模型的训练方法、装置及存储介质
CN110032646A (zh) * 2019-05-08 2019-07-19 山西财经大学 基于多源领域适应联合学习的跨领域文本情感分类方法
CN110032646B (zh) * 2019-05-08 2022-12-30 山西财经大学 一种基于多源领域适应联合学习的跨领域文本情感分类方法
CN110186680A (zh) * 2019-05-30 2019-08-30 盐城工学院 一种对抗判别域适应一维卷积神经网络智能故障诊断方法
CN110364186A (zh) * 2019-08-08 2019-10-22 清华大学深圳研究生院 一种基于对抗学习的端到端的跨语言语音情感识别方法
CN110364186B (zh) * 2019-08-08 2021-06-25 清华大学深圳研究生院 一种基于对抗学习的端到端的跨语言语音情感识别方法
CN110807291A (zh) * 2019-10-10 2020-02-18 南京摄星智能科技有限公司 一种基于拟态对抗学习机制的现场态势未来引导技术
CN110807291B (zh) * 2019-10-10 2023-09-26 南京星耀智能科技有限公司 一种基于拟态对抗学习机制的现场态势未来引导技术
CN110796199A (zh) * 2019-10-30 2020-02-14 腾讯科技(深圳)有限公司 一种图像处理方法、装置以及电子医疗设备
CN110992988B (zh) * 2019-12-24 2022-03-08 东南大学 一种基于领域对抗的语音情感识别方法及装置
CN110992988A (zh) * 2019-12-24 2020-04-10 东南大学 一种基于领域对抗的语音情感识别方法及装置
CN111612081B (zh) * 2020-05-25 2024-04-02 深圳前海微众银行股份有限公司 识别模型的训练方法、装置、设备及存储介质
CN111612081A (zh) * 2020-05-25 2020-09-01 深圳前海微众银行股份有限公司 识别模型的训练方法、装置、设备及存储介质
CN111738455A (zh) * 2020-06-02 2020-10-02 山东大学 一种基于集成域自适应的故障诊断方法及系统
CN111767949A (zh) * 2020-06-28 2020-10-13 华南师范大学 一种基于特征和样本对抗共生的多任务学习方法及其系统
CN111899221A (zh) * 2020-06-30 2020-11-06 哈尔滨工业大学 一种面向外观缺陷检测的自迁移学习方法
CN111899221B (zh) * 2020-06-30 2022-08-09 哈尔滨工业大学 一种面向外观缺陷检测的自迁移学习方法
CN112016451A (zh) * 2020-08-27 2020-12-01 贵州师范大学 一种用于迁移学习的训练样本标注成本削减方法
CN112199505B (zh) * 2020-10-30 2022-06-03 福州大学 一种基于特征表示学习的跨领域情感分类方法及系统
CN112199505A (zh) * 2020-10-30 2021-01-08 福州大学 一种基于特征表示学习的跨领域情感分类方法及系统
CN112434602A (zh) * 2020-11-23 2021-03-02 西安交通大学 一种基于可迁移共特征空间挖掘的故障诊断方法
CN112434602B (zh) * 2020-11-23 2023-08-29 西安交通大学 一种基于可迁移共特征空间挖掘的故障诊断方法
CN112541081A (zh) * 2020-12-21 2021-03-23 中国人民解放军国防科技大学 一种基于领域自适应的可迁移谣言检测方法
CN112784043B (zh) * 2021-01-18 2024-05-10 辽宁工程技术大学 一种基于门控卷积神经网络的方面级情感分类方法
CN112784043A (zh) * 2021-01-18 2021-05-11 辽宁工程技术大学 一种基于门控卷积神经网络的方面级情感分类方法
CN113344044B (zh) * 2021-05-21 2024-05-28 北京工业大学 一种基于领域自适应的跨物种医疗影像分类方法
CN113344044A (zh) * 2021-05-21 2021-09-03 北京工业大学 一种基于领域自适应的跨物种医疗影像分类方法
CN113360633B (zh) * 2021-06-09 2023-10-17 南京大学 一种基于深度域适应的跨域测试文档分类方法
CN113360633A (zh) * 2021-06-09 2021-09-07 南京大学 一种基于深度域适应的跨域测试文档分类方法
CN113447761A (zh) * 2021-07-14 2021-09-28 华中科技大学 基于最大均值差异的配电网小电流接地故障区段定位方法
CN113723083B (zh) * 2021-07-15 2023-05-26 东华理工大学 基于bert模型的带权消极监督文本情感分析方法
CN113723083A (zh) * 2021-07-15 2021-11-30 东华理工大学 基于bert模型的带权消极监督文本情感分析方法
CN113779249B (zh) * 2021-08-31 2022-08-16 华南师范大学 跨领域文本情感分类方法、装置、存储介质以及电子设备
CN113722439B (zh) * 2021-08-31 2024-01-09 福州大学 基于对抗性类别对齐网络的跨领域情感分类方法及系统
CN113779249A (zh) * 2021-08-31 2021-12-10 华南师范大学 跨领域文本情感分类方法、装置、存储介质以及电子设备
CN113722439A (zh) * 2021-08-31 2021-11-30 福州大学 基于对抗性类别对齐网络的跨领域情感分类方法及系统
CN114417852A (zh) * 2021-12-06 2022-04-29 重庆邮电大学 基于Wasserstein自编码器和高斯混合分布作为先验的主题建模方法
CN114305452A (zh) * 2021-12-15 2022-04-12 南京航空航天大学 一种基于脑电和领域适配的跨任务认知负荷识别方法
CN117435916A (zh) * 2023-12-18 2024-01-23 四川云实信息技术有限公司 航片ai解译中的自适应迁移学习方法
CN117435916B (zh) * 2023-12-18 2024-03-12 四川云实信息技术有限公司 航片ai解译中的自适应迁移学习方法

Also Published As

Publication number Publication date
CN109492099B (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
CN109492099A (zh) 一种基于领域对抗自适应的跨领域文本情感分类方法
CN110334219B (zh) 基于注意力机制融入文本语义特征的知识图谱表示学习方法
CN111598214B (zh) 一种基于图卷积神经网络的跨模态检索方法
CN107076567A (zh) 多语言图像问答
CN105512209A (zh) 一种基于特征自动学习的生物医学事件触发词识别方法
CN110135459A (zh) 一种基于双三元组深度度量学习网络的零样本分类方法
CN110059191A (zh) 一种文本情感分类方法及装置
CN103942571B (zh) 一种基于遗传规划算法的图形图像分类方法
CN107832458A (zh) 一种字符级的基于嵌套深度网络的文本分类方法
CN106446954A (zh) 一种基于深度学习的字符识别方法
CN113946685B (zh) 一种融合规则和深度学习的渔业标准知识图谱构建方法
He et al. Diff-font: Diffusion model for robust one-shot font generation
CN109325513A (zh) 一种基于海量单类单幅图像的图像分类网络训练方法
CN112487193A (zh) 一种基于自编码器的零样本图片分类方法
CN115935991A (zh) 多任务模型生成方法、装置、计算机设备和存储介质
CN114281950B (zh) 基于多图加权融合的数据检索方法与系统
CN113836891A (zh) 基于多元标注策略的结构化信息抽取方法和装置
CN117370578A (zh) 一种基于多模态信息进行食品安全知识图谱补全的方法
CN118397351A (zh) 一种小样本分类方法、系统、介质及设备
CN117217807B (zh) 一种基于多模态高维特征的不良资产估值方法
CN113095352A (zh) 融合静动态特征的缝洞型油藏半监督学习储层含油气性评价方法
Yan et al. A comparison of machine learning methods applied to the automated selection of river networks
CN114692615B (zh) 一种针对小语种的小样本意图识别方法
Li et al. Non-Co-Occurrence Enhanced Multi-Label Cross-Modal Hashing Retrieval Based on Graph Convolutional Network
CN115905545A (zh) 一种基于变分自编码器的无监督读者书评情感分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230628

Address after: 065000 South side of Guzhu Road, Gu'an County, Langfang, Hebei Province (No. 2 office in the yard of Gu'an County Zhengtong Petroleum Liquefied Gas Co., Ltd.)

Patentee after: Langfang jiayangming Technology Co.,Ltd.

Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing

Patentee before: Beijing University of Technology

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240910

Address after: Room 101, 6th Floor 6245, Floors 1-12, Building 1, No. 28 Beiyuan Road, Chaoyang District, Beijing 100020

Patentee after: Beijing Wangzhe Glory Information Consulting Co.,Ltd.

Country or region after: China

Address before: 065000 South side of Guzhu Road, Gu'an County, Langfang, Hebei Province (No. 2 office in the yard of Gu'an County Zhengtong Petroleum Liquefied Gas Co., Ltd.)

Patentee before: Langfang jiayangming Technology Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right