CN110263151B - 一种面向多视角多标签数据的隐语义学习方法 - Google Patents

一种面向多视角多标签数据的隐语义学习方法 Download PDF

Info

Publication number
CN110263151B
CN110263151B CN201910373011.7A CN201910373011A CN110263151B CN 110263151 B CN110263151 B CN 110263151B CN 201910373011 A CN201910373011 A CN 201910373011A CN 110263151 B CN110263151 B CN 110263151B
Authority
CN
China
Prior art keywords
matrix
label
data
view
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910373011.7A
Other languages
English (en)
Other versions
CN110263151A (zh
Inventor
温雯
韦滨
蔡瑞初
郝志峰
陈炳丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910373011.7A priority Critical patent/CN110263151B/zh
Publication of CN110263151A publication Critical patent/CN110263151A/zh
Application granted granted Critical
Publication of CN110263151B publication Critical patent/CN110263151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本发明提供了一种面向多视角多标签数据的隐语义学习方法,包括:读取多视角多标签数据作为预处理器的输入,然后进行数据预处理,并将预处理结果输入到训练器中,学习得到隐语义子空间和训练后的模型。预测未标注多视角数据的标签时,将未标注的多视角数据进行预处理,然后输入到训练好的模型中预测得到多标签类别。本发明中提出了一种融合多个视角信息的学习和多标签分类方法,将输入特征和输出多标签映射到共同的潜在语义子空间中。该方法能够处理高维稀疏数据所带来的维数灾难问题,同时融合多视角信息对多标签数据进行分类。

Description

一种面向多视角多标签数据的隐语义学习方法
技术领域
本发明一般涉及网络中的矩阵分析、正交约束方法及最优化方法,更具体地, 涉及一种面向多视角多标签数据的隐语义学习方法。
背景技术
近年来,以大数据、物联网、人工智能、5G为核心特征的数字化浪潮正席卷全球,由此带来了各个领域的海量数据。因此针对图像领域的分类问题、视频概念的自动标注一直受到学术界和工业界热切关注。而随着音乐数据库的规模和数量的增长,情感检索音乐已成为移动设备的歌曲选择、音乐推荐系统、电视广播节目和音乐治疗等各种应用的重要任务。多视角多标签学习在这些场景都是需要的,因为现实中很多数据并不是来自单一信息源,也不仅仅只有单一的标签,多视角多标签学习有很多实际应用需求例如:对文章的主题分类可以用于个性化推荐,对视频进行标注以及用于音乐个性化推荐系统,融合多视角和多标签数据有利于提高分类任务的准确性。
对于多视角多标签数据的融合,主要存在以下几个难点:
1.数据高维稀疏。任务中的数据往往分布在一个高维稀疏空间中,不太方便处理,维度太高导致采用的分类模型的复杂度也相应增高,最终导致分类模型容易过拟合。
2.多视角数据的融合。普遍认为不同视角之间信息是互补的,通过融合不同视角的数据可以提升学习效果,现有的方法效果并不是很理想,如何有效地融合多视角信息成为了急需解决的问题。
3.隐语义空间的学习。隐语义空间学习的主要问题,就是如何将特征从高维空间压缩到低维空间,需要保留什么样的信息,设定什么样的准则。
多视角多标签学习的基本目标就是解决上述信息处理存在的困难。然而,现有的方法中,还没有一个有效的方法能够高效地解决以上的问题。目前提出了有监督的LSI特征映射方法进行多标签分类,该方法通过将文本信息融合标签信息映射到低维隐语义子空间,然后再用线性SVM分类器分别对每个标签进行分类,这种方法有考虑到标签之间的相关性,然而没有考虑到多视角数据。另有人提出通过学习多视角间的互补属性,得到一个低维的平滑嵌入,但是这种方法缺失了多标签信息。最后目前提出一种基于矩阵分解的多视角多标签学习方法,学习多视角的共同表示,然而这种方法没有考虑到高维稀疏数据。综上,现有的机器学习学习方法的主要局限性就是没办法融合多视角多标签信息学习得到低维隐语义空间。
发明内容
为了克服现有技术不能有效融合多视角多标签信息学习得到低维隐语义空间的缺陷,本发明提出一种面向多视角多标签数据的隐语义学习方法。
为解决上述技术问题,本发明采用的技术方案是:
一种面向多视角多标签数据的隐语义空间学习方法,包括以下步骤:
S1.读取多视角多标签数据进行预处理,预处理部分去除文本数据的停用词并通过关键词权重计算算法(TF-IDF)将数据向量化,将预处理得到的特征向量化结果作为方法的输入;
S2.构建面向多视角多标签数据的隐语义学习模型;
S3.模型训练,通过交替方向乘子法(ADMM)和bregman迭代将带约束的隐语义空间学习问题转换成无约束的多组变量交替求解的子问题,并且通过奇异值分解更新隐语义空间;
S4.将迭代得到的W矩阵和C矩阵用于对新输入的多视角数据的预测。
优选的,所述的S2包括以下步骤:基于将数据映射到低维空间最小化重构误差的原理,构建融合不同视角和特点的分类器,同时结合多标签的相关性,构建面向多视角多标签数据的隐语义学习模型。
优选的,所述的隐语义学习模型如下:
Figure BDA0002050653990000021
γ=1...Γ
其中,定义Γ为视角个数,γ=1,...,Γ是相应的视角,X=[X1,...,XΓ]是输入不同视角的特征矩阵,αγ是不同视角对应的权重系数,V为隐语义空间,I为单位矩阵,同时令W=[W1,...,WΓ]为各个视角对应的权重矩阵,Y为输入特征矩阵对应的多标签矩阵,当标签为正时Y的元素值取值为1,标签为负时Y的元素值取值为-1;A=[A1,...,AΓ]表示为每个视角到隐语义空间的转换矩阵,C表示为多标签到隐语义空间的转换矩阵。
优选的,所述的S3包括以下步骤:
S31.学习模块通过交替方向乘子法(ADMM)和迭代推导得到迭代解析式:
Figure BDA0002050653990000031
Figure BDA0002050653990000032
Figure BDA0002050653990000033
Figure BDA0002050653990000034
Figure BDA0002050653990000035
Figure BDA0002050653990000036
Figure BDA0002050653990000037
其中,对偶变量B使得原始问题可以被分解成子问题,采用交替优化的方式,将优化问题的求解变成较小的局部子问题求解,将局部子问题的解以协同的方式,用于恢复原始大尺度的优化问题的解;其中I为单位矩阵,r为正则化系数,n 为矩阵的行数,m为矩阵的列数,k表示第k次迭代,Γ为视角个数,γ,γ'=1,...,Γ是相应的视角,
Figure BDA0002050653990000038
为左奇异值矩阵、
Figure BDA0002050653990000039
为右奇异值矩阵、
Figure BDA00020506539900000310
为单位矩阵;
S32.对矩阵A,C,W和对偶变量B进行初始化;
S33.按照上述迭代解析式2-4交替更新包括Wγ,Aγ,C在内的不同视角的投影转换矩阵;
S34.融合多视角数据和对偶变量B,并对Z矩阵进行奇异值分解,得到的左奇异值矩阵
Figure BDA00020506539900000311
右奇异值矩阵
Figure BDA00020506539900000312
和单位矩阵
Figure BDA00020506539900000313
S35.利用步骤S34中奇异值分解得到的左奇异值矩阵
Figure BDA0002050653990000041
和右奇异值矩阵
Figure BDA0002050653990000042
重构得到隐语义空间V;
S36.更新对偶变量Bk
S37.重复执行以上步骤S33到步骤S36直到方法收敛。
优选的,所述的S4包括以下内容:
针对未标注的新样本
Figure BDA0002050653990000043
输入,根据步骤S3中得到的 W=[W1,...,WΓ]和C计算:
Figure BDA0002050653990000044
Figure BDA0002050653990000045
为预测得到的多标签数据,大于0的元素则为属于该类别,小于0的则不属于此类别。
与现有技术相比,本发明技术方案的有益效果是:
1)本发明融合了多视角多标签数据;2)能够处理学习高维稀疏的数据;3) 能够学习得到数据潜在的语义空间。克服了之前方法存在的不足与局限性。而且学习到的隐语义空间是低维度的,解决了多视角多标签学习中存在的问题:高维度、高度稀疏。隐语义空间融合了多视角信息的互补性,从而解决了多视角互补性的问题。
附图说明
图1为实施方式中面向多视角多标签数据的隐语义学习方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,仅用于示例性说明,不能理解为对本专利的限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,本发明实施提供一种融合多视角多标签信息的隐语义空间学习方法,包括:
读取多视角多标签信息,然后学习多视角信息的投影矩阵,本发明涉及多个视角的学习,含有多组需要更新的变量,同时模型中对于学习得到的隐语义空间带有正交约束,因而引入交替方向乘子法和bregman迭代来进行优化求解。ADMM 采用分解坐标法的方式,将优化问题的求解变成较小的局部子问题求解,然后这些局部子问题的解以协同的方式,用于恢复原始大尺度的优化问题的解。对于每一个视角相关的变量更新至误差小于某一阈值时停止更新。之后学习得到隐语义空间,引入bregman迭代对隐语义空间的正交约束进行优化求解。然后对通过 bregman迭代得到的更新变量进行奇异值分解来生成最后的隐语义空间。对于学习得到的隐语义空间,做预测时我们可以通过将原始高维稀疏数据映射到隐语义空间中,再通过其他机器学习方法如线性支持向量机进行学习,或者可以直接通过矩阵分析的方式直接得到预测标签。
实施例2
本实施例提供的融合多视角多标签信息的隐语义空间学习方法与实施例1 相同,仅对方法中的各个步骤进行进一步限定。
步骤S1:数据预处理,读取多视角多标签数据进行预处理,预处理部分去除文本数据的停用词并通过TF-IDF算法将数据向量化,将预处理得到的特征向量化结果作为方法的输入;
步骤S2:构建面向多视角多标签数据的隐语义学习模型;基于将数据映射到低维空间最小化重构误差保留尽可能多的信息的原理,构建了融合不同视角和特点的分类器,同时结合多标签的相关性,本发明优化如下带约束目标函数:
Figure BDA0002050653990000051
γ=1...Γ
在上述模型(1)中,定义Γ为视角个数,γ=1,...,Γ是相应的视角, X=[X1,...,XΓ]是输入不同视角的特征矩阵,αγ是不同视角对应的权重系数,V 为隐语义空间,I为单位矩阵,同时令W=[W1,...,WΓ]为各个视角对应的权重矩阵。Y为输入特征矩阵对应的多标签矩阵,当标签为正时Y的元素值取值为1,标签为负时Y的元素值取值为-1。A=[A1,...,AΓ]表示为每个视角到隐语义空间的转换矩阵,C表示为多标签到隐语义空间的转换矩阵。
步骤S3:通过交替方向乘子法和bregman迭代将带约束的隐语义空间学习问题转换成无约束的多组变量交替求解的子问题,并且通过奇异值分解更新隐语义空间;
Figure BDA0002050653990000061
Figure BDA0002050653990000062
Figure BDA0002050653990000063
Figure BDA0002050653990000064
Figure BDA0002050653990000065
Figure BDA0002050653990000066
Figure BDA0002050653990000067
采用交替优化的方式,将优化问题的求解变成较小的局部子问题求解,将局部子问题的解以协同的方式,用于恢复原始大尺度的优化问题的解,I为单位矩阵,r为正则化系数,n为矩阵的行数,m为矩阵的列数,k表示第k次迭代,Γ为视角个数,γ,γ'=1,...,Γ是相应的视角,
Figure BDA0002050653990000068
为左奇异值矩阵、
Figure BDA0002050653990000069
为右奇异值矩阵、
Figure BDA00020506539900000610
为单位矩阵;
S32.对矩阵A,C,W和对偶变量B进行初始化;
S33.按照上述迭代解析式2-4交替更新包括Wγ,Aγ,C在内的不同视角的投影转换矩阵;
S34.融合多视角数据和对偶变量B,并对Z矩阵进行奇异值分解,得到的左奇异值矩阵
Figure BDA00020506539900000611
右奇异值矩阵
Figure BDA00020506539900000612
和单位矩阵
Figure BDA00020506539900000613
S35.利用步骤S34中奇异值分解得到的左奇异值矩阵
Figure BDA00020506539900000614
和右奇异值矩阵
Figure BDA00020506539900000615
重构得到隐语义空间V;
S36.更新对偶变量Bk
S37.重复执行以上步骤S33到步骤S36直到方法收敛。
步骤S4:模型预测
针对未标注的新样本
Figure BDA0002050653990000071
输入,由步骤S3中得到的W=[W1,...,WΓ] 和C计算:
Figure BDA0002050653990000072
Figure BDA0002050653990000073
为预测得到的多标签数据,大于0的元素则为属于该类别,小于0的则不属于此类别。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (3)

1.一种面向多视角多标签数据的隐语义空间学习方法,其特征在于,包括以下步骤:
S1.读取多视角多标签数据进行预处理,预处理部分去除文本数据的停用词并通过关键词权重计算算法将数据向量化,将预处理得到的特征向量化结果作为方法的输入;
S2.构建面向多视角多标签数据的隐语义学习模型;
所述的隐语义学习模型如下:
Figure FDA0003995610110000011
γ=1...Γ
其中,定义Γ为视角个数,γ=1,...,Γ是相应的视角,X=[X1,...,XΓ]是输入不同视角的特征矩阵,αγ是不同视角对应的权重系数,V为隐语义空间,I为单位矩阵,同时令W=[W1,...,WΓ]为各个视角对应的权重矩阵,Y为输入特征矩阵对应的多标签矩阵,当标签为正时Y的元素值取值为1,标签为负时Y的元素值取值为-1;A=[A1,...,AΓ]表示为每个视角到隐语义空间的转换矩阵,C表示为多标签到隐语义空间的转换矩阵;
S3.进行模型训练:通过交替方向乘子法和bregman迭代将带约束的隐语义空间学习问题转换成无约束的多组变量交替求解的子问题,并且通过奇异值分解更新隐语义空间,得到模型迭代后的矩阵;具体的步骤包括:
S31.学习模块通过交替方向乘子法和迭代推导得到迭代解析式:
Figure FDA0003995610110000012
Figure FDA0003995610110000013
Figure FDA0003995610110000014
Figure FDA0003995610110000021
Figure FDA0003995610110000022
Figure FDA0003995610110000023
Figure FDA0003995610110000024
Figure FDA0003995610110000025
其中,对偶变量B使得原始问题可以被分解成子问题,采用交替优化的方式,将优化问题的求解变成较小的局部子问题求解,将局部子问题的解以协同的方式,用于恢复原始大尺度的优化问题的解;其中I为单位矩阵,r为正则化系数,n为矩阵的行数,m为矩阵的列数,k表示第k次迭代,Γ为视角个数,γ和γ'是相应的视角,其取值为1,...,Γ,
Figure FDA0003995610110000026
为左奇异值矩阵、
Figure FDA0003995610110000027
为右奇异值矩阵、
Figure FDA0003995610110000028
为单位矩阵;
S32.对矩阵A,C,W和对偶变量B进行初始化;
S33.按照上述迭代解析式2-4交替更新包括Wγ,Aγ,C在内的不同视角的投影转换矩阵;
S34.融合多视角数据和对偶变量B,并对Z矩阵进行奇异值分解,得到的左奇异值矩阵
Figure FDA0003995610110000029
右奇异值矩阵
Figure FDA00039956101100000210
和单位矩阵
Figure FDA00039956101100000211
S35.利用步骤S34中奇异值分解得到的左奇异值矩阵
Figure FDA00039956101100000212
和右奇异值矩阵
Figure FDA00039956101100000213
重构得到隐语义空间V;
S36.更新对偶变量Bk
S37.重复执行以上步骤S33到步骤S36直到方法收敛;
S4.将模型迭代得到的矩阵用于对新输入的多视角多标签数据的预测。
2.根据权利要求1所述的面向多视角多标签数据的隐语义空间学习方法,其特征在于,所述的S2包括以下步骤:基于将数据映射到低维空间最小化重构误差的原理,构建融合不同视角和特点的分类器,同时结合多标签的相关性,构建面向多视角多标签数据的隐语义学习模型。
3.根据权利要求1所述的面向多视角多标签数据的隐语义空间学习方法,其特征在于,所述的S4包括以下内容:
针对未标注的新样本
Figure FDA0003995610110000031
输入,根据步骤S3中得到的W=[W1,...,WΓ]和C计算:
Figure FDA0003995610110000032
Figure FDA0003995610110000033
为预测得到的多标签数据,大于0的元素则为属于此类别,小于0的则不属于此类别。
CN201910373011.7A 2019-05-06 2019-05-06 一种面向多视角多标签数据的隐语义学习方法 Active CN110263151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910373011.7A CN110263151B (zh) 2019-05-06 2019-05-06 一种面向多视角多标签数据的隐语义学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910373011.7A CN110263151B (zh) 2019-05-06 2019-05-06 一种面向多视角多标签数据的隐语义学习方法

Publications (2)

Publication Number Publication Date
CN110263151A CN110263151A (zh) 2019-09-20
CN110263151B true CN110263151B (zh) 2023-02-07

Family

ID=67914212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910373011.7A Active CN110263151B (zh) 2019-05-06 2019-05-06 一种面向多视角多标签数据的隐语义学习方法

Country Status (1)

Country Link
CN (1) CN110263151B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807159B (zh) * 2019-10-30 2021-05-11 同盾控股有限公司 数据标记方法、装置、存储介质及电子设备
CN111291643B (zh) * 2020-01-20 2023-08-22 北京百度网讯科技有限公司 视频的多标签分类方法、装置、电子设备与存储介质
CN111860614B (zh) * 2020-06-30 2023-09-19 西安工程大学 基于深度子空间自表达的多标签分类方法
CN111816255B (zh) * 2020-07-09 2024-03-08 江南大学 融合多视角和最优多标签链式学习的rna结合蛋白识别
CN112418272A (zh) * 2020-10-29 2021-02-26 广东工业大学 一种用于亚细胞蛋白质定位的多视角多分类方法
CN112926675B (zh) * 2021-03-22 2023-08-18 哈尔滨工业大学(深圳) 视角和标签双重缺失下的深度不完整多视角多标签分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945370A (zh) * 2012-10-18 2013-02-27 浙江大学 基于多标签二视角支持向量机的分类方法
CN107016415A (zh) * 2017-04-12 2017-08-04 合肥工业大学 一种基于全卷积网络的彩色图像色彩语义分类方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583586B2 (en) * 2011-01-21 2013-11-12 International Business Machines Corporation Mining temporal patterns in longitudinal event data using discrete event matrices and sparse coding
US11205103B2 (en) * 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945370A (zh) * 2012-10-18 2013-02-27 浙江大学 基于多标签二视角支持向量机的分类方法
CN107016415A (zh) * 2017-04-12 2017-08-04 合肥工业大学 一种基于全卷积网络的彩色图像色彩语义分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于多视角多标签学习的读者情绪分类;温雯等;《计算机科学》;20180831;第191-197页 *

Also Published As

Publication number Publication date
CN110263151A (zh) 2019-09-20

Similar Documents

Publication Publication Date Title
CN110263151B (zh) 一种面向多视角多标签数据的隐语义学习方法
Ahmed et al. Deep learning modelling techniques: current progress, applications, advantages, and challenges
CN113822494A (zh) 风险预测方法、装置、设备及存储介质
Agarwal Ranking on graph data
CN112256866B (zh) 一种基于深度学习的文本细粒度情感分析算法
CN114896388A (zh) 一种基于混合注意力的层级多标签文本分类方法
CN117453921B (zh) 一种大语言模型的数据信息标签处理方法
CN111582506A (zh) 基于全局和局部标记关系的偏多标记学习方法
CN113987187A (zh) 基于多标签嵌入的舆情文本分类方法、系统、终端及介质
CN112651940A (zh) 基于双编码器生成式对抗网络的协同视觉显著性检测方法
CN117556067B (zh) 数据检索方法、装置、计算机设备和存储介质
CN114782752A (zh) 基于自训练的小样本图像集成分类方法及装置
Peng et al. Swin transformer-based supervised hashing
US11935278B1 (en) Image labeling for artificial intelligence datasets
He et al. Multilabel classification by exploiting data‐driven pair‐wise label dependence
Bahrami et al. Automatic image annotation using an evolutionary algorithm (IAGA)
Yang et al. Contrastive embedding distribution refinement and entropy-aware attention for 3D point cloud classification
Ong et al. Image-based plant identification with taxonomy aware architecture.
CN115129807A (zh) 基于自注意的社交媒体主题评论的细粒度分类方法及系统
Zhou et al. Deep global semantic structure-preserving hashing via corrective triplet loss for remote sensing image retrieval
CN113569130A (zh) 内容推荐方法、装置、设备及可读存储介质
Till et al. Self‐organizing maps for latent semantic analysis of free‐form text in support of public policy analysis
Lakshmi An efficient telugu word image retrieval system using deep cluster
Palekar et al. Label dependency classifier using multi feature graph convolution networks for automatic image annotation
Seo et al. Similar image retrieval using Autoencoder. I. Automatic morphology classification of galaxies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant