CN110414623B - 基于多视角学习的分类模型构建方法及装置 - Google Patents
基于多视角学习的分类模型构建方法及装置 Download PDFInfo
- Publication number
- CN110414623B CN110414623B CN201910721187.7A CN201910721187A CN110414623B CN 110414623 B CN110414623 B CN 110414623B CN 201910721187 A CN201910721187 A CN 201910721187A CN 110414623 B CN110414623 B CN 110414623B
- Authority
- CN
- China
- Prior art keywords
- data
- visual angle
- data set
- equation
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于多视角学习的分类模型构建方法,包括:接收到模型构建指令时,获取多个第一视角数据组及多个第二视角数据组;第一视角数据组包括携带正类标签的第一视角特征数据,以及与第一视角特征数据对应的第三类无标签特征数据;第二视角数据组包括携带负类标签的第二视角特征数据,以及与第二视角特征数据对应的第三类无标签特征数据;获取与模型构建指令对应的目标方程;应用拉格朗日乘子法对目标方程进行计算,得到与目标方程对应的对偶方程;基于训练数据集对所述对偶方程进行求解,得到与训练数据集对应的分类模型。通过结合第三类无标签特征数据进行分类模型的构建,降低了对多视角训练数据数量的依赖,提高分类模型的分类精度。
Description
技术领域
本发明涉及机器学习领域,特别涉及一种基于多视角学习的分类模型构建方法及装置。
背景技术
随着信息科技的发展,多视角学习(Multi-view Learning,MVL)越来越受到人们的欢迎。MVL是利用多视角数据训练机器学习模型的方法,其中,同一个样本从不同的途径或者不同的方法获得的特征数据被称为多视角数据,例如,中文中的“你好”,在英文中表征为“Hello”,在法语中表征为“Bonjour”,再有,一张带有心型的图片,在文字的视角下表述为“爱情”,多视角数据能通过不同的特征对相同的数据进行描述。
与单视角学习相比而言,应用MVL的方式构建分类模型,可以使得模型具有更好的泛化风险边界和更好的分类准确率。然而,经本发明人研究发现,在应用MVL的方式构建分类模型时,往往会受到多视角数据不足的影响,使得分类模型的分类效果受到限制。
发明内容
本发明所要解决的技术问题是提供一种基于多视角学习的分类模型构建方法,能够应用第一视角特征数据、与所述第一视角特征数据对应的第三类无标签特征数据、第二视角特征数据以及与所述第二视角特征数据对应的第三类无标签特征数据构建分类模型,能够降低对多视角训练数据数量的依赖,提高分类模型的分类精度。
本发明还提供了一种基于多视角学习的分类模型构建装置,用以保证上述方法在实际中的实现及应用。
一种基于多视角学习的分类模型构建方法,包括:
接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;
获取与所述模型构建指令对应的目标方程;
应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;
基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。
上述的方法,可选的,所述训练数据集的存储过程,包括:
获取第一初始训练集及第二初始训练集;
调用第一特征提取模型分别对所述第一初始训练集中的各个样本数据进行特征提取,得到与各个所述样本数据对应的第一视角数据特征;
分别为各个所述第一视角特征数据分配正类标签,并在所述第二初始训练集中确定与各个第一视角特征数据对应的第三类无标签特征数据;
将每个已分配正类标签的第一特征数据及与其对应的第三类无标签特征数据组成第一视角数据组;
调用第二特征提取模型分别对所述第一初始训练集中的各个样本数据进行特征提取,得到与各个所述样本数据对应的第二视角特征数据;
分别为各个所述第一视角特征数据分配负类标签,并在所述第二初始训练集中确定与各个第二视角特征数据对应的第三类无标签特征数据;
将每个已分配负类标签的第二特征数据及与其对应的第三类无标签特征数据组成第二视角数据组;
依据各个所述第一视角数据组及各个所述第二视角数据组,得到训练数据集,并将所述训练数据集进行存储。
上述的方法,可选的,所述训练数据集的存储过程,包括:
获取初始训练集,所述初始训练集包含正类数据集合、负类数据集合及第三类数据集合;
应用正类数据特征提取模型对所述正类数据集合中的各个正类数据进行特征提取,得到与各个所述正类数据对应的第一视角特征数据;
应用负类数据特征提取模型对所述负类数据集合中的各个负类数据进行特征提取,得到与各个所述负类数据对应的第二视角特征数据;
应用第三类数据特征提取模型对所述第三类数据集合中的各个第三类数据进行特征提取,得到与各个第三类数据的第三类无标签特征数据;
依据各个所述第一视角特征数据、各个所述第二视角特征数据及各个所述第三类无标签特征数据组成训练数据集,将所述训练数据集进行存储。
上述的方法,可选的,所述应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程,包括:
获取预先设置的各个拉格朗日乘子;
将所述拉格朗日乘子代入至所述目标方程中,以得到与所述目标方程对应的拉格朗日方程;
对所述拉格朗日方程中的各个参数进行求导,以得到各个所述参数的代数式;
将各个所述代数式代入至所述目标方程中,得到与所述目标方程对应的对偶方程。
上述的方法,可选的,所述基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型,包括:
将所述训练数据集中的第一数据集合及所述第二数据集合,依次代入所述对偶方程中,以确定所述目标方程中各个参数的参数值;
将已确定参数值的所述目标方程封装为分类模型。
上述的方法,可选的,还包括:
应用所述分类模型对所述训练数据集进行分类,以得到所述分类模型的分类准确率;
将所述分类准确率与预先设置的分类准确率阈值进行比较,若所述分类准确率小于预设的分类准确率阈值,则应用所述训练数据集对所述分类模型进行训练。
一种基于多视角学习的分类模型构建装置,包括:
第一获取单元,用于接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;
第二获取单元,用于获取与所述模型构建指令对应的目标方程;
运算单元,用于应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;
生成单元,用于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。
上述的装置,可选的,所述运算单元,包括:
获取子单元,用于获取预先设置的各个拉格朗日乘子;
第一运算子单元,用于将所述拉格朗日乘子代入至所述目标方程中,以得到与所述目标方程对应的拉格朗日方程;
第二运算子单元,用于对所述拉格朗日方程中的各个参数进行求导,以得到各个所述参数的代数式;
第三运算子单元,用于将各个所述代数式代入至所述目标方程中,得到与所述目标方程对应的对偶方程。
上述的装置,可选的,所述生成单元,包括:
第四运算子单元,用于将所述训练数据集中的第一数据集合及所述第二数据集合,依次代入所述对偶方程中,以确定所述目标方程中各个参数的参数值;
封装子单元,用于将已确定参数值的所述目标方程封装为分类模型。
上述的装置,可选的,还包括:
分类单元,用于应用所述分类模型对所述训练数据集进行分类,以得到所述分类模型的分类准确率;
训练单元,用于将所述分类准确率与预先设置的分类准确率阈值进行比较,若所述分类准确率小于预设的分类准确率阈值,则应用所述训练数据集对所述分类模型进行训练。
与现有技术相比,本发明包括以下优点:
本发明提供了一种基于多视角学习的分类模型构建方法,包括:
接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;获取与所述模型构建指令对应的目标方程;应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。能够应用第一视角特征数据、与所述第一视角特征数据对应的第三类无标签特征数据、第二视角特征数据以及与所述第二视角特征数据对应的第三类无标签特征数据构建分类模型,能够降低对多视角训练数据数量的依赖,提高分类模型的分类精度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于多视角学习的分类模型构建方法的方法流程图;
图2为本发明提供的一种基于多视角学习的分类模型构建方法的又一方法流程图;
图3为本发明提供的一种基于多视角学习的分类模型构建装置的结构示意图;
图4为本发明提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本发明实施例提供了一种基于多视角学习的分类模型构建方法,该方法可以应用在多种系统平台,其执行主体可以为计算机终端或各种移动设备的处理器,所述方法的方法流程图如图1所示,具体包括:
S101:接收到模型构建指令时,获取预先存储的训练数据集。
本发明实施例提供的方法中,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据。
本发明实施例提供的方法中,携带正类标签的第一视角特征数据可以为第一类型图片样本中的64-D颜色直方图,携带正类标签的第二视角特征数据可以为第一类型图片样本中的SIFT基于500-D数据包。第三类无标签特征数据可以为Universum数据,可以为第二类型图片的特征数据。
S102:获取与所述模型构建指令对应的目标方程。
本发明实施例提供的方法中,该目标方程为SVM-2k的最优模型。本发明实施例提供的方法中,该目标方程中存在一个或多个待求解参数。该目标方程可以技术人员预先设置的。
S103:应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程。
本发明实施例提供的方法中,通过应用拉格朗日乘子法可以将目标方程转换为对偶方程。
S104:基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。
本发明实施例提供的方法中,通过应用训练数据集对该对偶方程进行求解,可以得到对偶方程中各个待求解参数的参数值,将各个参数值代回原目标方程中可得到与训练数据集相应的SVM-2k分类模型。
本发明实施例提供的方法中,可以应用该分类模型对手写字体进行分类。
本发明实施例提供的基于多视角学习的分类模型构建方法,包括:接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;获取与所述模型构建指令对应的目标方程;应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。本发明实施例提供的方法中,利用第一视角特征数据、第二视角特征数据以及第三类无标签特征数据构建分类模型,第三类无标签特征数据可以作为先验知识域将第一视角特征数据及第二视角特征数据进行划界,能够降低对多视角训练数据数量的依赖,提高分类模型的分类精度。
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述训练数据集的存储过程,可以包括:
获取第一初始训练集及第二初始训练集;
调用第一特征提取模型分别对所述第一初始训练集中的各个样本数据进行特征提取,得到与各个所述样本数据对应的第一视角数据特征;
分别为各个所述第一视角特征数据分配正类标签,并在所述第二初始训练集中确定与各个第一视角特征数据对应的第三类无标签特征数据;
将每个已分配正类标签的第一特征数据及与其对应的第三类无标签特征数据组成第一视角数据组;
调用第二特征提取模型分别对所述第一初始训练集中的各个样本数据进行特征提取,得到与各个所述样本数据对应的第二视角特征数据;
分别为各个所述第一视角特征数据分配负类标签,并在所述第二初始训练集中确定与各个第二视角特征数据对应的第三类无标签特征数据;
将每个已分配负类标签的第二特征数据及与其对应的第三类无标签特征数据组成第二视角数据组;
依据各个所述第一视角数据组及各个所述第二视角数据组,得到训练数据集,并将所述训练数据集进行存储。
本发明实施例提供的方法中,第二初始训练集可以为Universum数据集。
本发明实施例提供的方法中,该第一特征提取模型及第二特征提取模型可以为技术人员预先设置的。可以通过确定待提取特征数据类型,获取与所述该特征数据类型相对应的特征提取模型,即本方案中可以预先设置有多个特征提取模型。
本发明实施例提供的方法中,所述训练数据集的存储过程,还可以包括:
获取初始训练集,所述初始训练集包含正类数据集合、负类数据集合及第三类数据集合;
应用正类数据特征提取模型对所述正类数据集合中的各个正类数据进行特征提取,得到与各个所述正类数据对应的第一视角特征数据;
应用负类数据特征提取模型对所述负类数据集合中的各个负类数据进行特征提取,得到与各个所述负类数据对应的第二视角特征数据;
应用第三类数据特征提取模型对所述第三类数据集合中的各个第三类数据进行特征提取,得到与各个第三类数据的第三类无标签特征数据;
依据各个所述第一视角特征数据、各个所述第二视角特征数据及各个所述第三类无标签特征数据组成训练数据集,将所述训练数据集进行存储。
本发明实施例提供的方法中,基于上述的实施过程,具体的,应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程,如图2所示,可以包括
S201:获取预先设置的各个拉格朗日乘子。
本发明实施例提供的方法中,各个拉格朗日乘子为技术人员预先设置的。
S202:将所述拉格朗日乘子代入至所述目标方程中,以得到与所述目标方程对应的拉格朗日方程。
本发明实施例提供的方法中,该目标方程,可以为:
s.t.|(wA·φA(xi)+bA)-(wB·φB(xi)+bB)|≤ε+ηi
其中,WA为第一视角特征数据对应的权重,bA为第一视角特征数据对应的阈值,WB为第二视角特征数据对应的权重,bB为第二视角特征数据对应的阈值;CA为第一惩罚参数,CB为第二惩罚参数,C为第三惩罚参数,D为第四惩罚参数;ηi(i=1,2,...,l)δ≥0,为松弛变量。
本发明实施提供的方法中,将所述拉格朗日乘子代入至所述目标方程中,以得到与所述目标方程对应的拉格朗日方程,该拉格朗日方程为:
S203:对所述拉格朗日方程中的各个参数进行求导,以得到各个所述参数的代数式。
本发明实施例提供的方法中,对朗格朗日函数L(Θ)进行分别求导并设置导函数为0,可得到各个参数的代数式,具体如下:
S204:将各个所述代数式代入至所述目标方程中,得到与所述目标方程对应的对偶方程。
本发明实施例提供的方法中,该对偶方程为:
i=1,...,l,m=1,2,...,μ,μ+1,...,2μ
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型,包括:
将所述训练数据集中的第一数据集合及所述第二数据集合,代入所述对偶方程中,以确定所述目标方程中各个参数的参数值;
将已确定参数值的所述目标方程封装为分类模型。
本发明实施例提供的方法中,将训练数据集合中的第一视角特征数据、第二视角特征数据及第三类无标签特征数据,输入至该对偶方程中,以对该对偶方程进行求解,得到目标方程的各个参数的参数值;并将已确定参数值的目标方程封装为与所述目标任务对应的分类模型。
本发明实施例提供的方法中,基于上述的实施过程,具体的,还包括:
应用所述分类模型对所述训练数据集进行分类,以得到所述分类模型的分类准确率;
将所述分类准确率与预先设置的分类准确率阈值进行比较,若所述分类准确率小于预设的分类准确率阈值,则应用所述训练数据集对所述分类模型进行训练。
本发明实施例提供的方法中,应用所述分类模型对所述训练数据集进行分类时,可以将分类结果与数据的标签进行比较,以确定分类模型的分类准确率。
本发明实施例提供的方法中,还可以通过设定一个具体的训练迭代次数,以应用该训练数据集对分类模型进行训练,直至训练的次数满足已设定的训练迭代次数。
本发明实施例提供的方法中,基于上述的实施过程,具体的,本发明实施例采用的训练数据集可以包括:PASCAL Visual Object Classes数据集、NUS-WIDE-OBJECT数据集、Handwritten Digit数据集、Image Segmentation Dataset。
其中,PASCAL Visual Object Classes数据集是一个对象图像数据集,包含9963幅真实世界的对象图像,分为20个类别,如人、鸟、自行车、椅子等,每个类有96到2008个图像,分为5011张训练图像和4952张测试图像。NUS-WIDE-OBJECT数据集是从这些图像中提取的六种低级特征,包括64-D颜色直方图,144-D颜色相关图,73-D边缘方向直方图,128-D小波纹理,225-D块颜色矩和SIFT基于500-D数据包。Handwritten Digit数据集包含具有手写数字“0”至“9”功能的数据集,手写体数字包含10个类别的2000幅图像,每个类别有200幅图像,每张图片都用二进制图像进行了数字表示。Image Segmentation Dataset是在户外7幅图像的数据库中随机抽取的对象图像数据集,由2310个随机选取的对象组成。
上述各个具体的实现方式,及各个实现方式的衍生过程,均在本发明保护范围内。
与图1所述的方法相对应,本发明实施例还提供了一种基于多视角学习的分类模型构建装置,用于对图1中方法的具体实现,本发明实施例提供的基于多视角学习的分类模型构建装置可以应用计算机终端或各种移动设备中,其结构示意图如图3所示,具体包括:
第一获取单元301,用于接到到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;
第二获取单元302,用于获取与所述模型构建指令对应的目标方程;
运算单元303,用于应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;
生成单元304,用于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。
本发明实施例提供的基于多视角学习的分类模型构建装置中,所述运算单元303,包括:
获取子单元,用于获取预先设置的各个拉格朗日乘子;
第一运算子单元,用于将所述拉格朗日乘子代入至所述目标方程中,以得到与所述目标方程对应的拉格朗日方程;
第二运算子单元,用于对所述拉格朗日方程中的各个参数进行求导,以得到各个所述参数的代数式;
第三运算子单元,用于将各个所述代数式代入至所述目标方程中,得到与所述目标方程对应的对偶方程。
本发明实施例提供的基于多视角学习的分类模型构建装置中,所述生成单元304,包括:
第四运算子单元,用于将所述训练数据集中的第一数据集合及所述第二数据集合,依次代入所述对偶方程中,以确定所述目标方程中各个参数的参数值;
封装子单元,用于将已确定参数值的所述目标方程封装为分类模型。
本发明实施例提供的基于多视角学习的分类模型构建装置中,还包括:
分类单元,用于应用所述分类模型对所述训练数据集进行分类,以得到所述分类模型的分类准确率;
训练单元,用于将所述分类准确率与预先设置的分类准确率阈值进行比较,若所述分类准确率小于预设的分类准确率阈值,则应用所述训练数据集对所述分类模型进行训练。
本发明实施例提供的基于多视角学习的分类模型构建装置,通过接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;获取与所述模型构建指令对应的目标方程;应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。本发明实施例提供的方法中,利用第一视角特征数据、第二视角特征数据以及第三类无标签特征数据构建分类模型,第三类无标签特征数据可以作为先验知识域将第一视角特征数据及第二视角特征数据进行划界,能够降低对多视角训练数据数量的依赖,提高分类模型的分类精度。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述基于多视角学习的分类模型构建方法。
本发明实施例还提供了一种电子设备,其结构示意图如图4所示,具体包括存储器401,以及一个或者一个以上的指令402,其中一个或者一个以上指令402存储于存储器401中,且经配置以由一个或者一个以上处理器403执行所述一个或者一个以上指令402进行以下操作:
接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;
获取与所述模型构建指令对应的目标方程;
应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;
基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上对本发明所提供的一种基于多视角学习的分类模型构建方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于多视角学习的分类模型构建方法,其特征在于,包括:
接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;所述携带正类标签的第一视角特征数据具体为第一类型图片样本中的64-D颜色直方图;所述携带负类标签的第二视角特征数据具体为第一类型图片样本中的SIFT基于500-D数据包;
获取与所述模型构建指令对应的目标方程,其中,所述目标方程为:
s.t.|(wA·φA(xi)+bA)-(wB·φB(xi)+bB)|≤ε+ηi;
其中,WA为第一视角特征数据对应的权重,bA为第一视角特征数据对应的阈值,WB为第二视角特征数据对应的权重,bB为第二视角特征数据对应的阈值;CA为第一惩罚参数,CB为第二惩罚参数,C为第三惩罚参数,D为第四惩罚参数;ηi(i=1,2,...,l),为松弛变量;
应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;
基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。
2.根据权利要求1所述的方法,其特征在于,所述训练数据集的存储过程,包括:
获取第一初始训练集及第二初始训练集;
调用第一特征提取模型分别对所述第一初始训练集中的各个样本数据进行特征提取,得到与各个所述样本数据对应的第一视角数据特征;
分别为各个所述第一视角特征数据分配正类标签,并在所述第二初始训练集中确定与各个第一视角特征数据对应的第三类无标签特征数据;
将每个已分配正类标签的第一特征数据及与其对应的第三类无标签特征数据组成第一视角数据组;
调用第二特征提取模型分别对所述第一初始训练集中的各个样本数据进行特征提取,得到与各个所述样本数据对应的第二视角特征数据;
分别为各个所述第一视角特征数据分配负类标签,并在所述第二初始训练集中确定与各个第二视角特征数据对应的第三类无标签特征数据;
将每个已分配负类标签的第二特征数据及与其对应的第三类无标签特征数据组成第二视角数据组;
依据各个所述第一视角数据组及各个所述第二视角数据组,得到训练数据集,并将所述训练数据集进行存储。
3.根据权利要求1所述的方法,其特征在于,所述训练数据集的存储过程,包括:
获取初始训练集,所述初始训练集包含正类数据集合、负类数据集合及第三类数据集合;
应用正类数据特征提取模型对所述正类数据集合中的各个正类数据进行特征提取,得到与各个所述正类数据对应的第一视角特征数据;
应用负类数据特征提取模型对所述负类数据集合中的各个负类数据进行特征提取,得到与各个所述负类数据对应的第二视角特征数据;
应用第三类数据特征提取模型对所述第三类数据集合中的各个第三类数据进行特征提取,得到与各个第三类数据的第三类无标签特征数据;
依据各个所述第一视角特征数据、各个所述第二视角特征数据及各个所述第三类无标签特征数据组成训练数据集,将所述训练数据集进行存储。
4.根据权利要求1所述的方法,其特征在于,所述应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程,包括:
获取预先设置的各个拉格朗日乘子;
将所述拉格朗日乘子代入至所述目标方程中,以得到与所述目标方程对应的拉格朗日方程;
对所述拉格朗日方程中的各个参数进行求导,以得到各个所述参数的代数式;
将各个所述代数式代入至所述目标方程中,得到与所述目标方程对应的对偶方程。
5.根据权利要求1所述的方法,其特征在于,所述基于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型,包括:
将所述训练数据集中的第一数据集合及所述第二数据集合,依次代入所述对偶方程中,以确定所述目标方程中各个参数的参数值;
将已确定参数值的所述目标方程封装为分类模型。
6.根据权利要求1所述的方法,其特征在于,还包括:
应用所述分类模型对所述训练数据集进行分类,以得到所述分类模型的分类准确率;
将所述分类准确率与预先设置的分类准确率阈值进行比较,若所述分类准确率小于预设的分类准确率阈值,则应用所述训练数据集对所述分类模型进行训练。
7.一种基于多视角学习的分类模型构建装置,其特征在于,包括:
第一获取单元,用于接收到模型构建指令时,获取预先存储的训练数据集,所述训练数据集包括第一数据集合及第二数据集合;所述第一数据集合包含多个第一视角数据组,所述第二数据集合包含多个第二视角数据组;所述第一视角数据组包括携带正类标签的第一视角特征数据,以及与所述第一视角特征数据对应的第三类无标签特征数据;所述第二视角数据组包括携带负类标签的第二视角特征数据,以及与所述第二视角特征数据对应的第三类无标签特征数据;所述携带正类标签的第一视角特征数据具体为第一类型图片样本中的64-D颜色直方图;所述携带负类标签的第二视角特征数据具体为第一类型图片样本中的SIFT基于500-D数据包;
第二获取单元,用于获取与所述模型构建指令对应的目标方程,其中,所述目标方程为:
s.t.|(wA·φA(xi)+bA)-(wB·φB(xi)+bB)|≤ε+ηi;
其中,WA为第一视角特征数据对应的权重,bA为第一视角特征数据对应的阈值,WB为第二视角特征数据对应的权重,bB为第二视角特征数据对应的阈值;CA为第一惩罚参数,CB为第二惩罚参数,C为第三惩罚参数,D为第四惩罚参数;ηi(i=1,2,...,l),为松弛变量;
运算单元,用于应用拉格朗日乘子法对所述目标方程进行计算,得到与所述目标方程对应的对偶方程;
生成单元,用于所述训练数据集对所述对偶方程进行求解,以得到与所述训练数据集对应的分类模型。
8.根据权利要求7所述的装置,其特征在于,所述运算单元,包括:
获取子单元,用于获取预先设置的各个拉格朗日乘子;
第一运算子单元,用于将所述拉格朗日乘子代入至所述目标方程中,以得到与所述目标方程对应的拉格朗日方程;
第二运算子单元,用于对所述拉格朗日方程中的各个参数进行求导,以得到各个所述参数的代数式;
第三运算子单元,用于将各个所述代数式代入至所述目标方程中,得到与所述目标方程对应的对偶方程。
9.根据权利要求7所述的装置,其特征在于,所述生成单元,包括:
第四运算子单元,用于将所述训练数据集中的第一数据集合及所述第二数据集合,依次代入所述对偶方程中,以确定所述目标方程中各个参数的参数值;
封装子单元,用于将已确定参数值的所述目标方程封装为分类模型。
10.根据权利要求7所述的装置,其特征在于,还包括:
分类单元,用于应用所述分类模型对所述训练数据集进行分类,以得到所述分类模型的分类准确率;
训练单元,用于将所述分类准确率与预先设置的分类准确率阈值进行比较,若所述分类准确率小于预设的分类准确率阈值,则应用所述训练数据集对所述分类模型进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910721187.7A CN110414623B (zh) | 2019-08-06 | 2019-08-06 | 基于多视角学习的分类模型构建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910721187.7A CN110414623B (zh) | 2019-08-06 | 2019-08-06 | 基于多视角学习的分类模型构建方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110414623A CN110414623A (zh) | 2019-11-05 |
CN110414623B true CN110414623B (zh) | 2022-06-24 |
Family
ID=68366070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910721187.7A Active CN110414623B (zh) | 2019-08-06 | 2019-08-06 | 基于多视角学习的分类模型构建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110414623B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203745A (zh) * | 2017-05-11 | 2017-09-26 | 天津大学 | 一种基于跨域学习的跨视角动作识别方法 |
CN108388907A (zh) * | 2017-12-29 | 2018-08-10 | 中国科学院自动化研究所 | 基于多视角学习的极化sar数据分类器实时更新方法 |
CN108776810A (zh) * | 2018-05-30 | 2018-11-09 | 华东理工大学 | 一种基于Universum学习的多经验核分类器 |
CN110008365A (zh) * | 2019-04-09 | 2019-07-12 | 广东工业大学 | 一种图像处理方法、装置、设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
-
2019
- 2019-08-06 CN CN201910721187.7A patent/CN110414623B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203745A (zh) * | 2017-05-11 | 2017-09-26 | 天津大学 | 一种基于跨域学习的跨视角动作识别方法 |
CN108388907A (zh) * | 2017-12-29 | 2018-08-10 | 中国科学院自动化研究所 | 基于多视角学习的极化sar数据分类器实时更新方法 |
CN108776810A (zh) * | 2018-05-30 | 2018-11-09 | 华东理工大学 | 一种基于Universum学习的多经验核分类器 |
CN110008365A (zh) * | 2019-04-09 | 2019-07-12 | 广东工业大学 | 一种图像处理方法、装置、设备及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
Multi-view dimensionality reduction based on Universum learning;XiaohongChen et al;《Neurocomputing》;20180131;2279-2286页 * |
基于Universum的多视角分类学习方法研究;刘文雯;《中国优秀硕士学位论文全文数据库信息科技辑》;20140615;第3章 * |
Also Published As
Publication number | Publication date |
---|---|
CN110414623A (zh) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6916383B2 (ja) | 画像質問応答方法、装置、システムおよび記憶媒体 | |
CN109816009B (zh) | 基于图卷积的多标签图像分类方法、装置及设备 | |
Bach et al. | On pixel-wise explanations for non-linear classifier decisions by layer-wise relevance propagation | |
CN110334759B (zh) | 一种评论驱动的深度序列推荐方法 | |
CN108399386A (zh) | 饼图中的信息提取方法及装置 | |
CN109359214A (zh) | 基于神经网络的视频描述生成方法、存储介质及终端设备 | |
CN115526259A (zh) | 一种多模态预训练模型的训练方法和装置 | |
CN111626362A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN107301643B (zh) | 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法 | |
CN113095333B (zh) | 无监督特征点检测方法及装置 | |
JP6107531B2 (ja) | 特徴抽出プログラム及び情報処理装置 | |
US20150131873A1 (en) | Exemplar-based feature weighting | |
CN113920516B (zh) | 一种基于孪生神经网络的书法字骨架匹配方法及系统 | |
CN110414622B (zh) | 基于半监督学习的分类器训练方法及装置 | |
CN112966685A (zh) | 用于场景文本识别的攻击网络训练方法、装置及相关设备 | |
CN110532562B (zh) | 神经网络训练方法、成语误用检测方法、装置和电子设备 | |
Bai et al. | Cross-domain representation learning by domain-migration generative adversarial network for sketch based image retrieval | |
CN109558882A (zh) | 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置 | |
CN116361502B (zh) | 一种图像检索方法、装置、计算机设备及存储介质 | |
CN110414623B (zh) | 基于多视角学习的分类模型构建方法及装置 | |
CN109063561B (zh) | 公式的识别计算方法和装置 | |
CN116977271A (zh) | 缺陷检测方法、模型训练方法、装置及电子设备 | |
CN115546813A (zh) | 一种文档分析方法、装置、存储介质及设备 | |
Shi et al. | Contour descriptor based on space symmetry and its matching technique | |
Loong et al. | Image‐based structural analysis for education purposes: A proof‐of‐concept study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |