CN107688822B - 基于深度学习的新增类别识别方法 - Google Patents
基于深度学习的新增类别识别方法 Download PDFInfo
- Publication number
- CN107688822B CN107688822B CN201710585350.2A CN201710585350A CN107688822B CN 107688822 B CN107688822 B CN 107688822B CN 201710585350 A CN201710585350 A CN 201710585350A CN 107688822 B CN107688822 B CN 107688822B
- Authority
- CN
- China
- Prior art keywords
- category
- sample image
- vector
- training sample
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于深度学习的新增类别识别方法,包括以下步骤:将预测样本输入到深度网络获得预测样本的输出向量;计算所述预测样本的输出向量,与训练样本中每种类别的代表向量之间的相似度值,从而识别所述预测样本的类别;其中,所述训练样本中每种类别的代表向量是通过将所述训练样本集输入到深度网络获得输出向量集,并根据所述训练样本的输出向量集计算得出的。
Description
技术领域
本发明涉及机器学习技术领域,特别涉及一种基于深度学习的新增类别识别方法。
背景技术
深度学习作为一种新型的机器学习方法,由于其对与时空域关联的样本数据具有很好的识别效果,例如,图像、音频、文本等,且对样本数据平移变形等变换具有一定的鲁棒性,使得其识别精度明显优于经典的机器学习方法,因此一提出即得到广泛应用。
深度学习尽管具有明显的识别精度优势,但在训练阶段的复杂度却高于SVM等经典的机器学习方法。因此,如何针对特定问题,学习得到最优网络模型,并且使该网络模型适用于普适的网络结构是一个难题。例如,传统机器学习的预测样本和训练样本,通常满足严格的独立同分布假设,并且预测样本的类别结果一定是训练样本所属类别的一种,但是,在实际的识别问题中,预测样本的类别有可能是训练样本之外的,对于这种类别增加的问题,现有的深度学习可以采用如下两种方式解决:
第一种方式是参考训练样本非均衡的处理方式,在设计网络结构时,在网络的最后一层增加“新增类别”输出。但是由于没有属于新增类别的训练样本,在训练阶段生成网络模型时,对新增类别的网络参数并不能有效更新,其新增类别输出从未被激活。所以在预测阶段,属于新增类别的预测样本很难激活新增类别输出。
第二种方式是采用预处理的方式,例如,属于异常检测方法的支持向量描述算法(SVDD)。在训练阶段,首先将所有现有类别的训练样本作为正常类别,其次利用这一正常类别的样本数据训练得到SVDD模型,然后使用普通的深度学习训练整个样本数据得到网络模型。在预测阶段,根据SVDD模型判断预测样本是否正常,如果预测样本被识别为异常样本,直接认定为新增类别,否则再利用普通的深度学习进行识别。这种方式的主要缺点存在于异常检测阶段精度较低,尤其是处理具有时空相关性的数据,例如图像、语音、文本、自然语言处理等。
因此,目前需要一种识别精度高,普适性好的新增类别识别方法。
发明内容
本发明的目的是提供一种基于深度学习的新增类别识别方法,该方法能够克服上述现有技术的缺陷,具体包括以下步骤:
步骤1)、将预测样本集输入到深度网络获得预测样本的输出向量;
步骤2)、计算所述预测样本的输出向量,与训练样本中每种类别的代表向量之间的相似度值,从而识别所述预测样本的类别;
其中,所述训练样本中每种类别的代表向量是通过将所述训练样本集输入到所述深度网络获得输出向量集,并根据所述训练样本的输出向量集计算得出的。
优选的,在计算所述训练样本中每种类别的代表向量时,仅针对所述训练样本集中类别确定的训练样本进行计算。
优选的,计算所述训练样本中每种类别的代表向量包括以下步骤:
对所述训练样本的输出向量进行零值归一化,获得所述训练样本的归一化输出向量;
利用所述训练样本的归一化输出向量计算获得输出向量的单边均值向量和单边方差向量;
利用所述单边均值向量和所述单边方差向量计算获得所述训练样本的每种类别的代表向量。
优选的,所述步骤1)进一步包括:对所述预测样本的输出向量进行零值归一化,获得所述预测样本的归一化输出向量。
优选的,所述步骤2)进一步包括:计算所述预测样本的归一化输出向量与所述训练样本的每种类别的代表向量之间的相似度值。
优选的,取所述最小相似度值对应的所述训练样本的类别为所述预测样本的类别识别结果。
优选的,当所述最小相似度值大于预定的阈值时,将所述相似度值对应的预测样本的类别识别为相对于所述训练样本集新增的类别。
优选的,将获得的所有属于新增类别的所述预测样本组成新增类别样本集,通过聚类方式区分不同类型的新增类别。
根据本发明的另一方面,提供一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器运行所述程序时执行如上所述的步骤。
根据本发明的另一个方面,提供一种计算机可读存储介质,包括存储在所述可读存储介质上的计算机程序,其中,所述程序执行如上所述的步骤。
相对于现有技术,本发明取得了如下有益技术效果:本发明提供的基于深度学习的新增类别识别方法,在训练阶段,利用单边均值/方差等算法,仅针对训练样本中的确定样本计算代表向量,与传统的机器学习方法相比,不仅保证了预测阶段的查全率和查准率,并且提高了整体的识别精度;另外,在预测阶段,通过比对预测样本与训练阶段计算得到的代表向量之间的相似度,识别出预测样本是否为新增类别,利用本发明提供的识别方法,不仅能够识别出属于具有新增类别的预测样本,还能够进一步应用于其它算法,例如聚类,具有很好的普遍适用性。
附图说明
图1是本发明提供的识别方法的训练阶段流程图。
图2是本发明提供的识别方法的预测阶段流程图。
具体实施方式
为了使本发明的目的、技术方案以及优点更加清楚明白,以下结合附图,对根据本发明的实施例中提供的基于深度学习的新增类别识别方法进行说明。
一般来说,机器学习(包括深度学习)可以分为监督学习,非监督学习和半监督学习三种类型。其中,监督学习是指所有训练样本的类别均是已标记的,机器学习的目的是判定预测样本的类别,结果必然属于现有类别;非监督学习是指所有训练样本的类别均是未标记的,非监督学习的目的是对训练样本进行聚类,进一步判定预测样本的类别和哪些训练样本的类别最相似;半监督学习中的训练样本的类别,有的是已标记的,有的是未标记的,对于未标记的训练样本,其类别属于现有类别的一种,半监督学习的目的是判定预测样本的类别,结果也是属于现有类别。综上所述,传统的机器学习,其预测样本的类别结果一定是训练样本所属类别的一种。
但是,在实际的识别问题中,预测样本的类别有可能是训练样本之外的,例如对于图片识别,假设训练样本图片中仅包括三种动物:“老虎”,“大象”和“狮子”,当对一张“狐狸”的预测样本进行分类时,传统的机器学习算法会将其判定为训练样本中的三种动物之一,而这显然是不正确的。为了解决上述问题,发明人经研究提出了一种训练模型及预测方法,能够识别预测样本中相对于训练样本新增的样本类别。
在本发明的一个实施例中,提供一种基于深度学习的新增类别识别方法,该方法,包括以下步骤:
S10.训练阶段
图1是本发明提供的识别方法的训练阶段流程图,如图1所示,在训练阶段,首先需要构建训练样本中每种类别的代表向量(100)。例如,训练样本集为X,该训练样本集X中每个样本xi的标记类别cj组成了类别集C,其中,样本xi∈X,i=1,2......N,N表示样本的总数,类别cj∈C,j=1,2......M,M表示类别的合成总数;将训练样本集X中每个样本xi分别输入已有的深度网络f(x)(101),获得样本的类别输出向量yi(102),其中yi=f(xi)∈C。
假设和分别表示类别向量cj和输出向量yi的第d维分量,将和进行零值归一化,得到向量和若则表示对应向量代表了第d种类别。如果类别向量cj和输出向量yi中有多个分量为正,则说明该向量代表多种类别。设定和的范围是和的范围是(-r,r),则可得到零值归一化公式如下:
S20.预测阶段
图2是本发明提供的识别方法的预测阶段流程图,如图2所示,在判定预测样本(200)的类别阶段,可以利用已有深度网络(201)获得预测样本xk的输出向量yk(202),进一步计算归一化输出向量与步骤S10获得的每种类别cj的代表向量zj之间的相似度进而判定预测样本的类别是否属于新增类别或者属于现有哪个类别。其中,相似度可以采用常规类型的定义,例如曼哈顿距离,欧氏距离,切比雪夫距离,余弦夹角,马氏距离等。
例如,可以定义输出向量yk和输出向量yi的相似度S(yk,yi)为:
其中,等式右侧,加号前的部分表示的是:将yk不识别为yi所属类别的惩罚;加号后的部分表示的是:将yk识别为yi非所属类别的惩罚;参数α是折中系数,当S(yk,yi)数值越小时,对应样本xk与样本xi越相似。
例如,根据步骤S10,将训练样本集输入已有深度网络得到训练样本的输出向量集,并利用获得的输出向量计算出每种类别的代表向量。假设训练样本集中共有A、B、C、D、E、F、G、H、I九种类型,利用本发明提供的计算方法获得的代表向量分别是:
A(1,0,0,0,0,0,0,0,0);
B(0,1,0,0,0,0,0,0,0);
C(0,0,1,0,0,0,0,0,0);
D(0,0,0,1,0,0,0,0,0);
E(0,0,0,0,1,0,0,0,0);
F(0,0,0,0,0,1,0,0,0);
G(0,0,0,0,0,0,1,0,0);
H(0,0,0,0,0,0,0,1,0);
I(0,0,0,0,0,0,0,0,1)。
假设利用已有深度网络得到的某一预测样本的归一化输出向量为:
(0.1,0.2,-0.1,-0.3,0,0.9,-0.8,0.3,0.1)
利用上述相似度计算公式可计算得到该预测样本的输出向量与A-I各训练样本类型的相似度分别为:
2.4,2.2,2.7,2.9,2.6,0.8,3.4,2.0,2.4
由此可知,该预测样本与类型F最相似。
在本发明的另一个实施例中,上述相似度计算公式中的折中系数α可依据经验设定,特别的,当折中系数α的取值使得等式右侧的加号前后两部分惩罚保持平衡时,此时的折中系数α的取值为最优。
在进行判定时,可以设置一个阈值t,以便判定预测样本xk的归一化输出向量与训练样本的每种类别cj的代表向量zj之间的相似度如果满足则判定预测样本xk的类别属于类别cj,且最小时所对应的类别为主类别;如果对于所有类别均满足则判定预测样本xk的类别属于新增类别。
例如,在使用卷积网络进行手写数字识别时,可以应用本发明提供的方法对新增类别进行识别。已知手写体数据集MNIST,该数据集包含10类共6万个训练样本和1万个测试样本,分别对应于数字0-9,每个样本数据为28×28的灰度图像(详见“http://yann.lecun.com/exdb/mnist/”)。
将MNIST训练数据集中的前9类数据,即对应于数字0-8的图像作为训练数据,测试数据集中的所有10类数据,即对应于数字0-9的图像作为测试数据。假设配置参数为:折中系数α=1,阈值t=1.2,零值归一化后的类别向量和输出向量每维的范围是(-0.8,0.8),根据本发明提供的方法,可获得识别结果如表1所示:
表1利用本发明提供的识别方法识别手写数字的识别结果
其中,查准率表示的是:所有预测结果中真实结果所占的比例;查全率表示的是:所有真实结果中预测结果正确所占的比例。
例如,针对训练样本和预测样本都包含的数字0,预测样本中共计有真实结果980个,利用本发明提供的识别方法识别出的结果显示,其中有965个识别正确,其余15个被识别为其它数字,查全率为98.47%;同时共计输出981个数字0的预测结果,其中包含965个真实结果,其余16个误将其它数字识别为数字0,查准率为98.37%。与利用传统的机器学习相比,利用本发明提供的识别方法识别出的查全率相当,查准率更加优秀;
针对相对于训练样本,预测样本中新增的类别数字9,预测样本中共计有真实结果1009个,利用本发明提供的识别方法识别出的结果显示,其中有934个识别正确,其余75个被识别为其它数字,查全率为92.57%;同时共计输出1080个数字9的预测结果,其中包含934个真实结果,其余146个误将其它数字识别为数字9,查准率为86.48%。与利用传统的机器学习相比,利用本发明提供的识别方法不仅能够将新增类别数字9单独识别出,其查全率和查准率都达到了相当高的水平,从而提高整体的识别精度。
尽管在上述实施例中,以一种类型新增类别,如数字9,为例对本发明提供的基于深度学习的新增类别识别方法进行了说明,但是本领域普通技术人员应当理解,在其他实施例中,本发明提供的识别方法同样适用于对包含有多种新增类别的预测样本的识别,当识别结果为新增类别的预测样本足够多时,可针对上述识别结果为新增类别的每个预测样本,计算预测样本xk的归一化输出向量对所有的归一化输出向量进行聚类,即无监督学习,其中,聚类方式可以使用现有成熟算法,例如K均值、高斯混合聚类、层次聚类,进而可以区分出不同类型的新增类别。
相对于现有技术,在本发明实施例中所提供的基于深度学习的新增类别识别方法,在训练阶段,将训练样本作为输入,利用已有深度网络,获得判定结果正确的输出向量集,根据训练样本的输出向量集计算出每种类别的代表向量;在测试阶段,将每个测试样本输入已有深度网络得到预测样本的输出向量,通过计算预测样本的输出向量和每种类别的代表向量的相似度来识别预测样本相对于训练样本是否为新增类别。与传统的机器学习相比,本发明提供的方法不仅能够与已有深度网络结合,且具有较高的查全率和查准率。
虽然本发明已经通过优选实施例进行了描述,然而本发明并非局限于这里所描述的实施例,在不脱离本发明范围的情况下还包括所作出的各种改变以及变化。
Claims (7)
1.一种面向图像识别的新增类别识别方法,包括以下步骤:
步骤1)、将预测样本图像输入到已有深度网络获得预测样本图像的输出向量,对所述预测样本图像的输出向量进行零值归一化,获得所述预测样本图像的归一化输出向量;
步骤2)、计算所述预测样本图像的归一化输出向量与训练样本图像中每种类别的代表向量之间的相似度值,从而识别所述预测样本图像的类别;
其中,所述训练样本中每种类别的代表向量是通过将所述训练样本图像集输入到所述已有深度网络获得输出向量集,并根据所述训练样本图像的输出向量集计算得出的,包括:对所述训练样本图像的输出向量进行零值归一化,获得所述训练样本图像的归一化输出向量;利用所述训练样本图像的归一化输出向量计算获得输出向量的单边均值向量和单边方差向量;利用所述单边均值向量和所述单边方差向量计算获得所述训练样本图像的每种类别的代表向量。
2.根据权利要求1所述的新增类别识别方法,在计算所述训练样本图像中每种类别的代表向量时,仅针对所述训练样本图像集中类别正确的训练样本图像进行计算。
3.根据权利要求1至2任一项所述的新增类别识别方法,取所述最小相似度值对应的所述训练样本图像的类别为所述预测样本图像的类别识别结果。
4.根据权利要求1至2任一项所述的新增类别识别方法,当所述最小相似度值大于预定的阈值时,将所述相似度值对应的预测样本图像的类别识别为相对于所述训练样本图像集新增的类别。
5.根据权利要求4所述的新增类别识别方法,将获得的所有属于新增类别的所述预测样本图像组成新增类别样本图像集,通过聚类方式区分不同类型的新增类别。
6.一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器运行所述程序时执行如权利要求1至5所述的步骤。
7.一种计算机可读存储介质,包括存储在所述可读存储介质上的计算机程序,其中,所述程序执行如权利要求1至5所述的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710585350.2A CN107688822B (zh) | 2017-07-18 | 2017-07-18 | 基于深度学习的新增类别识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710585350.2A CN107688822B (zh) | 2017-07-18 | 2017-07-18 | 基于深度学习的新增类别识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107688822A CN107688822A (zh) | 2018-02-13 |
CN107688822B true CN107688822B (zh) | 2021-07-20 |
Family
ID=61152857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710585350.2A Active CN107688822B (zh) | 2017-07-18 | 2017-07-18 | 基于深度学习的新增类别识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107688822B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657947B (zh) * | 2018-12-06 | 2021-03-16 | 西安交通大学 | 一种面向企业行业分类的异常检测方法 |
CN109934302B (zh) * | 2019-03-23 | 2021-12-07 | 大国创新智能科技(东莞)有限公司 | 新类别识别方法和基于模糊理论和深度学习的机器人系统 |
CN110570469B (zh) * | 2019-08-16 | 2020-08-25 | 广州威尔森信息科技有限公司 | 一种汽车图片角度位置的智能识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9342657B2 (en) * | 2003-03-24 | 2016-05-17 | Nien-Chih Wei | Methods for predicting an individual's clinical treatment outcome from sampling a group of patient's biological profiles |
CN102411687B (zh) * | 2011-11-22 | 2014-04-23 | 华北电力大学 | 未知恶意代码的深度学习检测方法 |
CN105512679A (zh) * | 2015-12-02 | 2016-04-20 | 天津大学 | 一种基于极限学习机的零样本分类方法 |
-
2017
- 2017-07-18 CN CN201710585350.2A patent/CN107688822B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107688822A (zh) | 2018-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11816888B2 (en) | Accurate tag relevance prediction for image search | |
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
US10235623B2 (en) | Accurate tag relevance prediction for image search | |
EP3582150A1 (en) | Method of knowledge transferring, information processing apparatus and storage medium | |
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
CN112070138B (zh) | 多标签混合分类模型的构建方法、新闻分类方法及系统 | |
CN111444342B (zh) | 一种基于多重弱监督集成的短文本分类方法 | |
CN116629275B (zh) | 一种基于大数据的智能决策支持系统及方法 | |
CN107688822B (zh) | 基于深度学习的新增类别识别方法 | |
Escalera et al. | Boosted Landmarks of Contextual Descriptors and Forest-ECOC: A novel framework to detect and classify objects in cluttered scenes | |
CN113723070B (zh) | 文本相似度模型训练方法、文本相似度检测方法及装置 | |
CN116127953B (zh) | 一种基于对比学习的中文拼写纠错方法、装置和介质 | |
US20170039451A1 (en) | Classification dictionary learning system, classification dictionary learning method and recording medium | |
CN117197904A (zh) | 人脸活体检测模型的训练方法、人脸活体检测方法及装置 | |
CN110348516B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN114495113A (zh) | 文本分类方法和文本分类模型的训练方法、装置 | |
CN117315263B (zh) | 一种目标轮廓装置、训练方法、分割方法、电子设备及存储介质 | |
CN116910571B (zh) | 一种基于原型对比学习的开集域适应方法及系统 | |
CN112613293B (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
US11663269B2 (en) | Error correction method and apparatus, and computer readable medium | |
CN116541704A (zh) | 一种多类噪声分离的偏标记学习方法 | |
CN111709475A (zh) | 一种基于N-grams的多标签分类方法及装置 | |
CN111177403A (zh) | 样本数据的处理方法和装置 | |
CN107993311B (zh) | 一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法 | |
CN110750712A (zh) | 基于数据驱动的软件安全需求推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |