CN107067027B - 一种基于光滑多示例学习的目标识别方法 - Google Patents
一种基于光滑多示例学习的目标识别方法 Download PDFInfo
- Publication number
- CN107067027B CN107067027B CN201710135040.0A CN201710135040A CN107067027B CN 107067027 B CN107067027 B CN 107067027B CN 201710135040 A CN201710135040 A CN 201710135040A CN 107067027 B CN107067027 B CN 107067027B
- Authority
- CN
- China
- Prior art keywords
- training
- picture
- detected
- probability model
- continuous probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 103
- 238000009499 grossing Methods 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000013095 identification testing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于光滑多示例学习的目标识别方法,包括样本训练步骤和目标识别步骤,样本训练步骤为:提取训练图片的示例特征;根据示例特征,进行光滑处理得到示例相关的连续概率模型;根据示例相关的连续概率模型进行训练,得到训练权重w;目标识别步骤为:提取待检测图片的示例特征;根据待检测图片的示例特征和训练权重,计算确定待检测图片中是否存在需要识别的目标。与现有技术相比,本发明具有识别效率高、识别准确率高以及识别效果好等优点。
Description
技术领域
本发明涉及图像识别领域,尤其是涉及一种基于光滑多示例学习的目标识别方法。
背景技术
多示例学习是1997年由Dietterich等人提出来的,当时主要用在药物活性预测上面。在那之后由于多示例学习在机器学习和机器视觉上的广泛应用,大量的多示例学习方法被提了出来。1998年DD(Diverse Density)被提出来,这种方法通过在许多不同正包和少量负包中寻找区块的方式来处理多示例学习问题,之后此方法又被发展成DD-SVM。2002年和2005年有S.Andrews和C.Zhang等人分别提出了miSVM和MILBoost方法,他们通过训练SVM和boosting分类器进行示例分类。最近2015年J.Wu等人建立了一个深度学习框架和用Bag-of-word模型来解决大规模的多示例学习问题。
目前,通过多示例学习来进行图像中目标识别的方法主要有以下三种:
(1)有监督的图像目标识别严重依赖于人工的参与,需要人工对图像是否含有目标物体进行标记,还要对含有物体的图片中物体的位置进行标记。在样本量很大的情况下,这是非常费时费力的,还有一定的局限性。
(2)并不是所有的多示例学习方法都可以识别一个包中示例的标签,有些多示例学习方法只对包级别样本进行了分类。
(3)在传统的多示例学习方法中,用来在正样本中定位目标物体的检测器是同过同一个样本训练得到的,这使得在同一个窗口进行重定位时产生偏重。
以上三种方法由于自身的缺陷都未能得到很好的识别效果。
发明内容
本发明的目的是针对上述问题提供一种基于光滑多示例学习的目标识别方法。
本发明的目的可以通过以下技术方案来实现:
一种基于光滑多示例学习的目标识别方法,所述方法包括样本训练步骤和目标识别步骤,所述样本训练步骤具体为:
A1)提取训练图片的示例特征;
A2)根据步骤A1)提取的示例特征,进行光滑处理得到示例相关的连续概率模型;
A3)根据步骤A2)得到的示例相关的连续概率模型进行训练,得到训练权重w;
所述目标识别步骤具体为:
B1)提取待检测图片的示例特征;
B2)根据步骤B1)得到的待检测图片的示例特征和步骤A3)得到的训练权重,计算确定待检测图片中是否存在需要识别的目标。
所述步骤A1)具体为:
A11)以每张训练图片作为一个训练包,产生与每一个训练包相对应的示例;
A12)对步骤A11)产生的所有示例进行特征提取,得到每一个示例的特征值xij。
所述特征提取包括颜色特征提取、形状特征提取和纹理特征提取。
所述步骤A2)具体为:
A21)根据步骤A1)得到的示例特征,计算得到每一个示例的标签的连续概率模型pij;
A22)根据步骤A21)得到的每一个示例的标签的连续概率模型pij,计算得到每一个训练图片的连续概率模型Pi。
所述每一个示例的标签的连续概率模型pij具体为:
pij=Pr(yij=1|xij;w)=Φ(wTxij)
其中,yij为第i个图片中的第j个示例。
所述每一个训练图片的连续概率模型Pi具体为:
其中,mi为第i张图片包含的示例总量。
所述根据步骤A2)得到的示例相关的连续概率模型进行训练的目标函数具体为:
其中,pij为每一个示例的标签的连续概率模型,Pi为每一个训练图片的连续概率模型,xij为每一个示例的特征值,p为界定示例正负的阈值,m为SVM模型边缘值,mi为第i张图片包含的示例总量,n为此次训练所用的样本数,Yi为第i个图片的标签,β和λ为调整参数。
所述步骤A3)包括通过多折样本训练对训练权重w进行优化,具体为:
A31)将训练图片中的正示例集随机分成K折训练集,对K折训练集进行遍历;
A32)每次进行训练时,选取其中第k折以外的训练集进行训练,得到与之对应的训练权重;
A33)将步骤A32)中得到的所有训练权重求取平均值,作为优化后的训练权重。
所述步骤B2)具体为:
B21)根据步骤B1)得到的示例特征和步骤A3)得到的训练权重,计算得到待检测图片中每一个示例的标签的连续概率模型pij';
B22)根据步骤B21)得到的每一个示例的标签的连续概率模型pij',计算得到待检测图片的连续概率模型Pi';
B23)判断待检测图片的连续概率模型Pi'是否为正,若是则表明待检测图片中存在目标,否则表明待检测图片中不存在目标;
B24)对于存在目标的待检测图片,选取B22)中连续概率模型pij'值最大所对应的示例,即为待检测图片中的目标位置。
所述待检测图片中每一个示例的标签的连续概率模型pij'和待检测图片的连续概率模型Pi'的求取方法与样本训练步骤中的方法相同。
与现有技术相比,本发明具有以下有益效果:
(1)通过对提取的图片的示例特征进行光滑处理从而得到示例相关的连续概率模型,继而将问题转化为连续的分类识别问题,便于后续的训练和目标识别。
(2)进行示例提取时,本发明采用了Edgebox的方法,简单易行,同时保证了提取速度。
(3)在训练得到了训练权重后,还通过多折样本训练对训练权重进行了优化,通过这种方式,重新定位确定检测时使用的样本不是训练时使用的样本,很好的防止了过早的锁定在错误的物体上。
(4)本方法中对每一个训练包中的所有示例标签都进行了训练,而非只是在包级别进行样本训练,训练更加准确,从而使得识别的效果更好。
(5)本方法可以实现对目标的全自动识别,无需人工参与和标记,识别耗时短且效率高。
(6)本方法既可以进行对待检测图片中是否存在目标进行识别,同时也可以确定目标在待检测图片中的位置,实用性能强。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
基于光滑多示例学习的目标识别方法的流程图如图1所示。该方法包括样本训练步骤和目标识别步骤,样本训练步骤具体为:
A1)提取训练图片的示例特征:
A11)以每张训练图片作为一个训练包,通过Edgebox产生与每一个训练包相对应的示例;
A12)对步骤A11)产生的所有示例进行特征提取,得到每一个示例的特征值xij;
A2)根据步骤A1)提取的示例特征,进行光滑处理得到示例相关的连续概率模型:
A21)根据步骤A1)得到的示例特征,计算得到每一个示例的标签的连续概率模型pij,具体为:
pij=Pr(yij=1|xij;w)=Φ(wTxij);
其中,yij为第i个图片中的第j个示例;
A22)根据步骤A21)得到的每一个示例的标签的连续概率模型pij,计算得到每一个训练图片的连续概率模型Pi:
其中,mi为第i张图片包含的示例总量;
A3)根据步骤A2)得到的示例相关的连续概率模型进行训练,得到训练权重w,其中根据步骤A2)得到的示例相关的连续概率模型进行训练的目标函数具体为:
其中,pij为每一个示例的标签的连续概率模型,Pi为每一个训练图片的连续概率模型,xij为每一个示例的特征值,p为界定示例正负的阈值,m为SVM模型边缘值,mi为第i张图片包含的示例总量,n为此次训练所用的样本数,Yi为第i个图片的标签,β和λ为调整参数;
步骤A3)可以通过多折样本训练对训练权重w进行优化,具体为:
A31)将训练图片中的正示例集随机分成K折训练集,对K折训练集进行遍历;
A32)每次进行训练时,选取其中第k折以外的训练集进行训练,得到与之对应的训练权重;
A33)将步骤A32)中得到的所有训练权重求取平均值,作为优化后的训练权重;
目标识别步骤具体为:
B1)提取待检测图片的示例特征;
B2)根据步骤B1)得到的待检测图片的示例特征和步骤A3)得到的训练权重,计算确定待检测图片中是否存在需要识别的目标,具体为:
B21)根据步骤B1)得到的示例特征,计算得到待检测图片中每一个示例的标签的连续概率模型pij';
B22)根据步骤B21)得到的每一个示例的标签的连续概率模型pij',计算得到待检测图片的连续概率模型Pi';
B23)判断待检测图片的连续概率模型Pi'是否为正,若是则表明待检测图片中存在目标,否则表明待检测图片中不存在目标,其中,待检测图片中每一个示例的标签的连续概率模型pij'和待检测图片的连续概率模型Pi'的求取方法与样本训练步骤中的方法相同;
B24)对于存在目标的待检测图片,选取B22)中连续概率模型pij'值最大所对应的示例,即为待检测图片中的目标位置。
根据上述步骤进行具体的目标识别试验,过程为:
(1)采用Edgebox技术产生多示例学习中的示例集合,一张图片作为一个包,每一个Edgebox产生的框作为一个示例。
(2)对图片进行预处理,并提取每个示例的颜色、形状、纹理等特征作为示例特征。
(3)示例标签的概率模型通过Probit模型给出:pij=Pr(yij=1|xij;w)=Φ(wTxij),包的概率模型通过Softmax模型给出:根据以上两个公式和考虑到示例级别和报级别的损失得到目标函数: 其中,pij为每一个示例的标签的连续概率模型,Pi为每一个训练图片的连续概率模型,xij为每一个示例的特征值,p为界定示例正负的阈值,m为SVM模型边缘值,mi为第i张图片包含的示例总量,n为此次训练所用的样本数,Yi为第i个图片的标签,β和λ为调整参数,Pr为分布函数,Φ为轭数。
(4)通过光滑方法把离散的多示例分类识别问题转换为连续的分类识别问题的,示例的光滑模型在(3)中通过Probit模型给出,包的光滑模型在(3)中通过Softmax模型进行定义,最后得到了(3)中的目标函数。转换为连续问题后就可以对目标函数利用梯度下降等方法求得最小值,进一步求解这个问题。
(5)通过多折的样本训练方法进行样本训练。把训练集中的正包随机分成K折,遍历这K折训练集,每次训练时使用第K折以外的正包进行训练,使用训练好的w在第K折上利用(3)中的目标函数确定检测目标,迭代若干次,具体迭代次数由经验确定。最后再用每一份中的正窗口来训练最终的检测器。
在Pascal06和Pascal07这两个数据集上的实验结果的CorLoc值如下表,CorLoc即为本方法所提供的目标位置窗口与物体精确位置标记窗口重叠面积大于50%的数量/所有目标定位次数。经过大量的实验证明,由下表可知,本实施例中提出的方法与其他常见多示例目标定位方法相比具有更好的准确率。:
表1.结果分析
数据集 | 本发明 | bMCL | ADMM | MIForest |
Pascal06 | 54 | 45 | 43 | 36 |
Pascal07 | 38 | 31 | 27 | 25 |
Claims (9)
1.一种基于光滑多示例学习的目标识别方法,其特征在于,所述方法包括样本训练步骤和目标识别步骤,所述样本训练步骤具体为:
A1)提取训练图片的示例特征,
A2)根据步骤A1)提取的示例特征,进行光滑处理得到示例相关的连续概率模型,
A3)根据步骤A2)得到的示例相关的连续概率模型进行训练,得到训练权重w,
所述目标识别步骤具体为:
B1)提取待检测图片的示例特征,
B2)根据步骤B1)得到的待检测图片的示例特征和步骤A3)得到的训练权重,计算确定待检测图片中是否存在需要识别的目标;
所述根据步骤A2)得到的示例相关的连续概率模型进行训练的目标函数具体为:
其中,pij为每一个示例的标签的连续概率模型,Pi为每一个训练图片的连续概率模型,xij为每一个示例的特征值,p为界定示例正负的阈值,m为SVM模型边缘值,mi为第i张图片包含的示例总量,n为此次训练所用的样本数,Yi为第i个图片的标签,β和λ为调整参数。
2.根据权利要求1所述的基于光滑多示例学习的目标识别方法,其特征在于,所述步骤A1)具体为:
A11)以每张训练图片作为一个训练包,产生与每一个训练包相对应的示例;
A12)对步骤A11)产生的所有示例进行特征提取,得到每一个示例的特征值xij。
3.根据权利要求2所述的基于光滑多示例学习的目标识别方法,其特征在于,所述特征提取包括颜色特征提取、形状特征提取和纹理特征提取。
4.根据权利要求3所述的基于光滑多示例学习的目标识别方法,其特征在于,所述步骤A2)具体为:
A21)根据步骤A1)得到的示例特征,计算得到每一个示例的标签的连续概率模型pij;
A22)根据步骤A21)得到的每一个示例的标签的连续概率模型pij,计算得到每一个训练图片的连续概率模型Pi。
5.根据权利要求4所述的基于光滑多示例学习的目标识别方法,其特征在于,所述每一个示例的标签的连续概率模型pij具体为:
pij=Pr(yij=1|xij;w)=Φ(wTxij)
其中,yij为第i个图片中的第j个示例。
7.根据权利要求1所述的基于光滑多示例学习的目标识别方法,其特征在于,所述步骤A3)包括通过多折样本训练对训练权重w进行优化,具体为:
A31)将训练图片中的正示例集随机分成K折训练集,对K折训练集进行遍历;
A32)每次进行训练时,选取其中第k折以外的训练集进行训练,得到与之对应的训练权重;
A33)将步骤A32)中得到的所有训练权重求取平均值,作为优化后的训练权重。
8.根据权利要求1所述的基于光滑多示例学习的目标识别方法,其特征在于,所述步骤B2)具体为:
B21)根据步骤B1)得到的示例特征和步骤A3)得到的训练权重,计算得到待检测图片中每一个示例的标签的连续概率模型pij';
B22)根据步骤B21)得到的每一个示例的标签的连续概率模型pij',计算得到待检测图片的连续概率模型Pi';
B23)判断待检测图片的连续概率模型Pi'是否为正,若是则表明待检测图片中存在目标,否则表明待检测图片中不存在目标;
B24)对于存在目标的待检测图片,选取B22)中连续概率模型pij'值最大所对应的示例,即为待检测图片中的目标位置。
9.根据权利要求8所述的基于光滑多示例学习的目标识别方法,其特征在于,所述待检测图片中每一个示例的标签的连续概率模型pij'和待检测图片的连续概率模型Pi'的求取方法与样本训练步骤中的方法相同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710135040.0A CN107067027B (zh) | 2017-03-08 | 2017-03-08 | 一种基于光滑多示例学习的目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710135040.0A CN107067027B (zh) | 2017-03-08 | 2017-03-08 | 一种基于光滑多示例学习的目标识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107067027A CN107067027A (zh) | 2017-08-18 |
CN107067027B true CN107067027B (zh) | 2020-06-23 |
Family
ID=59621549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710135040.0A Expired - Fee Related CN107067027B (zh) | 2017-03-08 | 2017-03-08 | 一种基于光滑多示例学习的目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107067027B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109767457B (zh) * | 2019-01-10 | 2021-01-26 | 厦门理工学院 | 在线多示例学习目标跟踪方法、终端设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324940A (zh) * | 2013-05-02 | 2013-09-25 | 广东工业大学 | 基于多示例多标签学习的皮肤病理图片特征识别方法 |
CN105512635A (zh) * | 2015-12-15 | 2016-04-20 | 鲁东大学 | 一种融合类别属性的深度网络地下目标识别方法及系统 |
CN105590102A (zh) * | 2015-12-30 | 2016-05-18 | 中通服公众信息产业股份有限公司 | 一种基于深度学习的前车车脸识别方法 |
-
2017
- 2017-03-08 CN CN201710135040.0A patent/CN107067027B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324940A (zh) * | 2013-05-02 | 2013-09-25 | 广东工业大学 | 基于多示例多标签学习的皮肤病理图片特征识别方法 |
CN105512635A (zh) * | 2015-12-15 | 2016-04-20 | 鲁东大学 | 一种融合类别属性的深度网络地下目标识别方法及系统 |
CN105590102A (zh) * | 2015-12-30 | 2016-05-18 | 中通服公众信息产业股份有限公司 | 一种基于深度学习的前车车脸识别方法 |
Non-Patent Citations (3)
Title |
---|
Supervised versus Multiple Instance Learning:An Empirical Comparison;Soumya Ray等;《Proceedings of the 22nd International Conference on Machine Learning》;20051231;第699页右栏第2段,第702页左栏第2段 * |
基于K折交叉验证的选择性集成分类算法;胡局新等;《科技通报》;20131231;第29卷(第12期);第2节第1段 * |
基于Logistic回归模型和凝聚函数的多示例学习算法;贺建军等;《大连理工大学学报》;20100930;第50卷(第5期);第788-793页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107067027A (zh) | 2017-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110543837B (zh) | 一种基于潜在目标点的可见光机场飞机检测方法 | |
CN105389593B (zh) | 基于surf特征的图像物体识别方法 | |
CN106846316B (zh) | 一种gis内部典型缺陷图像自动识别方法 | |
JP4921858B2 (ja) | 画像処理装置および画像処理プログラム | |
CN110163033B (zh) | 正样本获取方法、行人检测模型生成方法和行人检测方法 | |
CN104063713B (zh) | 一种基于随机蕨分类器的半自主在线学习方法 | |
CN104952073B (zh) | 基于深度学习的镜头边缘检测方法 | |
CN105005565B (zh) | 现场鞋底痕迹花纹图像检索方法 | |
CN105117740B (zh) | 字体识别方法及装置 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN108009567B (zh) | 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法 | |
CN103745233B (zh) | 基于空间信息迁移的高光谱图像分类方法 | |
CN103824090A (zh) | 一种自适应的人脸低层特征选择方法及人脸属性识别方法 | |
JP2022027473A5 (zh) | ||
Cheng et al. | Urban road extraction via graph cuts based probability propagation | |
CN110458022B (zh) | 一种基于域适应的可自主学习目标检测方法 | |
CN106780376A (zh) | 基于显著性检测和联合分割算法的背景图像分割方法 | |
CN105320970A (zh) | 一种马铃薯病害诊断装置、诊断系统及诊断方法 | |
CN110363228A (zh) | 噪声标签纠正方法 | |
WO2023201772A1 (zh) | 基于迭代域内适应和自训练的跨域遥感图像语义分割方法 | |
CN106778897B (zh) | 基于余弦距离和中心轮廓距离的两次植物物种识别方法 | |
CN105069471A (zh) | 基于模糊标签的高光谱数据子空间投影和分类方法 | |
CN105469099B (zh) | 基于稀疏表示分类的路面裂缝检测和识别方法 | |
CN107067027B (zh) | 一种基于光滑多示例学习的目标识别方法 | |
CN105956563A (zh) | 基于多示例学习进行新闻图像中人脸标注的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200623 |