CN102708367A - 基于目标轮廓特征的图像识别方法 - Google Patents
基于目标轮廓特征的图像识别方法 Download PDFInfo
- Publication number
- CN102708367A CN102708367A CN2012101457354A CN201210145735A CN102708367A CN 102708367 A CN102708367 A CN 102708367A CN 2012101457354 A CN2012101457354 A CN 2012101457354A CN 201210145735 A CN201210145735 A CN 201210145735A CN 102708367 A CN102708367 A CN 102708367A
- Authority
- CN
- China
- Prior art keywords
- image
- template
- target
- points
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000009194 climbing Effects 0.000 claims description 3
- 230000035772 mutation Effects 0.000 claims description 2
- 235000019553 satiation Nutrition 0.000 claims description 2
- 238000009827 uniform distribution Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract 1
- 239000004065 semiconductor Substances 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 8
- 238000010845 search algorithm Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
一种基于目标轮廓特征的图像识别方法,根据目标的轮廓特征而非整个模板计算相似度,并据此对模板进行分析得到最小类间距离,在搜索过程中,结合最小类间距离及适应度对群体进行划分,并通过局部搜索快速得到局部极值。图像识别是工业自动化领域中的重要课题,特别是当目标之间存在交错时,如何有效的识别多个目标是亟待解决的问题。本发明有效提高了搜索效率,保证了识别的实时性。将这种方法应用于半导体检测及生产设备机器视觉系统中,能够高效准确地识别定位场景图像中的多个重复目标。
Description
技术领域
本发明涉及一种基于目标轮廓特征的图像识别方法,属于机器视觉领域图像定位算法,特别针对有交错的重复目标的图像定位。
背景技术
图像识别是图像识别领域中的重要问题,在现代自动化设备中起着关键作用,是利用机器视觉进行闭环自动控制的系统中不可或缺的组成部分。图像识别系统需要实时的从场景图像中识别出所有与给定模板图像相匹配的目标图像,其识别效率、可靠性、鲁棒性直接影响到整个自动化设备的性能。目前流行的商业图像识别系统,都已成功应用于工程实践。然而这些系统对单目标图像识别比较完善,在处理多目标图像识别时尚存在不少问题亟待解决。特别的,当场景中目标之间存在交错现象时,现有的模板识别方法不能正确反映目标的匹配程度,使得识别正确率大大降低。因此,对多目标图像识别算法进行研究,使其能够处理目标图像间的交错现象是提高当前多目标图像识别的鲁棒性,扩大其应用范围亟待解决的问题。
针对上述问题,本发明提出了一种新的基于物体轮廓特征的图像识别方法。该方法首先对模板进行分析处理,得到最小类间距离,在对场景图像的搜索过程中,利用该最小类间距离以及优化过程中形成的适应度图景建立高斯混合模型,通过该模型指导进化,提高了搜索效率,增强了系统识别的实时性,在目标图像存在重叠的情况下也能够保证准确定位。
发明内容
本发明着重解决交错重复目标的识别定位问题,具体技术方案如下:
目前,工程实用的图像识别方法可以分为两类,一是基于灰度的模板匹配方法,一是基于特征的识别方法。由于基于特征的图像识别方法在提取实时场景图像特征的过程中耗时太多,无法满足实时性要求较强的应用场合,所以在工业自动化应用中一般采用基于灰度的模板匹配方法。通常用模板来表示待搜索目标,使用某种距离度量来衡量两幅图像之间的相似度。识别过程就是在场景图像中的搜索过程,即利用相似度度量来寻找与模板相匹配的目标子图像。根据距离度量以及搜索算法的不同形成了各种不同的算法。其中最常用的是基于象素差的绝对值和的相似度标准,即:
其中,S为给定的场景图像;T为模板图像,大小为M×M;S i,j 为S中欲与T匹配的子图像,(i,j)为S i,j 的左上角在S中的坐标;L为图像灰度级。
多目标图像识别需要实时的从场景图像中识别出所有与给定目标相匹配的目标图像。如图1所示,(a)为实时拍摄的一幅场景图像,(b)为从场景图像中选择的一幅模板,其中包含了我们感兴趣的待识别菱形物体,要求识别出当前场景中的所有的菱形物体并确定其坐标。
本发明的目标轮廓特征提取方法:
在模板匹配方法中,采用模板来表示识别目标,实际上是扩大了识别限制。如图1所示,采用模板识别时,由于场景图像中菱形物体排列紧密,因此生成的每幅包含菱形物体的子图像都会受其周围菱形物体的干扰,影响了识别的质量。由于通常关心的只是模板中的识别目标,对于目标周围的对象并不关心,因此,采用整个模板匹配来代替目标识别是值得商榷的。
为此,本发明给出了用目标的轮廓特征代替模板进行识别的方法。目标的轮廓特征是由模板图像中描述目标的点组成的集合,用Sq表示,这样模板T与目标子图像S i,j 之间的相似度变为:
目标轮廓特征的取得可以通过用户交互指定,也可以通过图像处理技术自动从模板图像中获得。由用户指定可以准确定义识别的语义,如定义菱形物体的轮廓特征为菱形所包含的区域以及边界线。此外,还可以通过图像处理技术如边缘提取方法自动获得目标轮廓特征,这样获得的轮廓特征虽然缺乏语义支持,但可以减少识别计算量,提高识别速度,在实际应用中也有较好的应用效果。
在多目标图像识别中,场景中存在多个目标,反映在相似度图景中存在对应于各个匹配点的明显的局部波峰。多目标识别的目的就是找到这几个局部极值,而不是单目标识别中那样搜索一个全局极值。用相似度来衡量图像之间的匹配程度,在正确的或接近正确的位置都会产生很好的响应,具有较高的相似度值。因此,对于场景图像中给定的两个具有较高相似度值的点,必须给出一种标准以判断两点是不同的目标图像还是同一目标图像在不同接近点响应。为此,对模板图像进行如下处理(流程参考图3):
a. 对模板图像进行去噪处理。
b. 将其进行二值化处理以消除噪音的影响,其中1表示感兴趣的目标象素,0表示非目标象素。
c. 建立模板图像T关于(u,v)的扩展图像,其扩展图像定义为:
其中(u,v)满足|u,v|<M。图2显示了与图1中模板对应的两幅模板扩展图像。
在最小类间距离的搜索过程中,首先得到一个候选点,令最小类间距离为该候选点到原点的距离。在后继搜索中,首先比较当前点与原点的距离,若该距离大于当前的最小类间距离,则不需对当前点进行相似度计算,否则进行相似度计算,若当前点为候选点,还要更新最小类间距离。由于距离的计算量远远小于相似度的计算量,这种方法能够有效节省计算量。
此外,通过模板扩展图像的定义可以看出,模板扩展图像由两部分组成,第一部分对应于式(3)中otherwise对应的部分,这部分完全是模板图像的拷贝,对这部分计算式(2)分母中的分式分子总为0,即这部分的计算并不影响相似度,相似度的计算完全由剩余的第二部分决定。因此在计算模板扩展图像与模板之间的相似度时,只需计算轮廓特征序列落到第二部分对应区域的象素差的绝对值和即可。利用这种方法计算相似度,可减少接近一半的计算量。
本发明的搜索算法设计:
多目标图像识别是一类典型的多模态优化问题。使用传统的启发式搜索算法,如梯度爬山法,模拟退火法等,均不能同时找到多个优解且易于陷入局部极值。根据2.2中最小类间距离的获取可以看出,对于场景中的两个目标点(i,j),(k,l),必有D((i,j),(k,l))<d。从聚类的角度看,以目标点为中心d/2半径的范围内的象素属于同一类,可由目标点代表。因此采用基于聚类小生境技术的混合进化算法进行搜索,以期同时得到多个满意解。
[0016] 为了保持所求问题本身的结构特征,避免采用二进制编码对问题空间结构的破坏以及所引起的转换成本,算法采用实数编码。每个个体c=(x,y)代表场景图像中的一幅待匹配子图像S x,y 。适应度为个体所代表的子图像与模板图像之间的相似度,即f(x,y)= R(S x,y ,T)。
算法描述如下:
b. 根据选择算子生成中间群体。
c. 聚类。对中间群体进行排序;从当前未归类个体中选择适应度最大的个体,若该个体与所有已形成类的代表点的距离大于d,则建立一个新类,并将该个体指定为该类的代表点,否则,将该个体就近归类,并更新相应的代表点(由于个体已经排序,所以各类只需在加入第一个点时检验是否需更新代表点),直到当前未归类个体的适应度<δ,δ由实际运行时的环境,例如灯光、目标与背景的区分度、噪音等决定;将所有剩余的未归类个体视为一类,该类无代表点。
d. 对新生成的类以及代表点被更新的类,在代表点邻域中进行爬山搜索,直到适应度不再增大,得到新的代表点;对无代表点类根据交叉,变异生成新一代群体,计算其适应度。
e. 若不满足终止标准,转b;否则,算法终止,输出各类代表点。
可以看出,在搜索算法中充分利用了模板分析得到的结果,由于模板图像是预先给出的,对模板的处理可以提前进行并不影响系统的实时处理能力,而且,对模板的处理可通过与用户交互进行指导,因此能有效的提高识别的速度与质量。
附图说明
图1是场景图像与模板图像,其中(a)为场景图像 (b)为模板;
图2是模板扩展图像示意图;
图3是廓特征提取流程图;
图4是采用不同标准得到图1的相似度图景,其中(a)为原标准,(b)为基于轮廓特征的标准。
具体实施方式
在搜索算法中,利用个体的适应度以及最小类间距离进行聚类,因此,目标适应度大小对算法性能有重要影响。若目标点或其周围区域点的适应度与非目标区域点的适应度差别不大,则会在非目标区域形成聚类,浪费计算资源,增加识别难度。为了分析目标特征轮廓提取对识别难度的影响,利用Matlab进行了算法仿真。图4比较了利用两种相似度标准得到的图1的相似度图景,其中(a)采用整幅模板进行匹配,(b)采用轮廓特征序列进行匹配。可以看出,采用整幅模板进行匹配时,如果目标图像之间存在交错现象,得到的相似度不能很好的反映目标的实际匹配情况。采用基于轮廓特征序列进行匹配,则能较好的消除由于目标交错对匹配结果带来的干扰。
表1给出了两种标准得到的平均适应度以及象素适应度分布情况。采用整幅模板进行匹配得到的平均适应度要高于采用模板序列进行匹配得到的结果,而标准差则小于模板序列匹配结果。由于我们的目的是找到相似度最大的几个点,所以希望在整个搜索场景中,只有几个目标点具有高相似度,其他点的相似度尽可能的低。由于目标点在整个场景中所占比例很小,所以相似度的均值越小,方差越大对目标点与非目标点的区分越好。比较两种标准的象素适应度分布情况可以看出,采用式(1)时,场景中适应度值不低于目标3的象素有531个,即目标3要与530个象素进行竞争,增加了目标的识别难度。采用式(2),对于最不易识别的目标5,仅有51个象素与其竞争,且这些象素大多分布在其他4个目标点附近,利用文中给出的目标区分判据可以容易的识别出该目标。可见,采用轮廓特征的匹配方法可以有效的降低目标识别的难度,提高识别正确率。
在计算机上利用图1进行测试。其中,场景图像大小320×240,模板大小88×73,N=50,δ=0.85。选择操作采用规模为2的联赛选择,交叉操作采用中间重组方法,变异操作采用实值变异因子。中止标准为进化代数超过100代或聚类代表点连续5代不变。
表2比较了两种标准的搜索结果,其中进化代数与搜索时间为运行100次得到的平均值。从表中可以看出,采用式(1)标准无法准确定位场景中的全部目标。由于式(1)得到的最小类间距离退化为模板大小,即d=73,而场景中目标(1,3),(2,3),(1,4),(3,4),(4,5)之间的距离均小于73,所以目标(1,3,4),(2,3),(4,5)无法同时获得。由于目标1及其附近区域的适应度明显高于其他目标更易被发现。即使由于搜索的随机性在搜索初期确定了目标3或4,但在随后的搜索过程中,一旦搜索到目标1附近,通过局部搜索目标1就会取代原目标成为新的聚类代表点。目标3或4被取代后,目标2或5才有可能成为新的聚类代表点。目标点之间的冲突延迟了聚类代表点的确定,降低了算法效率。采用式(2)确定的最小类间距离可以很好的区分各目标,使同时确定多个聚类代表点成为可能。加入局部搜索算法则提高了算法的稳定性与效率,大大降低了所需的进化代数。
表1 不同标准得到的图1相似度比较标准
(1)N表示相似度不低于超过目标点的象素数目
表2 不同标准搜索结果比较
Claims (3)
3.根据权利要求1,基于目标轮廓特征的图像识别方法的搜索算法特征步骤描述如下:
b. 根据选择算子生成中间群体;
c. 聚类,对中间群体进行排序;从当前未归类个体中选择适应度最大的个体,若该个体与所有已形成类的代表点的距离大于d,则建立一个新类,并将该个体指定为该类的代表点,否则,将该个体就近归类,并更新相应的代表点(由于个体已经排序,所以各类只需在加入第一个点时检验是否需更新代表点),直到当前未归类个体的适应度<δ,δ由实际运行时的环境,例如灯光、目标与背景的区分度、噪音等决定;将所有剩余的未归类个体视为一类,该类无代表点;
d. 对新生成的类以及代表点被更新的类,在代表点邻域中进行爬山搜索,直到适应度不再增大,得到新的代表点,对无代表点类根据交叉,变异生成新一代群体,计算其适应度;
e. 若不满足终止标准,转b;否则,算法终止,输出各类代表点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012101457354A CN102708367A (zh) | 2012-03-11 | 2012-05-11 | 基于目标轮廓特征的图像识别方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210061436 | 2012-03-11 | ||
CN201210061436.2 | 2012-03-11 | ||
CN2012101457354A CN102708367A (zh) | 2012-03-11 | 2012-05-11 | 基于目标轮廓特征的图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102708367A true CN102708367A (zh) | 2012-10-03 |
Family
ID=46901110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012101457354A Pending CN102708367A (zh) | 2012-03-11 | 2012-05-11 | 基于目标轮廓特征的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102708367A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166841A (zh) * | 2014-07-24 | 2014-11-26 | 浙江大学 | 一种视频监控网络中指定行人或车辆的快速检测识别方法 |
CN105930852A (zh) * | 2016-05-09 | 2016-09-07 | 山东省科学院海洋仪器仪表研究所 | 一种气泡图像识别方法 |
CN103824067B (zh) * | 2014-03-18 | 2016-10-05 | 北京理工大学 | 一种图像主要目标的定位与识别方法 |
CN113822095A (zh) * | 2020-06-02 | 2021-12-21 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、系统,机器人及存储介质 |
CN113822094A (zh) * | 2020-06-02 | 2021-12-21 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、系统,机器人及存储介质 |
CN116071429A (zh) * | 2023-03-29 | 2023-05-05 | 天津市再登软件有限公司 | 一种被子图案轮廓识别方法、装置、电子设备及存储介质 |
CN116645525A (zh) * | 2023-07-27 | 2023-08-25 | 深圳市豆悦网络科技有限公司 | 一种游戏图像识别方法及处理系统 |
-
2012
- 2012-05-11 CN CN2012101457354A patent/CN102708367A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824067B (zh) * | 2014-03-18 | 2016-10-05 | 北京理工大学 | 一种图像主要目标的定位与识别方法 |
CN104166841A (zh) * | 2014-07-24 | 2014-11-26 | 浙江大学 | 一种视频监控网络中指定行人或车辆的快速检测识别方法 |
CN104166841B (zh) * | 2014-07-24 | 2017-06-23 | 浙江大学 | 一种视频监控网络中指定行人或车辆的快速检测识别方法 |
CN105930852A (zh) * | 2016-05-09 | 2016-09-07 | 山东省科学院海洋仪器仪表研究所 | 一种气泡图像识别方法 |
CN105930852B (zh) * | 2016-05-09 | 2019-06-21 | 山东省科学院海洋仪器仪表研究所 | 一种气泡图像识别方法 |
CN113822095A (zh) * | 2020-06-02 | 2021-12-21 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、系统,机器人及存储介质 |
CN113822094A (zh) * | 2020-06-02 | 2021-12-21 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、系统,机器人及存储介质 |
CN113822095B (zh) * | 2020-06-02 | 2024-01-12 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、系统,机器人及存储介质 |
CN113822094B (zh) * | 2020-06-02 | 2024-01-16 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、系统,机器人及存储介质 |
CN116071429A (zh) * | 2023-03-29 | 2023-05-05 | 天津市再登软件有限公司 | 一种被子图案轮廓识别方法、装置、电子设备及存储介质 |
CN116645525A (zh) * | 2023-07-27 | 2023-08-25 | 深圳市豆悦网络科技有限公司 | 一种游戏图像识别方法及处理系统 |
CN116645525B (zh) * | 2023-07-27 | 2023-10-27 | 深圳市豆悦网络科技有限公司 | 一种游戏图像识别方法及处理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Automatic pavement crack detection by multi-scale image fusion | |
CN115082683B (zh) | 一种基于图像处理的注塑缺陷检测方法 | |
WO2023065395A1 (zh) | 作业车辆检测与跟踪方法和系统 | |
CN102708367A (zh) | 基于目标轮廓特征的图像识别方法 | |
CN110796186A (zh) | 基于改进的YOLOv3网络的干湿垃圾识别分类方法 | |
CN109190752A (zh) | 基于深度学习的全局特征和局部特征的图像语义分割方法 | |
Shabanzade et al. | Combination of local descriptors and global features for leaf recognition | |
WO2021082380A1 (zh) | 一种基于激光雷达的托盘识别方法、系统和电子设备 | |
CN110737788B (zh) | 快速的三维模型索引建立及检索方法 | |
CN106874421A (zh) | 基于自适应矩形窗口的图像检索方法 | |
CN103177266A (zh) | 储藏物害虫智能识别系统 | |
Gu et al. | An advanced deep learning approach for safety helmet wearing detection | |
Liu et al. | Development of a machine vision algorithm for recognition of peach fruit in a natural scene | |
CN104361135A (zh) | 一种图像检索方法 | |
CN113657423A (zh) | 适用于小体积零件与堆叠零件的目标检测方法及其应用 | |
CN116152494A (zh) | 基于两阶段3d点云语义分割的建筑物脚点识别分割方法 | |
CN116958052A (zh) | 一种基于yolo和注意力机制的印刷电路板缺陷检测方法 | |
Mu et al. | Salient object detection in low contrast images via global convolution and boundary refinement | |
CN111062418A (zh) | 一种基于最小生成树的无参数化聚类算法及系统 | |
CN116596921B (zh) | 一种焚烧炉渣分选方法及系统 | |
CN112633327B (zh) | 分阶段金属表面缺陷检测方法、系统、介质、设备及应用 | |
CN111523576B (zh) | 一种适用于电子质量检测的密度峰值聚类离群点检测方法 | |
CN104239411B (zh) | 一种基于颜色、位置聚类和角点检测的栅格状雷达的检测方法 | |
CN106980878B (zh) | 三维模型几何风格的确定方法及装置 | |
CN116342955A (zh) | 一种基于改进的特征金字塔网络的目标检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121003 |