CN106295639A - 一种虚拟现实终端以及目标图像的提取方法和装置 - Google Patents

一种虚拟现实终端以及目标图像的提取方法和装置 Download PDF

Info

Publication number
CN106295639A
CN106295639A CN201610620788.5A CN201610620788A CN106295639A CN 106295639 A CN106295639 A CN 106295639A CN 201610620788 A CN201610620788 A CN 201610620788A CN 106295639 A CN106295639 A CN 106295639A
Authority
CN
China
Prior art keywords
target image
image
information
shape information
edge contour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610620788.5A
Other languages
English (en)
Inventor
张超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Original Assignee
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leshi Zhixin Electronic Technology Tianjin Co Ltd, LeTV Holding Beijing Co Ltd filed Critical Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority to CN201610620788.5A priority Critical patent/CN106295639A/zh
Publication of CN106295639A publication Critical patent/CN106295639A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明的实施例公开一种虚拟现实终端以及其目标图像的提取方法和装置,涉及人机交互领域。所述方法包括:获得目标图像;对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息;在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。本发明的虚拟现实终端以及其目标图像的提取方法和装置,用整体模型降低每一个小区域判错概率,降低误判率,改进聚类效果。

Description

一种虚拟现实终端以及目标图像的提取方法和装置
技术领域
本发明实施例涉及人机交互领域,尤其涉及一种虚拟现实终端以及目标图像的提取方法和装置。
背景技术
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
手势识别技术是人机交互的重要技术,例如,视觉机器人利用手型识别技术采集手势的动作而进行相应的处理。
手势识别中,超像素分割能够获得一个个的小区域,在小区域聚类成目标的时候,会因类肤色背景的干扰而出现边缘的凸出或者凹进的情况,使得误判率较高。
因此,在实现本发明的过程中,发明人发现如何降低虚拟现实终端的目标图像的提取的误判率,成为有必要解决的技术问题。
发明内容
本发明实施例的目的在于提供一种虚拟现实终端以及其目标图像的提取方法和装置,用以解决现有技术中虚拟现实终端的目标图像的提取的误判率较高的问题。
本发明实施例采用的技术方案如下:
本发明的一实施例提供一种目标图像的处理方法,包括:
获得目标图像;
对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息;
在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
可选地,所述在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束具体包括:
使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
可选地,所述确定所述每个区域聚类的合法性具体包括:确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
可选地,在所述获得目标图像之前,所述方法还包括:
获取样本图像,并转换为样本图像模型;
使用当前获取的样本图像模型更新存储的样本图像模型;
所述提取所述目标图像的边缘轮廓信息和形状信息具体包括:
将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取所述目标图像的所述边缘轮廓信息和形状信息。
可选地,所述使用当前获取的样本图像模型更新存储的样本图像模型之后,所述方法还包括:
存储更新后的所述样本图像模型。
本发明的另一实施例提供一种目标图像的处理装置,包括:
图像获取单元,用于获得目标图像;
提取单元,用于对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息;
处理单元,用于在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
可选地,所述处理单元具体用于使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
可选地,所述处理单元用于确定所述每个区域聚类的合法性具体包括:
所述处理单元用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
可选地,其中,所述图像获取单元,还用于获取样本图像,并转换为样本图像模型;
所述目标图像的处理装置还包括:更新单元,用于使用当前获取的样本图像模型更新存储的样本图像模型;
所述提取单元进一步包括:
提取子单元,用于将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
可选地,所述目标图像的处理装置还包括:
存储单元,用于存储更新前后的所述样本图像模型。
本发明的另一实施例提供一种虚拟现实终端,包括:
第一硬件处理器,用于获得目标图像;
第二硬件处理器,用于对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息;在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
可选地,所述第二硬件处理器用于在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束具体包括:
所述第二硬件处理器用于使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
可选地,所述第二硬件处理器用于确定所述每个区域聚类的合法性具体包括:
所述第二硬件处理器用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
可选地,所述第一硬件处理器还用于获取样本图像,并转换为样本图像模型;
所述第二硬件处理器还用于使用当前获取的样本图像模型更新存储的样本图像模型;将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
可选地,所述虚拟现实终端还包括:
存储器,用于存储更新前后的所述样本图像模型。
本发明实施例的技术方案具有以下优点:
本发明实施例提供的一种虚拟现实终端以及目标图像的提取方法和装置,提取所述目标图像的边缘轮廓信息和形状信息,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束,达到用整体模型降低每一个小区域判错概率,降低误判率,改进聚类效果的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明另一实施例的一种目标图像的处理方法的流程示意图;
图2为本发明一实施例的一种目标图像的处理装置的结构示意图;
图3为本发明另一实施例的一种虚拟现实终端的结构示意图;
图4为本发明一实施例的一种目标图像的处理装置的结构示意图;
图5为本发明另一实施例的一种目标图像的处理方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明一实施例的一种目标图像的处理方法的流程示意图,所述目标图像的处理方法可以应用于机器人、计算机和电视等等各种视觉机器,所述目标图像的处理方法主要如下所述。
步骤11,获得目标图像。
步骤12,对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息。
步骤13,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
在本发明的另一实施例中,所述在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束具体包括:
使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
在本发明的另一实施例中,所述确定所述每个区域聚类的合法性具体包括:确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
在本发明的另一实施例中,在所述获得目标图像之前,所述方法还包括:
获取样本图像,并转换为样本图像模型;
使用当前获取的样本图像模型更新存储的样本图像模型;
所述提取所述目标图像的边缘轮廓信息和形状信息具体包括:
将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取所述目标图像的所述边缘轮廓信息和形状信息。
在本发明的另一实施例中,所述使用当前获取的样本图像模型更新存储的样本图像模型之后,所述方法还包括:
存储更新后的所述样本图像模型。
综上所述,本实施例的目标图像的处理方法,提取所述目标图像的边缘轮廓信息和形状信息,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束,可以用整体模型降低每一个小区域判错概率,降低误判率,可以达到改进聚类效果的目的。
如图2所示,为本发明一实施例的一种目标图像的处理装置的结构示意图,所述目标图像的处理装置可以应用于机器人、计算机和电视等等各种视觉机器,所述目标图像的处理装置包括:图像获取单元21、提取单元22和处理单元23。
所述图像获取单元21用于获得目标图像。
所述提取单元22用于对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息。
所述处理单元23用于在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
在本发明的另一实施例中,所述处理单元23具体用于使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
在本发明的另一实施例中,所述处理单元23用于确定所述每个区域聚类的合法性具体包括:
所述处理单元23用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
所述图像获取单元21,还用于获取样本图像,并转换为样本图像模型;
所述目标图像的处理装置还包括:更新单元,用于使用当前获取的样本图像模型更新存储的样本图像模型;
所述提取单元22进一步包括:
提取子单元,用于将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
可选地,所述目标图像的处理装置还包括:
存储单元,用于存储更新前后的所述样本图像模型。
综上所述,本实施例的目标图像的处理装置,提取所述目标图像的边缘轮廓信息和形状信息,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束,可以用整体模型降低每一个小区域判错概率,降低误判率,可以达到改进聚类效果的目的。
如图3所示,为本发明一实施例的一种虚拟现实终端的结构示意图,所述虚拟现实终端可以应用于机器人、计算机和电视等等各种视觉机器,所述虚拟现实终端包括:第一硬件处理器31和第二硬件处理器32。
所述第一硬件处理器31用于获得目标图像。
所述第二硬件处理器32用于对所述目标图像采用超像素进行分割而获得多个区域,提取所述目标图像的边缘轮廓信息和形状信息,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
在本发明的另一实施例中,所述第二硬件处理器32用于在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束具体包括:
所述第二硬件处理器32用于使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
在本发明的另一实施例中,所述第二硬件处理器32用于确定所述每个区域聚类的合法性具体包括:
所述第二硬件处理器32用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
在本发明的另一实施例中,所述第一硬件处理器31还用于获取样本图像,并转换为样本图像模型;
所述第二硬件处理器32还用于使用当前获取的样本图像模型更新存储的样本图像模型;将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
在本发明的另一实施例中,所述虚拟现实终端还包括:
存储器33,用于存储更新前后的所述样本图像模型。
综上所述,本实施例的虚拟现实终端,提取所述目标图像的边缘轮廓信息和形状信息,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束,可以用整体模型降低每一个小区域判错概率,降低误判率,可以达到改进聚类效果的目的。
如图4所示,为本发明另一实施例的一种目标图像的处理装置的结构示意图,所述目标图像的处理装置可以设置于机器人、计算机和电视等等各种视觉机器中,所述目标图像的处理装置包括:图像获取单元41、提取单元42、处理单元43、存储单元44和更新单元45。
所述图像获取单元41用于获取样本图像,例如离线地获取样本图像,并转换为样本图像模型存储在所述存储单元44中。
所述离线是指所述图像获取单元41非实时地获取样本图像,例如,在摄像头没有获取目标图像时,可以预先设置样本图像。或者,再例如,在摄像头摄取图像后将图像存储,然后在某个时间点,所述图像获取单元41获取这些图像作为样本图像。
所述摄像头,可以为视觉传感器,有线摄像头和无线摄像头,例如,USB摄像头,wifi摄像头,ARM接摄像头和cmos摄像头。
所述图像获取单元41用于获得目标图像。例如,所述图像获取单元41用于在线地获得目标图像。
所述在线是指所述图像获取单元41根据使用者的需求当前实时获取目标图像。
在本发明的另一实施例中,所述图像获取单元41既可以获取静态目标图像,也可以获取动态目标图像。
例如,所述图像获取单元41用于获取手的V字、五指张开、石头、剪刀和布等等几个静态目标图像。
再例如,所述图像获取单元41还用于获取头部、手臂、手指还是其他物体(如武器)的静态目标图像。
再例如,所述图像获取单元41还可以用于获取用户的动作(例如,跳起、下蹲、或前倾)的动态目标图像。
所述提取单元42进一步包括分割子单元421和提取子单元422。
所述分割子单元421用于对所述目标图像采用超像素进行分割而获得多个区域。
所述提取子单元422用于提取所述目标图像的边缘轮廓信息和形状信息。
例如,所述分割子单元421,用于采用基于阈值的分割方式、基于区域的分割方式、基于边缘的分割方式或基于聚类分析的图像分割方式对所述目标图像采用超像素进行分割而获得多个区域。
基于阈值的分割方法
包括全局阈值、自适应阈值、最佳阈值等等。阈值分割算法的关键是确定阈值,如果能确定一个合适的阈值就可准确地将图像分割开来。阈值确定后,将阈值与像素点的灰度值比较和像素分割可对各像素并行地进行,分割的结果直接给出图像区域。全局阈值是指整幅图像使用同一个阈值做分割处理,适用于背景和前景有明显对比的图像。它是根据整幅图像确定的:T=T(f)。但是这种方法只考虑像素本身的灰度值,一般不考虑空间特征,因而对噪声很敏感。常用的全局阈值选取方法有利用图像灰度直方图的峰谷法、最小误差法、最大类间方差法、最大熵自动阈值法以及其它一些方法。
在许多情况下,物体和背景的对比度在图像中的各处不是一样的,这时很难用一个统一的阈值将物体与背景分开。这时可以根据图像的局部特征分别采用不同的阚值进行分割。实际处理时,需要按照具体问题将图像分成若干子区域分别选择阈值,或者动态地根据一定的邻域范围选择每点处的阈值,进行图像分割。这时的阈值为自适应阈值。
阈值的选择需要根据具体问题来确定,一般通过实验来确定。对于给定的图像,可以通过分析直方图的方法确定最佳的阈值,例如当直方图明显呈现双峰情况时,可以选择两个峰值的中点作为最佳阈值。
基于区域的分割方法
包括区域生长法、分裂合并法。
(1)、区域生长方法
区域生长是一种根据事前定义的准则将像素或子区域聚合成更大区域的过程,主要考虑象素及其空间邻域象素之间的关系。
基本思想:从种子区域(可以是单个像素)开始,逐步增长,获得满足一致性的最大区域。
算法实现:
1)根据图像的不同应用选择一个或一组种子,它或者是最亮或最暗的点,或者是位于点簇中心的点。
2)选择一个相似性准则。
灰度级、彩色、纹理、梯度等特性相似。
3)从该种子开始向外扩张,不断将与集合中各个像素连通、且满足相似性准则的像素加入集合。
4)上一过程进行到不再有满足条件的新结点加入集合为止。(终止准则)
(2)、区域分裂合并
区域分裂合并法无需预先指定种子点,它按某种一致性准则分裂或者合并区域。可以先进行分裂运算,然后再进行合并运算;也可以分裂和合并运算同时进行,经过连续的分裂和合并,最后得到图像的精确分割效果。分裂合并法对分割复杂的场景图像比较有效。
算法实现:
1)对图像中灰度级不同的区域,均分为四个子区域。
2)如果相邻的子区域所有像素的灰度级相同,则将其合并。
3)反复进行上两步操作,直至不再有新的分裂与合并为止。
基于边缘的分割方法
检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种不连续性称为边缘,不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。
图像中边缘处像素的灰度值不连续,这种不连续性可通过求导数来检测到。对于阶跃状边缘,其位置对应一阶导数的极值点,对应二阶导数的过零点(零交叉点)。因此常用微分算子进行边缘检测。常用的一阶微分算子有Roberts算子、Prewitt算子和Sobel算子,二阶微分算子有Laplace算子和Kirsh算子等。在实际中各种微分算子常用小区域模板来表示,微分运算是利用模板和图像卷积来实现。这些算子对噪声敏感,只适合于噪声较小不太复杂的图像。
由于边缘和噪声都是灰度不连续点,在频域均为高频分量,直接采用微分运算难以克服噪声的影响。因此用微分算子检测边缘前要对图像进行平滑滤波。LoG算子和Canny算子是具有平滑功能的二阶和一阶微分算子,边缘检测效果较好,如图4所示。其中loG算子是采用Laplacian算子求高斯函数的二阶导数,Canny算子是高斯函数的一阶导数,它在噪声抑制和边缘检测之间取得了较好的平衡。
基于聚类分析的图像分割方法
特征空间聚类法进行图像分割是将图像空间中的像素用对应的特征空间点表示,根据它们在特征空间的聚集对特征空间进行分割,然后将它们映射回原图像空间,得到分割结果。其中,K均值、模糊C均值聚类(FCM)算法是最常用的聚类算法。K均值算法先选K个初始类均值,然后将每个像素归入均值离它最近的类并计算新的类均值。迭代执行前面的步骤直到新旧类均值之差小于某一阈值。模糊C均值算法是在模糊数学基础上对K均值算法的推广,是通过最优化一个模糊目标函数实现聚类,它不像K均值聚类那样认为每个点只能属于某一类,而是赋予每个点一个对各类的隶属度,用隶属度更好地描述边缘像素亦此亦彼的特点,适合处理事物内在的不确定性。利用模糊C均值(FCM)非监督模糊聚类标定的特点进行图像分割,可以减少人为的干预,且较适合图像中存在不确定性和模糊性的特点。
所述提取子单元422用于提取所述目标图像的边缘轮廓信息和形状信息,具体如下所述。
例如,所述提取子单元422用于结合在线更新和模型匹配的方式,提取目标图像的边缘轮廓信息和形状信息。
例如,所述更新单元45,用于使用当前获取的样本图像模型更新存储的样本图像模型。
所述提取子单元422用于在所述更新单元45使用当前获取的样本图像模型更新存储的样本图像模型后,将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
比如权重向量A,在线更新可以用以下公式更新:
A=A_Last*a+A_current*b。
其中,A_Last为历史权重,a为历史权重在更新时所占的比重;其中A_current为当前权重,b为历史权重在更新时所占的比重。
所述模型匹配的方法,一般指所述提取子单元422用于使用更新后的图像模型的两个向量(或者矩阵)的距离来计算匹配度,例如当所述两个向量(或者矩阵)的距离等于阈值时,确定模型匹配度为对应的值。
所述处理单元43用于在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
例如,所述处理单元43用于使用所述边缘轮廓信息和形状信息约束聚类的方向和合法性,例如,手的轮廓,不会有很尖锐的地方,用边缘轮廓信息和形状信息表示即无拐点。
所述处理单元43用于确定所述每个区域聚类的合法性具体包括:所述处理单元43用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
在本发明的另一实施例中,所述存储单元44还用于存储更新前后的所述样本图像模型。
综上所述,本实施例的目标图像的处理装置,提取所述目标图像的边缘轮廓信息和形状信息,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束,达到用整体模型降低每一个小区域判错概率,降低误判率,改进聚类效果的目的。
如图5所示,为本发明另一实施例的一种目标图像的处理方法的流程示意图,所述目标图像的处理方法可以应用于机器人、计算机和电视等等各种视觉机器中,所述目标图像的处理方法主要如下所述。
步骤51,离线获取样本图像,并转换为样本图像模型,且利用存储器存储所述样本图像模型。
所述离线是指非实时地获取样本图像,例如,在摄像头没有获取目标图像时,可以预先设置样本图像。或者,再例如,在摄像头摄取图像后将图像存储,然后在某个时间点,获取这些图像作为样本图像。
所述摄像头,可以为视觉传感器,有线摄像头和无线摄像头,例如,USB摄像头,wifi摄像头,ARM接摄像头和cmos摄像头。
步骤52,获得目标图像。
例如,在线地获得目标图像,所述在线是指根据使用者的需求当前实时获取目标图像。
在本发明的另一实施例中,既可以获取静态目标图像,也可以获取动态目标图像。
例如,获取手的V字、五指张开、石头、剪刀和布等等几个静态目标图像。
再例如,获取头部、手臂、手指还是其他物体(如武器)的静态目标图像。
再例如,获取用户的动作(例如,跳起、下蹲、或前倾)的动态目标图像。
步骤53,对所述目标图像采用超像素进行分割而获得多个区域。
例如,采用基于阈值的分割方式、基于区域的分割方式、基于边缘的分割方式或基于聚类分析的图像分割方式对所述目标图像采用超像素进行分割而获得多个区域。
基于阈值的分割方法
包括全局阈值、自适应阈值、最佳阈值等等。阈值分割算法的关键是确定阈值,如果能确定一个合适的阈值就可准确地将图像分割开来。阈值确定后,将阈值与像素点的灰度值比较和像素分割可对各像素并行地进行,分割的结果直接给出图像区域。全局阈值是指整幅图像使用同一个阈值做分割处理,适用于背景和前景有明显对比的图像。它是根据整幅图像确定的:T=T(f)。但是这种方法只考虑像素本身的灰度值,一般不考虑空间特征,因而对噪声很敏感。常用的全局阈值选取方法有利用图像灰度直方图的峰谷法、最小误差法、最大类间方差法、最大熵自动阈值法以及其它一些方法。
在许多情况下,物体和背景的对比度在图像中的各处不是一样的,这时很难用一个统一的阈值将物体与背景分开。这时可以根据图像的局部特征分别采用不同的阚值进行分割。实际处理时,需要按照具体问题将图像分成若干子区域分别选择阈值,或者动态地根据一定的邻域范围选择每点处的阈值,进行图像分割。这时的阈值为自适应阈值。
阈值的选择需要根据具体问题来确定,一般通过实验来确定。对于给定的图像,可以通过分析直方图的方法确定最佳的阈值,例如当直方图明显呈现双峰情况时,可以选择两个峰值的中点作为最佳阈值。
基于区域的分割方法
包括区域生长法、分裂合并法。
(1)、区域生长方法
区域生长是一种根据事前定义的准则将像素或子区域聚合成更大区域的过程,主要考虑象素及其空间邻域象素之间的关系。
基本思想:从种子区域(可以是单个像素)开始,逐步增长,获得满足一致性的最大区域。
算法实现:
1)根据图像的不同应用选择一个或一组种子,它或者是最亮或最暗的点,或者是位于点簇中心的点。
2)选择一个相似性准则。
灰度级、彩色、纹理、梯度等特性相似。
3)从该种子开始向外扩张,不断将与集合中各个像素连通、且满足相似性准则的像素加入集合。
4)上一过程进行到不再有满足条件的新结点加入集合为止。(终止准则)
(2)、区域分裂合并
区域分裂合并法无需预先指定种子点,它按某种一致性准则分裂或者合并区域。可以先进行分裂运算,然后再进行合并运算;也可以分裂和合并运算同时进行,经过连续的分裂和合并,最后得到图像的精确分割效果。分裂合并法对分割复杂的场景图像比较有效。
算法实现:
1)对图像中灰度级不同的区域,均分为四个子区域。
2)如果相邻的子区域所有像素的灰度级相同,则将其合并。
3)反复进行上两步操作,直至不再有新的分裂与合并为止。
基于边缘的分割方法
检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种不连续性称为边缘,不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。
图像中边缘处像素的灰度值不连续,这种不连续性可通过求导数来检测到。对于阶跃状边缘,其位置对应一阶导数的极值点,对应二阶导数的过零点(零交叉点)。因此常用微分算子进行边缘检测。常用的一阶微分算子有Roberts算子、Prewitt算子和Sobel算子,二阶微分算子有Laplace算子和Kirsh算子等。在实际中各种微分算子常用小区域模板来表示,微分运算是利用模板和图像卷积来实现。这些算子对噪声敏感,只适合于噪声较小不太复杂的图像。
由于边缘和噪声都是灰度不连续点,在频域均为高频分量,直接采用微分运算难以克服噪声的影响。因此用微分算子检测边缘前要对图像进行平滑滤波。LoG算子和Canny算子是具有平滑功能的二阶和一阶微分算子,边缘检测效果较好,如图4所示。其中loG算子是采用Laplacian算子求高斯函数的二阶导数,Canny算子是高斯函数的一阶导数,它在噪声抑制和边缘检测之间取得了较好的平衡。
基于聚类分析的图像分割方法
特征空间聚类法进行图像分割是将图像空间中的像素用对应的特征空间点表示,根据它们在特征空间的聚集对特征空间进行分割,然后将它们映射回原图像空间,得到分割结果。其中,K均值、模糊C均值聚类(FCM)算法是最常用的聚类算法。K均值算法先选K个初始类均值,然后将每个像素归入均值离它最近的类并计算新的类均值。迭代执行前面的步骤直到新旧类均值之差小于某一阈值。模糊C均值算法是在模糊数学基础上对K均值算法的推广,是通过最优化一个模糊目标函数实现聚类,它不像K均值聚类那样认为每个点只能属于某一类,而是赋予每个点一个对各类的隶属度,用隶属度更好地描述边缘像素亦此亦彼的特点,适合处理事物内在的不确定性。利用模糊C均值(FCM)非监督模糊聚类标定的特点进行图像分割,可以减少人为的干预,且较适合图像中存在不确定性和模糊性的特点。
步骤54,提取所述目标图像的边缘轮廓信息和形状信息。
例如,结合在线更新和模型匹配的方式,提取目标图像的边缘轮廓信息和形状信息。
例如,使用当前获取的样本图像模型更新存储的样本图像模型。
在使用当前获取的样本图像模型更新存储的样本图像模型后,将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
比如权重向量A,在线更新可以用以下公式更新:
A=A_Last*a+A_current*b。
其中,A_Last为历史权重,a为历史权重在更新时所占的比重;其中A_current为当前权重,b为历史权重在更新时所占的比重。
所述模型匹配的方法,一般指用于使用更新后的图像模型的两个向量(或者矩阵)的距离来计算匹配度,例如当所述两个向量(或者矩阵)的距离等于阈值时,确定模型匹配度为对应的值。
步骤55,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
例如,用所述边缘轮廓信息和形状信息约束聚类的方向和合法性,例如,手的轮廓,不会有很尖锐的地方,用边缘轮廓信息和形状信息表示即无拐点。
在本发明的另一实施例中,所述确定所述每个区域聚类的合法性具体包括:用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
在本发明的另一实施例中,所述目标图像的处理方法还包括:存储更新前后的所述样本图像模型。
综上所述,本实施例的目标图像的处理方法,提取所述目标图像的边缘轮廓信息和形状信息,在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束,达到用整体模型降低每一个小区域判错概率,降低误判率,改进聚类效果的目的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (15)

1.一种目标图像的处理方法,其特征在于,包括:
获得目标图像;
对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息;
在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
2.如权利要求1所述的方法,其特征在于,所述在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束具体包括:
使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
3.如权利要求2所述的方法,其特征在于,所述确定所述每个区域聚类的合法性具体包括:确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
4.如权利要求1-3任意一项所述的方法,其特征在于,在所述获得目标图像之前,所述方法还包括:
获取样本图像,并转换为样本图像模型;
使用当前获取的样本图像模型更新存储的样本图像模型;
所述提取所述目标图像的边缘轮廓信息和形状信息具体包括:
将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取所述目标图像的所述边缘轮廓信息和形状信息。
5.如权利要求4所述的方法,其特征在于,所述使用当前获取的样本图像模型更新存储的样本图像模型之后,所述方法还包括:
存储更新后的所述样本图像模型。
6.一种目标图像的处理装置,其特征在于,包括:
图像获取单元,用于获得目标图像;
提取单元,用于对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息;
处理单元,用于在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
7.如权利要求6所述的装置,其特征在于,所述处理单元具体用于使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
8.如权利要求7所述的装置,其特征在于,所述处理单元用于确定所述每个区域聚类的合法性具体包括:
所述处理单元用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
9.如权利要求6-8任意一项所述的装置,其特征在于,其中,
所述图像获取单元,还用于获取样本图像,并转换为样本图像模型;
所述目标图像的处理装置还包括:更新单元,用于使用当前获取的样本图像模型更新存储的样本图像模型;
所述提取单元进一步包括:
提取子单元,用于将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
10.如权利要求9所述的装置,其特征在于,所述目标图像的处理装置还包括:
存储单元,用于存储更新前后的所述样本图像模型。
11.一种虚拟现实终端,其特征在于,包括:
第一硬件处理器,用于获得目标图像;
第二硬件处理器,用于对所述目标图像采用超像素进行分割而获得多个区域,并提取所述目标图像的边缘轮廓信息和形状信息;在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束。
12.如权利要求11所述的虚拟现实终端,其特征在于,所述第二硬件处理器用于在所述每个区域聚类的时候使用所述边缘轮廓信息和形状信息进行约束具体包括:
所述第二硬件处理器用于使用所述边缘轮廓信息和形状信息确定每个区域聚类的方向和合法性,其中所述边缘轮廓信息和形状信息表示无拐点。
13.如权利要求12所述的虚拟现实终端,其特征在于,所述第二硬件处理器用于确定所述每个区域聚类的合法性具体包括:
所述第二硬件处理器用于确定所述每个区域聚类是否满足预定要求,如果其中某个区域聚类满足预定要求,确定当前该区域聚类正确,否则,确定当前该区域聚类错误。
14.如权利要求11-13任意一项所述的虚拟现实终端,其特征在于,
所述第一硬件处理器还用于获取样本图像,并转换为样本图像模型;
所述第二硬件处理器还用于使用当前获取的样本图像模型更新存储的样本图像模型;将所述提取的所述目标图像与更新后的样本图像模型进行匹配,如果匹配成功则提取目标图像的边缘轮廓信息和形状信息。
15.如权利要求14所述的虚拟现实终端,其特征在于,所述虚拟现实终端还包括:
存储器,用于存储更新前后的所述样本图像模型。
CN201610620788.5A 2016-08-01 2016-08-01 一种虚拟现实终端以及目标图像的提取方法和装置 Pending CN106295639A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610620788.5A CN106295639A (zh) 2016-08-01 2016-08-01 一种虚拟现实终端以及目标图像的提取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610620788.5A CN106295639A (zh) 2016-08-01 2016-08-01 一种虚拟现实终端以及目标图像的提取方法和装置

Publications (1)

Publication Number Publication Date
CN106295639A true CN106295639A (zh) 2017-01-04

Family

ID=57663920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610620788.5A Pending CN106295639A (zh) 2016-08-01 2016-08-01 一种虚拟现实终端以及目标图像的提取方法和装置

Country Status (1)

Country Link
CN (1) CN106295639A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256017A (zh) * 2017-04-28 2017-10-17 中国农业大学 路线规划方法及系统
CN110458855A (zh) * 2019-07-08 2019-11-15 安徽淘云科技有限公司 图像提取方法及相关产品
CN110471102A (zh) * 2019-08-19 2019-11-19 苏州瑞派宁科技有限公司 一种识别位置谱的方法、装置及计算机存储介质
CN110705427A (zh) * 2019-09-25 2020-01-17 中国人民解放军61646部队 一种遥感图像目标区域的提取处理方法及装置
CN111760290A (zh) * 2020-06-11 2020-10-13 网易(杭州)网络有限公司 一种信息处理方法、装置、计算机设备和存储介质
CN111950365A (zh) * 2020-07-07 2020-11-17 广东农工商职业技术学院 图像的区域识别方法、装置、设备以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077765A (zh) * 2013-03-26 2014-10-01 富士通株式会社 图像分割装置、图像分割方法和程序
CN104318558A (zh) * 2014-10-17 2015-01-28 浙江大学 复杂场景下基于多信息融合的手势分割方法
CN104537676A (zh) * 2015-01-12 2015-04-22 南京大学 一种基于在线学习的渐进式图像分割方法
CN105118049A (zh) * 2015-07-22 2015-12-02 东南大学 一种基于超像素聚类的图像分割方法
CN105117734A (zh) * 2015-07-28 2015-12-02 江南大学 基于模型在线更新的玉米种子高光谱图像分类识别方法
CN105427292A (zh) * 2015-11-11 2016-03-23 南京邮电大学 一种基于视频的显著目标检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077765A (zh) * 2013-03-26 2014-10-01 富士通株式会社 图像分割装置、图像分割方法和程序
CN104318558A (zh) * 2014-10-17 2015-01-28 浙江大学 复杂场景下基于多信息融合的手势分割方法
CN104537676A (zh) * 2015-01-12 2015-04-22 南京大学 一种基于在线学习的渐进式图像分割方法
CN105118049A (zh) * 2015-07-22 2015-12-02 东南大学 一种基于超像素聚类的图像分割方法
CN105117734A (zh) * 2015-07-28 2015-12-02 江南大学 基于模型在线更新的玉米种子高光谱图像分类识别方法
CN105427292A (zh) * 2015-11-11 2016-03-23 南京邮电大学 一种基于视频的显著目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王青苗: "基于超像素分割的视觉显著性检测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256017A (zh) * 2017-04-28 2017-10-17 中国农业大学 路线规划方法及系统
CN107256017B (zh) * 2017-04-28 2020-08-04 中国农业大学 路线规划方法及系统
CN110458855A (zh) * 2019-07-08 2019-11-15 安徽淘云科技有限公司 图像提取方法及相关产品
CN110471102A (zh) * 2019-08-19 2019-11-19 苏州瑞派宁科技有限公司 一种识别位置谱的方法、装置及计算机存储介质
CN110471102B (zh) * 2019-08-19 2021-06-01 苏州瑞派宁科技有限公司 一种识别位置谱的方法、装置以及计算机存储介质
CN110705427A (zh) * 2019-09-25 2020-01-17 中国人民解放军61646部队 一种遥感图像目标区域的提取处理方法及装置
CN111760290A (zh) * 2020-06-11 2020-10-13 网易(杭州)网络有限公司 一种信息处理方法、装置、计算机设备和存储介质
CN111950365A (zh) * 2020-07-07 2020-11-17 广东农工商职业技术学院 图像的区域识别方法、装置、设备以及存储介质
CN111950365B (zh) * 2020-07-07 2023-11-14 广东农工商职业技术学院 图像的区域识别方法、装置、设备以及存储介质

Similar Documents

Publication Publication Date Title
CN106295639A (zh) 一种虚拟现实终端以及目标图像的提取方法和装置
CN107230204B (zh) 一种从胸部ct图像中提取肺叶的方法及装置
Rafique et al. Statistical multi-objects segmentation for indoor/outdoor scene detection and classification via depth images
CN104834922B (zh) 基于混合神经网络的手势识别方法
CN107168527A (zh) 基于区域卷积神经网络的第一视角手势识别与交互方法
WO2019174276A1 (zh) 用于定位目标物体区域中心的图像处理方法、装置、设备和介质
CN105740945A (zh) 一种基于视频分析的人群计数方法
WO2007047461A9 (en) Bi-directional tracking using trajectory segment analysis
CN104537689B (zh) 基于局部对比显著性联合特征的目标跟踪方法
CN110837768A (zh) 一种面向珍稀动物保护的在线检测与识别方法
CN105405136A (zh) 一种基于粒子群算法的自适应脊柱ct图像分割方法
CN107798313A (zh) 一种人体姿态识别方法、装置、终端和存储介质
CN111160407A (zh) 一种深度学习目标检测方法及系统
CN109102514A (zh) 一种图像分割方法、装置、设备及计算机可读存储介质
CN110992378B (zh) 基于旋翼飞行机器人的动态更新视觉跟踪航拍方法及系统
CN110276764A (zh) 基于K值估计的K-Means水下图像背景分割改进算法
CN106778767B (zh) 基于orb和主动视觉的视觉图像特征提取及匹配方法
Juneja et al. Energy based methods for medical image segmentation
CN105678773B (zh) 一种低对比度图像分割方法
JP4567660B2 (ja) 電子画像内で物体のセグメントを求める方法
Pot et al. Self-supervisory signals for object discovery and detection
CN113705579A (zh) 一种视觉显著性驱动的图像自动标注方法
CN109359653A (zh) 一种棉花叶部粘连病斑图像分割方法和系统
CN111428555B (zh) 一种分关节的手部姿态估计方法
CN104463889B (zh) 一种基于cv模型的无人机自主着陆目标提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170104