CN109522911A - 一种图像形状的编码方法 - Google Patents
一种图像形状的编码方法 Download PDFInfo
- Publication number
- CN109522911A CN109522911A CN201811145800.7A CN201811145800A CN109522911A CN 109522911 A CN109522911 A CN 109522911A CN 201811145800 A CN201811145800 A CN 201811145800A CN 109522911 A CN109522911 A CN 109522911A
- Authority
- CN
- China
- Prior art keywords
- image
- shape coding
- coding method
- feature
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像形状编码方法,包括步骤:1)提取原图像显著特征,获得显著特征图;2)对显著特征图二值化,获得二值特征图;3)对二值特征图形状编码,获得形状编码图。本发明的图像形状编码方法应用于CNN的学习后在实验中所能取得的最高识别准确率,普遍高于不使用该方法时所能取得的最高识别准确率。因此,本发明有助于提升CNN的图像识别能力。
Description
技术领域
本发明涉及图像处理中的图像编码,特别涉及图像形状的编码方法。
背景技术
卷积神经网络(Convolutional Neural Network,CNN)是一种高效的智能图像识别方法,已经在许多领域的实际应用中取得了优异的成果。但有研究表明,目前常用的CNN通常只能学习到图像的中低层特征(边缘、纹理)而没能获得描述图像的全局结构的高级语义特征(形状、结构),这使得CNN在进行图像识别时会出现错识(将两张不同的图像识别为相同的对象)、漏识(将两张相似的图像识别为不同的对象)的问题,限制了CNN所能达到的最高识别准确率。因此,若能将形状特征引入CNN的学习中,必将令CNN的识别准确率有所提高,进一步地,将有效促进图像识别相关工作的发展。
发明内容
本发明的目的是提供一种对图像形状进行编码的方法,将编码后的图像交予CNN进行学习可克服其在一般情况下无法获取图像高级语义特征的问题。
为实现上述目的,对图像形状进行编码的方法包括步骤:
步骤1)、使用中央周边差算子对原图像进行卷积,获得显著特征图;
步骤2)、对步骤1)中得到的显著特征图进行二值化操作,得到由取零值的非显著点和取非零值的显著点组成的二值特征图;
步骤3)、构造一个二维矩阵,亦即形状编码图统计步骤2)中得到的二值特征图中的显著点对的出现频率。
本发明的形状编码方法应用于CNN的学习后在实验中所能取得的最高识别准确率,普遍高于不使用该方法时所能取得的最高识别准确率。因此,本发明有助于提升CNN的图像识别能力。
附图说明
图1为通过用中央周边差算子对原图像进行卷积,获得显著特征图的示意图;
图2为对显著特征图进行二值化操作的示意图;
图3为将原始的人脸图像转换为二值特征图的示例图;
图4为构建形状编码图、统计二值特征图中显著点对的出现频度的示意图;
图5为对二值特征图进行形状编码的示例图;
图6为将图3中的二值特征图转换为相应的形状编码图的示例图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步说明。
一种图像形状的编码方法,包括:
步骤1)、提取图像显著特征;
步骤2)、将显著特征图像转换为二值特征图像;
步骤3)、对二值特征图像进行形状编码。
在所述的步骤1)中,使用中央周边差算子对原图像进行卷积,从而得到显著特征图像。
在所述的步骤2)中,指定一个阈值,将图像中像素点值小于该阈值的像素点的值置零,令显著特征图像转换为只包含零值和非零值像素点的二值特征图像。
在所述的步骤3)中,统计二值特征图中的各类显著点对的出现频度并在一个二维矩阵亦即形状编码图中进行记录。
统计显著点对时只将第二个显著点在纵轴方向上坐标值大于或等于第一个显著点对的显著点对,即△y≥0的显著点对。
形状编码图的宽度为二值特征图的宽度,长度为2倍的二值特征图的长度减一。
显著点对是记录方式是以形状编码图第一行中间列的像素点为原点建立直角坐标系,然后将空间关系为(△x,△y)的显著点对的数量作为在直角坐标系中位于坐标为(△x,△y)处的像素点的值。
参见图1的示意图,假设有一幅大小为5×5的输入图像I如图1(a)所示,首先使用如图1(b)所示的大小为3×3的中央周边差算子作为卷积核对I进行卷积。这一卷积操作的目的在于提取出原图像I的显著特征,得到包含有原图像显著特征的如图1(c)所示的显著特征图。
然后如图2所示,对前一步中得到的显著特征图进行二值化操作,得到如图2(b)所示的由显著点(非零值的像素点)和非显著点(零值的像素点)组成的二值特征图。
参见图3的示例图,图3中的(a)为一张192×168的人脸图像,通过上述运算依次提取其显著特征并进行二值化后的结果是如图3中的(b)所示的二值特征图。从图3中的(b)可以看出,通过上述运算得到的二值特征图保留了原始人脸图像中的面部轮廓特征。尽管如此,这样的特征图中仍然只具有原图像的低层特征,为了能获得原图像的高层特征,还需要对其做进一步的变换。
对二值特征图进行形状编码是本发明的方法的核心。设有一个包含9个像素点的3×3的图像,其中有2个像素点是显著点(黑点),其余7个点为非显著点。参见图4的示意图,在图4中的(a)中以位于图像第一行第一列的像素点为坐标原点建立直角坐标系,则在此直角坐标系中,两个显著点在x轴和y轴方向上的距离分别为-1和2,即△x=-1,△y=2。然后统计这样的有着相同空间关系(△x,△y)的显著点对,并记录在一个新的二维矩阵亦即形状编码图中,其宽度与原图像相等,长度则为2倍的原图像长度减1。
以形状编码图第一行中间列的像素点为原点建立直角坐标系,在这个直角坐标系中进行上述记录工作。例如,对于在原图像中距离为△x=-1,△y=2的显著点对,在形状编码图的第二列第三行将这类显著点对的数量记录为1,如图4中的(b)所示。
参见图5的示意图,在形状编码的过程中,只取二值特征图像中在y轴方向上距离为非负数(即△y≥0)的显著点对。这是因为在统计显著点对的过程中,需要对二值特征图像中的每一个显著点进行遍历,统计其与其它所有显著点所构成的点对,而后者在y轴方向上的坐标值通常大于或等于前者。如对于如图4中的(a)中的两个显著点,在统计时只记录为一组距离为△x=-1,△y=2的点对,而不记录△x=1,△y=-2的点对,这样可以在形状编码时减少冗余特征、避免数据维度无意义地扩大。
参见图6的示例图,通过对图3中的二值特征图进行形状编码所得到的结果即为图6(b)的形状编码图。该图像中颜色越明亮(如图像中部)表示对应的显著点对的出现频度越高,相对地,颜色越暗淡(如图像右下角处)则表示对应的显著点对的出现频度越低。
Claims (7)
1.一种图像形状的编码方法,包括:
步骤1)、提取图像显著特征;
步骤2)、将显著特征图像转换为二值特征图像;
步骤3)、对二值特征图像进行形状编码。
2.根据权利要求1所述的一种图像形状编码方法,其特征在于,在所述的步骤1)中,使用中央周边差算子对原图像进行卷积,从而得到显著特征图像。
3.根据权利要求1所述的一种图像形状编码方法,其特征在于,在所述的步骤2)中,指定一个阈值,将图像中像素点值小于该阈值的像素点的值置零,令显著特征图像转换为只包含零值和非零值像素点的二值特征图像。
4.根据权利要求1所述的一种图像形状编码方法,其特征在于,在所述的步骤3)中,统计二值特征图中的各类显著点对的出现频度并在一个二维矩阵亦即形状编码图中进行记录。
5.根据权利要求4所述的一种图像形状编码方法,其特征在于,统计显著点对时只将第二个显著点在纵轴方向上坐标值大于或等于第一个显著点对的显著点对,即△y≥0的显著点对。
6.根据权利要求4所述的一种图像形状编码方法,其特征在于,形状编码图的宽度为二值特征图的宽度,长度为2倍的二值特征图的长度减一。
7.根据权利要求4所述的一种图像形状编码方法,其特征在于,显著点对是记录方式是以形状编码图第一行中间列的像素点为原点建立直角坐标系,然后将空间关系为(△x,△y)的显著点对的数量作为在直角坐标系中位于坐标为(△x,△y)处的像素点的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811145800.7A CN109522911A (zh) | 2018-09-29 | 2018-09-29 | 一种图像形状的编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811145800.7A CN109522911A (zh) | 2018-09-29 | 2018-09-29 | 一种图像形状的编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109522911A true CN109522911A (zh) | 2019-03-26 |
Family
ID=65771577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811145800.7A Pending CN109522911A (zh) | 2018-09-29 | 2018-09-29 | 一种图像形状的编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109522911A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0831657B1 (en) * | 1996-09-18 | 2002-06-26 | Sharp Kabushiki Kaisha | Vertex-based hierarchical shape representation and coding method and apparatus |
CN1515110A (zh) * | 2001-06-06 | 2004-07-21 | 夏普株式会社 | 图像编码方法和图像设备 |
CN102129698A (zh) * | 2011-03-08 | 2011-07-20 | 华中科技大学 | 一种基于感兴趣区域的图像编码方法 |
CN103442231A (zh) * | 2013-08-19 | 2013-12-11 | 中山大学深圳研究院 | 一种视频编码的方法 |
US8798383B1 (en) * | 2011-03-28 | 2014-08-05 | UtopiaCompression Corp. | Method of adaptive structure-driven compression for image transmission over ultra-low bandwidth data links |
CN105158275A (zh) * | 2014-11-18 | 2015-12-16 | 北京农业智能装备技术研究中心 | 基于近红外编码点阵结构光的苹果果梗/花萼检测方法 |
-
2018
- 2018-09-29 CN CN201811145800.7A patent/CN109522911A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0831657B1 (en) * | 1996-09-18 | 2002-06-26 | Sharp Kabushiki Kaisha | Vertex-based hierarchical shape representation and coding method and apparatus |
CN1515110A (zh) * | 2001-06-06 | 2004-07-21 | 夏普株式会社 | 图像编码方法和图像设备 |
CN102129698A (zh) * | 2011-03-08 | 2011-07-20 | 华中科技大学 | 一种基于感兴趣区域的图像编码方法 |
US8798383B1 (en) * | 2011-03-28 | 2014-08-05 | UtopiaCompression Corp. | Method of adaptive structure-driven compression for image transmission over ultra-low bandwidth data links |
CN103442231A (zh) * | 2013-08-19 | 2013-12-11 | 中山大学深圳研究院 | 一种视频编码的方法 |
CN105158275A (zh) * | 2014-11-18 | 2015-12-16 | 北京农业智能装备技术研究中心 | 基于近红外编码点阵结构光的苹果果梗/花萼检测方法 |
Non-Patent Citations (1)
Title |
---|
田昕等: "卫星应用中基于视觉显著性的感兴趣区域图像编码算法", 《光电工程》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ling et al. | Fast interactive object annotation with curve-gcn | |
CN109993269B (zh) | 基于注意力机制的单张图像人群计数方法 | |
Hori et al. | Raster-to-vector conversion by line fitting based on contours and skeletons | |
WO2016153697A1 (en) | Multi-layer skin detection and fused hand pose matching | |
CN105631486A (zh) | 图像文字识别方法及装置 | |
CN105005760A (zh) | 一种基于有限混合模型的行人再识别方法 | |
CN109059922A (zh) | 移动机器人定位方法、装置和系统 | |
US9552532B2 (en) | System and method for describing image outlines | |
CN109614933A (zh) | 一种基于确定性拟合的运动分割方法 | |
CN107292212B (zh) | 一种低信噪比环境下的二维码定位方法 | |
CN113015022A (zh) | 行为识别方法、装置、终端设备及计算机可读存储介质 | |
CN104680531A (zh) | 一种连通量统计信息提取方法及vlsi结构 | |
US20240020923A1 (en) | Positioning method based on semantic information, device and computer-readable storage medium | |
CN111507337A (zh) | 基于混合神经网络的车牌识别方法 | |
CN102831428A (zh) | 图像内快速响应矩阵码区域的提取方法 | |
CN101814141A (zh) | 存储介质、字符识别方法以及字符识别设备 | |
CN109522911A (zh) | 一种图像形状的编码方法 | |
CN110969163A (zh) | 一种检测图像中文本信息的方法 | |
Wu et al. | A rectangle detection method for real-time extraction of large panel edge | |
CN110532826A (zh) | 一种基于人工智能语义分割的条码识别装置与方法 | |
CN115909378A (zh) | 单据文本检测模型的训练方法及单据文本检测方法 | |
CN115205361A (zh) | 深度图像补全方法、装置、设备及存储介质 | |
CN114998283A (zh) | 一种镜头遮挡物检测方法及装置 | |
Shao et al. | Grouped outlier removal for robust ellipse fitting | |
CN113822092A (zh) | 用于定位位置探测图形的方法及装置、电子设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190326 |
|
RJ01 | Rejection of invention patent application after publication |