CN103971113B - 图像的识别方法与电子装置 - Google Patents
图像的识别方法与电子装置 Download PDFInfo
- Publication number
- CN103971113B CN103971113B CN201310061277.0A CN201310061277A CN103971113B CN 103971113 B CN103971113 B CN 103971113B CN 201310061277 A CN201310061277 A CN 201310061277A CN 103971113 B CN103971113 B CN 103971113B
- Authority
- CN
- China
- Prior art keywords
- chroma
- source image
- image
- texture
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 239000011159 matrix material Substances 0.000 claims description 79
- 230000007704 transition Effects 0.000 claims description 69
- 238000006243 chemical reaction Methods 0.000 claims description 50
- 239000003086 colorant Substances 0.000 claims description 29
- 230000001131 transforming effect Effects 0.000 claims description 26
- 238000009434 installation Methods 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 16
- 230000006798 recombination Effects 0.000 claims description 14
- 238000005215 recombination Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 230000001186 cumulative effect Effects 0.000 claims description 10
- 238000009825 accumulation Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 208000031481 Pathologic Constriction Diseases 0.000 claims description 4
- 238000003909 pattern recognition Methods 0.000 claims description 4
- 210000001215 vagina Anatomy 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 230000009471 action Effects 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000004590 computer program Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 14
- 238000010606 normalization Methods 0.000 description 5
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 2
- 235000017491 Bambusa tulda Nutrition 0.000 description 2
- 241001330002 Bambuseae Species 0.000 description 2
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 2
- 239000011425 bamboo Substances 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 235000012364 Peperomia pellucida Nutrition 0.000 description 1
- 240000007711 Peperomia pellucida Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20052—Discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明为一种图像的识别方法、具有图像识别功能的电子装置,与通过软件程序执行图像识别方法的计算机程序产品。图像的识别方法包含以下步骤:对一彩色来源图像进行纹理特征撷取后,得出多个纹理参数;对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差;以及,对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数。
Description
技术领域
本发明涉及一种图像的识别方法、电子装置与计算机程序产品,特别是涉及一种根据纹理特征、色彩属性而判断的图像的识别方法、电子装置与计算机程序产品。
背景技术
随着网络的普及,让使用者快速找到信息的搜寻引擎也日益重要。绝大多数搜寻引擎仅提供了文字搜寻的功能,即,由使用者输入关键字后,查询网络上的相关文章。
然而,现今因特网上的信息,举凡购物网站、新闻网站或者产品介绍,数字图片占了相当大的比例。因此,除了传统的文字搜寻功能外,针对图片的内容提供搜寻功能的需求亦不可小觑。
尽管部分的搜寻引擎提供了图片搜寻的功能,但是其技术还是以文字搜寻图片为主。即,使用者必须输入关键字后,再根据文字来寻找相关的图片。此种做法并不是真正对数据库或网络上的图片进行检索,而是针对每个图片提供元数据(metadata)的字段。也就是通过元数据的字段,对每张图片的内容提供说明或关键字。其后,当使用者希望找寻图案时,搜寻引擎便根据这些元数据的文字内容而寻找图片。
换言之,采用元数据的方式进行图片搜寻的前提是,图片数据库的内容必须先经过事先的判读处理,据以先取得元数据后,才能用来做为搜寻图片时的判断基础。
如果使用者希望以手边的图片为检索依据,希望通过搜寻引擎取得与手边图片相对应的图像时,采用元数据字段方式的检索便无法派上用场。
因此,直接以图片在图片数据库中寻找相似图片的搜寻方法,仍有发展的必要。
发明内容
本发明的一方面为一种图像的识别方法,包含以下步骤:对一彩色来源图像进行纹理特征撷取后,得出多个纹理参数;对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差;以及,对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数。
本发明的另一方面为一个具有图案识别功能的电子装置,包含:一储存单元,其是储存一彩色来源图像;以及,一纹理判断单元,电连接于该储存单元,其是对该彩色来源图像进行纹理特征撷取后,得出多个纹理参数;一色彩判断单元,电连接于该储存单元,其是对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差;以及,一识别单元,电连接于该纹理判断单元与该色彩判断单元,其是对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数。
本发明的再一方面为一种计算机程序产品,其上储存有一软件程序,该软件程序执行时将使具有一控制器的一电子装置进行一图像的识别方法,该图像的识别方法包括下列步骤:对一彩色来源图像进行纹理特征撷取后,得出多个纹理参数;对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差;以及,对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数。
本发明的又一方面为一种图像的识别方法,包含以下步骤:分别对一第一彩色来源图像、一第二彩色来源图像进行纹理特征撷取后,得出多个第一纹理参数、多个第二纹理参数;分别对这些第一纹理参数、这些第二纹理参数进行加权运算后,得出与该第一彩色来源图像、该第二彩色来源图像相对应的一第一纹理识别参数、一第二纹理识别参数;以及,根据该第一纹理识别参数、该第二纹理识别参数而识别该第一彩色来源图像与该第二彩色来源图像间的相似程度。
本发明的一方面为一种图像的识别方法,包含以下步骤:分别对一第一彩色来源图像、一第二彩色来源图像进行色彩特征撷取后,得出多个第一彩度动差、多个第二彩度动差;分别对这些第一彩度动差、这些第二彩度动差进行加权运算后,得出与该第一彩色来源图像、该第二彩色来源图像相对应的一第一色彩识别参数、一第二色彩识别参数;以及,根据该第一色彩识别参数、该第二色彩识别参数而识别该第一彩色来源图像与该第二彩色来源图像间的相似程度。
为了对本发明的上述及其他方面有更佳的了解,下文特举实施例,并配合附图详细说明如下。
附图说明
图1,其绘示本发明针对彩色来源图像,进行识别的流程图。
图2A,其是以原色表示法表示的彩色来源图像的示意图。
图2B,其是将彩色来源图像转换为灰阶来源图像的示意图。
图3A,其是将灰阶来源图像区分为多个灰阶区块的示意图。
图3B,其是本发明针对个别的灰阶区块进行离散余弦转换的示意图。
图4,其是对灰阶来源图像进行离散余弦转换后,个别的灰阶区块所对应得出的区块转换矩阵的示意图。
图5A,其是对各个灰阶区块分别进行离散正弦转换后,产生与各个灰阶区块相对应的多个区块转换矩阵的示意图。
图5B,其是将图5A的每个区块转换矩阵进行累加的示意图。
图5C,其是本发明根据区块转换矩阵的累加而得出图像转换矩阵的示意图。
图6,其是本发明针对纹理特征进行判断的流程图。
图7A,其是以原色表示法表示的彩色来源图像的示意图。
图7B,其是将彩色来源图像转换为色度表示法的示意图。
图8,其是将彩色来源图像的色度像素点,由色度数值转换为正规化色度值的示意图。
图9,其是根据第一正规化色度值与第二正规化色度值,而将彩色来源图像映射于彩度平面的示意图。
图10A、10B,其是本发明针对色彩特征进行判断的流程图。
图11,其是根据纹理参数与彩度动差而进一步产生图像识别参数的示意图。
图12A,其是假设一用于比对的第一彩色来源图像的示意图。
图12B,其是利用第二彩色来源图像比对第一彩色来源图像而判断两者的相似性的示意图。
图13,其是本发明的具有图案识别功能的电子装置的方块图。
图14,其是针对三个彩色来源图像进行图像识别的示意图。
附图符号说明
电子装置 5
储存单元 51
纹理判断单元 53
色彩判断单元 55
识别单元 57
灰阶转换模块 531
离散正弦转换模块 533
纹理特征撷取模块 535
区块分割模块 537
累加模块 539
彩度转换模块 551
映射模块 553
像素点累计模块 555
彩色特征撷取模块 557
具体实施方式
由于现有技术使用拟信息做为图像搜寻的依据,导致搜寻引擎无法有效的提供以图找图(Content-based image retrieval,简称为CBIR)的功能。为此,本发明提供了藉由图像的纹理特征与色彩特征所代表的特征,做为图像搜寻的判断基础的做法。
请参照图1,其绘示本发明针对彩色来源图像,进行识别的流程图。
其中,步骤S11代表的左侧分支流程,用于对彩色来源图像进行纹理特征撷取后,得出多个纹理参数。步骤S12代表的右侧分支流程,用于对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差。
接着,再利用步骤S13,对于纹理参数组成的纹理识别参数Ftexture,与彩度动差组成的色彩识别参数Fcolor进行加权运算后,得出与彩色来源图像相对应的图像识别参数Fpic。
承上,本发明的图像识别方法利用步骤S11产生纹理识别参数Ftexture,用以代表图像的纹理特征;以及,利用步骤S12产生色彩识别参数Fcolor,用以代表判断图像的色彩特征。这两个步骤的细部流程可以同时或先后进行。
更进一步的,当数据库存有多个彩色来源图像,并对这些彩色来源图像进行图1的流程时,本发明亦能针对每个彩色来源图像提供相对应的图像识别参数。
假设待测的图像为彩色来源图像A,先对彩色来源图像A进行图1的识别流程后,将得出与这个待测的彩色来源图像A相对应的图像识别参数Fpic-A。
接着,再将图像识别参数Fpic-A,与数据库中预存的多个图像识别参数进行比对。在预存的多个图像识别参数中,最接近图像识别参数Fpic-A者,其所对应的彩色来源图像,便是在数据库中,与彩色来源图像A最相似的图像。
本发明的识别流程可区分为两个判断面向:其一为针对纹理特征做为图像识别的判断基础;其二则是根据色彩特征做为图像识别的判断基础。本发明结合这两种判断面向,通过加权运算的方式,产生与彩色来源图像相对应的图像识别参数。以下依序说明这两个判断面向。附带一提的是,实际应用时,这两个面向亦可个别用于判断图像的相似性。
首先说明本发明如何利用图像的纹理特征做为图像识别的判断基础。纹理特征指的是图像中的物体如何构成图像,例如:图像中的人物的头发流线、图像中的人物穿着条纹衣物、图像的内容为竹林的画面时,则这些图像会具有不同的纹理特征。此处与来源图像相对应的纹理特征可大致区分为平滑纹理特征、纵向纹理特征、横向纹理特征、斜向纹理特征。
请参见图2A,其是以原色表示法表示的彩色来源图像的示意图。其中,彩色来源图像包含MxN个彩色像素点。为了便于说明,此处假设M=N=40,但是实际应用并不以此为限。即,图像的解析度与尺寸均可由本领域技术人员自由代换与应用。
彩色来源图像所包含的MxN个彩色像素点,分别对应于第一原色数值(R,代表红色数值)、第二原色数值(G,代表绿色数值)、第三原色数值(B,代表蓝色数值)。
以此实施例而言,本发明首先会对40x40=1600个彩色像素点,分别进行灰阶转换,进而得出1600个灰阶像素点。其中,彩色像素点所对应的原色数值(R、G、B),将通过灰阶转换,得出与灰阶像素点相对应的灰阶值(gray level)。
以第一列第一行位置上的像素点p(1,1)为例,原本对应于原色数值RGB_p(1,1),经由灰阶转换后,得出灰阶值Gray_p(1,1)。
本发明可根据如式1的灰阶转换公式,将彩色来源图像所包含的彩色像素点分别转换为灰阶像素点。
灰阶像素点的灰阶值
=0.299*第一原色数值(R)+0.587*第二原色数值(G)+0.114*第三原色数值(B)………………………(式1)
在式1中,定义了与第一原色数值(R)相对应的第一原色转换权重(例如:0.299)、与第二原色数值(G)相对应的第二原色转换权重(例如:0.587)、与第三原色数值(B)相对应的第三原色转换权重(例如:0.114)。
此处,灰阶像素所对应的灰阶值,是根据彩色像素点所具有的第一原色数值与第一原色转换权重的乘积、第二原色数值与第二原色转换权重的乘积、第三原色数值与第三原色转换权重的乘积,进一步加总而得出。
将MxN个彩色像素点转换为灰阶像素点后,相当于将图2A所示的彩色来源图像转换为图2B所示的灰阶来源图像。
请参见图2B,其是将彩色来源图像转换为灰阶来源图像的示意图。
此图的灰阶像素点与图2A的彩色像素点之间具有一对一的对应关系。即,第一列第一行的灰阶像素点Gray_p(1,1)的灰阶值是由图2A中,第一列第一行的彩色像素点RGB_p(1,1)进行灰阶转换而得出的。
接着,将灰阶图像区分为多个灰阶区块。
请参见图3A,其是将灰阶来源图像区分为多个灰阶区块的示意图。灰阶区块所各自包含的像素点个数,会因应离散正弦转换的运算方式而决定。例如:此处以8x8的灰阶区块作为离散正弦转换的基本单位。因此,此处将图像区分为多个8x8像素点所组成的灰阶区块。由于这里假设M=N=40,图3A共可区分为5x5个灰阶区块。
也就是说,灰阶区块的数量与灰阶区块所各自包含的像素点个数,将因应彩色来源图像的尺寸与离散正弦转换的运算方式(基本单位)而决定。
请参见图3B,其是本发明针对个别的灰阶区块进行离散余弦转换的示意图。在此实施例中,相当于对5x5=25个灰阶区块分别进行离散余弦转换(Discrete CosineTransform,简称为DCT),通过离散余弦转换而将灰阶图像转换至频域。
进行离散余弦转换时,灰阶区块与区块转换矩阵的位置彼此对应。例如,第一列第一行的灰阶区块将对应转换得出位于第一列第一行的区块转换矩阵。
请参见图4,其是对灰阶来源图像进行离散余弦转换后,个别的灰阶区块所对应得出的区块转换矩阵的示意图。此图代表对灰阶来源图像所包含的5x5个灰阶区块进行离散余弦转换后,将对应得出5x5个区块转换矩阵。
在此图中,每一个区块转换矩阵所包含的转换数值,可根据转换数值所在的位置而区分为不同的区域。此处以放大后的第一列第一行的区块转换矩阵dct_B(1,1)为例,共可区分为平滑纹理区、纵向纹理区、横向纹理区、斜向纹理区、高频。
经由离散余弦转换后的图像,在其频率域的不同位置上的转换数值可以用来显示来源图像的纹理强弱以及方向。
其中,当位于区块转换矩阵的左上角的平滑纹理区(DC)中,具有较大的转换数值时,代表彩色来源图像中,大多数由平滑的区域所构成。
当位于区块转换矩阵的右上角的纵向纹理区(Vertical),具有较大的转换数值时,代表彩色来源图像中,大多数的区域为纵向的分布。例如:彩色来源图像的内容为竹林。
当位于区块转换矩阵的左下角的横向纹理区(Horizontal),具有较大的转换数值时,代表彩色来源图像中,大多数的区域为横向的分布。例如:彩色来源图像包含穿着囚衣的人物。
当位于区块转换矩阵的中间的斜向纹理区(Slash)中,具有较大的转换数值时,代表彩色来源图像中,大多数的区域具有斜向的线条。例如:彩色来源图像为雨天的画面。
此外,一般的图像在进行离散余弦转换时,区块转换矩阵的右下角所代表的高频区域(High Frequency)均相当的小,因而可以忽略不计。
请参见图5A,其是对各个灰阶区块分别进行离散正弦转换后,产生与各个灰阶区块相对应的多个区块转换矩阵的示意图。其中,每一个区块转换矩阵都各自具有如图4所述的特性。
请参见图5B,其是将图5A的每个区块转换矩阵进行累加的示意图。本发明针对图5A所示的5x5个区块转换矩阵,将相对应位置的转换数值进行累加,进而得出如图5C所示的图像转换矩阵。
请参见图5C,其是本发明根据区块转换矩阵的累加而得出图像转换矩阵的示意图。图像转换矩阵的每一个数值都是根据图5B的累加而得出,因此,同样可区分为平滑纹理区、纵向纹理区、横向纹理区与与斜向纹理区。
至此,整张彩色来源图像的纹理特征已被萃取出来,并以能量化的数值储存。
据此,本发明进一步定义多个纹理参数。纹理参数包含:与平滑纹理区相对应的平滑纹理参数EDC、与纵向纹理区相对应的纵向纹理参数EV、与横向纹理区相对应的横向纹理参数EH,以及与斜向纹理区相对应的斜向纹理参数ES。各个纹理参数的表示公式如下:
平滑纹理参数……………………(式2)
斜向纹理参数………………………(式3)
纵向纹理参数………………………(式4)
横向纹理参数……………………(式5)
请参见图6,其是本发明针对纹理特征进行判断的流程图。此图汇整了图2A、2B、3A、3B、4、5A、5B、5C的作法。
首先,对彩色来源图像进行灰阶转换而产生灰阶来源图像(步骤S21,图2A、2B)。
其次,对灰阶来源图像进行离散正弦转换而产生至少一个区块转换矩阵(步骤S23)。其中,S23进一步包含以下步骤:将灰阶来源图像区分为至少一个灰阶区块(步骤S231,图3A);以及,分别对灰阶区块进行离散正弦转换后,产生与灰阶区块相对应的区块转换矩阵(步骤S233,图3B、4、5A)。
承上,每一个区块转换矩阵均包含多个转换数值,例如:进行8x8DCT转换时,包含8x8个转换数值。当区块转换矩阵的数量为多个(5x5个)时,
接着,根据区块转换矩阵而得出纹理参数(步骤S25,图5B、5C)。
步骤S25进一步包含:累加区块转换矩阵而得出图像转换矩阵,其中图像转换矩阵包含多个累加转换数值(步骤S251,图5B);将图像转换矩阵区分为平滑纹理区、纵向纹理区、横向纹理区、斜向纹理区与高频区(步骤S253);以及,根据平滑纹理区、纵向纹理区、横向纹理区、斜向纹理区而得出平滑纹理参数EDC、纵向纹理参数EV、横向纹理参数EH,以及斜向纹理参数ES(步骤S255)。
参考图5B的说明可以得知,当区块转换矩阵的个数为多个时,步骤S25可进一步将位于第一区块转换矩阵的第一位置的转换数值与位于第二区块转换矩阵的第一位置的转换数值相加;对各区块转换矩阵的第一位置的转换数值重复前述步骤;以及,对各个区块转换矩阵的每一个位置的转换数值重复前述步骤后得出图像转换矩阵。
接着说明本发明如判断图像的色彩特征:
请参见图7A,其是以原色表示法表示的彩色来源图像的示意图。
首先假设色度转换矩阵为:
通过色度转换矩阵,可以将彩色来源图像所包含的彩色像素点所对应的第一原色数值(R)、第二原色数值(G)、第三原色数值(B),转换为以CIE XYZ彩色系统所采用的色度表示法表示。
据此,通过色度转换矩阵将原色数值转换为色度数值的方法如下:
……………………(式6)
即,改以第一色度数值(X)、第二色度数值(Y)、第三色度数值(Z)代表像素点。此处将这些以色度表示法代表的像素点称为色度像素点。
请参见图7B,其是将彩色来源图像转换为色度表示法的示意图。此处的转换为一对一的关系,因此,位置在p(1,1)的彩色像素点,其表示法将由RGB_p(1,1)改变为以XYZ_p(1,1)表示的色度像素点。
为了比对方便,色度像素点可进一步藉由正规化的计算,得出介于0与1区间的正规化色度值。
请参见图8,其是将彩色来源图像的色度像素点,由色度数值转换为正规化色度值的示意图。
在此图中,每一个色度像素点将根据相对应的第一色度数值(X)、第二色度数值(Y)、第三色度数值(Z)而产生第一正规化色度值与第二正规化色度值。
由色度值得出正规化色度值的方式可以下式表示:
………………………………(式7)
由此可知,第一正规化色度值(X′)的导出方式为:色度像素点所对应的第一色度数值(X)、第二色度数值(Y)、第三色度数值(Z)的总和,与第一色度数值(X)而得出第一正规化色度值(X′),即,X′=X/(X+Y+Z)。
以及,第二正规化色度值(Y′)的导出方式为:色度像素点所对应的第一色度数值(X)、第二色度数值(Y)、第三色度数值(Z)的总和,与第二色度数值(Y)而得出第二正规化色度值(Y′),即,Y′=Y/(X+Y+Z)。
请参见图9,其是根据第一正规化色度值与第二正规化色度值,而将彩色来源图像映射于彩度平面的示意图。彩度平面的横轴对应于第一正规化色度值X′、纵轴对应于第二正规化色度值Y′。
图9相当于把一张彩色来源图像所包含的每个彩色像素点所对应彩色信息对应到二维的彩度平面中。因此,在图9所示的彩度平面中,点的总数相当于彩色来源图像中的彩色像素点的数量。
例如:X′Y′_p(1,2)代表位于彩色来源图像的第一列第二行的彩色像素点所对应的第一正规化色度值与第二正规化色度值;X′Y′_p(1,3)代表位于彩色来源图像的第一列第三行的彩色像素点所对应的第一正规化色度值与第二正规化色度值;以及,X′Y′_p(1,4)代表代表位于彩色来源图像的第一列第四行的彩色像素点所对应的第一正规化色度值与第二正规化色度值。其余位置的各点亦同。
在彩度平面上,相同的一组正规化色度值可能同时对应于多个像素点。这是因为在来源像素点中,位置不同的像素点仍可能对应于相同彩度的缘故。因此,彩度平面上的位置与相对应的像素点个数可能为一对多的对应关系。
为了计算方便,可将正规化色度值量化于特定数值区间内。例如,将第一正规化色度值与第二正规化色度值分别乘上256再除以1000,进而使第一正规化色度值与第二正规化色度值量化在0~256之间。当然,关于特定数值区间的选择可根据应用或系统的处理速度而调整。
再者,本发明进一步针对彩度平面上的各点所对应的像素点个数进行统计的作法。此处以C(x′,y′)代表彩度平面的位置(x’,y’)所对应的像素点个数。根据本发明的构想,不同的彩色来源图像所对应得出的彩度平面并不相同,因此,彩度平面上各个位置所对应的像素点个数(统计结果)C(x′,y′),可用于代表彩色来源图像的色彩特征。
再者,本发明定义了彩度比重组合,用以搭配彩度平面上各个位置所对应的像素点个数使用。
本发明首先定义一个总和幂次,利用这个总和幂次代表第一正规化色度值的幂次与第二正规化色度值的幂次之和。为了简化说明,此处假设总和幂次=p+q,其中以第一幂次p对应于第一正规化色度值,并以第二幂次q对应于第二正规化色度值。
因此,在总和幂次p+q≦2的前提下,由第一幂次p与第二幂次q形成的彩度比重组合可能包含六种情形:(p=0,q=0)、(p=0,q=1)、(p=1,q=0)、(p=0,q=2)、(p=1,q=1)、(p=2,q=0)。
接着定义如何根据彩度比重组合,与彩度平面上的各个位置所对应的色度像素点的个数,计算彩度动差mpq:
…………………………………(式8)
其中XL、YL代表量化值256。由此公式可以得知,彩度动差的数量会根据彩度比重组合的数量而决定。据此,当总和幂次p+q≦2时,共对应产生六个彩度动差。
第一彩度动差…………………(式9)
第二彩度动差…………………(式10)
第三彩度动差…………………(式11)
第四彩度动差…………………(式12)
第五彩度动差…………………(式13)
第六彩度动差…………………(式14)
须留意的是,此处虽然假设总和幂次小于或等于2(p+q≦2),但是实际应用时,总和幂次也可能是其他数值(例如:小于或等于3)。连带的,第一幂次p与第二幂次q所形成的彩度比重组合也可能改变。再者,彩度动差的数量也会随着改变。
请参见图10A、图10B,其是本发明针对色彩特征进行判断的流程图。参看图7A、7B、8、9可以得知,如步骤S12所述,对彩色来源图像进行色彩特征撷取后,得出多个彩度动差的步骤包含以下步骤:
对彩色像素点分别进行彩度转换,进而得出多个色度像素点(步骤S31,图7A、7B);将色度像素点映射于彩度平面(步骤S33,图9);计算在该彩度平面上的各个位置所对应的色度像素点的个数(步骤S35);定义多个彩度比重组合(步骤S37);以及,根据彩度比重组合与彩度平面上的各个位置所对应的色度像素点的个数而得出彩度动差(步骤S39)。
其中步骤S31包含以下步骤:提供色度转换矩阵(步骤S311);以及,根据色度转换矩阵而将使利用原色表示法代表的彩色像素点,转换为利用色度表示法代表的色度像素点(步骤S313)。
步骤S33包含以下步骤:根据色度像素点所具有的第一色度数值、第二色度数值、第三色度数值而分别得出代表色度像素点的第一正规化色度值X’、第二正规化色度值Y’(步骤S331);以及,利用代表色度像素点的第一正规化色度值X’、第二正规化色度值Y’而决定色度像素点在彩度平面的位置(步骤S333)。
步骤S331用于得出每一个色度像素点的第一正规化色度值与第二正规化色度值。因此,步骤S331包含以下步骤:
根据第一色度像素点的第一色度数值(Xp11),以及第一色度像素点的第一色度数值(Xp11)、第二色度数值(Yp11)、第三色度数值(Zp11)的总和(Xp11+Y p11+Zp11)而得出代表该第一色度像素点的该第一正规化色度值(Xp11/(Xp11+Y p11+Zp11));根据第一色度像素点的第二色度数值(Yp11),以及第一色度像素点的第一色度数值(Xp11)、第二色度数值(Yp11)、第三色度数值(Xp11)的总和(Xp11+Yp11+Zp11)而得出代表第一色度像素点的该第二正规化色度值(Yp11/(X p11+Yp11+Zp11));以及,对每一个色度像素点(P11~PMN)重复前述步骤。
步骤S331还可包含以下步骤:对代表色度像素点的第一正规化色度值(Xp11/(Xp11+Yp11+Zp11))与第二正规化色度值(Yp11/(Xp11+Yp11+Zp11))进行量化转换。
步骤S39包含以下步骤:
因应各该彩度比重组合,改变在该彩度平面上的各个位置所对应的第一正规化色度值所对应的幂次,与各个位置所对应的第二正规化色度值所对应的幂次(步骤S391);以及,计算在彩度平面上的各个位置所对应的第一正规化色度值所对应的幂次、各个位置所对应的第二正规化色度值所对应的幂,与在彩度平面上的各个位置所对应的色度像素点的个数的乘积,并据此而得出彩度动差(步骤S393)。
请参见图11,其是根据纹理参数与彩度动差而进一步产生图像识别参数的示意图。在前述图6与图10中,说明了本发明如何得出纹理参数与彩度动差,此图则进一步说明根据纹理参数与彩度动差产生图像识别参数Fpic的关系。
由此图可以看出,步骤S13是先分别得出纹理识别参数与色彩识别参数后,再对纹理识别参数Ftexture与色彩识别参数Fcolor进行加总而得出图像识别参数Fpic。
即,针对纹理参数、彩色来源图像的尺寸进行加权计算后,得出纹理识别参数Ftexture。其中,纹理参数的类型包含:平滑纹理参数EDC、斜向纹理参数ES、横向纹理参数EH、纵向纹理参数EV。
以及,针对彩度动差,搭配彩色来源图像的尺寸进行加权计算进行加权计算后,得出色彩识别参数Fcolor。其中,彩度动差是根据彩度比重组合、彩度平面上的各个位置所对应的色度像素的个数而计算得出的。
之后,再对纹理识别参数Ftexture与色彩识别参数Fcolor进行加权与加总而得出图像识别参数Fpic。
以下分别说明纹理识别参数Ftexture与色彩识别参数Fcolor的产生方式。
首先说明纹理识别参数Ftexture的产生方式如下:
在进行加权运算前,可进一步根据彩色来源图像的尺寸而调整与纹理参数相对应的权重。例如:当彩色来源图像大于1000倍时,将每一个纹理参数乘以2。此步骤可选择性加入。
纹理识别参数Ftexture的产生方式被定义为:根据与平滑纹理参数相对应的平滑纹理权重a、与纵向纹理参数相对应的纵向纹理权重b、与横向纹理参数相对应的横向纹理权重c、与斜向纹理参数相对应的斜向纹理权重d而对纹理参数进行加权运算。
须留意的是,除了设定纹理识别参数Ftexture为个别的纹理参数与纹理权重的乘积的总和外,也可以利用纹理参数的比值而计算纹理识别参数Ftexture。以下便举出几种可能的计算方式。
Ftexture=a×|EDC|+b×|EV|+c×|EH|+d×|ES|………………(式15)
………………………(式16)
………………………(式17)
………………………………(式18)
以式16为例,假设a=0.7、b/c=0.15、d=0.15,则会得出式19。
…………………(式19)
在一般的情况下,因为彩色来源图像中会有蛮高的平滑纹理成份。因此,平滑纹理权重的数值会假设为这些纹理权重中的极大值。
在这些式子中,在计算纹理识别参数Ftexture时,纹理参数与纹理权重(a,b,c,d)的数值仅用于代表与纹理参数对应的权重值,根据彩色来源图像的属性不同,a、b、c、d所代表的数值也可能不同。例如:当图像中的横向纹理较多而较重视横向纹理的比对时,以较高的纹理权重数值对应于横向纹理特征。
再者,不同式子中的a、b、c、d的值也可以不同。
此外,此处的纹理权重的数值也可以根据图像的、类型而改变,只要上述各式子的右侧中,各个的系数的加总结果为1即可。
接着说明色彩识别参数Fcolor的产生方式为:
本发明主要利用彩度动差(m00、m01、m10、m11、m02、m20),计算出与彩色来源图像相对应的色彩识别参数Fcolor。为简化计算过程,在计算色彩识别参数时,也可选择性的忽略影响较小的彩度动差,例如:不计入第一彩度动差|m00|。
此外,还会根据彩色来源图像的尺寸而调整与彩度动差相对应的权重。因此,针对每一个色彩度差,以尺寸缩放因子z做为权重。
Fcolor=z×|m00|+z×|m01|+z×|m10|+z×|m11|+z×|m02|+z×|m20|………(式20)
提供权重z的目的是为了考虑彩色来源图像可能具有不同的长宽比例。具有较大尺寸的彩色来源图像,具有较多的像素点。连带的,在彩度平面上所对应的点数也较多。此时,在彩度平面上的相同位置所对应的色度像素的个数也会增加。因此,本发明进一步在计算色彩识别参数时,再针对图像尺寸的差异,乘上尺寸缩放因子z。
假设第一彩色来源图像A1的尺寸为100x100,且当彩色来源图像为这个尺寸时,尺寸缩放因子为1。则,计算第一彩色来源图像A1的色彩识别参数的方式为:
…………………………(式21)
另一方面,当第二彩色来源图像A2与第一彩色来源图像A1的内容相同但尺寸为400x400时,则需纳入尺寸被放大(400*400)/(100*100)=16倍的考虑。此时,令尺寸缩放因子=1/16,则Fcolor-B与Fcolor-A相等。
…………(式22)
针对不同的彩色来源图像,重复前述过程时,可以针对来源图像找出相对应的纹理参数(EDC、EV、EH、ES)与彩度动差(m00、m01、m10、m11、m02、m20)。接着,再进一步得出与彩色来源图像相对应的纹理识别参数Ftexture与色彩识别参数Fcolor。
例如:第一彩色来源图像A对应于第一纹理识别参数Ftexture-A与第一色彩识别参数Fcolor-A;第二彩色来源图像B对应于第二纹理识别参数Ftexture-B与第二色彩识别参数Fcolor-B。
其后,如果要比对第一彩色来源图像A与第二彩色来源图像B的相似程度时,便可以根据两个彩色来源图像所对应的纹理识别参数Ftexture与色彩识别参数Fcolor的比较而判断得出。
定义图像差异参数DAB为纹理参数之间的差值与彩度动差之间的差值的总和:
DAB=|Ftexture-A-Ftexture-B|+|Fcolor-A-Fcolor-B|…………………………….(式23)
需注意的是,利用式23计算图像差异参数时,必须确认第一彩色来源图像A与第二彩色来源图像B在计算纹理参数与彩度动差的相关参考依据为一致的。
例如:计算纹理参数时的纹理权重个数与数值必须相同。另一方面,还要考虑以尺寸缩放因子搭配彩度动差计算。
经过式23的运算后,很轻易的可以找出数据库中与待测的彩色来源图像间,具有最小误差的彩色来源图像。
请参见图12A,其是假设一用于比对的第一彩色来源图像的示意图。在此图中,假设第一彩色来源图像可大致区分为左侧二分之一与右侧二分之一两个部份。其中左侧二分之一的区块假设为具有网状纹理的蓝色,右侧二分之一的区块则假设为具有点状网底的红色。此外,第一来源图像靠近下缘处假设为纵向的黑白条纹。
请参见图12B,其是利用第二彩色来源图像比对第一彩色来源图像而判断两者的相似性的示意图。此图的构成方式与图12A相似,差别在于图12B所示的第二来源图像的左右两侧区块的分配彼此反向。
如果单以色彩特征判断图像的相似性时,可能会因为在这两张图中,红色与蓝色出现的比率相同,误以为两张彩色来源图像为相同的情形。然而,采用本发明的识别方法时,还进一步考虑的纹理特征的判断,因而可以判断出这两张彩色来源图像的纹理特征并不相同。
请参见图13,其是本发明的具有图案识别功能的电子装置的方块图。此处的电子装置5可泛指搜寻引擎的伺服器、个人计算机、数字相框等存有彩色来源图像的电子产品。
本发明的电子装置5包含:储存单元51、纹理判断单元53、色彩判断单元55、识别单元57。其中,纹理判断单元53与色彩判断单元55均电连接于储存单元51与识别单元57。
储存单元51用于储存储存彩色来源图像。纹理判断单元53用于对彩色来源图像进行纹理特征撷取后,得出多个纹理参数。色彩判断单元55用于对彩色来源图像进行色彩特征撷取后,得出彩度动差。
识别单元57用于对纹理参数与彩度动差进行加权运算后,得出图像识别参数Fpic。此外,识别单元57可选择性的根据彩色来源图像的尺寸而调整与纹理参数、彩度动差相对应的权重。
针对图像搜寻与比对的应用,电子装置5将对多个彩色来源图像进行类似的处理。因此,储存单元51将分别提供不同的记忆体位址而储存不同的彩色来源图像(例如:第一彩色来源图像与第二彩色来源图像)。
连带的,纹理判断单元53与色彩判断单元55会针对这些彩色来源图像而撷取纹理特征参数与彩度动差。其后,再由识别单元57产生与第一彩色来源图像相对应的第一图像识别参数,以及,与第二彩色来源图像相对应的第二图像识别参数。
识别单元57可包含比较模块(未绘示),用于比较第一图像识别参数与第二图像识别参数。当第一图像识别参数与第二图像识别参数越接近时,代表第一彩色来源图像与第二彩色来源图像的相似程度越高。
纹理判断单元53包含:灰阶转换模块531、离散正弦转换模块533、纹理特征撷取模块535、区块分割模块537、累加模块539。
灰阶转换模块531电连接于储存单元51。灰阶转换模块531用于对彩色来源图像进行灰阶转换而产生灰阶来源图像。
区块分割模块537电连接于灰阶转换模块531,其将灰阶来源图像区分为灰阶区块。
离散正弦转换模块533电连接于灰阶转换模块531与区块分割模块537,其是对灰阶来源图像进行离散正弦转换而产生区块转换矩阵。
纹理特征撷取模块535电连接于离散正弦转换模块533,其是根据区块转换矩阵而得出纹理参数。
累加模块539电连接于纹理特征撷取模块535与识别单元57,其是累加区块转换矩阵而得出图像转换矩阵。
色彩判断单元55包含:彩度转换模块551、映射模块553、像素点累计模块555、彩色特征撷取模块557。
彩度转换模块551电连接于储存单元51。彩度转换模块551用来根据色度转换矩阵,将彩色像素点转换为色度像素点。其中,色度转换矩阵可预存于储存单元51内。
映射模块553电连接于彩度转换模块551,映射模块553用于将色度像素点映射于彩度平面。
像素点累计模块555电连接于映射模块553。像素点累计模块555用于计算在彩度平面上的各个位置所对应的色度像素点的个数。
彩色特征撷取模块557电连接于像素点累计模块555与识别单元57。彩色特征撷取模块557根据多个彩度比重组合与彩度平面上的各个位置所对应的色度像素点的个数而计算得出彩度动差。
请参见图14,其是针对三个彩色来源图像进行图像识别的示意图。假设第一彩色来源图像为使用者要用于检索的图像。此外,第二彩色来源图像与第三彩色来源图像为数据库中既存的图像。如前所述,针对不同尺寸的情形,将于计算图像识别参数的过程中,加入缩放因子的考虑。
根据前述说明可以得知,本发明将针对第一彩色来源图像,计算出第一图像识别参数。同样的,针对第二彩色来源图像,计算出第二图像识别参数。以及,针对第三彩色来源图像,计算出与第三图像识别参数。
接着,计算第一图像识别参数与第二图像识别参数间的差值。以及比较第一图像识别参数与第三图像识别参数间的差值。其后再比较这两个差值的大小。
如果第一图像识别参数与第二图像识别参数之间的差值较小,代表第二彩色来源图像与第一彩色来源图像较为相似。
反之,如果第一图像识别参数与第三图像识别参数之间的差值较小时,代表第三彩色来源图像与第一彩色来源图像较为相似。
同理,当搜寻引擎或电子装置内部的数据库,存在许多既有的来源图像时,便可以根据前述的图像识别流程,找出与欲检索的彩色来源图像最相似者。
根据本发明的构想,当搜寻引擎或电子装置要提供图像检索功能时,可以提供预设的参考图像尺寸。针对每一个彩色来源图像,都以这个参考图像尺寸为比较对像。据此,决定相对应的缩放因子。待缩放因子决定后,再据此而调整纹理识别参数Ftexture与色彩识别参数Fcolor的权重,进而计算出相对应的图像识别参数Fpic。
接着,将这些彩色来源图像与个别对应的图像识别参数储存起来。后续,如果要进行图像检索时,同样将待检索的彩色来源图像,以相同的标准尺寸作为参考对象。通过缩放因子对于权重的调整,计算得出与待检索的彩色来源图像相对应的图像识别参数。
此时,只要比对数据库所预存的图像识别参数中,与待检索的彩色来源图像具有最接近的图像识别参数者,就是数据库中与待检索的彩色来源图像最相似的图像。
本发明可进一步应用于任何的计算机程序产品,其上储存有软件程序。当软件程序执行时,将使具有控制器的电子装置进行如前述的图像识别方法。或者,计算机程序产品亦可单独以纹理特征或色彩特征进行图像识别。
本发明的识别方法在取得图像识别参数时,会纳入颜色(彩度)、颜色分布、形状(纹理)、以及远近大小(缩放比)等面向的考虑,此种做法与肉眼比对的流程较为接近,也较符合使用者的直观。因此,本发明所提供的图像识别功能也更符合使用者的需求。据此,本发明能提供以图找图的功能,让图像的搜寻不再局限于文字输入,也让图像的搜寻过程更便利。
本领域的技术人员均可了解:在上述的说明中,作为举例的各种逻辑方块、模块、电路及方法步骤皆可利用电子硬件、计算机软件,或二者的组合来实现,且该些实现方式间的连线方式,无论上述说明所采用的是信号连结、连接、耦接、电连接或其他类型的替代作法等用语,其目的仅为了说明在实现逻辑方块、模块、电路及方法步骤时,可以通过不同的手段,例如有线电子信号、无线电磁信号以及光信号等,以直接、间接的方式来进行信号交换,进而达到信号、数据、控制信息的交换与传递的目的。因此说明书所采用的用语并不会形成发明在实现连线关系时的限制,更不会因其连线方式的不同而脱离本发明的范畴。
综上所述,虽然本发明已以诸项实施例揭示如上,然其并非用以限定本发明。本领域的技术人员,在不脱离本发明的精神和范围的前途下,可作各种的更动与润饰。因此,本发明的保护范围是以本发明的权利要求为准。
Claims (34)
1.一种图像的识别方法,包含以下步骤:
对一彩色来源图像进行纹理特征撷取后,得出多个纹理参数;
对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差;以及,对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数,
其中对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的该图像识别参数的步骤还包含以下步骤:
根据该彩色来源图像的尺寸而调整与这些纹理参数相对应的权重,以及根据该彩色来源图像的尺寸而调整与这些彩度动差相对应的权重。
2.如权利要求1所述的识别方法,其中对该彩色来源图像进行纹理特征撷取后,得出多个纹理参数的步骤包含以下步骤:
对该彩色来源图像进行灰阶转换而产生一灰阶来源图像;
对该灰阶来源图像进行离散正弦转换而产生至少一个区块转换矩阵;以及,
根据该至少一个区块转换矩阵而得出这些纹理参数。
3.如权利要求2所述的识别方法,其中该灰阶来源图像包含多个灰阶像素点,且各该灰阶像素点所对应的灰阶值,是根据一灰阶转换公式而对该彩色来源图像所包含的多个彩色像素点分别计算得出。
4.如权利要求3所述的识别方法,其中该灰阶转换公式定义与第一原色数值相对应的一第一原色转换权重、与第二原色数值相对应的一第二原色转换权重、与第三原色数值相对应的一第三原色转换权重。
5.如权利要求4所述的识别方法,其中这些灰阶像素所对应的灰阶值是根据各该彩色像素点所具有的一第一原色数值、一第二原色数值、一第三原色数值分别与该第一原色转换权重、第二原色转换权重、第三原色转换权重相乘而得出乘积后,进一步加总而得出。
6.如权利要求2所述的识别方法,其中对该灰阶来源图像进行离散正弦转换而产生该至少一个区块转换矩阵的步骤包含以下步骤:
将该灰阶来源图像区分为至少一个灰阶区块;以及,
分别对该至少一个灰阶区块进行离散正弦转换后,产生与该至少一个灰阶区块相对应的该至少一个区块转换矩阵。
7.如权利要求6所述的识别方法,其中该彩色来源图像包含MxN个像素点,而该至少一个灰阶区块的数量与灰阶区块所各自包含的像素点个数,因应离散正弦转换的运算方式而决定。
8.如权利要求7所述的识别方法,其中当离散正弦转换为8x8格式时,该至少一个灰阶区块各自包含8x8个灰阶像素点。
9.如权利要求2所述的识别方法,其中根据该至少一个区块转换矩阵而得出这些纹理参数的步骤包含以下步骤:
累加该至少一个区块转换矩阵而得出一图像转换矩阵,其中该图像转换矩阵包含多个累加转换数值;
将该图像转换矩阵区分为一平滑纹理区、一纵向纹理区、一横向纹理区、一斜向纹理区与一高频区;以及,
根据该平滑纹理区、该纵向纹理区、该横向纹理区、该斜向纹理区而得出这些纹理参数。
10.如权利要求9所述的识别方法,其中这些纹理参数包含:与该平滑纹理区相对应的一平滑纹理参数、与该纵向纹理区相对应的一纵向纹理参数、与该横向纹理区相对应的一横向纹理参数,以及与该斜向纹理区相对应的一斜向纹理参数。
11.如权利要求10所述的识别方法,其中对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的该图像识别参数的步骤包含以下步骤:
根据与该平滑纹理参数相对应的一平滑纹理权重、与该纵向纹理参数相对应的一纵向纹理权重、与该横向纹理参数相对应的一横向纹理权重、与该斜向纹理参数相对应的一斜向纹理权重而对这些纹理参数进行加权运算。
12.如权利要求11所述的识别方法,其中该平滑纹理权重具有这些纹理权重中的极大值。
13.如权利要求9所述的识别方法,其中该至少一个区块转换矩阵包含多个转换数值,当该至少一个区块转换矩阵的数量为多个时,累加该至少一个区块转换矩阵而得出该图像转换矩阵的步骤包含以下步骤:
将位于一第一区块转换矩阵的第一位置的转换数值与位于一第二区块转换矩阵的第一位置的转换数值相加;
对各该区块转换矩阵的第一位置的转换数值重复前述步骤;以及,
对各该区块转换矩阵的每一个位置的转换数值重复前述步骤后得出该图像转换矩阵。
14.如权利要求1所述的识别方法,其中该彩色来源图像包含多个彩色像素点,而对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差的步骤包含以下步骤:
对这些彩色像素点分别进行彩度转换,进而得出多个色度像素点;
将这些色度像素点映射于一彩度平面;
计算在该彩度平面上的各个位置所对应的色度像素点的个数;
定义多个彩度比重组合;以及,
根据这些彩度比重组合与该彩度平面上的各个位置所对应的色度像素点的个数而得出这些彩度动差。
15.如权利要求14所述的识别方法,其中对这些彩色像素点分别进行彩度转换,进而得出这些色度像素点的步骤包含以下步骤:
提供一色度转换矩阵;以及,
根据该色度转换矩阵而将使利用一原色表示法代表的这些彩色像素点转换为利用一色度表示法代表的这些色度像素点。
16.如权利要求15所述的识别方法,其中该原色表示法是以一第一原色数值、一第二原色数值、一第三原色数值代表这些彩色像素点,而该色度表示法是以一第一色度数值、一第二色度数值、一第三色度数值代表这些色度像素点。
17.如权利要求16所述的识别方法,其中将这些色度像素点映射于该彩度平面的步骤包含以下步骤:
根据各该色度像素点所具有的第一色度数值、第二色度数值、第三色度数值而分别得出代表各该色度像素点的一第一正规化色度值、一第二正规化色度值;以及,
利用代表各该色度像素点的该第一正规化色度值、该第二正规化色度值而决定这些色度像素点在该彩度平面的位置。
18.如权利要求17所述的识别方法,其中根据各该色度像素点所具有的第一色度数值、第二色度数值、第三色度数值而分别得出代表各该色度像素点的该第一正规化色度值、该第二正规化色度值的步骤包含以下步骤:
根据一第一色度像素点的第一色度数值,以及该第一色度像素点的第一色度数值、第二色度数值、第三色度数值的总和而得出代表该第一色度像素点的该第一正规化色度值;
根据该第一色度像素点的第二色度数值,以及该第一色度像素点的第一色度数值、第二色度数值、第三色度数值的总和而得出代表该第一色度像素点的该第二正规化色度值;以及,
对各该色度像素点重复前述步骤。
19.如权利要求18所述的识别方法,其中根据各该色度像素点所具有的第一色度数值、第二色度数值、第三色度数值而分别得出代表各该色度像素点的该第一正规化色度值、该第二正规化色度值的步骤还包含以下步骤:
对代表各该色度像素点的该第一正规化色度值与该第二正规化色度值进行量化转换。
20.如权利要求18所述的识别方法,其中根据这些彩度比重组合与该彩度平面上的各个位置所对应的色度像素点的个数而得出这些彩度动差的步骤包含以下步骤:
因应各该彩度比重组合,改变在该彩度平面上的各个位置所对应的第一正规化色度值所对应的幂次,与各个位置所对应的第二正规化色度值所对应的幂次;以及,
计算在该彩度平面上的各个位置所对应的第一正规化色度值所对应的幂次、各个位置所对应的第二正规化色度值所对应的幂次,与在该彩度平面上的各个位置所对应的色度像素点的个数的乘积,并据此而得出这些彩度动差。
21.如权利要求1所述的识别方法,其中这些彩度动差的数量是根据这些彩度比重组合的数量而决定。
22.一个具有图案识别功能的电子装置,包含:
一储存单元,其储存一彩色来源图像;以及,
一纹理判断单元,电连接于该储存单元,其是对该彩色来源图像进行纹理特征撷取后,得出多个纹理参数;
一色彩判断单元,电连接于该储存单元,其是对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差;以及,
一识别单元,电连接于该纹理判断单元与该色彩判断单元,其是对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数,其中根据该彩色来源图像的尺寸而调整与这些纹理参数相对应的权重,以及根据该彩色来源图像的尺寸而调整与这些彩度动差相对应的权重。
23.如权利要求22所述的电子装置,其中该纹理判断单元包含:
一灰阶转换模块,电连接于该储存单元,其是对该彩色来源图像进行灰阶转换而产生一灰阶来源图像;
一离散正弦转换模块,电连接于该灰阶转换模块,其是对该灰阶来源图像进行离散正弦转换而产生至少一个区块转换矩阵;以及,
一纹理特征撷取模块,电连接于该离散正弦转换模块,其是根据该至少一个区块转换矩阵而得出这些纹理参数。
24.如权利要求23所述的电子装置,其中该纹理判断单元还包含:
一区块分割模块,电连接于该灰阶转换模块与该离散正弦转换模块,其是将该灰阶来源图像区分为至少一个灰阶区块。
25.如权利要求24所述的电子装置,其中该离散正弦转换模块分别对该至少一个灰阶区块进行离散正弦转换后,产生与该至少一个灰阶区块相对应的该至少一个区块转换矩阵。
26.如权利要求23所述的电子装置,其中该纹理判断单元还包含:
一累加模块,电连接于该纹理特征撷取模块与该识别单元,其是累加该至少一个区块转换矩阵而得出一图像转换矩阵,其中该图像转换矩阵包含多个累加转换数值。
27.如权利要求26所述的电子装置,其中该至少一个区块转换矩阵包含多个转换数值,而该累加模块是将位于一第一区块转换矩阵的第一位置的转换数值与位于一第二区块转换矩阵的第一位置的转换数值相加;对各该区块转换矩阵的第一位置的转换数值重复前述步骤;以及,对各该区块转换矩阵的每一个位置的转换数值重复前述步骤后得出该图像转换矩阵。
28.如权利要求26所述的电子装置,其中该图像转换矩阵区分为一平滑纹理区、一纵向纹理区、一横向纹理区、一斜向纹理区与一高频区,而该识别单元是根据该平滑纹理区、该纵向纹理区、该横向纹理区、该斜向纹理区而得出这些纹理参数。
29.如权利要求28所述的电子装置,其中该识别单元根据与该平滑纹理参数相对应的一平滑纹理权重、与该纵向纹理参数相对应的一纵向纹理权重、与该横向纹理参数相对应的一横向纹理权重、与该斜向纹理参数相对应的一斜向纹理权重而对这些纹理参数进行加权运算。
30.如权利要求22所述的电子装置,其中该色彩判断单元包含:
一彩度转换模块,电连接于该储存单元,其是对这些彩色像素点分别进行彩度转换,进而得出多个色度像素点;
一映射模块,电连接于该彩度转换模块,其是将这些色度像素点映射于一彩度平面;
一像素点累计模块,电连接于该映射模块,其是计算在该彩度平面上的各个位置所对应的色度像素点的个数;以及,
一彩色特征撷取模块,电连接于该像素点累计模块与该识别单元,其是根据多个彩度比重组合与该彩度平面上的各个位置所对应的色度像素点的个数而得出这些彩度动差。
31.如权利要求30所述的电子装置,其中该彩度转换模块是根据一色度转换矩阵而将使利用一原色表示法代表的这些彩色像素点转换为利用一色度表示法代表的该色度像素点。
32.一种用于图像的识别的装置,该装置包括:
对一彩色来源图像进行纹理特征撷取后,得出多个纹理参数的部件;
对该彩色来源图像进行色彩特征撷取后,得出多个彩度动差的部件;以及,
对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数的部件,其中对这些纹理参数与这些彩度动差进行加权运算后,得出与该彩色来源图像相对应的一图像识别参数的部件还包括:
根据该彩色来源图像的尺寸而调整与这些纹理参数相对应的权重的部件,以及根据该彩色来源图像的尺寸而调整与这些彩度动差相对应的权重的部件。
33.一种图像的识别方法,包含以下步骤:
分别对一第一彩色来源图像、一第二彩色来源图像进行纹理特征撷取后,得出多个第一纹理参数、多个第二纹理参数;
分别对这些第一纹理参数、这些第二纹理参数进行加权运算后,得出与该第一彩色来源图像、该第二彩色来源图像相对应的一第一纹理识别参数、一第二纹理识别参数;以及,
根据该第一纹理识别参数、该第二纹理识别参数而识别该第一彩色来源图像与该第二彩色来源图像间的相似程度,
其中,根据第一彩色来源图像的尺寸和第二彩色来源图像的尺寸而分别调整与第一纹理参数和第二纹理参数相对应的权重。
34.一种图像的识别方法,包含以下步骤:
分别对一第一彩色来源图像、一第二彩色来源图像进行色彩特征撷取后,得出多个第一彩度动差、多个第二彩度动差;
分别对这些第一彩度动差、这些第二彩度动差进行加权运算后,得出与该第一彩色来源图像、该第二彩色来源图像相对应的一第一图像识别参数、一第二图像识别参数;以及,
根据该第一图像识别参数、该第二图像识别参数而识别该第一彩色来源图像与该第二彩色来源图像间的相似程度,
其中,根据第一彩色来源图像的尺寸和第二彩色来源图像的尺寸而分别调整与第一彩度动差和第二彩度动差相对应的权重。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102104154A TWI475495B (zh) | 2013-02-04 | 2013-02-04 | 圖像的識別方法、電子裝置與電腦程式產品 |
TW102104154 | 2013-02-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103971113A CN103971113A (zh) | 2014-08-06 |
CN103971113B true CN103971113B (zh) | 2017-05-17 |
Family
ID=51240584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310061277.0A Active CN103971113B (zh) | 2013-02-04 | 2013-02-27 | 图像的识别方法与电子装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US9269019B2 (zh) |
CN (1) | CN103971113B (zh) |
TW (1) | TWI475495B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10460195B2 (en) * | 2015-03-27 | 2019-10-29 | Mitsubishi Electric Corporation | Imaging apparatus and method, operation apparatus and method, and program and recording medium |
CN105654093B (zh) * | 2015-11-25 | 2018-09-25 | 小米科技有限责任公司 | 特征提取方法及装置 |
US10402696B2 (en) * | 2016-01-04 | 2019-09-03 | Texas Instruments Incorporated | Scene obstruction detection using high pass filters |
CN108573501B (zh) * | 2017-03-14 | 2021-09-21 | 中国科学院宁波材料技术与工程研究所 | 一种基础矩阵的解算方法 |
CN107967478A (zh) * | 2017-12-08 | 2018-04-27 | 奕响(大连)科技有限公司 | 一种简化dct像素灰度图片相似判定方法 |
CN109326245A (zh) * | 2018-11-09 | 2019-02-12 | 深圳市华星光电半导体显示技术有限公司 | 侦测显示装置的图像中高频成分的方法及装置 |
CN111460870A (zh) * | 2019-01-18 | 2020-07-28 | 北京市商汤科技开发有限公司 | 目标的朝向确定方法及装置、电子设备及存储介质 |
CN111126413B (zh) * | 2019-11-25 | 2023-05-05 | 郑州大学 | 基于图像识别的车用燃油清净性快速测定方法及装置 |
CN112330607A (zh) * | 2020-10-20 | 2021-02-05 | 精英数智科技股份有限公司 | 基于图像识别技术的煤矸识别方法、装置及系统 |
CN112484856B (zh) * | 2020-10-30 | 2024-09-20 | 浙江农林大学暨阳学院 | 一种获取高精度色度和光谱图像的方法 |
CN112446715B (zh) * | 2021-02-01 | 2021-05-04 | 深圳华龙讯达信息技术股份有限公司 | 一种基于工业互联网云平台的产品溯源方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6411953B1 (en) * | 1999-01-25 | 2002-06-25 | Lucent Technologies Inc. | Retrieval and matching of color patterns based on a predetermined vocabulary and grammar |
CN101673401A (zh) * | 2008-09-08 | 2010-03-17 | 索尼株式会社 | 图像处理设备、图像处理方法和程序 |
EP2257072A1 (en) * | 2009-05-27 | 2010-12-01 | Nxp B.V. | Image and video coding |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4652720B2 (ja) * | 2004-05-07 | 2011-03-16 | キヤノン株式会社 | カラー画像形成装置及びその制御方法 |
ITVA20060079A1 (it) * | 2006-12-19 | 2008-06-20 | St Microelectronics Srl | Metodo di classificazione cromatica di pixel e metodo di miglioramento adattativo di un'immagine a colori |
TWI333169B (en) * | 2007-07-06 | 2010-11-11 | Quanta Comp Inc | Image recognition method and image recognition apparatus |
US8478053B2 (en) * | 2009-07-15 | 2013-07-02 | Nikon Corporation | Image sorting apparatus |
-
2013
- 2013-02-04 TW TW102104154A patent/TWI475495B/zh active
- 2013-02-27 CN CN201310061277.0A patent/CN103971113B/zh active Active
- 2013-10-08 US US14/048,104 patent/US9269019B2/en active Active
-
2016
- 2016-01-13 US US14/994,210 patent/US9466123B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6411953B1 (en) * | 1999-01-25 | 2002-06-25 | Lucent Technologies Inc. | Retrieval and matching of color patterns based on a predetermined vocabulary and grammar |
CN101673401A (zh) * | 2008-09-08 | 2010-03-17 | 索尼株式会社 | 图像处理设备、图像处理方法和程序 |
EP2257072A1 (en) * | 2009-05-27 | 2010-12-01 | Nxp B.V. | Image and video coding |
Also Published As
Publication number | Publication date |
---|---|
US9466123B2 (en) | 2016-10-11 |
US20140219557A1 (en) | 2014-08-07 |
CN103971113A (zh) | 2014-08-06 |
US20160125623A1 (en) | 2016-05-05 |
US9269019B2 (en) | 2016-02-23 |
TW201432584A (zh) | 2014-08-16 |
TWI475495B (zh) | 2015-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103971113B (zh) | 图像的识别方法与电子装置 | |
CN108681991A (zh) | 基于生成对抗网络的高动态范围反色调映射方法及系统 | |
CN107077474A (zh) | 快速颜色搜索 | |
CN108280190A (zh) | 图像分类方法、服务器及存储介质 | |
CN102253995B (zh) | 一种利用位置信息实现图像搜索的方法和系统 | |
CN109785400B (zh) | 一种剪影图像制作方法、装置、电子设备及存储介质 | |
Sudha | Robust Hausdorff distance measure for face recognition | |
CN108024105A (zh) | 图像色彩调节方法、装置、电子设备及存储介质 | |
CN102542572A (zh) | 检测视频序列中的移动物体图像的方法以及图像处理系统 | |
CN111539353A (zh) | 一种图像场景识别方法及装置、计算机设备以及存储介质 | |
CN104281865B (zh) | 一种生成二维码的方法与设备 | |
CN107507158A (zh) | 一种图像处理方法和装置 | |
CN109993202A (zh) | 一种线稿型图形相似度判断方法、电子设备及存储介质 | |
CN104376280B (zh) | 一种面向谷歌眼镜的图像代码生成方法 | |
CN108510474B (zh) | 烟叶图像质量的评价方法、系统、存储器、及电子设备 | |
KR20110019117A (ko) | 시멘틱 기반의 이미지 검색 방법 | |
CN104376523B (zh) | 一种面向谷歌眼镜的图像代码防伪系统构成方法 | |
JP5615344B2 (ja) | 色特徴を抽出するための方法および装置 | |
CN109996028A (zh) | 监控显示设备和水印添加方法 | |
CN115239746B (zh) | 一种面向对象的遥感图像分割方法、装置、设备及介质 | |
KR101142163B1 (ko) | 시멘틱 기반의 이미지 검색 방법 | |
CN106295654B (zh) | 一种图像识别方法及装置 | |
CN110245661A (zh) | 一种基于韦伯定律的多层卷积图像特征提取方法及系统 | |
CN106228163B (zh) | 一种基于特征选择的局部差三进制序列图像特征描述方法 | |
CN107870923A (zh) | 图像检索方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |