TWI475495B - 圖像的識別方法、電子裝置與電腦程式產品 - Google Patents

圖像的識別方法、電子裝置與電腦程式產品 Download PDF

Info

Publication number
TWI475495B
TWI475495B TW102104154A TW102104154A TWI475495B TW I475495 B TWI475495 B TW I475495B TW 102104154 A TW102104154 A TW 102104154A TW 102104154 A TW102104154 A TW 102104154A TW I475495 B TWI475495 B TW I475495B
Authority
TW
Taiwan
Prior art keywords
texture
color
chroma
value
image
Prior art date
Application number
TW102104154A
Other languages
English (en)
Other versions
TW201432584A (zh
Inventor
Po Hsuan Liao
Original Assignee
Wistron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wistron Corp filed Critical Wistron Corp
Priority to TW102104154A priority Critical patent/TWI475495B/zh
Priority to CN201310061277.0A priority patent/CN103971113B/zh
Priority to US14/048,104 priority patent/US9269019B2/en
Publication of TW201432584A publication Critical patent/TW201432584A/zh
Application granted granted Critical
Publication of TWI475495B publication Critical patent/TWI475495B/zh
Priority to US14/994,210 priority patent/US9466123B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20052Discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

圖像的識別方法、電子裝置與電腦程式產品
本發明是有關於一種圖像的識別方法、電子裝置與電腦程式產品,且特別是有關於一種根據紋理特徵、色彩屬性而判斷之圖像的識別方法、電子裝置與電腦程式產品。
隨著網路的普及,讓使用者快速找到資訊的搜尋引擎也日益重要。絕大多數搜尋引擎僅提供了文字搜尋的功能,即,由使用者輸入關鍵字後,查詢網路上的相關文章。
然而,現今網際網路上的資訊,舉凡購物網站、新聞網站或者產品介紹,數位圖片占了相當大的比例。因此,除了傳統的文字搜尋功能外,針對圖片的內容提供搜尋功能的需求亦不可小覷。
儘管部分的搜尋引擎提供了圖片搜尋的功能,但是其技術還是以文字搜尋圖片為主。即,使用者必須輸入關鍵字後,再根據文字來尋找相關的圖片。此種做法並不是真正對資料庫或網路上的圖片進行檢索,而是針對每個圖片提供擬資料(metadata)的欄位。也就是透過擬資料的欄位,對每張圖片的內容提供說明或關鍵字。其後,當使用者希望找尋圖案時,搜尋引擎便根據這些擬資料的文字內容而尋找圖片。
換言之,採用擬資料的方式進行圖片搜尋的前提是, 圖片資料庫的內容必須先經過事先的判讀處理,據以先取得擬資料後,才能用來做為搜尋圖片時的判斷基礎。
如果使用者希望以手邊的圖片為檢索依據,希望透過搜尋引擎取得與手邊圖片相對應之圖像時,採用擬資料欄位方式的檢索便無法派上用場。
因此,直接以圖片在圖片資料庫中尋找相似圖片的搜尋方法,仍有發展的必要。
本發明之一方面係為一種圖像的識別方法,包含以下步驟:對一彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數;對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差;以及,對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之一圖像識別參數。
本發明之另一方面係為一個具有圖案識別功能的電子裝置,包含:一儲存單元,其係儲存一彩色來源圖像;以及,一紋理判斷單元,電連接於該儲存單元,其係對該彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數;一色彩判斷單元,電連接於該儲存單元,其係對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差;以及,一識別單元,電連接於該紋理判斷單元與該色彩判斷單元,其係對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之一圖像識別參數。
本發明之再一方面係為一種電腦程式產品,其上儲存有一軟體程式,該軟體程式執行時將使具有一控制器之一電子裝置進行一圖像的識別方法,該圖像的識別方法包括下列步驟:對一彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數;對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差;以及,對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之一圖像識別參數。
本發明之又一方面係為一種圖像的識別方法,包含以下步驟:分別對一第一彩色來源圖像、一第二彩色來源圖像進行紋理特徵擷取後,得出複數個第一紋理參數、複數個第二紋理參數;分別對該等第一紋理參數、該等第二紋理參數進行加權運算後,得出與該第一彩色來源圖像、該第二彩色來源圖像相對應之一第一紋理識別參數、一第二紋理識別參數;以及,根據該第一紋理識別參數、該第二紋理識別參數而識別該第一彩色來源圖像與該第二彩色來源圖像間的相似程度。
本發明之一方面係為一種圖像的識別方法,包含以下步驟:分別對一第一彩色來源圖像、一第二彩色來源圖像進行色彩特徵擷取後,得出複數個第一彩度動差、複數個第二彩度動差;分別對該等第一彩度動差、該等第二彩度動差進行加權運算後,得出與該第一彩色來源圖像、該第二彩色來源圖像相對應之一第一色彩識別參數、一第二色彩識別參數;以及,根據該第一色彩識別參數、該第二色彩識別參數而識別該第一彩色來源圖像與該第二彩色來 源圖像間的相似程度。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉實施例,並配合所附圖式,作詳細說明如下:
由於習用技術使用擬資訊做為圖像搜尋的依據,導致搜尋引擎無法有效的提供以圖找圖(Content-based image retrieval,簡稱為CBIR)的功能。為此,本發明提供了藉由圖像的紋理特徵與色彩特徵所代表的特徵,做為圖像搜尋之判斷基礎的做法。
請參照第1圖,其繪示本發明針對彩色來源圖像,進行識別的流程圖。
其中,步驟S11代表的左側分支流程,用於對彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數。步驟S12代表的右側分支流程,用於對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差。
接著,再利用步驟S13,對於紋理參數組成的紋理識別參數Ftexture ,與彩度動差組成的色彩識別參數Fcolor 進行加權運算後,得出與彩色來源圖像相對應之圖像識別參數Fpic
承上,本發明的圖像識別方法利用步驟S11產生紋理識別參數Ftexture ,用以代表圖像的紋理特徵;以及,利用步驟S12產生色彩識別參數Fcolor ,用以代表判斷圖像的色彩特徵。這兩個步驟的細部流程可以同時或先後進行。
更進一步的,當資料庫存有多個彩色來源圖像,並對這些彩色來源圖像進行第1圖的流程時,本發明亦能針對每個彩色來源圖像提供相對應的圖像識別參數。
假設待測的圖像為彩色來源圖像A,先對彩色來源圖像A進行第1圖的識別流程後,將得出與這個待測的彩色來源圖像A相對應的圖像識別參數Fpic-A
接著,再將圖像識別參數Fpic-A ,與資料庫中預存的多個圖像識別參數進行比對。在預存的多個圖像識別參數中,最接近圖像識別參數Fpic-A 者,其所對應的彩色來源圖像,便是在資料庫中,與彩色來源圖像A最相似的圖像。
本發明的識別流程可區分為兩個判斷面向:其一為針對紋理特徵做為圖像識別的判斷基礎;其二則是根據色彩特徵做為圖像識別的判斷基礎。本發明結合這兩種判斷面向,透過加權運算的方式,產生與彩色來源圖像相對應之圖像識別參數。以下依序說明這兩個判斷面向。附帶一提的是,實際應用時,這兩個面向亦可個別用於判斷圖像的相似性。
首先說明本發明如何利用圖像的紋理特徵做為圖像識別的判斷基礎。紋理特徵指的是圖像中的物體如何構成圖像,例如:圖像中的人物之頭髮流線、圖像中的人物穿著條紋衣物、圖像的內容為竹林的畫面時,則這些圖像會具有不同的紋理特徵。此處與來源圖像相對應之紋理特徵可大致區分為平滑紋理特徵、縱向紋理特徵、橫向紋理特徵、斜向紋理特徵。
請參見第2A圖,其係以原色表示法表示之彩色來源 圖像之示意圖。其中,彩色來源圖像包含MxN個彩色像素點。為了便於說明,此處假設M=N=40,但是實際應用並不以此為限。即,圖像的解析度與尺寸均可由本領域習用技術之人自由代換與應用。
彩色來源圖像所包含的MxN個彩色像素點,分別對應於第一原色數值(R,代表紅色數值)、第二原色數值(G,代表綠色數值)、第三原色數值(B,代表藍色數值)。
以此實施例而言,本發明首先會對40x40=1600個彩色像素點,分別進行灰階轉換,進而得出1600個灰階像素點。其中,彩色像素點所對應的原色數值(R、G、B),將透過灰階轉換,得出與灰階像素點相對應的灰階值(gray level)。
以第一列第一行位置上的像素點p(1,1)為例,原本對應於原色數值RGB_p(1,1),經由灰階轉換後,得出灰階值Gray_p(1,1)。
本發明可根據如第1式之灰階轉換公式,將彩色來源圖像所包含的彩色像素點分別轉換為灰階像素點。
灰階像素點的灰階值=0.299*第一原色數值(R)+0.587*第二原色數值(G)+0.114*第三原色數值(B)………(第1式)
在第1式中,定義了與第一原色數值(R)相對應之第一原色轉換權重(例如:0.299)、與第二原色數值(G)相對應之第二原色轉換權重(例如:0.587)、與第三原色數值(B)相對應之第三原色轉換權重(例如:0.114)。
此處,灰階像素所對應之灰階值,係根據彩色像素點 所具有之第一原色數值與第一原色轉換權重的乘積、第二原色數值與第二原色轉換權重的乘積、第三原色數值與第三原色轉換權重的乘積,進一步加總而得出。
將MxN個彩色像素點轉換為灰階像素點後,相當於將第2A圖所示的彩色來源圖像轉換為第2B圖所示的灰階來源圖像。
請參見第2B圖,其係將彩色來源圖像轉換為灰階來源圖像之示意圖。
此圖式的灰階像素點與第2A圖的彩色像素點之間具有一對一的對應關係。即,第一列第一行的灰階像素點Gray_p(1,1)的灰階值是由第2A圖中,第一列第一行的彩色像素點RGB_p(1,1)進行灰階轉換而得出的。
接著,將灰階圖像區分為複數個灰階區塊。
請參見第3A圖,其係將灰階來源圖像區分為多個灰階區塊之示意圖。灰階區塊所各自包含之像素點個數,會因應離散餘弦轉換的運算方式而決定。例如:此處以8x8的灰階區塊作為離散餘弦轉換的基本單位。因此,此處將圖像區分為多個8x8像素點所組成的灰階區塊。由於這裡假設M=N=40,第3A圖共可區分為5x5個灰階區塊。
也就是說,灰階區塊的數量與灰階區塊所各自包含之像素點個數,將因應彩色來源圖像的尺寸與離散餘弦轉換的運算方式(基本單位)而決定。
請參見第3B圖,其係本發明針對個別的灰階區塊進行離散餘弦轉換之示意圖。在此實施例中,相當於對5x5=25個灰階區塊分別進行離散餘弦轉換(Discrete Cosine Transform,簡稱為DCT),透過離散餘弦轉換而將灰階圖像轉換至頻域。
進行離散餘弦轉換時,灰階區塊與區塊轉換矩陣的位置彼此對應。例如,第一列第一行的灰階區塊將對應轉換得出位於第一列第一行的區塊轉換矩陣。
請參見第4圖,其係對灰階來源圖像進行離散餘弦轉換後,個別之灰階區塊所對應得出之區塊轉換矩陣之示意圖。此圖式代表對灰階來源圖像所包含的5x5個灰階區塊進行離散餘弦轉換後,將對應得出5x5個區塊轉換矩陣。
在此圖式中,每一個區塊轉換矩陣所包含的轉換數值,可根據轉換數值所在的位置而區分為不同的區域。此處以放大後的第一列第一行的區塊轉換矩陣dct_B(1,1)為例,共可區分為平滑紋理區、縱向紋理區、橫向紋理區、斜向紋理區、高頻區。
經由離散餘弦轉換後的圖像,在其頻率域之不同位置上的轉換數值可以用來顯示來源圖像的紋理強弱以及方向。
其中,當位於區塊轉換矩陣之左上角的平滑紋理區(DC)中,具有較大的轉換數值時,代表彩色來源圖像中,大多數由平滑的區域所構成。
當位於區塊轉換矩陣之右上角的縱向紋理區(Vertical),具有較大的轉換數值時,代表彩色來源圖像中,大多數的區域為縱向的分佈。例如:彩色來源圖像的內容為竹林。
當位於區塊轉換矩陣之左下角的橫向紋理區 (Horizontal),具有較大的轉換數值時,代表彩色來源圖像中,大多數的區域為橫向的分佈。例如:彩色來源圖像包含穿著囚衣的人物。
當位於區塊轉換矩陣之中間的斜向紋理區(Slash)中,具有較大的轉換數值時,代表彩色來源圖像中,大多數的區域具有斜向的線條。例如:彩色來源圖像為雨天的畫面。
此外,一般的圖像在進行離散餘弦轉換時,區塊轉換矩陣之右下角所代表的高頻區域(High Frequency)均相當的小,因而可以忽略不計。
請參見第5A圖,其係對各個灰階區塊分別進行離散餘弦轉換後,產生與各個灰階區塊相對應之複數個區塊轉換矩陣之示意圖。其中,每一個區塊轉換矩陣都各自具有如第4圖所述之特性。
請參見第5B圖,其係將第5A圖的每個區塊轉換矩陣進行累加之示意圖。本發明針對第5A圖所示的5x5個區塊轉換矩陣,將相對應位置之轉換數值進行累加,進而得出如第5C圖所示的圖像轉換矩陣。
請參見第5C圖,其係本發明根據區塊轉換矩陣的累加而得出圖像轉換矩陣之示意圖。圖像轉換矩陣的每一個數值都是根據第5B圖的累加而得出,因此,同樣可區分為平滑紋理區、縱向紋理區、橫向紋理區與與斜向紋理區。
至此,整張彩色來源圖像的紋理特徵已被萃取出來,並能以量化的數值儲存。
據此,本發明進一步定義多個紋理參數。紋理參數包 含:與平滑紋理區相對應之平滑紋理參數EDC 、與縱向紋理區相對應之縱向紋理參數EV 、與橫向紋理區相對應之橫向紋理參數EH ,以及與斜向紋理區相對應之斜向紋理參數ES 。各個紋理參數的表示公式如下:
請參見第6圖,其係本發明針對紋理特徵進行判斷之流程圖。此圖式彙整了第2A、2B、3A、3B、4、5A、5B、5C圖的作法。
首先,對彩色來源圖像進行灰階轉換而產生灰階來源圖像(步驟S21,第2A、2B圖)。
其次,對灰階來源圖像進行離散餘弦轉換而產生至少一個區塊轉換矩陣(步驟S23)。其中,S23進一步包含以下步驟:將灰階來源圖像區分為至少一個灰階區塊(步驟S231,第3A圖);以及,分別對灰階區塊進行離散餘弦轉 換後,產生與灰階區塊相對應之區塊轉換矩陣(步驟S233,第3B、4、5A圖)。
承上,每一個區塊轉換矩陣均包含複數個轉換數值,例如:進行8x8DCT轉換時,包含8x8個轉換數值。
接著,根據區塊轉換矩陣而得出紋理參數(步驟S25,第5B、5C圖)。
步驟S25進一步包含:累加區塊轉換矩陣而得出圖像轉換矩陣,其中圖像轉換矩陣係包含複數個累加轉換數值(步驟S251,第5B圖);將圖像轉換矩陣區分為平滑紋理區、縱向紋理區、橫向紋理區、斜向紋理區與高頻區(步驟S253);以及,根據平滑紋理區、縱向紋理區、橫向紋理區、斜向紋理區而得出平滑紋理參數EDC 、縱向紋理參數EV 、橫向紋理參數EH ,以及斜向紋理參數ES (步驟S255)。
參考第5B圖的說明可以得知,當區塊轉換矩陣的個數為複數個時,步驟S25可進一步將位於第一區塊轉換矩陣之第一位置的轉換數值與位於第二區塊轉換矩陣之第一位置的轉換數值相加;對各區塊轉換矩陣之第一位置的轉換數值重覆前述步驟;以及,對各個區塊轉換矩陣之每一個位置的轉換數值重覆前述步驟後得出圖像轉換矩陣。
接著說明本發明如判斷圖像的色彩特徵:請參見第7A圖,其係以原色表示法表示之彩色來源圖像之示意圖。
首先假設色度轉換矩陣為:
透過色度轉換矩陣,可以將彩色來源圖像所包含的彩色像素點所對應的第一原色數值(R)、第二原色數值(G)、第三原色數值(B),轉換為以CIE XYZ彩色系統所採用的色度表示法表示。
據此,透過色度轉換矩陣將原色數值轉換為色度數值的方法如下:
即,改以第一色度數值(X)、第二色度數值(Y)、第三色度數值(Z)代表像素點。此處將這些以色度表示法代表的像素點稱為色度像素點。
請參見第7B圖,其係將彩色來源圖像轉換為色度表示法之示意圖。此處的轉換為一對一的關係,因此,位置在p(1,1)的彩色像素點,其表示法將由RGB_p(1,1)改變為以XYZ_p(1,1)表示的色度像素點。
為了比對方便,色度像素點可進一步藉由正規化的計算,得出介於0與1區間的正規化色度值。
請參見第8圖,其係將彩色來源圖像的色度像素點,由色度數值轉換為正規化色度值之示意圖。
在此圖式中,每一個色度像素點將根據相對應之第一色度數值(X)、第二色度數值(Y)、第三色度數值(Z)而產生第一正規化色度值與第二正規化色度值。
由色度值得出正規化色度值的方式可以下式表示:
由此可知,第一正規化色度值(X’)的導出方式為:色度像素點所對應之第一色度數值(X)、第二色度數值(Y)、第三色度數值(Z)的總和,與第一色度數值(X)而得出第一正規化色度值(X’),即,X’=X/(X+Y+Z)。
以及,第二正規化色度值(Y’)的導出方式為:色度像素點所對應之第一色度數值(X)、第二色度數值(Y)、第三色度數值(Z)的總和,與第二色度數值(Y)而得出第二正規化色度值(Y’),即,Y’=Y/(X+Y+Z)。
請參見第9圖,其係根據第一正規化色度值與第二正規化色度值,而將彩色來源圖像映射於彩度平面之示意圖。彩度平面的橫軸對應於第一正規化色度值X’、縱軸對應於第二正規化色度值Y’。
第9圖相當於把一張彩色來源圖像所包含的每個彩色像素點所對應彩色資訊對應到二維的彩度平面中。因此,在第9圖所示的彩度平面中,點的總數相當於彩色來源圖像中的彩色像素點的數量。
例如:X’Y’_p(1,2)代表位於彩色來源圖像之第一列第二行的彩色像素點所對應的第一正規化色度值與第二正規化色度值;X’Y’_p(1,3)代表位於彩色來源圖像之第一列第三行的彩色像素點所對應的第一正規化色度值與第二正規化色度值;以及,X’Y’_p(1,4)代表代表位於彩色來源圖像之第一列第四行的彩色像素點所對應的第一 正規化色度值與第二正規化色度值。其餘位置的各點亦同。
在彩度平面上,相同的一組正規化色度值可能同時對應於多個像素點。這是因為在來源像素點中,位置不同的像素點仍可能對應於相同彩度的緣故。因此,彩度平面上的位置與相對應之像素點個數可能為一對多的對應關係。
為了計算方便,可將正規化色度值量化於特定數值區間內。例如,將第一正規化色度值與第二正規化色度值分別乘上256再除以1000,進而使第一正規化色度值與第二正規化色度值量化在0~256之間。當然,關於特定數值區間的選擇可根據應用或系統的處理速度而調整。
再者,本發明進一步針對彩度平面上的各點所對應之像素點個數進行統計的作法。此處以C(x’,y’)代表彩度平面之位置(x’,y’)所對應的像素點個數。根據本發明的構想,不同的彩色來源圖像所對應得出之彩度平面並不相同,因此,彩度平面上各個位置所對應的像素點個數(統計結果)C(x’,y’),可用於代表彩色來源圖像的色彩特徵。
再者,本發明定義了彩度比重組合,用以搭配彩度平面上各個位置所對應的像素點個數使用。
本發明首先定義一個總和冪次,利用這個總和冪次代表第一正規化色度值的冪次與第二正規化色度值的冪次之和。為了簡化說明,此處假設總和冪次=p+q,其中以第一冪次p對應於第一正規化色度值,並以第二冪次q對應於第二正規化色度值。
因此,在總和冪次p+q≦2的前提下,由第一冪次p 與第二冪次q形成的彩度比重組合可能包含六種情形:(p=0,q=0)、(p=0,q=1)、(p=1,q=0)、(p=0,q=2)、(p=1,q=1)、(p=2,q=0)。
接著定義如何根據彩度比重組合,與彩度平面上的各個位置所對應之色度像素點的個數,計算彩度動差mpq
其中XL 、YL 代表量化值256。由此公式可以得知,彩度動差的數量會根據彩度比重組合的數量而決定。據此,當總和冪次p+q≦2時,共對應產生六個彩度動差。
須留意的是,此處雖然假設總和冪次小於或等於2(p+q≦2),但是實際應用時,總和冪次也可能是其他數值(例如:小於或等於3)。連帶的,第一冪次p與第二冪次q所形成的彩度比重組合也可能改變。再者,彩度動差的數量也會隨著改變。
請參見第10A、10B圖,其係本發明針對色彩特徵進行判斷之流程圖。參看第7A、7B、8、9圖可以得知,如步驟S12所述,對彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差之步驟包含以下步驟:對彩色像素點分別進行彩度轉換,進而得出複數個色度像素點(步驟S31,第7A、7B圖);將色度像素點映射於彩度平面(步驟S33,第9圖);計算在該彩度平面上的各個位置所對應之色度像素點的個數(步驟S35);定義複數個彩度比重組合(步驟S37);以及,根據彩度比重組合與彩度平面上的各個位置所對應之色度像素點的個數而得出彩度動差(步驟S39)。
其中步驟S31包含以下步驟:提供色度轉換矩陣(步驟S311);以及,根據色度轉換矩陣而將使利用原色表示法代表的彩色像素點,轉換為利用色度表示法代表之色度像素點(步驟S313)。
步驟S33包含以下步驟:根據色度像素點所具有的第一色度數值、第二色度數值、第三色度數值而分別得出代表色度像素點之第一正規化色度值X’、第二正規化色度值Y’(步驟S331);以及,利用代表色度像素點之第一正規化色度值X’、第二正規化色度值Y’而決定色度像素 點在彩度平面的位置(步驟S333)。
步驟S331用於得出每一個色度像素點的第一正規化色度值與第二正規化色度值。因此,步驟S331包含以下步驟:根據第一色度像素點之第一色度數值(Xp11 ),以及第一色度像素點之第一色度數值(Xp11 )、第二色度數值(Yp11 )、第三色度數值(Zp11 )的總和(Xp11 +Yp11 +Zp11 )而得出代表該第一色度像素點之該第一正規化色度值(Xp11 /(Xp11 +Yp11 +Zp11 ));根據第一色度像素點之第二色度數值(Yp11 ),以及第一色度像素點之第一色度數值(Xp11 )、第二色度數值(Yp11 )、第三色度數值(Xp11 )的總和(Xp11 +Yp11 +Zp11 )而得出代表第一色度像素點之該第二正規化色度值(Yp11 /(Xp11 +Yp11 +Zp11 ));以及,對每一個色度像素點(P11 ~PMN )重覆前述步驟。
步驟S331還可包含以下步驟:對代表色度像素點的第一正規化色度值(Xp11 /(Xp11 +Yp11 +Zp11 ))與第二正規化色度值(Yp11 /(Xp11 +Yp11 +Zp11 ))進行量化轉換。
步驟S39係包含以下步驟:因應各該彩度比重組合,改變在該彩度平面上的各個位置所對應之第一正規化色度值所對應的冪次,與各個位置所對應之第二正規化色度值所對應的冪次(步驟S391);以及,計算在彩度平面上的各個位置所對應之第一正規化色度值所對應的冪次、各個位置所對應之第二正規化色度值所對應的冪,與在彩度平面上的各個位置所對應之色度像素點的個數之乘積,並據此而得出彩度動差 (步驟S393)。
請參見第11圖,其係根據紋理參數與彩度動差而進一步產生圖像識別參數之示意圖。在前述第6圖與第10圖中,說明了本發明如何得出紋理參數與彩度動差,此圖式則進一步說明根據紋理參數與彩度動差產生圖像識別參數Fpic 的關係。
由此圖式可以看出,步驟S13是先分別得出紋理識別參數與色彩識別參數後,再對紋理識別參數Ftexture 與色彩識別參數Fcolor 進行加總而得出圖像識別參數Fpic
即,針對紋理參數、彩色來源圖像的尺寸進行加權計算後,得出紋理識別參數Ftexture 。其中,紋理參數的類型包含:平滑紋理參數EDC 、斜向紋理參數ES 、橫向紋理參數EH 、縱向紋理參數EV
以及,針對彩度動差,搭配彩色來源圖像的尺寸進行加權計算進行加權計算後,得出色彩識別參數Fcolor 。其中,彩度動差是根據彩度比重組合、彩度平面上的各個位置所對應之色度像素的個數而計算得出的。
之後,再對紋理識別參數Ftexture 與色彩識別參數Fcolor 進行加權與加總而得出圖像識別參數Fpic
以下分別說明紋理識別參數Ftexture 與色彩識別參數Fcolor 的產生方式。
首先說明紋理識別參數Ftexture 的產生方式如下:在進行加權運算前,可進一步根據彩色來源圖像的尺寸而調整與紋理參數相對應之權重。例如:當彩色來源圖像大於1000倍時,將每一個紋理參數乘以2。此步驟可選 擇性加入。
紋理識別參數Ftexture 的產生方式被定義為:根據與平滑紋理參數相對應之平滑紋理權重a、與縱向紋理參數相對應之縱向紋理權重b、與橫向紋理參數相對應之橫向紋理權重c、與斜向紋理參數相對應之斜向紋理權重d而對紋理參數進行加權運算。
須留意的是,除了設定紋理識別參數Ftexture 為個別的紋理參數與紋理權重之乘積的總和外,也可以利用紋理參數的比值而計算紋理識別參數Ftexture 。以下便舉出幾種可能的計算方式。
F texture =a ×|E DC |+b ×|E V |+c ×|E H |+d ×|E S | ………(第15式)
以第16式為例,假設a=0.7、b/c=0.15、d=0.15,則會得出第19式。
在一般的情況下,因為彩色來源圖像中會有蠻高的平滑紋理成份。因此,平滑紋理權重的數值會假設為該等紋理權重中的極大值。
在這些式子中,在計算紋理識別參數Ftexture 時,紋理參數與紋理權重(a,b,c,d)的數值僅用於代表與紋理參 數對應的權重值,根據彩色來源圖像之屬性不同,a、b、c、d所代表的數值也可能不同。例如:當圖像中的橫向紋理較多而較重視橫向紋理的比對時,以較高的紋理權重數值對應於橫向紋理特徵。
再者,不同式子中的a、b、c、d的值也可以不同。
此外,此處的紋理權重的數值也可以根據圖像的、類型而改變,只要上述各式子的右側中,各個的係數的加總結果為1即可。
接著說明色彩識別參數Fcolor 的產生方式為:本發明主要利用彩度動差(m00 、m01 、m10 、m11 、m02 、m20 ),計算出與彩色來源圖像相對應之色彩識別參數Fcolor 。為簡化計算過程,在計算色彩識別參數時,也可選擇性的忽略影響較小的彩度動差,例如:不計入第一彩度動差|m 00 |
此外,還會根據彩色來源圖像的尺寸而調整與彩度動差相對應之權重。因此,針對每一個色彩度差,以尺寸縮放因子z做為權重。
F color =z ×|m 00 |+z ×|m 01 |+z ×|m 10 |+z ×|m 11 |+z ×|m 02 |+z ×|m 20 | ………(第20式)
提供權重z的目的是為了考量彩色來源圖像可能具有不同的長寬比例。
具有較大尺寸的彩色來源圖像,具有較多的像素點。連帶 的,在彩度平面上所對應之點數也較多。此時,在彩度平面上的相同位置所對應之色度像素的個數也會增加。因此,本發明進一步在計算色彩識別參數時,再針對圖像尺寸的差異,乘上尺寸縮放因子z。
假設第一彩色來源圖像A1的尺寸為100x100,且當彩色來源圖像為這個尺寸時,尺寸縮放因子為1。則,計算第一彩色來源圖像A1之色彩識別參數的方式為:
另一方面,當第二彩色來源圖像A2與第一彩色來源圖像A1的內容相同但尺寸為400x400時,則需納入尺寸被放大(400*400)/(100*100)=16倍的考量。此時,令尺寸縮放因子=1/16,則Fcolor-B 與Fcolor-A 相等。
針對不同的彩色來源圖像,重覆前述過程時,可以針對來源圖像找出相對應的紋理參數(EDC 、EV 、EH 、ES )與彩度動差(m00 、m01 、m10 、m11 、m02 、m20 )。接著,再進一步得出與彩色來源圖像相對應的紋理識別參數Ftexture 與色彩識別參數Fcolor
例如:第一彩色來源圖像A對應於第一紋理識別參數Ftexture-A 與第一色彩識別參數Fcolor-A ;第二彩色來源圖像B對應於第二紋理識別參數Ftexture-B 與第二色彩識別參數Fcolor-B
其後,如果要比對第一彩色來源圖像A與第二彩色來源圖像B的相似程度時,便可以根據兩個彩色來源圖像所對應之紋理識別參數Ftexture 與色彩識別參數Fcolor 的比較而判斷得出。
定義圖像差異參數DAB 為紋理參數之間的差值與彩度動差之間的差值的總和:D AB =|F texture-A -F texture-B |+|F color-A -F color-B | ………(第23式)
需注意的是,利用第23式計算圖像差異參數時,必須確認第一彩色來源圖像A與第二彩色來源圖像B在計算紋理參數與彩度動差的相關參考依據為一致的。
例如:計算紋理參數時的紋理權重個數與數值必須相同。另一方面,還要考慮以尺寸縮放因子搭配彩度動差計算。
經過第23式的運算後,很輕易的可以找出資料庫中與待測的彩色來源圖像間,具有最小誤差的彩色來源圖像。
請參見第12A圖,其係假設一用於比對之第一彩色來源圖像之示意圖。在此圖式中,假設第一彩色來源圖像可大致區分為左側二分之一與右側二分之一兩個部份。其中左側二分之一的區塊假設為具有網狀紋理的藍色,右側二分之一的區塊則假設為具有點狀網底的紅色。此外,第一來源圖像靠近下緣處假設為縱向的黑白條紋。
請參見第12B圖,其係利用第二彩色來源圖像比對第一彩色來源圖像而判斷兩者之相似性的示意圖。此圖式的 構成方式與第12A圖相似,差別在於第12B圖所示的第二來源圖像的左右兩側區塊的分配彼此反向。
如果單以色彩特徵判斷圖像的相似性時,可能會因為在這兩張圖中,紅色與藍色出現的比率相同,誤以為兩張彩色來源圖像為相同的情形。然而,採用本發明的識別方法時,還進一步考量的紋理特徵的判斷,因而可以判斷出這兩張彩色來源圖像的紋理特徵並不相同。
請參見第13圖,其係本發明之具有圖案識別功能的電子裝置的方塊圖。此處的電子裝置5可泛指搜尋引擎的伺服器、個人電腦、數位相框等存有彩色來源圖像的電子產品。
本發明的電子裝置5包含:儲存單元51、紋理判斷單元53、色彩判斷單元55、識別單元57。其中,紋理判斷單元53與色彩判斷單元55均電連接於儲存單元51與識別單元57。
儲存單元51用於儲存儲存彩色來源圖像。紋理判斷單元53用於對彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數。色彩判斷單元55用於對彩色來源圖像進行色彩特徵擷取後,得出彩度動差。
識別單元57用於對紋理參數與彩度動差進行加權運算後,得出圖像識別參數Fpic 。此外,識別單元57可選擇性的根據彩色來源圖像的尺寸而調整與紋理參數、彩度動差相對應之權重。
針對圖像搜尋與比對的應用,電子裝置5將對多個彩色來源圖像進行類似的處理。因此,儲存單元51將分別 提供不同的記憶體位址而儲存不同的彩色來源圖像(例如:第一彩色來源圖像與第二彩色來源圖像)。
連帶的,紋理判斷單元53與色彩判斷單元55會針對這些彩色來源圖像而擷取紋理特徵參數與彩度動差。其後,再由識別單元57產生與第一彩色來源圖像相對應之第一圖像識別參數,以及,與第二彩色來源圖像相對應之第二圖像識別參數。
識別單元57可包含比較模組(未繪式),用於比較第一圖像識別參數與第二圖像識別參數。當第一圖像識別參數與第二圖像識別參數越接近時,代表第一彩色來源圖像與第二彩色來源圖像的相似程度越高。
紋理判斷單元53包含:灰階轉換模組531、離散餘弦轉換模組533、紋理特徵擷取模組535、區塊分割模組537、累加模組539。
灰階轉換模組531電連接於儲存單元51。灰階轉換模組531用於對彩色來源圖像進行灰階轉換而產生灰階來源圖像。
區塊分割模組537電連接於灰階轉換模組531,其係將灰階來源圖像區分為灰階區塊。
離散餘弦轉換模組533電連接於灰階轉換模組531與區塊分割模組537,其係對灰階來源圖像進行離散餘弦轉換而產生區塊轉換矩陣。
紋理特徵擷取模組535電連接於離散餘弦轉換模組533,其係根據區塊轉換矩陣而得出紋理參數。
累加模組539電連接於紋理特徵擷取模組535與識別 單元57,其係累加區塊轉換矩陣而得出圖像轉換矩陣。
色彩判斷單元55包含:彩度轉換模組551、映射模組553、像素點累計模組555、彩色特徵擷取模組557。
彩度轉換模組551電連接於儲存單元51。彩度轉換模組551用來根據色度轉換矩陣,將彩色像素點轉換為色度像素點。其中,色度轉換矩陣可預存於儲存單元51內。
映射模組553電連接於彩度轉換模組551,映射模組553用於將色度像素點映射於彩度平面。
像素點累計模組555電連接於映射模組553。像素點累計模組555用於計算在彩度平面上的各個位置所對應之色度像素點的個數。
彩色特徵擷取模組557電連接於像素點累計模組555與識別單元57。彩色特徵擷取模組557根據複數個彩度比重組合與彩度平面上的各個位置所對應之色度像素點的個數而計算得出彩度動差。
請參見第14圖,其係針對三個彩色來源圖像進行圖像識別之示意圖。假設第一彩色來源圖像為使用者要用於檢索的圖像。此外,第二彩色來源圖像與第三彩色來源圖像為資料庫中既存的圖像。如前所述,針對不同尺寸的情形,將於計算圖像識別參數的過程中,加入縮放因子的考量。
根據前述說明可以得知,本發明將針對第一彩色來源圖像,計算出第一圖像識別參數。同樣的,針對第二彩色來源圖像,計算出第二圖像識別參數。以及,針對第三彩色來源圖像,計算出與第三圖像識別參數。
接著,計算第一圖像識別參數與第二圖像識別參數間的差值。以及比較第一圖像識別參數與第三圖像識別參數間的差值。其後再比較這兩個差值的大小。
如果第一圖像識別參數與第二圖像識別參數之間的差值較小,代表第二彩色來源圖像與第一彩色來源圖像較為相似。
反之,如果第一圖像識別參數與第三圖像識別參數之間的差值較小時,代表第三彩色來源圖像與第一彩色來源圖像較為相似。
同理,當搜尋引擎或電子裝置內部的資料庫,存在許多既有的來源圖像時,便可以根據前述的圖像識別流程,找出與欲檢索之彩色來源圖像最相似者。
根據本發明的構想,當搜尋引擎或電子裝置要提供圖像檢索功能時,可以提供預設的參考圖像尺寸。針對每一個彩色來源圖像,都以這個參考圖像尺寸為比較對像。據此,決定相對應的縮放因子。待縮放因子決定後,再據此而調整紋理識別參數Ftexture 與色彩識別參數Fcolor 的權重,進而計算出相對應的圖像識別參數Fpic
接著,將這些彩色來源圖像與個別對應之圖像識別參數儲存起來。後續,如果要進行圖像檢索時,同樣將待檢索的彩色來源圖像,以相同的標準尺寸作為參考對象。透過縮放因子對於權重的調整,計算得出與待檢索之彩色來源圖像相對應的圖像識別參數。
此時,只要比對資料庫所預存之圖像識別參數中,與待檢索的彩色來源圖像具有最接近之圖像識別參數者,就 是資料庫中與待檢索之彩色來源圖像最相似的圖像。
本發明可進一步應用於任何的電腦程式產品,其上儲存有軟體程式。當軟體程式執行時,將使具有控制器之電子裝置進行如前述之圖像識別方法。或者,電腦程式產品亦可單獨以紋理特徵或色彩特徵進行圖像識別。
本發明的識別方法在取得圖像識別參數時,會納入顏色(彩度)、顏色分佈、形狀(紋理)、以及遠近大小(縮放比)等面向的考量,此種做法與肉眼比對的流程較為接近,也較符合使用者的直觀。因此,本發明所提供的圖像識別功能也更符合使用者的需求。據此,本發明能提供以圖找圖的功能,讓圖像的搜尋不再侷限於文字輸入,也讓圖像的搜尋過程更便利。
在本領域中的習知技藝者均可瞭解:在上述的說明中,作為舉例之各種邏輯方塊、模組、電路及方法步驟皆可利用電子硬體、電腦軟體,或二者之組合來實現,且該些實現方式間的連線方式,無論上述說明所採用的是信號連結、連接、耦接、電連接或其他類型之替代作法等用語,其目的僅為了說明在實現邏輯方塊、模組、電路及方法步驟時,可以透過不同的手段,例如有線電子信號、無線電磁信號以及光信號等,以直接、間接的方式來進行信號交換,進而達到信號、資料、控制資訊的交換與傳遞之目的。因此說明書所採的用語並不會形成本案在實現連線關係時的限制,更不會因其連線方式的不同而脫離本案之範疇。
綜上所述,雖然本發明已以諸項實施例揭露如上,然 其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
5‧‧‧電子裝置
51‧‧‧儲存單元
53‧‧‧紋理判斷單元
55‧‧‧色彩判斷單元
57‧‧‧識別單元
531‧‧‧灰階轉換模組
533‧‧‧離散餘弦轉換模組
535‧‧‧紋理特徵擷取模組
537‧‧‧區塊分割模組
539‧‧‧累加模組
551‧‧‧彩度轉換模組
553‧‧‧映射模組
555‧‧‧像素點累計模組
557‧‧‧彩色特徵擷取模組
第1圖,其繪示本發明針對彩色來源圖像,進行識別的流程圖。
第2A圖,其係以原色表示法表示之彩色來源圖像之示意圖。
第2B圖,其係將彩色來源圖像轉換為灰階來源圖像之示意圖。
第3A圖,其係將灰階來源圖像區分為多個灰階區塊之示意圖。
第3B圖,其係本發明針對個別的灰階區塊進行離散餘弦轉換之示意圖。
第4圖,其係對灰階來源圖像進行離散餘弦轉換後,個別之灰階區塊所對應得出之區塊轉換矩陣之示意圖。
第5A圖,其係對各個灰階區塊分別進行離散餘弦轉換後,產生與各個灰階區塊相對應之複數個區塊轉換矩陣之示意圖。
第5B圖,其係將第5A圖的每個區塊轉換矩陣進行累加之示意圖。
第5C圖,其係本發明根據區塊轉換矩陣的累加而得 出圖像轉換矩陣之示意圖。
第6圖,其係本發明針對紋理特徵進行判斷之流程圖。
第7A圖,其係以原色表示法表示之彩色來源圖像之示意圖。
第7B圖,其係將彩色來源圖像轉換為色度表示法之示意圖。
第8圖,其係將彩色來源圖像的色度像素點,由色度數值轉換為正規化色度值之示意圖。
第9圖,其係根據第一正規化色度值與第二正規化色度值,而將彩色來源圖像映射於彩度平面之示意圖。
第10A、10B圖,其係本發明針對色彩特徵進行判斷之流程圖。
第11圖,其係根據紋理參數與彩度動差而進一步產生圖像識別參數之示意圖。
第12A圖,其係假設一用於比對之第一彩色來源圖像之示意圖。
第12B圖,其係利用第二彩色來源圖像比對第一彩色來源圖像而判斷兩者之相似性的示意圖。
第13圖,其係本發明之具有圖案識別功能的電子裝置的方塊圖。
第14圖,其係針對三個彩色來源圖像進行圖像識別之示意圖。

Claims (36)

  1. 一種圖像的識別方法,包含以下步驟:對一彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數;對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差;根據一參考圖像的尺寸與該彩色來源圖像的尺寸而決定一縮放因子;以及,根據該縮放因子而對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之一圖像識別參數。
  2. 如申請專利範圍第1項所述之識別方法,其中對該彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數之步驟係包含以下步驟:對該彩色來源圖像進行灰階轉換而產生一灰階來源圖像;對該灰階來源圖像進行離散餘弦轉換而產生至少一個區塊轉換矩陣;以及,根據該至少一個區塊轉換矩陣而得出該等紋理參數。
  3. 如申請專利範圍第2項所述之識別方法,其中該灰階來源圖像係包含複數個灰階像素點,且各該灰階像素點所對應之灰階值,係根據一灰階轉換公式而對該彩色來源圖像所包含的複數個彩色像素點分別計算得出。
  4. 如申請專利範圍第3項所述之識別方法,其中該 灰階轉換公式係定義與第一原色數值相對應之一第一原色轉換權重、與第二原色數值相對應之一第二原色轉換權重、與第三原色數值相對應之一第三原色轉換權重。
  5. 如申請專利範圍第4項所述之識別方法,其中該等灰階像素所對應之灰階值係根據各該彩色像素點所具有之一第一原色數值、一第二原色數值、一第三原色數值分別與該第一原色轉換權重、第二原色轉換權重、第三原色轉換權重相乘而得出乘積後,進一步加總而得出。
  6. 如申請專利範圍第2項所述之識別方法,其中對該灰階來源圖像進行離散餘弦轉換而產生該至少一個區塊轉換矩陣之步驟係包含以下步驟:將該灰階來源圖像區分為至少一個灰階區塊;以及,分別對該至少一個灰階區塊進行離散餘弦轉換後,產生與該至少一個灰階區塊相對應之該至少一個區塊轉換矩陣。
  7. 如申請專利範圍第6項所述之識別方法,其中該彩色來源圖像係包含MxN個像素點,而該至少一個灰階區塊與的數量與灰階區塊所各自包含之像素點,係因應離散餘弦轉換的運算方式而決定。
  8. 如申請專利範圍第7項所述之識別方法,其中當離散餘弦轉換為8x8格式時,該至少一個灰階區塊係各自包含8x8個灰階像素點。
  9. 如申請專利範圍第2項所述之識別方法,其中根據該至少一個區塊轉換矩陣而得出該等紋理參數之步驟係包含以下步驟: 累加該至少一個區塊轉換矩陣而得出一圖像轉換矩陣,其中該圖像轉換矩陣係包含複數個累加轉換數值;將該圖像轉換矩陣區分為一平滑紋理區、一縱向紋理區、一橫向紋理區、一斜向紋理區與一高頻區;以及,根據該平滑紋理區、該縱向紋理區、該橫向紋理區、該斜向紋理區而得出該等紋理參數。
  10. 如申請專利範圍第9項所述之識別方法,其中該等紋理參數係包含:與該平滑紋理區相對應之一平滑紋理參數、與該縱向紋理區相對應之一縱向紋理參數、與該橫向紋理區相對應之一橫向紋理參數,以及與該斜向紋理區相對應之一斜向紋理參數。
  11. 如申請專利範圍第10項所述之識別方法,其中對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之該圖像識別參數之步驟係包含以下步驟:根據與該平滑紋理參數相對應之一平滑紋理權重、與該縱向紋理參數相對應之一縱向紋理權重、與該橫向紋理參數相對應之一橫向紋理權重、與該斜向紋理參數相對應之一斜向紋理權重而對該等紋理參數進行加權運算。
  12. 如申請專利範圍第11項所述之識別方法,其中該平滑紋理權重具有該等紋理權重中的極大值。
  13. 如申請專利範圍第9項所述之識別方法,其中該至少一個區塊轉換矩陣係包含複數個轉換數值,當該至少一個區塊轉換矩陣的數量為複數個時,累加該至少一個區塊轉換矩陣而得出該圖像轉換矩陣之步驟係包含以下步 驟:將位於一第一區塊轉換矩陣之第一位置的轉換數值與位於一第二區塊轉換矩陣之第一位置的轉換數值相加;對各該區塊轉換矩陣之第一位置的轉換數值重覆前述步驟;以及,對各該區塊轉換矩陣之每一個位置的轉換數值重覆前述步驟後得出該圖像轉換矩陣。
  14. 如申請專利範圍第1項所述之識別方法,其中該彩色來源圖像係包含複數個彩色像素點,而對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差之步驟係包含以下步驟:對該等彩色像素點分別進行彩度轉換,進而得出複數個色度像素點;將該等色度像素點映射於一彩度平面;計算在該彩度平面上的各個位置所對應之色度像素點的個數;定義複數個彩度比重組合;以及,根據該等彩度比重組合與該彩度平面上的各個位置所對應之色度像素點的個數而得出該等彩度動差。
  15. 如申請專利範圍第14項所述之識別方法,其中對該等彩色像素點分別進行彩度轉換,進而得出該等色度像素點之步驟係包含以下步驟:提供一色度轉換矩陣;以及,根據該色度轉換矩陣而將使利用一原色表示法代表的該等彩色像素點轉換為利用一色度表示法代表之該等 色度像素點。
  16. 如申請專利範圍第15項所述之識別方法,其中該原色表示法係以一第一原色數值、一第二原色數值、一第三原色數值代表該等彩色像素點,而該色度表示法係以一第一色度數值、一第二色度數值、一第三色度數值代表該等色度像素點。
  17. 如申請專利範圍第16項所述之識別方法,其中將該等色度像素點映射於該彩度平面之步驟係包含以下步驟:根據各該色度像素點所具有的第一色度數值、第二色度數值、第三色度數值而分別得出代表各該色度像素點之一第一正規化色度值、一第二正規化色度值;以及,利用代表各該色度像素點之該第一正規化色度值、該第二正規化色度值而決定該等色度像素點在該彩度平面的位置。
  18. 如申請專利範圍第17項所述之識別方法,其中根據各該色度像素點所具有的第一色度數值、第二色度數值、第三色度數值而分別得出代表各該色度像素點之該第一正規化色度值、該第二正規化色度值之步驟係包含以下步驟:根據一第一色度像素點之第一色度數值,以及該第一色度像素點之第一色度數值、第二色度數值、第三色度數值的總和而得出代表該第一色度像素點之該第一正規化色度值;根據該第一色度像素點之第二色度數值,以及該第一 色度像素點之第一色度數值、第二色度數值、第三色度數值的總和而得出代表該第一色度像素點之該第二正規化色度值;以及,對各該色度像素點重覆前述步驟。
  19. 如申請專利範圍第18項所述之識別方法,其中根據各該色度像素點所具有的第一色度數值、第二色度數值、第三色度數值而分別得出代表各該色度像素點之該第一正規化色度值、該第二正規化色度值之步驟更包含以下步驟:對代表各該色度像素點的該第一正規化色度值與該第二正規化色度值進行量化轉換。
  20. 如申請專利範圍第18項所述之識別方法,其中根據該等彩度比重組合與該彩度平面上的各個位置所對應之色度像素點的個數而得出該等彩度動差之步驟係包含以下步驟:因應各該彩度比重組合,改變在該彩度平面上的各個位置所對應之第一正規化色度值所對應的冪次,與各個位置所對應之第二正規化色度值所對應的冪次;以及,計算在該彩度平面上的各個位置所對應之第一正規化色度值所對應的冪次、各個位置所對應之第二正規化色度值所對應的冪次,與在該彩度平面上的各個位置所對應之色度像素點的個數之乘積,並據此而得出該等彩度動差。
  21. 如申請專利範圍第1項所述之識別方法,其中該等彩度動差的數量係根據該等彩度比重組合的數量而決 定。
  22. 如申請專利範圍第1項所述之識別方法,其中對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之該圖像識別參數之步驟更包含以下步驟:根據該彩色來源圖像的尺寸而調整與該等紋理參數相對應之權重。
  23. 如申請專利範圍第1項所述之識別方法,其中對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之該圖像識別參數之步驟更包含以下步驟:根據該彩色來源圖像的尺寸而調整與該等彩度動差相對應之權重。
  24. 一個具有圖像識別功能的電子裝置,包含:一儲存單元,其係儲存一彩色來源圖像;以及,一紋理判斷單元,電連接於該儲存單元,其係對該彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數;一色彩判斷單元,電連接於該儲存單元,其係對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差;以及,一識別單元,電連接於該紋理判斷單元與該色彩判斷單元,其係根據一參考圖像的尺寸與該彩色來源圖像的尺寸而決定一縮放因子,以及根據該縮放因子而對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之一圖像識別參數。
  25. 如申請專利範圍第24項所述之電子裝置,其中該紋理判斷單元係包含:一灰階轉換模組,電連接於該儲存單元,其係對該彩色來源圖像進行灰階轉換而產生一灰階來源圖像;一離散餘弦轉換模組,電連接於該灰階轉換模組,其係對該灰階來源圖像進行離散餘弦轉換而產生至少一個區塊轉換矩陣;以及,一紋理特徵擷取模組,電連接於該離散餘弦轉換模組,其係根據該至少一個區塊轉換矩陣而得出該等紋理參數。
  26. 如申請專利範圍第25項所述之電子裝置,其中該紋理判斷單元更包含:一區塊分割模組,電連接於該灰階轉換模組與該離散餘弦轉換模組,其係將該灰階來源圖像區分為至少一個灰階區塊。
  27. 如申請專利範圍第26項所述之電子裝置,其中該離散餘弦轉換模組係分別對該至少一個灰階區塊進行離散餘弦轉換後,產生與該至少一個灰階區塊相對應之該至少一個區塊轉換矩陣。
  28. 如申請專利範圍第25項所述之電子裝置,其中該紋理判斷單元更包含:一累加模組,電連接於該紋理特徵擷取模組與該識別單元,其係累加該至少一個區塊轉換矩陣而得出一圖像轉換矩陣,其中該圖像轉換矩陣係包含複數個累加轉換數值。
  29. 如申請專利範圍第28項所述之電子裝置,其中該至少一個區塊轉換矩陣係包含複數個轉換數值,而該累加模組係將位於一第一區塊轉換矩陣之第一位置的轉換數值與位於一第二區塊轉換矩陣之第一位置的轉換數值相加;對各該區塊轉換矩陣之第一位置的轉換數值重覆前述步驟;以及,對各該區塊轉換矩陣之每一個位置的轉換數值重覆前述步驟後得出該圖像轉換矩陣。
  30. 如申請專利範圍第28項所述之電子裝置,其中該圖像轉換矩陣係區分為一平滑紋理區、一縱向紋理區、一橫向紋理區、一斜向紋理區與一高頻區,而該識別單元係根據該平滑紋理區、該縱向紋理區、該橫向紋理區、該斜向紋理區而得出該等紋理參數。
  31. 如申請專利範圍第30項所述之電子裝置,其中該識別單元係根據與該平滑紋理參數相對應之一平滑紋理權重、與該縱向紋理參數相對應之一縱向紋理權重、與該橫向紋理參數相對應之一橫向紋理權重、與該斜向紋理參數相對應之一斜向紋理權重而對該等紋理參數進行加權運算。
  32. 如申請專利範圍第24項所述之電子裝置,其中該色彩判斷單元係包含:一彩度轉換模組,電連接於該儲存單元,其係對該等彩色像素點分別進行彩度轉換,進而得出複數個色度像素點;一映射模組,電連接於該彩度轉換模組,其係將該等色度像素點映射於一彩度平面; 一像素點累計模組,電連接於該映射模組,其係計算在該彩度平面上的各個位置所對應之色度像素點的個數;以及,一彩色特徵擷取模組,電連接於該像素點累計模組與該識別單元,其係根據複數個彩度比重組合與該彩度平面上的各個位置所對應之色度像素點的個數而得出該等彩度動差。
  33. 如申請專利範圍第32項所述之電子裝置,其中該彩度轉換模組係根據一色度轉換矩陣而將使利用一原色表示法代表的該等彩色像素點轉換為利用一色度表示法代表之該色度像素點。
  34. 如申請專利範圍第1項所述之電子裝置,其中該識別單元係根據該彩色來源圖像的尺寸而調整與該等紋理參數相對應之權重。
  35. 如申請專利範圍第1項所述之電子裝置,其中該識別單元係根據該彩色來源圖像的尺寸而調整與該等彩度動差相對應之權重。
  36. 一種電腦程式產品,其上儲存有一軟體程式,該軟體程式執行時將使具有一控制器之一電子裝置進行一圖像的識別方法,該圖像的識別方法包括下列步驟:對一彩色來源圖像進行紋理特徵擷取後,得出複數個紋理參數;對該彩色來源圖像進行色彩特徵擷取後,得出複數個彩度動差;根據一參考圖像的尺寸與該彩色來源圖像的尺寸而 決定一縮放因子;以及,根據該縮放因子而對該等紋理參數與該等彩度動差進行加權運算後,得出與該彩色來源圖像相對應之一圖像識別參數。
TW102104154A 2013-02-04 2013-02-04 圖像的識別方法、電子裝置與電腦程式產品 TWI475495B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
TW102104154A TWI475495B (zh) 2013-02-04 2013-02-04 圖像的識別方法、電子裝置與電腦程式產品
CN201310061277.0A CN103971113B (zh) 2013-02-04 2013-02-27 图像的识别方法与电子装置
US14/048,104 US9269019B2 (en) 2013-02-04 2013-10-08 Image identification method, electronic device, and computer program product
US14/994,210 US9466123B2 (en) 2013-02-04 2016-01-13 Image identification method, electronic device, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102104154A TWI475495B (zh) 2013-02-04 2013-02-04 圖像的識別方法、電子裝置與電腦程式產品

Publications (2)

Publication Number Publication Date
TW201432584A TW201432584A (zh) 2014-08-16
TWI475495B true TWI475495B (zh) 2015-03-01

Family

ID=51240584

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102104154A TWI475495B (zh) 2013-02-04 2013-02-04 圖像的識別方法、電子裝置與電腦程式產品

Country Status (3)

Country Link
US (2) US9269019B2 (zh)
CN (1) CN103971113B (zh)
TW (1) TWI475495B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157299A1 (ja) * 2015-03-27 2016-10-06 三菱電機株式会社 撮像装置及び方法、操作装置及び方法、並びにプログラム及び記録媒体
CN105654093B (zh) 2015-11-25 2018-09-25 小米科技有限责任公司 特征提取方法及装置
US10402696B2 (en) * 2016-01-04 2019-09-03 Texas Instruments Incorporated Scene obstruction detection using high pass filters
CN108573501B (zh) * 2017-03-14 2021-09-21 中国科学院宁波材料技术与工程研究所 一种基础矩阵的解算方法
CN107967478A (zh) * 2017-12-08 2018-04-27 奕响(大连)科技有限公司 一种简化dct像素灰度图片相似判定方法
CN109326245A (zh) * 2018-11-09 2019-02-12 深圳市华星光电半导体显示技术有限公司 侦测显示装置的图像中高频成分的方法及装置
CN111460871B (zh) 2019-01-18 2023-12-22 北京市商汤科技开发有限公司 图像处理方法及装置、存储介质
CN111126413B (zh) * 2019-11-25 2023-05-05 郑州大学 基于图像识别的车用燃油清净性快速测定方法及装置
CN112330607A (zh) * 2020-10-20 2021-02-05 精英数智科技股份有限公司 基于图像识别技术的煤矸识别方法、装置及系统
CN112484856A (zh) * 2020-10-30 2021-03-12 浙江农林大学暨阳学院 一种获取高精度色度和光谱图像的方法
CN112446715B (zh) * 2021-02-01 2021-05-04 深圳华龙讯达信息技术股份有限公司 一种基于工业互联网云平台的产品溯源方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200903349A (en) * 2007-07-06 2009-01-16 Quanta Comp Inc Image recognition method and image recognition apparatus

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411953B1 (en) * 1999-01-25 2002-06-25 Lucent Technologies Inc. Retrieval and matching of color patterns based on a predetermined vocabulary and grammar
JP4652720B2 (ja) * 2004-05-07 2011-03-16 キヤノン株式会社 カラー画像形成装置及びその制御方法
ITVA20060079A1 (it) * 2006-12-19 2008-06-20 St Microelectronics Srl Metodo di classificazione cromatica di pixel e metodo di miglioramento adattativo di un'immagine a colori
JP5157768B2 (ja) * 2008-09-08 2013-03-06 ソニー株式会社 画像処理装置および方法、並びにプログラム
EP2257072A1 (en) * 2009-05-27 2010-12-01 Nxp B.V. Image and video coding
US8478053B2 (en) * 2009-07-15 2013-07-02 Nikon Corporation Image sorting apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200903349A (en) * 2007-07-06 2009-01-16 Quanta Comp Inc Image recognition method and image recognition apparatus

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PASCHOS, George. "Image content-based retrieval using chromaticity moments", Knowledge and Data Engineering,IEEE Transactions on, 2003, 15.5: 1069-1072. *

Also Published As

Publication number Publication date
US9269019B2 (en) 2016-02-23
CN103971113A (zh) 2014-08-06
CN103971113B (zh) 2017-05-17
US20140219557A1 (en) 2014-08-07
US9466123B2 (en) 2016-10-11
US20160125623A1 (en) 2016-05-05
TW201432584A (zh) 2014-08-16

Similar Documents

Publication Publication Date Title
TWI475495B (zh) 圖像的識別方法、電子裝置與電腦程式產品
US9014468B2 (en) Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method
CN111489346B (zh) 一种全参考图像质量评价方法及系统
CN106650615A (zh) 一种图像处理方法及终端
Javaheri et al. A point-to-distribution joint geometry and color metric for point cloud quality assessment
CN111539353A (zh) 一种图像场景识别方法及装置、计算机设备以及存储介质
CN112561976A (zh) 一种图像主颜色特征提取方法、图像检索方法、存储介质及设备
US9330447B2 (en) Image evaluation device, image selection device, image evaluation method, recording medium, and program
US10026009B2 (en) Methods and systems for determining a perceptual similarity between images
JP2002358515A (ja) 変倍画像生成装置及び方法、画像特徴算出装置及び方法、及びそのコンピュータプログラムとコンピュータ読み取り可能な記憶媒体、並びに画像データ構造
Taspinar et al. Source camera attribution of multi-format devices
Losson et al. CFA local binary patterns for fast illuminant-invariant color texture classification
CN105631812B (zh) 一种对显示图像进行色彩增强的控制方法及控制装置
Zhang et al. MLSIM: A Multi-Level Similarity index for image quality assessment
CN106294690A (zh) 基于内容的图像视频搜索平台
CN113395407A (zh) 图像处理装置、图像处理方法及计算机可读介质
US8532404B2 (en) Image processing apparatus, image processing method and computer-readable medium
JPH11238067A (ja) 画像検索システムおよび記録媒体
CN105007472A (zh) 照片显示方法及装置
Lüsi et al. Optimal image compression via block-based adaptive colour reduction with minimal contour effect
JP2014067129A (ja) スケール毎の特徴量と色分布との関係を考慮した色変換処理プログラム、装置及び方法
CN116152530B (zh) 图像差异的确定方法和装置、存储介质及电子设备
CN109977734B (zh) 图像处理方法和装置
Araujo et al. Effects of Color Quantization on JPEG Compression
CN116668708A (zh) 一种参数确定方法、装置、电子设备及存储介质