TW201502998A - 圖像識別方法、裝置、終端設備及伺服器 - Google Patents

圖像識別方法、裝置、終端設備及伺服器 Download PDF

Info

Publication number
TW201502998A
TW201502998A TW103121636A TW103121636A TW201502998A TW 201502998 A TW201502998 A TW 201502998A TW 103121636 A TW103121636 A TW 103121636A TW 103121636 A TW103121636 A TW 103121636A TW 201502998 A TW201502998 A TW 201502998A
Authority
TW
Taiwan
Prior art keywords
image information
information
image
recognition
feature
Prior art date
Application number
TW103121636A
Other languages
English (en)
Other versions
TWI518602B (zh
Inventor
de-mao Zhou
Bin Xiao
Ke Ren Li
pin-lin Chen
Original Assignee
Tencent Tech Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Tech Shenzhen Co Ltd filed Critical Tencent Tech Shenzhen Co Ltd
Publication of TW201502998A publication Critical patent/TW201502998A/zh
Application granted granted Critical
Publication of TWI518602B publication Critical patent/TWI518602B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding

Abstract

本發明提供一種圖像識別方法、裝置、終端設備及伺服器,其方法可包含:採集待識別的圖像資訊;將圖像資訊發送至伺服器,以使伺服器對圖像資訊進行特徵識別,並返回識別結果;輸出伺服器返回的識別結果。本發明可簡化使用者操作,提升圖像識別的效率,提升圖像識別的智能性。

Description

圖像識別方法、裝置、終端設備及伺服器
本發明係關於網際網路技術領域,具體關於圖像識別技術領域,尤其關於一種圖像識別方法、裝置、終端設備及伺服器。
習知技術中,圖像識別的處理方案包含下列步驟。首先,使用者導入待識別的圖像資訊,其次,使用者手動選擇待識別的圖像資訊中包含的物體的類別,最後在所選擇的類別中對圖像資訊進行識別獲得識別結果。習知的圖像識別技術需要使用者手動干預,操作繁瑣,降低了圖像識別的效率,降低了圖像識別的智能性。
為解決上述問題,本發明之一目的在於提供一種圖像識別方法、裝置、終端設備及伺服器,可簡化使用者操 作,提升圖像識別的效率,提升圖像識別的智能性。
為獲得上述發明目的,本發明提供一種圖像識別方法,可包含:採集待識別的圖像資訊;將該圖像資訊發送至伺服器,以使該伺服器對該圖像資訊進行特徵識別,並傳回識別結果;輸出該伺服器傳回的識別結果。
本發明進一步提供另一種圖像識別方法,可包含:接收終端設備發送的待識別的圖像資訊;對該圖像資訊進行特徵識別,獲得識別結果;向該終端設備傳回該識別結果。
本發明進一步提供一種圖像識別裝置,可包含:採集模組,用於採集待識別的圖像資訊;識別模組,用於將該圖像資訊發送至伺服器,以使該伺服器對該圖像資訊進行特徵識別,並傳回識別結果;輸出模組,用於輸出該伺服器傳回的識別結果。
本發明第進一步提供一種終端設備,可包含上述協力廠商面提供的圖像識別裝置。
本發明進一步提供另一種圖像識別裝置,可包含:接收模組,用於接收終端設備發送的待識別的圖 像資訊;識別模組,用於對該圖像資訊進行特徵識別,獲得識別結果;結果傳回模組,用於向該終端設備傳回該識別結果。
本發明進一步提供一種伺服器,可包含上述圖像識別裝置。
實施本發明實施例,具有如下有益效果:本發明實施例中,可自動採集待識別的圖像資訊,並可對待識別的圖像資訊進行特徵識別獲得識別結果,避免了用戶手動干預,簡化了用戶操作,同時提升了圖像識別的效率,提升了圖像識別的智能性。
S101~S103‧‧‧步驟
S201~S208‧‧‧步驟
S301~S303‧‧‧步驟
S401~S406‧‧‧步驟
101‧‧‧採集模組
102‧‧‧識別模組
103‧‧‧輸出模組
104‧‧‧裁剪模組
105‧‧‧編碼模組
106‧‧‧顯示模組
1101‧‧‧監測單元
1102‧‧‧獲取單元
1103‧‧‧確定單元
201‧‧‧接收模組
202‧‧‧識別模組
2201‧‧‧提取單元
2202‧‧‧匹配單元
2203‧‧‧確定單元
203‧‧‧結果傳回模組
204‧‧‧解碼模組
為了更清楚地說明本發明實施例或習知技術中的技術方案,下面將對實施例或習知技術描述中所需要使用的圖示作簡單地介紹,顯而易見地,下面描述中的圖示僅僅是本發明的一些實施例,對於本領域技術人員來講,還可以根據這些圖示獲得其他的圖示。
第1圖為本發明實施例提供的一種圖像識別方法的流程圖;第2圖為本發明實施例提供的另一種圖像識別方法的流程 圖;第3圖為本發明實施例提供的又一種圖像識別方法的流程圖;第4圖為本發明實施例提供的又一種圖像識別方法的流程圖;第5圖為本發明實施例提供的一種圖像識別裝置的結構示意圖;第6圖為本發明實施例提供的另一種圖像識別裝置的結構示意圖;第7圖為本發明實施例提供的採集模組的結構示意圖;第8圖為本發明實施例提供的又一種圖像識別裝置的結構示意圖;第9圖為本發明實施例提供的又一種圖像識別裝置的結構示意圖;第10圖為本發明實施例提供的識別模組的結構示意圖。
下面將結合本發明實施例中的圖示,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域技術人員所的等效修改,都屬於本發明保護的範圍。
本發明實施例中,終端設備可以包含但不限於: 個人電腦(Personal Computer,PC)、平板電腦(例如iPAD等)、手機、智慧手機、筆記型電腦等設備。
下面將結合第1圖-第2圖,對本發明實施例提供 的圖像識別方法進行詳細介紹。需要說明的是,第1圖-第2圖所示的圖像識別方法的流程由一種圖像識別裝置所執行,該圖像識別裝置安裝於終端設備中。
請參見第1圖,為本發明實施例提供的一種圖像 識別方法的流程圖。該方法可包含以下步驟S101-步驟S103。
在步驟S101中,採集待識別的圖像資訊。
本步驟中,可以利用終端設備的照相應用,例如
攝影鏡頭、照相機等應用,從所述照相應用的拍攝介面中採集待識別的圖像資訊。
在步驟S102中,將圖像資訊發送至伺服器,以使 伺服器對圖像資訊進行特徵識別,並傳回識別結果。
其中,對圖像資訊進行特徵識別的技術,指通過 對圖像資訊包含的特徵進行處理、分析和理解,從圖像資訊中識別出目標物件的技術。
在步驟S103中,輸出伺服器傳回的識別結果。
其中,識別結果可包含圖像資訊中的物體的簡介 資訊和該圖像資訊中的物體的位址資訊。其中,位址資訊可以是物體的購買位址資訊,通過位址資訊可打開物體的購買 詳情介面。可以理解的是,本步驟輸出伺服器傳回的識別結果之後,用戶可以對該識別結果進行相應操作,例如查看圖像資訊中的物體的簡介資訊,或者,點擊圖像資訊中的物體的位址資訊,或者,在瀏覽器中打開圖像資訊中包含的物體的位址資訊。
請參見第2圖,為本發明實施例提供的另一種圖 像識別方法的流程圖。該方法可包含以下步驟S201-步驟S208。
在步驟S201中,當照相應用啟動時,監測照相應 用的拍攝介面。
其中,照相應用指終端設備中的照相應用,可包 含但不限於攝影鏡頭、照相機等應用。本步驟中,當照相應用啟動時,該照相應用的拍攝介面即被打開,該照相應用的拍攝介面中將出現欲拍攝的圖像資訊。可以理解的是,若該照相應用的拍攝按鈕被觸發,例如使用者按下拍攝按鍵,則該照相應用的拍攝介面中將出現已拍攝的靜態的圖像資訊。 若該照相應用的拍攝按鈕未被觸發,則該照相應用的拍攝介面中出現的圖像資訊為動態的圖像資訊。本實施例中,為了提高智能性,避免用戶手動拍攝以簡化用戶操作,較佳地,本步驟監測照相應用的拍攝按鈕未被觸發的情況下的拍攝介面,即監測照相應用的拍攝介面中出現的動態的圖像資訊。
在步驟S202中,從照相應用的拍攝介面中獲取預 設時間的圖像資訊。
其中,預設時間可根據實際需要進行設定,例如 設定預設時間為5s、10s等等。由於監測到的照相應用的拍攝介面中出現的圖像資訊為動態的圖像資訊,因此,本步驟可以從照相應用的拍攝介面中獲取預設時間的動態的圖像資訊,例如假設預設時間為5s,步驟S201在照相應用啟動時,監測到照相應用的拍攝介面中出現圖像資訊,本步驟則獲取5s內出現在照相應用的拍攝介面中的圖像應用,當到達5s後,可不再獲取照相應用的拍攝介面中出現的圖像資訊。
在步驟S203中,將獲取的圖像資訊確定為待識別的圖像資訊。
本實施例的步驟S201-步驟S203可以為第1圖所示實施例的步驟S101的具體細化步驟。需要說明的是,本實施例中,從照相應用的拍攝介面中獲取預設時間的圖像資訊作為待識別的圖像資訊,而並非直接獲取所述照相應用的拍攝介面中出現的全部圖像資訊作為待識別的圖像資訊,通過對預設時間的具體設定,既可保證圖像識別的順利進行,又可有效提升圖像資訊獲取的效率,同時可避免對圖像資訊的處理資源的浪費。
在步驟S204中,按照預設的圖像規格,對圖像資訊進行裁剪處理。
在步驟S205中,對裁剪處理後的圖像資訊進行編 碼處理。
本實施例的步驟S204-步驟S205可以為對圖像資 訊的預處理過程。其中,預設的圖像規格可根據實際需要進行設定,例如設定預設的圖像規格為“220圖元(高)*320圖元(寬),解析度350dpi”,或者,設定預設的圖像規格為“441圖元(高)*311圖元(寬),解析度360dpi”等等。由於從照相應用的拍攝介面中獲取的預設時間的圖像資訊的規格可能不一致,例如:用戶在預設時間內多次調整了照相應用的焦距或背光等屬性,使得預設時間內的圖像資訊的規格不統一。步驟S204則可對不滿足預設的圖像規格的圖像資訊進行裁剪處理,將預設時間內的圖像資訊的規格進行統一。由於裁剪處理後的圖像資訊需要發送至伺服器進行特徵識別,為了便於傳輸,步驟S205還可以對裁剪處理後的圖像資訊進行編碼處理,以提高傳輸效率,節省傳輸所佔用的網路資源。
在步驟S206中,將編碼處理後的圖像資訊發送至 伺服器,以使伺服器對圖像資訊進行特徵識別,並傳回識別結果。
其中,對圖像資訊進行特徵識別的技術,指通過 對圖像資訊包含的特徵進行處理、分析和理解,從圖像資訊中識別出目標物件的技術。本步驟中,伺服器在接收到編碼處理後的圖像資訊之後,首先對該圖像資訊進行解碼處理,該解碼處理的過程為步驟S205的編碼過程的逆過程。實際應 用中,伺服器可對解碼處理後的圖像資訊進行特徵識別,具體實現中,伺服器可首先利用特徵識別技術從解碼處理後的圖像資訊中進行特徵提取,該特徵識別技術可包含但不限於:尺度不變特徵轉換(Scale-invariant feature transform,SIFT)技術或加速強健特徵(Speeded Up Robust Features,SURF)等等。然後將提取的特徵與預設的物體特徵範本進行比對,根據比對獲得識別結果。
在步驟S207中,輸出伺服器傳回的識別結果。
其中,識別結果包含圖像資訊中的物體的簡介資 訊和圖像資訊中的物體的位址資訊。其中,位址資訊可以是物體的購買位址資訊,通過位址資訊可打開物體的購買詳情介面。可以理解的是,本步驟輸出伺服器傳回的識別結果之後,用戶可以對該識別結果進行相應操作,例如查看圖像資訊中的物體的簡介資訊,或者,點擊圖像資訊中的物體的位址資訊,或者,在瀏覽器中打開圖像資訊中包含的物體的位址資訊。
在步驟S208中,當檢測到對識別結果的觸發操作 時,顯示圖像資訊中的物體的位址資訊所指示的物體的詳情頁面。
其中,觸發操作可包含但不限於點擊圖像資訊中 的物體的位址資訊,或者,在瀏覽器中打開圖像資訊中的物體的位址資訊等等。本步驟中,當檢測到對識別結果的觸發 操作時,顯示圖像資訊中的物體的位址資訊所指示的物體的詳情頁面,例如顯示物體的購買詳情頁面,有利於實現物體的精準行銷。
通過上述第1圖-第2圖所示實施例的描述,本發 明實施例中,可自動採集待識別的圖像資訊,並可對待識別的圖像資訊進行特徵識別獲得識別結果,避免了用戶手動干預,簡化了用戶操作,同時提升了圖像識別的效率,提升了圖像識別的智能性。
下面將結合第3圖-第4圖,對本發明實施例提供 的圖像識別方法進行詳細介紹。需要說明的是,第3圖-第4圖所示的圖像識別方法的流程由另一種圖像識別裝置所執行,該圖像識別裝置安裝於伺服器中。
請參見第3圖,為本發明實施例提供的又一種圖像識別方法的流程圖;該方法包含以下步驟S301-步驟S303。
在步驟S301中,接收終端設備發送的待識別的圖像資訊。
其中,待識別的圖像資訊可以是終端設備利用照相應用,例如攝影鏡頭、照相機等應用,從照相應用的拍攝介面中採集到的圖像資訊。本步驟中,接收終端設備發送的待識別的圖像資訊。
在步驟S302中,對圖像資訊進行特徵識別,獲得識別結果。
其中,對圖像資訊進行特徵識別的技術,指通過 對圖像資訊包含的特徵進行處理、分析和理解,從圖像資訊中識別出目標物件的技術。本步驟中,利用對圖像資訊進行特徵識別的技術,識別出圖像資訊中包含的物體。
在步驟S303中,向終端設備傳回識別結果。
其中,識別結果包含圖像資訊中的物體的簡介資訊和圖像資訊中的物體的位址資訊。其中,位址資訊可以是物體的購買位址資訊,通過位址資訊可打開物體的購買詳情介面。可以理解的是,本步驟向終端設備傳回識別結果之後,終端設備可輸出伺服器傳回的識別結果,用戶可以對該輸出的識別結果進行相應操作,例如查看所述圖像資訊中的物體的簡介資訊,或者,點擊圖像資訊中包含的物體的位址資訊,或者,在瀏覽器中打開圖像資訊中包含的物體的位址資訊。
請參見第4圖,為本發明實施例提供的又一種圖像識別方法的流程圖。該方法包含以下步驟S401-步驟S406。
在步驟S401中,接收終端設備發送的待識別的圖像資訊。
本實施例的步驟S401可參見第3圖所示實施例的步驟S301,在此不贅述。
在步驟S402中,對接收到的圖像資訊進行解碼處理。
為了便於圖像資訊的傳輸,終端設備可以對採集 到的圖像資訊進行預處理,包含裁剪處理和編碼處理,以提高傳輸效率,節省傳輸所佔用的網路資源。本步驟中,在接收到終端設備發送的待識別的圖像資訊之後,對該圖像資訊進行解碼處理,該解碼處理的過程為終端設備的編碼過程的逆過程。
在步驟S403中,提取圖像資訊的特徵資訊。
本步驟可利用特徵識別技術從解碼處理後的圖 像資訊中進行特徵提取,該特徵識別技術包含但不限於:SIFT技術或SURF等等。
在步驟S404中,將圖像資訊的特徵資訊與預設的 物體特徵範本進行比對,判斷是否存在與圖像資訊的特徵資訊相匹配的物體特徵範本。
其中,圖像資訊的特徵資訊與某一物體特徵範本 相匹配,可以指圖像資訊的特徵資訊與該物體特徵範本完全相同,例如,若圖像資訊的特徵資訊可採用特徵向量K1表示,某書籍的物體特徵範本也可採用特徵向量K1,則圖像資訊的特徵資訊與該書籍的物體特徵範本相匹配。圖像資訊的特徵資訊與某一物體特徵範本相匹配,也可以指圖像資訊的特徵資訊與該物體特徵範本達到特定臨界值的相似,例如,假設特定臨界值為80%,若圖像資訊的特徵資訊可採用特徵向量K2表示,K2包含5個特徵值。某CD封面的物體特徵範本可採用特徵向量K3表示,K3包含5個特徵值。如果K2與K3之間的 相同特徵值達到4個以上,則圖像資訊的特徵資訊與CD封面的物體特徵範本的相似度達到80%以上,則圖像資訊的特徵資訊與書籍的物體特徵範本相匹配。
在步驟S405中,如果存在與圖像資訊的特徵資訊 相匹配的物體特徵範本,將相匹配的物體特徵範本所標識的物體的簡介資訊和位址資訊確定為識別結果。
如果步驟S404判斷存在與圖像資訊的特徵資訊 相匹配的物體特徵範本,表示對圖像資訊識別成功,本步驟則將相匹配的物體特徵範本所標識的物體的簡介資訊和位址資訊確定為識別結果。按照步驟S404中的範例,若圖像資訊的特徵資訊與某書籍的物體特徵範本相匹配,則可判斷圖像資訊中包含該書籍,本步驟可將該書籍的簡介資訊和該書籍的位址資訊作為識別結果。進一步按照步驟S404中的範例,若圖像資訊的特徵資訊與某CD封面的物體特徵範本相匹配,則可判斷圖像資訊中包含該CD封面,本步驟可將該CD封面的簡介資訊和該CD封面標識的CD的位址資訊作為識別結果。可以理解的是,如果步驟S404判斷不存在與圖像資訊的特徵資訊相匹配的物體特徵範本,表示對圖像資訊識別不成功,本實施例則可以向終端設備傳回識別失敗的提示資訊。
在步驟S406中,向終端設備傳回識別結果。
本實施例的步驟S401可參見第3圖所示實施例的步驟S303,在此不贅述。
通過上述第3圖-第4圖所示實施例的描述,本發 明實施例中,可自動採集待識別的圖像資訊,並可對待識別的圖像資訊進行特徵識別獲得識別結果,避免了用戶手動干預,簡化了用戶操作,同時提升了圖像識別的效率,提升了圖像識別的智能性。
需要說明的是,第3圖-第4圖所示的圖像識別方 法的由安裝於伺服器中的圖像識別裝置執行,為了提升圖像識別效率,上述方法中還可以採用並行處理方式,例如在一個伺服器中採用多個圖像識別裝置並行進行識別處理,或者,採用多個伺服器,在每個伺服器中安裝一個圖像識別裝置,每個伺服器中的圖像識別裝置並行進行識別處理等等。
下面將結合第5圖-第7圖,對本發明實施例提供 的一種圖像識別裝置的結構進行詳細介紹。需要說明的是,第5圖-第7圖所示的圖像識別裝置,安裝於終端設備中,該圖像識別裝置可以為終端設備中的用戶端模組,例如即時通信用戶端、社交網路服務(Social Networking Services,SNS)用戶端等等,用於執行本發明第1圖-第2圖所示實施例的方法,為了便於說明,僅示出了與本發明實施例相關的部分,具體技術細節未揭示的,請參照本發明第1圖-第2圖所示的實施例。
請參見第5圖,為本發明實施例提供的一種圖像 識別裝置的結構示意圖。該裝置包含採集模組101、識別模組 102和輸出模組103。
採集模組101,用於採集待識別的圖像資訊。
採集模組101可以利用終端設備的照相應用,例如攝影鏡頭、照相機等應用,從照相應用的拍攝介面中採集待識別的圖像資訊。
識別模組102,用於將圖像資訊發送至伺服器,以使伺服器對圖像資訊進行特徵識別,並傳回識別結果。
其中,對圖像資訊進行特徵識別的技術,指通過對圖像資訊包含的特徵進行處理、分析和理解,從圖像資訊中識別出目標物件的技術。
輸出模組103,用於輸出伺服器傳回的識別結果。
其中,識別結果包含圖像資訊中的物體的簡介資訊和圖像資訊中的物體的位址資訊。其中,位址資訊可以是物體的購買位址資訊,通過位址資訊可打開物體的購買詳情介面。可以理解的是,輸出模組103輸出伺服器傳回的識別結果之後,用戶可以對該識別結果進行相應操作,例如查看圖像資訊中的物體的簡介資訊,或者,點擊圖像資訊中的物體的位址資訊,或者,在瀏覽器中打開圖像資訊中的物體的位址資訊。
請參見第6圖,為本發明實施例提供的另一種圖像識別裝置的結構示意圖。該裝置包含採集模組101、識別模組102和輸出模組103。可選地,該裝置還可包含裁剪模組104 和編碼模組105。可選地,該裝置還包含顯示模組106。
裁剪模組104,用於按照預設的圖像規格,對圖 像資訊進行裁剪處理。
編碼模組105,用於對裁剪處理後的圖像資訊進 行編碼處理。
裁剪模組104和編碼模組105的處理過程可以為 對圖像資訊的預處理過程。其中,預設的圖像規格可根據實際需要進行設定,例如,可設定預設的圖像規格為“220圖元(高)*320圖元(寬),解析度350dpi”,或者,可設定預設的圖像規格為“441圖元(高)*311圖元(寬),解析度360dpi”等等。由於從照相應用的拍攝介面中獲取的預設時間的圖像資訊的規格可能不一致,例如,用戶在預設時間內多次調整了照相應用的焦距或背光等屬性,使得預設時間內的圖像資訊的規格不統一。裁剪模組104可對不滿足預設的圖像規格的圖像資訊進行裁剪處理,將預設時間內的圖像資訊的規格進行統一。由於裁剪處理後的圖像資訊需要發送至伺服器進行特徵識別,為了便於傳輸,編碼模組105可以對裁剪處理後的圖像資訊進行編碼處理,以提高傳輸效率,節省傳輸所佔用的網路資源。
顯示模組106,用於當檢測到對識別結果的觸發 操作時,顯示圖像資訊中包含的物體的位址資訊所指示的物體的詳情頁面。
其中,觸發操作包含但不限於點擊圖像資訊中的 物體的位址資訊,或者,在瀏覽器中打開圖像資訊中的物體的位址資訊等等。顯示模組106當檢測到對識別結果的觸發操作時,顯示圖像資訊中的物體的位址資訊所指示的物體的詳情頁面,例如顯示物體的購買詳情頁面,有利於實現物體的精準行銷。
請參見第7圖,為本發明實施例提供的採集模組 的結構示意圖。該採集模組101包含監測單元1101、獲取單元1102和確定單元1103。
監測單元1101,用於當照相應用啟動時,監測照相應用的拍攝介面。
其中,照相應用指終端設備中的照相應用,包含但不限於攝影鏡頭、照相機等應用。當照相應用啟動時,該照相應用的拍攝介面即被打開,該照相應用的拍攝介面中將出現欲拍攝的圖像資訊。可以理解的是,若該照相應用的拍攝按鈕被觸發,例如使用者按下拍攝按鍵,則該照相應用的拍攝介面中將出現已拍攝的靜態的圖像資訊。若該照相應用的拍攝按鈕未被觸發,則該照相應用的拍攝介面中出現的圖像資訊為動態的圖像資訊。本實施例中,為了提高智能性,避免用戶手動拍攝以簡化用戶操作,較佳地,監測單元1101監測照相應用的拍攝按鈕未被觸發的情況下的拍攝介面,即監測照相應用的拍攝介面中出現的動態的圖像資訊。
獲取單元1102,用於從照相應用的拍攝介面中獲 取預設時間的圖像資訊。
其中,預設時間可根據實際需要進行設定,例如 設定預設時間為5s、10s等等。由於監測到的照相應用的拍攝介面中出現的圖像資訊為動態的圖像資訊,因此,獲取單元1102可以從照相應用的拍攝介面中獲取預設時間的動態的圖像資訊,例如,假設預設時間為5s,獲取單元1102在照相應用啟動時,監測到照相應用的拍攝介面中出現圖像資訊,獲取單元1102則獲取5s內出現在照相應用的拍攝介面中的圖像應用,當到達5s後,可不再獲取照相應用的拍攝介面中出現的圖像資訊。
確定單元1103,用於將獲取的圖像資訊確定為待 識別的圖像資訊。
監測單元1101、獲取單元1102和確定單元1103的 處理過程為採集待識別的圖像資訊的過程。需要說明的是,本實施例中,從照相應用的拍攝介面中獲取預設時間的圖像資訊作為待識別的圖像資訊,而並非直接獲取照相應用的拍攝介面中出現的全部圖像資訊作為待識別的圖像資訊,通過對預設時間的具體設定,既可保證圖像識別的順利進行,又可有效提升圖像資訊獲取的效率,同時可避免對圖像資訊的處理資源的浪費。
通過上述第5圖-第7圖所示實施例的描述,本發 明實施例中,可自動採集待識別的圖像資訊,並可對待識別的圖像資訊進行特徵識別獲得識別結果,避免了用戶手動干預,簡化了用戶操作,同時提升了圖像識別的效率,提升了圖像識別的智能性。
本發明實施例還揭示了一種終端設備,該終端設 備包含圖像識別裝置,該裝置的結構和功能可參見第5圖-第7圖所示實施例的描述,在此不贅述。需要說明的是,本實施例的終端設備可以應用於上述方法中。
本發明實施例中,可自動採集待識別的圖像資 訊,並可對待識別的圖像資訊進行特徵識別獲得識別結果,避免了用戶手動干預,簡化了用戶操作,同時提升了圖像識別的效率,提升了圖像識別的智能性。
下面將結合第8圖-第10圖,對本發明實施例提供 的一種圖像識別裝置的結構進行詳細介紹。需要說明的是,第8圖-第10圖所示的圖像識別裝置,可安裝於伺服器中,用於執行本發明第3圖-第4圖所示實施例的方法,為了便於說明,僅示出了與本發明實施例相關的部分,具體技術細節未揭示的,請參照本發明第3圖-第4圖所示的實施例。
請參見第8圖,為本發明實施例提供的一種圖像 識別裝置的結構示意圖。該裝置包含接收模組201、識別模組202和結果傳回模組203。
接收模組201用於接收終端設備發送的待識別的 圖像資訊。
其中,待識別的圖像資訊可以是終端設備利用照 相應用,例如攝影鏡頭、照相機等應用,從照相應用的拍攝介面中採集到的圖像資訊;接收模組201接收終端設備發送的待識別的圖像資訊。
識別模組202,用於對圖像資訊進行特徵識別, 獲得識別結果。
其中,對圖像資訊進行特徵識別的技術,指通過 對圖像資訊包含的特徵進行處理、分析和理解,從圖像資訊中識別出目標物件的技術。識別模組202利用對圖像資訊進行特徵識別的技術,識別出圖像資訊中包含的物體。
結果傳回模組203,用於向終端設備傳回識別結 果。
其中,識別結果包含圖像資訊中的物體的簡介資 訊和圖像資訊中的物體的位址資訊。其中,位址資訊可以物體的購買位址資訊,通過位址資訊可打開物體的購買詳情介面。可以理解的是,結果傳回模組203向終端設備傳回識別結果之後,終端設備可輸出伺服器傳回的識別結果,用戶可以對該輸出的識別結果進行相應操作,例如查看圖像資訊中包含的物體的簡介資訊,或者點擊圖像資訊中包含的物體的位址資訊,或者,在瀏覽器中打開圖像資訊中的物體的位址資訊。
請參見第9圖,為本發明實施例提供的另一種圖 像識別裝置的結構示意圖。該裝置包含接收模組201、識別模組202和結果傳回模組203。可選地,該裝置還包含解碼模組204。
解碼模組204,用於對接收到的圖像資訊進行解 碼處理。
為了便於圖像資訊的傳輸,終端設備可以對採集 到的圖像資訊進行預處理,包含裁剪處理和編碼處理,以提高傳輸效率,節省傳輸所佔用的網路資源。解碼模組204在接收到終端設備發送的待識別的圖像資訊之後,對該圖像資訊進行解碼處理,該解碼處理的過程為終端設備的編碼過程的逆過程。
請參見第10圖,為本發明實施例提供的識別模組 的結構示意圖。該識別模組202包含提取單元2201、匹配單元2202和確定單元2203。
提取單元2201,用於提取圖像資訊的特徵資訊。
提取單元2201可利用特徵識別技術從解碼處理後的圖像資訊中進行特徵提取,該特徵識別技術包含但不限於SIFT技術或SURF等等。
匹配單元2202,用於將圖像資訊的特徵資訊與預設的物體特徵範本進行比對,判斷是否存在與圖像資訊的特徵資訊相匹配的物體特徵範本。
其中,圖像資訊的特徵資訊與某一物體特徵範本 相匹配,可以指圖像資訊的特徵資訊與該物體特徵範本完全相同,例如,若圖像資訊的特徵資訊可採用特徵向量K1表示,某書籍的物體特徵範本也可採用特徵向量K1,則圖像資訊的特徵資訊與該書籍的物體特徵範本相匹配。圖像資訊的特徵資訊與某一物體特徵範本相匹配,也可以指圖像資訊的特徵資訊與該物體特徵範本達到特定臨界值的相似,例如,假設特定臨界值為80%,若圖像資訊的特徵資訊可採用特徵向量K2表示,K2包含5個特徵值。某CD封面的物體特徵範本可採用特徵向量K3表示,K3包含5個特徵值。如果K2與K3之間的相同特徵值達到4個以上,則圖像資訊的特徵資訊與CD封面的物體特徵範本的相似度達到80%以上,則圖像資訊的特徵資訊與書籍的物體特徵範本相匹配。
確定單元2203,用於如果存在與圖像資訊的特徵 資訊相匹配的物體特徵範本,將相匹配的物體特徵範本所標識的物體的簡介資訊和位址資訊確定為識別結果。
如果存在與圖像資訊的特徵資訊相匹配的物體 特徵範本,表示對圖像資訊識別成功,確定單元2203則將相匹配的物體特徵範本所標識的物體的簡介資訊和位址資訊確定為識別結果。按照本實施例中的範例。若圖像資訊的特徵資訊與某書籍的物體特徵範本相匹配,則可判斷圖像資訊中包含該書籍,確定單元2203可將該書籍的簡介資訊和該書籍 的位址資訊作為識別結果。進一步按照本實施例中的範例,若圖像資訊的特徵資訊與某CD封面的物體特徵範本相匹配,則可判斷圖像資訊中包含該CD封面,確定單元2203可將該CD封面的簡介資訊和該CD封面標識的CD的位址資訊作為識別結果。可以理解的是,如果不存在與圖像資訊的特徵資訊相匹配的物體特徵範本,表示對圖像資訊識別不成功,本實施例則可以向終端設備傳回識別失敗的提示資訊。
通過上述第8圖-第10圖所示實施例的描述,本發 明實施例中,可自動採集待識別的圖像資訊,並可對待識別的圖像資訊進行特徵識別獲得識別結果,避免了用戶手動干預,簡化了用戶操作,同時提升了圖像識別的效率,提升了圖像識別的智能性。
需要說明的是,第8圖-第10圖所示的圖像識別裝 置,可安裝於伺服器中,用於對終端設備傳輸的圖像資訊進行識別處理。為了提升圖像識別效率,可以採用並行處理方式,例如在一個伺服器中採用多個圖像識別裝置並行進行識別處理;或者,採用多個伺服器,在每個伺服器中安裝一個圖像識別裝置,每個伺服器中的圖像識別裝置並行進行識別處理等等。
本發明實施例還揭示了一種伺服器,該伺服器可 包含圖像識別裝置,該裝置的結構和功能可參見第8圖-第10圖所示實施例的描述,在此不贅述。需要說明的是,本實施 例的伺服器可以應用於上述方法中。
本發明實施例中,可自動採集待識別的圖像資 訊,並可對待識別的圖像資訊進行特徵識別獲得識別結果,避免了用戶手動干預,簡化了用戶操作,同時提升了圖像識別的效率,提升了圖像識別的智能性。
本領域一般技術人員可以理解實現上述實施例 方法中的全部或部分流程,是可以通過電腦程式來指令相關的硬體來完成,所述的程式可存儲於一電腦可讀取儲存媒體中,該程式在執行時,可包含如上述各方法的實施例的流程。 其中,所述的儲存媒體可為磁碟、光碟、唯讀記憶體(Read-Only Memory,ROM)或隨機存取記憶體(Random Access Memory,RAM)等。
以上所揭露的僅為本發明較佳實施例而已,當然不能以此來限定本發明之權利範圍,因此依本發明權利要求所作的等同變化,仍屬本發明所涵蓋的範圍。
S101~S103‧‧‧步驟

Claims (20)

  1. 一種圖像識別方法,其包含:採集待識別的圖像資訊;將該圖像資訊發送至伺服器,以使該伺服器對該圖像資訊進行特徵識別,並傳回識別結果;及輸出該伺服器傳回的識別結果。
  2. 如申請專利範圍第1項所述的方法,其中該採集待識別的圖像資訊的步驟之後,該將該圖像資訊發送至伺服器的步驟之前,還包含:按照預設的圖像規格,對該圖像資訊進行裁剪處理;及對裁剪處理後的圖像資訊進行編碼處理。
  3. 如申請專利範圍第1項所述的方法,其中該將該圖像資訊發送至伺服器的步驟,包含:將該編碼處理後的圖像資訊發送至伺服器。
  4. 如申請專利範圍第1項所述的方法,其中該採集待識別的圖像資訊包含:當照相應用啟動時,監測該照相應用的拍攝介面;從該照相應用的拍攝介面中獲取預設時間的圖像資訊;及 將該獲取的圖像資訊確定為待識別的圖像資訊。
  5. 如申請專利範圍第1至4項任一項所述的方法,其中該識別結果包含該圖像資訊中的物體的簡介資訊和該圖像資訊中的物體的位址資訊。
  6. 如申請專利範圍第5項所述的方法,其中該輸出該伺服器傳回的識別結果的步驟之後,更包含:當檢測到對該識別結果的觸發操作時,顯示該圖像資訊中的該物體的位址資訊所指示的該物體的詳情頁面。
  7. 一種圖像識別方法,其包含:接收終端設備發送的待識別的圖像資訊;對該圖像資訊進行特徵識別,獲得識別結果;及向該終端設備傳回該識別結果。
  8. 如申請專利範圍第7項所述的方法,其中該對該圖像資訊進行特徵識別,獲得識別結果,包含:提取該圖像資訊的特徵資訊;將該圖像資訊的特徵資訊與預設的物體特徵範本進行比對,判斷是否存在與該圖像資訊的特徵資訊相匹配的物體特徵範本;及 如果存在與該圖像資訊的特徵資訊相匹配的物體特徵範本,將該相匹配的物體特徵範本所標識的物體的簡介資訊和位址資訊確定為識別結果。
  9. 如申請專利範圍第7或8項所述的方法,其中該接收終端設備發送的待識別的圖像資訊的步驟之後,該對該圖像資訊進行特徵識別,獲得識別結果的步驟之前,還包含:對接收到的圖像資訊進行解碼處理。
  10. 如申請專利範圍第9項所述的方法,其中該對該圖像資訊進行特徵識別,獲得識別結果的步驟包含:對該解碼處理後的圖像資訊進行特徵識別,獲得識別結果。
  11. 一種圖像識別裝置,其包含:採集模組,用於採集待識別的圖像資訊;識別模組,用於將該圖像資訊發送至伺服器,以使該伺服器對該圖像資訊進行特徵識別,並傳回識別結果;及輸出模組,用於輸出該伺服器傳回的該識別結果。
  12. 如申請專利範圍第11項所述的裝置,更包含:裁剪模組,用於按照預設的圖像規格,對該圖像資訊進行裁剪處理;及 編碼模組,用於對裁剪處理後的圖像資訊進行編碼處理。
  13. 如申請專利範圍第11項所述的裝置,其中該採集模組包含:監測單元,用於當照相應用啟動時,監測該照相應用的拍攝介面;獲取單元,用於從該照相應用的拍攝介面中獲取預設時間的圖像資訊;及確定單元,用於將該獲取的圖像資訊確定為待識別的圖像資訊。
  14. 如申請專利範圍第11至13項任一項所述的裝置,其中該識別結果包含該圖像資訊中的物體的簡介資訊和該圖像資訊中的物體的位址資訊。
  15. 如申請專利範圍第14項所述的裝置,更包含:顯示模組,用於當檢測到對該識別結果的觸發操作時,顯示該圖像資訊中的該物體的位址資訊所指示的該物體的詳情頁面。
  16. 一種終端設備,其包含如申請專利範圍第11至13項任一項所述的圖像識別裝置。
  17. 一種圖像識別裝置,其包含:接收模組,用於接收終端設備發送的待識別的圖像資訊;識別模組,用於對該圖像資訊進行特徵識別,獲得識別結果;及結果傳回模組,用於向該終端設備傳回該識別結果。
  18. 如申請專利範圍第17項所述的裝置,其中該識別模組包含:提取單元,用於提取該圖像資訊的特徵資訊;匹配單元,用於將該圖像資訊的特徵資訊與預設的物體特徵範本進行比對,判斷是否存在與該圖像資訊的特徵資訊相匹配的物體特徵範本;及確定單元,用於如果存在與該圖像資訊的特徵資訊相匹配的物體特徵範本,將該相匹配的物體特徵範本所標識的物體的簡介資訊和位址資訊確定為識別結果。
  19. 如申請專利範圍第17或18項所述的裝置,更包含:解碼模組,用於對接收到的圖像資訊進行解碼處理。
  20. 一種伺服器,其包含如申請專利範圍第17至18項任一項所述的圖像識別裝置。
TW103121636A 2013-07-10 2014-06-23 圖像識別方法、裝置、終端設備及伺服器 TWI518602B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310288861.XA CN104143104A (zh) 2013-07-10 2013-07-10 一种图像识别方法、装置、终端设备及服务器

Publications (2)

Publication Number Publication Date
TW201502998A true TW201502998A (zh) 2015-01-16
TWI518602B TWI518602B (zh) 2016-01-21

Family

ID=51852274

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103121636A TWI518602B (zh) 2013-07-10 2014-06-23 圖像識別方法、裝置、終端設備及伺服器

Country Status (5)

Country Link
CN (1) CN104143104A (zh)
HK (1) HK1199668A1 (zh)
SA (1) SA114350646B1 (zh)
TW (1) TWI518602B (zh)
WO (1) WO2015003446A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677728A (zh) * 2015-12-28 2016-06-15 广东正美家具科技有限公司 物体图像识别分类管理方法
CN105809174B (zh) * 2016-03-29 2019-04-30 北京小米移动软件有限公司 识别图像的方法及装置
CN106203406A (zh) * 2016-08-27 2016-12-07 李春华 一种基于云计算的识别系统
CN106777066B (zh) * 2016-12-12 2021-03-19 北京奇虎科技有限公司 一种图像识别匹配媒体文件的方法和装置
CN107678619B (zh) * 2017-09-25 2020-02-18 维沃移动通信有限公司 一种主题应用方法、电子设备及服务器
CN113516119A (zh) * 2021-08-06 2021-10-19 上海中通吉网络技术有限公司 一种收寄件人地址信息校对的方法、装置及移动终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007502092A (ja) * 2003-05-16 2007-02-01 ピカサ インコーポレイテッド ネットワークを通じた画像共有のための方法及びシステム
JP4413633B2 (ja) * 2004-01-29 2010-02-10 株式会社ゼータ・ブリッジ 情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム
CN1972186B (zh) * 2005-11-24 2011-11-09 中国科学院自动化研究所 一种移动式身份认证系统及其认证方法
CN101373514A (zh) * 2007-08-24 2009-02-25 李树德 人脸识别方法和系统
CN101957911B (zh) * 2010-09-29 2012-11-28 汉王科技股份有限公司 一种人脸识别方法及系统
CN103167082A (zh) * 2012-06-19 2013-06-19 深圳市金立通信设备有限公司 一种便于老年人购物的手机辅助系统及方法
CN103150904A (zh) * 2013-02-05 2013-06-12 中山大学 一种基于图像特征的卡口车辆图像识别方法

Also Published As

Publication number Publication date
CN104143104A (zh) 2014-11-12
HK1199668A1 (zh) 2015-07-10
SA114350646B1 (ar) 2016-09-18
TWI518602B (zh) 2016-01-21
WO2015003446A1 (en) 2015-01-15

Similar Documents

Publication Publication Date Title
TWI518602B (zh) 圖像識別方法、裝置、終端設備及伺服器
US10949952B2 (en) Performing detail enhancement on a target in a denoised image
CN104572732A (zh) 查询用户标识的方法及装置、获取用户标识的方法及装置
US8965067B2 (en) Face data acquirer, end user video conference device, server, method, computer program and computer program product for extracting face data
US20170109912A1 (en) Creating a composite image from multi-frame raw image data
CN102332001B (zh) 一种视频缩略图生成方法及装置
KR20160044470A (ko) 배경 이미지를 설정하기 위한 방법, 서버 및 시스템
WO2017084220A1 (zh) 一种拍照处理的方法、装置以及终端
US9195896B2 (en) Methods and systems for image recognition
WO2021218416A1 (zh) 可读存储介质、显示装置及其图像处理方法
WO2019213818A1 (zh) 拍摄控制方法及电子装置
WO2015027882A1 (en) Method, apparatus and terminal for image processing
WO2018028253A1 (zh) 一种信息处理方法、装置及存储介质
WO2021163880A1 (zh) 一种录屏方法、装置及计算机可读存储介质
JP2023540273A (ja) 眼部状態検出による画像処理方法、装置及び記憶媒体
CN107977437B (zh) 图像处理方法、装置、存储介质和电子设备
KR20150083491A (ko) 단말과 서버간의 정보 동기화 방법 및 시스템
CN115396705A (zh) 投屏操作验证方法、平台及系统
CN111491209A (zh) 视频封面确定方法、装置、电子设备和存储介质
CN103605687A (zh) 一种移动终端的拍照识图系统和方法
CN109167939B (zh) 一种自动配文方法、装置及计算机存储介质
WO2015196681A1 (zh) 一种图片处理方法及电子设备
CN111369557B (zh) 图像处理方法、装置、计算设备和存储介质
TW201435627A (zh) 搜索優化系統及方法
Ou et al. Machine learning-based object recognition technology for bird identification system