TWI631514B - Method and system for marking recognition based on mobile terminal - Google Patents

Method and system for marking recognition based on mobile terminal Download PDF

Info

Publication number
TWI631514B
TWI631514B TW101146907A TW101146907A TWI631514B TW I631514 B TWI631514 B TW I631514B TW 101146907 A TW101146907 A TW 101146907A TW 101146907 A TW101146907 A TW 101146907A TW I631514 B TWI631514 B TW I631514B
Authority
TW
Taiwan
Prior art keywords
image
mark
processed
special
black
Prior art date
Application number
TW101146907A
Other languages
English (en)
Other versions
TW201413602A (zh
Inventor
張倫
楚汝峰
張春暉
Original Assignee
阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阿里巴巴集團服務有限公司 filed Critical 阿里巴巴集團服務有限公司
Publication of TW201413602A publication Critical patent/TW201413602A/zh
Application granted granted Critical
Publication of TWI631514B publication Critical patent/TWI631514B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本方案涉及一種基於行動終端的標誌識別處理方法和系統。該方法包括:藉由行動終端獲得待處理圖像;在獲得的所述待處理圖像中檢測預設於所述標誌的固定位置的特殊標記,若匹配上所述特殊標記表明檢測到所述特殊標記則定位所述標誌;根據定位的所述標誌的位置,分割出標誌所在區域;識別分割出的所述標誌所在區域中的標誌的內容。該系統包括對應上述方法組成部分以及相應方法步驟的功能。本方案預設標記與表示目標物的標誌綁定,基於行動平臺在獲取的圖片或圖像上根據該預設的標記定位該標誌、並分割出標誌區域,再使用圖像處理方法識別出商品代碼或標誌,能夠簡單、快速、準確、有效地獲取標誌,實現在行動終端平臺上的廣告等圖像的標誌識別處理。

Description

基於行動終端的標誌識別處理方法和系統
本發明專利申請涉及行動終端的字元識別領域,尤其涉及一種基於行動終端的標誌識別處理方法和系統。
光學字元識別(OCR,Optical Character Recognition)技術是指電子設備(例如掃描器或數位相機)檢查紙上列印的字元,藉由檢測暗、亮的模式確定其形狀,然後用字元識別方法將其形狀翻譯成電腦文字的過程,即對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面資訊的過程。也就是藉由掃描和攝像等光學輸入方式獲取紙上的文字圖像資訊。其能利用各種模式識別演算法分析文字形態特徵,判斷出漢字的標準編碼,並按照通用格式儲存在文字檔案中:藉由掃描器輸入後,將文稿形成圖像文件,做圖像處理;接著先對版面劃分(如進行版面分析:版面理解、字切分、歸一化等)以便分開不同部分進行分別按次序處理;再對文字閱讀(如圖形文字“漢字”),逐一辨認,單字識別,再歸一化;對OCR識別後的文字編輯修改。
一個OCR識別系統,其目的是要把影像或圖像做一個轉換,使影像內的圖形繼續保存、有表格則表格內資料及影像內的文字,一律變成電腦文字,使得影像資料儲存量減少、降低儲存空間或者對識別的文字可以再使用、分 析等,同時節省人力輸入和輸入時間。
從影像到結果輸出,通常必須經過影像輸入(影像轉入101、影像前處理103、文字特徵抽取105)、比對識別107、校正和結果輸出109等步驟,參見圖1。
影像轉入101:需要OCR處理的標的物,藉由光學儀器如影像掃描器、傳真機或任何攝影材料,把影像轉入電腦。隨著科技進步,掃描器、攝像頭等輸入裝置製作越來越精致、輕薄短小、品質高,便於置入,高解析度也使得影像更清晰,速度提高促進OCR處理效率提高。
影像前處理103:是OCR系統中,必須解決問題最多的一個模組,從得到一個非黑即白的二值化映射,或灰階、彩色的原始影像,到獨立出一個個文字影像的過程。影像前處理103包含:影像正規化、去除雜訊、影像矯正等影像處理,及圖文分析、文字行與字分離的文件前處理。由於影像處理已經是成熟的技術,但在影像的文件前處理方面,各類方式各有千秋,通常影像要先將圖片、表格、文字區域分離出來,甚至可將文章編排方向、文章提綱及內容主體分開,而文字大小及文字字體也如原始文件一樣判斷出來。
文字特徵抽取105:單以識別率而言,特徵抽取是OCR的核心,用什麽特徵、怎麽抽取直接影響識別的好壞,“特徵”也就是識別的籌碼。文字特徵抽取105,簡易的區分可分為兩類:(1)一類為統計的特徵,如文字區域內的黑/白點數比,當文字區分成好幾個區域時,這一個個 區域黑/白點數比之聯合,成為空間的一個數值向量,在比對時,基本數學理論就足以應對;(2)另一類特徵為結構的特徵,如文字影像細線化後,取得字的芼劃端點、交叉點之數量及位置,或以芼劃段為特徵,配合特殊的比對方法,進行比對。
當輸入文字計算完特徵之後,不論是用統計或結構的特徵,都要有一比對資料庫或特徵資料庫來進行對比,資料庫的內容應當包含所有欲識別的字集文字,根據與輸入文字一樣的特徵抽取方法所得到的特徵群組。
比對(對比)識別107:基於使用比對資料庫進行比對,將輸入文字的特徵與比對資料庫中的特徵,藉由數學方式,進行比對識別。比對識別可充分發揮數學運算理論,其能根據不同的特徵特性,選用不同的數學距離函數。比較有名的比對方法如:歐式空間的比對方法、鬆弛比對法(Relaxation)、動態程式比對法(Dynamic Programming,DP)、類似神經網路的資料庫建立和對比、HMM(Hidden Markov Model)等。並且為了使得識別結果更穩定,也有所謂的專家系統(Experts System)被提出,利用各種特徵比對方法的相異互補性,使得識別出的結果信心度特別高。
購買商品時商品上的條碼肉眼無法識別,只有專用讀取設備能識別。還有一類情形是,人們通常用一個數位或者文字編碼對商品等目標物進行索引並形成目錄、序列、編碼/編號/代號等標誌,如商品有商品代碼(或稱為商品 編碼、商品編號等),由數位、文字、圖像(如商家LOGO)等編碼形成的該商品代碼以代表某個商品。常見的網路或手機廣告中展示的商品圖像,在該商品圖像的周圍/附近、或者在該商品圖像的內部,拍攝或要發送的正銷售的實體商品上都可能會出現商品代碼。目前的技術還不能直接識別這些數位、漢字(文字)、圖像等表示的商品代碼,而隨著網際網路行動技術的發展,對利用手機等行動終端(設備)等行動平臺來獲取和識別商品代碼也提出了需求。通常,對掃描或攝像的這類廣告資訊(如背景複雜的商品圖像),可以利用現有的OCR技術加以識別或獲取。但現有的OCR技術中,已有的影像前處理103過程,一般採用版面分析的方法區分圖像中的圖像部分和文字部分。該方法適用於有一定結構資訊的文字版面。但諸如上述廣告裏出現在商品圖像附近或者在商品圖像內部的商品代碼的這些情況,圖像一般比較複雜,較難使用傳統的版面分析的方法提取出字元區域。
因而,對商品圖片,尤其是在行動平臺上對顯示的廣告商品圖像的商品代碼或標誌(即複雜圖像中目標物的標誌)進行識別或獲取,存在困難。
針對上述現有技術的缺陷,本發明的技術方案要解決的技術問題是提供一種基於行動終端的標誌識別處理方法和系統,預設標記與表示目標物的標誌綁定,基於行動平 臺藉由圖像識別的方法處理攝像機獲取的商品圖片/圖像,先在攝像機獲取的圖片或圖像上根據該預設的標記定位該標誌、並分割出標誌(商品代碼)的區域,再使用圖像處理方法識別出商品代碼或標誌。
本發明的技術方案,能夠實現在一幅複雜背景的圖片中,使用一個標記來定位文字或數位部分,並將其應用到商品等目標物的檢索。
本發明提供的一種基於行動終端的標誌識別處理方法,包括:藉由行動終端獲得待處理圖像;當獲取待處理圖像後,在所述待處理圖像中檢測預設於所述標誌的固定位置的特殊標記,若匹配上所述特殊標記表明檢測到所述特殊標記,則定位所述標誌;根據定位的所述標誌的位置,分割出標誌所在區域;識別分割出的所述標誌所在區域中的標誌的內容。
對應本發明的方法的一種基於行動終端的標誌識別處理系統,包括:圖像獲取模組,用於藉由行動終端獲取待處理圖像;特殊標記匹配模組,用於在獲取的待處理圖像中檢測預設於所述標誌的固定位置的特殊標記,以定位所述標誌:當獲取待處理圖像後,在待處理圖像中檢測所述特殊標記,若匹配上所述特殊標記表明檢測到所述特殊標記,則定位所述標誌;標誌定位模組,用於根據定位的所述標誌的位置,分割出標誌所在區域;字元識別模組,識別分割出的所述標誌所在區域中的標誌的內容。
本發明的方案中,其利用特殊符號或稱特殊標記,對 數位或文字型目標物的標誌如商品的商品代碼進行標記以定位,再使用圖像處理方法來識別標誌,能夠簡單、快速、準確、有效地獲取標誌,實現在行動終端平臺上的廣告等圖像的標誌識別處理。
下面將結合本發明實施例中的圖式,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
本發明具體實施方式以商品作為目標物為例。在獲取的圖像位於商品代碼前加入一個特殊符號來幫助定位,即藉由特殊符號(如特定設計的一種標記、記號)對數位或文字型商品代碼(即標誌)進行標記以便進行定位,藉由圖像識別方法處理攝像機獲取的圖片或圖像。在圖像處理環節,首先經邊緣檢測、直線擬合及模板匹配等方式以獲得商品代碼的位置和尺寸;然後使用光學字元識別出商品代碼。
本發明的該具體實施方式的標誌識別處理系統,如圖2所示,以商品為目標物。由圖像獲取模組201、圖像的特殊標記匹配模組203、標誌定位模組205、圖像的字元識別模組207。
圖像獲取模組201,基於行動設備(終端)或其他行動平臺,用掃描、拍攝/攝像、下載等方式獲得商品的圖像(即準備處理的圖片),如用手機的攝像機獲取諸如商品圖片,或攝取/下載廣告中的諸如商品圖片等即包含目標物圖像的原圖。所述行動終端是利用掃描器、攝像機或網路下載,獲取待處理圖像;獲取的待處理圖像可以是諸如商品圖片即包含目標物圖像的原圖。所述標誌是目標物的標誌如所述商品圖片的附近或內部的商品代碼。商品代碼是數字型或文字型的字元、或圖像型等。
圖像的特殊標記匹配模組203,在獲取的圖片中,匹配特殊標記。特殊標記是與目標物的標誌如商品代碼綁定的,預先設置好的,在商品代碼(標誌)設計的時候先定義好(之後可以一起印刷等)。對原圖直接檢測特殊標記,從而利用特殊標記在複雜背景的圖像(圖片)中定位(檢測)要識別的商品圖像(圖片)上的商品代碼。如圖4所示的編碼示例“1234567”數字型標誌,檢測到該特殊標記則能確定此處有商品代碼。二者有固定的關係,如:只要是標誌,其旁邊、其前或其某個確定的位置處就設計有該特殊標記。
事先設計有帶黑框的特殊標記(圖4、圖5),作為定位商品代碼(目標物的標誌)的特殊標記。該黑框內也會包括字元、文字、圖像(如某商家logo)等。用於定位標誌的特殊標記可以定義為黑框結合內容(如黑框+內部圖片)的形式(內部圖片如各種字元或圖形圖像符號)。
該特殊標記可以根據但不限於商品圖像附近或圖像內的商品代碼(如:數字型代碼、文字型代碼、圖像型代碼(如商家LOGO)等標誌)的字元、文字或圖像的結構和/或特徵(如:長度、寬度、大小、尺寸、方向、位置、色彩、灰度、亮度、等等)來預先設計。例如圖4中的根據需要設置有“t”符號在內的黑框這種圖形符號,“t”字也可以設計以適應外觀的要求。
該特殊標記還可以利用圖像處理演算法中,會對圖像中的像素逐行掃描的原理,設計樣式固定的有規則的像素的兩組黑白比例關係的區域作為的特殊標記圖樣。這樣,經逐行掃描發現存在按黑白比的規則設定的至少一行像素的圖像特徵區域,在待處理圖像中檢測所述特殊標記包括直接檢測符合上述黑白比的圖像特徵區域。
按黑白比的規則設定的至少一行像素的圖像特徵區域,通常,可以設定兩行或兩行以上的像素,黑白比分別為1:1:3:1:1和1:2:1:2:1。比如:(1)相鄰或非相鄰兩行像素,每行像素的連續或非連續像素出現了黑白比,一行為1:1:3:1:1、一行為1:2:1:2:1;相鄰或非相鄰的多行(兩行以上)等,有幾行的連續或非連續的像素出現的黑白比為1:1:3:1:1、另外有幾行連續或非連續的像素出現的黑白比為1:2:1:2:1。也就是說,該黑白比的圖像特徵區域設定:可以是一行、相鄰或非相鄰的兩行、或者,相鄰或非相鄰的多行(兩行以上)等情況;可能有多行符合1:1:3:1:1、然後又有多行符合1:2:1:2:1;另外,黑白比規 則的像素,也不一定是該行像素中的連續像素,只要接連有幾個像素的黑白比例符合這種定義就可以(只要連續像素的黑白比例符合這種定義即可)。比如說,有五個像素黑,五個像素白,然後十五個像素黑,五個像素白,五個像素黑(這個可以隨著標記大小的變化而變化),也是符合1:1:3:1:1的比例的。而圖像特徵區域就可以設計為有該像素黑白比規則的黑框結合內部內容的形式(也隨需要標記的大小變化)。
例如圖5中的示意的黑框+“T”兩組黑白比區域圖樣,是有兩行像素的黑白比固定其圖樣設計規則為,一行有黑白比1:1:3:1:1(即該行像素會有:1個黑像素、1個白像素、3個黑像素、1個白像素、1個黑像素)的像素情況,另一行(圖5所示下方一行)有黑白比1:2:1:2:1(即該行像素出現:1個黑像素、2個白像素、1個黑像素、2個白像素、1個黑像素)的像素情況。在圖像處理時,只要掃描圖像時發現有兩行像素所在區域有這樣兩組黑白比的情況存在,就可以確定此處區域為特殊標記。特殊標記的圖樣根據該比例設計,不限於圖5所示圖樣,只是必須滿足上述兩行像素中的兩組黑白比例規則。
圖4給出了一種檢測(匹配和定位)方式:在匹配特殊標記前,預設黑框及其內部內容(內部內容是根據情況或需求可設計的,如“t”字元)作為特殊標記;先檢測屬於特殊標記的黑框是否存在,如果存 在,然後匹配黑框中的內容,如“t”符,由此確定特殊標記在此。由於標記和標誌綁定,有該特殊標記就有相應的目標物的標誌(商品代碼),因而此處是商品代碼所在區域,由此實現定位目標物的標誌(如該商品代碼)。如果不存在黑框或內容不匹配可以表示原圖上沒有目標物的標誌。
圖5給出了一種檢測(匹配和定位)速度和運算速度更快捷、更準確的特殊標記檢測方式:在匹配特殊標記之前,預設至少一行、兩行或多行像素的兩組黑白比(如上所述數位比例)規則的圖樣,表示按照該規則設計的圖或滿足該規則的區域為特殊標記,後面以兩行像素為例進行說明;在原圖中尋找(圖像處理演算法中逐行掃描像素),發現符合預設的固定樣式規則的兩行像素的兩組黑白比例區域。如直接在圖片中尋找兩行像素的黑白比符合1:1:3:1:1(上行像素黑白比)以及1:2:1:2:1(下行像素黑白比)的圖像特徵區域。從而利用直接在圖像上檢測具有所述數位比例的圖像特徵區域,找到所述圖像特徵區域即實現了特殊標記的匹配,檢測到該特殊標記則能夠定位所述標誌在哪個位置。
圖5的方式無需尋找黑框等圖形圖像,只需要在通常的圖像處理掃描過程中尋找符合規定的像素黑白比例定義的圖樣,就能確定由該比例定義的特殊標記,因而該方式檢測速度能更快、檢測結果更準確,實現起來更簡單,稱 快速定位法。
在該圖像的特殊標記匹配模組203中,基於所述特殊標記,其檢測、匹配和定位的演算法,可以採用邊緣檢測、直線擬合以及模板匹配演算法,以確定目標物的標誌(商品代碼)的位置和尺寸。
標誌定位模組205,能根據定位的標誌位置和尺寸切割(分割)標誌即商品代碼的區域。分出商品代碼區域的圖像,並能傳送給字元識別模組207
圖像的字元識別模組207,接收來自標誌定位模組205的分出區域,對分出的區域進行識別,如識別出商品代碼的數位“1234567”等。這裏可以使用OCR光學字元識別演算法,使用OCR識別分割出的區域中的標誌的內容,包括識別出數字型、文字型字元,或圖像型符號等。
下面將根據圖3,以商品的商品代碼為例,對本發明的標誌識別處理系統的流程,即標誌識別處理方法,進行描述,方法的步驟中,不再對系統的模組功能重復描述。
圖像獲取步驟301,藉由手機等行動設備獲得要處理的圖像/圖片。所述行動終端是利用掃描器、攝像機或網路下載,獲取待處理圖像;獲取的待處理圖像是商品圖片;所述標誌是所述商品圖片的附近或內部的商品編碼。商品編碼是數字型或文字型的字元。具體參見模組201的描述。
在特殊標記設置步驟303,預先構造用於在上述獲取的、具有複雜背景的圖片中使用的特殊標記,綁定商品代 碼。特殊標記可以是圖形符號(如圖4所示黑框和其內部),或者是黑白比規則固定樣式的至少一行、兩行或多行像素的圖像特徵區域(如圖5所示按兩組黑白比規則1:1:3:1:1以及1:2:1:2:1設計的黑框圖區域)。具體參見模組203的描述的標記設計方式(圖4、圖5)。
在特殊的標記檢測和匹配步驟305,藉由對特殊標記進行檢測(定位和匹配),如對圖上的圖形符號邊框檢測(黑框),然後匹配黑框中的“t”字(圖4所述方式);或者直接在圖片上找符合預設比例的圖像特徵區域(如圖5所述方式)。
方式一:當採用圖形符號形式的特殊標記時,特殊標記是帶黑框及其內有字元的圖形符號;檢測黑框並匹配其框內的內容,確定檢測到特殊標記;由於特殊標記與所述待處理圖像的(目標物)標誌如商品代碼綁定,則找到特殊標記就能定位到該商品代碼(標誌)。
方式二,又稱快速定位法:當特殊標記特殊標記採用上述特定的數位比設計時,直接在圖像上檢測(逐行掃描像素時尋找)具有所述數位比的圖像特徵區域,找到所述圖像特徵區域即實現了所述標誌與特殊標記的匹配,並定位所述標誌。
具體參見模組203的兩種檢測(匹配和定位)方式的描述。
上述步驟305基於所述特殊標記的檢測、匹配和定位,是根據邊緣檢測、直線擬合以及模板匹配演算法來確 定標誌的位置和尺寸。
標誌定位步驟307,根據步驟305所定位的標誌(如商品代碼)的位置,切割商品代碼的所在區域。
處理步驟309,實現圖像的字元識別和後續處理。根據步驟307獲得的商品代碼區域的圖像(對分出的區域)進行識別,如識別出商品代碼的數位等。這裏可以使用OCR光學字元識別演算法,使用OCR識別分割出的區域中的標誌的內容包括識別出數字型、文字型字元,或圖像型符號等。
判定全部完成步驟311,判斷獲取的、要識別的圖像已經全部完成,不再識別後面的其他圖像或圖片等,則結束該流程,否則返回開始繼續進行識別。
本發明的系統及其方法藉由特定的標記符號來確定複雜圖像中的特定區域,提供了一種快速簡易有效準確的圖像內容以識別技術。
本說明書中的各個實施例一般採用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
本發明可以在由電腦執行的電腦可執行指令的一般上下文中描述,例如程式模組或單元。一般地,程式模組或單元可以包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構等等。一般來說,程式模組或單元可以由軟體、硬體或兩者的結合來實現。也可以在分散式計算環境中實踐本發明,在這些分散式計算環 境中,由藉由通信網路而被連接的遠端處理設備來執行任務。在分散式計算環境中,程式模組或單元可以位於包括儲存設備在內的本地和遠端電腦儲存介質中。
最後,還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。
本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本發明的方法及其主要思想;同時,對於本領域的一般技術人員,依據本發明的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。
201‧‧‧圖像獲取模組
203‧‧‧特殊標記匹配模組
205‧‧‧標誌定位模組
207‧‧‧字元識別模組
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些圖式獲得其他的圖式。
圖1為OCR系統的處理方塊圖。
圖2為本發明具體實施方式的標誌識別處理系統結構圖。
圖3為本發明具體實施方式的標誌識別處理流程圖。
圖4為本發明具體實施方式的一種利用標記檢測商品數位標誌的直觀圖。
圖5為本發明具體實施方式的另一種利用標記檢測商品數位標誌的直觀圖。

Claims (14)

  1. 一種基於行動終端的標誌識別處理系統,其特徵在於,包括:圖像獲取模組,用於藉由行動終端獲取待處理圖像;特殊標記匹配模組,用於在獲取的待處理圖像中檢測預設於該標誌的固定位置的特殊標記,以定位該標誌,該特殊標記與該標誌綁定;當獲取該待處理圖像後,在該待處理圖像中檢測該特殊標記,若匹配上該特殊標記表明檢測到該特殊標記,則定位該標誌,其中定位該標誌包括:決定與該特殊標記相關聯的該待處理圖像中的第一部分;以及至少部份根據與該特殊標記相關聯的該待處理圖像中的該第一部分來決定與該標誌相關聯的該待處理圖像中的第二部分,其中,至少部份根據與該特殊標記相關聯的該待處理圖像中的該第一部分來決定與該標誌相關聯的該待處理圖像中的該第二部分包括:在靠近與該特殊標記相關聯的該待處理圖像中的該第一部分的位置的該待處理圖像之區域中,搜尋與該標誌相關聯的該待處理圖像中的該第二部分;標誌定位模組,用於根據定位的該標誌的位置,分割出標誌所在區域;字元識別模組,識別分割出的該標誌所在區域中的標誌的內容。
  2. 如申請專利範圍第1項的系統,其中,該特殊標記定義為黑框結合內部圖片,內部圖片在檢 測該特殊標記時用於該匹配;在待處理圖像中檢測該特殊標記包括:先檢測到該黑框,再匹配該內部圖片,如果內部圖片匹配上則表明匹配上該特殊標記。
  3. 如申請專利範圍第1項的系統,其中,該特殊標記包括:經逐行掃描發現存在按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域;在待處理圖像中檢測該特殊標記包括:直接檢測符合上述黑白比的圖像特徵區域。
  4. 如申請專利範圍第3項的系統,其中,該按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域還包括:其中,設定兩行或多行像素,出現像素的黑白比規則分別為1:1:3:1:1和1:2:1:2:1;圖像特徵區域設計為黑框結合內部內容。
  5. 如申請專利範圍第2或3項的系統,其中,該標誌的固定位置包括:在該標誌前或在該標誌後。
  6. 如申請專利範圍第1項的系統,其中,獲取的待處理圖像是商品圖片;該標誌是該商品圖片的附近或內部的商品代碼;商品代碼包括字元或數位字元,和/或圖像。
  7. 如申請專利範圍第1項的系統,其中,字元識別模組還包括:使用OCR識別分割出的區域中的標誌的內容。
  8. 一種基於行動終端的標誌識別處理方法,其特徵在於,包括:藉由行動終端獲得待處理圖像;當獲取該待處理圖像後,在該待處理圖像中檢測預設於該標誌的固定位置的特殊標記,該特殊標記與該標誌綁定,若匹配上該特殊標記表明檢測到該特殊標記,則定位該標誌,其中定位該標誌包括:決定與該特殊標記相關聯的該待處理圖像中的第一部分;以及至少部份根據與該特殊標記相關聯的該待處理圖像中的該第一部分來決定與該標誌相關聯的該待處理圖像中的第二部分,其中,至少部份根據與該特殊標記相關聯的該待處理圖像中的該第一部分來決定與該標誌相關聯的該待處理圖像中的該第二部分包括:在靠近與該特殊標記相關聯的該待處理圖像中的該第一部分的位置的該待處理圖像之區域中,搜尋與該標誌相關聯的該待處理圖像中的該第二部分;根據定位的該標誌的位置,分割出標誌所在區域;識別分割出的該標誌所在區域中的標誌的內容。
  9. 如申請專利範圍第8項的方法,其中,該特殊標記定義為黑框結合內部圖片,內部圖片在檢測該特殊標記時用於該匹配;在待處理圖像中檢測該特殊標記包括:先檢測到該黑框,再匹配該內部圖片,如果內部圖片匹配上則表明匹配上該特殊標記。
  10. 如申請專利範圍第8項的方法,其中, 該特殊標記包括:經逐行掃描發現存在按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域;在待處理圖像中檢測該特殊標記包括:直接檢測符合上述黑白比的圖像特徵區域。
  11. 如申請專利範圍第10項的方法,其中,該按黑白比的規則設定的至少一行、兩行或多行像素的圖像特徵區域還包括:其中,設定兩行或多行像素,出現像素的黑白比規則分別為1:1:3:1:1和1:2:1:2:1;圖像特徵區域設計為黑框結合內部內容。
  12. 如申請專利範圍第9或10項的方法,其中,該標誌的固定位置包括:在該標誌前或在該標誌後。
  13. 如申請專利範圍第8項的方法,其中,獲取的待處理圖像是商品圖片;該標誌是該商品圖片的附近或內部的商品代碼;商品代碼包括字元或數位字元,和/或圖像。
  14. 如申請專利範圍第8項的方法,其中,識別步驟還包括:使用OCR識別分割出的區域中的標誌的內容。
TW101146907A 2012-09-21 2012-12-12 Method and system for marking recognition based on mobile terminal TWI631514B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210360774.6A CN103679164A (zh) 2012-09-21 2012-09-21 一种基于移动终端的标志识别处理方法和系统
??201210360774.6 2012-09-21

Publications (2)

Publication Number Publication Date
TW201413602A TW201413602A (zh) 2014-04-01
TWI631514B true TWI631514B (zh) 2018-08-01

Family

ID=50316654

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101146907A TWI631514B (zh) 2012-09-21 2012-12-12 Method and system for marking recognition based on mobile terminal

Country Status (5)

Country Link
US (2) US8971620B2 (zh)
JP (2) JP5972468B2 (zh)
CN (1) CN103679164A (zh)
TW (1) TWI631514B (zh)
WO (1) WO2014046918A1 (zh)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9613267B2 (en) * 2012-05-31 2017-04-04 Xerox Corporation Method and system of extracting label:value data from a document
US9087272B2 (en) * 2013-07-17 2015-07-21 International Business Machines Corporation Optical match character classification
US9245192B2 (en) * 2013-09-20 2016-01-26 Here Global B.V. Ad collateral detection
KR102209729B1 (ko) * 2014-04-04 2021-01-29 삼성전자주식회사 인식 영역에 기반하여 콘텐트를 검출하는 전자 장치 및 방법
GB2526102B (en) * 2014-05-13 2020-09-23 Grass Valley Ltd Logo detection by edge matching
CN105303189B (zh) 2014-07-29 2019-08-20 阿里巴巴集团控股有限公司 一种用于检测预定区域中特定标识图像的方法及装置
CN105608459B (zh) * 2014-10-29 2018-09-14 阿里巴巴集团控股有限公司 商品图片的分割方法及其装置
CN107209862B (zh) * 2015-01-21 2021-03-09 国立大学法人东京农工大学 识别装置和信息存储介质
US9892478B2 (en) 2015-03-06 2018-02-13 Digimarc Corporation Digital watermarking applications
US10467284B2 (en) 2015-08-03 2019-11-05 Google Llc Establishment anchoring with geolocated imagery
US9690967B1 (en) 2015-10-29 2017-06-27 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery
US10262176B1 (en) 2016-02-23 2019-04-16 Digimarc Corporation Scanner with control logic for resolving package labeling
US10198782B1 (en) * 2016-09-15 2019-02-05 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery
US11042161B2 (en) 2016-11-16 2021-06-22 Symbol Technologies, Llc Navigation control method and apparatus in a mobile automation system
CN108345895A (zh) * 2017-01-22 2018-07-31 上海分泽时代软件技术有限公司 广告图像识别方法以及广告图像识别系统
US10726273B2 (en) 2017-05-01 2020-07-28 Symbol Technologies, Llc Method and apparatus for shelf feature and object placement detection from shelf images
US10505057B2 (en) 2017-05-01 2019-12-10 Symbol Technologies, Llc Device and method for operating cameras and light sources wherein parasitic reflections from a paired light source are not reflected into the paired camera
US11449059B2 (en) 2017-05-01 2022-09-20 Symbol Technologies, Llc Obstacle detection for a mobile automation apparatus
US10663590B2 (en) 2017-05-01 2020-05-26 Symbol Technologies, Llc Device and method for merging lidar data
US10591918B2 (en) 2017-05-01 2020-03-17 Symbol Technologies, Llc Fixed segmented lattice planning for a mobile automation apparatus
US10949798B2 (en) 2017-05-01 2021-03-16 Symbol Technologies, Llc Multimodal localization and mapping for a mobile automation apparatus
US20180314908A1 (en) * 2017-05-01 2018-11-01 Symbol Technologies, Llc Method and apparatus for label detection
US11367092B2 (en) 2017-05-01 2022-06-21 Symbol Technologies, Llc Method and apparatus for extracting and processing price text from an image set
US11093896B2 (en) 2017-05-01 2021-08-17 Symbol Technologies, Llc Product status detection system
EP3619600A4 (en) 2017-05-01 2020-10-21 Symbol Technologies, LLC METHOD AND APPARATUS FOR OBJECT STATE DETECTION
WO2018201423A1 (en) 2017-05-05 2018-11-08 Symbol Technologies, Llc Method and apparatus for detecting and interpreting price label text
US10521914B2 (en) 2017-09-07 2019-12-31 Symbol Technologies, Llc Multi-sensor object recognition system and method
US10572763B2 (en) 2017-09-07 2020-02-25 Symbol Technologies, Llc Method and apparatus for support surface edge detection
TWI649698B (zh) 2017-12-21 2019-02-01 財團法人工業技術研究院 物件偵測裝置、物件偵測方法及電腦可讀取媒體
US10823572B2 (en) 2018-04-05 2020-11-03 Symbol Technologies, Llc Method, system and apparatus for generating navigational data
US11327504B2 (en) 2018-04-05 2022-05-10 Symbol Technologies, Llc Method, system and apparatus for mobile automation apparatus localization
US10740911B2 (en) 2018-04-05 2020-08-11 Symbol Technologies, Llc Method, system and apparatus for correcting translucency artifacts in data representing a support structure
US10809078B2 (en) 2018-04-05 2020-10-20 Symbol Technologies, Llc Method, system and apparatus for dynamic path generation
US10832436B2 (en) 2018-04-05 2020-11-10 Symbol Technologies, Llc Method, system and apparatus for recovering label positions
US11506483B2 (en) 2018-10-05 2022-11-22 Zebra Technologies Corporation Method, system and apparatus for support structure depth determination
US11010920B2 (en) 2018-10-05 2021-05-18 Zebra Technologies Corporation Method, system and apparatus for object detection in point clouds
US11090811B2 (en) 2018-11-13 2021-08-17 Zebra Technologies Corporation Method and apparatus for labeling of support structures
US11003188B2 (en) 2018-11-13 2021-05-11 Zebra Technologies Corporation Method, system and apparatus for obstacle handling in navigational path generation
US11079240B2 (en) 2018-12-07 2021-08-03 Zebra Technologies Corporation Method, system and apparatus for adaptive particle filter localization
US11416000B2 (en) 2018-12-07 2022-08-16 Zebra Technologies Corporation Method and apparatus for navigational ray tracing
US11100303B2 (en) 2018-12-10 2021-08-24 Zebra Technologies Corporation Method, system and apparatus for auxiliary label detection and association
US11015938B2 (en) 2018-12-12 2021-05-25 Zebra Technologies Corporation Method, system and apparatus for navigational assistance
US10731970B2 (en) 2018-12-13 2020-08-04 Zebra Technologies Corporation Method, system and apparatus for support structure detection
TWI703508B (zh) * 2018-12-19 2020-09-01 洽吧智能股份有限公司 字元影像識別方法與系統
CA3028708A1 (en) 2018-12-28 2020-06-28 Zih Corp. Method, system and apparatus for dynamic loop closure in mapping trajectories
US10789438B1 (en) 2019-02-08 2020-09-29 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data
US11250535B1 (en) 2019-02-08 2022-02-15 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data, and robustness checks
US11200677B2 (en) 2019-06-03 2021-12-14 Zebra Technologies Corporation Method, system and apparatus for shelf edge detection
US11341663B2 (en) 2019-06-03 2022-05-24 Zebra Technologies Corporation Method, system and apparatus for detecting support structure obstructions
US11662739B2 (en) 2019-06-03 2023-05-30 Zebra Technologies Corporation Method, system and apparatus for adaptive ceiling-based localization
US11080566B2 (en) 2019-06-03 2021-08-03 Zebra Technologies Corporation Method, system and apparatus for gap detection in support structures with peg regions
US11402846B2 (en) 2019-06-03 2022-08-02 Zebra Technologies Corporation Method, system and apparatus for mitigating data capture light leakage
US11960286B2 (en) 2019-06-03 2024-04-16 Zebra Technologies Corporation Method, system and apparatus for dynamic task sequencing
US11151743B2 (en) 2019-06-03 2021-10-19 Zebra Technologies Corporation Method, system and apparatus for end of aisle detection
WO2021054850A1 (ru) * 2019-09-17 2021-03-25 Публичное Акционерное Общество "Сбербанк России" Способ и система интеллектуальной обработки документа
CN111091532B (zh) * 2019-10-30 2023-07-18 中国四维测绘技术有限公司 一种基于多层感知机的遥感影像色彩评价方法和系统
US11507103B2 (en) 2019-12-04 2022-11-22 Zebra Technologies Corporation Method, system and apparatus for localization-based historical obstacle handling
US11107238B2 (en) 2019-12-13 2021-08-31 Zebra Technologies Corporation Method, system and apparatus for detecting item facings
CN113033588A (zh) * 2019-12-24 2021-06-25 中移雄安信息通信科技有限公司 一种图像处理方法及电子设备
US11822333B2 (en) 2020-03-30 2023-11-21 Zebra Technologies Corporation Method, system and apparatus for data capture illumination control
US11450024B2 (en) 2020-07-17 2022-09-20 Zebra Technologies Corporation Mixed depth object detection
US11593915B2 (en) 2020-10-21 2023-02-28 Zebra Technologies Corporation Parallax-tolerant panoramic image generation
US11392891B2 (en) 2020-11-03 2022-07-19 Zebra Technologies Corporation Item placement detection and optimization in material handling systems
US11847832B2 (en) 2020-11-11 2023-12-19 Zebra Technologies Corporation Object classification for autonomous navigation systems
US11954882B2 (en) 2021-06-17 2024-04-09 Zebra Technologies Corporation Feature-based georegistration for mobile computing devices

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4776464A (en) * 1985-06-17 1988-10-11 Bae Automated Systems, Inc. Automated article handling system and process
US5081685A (en) * 1988-11-29 1992-01-14 Westinghouse Electric Corp. Apparatus and method for reading a license plate
US20040218785A1 (en) * 2001-07-18 2004-11-04 Kim Sung Ho System for automatic recognizing licence number of other vehicles on observation vehicles and method thereof
US20110013843A1 (en) * 2000-12-21 2011-01-20 International Business Machines Corporation System and Method for Compiling Images from a Database and Comparing the Compiled Images with Known Images

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2657982B1 (fr) 1990-02-02 1992-11-27 Cga Hbs Procede de localisation d'adresse sur des articles a trier, etiquette d'adressage et dispositif de mise en óoeuvre du procede.
US5060980A (en) 1990-05-30 1991-10-29 Xerox Corporation Form utilizing encoded indications for form field processing
JPH06339026A (ja) * 1993-05-31 1994-12-06 Matsushita Electric Ind Co Ltd 補正データ生成装置
JPH0793473A (ja) * 1993-09-21 1995-04-07 Hitachi Eng Co Ltd 文字領域割り出し方法
JP3726395B2 (ja) 1997-01-30 2005-12-14 株式会社デンソー 2次元コードおよび2次元コードの読取方法
JPH1154407A (ja) * 1997-08-05 1999-02-26 Nikon Corp 位置合わせ方法
JP4054428B2 (ja) * 1998-02-05 2008-02-27 キヤノン株式会社 画像検索装置及びその方法、コンピュータ可読メモリ
US6360001B1 (en) 2000-05-10 2002-03-19 International Business Machines Corporation Automatic location of address information on parcels sent by mass mailers
CA2375355A1 (en) 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
US7328847B1 (en) * 2003-07-30 2008-02-12 Hewlett-Packard Development Company, L.P. Barcode data communication methods, barcode embedding methods, and barcode systems
US20050044758A1 (en) * 2003-08-29 2005-03-03 Richard Gary P. More readily identifiable license plate
JP4391839B2 (ja) * 2004-01-30 2009-12-24 富士通株式会社 撮影条件設定プログラム、撮影条件設定方法および撮影条件設定装置
JP2006331322A (ja) 2005-05-30 2006-12-07 Fuji Electric Systems Co Ltd 検索用タグ及びこれを使用した情報検索システム
US7613328B2 (en) * 2005-09-09 2009-11-03 Honeywell International Inc. Label detection
US7769236B2 (en) * 2005-10-31 2010-08-03 National Research Council Of Canada Marker and method for detecting said marker
JP4745830B2 (ja) * 2006-01-05 2011-08-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP4670657B2 (ja) 2006-01-24 2011-04-13 富士ゼロックス株式会社 画像処理装置、画像処理方法及びプログラム
JP2007304864A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 文字認識処理システムおよび文字認識処理プログラム
US8218821B2 (en) * 2007-01-23 2012-07-10 Pips Technology, Inc. Video preprocessing of image information for character recognition
US8285047B2 (en) * 2007-10-03 2012-10-09 Xerox Corporation Automated method and system for naming documents from a scanned source based on manually marked text
JP4711093B2 (ja) * 2008-08-28 2011-06-29 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4821869B2 (ja) 2009-03-18 2011-11-24 富士ゼロックス株式会社 文字認識装置、画像読取装置、およびプログラム
WO2010114449A1 (en) * 2009-03-30 2010-10-07 Telefonaktiebolaget Lm Ericsson (Publ) Barcode processing
US8594422B2 (en) 2010-03-11 2013-11-26 Microsoft Corporation Page layout determination of an image undergoing optical character recognition
US9292565B2 (en) 2010-06-30 2016-03-22 International Business Machines Corporation Template-based recognition of food product information
CN103339642A (zh) * 2010-09-20 2013-10-02 鲁米迪格姆有限公司 机器可读符号
US20120223968A1 (en) 2010-10-12 2012-09-06 Kazutoshi Kashimoto Display processing device, display method, and program
US8528820B2 (en) * 2011-06-29 2013-09-10 Symbol Technologies, Inc. Object identification using barcode reader
US20130279758A1 (en) * 2012-04-23 2013-10-24 Xerox Corporation Method and system for robust tilt adjustment and cropping of license plate images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4776464A (en) * 1985-06-17 1988-10-11 Bae Automated Systems, Inc. Automated article handling system and process
US5081685A (en) * 1988-11-29 1992-01-14 Westinghouse Electric Corp. Apparatus and method for reading a license plate
US20110013843A1 (en) * 2000-12-21 2011-01-20 International Business Machines Corporation System and Method for Compiling Images from a Database and Comparing the Compiled Images with Known Images
US20040218785A1 (en) * 2001-07-18 2004-11-04 Kim Sung Ho System for automatic recognizing licence number of other vehicles on observation vehicles and method thereof

Also Published As

Publication number Publication date
US20150199581A1 (en) 2015-07-16
WO2014046918A1 (en) 2014-03-27
CN103679164A (zh) 2014-03-26
US9811749B2 (en) 2017-11-07
JP5972468B2 (ja) 2016-08-17
JP2015529369A (ja) 2015-10-05
JP2016201126A (ja) 2016-12-01
US20140086483A1 (en) 2014-03-27
US8971620B2 (en) 2015-03-03
TW201413602A (zh) 2014-04-01

Similar Documents

Publication Publication Date Title
TWI631514B (zh) Method and system for marking recognition based on mobile terminal
CN107016387B (zh) 一种识别标签的方法及装置
CN107133622B (zh) 一种单词的分割方法和装置
CN111160352B (zh) 一种基于图像分割的工件金属表面文字识别方法及系统
US9916499B2 (en) Method and system for linking printed objects with electronic content
US20090148043A1 (en) Method for extracting text from a compound digital image
CN111275139A (zh) 手写内容去除方法、手写内容去除装置、存储介质
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN110991303A (zh) 一种图像中文本定位方法、装置及电子设备
WO2022082431A1 (en) Systems and methods for extracting information from paper media based on depth information
Karanje et al. Survey on text detection, segmentation and recognition from a natural scene images
Chavre et al. Scene text extraction using stroke width transform for tourist translator on android platform
Salunkhe et al. Recognition of multilingual text from signage boards
Lai et al. Binarization by local k-means clustering for Korean text extraction
CN116030472A (zh) 文字坐标确定方法及装置
CN110084117A (zh) 基于二值图分段投影的文档表格线检测方法、系统
Valiente et al. A process for text recognition of generic identification documents over cloud computing
CN109871910B (zh) 一种手写字符识别方法及装置
Höhn Detecting arbitrarily oriented text labels in early maps
CN113269045A (zh) 自然场景下中文艺术字检测识别方法
CN112861861A (zh) 识别数码管文本的方法、装置及电子设备
CN114202761B (zh) 一种基于图片信息聚类的信息批量提取方法
Kumar et al. A comparative Analysis of Feature Extraction Algorithms and Deep Learning Techniques for Detection from Natural Images
Pan et al. A new Database of Digits extracted from coins with hard-to-segment Foreground for Optical character recognition evaluation
Selvam et al. Enhancing Text Detection in Natural Scenes: A Hybrid Approach with MSER, Connected Components, and Norm-CLAHE

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees