TWI478074B - 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 - Google Patents

文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 Download PDF

Info

Publication number
TWI478074B
TWI478074B TW099141804A TW99141804A TWI478074B TW I478074 B TWI478074 B TW I478074B TW 099141804 A TW099141804 A TW 099141804A TW 99141804 A TW99141804 A TW 99141804A TW I478074 B TWI478074 B TW I478074B
Authority
TW
Taiwan
Prior art keywords
text
image
characters
character
combination
Prior art date
Application number
TW099141804A
Other languages
English (en)
Other versions
TW201224949A (en
Inventor
Yichong Zeng
Jingfung Chen
Original Assignee
Inst Information Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inst Information Industry filed Critical Inst Information Industry
Priority to TW099141804A priority Critical patent/TWI478074B/zh
Priority to US12/971,176 priority patent/US8965128B2/en
Priority to GB1021692.7A priority patent/GB2486283B/en
Publication of TW201224949A publication Critical patent/TW201224949A/zh
Application granted granted Critical
Publication of TWI478074B publication Critical patent/TWI478074B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Electromagnetism (AREA)
  • Toxicology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
本發明是有關於一種文字辨識方法以及裝置以及儲存文字辨識方法之電腦可讀取紀錄媒體。
在日常生活上,有時需要將一些圖片或是書籍、雜誌上的文字用打字的方式輸入到電腦系統內,或是需要將沒有原稿的DM或是合約書進行修改。先前技術中,可使用文字辨識軟體,將圖片上之文字影像進行辨識,以轉換成電腦可讀取之文字編碼。
一般文字辨識軟體係藉由將圖片上之各文字影像切成多個僅具單一文字之影像區塊,以一一辨識各單一文字影像區塊上之文字。然而,若未正確切割各單一文字影像區塊,將大幅降低文字辨識之正確率。
因此,本發明之一態樣是在提供一種文字辨識方法。在文字辨識方法中,將待辨識影像切割成多個文字影像區塊,以辨識出各文字影像區塊之多個可能文字。然後,將文字影像區塊中相鄰者進行組合,並比對各可能文字之組合,以辨識組合後之文字影像區塊上之文字組合。文字辨識方法可實作為一電腦程式,並儲存於一電腦可讀取記錄媒體中,而使電腦讀取此記錄媒體後執行文字辨識方法。文字辨識方法,包含接收一第一文字影像區塊。其中,第一文字影像區塊上顯示數個第一文字。將第一文字影像區塊切割為數個第二文字影像區塊。其中,每一第二文字影像區塊上顯示一第二文字,第二文字為第一文字的其中之一。自每一第二文字影像區塊,辨識出對應於第二文字之數個第三文字。將第二文字影像區塊中相鄰者,組合為數個第三文字影像區塊。其中,每一第三文字影像區塊上顯示第二文字所組成之一第一文字組合。根據第三文字,自每一第三文字影像區塊,辨識出對應於第一文字組合之一第二文字組合。其中,每一第二文字組合由第三文字所組成。
本發明之另一態樣是在提供一種文字辨識裝置。在文字辨識裝置將待辨識影像切割成多個文字影像區塊,以辨識出各文字影像區塊之多個可能文字。然後,將文字影像區塊中相鄰者進行組合,並比對各可能文字之組合,以辨識組合後之文字影像區塊上之文字組合。文字辨識裝置之處理元件包含一文字影像接收模組、一影像切割模組、一文字辨識模組、一影像組合模組以及一字組辨識模組。文字影像接收模組接收一第一文字影像區塊。其中,第一文字影像區塊上顯示數個第一文字。影像切割模組將第一文字影像區塊切割為數個第二文字影像區塊。其中,每一第二文字影像區塊上顯示一第二文字,第二文字為第一文字的其中之一。文字辨識模組自每一第二文字影像區塊,辨識出對應於第二文字之數個第三文字。影像組合模組將第二文字影像區塊中相鄰者,組合為多個第三文字影像區塊。每一第三文字影像區塊上顯示第二文字所組成之一第一文字組合。字組辨識模組根據第三文字,自每一第三文字影像區塊,辨識出對應於第一文字組合之一第二文字組合。其中,每一第二文字組合由第三文字所組成。
應用本發明具有下列優點。由於所辨識出之文字組合係從各單一文字區塊辨識出之文字組合而成,於是可增加辨識出之文字組合之正確率。此外,亦可避免未正確切割單一文字之影像,所造成之單一文字辨識錯誤。
以下將以圖式及詳細說明清楚說明本發明之精神,任何所屬技術領域中具有通常知識者在瞭解本發明之較佳實施例後,當可由本發明所教示之技術,加以改變及修飾,其並不脫離本發明之精神與範圍。
第1圖係依照本發明一實施方式的一種文字辨識方法之流程圖。第2A圖至第2C圖係文字辨識之一實施例。在文字辨識方法中,將待辨識影像切割成多個文字影像區塊,以辨識出各文字影像區塊之多個可能文字。然後,將文字影像區塊中相鄰者進行組合,並比對各可能文字之組合,以辨識組合後之文字影像區塊上之文字組合。文字辨識方法可實作為一電腦程式,並儲存於一電腦可讀取記錄媒體中,而使電腦讀取此記錄媒體後執行文字辨識方法。電腦可讀取記錄媒體可為唯讀記憶體、快閃記憶體、軟碟、硬碟、光碟、隨身碟、磁帶、可由網路存取之資料庫或熟悉此技藝者可輕易思及具有相同功能之電腦可讀取紀錄媒體。
文字辨識方法100包含以下步驟:同時參照第1圖以及第2A圖。在步驟130中,接收一第一文字影像區塊201。其中,第一文字影像區塊201上顯示數個第一文字201a、201b、201c、201d。此外,可在步驟130前,接收一待辨識影像(步驟110),並自待辨識影像擷取第一文字影像區塊(步驟120),供步驟130接收。如此一來,可藉由將第一文字影像區塊201自待辨識影像上擷取出,而減少文字辨識方法100在辨識時,被待辨識影像上非文字區塊所影響,增加文字辨識成功之機率。
此外,可在擷取第一文字影像區塊201(步驟120)時,對所擷取出之第一文字影像區塊201正規化。其中,可藉由仿射映像(Affine Mapping)演算法、尺度不變特徵轉換(Scale-Invariant Feature Transform,SIFT)演算法、加速強健特徵(Speeded Up Robust Features,SURF)演算法或其他影像正規化方法,對所擷取出之第一文字影像區塊正規化。如此一來,可藉由正規化,增加文字辨識成功機率。
同時參照第1圖、第2A圖以及第2B圖。在步驟140中,將第一文字影像區塊201切割為數個第二文字影像區塊202、203、204、205。其中,每一第二文字影像區塊202、203、204、205上顯示一第二文字202a、203a、204a、205a,且各第二文字202a、203a、204a、205a分別為第一文字201a、201b、201c、201d的其中之一。
在步驟150中,自每一第二文字影像區塊202、203、204、205,辨識出對應於第二文字202a、203a、204a、205a之數個第三文字。舉例來說,步驟150可能將第二文字影像區塊202上之第二文字202a,辨識為「1」或「7」;步驟150可能將第二文字影像區塊203上之第二文字203a,辨識為「6」或「8」;步驟150可能將第二文字影像區塊204、205上之第二文字204a、205a,皆辨識為「2」或「3」。因此,「1」以及「7」被視為對應於第二文字202a之第三文字,「6」以及「8」被視為對應於第二文字202b之第三文字,「2」以及「3」被視為對應於第二文字202c之第三文字,「2」以及「3」被視為對應於第二文字202d之第三文字。
同時參照第1圖、第2B圖以及第2C圖。在步驟160中,將第二文字影像區塊202、203、204、205中相鄰者,組合為數個第三文字影像區塊206、207。其中,第三文字影像區塊206上顯示第二文字202a、203a所組成之一第一文字組合206a,第三文字影像區塊207上顯示第二文字204a、205a所組成之一第一文字組合207a。然而,在其他實施例中,可將相鄰之至少三個第二文字影像區塊,組合為第三文字影像區塊,並不限於本揭露中。
在步驟170中,根據第三文字,自每一第三文字影像區塊206、207,辨識出對應於各第一文字組合206a、207a之一第二文字組合。其中,每一第二文字組合由第三文字所組成。舉例來說,步驟170可從對應於第二文字202a、203a之第三文字,組合出「1 6」、「1 8」、「7 6」、「7 8」,以從中選出對應於第一文字組合206a之第二文字組合;步驟170可從對應於第二文字204a、205a之第三文字,組合出「2 2」、「2 3」、「3 2」、「3 3」,以從中選出對應於第一文字組合207a之第二文字組合。如此一來,由於所辨識出之第二文字組合係從各單一文字區塊辨識出之文字組合而成,於是可增加辨識出之第二文字組合之正確率。此外,亦可避免步驟140之切割不正確,所造成之單一文字辨識錯誤。
接下來,在本發明之一實施例中,可使相鄰之文字影像區塊206、207組合為另一文字影像區塊,以進一步進行辨識。如此一來,可藉由將文字影像區塊進一步組合作為辨識之依據,增加辨識正確之機率。此外,在本發明之另一實施例中,可直接輸出所辨識出之第二文字組合。
同時參照第1圖以及第2B圖。在本發明之一實施例中,自每一第二文字影像區塊202、203、204、205,辨識出對應於第二文字202a、203a、204a、205a之第三文字(步驟150)可包含以下步驟:分別比對每一第二文字影像區塊202、203、204、205與一影像資料庫之數個可選文字之文字影像,以自可選文字取得對應於第二文字202a、203a、204a、205a之第三文字。其中,可分別計算每一第二文字影像區塊202、203、204、205與各可選文字之文字影像間之一文字影像差異值,作為取得對應於第二文字202a、203a、204a、205a之第三文字之依據。文字影像差異值係藉由非線性差異值計算方法,如最小均方(Least Mean Square,LMS)演算法、二次規劃(Quadratic Programming)演算法或其他非線性差異值計算方法,所計算。此外,可先辨識各第二文字影像區塊202、203、204、205之文字類型,以增快文字辨識速度並減少文字辨識所需之比對次數。舉例來說,在本實施例中,可將第二文字影像區塊202、203、204、205之辨識為數字類型,並僅與數字之文字影像進行比對,而執行步驟150之辨識。
同時參照第1圖以及第2C圖。在本發明之一實施例中,根據第三文字,自每一第三文字影像區塊206、207,辨識出對應於各第一文字組合206a、207a之一第二文字組合(步驟170)可包含以下步驟:比對每一第三文字影像區塊206、207與一影像資料庫之對應於第三文字之文字影像,以自第三文字組成對應於第一文字組合之第二文字組合。其中,分別計算每一第三文字影像區塊206、207與對應於第三文字之文字影像間之一組合影像差異值,作為第二文字組合之選擇依據。舉例來說,可分別計算第三文字影像區塊206與第三文字所組成之文字組合「1 6」、「1 8」、「7 6」、「7 8」之組合影像差異值,以從中選出組合影像差異值最小者,作為對應於第一文字組合206a之第二文字組合;可分別計算第三文字影像區塊207與第三文字所組成之文字組合「2 2」、「2 3」、「3 2」、「3 3」之組合影像差異值,以從中選出組合影像差異值最小者,作為對應於第一文字組合207a之第二文字組合。
第3圖繪示依照本發明另一實施方式的一種文字辨識裝置之功能方塊圖。文字辨識裝置將待辨識影像切割成多個文字影像區塊,以辨識出各文字影像區塊之多個可能文字。然後,將文字影像區塊中相鄰者進行組合,並比對各可能文字之組合,以辨識組合後之文字影像區塊上之文字組合。
文字辨識裝置300之處理元件310包含一文字影像接收模組313、一影像切割模組314、一文字辨識模組315、一影像組合模組316以及一字組辨識模組317。
同時參照第2A圖以及第3圖。文字影像接收模組313接收一第一文字影像區塊201。其中,第一文字影像區塊201上顯示數個第一文字201a、201b、201c、201d。此外,處理元件310可包含一待辨識影像接收模組311以及一影像擷取模組312。待辨識影像接收模組311接收一待辨識影像。其中,在本發明之一實施例中,文字辨識裝置300更可包含電性連接處理元件310之一拍攝元件320。於是,拍攝元件320可拍攝待辨識影像,供待辨識影像接收模組311接收。此外,在本發明之另一實施例中,文字辨識裝置300更可包含電性連接處理元件310之一資料傳輸介面330。於是,待辨識影像接收模組311可透過資料傳輸介面330,接收待辨識影像。
影像擷取模組312自待辨識影像擷取第一文字影像區塊201。如此一來,可藉由將第一文字影像區塊201自待辨識影像上擷取出,而減少文字辨識裝置300在辨識時,被待辨識影像上非文字區塊所影響,增加文字辨識成功之機率。此外,影像擷取模組312可對所擷取出之第一文字影像區塊201正規化。其中,可藉由仿射映像演算法、尺度不變特徵轉換演算法、加速強健特徵演算法或其他影像正規化方法,對所擷取出之第一文字影像區塊正規化。如此一來,可藉由正規化,增加文字辨識成功機率。
同時參照第2A圖、第2B圖以及第3圖。影像切割模組314將第一文字影像區塊201切割為數個第二文字影像區塊202、203、204、205。其中,每一第二文字影像區塊202、203、204、205上顯示一第二文字202a、203a、204a、205a,第二文字202a、203a、204a、205a分別為第一文字201a、201b、201c、201d的其中之一。
文字辨識模組315自每一第二文字影像區塊202、203、204、205,辨識出對應於第二文字202a、203a、204a、205a之數個第三文字。舉例來說,文字辨識模組315可能將第二文字影像區塊202上之第二文字202a,辨識為「1」或「7」;文字辨識模組315可能將第二文字影像區塊203上之第二文字203a,辨識為「6」或「8」;文字辨識模組315可能將第二文字影像區塊204、205上之第二文字204a、205a,皆辨識為「2」或「3」。因此,「1」以及「7」被視為對應於第二文字202a之第三文字,「6」以及「8」被視為對應於第二文字202b之第三文字,「2」以及「3」被視為對應於第二文字202c之第三文字,「2」以及「3」被視為對應於第二文字202d之第三文字。
同時參照第2B圖、第2C圖以及第3圖。影像組合模組316將第二文字影像區塊202、203、204、205中相鄰者,組合為多個第三文字影像區塊206、207。其中,第三文字影像區塊206上顯示第二文字202a、203a所組成之一第一文字組合206a,第三文字影像區塊207上顯示第二文字204a、205a所組成之一第一文字組合207a。
字組辨識模組317根據第三文字,自每一第三文字影像區塊206、207,辨識出對應於第一文字組合206a、207a之一第二文字組合。其中,每一第二文字組合由第三文字所組成。舉例來說,字組辨識模組317可從對應於第二文字202a、203a之第三文字,組合出「1 6」、「1 8」、「7 6」、「7 8」,以從中選出對應於第一文字組合206a之第二文字組合;字組辨識模組317可從對應於第二文字204a、205a之第三文字,組合出「2 2」、「2 3」、「3 2」、「3 3」,以從中選出對應於第一文字組合207a之第二文字組合。如此一來,由於所辨識出之第二文字組合係從各單一文字區塊辨識出之文字組合而成,於是可增加辨識出之第二文字組合之正確率。此外,亦可避免影像切割模組314之切割不正確,所造成之單一文字辨識錯誤。然而,在其他實施例中,可將相鄰之至少三個第二文字影像區塊,組合為第三文字影像區塊,並不限於本揭露中。
接下來,在本發明之一實施例中,影像組合模組316可使相鄰之文字影像區塊206、207組合為另一文字影像區塊,以進一步進行辨識。如此一來,可藉由將文字影像區塊進一步組合作為辨識之依據,增加辨識正確之機率。此外,在本發明之另一實施例中,可使文字辨識裝置300之一輸出元件340,直接輸出所辨識出之第二文字組合。
同時參照第2B圖以及第3圖。在本發明之一實施例中,文字辨識模組315可藉由比對影像,以進行個別文字辨識。因此,文字辨識裝置300更可包含電性連接處理元件310之一影像資料庫350,用以儲存數個可選文字之文字影像。文字辨識模組315可包含一文字比對器315a。文字比對器315a分別比對每一第二文字影像區塊202、203、204、205與影像資料庫350中之可選文字之文字影像,以自可選文字取得對應於第二文字202a、203a、204a、205a之第三文字。其中,文字辨識模組315可藉由比對影像間的差異值,作為文字辨識之依據。因此,文字辨識模組315更可包含一文字影像差異值計算器315b。文字影像差異值計算器315b可分別計算每一第二文字影像區塊202、203、204、205與各可選文字之文字影像間之一文字影像差異值,作為文字辨識模組315辨識之依據。文字影像差異值計算器315b可藉由非線性差異值計算方法,如最小均方(Least Mean Square,LMS)演算法、二次規劃(Quadratic Programming)演算法或其他非線性差異值計算方法,計算文字影像差異值。此外,文字辨識模組315可先辨識各第二文字影像區塊202、203、204、205之文字類型,以增快文字辨識速度並減少文字辨識所需之比對次數。舉例來說,在本實施例中,文字辨識模組315可將第二文字影像區塊202、203、204、205之辨識為數字類型,並僅與影像資料庫350中之數字之文字影像進行比對,而進行辨識。
同時參照第2C圖以及第3圖。在本發明之一實施例中,字組辨識模組317可藉由比對影像,以進行文字組合辨識。因此,字組辨識模組317可包含一字組比對器317a。字組比對器317a比對每一第三文字影像區塊206、207與影像資料庫350中對應於第三文字之文字影像,以自第三文字組成對應於第一文字組合之第二文字組合。其中,字組辨識模組317可藉由比對文字組合之影像間的差異值,作為文字組合辨識之依據。因此,字組辨識模組317更可包含一字組影像差異值計算器317b。字組影像差異值計算器317b分別計算每一第三文字影像區塊206、207與對應於第三文字之文字影像間之一組合影像差異值,作為字組辨識模組317辨識出第二文字組合之依據。舉例來說,字組影像差異值計算器317b可分別計算第三文字影像區塊206與第三文字所組成之文字組合「1 6」、「1 8」、「7 6」、「7 8」之組合影像差異值,以從中選出組合影像差異值最小者,作為對應於第一文字組合206a之第二文字組合;字組影像差異值計算器317b可分別計算第三文字影像區塊207與第三文字所組成之文字組合「2 2」、「2 3」、「3 2」、「3 3」之組合影像差異值,以從中選出組合影像差異值最小者,作為對應於第一文字組合207a之第二文字組合。
由上述本發明實施方式可知,應用本發明具有下列優點。由於所辨識出之文字組合係從各單一文字區塊辨識出之文字組合而成,於是可增加辨識出之文字組合之正確率。此外,亦可避免未正確切割單一文字之影像,所造成之單一文字辨識錯誤。
雖然本發明已以實施方式揭露如上,然其並非用以限定本發明,任何熟習此技藝者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100...文字辨識方法
110~170...步驟
201...第一文字影像區塊
201a、201b、201c、201d...第一文字
202、203、204、205...第二文字影像區塊
202a、203a、204a、205a...第二文字
206、207...第三文字影像區塊
206a、207a...第一文字組合
300...文字辨識裝置
310...處理元件
311...待辨識影像接收模組
312...影像擷取模組
313...文字影像接收模組
314...影像切割模組
315...文字辨識模組
315a...文字比對器
315b...文字影像差異值計算器
316...影像組合模組
317...字組辨識模組
317a...字組比對器
317b...字組影像差異值計算器
320...拍攝元件
330...資料傳輸介面
340...輸出元件
350...影像資料庫
為讓本發明之上述和其他目的、特徵、優點與實施例能更明顯易懂,所附圖式之說明如下:
第1圖係依照本發明一實施方式的一種文字辨識方法之流程圖。
第2A圖至第2C圖係文字辨識之一實施例。
第3圖繪示依照本發明另一實施方式的一種文字辨識裝置之功能方塊圖。
100...文字辨識方法
110~170...步驟

Claims (19)

  1. 一種文字辨識方法,包含:接收一第一文字影像區塊,其中該第一文字影像區塊上顯示複數個第一文字;將該第一文字影像區塊切割為複數個第二文字影像區塊,其中每一該些第二文字影像區塊上顯示一第二文字,該第二文字為該些第一文字的其中之一;自每一該些第二文字影像區塊,辨識出對應於該第二文字之複數個第三文字;將該些第二文字影像區塊中相鄰者,組合為複數個第三文字影像區塊,其中每一該些第三文字影像區塊上顯示該些第二文字所組成之一第一文字組合;根據相鄰的該些第二文字所對應的該些第三文字,組合出複數個第三文字組合,其中每一該些第三文字組合包括該些第三文字的至少其中之二;以及自每一該些第三文字影像區塊,從該些第三文字組合中辨識出對應於該些第一文字組合之一第二文字組合,其中每一該些第二文字組合由該些第三文字所組成。
  2. 如請求項1所述之文字辨識方法,其中自每一該些第二文字影像區塊,辨識出對應於該第二文字之該些第三文字包含:分別比對每一該些第二文字影像區塊與一影像資料庫之複數個可選文字之文字影像,以自該些可選文字取得對應於該第二文字之該些第三文字。
  3. 如請求項2所述之文字辨識方法,其中比對每一該些第二文字影像區塊與該些可選文字之文字影像包含:分別計算每一該些第二文字影像區塊與該些可選文字之文字影像間之一文字影像差異值,其中自該些可選文字取得對應於該第二文字之該些第三文字係根據該些文字影像差異值。
  4. 如請求項3所述之文字辨識方法,其中該些文字影像差異值係藉由非線性差異值計算方法所計算。
  5. 如請求項1所述之文字辨識方法,其中自每一該些第三文字影像區塊,從該些第三文字組合中辨識出對應於該些第一文字組合之該第二文字組合包含:比對每一該些第三文字影像區塊與一影像資料庫之對應於該些第三文字之文字影像,以自該些第三文字組成對應於該些第一文字組合之該些第二文字組合。
  6. 如請求項5所述之文字辨識方法,其中比對每一該些第三文字影像區塊與該影像資料庫之對應於該些第三文字之文字影像包含:分別計算每一該些第三文字影像區塊與對應於該些第三文字之文字影像間之一組合影像差異值,其中自該些第三文字組成對應於該些第一文字組合之 該些第二文字組合係根據該些組合影像差異值。
  7. 如請求項1所述之文字辨識方法,更包含:接收一待辨識影像;以及自該待辨識影像擷取該第一文字影像區塊。
  8. 如請求項1所述之文字辨識方法,更包含:接收一待辨識影像;以及自該待辨識影像擷取並正規化該第一文字影像區塊。
  9. 如請求項8所述之文字辨識方法,其中正規化該第一文字影像區塊係藉由仿射映像演算法、尺度不變特徵轉換演算法或加速強健特徵演算法。
  10. 一種電腦可讀取紀錄媒體,儲存一電腦程式,用以執行一種文字辨識方法,其中該文字辨識方法包含:接收一第一文字影像區塊,其中該第一文字影像區塊上顯示複數個第一文字;將該第一文字影像區塊切割為複數個第二文字影像區塊,其中每一該些第二文字影像區塊上顯示一第二文字,該第二文字為該些第一文字的其中之一;自每一該些第二文字影像區塊,辨識出對應於該第二文字之複數個第三文字;將該些第二文字影像區塊中相鄰者,組合為複數個第 三文字影像區塊,每一該些第三文字影像區塊上顯示該些第二文字所組成之一第一文字組合;根據相鄰的該些第二文字所對應的該些第三文字,組合出複數個第三文字組合,其中每一該些第三文字組合包括該些第三文字的至少其中之二;以及自每一該些第三文字影像區塊,從該些第三文字組合中辨識出對應於該些第一文字組合之一第二文字組合,其中每一該些第二文字組合由該些第三文字所組成。
  11. 一種文字辨識裝置,包含:一處理元件,包含:一文字影像接收模組,接收一第一文字影像區塊,其中該第一文字影像區塊上顯示複數個第一文字;一影像切割模組,將該第一文字影像區塊切割為複數個第二文字影像區塊,其中每一該些第二文字影像區塊上顯示一第二文字,該第二文字為該些第一文字的其中之一;一文字辨識模組,自每一該些第二文字影像區塊,辨識出對應於該第二文字之複數個第三文字;一影像組合模組,將該些第二文字影像區塊中相鄰者,組合為複數個第三文字影像區塊,每一該些第三文字影像區塊上顯示該些第二文字所組成之一第一文字組合;以及一字組辨識模組,根據相鄰的該些第二文字所對應的該些第三文字,組合出複數個第三文字組合,其中每一 該些第三文字組合包括該些第三文字的至少其中之二,其中該字組辨識模組自每一該些第三文字影像區塊,從該些第三文字組合中辨識出對應於該些第一文字組合之一第二文字組合,其中每一該些第二文字組合由該些第三文字所組成。
  12. 如請求項11所述之文字辨識裝置,其中該文字辨識裝置更包含電性連接該處理元件之一影像資料庫,該影像資料庫存有複數個可選文字之文字影像,該文字辨識模組包含:一文字比對器,分別比對每一該些第二文字影像區塊與該影像資料庫中之該些可選文字之文字影像,以自該些可選文字取得對應於該第二文字之該些第三文字。
  13. 如請求項12所述之文字辨識裝置,其中該文字辨識模組更包含:一文字影像差異值計算器,分別計算每一該些第二文字影像區塊與該些可選文字之文字影像間之一文字影像差異值,其中該文字比對器係根據該些文字影像差異值,取得對應於該第二文字之該些第三文字。
  14. 如請求項11所述之文字辨識裝置,其中該文字辨識裝置更包含電性連接該處理元件之一影像資料庫,該影像資料庫存有複數個可選文字之文字影像,該字組辨識模 組包含:一字組比對器,比對每一該些第三文字影像區塊與該影像資料庫中對應於該些第三文字之文字影像,以自該些第三文字組成對應於該些第一文字組合之該些第二文字組合。
  15. 如請求項14所述之文字辨識裝置,其中該字組辨識模組更包含:一字組影像差異值計算器,分別計算每一該些第三文字影像區塊,與對應於該些第三文字所組成之字組影像間之一組合影像差異值,其中該字組比對器係根據該些組合影像差異值,而自該些第三文字組成對應於該些第一文字組合之該些第二文字組合。
  16. 如請求項11所述之文字辨識裝置,其中該處理元件更包含:一待辨識影像接收模組,接收一待辨識影像;以及一影像擷取模組,自該待辨識影像擷取該第一文字影像區塊。
  17. 如請求項16所述之文字辨識裝置,更包含:一拍攝元件,電性連接該處理元件,拍攝該待辨識影像。
  18. 如請求項16所述之文字辨識裝置,更包含:一資料傳輸介面,電性連接該處理元件,其中該待辨識影像係透過該資料傳輸介面所接收。
  19. 如請求項11所述之文字辨識裝置,更包含:一輸出元件,電性連接該處理元件,輸出該第二文字組合。
TW099141804A 2010-12-01 2010-12-01 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 TWI478074B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW099141804A TWI478074B (zh) 2010-12-01 2010-12-01 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
US12/971,176 US8965128B2 (en) 2010-12-01 2010-12-17 Code recognition method, device and computer readable storage medium for storing code recognition method
GB1021692.7A GB2486283B (en) 2010-12-01 2010-12-20 Code recognition method, device and computer readable storage medium for storing code recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW099141804A TWI478074B (zh) 2010-12-01 2010-12-01 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體

Publications (2)

Publication Number Publication Date
TW201224949A TW201224949A (en) 2012-06-16
TWI478074B true TWI478074B (zh) 2015-03-21

Family

ID=43598772

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099141804A TWI478074B (zh) 2010-12-01 2010-12-01 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體

Country Status (3)

Country Link
US (1) US8965128B2 (zh)
GB (1) GB2486283B (zh)
TW (1) TWI478074B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886609B (zh) * 2017-03-31 2019-12-31 中国科学院地理科学与资源研究所 街区式农村居民地遥感快速标注方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW376492B (en) * 1997-08-06 1999-12-11 Nippon Telegraph & Telephone Methods for extraction and recognition of pattern in an image, method for image abnormality judging, and memory medium with image processing programs
EP1085456B1 (en) * 1999-09-15 2006-11-22 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
TW200847035A (en) * 2007-05-08 2008-12-01 Microsoft Corp Photo generated 3-D navigable storefront

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4259661A (en) * 1978-09-01 1981-03-31 Burroughs Corporation Apparatus and method for recognizing a pattern
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4499499A (en) * 1982-12-29 1985-02-12 International Business Machines Corporation Method for identification and compression of facsimile symbols in text processing systems
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
US5020117A (en) * 1988-01-18 1991-05-28 Kabushiki Kaisha Toshiba Handwritten character string recognition system
JPH0283688A (ja) * 1988-09-20 1990-03-23 Nec Corp 文字認識方式
JP2991779B2 (ja) * 1990-06-11 1999-12-20 株式会社リコー 文字認識方法及び装置
JP3260843B2 (ja) * 1992-08-25 2002-02-25 株式会社リコー 文字認識方法
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
JP2611904B2 (ja) * 1992-10-19 1997-05-21 株式会社エイ・ティ・アール視聴覚機構研究所 文字認識装置
US5644656A (en) * 1994-06-07 1997-07-01 Massachusetts Institute Of Technology Method and apparatus for automated text recognition
US5787194A (en) * 1994-11-08 1998-07-28 International Business Machines Corporation System and method for image processing using segmentation of images and classification and merging of image segments using a cost function
US5737443A (en) 1994-11-14 1998-04-07 Motorola, Inc. Method of joining handwritten input
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
US5862259A (en) * 1996-03-27 1999-01-19 Caere Corporation Pattern recognition employing arbitrary segmentation and compound probabilistic evaluation
SG71018A1 (en) * 1997-03-01 2000-03-21 Inst Of Systems Science Nat Un Robust identification code recognition system
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning
JP4704601B2 (ja) * 2000-11-01 2011-06-15 富士通株式会社 文字認識方法,プログラム及び記録媒体
JP4136316B2 (ja) * 2001-01-24 2008-08-20 富士通株式会社 文字列認識装置
US6735337B2 (en) * 2001-02-02 2004-05-11 Shih-Jong J. Lee Robust method for automatic reading of skewed, rotated or partially obscured characters
JP4240859B2 (ja) * 2001-09-05 2009-03-18 株式会社日立製作所 携帯端末装置及び通信システム
US7106905B2 (en) * 2002-08-23 2006-09-12 Hewlett-Packard Development Company, L.P. Systems and methods for processing text-based electronic documents
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
US20050175242A1 (en) * 2003-04-24 2005-08-11 Fujitsu Limited Online handwritten character input device and method
JP4713107B2 (ja) * 2004-08-20 2011-06-29 日立オムロンターミナルソリューションズ株式会社 景観中文字列認識方式および装置
US7561737B2 (en) * 2004-09-22 2009-07-14 Microsoft Corporation Mathematical expression recognition
WO2006105108A2 (en) * 2005-03-28 2006-10-05 United States Postal Service Multigraph optical character reader enhancement systems and methods
JP4549400B2 (ja) * 2008-03-04 2010-09-22 富士通株式会社 文書認識プログラム、文書認識装置、および文書認識方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW376492B (en) * 1997-08-06 1999-12-11 Nippon Telegraph & Telephone Methods for extraction and recognition of pattern in an image, method for image abnormality judging, and memory medium with image processing programs
EP1085456B1 (en) * 1999-09-15 2006-11-22 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
TW200847035A (en) * 2007-05-08 2008-12-01 Microsoft Corp Photo generated 3-D navigable storefront

Also Published As

Publication number Publication date
GB2486283B (en) 2015-07-08
US8965128B2 (en) 2015-02-24
GB2486283A (en) 2012-06-13
US20120141030A1 (en) 2012-06-07
GB201021692D0 (en) 2011-02-02
TW201224949A (en) 2012-06-16

Similar Documents

Publication Publication Date Title
US9183429B2 (en) Method and apparatus for facial recognition
WO2020253127A1 (zh) 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质
US9177205B2 (en) Image attribute discrimination apparatus, attribute discrimination support apparatus, image attribute discrimination method, attribute discrimination support apparatus controlling method, and control program
CN110321845B (zh) 一种从视频中提取表情包的方法、装置及电子设备
JP5361524B2 (ja) パターン認識システム及びパターン認識方法
CN111564157A (zh) 会议记录优化方法、装置、设备及存储介质
US11816923B2 (en) Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium
JP6969663B2 (ja) ユーザの撮影装置を識別する装置及び方法
US9542594B2 (en) Information processing apparatus, method for processing information, and program
CN110717458B (zh) 人脸识别方法及识别装置
JP2012252447A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
CN111753764A (zh) 一种边缘端基于姿态估计的手势识别方法
CN113158773B (zh) 一种活体检测模型的训练方法及训练装置
JP5214679B2 (ja) 学習装置、方法及びプログラム
CN113205047A (zh) 药名识别方法、装置、计算机设备和存储介质
CN112613471A (zh) 人脸活体检测方法、装置及计算机可读存储介质
US9430710B2 (en) Target-image detecting device, control method and control program thereof, recording medium, and digital camera
TWI478074B (zh) 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
JP2006133941A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び携帯型端末
US20090154812A1 (en) Method for Identifying Objects and Object Identification System
CN111046804A (zh) 活体检测方法、装置、电子设备及可读存储介质
WO2023024424A1 (zh) 分割网络训练方法、使用方法、装置、设备及存储介质
CN111708988B (zh) 侵权视频识别方法、装置、电子设备及存储介质
JP2004199200A (ja) パターン認識装置、撮像装置、情報処理システム、パターン認識方法、記録媒体、及びプログラム
CN112989869A (zh) 人脸质量检测模型的优化方法、装置、设备及存储介质