TWI612480B - 文字影像辨識系統及操作文字影像辨識系統的方法 - Google Patents

文字影像辨識系統及操作文字影像辨識系統的方法 Download PDF

Info

Publication number
TWI612480B
TWI612480B TW105114280A TW105114280A TWI612480B TW I612480 B TWI612480 B TW I612480B TW 105114280 A TW105114280 A TW 105114280A TW 105114280 A TW105114280 A TW 105114280A TW I612480 B TWI612480 B TW I612480B
Authority
TW
Taiwan
Prior art keywords
image
database
target
flag
processor
Prior art date
Application number
TW105114280A
Other languages
English (en)
Other versions
TW201740308A (zh
Inventor
蔡祈岩
郭峻成
Original Assignee
有無科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 有無科技股份有限公司 filed Critical 有無科技股份有限公司
Priority to TW105114280A priority Critical patent/TWI612480B/zh
Publication of TW201740308A publication Critical patent/TW201740308A/zh
Application granted granted Critical
Publication of TWI612480B publication Critical patent/TWI612480B/zh

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

文字影像辨識系統包含標誌資料庫、字詞資料庫、影像擷取裝置、顯示螢幕及處理器。標誌資料庫儲存複數個標誌的圖形特徵資料及每一標誌所對應之格式模板。影像擷取裝置擷取目標影像。顯示螢幕顯示目標影像。處理器根據目標影像之擷取標誌的圖形特徵與第一標誌資料庫之複數個標誌的圖形特徵的相似程度自複數個標誌中選取目標標誌,根據標誌資料庫中目標標誌所對應之目標格式模板將目標影像區分為複數個影像子區塊,並根據字詞資料庫辨識複數個影像子區塊中的文字影像。

Description

文字影像辨識系統及操作文字影像辨識系統的方法
本發明係有關於一種文字影像辨識系統,特別是一種能夠依據目標影像中之標誌所對應的模板來辨識目標影像之文字影像的影像辨識系統。
一般而言,為了能夠有效管理文件,將文件影像化並將影像中的文字電子化是常見且重要的過程。先前技術在對影像中的文字進行辨識時,會將分析影像內容後所取得的影像特徵與通用字詞庫裡儲存的字詞特徵來進行比對與辨識,而通用字詞庫中所儲存的字詞可能包含各種常用的字詞或甚至各種領域的專有名詞。然而因為通用字詞庫裡的字詞資料與影像內容並無對應關係,因此直接將分析影像後所得的影像特徵與通用字詞庫裡的字詞相進行比對,不僅可能耗費不必要的運算資源,也未必能得到滿意的成果。
此外,在許多應用中,影像的內容可能為制式的表格文件,而表格中的不同欄位常會記載不同類型的資訊,舉例來說,信封或包裹上常會利用不同的欄位來記載與郵務傳遞相關的資訊,例如收件人欄位及收件地址欄位即會分別記載姓名及地址資訊。然而這兩種資訊所常用的字詞則有相當差異,舉例來說,在地址資訊中常見的字詞可能包含「XX市」、「XX區」、「XX路」…等等,而這些字詞一般則較少出現在人名當中。在此情況下,若仍用使用通用字詞庫中所記錄的字詞來辨識表格中不同欄位的文字,則容易浪費不必要的運算資源在比對不相關的字詞,而且也可能會造成誤判,導致在取得辨識結果之後,還需以人工的方式進行校正,反而造成使用上的不便。因此,如何有效地辨識影像中的文字即成為了一個有待解決的問題。
本發明之一實施例提供一種文字影像辨識系統,文字影像辨識系統包含標誌資料庫、字詞資料庫、影像擷取裝置、顯示螢幕及處理器。
標誌資料庫可儲存複數個標誌的圖形特徵資料,及每一標誌所對應之格式模板,格式模板包含複數個特定資訊區塊所對應的內容及相對分布位置資訊。影像擷取裝置可擷取目標影像。顯示螢幕耦接於影像擷取裝置,並可顯示目標影像。處理器耦接於影像擷取裝置、顯示螢幕、第一標誌資料庫及字詞資料庫,且處理器可根據目標影像之擷取標誌的圖形特徵與第一標誌資料庫之複數個標誌的圖形特徵資料的相似程度自複數個標誌中選取目標標誌,根據第一標誌資料庫中目標標誌所對應之目標格式模板將目標影像區分為複數個影像子區塊,並根據字詞資料庫辨識複數個影像子區塊中的文字影像。
本發明之另一實施例提供一種文字影像辨識系統的操作方法,文字影像辨識系統包含影像擷取裝置、顯示螢幕、處理器、標誌資料庫及字詞資料庫。第一標誌資料庫儲存有複數個標誌的圖形特徵資料及每一標誌所對應之格式模板,格式模板包含複數個特定資訊區塊所對應的內容及相對分布位置資訊,文字影像辨識系統的操作方法包含影像擷取裝置擷取目標影像,顯示螢幕顯示目標影像,處理器根據目標影像之擷取標誌的圖形特徵與標誌資料庫之複數個標誌的圖形特徵資料的相似程度自複數個標誌中選取目標標誌,處理器根據目標標誌所對應之目標格式模板將目標影像分為複數個影像子區塊,及處理器根據字詞資料庫辨識複數個影像子區塊中的文字影像。
第1圖為本發明一實施例之文字影像辨識系統100的示意圖,文字影像辨識系統100(例如帶有拍照功能的手機)包含第一標誌資料庫110、字詞資料庫120、影像擷取裝置130、顯示螢幕140及第一處理器150。顯示螢幕140耦接於影像擷取裝置130,而第一處理器150則耦接於影像擷取裝置130、顯示螢幕140、第一標誌資料庫110及字詞資料庫120。
在本發明的部分實施例中,文字影像辨識系統100可用來辨識包裹或信件上的郵件資訊。一般而言,若包裹或是信件是由特定的機構或商家寄出,則在其包裹或信件上通常會附有該機構或商家的標誌,並以其機構或商家之特定格式的表單來填寫郵件資訊。舉例來說,第2圖為物流公司所遞送之包裹O的外觀。第2圖的包裹O上方印有物流公司的標誌L1,並印有紀錄郵件資訊的表單,第2圖所示的表單分為寄件人、寄件地址、收件人、收件地址、收件人連絡電話等相異的欄位,分別用以紀錄對應的資訊。
由於不同的機構或商家通常會有不同的代表標誌,且各個不同的機構或商家所用來記錄郵件資訊的表單也可能會利用相異之特定格式的欄位來記錄包裹或信件上的郵件資訊,而其欄位的位置排列也可能各自相異,因此文字影像辨識系統100的第一標誌資料庫110可儲存各個機構或商家之標誌的圖形特徵資料,例如標誌L 1至L N的圖形特徵資料,並可儲存每一個標誌L 1至L N所對應之格式模板,每一格式模板則可包含複數個特定資訊區塊所對應的內容及其相對分布位置資訊,使得文字影像辨識系統100得以用對應的手段來辨識包裹或信件上的郵件資訊。其中N為正整數。
舉例來說,第一標誌資料庫110已儲存了第2圖中物流公司之標誌L 1的圖形特徵資料以及標誌L 1所對應到的格式模板。第2圖中的表單包含了特定資訊區塊B1、B2、B3、B4及B5,並分別用來記錄寄件人、寄件地址、收件人、收件地址、收件人連絡電話,因此在第一標誌資料庫110中,標誌L 1所對應到的格式模板也會包含特定資訊區塊B1、B2、B3、B4及B5所對應的內容,以及特定資訊區塊B1、B2、B3、B4及B5的相對分布位置資訊,例如特定資訊區塊B1、B2、B3、B4及B5在空間上的排列順序以及資訊區塊B1、B2、B3、B4及B5所占的面積比例。
如此一來,文字影像辨識系統100即可根據第一標誌資料庫110中所儲存的資訊來辨識包裹或郵件上的標誌,並可根據所辨識出之標誌所對應到的格式模板,以用對應的辨識手段來辨識包裹或郵件上各個欄位的內容,而達到避免誤判的效果。
當利用文字影像辨識系統100來辨識包裹或信件上的郵件資訊時,文字影像辨識系統100之影像擷取裝置130可擷取所欲進行辨識的目標影像IMG1,而顯示螢幕140則可顯示目標影像IMG1。第3圖為本發明一實施例之目標影像IMG1的示意圖。
在第1圖及第3圖的實施例中,第一處理器150可先計算目標影像IMG1中的擷取標誌L C的圖形特徵。在本發明的部分實施例中,第一處理器150可對擷取標誌L C進行影像處理以取得其圖形特徵,例如第一處理器150可透過計算擷取標誌L C的色彩灰階分布(color histogram),對擷取標誌L C進行邊界檢測(edge detection)等方式來取得擷取標誌L C的圖形特徵,甚至亦可利用尺度不變特徵轉換(Scale-invariant feature transform ,SIFT)來取得擷取標誌L C的圖形特徵。同樣的,第一標誌資料庫110中所儲存之各個機構或商家之標誌L 1至L N的圖形特徵也會是根據相同的演算法所取得的圖形特徵。
在計算取得擷取標誌L C的圖形特徵後,第一處理器150即可根據擷取標誌L C的圖形特徵與第一標誌資料庫110之複數個標誌L 1至L N的圖形特徵資料的相似程度自複數個標誌L 1至L N中選取目標標誌。在本發明的部分實施例中,第一處理器150所取得之擷取標誌L C的圖形特徵可能包含複數個特徵值,此時可計算擷取標誌L C的各個特徵值與第一標誌資料庫110中的每一個標誌的各個特徵值的平方差之和,以作為判斷擷取標誌L C與各個標誌的相似程度,亦或可根據最近鄰居法(K nearest neighbor,KNN)來將擷取標誌L C歸類至相近的標誌。在經過第一處理器150的運算之後,若判斷擷取標誌L C的圖形特徵與標誌L 1的圖形特徵最為接近,即可選擇標誌L 1作為目標標誌,並進行後續的處理。
然而,本發明並不限定以上述方式取得各個標誌的圖形特徵,也不限定以上述方式計算各個標誌間的相似程度。在本發明的部分實施例中,第一處理器150亦可根據其他的影像處理演算法取得擷取標誌L C的圖形特徵,而第一標誌資料庫110中所儲存之各個機構或商家之標誌的圖形特徵也將是以相同的演算法取得。此外,在本發明的其他實施例中,第一處理器150亦可能根據系統的需要或標誌的特性選擇以不同的方式來計算各個標誌間的相似程度。
在第一處理器150根據擷取標誌L C與第一標誌資料庫110之複數個標誌L 1至L N的相似程度自複數個標誌中選取目標標誌之後,第一處理器150即可取得第一標誌資料庫110中目標標誌所對應之目標格式模板,並可根據目標標誌所對應之目標格式模板將目標影像IMG1區分為複數個影像子區塊,然後再分別以不同的對應手段進行辨識,避免誤判。在第3圖的實施例中,第一處理器150可根據目標標誌,亦即標誌L 1,所對應之目標格式模板將目標影像IMG1分為複數個影像子區塊S1、S2、S3、S4及S5,而影像子區塊S1至S5可分別對應到第2圖之包裹O之表單上的資訊區塊B1、B2、B3、B4及B5。再者,根據目標標誌所對應之目標格式模板第一處理器150亦可得知每一個影像子區塊S1至S5中所記載的資訊類別,例如對應至資訊區塊B1至B5的影像子區塊S1至 S5應包含分別用來記錄寄件人、寄件地址、收件人、收件地址、收件人連絡電話的欄位。
如此一來,第一處理器150即可進一步根據字詞資料庫120辨識影像子區塊中S1至S5的文字影像。在本發明的部分實施例中,第一處理器150可以根據字詞資料庫120中對應的字詞資料組來辨識不同的影像子區塊中S1至S5的文字影像。舉例來說,當利用文字影像辨識系統100來管理社區所接收到的包裹及郵件時,字詞資料庫120即可能包含與社區地址相關之第一字詞資料組122及與社區住戶姓名相關之第二字詞資料組124。例如第一字詞資料組122可能包含「台北市」、「高雄市」、「大安路」…等與地址相關的字詞的資訊,而第二字詞資料組124則可能包含「陳大偉」、「林小華」…等與社區住戶姓名相關的字詞資訊。
在此情況下,第一處理器即可根據第一字詞資料組122辨識影像子區塊S1至S5中用以記錄收件人地址及寄件人地址之影像子區塊S2及S4的文字影像,並可根據第二字詞資料組124辨識影像子區塊S1至S5中用以記錄收件人姓名之影像子區塊S3內的文字影像。
由於第一處理器150能夠辨識包裹或郵件上的標誌,並進一步根據對應於其標誌之商家所慣用的表單格式將目標影像IMG1區分為不同的影像子區塊S1至S5,再根據各個影像子區塊所對應的內容類型選擇適當的字詞資料組來辨識其影像子區塊內的文字影像,因此能夠較先前技術更加精準的辨識目標影像內的文字影像。
雖然在上述實施例中,文字影像辨識系統100可用來管理社區所接收到的包裹及郵件,然而本發明並不限定於管理社區內的包裹及郵件,而亦可應用於郵政單位或物流公司內部的包裹及郵件管理,甚至在本發明的其他實施例中,文字影像辨識系統100亦可用來管理其他類型的表單文件,舉例來說,文字影像辨識系統100亦可用來管理證照或病歷等文件,並可根據證照或病歷上的特定標誌辨識出其對應的格式模板,並依照對應的格式模板將影像區分為相異的影像子區塊,再根據對應的字詞資料組來辨識各個影像子區塊內的文字影像,由於對應的字詞資料組中所包含的字詞會與對應的影像子區塊的內容相關,因此能夠提高辨識文字影像的準確率。
此外,由於各個機構或商家所使用的表單可能不定時的更新,因此在本發明的部分實施例中第一處理器150還可根據辨識影像子區塊S1至S5中的文字影像的辨識結果更新第一標誌資料庫110中目標標誌所對應之目標格式模板。舉例來說,當第一處理器150根據原先第一標誌資料庫110中目標標誌所對應之目標格式模板將目標影像IMG1區分為不同之影像子區塊,並對各個影像子區塊進行辨識時,倘若使用者發現所得出的辨識結果有誤,或所得出的辨識結果與原先目標格式模板中所設定的內容類型不相符時,即可對第一標誌資料庫110中目標標誌所對應之目標格式模板進行更新。如此一來,即可確保目標標誌所對應之目標格式模板是與其機構或商家所更新的表單相容的最新版本,而能夠有效的提升文字影像的辨識準確率。
在本發明的部分實施例中,第一處理器150所更新之目標格式模板還可上傳到雲端主機以供其他的處理器下載利用。第4圖為本發明一實施例之文字影像辨識系統200的示意圖,文字影像辨識系統200與文字影像辨識系統100具有相似的結構,並可依據相似的原理操作。兩者的差別在於文字影像辨識系統200還包含雲端主機260、共用標誌資料庫270、第二處理器280及第二標誌資料庫290。
第二處理器280的操作原理與第一處理器150的操作原理相同,而第二標誌資料庫290的操作原理則與第一標誌資料庫110的操作原理則相同。換言之,第二處理器280可根據第二標誌資料庫290中所儲存的複數個標誌的圖形特徵資料來辨識目標影像中的標誌,並根據辨識出的標誌所對應的格式模板將目標影像區分為複數個影像子區塊,再針對每個影像子區塊內的文字影像進行辨識。
雲端主機260包含共用標誌資料庫270,共用標誌資料庫270中可儲存各個機構或商家之標誌的圖形特徵資料,並可儲存每一個標誌所對應之格式模板,每一格式模板則可包含複數個特定資訊區塊所對應的內容及其相對分布位置資訊。在本發明的部分實施例中,第一處理器150可透過網路下載共用標誌資料庫270的資料以更新第一標誌資料庫110的內容,而第二處理器280亦可透過網路下載共用標誌資料庫270的資料以更新第二標誌資料庫290的內容。如此一來,當雲端主機260更新共用標誌資料庫270的內容時,第一標誌資料庫110及第二標誌資料庫290的內容也可以對應的更新,因此可以減少第一處理器150及第二處理器280誤判的情況。
在此情況下,當使用者發現處理器的辨識影像子區塊中的文字影像的辨識結果有誤,或所得出的辨識結果與原先目標格式模板中所設定的內容類型不相符時,亦可將其辨識結果上傳至雲端主機260。如此一來,雲端主機260即可蒐集各個處理器的辨識結果,倘若回報為錯誤的辨識結果數量顯著的增加,或超過一預定值,則表示對應的機構或商家可能已經變更了原先使用的表單格式,此時雲端主機260即可根據蒐集到的辨識結果來更新共用標誌資料庫270。而第一處理器150及第二處理器280即可根據共用標誌資料庫270分別更新第一標至資料庫110及第二標誌資料庫290。如此一來,即可確保第一標至資料庫110及第二標誌資料庫290中的目標格式模板為與各機構或商家所更新的表單相容的最新版本,而能夠有效的提升文字影像的辨識準確率。
第5圖為本發明一實施例之文字影像辨識系統100或200的操作方法300的流程圖,方法300可包含但不限於步驟S310至S350。
S310: 影像擷取裝置130擷取目標影像IMG1;
S320: 顯示螢幕140顯示目標影像IMG1;
S330: 第一處理器150根據目標影像IMG1之擷取標誌L C的圖形特徵與第一標誌資料庫110之複數個標誌L 1至L N的圖形特徵資料的相似程度自複數個標誌L 1至L N中選取目標標誌;
S340: 第一處理器150根據目標標誌所對應之目標格式模板將目標影像IMG1分為複數個影像子區塊S1至S5;
S350: 第一處理器150根據字詞資料庫120辨識影像子區塊S1至S5中的文字影像。
在步驟S310及S320中,影像擷取裝置130可擷取目標影像IMG1,而顯示螢幕140則可顯示影像擷取裝置130所擷取之目標影像IMG1。接著第一處理器150可計算取得目標影像IMG1之擷取標誌L C的圖形特徵,在本發明的部分實施例中,第一處理器150可透過計算擷取標誌L C的色彩灰階分布,對擷取標誌L C進行邊界檢測,或利用尺度不變特徵轉換的運算,亦或是其他的影像處理演算法來取得擷取標誌L C的圖形特徵。
在步驟S330中,第一處理器150即可根據目標影像IMG1之擷取標誌L C的圖形特徵與第一標誌資料庫110之複數個標誌L 1至L N的圖形特徵資料的相似程度自複數個標誌L 1至L N中選取目標標誌。在步驟S340中,第一處理器150會根據目標標誌所對應之目標格式模板將目標影像IMG1分為複數個影像子區塊S1至S5。由於目標格式模板中會記錄各個影像子區塊所對應的內容類型,例如影像子區塊S1至S5可能分別用以紀錄寄件人、寄件地址、收件人、收件地址、收件人連絡電話的資訊,因此在步驟S350中,第一處理器150即可根據字詞資料庫120辨識影像子區塊S1至S5中的文字影像,並可根據每個影像子區塊所對應的內容選擇相關的字詞資料組來辨識影像子區塊S1至S5中的文字影像。
如此一來,方法300即能夠根據目標影像IMG1中的標誌取得目標影像IMG1可能所對應到的格式,並根據其對應的格式辨識不同欄位中的文字影像,進而能夠提高辨識文字影像的準確率。
此外,由於各個機構或商家所使用的表單可能不定時的更新,因此在本發明的部分實施例中,方法300還可包含第一處理器150根據辨識影像子區塊S1至S5中的文字影像的辨識結果更新第一標誌資料庫110中目標標誌所對應之目標格式模板的步驟。如此一來,即可保持第一標誌資料庫中的格式模板維持在最新的版本,而能夠有效的提升文字影像的辨識準確率。
第6圖為本發明一實施例之文字影像辨識系統200的操作方法400的流程圖,方法400可包含但不限於步驟S410至S420。
S410: 雲端主機260根據第一處理器150辨識影像子區塊S1至S5中的文字影像的辨識結果更新共用標誌資料庫270;
S420: 第二處理器280根據共用標誌資料庫270更新第二標誌資料庫290。
透過方法400,雲端主機260可根據文字影像辨識系統200之第一處理器150的辨識結果來更新共用標誌資料庫270,並使得第二處理器280能夠根據共用標誌資料庫270來更新第二標誌資料庫290。換言之,雲端主機260可根據每個處理器所得到的辨識結果來更新共用標誌資料庫270,並可將更新的內容及時地分享給各個處理器,因此能夠避免處理器因為使用舊的標誌資料庫而導致誤判的情況。
綜上所述,本發明所提供之文字影像辨識系統及文字影像辨識系統的操作方法能夠辨識包裹或郵件上的標誌,並進一步根據對應於其標誌之商家所慣用的表單格式將目標影像區分為不同的影像子區塊,再根據各個影像子區塊所對應的內容類型選擇適當的字詞資料組來辨識其影像子區塊內的文字影像,因此能夠較先前技術更加精準的辨識目標影像內的文字影像。 以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。
100、200 文字影像辨識系統 110 第一標誌資料庫 120 字詞資料庫 122 第一字詞資料組 124 第二字詞資料組 130 影像擷取裝置 140 顯示螢幕 150 第一處理器 L 1至L N標誌 O 包裹 B1至B5 資訊區塊 IMG1 目標影像 L C擷取標誌 S1至S5 影像子區塊 260 雲端主機 270 共用標誌資料庫 280 第二處理器 290 第二標誌資料庫 300、400 方法 S310至S350、S410至S420 步驟
第1圖為本發明一實施例之文字影像辨識系統的示意圖。 第2圖為物流公司所遞送之包裹的外觀。 第3圖為本發明一實施例之目標影像的示意圖。 第4圖為本發明另一實施例之文字影像辨識系統的示意圖 第5圖為本發明一實施例之第1圖或第4圖之文字影像辨識系統的操作方法的流程圖。 第6圖為本發明一實施例之第4圖之文字影像辨識系統的操作方法的流程圖。
300 方法 S310至S350 步驟

Claims (12)

  1. 一種文字影像辨識系統,包含: 一第一標誌資料庫,用以儲存複數個標誌的圖形特徵資料,及每一標誌所對應之一格式模板,該格式模板包含複數個特定資訊區塊所對應的內容及相對分布位置資訊; 一字詞資料庫; 一影像擷取裝置,用以擷取一目標影像; 一顯示螢幕,耦接於該影像擷取裝置,用以顯示該目標影像;及 一第一處理器,耦接於該影像擷取裝置、該顯示螢幕、該第一標誌資料庫及該字詞資料庫,該第一處理器用以: 根據該目標影像之一擷取標誌的圖形特徵與該第一標誌資料庫之該些標誌的圖形特徵資料的相似程度自該些標誌中選取一目標標誌; 根據該第一標誌資料庫中該目標標誌所對應之一目標格式模板將該目標影像區分為複數個影像子區塊;及 根據該字詞資料庫辨識該些影像子區塊中的文字影像。
  2. 如請求項1所述之文字影像辨識系統,其中該些影像子區塊包含一收件人地址區塊及一收件人姓名區塊。
  3. 如請求項2所述之文字影像辨識系統,其中該字詞資料庫包含與地址相關之一第一字詞資料組,及該第一處理器係根據該第一字詞資料組辨識該收件人地址區塊內的文字。
  4. 如請求項2或3所述之文字影像辨識系統,其中該字詞資料庫包含與住戶姓名相關之一第二字詞資料組,及該第一處理器係根據該第二字詞資料組辨識該收件人姓名區塊內的文字。
  5. 如請求項1所述之文字影像辨識系統,該第一處理器另用以根據辨識該些影像子區塊中的文字影像的辨識結果更新該第一標誌資料庫中該目標標誌所對應之該目標格式模板。
  6. 如請求項1所述之文字影像辨識系統,另包含: 一雲端主機,用以根據該第一處理器辨識該些影像子區塊中的文字影像的辨識結果更新一共用標誌資料庫;及 一第二處理器,用以根據該共用標誌資料庫更新一第二標誌資料庫。
  7. 一種文字影像辨識系統的操作方法,該文字影像辨識系統包含一影像擷取裝置、一顯示螢幕、一第一處理器、一第一標誌資料庫及一字詞資料庫,該第一標誌資料庫儲存有複數個標誌的圖形特徵資料及每一標誌所對應之一格式模板,該格式模板包含複數個特定資訊區塊所對應的內容及相對分布位置資訊,該方法包含: 該影像擷取裝置擷取一目標影像; 該顯示螢幕顯示該目標影像; 該第一處理器根據該目標影像之一擷取標誌的圖形特徵與該第一標誌資料庫之該些標誌的圖形特徵資料的相似程度自該些標誌中選取一目標標誌; 該第一處理器根據該目標標誌所對應之一目標格式模板將該目標影像分為複數個影像子區塊;及 該第一處理器根據該字詞資料庫辨識該些影像子區塊中的文字影像。
  8. 如請求項7所述之方法,其中該些影像子區塊包含一收件人地址區塊及一收件人姓名區塊。
  9. 如請求項8所述之方法,其中該字詞資料庫包含與地址相關之一第一字詞資料組,及該第一處理器係根據該第一字詞資料組辨識該收件人地址區塊內的文字。
  10. 如請求項8或9所述之方法,其中該字詞資料庫包含與住戶姓名相關之一第二字詞資料組,及該第一處理器係根據該第二字詞資料組辨識該收件人姓名區塊內的文字。
  11. 如請求項7所述之方法,另包含該第一處理器根據辨識該些影像子區塊中的文字影像的辨識結果更新該第一標誌資料庫中該目標標誌所對應之該目標格式模板。
  12. 如請求項7所述之方法,該文字影像辨識系統另包含一雲端主機及一第二處理器,該方法另包含: 該雲端主機根據該第一處理器辨識該些影像子區塊中的文字影像的辨識結果更新一共用標誌資料庫;及 一第二處理器根據該共用標誌資料庫更新一第二標誌資料庫。
TW105114280A 2016-05-09 2016-05-09 文字影像辨識系統及操作文字影像辨識系統的方法 TWI612480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW105114280A TWI612480B (zh) 2016-05-09 2016-05-09 文字影像辨識系統及操作文字影像辨識系統的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW105114280A TWI612480B (zh) 2016-05-09 2016-05-09 文字影像辨識系統及操作文字影像辨識系統的方法

Publications (2)

Publication Number Publication Date
TW201740308A TW201740308A (zh) 2017-11-16
TWI612480B true TWI612480B (zh) 2018-01-21

Family

ID=61022833

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105114280A TWI612480B (zh) 2016-05-09 2016-05-09 文字影像辨識系統及操作文字影像辨識系統的方法

Country Status (1)

Country Link
TW (1) TWI612480B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW429811U (en) * 1999-04-26 2001-04-11 Wu Fu Guo Fast distribution mail sorting device
TW200705955A (en) * 2005-07-21 2007-02-01 Inventec Appliances Corp Method for collecting business card data in mobile communication apparatus
US20080279454A1 (en) * 2007-05-07 2008-11-13 Lev Jeffrey A Slot in housing adapted to receive at least a portion of a printed paper item for optical character recognition
TW201145185A (en) * 2010-06-11 2011-12-16 Primax Electronics Ltd Business card recognizing system
CN102622592A (zh) * 2012-01-19 2012-08-01 北京友录在线科技发展有限公司 一种基于云技术的名片识别方法
US20130227037A1 (en) * 2012-02-27 2013-08-29 Damon Kyle Wayans Method and apparatus for implementing a business card application
CN103279743A (zh) * 2013-05-28 2013-09-04 深圳市中兴移动通信有限公司 一种名片识别的方法和装置
TW201346821A (zh) * 2011-12-19 2013-11-16 Intel Corp 智慧型裝置輔助商務
CN104243597A (zh) * 2014-09-25 2014-12-24 河南智业科技发展有限公司 一种基于wlan环境下的名片发放收集系统及方法
TW201537140A (zh) * 2014-03-31 2015-10-01 Gorilla Technology Inc 用於物件包裝之物件三維尺寸估測系統及方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW429811U (en) * 1999-04-26 2001-04-11 Wu Fu Guo Fast distribution mail sorting device
TW200705955A (en) * 2005-07-21 2007-02-01 Inventec Appliances Corp Method for collecting business card data in mobile communication apparatus
US20080279454A1 (en) * 2007-05-07 2008-11-13 Lev Jeffrey A Slot in housing adapted to receive at least a portion of a printed paper item for optical character recognition
TW201145185A (en) * 2010-06-11 2011-12-16 Primax Electronics Ltd Business card recognizing system
TW201346821A (zh) * 2011-12-19 2013-11-16 Intel Corp 智慧型裝置輔助商務
CN102622592A (zh) * 2012-01-19 2012-08-01 北京友录在线科技发展有限公司 一种基于云技术的名片识别方法
US20130227037A1 (en) * 2012-02-27 2013-08-29 Damon Kyle Wayans Method and apparatus for implementing a business card application
CN103279743A (zh) * 2013-05-28 2013-09-04 深圳市中兴移动通信有限公司 一种名片识别的方法和装置
TW201537140A (zh) * 2014-03-31 2015-10-01 Gorilla Technology Inc 用於物件包裝之物件三維尺寸估測系統及方法
CN104243597A (zh) * 2014-09-25 2014-12-24 河南智业科技发展有限公司 一种基于wlan环境下的名片发放收集系统及方法

Also Published As

Publication number Publication date
TW201740308A (zh) 2017-11-16

Similar Documents

Publication Publication Date Title
US10140511B2 (en) Building classification and extraction models based on electronic forms
JP5500480B2 (ja) 帳票認識装置及び帳票認識方法
US20140067631A1 (en) Systems and Methods for Processing Structured Data from a Document Image
US20140270536A1 (en) Systems and methods for classifying objects in digital images captured using mobile devices
JP6569532B2 (ja) 管理システム、リスト作成装置、リスト作成方法、管理方法及び管理用プログラム
US9098765B2 (en) Systems and methods for capturing and storing image data from a negotiable instrument
WO2000052645A1 (fr) Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document
US9031308B2 (en) Systems and methods for recreating an image using white space and check element capture
TWI751426B (zh) 影像處理系統、影像處理方法及程式產品
CN111695555B (zh) 一种基于题号的精准框题方法、装置、设备和介质
TWI725465B (zh) 影像處理系統、影像處理方法及程式產品
EP3065080A1 (en) Delivery processor and computer readable storage medium
US20140268250A1 (en) Systems and methods for receipt-based mobile image capture
CN110909740A (zh) 信息处理装置以及存储介质
CN110569818A (zh) 一种智能阅读学习方法
CN112668580A (zh) 一种文本识别方法、文本识别装置及终端设备
CN114581928A (zh) 一种表格识别方法及系统
JP2014026660A (ja) データ生成装置およびデータ生成方法
TWI612480B (zh) 文字影像辨識系統及操作文字影像辨識系統的方法
CN110991371A (zh) 一种基于坐标识别的智能阅读学习方法
JP5368141B2 (ja) データ生成装置およびデータ生成方法
CN112101356A (zh) 一种图片中特定文本的定位方法、装置及存储介质
CN110751140A (zh) 字符批量识别方法、装置和计算机设备
CN115019326B (zh) 档案录入系统、方法、装置以及存储介质
JP6390637B2 (ja) 管理装置、管理方法、および、管理装置用のプログラム