TWI775038B - 字元識別方法、裝置及電腦可讀取存儲介質 - Google Patents
字元識別方法、裝置及電腦可讀取存儲介質 Download PDFInfo
- Publication number
- TWI775038B TWI775038B TW109102249A TW109102249A TWI775038B TW I775038 B TWI775038 B TW I775038B TW 109102249 A TW109102249 A TW 109102249A TW 109102249 A TW109102249 A TW 109102249A TW I775038 B TWI775038 B TW I775038B
- Authority
- TW
- Taiwan
- Prior art keywords
- shadow
- document
- preset
- processed
- test
- Prior art date
Links
Images
Landscapes
- Holo Graphy (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
一種字元識別方法、裝置及電腦可讀取存儲介質,所述方法包括:將待處理文檔輸入至陰影預測模型,得到待處理文檔之陰影區域與陰影強度;判斷待處理文檔之陰影區域與陰影強度是否影響到待處理文檔之OCR辨識率;若待處理文檔之陰影區域與陰影強度影響到待處理文檔之OCR辨識率,則將待處理文檔輸入至陰影去除模型,以對待處理文檔進行陰影去除;對經過陰影去除處理之待處理文檔進行OCR識別;及若待處理文檔之陰影區域與陰影強度不會影響到所述待處理文檔之OCR辨識率,則直接對待處理文檔進行OCR識別。
Description
本發明涉及影像處理技術領域,尤其涉及一種字元識別方法、裝置及電腦可讀取存儲介質。
光學字元辨識(Optical Character Recognition,OCR)是指藉由影像處理與模式識別技術對光學字元進行識別,並將光學字元翻譯成電腦文字之過程。然而藉由手機、平板電腦等設備對檔進行掃描得來之檔影像常常出現陰影遮擋檔之問題,檔影像較容易受到陰影干擾而導致OCR辨識率下降。
有鑑於此,有必要提供一種字元識別方法、裝置及電腦可讀取存儲介質,可判斷文檔是否受到陰影影響以確定是否對文檔進行陰影去除,可有效提升文檔OCR辨識率。
本發明一實施方式提供一種字元識別方法,應用於電子裝置,所述方法包括:將待處理文檔輸入至陰影預測模型,得到所述待處理文檔之陰影區域與陰影強度;判斷所述待處理文檔之陰影區域與陰影強度是否影響到所述待處理文檔之OCR辨識率;若所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率,則將所述待處理文檔輸入至陰影去除模型,以對
所述待處理文檔進行陰影去除;對經過陰影去除處理之待處理文檔進行OCR識別;及若所述待處理文檔之陰影區域與陰影強度不會影響到所述待處理文檔之OCR辨識率,則直接對所述待處理文檔進行OCR識別。
本發明一實施方式還提供一種字元識別裝置,所述裝置包括處理器及記憶體,所述記憶體上存儲有複數電腦程式,所述處理器用於執行所述記憶體中存儲之電腦程式時實現上述字元識別方法之步驟。
本發明一實施方式還提供一種電腦可讀取存儲介質,所述電腦可讀取存儲介質存儲有多條指令,多條所述指令可被一個或者多個處理器執行,以實現上述之字元識別方法之步驟。
與習知技術相比,上述字元識別方法、裝置及電腦可讀取存儲介質,可藉由判斷文檔是否受到陰影影響以確定是否對文檔進行陰影去除,採用陰影預測模型及陰影去除模型實現對文檔上之陰影進行去除,可有效提升文檔OCR辨識率。
10:記憶體
20:處理器
30:字元識別程式
100:字元識別裝置
101:陰影預測模組
102:判斷模組
103:陰影處理模組
104:識別模組
S300~S308:步驟
圖1是本發明一實施方式之字元識別裝置之功能模組圖。
圖2是本發明一實施方式之字元識別程式之功能模組圖。
圖3是本發明一實施方式之字元識別方法之步驟流程圖。
請參閱圖1,為本發明字元識別裝置較佳實施例之示意圖。
所述字元識別裝置100包括記憶體10、處理器20及存儲於所述記憶體10中並可於所述處理器20上運行之字元識別程式30。所述處理器20執行所述字元識別程式30時實現字元識別方法實施例中之步驟,例如圖3所示之步
驟S300~S308。或者,所述處理器20執行所述字元識別程式30時實現字元識別程式實施例中各模組之功能,例如圖2中之模組101~104。
所述字元識別程式30可被分割成一個或多個模組,所述一個或者多個模組被存儲於所述記憶體10中,並由所述處理器20執行,以完成本發明。所述一個或多個模組可是能夠完成特定功能之一系列電腦程式指令段,所述指令段用於描述所述字元識別程式30於所述字元識別裝置100中之執行過程。例如,所述字元識別程式30可被分割成圖2中之陰影預測模組101、判斷模組102、陰影處理模組103及識別模組104。各模組具體功能參見下圖2中各模組之功能。
本領域技術人員可理解,所述示意圖僅是字元識別裝置100之示例,並不構成對字元識別裝置100之限定,可包括比圖示更多或更少之部件,或者組合某些部件,或者不同之部件,例如所述字元識別裝置100還可包括顯示裝置、匯流排等。
所稱處理器20可是中央處理單元(Central Processing Unit,CPU),還可是其他通用處理器、數位訊號處理器(Digital Signal Processor,DSP)、專用積體電路(Application Specific Integrated Circuit,ASIC)、現成可程式設計閘陣列(Field-Programmable Gate Array,FPGA)或者其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件等。通用處理器可是微處理器或者所述處理器20亦可是任何常規之處理器等,所述處理器20可利用各種介面與匯流排連接字元識別裝置100之各個部分。
所述記憶體10可用於存儲所述字元識別程式30與/或模組,所述處理器20藉由運行或執行存儲於所述記憶體10內之電腦程式與/或模組,以及調用存儲於記憶體10內之資料,實現所述字元識別裝置100之各種功能。所述記憶體10可包括高速隨機存取記憶體,還可包括非易失性記憶體,例如硬碟機、
記憶體、插接式硬碟機,智慧存儲卡(Smart Media Card,SMC),安全數位(Secure Digital,SD)卡,快閃記憶體卡(Flash Card)、至少一個磁碟記憶體件、快閃記憶體器件、或其他非易失性固態記憶體件。
圖2為本發明字元識別程式較佳實施例之功能模組圖。
參閱圖2所示,字元識別程式30可包括陰影預測模組101、判斷模組102、陰影處理模組103及識別模組104。於一實施方式中,上述模組可為存儲於所述記憶體10中且可被所述處理器20調用執行之可程式化軟體指令。可理解之是,於其他實施方式中,上述模組亦可為固化於所述處理器20中之程式指令或固件(firmware)。
所述陰影預測模組101用於將待處理文檔輸入至陰影預測模型,得到所述待處理文檔之陰影區域與陰影強度。
於一實施方式中,所述待處理文檔可是指需進行字元識別之文檔,所述待處理文檔之獲取方式可是掃描、拍攝等,於此不作限定。
於一實施方式中,所述陰影預測模型可基於樣本庫中之多個樣本文檔訓練得到,比如,所述陰影預測模型由樣本庫中之多個樣本文檔對預設深度學習網路進行訓練得到。所述陰影預測模型優選藉由有監督學習方式訓練得到,所述預設深度學習網路所採用之深度學習演算法可根據實際需求進行選定,比如可採用卷積神經網路演算法、迴圈神經網路演算法、BP神經網路演算法等。所述樣本庫可是於模型訓練前藉由預設方式建立,比如可藉由人工收集/構建多張樣本文檔並存儲於一指定之存儲區域,以建立所述樣本庫。所述樣本庫中之樣本文檔優選包括多張有陰影之樣本文檔及多張無陰影之樣本文檔。
於一實施方式中,所述樣本文檔之訓練特徵可包括背景顏色、陰影區域及陰影強度,亦可僅包括陰影區域與陰影強度。當訓練特徵包括背景顏色、陰影區域及陰影強度時,訓練得到之陰影預測模型可用於提取文檔之背景
顏色、陰影區域及陰影強度。所述有陰影之樣本文檔中之陰影可由預設陰影添加軟體所添加,進而方便訓練特徵之提取。比如,模型構建人員可利用預設陰影添加軟體對多個文檔進行陰影添加以得到多個有陰影之樣本文檔。該預設陰影添加軟體可根據實際使用需求進行選定,於此不作限定。
於一實施方式中,所述預設深度學習網路可包括輸入層、多個隱藏層及輸出層。可藉由以下方式訓練得到所述陰影預測模型:a.隨機將樣本庫中之多個樣本文檔劃分為訓練集及測試集,訓練集之圖片數量優選大於測試集之圖片數量,比如將80%之樣本文檔劃分為訓練集,將20%之樣本文檔劃分為測試集;b.利用所述訓練集對所述預設深度學習網路進行訓練及利用所述測試集對訓練得到之陰影預測模型進行測試;c.根據測試集中之每一測試圖片之測試結果統計得到一模型預測準確率;d.判斷所述模型預測準確率是否符合預設測試要求;e.若所述模型預測準確率符合預設測試要求,則完成對所述預設深度學習網路之訓練,當前訓練得到之陰影預測模型滿足使用需求;f.若所述模型預測準確率不符合預設測試要求,則調整所述預設深度學習網路之參數,並利用所述訓練集重新對調整後之預設深度學習網路進行訓練,直到測試集驗證得到之模型預測準確率符合所述預設測試要求。
舉例而言,所述預設深度學習網路為神經網路,所述預設深度學習網路之參數可包括總層數、每一層之神經元數等,所述調整預設深度學習網路之參數可是調整所述預設深度學習網路之總層數與/或每一層之神經元數。
可理解當所述模型預測準確率符合預設測試要求時,表明此模型預測效果較好,可滿足使用需求,可將當前訓練得到之陰影預測模型作為最終使用之陰影預測模型;當所述模型預測準確率不符合預設測試要求時,表明此模
型預測效果不好,需要進行改善,此時可調整預設深度學習網路之參數,並利用所述訓練集重新對調整後之預設深度學習網路進行訓練,並再次利用所述測試集對重新訓練得到之陰影預測模型進行測試得到一新之模型預測準確率,再判斷該新之模型預測準確率是否符合預設測試要求,若符合,則表明重新訓練得到之陰影預測模型預測效果較好,可滿足使用需求,可將重新訓練得到之陰影預測模型作為最終使用之陰影預測模型;如果該新之模型預測準確率仍然不符合預設測試要求,需要再次重複上述調整與訓練之步驟直至藉由測試集得到之模型預測準確率符合預設測試要求。
於一實施方式中,所述預設測試要求可根據實際使用需求進行設定,例如所述預設測試要求可是測試準確率需達到95%。
於一實施方式中,當訓練得到所述陰影預測模型後,所述陰影預測模組101可將待處理文檔輸入至陰影預測模型,所述陰影預測模型可輸出所述待處理文檔之陰影區域與陰影強度。
所述判斷模組102用於判斷所述待處理文檔之陰影區域與陰影強度是否影響到所述待處理文檔之OCR辨識率。
於一實施方式中,當所述陰影預測模組101得到所述待處理文檔之陰影區域與陰影強度時,所述判斷模組102可將所述待處理文檔之陰影區域與陰影強度分別與對應之基準閾值進行比較,來判斷所述待處理文檔之陰影區域與陰影強度是否影響到所述待處理文檔之OCR辨識率。
舉例而言,預先為陰影區域對應設置有第一基準閾值,為陰影強度對應設置有第二基準閾值。當所述待處理文檔之陰影區域大於所述第一基準閾值且所述待處理文檔之陰影強度大於所述第二基準閾值時,判斷模組102判定所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率。所述第一基準閾值與所述第二基準閾值可根據實際文字辨識需求進行設定,於
此不作限定。
所述陰影處理模組103用在於所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率時,將所述待處理文檔輸入至陰影去除模型,以對所述待處理文檔進行陰影去除。
於一實施方式中,當判斷模組102判定所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率時,所述陰影處理模組103可將所述待處理文檔輸入至陰影去除模型,以藉由所述陰影去除模型對所述待處理文檔進行陰影去除。
於一實施方式中,所述陰影去除模型可藉由以下方式訓練得到:a.利用所述陰影預測模型提取得到所述樣本庫中每一樣本文檔之背景顏色、陰影區域及陰影強度,可僅對有陰影之樣本文檔進行提取操作;b.將所述陰影預測模型提取得到之每一所述樣本文檔之背景顏色、陰影區域及陰影強度輸入至預設陰影去除網路,以訓練得到一中間處理模型;c.利用所述中間處理模型對預設測試集中之多個測試文檔進行陰影去除,並統計得到對經過陰影處理後之多個測試文檔進行OCR識別之之平均OCR辨識率;d.判斷所述平均OCR辨識率是否大於預設辨識率;e.若所述平均OCR辨識率大於所述預設辨識率時,則可將訓練得到之中間處理模型作為所述陰影去除模型。
於一實施方式中,所述預設陰影去除網路可是習知之基於深度學習演算法訓練得到之具有陰影去除功能之網路。所述中間處理模型之訓練過程可根據實際需求進行設定,比如可參照陰影預測模型之訓練方式進行訓練,於此不再陳述。當訓練得到中間處理模型,該中間處理模型可基於文檔之背景顏色、陰影區域及陰影強度進行陰影去除,或者基於文檔之陰影區域及陰影強度
進行陰影去除。
於一實施方式中,所述預設測試集中之多個測試文檔優選為具有陰影之文檔。該多個測試文檔可來源於所述樣本庫,亦可由預設陰影添加軟體所添加。當訓練得到中間模型時,可利用所述中間處理模型對預設測試集中之多個測試文檔進行陰影去除,並統計得到對經過陰影處理後之多個測試文檔進行OCR識別之平均OCR辨識率。
可理解當多個測試文檔經過陰影去除後,可統計得到每一經過陰影處理後之測試文檔之OCR辨識率,再根據該多個OCR辨識率可計算得到所述平均OCR辨識率。
於一實施方式中,所述預設辨識率可根據實際使用需求進行設定,比如所述預設辨識率可設定為字元識別準確性為98%。
於一實施方式中,當所述平均OCR辨識率大於所述預設辨識率時,表明此中間處理模型之陰影去除效果較好,可滿足使用需求,可將訓練得到之中間處理模型作為陰影去除模型。
於一實施方式中,當所述平均OCR辨識率不大於所述預設辨識率時,表明此中間處理模型之陰影去除效果不太理想,經過陰影處理後之文檔之OCR辨識率較低,此時,可調整所述預設陰影去除網路之網路參數(比如預設陰影去除網路之隱藏層之層數),再將所述陰影預測模型提取得到之每一所述樣本文檔之背景顏色、陰影區域及陰影強度重新輸入至調整後之預設陰影去除網路進行重新訓練,以重新訓練得到一中間處理模型,再利用重新訓練得到之中間處理模型對預設測試集中之多個測試文檔進行陰影去除,以重新統計得到平均OCR辨識率。若重新統計得到之平均OCR辨識率大於所述預設辨識率時,則可將重新訓練得到之中間處理模型作為所述陰影去除模型。若重新統計得到之平均OCR辨識率仍然不大於所述預設辨識率時,則需要再次重複上述調整與
訓練之步驟直至重新統計得到之平均OCR辨識率大於所述預設辨識率。
於一實施方式中,藉由所述陰影預測模型可得到所述待處理文檔之背景顏色、陰影區域與陰影強度,所述陰影去除模型可根據所述待處理文檔之背景顏色、陰影區域及陰影強度對所述待處理文檔進行陰影去除。於本申請之其他實施方式中,所述陰影去除模型亦可根據所述待處理文檔陰影區域及陰影強度對所述待處理文檔進行陰影去除。
所述識別模組104用於對經過陰影去除處理之待處理文檔進行OCR識別。
於一實施方式中,當所述待處理文檔進行陰影去除處理後,所述識別模組104可對處理後之待處理文檔進行OCR識別,進而可提高待處理文檔之OCR辨識率。
於一實施方式中,若判斷模組102判斷所述待處理文檔之陰影區域與陰影強度不會影響到所述待處理文檔之OCR辨識率,表明所述待處理文檔無需進行陰影去除處理,所述識別模組104可直接對所述待處理文檔進行OCR識別。
請參閱圖3,為本發明一實施例中字元識別方法之流程圖。所述字元識別方法可應用於字元識別裝置100中。根據不同之需求,所述流程圖中步驟之順序可改變,某些步驟可省略。
步驟S300,將待處理文檔輸入至陰影預測模型,得到所述待處理文檔之陰影區域與陰影強度。
於一實施方式中,所述待處理文檔可是指需進行字元識別之文檔,所述待處理文檔之獲取方式可是掃描、拍攝等,於此不作限定。
於一實施方式中,所述陰影預測模型可基於樣本庫中之多個樣本文檔訓練得到,比如,所述陰影預測模型由樣本庫中之多個樣本文檔對預設深
度學習網路進行訓練得到。所述陰影預測模型優選藉由有監督學習方式訓練得到,所述預設深度學習網路所採用之深度學習演算法可根據實際需求進行選定,比如可採用卷積神經網路演算法、迴圈神經網路演算法、BP神經網路演算法等。所述樣本庫可是於模型訓練前藉由預設方式建立,比如可藉由人工收集/構建多張樣本文檔並存儲於一指定之存儲區域,以建立所述樣本庫。所述樣本庫中之樣本文檔優選包括多張有陰影之樣本文檔及多張無陰影之樣本文檔。
於一實施方式中,所述樣本文檔之訓練特徵可包括背景顏色、陰影區域及陰影強度,亦可僅包括陰影區域與陰影強度。當訓練特徵包括背景顏色、陰影區域及陰影強度時,訓練得到之陰影預測模型可用於提取文檔之背景顏色、陰影區域及陰影強度。所述有陰影之樣本文檔中之陰影可由預設陰影添加軟體所添加,進而方便訓練特徵之提取。比如,模型構建人員可利用預設陰影添加軟體對多個文檔進行陰影添加以得到多個有陰影之樣本文檔。該預設陰影添加軟體可根據實際使用需求進行選定,於此不作限定。
於一實施方式中,所述預設深度學習網路可包括輸入層、多個隱藏層及輸出層。可藉由以下方式訓練得到所述陰影預測模型:a.隨機將樣本庫中之多個樣本文檔劃分為訓練集及測試集,訓練集之圖片數量優選大於測試集之圖片數量,比如將80%之樣本文檔劃分為訓練集,將20%之樣本文檔劃分為測試集;b.利用所述訓練集對所述預設深度學習網路進行訓練及利用所述測試集對訓練得到之陰影預測模型進行測試;c.根據測試集中之每一測試圖片之測試結果統計得到一模型預測準確率;d.判斷所述模型預測準確率是否符合預設測試要求;e.若所述模型預測準確率符合預設測試要求,則完成對所述預設深度學習網路之訓練,當前訓練得到之陰影預測模型滿足使用需求;
f.若所述模型預測準確率不符合預設測試要求,則調整所述預設深度學習網路之參數,並利用所述訓練集重新對調整後之預設深度學習網路進行訓練,直到測試集驗證得到之模型預測準確率符合所述預設測試要求。
舉例而言,所述預設深度學習網路為神經網路,所述預設深度學習網路之參數可包括總層數、每一層之神經元數等,所述調整預設深度學習網路之參數可是調整所述預設深度學習網路之總層數與/或每一層之神經元數。
可理解當所述模型預測準確率符合預設測試要求時,表明此模型預測效果較好,可滿足使用需求,可將當前訓練得到之陰影預測模型作為最終使用之陰影預測模型;當所述模型預測準確率不符合預設測試要求時,表明此模型預測效果不好,需要進行改善,此時可調整預設深度學習網路之參數,並利用所述訓練集重新對調整後之預設深度學習網路進行訓練,並再次利用所述測試集對重新訓練得到之陰影預測模型進行測試得到一新之模型預測準確率,再判斷該新之模型預測準確率是否符合預設測試要求,若符合,則表明重新訓練得到之陰影預測模型預測效果較好,可滿足使用需求,可將重新訓練得到之陰影預測模型作為最終使用之陰影預測模型;如果該新之模型預測準確率仍然不符合預設測試要求,需要再次重複上述調整與訓練之步驟直至藉由測試集得到之模型預測準確率符合預設測試要求。
於一實施方式中,所述預設測試要求可根據實際使用需求進行設定,例如所述預設測試要求可是測試準確率需達到95%。
於一實施方式中,當訓練得到所述陰影預測模型後,可將待處理文檔輸入至陰影預測模型,所述陰影預測模型可輸出所述待處理文檔之陰影區域與陰影強度。
步驟S302,判斷所述待處理文檔之陰影區域與陰影強度是否影響到所述待處理文檔之OCR辨識率。
於一實施方式中,當預測得到所述待處理文檔之陰影區域與陰影強度時,可將所述待處理文檔之陰影區域與陰影強度分別與對應之基準閾值進行比較,來判斷所述待處理文檔之陰影區域與陰影強度是否影響到所述待處理文檔之OCR辨識率。
舉例而言,預先為陰影區域對應設置有第一基準閾值,為陰影強度對應設置有第二基準閾值。當所述待處理文檔之陰影區域大於所述第一基準閾值且所述待處理文檔之陰影強度大於所述第二基準閾值時,判定所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率。所述第一基準閾值與所述第二基準閾值可根據實際文字辨識需求進行設定,於此不作限定。
步驟S304,若所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率時,則將所述待處理文檔輸入至陰影去除模型,以對所述待處理文檔進行陰影去除。
於一實施方式中,當所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率時,可將所述待處理文檔輸入至陰影去除模型,以藉由所述陰影去除模型對所述待處理文檔進行陰影去除。
於一實施方式中,所述陰影去除模型可藉由以下方式訓練得到:a.利用所述陰影預測模型提取得到所述樣本庫中每一樣本文檔之背景顏色、陰影區域及陰影強度,可僅對有陰影之樣本文檔進行提取操作;b.將所述陰影預測模型提取得到之每一所述樣本文檔之背景顏色、陰影區域及陰影強度輸入至預設陰影去除網路,以訓練得到一中間處理模型;c.利用所述中間處理模型對預設測試集中之多個測試文檔進行陰影去除,並統計得到對經過陰影處理後之多個測試文檔進行OCR識別之之平均OCR辨識率;
d.判斷所述平均OCR辨識率是否大於預設辨識率;e.若所述平均OCR辨識率大於所述預設辨識率時,則可將訓練得到之中間處理模型作為所述陰影去除模型。
於一實施方式中,所述預設陰影去除網路可是習知之基於深度學習演算法訓練得到之具有陰影去除功能之網路。所述中間處理模型之訓練過程可根據實際需求進行設定,比如可參照陰影預測模型之訓練方式進行訓練,於此不再陳述。當訓練得到中間處理模型,該中間處理模型可基於文檔之背景顏色、陰影區域及陰影強度進行陰影去除,或者基於文檔之陰影區域及陰影強度進行陰影去除。
於一實施方式中,所述預設測試集中之多個測試文檔優選為具有陰影之文檔。該多個測試文檔可來源於所述樣本庫,亦可由預設陰影添加軟體所添加。當訓練得到中間模型時,可利用所述中間處理模型對預設測試集中之多個測試文檔進行陰影去除,並統計得到對經過陰影處理後之多個測試文檔進行OCR識別之平均OCR辨識率。
可理解當多個測試文檔經過陰影去除後,可統計得到每一經過陰影處理後之測試文檔之OCR辨識率,再根據該多個OCR辨識率可計算得到所述平均OCR辨識率。
於一實施方式中,所述預設辨識率可根據實際使用需求進行設定,比如所述預設辨識率可設定為字元識別準確性為98%。
於一實施方式中,當所述平均OCR辨識率大於所述預設辨識率時,表明此中間處理模型之陰影去除效果較好,可滿足使用需求,可將訓練得到之中間處理模型作為陰影去除模型。
於一實施方式中,當所述平均OCR辨識率不大於所述預設辨識率時,表明此中間處理模型之陰影去除效果不太理想,經過陰影處理後之文檔之
OCR辨識率較低,此時,可調整所述預設陰影去除網路之網路參數(比如預設陰影去除網路之隱藏層之層數),再將所述陰影預測模型提取得到之每一所述樣本文檔之背景顏色、陰影區域及陰影強度重新輸入至調整後之預設陰影去除網路進行重新訓練,以重新訓練得到一中間處理模型,再利用重新訓練得到之中間處理模型對預設測試集中之多個測試文檔進行陰影去除,以重新統計得到平均OCR辨識率。若重新統計得到之平均OCR辨識率大於所述預設辨識率時,則可將重新訓練得到之中間處理模型作為所述陰影去除模型。若重新統計得到之平均OCR辨識率仍然不大於所述預設辨識率時,則需要再次重複上述調整與訓練之步驟直至重新統計得到之平均OCR辨識率大於所述預設辨識率。
於一實施方式中,藉由所述陰影預測模型可得到所述待處理文檔之背景顏色、陰影區域與陰影強度,所述陰影去除模型可根據所述待處理文檔之背景顏色、陰影區域及陰影強度對所述待處理文檔進行陰影去除。於本申請之其他實施方式中,所述陰影去除模型亦可根據所述待處理文檔陰影區域及陰影強度對所述待處理文檔進行陰影去除。
步驟S306,對經過陰影去除處理之待處理文檔進行OCR識別。
於一實施方式中,當所述待處理文檔進行陰影去除處理後,可對處理後之待處理文檔進行OCR識別,進而可提高待處理文檔之OCR辨識率。
步驟S308,若所述待處理文檔之陰影區域與陰影強度不會影響到所述待處理文檔之OCR辨識率,則直接對所述待處理文檔進行OCR識別。
於一實施方式中,若所述待處理文檔之陰影區域與陰影強度不會影響到所述待處理文檔之OCR辨識率,表明所述待處理文檔無需進行陰影去除處理,可直接對所述待處理文檔進行OCR識別。
上述字元識別方法、裝置及電腦可讀取存儲介質,可藉由判斷文檔是否受到陰影影響以確定是否對文檔進行陰影去除,採用陰影預測模型及陰
影去除模型實現對文檔上之陰影進行去除,可有效提升文檔OCR辨識率。
綜上所述,本發明符合發明專利要件,爰依法提出專利申請。惟,以上所述者僅為本發明之較佳實施方式,本發明之範圍並不以上述實施方式為限,舉凡熟悉本案技藝之人士爰依本發明之精神所作之等效修飾或變化,皆應涵蓋於以下申請專利範圍內。
S300~S308:步驟
Claims (8)
- 一種字元識別方法,應用於電子裝置,所述方法包括:將待處理文檔輸入至陰影預測模型,得到所述待處理文檔之陰影區域與陰影強度;判斷所述待處理文檔之陰影區域是否大於第一基準閾值及所述待處理文檔之陰影強度是否大於第二基準閾值,以確定所述待處理文檔之陰影區域與陰影強度是否影響到所述待處理文檔之OCR辨識率;若所述待處理文檔之陰影區域與陰影強度影響到所述待處理文檔之OCR辨識率,則將所述待處理文檔輸入至陰影去除模型,以對所述待處理文檔進行陰影去除;對經過陰影去除處理之待處理文檔進行OCR識別;及若所述待處理文檔之陰影區域與陰影強度不會影響到所述待處理文檔之OCR辨識率,則直接對所述待處理文檔進行OCR識別;其中,所述陰影預測模型基於樣本庫中之多張有陰影之樣本文檔及多張無陰影之樣本文檔對預設深度學習網路進行訓練得到,每一所述樣本文檔之訓練特徵包括背景顏色、陰影區域及陰影強度。
- 如請求項1所述之字元識別方法,其中所述有陰影之樣本文檔由預設陰影添加軟體在所述無陰影之樣本文檔添加陰影得到。
- 如請求項1所述之字元識別方法,其中所述基於樣本庫中之多個樣本文檔對預設深度學習網路進行訓練得到所述陰影預測模型之步驟包括:將所述樣本庫中之多個樣本文檔劃分為訓練集及測試集;利用所述訓練集對所述預設深度學習網路進行訓練及利用所述測試集對訓練得到之陰影預測模型進行測試;及若所述測試集之測試結果符合預設測試要求,則結束對所述預設深度學習 網路之訓練。
- 如請求項3所述之字元識別方法,還包括:若所述測試集之測試結果不符合所述預設測試要求,則調整所述預設深度學習網路之參數;利用所述訓練集重新對調整後之預設深度學習網路進行訓練及利用所述測試集對重新訓練得到之陰影預測模型進行測試;若重新訓練得到之陰影預測模型之測試結果符合所述預設測試要求,則結束對所述預設深度學習網路之訓練;及若重新訓練得到之陰影預測模型之測試結果不符合所述預設測試要求,則重複上述調整與訓練步驟直至藉由所述測試集得到之測試結果符合所述預設測試要求。
- 如請求項1所述之字元識別方法,其中所述陰影去除模型之訓練步驟包括:將所述陰影預測模型提取得到之每一所述樣本文檔之背景顏色、陰影區域及陰影強度輸入至預設陰影去除網路,以訓練得到一中間處理模型;利用所述中間處理模型對預設測試集中之多個測試文檔進行陰影去除,並統計得到對經過陰影去除處理後之多個測試文檔進行OCR識別之平均OCR辨識率,其中所述預設測試集中之多個測試文檔為具有陰影之文檔;判斷所述平均OCR辨識率是否大於預設辨識率;若所述平均OCR辨識率大於所述預設辨識率,則將訓練得到之中間處理模型作為所述陰影去除模型。
- 如請求項5所述之字元識別方法,其中所述判斷所述平均OCR辨識率是否大於預設辨識率之步驟之後還包括:若所述平均OCR辨識率不大於所述預設辨識率,則調整所述預設陰影去除 網路之網路參數;及將所述陰影預測模型提取得到之每一所述樣本文檔之背景顏色、陰影區域及陰影強度重新輸入至調整後之預設陰影去除網路,以重新訓練得到一中間處理模型。
- 一種字元識別裝置,所述裝置包括處理器及記憶體,所述記憶體上存儲有複數電腦程式,所述處理器用於執行記憶體中存儲之電腦程式時實現如請求項1至6中任一項所述之字元識別方法之步驟。
- 一種電腦可讀取存儲介質,所述電腦可讀取存儲介質存儲有多條指令,多條所述指令可被一個或者多個處理器執行,以實現如請求項1至6中任一項所述之字元識別方法之步驟。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109102249A TWI775038B (zh) | 2020-01-21 | 2020-01-21 | 字元識別方法、裝置及電腦可讀取存儲介質 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109102249A TWI775038B (zh) | 2020-01-21 | 2020-01-21 | 字元識別方法、裝置及電腦可讀取存儲介質 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202129540A TW202129540A (zh) | 2021-08-01 |
TWI775038B true TWI775038B (zh) | 2022-08-21 |
Family
ID=78282747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109102249A TWI775038B (zh) | 2020-01-21 | 2020-01-21 | 字元識別方法、裝置及電腦可讀取存儲介質 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI775038B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI775634B (zh) * | 2021-10-07 | 2022-08-21 | 博相科技股份有限公司 | 英文字體影像辨識方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201447773A (zh) * | 2013-06-13 | 2014-12-16 | Univ Nat Yunlin Sci & Tech | 車牌辨識方法及其手持式電子裝置 |
CN107977671A (zh) * | 2017-10-27 | 2018-05-01 | 浙江工业大学 | 一种基于多任务卷积神经网络的舌象分类方法 |
WO2018207334A1 (ja) * | 2017-05-12 | 2018-11-15 | 日本電気株式会社 | 画像認識装置、画像認識方法および画像認識プログラム |
CN110674815A (zh) * | 2019-09-29 | 2020-01-10 | 四川长虹电器股份有限公司 | 基于深度学习关键点检测的发票图像畸变校正方法 |
-
2020
- 2020-01-21 TW TW109102249A patent/TWI775038B/zh active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201447773A (zh) * | 2013-06-13 | 2014-12-16 | Univ Nat Yunlin Sci & Tech | 車牌辨識方法及其手持式電子裝置 |
WO2018207334A1 (ja) * | 2017-05-12 | 2018-11-15 | 日本電気株式会社 | 画像認識装置、画像認識方法および画像認識プログラム |
CN107977671A (zh) * | 2017-10-27 | 2018-05-01 | 浙江工业大学 | 一种基于多任务卷积神经网络的舌象分类方法 |
CN110674815A (zh) * | 2019-09-29 | 2020-01-10 | 四川长虹电器股份有限公司 | 基于深度学习关键点检测的发票图像畸变校正方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202129540A (zh) | 2021-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8867828B2 (en) | Text region detection system and method | |
WO2019051941A1 (zh) | 车型识别方法、装置、设备及计算机可读存储介质 | |
CN108280332B (zh) | 移动终端的生物特征认证识别检测方法、装置和设备 | |
JP2015215876A (ja) | ライブネス検査方法と装置、及び映像処理方法と装置 | |
US20200125836A1 (en) | Training Method for Descreening System, Descreening Method, Device, Apparatus and Medium | |
CN113221601B (zh) | 字符识别方法、装置及计算机可读存储介质 | |
CN110765843B (zh) | 人脸验证方法、装置、计算机设备及存储介质 | |
Hilles et al. | Latent fingerprint enhancement and segmentation technique based on hybrid edge adaptive dtv model | |
Mazumdar et al. | Universal image manipulation detection using deep siamese convolutional neural network | |
JP7121132B2 (ja) | 画像処理方法、装置及び電子機器 | |
TWI775038B (zh) | 字元識別方法、裝置及電腦可讀取存儲介質 | |
CN108960246B (zh) | 一种用于图像识别的二值化处理装置及方法 | |
CN110232381B (zh) | 车牌分割方法、装置、计算机设备及计算机可读存储介质 | |
CN115410281A (zh) | 电子签名识别方法、装置、设备及存储介质 | |
CN115546105A (zh) | 一种轮胎花纹检测方法、装置、可读存储介质及终端设备 | |
CN113239738B (zh) | 一种图像的模糊检测方法及模糊检测装置 | |
CN111986176B (zh) | 一种裂纹图像识别方法、系统、终端及可读存储介质 | |
CN113222826A (zh) | 文档阴影去除方法及装置 | |
CN111539258B (zh) | 虹膜图像识别方法、虹膜图像识别装置及存储介质 | |
TWI775039B (zh) | 文檔陰影去除方法及裝置 | |
CN112308061A (zh) | 一种车牌字符排序方法、识别方法及装置 | |
Vera et al. | Iris recognition algorithm on BeagleBone Black | |
CN111352827A (zh) | 一种自动化测试的方法及装置 | |
CN110956190A (zh) | 图像识别方法及装置、计算机装置和计算机可读存储介质 | |
CN112395981B (zh) | 一种基于指静脉图像的认证方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent |