TW202407646A - 文字圖像辨識系統及其方法 - Google Patents

文字圖像辨識系統及其方法 Download PDF

Info

Publication number
TW202407646A
TW202407646A TW111130403A TW111130403A TW202407646A TW 202407646 A TW202407646 A TW 202407646A TW 111130403 A TW111130403 A TW 111130403A TW 111130403 A TW111130403 A TW 111130403A TW 202407646 A TW202407646 A TW 202407646A
Authority
TW
Taiwan
Prior art keywords
data
text
recognition
text data
image
Prior art date
Application number
TW111130403A
Other languages
English (en)
Other versions
TWI847218B (zh
Inventor
陳隆昇
馬子杰
陳裕興
Original Assignee
台灣大哥大股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 台灣大哥大股份有限公司 filed Critical 台灣大哥大股份有限公司
Priority to TW111130403A priority Critical patent/TWI847218B/zh
Priority claimed from TW111130403A external-priority patent/TWI847218B/zh
Publication of TW202407646A publication Critical patent/TW202407646A/zh
Application granted granted Critical
Publication of TWI847218B publication Critical patent/TWI847218B/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種文字圖像拆分系統,包含:一資料庫,儲存一初始文字資料、一第一數值資料、一第二數值資料以及複數個原始辨識文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料;以及一伺服器,存取該資料庫,該伺服器接收一初始圖像資料,該初始圖像資料包含一第一文字圖像資料以及一第二文字圖像資料;其中該伺服器120至少藉由該第一文字資料、該第二文字資料、該第一文字圖像資料、該第二文字圖像資料、該第一數值資料、該第二數值資料以及該複數個原始辨識文字資料,以判斷該初始圖像資料是否符合該初始文字資料。 。

Description

文字圖像辨識系統及其方法
本發明係關於一種文字圖像辨識系統及其方法,特別係關於一種可判斷文字圖像是否符合於其所對應之目標文字的文字圖像辨識系統及其方法。
傳統的文字圖像辨識系統(例如光學字元辨識Optical Character Recognition,OCR)系統雖可辨識圖像資料中的文字圖像,但卻難以準確的辨識出某些特殊的文字圖像(例如簽名字、手寫字等)。舉例而言,當使用者的簽名字較為潦草時,傳統的光學字元辨識往往無法正確判斷該簽名字是否符合使用者的姓名。有鑑於此,將需要一種對文字圖像具有較高的判斷正確率的文字圖像辨識系統及其方法。
為了解決上述問題,本發明之一構想在於提供一種對文字圖像具有較高的判斷正確率的文字圖像辨識系統及其方法。本發明之另一構想在於提供一種可判斷文字圖像是否符合於其所對應之目標文字的文字圖像辨識系統及其方法。
對文字圖像具有較高的判斷正確率的文字圖像辨識系統及其方法。
基於前揭構想,本發明提供一種文字圖像辨識系統,包含:一資料庫,儲存一初始文字資料、一第一數值資料、一第二數值資料以及複數個原始辨識文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料,該第一數值資料指示出一第一預定數值,該第二數值資料指示出一第二預定數值;以及一伺服器,存取該資料庫,該伺服器接收一第一初始圖像資料,該第一初始圖像資料包含一第一文字圖像資料以及一第二文字圖像資料;其中該伺服器包含;一文字辨識模組,基於該第一文字圖像資料以產生複數個第一機率資料,該複數個第一機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第一機率資料分別指示出其所對應之原始辨識文字資料符合於該第一文字圖像資料的機率,其中該文字辨識模組並基於該第二文字圖像資料以產生複數個第二機率資料,該複數個第二機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第二機率資料分別指示出其所對應之原始辨識文字資料符合於該第二文字圖像資料的機率;以及一處理模組,基於該複數個第一機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第一排名資料,該複數個第一排名資料分別關聯於該複數個原始辨識文字資料其中一者,其中該處理模組並基於該複數個第二機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第二排名資料,該複數個第二排名資料分別關聯於該複數個原始辨識文字資料其中一者;其中該處理模組基於該複數個第一排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第一辨識文字資料,該一至多個第一辨識文字資料的總數等於該第一預定數值,且該一至多個第一辨識文字資料所分別關聯的該第一排名資料皆小於或等於該第一預定數值;其中該處理模組基於該複數個第二排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第二辨識文字資料,該一至多個第二辨識文字資料的總數等於該第二預定數值,且該一至多個第二辨識文字資料所分別關聯的該第二排名資料皆小於或等於該第二預定數值;其中該處理模組至少基於該第一文字資料、該第二文字資料、該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料,以產生一判斷資料,該判斷資料指示出該第一初始圖像資料是否符合該初始文字資料。
於本發明之一較佳實施例中,該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,且該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
於本發明之一較佳實施例中,該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
於本發明之一較佳實施例中,該第一預定數值等於該第二預定數值。
於本發明之一較佳實施例中,該處理模組於獲得該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料之前,將該第一數值資料以及該第二數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值以及該第二預定數值。
於本發明之一較佳實施例中,該伺服器接收複數個第二初始圖像資料,該伺服器的該處理模組基於該複數個第二初始圖像資料符合於該初始文字資料的比率低於一門檻值,而產生一警示資料。
於本發明之一較佳實施例中,該資料庫儲存一第三數值資料,該第三數值資料指示出一第三預定數值;其中該初始文字資料包含一第三文字資料,該第一初始圖像資料包含一第三文字圖像資料;其中該文字辨識模組基於該第三文字圖像資料以產生複數個第三機率資料,該複數個第三機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第三機率資料分別指示出其所對應之原始辨識文字資料符合於該第三文字圖像資料的機率;其中該處理模組基於該複數個第三機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第三排名資料,該複數個第三排名資料分別關聯於該複數個原始辨識文字資料其中一者;其中該處理模組基於該複數個第三排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第三辨識文字資料,該一至多個第三辨識文字資料的總數等於該第三預定數值,且該一至多個第三辨識文字資料所分別關聯的該第三排名資料皆小於或等於該第三預定數值;其中該處理模組至少係基於該第一文字資料、該第二文字資料、該第三文字資料、該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料,以產生該判斷資料。
於本發明之一較佳實施例中,該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,且該第三文字資料符合於該一至多個第三辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
於本發明之一較佳實施例中,該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,或基於該第三文字資料不符合於該一至多個第三辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
於本發明之一較佳實施例中,該處理模組於獲得該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料之前,將該第一數值資料、該第二數值資料以及該第三數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值、該第二預定數值以及該第三預定數值。
根據本發明之目的,再提供一種文字圖像辨識方法,應用於一文字圖像辨識系統,該文字圖像辨識系統包含一資料庫以及一伺服器,該伺服器存取該資料庫;其中該資料庫儲存一初始文字資料、一第一數值資料、一第二數值資料以及複數個原始辨識文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料,該第一數值資料指示出一第一預定數值,該第二數值資料指示出一第二預定數值;其中該文字圖像辨識方法包含以下步驟:由該伺服器接收一第一初始圖像資料,其中該第一初始圖像資料包含一第一文字圖像資料以及一第二文字圖像資料;由該伺服器的一文字辨識模組基於該第一文字圖像資料以產生複數個第一機率資料,其中該複數個第一機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第一機率資料分別指示出其所對應之原始辨識文字資料符合於該第一文字圖像資料的機率;由該文字辨識模組基於該第二文字圖像資料以產生複數個第二機率資料,其中該複數個第二機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第二機率資料分別指示出其所對應之原始辨識文字資料符合於該第二文字圖像資料的機率;由該伺服器的一處理模組基於該複數個第一機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第一排名資料,其中該複數個第一排名資料分別關聯於該複數個原始辨識文字資料其中一者;由該處理模組基於該複數個第二機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第二排名資料,其中該複數個第二排名資料分別關聯於該複數個原始辨識文字資料其中一者;由該處理模組基於該複數個第一排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第一辨識文字資料,其中該一至多個第一辨識文字資料的總數等於該第一預定數值,且該一至多個第一辨識文字資料所分別關聯的該第一排名資料皆小於或等於該第一預定數值;由該處理模組基於該複數個第二排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第二辨識文字資料,其中該一至多個第二辨識文字資料的總數等於該第二預定數值,且該一至多個第二辨識文字資料所分別關聯的該第二排名資料皆小於或等於該第二預定數值;以及由該處理模組至少基於該第一文字資料、該第二文字資料、該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料,以產生一判斷資料,其中該判斷資料指示出該第一初始圖像資料是否符合該初始文字資料。
於本發明之一較佳實施例中,該文字圖像辨識方法進一步包含:由該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,且該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
於本發明之一較佳實施例中,該文字圖像辨識方法進一步包含:由該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
於本發明之一較佳實施例中,該第一預定數值等於該第二預定數值。
於本發明之一較佳實施例中,該文字圖像辨識方法進一步包含:由該處理模組於獲得該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料之前,將該第一數值資料以及該第二數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值以及該第二預定數值。
於本發明之一較佳實施例中,該文字圖像辨識方法進一步包含:由該伺服器接收複數個第二初始圖像資料;以及由該伺服器的該處理模組基於該複數個第二初始圖像資料符合於該初始文字資料的比率低於一門檻值,而產生一警示資料。
於本發明之一較佳實施例中,該資料庫儲存一第三數值資料,該第三數值資料指示出一第三預定數值;其中該初始文字資料包含一第三文字資料,該第一初始圖像資料包含一第三文字圖像資料;其中該文字圖像辨識方法進一步包含:由該文字辨識模組基於該第三文字圖像資料以產生複數個第三機率資料,其中該複數個第三機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第三機率資料分別指示出其所對應之原始辨識文字資料符合於該第三文字圖像資料的機率;由該處理模組基於該複數個第三機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第三排名資料,其中該複數個第三排名資料分別關聯於該複數個原始辨識文字資料其中一者;由該處理模組基於該複數個第三排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第三辨識文字資料,其中該一至多個第三辨識文字資料的總數等於該第三預定數值,且該一至多個第三辨識文字資料所分別關聯的該第三排名資料皆小於或等於該第三預定數值;以及由該處理模組至少基於該第一文字資料、該第二文字資料、該第三文字資料、該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料,以產生該判斷資料。
於本發明之一較佳實施例中,該文字圖像辨識方法進一步包含:由該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,且該第三文字資料符合於該一至多個第三辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
於本發明之一較佳實施例中,該文字圖像辨識方法進一步包含:由該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,或基於該第三文字資料不符合於該一至多個第三辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
於本發明之一較佳實施例中,該文字圖像辨識方法進一步包含:由該處理模組於獲得該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料之前,將該第一數值資料、該第二數值資料以及該第三數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值、該第二預定數值以及該第三預定數值。
本發明前述各方面及其它方面依據下述的非限制性具體實施例詳細說明以及參照附隨的圖式將更趨於明瞭。
請參閱第一圖,其例示說明了根據本發明文字圖像辨識系統一具體實施例的系統架構圖。如第一圖所示實施例,文字圖像辨識系統100包含資料庫110以及伺服器120,伺服器120包含文字辨識模組122以及處理模組124。其中,伺服器120通訊連接資料庫110,且伺服器120可存取資料庫110。較佳地,文字辨識模組122以及處理模組124皆通訊連接資料庫110,且文字辨識模組122以及處理模組124皆可存取資料庫110。較佳地,文字辨識模組122通訊連接處理模組124。較佳地,本發明之文字圖像辨識系統可包含一或多個處理器,並以硬體與軟體協同運作的方式實施資料庫110以及伺服器120。在一具體實施例中,資料庫110可包含一或多個處理器,並以硬體與軟體協同運作的方式實施資料庫110所具備的功能;且伺服器120可包含一或多個處理器,並以硬體與軟體協同運作的方式實施伺服器120所具備的功能(例如伺服器120係以硬體與軟體協同運作的方式實施文字辨識模組122以及處理模組124)。在一具體實施例中,伺服器120可進一步包含一接收模組(圖未視),伺服器120可藉由接收模組以接收資料(例如接收初始圖像資料等,初始圖像資料於後將進一步說明)。較佳地,伺服器120的接收模組通訊連接資料庫110,且接收模組可存取資料庫110。較佳地,伺服器120的接收模組通訊連接文字辨識模組122以及處理模組124。較佳地,伺服器120可包含一或多個處理器,並以硬體與軟體協同運作的方式實施文字辨識模組122、處理模組124以及接收模組。
如第一圖所示實施例,資料庫110可儲存初始文字資料、第一數值資料、第二數值資料以及複數個原始辨識文字資料。其中,初始文字資料包含第一文字資料以及第二文字資料,第一數值資料指示出第一預定數值,第二數值資料指示出第二預定數值。較佳地,第一文字資料以及第二文字資料分別指示出一特定文字。在第一圖所示實施例中,伺服器120可自裝置900接收初始圖像資料(伺服器120通訊連接裝置900),並可依需求而將初始圖像資料儲存於資料庫110中,初始圖像資料可包含第一文字圖像資料以及第二文字圖像資料。其中,裝置900可為手機、電腦、處理裝置、圖像資料輸入裝置、電子手寫裝置等,但不以此為限。伺服器120可至少藉由初始文字資料、初始圖像資料、第一數值資料、第二數值資料以及複數個原始辨識文字資料,以判斷初始圖像資料是否符合初始文字資料。在一具體實施例中,初始文字資料可指示出一特定使用者的相關資訊,例如初始文字資料可指示出該特定使用者的姓名,或指示出該特定使用者的身分證字號等,但不以此為限。在一具體實施例中,初始圖像資料可為使用者所輸入或提供的圖象資料,例如初始圖像資料可為使用者所輸入或提供的簽名圖象等,但不以此為限。在一具體實施例中,各個數值資料所指示出的預定數值可由使用者依需求而設定或調整。
請同時參閱第一圖以及第二圖,其中第二圖例示說明了初始文字資料以及初始圖像資料一具體實施例的示意圖。如第一圖以及第二圖所示實施例,初始文字資料210包含第一文字資料212以及第二文字資料214,第一文字資料212指示出一特定文字「陳」,而第二文字資料214指示出一特定文字「宗」。初始圖像資料220(或可稱為第一初始圖像資料)包含第一文字圖像資料222以及第二文字圖像資料224。在第一圖以及第二圖所示實施例中,資料庫110可儲存初始文字資料210、第一數值資料、第二數值資料以及複數個原始辨識文字資料。第一數值資料指示出第一預定數值,第二數值資料指示出第二預定數值。伺服器120可自裝置900接收初始圖像資料220(例如伺服器120可藉由接收模組以接收初始圖像資料220)。在一具體實施例中,第一預定數值以及第二預定數值皆為3。
伺服器120的文字辨識模組122可基於第一文字圖像資料222以產生複數個第一機率資料(較佳地,文字辨識模組122係基於第一文字圖像資料222以及複數個原始辨識文字資料,以產生複數個第一機率資料),該複數個第一機率資料分別關聯於複數個原始辨識文字資料其中一者,且該複數個第一機率資料分別指示出其所對應之原始辨識文字資料符合於第一文字圖像資料222的機率。
舉例而言,文字辨識模組122可基於第一文字圖像資料222以及原始辨識文字資料251,以產生第一機率資料261,第一機率資料261關聯於原始辨識文字資料251,且如第二圖所示,第一機率資料261指示出其所對應之原始辨識文字資料251符合於第一文字圖像資料222的機率為68.5%。文字辨識模組122可基於第一文字圖像資料222以及原始辨識文字資料252,以產生第一機率資料262,第一機率資料262關聯於原始辨識文字資料252,且如第二圖所示,第一機率資料262指示出其所對應之原始辨識文字資料252符合於第一文字圖像資料222的機率為9.4%。文字辨識模組122可基於第一文字圖像資料222以及原始辨識文字資料253,以產生第一機率資料263,第一機率資料263關聯於原始辨識文字資料253,且如第二圖所示,第一機率資料263指示出其所對應之原始辨識文字資料253符合於第一文字圖像資料222的機率為10.5%。
較佳地,文字辨識模組122可基於第一文字圖像資料222以及儲存於資料庫110中的所有原始辨識文字資料,以針對每一個原始辨識文字資料產生一對應的第一機率資料。應了解,文字辨識模組122可使用諸如深度學習(Deep Learning)、類神經網路(Artificial Neural Network)、歸一化指數函數(Softmax)、光學字元辨識(Optical Character Recognition,OCR)其中至少一者(但不以此些技術或方法為限),以基於一特定文字圖像資料以及一特定原始辨識文字資料,產生對應於該特定文字圖像資料以及該特定原始辨識文字資料的機率資料。應了解,資料庫110所儲存的原始辨識文字資料越多,則伺服器120越能夠辨識出文字圖像資料所指示出的文字為何者。因此,資料庫110可盡量儲存較多的原始辨識文字資料,且伺服器120可以大量的訓練資料對文字辨識模組122進行訓練,以令文字辨識模組122可判斷一特定文字圖像資料是否符合一特定辨識文字資料。在一具體實施例中,資料庫110所儲存的原始辨識文字資料大於一萬個。在另一具體實施例中,資料庫110所儲存的原始辨識文字資料大於一萬三千個。
在第一圖以及第二圖所示實施例中,文字辨識模組122可基於第二文字圖像資料224以產生複數個第二機率資料(較佳地,文字辨識模組122係基於第二文字圖像資料224以及複數個原始辨識文字資料,以產生複數個第二機率資料),該複數個第二機率資料分別關聯於複數個原始辨識文字資料其中一者,且該複數個第二機率資料分別指示出其所對應之原始辨識文字資料符合於第二文字圖像資料224的機率。
舉例而言,文字辨識模組122可基於第二文字圖像資料224以及原始辨識文字資料254,以產生第二機率資料264,第二機率資料264關聯於原始辨識文字資料254,且如第二圖所示,第二機率資料264指示出其所對應之原始辨識文字資料254符合於第二文字圖像資料224的機率為54.7%。文字辨識模組122可基於第二文字圖像資料224以及原始辨識文字資料255,以產生第二機率資料265,第二機率資料265關聯於原始辨識文字資料255,且如第二圖所示,第二機率資料265指示出其所對應之原始辨識文字資料255符合於第二文字圖像資料224的機率為19.1%。文字辨識模組122可基於第二文字圖像資料224以及原始辨識文字資料256,以產生第二機率資料266,第二機率資料266關聯於原始辨識文字資料256,且如第二圖所示,第二機率資料266指示出其所對應之原始辨識文字資料256符合於第二文字圖像資料224的機率為10.3%。較佳地,文字辨識模組122可基於第二文字圖像資料224以及儲存於資料庫110中的所有原始辨識文字資料,以針對每一個原始辨識文字資料產生一對應的第一機率資料。
在第一圖以及第二圖所示實施例中,伺服器120的處理模組124可基於複數個第一機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第一排名資料(例如第一排名資料271、第一排名資料272、第一排名資料273等),其中該複數個第一排名資料分別關聯於複數個原始辨識文字資料其中一者。舉例而言,處理模組124所產生的第一排名資料271關聯於原始辨識文字資料251,且第一排名資料271指示出原始辨識文字資料251的第一機率資料261的排名為第1名;處理模組124所產生的第一排名資料272關聯於原始辨識文字資料252,且第一排名資料272指示出原始辨識文字資料252的第一機率資料262的排名為第3名;處理模組124所產生的第一排名資料273關聯於原始辨識文字資料253,且第一排名資料273指示出原始辨識文字資料253的第一機率資料263的排名為第2名。
處理模組124可基於複數個第二機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第二排名資料(例如第二排名資料274、第二排名資料275、第二排名資料276等),其中該複數個第二排名資料分別關聯於複數個原始辨識文字資料其中一者。舉例而言,處理模組124所產生的第二排名資料274關聯於原始辨識文字資料254,且第二排名資料274指示出原始辨識文字資料254的第二機率資料264的排名為第1名;處理模組124所產生的第二排名資料275關聯於原始辨識文字資料255,且第二排名資料275指示出原始辨識文字資料255的第二機率資料265的排名為第2名;處理模組124所產生的第二排名資料276關聯於原始辨識文字資料256,且第二排名資料276指示出原始辨識文字資料256的第二機率資料266的排名為第4名。
處理模組124可基於複數個第一排名資料,以自複數個原始辨識文字資料中,獲得一至多個第一辨識文字資料。其中,該一至多個第一辨識文字資料的總數等於第一預定數值,且該一至多個第一辨識文字資料所分別關聯的第一排名資料皆小於或等於第一預定數值。詳細而言,若第一預定數值為K,則處理模組124即是基於複數個第一排名資料,以自複數個原始辨識文字資料中,擷取前K名的原始辨識文字資料,以做為第一辨識文字資料。舉例而言,若第一預定數值為3,則處理模組124可基於各個第一排名資料,以將第1名的原始辨識文字資料251(其第一排名資料271為1)、第2名的原始辨識文字資料253(其第一排名資料273為2)以及第3名的原始辨識文字資料252(其第一排名資料272為3)皆列為第一辨識文字資料。
處理模組124可基於複數個第二排名資料,以自複數個原始辨識文字資料中,獲得一至多個第二辨識文字資料,該一至多個第二辨識文字資料的總數等於第二預定數值,且該一至多個第二辨識文字資料所分別關聯的第二排名資料皆小於或等於第二預定數值。詳細而言,若第二預定數值為K,則處理模組124即是基於複數個第二排名資料,以自複數個原始辨識文字資料中,擷取前K名的原始辨識文字資料,以做為第二辨識文字資料。舉例而言,若第二預定數值為3,則處理模組124可基於各個第二排名資料,以將第1名的原始辨識文字資料254(其第一排名資料274為1)、第2名的原始辨識文字資料255(其第一排名資料275為2)以及第3名的原始辨識文字資料(圖未視)皆列為第二辨識文字資料。
處理模組124可至少基於第一文字資料212、第二文字資料214、該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料,以產生判斷資料。其中,判斷資料指示出初始圖像資料220是否符合初始文字資料210。在一具體實施例中,處理模組124可至少基於第一文字資料212符合於該一至多個第一辨識文字資料其中任一者,且第二文字資料214符合於一至多個第二辨識文字資料其中任一者,而使判斷資料指示出初始圖像資料220符合初始文字資料210。在一具體實施例中,處理模組124可基於第一文字資料212不符合於該一至多個第一辨識文字資料其中每一者,或基於第二文字資料214不符合於該一至多個第二辨識文字資料其中每一者,而使判斷資料指示出初始圖像資料220不符合初始文字資料210。
由第二圖的第一文字資料212可知,第一文字圖像資料222應為文字「陳」的手寫文字圖像。但因第一文字圖像資料222中的手寫字較為潦草,導致系統判斷第一文字圖像資料222最有可能為文字「凍」。此時若以傳統的文字圖像辨識系統進行判斷,將會直接認定初始圖像資料220的第一文字圖像資料222不符合初始文字資料210的第一文字資料212,進而判斷初始圖像資料220不符合初始文字資料210。而本發明之文字圖像辨識系統100藉由設定預定數值(例如將第一預定數值設定為3),即令本發明之文字圖像辨識系統100可正確判斷出初始圖像資料220的第一文字圖像資料222實際上係符合於初始文字資料210的第一文字資料212。如此,即便使用者的手寫字較為潦草,本發明之文字圖像辨識系統100仍可正確判斷出初始圖像資料220係符合初始文字資料210。
在一具體實施例中,第一預定數值可等於第二預定數值。其中,當第一預定數值大於一預定門檻值時,伺服器120即以複數個訓練資料對文字辨識模組122進行訓練,以提升文字辨識模組122判斷一特定文字圖像資料是否符合一特定辨識文字資料的準確率。另外,當第一預定數值小於或等於預定門檻值,且關聯於判斷資料的一判斷準確率低於一特定閾值時,伺服器120即以複數個訓練資料對文字辨識模組122進行訓練,以提升文字辨識模組122判斷一特定文字圖像資料是否符合一特定辨識文字資料的準確率。在另一具體實施例中,第一數值資料即為第二數值資料。在一具體實施例中,處理模組124於獲得該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料之前,可將第一數值資料以及第二數值資料其中至少一者更改為一特定數值。其中,該特定數值小於第一預定數值以及第二預定數值。較佳地,處理模組124係以隨機的方式決定將第一數值資料以及第二數值資料其中至少一者更改為特定數值。在一具體實施例中,該特定數值為1。應了解,藉由將第一數值資料以及第二數值資料其中至少一者更改為一特定數值的做法,將可有效的避免本發明之文字圖像辨識系統100因第一數值資料及/或第二數值資料設定的過大而導致誤判。此外,藉由將第一數值資料以及第二數值資料其中至少一者更改為一特定數值的做法,亦可有效識別出初始圖像資料220是否為錯誤的簽名或假冒的簽名。
在一具體實施例中,伺服器120可接收複數個初始圖像資料(或可稱為複數個第二初始圖像資料),伺服器120的處理模組124可基於該複數個第二初始圖像資料符合於初始文字資料210的比率低於一門檻值,而產生一警示資料。例如當門檻值為80時,則一旦該複數個第二初始圖像資料中,符合於初始文字資料210的第二初始圖像資料之比率低於80%(亦即,在該複數個第二初始圖像資料中,有超過20%的第二初始圖像資料被伺服器120判斷為不符合初始文字資料210)時,則處理模組124將產生警示資料。
應了解,初始文字資料並非僅可包含兩個文字資料,其亦可視需求而包含三個以上的文字資料,例如在一具體實施例中,初始文字資料可包含第一文字資料、第二文字資料以及第三文字資料。而在另一具體實施例中,初始文字資料可包含第一文字資料、第二文字資料、第三文字資料以及第四文字資料,以此類推。應了解,初始圖像資料並非僅可包含兩個文字圖像資料,其亦可視需求而包含三個以上的文字圖像資料,例如在一具體實施例中,初始圖像資料可包含第一文字圖像資料、第二文字圖像資料以及第三文字圖像資料。而在另一具體實施例中,初始圖像資料可包含第一文字圖像資料、第二文字圖像資料、第三文字圖像資料以及第四文字圖像資料,以此類推。
應了解,第一文字資料、第二文字資料、第三文字資料等所指示出的特定文字可為中文字、英文字母、其他國家之文字、文字符號或數字等,但不以此為限。應了解,資料庫110並非僅可儲存兩個數值資料,而係可視需求儲存三個以上的數值資料。較佳地,資料庫110可依據初始文字資料所包含的文字資料之數量,而儲存對應數量的數值資料。例如當初始文字資料包含三個文字資料時,資料庫110即至少儲存三個數值資料,以此類推。較佳地,資料庫110可依據初始圖像資料所包含的文字圖像資料之數量,而儲存對應數量的數值資料。例如當初始圖像資料包含三個文字圖像資料時,資料庫110即至少儲存三個數值資料,以此類推。
請同時參閱第一圖以及第三圖,其中第三圖例示說明了初始文字資料以及初始圖像資料一具體實施例的示意圖。如第三圖所示實施例,初始文字資料310包含第一文字資料312、第二文字資料314以及第三文字資料316。初始圖像資料320(或可稱為第一初始圖像資料)包含第一文字圖像資料322、第二文字圖像資料324以及第三文字圖像資料326。在第一圖以及第三圖所示實施例中,本發明之文字圖像辨識系統的資料庫儲存初始文字資料310、第一數值資料、第二數值資料、第三數值資料以及複數個原始辨識文字資料。其中,第一數值資料指示出一第一預定數值,第二數值資料指示出一第二預定數值,第三數值資料指示出一第三預定數值。
伺服器120可接收初始圖像資料320。伺服器120的文字辨識模組122可基於第一文字圖像資料322以產生複數個第一機率資料(較佳地,文字辨識模組122係基於第一文字圖像資料322以及複數個原始辨識文字資料,以產生複數個第一機率資料)。其中,複數個第一機率資料分別關聯於複數個原始辨識文字資料其中一者,且複數個第一機率資料分別指示出其所對應之原始辨識文字資料符合於第一文字圖像資料322的機率。文字辨識模組122可基於第二文字圖像資料324以產生複數個第二機率資料(較佳地,文字辨識模組122係基於第二文字圖像資料324以及複數個原始辨識文字資料,以產生複數個第二機率資料)。其中,複數個第二機率資料分別關聯於複數個原始辨識文字資料其中一者,且複數個第二機率資料分別指示出其所對應之原始辨識文字資料符合於第二文字圖像資料324的機率。文字辨識模組122並可基於第三文字圖像資料326以產生複數個第三機率資料(較佳地,文字辨識模組122係基於第三文字圖像資料326以及複數個原始辨識文字資料,以產生複數個第三機率資料)。其中,該複數個第三機率資料分別關聯於複數個原始辨識文字資料其中一者,且該複數個第三機率資料分別指示出其所對應之原始辨識文字資料符合於第三文字圖像資料326的機率。
伺服器120的處理模組124可基於複數個第一機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第一排名資料。其中,複數個第一排名資料分別關聯於複數個原始辨識文字資料其中一者。處理模組124可基於複數個第二機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第二排名資料。其中,複數個第二排名資料分別關聯於該複數個原始辨識文字資料其中一者。處理模組124並可基於複數個第三機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第三排名資料。其中,複數個第三排名資料分別關聯於複數個原始辨識文字資料其中一者。
處理模組124可基於複數個第一排名資料,以自複數個原始辨識文字資料中,獲得一至多個第一辨識文字資料。其中,該一至多個第一辨識文字資料的總數等於第一預定數值,且該一至多個第一辨識文字資料所分別關聯的第一排名資料皆小於或等於第一預定數值。處理模組124可基於複數個第二排名資料,以自複數個原始辨識文字資料中,獲得一至多個第二辨識文字資料。其中,該一至多個第二辨識文字資料的總數等於第二預定數值,且該一至多個第二辨識文字資料所分別關聯的第二排名資料皆小於或等於第二預定數值。處理模組124可基於複數個第三排名資料,以自複數個原始辨識文字資料中,獲得一至多個第三辨識文字資料。其中,該一至多個第三辨識文字資料的總數等於第三預定數值,且該一至多個第三辨識文字資料所分別關聯的第三排名資料皆小於或等於第三預定數值。
處理模組124可至少基於第一文字資料312、第二文字資料314、第三文字資料316、該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料,以產生判斷資料。其中,判斷資料指示出初始圖像資料320是否符合初始文字資料310。在一具體實施例中,處理模組124可至少基於第一文字資料312符合於該一至多個第一辨識文字資料其中任一者,第二文字資料314符合於該一至多個第二辨識文字資料其中任一者,且第三文字資料316符合於該一至多個第三辨識文字資料其中任一者,而使判斷資料指示出初始圖像資料320符合初始文字資料310。在一具體實施例中,處理模組124可基於第一文字資料312不符合於該一至多個第一辨識文字資料其中每一者,或基於第二文字資料314不符合於該一至多個第二辨識文字資料其中每一者,或基於第三文字資料316不符合於該一至多個第三辨識文字資料其中每一者,而使判斷資料指示出初始圖像資料320不符合初始文字資料310。
在一具體實施例中,第一預定數值、第二預定數值以及第三預定數值可彼此相等。其中,當第一預定數值大於一預定門檻值時,伺服器120即以複數個訓練資料對文字辨識模組122進行訓練,以提升文字辨識模組122判斷一特定文字圖像資料是否符合一特定辨識文字資料的準確率。另外,當第一預定數值小於或等於預定門檻值,且關聯於判斷資料的一判斷準確率低於一特定閾值時,伺服器120即以複數個訓練資料對文字辨識模組122進行訓練,以提升文字辨識模組122判斷一特定文字圖像資料是否符合一特定辨識文字資料的準確率。在另一具體實施例中,第一數值資料即為第二數值資料,且第一數值資料即為第三數值資料。在一具體實施例中,處理模組124於獲得該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料之前,可將第一數值資料、第二數值資料以及第三數值資料其中至少一者更改為一特定數值。其中,該特定數值小於第一預定數值、第二預定數值以及第三預定數值。
較佳地,處理模組124係以隨機的方式決定將第一數值資料、第二數值資料以及第三數值資料其中至少一者更改為一特定數值。在一具體實施例中,該特定數值為1。應了解,藉由將第一數值資料、第二數值資料以及第三數值資料其中至少一者更改為一特定數值的做法,將可有效的避免本發明之文字圖像辨識系統100因第一數值資料及/或第二數值資料及/或第三數值資料設定的過大而導致誤判。此外,藉由將第一數值資料、第二數值資料以及第三數值資料其中至少一者更改為一特定數值的做法,亦可有效識別出初始圖像資料320是否為錯誤的簽名或假冒的簽名。
請參閱第四圖,其例示說明了根據本發明之文字圖像辨識方法一具體實施例的流程圖。如第四圖所示實施例,本發明之文字圖像辨識方法400係應用於一文字圖像辨識系統,該文字圖像辨識系統包含資料庫以及伺服器,該伺服器存取該資料庫。其中資料庫儲存初始文字資料、第一數值資料、第二數值資料以及複數個原始辨識文字資料,初始文字資料包含第一文字資料以及第二文字資料。第一數值資料指示出一第一預定數值,第二數值資料指示出一第二預定數值。文字圖像辨識方法400開始於步驟410,由伺服器接收一第一初始圖像資料。其中第一初始圖像資料包含第一文字圖像資料以及第二文字圖像資料。接著,執行步驟420,由伺服器的文字辨識模組基於第一文字圖像資料以產生複數個第一機率資料。其中,複數個第一機率資料分別關聯於複數個原始辨識文字資料其中一者,且複數個第一機率資料分別指示出其所對應之原始辨識文字資料符合於第一文字圖像資料的機率。接著,執行步驟430,由文字辨識模組基於第二文字圖像資料以產生複數個第二機率資料。其中,複數個第二機率資料分別關聯於複數個原始辨識文字資料其中一者,且複數個第二機率資料分別指示出其所對應之原始辨識文字資料符合於第二文字圖像資料的機率。
接著,執行步驟440,由伺服器的處理模組基於複數個第一機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第一排名資料。其中,複數個第一排名資料分別關聯於複數個原始辨識文字資料其中一者。接著,執行步驟450,由處理模組基於複數個第二機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第二排名資料。其中,複數個第二排名資料分別關聯於複數個原始辨識文字資料其中一者。
接著,執行步驟460,由處理模組基於複數個第一排名資料,以自複數個原始辨識文字資料中,獲得一至多個第一辨識文字資料。其中,該一至多個第一辨識文字資料的總數等於第一預定數值,且該一至多個第一辨識文字資料所分別關聯的第一排名資料皆小於或等於第一預定數值。接著,執行步驟470,由處理模組基於複數個第二排名資料,以自複數個原始辨識文字資料中,獲得一至多個第二辨識文字資料。其中,該一至多個第二辨識文字資料的總數等於第二預定數值,且該一至多個第二辨識文字資料所分別關聯的第二排名資料皆小於或等於第二預定數值。接著,執行步驟480,由處理模組至少基於第一文字資料、第二文字資料、該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料,以產生一判斷資料。其中,該判斷資料指示出第一初始圖像資料是否符合初始文字資料。
在一具體實施例中,文字圖像辨識方法400可進一步包含以下步驟:由處理模組至少基於第一文字資料符合於該一至多個第一辨識文字資料其中任一者,且第二文字資料符合於該一至多個第二辨識文字資料其中任一者,而使判斷資料指示出第一初始圖像資料符合初始文字資料。在一具體實施例中,文字圖像辨識方法400可進一步包含以下步驟:由處理模組基於第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,而使判斷資料指示出第一初始圖像資料不符合初始文字資料。
在一具體實施例中,第一預定數值可等於第二預定數值。其中,當第一預定數值大於一預定門檻值時,伺服器即以複數個訓練資料對文字辨識模組進行訓練,以提升文字辨識模組判斷一特定文字圖像資料是否符合一特定辨識文字資料的準確率。另外,當第一預定數值小於或等於預定門檻值,且關聯於判斷資料的一判斷準確率低於一特定閾值時,伺服器即以複數個訓練資料對文字辨識模組進行訓練,以提升文字辨識模組判斷一特定文字圖像資料是否符合一特定辨識文字資料的準確率。在另一具體實施例中,第一數值資料即為第二數值資料。
在一具體實施例中,文字圖像辨識方法400可進一步包含以下步驟:由處理模組於獲得該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料之前,將第一數值資料以及第二數值資料其中至少一者更改為一特定數值,該特定數值小於第一預定數值以及第二預定數值。較佳地,處理模組係以隨機的方式決定將第一數值資料以及第二數值資料其中至少一者更改為特定數值。在一具體實施例中,該特定數值為1。應了解,藉由將第一數值資料以及第二數值資料其中至少一者更改為一特定數值的做法,將可有效的避免本發明之文字圖像辨識系統因第一數值資料及/或第二數值資料設定的過大而導致誤判。此外,藉由將第一數值資料以及第二數值資料其中至少一者更改為一特定數值的做法,亦可有效識別出初始圖像資料是否為錯誤的簽名或假冒的簽名。
在一具體實施例中,文字圖像辨識方法400可進一步包含以下步驟:由伺服器接收複數個第二初始圖像資料;以及由伺服器的處理模組基於該複數個第二初始圖像資料符合於初始文字資料的比率低於一門檻值,而產生一警示資料。
在一具體實施例中,資料庫另儲存一第三數值資料,該第三數值資料指示出一第三預定數值。此外,初始文字資料包含一第三文字資料,第一初始圖像資料包含一第三文字圖像資料。其中,文字圖像辨識方法400可進一步包含以下步驟:由文字辨識模組基於第三文字圖像資料以產生複數個第三機率資料。其中,該複數個第三機率資料分別關聯於複數個原始辨識文字資料其中一者,且該複數個第三機率資料分別指示出其所對應之原始辨識文字資料符合於第三文字圖像資料的機率;由處理模組基於該複數個第三機率資料而將複數個原始辨識文字資料進行排名,以產生複數個第三排名資料。其中,該複數個第三排名資料分別關聯於複數個原始辨識文字資料其中一者;由處理模組基於該複數個第三排名資料,以自複數個原始辨識文字資料中,獲得一至多個第三辨識文字資料。其中,該一至多個第三辨識文字資料的總數等於第三預定數值,且該一至多個第三辨識文字資料所分別關聯的第三排名資料皆小於或等於第三預定數值;以及由處理模組至少基於第一文字資料、第二文字資料、第三文字資料、該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料,以產生判斷資料。
在一具體實施例中,文字圖像辨識方法400可進一步包含以下步驟:由處理模組至少基於第一文字資料符合於該一至多個第一辨識文字資料其中任一者,第二文字資料符合於該一至多個第二辨識文字資料其中任一者,且第三文字資料符合於該一至多個第三辨識文字資料其中任一者,而使判斷資料指示出第一初始圖像資料符合初始文字資料。在一具體實施例中,文字圖像辨識方法400可進一步包含以下步驟:由處理模組基於第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,或基於第三文字資料不符合於該一至多個第三辨識文字資料其中每一者,而使判斷資料指示出第一初始圖像資料不符合初始文字資料。
在一具體實施例中,文字圖像辨識方法400可進一步包含以下步驟:由處理模組於獲得該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料之前,將第一數值資料、第二數值資料以及第三數值資料其中至少一者更改為一特定數值,該特定數值小於第一預定數值、第二預定數值以及第三預定數值。在一具體實施例中,該特定數值為1。應了解,藉由將第一數值資料、第二數值資料以及第三數值資料其中至少一者更改為一特定數值的做法,將可有效的避免本發明之文字圖像辨識系統因第一數值資料及/或第二數值資料及/或第三數值資料設定的過大而導致誤判。此外,藉由將第一數值資料、第二數值資料以及第三數值資料其中至少一者更改為一特定數值的做法,亦可有效識別出初始圖像資料是否為錯誤的簽名或假冒的簽名。
至此,本發明之文字圖像辨識系統及其方法已經由上述說明及圖式加以說明。然應了解,本發明的各個具體實施例僅是做為說明之用,在不脫離本發明申請專利範圍與精神下可進行各種改變,且均應包含於本發明之專利範圍中。因此,本說明書所描述的各具體實施例並非用以限制本發明,本發明之真實範圍與精神揭示於以下申請專利範圍。
100:文字圖像辨識系統 110:資料庫 120:伺服器 122:文字辨識模組 124:處理模組 210:初始文字資料 212:第一文字資料 214:第二文字資料 220:初始圖像資料 222:第一文字圖像資料 224:第二文字圖像資料 251~256:原始辨識文字資料 261~263:第一機率資料 264~266:第二機率資料 271~273:第一排名資料 274~276:第二排名資料 310:初始文字資料 312:第一文字資料 314:第二文字資料 316:第三文字資料 320:初始圖像資料 322:第一文字圖像資料 324:第二文字圖像資料 326:第三文字圖像資料 400:文字圖像辨識方法 410~480:步驟 900:裝置
第一圖為本發明文字圖像辨識系統一具體實施例的系統架構圖。
第二圖為初始文字資料以及初始圖像資料一具體實施例的示意圖。
第三圖為初始文字資料以及初始圖像資料一具體實施例的示意圖。
第四圖為本發明之文字圖像辨識方法一具體實施例的流程圖。
100:文字圖像辨識系統
110:資料庫
120:伺服器
122:文字辨識模組
124:處理模組
900:裝置

Claims (20)

  1. 一種文字圖像辨識系統,包含: 一資料庫,儲存一初始文字資料、一第一數值資料、一第二數值資料以及複數個原始辨識文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料,該第一數值資料指示出一第一預定數值,該第二數值資料指示出一第二預定數值;以及 一伺服器,存取該資料庫,該伺服器接收一第一初始圖像資料,該第一初始圖像資料包含一第一文字圖像資料以及一第二文字圖像資料; 其中該伺服器包含; 一文字辨識模組,基於該第一文字圖像資料以產生複數個第一機率資料,該複數個第一機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第一機率資料分別指示出其所對應之原始辨識文字資料符合於該第一文字圖像資料的機率,其中該文字辨識模組並基於該第二文字圖像資料以產生複數個第二機率資料,該複數個第二機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第二機率資料分別指示出其所對應之原始辨識文字資料符合於該第二文字圖像資料的機率;以及 一處理模組,基於該複數個第一機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第一排名資料,該複數個第一排名資料分別關聯於該複數個原始辨識文字資料其中一者,其中該處理模組並基於該複數個第二機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第二排名資料,該複數個第二排名資料分別關聯於該複數個原始辨識文字資料其中一者; 其中該處理模組基於該複數個第一排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第一辨識文字資料,該一至多個第一辨識文字資料的總數等於該第一預定數值,且該一至多個第一辨識文字資料所分別關聯的該第一排名資料皆小於或等於該第一預定數值; 其中該處理模組基於該複數個第二排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第二辨識文字資料,該一至多個第二辨識文字資料的總數等於該第二預定數值,且該一至多個第二辨識文字資料所分別關聯的該第二排名資料皆小於或等於該第二預定數值; 其中該處理模組至少基於該第一文字資料、該第二文字資料、該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料,以產生一判斷資料,該判斷資料指示出該第一初始圖像資料是否符合該初始文字資料。
  2. 如請求項1之文字圖像辨識系統,其中該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,且該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
  3. 如請求項1之文字圖像辨識系統,其中該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
  4. 如請求項1之文字圖像辨識系統,其中該第一預定數值等於該第二預定數值。
  5. 如請求項1之文字圖像辨識系統,其中該處理模組於獲得該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料之前,將該第一數值資料以及該第二數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值以及該第二預定數值。
  6. 如請求項1之文字圖像辨識系統,其中該伺服器接收複數個第二初始圖像資料,該伺服器的該處理模組基於該複數個第二初始圖像資料符合於該初始文字資料的比率低於一門檻值,而產生一警示資料。
  7. 如請求項1之文字圖像辨識系統,其中該資料庫儲存一第三數值資料,該第三數值資料指示出一第三預定數值; 其中該初始文字資料包含一第三文字資料,該第一初始圖像資料包含一第三文字圖像資料; 其中該文字辨識模組基於該第三文字圖像資料以產生複數個第三機率資料,該複數個第三機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第三機率資料分別指示出其所對應之原始辨識文字資料符合於該第三文字圖像資料的機率; 其中該處理模組基於該複數個第三機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第三排名資料,該複數個第三排名資料分別關聯於該複數個原始辨識文字資料其中一者; 其中該處理模組基於該複數個第三排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第三辨識文字資料,該一至多個第三辨識文字資料的總數等於該第三預定數值,且該一至多個第三辨識文字資料所分別關聯的該第三排名資料皆小於或等於該第三預定數值; 其中該處理模組至少係基於該第一文字資料、該第二文字資料、該第三文字資料、該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料,以產生該判斷資料。
  8. 如請求項7之文字圖像辨識系統,其中該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,且該第三文字資料符合於該一至多個第三辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
  9. 如請求項7之文字圖像辨識系統,其中該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,或基於該第三文字資料不符合於該一至多個第三辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
  10. 如請求項7之文字圖像辨識系統,其中該處理模組於獲得該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料之前,將該第一數值資料、該第二數值資料以及該第三數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值、該第二預定數值以及該第三預定數值。
  11. 一種文字圖像辨識方法,應用於一文字圖像辨識系統,該文字圖像辨識系統包含一資料庫以及一伺服器,該伺服器存取該資料庫;其中該資料庫儲存一初始文字資料、一第一數值資料、一第二數值資料以及複數個原始辨識文字資料,該初始文字資料包含一第一文字資料以及一第二文字資料,該第一數值資料指示出一第一預定數值,該第二數值資料指示出一第二預定數值;其中該文字圖像辨識方法包含以下步驟: 由該伺服器接收一第一初始圖像資料,其中該第一初始圖像資料包含一第一文字圖像資料以及一第二文字圖像資料; 由該伺服器的一文字辨識模組基於該第一文字圖像資料以產生複數個第一機率資料,其中該複數個第一機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第一機率資料分別指示出其所對應之原始辨識文字資料符合於該第一文字圖像資料的機率; 由該文字辨識模組基於該第二文字圖像資料以產生複數個第二機率資料,其中該複數個第二機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第二機率資料分別指示出其所對應之原始辨識文字資料符合於該第二文字圖像資料的機率; 由該伺服器的一處理模組基於該複數個第一機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第一排名資料,其中該複數個第一排名資料分別關聯於該複數個原始辨識文字資料其中一者; 由該處理模組基於該複數個第二機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第二排名資料,其中該複數個第二排名資料分別關聯於該複數個原始辨識文字資料其中一者; 由該處理模組基於該複數個第一排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第一辨識文字資料,其中該一至多個第一辨識文字資料的總數等於該第一預定數值,且該一至多個第一辨識文字資料所分別關聯的該第一排名資料皆小於或等於該第一預定數值; 由該處理模組基於該複數個第二排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第二辨識文字資料,其中該一至多個第二辨識文字資料的總數等於該第二預定數值,且該一至多個第二辨識文字資料所分別關聯的該第二排名資料皆小於或等於該第二預定數值;以及 由該處理模組至少基於該第一文字資料、該第二文字資料、該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料,以產生一判斷資料,其中該判斷資料指示出該第一初始圖像資料是否符合該初始文字資料。
  12. 如請求項10之文字圖像辨識方法,進一步包含:由該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,且該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
  13. 如請求項10之文字圖像辨識方法,進一步包含:由該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
  14. 如請求項10之文字圖像辨識方法,其中該第一預定數值等於該第二預定數值。
  15. 如請求項10之文字圖像辨識方法,進一步包含:由該處理模組於獲得該一至多個第一辨識文字資料以及該一至多個第二辨識文字資料之前,將該第一數值資料以及該第二數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值以及該第二預定數值。
  16. 如請求項10之文字圖像辨識方法,進一步包含: 由該伺服器接收複數個第二初始圖像資料;以及 由該伺服器的該處理模組基於該複數個第二初始圖像資料符合於該初始文字資料的比率低於一門檻值,而產生一警示資料。
  17. 如請求項10之文字圖像辨識方法,其中該資料庫儲存一第三數值資料,該第三數值資料指示出一第三預定數值; 其中該初始文字資料包含一第三文字資料,該第一初始圖像資料包含一第三文字圖像資料; 其中該文字圖像辨識方法進一步包含: 由該文字辨識模組基於該第三文字圖像資料以產生複數個第三機率資料,其中該複數個第三機率資料分別關聯於該複數個原始辨識文字資料其中一者,且該複數個第三機率資料分別指示出其所對應之原始辨識文字資料符合於該第三文字圖像資料的機率; 由該處理模組基於該複數個第三機率資料而將該複數個原始辨識文字資料進行排名,以產生複數個第三排名資料,其中該複數個第三排名資料分別關聯於該複數個原始辨識文字資料其中一者; 由該處理模組基於該複數個第三排名資料,以自該複數個原始辨識文字資料中,獲得一至多個第三辨識文字資料,其中該一至多個第三辨識文字資料的總數等於該第三預定數值,且該一至多個第三辨識文字資料所分別關聯的該第三排名資料皆小於或等於該第三預定數值;以及 由該處理模組至少基於該第一文字資料、該第二文字資料、該第三文字資料、該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料,以產生該判斷資料。
  18. 如請求項17之文字圖像辨識方法,進一步包含:由該處理模組至少基於該第一文字資料符合於該一至多個第一辨識文字資料其中任一者,該第二文字資料符合於該一至多個第二辨識文字資料其中任一者,且該第三文字資料符合於該一至多個第三辨識文字資料其中任一者,而使該判斷資料指示出該第一初始圖像資料符合該初始文字資料。
  19. 如請求項17之文字圖像辨識方法,進一步包含:由該處理模組基於該第一文字資料不符合於該一至多個第一辨識文字資料其中每一者,或基於該第二文字資料不符合於該一至多個第二辨識文字資料其中每一者,或基於該第三文字資料不符合於該一至多個第三辨識文字資料其中每一者,而使該判斷資料指示出該第一初始圖像資料不符合該初始文字資料。
  20. 如請求項17之文字圖像辨識方法,進一步包含:由該處理模組於獲得該一至多個第一辨識文字資料、該一至多個第二辨識文字資料以及該一至多個第三辨識文字資料之前,將該第一數值資料、該第二數值資料以及該第三數值資料其中至少一者更改為一特定數值,該特定數值小於該第一預定數值、該第二預定數值以及該第三預定數值。
TW111130403A 2022-08-12 文字圖像辨識系統及其方法 TWI847218B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW111130403A TWI847218B (zh) 2022-08-12 文字圖像辨識系統及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW111130403A TWI847218B (zh) 2022-08-12 文字圖像辨識系統及其方法

Publications (2)

Publication Number Publication Date
TW202407646A true TW202407646A (zh) 2024-02-16
TWI847218B TWI847218B (zh) 2024-07-01

Family

ID=

Similar Documents

Publication Publication Date Title
US10936973B1 (en) Adversarial example detection method and apparatus, computing device, and non-volatile computer-readable storage medium
US9600648B2 (en) Methods and apparatuses for controlling access to computer systems and for annotating media files
CN108053545B (zh) 证件验真方法和装置、服务器、存储介质
CN111191067A (zh) 绘本识别方法、终端设备及计算机可读存储介质
CN113656547B (zh) 文本匹配方法、装置、设备及存储介质
US20230134169A1 (en) Text-based document classification method and document classification device
CN111814779A (zh) 一种票据文本识别方法、装置、设备及存储介质
CN111444905B (zh) 基于人工智能的图像识别方法和相关装置
CN111797217A (zh) 基于faq匹配模型的信息查询方法、及其相关设备
JP6146209B2 (ja) 情報処理装置、文字認識方法、及びプログラム
Seni et al. Generalizing edit distance to incorporate domain information: Handwritten text recognition as a case study
JP5365065B2 (ja) 辞書作成装置
TW202407646A (zh) 文字圖像辨識系統及其方法
CN111444906A (zh) 基于人工智能的图像识别方法和相关装置
CN113177543B (zh) 证件识别方法、装置、设备及存储介质
CA3170100A1 (en) Text processing method and device and computer-readable storage medium
CN114625909A (zh) 一种图像文本的选取方法、装置、电子设备和存储介质
CA3156204A1 (en) Domain based text extraction
CN113157960A (zh) 相似数据获取的方法及装置、电子设备和计算机可读存储介质
CN112507912A (zh) 一种识别违规图片的方法及装置
US20240020473A1 (en) Domain Based Text Extraction
CN113837129B (zh) 手写签名错别字识别方法、装置、设备及存储介质
CN111291352B (zh) 标签数据的生成方法和装置
CN111860696A (zh) 字符注册方法、装置、电子设备及存储介质
JP2024022192A (ja) 学習データ生成装置、学習装置、予測装置、学習データ生成方法、学習方法、予測方法、及びプログラム