TWM593008U - 表單內容辨識系統 - Google Patents
表單內容辨識系統 Download PDFInfo
- Publication number
- TWM593008U TWM593008U TW108213640U TW108213640U TWM593008U TW M593008 U TWM593008 U TW M593008U TW 108213640 U TW108213640 U TW 108213640U TW 108213640 U TW108213640 U TW 108213640U TW M593008 U TWM593008 U TW M593008U
- Authority
- TW
- Taiwan
- Prior art keywords
- text
- content
- features
- module
- recognition
- Prior art date
Links
- 238000012015 optical character recognition Methods 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
一種表單內容辨識系統,其包含一用以提取一表單之表格線條特徵及表格間隔特徵表格辨識模組,一文字辨識模組用以提取該表單影像中之文字特徵及文字間隔特徵;以及一表單內容形成模組,依據該表格之相對列位置、該文字特徵之相對行位置及該文字內容產生一表單辨識檔。其中,表單內容辨識系統能夠判斷表格之相對列位置以及表格內文字特徵之相對行位置。
Description
本新型是有關於一種表單內容辨識系統,特別是指一種利用光學字元識別技術提取表單內的表格與文字的辨識系統及方法。
在日常活動中,為了讓人們方便填寫文件,並提高文件的可讀性,利用表格的方式呈現文件內容是相當常見的方式。然而,隨著表格使用量的迅速增長,以人力閱讀後再輸入的方式已逐漸不敷使用,因此,透過電腦系統來辨識文件就成了一個趨勢。但以表格方式呈現的文件,由於表格文件通常包含了表格與文字,且在表格的形態上往往也會隨著使用者的需要而變化出各式各樣不同的欄位與格線,在辨識上較單純僅載有文字的文件辨識來得更為困難,且表格內的文字又有字體、大小、位置偏移、多行換列的狀況,使得辨識上更為困難,且對於電腦系統的負擔日益加重。據此,為提高電腦系統的辨識能力,習知技術採用事先設定好的文件模板、辨識區塊、相應的文件模板名稱或編號,當電腦系統辨識出文件模板名稱或編號時,便自動帶入文件模板,並針對事先設定好的辨識區塊進行辨識,從而減輕電腦系統的負擔。另外,亦有人開發出單純以特徵詞語判斷對應的文字內容,或者以光學字元識別技術識別文件內容後,再以手動方式判斷與圈選出表格欄位的位置與範圍。
因此,如何在無需事先建立表格模板狀況下能夠自動正確地辨識出表單內容,實為相關業者目前所欲解決的問題。
有鑑於此,本創作提出一種表單內容辨識系統,透過光學字元識別技術處理表單影像,並提取表單中的表格線條特徵及表格間隔特徵,再以一預定方向提取文字特徵並判斷該文字特徵之相對位置,最後產生一表單辨識檔。
根據本創作之一實施例,表單內容辨識系統包含一表格辨識模組,用以接收一表單影像,透過光學字元識別技術提取該表單影像中之一表格之表格線條特徵及表格間隔特徵,其中該表格辨識模組依據該表格線條特徵與該表格間隔特徵判斷該表格之相對列位置;一文字辨識模組,透過光學字元識別技術提取該表單影像中之文字特徵及文字間隔特徵,其中該文字識別模組係以一預定方向於同一行之該表格內逐行提取該文字特徵,該文字辨識模組依據該文字間隔特徵判斷該文字特徵之相對位置,並進行文字辨識以產生一文字內容;以及一表單內容形成模組,依據該表格之相對位置、該文字特徵之相對位置及該文字內容產生一表單辨識檔。
為使本創作之技術內容、目的及優點更容易理解,下面將結合附圖對本創作的實施方式作進一步地詳細描述,然而,新型性概念可以不同形式體現且不應被解釋為限於本文中所闡述之實例實施例,本描述係為本創作概念之代表性實施例之描述,並不意欲限制本創作之範疇。
如圖1所示,根據本創作之一實施例,本創作之表單內容辨識系統,包含一表格辨識模組101、一文字辨識模組102以及一表單內容形成模組103。本文中所稱之「模組」可為具有特定功能性、操作及/或輸出之硬體、韌體、軟體或其組合。模組具體可以由電腦晶片或者由具有相應功能的電子產品來實現,例如可以為伺服器、個人電腦、筆記型電腦、行動電話、智慧電話、個人數位助理、平板電腦、可穿戴裝置或者這些裝置中的任何裝置的組合,也可以是以用戶端-伺服器(Client/Server)架構來實現,例如使用者自一用戶端提供表單影像,經過網路將表單影像提供給運行於一伺服器之表單內容辨識系統進行辨識。
本創作之表格辨識模組101係一具有資訊接收與光學字元識別技術之功能模組,用以接收一表單影像,並透過光學字元識別技術提取該表單影像中之一表格之表格線條特徵及表格間隔特徵,其中該表格辨識模組101依據該表格線條特徵與該表格間隔特徵判斷該表格之相對列位置。在本實施例中,光學字元識別技術之功能內建於表格辨識模組101中;在其他實施例中,光學字元識別技術係由一光學字元識別模組提供,且光學字元識別模組與表格辨識模組101連接,自表格辨識模組101接收表單影像並進行表格線條特徵及表格間隔特徵提取後,將表格線條特徵及表格間隔特徵提取結果提供給表格辨識模組101。
文字辨識模組102,透過光學字元識別技術提取該表單影像中之文字特徵及文字間隔特徵,其中該文字識別模組係以一預定方向於同一行之該表格內逐行提取該文字特徵, 該文字辨識模組102依據該文字間隔特徵判斷該文字特徵之相對行位置,並進行文字辨識以產生一文字內容。在本實施例中,光學字元識別技術之功能內建於文字辨識模組102中;在其他實施例中,光學字元識別技術係由一光學字元識別模組提供,且光學字元識別模組與文字辨識模組102連接,自文字辨識模組102接收表單影像並進行文字特徵提取後,將文字特徵提取結果提供給表格辨識模組101。
表單內容形成模組103,係分別自表格辨識模組101與文字辨識模組102接收表格之相對列位置、文字特徵之相對行位置及文字內容,接著將表格之相對列位置與文字特徵之相對行位置進行對比,於相對位置相同時,將相對位置相同的表格及文字內容結合,藉此產生一表單辨識檔。
以下結合圖2、圖3與圖4說明,圖2的流程圖示出的步驟可以在諸如一組電腦可執行指令的電腦系統中執行,並且,雖然在流程圖中示出了邏輯順序,但應理解在不同情況下,可以不同於此例示之順序執行所示出或描述的步驟。
本實施例之表單內容辨識系統之實施流程如圖2所示,該系統之實施流程包含步驟S201-S206。於步驟S201,表單內容辨識系統100接收一表單影像,表單影像如圖3所示。於步驟S202,表單內容辨識系統100之表格辨識模組101接收表單影像後,透過光學字元識別技術以一第一預定方向D1逐步提取圖3表格影像中的複數個表格線條特徵,表格線條特徵包含水平格線與垂直格線,水平格線例如FH1與FH2,垂直格線例如FV1-FV5,表格辨識模組101還會提取出表格間隔特徵FS。
表格辨識模組101沿第一預定方向D1提取時,首先會提取出第一條水平格線FH1,接著提取出垂直格線例如FV1-FV5,其中當表格間隔特徵FS介於一影像邊界與一垂直格線FV1之間時,判斷為垂直格線FV1為第一列R1的一端,同理,垂直格線FV5為列R1的另一端,藉此表格辨識模組101即可判斷列R1的兩端界線,而介於垂直格線FV1與FV5之間的FV2-FV4,判斷為第一列R1列內的不同欄位之垂直格線。接著,表格辨識模組101沿第一預定方向D1提取出水平格線FH2,並依據水平格線FH1-FH2與垂直格線FV1-FV5提取出R1列的格式。完成第一列R1提取後,表格辨識模組101繼續進行其他列的表格線條特徵與表格間隔特徵,已完成各列R2-R5的相對列位置以及列內的欄位的提取。
於步驟S203,表單內容辨識系統100之文字辨識模組102接收表單影像後,透過光學字元識別技術以第一預定方向D1逐列提取該表單影像中之文字特徵及文字間隔特徵,文字間隔特徵如圖3之文字間隔WS。
於步驟S204,依據該文字間隔特徵判斷該文字特徵之相對行位置,其中一該文字特徵以該文字間隔特徵與另一該文字特徵沿垂直於第一預定方向D1之第二預定方向D2相鄰時,判斷該文字特徵之相對位置為同一行。如圖4所示,文字辨識模組102讀取文字特徵時,還可以對文字特徵進行中心位置判斷,並利用文字特徵之中心位置與文字間隔WS進行相對行位置之判斷。
請參閱圖3與圖4,首先,文字辨識模組102沿第一預定方向D1辨識文字時,先辨識出「敦化南路一段」之文字特徵,再辨識出「F123456789」、「王小明」、「70.9.9」以及「臺北市」文字特徵,最後再辨識出「108號14樓」。其中,「臺北市」文字特徵之中心位置與「敦化南路一段」文字特徵之中心位置不在同一位置上,即「臺北市」與「敦化南路一段」之間未能以文字間隔特徵WS沿垂直於該預定方向之方向D2相鄰,判斷為該列內欄位之不同行,且由於「敦化南路一段」為最先辨識出之文字特徵,文字辨識模組102判斷「敦化南路一段」為第一行L1。而「王小明」之中心位置與另一文字特徵「F123456789」之中心位置相同且以文字間隔特徵WS沿垂直於該預定方向之方向D2相鄰,判斷「王小明」與「F123456789」之相對位置為該列內欄位之同行,同理文字辨識模組102判斷「F123456789」、「王小明」、「70.9.9」以及「臺北市」為同一行並判斷為第二行L2。再者,「臺北市」與「108號14樓」之間未能以文字間隔特徵WS沿垂直於該預定方向之方向D2相鄰,判斷為該列內欄位之不同行,且由於文字辨識模組102先辨識第二行L2之文字特徵「臺北市」後才辨識出「108號14樓」,因此文字辨識模組102判斷「108號14樓」為第三行L3。據此,文字辨識模組102能判斷文字特徵之相對行位置,即文字辨識模組102能辨識出同一列中不同行的文字特徵。
於步驟S205,文字辨識模組102對L1-L3之文字特徵進行文字辨識以產生一文字內容。文字辨識係指將表單影像中可能為文字的內容並予以文字化,包含文字、數字及/或標點符號。在其他實施例中,文字辨識模組102可以依一預設規則辨識特定行之文字特徵,例如僅辨識第一行L1、僅辨識第二行L2、僅辨識第三行L3或僅辨識第一行L1與第二行L2之文字特徵。
於步驟S206,依據該表格之相對位置、該文字特徵之相對位置及該文字內容產生一表單辨識檔。表單內容形成模組103自表格辨識模組101與文字辨識模組102分別接收表格之相對列位置、文字特徵之相對位置及文字內容後,對表格之相對位置與文字特徵之相對位置進行對比,於相對位置相同時,表單內容形成模組103將相對位置相同的表格及文字內容結合,藉此產生一表單辨識檔。
在另一實施例中,如圖5所示,本另一實施例之表單內容辨識系統100與圖1之實施例相比更包含一影像處理模組104以及一語意分析模組105。
影像處理模組104係用以接收該表單影像並對表單影像進行影像預處理,以提高表單影像之可識別性,且影像處理模組104與表格辨識模組101、文字辨識模組102連接,以將預處理後的表單影像提供給表格辨識模組101與文字辨識模組102。所述影像預處理係指進行影像標準化處理,例如對表單影像進行傾斜校正調整、梯形校正調整、解析度調整、亮度調整、對比度調整、尺寸調整、雜訊去除、浮水印去除等。如圖6所示,表單內容辨識系統之實施流程於接收表單影像步驟S601後,由影像處理模組104進行影像預處理步驟S602。
在本實施例中,本表單內容辨識系統100於完成表單內容辨識系統之實施流程之步驟S603至S606後,產生一文字內容。接著於步驟S607,由語意分析模組105分析所述文字內容並產生一語意分析結果,語意分析係將辨識而得的文字提供給進行斷句以產生複數個詞彙,如被保險人、姓名、身分證、證號、出生年、年月、聯絡、地址、保險內容、繳費、年繳、保費等,但不限於此。語意分析模組105以所述詞彙向一詞彙資料庫(未圖示)查詢是否有相同或相似的內容,如資料庫查詢有相同或相似的詞彙,則確認該詞彙之語意。前述資料庫可以是包含至少一個詞彙對照表或詞彙清單;在其他實施例中,資料庫可以是一或多個具有資訊儲存功能之設備。接著進行步驟S608,依據表格之相對位置、文字特徵之相對位置及文字內容產生一表單辨識檔。
在其他實施例中,文字辨識模組102包含一神經網路單元,用以執行神經網路演算法以進行文字區塊識別與文字特徵提取,神經網路演算法可包含多層感知器演算法、人工神經網路演算法(Artificial Neural Networks;ANN)、卷積神經網路(Convolutional Neural Networks;CNN)演算法、區域卷積神經網路(Reginal convolutional Neural Networks;RCNN)演算法、遞歸神經網路(Recurrent neural networks;RNN)演算法等。
在其他實施例中,語意分析模組105包含一神經網路單元,用以執行神經網路演算法以進行文字內容分析以產生一語意分析結果,神經網路演算法可包含多層感知器演算法、人工神經網路演算法、卷積神經網路演算法、區域卷積神經網路演算法、遞歸神經網路演算法等。
在其他實施例中,本創作之表單內容辨識系統100還可以包含一影像獲取模組(未圖示),用以取得一表單影像,影像獲取模組可用以接收一影像之光學訊號並轉換為該影像之數位訊號,例如相機、手機照相模組等具有影像感測單元之影像獲取模組。
雖然本創作已以實施例揭露如上實施例,然其並非用以限定本創作,任何所屬技術領域中具有通常知識者,在不脫離本創作之精神和範圍內,當可作些許之更動與修飾,皆應為本專利所主張之權利範圍,故本專利之保護範圍當視後附之專利申請範圍所界定者為準。
100:表單內容辨識系統
101:表格辨識模組
102:文字辨識模組
103:表單內容形成模組
104:影像處理模組
105:語意分析模組
S201-S206:步驟
S601-S608:步驟
D1:第一預定方向
D2:第二預定方向
FV1-FV5:垂直格線
FH1-FH2:水平格線
R1-R5:列
WS:文字間隔
FS:表格間隔
L1-L3:行
圖1為本創作之表單內容辨識系統之一實施例示意圖。
圖2為本創作之表單內容辨識系統之一實施例之實施流程示意圖。
圖3為本創作之一種表單影像之一實施例。
圖4為本創作之一種表單內容辨識方法之文字特徵之相對行位置判斷示意圖。
圖5為本創作之表單內容辨識系統之另一實施例示意圖。
圖6為本創作之表單內容辨識系統之另一實施例之實施流程示意圖。
100:表單內容辨識系統
101:表格辨識模組
102:文字辨識模組
103:表單內容形成模組
Claims (5)
- 一種表單內容辨識系統,運用一電腦裝置內,包含下列模組:一表格辨識模組,用以接收一表單影像,透過光學字元識別技術提取該表單影像中之一表格之表格線條特徵及表格間隔特徵,其中該表格辨識模組依據該表格線條特徵與該表格間隔特徵判斷該表格之相對列位置;一文字辨識模組,透過光學字元識別技術提取該表單影像中之文字特徵及文字間隔特徵,其中該文字識別模組係以一預定方向於同一列之該表格內逐行提取該文字特徵,該文字辨識模組依據該文字間隔特徵判斷該文字特徵之相對行位置,並進行文字辨識以產生一文字內容;以及一表單內容形成模組,依據該表格之相對位置、該文字特徵之相對位置及該文字內容產生一表單辨識檔。
- 如請求項1所述之表單內容辨識系統,更包括一影像處理模組,用以接收該表單影像並對表單影像進行影像預處理。
- 如請求項1所述之表單內容辨識系統,其中更包括一語意分析模組,用以分析該文字內容並產生一語意分析結果。
- 如請求項1所述之表單內容辨識系統,其中該文字辨識模組更包括一神經網路單元,用以提取該文字特徵。
- 如請求項3所述之表單內容辨識系統,其中該語意分析模組更包括一神經網路單元,用以分析該文字內容並產生該語意分析結果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108213640U TWM593008U (zh) | 2019-10-16 | 2019-10-16 | 表單內容辨識系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108213640U TWM593008U (zh) | 2019-10-16 | 2019-10-16 | 表單內容辨識系統 |
Publications (1)
Publication Number | Publication Date |
---|---|
TWM593008U true TWM593008U (zh) | 2020-04-01 |
Family
ID=71133288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108213640U TWM593008U (zh) | 2019-10-16 | 2019-10-16 | 表單內容辨識系統 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWM593008U (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI748781B (zh) * | 2020-12-03 | 2021-12-01 | 玉山商業銀行股份有限公司 | 文件內容識別方法、金融服務申請審核方法與系統 |
-
2019
- 2019-10-16 TW TW108213640U patent/TWM593008U/zh not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI748781B (zh) * | 2020-12-03 | 2021-12-01 | 玉山商業銀行股份有限公司 | 文件內容識別方法、金融服務申請審核方法與系統 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853638B2 (en) | System and method for extracting structured information from image documents | |
US10846553B2 (en) | Recognizing typewritten and handwritten characters using end-to-end deep learning | |
EP3440591B1 (en) | Improving optical character recognition (ocr) accuracy by combining results across video frames | |
US9922247B2 (en) | Comparing documents using a trusted source | |
CN106326888B (zh) | 图像识别方法和装置 | |
US9098765B2 (en) | Systems and methods for capturing and storing image data from a negotiable instrument | |
Demilew et al. | Ancient Geez script recognition using deep learning | |
CN109872784A (zh) | 智能病历生成方法、装置、计算机设备以及存储介质 | |
CN112257613A (zh) | 体检报告信息结构化提取方法、装置及计算机设备 | |
US10163007B2 (en) | Detecting orientation of textual documents on a live camera feed | |
US20140233835A1 (en) | Systems and methods for recreating an image using white space and check element capture | |
US11961094B2 (en) | Fraud detection via automated handwriting clustering | |
CN112883980A (zh) | 一种数据处理方法及系统 | |
TWM593008U (zh) | 表單內容辨識系統 | |
RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
TW202117589A (zh) | 表單內容辨識系統及其方法 | |
CN116825269A (zh) | 体检报告的处理方法、装置、电子设备和可读存储介质 | |
WO2022156088A1 (zh) | 指纹签名生成方法、装置、电子设备及计算机存储介质 | |
Cai et al. | Bank card and ID card number recognition in Android financial APP | |
US11335108B2 (en) | System and method to recognise characters from an image | |
Sisodia et al. | A conglomerate technique for finger print recognition using phone camera captured images | |
Ajao et al. | Yoruba handwriting word recognition quality evaluation of preprocessing attributes using information theory approach | |
CN113705560A (zh) | 基于图像识别的数据提取方法、装置、设备及存储介质 | |
Snoussi et al. | Arabic document segmentation on a smartphone towards Big Data HAJJ rules extraction | |
Gupta et al. | Table detection and metadata extraction in document images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4K | Annulment or lapse of a utility model due to non-payment of fees |