TWM627419U

TWM627419U - 文件辨識系統

Info

Publication number: TWM627419U
Application number: TW111200505U
Authority: TW
Inventors: 黃揚文
Original assignee: 基嘉科技股份有限公司
Priority date: 2022-01-13
Filing date: 2022-01-13
Publication date: 2022-05-21

Abstract

一種文件辨識系統，經由掃描裝置掃描一文件並取得一文件影像。文件識別系統包括一影像處理模組、一儲存模組、一第一辨識模組及一第二辨識模組。影像處理模組從掃描裝置接收文件影像。儲存模組儲存有多個文件樣板與多個識別模型，文件樣板與識別模型相對應。第一辨識模組適於取得文件影像，第一辨識模組適於從文件影像中辨識出多個關鍵特徵資料，並找出所對應的文件樣板。第二辨識模組適於根據第一辨識模組所找出的文件樣板而載入對應的識別模型，以識別模型對文件影像實施辨識，取得多筆文字資料，並將文字資料填入對應的內容欄目。

Description

文件辨識系統

一種辨識系統與方法，特別是一種文件的辨識系統與方法。

公文是公部門訊息往來的文件，同時也是公部門辦理公務的重要依據，在特定場合也具有一定的法律效力，是相當重要的文件。而且，基於其重要性，目前公文仍是以紙本的形式收發為主。

此外，我國法規亦規定公文依據其重要性，都有不同的保存年限。換言之，幾乎所有的公文都必須被保存。如今，隨著時代進步，大多公文都會電子化進行數位保存，以利調閱與查詢。

然而，紙本公文在進行數位保存時，仍仰賴人工登打，也就是由人員逐字輸入到電腦系統內，需要花費大量的時間，特別是某些公文收發量特別大的部門，需要更多時間來處理這些公文，並且人員登打非常容易出錯，後須追蹤比對也不容易。

因此，如何解決上述問題便是本領具通常知識者值得去思量的。

有鑑於此，本創作提供一種文件辨識系統與方法，使用文字辨識技術將文件中的文字轉換為可編輯的數位文字資料，並依據其欄目自動歸納資料。大幅降低人工登打文件所需的時間，也減少出錯的機率。其具體技術手段如下：一種文件辨識系統，適於辨識至少一文件，該文件識別系統包括一掃描裝置、一顯示器及至少一伺服器。掃描裝置適於掃描該文件並取得一文件影像。伺服器，連接至該顯示器與該掃描裝置，該伺服器包括一影像處理模組、一儲存模組、一第一辨識模組、一第二辨識模組、一定位模組及一顯示模組。影像處理模組連接至該掃描裝置並接收該文件影像。儲存模組儲存有多個文件樣板與多個識別模型，所述文件樣板與所述識別模型相對應。第一辨識模組從該影像處理模組擷取該文件影像，該第一辨識模組，從該影像處理模組擷取該文件影像，該第一辨識模組適於對該文件影像實施文字辨識，取得多筆文字資料。第二辨識模組適於根據該第一辨識模組所取得的多筆文字資料找出對應的該文件樣板而載入對應的該識別模型，以該識別模型從該文字資料中找出多個標題資料，並根據該標題資料將所述文字資料填入對應的多個內容欄目。定位模組適於取得所述文字資料在該文件影像上對應的一座標資料。顯示模組當該內容欄目內的某一所述文字資料被點擊，該顯示模組在一顯示器上顯示該文件影像與一圖標，該圖標是根據被點擊的該文字資料所對應的該座標資料顯示於該文件影像上。

上述之文件辨識系統，其中，該影像處理模組還適於對該文件影像實施二值化。

上述之文件辨識系統，其中，該伺服器還包括一掃描控制模組，該掃描控制模組適於從該文件影像中偵測至少一特徵圖形，當該掃描控制模組偵測到該特徵圖形，將該文件影像儲存為一文件檔案。

上述之文件辨識系統，其中，該特徵圖案為條碼圖案。

1:文件辨識系統

10:掃描裝置

100:伺服器

110:影像處理模組

120:儲存模組

130:第一辨識模組

140:第二辨識模組

150:定位模組

160:顯示模組

170:掃描控制模組

20:顯示器

21:上視窗

22:下視窗

201:操作介面

210、210a~210i:文件影像

211:文字資料

212:標題欄目

212a~212c:特徵圖形

220:內容欄目

221:文字

222:圖標

S10~S70:流程圖步驟

圖1所繪示為本創作之文件辨識系統。

圖2A至圖2C所繪示為文字辨識的示意圖。

圖2D所繪示為定位與顯示的示意圖。

圖3所繪示為掃描控制的示意圖。

圖4A所繪示為本創作的文件辨識方法。

圖4B所繪示為另一實施例的文件辨識方法。

請參閱圖1，圖1所繪示為本創作之文件辨識系統。本創作之文件辨識系統1適於辨識一文件，此文件例如為公家機關所發出的公文。且文件辨識系統1包括了一伺服器100、一掃描裝置10與一顯示器20，其中伺服器100是連接至掃描裝置10與顯示器20。掃描裝置10即為掃描器(scanner)，是一種可將紙本文件轉換成數位影像的裝置，因此掃描裝置10可經由掃描文件而取得一文件影像。伺服器100還與一顯示器20相連接。顯示器20適於顯示伺服器100的操作介面，提供使用者瀏覽與操作。

伺服器100為本創作之文件辨識系統1主要的運算裝置。伺服器100包括一影像處理模組110、一儲存模組120、一第一辨識模組130、一第二辨識模組140、一定位模組150、一顯示模組160與一掃描控制模組170。在本實施例中，上述這些功能模組例如是用軟體的來實現各自的功能。

在本實施例中，影像處理模組110是連接至掃描裝置10並接收文件影像。影像處理模組110可提供多種影像處理功能，例如調整亮度、對比、色調等。在一實施例中，影像處理模組110還適於對文件影像實施二值化，二值化是指將文件影像中的灰階調整為僅有黑與白。舉例來說，在像素的灰階值0-255之中取一閥值，大於閥值的像素全數調整為255(白)，小於閥值的像素則全數調整為0(黑)。如此一來影像變僅剩下黑與白的色塊。而對文件影像實施二值化，可讓文件影像中的文字更為清晰，以利後續的辨識。

儲存模組120適於儲存多個文件樣板與多個識別模型，而這些文件樣板與識別模型是相對應。具體來說，文件樣板為不同類型公文的樣板，例如呈、函、書函、簽、報告、電報、咨、公告、通告、通知、證明書、移文、退文、開會通知、公示送達、公務電話紀錄、令或手諭等類型的公文，均有各自的樣板。而識別模型與這些樣板相對應，也就是說每一種類型的公文都有對應的識別模型。在本實施例中，識別模型則是針對不同種類公文的辨識邏輯。

第一辨識模組130將從影像處理模組110擷取文件影像，並對文件影像實施文字辨識，取得多筆文字資料。在本實施例中，第一辨識模組130是以光學字元辨識(英語：Optical Character Recognition，OCR)來辨識文件影像的內容，以此取得對應的文字資料，例如：文件影像中的字母、單字、數字或國字，並轉換為可編輯的數位文字。

第二辨識模組140適於根據第一辨識模組130所取得的多筆文字資料找出對應的文件樣板而載入對應的識別模型。換句話說，第二辨識模組140會從文件影像中找出某些關鍵特徵，來識別文件影像所對應的公文類別，關鍵特徵例如為文件抬頭(發文單位名稱後方的文字)、文末印鑑圖像或公文標題排列等。進一步利用這些關鍵特徵與文件樣板的相似程度判斷文件影像的公文類別，例如以符合程度的百分比判斷，符合程度大於一定百分比，則可判定該文件影像所屬的公文類別。在其他實施例中，第二辨識模組140是包括經過數據訓練的人工智慧模型，並以人工智慧模型運算並比對文字資料與文件樣板，找出最接近的文件樣板。

第二辨識模組140還適於以識別模型從文字資料中找出多個標題資料，並根據標題資料將文字資料填入對應的內容欄目。也就是說，第一辨識模組130辨識出文字資料後，第二辨識模組140便以對應的識別模組(辨識邏輯)來辨識文件影像，從中找出標題資料，例如「主旨」、「說明」或「辦法」等標題。接著，利用所找出的標題，擷取對應的文字資料，即依附於該標題的內容，將這些內容填入對應的內容欄目。

請參閱圖2A至圖2C，圖2A至圖2C所繪示為文字辨識的示意圖。請先參閱圖2A，伺服器100會在顯示器20上顯示一操作介面201，並且操作介面201包括上視窗21與下視窗22。上視窗21適於顯示文件影像，而下視窗具有多個標題欄目212與多個內容欄目220，其中標題欄目212與內容欄目220會根據識別模組而有所不同。

接著請參閱圖2B與圖2C，文件影像210被載入，並顯示於上視窗21中，並且經過第二辨識模組140的辨識後，所取得的文字資料211則會被填入對應的內容欄目220。例如「收發文號」標題欄目212的內容欄目220，便會填入「O字第OOOOOOOO號」的文字資料211，便是對應至文件影像210中發文字號的內容1(對應文件影像210中的「發文字號」)。圖2C則是可捲動上視窗21，下方的內容欄目220則隨著文件影像210的位置與內容轉換。此時，被填入內容欄目220的文字資料211為可編輯的數位文字，可進行刪減或複製等操作。進一步的，這些文字資料211可輸出並儲存成文字檔案，例如doc檔案，可供使用者以常用的文書軟體進行編輯使用。

請返參圖1，定位模組150適於取得文字資料在文件影像上對應的一座標資料。也就是說，當第二辨識模組140取得文字資料時，定位模組150同時會取得文字資料在文件影像上對應的位置。具體來說，文件影像是一種像素化的資料，座標資料基於文件影像的像素而形成，也就是文字資料在文件影像上對應的像素點位，若為多頁的文件影像，則是以頁數與像素點為做為座標資料的根據。顯示模組160適於顯示器20上顯示文件影像與一圖標。當內容欄目內的某所述文字資料被點擊，顯示模組160便在顯示器20上顯示文件影像與圖標，其中圖標是根據被點擊的文字資料所對應的座標資料顯示於文件影像上。

請參閱圖2D，圖2D所繪示為定位與顯示的示意圖。所取得的文字資料211會顯示在內容欄目220中，而當使用者點擊文字資料211，例如圖2D中被點擊的文字221。此時上視窗21便會顯示對應文件影像210的位置，並在該位置上顯示一圖標222，圖標222的位置便是根據文字資料211所對應的座標資料顯示。例如被點擊的文字221為「第」，上視窗21便會顯示文字「第」在文件影像210的位置，並以圖標222標示文字「第」，讓使用者更能確認文字221在文件影像210上的位置。進一步比對文字辨識結果是否正確。

請返參圖1，伺服器100還包括一掃描控制模組170，掃描控制模組170適於從文件影像中偵測至少一特徵圖形，當掃描控制模組170偵測到特徵圖形，將文件影像儲存為一文件檔案。

請參閱圖3，圖3所繪示為掃描控制的示意圖。當文件為多頁文件時，掃描裝置10可逐頁掃描，便會形成數個文件影像210a~210i。當掃描控制模組170從這些文件影像210a~210i偵測特徵圖形212a~212c，在偵測到特徵圖形212a後，便將形成的文件影像210a儲存為一文件檔案。隨後掃描控制模組170繼續偵測特徵圖形，偵測到第二個特徵圖形212b，便將掃描到的文件影像210b~210e儲存為另一文件檔案。因此，當偵測到第三個特徵圖形212c後，將文件影像210f~210h儲存再存為另一文件檔案。剩餘的文件影像210i儲存為另一文件檔案。

因此，使用者可將多份文件一次使用掃描裝置10進行掃描，並且在文件上預先設置特徵圖形(例如為條碼圖案)，作為文件分隔的標記，個別儲存為不同的文件檔案。如此掃描控制模組170便可利用這些特徵圖形來區隔這些文件，達到批次掃描的功效。並且，所分別儲存的文件檔案，則可分別經由第一辨識模組130與第二辨識模組140進行辨識，擷取其中的文字資料。如此一來使用者便可透過伺服器100一次性處理大量的文件。

以下說明本創作辨識文件的方法。其中，相同元件將標以相同的符號，且不做詳細的敘述。

請參閱圖4A，圖4A所繪示為本創作的文件辨識方法。首先，進行步驟S10，使用掃描裝置10掃描一文件取得文件影像，即是將紙本文件轉換為數位檔案。接著，進行步驟S20，以文字辨識偵測文件影像，取得多筆文字資料，也就是將文件影像中的文字轉化為數位文字。之後，進行步驟S30，將文字資料與多個文件樣板比較，選出符合的所述文件樣板，便是將所找出的文字與預先儲存之各類型的文件樣板比較，以便找出最適當的文件樣板，以辨識所掃描的文件類型。

接下來，進行步驟S40，根據步驟S30所選用的文件樣板，選用對應的識別模型，也就是根據文件類型選用適當的辨識邏輯。再來，進行步驟S50，以所選用的識別模型對文件影像進行辨識，找出多個標題資料，例如「主旨」或「說明」等標題。取得標題資料之後，進行步驟S60，取得所述文字資料在文件影像上對應的多個座標資料，即是找出每個文字資料的來源，透過座標確認這些文字資料在文件影像上的位置。接下來，進行步驟S70，將所取得的文件資料填入對應標題資料的內容欄目，也就是將辨識出的文字依照其所屬的標題，填入對應的內容欄目。

在一實施例中，進行步驟S70之後，若使用者點擊內容欄目中的文字資料後，便顯示該文字資料在文件影像上的位置，並以圖標標記對應的文字(參閱圖2B)，方便追蹤文字的來源。

請參閱圖4B，圖4B所繪示為另一實施例的文件辨識方法。在此實施例中，當文件為多頁時，在步驟S10與步驟S20之間可進行步驟S11，從文件影像中偵測一特徵圖形，從文件中尋找條碼等特徵圖形。接著，進行步驟S12，偵測到特徵圖形後，將文件影像儲存為一文件檔案，即是以特徵圖形作為儲存的分隔點，個別儲存這些文件影像，區分不同的文件(參閱圖3)。進一步的，在步驟S10與步驟S20之間可進行步驟S13，對文件影像實施二值化，二值化可將文件影像轉換為只有黑與白的影像，有利於提高辨識的準確度。

本創作提供上述的文件辨識系統1與文件辨識方法，透過文字辨識來辨識傳統的紙本文件，將紙本文件上的文字轉換為可編輯的數位文字資料。並可透根據為文件的欄目自動歸類整理，將轉換出的文字資料填入對應的欄目裡，如此便可將紙本文件電子化。且數位化的文字資料更便於編輯、查詢與檢索使用，提高文件保存與歸檔的效率，減少人為錯誤的可能。

本創作以實施例說明如上，然其並非用以限定本創作所主張之專利權利範圍。其專利保護範圍當視後附之申請專利範圍及其等同領域而定。凡本領域具有通常知識者，在不脫離本專利精神或範圍內，所作之更動或潤飾，均屬於本創作所揭示精神下所完成之等效改變或設計，且應包含在下述之申請專利範圍內。