TWI821128B - 資料核對系統及其方法 - Google Patents
資料核對系統及其方法 Download PDFInfo
- Publication number
- TWI821128B TWI821128B TW112106651A TW112106651A TWI821128B TW I821128 B TWI821128 B TW I821128B TW 112106651 A TW112106651 A TW 112106651A TW 112106651 A TW112106651 A TW 112106651A TW I821128 B TWI821128 B TW I821128B
- Authority
- TW
- Taiwan
- Prior art keywords
- verification
- deposit
- historical
- file
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012795 verification Methods 0.000 claims abstract description 142
- 238000006243 chemical reaction Methods 0.000 claims abstract description 28
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 238000013524 data verification Methods 0.000 claims description 26
- 238000012546 transfer Methods 0.000 claims description 22
- 238000010801 machine learning Methods 0.000 claims description 10
- 238000012706 support-vector machine Methods 0.000 claims description 9
- 238000007637 random forest analysis Methods 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
一種資料核對系統及其方法,包括收發器、儲存媒體及處理器。處理器存取並執行儲存媒體所儲存的模組及資料庫。備份模組將使用者填寫的存匯文件備份為核對文件,其中核對文件的核對文件編號與歷史存匯記錄資料的歷史存匯文件編號對應。辨識模組依據核對文件進行文字及文字位置辨識。轉換模組將核對文件中的存匯額度轉換為第一數字資訊,且將歷史存匯記錄資料的歷史存匯額度轉換為第二數字資訊。計算模組計算相似指標資訊。模型建立模組建立相異性機率模型。通知模組計算待測核對文件的模型相異性機率,以判定是否發出通知資訊進行人工核對。
Description
本發明是有關於資料管理,且特別是有關於一種資料核對系統及其方法。
由於客戶於銀行行使相關銀行事務(例如存匯事務)完成後,通常承辦人員需要將相關文件進行初步確認額度與進行處理並記錄於系統中,後續需要由上級主管再次確認客戶實際填寫的額度與系統紀錄是否一致,若相關文件數量較大的時候,則需要花費大量時間與人力進行一一核對處理,不僅影響處理效率且容易出錯。
本發明提供一種資料核對系統及其方法,不僅減少人工核對花費的人力物力成本,並且同時優化核對管理流程,減少人工核對容易產生的疏漏問題。
本發明的一種資料核對系統,包括收發器、儲存媒體以及處理器。儲存媒體用以儲存多個模組以及資料庫,資料庫用以儲存多個歷史存匯記錄資料,歷史存匯記錄資料包括多個存匯項目及歷史存匯文件編號,存匯項目至少包括歷史存匯額度。處理器耦接至儲存媒體以及收發器,處理器存取並執行儲存媒體所儲存的備份模組、辨識模組、轉換模組、計算模組、模型建立模組、通知模組以及資料庫。備份模組用以將各使用者填寫的存匯文件備份為核對文件,其中核對文件的核對文件編號與歷史存匯記錄資料的歷史存匯文件編號一一對應,核對文件包括多個核對項目,核對項目至少包括存匯額度。辨識模組與備份模組電性連接,依據核對文件進行文字辨識及文字位置辨識,獲取各核對項目對應的文字資訊及文字位置資訊。轉換模組與辨識模組電性連接,依據核對文件編號、文字資訊及文字位置資訊將核對文件中的存匯額度轉換為第一數字資訊,並且依據歷史存匯文件編號將歷史存匯記錄資料的歷史存匯額度轉換為第二數字資訊。計算模組與轉換模組電性連接,依據核對文件編號、歷史存匯文件編號、第一數字資訊及第二數字資訊計算相似指標資訊。模型建立模組與計算模組電性連接,以依據相似指標資訊及機器學習方法建立相異性機率模型。通知模組分別與備份模組及模型建立模組電性連接,從備份模組獲取待測核對文件,依據待測核對文件及相異性機率模型計算待測核對文件的模型相異性機率,以依據機率閾值及模型相異性機率判斷是否需進行人工核對,以判定是否發出通知資訊。
本發明的一種資料核對方法,其中該方法包括:儲存多個歷史存匯記錄資料,歷史存匯記錄資料包括多個存匯項目及歷史存匯文件編號,存匯項目至少包括歷史存匯額度;使用者將各使用者填寫的存匯文件備份為核對文件,其中核對文件的核對文件編號與歷史存匯記錄資料的歷史存匯文件編號一一對應,核對文件包括多個核對項目,核對項目至少包括存匯額度;依據核對文件進行文字辨識及文字位置辨識,獲取各核對項目對應的文字資訊及文字位置資訊;依據核對文件編號、文字資訊及文字位置資訊將核對文件中的存匯額度轉換為第一數字資訊,並且依據歷史存匯文件編號將歷史存匯記錄資料的歷史存匯額度轉換為第二數字資訊;依據核對文件編號、歷史存匯文件編號、第一數字資訊及第二數字資訊計算相似指標資訊;依據相似指標資訊及機器學習方法建立相異性機率模型;以及獲取待測核對文件,依據待測核對文件及相異性機率模型計算待測核對文件的模型相異性機率,以依據機率閾值及模型相異性機率判斷是否需進行人工核對,以判定是否發出通知資訊。
基於上述,本發明提供一種資料核對系統及其方法,透過自動化方式在取得相關文件後,經由資料核對系統建立相異性機率模型,不僅減少人工核對花費的人力物力成本,並且同時優化核對管理流程,減少人工核對容易產生的疏漏問題。
為讓本揭露的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖1是依照本發明的一實施例的一種資料核對系統的示意圖。
請參照圖1,本揭露一實施例的資料核對系統10包括處理器110、儲存媒體120以及收發器130。
收發器130以無線或有線的方式傳送及接收訊號。收發器130還可以執行例如低噪聲放大、阻抗匹配、混頻、向上或向下頻率轉換、濾波、放大以及類似的操作。
儲存媒體120用以儲存資料核對系統10運行時所需的各項軟體、資料及各類程式碼。儲存媒體120例如是任何型態的固定式或可移動式的隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)、硬碟(hard disk drive,HDD)、固態硬碟(solid state drive,SSD)或類似元件或上述元件的組合,而用於儲存可由處理器110執行的多個模組或各種應用程式。在一實施例中,儲存媒體120可儲存備份模組1201、辨識模組1202、轉換模組1203、計算模組1204、模型建立模組1205、通知模組1206以及資料庫1207。
處理器110例如是中央處理單元(central processing unit,CPU),或是其他可程式化之一般用途或特殊用途的微控制單元(micro control unit,MCU)、微處理器(microprocessor)、數位信號處理器(digital signal processor,DSP)、可程式化控制器、特殊應用積體電路(application specific integrated circuit,ASIC)、圖形處理器(graphics processing unit,GPU)、影像訊號處理器(image signal processor,ISP)、影像處理單元(image processing unit,IPU)、算數邏輯單元(arithmetic logic unit,ALU)、複雜可程式邏輯裝置(complex programmable logic device,CPLD)、現場可程式化邏輯閘陣列(field programmable gate array,FPGA)或其他類似元件或上述元件的組合。處理器110可耦接至儲存媒體120以及收發器130,並且存取和執行儲存於儲存媒體120中的各種應用程式以及儲存媒體120所儲存的備份模組1201、辨識模組1202、轉換模組1203、計算模組1204、模型建立模組1205、通知模組1206以及資料庫1207。
圖2是依照本發明的一實施例的歷史存匯記錄資料的示意圖。
請參照圖1及圖2,資料庫1207用以儲存多個歷史存匯記錄資料201,歷史存匯記錄資料201包括多個存匯項目及歷史存匯文件編號,在一實施例中,存匯項目可包括客戶人員編號、客戶姓名、客戶賬戶、存匯類型、歷史存匯額度(元)、存匯時間及承辦人。本發明並不以此為限。
備份模組1201用以將各使用者填寫的存匯文件備份為核對文件,其中核對文件的核對文件編號與歷史存匯記錄資料201的歷史存匯文件編號一一對應,核對文件包括多個核對項目,在一實施例中,核對項目可包括存匯額度、客戶姓名、客戶賬戶、存匯類型及存匯時間。本發明並不以此為限。
圖3是依照本發明的一實施例的核對文件的文字資訊及文字位置資訊的示意圖。
請參照圖1及圖3,辨識模組1202與備份模組1201電性連接,依據核對文件進行文字辨識及文字位置辨識,獲取各核對項目對應的文字資訊(文字結果)301及文字位置資訊302。在一實施例中,核對文件的文字資訊301可包括客戶姓名、客戶賬戶、存匯類型及存匯額度。本發明並不以此為限。
如圖3所示,辨識模組1202可採用光學字元辨識(Optical Character Recognition,OCR)技術進行文字辨識或文字擷取,以EAST(An Efficient and Accurate SceneText Detector)算法取得文字的對應位置、文字任意大小或任意方向(水平或傾斜),以機器學習方式例如支持向量機(Support Vector Machine,SVM)、K-近鄰算法(K-Nearest Neighborhood,K-NN)或卷積神經網路(Convolutional Neural Network,CNN)等方式辨別核對文件的每個文字,經由以上方式取得核對文件中的文字資訊301及文字位置資訊302。
在一實施例中,如圖3所示,以A4大小為範例(210*297),以其左下角位置為x=0,y=0為原點,基於此原點對應其文字所在位置範圍分別取得核對文件中的文字資訊301(例如圖3中的文字結果/項目內容)及文字位置資訊302(例如圖3中對應存匯額度這一核對項目的距離文字水平位置最左邊100、距離文字水平位置最右邊105、距離文字垂直位置最下面280、距離文字垂直位置最上面290等文字位置資訊),依據上述文字位置資訊可獲取存匯額度這一核對項目於A4中的對應位置,從而辨識出存匯額度為500000。
圖4是依照本發明的一第一實施例的將核對文件中的存匯額度轉換為第一數字資訊的示意圖。圖5是依照本發明的一第一實施例的將歷史存匯記錄資料中的歷史存匯額度轉換為第二數字資訊的示意圖。
請參照圖4及圖5,轉換模組1203與辨識模組1202電性連接,依據核對文件編號、文字資訊及文字位置資訊將核對文件中的存匯額度轉換為第一數字資訊401,並且依據歷史存匯文件編號將歷史存匯記錄資料201的歷史存匯額度轉換為第二數字資訊501。
如圖4所示,在一第一實施例中,以核對文件編號為1為例。轉換模組1203依據圖3將核對文件編號為1的核對文件中的存匯額度500000轉換為第一數字資訊401(即圖4所示數字0出現5次,數字5出現1次)。以此類推,轉換模組1203依據圖3將核對文件編號為3的核對文件中的存匯額度1100000轉換為第一數字資訊401(即圖4所示數字0出現5次,數字1出現2次)。
同樣地,如圖5所示,在一實施例中,以歷史存匯文件編號為1為例。轉換模組1203依據圖2將歷史存匯文件編號為1的歷史存匯記錄資料201中的存匯額度500000轉換為第二數字資訊501(即圖5所示數字0出現5次,數字5出現1次)。以此類推,轉換模組1203依據圖2將歷史存匯文件編號為3的歷史存匯記錄資料201中的存匯額度1700000轉換為第二數字資訊501(即圖5所示數字0出現5次,數字1出現1次,數字7出現1次)。
計算模組1204與轉換模組1203電性連接,依據核對文件編號、歷史存匯文件編號、第一數字資訊401及第二數字資訊501計算相似指標資訊。於本實施例中,相似指標資訊可包括餘弦相似性(cosine similarity)及歐式距離。
餘弦相似性c1計算公式(1)如下:
…(1)
其中A為核對文件的第一數字資訊,B為歷史存匯記錄資料的第二數字資訊,i為A或B的資訊維度,餘弦相似性c1為
,其中n為正整數。
歐式距離d1計算公式(2)如下:
…(2)
其中x為核對文件的第一數字資訊,y為歷史存匯記錄資料的第二數字資訊,n為x或y的資訊維度,d1為歐式距離,n為正整數。
在一實施例中,以核對文件編號為1的核對文件以及與其對應的歷史存匯文件編號為1的歷史存匯記錄資料201為例結合公式(1)及(2)計算相似指標資訊(餘弦相似性c1為1及歐式距離d1為0)如下所示。
以此類推,計算其餘核對文件編號於歷史存匯文件編號對應的核對文件以及歷史存匯記錄資料的相似指標資訊(餘弦相似性c1及歐式距離d1)。
圖6是依照本發明的一第二實施例的將核對文件中的存匯額度轉換為第一數字資訊的示意圖。圖7是依照本發明的一第二實施例的將歷史存匯記錄資料中的歷史存匯額度轉換為第二數字資訊的示意圖。
請參照圖6及圖7,在一第二實施例中,轉換模組1203還可依據文字資訊是否出現於核對文件或出現於歷史存匯記錄資料201而轉換為第一數字資訊601或第二數字資訊701。
以核對文件編號為1為例。轉換模組1203依據圖3將核對文件編號為1的核對文件中的存匯額度500000轉換為第一數字資訊601(即圖6所示數字0及5出現過則標識為1,數字1-4、6-9未出現過則標識為0)。以此類推,轉換模組1203依據圖3將核對文件編號為3的核對文件中的存匯額度1100000轉換為第一數字資訊401(即圖6所示數字0及1出現過則標識為1,數字2-9未出現過則標識為0)。
同樣地,如圖7所示,在一實施例中,以歷史存匯文件編號為1為例。轉換模組1203依據圖2將歷史存匯文件編號為1的歷史存匯記錄資料201中的存匯額度500000轉換為第二數字資訊701(即圖7所示數字0及5出現過則標識為1,數字1-4、6-9未出現過則標識為0)。以此類推,轉換模組1203依據圖2將歷史存匯文件編號為3的歷史存匯記錄資料201中的存匯額度1700000轉換為第二數字資訊701(即圖7所示數字0、1、7出現過則標識為1,數字2-6、8-9未出現過則標識為0)。
計算模組1204依據核對文件編號、歷史存匯文件編號、第一數字資訊601及第二數字資訊701計算相似指標資訊。
在第二實施例中,以核對文件編號為1的核對文件以及與其對應的歷史存匯文件編號為1的歷史存匯記錄資料201為例結合上述公式(1)及(2)計算相似指標資訊(餘弦相似性c2為1及歐式距離d2為0),如下所示。
同樣地,對其餘核對文件及歷史存匯記錄資料201計算相似指標資訊(餘弦相似性c1、c2及歐式距離d1、d2)。圖8是依照本發明的一實施例的相似指標資訊的示意圖。
模型建立模組1205與計算模組1204電性連接,以依據圖8所示計算所得的相似指標資訊與實際上是否一致及機器學習方法建立相異性機率模型,其中該機器學習方法為線性回歸、支持向量機(SVM,Support Vector Machine)或隨機森林(random forest)。
圖9是依照本發明的一實施例的模型相異性機率的示意圖。
如圖9所示,通知模組1206分別與備份模組1201及模型建立模組1205電性連接,從備份模組1201獲取待測核對文件(核對文件編號為5-7),依據待測核對文件及相異性機率模型計算待測核對文件的模型相異性機率,以依據機率閾值及模型相異性機率判斷是否需進行人工核對,以判定是否發出通知資訊。
如圖9所示,辨識模組1202取得待測核對文件中的文字資訊301及文字位置資訊302,計算模組1204依據公式(1)及(2)及經由轉換模組1203將待測核對文件中的存匯額度轉換為第一數字資訊、第二數字資訊計算相似指標資訊(c1、c2、d1、d2)及上述相異性機率模型計算待測核對文件的模型相異性機率901,例如核對文件編號5的核對文件的模型相異性機率901為0.15,核對文件編號6的核對文件的模型相異性機率901為0等。
於本實施例中,設定機率閾值為0.1,倘若模型相異性機率小於機率閾值,則判斷待測核對文件的一致程度極高,後續不需再進行人工核對,例如核對文件編號6的核對文件的模型相異性機率為0,則判斷待測核對文件的一致程度極高,後續不需再進行人工核對。倘若模型相異性機率不小於機率閾值,判斷待測核對文件的一致程度低,後續需再進行人工核對,則判定發出通知資訊以通知使用者此待測核對文件後續需再進行人工核對,例如核對文件編號5的核對文件的模型相異性機率為0.15,則判定待測核對文件5的一致程度低,發出通知資訊以通知使用者待測核對文件5後續需再進行人工核對。
圖10是依照本發明的一實施例的一種資料核對方法的流程圖。
如圖10所示,在步驟S901中,於資料庫1207中儲存多個歷史存匯記錄資料。
在步驟S902中,備份模組1201將各使用者填寫的存匯文件備份為核對文件。
在步驟S903中,辨識模組1202依據核對文件進行文字辨識及文字位置辨識,獲取各核對項目對應的文字資訊及文字位置資訊。
在步驟S904中,轉換模組1203依據核對文件編號、文字資訊及文字位置資訊將核對文件中的存匯額度轉換為第一數字資訊,並且依據歷史存匯文件編號將歷史存匯記錄資料的歷史存匯額度轉換為第二數字資訊。
在步驟S905中,計算模組1204依據核對文件編號、歷史存匯文件編號、第一數字資訊及第二數字資訊計算相似指標資訊。
在步驟S906中,模型建立模組1205依據相似指標資訊及機器學習方法建立相異性機率模型。
在步驟S907中,通知模組1206獲取待測備份文件,依據待測備份文件及相異性機率模型計算待測備份文件的模型相異性機率,以依據機率閾值及模型相異性機率判斷是否需進行人工核對,以判定是否發出通知資訊。
基於上述,本發明提供一種資料核對系統及其方法,透過自動化方式在取得相關文件後,經由資料核對系統建立相異性機率模型,不僅減少人工核對花費的人力物力成本,並且同時優化核對管理流程,減少人工核對容易產生的疏漏問題。
雖然本揭露已以實施例揭露如上,然其並非用以限定本揭露,任何所屬技術領域中具有通常知識者,在不脫離本揭露的精神和範圍內,當可作些許的更動與潤飾,故本揭露的保護範圍當視後附的申請專利範圍所界定者為準。
10:資料核對系統
110:處理器
120:儲存媒體
130:收發器
1201:備份模組
1202:辨識模組
1203:轉換模組
1204:計算模組
1205:模型建立模組
1206:通知模組
1207:資料庫
201:歷史存匯記錄資料
301:文字資訊
302:文字位置資訊
401、601:第一數字資訊
501、701:第二數字資訊
801:相似指標資訊
901:模型相異性機率
S901、S902、S903、S904、S905、S906、S907:步驟
圖1是依照本發明的一實施例的一種資料核對系統的示意圖。
圖2是依照本發明的一實施例的歷史存匯記錄資料的示意圖。
圖3是依照本發明的一實施例的核對文件的文字資訊及文字位置資訊的示意圖。
圖4是依照本發明的一第一實施例的將核對文件中的存匯額度轉換為第一數字資訊的示意圖。
圖5是依照本發明的一第一實施例的將歷史存匯記錄資料中的歷史存匯額度轉換為第二數字資訊的示意圖。
圖6是依照本發明的一第二實施例的將核對文件中的存匯額度轉換為第一數字資訊的示意圖。
圖7是依照本發明的一第二實施例的將歷史存匯記錄資料中的歷史存匯額度轉換為第二數字資訊的示意圖。
圖8是依照本發明的一實施例的相似指標資訊的示意圖。
圖9是依照本發明的一實施例的模型相異性機率的示意圖。
圖10是依照本發明的一實施例的一種資料核對方法的流程圖。
10:資料核對系統
110:處理器
120:儲存媒體
130:收發器
1201:備份模組
1202:辨識模組
1203:轉換模組
1204:計算模組
1205:模型建立模組
1206:通知模組
1207:資料庫
Claims (10)
- 一種資料核對系統,包括: 收發器; 儲存媒體,用以儲存多個模組以及資料庫,該資料庫用以儲存多個歷史存匯記錄資料,該些歷史存匯記錄資料包括多個存匯項目及歷史存匯文件編號,該些存匯項目至少包括歷史存匯額度;以及 處理器,耦接至該儲存媒體以及該收發器,該處理器存取並執行該儲存媒體所儲存的該些模組以及該資料庫,該些模組包括: 備份模組,用以將各使用者填寫的存匯文件備份為核對文件,其中該核對文件的核對文件編號與該些歷史存匯記錄資料的該歷史存匯文件編號一一對應,該核對文件包括多個核對項目,該些核對項目至少包括存匯額度; 辨識模組,與該備份模組電性連接,依據該核對文件進行文字辨識及文字位置辨識,獲取各該核對項目對應的文字資訊及文字位置資訊; 轉換模組,與該辨識模組電性連接,依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為第二數字資訊; 計算模組,與該轉換模組電性連接,依據該核對文件編號、該歷史存匯文件編號、該第一數字資訊及該第二數字資訊計算相似指標資訊; 模型建立模組,與該計算模組電性連接,以依據該相似指標資訊及機器學習方法建立相異性機率模型;以及 通知模組,分別與該備份模組及該模型建立模組電性連接,從該備份模組獲取待測核對文件,依據該待測核對文件及該相異性機率模型計算該待測核對文件的模型相異性機率,以依據機率閾值及該模型相異性機率判斷是否需進行人工核對,以判定是否發出通知資訊。
- 如請求項1所述的資料核對系統,其中該轉換模組依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為該第二數字資訊的操作中,更包括, 該轉換模組更依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為表示為數字為0至9的該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為表示為數字為0至9的該第二數字資訊。
- 如請求項2所述的資料核對系統,其中該轉換模組依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為該第二數字資訊的操作中,更包括, 該轉換模組更依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為表示為數字為0或1的該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為表示為數字為0或1的該第二數字資訊,其中該數字為0表示該存匯額度對應的該文字資訊未在該核對文件出現或者該歷史存匯額度對應的該文字資訊未在該些歷史存匯記錄資料出現,其中該數字為1表示該存匯額度對應的該文字資訊在該核對文件出現或者該歷史存匯額度對應的該文字資訊在該些歷史存匯記錄資料出現。
- 如請求項1所述的資料核對系統,其中該相似指標資訊至少包括餘弦相似性(cosine similarity)及歐式距離。
- 如請求項1所述的資料核對系統,其中該機器學習方法為線性回歸、支持向量機(SVM,Support Vector Machine)或隨機森林(random forest)。
- 一種資料核對方法,其中該方法包括: 儲存多個歷史存匯記錄資料,該些歷史存匯記錄資料包括多個存匯項目及歷史存匯文件編號,該些存匯項目至少包括歷史存匯額度; 使用者將各使用者填寫的存匯文件備份為核對文件,其中該核對文件的核對文件編號與該些歷史存匯記錄資料的該歷史存匯文件編號一一對應,該核對文件包括多個核對項目,該些核對項目至少包括存匯額度; 依據該核對文件進行文字辨識及文字位置辨識,獲取各該核對項目對應的文字資訊及文字位置資訊; 依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為第二數字資訊; 依據該核對文件編號、該歷史存匯文件編號、該第一數字資訊及該第二數字資訊計算相似指標資訊; 依據該相似指標資訊及機器學習方法建立相異性機率模型;以及 獲取待測核對文件,依據該待測核對文件及該相異性機率模型計算該待測核對文件的模型相異性機率,以依據機率閾值及該模型相異性機率判斷是否需進行人工核對,以判定是否發出通知資訊。
- 如請求項6所述的資料核對方法,其中該依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為該第二數字資訊的步驟中,更包括, 依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為表示為數字為0至9的該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為表示為數字為0至9的該第二數字資訊。
- 如請求項7所述的資料核對方法,其中該依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為該第二數字資訊的步驟中,更包括, 依據該核對文件編號、該文字資訊及該文字位置資訊將該核對文件中的該存匯額度轉換為表示為數字為0或1的該第一數字資訊,並且依據該歷史存匯文件編號將該些歷史存匯記錄資料的該歷史存匯額度轉換為表示為數字為0或1的該第二數字資訊,其中該數字為0表示該存匯額度對應的該文字資訊未在該核對文件出現或者該歷史存匯額度對應的該文字資訊未在該些歷史存匯記錄資料出現,其中該數字為1表示該存匯額度對應的該文字資訊在該核對文件出現或者該歷史存匯額度對應的該文字資訊在該些歷史存匯記錄資料出現。
- 如請求項6所述的資料核對方法,其中該相似指標資訊至少包括餘弦相似性(cosine similarity)及歐式距離。
- 如請求項6所述的資料核對方法,其中該該機器學習方法為線性回歸、支持向量機(SVM,Support Vector Machine)或隨機森林(random forest)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW112106651A TWI821128B (zh) | 2023-02-23 | 2023-02-23 | 資料核對系統及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW112106651A TWI821128B (zh) | 2023-02-23 | 2023-02-23 | 資料核對系統及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI821128B true TWI821128B (zh) | 2023-11-01 |
TW202435148A TW202435148A (zh) | 2024-09-01 |
Family
ID=89722302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112106651A TWI821128B (zh) | 2023-02-23 | 2023-02-23 | 資料核對系統及其方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI821128B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8064700B2 (en) * | 2004-02-15 | 2011-11-22 | Google Inc. | Method and system for character recognition |
US11222315B1 (en) * | 2009-08-19 | 2022-01-11 | United Services Automobile Association (Usaa) | Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments |
CN114139840A (zh) * | 2020-08-12 | 2022-03-04 | 中国电子科技集团公司电子科学研究院 | 数据中心准入合规验证方法及系统 |
US11295377B1 (en) * | 2010-06-08 | 2022-04-05 | United Services Automobile Association (Usaa) | Automatic remote deposit image preparation apparatuses, methods and systems |
CN114861622A (zh) * | 2022-04-28 | 2022-08-05 | 中国工商银行股份有限公司 | 跟单信用证生成方法、装置、设备、存储介质和程序产品 |
CN106575166B (zh) * | 2014-08-11 | 2022-11-29 | 张锐 | 手写输入字符的处理、数据拆分和合并及编解码处理方法 |
TWM641579U (zh) * | 2023-02-23 | 2023-05-21 | 兆豐國際商業銀行股份有限公司 | 資料核對系統 |
-
2023
- 2023-02-23 TW TW112106651A patent/TWI821128B/zh active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8064700B2 (en) * | 2004-02-15 | 2011-11-22 | Google Inc. | Method and system for character recognition |
US11222315B1 (en) * | 2009-08-19 | 2022-01-11 | United Services Automobile Association (Usaa) | Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments |
US11295377B1 (en) * | 2010-06-08 | 2022-04-05 | United Services Automobile Association (Usaa) | Automatic remote deposit image preparation apparatuses, methods and systems |
CN106575166B (zh) * | 2014-08-11 | 2022-11-29 | 张锐 | 手写输入字符的处理、数据拆分和合并及编解码处理方法 |
CN114139840A (zh) * | 2020-08-12 | 2022-03-04 | 中国电子科技集团公司电子科学研究院 | 数据中心准入合规验证方法及系统 |
CN114861622A (zh) * | 2022-04-28 | 2022-08-05 | 中国工商银行股份有限公司 | 跟单信用证生成方法、装置、设备、存储介质和程序产品 |
TWM641579U (zh) * | 2023-02-23 | 2023-05-21 | 兆豐國際商業銀行股份有限公司 | 資料核對系統 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111723786B (zh) | 一种基于单模型预测的安全帽佩戴检测方法及装置 | |
EP4040401A1 (en) | Image processing method and apparatus, device and storage medium | |
CN104751055B (zh) | 一种基于纹理的分布式恶意代码检测方法、装置及系统 | |
CN104166982A (zh) | 基于典型相关性分析的图像优化聚类方法 | |
CN109063719B (zh) | 一种联合结构相似性和类信息的图像分类方法 | |
EP3908971A1 (en) | Identifying key-value pairs in documents | |
Yang et al. | Multi-scale bidirectional fcn for object skeleton extraction | |
WO2020012523A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
WO2022194062A1 (zh) | 疾病标签检测方法、装置、电子设备及存储介质 | |
TWM641579U (zh) | 資料核對系統 | |
CN104951306A (zh) | 基于实时计算框架的数据处理方法和系统 | |
Zhang et al. | Pulmonary nodule detection based on 3D feature pyramid network with incorporated squeeze‐and‐excitation‐attention mechanism | |
CN114996466B (zh) | 一种医学标准映射模型的建立方法、系统及使用方法 | |
Basha et al. | Evaluating the performance of supervised classification models: decision tree and Naïve Bayes using KNIME | |
WO2021102632A1 (zh) | 字符获取、页面处理与知识图谱构建方法及装置、介质 | |
CN114971294A (zh) | 数据采集方法、装置、设备及存储介质 | |
TWI821128B (zh) | 資料核對系統及其方法 | |
CN107423294A (zh) | 一种社群图像检索方法及系统 | |
CN113515614A (zh) | 基于知识蒸馏的属性识别方法、终端设备及存储介质 | |
Ding et al. | An efficient 3D model retrieval method based on convolutional neural network | |
CN116468043A (zh) | 嵌套实体识别方法、装置、设备及存储介质 | |
TW202435148A (zh) | 資料核對系統及其方法 | |
WO2021114626A1 (zh) | 一种病历数据的质量检测方法和相关装置 | |
CN111967579A (zh) | 使用卷积神经网络对图像进行卷积计算的方法和装置 | |
CN114036267A (zh) | 对话方法及系统 |