TW201837788A

TW201837788A - 理賠單據的字元識別方法及伺服器

Info

Publication number: TW201837788A
Application number: TW106135247A
Authority: TW
Inventors: 金飛虎; 薛燕; 米藝; 李歡歡; 仇一
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-04-11
Filing date: 2017-10-13
Publication date: 2018-10-16
Also published as: EP3432197A4; JP6710483B2; WO2018188199A1; KR20190026641A; US20190147239A1; TWI621077B; CN107220648A; CN107220648B; AU2017408799B2; AU2017408799A1; EP3432197B1; EP3432197A1; US10650231B2; JP2019520615A; SG11201900263SA; KR102171220B1

Abstract

本發明公開了一種理賠單據的字元識別方法及伺服器，該方法包括：伺服器在收到待識別字元的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域；呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別，以識別出各個分割區域中的字元。本發明避免了在對整個理賠單據影像中的字元進行統一識別時單據中的框線對字元識別的影響及干涉，能有效提高對理賠單據中字元的識別精度。

Description

理賠單據的字元識別方法及伺服器

本發明涉及電腦技術領域，尤其涉及一種理賠單據的字元識別方法及伺服器。

隨著大眾保險意識的增強、購買保險的客戶群大幅增多，保險公司需處理的客戶理賠申請越來越多，保險公司作業人員需輸入的理賠單據影像也越來越多，以致於輸入單據作業人員的人力緊張，同時，經常會出現輸入單據錯誤。為了有效減少輸入單據錯誤、提高輸入單據效率，目前，有些保險公司在輸入單據作業過程中引入OCR(Optical Character Recognition，光學字元識別)技術，以自動識別出理賠單據影像的字元以填充到對應的輸入欄位中。

然而，現有的利用OCR技術進行理賠單據影像字元的識別方案僅利用自身的識別引擎對整個理賠單據影像中的字元進行統一識別，並未考慮理賠單據框架格式對識別精度的影響，也並未考慮單據中的框線對字元識別的干涉，使得現有的識別方案的識別精度不高，需要耗費大量的人力、物力進行校驗。

本發明的主要目的在於提供一種理賠單據的字元識別方法及伺服器，旨在提高理賠單據的識別精度。

為實現上述目的，本發明提供的一種理賠單據的字元識別方法，所述方法包括以下步驟：伺服器在收到待識別字元的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域；呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別，以識別出各個分割區域中的字元。

在一實施例中，所述呼叫預先確定的分析模型對獲得的各個分割區域進行分析的步驟包括：呼叫預先確定的分析模型對獲得的各個分割區域進行分析，以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域；所述利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別的步驟還包括：利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別，以識別出各個所述第一分割區域中的字元，並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別，以識別出各個所述第二分割區域中的字元。

在一實施例中，所述預先確定的分析模型為卷積神經網路模型，所述預先確定的分析模型的訓練過程如下： A、針對預先確定的理賠單據框架格式，獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本；B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割，並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域；C、將所有第三分割區域歸入第一訓練集，將所有第四分割區域歸入第二訓練集；D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域，並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域；E、利用提取的各個待訓練的分割區域進行模型訓練，以生成所述預先確定的分析模型，並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證；F、若驗證通過率大於或等於預設閾值，則訓練完成，或者，若驗證通過率小於預設閾值，則增加理賠單據影像樣本的數量，並重複執行上述步驟A、B、C、D、E，直至驗證通過率大於或等於預設閾值。

在一實施例中，所述預先確定的識別模型為長短期記憶LSTM模型，所述預先確定的識別模型的訓練過程如下：獲取預設數量的分割區域樣本，對各個分割區域樣本以該分割區域樣本所含字元來進行標注；將預設數量的分割區域樣本按照預設比例分為第一資料集和第二資料集，並將所述第一資料集作為訓練集，將所述第二資料集作為測試集；將所述第一資料集送入LSTM網路進行模型訓練，每隔預設時間，使用訓練得到的模型對所述第二資料集中的分割區域樣本進行字元識別，並將識別的字元與該分割區域樣本的標注進行比對，以計算識別的字元和標注的誤差；若訓練得到的模型識別字元的誤差出現發散，則調整預設的訓練參數並重新訓練，直至使得訓練得到的模型識別字元的誤差能夠收斂；若訓練得到的模型識別字元的誤差收斂，則結束模型訓練，將生成的模型作為訓練好的所述預先確定的識別模型。

在一實施例中，所述分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域，且所述分割區域為不包含框線的區域。

此外，為實現上述目的，本發明還提供一種理賠單據的字元識別伺服器，所述字元識別伺服器包括：分割模組，用於在收到待識別字元的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域；識別模組，用於呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別，以識別出各個分割區域中的字元。

在一實施例中，所述識別模組還用於：呼叫預先確定的分析模型對獲得的各個分割區域進行分析，以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域；利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別，以識別出各個所述第一分割區域中的字元，並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別，以識別出各個所述第二分割區域中的字元。

在一實施例中，所述預先確定的分析模型為卷積神經網路模型，所述預先確定的分析模型的訓練過程如下：A、針對預先確定的理賠單據框架格式，獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本；B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割，並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域；C、將所有第三分割區域歸入第一訓練集，將所有第四分割區域歸入第二訓練集；D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域，並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域；E、利用提取的各個待訓練的分割區域進行模型訓練，以生成所述預先確定的分析模型，並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證；F、若驗證通過率大於或等於預設閾值，則訓練完成，或者，若驗證通過率小於預設閾值，則增加理賠單據影像樣本的數量，並重複執行上述步驟A、B、C、D、E，直至驗證通過率大於或等於預設閾值。

本發明提出的理賠單據的字元識別方法及伺服器，在對理賠單據影像進行字元識別前，按照該理賠單據框架格式的框線排布對其進行區域分割，利用預先確定的識別規則對該理賠單據的各個分割區域分別進行字元識別，以分別識別出各個分割區域中的字元。由於考慮到理賠單據框架格式對識別精度的影響，在進行字元識別前先按照理賠單據框架格式的框線排布進行區域分割，再針對各個分割區域來進行字元識別，避免了在對整個理賠單據影像中的字元進行統一識別時單據中的框線對字元識別的影響及干涉，能有效提高對理賠單據中字元的識別精度。

S10‧‧‧步驟

S20‧‧‧步驟

S201‧‧‧步驟

S202‧‧‧步驟

01‧‧‧分割模組

02‧‧‧識別模組

圖1為本發明理賠單據的字元識別方法第一實施例的流程示意圖；圖2為本發明理賠單據的字元識別方法第二實施例的流程示意圖；圖3為本發明理賠單據的字元識別伺服器第一實施例的功能模組示意圖。

本發明目的的實現、功能特點及優點將結合實施例，參照附圖做進一步說明。

為了使本發明所要解決的技術問題、技術方案及有益效果更加清楚、明白，以下結合附圖和實施例，對本發明進行進一步詳細說明。應當理解，此處所描述的具體實施例僅僅用以解釋本發明，並不用於限定本發明。

本發明提供一種理賠單據的字元識別方法。

參照圖1，圖1為本發明理賠單據的字元識別方法第一實施例的流程示意圖。

在第一實施例中，該理賠單據的字元識別方法包括：步驟S10，伺服器在收到待識別字元的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域；本實施例中，伺服器可以接收使用者發出的包含待識別字元的理賠單據影像的字元識別請求，例如，接收使用者通過手機、平板電腦、自助終端設備等終端發送的字元識別請求，如接收使用者在手機、平板電腦、自助終端設備等終端中預先安裝的客戶端上發送來的字元識別請求，或接收使用者在手機、平板電腦、自助終端設備等終端中的瀏覽器系統上發送來的字元識別請求。

伺服器在收到待識別字元識別的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，理賠單據影像中按照其框架格式排布有橫向或豎向的框線，以組成各項輸入欄供使用者填寫相關信息。本實施例中，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域。例如，在一種實施方式中，由於一般不同類型的保險均對應有不同的單據格式模板，因此，可預先根據使用者上傳的單據類型(可能不同的保險有不同的單據格式)，獲取到對應的單據模板，然後根據模板的格式來分割。如可根據收到的待識別字元的理賠單據影像的單據類型，找到該理賠單據影像對應的單據模板，然後根據其對應的單據模板進行區域分割。該分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域，且該分割區域為不包含框線的區域，以避免後續在對每一分割區域進行字元識別時框線對識別精度的干涉及影響，該分割區域類似於excel表格的每個方格，excel表格的每個方格即是最小區域內不包含框線的區域。

步驟S20，呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別，以識別出各個分割區域中的字元。

在按照該理賠單據框架格式的框線排布對理賠單據影像進行區域分割得到一個或多個分割區域後，可呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對各個分割區域分別進行字元識別，以識別出各個分割區域中的字元，也即理賠單據影像中的字元。例如，可利用預先確定的分析模型分析各個分割區域所適用的識別模型或識別方式，再根據分析出的結果針對各個分割區域利用適合各個分割區域自身的識別模型或識別方式來進行字元識別，以提高字元識別的準確率。如針對不同的分割區域，可分析出字元識別的方式為利用光學字元識別引擎進行識別，也可以用其他識別引擎或訓練的識別模型來進行識別，在此不做限定。識別出各個分割區域中的字元，還可將各個分割區域中的字元自動填充、輸入至與該理賠單據影像對應的電子理賠單據的各相應輸入欄位中。

本實施例在對理賠單據影像進行字元識別前，按照該理賠單據框架格式的框線排布對其進行區域分割，利用預先確定的識別規則對該理賠單據的各個分割區域分別進行字元識別，以分別識別出各個分割區域中的字元。由於考慮到理賠單據框架格式對識別精度的影響，在進行字元識別前先按照理賠單據框架格式的框線排布進行區域分割，再針對各個分割區域來進行字元識別，避免了在對整個理賠單據影像中的字元進行統一識別時單據中的框線對字元識別的影響及干涉，能有效提高對理賠單據中字元的識別精度。

如圖2所示，本發明第二實施例提出一種理賠單據的字元識別方法，在上述實施例的基礎上，所述步驟S20包括：步驟S201，呼叫預先確定的分析模型對獲得的各個分割區域進行分析，以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域；步驟S202，利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別，以識別出各個所述第一分割區域中的字元，並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別，以識別出各個所述第二分割區域中的字元。

本實施例中，在按照該理賠單據框架格式的框線排布進行區域分割得到一個或多個分割區域後，在對獲得的分割區域進行識別之前，還呼叫預先確定的分析模型對獲得的各個分割區域進行分析，以分析出無需深度識別的第一分割區域和需要深度識別的第二分割區域。例如，以當前自身的識別引擎為OCR字元識別引擎為例進行說明，可將OCR字元識別引擎能正確識別或識別率高的區域作為無需深度識別的區域，即利用當前自身的OCR字元識別引擎即可對該區域的字元進行正確的識別，無需借助其他識別方式。將OCR字元識別引擎無法識別或識別率低的區域作為需要深度識別的區域，即利用當前自身的OCR字元識別引擎無法對該區域的字元進行正確的識別，需借助其他識別方式如經訓練過的識別模型來進行字元識別。

在分析出該理賠單據影像中可利用OCR字元識別引擎進行正確識別的第一分割區域和不可利用OCR字元識別引擎識別的第二分割區域之後，即可針對分析出的第一分割區域和第二分割區域採取不同的識別方式進行字元識別。利用預先確定的OCR字元識別引擎對各個所述第一分割區域進行字元識別，以正確識別出各個所述第一分割區域中的字元。呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別，以正確識別出各個所述第二分割區域中的字元，該預先確定的識別模型可以是針對大量分割區域樣本進行訓練好的識別模型，也可以是比自身的OCR字元識別引擎識別方式更複雜、識別效果更好的識別引擎，在此不做限定。

進一步地，在其他實施例中，所述預先確定的分析模型為卷積神經網路(Convolutional Neural Network，簡稱CNN)模型，所述預先確定的分析模型的訓練過程如下：A、針對預先確定的理賠單據框架格式，獲取預設數量(例如，50萬個)的基於該理賠單據框架格式的理賠單據影像樣本；B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割，並確定出各個理賠單據影像樣本中OCR字元識別引擎識別錯誤的第三分割區域和OCR字元識別引擎識別正確的第四分割區域；C、將所有第三分割區域歸入第一訓練集，將所有第四分割區域歸入第二訓練集；D、分別從第一訓練集和第二訓練集中提取出第一預設比例(例如，80%)的分割區域作為待訓練的分割區域，並將第一訓練集和第二訓練集中剩餘的分割區域作為待驗證的分割區域； E、利用提取的各個待訓練的分割區域進行模型訓練，以生成所述預先確定的分析模型，並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證；F、若驗證通過率大於等於預設閾值(例如，98%)，則訓練完成，或者，若驗證通過率小於預設閾值，則增加理賠單據影像樣本的數量，並重複執行所述步驟A、B、C、D、E，直至驗證通過率大於或等於預設閾值。

本實施例中利用經大量理賠單據影像樣本訓練過的卷積神經網路模型來進行分割區域分析，能夠準確分析出理賠單據的各個分割區域中可利用OCR字元識別引擎來正確識別字元的第一分割區域和無法利用OCR字元識別引擎來正確識別字元的第二分割區域，以便後續針對第一分割區域和第二分割區域分別採用不同的識別方式來進行準確的字元識別操作，從而提高對理賠單據中字元的識別精度。

進一步地，在其他實施例中，所述預先確定的識別模型為長短期記憶(Long Short-Term Memory，簡稱LSTM)模型，所述預先確定的識別模型的訓練過程如下：獲取預設數量(例如，10萬)的區域樣本，該區域樣本可以是歷史資料中對若干理賠單據按照其框架格式的框線排布進行區域分割後的分割區域樣本。在一種實施方式中，可統一將分割區域樣本中的字體設置為黑色，背景設置為白色，以便於進行字元識別。並將各個分割區域樣本進行標注，如可將各個分割區域樣本的名稱命名為該分割區域樣本所包含的字元以進行標注。

將預設數量的分割區域樣本按照預設比例(例如，8：2)分為第一資料集和第二資料集，將第一資料集作為訓練集，將第二資料集作為測試集，其中，第一資料集的樣本數量比例大於或者等於第二資料集的樣本數量比例。

將第一資料集送入LSTM網路進行模型訓練，每隔預設時間(例如每30分鐘或每進行1000次迭代)，對模型使用第二資料集進行測試，以評估當前訓練的模型效果。例如，在測試時，可使用訓練得到的模型對第二資料集中的分割區域樣本進行字元識別，並將利用訓練得到的模型對分割區域樣本的字元識別結果與該分割區域樣本的標注進行比對，以計算出訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差。具體地，在計算誤差時，可採用編輯距離作為計算標準，其中，編輯距離(Edit Distance)，又稱Levenshtein距離，是指兩個字串之間，由一個轉成另一個所需的最少編輯操作次數。許可的編輯操作包括將一個字元替換成另一個字元，插入一個字元，刪除一個字元，一般來說，編輯距離越小，兩個串的相似度越大。因此，在以編輯距離作為計算標準來計算訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差時，計算得到的誤差越小，說明訓練得到的模型的字元識別結果與該分割區域樣本的標注的相似度越大；相反，計算得到的誤差越大，說明訓練得到的模型的字元識別結果與該分割區域樣本的標注的相似度越小。

由於該分割區域樣本的標注為該分割區域樣本的名稱也即該分割區域樣本所包含的字元，因此，計算出的訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差即為訓練得到的模型的字元識別結果與該分割區域樣本所包含的字元之間的誤差，能反映出訓練得到的模型識別出的字元與正確的字元之間的誤差。記錄每一次對訓練的模型使用第二資料集進行測試的誤差，並分析誤差的變化趨勢，若分析測試時的訓練模型對分割區域樣本的字元識別的誤差出現發散，則調整訓練參數如activation函數、LSTM層數、輸入輸出的變數維度等，並重新訓練，使測試時的訓練模型對分割區域樣本的字元識別的誤差能夠收斂。當分析測試時的訓練模型對分割區域樣本的字元識別的誤差收斂後，則結束模型訓練，將生成的訓練模型作為訓練好的所述預先確定的識別模型。

本實施例中，針對OCR字元識別引擎無法識別的區域，採用訓練好的LSTM模型進行識別，由於LSTM模型為經大量分割區域樣本訓練過的，且對分割區域樣本的字元識別的誤差收斂的模型，配合LSTM模型自身的長期記憶功能使該LSTM模型在識別分割區域中的字元時，能利用模型記住的長期信息如上下文信息等，更加準確地識別出分割區域中的字元，從而進一步提高對理賠單據中字元的識別精度。

本發明進一步提供一種理賠單據的字元識別伺服器。

參照圖3，圖3為本發明理賠單據的字元識別伺服器第一實施例的功能模組示意圖。

在第一實施例中，該理賠單據的字元識別伺服器包括：分割模組01，用於在收到待識別字元的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域；本實施例中，伺服器可以接收使用者發出的包含待識別字元的理賠單據影像的字元識別請求，例如，接收使用者通過手機、平板電腦、自助終端設備等終端發送的字元識別請求，如接收使用者在手機、平板電腦、自助終端設備等終端中預先安裝的客戶端上發送來的字元識別請求，或接收使用者在手機、平板電腦、自助終端設備等終端中的瀏覽器系統上發送來的字元識別請求。

識別模組02，用於呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別，以識別出各個分割區域中的字元。

進一步地，在上述實施例的基礎上，上述識別模組02還用於：呼叫預先確定的分析模型對獲得的各個分割區域進行分析，以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域；利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別，以識別出各個所述第一分割區域中的字元，並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別，以識別出各個所述第二分割區域中的字元。

進一步地，在其他實施例中，所述預先確定的分析模型為卷積神經網路(Convolutional Neural Network，簡稱CNN)模型，所述預先確定的分析模型的訓練過程如下：A、針對預先確定的理賠單據框架格式，獲取預設數量(例如，50萬個)的基於該理賠單據框架格式的理賠單據影像樣本；B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割，並確定出各個理賠單據影像樣本中OCR字元識別引擎識別錯誤的第三分割區域和OCR字元識別引擎識別正確的第四分割區域；C、將所有第三分割區域歸入第一訓練集，將所有第四分割區域歸入第二訓練集；D、分別從第一訓練集和第二訓練集中提取出第一預設比例(例如，80%)的分割區域作為待訓練的分割區域，並將第一訓練集和第二訓練集中剩餘的分割區域作為待驗證的分割區域；E、利用提取的各個待訓練的分割區域進行模型訓練，以生成所述預先確定的分析模型，並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證；F、若驗證通過率大於等於預設閾值(例如，98%)，則訓練完成，或者，若驗證通過率小於預設閾值，則增加理賠單據影像樣本的數量，並重複執行所述步驟A、B、C、D、E，直至驗證通過率大於或等於預設閾值。

由於該分割區域樣本的標注為該分割區域樣本的名稱也即該分割區域樣本所包含的字元，因此，計算出的訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差即為訓練得到的模型的字元識別結果與該分割區域樣本所包含的字元之間的誤差，能反映出訓練得到的模型識別出的字元與正確的字元之間的誤差。記錄每一次對訓練的模型使用第二資料集進行測試的誤差，並分析誤差的變化趨勢，若分析測試時的訓練模型對分割區域樣本的字元識別的誤差出現發散，則調整訓練參數如activation 函數、LSTM層數、輸入輸出的變數維度等，並重新訓練，使測試時的訓練模型對分割區域樣本的字元識別的誤差能夠收斂。當分析測試時的訓練模型對分割區域樣本的字元識別的誤差收斂後，則結束模型訓練，將生成的訓練模型作為訓練好的所述預先確定的識別模型。

需要說明的是，在本文中，術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下，由語句“包括一個......”限定的要素，並不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。

通過以上的實施方式的描述，所屬技術領域中具有通常知識者可以清楚地瞭解到上述實施例方法可借助軟體加必需的通用硬體平臺的方式來實現，當然也可以通過硬體來實現，但很多情況下前者是更佳的實施方式。基於這樣的理解，本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來，該電腦軟體產品儲存在一個儲存介質(如ROM/RAM、磁碟、光碟)中，包括若干指令用以使得一台終端設備(可以是手機，電腦，伺服器，空調器，或者網路設備等)執行本發明各個實施例所述的方法。

以上參照附圖說明瞭本發明的優選實施例，並非因此局限本發明的權利範圍。上述本發明實施例序號僅僅為了描述，不代表實施例的優劣。另外，雖然在流程圖中示出了邏輯順序，但是在某些情況下，可以以不同於此處的順序執行所示出或描述的步驟。

所屬技術領域中具有通常知識者不脫離本發明的範圍和實質，可以有多種變型方案實現本發明，比如作為一個實施例的特徵可用於另一實施例而得到又一實施例。凡在運用本發明的技術構思之內所作的任何修改、等同替換和改進，均應在本發明的權利範圍之內。

Claims

一種理賠單據的字元識別方法，其中，所述方法包括以下步驟：伺服器在收到待識別字元的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域；呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別，以識別出各個分割區域中的字元。
如請求項1所述的理賠單據的字元識別方法，其中，所述呼叫預先確定的分析模型對獲得的各個分割區域進行分析的步驟包括：呼叫預先確定的分析模型對獲得的各個分割區域進行分析，以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域；所述利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別的步驟還包括：利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別，以識別出各個所述第一分割區域中的字元，並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別，以識別出各個所述第二分割區域中的字元。
如請求項2所述的理賠單據的字元識別方法，其中，所述預先確定的分析模型為卷積神經網路模型，所述預先確定的分析模型的訓練過程如下：A、針對預先確定的理賠單據框架格式，獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本；B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割，並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域；C、將所有第三分割區域歸入第一訓練集，將所有第四分割區域歸入第二訓練集； D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域，並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域；E、利用提取的各個待訓練的分割區域進行模型訓練，以生成所述預先確定的分析模型，並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證；F、若驗證通過率大於或等於預設閾值，則訓練完成，或者，若驗證通過率小於預設閾值，則增加理賠單據影像樣本的數量，並重複執行上述步驟A、B、C、D、E，直至驗證通過率大於或等於預設閾值。
如請求項2或3所述的理賠單據的字元識別方法，其中，所述預先確定的識別模型為長短期記憶LSTM模型，所述預先確定的識別模型的訓練過程如下：獲取預設數量的分割區域樣本，對各個分割區域樣本以該分割區域樣本所含字元來進行標注；將預設數量的分割區域樣本按照預設比例分為第一資料集和第二資料集，並將所述第一資料集作為訓練集，將所述第二資料集作為測試集；將所述第一資料集送入LSTM網路進行模型訓練，每隔預設時間，使用訓練得到的模型對所述第二資料集中的分割區域樣本進行字元識別，並將識別的字元與該分割區域樣本的標注進行比對，以計算識別的字元和標注的誤差；若訓練得到的模型識別字元的誤差出現發散，則調整預設的訓練參數並重新訓練，直至使得訓練得到的模型識別字元的誤差能夠收斂；若訓練得到的模型識別字元的誤差收斂，則結束模型訓練，將生成的模型作為訓練好的所述預先確定的識別模型。
如請求項1所述的理賠單據的字元識別方法，其中，所述分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域，且所述分割區域為不包含框線的區域。
一種理賠單據的字元識別伺服器，其中，所述字元識別伺服器包括：分割模組，用於在收到待識別字元的理賠單據影像後，按照該理賠單據框架格式的框線排布進行區域分割，獲得一個或多個分割區域；識別模組，用於呼叫預先確定的分析模型對獲得的各個分割區域進行分析，並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別，以識別出各個分割區域中的字元。
如請求項6所述的理賠單據的字元識別伺服器，其中，所述識別模組還用於：呼叫預先確定的分析模型對獲得的各個分割區域進行分析，以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域；利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別，以識別出各個所述第一分割區域中的字元，並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別，以識別出各個所述第二分割區域中的字元。
如請求項7所述的理賠單據的字元識別伺服器，其中，所述預先確定的分析模型為卷積神經網路模型，所述預先確定的分析模型的訓練過程如下：A、針對預先確定的理賠單據框架格式，獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本；B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割，並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域；C、將所有第三分割區域歸入第一訓練集，將所有第四分割區域歸入第二訓練集；D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域，並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域； E、利用提取的各個待訓練的分割區域進行模型訓練，以生成所述預先確定的分析模型，並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證；F、若驗證通過率大於或等於預設閾值，則訓練完成，或者，若驗證通過率小於預設閾值，則增加理賠單據影像樣本的數量，並重複執行上述步驟A、B、C、D、E，直至驗證通過率大於或等於預設閾值。
如請求項7或8所述的理賠單據的字元識別伺服器，其中，所述預先確定的識別模型為長短期記憶LSTM模型，所述預先確定的識別模型的訓練過程如下：獲取預設數量的分割區域樣本，對各個分割區域樣本以該分割區域樣本所含字元來進行標注；將預設數量的分割區域樣本按照預設比例分為第一資料集和第二資料集，並將所述第一資料集作為訓練集，將所述第二資料集作為測試集；將所述第一資料集送入LSTM網路進行模型訓練，每隔預設時間，使用訓練得到的模型對所述第二資料集中的分割區域樣本進行字元識別，並將識別的字元與該分割區域樣本的標注進行比對，以計算識別的字元和標注的誤差；若訓練得到的模型識別字元的誤差出現發散，則調整預設的訓練參數並重新訓練，直至使得訓練得到的模型識別字元的誤差能夠收斂；若訓練得到的模型識別字元的誤差收斂，則結束模型訓練，將生成的模型作為訓練好的所述預先確定的識別模型。
如請求項6所述的理賠單據的字元識別伺服器，其中，所述分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域，且所述分割區域為不包含框線的區域。