TW201837788A - 理賠單據的字元識別方法及伺服器 - Google Patents
理賠單據的字元識別方法及伺服器 Download PDFInfo
- Publication number
- TW201837788A TW201837788A TW106135247A TW106135247A TW201837788A TW 201837788 A TW201837788 A TW 201837788A TW 106135247 A TW106135247 A TW 106135247A TW 106135247 A TW106135247 A TW 106135247A TW 201837788 A TW201837788 A TW 201837788A
- Authority
- TW
- Taiwan
- Prior art keywords
- model
- document
- segmented
- character recognition
- area
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
- G06V30/18038—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters
- G06V30/18048—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters with interaction between the responses of different filters, e.g. cortical complex cells
- G06V30/18057—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Finance (AREA)
- Biophysics (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本發明公開了一種理賠單據的字元識別方法及伺服器,該方法包括:伺服器在收到待識別字元的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域;呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別,以識別出各個分割區域中的字元。本發明避免了在對整個理賠單據影像中的字元進行統一識別時單據中的框線對字元識別的影響及干涉,能有效提高對理賠單據中字元的識別精度。
Description
本發明涉及電腦技術領域,尤其涉及一種理賠單據的字元識別方法及伺服器。
隨著大眾保險意識的增強、購買保險的客戶群大幅增多,保險公司需處理的客戶理賠申請越來越多,保險公司作業人員需輸入的理賠單據影像也越來越多,以致於輸入單據作業人員的人力緊張,同時,經常會出現輸入單據錯誤。為了有效減少輸入單據錯誤、提高輸入單據效率,目前,有些保險公司在輸入單據作業過程中引入OCR(Optical Character Recognition,光學字元識別)技術,以自動識別出理賠單據影像的字元以填充到對應的輸入欄位中。
然而,現有的利用OCR技術進行理賠單據影像字元的識別方案僅利用自身的識別引擎對整個理賠單據影像中的字元進行統一識別,並未考慮理賠單據框架格式對識別精度的影響,也並未考慮單據中的框線對字元識別的干涉,使得現有的識別方案的識別精度不高,需要耗費大量的人力、物力進行校驗。
本發明的主要目的在於提供一種理賠單據的字元識別方法及伺服器,旨在提高理賠單據的識別精度。
為實現上述目的,本發明提供的一種理賠單據的字元識別方法,所述方法包括以下步驟:伺服器在收到待識別字元的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域;呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別,以識別出各個分割區域中的字元。
在一實施例中,所述呼叫預先確定的分析模型對獲得的各個分割區域進行分析的步驟包括:呼叫預先確定的分析模型對獲得的各個分割區域進行分析,以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域;所述利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別的步驟還包括:利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別,以識別出各個所述第一分割區域中的字元,並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別,以識別出各個所述第二分割區域中的字元。
在一實施例中,所述預先確定的分析模型為卷積神經網路模型,所述預先確定的分析模型的訓練過程如下: A、針對預先確定的理賠單據框架格式,獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本;B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割,並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域;C、將所有第三分割區域歸入第一訓練集,將所有第四分割區域歸入第二訓練集;D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域,並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域;E、利用提取的各個待訓練的分割區域進行模型訓練,以生成所述預先確定的分析模型,並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證;F、若驗證通過率大於或等於預設閾值,則訓練完成,或者,若驗證通過率小於預設閾值,則增加理賠單據影像樣本的數量,並重複執行上述步驟A、B、C、D、E,直至驗證通過率大於或等於預設閾值。
在一實施例中,所述預先確定的識別模型為長短期記憶LSTM模型,所述預先確定的識別模型的訓練過程如下:獲取預設數量的分割區域樣本,對各個分割區域樣本以該分割區域樣本所含字元來進行標注;將預設數量的分割區域樣本按照預設比例分為第一資料集 和第二資料集,並將所述第一資料集作為訓練集,將所述第二資料集作為測試集;將所述第一資料集送入LSTM網路進行模型訓練,每隔預設時間,使用訓練得到的模型對所述第二資料集中的分割區域樣本進行字元識別,並將識別的字元與該分割區域樣本的標注進行比對,以計算識別的字元和標注的誤差;若訓練得到的模型識別字元的誤差出現發散,則調整預設的訓練參數並重新訓練,直至使得訓練得到的模型識別字元的誤差能夠收斂;若訓練得到的模型識別字元的誤差收斂,則結束模型訓練,將生成的模型作為訓練好的所述預先確定的識別模型。
在一實施例中,所述分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域,且所述分割區域為不包含框線的區域。
此外,為實現上述目的,本發明還提供一種理賠單據的字元識別伺服器,所述字元識別伺服器包括:分割模組,用於在收到待識別字元的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域;識別模組,用於呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別,以識別出各個分割區域中的字元。
在一實施例中,所述識別模組還用於:呼叫預先確定的分析模型對獲得的各個分割區域進行分析,以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字 元識別引擎識別的第二分割區域;利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別,以識別出各個所述第一分割區域中的字元,並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別,以識別出各個所述第二分割區域中的字元。
在一實施例中,所述預先確定的分析模型為卷積神經網路模型,所述預先確定的分析模型的訓練過程如下:A、針對預先確定的理賠單據框架格式,獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本;B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割,並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域;C、將所有第三分割區域歸入第一訓練集,將所有第四分割區域歸入第二訓練集;D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域,並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域;E、利用提取的各個待訓練的分割區域進行模型訓練,以生成所述預先確定的分析模型,並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證;F、若驗證通過率大於或等於預設閾值,則訓練完成,或者, 若驗證通過率小於預設閾值,則增加理賠單據影像樣本的數量,並重複執行上述步驟A、B、C、D、E,直至驗證通過率大於或等於預設閾值。
在一實施例中,所述預先確定的識別模型為長短期記憶LSTM模型,所述預先確定的識別模型的訓練過程如下:獲取預設數量的分割區域樣本,對各個分割區域樣本以該分割區域樣本所含字元來進行標注;將預設數量的分割區域樣本按照預設比例分為第一資料集和第二資料集,並將所述第一資料集作為訓練集,將所述第二資料集作為測試集;將所述第一資料集送入LSTM網路進行模型訓練,每隔預設時間,使用訓練得到的模型對所述第二資料集中的分割區域樣本進行字元識別,並將識別的字元與該分割區域樣本的標注進行比對,以計算識別的字元和標注的誤差;若訓練得到的模型識別字元的誤差出現發散,則調整預設的訓練參數並重新訓練,直至使得訓練得到的模型識別字元的誤差能夠收斂;若訓練得到的模型識別字元的誤差收斂,則結束模型訓練,將生成的模型作為訓練好的所述預先確定的識別模型。
在一實施例中,所述分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域,且所述分割區域為不包含框線的區域。
本發明提出的理賠單據的字元識別方法及伺服器,在對理賠單據影像進行字元識別前,按照該理賠單據框架格式的框線排布對其進行區域分割,利用預先確定的識別規則對該理賠單據的各個分割區域分別進 行字元識別,以分別識別出各個分割區域中的字元。由於考慮到理賠單據框架格式對識別精度的影響,在進行字元識別前先按照理賠單據框架格式的框線排布進行區域分割,再針對各個分割區域來進行字元識別,避免了在對整個理賠單據影像中的字元進行統一識別時單據中的框線對字元識別的影響及干涉,能有效提高對理賠單據中字元的識別精度。
S10‧‧‧步驟
S20‧‧‧步驟
S201‧‧‧步驟
S202‧‧‧步驟
01‧‧‧分割模組
02‧‧‧識別模組
圖1為本發明理賠單據的字元識別方法第一實施例的流程示意圖;圖2為本發明理賠單據的字元識別方法第二實施例的流程示意圖;圖3為本發明理賠單據的字元識別伺服器第一實施例的功能模組示意圖。
本發明目的的實現、功能特點及優點將結合實施例,參照附圖做進一步說明。
為了使本發明所要解決的技術問題、技術方案及有益效果更加清楚、明白,以下結合附圖和實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,並不用於限定本發明。
本發明提供一種理賠單據的字元識別方法。
參照圖1,圖1為本發明理賠單據的字元識別方法第一實施例的流程示意圖。
在第一實施例中,該理賠單據的字元識別方法包括: 步驟S10,伺服器在收到待識別字元的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域;本實施例中,伺服器可以接收使用者發出的包含待識別字元的理賠單據影像的字元識別請求,例如,接收使用者通過手機、平板電腦、自助終端設備等終端發送的字元識別請求,如接收使用者在手機、平板電腦、自助終端設備等終端中預先安裝的客戶端上發送來的字元識別請求,或接收使用者在手機、平板電腦、自助終端設備等終端中的瀏覽器系統上發送來的字元識別請求。
伺服器在收到待識別字元識別的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,理賠單據影像中按照其框架格式排布有橫向或豎向的框線,以組成各項輸入欄供使用者填寫相關信息。本實施例中,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域。例如,在一種實施方式中,由於一般不同類型的保險均對應有不同的單據格式模板,因此,可預先根據使用者上傳的單據類型(可能不同的保險有不同的單據格式),獲取到對應的單據模板,然後根據模板的格式來分割。如可根據收到的待識別字元的理賠單據影像的單據類型,找到該理賠單據影像對應的單據模板,然後根據其對應的單據模板進行區域分割。該分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域,且該分割區域為不包含框線的區域,以避免後續在對每一分割區域進行字元識別時框線對識別精度的干涉及影響,該分割區域類似於excel表格的每個方格,excel表格的每個方格即是最小區域內不包含框線的區域。
步驟S20,呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別,以識別出各個分割區域中的字元。
在按照該理賠單據框架格式的框線排布對理賠單據影像進行區域分割得到一個或多個分割區域後,可呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對各個分割區域分別進行字元識別,以識別出各個分割區域中的字元,也即理賠單據影像中的字元。例如,可利用預先確定的分析模型分析各個分割區域所適用的識別模型或識別方式,再根據分析出的結果針對各個分割區域利用適合各個分割區域自身的識別模型或識別方式來進行字元識別,以提高字元識別的準確率。如針對不同的分割區域,可分析出字元識別的方式為利用光學字元識別引擎進行識別,也可以用其他識別引擎或訓練的識別模型來進行識別,在此不做限定。識別出各個分割區域中的字元,還可將各個分割區域中的字元自動填充、輸入至與該理賠單據影像對應的電子理賠單據的各相應輸入欄位中。
本實施例在對理賠單據影像進行字元識別前,按照該理賠單據框架格式的框線排布對其進行區域分割,利用預先確定的識別規則對該理賠單據的各個分割區域分別進行字元識別,以分別識別出各個分割區域中的字元。由於考慮到理賠單據框架格式對識別精度的影響,在進行字元識別前先按照理賠單據框架格式的框線排布進行區域分割,再針對各個分割區域來進行字元識別,避免了在對整個理賠單據影像中的字元進行統一識別時單據中的框線對字元識別的影響及干涉,能有效提高對理賠單據中字 元的識別精度。
如圖2所示,本發明第二實施例提出一種理賠單據的字元識別方法,在上述實施例的基礎上,所述步驟S20包括:步驟S201,呼叫預先確定的分析模型對獲得的各個分割區域進行分析,以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域;步驟S202,利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別,以識別出各個所述第一分割區域中的字元,並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別,以識別出各個所述第二分割區域中的字元。
本實施例中,在按照該理賠單據框架格式的框線排布進行區域分割得到一個或多個分割區域後,在對獲得的分割區域進行識別之前,還呼叫預先確定的分析模型對獲得的各個分割區域進行分析,以分析出無需深度識別的第一分割區域和需要深度識別的第二分割區域。例如,以當前自身的識別引擎為OCR字元識別引擎為例進行說明,可將OCR字元識別引擎能正確識別或識別率高的區域作為無需深度識別的區域,即利用當前自身的OCR字元識別引擎即可對該區域的字元進行正確的識別,無需借助其他識別方式。將OCR字元識別引擎無法識別或識別率低的區域作為需要深度識別的區域,即利用當前自身的OCR字元識別引擎無法對該區域的字元進行正確的識別,需借助其他識別方式如經訓練過的識別模型來進行字元識別。
在分析出該理賠單據影像中可利用OCR字元識別引擎進行 正確識別的第一分割區域和不可利用OCR字元識別引擎識別的第二分割區域之後,即可針對分析出的第一分割區域和第二分割區域採取不同的識別方式進行字元識別。利用預先確定的OCR字元識別引擎對各個所述第一分割區域進行字元識別,以正確識別出各個所述第一分割區域中的字元。呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別,以正確識別出各個所述第二分割區域中的字元,該預先確定的識別模型可以是針對大量分割區域樣本進行訓練好的識別模型,也可以是比自身的OCR字元識別引擎識別方式更複雜、識別效果更好的識別引擎,在此不做限定。
進一步地,在其他實施例中,所述預先確定的分析模型為卷積神經網路(Convolutional Neural Network,簡稱CNN)模型,所述預先確定的分析模型的訓練過程如下:A、針對預先確定的理賠單據框架格式,獲取預設數量(例如,50萬個)的基於該理賠單據框架格式的理賠單據影像樣本;B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割,並確定出各個理賠單據影像樣本中OCR字元識別引擎識別錯誤的第三分割區域和OCR字元識別引擎識別正確的第四分割區域;C、將所有第三分割區域歸入第一訓練集,將所有第四分割區域歸入第二訓練集;D、分別從第一訓練集和第二訓練集中提取出第一預設比例(例如,80%)的分割區域作為待訓練的分割區域,並將第一訓練集和第二訓練集中剩餘的分割區域作為待驗證的分割區域; E、利用提取的各個待訓練的分割區域進行模型訓練,以生成所述預先確定的分析模型,並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證;F、若驗證通過率大於等於預設閾值(例如,98%),則訓練完成,或者,若驗證通過率小於預設閾值,則增加理賠單據影像樣本的數量,並重複執行所述步驟A、B、C、D、E,直至驗證通過率大於或等於預設閾值。
本實施例中利用經大量理賠單據影像樣本訓練過的卷積神經網路模型來進行分割區域分析,能夠準確分析出理賠單據的各個分割區域中可利用OCR字元識別引擎來正確識別字元的第一分割區域和無法利用OCR字元識別引擎來正確識別字元的第二分割區域,以便後續針對第一分割區域和第二分割區域分別採用不同的識別方式來進行準確的字元識別操作,從而提高對理賠單據中字元的識別精度。
進一步地,在其他實施例中,所述預先確定的識別模型為長短期記憶(Long Short-Term Memory,簡稱LSTM)模型,所述預先確定的識別模型的訓練過程如下:獲取預設數量(例如,10萬)的區域樣本,該區域樣本可以是歷史資料中對若干理賠單據按照其框架格式的框線排布進行區域分割後的分割區域樣本。在一種實施方式中,可統一將分割區域樣本中的字體設置為黑色,背景設置為白色,以便於進行字元識別。並將各個分割區域樣本進行標注,如可將各個分割區域樣本的名稱命名為該分割區域樣本所包含的字元以進行標注。
將預設數量的分割區域樣本按照預設比例(例如,8:2)分為第一資料集和第二資料集,將第一資料集作為訓練集,將第二資料集作為測試集,其中,第一資料集的樣本數量比例大於或者等於第二資料集的樣本數量比例。
將第一資料集送入LSTM網路進行模型訓練,每隔預設時間(例如每30分鐘或每進行1000次迭代),對模型使用第二資料集進行測試,以評估當前訓練的模型效果。例如,在測試時,可使用訓練得到的模型對第二資料集中的分割區域樣本進行字元識別,並將利用訓練得到的模型對分割區域樣本的字元識別結果與該分割區域樣本的標注進行比對,以計算出訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差。具體地,在計算誤差時,可採用編輯距離作為計算標準,其中,編輯距離(Edit Distance),又稱Levenshtein距離,是指兩個字串之間,由一個轉成另一個所需的最少編輯操作次數。許可的編輯操作包括將一個字元替換成另一個字元,插入一個字元,刪除一個字元,一般來說,編輯距離越小,兩個串的相似度越大。因此,在以編輯距離作為計算標準來計算訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差時,計算得到的誤差越小,說明訓練得到的模型的字元識別結果與該分割區域樣本的標注的相似度越大;相反,計算得到的誤差越大,說明訓練得到的模型的字元識別結果與該分割區域樣本的標注的相似度越小。
由於該分割區域樣本的標注為該分割區域樣本的名稱也即該分割區域樣本所包含的字元,因此,計算出的訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差即為訓練得到的模型的字元識別結果 與該分割區域樣本所包含的字元之間的誤差,能反映出訓練得到的模型識別出的字元與正確的字元之間的誤差。記錄每一次對訓練的模型使用第二資料集進行測試的誤差,並分析誤差的變化趨勢,若分析測試時的訓練模型對分割區域樣本的字元識別的誤差出現發散,則調整訓練參數如activation函數、LSTM層數、輸入輸出的變數維度等,並重新訓練,使測試時的訓練模型對分割區域樣本的字元識別的誤差能夠收斂。當分析測試時的訓練模型對分割區域樣本的字元識別的誤差收斂後,則結束模型訓練,將生成的訓練模型作為訓練好的所述預先確定的識別模型。
本實施例中,針對OCR字元識別引擎無法識別的區域,採用訓練好的LSTM模型進行識別,由於LSTM模型為經大量分割區域樣本訓練過的,且對分割區域樣本的字元識別的誤差收斂的模型,配合LSTM模型自身的長期記憶功能使該LSTM模型在識別分割區域中的字元時,能利用模型記住的長期信息如上下文信息等,更加準確地識別出分割區域中的字元,從而進一步提高對理賠單據中字元的識別精度。
本發明進一步提供一種理賠單據的字元識別伺服器。
參照圖3,圖3為本發明理賠單據的字元識別伺服器第一實施例的功能模組示意圖。
在第一實施例中,該理賠單據的字元識別伺服器包括:分割模組01,用於在收到待識別字元的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域;本實施例中,伺服器可以接收使用者發出的包含待識別字元 的理賠單據影像的字元識別請求,例如,接收使用者通過手機、平板電腦、自助終端設備等終端發送的字元識別請求,如接收使用者在手機、平板電腦、自助終端設備等終端中預先安裝的客戶端上發送來的字元識別請求,或接收使用者在手機、平板電腦、自助終端設備等終端中的瀏覽器系統上發送來的字元識別請求。
伺服器在收到待識別字元識別的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,理賠單據影像中按照其框架格式排布有橫向或豎向的框線,以組成各項輸入欄供使用者填寫相關信息。本實施例中,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域。例如,在一種實施方式中,由於一般不同類型的保險均對應有不同的單據格式模板,因此,可預先根據使用者上傳的單據類型(可能不同的保險有不同的單據格式),獲取到對應的單據模板,然後根據模板的格式來分割。如可根據收到的待識別字元的理賠單據影像的單據類型,找到該理賠單據影像對應的單據模板,然後根據其對應的單據模板進行區域分割。該分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域,且該分割區域為不包含框線的區域,以避免後續在對每一分割區域進行字元識別時框線對識別精度的干涉及影響,該分割區域類似於excel表格的每個方格,excel表格的每個方格即是最小區域內不包含框線的區域。
識別模組02,用於呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別,以識別出各個分割區域中的字元。
在按照該理賠單據框架格式的框線排布對理賠單據影像進 行區域分割得到一個或多個分割區域後,可呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對各個分割區域分別進行字元識別,以識別出各個分割區域中的字元,也即理賠單據影像中的字元。例如,可利用預先確定的分析模型分析各個分割區域所適用的識別模型或識別方式,再根據分析出的結果針對各個分割區域利用適合各個分割區域自身的識別模型或識別方式來進行字元識別,以提高字元識別的準確率。如針對不同的分割區域,可分析出字元識別的方式為利用光學字元識別引擎進行識別,也可以用其他識別引擎或訓練的識別模型來進行識別,在此不做限定。識別出各個分割區域中的字元,還可將各個分割區域中的字元自動填充、輸入至與該理賠單據影像對應的電子理賠單據的各相應輸入欄位中。
本實施例在對理賠單據影像進行字元識別前,按照該理賠單據框架格式的框線排布對其進行區域分割,利用預先確定的識別規則對該理賠單據的各個分割區域分別進行字元識別,以分別識別出各個分割區域中的字元。由於考慮到理賠單據框架格式對識別精度的影響,在進行字元識別前先按照理賠單據框架格式的框線排布進行區域分割,再針對各個分割區域來進行字元識別,避免了在對整個理賠單據影像中的字元進行統一識別時單據中的框線對字元識別的影響及干涉,能有效提高對理賠單據中字元的識別精度。
進一步地,在上述實施例的基礎上,上述識別模組02還用於:呼叫預先確定的分析模型對獲得的各個分割區域進行分析, 以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域;利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別,以識別出各個所述第一分割區域中的字元,並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別,以識別出各個所述第二分割區域中的字元。
本實施例中,在按照該理賠單據框架格式的框線排布進行區域分割得到一個或多個分割區域後,在對獲得的分割區域進行識別之前,還呼叫預先確定的分析模型對獲得的各個分割區域進行分析,以分析出無需深度識別的第一分割區域和需要深度識別的第二分割區域。例如,以當前自身的識別引擎為OCR字元識別引擎為例進行說明,可將OCR字元識別引擎能正確識別或識別率高的區域作為無需深度識別的區域,即利用當前自身的OCR字元識別引擎即可對該區域的字元進行正確的識別,無需借助其他識別方式。將OCR字元識別引擎無法識別或識別率低的區域作為需要深度識別的區域,即利用當前自身的OCR字元識別引擎無法對該區域的字元進行正確的識別,需借助其他識別方式如經訓練過的識別模型來進行字元識別。
在分析出該理賠單據影像中可利用OCR字元識別引擎進行正確識別的第一分割區域和不可利用OCR字元識別引擎識別的第二分割區域之後,即可針對分析出的第一分割區域和第二分割區域採取不同的識別方式進行字元識別。利用預先確定的OCR字元識別引擎對各個所述第一分割區域進行字元識別,以正確識別出各個所述第一分割區域中的字元。呼叫 預先確定的識別模型對各個所述第二分割區域進行字元識別,以正確識別出各個所述第二分割區域中的字元,該預先確定的識別模型可以是針對大量分割區域樣本進行訓練好的識別模型,也可以是比自身的OCR字元識別引擎識別方式更複雜、識別效果更好的識別引擎,在此不做限定。
進一步地,在其他實施例中,所述預先確定的分析模型為卷積神經網路(Convolutional Neural Network,簡稱CNN)模型,所述預先確定的分析模型的訓練過程如下:A、針對預先確定的理賠單據框架格式,獲取預設數量(例如,50萬個)的基於該理賠單據框架格式的理賠單據影像樣本;B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割,並確定出各個理賠單據影像樣本中OCR字元識別引擎識別錯誤的第三分割區域和OCR字元識別引擎識別正確的第四分割區域;C、將所有第三分割區域歸入第一訓練集,將所有第四分割區域歸入第二訓練集;D、分別從第一訓練集和第二訓練集中提取出第一預設比例(例如,80%)的分割區域作為待訓練的分割區域,並將第一訓練集和第二訓練集中剩餘的分割區域作為待驗證的分割區域;E、利用提取的各個待訓練的分割區域進行模型訓練,以生成所述預先確定的分析模型,並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證;F、若驗證通過率大於等於預設閾值(例如,98%),則訓練 完成,或者,若驗證通過率小於預設閾值,則增加理賠單據影像樣本的數量,並重複執行所述步驟A、B、C、D、E,直至驗證通過率大於或等於預設閾值。
本實施例中利用經大量理賠單據影像樣本訓練過的卷積神經網路模型來進行分割區域分析,能夠準確分析出理賠單據的各個分割區域中可利用OCR字元識別引擎來正確識別字元的第一分割區域和無法利用OCR字元識別引擎來正確識別字元的第二分割區域,以便後續針對第一分割區域和第二分割區域分別採用不同的識別方式來進行準確的字元識別操作,從而提高對理賠單據中字元的識別精度。
進一步地,在其他實施例中,所述預先確定的識別模型為長短期記憶(Long Short-Term Memory,簡稱LSTM)模型,所述預先確定的識別模型的訓練過程如下:獲取預設數量(例如,10萬)的區域樣本,該區域樣本可以是歷史資料中對若干理賠單據按照其框架格式的框線排布進行區域分割後的分割區域樣本。在一種實施方式中,可統一將分割區域樣本中的字體設置為黑色,背景設置為白色,以便於進行字元識別。並將各個分割區域樣本進行標注,如可將各個分割區域樣本的名稱命名為該分割區域樣本所包含的字元以進行標注。
將預設數量的分割區域樣本按照預設比例(例如,8:2)分為第一資料集和第二資料集,將第一資料集作為訓練集,將第二資料集作為測試集,其中,第一資料集的樣本數量比例大於或者等於第二資料集的樣本數量比例。
將第一資料集送入LSTM網路進行模型訓練,每隔預設時間(例如每30分鐘或每進行1000次迭代),對模型使用第二資料集進行測試,以評估當前訓練的模型效果。例如,在測試時,可使用訓練得到的模型對第二資料集中的分割區域樣本進行字元識別,並將利用訓練得到的模型對分割區域樣本的字元識別結果與該分割區域樣本的標注進行比對,以計算出訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差。具體地,在計算誤差時,可採用編輯距離作為計算標準,其中,編輯距離(Edit Distance),又稱Levenshtein距離,是指兩個字串之間,由一個轉成另一個所需的最少編輯操作次數。許可的編輯操作包括將一個字元替換成另一個字元,插入一個字元,刪除一個字元,一般來說,編輯距離越小,兩個串的相似度越大。因此,在以編輯距離作為計算標準來計算訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差時,計算得到的誤差越小,說明訓練得到的模型的字元識別結果與該分割區域樣本的標注的相似度越大;相反,計算得到的誤差越大,說明訓練得到的模型的字元識別結果與該分割區域樣本的標注的相似度越小。
由於該分割區域樣本的標注為該分割區域樣本的名稱也即該分割區域樣本所包含的字元,因此,計算出的訓練得到的模型的字元識別結果與該分割區域樣本的標注的誤差即為訓練得到的模型的字元識別結果與該分割區域樣本所包含的字元之間的誤差,能反映出訓練得到的模型識別出的字元與正確的字元之間的誤差。記錄每一次對訓練的模型使用第二資料集進行測試的誤差,並分析誤差的變化趨勢,若分析測試時的訓練模型對分割區域樣本的字元識別的誤差出現發散,則調整訓練參數如activation 函數、LSTM層數、輸入輸出的變數維度等,並重新訓練,使測試時的訓練模型對分割區域樣本的字元識別的誤差能夠收斂。當分析測試時的訓練模型對分割區域樣本的字元識別的誤差收斂後,則結束模型訓練,將生成的訓練模型作為訓練好的所述預先確定的識別模型。
本實施例中,針對OCR字元識別引擎無法識別的區域,採用訓練好的LSTM模型進行識別,由於LSTM模型為經大量分割區域樣本訓練過的,且對分割區域樣本的字元識別的誤差收斂的模型,配合LSTM模型自身的長期記憶功能使該LSTM模型在識別分割區域中的字元時,能利用模型記住的長期信息如上下文信息等,更加準確地識別出分割區域中的字元,從而進一步提高對理賠單據中字元的識別精度。
需要說明的是,在本文中,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
通過以上的實施方式的描述,所屬技術領域中具有通常知識者可以清楚地瞭解到上述實施例方法可借助軟體加必需的通用硬體平臺的方式來實現,當然也可以通過硬體來實現,但很多情況下前者是更佳的實施方式。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該電腦軟體產品儲存在一個儲存介質(如ROM/RAM、磁碟、光碟)中,包括若干指令用以使得一台終端 設備(可以是手機,電腦,伺服器,空調器,或者網路設備等)執行本發明各個實施例所述的方法。
以上參照附圖說明瞭本發明的優選實施例,並非因此局限本發明的權利範圍。上述本發明實施例序號僅僅為了描述,不代表實施例的優劣。另外,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同於此處的順序執行所示出或描述的步驟。
所屬技術領域中具有通常知識者不脫離本發明的範圍和實質,可以有多種變型方案實現本發明,比如作為一個實施例的特徵可用於另一實施例而得到又一實施例。凡在運用本發明的技術構思之內所作的任何修改、等同替換和改進,均應在本發明的權利範圍之內。
Claims (10)
- 一種理賠單據的字元識別方法,其中,所述方法包括以下步驟:伺服器在收到待識別字元的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域;呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別,以識別出各個分割區域中的字元。
- 如請求項1所述的理賠單據的字元識別方法,其中,所述呼叫預先確定的分析模型對獲得的各個分割區域進行分析的步驟包括:呼叫預先確定的分析模型對獲得的各個分割區域進行分析,以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域;所述利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別的步驟還包括:利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別,以識別出各個所述第一分割區域中的字元,並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別,以識別出各個所述第二分割區域中的字元。
- 如請求項2所述的理賠單據的字元識別方法,其中,所述預先確定的分析模型為卷積神經網路模型,所述預先確定的分析模型的訓練過程如下:A、針對預先確定的理賠單據框架格式,獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本;B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割,並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域;C、將所有第三分割區域歸入第一訓練集,將所有第四分割區域歸入第二訓練集; D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域,並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域;E、利用提取的各個待訓練的分割區域進行模型訓練,以生成所述預先確定的分析模型,並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證;F、若驗證通過率大於或等於預設閾值,則訓練完成,或者,若驗證通過率小於預設閾值,則增加理賠單據影像樣本的數量,並重複執行上述步驟A、B、C、D、E,直至驗證通過率大於或等於預設閾值。
- 如請求項2或3所述的理賠單據的字元識別方法,其中,所述預先確定的識別模型為長短期記憶LSTM模型,所述預先確定的識別模型的訓練過程如下:獲取預設數量的分割區域樣本,對各個分割區域樣本以該分割區域樣本所含字元來進行標注;將預設數量的分割區域樣本按照預設比例分為第一資料集和第二資料集,並將所述第一資料集作為訓練集,將所述第二資料集作為測試集;將所述第一資料集送入LSTM網路進行模型訓練,每隔預設時間,使用訓練得到的模型對所述第二資料集中的分割區域樣本進行字元識別,並將識別的字元與該分割區域樣本的標注進行比對,以計算識別的字元和標注的誤差;若訓練得到的模型識別字元的誤差出現發散,則調整預設的訓練參數並重新訓練,直至使得訓練得到的模型識別字元的誤差能夠收斂;若訓練得到的模型識別字元的誤差收斂,則結束模型訓練,將生成的模型作為訓練好的所述預先確定的識別模型。
- 如請求項1所述的理賠單據的字元識別方法,其中,所述分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域,且所述分割區域為不包含框線的區域。
- 一種理賠單據的字元識別伺服器,其中,所述字元識別伺服器包 括:分割模組,用於在收到待識別字元的理賠單據影像後,按照該理賠單據框架格式的框線排布進行區域分割,獲得一個或多個分割區域;識別模組,用於呼叫預先確定的分析模型對獲得的各個分割區域進行分析,並利用預先確定的識別規則對分析出的各個分割區域分別進行字元識別,以識別出各個分割區域中的字元。
- 如請求項6所述的理賠單據的字元識別伺服器,其中,所述識別模組還用於:呼叫預先確定的分析模型對獲得的各個分割區域進行分析,以分析出可利用光學字元識別引擎識別的第一分割區域和不可利用光學字元識別引擎識別的第二分割區域;利用預先確定的光學字元識別引擎對各個所述第一分割區域進行字元識別,以識別出各個所述第一分割區域中的字元,並呼叫預先確定的識別模型對各個所述第二分割區域進行字元識別,以識別出各個所述第二分割區域中的字元。
- 如請求項7所述的理賠單據的字元識別伺服器,其中,所述預先確定的分析模型為卷積神經網路模型,所述預先確定的分析模型的訓練過程如下:A、針對預先確定的理賠單據框架格式,獲取預設數量的基於該理賠單據框架格式的理賠單據影像樣本;B、對每一個理賠單據影像樣本按照該理賠單據框架格式的框線排布進行區域分割,並確定出各個理賠單據影像樣本中利用光學字元識別引擎識別錯誤的第三分割區域和利用光學字元識別引擎識別正確的第四分割區域;C、將所有第三分割區域歸入第一訓練集,將所有第四分割區域歸入第二訓練集;D、分別從所述第一訓練集和所述第二訓練集中提取出第一預設比例的分割區域作為待訓練的分割區域,並將所述第一訓練集和所述第二訓練集中剩餘的分割區域作為待驗證的分割區域; E、利用提取的各個待訓練的分割區域進行模型訓練,以生成所述預先確定的分析模型,並利用各個待驗證的分割區域對生成的所述預先確定的分析模型進行驗證;F、若驗證通過率大於或等於預設閾值,則訓練完成,或者,若驗證通過率小於預設閾值,則增加理賠單據影像樣本的數量,並重複執行上述步驟A、B、C、D、E,直至驗證通過率大於或等於預設閾值。
- 如請求項7或8所述的理賠單據的字元識別伺服器,其中,所述預先確定的識別模型為長短期記憶LSTM模型,所述預先確定的識別模型的訓練過程如下:獲取預設數量的分割區域樣本,對各個分割區域樣本以該分割區域樣本所含字元來進行標注;將預設數量的分割區域樣本按照預設比例分為第一資料集和第二資料集,並將所述第一資料集作為訓練集,將所述第二資料集作為測試集;將所述第一資料集送入LSTM網路進行模型訓練,每隔預設時間,使用訓練得到的模型對所述第二資料集中的分割區域樣本進行字元識別,並將識別的字元與該分割區域樣本的標注進行比對,以計算識別的字元和標注的誤差;若訓練得到的模型識別字元的誤差出現發散,則調整預設的訓練參數並重新訓練,直至使得訓練得到的模型識別字元的誤差能夠收斂;若訓練得到的模型識別字元的誤差收斂,則結束模型訓練,將生成的模型作為訓練好的所述預先確定的識別模型。
- 如請求項6所述的理賠單據的字元識別伺服器,其中,所述分割區域是由該理賠單據框架格式的框線所圍成的最小單位的區域,且所述分割區域為不包含框線的區域。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710233613.3 | 2017-04-11 | ||
CN201710233613.3A CN107220648B (zh) | 2017-04-11 | 2017-04-11 | 理赔单据的字符识别方法及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI621077B TWI621077B (zh) | 2018-04-11 |
TW201837788A true TW201837788A (zh) | 2018-10-16 |
Family
ID=59927567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106135247A TWI621077B (zh) | 2017-04-11 | 2017-10-13 | 理賠單據的字元識別方法及伺服器 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10650231B2 (zh) |
EP (1) | EP3432197B1 (zh) |
JP (1) | JP6710483B2 (zh) |
KR (1) | KR102171220B1 (zh) |
CN (1) | CN107220648B (zh) |
AU (1) | AU2017408799B2 (zh) |
SG (1) | SG11201900263SA (zh) |
TW (1) | TWI621077B (zh) |
WO (1) | WO2018188199A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI684950B (zh) * | 2018-12-12 | 2020-02-11 | 全友電腦股份有限公司 | 物種數據解析方法、系統及電腦程式產品 |
TWI703508B (zh) * | 2018-12-19 | 2020-09-01 | 洽吧智能股份有限公司 | 字元影像識別方法與系統 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798299B (zh) * | 2017-10-09 | 2020-02-07 | 平安科技(深圳)有限公司 | 票据信息识别方法、电子装置及可读存储介质 |
CN107766809B (zh) * | 2017-10-09 | 2020-05-19 | 平安科技(深圳)有限公司 | 电子装置、票据信息识别方法和计算机可读存储介质 |
CN108319641A (zh) * | 2017-12-21 | 2018-07-24 | 无锡雅座在线科技股份有限公司 | 菜品信息录入方法及装置 |
CN108198591A (zh) * | 2017-12-28 | 2018-06-22 | 泰康保险集团股份有限公司 | 用于远程审核单据的方法与装置 |
CN110135225B (zh) * | 2018-02-09 | 2021-04-09 | 北京世纪好未来教育科技有限公司 | 样本标注方法及计算机存储介质 |
CN108595519A (zh) * | 2018-03-26 | 2018-09-28 | 平安科技(深圳)有限公司 | 热点事件分类方法、装置及存储介质 |
CN110321760A (zh) * | 2018-03-29 | 2019-10-11 | 北京和缓医疗科技有限公司 | 一种医疗单据识别方法和装置 |
CN108564035B (zh) | 2018-04-13 | 2020-09-25 | 杭州睿琪软件有限公司 | 识别单据上记载的信息的方法及系统 |
US20210334530A1 (en) * | 2018-06-21 | 2021-10-28 | Element Ai Inc. | Data extraction from short business documents |
CN109241857A (zh) * | 2018-08-13 | 2019-01-18 | 杭州睿琪软件有限公司 | 一种单据信息的识别方法及系统 |
CN109190594A (zh) * | 2018-09-21 | 2019-01-11 | 广东蔚海数问大数据科技有限公司 | 光学字符识别系统及信息提取方法 |
CN110569700B (zh) * | 2018-09-26 | 2020-11-03 | 创新先进技术有限公司 | 优化损伤识别结果的方法及装置 |
CN109492549A (zh) * | 2018-10-24 | 2019-03-19 | 杭州睿琪软件有限公司 | 一种训练样本集处理、模型训练方法及系统 |
CN109344838B (zh) * | 2018-11-02 | 2023-11-24 | 长江大学 | 发票信息自动快速识别方法、系统以及装置 |
SG11201903592RA (en) * | 2018-11-02 | 2020-06-29 | Alibaba Group Holding Ltd | Monitoring multiple system indicators |
CN109784341A (zh) * | 2018-12-25 | 2019-05-21 | 华南理工大学 | 一种基于lstm神经网络的医疗单据识别方法 |
JP2020027598A (ja) * | 2018-12-27 | 2020-02-20 | 株式会社シグマクシス | 文字認識装置、文字認識方法及び文字認識プログラム |
CN109903172A (zh) * | 2019-01-31 | 2019-06-18 | 阿里巴巴集团控股有限公司 | 理赔信息提取方法和装置、电子设备 |
CN110084704A (zh) * | 2019-03-15 | 2019-08-02 | 北京水滴互联科技有限公司 | 一种互助保障服务器、系统及互助保障方法 |
SG10201904825XA (en) | 2019-05-28 | 2019-10-30 | Alibaba Group Holding Ltd | Automatic optical character recognition (ocr) correction |
CN110610175A (zh) * | 2019-08-06 | 2019-12-24 | 深圳市华付信息技术有限公司 | 一种ocr数据误标注清洗方法 |
US11481605B2 (en) | 2019-10-25 | 2022-10-25 | Servicenow Canada Inc. | 2D document extractor |
CN111291742B (zh) * | 2020-02-10 | 2023-08-04 | 北京百度网讯科技有限公司 | 对象识别方法和装置、电子设备、存储介质 |
CN111539424A (zh) * | 2020-04-21 | 2020-08-14 | 北京云从科技有限公司 | 一种基于ocr的图像处理方法、系统、设备及介质 |
US11972489B1 (en) | 2020-04-24 | 2024-04-30 | State Farm Mutual Automobile Insurance Company | Claims process assistance using models |
CN111259873B (zh) * | 2020-04-26 | 2021-02-26 | 江苏联著实业股份有限公司 | 一种表格数据提取方法及装置 |
CN112686262A (zh) * | 2020-12-28 | 2021-04-20 | 广州博士信息技术研究院有限公司 | 一种基于图像识别技术的手册提取结构化数据并快速归档的方法 |
CN115981798B (zh) * | 2023-03-21 | 2023-08-01 | 北京探境科技有限公司 | 文件解析方法、装置、计算机设备及可读存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04304586A (ja) | 1991-04-01 | 1992-10-27 | Mitsubishi Electric Corp | 文字認識装置 |
JP2003256772A (ja) * | 2002-03-06 | 2003-09-12 | Ricoh Co Ltd | 文字認識装置及び記録媒体 |
TW200802137A (en) | 2006-06-16 | 2008-01-01 | Univ Nat Chiao Tung | Serial-type license plate recognition system |
TWI355853B (en) | 2008-04-25 | 2012-01-01 | Hon Hai Prec Ind Co Ltd | Image capturing device and image arranging method |
KR101028670B1 (ko) * | 2008-10-22 | 2011-04-12 | 엔에이치엔(주) | 언어모델과 ocr을 이용하여 문서에 포함된 문자열을 인식하는 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
JP4856235B2 (ja) | 2009-12-15 | 2012-01-18 | 富士通株式会社 | 帳票認識方法及び帳票認識装置 |
US8625113B2 (en) * | 2010-09-24 | 2014-01-07 | Ricoh Company Ltd | System and method for distributed optical character recognition processing |
CN102567764B (zh) | 2012-01-13 | 2016-03-02 | 中国工商银行股份有限公司 | 一种提高电子影像识别效率的票据凭证及系统 |
JP5753828B2 (ja) | 2012-09-27 | 2015-07-22 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理プログラム |
CN103258198B (zh) * | 2013-04-26 | 2015-12-23 | 四川大学 | 一种表格文档图像中字符提取方法 |
US9800895B2 (en) | 2013-06-27 | 2017-10-24 | Qualcomm Incorporated | Depth oriented inter-view motion vector prediction |
JP6773400B2 (ja) * | 2014-09-30 | 2020-10-21 | メディア株式会社 | 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体 |
US9659213B2 (en) * | 2015-07-03 | 2017-05-23 | Cognizant Technology Solutions India Pvt. Ltd. | System and method for efficient recognition of handwritten characters in documents |
CN105654072B (zh) * | 2016-03-24 | 2019-03-01 | 哈尔滨工业大学 | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 |
CN106446881B (zh) * | 2016-07-29 | 2019-05-21 | 北京交通大学 | 从医疗化验单图像中提取化验结果信息的方法 |
US20180101726A1 (en) * | 2016-10-10 | 2018-04-12 | Insurance Services Office Inc. | Systems and Methods for Optical Character Recognition for Low-Resolution Documents |
CN106557747B (zh) * | 2016-11-15 | 2018-06-22 | 平安科技(深圳)有限公司 | 识别保险单号码的方法及装置 |
JP6401806B2 (ja) * | 2017-02-14 | 2018-10-10 | 株式会社Pfu | 日付識別装置、日付識別方法及び日付識別プログラム |
-
2017
- 2017-04-11 CN CN201710233613.3A patent/CN107220648B/zh active Active
- 2017-06-30 JP JP2018536430A patent/JP6710483B2/ja active Active
- 2017-06-30 US US16/084,244 patent/US10650231B2/en active Active
- 2017-06-30 EP EP17899230.1A patent/EP3432197B1/en active Active
- 2017-06-30 KR KR1020187023693A patent/KR102171220B1/ko active IP Right Grant
- 2017-06-30 AU AU2017408799A patent/AU2017408799B2/en active Active
- 2017-06-30 SG SG11201900263SA patent/SG11201900263SA/en unknown
- 2017-06-30 WO PCT/CN2017/091363 patent/WO2018188199A1/zh active Application Filing
- 2017-10-13 TW TW106135247A patent/TWI621077B/zh active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI684950B (zh) * | 2018-12-12 | 2020-02-11 | 全友電腦股份有限公司 | 物種數據解析方法、系統及電腦程式產品 |
TWI703508B (zh) * | 2018-12-19 | 2020-09-01 | 洽吧智能股份有限公司 | 字元影像識別方法與系統 |
Also Published As
Publication number | Publication date |
---|---|
EP3432197A4 (en) | 2019-06-19 |
JP6710483B2 (ja) | 2020-06-17 |
WO2018188199A1 (zh) | 2018-10-18 |
KR20190026641A (ko) | 2019-03-13 |
US20190147239A1 (en) | 2019-05-16 |
TWI621077B (zh) | 2018-04-11 |
CN107220648A (zh) | 2017-09-29 |
CN107220648B (zh) | 2018-06-22 |
AU2017408799B2 (en) | 2019-10-10 |
AU2017408799A1 (en) | 2018-11-08 |
EP3432197B1 (en) | 2022-07-06 |
EP3432197A1 (en) | 2019-01-23 |
US10650231B2 (en) | 2020-05-12 |
JP2019520615A (ja) | 2019-07-18 |
SG11201900263SA (en) | 2019-02-27 |
KR102171220B1 (ko) | 2020-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI621077B (zh) | 理賠單據的字元識別方法及伺服器 | |
CN110704633B (zh) | 命名实体识别方法、装置、计算机设备及存储介质 | |
JP2021089705A (ja) | 翻訳品質を評価するための方法と装置 | |
WO2021164284A1 (zh) | 生成阅读理解的问题题目的方法、装置、设备及存储介质 | |
WO2021151270A1 (zh) | 图像结构化数据提取方法、装置、设备及存储介质 | |
WO2018214895A1 (zh) | 数据处理方法、数据处理装置、存储设备及网络设备 | |
US11501655B2 (en) | Automated skill tagging, knowledge graph, and customized assessment and exercise generation | |
CN111325031B (zh) | 简历解析方法及装置 | |
CN112418813B (zh) | 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质 | |
CN111723182B (zh) | 一种用于漏洞文本的关键信息抽取方法及装置 | |
CN111159997B (zh) | 一种企业投标文档的智能校验方法 | |
CN110852082A (zh) | 同义词的确定方法及装置 | |
CN113158988B (zh) | 财务报表处理方法、装置以及计算机可读存储介质 | |
US20220129423A1 (en) | Method for annotating data, related apparatus and computer program product | |
CN113645357B (zh) | 通话质检方法、装置、计算机设备和计算机可读存储介质 | |
CN115982272A (zh) | 一种城市大数据管理的数据标注方法、装置及计算机存储介质 | |
CN112860873B (zh) | 智能应答方法、装置及存储介质 | |
CN112287828A (zh) | 一种基于机器学习的财务报表生成方法及装置 | |
CN110879868A (zh) | 顾问方案生成方法、装置、系统、电子设备及介质 | |
CN111382750A (zh) | 图形验证码识别方法及装置 | |
CN112131378A (zh) | 用于识别民生问题类别的方法、装置及电子设备 | |
CN116665646A (zh) | 方言数据自动筛选识别方法、装置、设备及其存储介质 | |
CN117635768A (zh) | 流程图的绘制方法、装置和电子设备 | |
CN116684529A (zh) | 外呼处理方法、装置、计算机设备及存储介质 | |
CN115345132A (zh) | 文件处理方法、装置以及设备 |