TWM585395U - 運用深度學習之長短期記憶模型輔助保險理賠系統 - Google Patents

運用深度學習之長短期記憶模型輔助保險理賠系統 Download PDF

Info

Publication number
TWM585395U
TWM585395U TW108204659U TW108204659U TWM585395U TW M585395 U TWM585395 U TW M585395U TW 108204659 U TW108204659 U TW 108204659U TW 108204659 U TW108204659 U TW 108204659U TW M585395 U TWM585395 U TW M585395U
Authority
TW
Taiwan
Prior art keywords
date
module
insurance
medical
vocabulary
Prior art date
Application number
TW108204659U
Other languages
English (en)
Inventor
洪立全
Original Assignee
富邦人壽保險股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富邦人壽保險股份有限公司 filed Critical 富邦人壽保險股份有限公司
Priority to TW108204659U priority Critical patent/TWM585395U/zh
Publication of TWM585395U publication Critical patent/TWM585395U/zh

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一種運用深度學習之長短期記憶模型輔助保險理賠系統,保險理賠系統包含一前處理模組、一日期標準化模組、一日期分析模組以及一日期計算模組,其中前處理模組係用以接收一保戶之理賠文件或一理賠影像,產生理賠文字檔,再由日期分析模組與日期分析模組以長短期記憶模型對理賠文字檔進行處理,產生標準化日期、醫療日期及醫療類型,藉此進行醫療日數運算,產生一對應於該醫療類型之一醫療日數。

Description

運用深度學習之長短期記憶模型輔助保險理賠系統
本案是關於一種運用深度學習之長短期記憶模型輔助保險理賠系統,尤其是以長短期記憶模型對理賠文件或理賠影像之文字進行處理,產生標準化日期、醫療日期及醫療類型,藉此進行醫療日數運算,以及對應到保戶之保單條款計算出相關理賠金額。
以往保戶要請領保險理賠時,保戶向醫院取得醫囑後,交給保險公司,保險公司人員以人工方式識別日期,再藉由人工判斷該日期的類型、計算天數,最後乘上該險種對應之每日醫療單位作為理賠金額;然而中文日期格式繁多,且每位醫生對於日期寫法習慣不一,再加上日期格式上常有全形、半形格式交錯的狀況,導致光學字元辨識率不佳,且光學字元辨識率結果常與其他英文字或標點符號誤判(例:l。7年2月。6日、加18╱!•╱。l),而日期是否能正確判斷往往影響保戶的權益甚鉅,故現行方式仍是依靠大量人工來審閱文件與進行日期判斷。
因此,如何正確且快速地解析保險理賠文件,使保險理賠自動化得以實現,實為相關業者目前所亟須解決的問題。
有鑑於此,本創作提出一種運用深度學習之長短期記憶模型輔助保險理賠系統。在一些實施例中,本創作之一種保險理賠系統,包含一前處理模組,接收一含日期之保戶之一理賠文件或一理賠影像,對該理賠文件或該理賠影像進行文字識別以產生一第一理賠文字檔,該第一理賠文字檔包含一日期;一日期標準化模組,包含一詞彙處理單元、一詞彙庫、一詞向量建立單元以及一日期轉換單元,該詞彙處理單元於接收該理賠文字檔後,依據該詞彙庫之詞彙對該理賠文字檔進行可能為日期之詞彙識別,並產生一日期詞彙識別結果,該詞向量建立單元依據該日期詞彙識別結果中的字元的順序及字元特徵產生詞向量(字元順序x字元特徵)詞向量,該日期轉換單元包含一長短期記憶模型,該長短期記憶模型依據該些詞向量產生至少一標準化日期,並以該標準化日期替代該第一理賠文字檔之日期以產生一第二理賠文字檔;一日期分析模組,包含一長短期記憶模型,接收該理賠文字檔與該標準化日期,依據該標準化日期與其前後之該理賠文字檔內之詞彙,依據中文語意之特性,依時間順序產生有代表對於辭彙描述順序及辭彙特徵之多維度詞向量,各該多維度詞向量至少包含一該標準化日期與二詞彙,再依據該多維度詞向量產生對應於該標準化日期之一醫療類型;以及一日期計算模組,接收該標準化日期與該醫療類型,進行醫療日期期間運算,產生一對應於該醫療類型之一醫療日數。
在一實施例中,保險理賠系統之該醫療日期包含起始日期與終止日期。
在一實施例中,保險理賠系統之該醫療日期包含更包含一手術日期。
在一實施例中,保險理賠系統之該前處理模組包含一文件獲得單元、一影像處理單元以及一文字識別單元。
在一實施例中,保險理賠系統之該影像處理單元係用以進行影像標準化處理。
在一實施例中,保險理賠系統之該文字識別單元係用以進行光學字元識別處理。
在一實施例中,保險理賠系統之該文字處理模組更包含一除錯單元,該除錯單元係用以識別錯誤詞彙並以正確詞彙替換。
在一實施例中,保險理賠系統更包含一儲存模組,該儲存模組連接至該前處理模組、日期標準化模組、日期分析模組、日期分析模組或其組合。
在一實施例中,保險理賠系統更包含一理賠資訊查詢模組及一理賠資料庫,該理賠資訊查詢模組係用以查詢該理賠資料庫儲存之保戶之理賠資訊。
在一實施例中,保險理賠系統更包含一理賠金額計算模組,依據該理賠資訊與該醫療日數計算理賠金額。
為使本創作之技術內容、目的及優點更容易理解,下面將結合附圖對本創作的實施方式作進一步地詳細描述,然而,本描述係為例示性實施例之描述,並不意欲限制本創作之範疇。
如圖1所示,為本創作之運用深度學習之長短期記憶模型輔助保險理賠系統之一實施例,包含:一前處理模組100、一日期標準化模組200、一日期分析模組300以及一日期計算模組400。其中前處理模組100與日期標準化模組200連接,日期標準化模組200與日期分析模組300連接,日期分析模組300連接與日期計算模組400,在本創作中連接係指模組間之訊息傳遞、交換之管道,例如有線連接或無線連接。
如圖2所示,利用本實施例之運用深度學習之長短期記憶模型輔助保險理賠系統時之保險理賠流程步驟包含:步驟S201,接收一保戶之理賠文件或一理賠影像;步驟S202,對該理賠文件或該理賠影像進行文字識別步驟,並產生一理賠文字檔;步驟S203,對該理賠文字檔進行詞彙識別步驟,並產生一詞彙識別結果;步驟S204,依據該詞彙識別結果產生複數個日期詞向量;步驟S205,依據該些日期詞向量產生至少一標準化日期;步驟S206,依據該標準化日期與其前後之該理賠文字檔內之詞彙,依時間順序建立多維度詞向量,各該多維度詞向量至少包含一該標準化日期與二詞彙,再依據該多維度詞向量產生對應於該標準化日期之一醫療類型;以及步驟S207,接收該標準化日期與該醫療類型,進行醫療日期期間運算,產生一對應於該醫療類型之一醫療日數。
在本實施例中,前處理模組100包含一文件獲得單元101、一影像處理單元102以及一文字識別單元103,其中文件獲得單元101係用以獲得一保戶之一理賠文件或一理賠影像,文件獲得單元101可以是一具有資訊接收功能之單元,用以接收其他模組或裝置提供之理賠文件或理賠影像,也可以是一具有接收影像之光學訊號並轉換為該影像之數位訊號功能之單元,如具影像感測單元之感光耦合元件(Charge Coupled Device,CCD)或互補性氧化金屬半導體(Complementary Metal-Oxide Semiconductor,CMOS);影像處理單元係用以進行影像標準化處理,例如對理賠影像進行傾斜校正調整、梯形校正調整、解析度調整、亮度調整、對比度調整、尺寸調整等;文字識別單元103對該理賠文件或該理賠影像進行光學字元識別(Optical Character Recognition,OCR),以產生一理賠文字檔。前處理模組100可以是一個設置於電腦裝置內之模組,例如桌上型電腦、筆記型電腦、智慧手機等,在本實施例中,圖1之前處理模組100係設置於一智慧手機中,該智慧手機包含一照相模組,其功能即相當於前處理模組100之文件獲得單元101,使用者(如保險公司之保戶)利用該智慧手機對其診斷證明書、醫囑或其他證明文件進行影像擷取,產生一至多個理賠影像,即進行圖2之步驟S201,本系統獲得一使用者提供之理賠文件或一理賠影像。接著進行步驟S202,由本系統前處理模組100之影像處理單元對理賠影像進行處理,使得每一個理賠影像的顏色、尺寸、對比、亮度、角度達到後續文字識別單元103所需之要求,提高可識別性,接著由前處理模組100之文字識別單元103進行光學字元識別並產生一第一理賠文字檔。如圖3所示,中文日期格式繁多,一個單一日期「西元2019年1月1日」的寫法可能有圖中所示的五種,例如代表民國108年1月1日的108年1月1日、英文月份簡寫的Jan、完整的英文月份January,日期的字體大小、間隔符號也有可能不一致的情形,文字識別單元103可以將一般文字與日期文字個別地轉換為一固定格式的文字,但文字識別單元103識別的日期文字結果未必是正確的,例如2019.01.01可能識別成「2。19.01.。1」、「2。19.。1.01」或「2019.01.01」;1/1. 2019可能識別成「1/1.2。19」、「1 7.2019」、「1/122019」或「I1I.2。19」;January 01‘18可能識別成「January 0118」、或「2anuary 01。18」。據此,理賠文字檔中就含有類似上述文字識別單元103所識別之日期文字。
在本實施例中,日期標準化模組200包含一詞彙處理單元201、一詞彙庫202、一詞向量建立單元203以及一日期轉換單元204。日期標準化模組200接收理賠文字檔後,進行步驟S203之詞彙識別步驟,以產生一詞彙識別結果。其中,詞彙識別步驟包括詞彙處理單元201對理賠文字檔的文字進行同義詞及除錯處理,詞彙處理單元201依據詞彙庫202之詞彙對該理賠文字檔進行詞彙的比較與置換,例如文字識別單元103識別後的理賠文字檔的文字為「木完住院台撩」以及「離部」,其中包含正確文字與錯誤文字。因此,於步驟S203,詞彙處理單元201將「木完」替換成「本院」、「台撩」替換成「治療」、「離部」替換成「離院」等,並以經進行同義詞及除錯處理後之文字作為詞彙識別結果。
接續進行步驟S204,日期標準化模組200之詞向量建立單元203再依據前述詞彙識別結果中的字元的順序及字元特徵產生詞向量(字元順序x字元特徵)給予各字元一詞向量。在本實施例中,詞彙識別結果為「108年」時,詞向量建立單元203相應地建立之詞向量為『「1」「0」「8」「年」』。如此,當詞彙識別結果中的有複數個日期之文字時,詞向量建立單元203即可藉此產生複數個日期詞向量。
接著,步驟S205,依據該些日期詞向量產生至少一標準化日期。日期轉換單元204包含一長短期記憶模型(Long-short term memory),該長短期記憶模型依據日期詞向量,使不同格式的日期標準化。例如圖3的「2019.01.01」、「1/1.2019」、「1. Jan. 2019」、「108年1月1日」、「January 01 ‘18」經日期轉換單元204都可轉化為「20190101」,不同格式的日期經日期轉換單元204處理後變成具有相同格式之日期,以利本創作之保險理賠系統進行後續處理。
在本實施例中,日期分析模組300包含一長短期記憶模型,日期分析模組300用以執行步驟S206,於步驟S206中,日期分析模組300接收前述之該詞彙識別結果與該標準化日期,依據該標準化日期與其前後之該詞彙識別結果內之詞彙,依時間順序建立多維度詞向量,各該多維度詞向量至少包含一該標準化日期與一詞彙,再依據該多維度詞向量產生對應於該標準化日期之一醫療類型。如圖4之待識別之醫囑,該醫囑經前處理模組100、日期標準化模組200處理後,其內容被辨識、提取與日期標準化,由日期標準化模組200產生一內容為「病患王大明曾於20190101~20190105本院住院治療,於20190102接受膝關節重建手術,於20190201、20190210、20190228至本院門診治療」的連續文字之第二理賠文字檔。接著,日期分析模組300藉由長短期記憶模型對前述內容進行分析,尤其是已標準化的日期及其前後文,產生複數個由至少二字元構成之多維詞向量,例如理賠文字「病患王大明曾於20190101~ 20190105本院住院治療」,日期分析模組300會依日期數量產生二個對應之詞向量「病患王大明曾於20190101~本院住院治療」與「病患王大明曾於~20190105本院住院治療」,且日期分析模組300會以日期與醫療類型書寫的習慣或規則判斷標準化日期與醫療類型可能的關係,例如「於20190101住院」或「於20190101~20190105住院」可能都表示住院日期為20190101,如有多個連續標準化日期與醫療類型時,日期分析模組300能夠判定其順序,並將標準化日期前加上醫療類型「本院」、「住院」與「治療」後使之形成關聯,產生「20190101-住院」、「20190102-手術」、「20190105-出院」、「20190201-門診」、「20190210-門診」、「20190228-門診」等具有醫療日期及醫療類型之醫療類型日期識別結果。在本實施例中,醫療日期有20190101、20190102、20190105、20190201、20190210、與20190228六個日期,醫療類型包括住院、手術與門診三個,且日期分析模組300會比較相關醫療類型的關聯日期,例如手術日期應晚於住院日期但早於出院日期等,藉此對醫療類型之時序進行正確地判斷。
在其他實施例中,多維度詞向量也可以是由一標準化日期與二詞彙組成,例如以標準化日期「20190102」與二詞彙「於」、「手術」組成「於20190102手術」的多維度詞向量。
接著,步驟S207,日期計算模組400接收該第二理賠文字檔、該些醫療日期及醫療類型,依據醫療類型與醫療日期綜合進行醫療日期期間運算,以產生一對應於該醫療類型之一醫療日數。例如,以住院日為醫療起始日期,以出院日為醫療日期終止日期,在本實施例中,住院日期判斷為20190101,出院日期判斷為20190105,日期計算模組400即將兩個日期相減而得到住院日期為5日,即住院醫療日數為5日。
本創作之保險理賠系統之一另一實施例中,如圖5所示,保險理賠系統更包含一理賠資訊查詢模組500、一理賠資料庫600及一理賠金額計算模組700,其中該理賠資料庫600儲存有複數個保戶之保單資訊,保單資訊包含險種、保險人、被保險人、受益人、給付項目、給付金額、給付條件、給付限制等,但不限於此。該理賠資訊查詢模組500係用以查詢該理賠資料庫600儲存之保戶之理賠資訊。利用本創作之運用深度學習之長短期記憶模型輔助保險理賠方法之另一實施例之保險理賠流程,如圖6所示,於步驟S208,該理賠資訊查詢模組500自該日期計算模組400接收該醫療日數、醫療類型及該第二理賠文字檔後,依據該第二理賠文字檔中的患者姓名王大明判斷待查詢理賠資訊為王大明之保單資料,再以王大明為關鍵字向該理賠資料庫600請求對應的保單資料,如該理賠資料庫600中儲存有王大明之保單資料,該理賠資料庫600將險種、保險人、被保險人、受益人、給付項目、給付金額、給付條件、給付限制等保單資料作為理賠資訊提供給該理賠資訊查詢模組500;該理賠資訊查詢模組500再將該些理賠資訊與該第二理賠文字檔提供給理賠金額計算模組700。
在其他實施例中,理賠資訊查詢模組500亦可以一或多個選自電話、身分證號、地址、保單編號等資訊進行保單資料查詢。
步驟209,該理賠金額計算模組700將該醫療類型與該醫療日數與該理賠資訊進行對照,以計算理賠金額。例如理賠資訊中的給付項目包含門診治療與住院,給付金額為門診治療新台幣1,000元/次、住院新台幣3,000元/日,該理賠金額計算模組700即依據該醫療類型與該醫療日數計算理賠金額為新台幣1萬8千元整(1,000x3+3,000x5)。在其他實施例中,例如理賠資訊中的給付項目包含門診治療、手術、住院,給付金額為門診治療新台幣1,000元/次、手術新台幣150,000元/、住院新台幣1,000元/日,該理賠金額計算模組700即依據該醫療類型與該醫療日數計算理賠金額為新台幣16萬8千元整(1,000x3+150,000+3,000x5)。其中手術給付項目可以是以定額給付,也可以是一理賠上限金額(限額)。如為理賠上限金額,該理賠金額計算模組700可依理賠文件或理賠影像如醫療收據上所載之金額進行給付額判斷,如醫療收據上所載之金額小於理賠上限金額,則以醫療收據上所載之金額為給付金額;如醫療收據上所載之金額大於理賠上限金額,則以理賠上限金額為給付金額。
雖然本創作已以實施例揭露如上實施例,然其並非用以限定本創作,任何所屬技術領域中具有通常知識者,在不脫離本創作之精神和範圍內,當可作些許之更動與修飾,皆應為本專利所主張之權利範圍,故本專利之保護範圍當視後附之專利申請範圍所界定者為準。
100‧‧‧前處理模組
101‧‧‧文件獲得單元
102‧‧‧影像處理單元
103‧‧‧文字識別單元
200‧‧‧文字處理模組
201‧‧‧詞彙處理單元
202‧‧‧詞彙庫
203‧‧‧詞向量建立單元
204‧‧‧日期轉換單元
300‧‧‧日期分析模組
400‧‧‧日期計算模組
500‧‧‧理賠資訊查詢模組
600‧‧‧理賠資料庫
700‧‧‧理賠金額計算模組
S201-S209‧‧‧步驟
圖1為本創作之運用深度學習之長短期記憶模型輔助保險理賠系統之一實施例之示意圖。
圖2為利用本創作之運用深度學習之長短期記憶模型輔助保險理賠方法之一實施例之保險理賠流程。
圖3為本創作之手寫日期樣式之示意圖。
圖4為本創作之待識別之醫囑之示意圖。
圖5為本創作之運用深度學習之長短期記憶模型輔助保險理賠系統之又一實施例之示意圖。
圖6為利用本創作之運用深度學習之長短期記憶模型輔助保險理賠方法之另一實施例之保險理賠流程。

Claims (9)

  1. 一種運用深度學習之長短期記憶模型輔助保險理賠系統,包含:
    一前處理模組,接收一含日期之保戶之一理賠文件或一理賠影像,對該理賠文件或該理賠影像進行文字識別以產生一第一理賠文字檔,該第一理賠文字檔包含一日期;
    一日期標準化模組,包含一詞彙處理單元、一詞彙庫、一詞向量建立單元以及一日期轉換單元,該詞彙處理單元於接收該理賠文字檔後,依據該詞彙庫之詞彙對該理賠文字檔進行詞彙識別,並產生一詞彙識別結果,該詞向量建立單元依據該詞彙識別結果中的日期產生複數個日期詞向量,該日期轉換單元包含一長短期記憶模型,該長短期記憶模型依據該些日期詞向量產生至少一標準化日期,並以該標準化日期替代該第一理賠文字檔之日期以產生一第二理賠文字檔;
    一日期分析模組,包含一長短期記憶模型,接收該第二理賠文字檔,依據該標準化日期與其前後之該理賠文字檔內之詞彙,依時間順序建立多維度詞向量,各該多維度詞向量至少包含一該標準化日期與一詞彙,再依據該多維度詞向量產生對應於該標準化日期之一醫療類型;以及
    一日期計算模組,接收該標準化日期與該醫療類型,進行醫療日期期間運算,產生一對應於該醫療類型之一醫療日數。
  2. 如請求項1所述之保險理賠系統,其中該醫療日期包含起始日期與終止日期。
  3. 如請求項2所述之保險理賠系統,其中該醫療日期包含更包含一手術日期。
  4. 如請求項1所述之保險理賠系統,其中該前處理模組包含一文件獲得單元、一影像處理單元以及一文字識別單元。
  5. 如請求項4所述之保險理賠系統,其中該影像處理單元係用以進行影像標準化處理。
  6. 如請求項4所述之保險理賠系統,其中該文字識別單元係用以進行光學字元識別處理。
  7. 如請求項1所述之保險理賠系統,更包含一儲存模組,該儲存模組連接至該前處理模組、日期標準化模組、日期分析模組、日期分析模組或其組合。
  8. 如請求項1或7所述之保險理賠系統,更包含一理賠資訊查詢模組及一理賠資料庫,該理賠資訊查詢模組係用以查詢該理賠資料庫儲存之保戶之理賠資訊。
  9. 如請求項8所述之保險理賠系統,更包含一理賠金額計算模組,依據該理賠資訊與該醫療日數計算理賠金額。
TW108204659U 2019-04-16 2019-04-16 運用深度學習之長短期記憶模型輔助保險理賠系統 TWM585395U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW108204659U TWM585395U (zh) 2019-04-16 2019-04-16 運用深度學習之長短期記憶模型輔助保險理賠系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108204659U TWM585395U (zh) 2019-04-16 2019-04-16 運用深度學習之長短期記憶模型輔助保險理賠系統

Publications (1)

Publication Number Publication Date
TWM585395U true TWM585395U (zh) 2019-10-21

Family

ID=69053451

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108204659U TWM585395U (zh) 2019-04-16 2019-04-16 運用深度學習之長短期記憶模型輔助保險理賠系統

Country Status (1)

Country Link
TW (1) TWM585395U (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI712979B (zh) * 2019-04-16 2020-12-11 富邦人壽保險股份有限公司 運用深度學習之長短期記憶模型輔助保險理賠系統及其方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI712979B (zh) * 2019-04-16 2020-12-11 富邦人壽保險股份有限公司 運用深度學習之長短期記憶模型輔助保險理賠系統及其方法

Similar Documents

Publication Publication Date Title
US7610192B1 (en) Process and system for high precision coding of free text documents against a standard lexicon
US20140006926A1 (en) Systems and methods for natural language processing to provide smart links in radiology reports
US20160210426A1 (en) Method of classifying medical documents
US10789461B1 (en) Automated systems and methods for textual extraction of relevant data elements from an electronic clinical document
CN109460756B (zh) 医学影像处理方法、装置、电子设备及计算机可读介质
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
WO2023039942A1 (zh) 基于文本识别的要素信息提取方法、装置、设备及介质
US11727701B2 (en) Techniques to determine document recognition errors
WO2021151302A1 (zh) 基于机器学习的药品质控分析方法、装置、设备及介质
US20170004288A1 (en) Interactive and multimedia medical report system and method thereof
US20190027149A1 (en) Documentation tag processing system
US9881004B2 (en) Gender and name translation from a first to a second language
Suganthi et al. An offline English optical character recognition and NER using LSTM and adaptive neuro-fuzzy inference system
TWM585395U (zh) 運用深度學習之長短期記憶模型輔助保險理賠系統
CN113111660A (zh) 数据处理方法、装置、设备和存储介质
CN110335649B (zh) 一种基于Filemaker数据库的临床药物试验数据平台
CN116825269A (zh) 体检报告的处理方法、装置、电子设备和可读存储介质
TWI712979B (zh) 運用深度學習之長短期記憶模型輔助保險理賠系統及其方法
CN111063445A (zh) 基于医疗数据的特征提取方法及装置、设备和介质
CN115759040A (zh) 一种电子病历解析方法、装置、设备和存储介质
US20210357634A1 (en) Methods and systems for processing documents with task-specific highlighting
CN114743209A (zh) 处方的识别校验方法、系统、电子设备和存储介质
Amujala et al. Digitization and data frames for card index records
TWM613338U (zh) 醫囑資訊擷取系統
US20150339441A1 (en) Systems and methods for attaching electronic versions of paper documents to associated patient records in electronic health records

Legal Events

Date Code Title Description
MM4K Annulment or lapse of a utility model due to non-payment of fees