JP6821885B1 - Artificial intelligence-based insurance claim detection device and method - Google Patents

Artificial intelligence-based insurance claim detection device and method Download PDF

Info

Publication number
JP6821885B1
JP6821885B1 JP2020526088A JP2020526088A JP6821885B1 JP 6821885 B1 JP6821885 B1 JP 6821885B1 JP 2020526088 A JP2020526088 A JP 2020526088A JP 2020526088 A JP2020526088 A JP 2020526088A JP 6821885 B1 JP6821885 B1 JP 6821885B1
Authority
JP
Japan
Prior art keywords
pattern
unfair
new
insurance
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020526088A
Other languages
Japanese (ja)
Other versions
JP2021504782A (en
Inventor
ヒョク キム、ジ
ヒョク キム、ジ
ヒョン リー、ジ
ヒョン リー、ジ
Original Assignee
ワイセイテック カンパニー リミテッド
ワイセイテック カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ワイセイテック カンパニー リミテッド, ワイセイテック カンパニー リミテッド filed Critical ワイセイテック カンパニー リミテッド
Application granted granted Critical
Publication of JP6821885B1 publication Critical patent/JP6821885B1/en
Publication of JP2021504782A publication Critical patent/JP2021504782A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Evolutionary Computation (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

保険金不当請求の探知装置及び方法が開示される。本願の一実施例による保険金不当請求の探知装置は、保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部とを含むことができる。The detection device and method for unfair insurance claims will be disclosed. The insurance claim unfair claim detection device according to the embodiment of the present application is an unfair instruction / learning platform that inputs the characteristic variable and the normal claim data, and the data preprocessing unit that standardizes the insurance claim breakdown data and derives the characteristic variable. It can include an unfair claim detection unit that constructs a claim detection model and an unfair claim determination unit that determines whether or not the breakdown of new insurance claims is unreasonable based on the unfair claim detection model.

Description

本願は、人工知能基盤の保険金不当請求の探知装置及び方法に関する。 The present application relates to an artificial intelligence-based insurance claim detection device and method.

既存の保険詐欺防止システムは、ビジネスルールを基盤として請求された保険事件に対して、審査者の経験と知識を土台としてルールを導出する方法で、調査対象ルールと調査対象除外ルールとに区分して算出している。しかし、保険詐欺は益々知能化及び高度化されるにつれて新しい不当請求パターンまたは詐欺パターンに対する持続的な更新が必要である。 The existing insurance fraud prevention system is a method of deriving rules based on the experience and knowledge of the examiner for insurance cases claimed based on business rules, and divides them into investigation target rules and investigation target exclusion rules. Is calculated. However, as insurance fraud becomes more intelligent and sophisticated, it requires continuous updates to new fraudulent claims patterns or fraud patterns.

また、保険会社は、保険詐欺に対して何らの措置も取らないまま保険金詐取を放置することもできず、保険詐欺を完全に明かすという目的の下で無限大の調査費用を出費することもできない。そこで、保険会社は、保険詐欺により詐取される保険金を減らす一方、過度に多い調査費用を出費しない適正な程度で調査努力の水準を決める必要がある。 Insurers also cannot neglect insurance fraud without taking any action against it, and can spend an infinite amount of investigative costs with the goal of completely revealing insurance fraud. Can not. Therefore, insurance companies need to reduce the amount of insurance money stolen by insurance fraud, while determining the level of research efforts to an appropriate level without spending excessive research costs.

本願の背景となる技術は、特許文献1に開示されている。 The technique behind the present application is disclosed in Patent Document 1.

韓国登録特許公報第10−0862181号Korean Registered Patent Gazette No. 10-0862181

本願は、前述した従来技術の問題点を解決するためのもので、保険金請求の不当請求を判別することができる探知模型を提供する人工知能基盤の保険金不当請求の探知装置及び方法を提供することを目的とする。 The present application is for solving the above-mentioned problems of the prior art, and provides an artificial intelligence-based insurance claim unfair claim detection device and method that provides a detection model capable of determining an unfair claim claim. The purpose is to do.

本願は、前述した従来技術の問題点を解決するためのもので、保険金請求関連データを学習して新規の請求件に対する不当を判別する人工知能基盤の保険金不当請求の探知装置及び方法を提供することを目的とする。 The present application is for solving the above-mentioned problems of the prior art, and provides an artificial intelligence-based insurance claim unfair claim detection device and method for learning insurance claim-related data and determining improperness for a new claim. The purpose is to provide.

但し、本願の実施例が達成しようとする技術的課題は、上記のような技術的課題に限定されず、また他の技術的課題が存在し得る。 However, the technical problem to be achieved by the embodiment of the present application is not limited to the above-mentioned technical problem, and other technical problems may exist.

但し、本願の実施例が達成しようとする技術的課題は、上記のような技術的課題に限定されず、さらに他の技術的課題が存在し得る。 However, the technical problem to be achieved by the embodiment of the present application is not limited to the above-mentioned technical problem, and other technical problems may exist.

上記の技術的課題を達成するための技術的手段として、本願の一実施例による保険金不当請求の探知装置は、保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部とを含むことができる。 As a technical means for achieving the above technical problems, the insurance claim unfair claim detection device according to the embodiment of the present application includes a data preprocessing unit for stylizing insurance claim breakdown data and deriving characteristic variables, and the above. An unfair claim detection unit that builds an unfair claim detection model based on teaching and learning that inputs characteristic variables and normal claim data, and an unfair judgment of whether or not the new insurance claim breakdown is unreasonable based on the unfair claim detection model. It can include a billing determination unit.

本願の一実施例によると、前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録するデータベースをさらに含み、前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むことができる。 According to one embodiment of the present application, the insurance claim breakdown data further includes a database that records at least one of the insurance claim breakdown data, the characteristic variable, and the normal claim data, and the insurance claim breakdown data includes claim data, contract data, and payment. It can include at least one of data, insurance designer data, and customer data.

本願の一実施例によると、前記不当請求探知部は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。 According to one embodiment of the present application, the unreasonable claim detection unit can construct the unreasonable claim detection model based on the classification / prediction algorithm of the teaching learning platform.

本願の一実施例によると、新規パターン分析部をさらに含み、前記新規パターン分析部は、前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する不当請求パターン分類部と、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する判別模型構築部と、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する新規パターン判別部とを含むことができる。 According to one embodiment of the present application, the new pattern analysis unit further includes a new pattern analysis unit, which classifies new patterns of unfair claims based on a non-teaching learning-based crowd algorithm that inputs the characteristic variable. The pattern classification unit, the discrimination model construction unit that constructs a new pattern discrimination model based on the decision algorithm of the teaching and learning platform, and the new pattern discrimination unit that discriminates the pattern type of the new request based on the new pattern discrimination model. Can include.

本願の一実施例によると、前記不当請求パターン分類部は、前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、前記請求パターンの群集間分離度に基づいて前記新規パターンを検出することができる。 According to one embodiment of the present application, the unreasonable claim pattern classification unit crowds the characteristic variable into a plurality of billing patterns through the crowd algorithm based on the frequency of the characteristic variable, and determines the degree of separation between the communities of the claim pattern. Based on this, the new pattern can be detected.

本願の一実施例によると、前記不当請求パターン分類部は、前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。 According to one embodiment of the present application, the unreasonable claim pattern classification unit can classify the new pattern into a plurality of similar pattern groups based on the degree of similarity between the new patterns.

本願の一実施例によると、前記不当請求パターン分類部は、前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定することができる。 According to one embodiment of the present application, the unreasonable claim pattern classification unit is based on the number of characteristic variables having a threshold value or more set in advance for each of the characteristic variables among the characteristic variables linked with each of the new patterns. The risk level of the pattern group can be set.

本願の一実施例によると、前記判別模型構築部は、前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築することができる。 According to one embodiment of the present application, the discriminative model construction unit learns a new pattern discrimination rule based on a decision-making algorithm that inputs the new pattern included in the pattern group according to the risk level, and learns the new pattern discrimination rule. The new pattern discrimination model including the discrimination rule can be constructed.

本願の一実施例によると、前記新規パターン判別部は、前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。 According to one embodiment of the present application, the new pattern discriminating unit determines which of the normal billing pattern, the unreasonable billing pattern, and the new pattern the new billing is based on the new pattern discriminating rule. be able to.

本願の一実施例による保険金不当請求の探知方法は、保険請求内訳データを定型化して特質変数を導出する段階、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する段階及び前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する段階を含むことができる。 The method of detecting an unfair claim for insurance claims according to an embodiment of the present application is a stage of deriving a characteristic variable by stylizing the insurance claim breakdown data, and an unfair claim detection model of a teaching and learning platform that inputs the characteristic variable and normal claim data. It can include a stage of construction and a stage of determining whether or not the breakdown of new insurance claims is unreasonable based on the unfair claim detection model.

本願の一実施例によると、前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録する段階をさらに含み、前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むことができる。 According to one embodiment of the present application, the insurance claim breakdown data further includes a step of recording at least one of the insurance claim breakdown data, the characteristic variable, and the normal claim data, and the insurance claim breakdown data includes claim data, contract data, and payment. It can include at least one of data, insurance designer data, and customer data.

本願の一実施例によると、前記不当請求探知模型を構築する段階は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。 According to one embodiment of the present application, at the stage of constructing the unreasonable claim detection model, the unreasonable claim detection model can be constructed based on the classification / prediction algorithm of the teaching learning platform.

本願の一実施例によると、新規パターンを分析する段階をさらに含み、前記新規パターンを分析する段階は、前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する段階と、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する段階と、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する段階とを含むことができる。 According to one embodiment of the present application, the step of analyzing the new pattern further includes the step of analyzing the new pattern, and the step of analyzing the new pattern is based on the non-teaching learning-based crowd algorithm that inputs the characteristic variable. It can include a step of classifying, a step of constructing a new pattern discriminative model based on the decision-making algorithm of the teaching and learning platform, and a step of discriminating the pattern type of the new claim based on the new pattern discriminative model.

本願の一実施例によると、前記不当請求の新規パターンを分類する段階は、前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、前記請求パターンの群集間分離度に基づいて前記新規パターンを検出することができる。 According to one embodiment of the present application, the step of classifying the new pattern of unfair claim is to crowd the characteristic variable into a plurality of billing patterns through the crowd algorithm based on the frequency of the characteristic variable, and crowd the claim pattern. The new pattern can be detected based on the degree of separation.

本願の一実施例によると、前記不当請求の新規パターンを分類する段階は、前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。 According to one embodiment of the present application, the step of classifying the new pattern of the unfair claim can classify the new pattern into a plurality of similar pattern groups based on the similarity between the new patterns.

本願の一実施例によると、前記不当請求の新規パターンを分類する段階は、前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定することができる。 According to one embodiment of the present application, the step of classifying the new pattern of the unfair claim is a characteristic variable having a threshold value or more set in advance for each of the characteristic variables among the characteristic variables linked with each of the new patterns. The risk level of the pattern group can be set based on the number.

本願の一実施例によると、前記新規パターン判別模型を構築する段階は、前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築することができる。 According to one embodiment of the present application, at the stage of constructing the new pattern discrimination model, a new pattern discrimination rule is learned based on a decision-making algorithm that inputs the new pattern included in the pattern group according to the risk level. , The new pattern discrimination model including the new pattern discrimination rule can be constructed.

本願の一実施例によると、前記パターン類型を判別する段階は、前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。 According to one embodiment of the present application, the step of discriminating the pattern type is to determine which of the normal billing pattern, the unreasonable billing pattern, and the new pattern the new billing is based on the new pattern discriminating rule. It can be determined.

上述した課題解決手段は、単に例示的なもので、本願を制限しようとする意図で解釈されてはならない。上述した例示的な実施例の他にも、図面及び発明の詳細な説明に追加の実施例が存在し得る。 The above-mentioned problem-solving means are merely exemplary and should not be construed with the intent of limiting the present application. In addition to the exemplary examples described above, there may be additional examples in the drawings and detailed description of the invention.

前述した本願の課題解決手段によると、保険金請求の不当請求を判別することができる探知模型を提供する人工知能基盤の保険金不当請求の探知装置及び方法を提供することができる。 According to the above-mentioned problem-solving means of the present application, it is possible to provide an artificial intelligence-based detection device and method for unfair insurance claims, which provides a detection model capable of determining unfair claims for insurance claims.

本願は、前述した従来技術の問題点を解決するためのもので、保険金請求関連データを学習して新規請求件に対する不当を判別する人工知能基盤の保険金不当請求の探知装置及び方法を提供することができる。 The present application is for solving the above-mentioned problems of the prior art, and provides an artificial intelligence-based insurance claim unfair claim detection device and method for learning insurance claim-related data and determining improperness for a new claim. can do.

本願の一実施例による保険金不当請求の探知装置の構成を図示した図面である。It is a drawing which illustrated the structure of the detection device of the insurance claim unfair claim by one Example of this application. 本願の一実施例による保険金不当請求の探知装置の新規パターン分析部の構成を図示した図面である。It is a drawing which illustrated the structure of the new pattern analysis part of the detection device of the insurance claim unfair claim according to one Example of this application. 本願の一実施例による保険金不当請求の探知装置の新規パターン検出の例を図示した図面である。It is a drawing which illustrated the example of the new pattern detection of the detection device of the insurance claim unfair claim by one Example of this application. 本願の一実施例による保険金不当請求の探知装置の類似パターングループ分類の例を図示した図面である。It is a drawing which illustrated the example of the similar pattern group classification of the detection device of the insurance claim unfair claim by one Example of this application. 本願の一実施例による保険金不当請求の探知装置の不当請求探知模型の評価指標を図示した図面である。It is a drawing which illustrated the evaluation index of the unfair claim detection model of the unfair claim detection device of the insurance claim unfair claim according to one Example of this application. 本願の一実施例による保険金不当請求の探知装置のアルゴリズム間性能比較を図示した図面である。It is a drawing which illustrated the performance comparison between algorithms of the detection device of an insurance claim unfair claim according to one Example of this application. 本願の一実施例による保険金不当請求の探知装置のアルゴリズム間安定性及び柔軟性を比較した図面である。It is a drawing which compared the stability and flexibility between algorithms of the detection device of unfair insurance claim according to one Example of this application. 本願の一実施例による保険金不当請求の探知装置のDeep Learningアルゴリズムで構築された不当請求探知模型を図示した図面である。It is a drawing which illustrated the unfair claim detection model constructed by the Deep Learning algorithm of the insurance claim unfair claim detection device by one Example of this application. 本願の一実施例による保険金不当請求の探知方法の流れを図示した図面である。It is a drawing which illustrated the flow of the detection method of the insurance claim unfair claim by one Example of this application. 本願の一実施例による保険金不当請求の探知方法の新規不当請求パターン分析の流れを図示した図面である。It is a drawing which illustrated the flow of the new unfair claim pattern analysis of the method of detecting an unfair claim of insurance claim by one Example of this application.

以下では、添付の図面を参照して本願が属する技術分野で通常の知識を有する者が容易に実施することができるように、本願の実施例を詳しく説明する。しかし、本願は、様々な異なる形態で具現されることができ、ここで説明する実施例に限定されない。そして、図面で本願を明確に説明するために、説明と関係ない部分は省略し、明細書全体を通じて類似した部分については類似した図面符号をつけた。 In the following, examples of the present application will be described in detail so that a person having ordinary knowledge in the technical field to which the present application belongs can be easily carried out with reference to the attached drawings. However, the present application can be embodied in a variety of different forms and is not limited to the examples described herein. Then, in order to clearly explain the present application in the drawings, parts unrelated to the description are omitted, and similar parts are given similar drawing reference numerals throughout the specification.

本願明細書全体において、ある部分が他の部分と「連結」されているとすると、これは「直接的に連結」されている場合だけでなく、その中間に他の素子を挟んで「電気的に連結」されている場合も含む。 In the entire specification of the present application, if one part is "connected" to another part, this is not only when it is "directly connected", but also "electrically" with another element in between. Including the case where it is "connected to".

本願明細書全体において、ある部材が他の部材「上に」、「上部に」、「上端に」、「下に」、「下部に」、「下端に」位置しているとすると、これは、ある部材が他の部材に接している場合だけでなく、二つの部材間にまた他の部材が存在する場合も含む。 Assuming that, in the entire specification of the present application, one member is located "above", "upper", "upper", "lower", "lower", "lower", this is This includes not only the case where one member is in contact with another member but also the case where another member exists between the two members.

本願明細書全体において、ある部分がある構成要素を「含む」とすると、これは、特に反対の記載がない限り、他の構成要素を除外するのではなく、他の構成要素をさらに含むことができることを意味する。 In the entire specification of the present application, when a component is "included" in a certain part, it may include other components, rather than excluding other components, unless otherwise specified. It means that you can do it.

図1は、本願の一実施例による保険金不当請求の探知装置の構成を図示した図面である。 FIG. 1 is a drawing illustrating the configuration of an insurance claim unfair claim detection device according to an embodiment of the present application.

図1を参照すると、保険金不当請求の探知装置100は、データ前処理部110、不当請求探知部120、不当請求判断部130、新規パターン分析部140及びデータベース150を含むことができる。データ前処理部110は、保険請求内訳データを定型化して特質変数を導出することができる。 Referring to FIG. 1, the insurance claim unfair claim detection device 100 can include a data preprocessing unit 110, an unfair claim detection unit 120, an unfair claim determination unit 130, a new pattern analysis unit 140, and a database 150. The data preprocessing unit 110 can standardize the insurance claim breakdown data and derive characteristic variables.

後述する説明は、保険金の不当請求だけでなく、補助金、支援金、保証金などの不当請求を含むことは自明であるが、説明の便宜のために、保険金不当請求を中心として説明する。前記保険請求内訳データは、例示として、保険金を請求した請求データ、保険または補助金関連の契約データ、保険金の支給データ、保険設計士データ、顧客データ及び保険詐欺摘発結果データの少なくともいずれか一つを含むことができる。データ前処理部110は、前記保険請求内訳データを定型化して特質変数を導出することができる。保険請求内訳データの定型化は例えば、顧客データの場合、顧客の所得水準、顧客が訪問した病院の数、顧客が申請した疾病事由の個数などを数値化することを意味する。また、データ前処理部110によって導出される特質変数は、保険金請求と関連して数値化された値を有することができる変数であり、例えば、顧客ID番号、保険詐欺者であるか否か、同一病名で重複申請した個数、契約締結年月個数、一日最大契約個数、支払い承認された証券個数、支払い申請した証券個数、顧客が締結した証券個数、保障性保険の請求回数、信用等級の変化量、加入した契約の種類、類義病院訪問の総回数、顧客が申請した疾病事由の個数、顧客が会った医者の人数、顧客が訪問した病院の個数、有効入/通院の総日数、診療科目個数、顧客所得水準、FP(Financial Planner)の変更回数、実損処理個数、詐欺FP契約個数の少なくともいずれか一つを含むことができる。データベース150は、保険請求内訳データ、前記特質変数及び正常請求データの少なくともいずれか一つを記録することができる。 It is obvious that the explanations described below include not only unfair claims for insurance claims but also unfair claims for subsidies, subsidies, security deposits, etc., but for convenience of explanation, the explanation will focus on unfair claims for insurance claims. .. The insurance claim breakdown data is, for example, at least one of insurance claim data, insurance or subsidy-related contract data, insurance payment data, insurance designer data, customer data, and insurance fraud detection result data. Can include one. The data pre-processing unit 110 can standardize the insurance claim breakdown data and derive characteristic variables. For example, in the case of customer data, stylizing insurance claim breakdown data means quantifying the income level of the customer, the number of hospitals visited by the customer, the number of reasons for illness applied by the customer, and the like. Further, the characteristic variable derived by the data preprocessing unit 110 is a variable that can have a quantified value in relation to the insurance claim, for example, a customer ID number and whether or not the insurance fraudster. , Number of duplicate applications with the same disease name, Number of contracts concluded, Maximum number of contracts per day, Number of securities approved for payment, Number of securities applied for payment, Number of securities concluded by customers, Number of claims for security insurance, Credit grade Number of changes, types of contracts subscribed, total number of visits to similar hospitals, number of reasons for illness applied by the customer, number of doctors the customer met, number of hospitals visited by the customer, total number of valid admissions / visits , The number of medical treatment subjects, the customer income level, the number of changes in FP (Financial Planner), the number of actual loss processing, and the number of fraudulent FP contracts can be included at least one of them. The database 150 can record at least one of the insurance claim breakdown data, the characteristic variable, and the normal claim data.

不当請求探知部120は、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。前記不当請求探知部120は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。例示として、前記分類/予測アルゴリズムは、Random Forestアルゴリズム、SVM(support vector machine)アルゴリズム、Extra Treeアルゴリズム、XG Boostアルゴリズム、及びDeep Learningアルゴリズムの少なくともいずれか一つを含むことができる。Random Forestアルゴリズムは、数多くのDecision TreeがForestを構成してそれぞれの予測結果を一つの結果変数として平均化するアルゴリズムであり、SVMアルゴリズムは、データの分布空間で最も大幅の境界を区分してデータが属する分類を判断する非確率的アルゴリズムである。Extra Treeアルゴリズムは、Random forestと類似しているが、速度がRandom forestに比べて速いアルゴリズムであり、XGBoostアルゴリズムは、Random ForestのTreeは独立であることに対し、XGBoostのTreeの結果を次のツリーに適用するboost方式のアルゴリズムである。Deep Learningアルゴリズムは、多層構造のNeural Networkを基盤として変数のパターンが結果に及ぶ影響を加重値で調節しながら学習するアルゴリズムである。 The unjustified claim detection unit 120 can construct an unjustified claim detection model of a teaching and learning platform that inputs the characteristic variable and normal claim data. Teaching learning means learning a model by utilizing pre-constructed learning data (training data). The unjustified claim detection unit 120 can construct the unreasonable claim detection model based on the classification / prediction algorithm of the teaching learning platform. By way of example, the classification / prediction algorithm can include at least one of a Random Forest algorithm, a SVM (support vector machine) algorithm, an Extra Tree algorithm, an XG Boost algorithm, and a Deep Learning algorithm. The Random Forest algorithm is an algorithm in which a large number of Decision Trees compose a Forest and averages each prediction result as one result variable, and the SVM algorithm divides the data at the largest boundary in the data distribution space. It is a non-probabilistic algorithm that determines the classification to which. The Extra Tree algorithm is similar to the Random forest, but the speed is faster than the Random forest. This is a boost algorithm applied to the tree. The Deep Learning algorithm is an algorithm that learns while adjusting the influence of the variable pattern on the result with a weighted value based on the multi-layered Neural Network.

前記不当請求探知模型は、前記特質変数及び正常請求データを入力として不当請求探知結果を出力することができる。例示として、不当請求探知模型は、特質変数と正常請求データ間の類似度に基づいて不当請求探知結果を出力することができる。前記類似度が予め設定された閾値未満であれば、特質変数と連携された保険請求を正常として判断し、前記類似度が予め設定された閾値以上であれば、特質変数と連携された保険請求を不当請求として判断することができる。前記類似度は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムによって演算されることができる。K−meansクラスターリングアルゴリズムは、伝統的な分類技法として、対象集団を距離の平均値(類似度)を基準としてK個の群集に繰り返し細分化する技法であり、SOMアルゴリズムは、人工神経網を基盤として訓練集合の入力パターンを加重値で学習して群集化する技法である。また、EM&Canopyアルゴリズムは、与えられた初期値で可能性が最大のものから繰り返し過程を通じてパラメーター値を更新して群集化する技法を意味する。不当請求探知部120は、入力による出力の導出を繰り返して行うことで不当請求探知模型の正確度を向上させることができる。 The unjustified claim detection model can output the unjustified claim detection result by inputting the characteristic variable and the normal claim data. As an example, the unjustified claim detection model can output the unjustified claim detection result based on the similarity between the characteristic variable and the normal claim data. If the similarity is less than the preset threshold, the insurance claim linked with the characteristic variable is judged to be normal, and if the similarity is equal to or higher than the preset threshold, the insurance claim linked with the characteristic variable is judged to be normal. Can be judged as an unreasonable claim. The similarity can be calculated by at least one of a K-means clustering algorithm, a SOM (Self-Organizing-Maps) algorithm, and an EM & Canopy algorithm. The K-means clustering algorithm is a traditional classification technique in which a target population is repeatedly subdivided into K crowds based on the mean value (similarity) of distances, and the SOM algorithm is an artificial neural network. As a basis, it is a technique to learn the input pattern of the training set with a weighted value and crowd it. In addition, the EM & Canopy algorithm means a technique of updating and crowding parameter values through an iterative process from the one with the maximum possibility with a given initial value. The unjustified claim detection unit 120 can improve the accuracy of the unjustified claim detection model by repeatedly deriving the output by the input.

不当請求判断部130は、不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断することができる。不当請求探知部120によって構築された不当請求探知模型に新しい新規保険請求内訳が入力されれば、前述したように類似度に基づいて新規保険請求内訳が不当であるか否かが判断されることができる。 The unfair claim determination unit 130 can determine whether or not the new insurance claim breakdown is unreasonable based on the unfair claim detection model. If a new insurance claim breakdown is input to the unfair claim detection model constructed by the unfair claim detection unit 120, it is determined whether or not the new insurance claim breakdown is unreasonable based on the similarity as described above. Can be done.

図2は、本願の一実施例による保険金不当請求の探知装置の新規パターン分析部の構成を図示した図面である。 FIG. 2 is a drawing illustrating the configuration of a new pattern analysis unit of the insurance claim unfair claim detection device according to the embodiment of the present application.

本願の一実施例による保険金不当請求の探知装置は、不当請求の新しいパターン、即ち、新規パターンを分析して新しい保険請求(新規請求)のパターン類型を決定することができる。図2を参照すると、新規パターン分析部140は、不当請求パターン分類部141、判別模型構築部142及び新規パターン判別部143を含むことができる。不当請求パターン分類部141は、特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類することができる。非指導学習とは、学習用データを構築するものではなく、データ自体を分析するか群集しながら学習するアルゴリズムを意味する。これは公知された事項であるため、具体的な説明は省略する。不当請求パターン分類部141は、保険請求内訳データの頻度に基づいて特質変数を複数個の請求パターンに群集することができる。例示として、不当請求パターン分類部141は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムに基づいて不当請求の新規パターンを分類することができる。 The insurance claim unfair claim detection device according to one embodiment of the present application can analyze a new pattern of unfair claims, that is, a new pattern, and determine a pattern type of a new insurance claim (new claim). With reference to FIG. 2, the new pattern analysis unit 140 can include an unreasonable claim pattern classification unit 141, a discrimination model construction unit 142, and a new pattern discrimination unit 143. The unfair claim pattern classification unit 141 can classify a new pattern of unfair claim based on a non-teaching learning-based crowd algorithm that inputs a characteristic variable. Non-teaching learning does not construct learning data, but means an algorithm that learns while analyzing or crowding the data itself. Since this is a known matter, a specific description thereof will be omitted. The unfair claim pattern classification unit 141 can crowd the characteristic variables into a plurality of claim patterns based on the frequency of the insurance claim breakdown data. As an example, the unfair billing pattern classification unit 141 may classify a new pattern of unfair billing based on at least one of a K-means clustering algorithm, a SOM (Self-Organizing-Maps) algorithm, and an EM & Coopy algorithm. it can.

図3は、本願の一実施例による保険金不当請求の探知装置の新規パターン検出の例を図示した図面である。 FIG. 3 is a drawing illustrating an example of detecting a new pattern of an insurance claim unfair claim detection device according to an embodiment of the present application.

図3は、特質変数の頻度によって群集された請求パターンを示し、互いに異なる請求パターンに属した特質変数の頻度が類似した場合、図3に示すように、同一または類似した色(青色)で区分されることができる。即ち、請求パターン相互間の色が同一または類似した場合、群集間の分離度が低いと言える。また、特質変数間で類似した頻度で群集された請求パターンは、正常な保険請求により発生する特質変数の頻度に基づいて群集された請求パターン、即ち、不当請求ではなく正常な請求パターンであると判断することができる。 FIG. 3 shows billing patterns crowded according to the frequency of characteristic variables, and when the frequencies of characteristic variables belonging to different billing patterns are similar, they are classified by the same or similar color (blue) as shown in FIG. Can be done. That is, when the colors of the billing patterns are the same or similar, it can be said that the degree of separation between the communities is low. In addition, a claim pattern crowded with similar frequencies among characteristic variables is a claim pattern crowded based on the frequency of characteristic variables generated by a normal insurance claim, that is, a normal claim pattern rather than an unreasonable claim. You can judge.

一方、類似した頻度を有する特質変数と異なる頻度を有する特質変数で群集された請求パターンの場合、図3に示すように、前述した請求パターンとは異なる色(赤色)で区分されることができる。このような請求パターンは、正常な請求パターンの特質変数の頻度とは異なるため(例えば、FP変更回数が正常な請求パターンの特質変数に比べて相対的に多い場合)、不当請求の新規パターンであることができ、不当請求パターン分類部141によって検出されることができる。 On the other hand, in the case of a billing pattern crowded with a characteristic variable having a similar frequency and a characteristic variable having a different frequency, as shown in FIG. 3, it can be classified by a color (red) different from the above-mentioned billing pattern. .. Since such a billing pattern is different from the frequency of the characteristic variable of the normal billing pattern (for example, when the number of FP changes is relatively large compared to the characteristic variable of the normal billing pattern), the new pattern of unfair billing It can be and can be detected by the unjustified claim pattern classification unit 141.

図4は、本願の一実施例による保険金不当請求の探知装置の類似パターングループ分類の例を図示した図面である。 FIG. 4 is a drawing illustrating an example of similar pattern group classification of the insurance claim unfair claim detection device according to one embodiment of the present application.

不当請求パターン分類部141は、新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。新規パターン相互間の類似度は、前述した群集アルゴリズムに基づいて演算されることができるため、重複する説明は省略する。図4は、新規パターン相互間の類似度に基づいて7個の類似パターングループに分類された例を図示する。前記類似パターングループの数は、新規パターン相互間の類似度によって変化することができることは自明である。また、不当請求パターン分類部141は、前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定することができる。例示として、前記危険水準は、図4に示すように、注意群、低危険群、中危険群及び高危険群に区分されることができるが、これに限定されるものではない。即ち、高危険群として分類されたパターングループの場合、閾値以上の特質変数が多い新規パターンを含むパターングループである可能性が高いと言える。 The unjustified claim pattern classification unit 141 can classify the new pattern into a plurality of similar pattern groups based on the degree of similarity between the new patterns. Since the similarity between new patterns can be calculated based on the crowd algorithm described above, duplicate description will be omitted. FIG. 4 illustrates an example of classification into seven similar pattern groups based on the degree of similarity between new patterns. It is self-evident that the number of similar pattern groups can vary depending on the degree of similarity between new patterns. In addition, the unfair claim pattern classification unit 141 determines the risk level of the pattern group based on the number of characteristic variables linked to each of the new patterns and which is equal to or higher than the threshold value set in advance for each of the characteristic variables. Can be set. As an example, as shown in FIG. 4, the risk level can be classified into a caution group, a low risk group, a medium risk group, and a high risk group, but the risk level is not limited thereto. That is, in the case of a pattern group classified as a high-risk group, it can be said that there is a high possibility that the pattern group includes a new pattern having many characteristic variables above the threshold value.

判別模型構築部142は、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。また、意思決定アルゴリズムとは、例えば、Decision Treeアルゴリズムであることができるが、これに限定されるものではない。 The discriminative model construction unit 142 can construct a new pattern discriminative model based on the decision-making algorithm of the teaching and learning platform. Teaching learning means learning a model by utilizing pre-constructed learning data (training data). Further, the decision-making algorithm can be, for example, a Decision Tree algorithm, but is not limited thereto.

判別模型構築部142は、危険水準が設定されたパターングループに分類された前記請求パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習することができる。また、判別模型構築部130は、新規パターン判別規則を含む新規不当請求パターン判別模型を構築することができる。前述した非指導学習基盤の新規パターン分類は、単純に頻度に基づいて新規パターンを分類することはできるが、いずれの変数によって分類されたかは分からない。従って、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別規則を学習することができる。 The discriminative model construction unit 142 can learn a new pattern discriminative rule based on a decision-making algorithm that inputs the billing pattern classified into a pattern group in which a risk level is set. In addition, the discriminative model building unit 130 can build a new unjustified claim pattern discriminative model including a new pattern discriminative rule. In the above-mentioned new pattern classification based on non-teaching learning, new patterns can be classified simply based on frequency, but it is unknown which variable was used for classification. Therefore, a new pattern discrimination rule can be learned based on the decision-making algorithm of the teaching learning platform.

前記新規パターン判別規則とは、閾値以上の特質変数に基づいて請求パターンを新規パターンとして判別することができる規則を意味する。また、このような新規パターン判別規則を総合して判別模型構築部142によって新規パターン判別模型として構築されることができる。前記高危険群として設定されたパターングループの新規パターンは、予め設定された閾値以上の特質変数を有する確率が他の危険群に比べて相対的に高いことは自明である。しかし、低危険群のパターングループであるとしても、不当請求の余地がある特質変数(即ち、予め設定された閾値以上の特質変数)を有する確率がなくはないため、全ての危険水準別のパターングループに含まれた新規パターンを入力として新規パターン判別規則が学習されることができる。また、新規パターン判別規則の学習は、特質変数の重要度が考慮されることができる。すなわち、多様な特質変数の中でも不当請求の危険性が高い特質変数の場合、相対的に高い重要度を有することができ、新規パターン判別規則の学習時にこのような特質変数の重要度が考慮されることができる。例えば、特質変数の中で類義病院訪問の総回数は、顧客が会った医者の人数より高い重要度が付与されることができる。判別模型構築部142は、特質変数の重要度を考慮することで、より正確な新規パターン判別模型を構築することができる。 The new pattern discrimination rule means a rule that can discriminate a billing pattern as a new pattern based on a characteristic variable equal to or higher than a threshold value. Further, such a new pattern discrimination rule can be integrated and constructed as a new pattern discrimination model by the discrimination model construction unit 142. It is self-evident that the new pattern of the pattern group set as the high-risk group has a relatively high probability of having a characteristic variable equal to or higher than a preset threshold value as compared with other risk groups. However, even if it is a pattern group of a low-risk group, there is a possibility that it has a characteristic variable that can be unfairly claimed (that is, a characteristic variable that is equal to or higher than a preset threshold value). A new pattern discrimination rule can be learned by inputting a new pattern included in a group. In addition, the importance of characteristic variables can be taken into consideration when learning new pattern discrimination rules. That is, among various characteristic variables, characteristic variables with a high risk of unfair claim can have a relatively high importance, and the importance of such characteristic variables is taken into consideration when learning a new pattern discrimination rule. Can be done. For example, among the characteristic variables, the total number of visits to a similar hospital can be given a higher importance than the number of doctors the customer has met. The discriminative model construction unit 142 can construct a more accurate new pattern discriminative model by considering the importance of the characteristic variable.

新規パターン判別部143は、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別することができる。新規パターン判別部143は、新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。換言すると、構築された新規パターン判別模型に新規請求の特質変数を入力して、正常で判断された請求パターンであるか、不当請求で判断されたパターンであるか、新しい不当請求の新規パターンであるか、パターンの類型を判別することができる。また、前記新規請求が不当請求として判断されたパターン及び不当請求の新規パターンとして判断された場合、不当請求判断の要因(すなわち、特質変数)として作用した特質変数を検出することができる。例示として、新規請求の中で健康保険の分布が多数であり、受診者の年齢が20代中盤であり、女性が多数という特質変数である時に、初診診察及び再診診察が高い分布を示す場合、留意すべき不当請求のパターンとして判断されることができる。また、初診に比べて再診の割合が相対的に高い場合、治療、施術、手術前の不当請求のパターンとして判断することができる。 The new pattern discrimination unit 143 can discriminate the pattern type of the new request based on the new pattern discriminative model. The new pattern discriminating unit 143 can discriminate which of the normal billing pattern, the unreasonable billing pattern, and the new pattern the new billing is based on the new pattern discriminating rule. In other words, by inputting the characteristic variable of the new billing into the constructed new pattern discriminative model, the billing pattern is judged to be normal, the pattern is judged by the unfair billing, or the new pattern of the new unfair billing is used. It is possible to determine the type of pattern. In addition, when the new claim is determined as a pattern determined as an unreasonable claim and a new pattern of an unreasonable claim, a characteristic variable acting as a factor (that is, a characteristic variable) for determining an unreasonable claim can be detected. As an example, when the distribution of health insurance is large in new claims, the age of the examinee is in the mid-20s, and the characteristic variable is that there are many women, the initial examination and the re-examination show a high distribution. , Can be judged as a pattern of unfair claims to be noted. In addition, when the rate of return visits is relatively higher than that of the first visit, it can be judged as a pattern of unreasonable claims before treatment, treatment, and surgery.

図5は、本願の一実施例による保険金不当請求の探知装置の不当請求探知模型の評価指標を図示した図面である。 FIG. 5 is a drawing illustrating an evaluation index of an unfair claim detection model of an insurance claim unfair claim detection device according to an embodiment of the present application.

不当請求探知模型は、模型構築に基盤となる分類/予測アルゴリズムによってその性能が左右される。図5を参照すると、不当請求探知模型の評価指標は、Accuracy(正確度)、Precison(精密度)、Recall(再現率)を使用するが、実際の不当請求探知ではY Recallの向上に重点を置く。Accuracy(正確度)は、不当請求探知模型が探知した結果と実際の結果が一致する正探知の割合で(TP(True Positive)+TN(True Negative))/Totalで表すことができ、100に近いほど良い指標であると解釈されることができる。Precison(精密度)は、不当請求探知模型が不当であると探知した結果の中で、実際の結果も不当である正探割合で(TP)/(TP+FP(False Positive))で表すことができ、1−Precisonで誤探率を表すことができる。 The performance of the unjustified claim detection model depends on the classification / prediction algorithm that is the basis for model construction. With reference to FIG. 5, the evaluation index of the unjustified claim detection model uses Accuracy (accuracy), Precison (precision), and Recall (recall rate), but in the actual unjustified claim detection, the emphasis is on improving Y Recall. Put. Accuracy (accuracy) can be expressed as (TP (True Positive) + TN (True Negative)) / Total, which is the ratio of positive detection in which the result detected by the unjustified claim detection model matches the actual result, and is close to 100. It can be interpreted as a good indicator. Precision (precision) can be expressed as (TP) / (TP + FP (False Positive)) in the correct detection ratio, which is also an unreasonable actual result among the results of detecting that the unjustified claim detection model is unreasonable. , 1-Precison can represent the false positive rate.

Recall(再現率)は、全体の不当請求の中で不当請求探知模型が不当請求であると正確に探知した正探割合で(TP)/(TP+FN(False Negative))で表すことができ、1−Recallで未探率を表すことができる。 The Recall can be expressed as (TP) / (TP + FN (False Negative)) by the correct detection ratio that accurately detects that the unreasonable claim detection model is unjustified in the total unjustified claim. -Recall can represent the unexplored rate.

図6は、本願の一実施例による保険金不当請求の探知装置のアルゴリズム間性能比較を図示した図面である。 FIG. 6 is a drawing illustrating a performance comparison between algorithms of an insurance claim unfair claim detection device according to an embodiment of the present application.

図6は、Random Forestアルゴリズム、SVMアルゴリズム、Extra Treeアルゴリズム及びXFBoostアルゴリズムでそれぞれ構築された不当請求探知模型に高危険群のパターングループと連携された特質変数を入力として出力される結果を比較した図面である。各アルゴリズムで構築された不当請求探知模型の高い正確度も重要であるが、実際の不当請求を探知することができるY Recallをより重要に考慮すれば、Random Forestアルゴリズム及びExtra Treeアルゴリズムで構築された不当請求探知模型が他のアルゴリズムに比べて相対的に優れた性能を表すことを確認することができる。 FIG. 6 is a drawing comparing the results output by inputting characteristic variables linked with the pattern group of the high-risk group into the unfair billing detection model constructed by the Random Forest algorithm, the SVM algorithm, the Extra Tree algorithm, and the XFBest algorithm, respectively. Is. The high accuracy of the fraudulent billing detection model constructed by each algorithm is also important, but if Y Recall, which can detect the actual fraudulent billing, is considered more importantly, it is constructed by the Random Forest algorithm and the Extra Tree algorithm. It can be confirmed that the unjustified claim detection model exhibits relatively superior performance compared to other algorithms.

図7は、本願の一実施例による保険金不当請求の探知装置のアルゴリズム間安定性及び柔軟性を比べた図面である。 FIG. 7 is a drawing comparing the inter-algorithm stability and flexibility of the insurance claim unfair claim detection device according to the embodiment of the present application.

図7のaは、Random Forestアルゴリズムで構築された不当請求探知模型を図式化した図面であり、図7のbは、Deep Learningアルゴリズムで構築された不当請求探知模型を図式化した図面である。Random Forestアルゴリズムで構築された不当請求探知模型は、条件を基準として分類する方式、例えば、「a*請求金額+b*医者数+c*受診数」を基準として判定するか、請求金額>a、医者数>b、受診数>cであれば「異常」(すなわち、不当請求)と分類する方式である。Deep Learningアルゴリズムで構築された不当請求探知模型は、異常(不当請求)状態に該当する(請求金額、医者数、受診数)の組み合わせを探し出す方式であり、Deep LearningアルゴリズムのConvolutional Neural Network(CNN)はイメージ処理に適合し、Recurrent Neural Network(RNN)は時系列処理に適合した特性がある。Random Forestアルゴリズムで構築された不当請求探知模型は、線形関係を有する変数を知られた規則に適用するのに適合するが、連関変数が多くなればむしろ正確性が落ちるという短所がある一方、Deep Learningアルゴリズムで構築された不当請求探知模型は、変数の組み合わせをパターンとして学習して新しいパターンを自ら発見し、如何なるパターンに対しても異常可能性を算出可能であり、多くの変数を対象として正確度の高い予測を行うことができるという特徴がある。従って、Deep Learningアルゴリズムで構築された不当請求探知模型がRandom Forestアルゴリズムで構築された不当請求探知模型より安定性と柔軟性が高いと言える。 FIG. 7a is a diagram diagram of the unreasonable claim detection model constructed by the Random Forest algorithm, and FIG. 7b is a diagram diagram of the unjustified claim detection model constructed by the Deep Learning algorithm. The unfair billing detection model constructed by the Random Forest algorithm is classified based on the conditions, for example, "a * billing amount + b * number of doctors + c * number of consultations", or billing amount> a, doctor. If the number> b and the number of consultations> c, it is classified as "abnormal" (that is, unreasonable claim). The unfair billing detection model constructed by the Deep Learning algorithm is a method of finding a combination of (billing amount, number of doctors, number of consultations) corresponding to an abnormal (unfair billing) state, and is a Convolutional Neural Network (CNN) of the Deep Learning algorithm. Is suitable for image processing, and Recurrent Neural Network (RNN) has characteristics suitable for time series processing. The unfair claim detection model built with the Random Forest algorithm is suitable for applying variables with linear relationships to known rules, but has the disadvantage of being less accurate with more related variables, while Deep. The unfair claim detection model constructed by the learning algorithm can learn the combination of variables as a pattern, discover a new pattern by itself, calculate the possibility of anomaly for any pattern, and is accurate for many variables. It is characterized by being able to make high-level predictions. Therefore, it can be said that the unreasonable claim detection model constructed by the Deep Learning algorithm is more stable and flexible than the unjustified claim detection model constructed by the Random Forest algorithm.

一方、Deep Learningアルゴリズムは、学習の個数、即ち、入力によって出力を算出する繰り返しの数が少ない場合、その性能が低下し得る。例示として、高危険群のパターングループと連携された特質変数の数は、他の危険群のパターングループと連携された特質変数の数より相対的に少ないことがある。このような場合、Deep Learningアルゴリズムで構築された不当請求探知模型は不当を判別する性能が低下し得る。従って、不当請求探知部120は、特質変数の数が予め設定された数未満の場合、Under Samplingを通じて不当の割合を高めることで、Deep Learningアルゴリズムで構築された不当請求探知模型のY Recallを向上させることができる。 On the other hand, the performance of the Deep Learning algorithm may deteriorate when the number of learnings, that is, the number of iterations for calculating the output by the input is small. As an example, the number of characteristic variables associated with high-risk group pattern groups may be relatively smaller than the number of characteristic variables associated with other risk group pattern groups. In such a case, the unjustified claim detection model constructed by the Deep Learning algorithm may have a reduced ability to discriminate unreasonableness. Therefore, when the number of characteristic variables is less than a preset number, the unreasonable claim detection unit 120 improves the Y Recall of the unjustified claim detection model constructed by the Deep Learning algorithm by increasing the unreasonable rate through Under Learning. Can be made to.

図8は、本願の一実施例による保険金不当請求の探知装置のDeep Learningアルゴリズムで構築された不当請求探知模型を図示した図面である。 FIG. 8 is a drawing illustrating an unfair claim detection model constructed by the Deep Learning algorithm of the insurance claim unfair claim detection device according to the embodiment of the present application.

図8を参照すると、Deep Learningアルゴリズムで構築された不当請求探知模型は、前述したように学習が十分に行われていない場合、その性能が明確に発揮されない一方、学習が繰り返されるほど性能が向上されるという特徴がある。また、Deep LearningアルゴリズムのHidden Layerの構造によって性能の差異が大きく変わるため、多様なLayer構造を有する不当請求探知模型を構築することで、Deep Learningアルゴリズムで構築された不当請求探知模型の性能を最適化することができる。 With reference to FIG. 8, the unreasonable claim detection model constructed by the Deep Learning algorithm does not clearly exhibit its performance when learning is not sufficiently performed as described above, but its performance improves as the learning is repeated. It has the characteristic of being done. In addition, since the difference in performance varies greatly depending on the structure of the Hidden Layer of the Deep Learning algorithm, the performance of the unfair billing detection model constructed by the Deep Learning algorithm is optimized by constructing an unfair claim detection model having various Layer structures. Can be transformed into.

図9は、本願の一実施例による保険金不当請求の探知方法の流れを図示した図面であり、図10は、本願の一実施例による保険金不当請求の探知方法の新規不当請求パターン分析の流れを図示した図面である。 FIG. 9 is a drawing illustrating the flow of a method for detecting an unfair insurance claim according to an embodiment of the present application, and FIG. 10 is a new unfair claim pattern analysis of a method for detecting an unfair insurance claim according to an embodiment of the present application. It is a drawing which illustrated the flow.

図9及び図10に示した新規不当請求パターン分析方法は、上述した図1〜図8を通じて説明された保険金不当請求の探知装置によって行われることができる。従って、以下で省略された内容であるとしても、図1〜図8を通じて保険金不当請求の探知装置について説明された内容は、図9及び図10にも同様に適用されることができる。 The new unfair claim pattern analysis method shown in FIGS. 9 and 10 can be performed by the insurance claim unfair claim detection device described with reference to FIGS. 1 to 8 described above. Therefore, even if the content is omitted below, the content described for the insurance claim unfair claim detection device through FIGS. 1 to 8 can be similarly applied to FIGS. 9 and 10.

図9を参照すると、段階S910においてデータ前処理部110は前記保険請求内訳データを定型化して特質変数を導出することができる。前記保険請求内訳データは、例示として、保険金を請求した請求データ、保険または補助金関連契約データ、保険金の支給データ、保険設計士データ、顧客データ及び保険詐欺摘発結果データの少なくともいずれか一つを含むことができる。保険請求内訳データの定型化は、例えば、顧客データの場合、顧客の所得水準、顧客が訪問した病院の数、顧客が申請した疾病事由の個数などを数値化することを意味する。データベース150は、保険請求内訳データ、前記特質変数及び正常請求データの少なくともいずれか一つを記録することができる。 Referring to FIG. 9, in step S910, the data preprocessing unit 110 can stylize the insurance claim breakdown data and derive characteristic variables. The insurance claim breakdown data is, for example, at least one of insurance claim data, insurance or subsidy-related contract data, insurance payment data, insurance designer data, customer data, and insurance fraud detection result data. Can include one. For example, in the case of customer data, stylizing insurance claim breakdown data means quantifying the income level of the customer, the number of hospitals visited by the customer, the number of reasons for illness applied by the customer, and the like. The database 150 can record at least one of the insurance claim breakdown data, the characteristic variable, and the normal claim data.

段階S920において、不当請求探知部120は、前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築することができる。前記不当請求探知部120は、前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築することができる。例示として、前記分類/予測アルゴリズムは、Random Forestアルゴリズム、SVM(support vector machine)アルゴリズム、Extra Treeアルゴリズム、XG Boostアルゴリズム及びDeep Learningアルゴリズムの少なくともいずれか一つを含むことができる。 In step S920, the unreasonable claim detection unit 120 can construct an unreasonable claim detection model of the teaching learning base that inputs the characteristic variable and the normal claim data. The unjustified claim detection unit 120 can construct the unreasonable claim detection model based on the classification / prediction algorithm of the teaching learning platform. By way of example, the classification / prediction algorithm can include at least one of a Random Forest algorithm, an SVM (support vector machine) algorithm, an Extra Tree algorithm, an XG Boost algorithm, and a Deep Learning algorithm.

前記不当請求探知模型は、前記特質変数及び正常請求データを入力として不当請求探知結果を出力することができる。例示として、不当請求探知模型は、特質変数と正常請求データ間の類似度に基づいて不当請求探知結果を出力することができる。前記類似度が予め設定された閾値未満であれば特質変数と連携された保険請求を正常として判断し、前記類似度が予め設定された閾値以上であれば特質変数と連携された保険請求を不当請求として判断することができる。前記類似度は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムによって演算されることができる。 The unjustified claim detection model can output the unjustified claim detection result by inputting the characteristic variable and the normal claim data. As an example, the unjustified claim detection model can output the unjustified claim detection result based on the similarity between the characteristic variable and the normal claim data. If the similarity is less than the preset threshold value, the insurance claim linked with the characteristic variable is judged to be normal, and if the similarity is equal to or higher than the preset threshold value, the insurance claim linked with the characteristic variable is unreasonable. It can be judged as a claim. The similarity can be calculated by at least one of a K-means clustering algorithm, a SOM (Self-Organizing-Maps) algorithm, and an EM & Canopy algorithm.

段階S930において、不当請求判断部130は、不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断することができる。不当請求探知部120によって構築された不当請求探知模型に新しい新規保険請求内訳が入力されれば、前述したように、類似度に基づいて新規保険請求内訳が不当であるか否かが判断されることができる。 In step S930, the unfair claim determination unit 130 can determine whether or not the new insurance claim breakdown is unreasonable based on the unfair claim detection model. If a new insurance claim breakdown is input to the unfair claim detection model constructed by the unfair claim detection unit 120, it is determined whether or not the new insurance claim breakdown is unreasonable based on the similarity as described above. be able to.

図10を参照して新規不当請求パターン分析の流れを説明すると、段階S1010において、データ前処理部110は、保険請求内訳データを定型化して特質変数を導出することができる。これは、前述した段階S910で説明したデータ前処理部110と同様に理解されることができるため、重複する説明は省略する。 Explaining the flow of the new unfair claim pattern analysis with reference to FIG. 10, in step S1010, the data preprocessing unit 110 can standardize the insurance claim breakdown data and derive characteristic variables. Since this can be understood in the same manner as the data preprocessing unit 110 described in step S910 described above, duplicate description will be omitted.

段階S1020において、不当請求パターン分類部141は、特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類することができる。不当請求パターン分類部141は、保険請求内訳データの頻度に基づいて特質変数を複数個の請求パターンに群集することができる。例示として、不当請求パターン分類部141は、K−meansクラスターリングアルゴリズム、SOM(Self−Organizing−Maps)アルゴリズム、EM&Canopyアルゴリズムの少なくともいずれか一つのアルゴリズムに基づいて不当請求の新規パターンを分類することができる。不当請求パターン分類部141は、前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集することができる。即ち、請求パターンは、同質性のある特質変数の群集であることができる。また、請求パターンの群集間の分離度、即ち、群集間距離に基づいて前記新規パターンを検出することができる。 In step S1020, the unjustified claim pattern classification unit 141 can classify a new unjustified claim pattern based on a non-teaching learning-based crowd algorithm that takes a characteristic variable as an input. The unfair claim pattern classification unit 141 can crowd the characteristic variables into a plurality of claim patterns based on the frequency of the insurance claim breakdown data. As an example, the unfair billing pattern classification unit 141 may classify a new pattern of unfair billing based on at least one of a K-means clustering algorithm, a SOM (Self-Organizing-Maps) algorithm, and an EM & Coopy algorithm. it can. The unjustified claim pattern classification unit 141 can crowd the characteristic variable into a plurality of billing patterns through the crowd algorithm based on the frequency of the characteristic variable. That is, the claim pattern can be a community of homogeneous characteristic variables. In addition, the new pattern can be detected based on the degree of separation between the crowds of the billing pattern, that is, the distance between the crowds.

また、不当請求パターン分類部141は、新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類することができる。新規パターン相互間の類似度は、前述した群集アルゴリズムに基づいて演算されることができるため、重複する説明は省略する。 Further, the unreasonable claim pattern classification unit 141 can classify the new pattern into a plurality of similar pattern groups based on the degree of similarity between the new patterns. Since the similarity between new patterns can be calculated based on the crowd algorithm described above, duplicate description will be omitted.

段階S1030において、判別模型構築部142は、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築することができる。指導学習とは、予め構築された学習用データ(training data)を活用してモデルを学習することを意味する。また、意思決定アルゴリズムとは、例えば、Decision Treeアルゴリズムであることができるが、これに限定されるものではない。判別模型構築部130は、危険水準が設定されたパターングループに分類された前記請求パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習することができる。また、判別模型構築部142は、新規パターン判別規則を含む新規不当請求パターン判別模型を構築することができる。新規パターン判別規則の学習は、特質変数の重要度が考慮されることができる。すなわち、多様な特質変数の中でも不当請求の危険性が高い特質変数の場合、相対的に高い重要度を有することができ、新規パターン判別規則の学習時にこのような特質変数の重要度が考慮されることができる。例えば、特質変数の中で類義病院訪問の総回数は顧客が会った医者の人数より高い重要度が付与されることができる。判別模型構築部142は、特質変数の重要度を考慮することで、より正確な新規パターン判別模型を構築することができる。 In step S1030, the discriminative model building unit 142 can build a new pattern discriminative model based on the decision-making algorithm of the teaching and learning platform. Teaching learning means learning a model by utilizing pre-constructed learning data (training data). Further, the decision-making algorithm can be, for example, a Decision Tree algorithm, but is not limited thereto. The discriminative model construction unit 130 can learn a new pattern discriminative rule based on a decision-making algorithm that inputs the billing pattern classified into a pattern group in which a risk level is set. Further, the discriminative model construction unit 142 can construct a new unjustified claim pattern discriminative model including a new pattern discriminative rule. The importance of characteristic variables can be taken into account when learning new pattern discrimination rules. That is, among various characteristic variables, characteristic variables with a high risk of unfair claim can have a relatively high importance, and the importance of such characteristic variables is taken into consideration when learning a new pattern discrimination rule. Can be done. For example, among the characteristic variables, the total number of visits to a similar hospital can be given a higher importance than the number of doctors the customer has met. The discriminative model construction unit 142 can construct a more accurate new pattern discriminative model by considering the importance of the characteristic variable.

段階S1040において、新規パターン判別部143は、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別することができる。新規パターン判別部143は、新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別することができる。換言すると、構築された新規パターン判別模型に新規請求の特質変数を入力して、正常として判断された請求パターンであるか、不当請求として判断されたパターンであるか、新しい不当請求の新規パターンであるか、パターンの類型を判別することができる。また、前記新規請求が不当請求として判断されたパターン及び不当請求の新規パターンとして判断された場合、不当請求判断の要因(すなわち、特質変数)として作用した特質変数を検出することができる。 In step S1040, the new pattern discrimination unit 143 can discriminate the pattern type of the new claim based on the new pattern discriminative model. The new pattern discriminating unit 143 can discriminate which of the normal billing pattern, the unreasonable billing pattern, and the new pattern the new billing is based on the new pattern discriminating rule. In other words, by inputting the characteristic variable of the new billing into the constructed new pattern discriminative model, the billing pattern is judged to be normal, the pattern is judged to be unreasonable billing, or the new pattern of new unjustified billing is used. It is possible to determine the type of pattern. In addition, when the new claim is determined as a pattern determined as an unreasonable claim and a new pattern of an unreasonable claim, a characteristic variable acting as a factor (that is, a characteristic variable) for determining an unreasonable claim can be detected.

本願の一実施例によると、保険金不当請求の探知方法は、多様なコンピュータ手段を通じて行われることができるプログラム命令形態で具現されて、コンピュータ読取可能な媒体に記録されることができる。前記コンピュータ読取可能媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。前記媒体に記録されるプログラム命令は、本発明のために特別に設計されて構成されたものであってもよく、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータ読取可能記録媒体の例としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フロプティカルディスク(floptical disk)のような磁気−光媒体(magneto−optical media)、及びロム(ROM)、ラム(RAM)、フラッシュメモリーなどのようなプログラム命令を格納し行うように特別に構成されたハードウェア装置が含まれる。プログラム命令の例としては、コンパイラによって作られるような機械語コードだけでなく、インタプリターなどを使用してコンピュータによって実行されることができる高級言語コードを含む。上記のハードウェア装置は、本発明の動作を行うために一つ以上のソフトウェアモジュールとして作動するように構成されることができ、その反対の場合も同様である。 According to one embodiment of the present application, the method of detecting an unfair insurance claim can be embodied in a program instruction form that can be performed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be those specially designed and configured for the present invention, or may be those known and usable by those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and floptic discs. ) Includes magnetic-optical media such as), and hardware devices specially configured to store and perform program instructions such as ROM, RAM, flash memory, etc. Is done. Examples of program instructions include not only machine language code as produced by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above can be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

前述した本願の説明は、例示のためのものであり、本願が属する技術分野の通常の知識を有する者は、本願の技術的思想や必須的な特徴を変更せずに他の具体的な形態に容易に変形可能なことが理解できるであろう。従って、以上で記述した実施例は、全ての面で例示的なものであり、限定的なものではないと理解すべきである。例えば、単一型で説明されている各構成要素は、分散して実施してもよく、同様に、分散して説明されている構成要素も、結合した形態で実施してもよい。 The above description of the present application is for illustration purposes only, and a person having ordinary knowledge of the technical field to which the present application belongs may use other specific forms without changing the technical idea or essential features of the present application. It can be seen that it can be easily deformed. Therefore, it should be understood that the examples described above are exemplary in all respects and are not limiting. For example, each component described in the single type may be carried out in a distributed manner, and similarly, the components described in a distributed manner may be carried out in a combined form.

本願の範囲は、上記詳細な説明よりも後述する特許請求の範囲によって表され、特許請求の範囲の意味及び範囲、並びにその均等概念から導出される全ての変更又は変形された形態が本願の範囲に含まれると解釈されるべきである。
[項目1]
保険金不当請求の探知装置において、
保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、
上記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、
上記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部とを含む保険金不当請求の探知装置。
[項目2]
上記保険請求内訳データ、上記特質変数及び上記正常請求データの少なくともいずれか一つを記録するデータベースをさらに含み、
上記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである項目1に記載の保険金不当請求の探知装置。
[項目3]
上記不当請求探知部は、
上記指導学習基盤の分類/予測アルゴリズムに基づいて上記不当請求探知模型を構築するものである項目1に記載の保険金不当請求の探知装置。
[項目4]
新規パターン分析部をさらに含み、
上記新規パターン分析部は、
上記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する不当請求パターン分類部と、
指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する判別模型構築部と、
上記新規パターン判別模型に基づいて新規請求のパターン類型を判別する新規パターン判別部とを含むものである項目1に記載の保険金不当請求の探知装置。
[項目5]
上記不当請求パターン分類部は、
上記特質変数の頻度に基づいて上記群集アルゴリズムを通じて上記特質変数を複数個の請求パターンに群集し、
上記請求パターンの群集間分離度に基づいて上記新規パターンを検出するものである項目4に記載の保険金不当請求の探知装置。
[項目6]
上記不当請求パターン分類部は、
上記新規パターン相互間の類似度に基づいて上記新規パターンを複数個の類似パターングループに分類するものである項目5に記載の保険金不当請求の探知装置。
[項目7]
上記不当請求パターン分類部は、
上記新規パターンのそれぞれと連携された特質変数の中で上記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて上記パターングループの危険水準を設定するものである項目6に記載の保険金不当請求の探知装置。
[項目8]
上記判別模型構築部は、
上記危険水準別に上記パターングループに含まれた上記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、上記新規パターン判別規則を含む上記新規パターン判別模型を構築するものである項目7に記載の保険金不当請求の探知装置。
[項目9]
上記新規パターン判別部は、
上記新規パターン判別規則に基づいて上記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである項目8に記載の保険金不当請求の探知装置。
[項目10]
保険金不当請求の探知方法において、
保険請求内訳データを定型化して特質変数を導出する段階と、
上記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する段階と、
上記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する段階とを含む保険金不当請求の探知方法。
[項目11]
上記保険請求内訳データ、上記特質変数及び上記正常請求データの少なくともいずれか一つを記録する段階をさらに含み、
上記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである項目10に記載の保険金不当請求の探知方法。
[項目12]
上記不当請求探知模型を構築する段階は、
上記指導学習基盤の分類/予測アルゴリズムに基づいて上記不当請求探知模型を構築するものである項目10に記載の保険金不当請求の探知方法。
[項目13]
新規パターンを分析する段階をさらに含み、
上記新規パターンを分析する段階は、
上記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する段階と、
指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する段階と、
上記新規パターン判別模型に基づいて新規請求のパターン類型を判別する段階とを含むものである項目12に記載の保険金不当請求の探知方法。
[項目14]
上記不当請求の新規パターンを分類する段階は、
上記特質変数の頻度に基づいて上記群集アルゴリズムを通じて上記特質変数を複数個の請求パターンに群集し、
上記請求パターンの群集間分離度に基づいて上記新規パターンを検出するものである項目13に記載の保険金不当請求の探知方法。
[項目15]
上記不当請求の新規パターンを分類する段階は、
上記新規パターン相互間の類似度に基づいて上記新規パターンを複数個の類似パターングループに分類するものである項目14に記載の保険金不当請求の探知方法。
[項目16]
上記不当請求の新規パターンを分類する段階は、
上記新規パターンのそれぞれと連携された特質変数の中で上記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて上記パターングループの危険水準を設定するものである項目15に記載の保険金不当請求の探知方法。
[項目17]
上記新規パターン判別模型を構築する段階は、
上記危険水準別に上記パターングループに含まれた上記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、上記新規パターン判別規則を含む上記新規パターン判別模型を構築するものである項目16に記載の保険金不当請求の探知方法。
[項目18]
上記パターン類型を判別する段階は、
上記新規パターン判別規則に基づいて上記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである項目17に記載の保険金不当請求の探知方法。
[項目19]
項目10から18のいずれか一項の方法をコンピュータで実行するためのプログラムを記録したコンピュータで読取可能な記録媒体。
The scope of the present application is represented by the scope of claims, which will be described later rather than the above detailed description, and the meaning and scope of the scope of claims and all modified or modified forms derived from the concept of equality thereof are the scope of the present application. Should be interpreted as being included in.
[Item 1]
In the insurance claim unfair claim detection device
A data pre-processing unit that standardizes insurance claim breakdown data and derives characteristic variables,
The unfair billing detection unit that builds the unfair billing detection model of the teaching and learning platform that inputs the above characteristic variables and normal billing data,
An insurance claim unfair claim detection device including an unfair claim determination unit that determines whether or not a new insurance claim breakdown is unreasonable based on the above unfair claim detection model.
[Item 2]
It further includes a database that records at least one of the insurance claim breakdown data, the characteristic variable and the normal claim data.
The insurance claim unfair claim detection device according to item 1, wherein the insurance claim breakdown data includes at least one of claim data, contract data, payment data, insurance designer data, and customer data.
[Item 3]
The above unjustified claim detection department
The insurance claim unfair claim detection device according to item 1, which constructs the unfair claim detection model based on the classification / prediction algorithm of the teaching and learning platform.
[Item 4]
Including a new pattern analysis department
The above new pattern analysis department
An unfair billing pattern classification unit that classifies new patterns of unfair billing based on a non-teaching learning-based crowd algorithm that inputs the above characteristic variables,
A discriminative model construction unit that builds a new pattern discriminative model based on the decision-making algorithm of the teaching and learning platform,
The device for detecting an unfair insurance claim according to item 1, which includes a new pattern discrimination unit that discriminates a pattern type of a new claim based on the new pattern discriminative model.
[Item 5]
The above unfair billing pattern classification department
The characteristic variables are crowded into a plurality of billing patterns through the crowd algorithm based on the frequency of the characteristic variables.
The device for detecting an unfair insurance claim according to item 4, which detects the new pattern based on the degree of separation between communities of the claim pattern.
[Item 6]
The above unfair billing pattern classification department
The device for detecting unfair insurance claims according to item 5, which classifies the new patterns into a plurality of similar pattern groups based on the degree of similarity between the new patterns.
[Item 7]
The above unfair billing pattern classification department
Item 6 wherein the risk level of the pattern group is set based on the number of characteristic variables linked to each of the new patterns and which are equal to or larger than the preset threshold value for each of the characteristic variables. Insurance claim unfair claim detection device.
[Item 8]
The above discriminative model construction unit
A new pattern discrimination rule is learned based on a decision-making algorithm that inputs the new pattern included in the pattern group according to the risk level, and the new pattern discrimination model including the new pattern discrimination rule is constructed. The detection device for unfair insurance claims according to item 7.
[Item 9]
The new pattern discriminating unit is
The insurance claim unfair claim detection device according to item 8, which determines which of the normal claim pattern, the unfair claim pattern, and the new pattern the new claim is based on the new pattern determination rule. ..
[Item 10]
In the method of detecting unfair insurance claims
At the stage of stylizing insurance claim breakdown data and deriving characteristic variables,
At the stage of constructing an unfair billing detection model of the teaching learning platform that inputs the above characteristic variables and normal billing data,
A method for detecting an unfair insurance claim, including a step of determining whether or not the breakdown of a new insurance claim is unreasonable based on the above-mentioned unfair claim detection model.
[Item 11]
Further including the step of recording at least one of the insurance claim breakdown data, the characteristic variable and the normal claim data.
The method for detecting an unfair insurance claim according to item 10, wherein the insurance claim breakdown data includes at least one of claim data, contract data, payment data, insurance designer data, and customer data.
[Item 12]
The stage of constructing the above unjustified claim detection model is
The method for detecting an unfair insurance claim according to item 10, wherein the unfair claim detection model is constructed based on the classification / prediction algorithm of the teaching and learning base.
[Item 13]
Including the stage of analyzing new patterns
The stage of analyzing the above new pattern is
At the stage of classifying new patterns of unfair billing based on the non-teaching learning-based crowd algorithm that inputs the above characteristic variables,
At the stage of constructing a new pattern discriminative model based on the decision-making algorithm of the teaching and learning platform,
The method for detecting an unfair insurance claim according to item 12, which includes a step of discriminating a pattern type of a new claim based on the new pattern discriminative model.
[Item 14]
The stage of classifying the new pattern of unfair billing is
The characteristic variables are crowded into a plurality of billing patterns through the crowd algorithm based on the frequency of the characteristic variables.
The method for detecting an unfair insurance claim according to item 13, which detects the new pattern based on the degree of separation between communities of the claim pattern.
[Item 15]
The stage of classifying the new pattern of unfair billing is
The method for detecting an unfair insurance claim according to item 14, wherein the new pattern is classified into a plurality of similar pattern groups based on the degree of similarity between the new patterns.
[Item 16]
The stage of classifying the new pattern of unfair billing is
Item 15. The item 15 in which the risk level of the pattern group is set based on the number of characteristic variables linked to each of the new patterns and which is equal to or higher than the preset threshold value for each of the characteristic variables. How to detect unfair insurance claims.
[Item 17]
The stage of constructing the above new pattern discrimination model is
A new pattern discrimination rule is learned based on a decision-making algorithm that inputs the new pattern included in the pattern group according to the risk level, and the new pattern discrimination model including the new pattern discrimination rule is constructed. The method for detecting an unfair insurance claim according to item 16.
[Item 18]
The stage for determining the above pattern type is
The method for detecting an unfair insurance claim according to item 17, which determines which of the normal claim pattern, the unfair claim pattern, and the new pattern the new claim is based on the new pattern determination rule. ..
[Item 19]
A computer-readable recording medium on which a program for executing the method of any one of items 10 to 18 is recorded.

Claims (9)

保険金不当請求の探知装置において、
保険請求内訳データを定型化して特質変数を導出するデータ前処理部と、
前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する不当請求探知部と、
前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する不当請求判断部と
前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類する不当請求パターン分類部、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築する判別模型構築部及び前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する新規パターン判別部を含む新規パターン分析部とを含み、
前記不当請求探知部は、
前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築し、
前記不当請求パターン分類部は、
前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、
前記請求パターンの群集間分離度に基づいて前記新規パターンを検出し、
前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類し、
前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定し、
前記特質変数は、保険金請求と関連して数値化された値を有することができる変数であり、前記特質変数は、同一病名で重複申請した個数及び顧客が申請した疾病事由の個数を含むものである、保険金不当請求の探知装置。
In the insurance claim unfair claim detection device
A data pre-processing unit that standardizes insurance claim breakdown data and derives characteristic variables,
An unfair billing detection unit that constructs an unfair billing detection model of a teaching and learning platform that inputs the characteristic variables and normal billing data,
An unfair claim judgment unit that determines whether or not the breakdown of new insurance claims is unreasonable based on the unfair claim detection model .
The unfair billing pattern classification unit that classifies new patterns of unfair billing based on the crowd algorithm of the non-teaching learning base that inputs the characteristic variables, and the discriminative model that builds a new pattern discriminative model based on the decision algorithm of the teaching learning base. Including a construction unit and a new pattern analysis unit including a new pattern discrimination unit that discriminates a pattern type of a new claim based on the new pattern discrimination model.
The unfair claim detection unit
The unjustified claim detection model was constructed based on the classification / prediction algorithm of the teaching and learning base, and
The unfair billing pattern classification unit
The characteristic variables are crowded into a plurality of billing patterns through the crowd algorithm based on the frequency of the characteristic variables.
The new pattern is detected based on the degree of separation between communities of the billing pattern.
The new patterns are classified into a plurality of similar pattern groups based on the degree of similarity between the new patterns.
Among the characteristic variables linked with each of the new patterns, the risk level of the pattern group is set based on the number of characteristic variables equal to or higher than the preset threshold value for each of the characteristic variables.
The characteristic variable is a variable that can have a quantified value in relation to an insurance claim, and the characteristic variable includes the number of duplicate applications for the same disease name and the number of disease reasons applied by the customer. , Insurance claim unfair claim detection device.
前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録するデータベースをさらに含み、
前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである請求項1に記載の保険金不当請求の探知装置。
It further includes a database that records at least one of the insurance claim breakdown data, the characteristic variable, and the normal claim data.
The insurance claim unfair claim detection device according to claim 1, wherein the insurance claim breakdown data includes at least one of claim data, contract data, payment data, insurance designer data, and customer data.
前記判別模型構築部は、
前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築するものである請求項1または2に記載の保険金不当請求の探知装置。
The discriminative model construction unit
A new pattern discrimination rule is learned based on a decision-making algorithm that inputs the new pattern included in the pattern group according to the risk level, and the new pattern discrimination model including the new pattern discrimination rule is constructed. The detection device for unfair insurance claims according to claim 1 or 2 .
前記新規パターン判別部は、
前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである請求項に記載の保険金不当請求の探知装置。
The new pattern discriminating unit is
The detection of unfair insurance claims according to claim 3 , which determines which of the normal claim pattern, the unfair claim pattern, and the new pattern the new claim is based on the new pattern determination rule. apparatus.
保険金不当請求の探知方法において、
データ前処理部が保険請求内訳データを定型化して特質変数を導出する段階と、
不当請求探知部が前記特質変数及び正常請求データを入力とする指導学習基盤の不当請求探知模型を構築する段階と、
不当請求判断部が前記不当請求探知模型に基づいて新規保険請求内訳が不当であるか否かを判断する段階と
新規パターン分析部が前記特質変数を入力とする非指導学習基盤の群集アルゴリズムに基づいて不当請求の新規パターンを分類し、指導学習基盤の意思決定アルゴリズムに基づいて新規パターン判別模型を構築し、前記新規パターン判別模型に基づいて新規請求のパターン類型を判別する段階とを含み、
前記不当請求探知模型を構築する段階は、
前記指導学習基盤の分類/予測アルゴリズムに基づいて前記不当請求探知模型を構築し、
前記新規請求のパターン類型を判別する段階は、
前記特質変数の頻度に基づいて前記群集アルゴリズムを通じて前記特質変数を複数個の請求パターンに群集し、
前記請求パターンの群集間分離度に基づいて前記新規パターンを検出し、
前記新規パターン相互間の類似度に基づいて前記新規パターンを複数個の類似パターングループに分類し、
前記新規パターンのそれぞれと連携された特質変数の中で前記特質変数のそれぞれに予め設定された閾値以上の特質変数の数に基づいて前記パターングループの危険水準を設定し、
前記特質変数は、保険金請求と関連して数値化された値を有することができる変数であり、前記特質変数は、同一病名で重複申請した個数及び顧客が申請した疾病事由の個数を含むものである、保険金不当請求の探知方法。
In the method of detecting unfair insurance claims
The stage where the data pre-processing department standardizes the insurance claim breakdown data and derives the characteristic variables,
The stage where the unfair billing detection unit constructs the unfair billing detection model of the teaching and learning platform that inputs the characteristic variables and normal billing data,
The stage where the Unfair Claim Judgment Department determines whether or not the new insurance claim breakdown is unreasonable based on the unfair claim detection model ,
The new pattern analysis unit classifies new patterns of unfair claims based on the non-teaching learning platform crowd algorithm that inputs the characteristic variable, constructs a new pattern discrimination model based on the teaching learning platform decision-making algorithm, and describes the above. Including the stage of discriminating the pattern type of new billing based on the new pattern discriminative model.
The stage of constructing the unfair claim detection model is
The unjustified claim detection model was constructed based on the classification / prediction algorithm of the teaching and learning base, and
The step of determining the pattern type of the new billing is
The characteristic variables are crowded into a plurality of billing patterns through the crowd algorithm based on the frequency of the characteristic variables.
The new pattern is detected based on the degree of separation between communities of the billing pattern.
The new patterns are classified into a plurality of similar pattern groups based on the degree of similarity between the new patterns.
Among the characteristic variables linked with each of the new patterns, the risk level of the pattern group is set based on the number of characteristic variables equal to or higher than the preset threshold value for each of the characteristic variables.
The characteristic variable is a variable that can have a quantified value in relation to an insurance claim, and the characteristic variable includes the number of duplicate applications for the same disease name and the number of disease reasons applied by the customer. , How to detect unfair insurance claims.
前記保険請求内訳データ、前記特質変数及び前記正常請求データの少なくともいずれか一つを記録する段階をさらに含み、
前記保険請求内訳データは、請求データ、契約データ、支給データ、保険設計士データ、顧客データの少なくともいずれか一つを含むものである請求項に記載の保険金不当請求の探知方法。
Further including the step of recording at least one of the insurance claim breakdown data, the characteristic variable and the normal claim data.
The method for detecting an unfair insurance claim according to claim 5 , wherein the insurance claim breakdown data includes at least one of claim data, contract data, payment data, insurance designer data, and customer data.
前記新規パターン判別模型を構築する段階は、
前記危険水準別に前記パターングループに含まれた前記新規パターンを入力とする意思決定アルゴリズムに基づいて新規パターン判別規則を学習し、前記新規パターン判別規則を含む前記新規パターン判別模型を構築するものである請求項5または6に記載の保険金不当請求の探知方法。
The stage of constructing the new pattern discrimination model is
A new pattern discrimination rule is learned based on a decision-making algorithm that inputs the new pattern included in the pattern group according to the risk level, and the new pattern discrimination model including the new pattern discrimination rule is constructed. The method for detecting an unfair insurance claim according to claim 5 or 6 .
前記パターン類型を判別する段階は、
前記新規パターン判別規則に基づいて前記新規請求が正常請求パターン、不当請求パターン及び新規パターンの中でいずれのパターン類型であるかを判別するものである請求項に記載の保険金不当請求の探知方法。
The step of discriminating the pattern type is
The detection of unfair insurance claims according to claim 7 , which determines which of the normal claim pattern, the unfair claim pattern, and the new pattern the new claim is based on the new pattern determination rule. Method.
請求項5から8のいずれか一項の方法をコンピュータ実行させるためのプログラム。 Any order of the program to execute the one of methods in a computer according to claim 5 to 8.
JP2020526088A 2017-11-29 2018-11-23 Artificial intelligence-based insurance claim detection device and method Active JP6821885B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2017-0162069 2017-11-29
KR1020170162069A KR101974521B1 (en) 2017-11-29 2017-11-29 Device and method for insurance unfair claim detection based on artificial intelligence
PCT/KR2018/014539 WO2019107840A1 (en) 2017-11-29 2018-11-23 Device and method for detecting fraudulent insurance claim on basis of artificial intelligence

Publications (2)

Publication Number Publication Date
JP6821885B1 true JP6821885B1 (en) 2021-01-27
JP2021504782A JP2021504782A (en) 2021-02-15

Family

ID=66655931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020526088A Active JP6821885B1 (en) 2017-11-29 2018-11-23 Artificial intelligence-based insurance claim detection device and method

Country Status (3)

Country Link
JP (1) JP6821885B1 (en)
KR (1) KR101974521B1 (en)
WO (1) WO2019107840A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7144495B2 (en) * 2020-09-29 2022-09-29 損害保険ジャパン株式会社 Payment exclusion possibility determination device, payment exclusion possibility determination system, and payment exclusion possibility determination method
CN115695052B (en) * 2023-01-03 2023-03-31 平安银行股份有限公司 Data protection method and device for shared interface

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06119355A (en) * 1992-10-05 1994-04-28 Nri & Ncc Co Ltd Research support system of unfair practice
JP2006221449A (en) * 2005-02-10 2006-08-24 American Family Life Assurance Co Of Columbus Contract managing device
KR100792175B1 (en) * 2006-02-17 2008-01-07 동부화재해상보험 주식회사 A claim management system and method for compensation of insurance by a virtual consultant
US20100145734A1 (en) * 2007-11-28 2010-06-10 Manuel Becerra Automated claims processing system
US8762180B2 (en) * 2009-08-25 2014-06-24 Accenture Global Services Limited Claims analytics engine
US20110282695A1 (en) * 2010-05-17 2011-11-17 Joseph Blue Methods and systems for fraud detection
KR101138830B1 (en) * 2011-04-28 2012-05-10 사단법인 보험개발원 Insurance accident analysis method and system thereof
WO2015002630A2 (en) * 2012-07-24 2015-01-08 Deloitte Development Llc Fraud detection methods and systems
US20150220862A1 (en) * 2014-02-05 2015-08-06 Fraud Sniffr, Inc. System and method for automated evaluation of customer activity
KR101603725B1 (en) * 2014-05-16 2016-03-16 삼성생명보험주식회사 Apparatus for detecting insurance fraud and computer-readable medium thereof
KR101743269B1 (en) * 2016-01-13 2017-06-05 주식회사 엔젠소프트 Method and apparatus of fraud detection by analysis of PC information and modeling of behavior pattern
US9849364B2 (en) * 2016-02-02 2017-12-26 Bao Tran Smart device
KR101847847B1 (en) * 2016-11-15 2018-04-12 주식회사 와이즈넛 Method for clustering document from informal text data by using deep learning

Also Published As

Publication number Publication date
KR101974521B1 (en) 2019-05-07
JP2021504782A (en) 2021-02-15
WO2019107840A1 (en) 2019-06-06

Similar Documents

Publication Publication Date Title
Rai et al. Fraud detection in credit card data using unsupervised machine learning based scheme
Mohammadi et al. Customer credit risk assessment using artificial neural networks
KR102085814B1 (en) Device and method for new unfair claim pattern analysis based on artificial intelligence
KR102153912B1 (en) Device and method for insurance unfair claim and unfair pattern detection based on artificial intelligence
JP6821885B1 (en) Artificial intelligence-based insurance claim detection device and method
Kasasbeh et al. Multilayer perceptron artificial neural networks-based model for credit card fraud detection
Chadha et al. Application of data mining techniques on heart disease prediction: a survey
Li et al. Explain graph neural networks to understand weighted graph features in node classification
JP7009658B2 (en) Malicious delinquency detection device and method based on artificial intelligence
Jain et al. Singular race models: addressing bias and accuracy in predicting prisoner recidivism
Shanthi et al. Gender specific classification of road accident patterns through data mining techniques
KR20200010621A (en) Device and method for insurance unfair claim and unfair pattern detection based on artificial intelligence
Simić et al. A three-stage hybrid clustering system for diagnosing children with primary headache disorder
Settipalli et al. Predictive and adaptive drift analysis on decomposed healthcare claims using ART based topological clustering
Ahmad Mining health data for breast cancer diagnosis using machine learning
Reyes-Nava et al. Using deep learning to classify class imbalanced gene-expression microarrays datasets
Alshantti et al. Self-Organising map based framework for investigating accounts suspected of money laundering
KR102149542B1 (en) Device and method for detecting new fraudulent claims
Majumdar et al. Heuristic model to improve feature selection based on machine learning in data mining
JP2020144502A (en) Classification system
Mohanta et al. Health Insurance Fraud Detection Using Feature Selection and Ensemble Machine Learning Techniques
DEB et al. A comparative study on credit card fraud detection
Nguyen-Thi et al. Using novel noise filtering techniques to ensemble classifiers for credit scoring: Using noise filtering techniques to ensemble classifiers for credit scoring
Wang et al. Imbalanced classification problem using data-driven and random forest method
Miao Using Machine Learning Method to Predict Stroke Risk

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200522

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200522

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200522

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20201028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201210

R150 Certificate of patent or registration of utility model

Ref document number: 6821885

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250