KR102149542B1 - Device and method for detecting new fraudulent claims - Google Patents

Device and method for detecting new fraudulent claims Download PDF

Info

Publication number
KR102149542B1
KR102149542B1 KR1020190155133A KR20190155133A KR102149542B1 KR 102149542 B1 KR102149542 B1 KR 102149542B1 KR 1020190155133 A KR1020190155133 A KR 1020190155133A KR 20190155133 A KR20190155133 A KR 20190155133A KR 102149542 B1 KR102149542 B1 KR 102149542B1
Authority
KR
South Korea
Prior art keywords
insurance
new
data
unfair
model
Prior art date
Application number
KR1020190155133A
Other languages
Korean (ko)
Inventor
김지혁
최정문
Original Assignee
(주)위세아이텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)위세아이텍 filed Critical (주)위세아이텍
Priority to KR1020190155133A priority Critical patent/KR102149542B1/en
Application granted granted Critical
Publication of KR102149542B1 publication Critical patent/KR102149542B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

The present invention relates to a new fraudulent claim detection device and a method thereof. The new fraudulent claim detection device can comprise: a data preprocessing part that preprocesses insurance claim details data to derive and refine feature variables required for artificial intelligence learning; a model construction part that builds a normal autoencoder model that learns normal feature variables derived from normal insurance claim details data and an abnormal autoencoder model that learns abnormal feature variables derived from abnormal insurance claim details data; a new pattern detection part that detects a new pattern of fraudulent claims from an error value of each of the normal autoencoder model and the abnormal autoencoder model; and a new fraudulent claim determination part that determines new fraudulent insurance claims based on a fraudulent claim detection model that learns the new pattern.

Description

신규 부당청구 검출 장치 및 방법{DEVICE AND METHOD FOR DETECTING NEW FRAUDULENT CLAIMS}New unfair claim detection device and method {DEVICE AND METHOD FOR DETECTING NEW FRAUDULENT CLAIMS}

본원은 신규 부당청구 검출 장치 및 방법에 관한 것이다.The present application relates to a novel apparatus and method for detecting unfair claims.

기존의 보험금 부당청구 탐지는 대부분 기존의 비즈니스 룰 기반으로 청구된 보험 사건에 대해 전문가의 경험과 지식을 바탕으로 룰을 도출하는 방법으로 부당청구를 탐지하고, 보험사기를 방지하고 있다.Existing unfair claims for insurance claims are mostly detected based on existing business rules to detect unfair claims and prevent insurance fraud by deriving rules based on expert experience and knowledge.

하지만 전문가의 규칙 기반 보험금 부당청구 방법은 시간적, 경제적으로 비효율적인 부분이 많다. 전문가들의 조사에 기반해 보험금 부당청구를 탐지하는 데에는 인력이 한정적이고, 빅데이터 시대에 모든 데이터를 처리하는 데에는 시간적, 경제적 제약이 따른다.However, the expert's rule-based unfair claim method is often inefficient in terms of time and economy. Human resources are limited to detect unfair claims for insurance claims based on expert research, and time and economic constraints are imposed on processing all data in the era of big data.

또한 보험회사는 보험사기에 대해 아무런 조치도 취하지 않은 채 보험금 누수를 방치할 수도 없고, 보험사기를 완전히 밝혀낸다는 목적 하에 무한대의 조사비용을 지출할 수도 없다. 이에 보험회사는 보험사기로부터 누수보험금을 줄이는 한편 지나치게 많은 조사비용을 지출하지 않는 적정한 선에서 조사노력의 수준을 결정할 필요가 있다. 따라서 기존의 보험사기 방지시스템은 새로운 방법이 필요하고, 새로운 사기패턴도 탐지할 수 있는 방법이 필요하다. In addition, insurance companies cannot neglect insurance money leaks without taking any action against insurance fraud, nor can they spend infinite investigation costs for the purpose of fully revealing insurance fraud. Accordingly, insurance companies need to determine the level of investigation efforts in an appropriate manner not to spend too much investigation cost while reducing the amount of insurance leakage from insurance fraud. Therefore, the existing insurance fraud prevention system needs a new method and a method capable of detecting new fraud patterns.

본원의 배경이 되는 기술은 한국등록특허공보 제10-0862181호에 개시되어 있다.The technology behind the present application is disclosed in Korean Patent Application Publication No. 10-0862181.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 보험금의 부당청구 패턴 및 부당청구의 신규 패턴을 검출하기 위한 신규 부당청구 검출 장치 및 방법을 제공하는 것을 목적으로 한다.The present application is to solve the problems of the prior art described above, an object of the present invention to provide a new unfair claim detection apparatus and method for detecting a new pattern of unfair claims and unfair claims of insurance money.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 부당청구 데이터를 학습하여 새로운 부당청구 패턴을 분석하고, 신규 보험청구건에 대한 부당청구 여부를 판별할 수 있는 신규 부당청구 검출 장치 및 방법을 제공하는 것을 목적으로 한다.The present application is to solve the problems of the prior art described above, a new unfair claim detection device and method capable of learning unfair claim data to analyze a new unfair claim pattern, and to determine whether or not a new insurance claim is unfairly claimed. It aims to provide.

다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들도 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problems to be achieved by the embodiments of the present application are not limited to the technical problems as described above, and other technical problems may exist.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 신규 부당청구 검출 장치는 보험청구 내역 데이터를 전처리하여, 인공지능 학습에 요구되는 특질 변수를 도출하여 정제하는 데이터 전처리부, 정상 보험청구 내역 데이터로부터 도출된 정상 특질 변수를 학습하는 정상 오토인코더 모델 및 이상 보험청구 내역 데이터로부터 도출된 이상 특질 변수를 학습하는 이상 오토인코더 모델을 구축하는 모델 구축부, 상기 정상 오토인코더 모델 및 상기 이상 오토인코더 모델 각각의 에러값으로부터 부당청구의 신규 패턴을 검출하는 신규 패턴 검출부 및 상기 신규 패턴을 학습하는 부당청구 탐지 모델에 기초하여 신규 보험청구의 부당청구를 판별하는 신규 부당청구 판별부를 포함할 수 있다.As a technical means for achieving the above technical problem, a new unfair claim detection device according to an embodiment of the present application preprocesses insurance claim details data, and a data preprocessing unit that derives and refines characteristic variables required for artificial intelligence learning, A model construction unit that builds a normal autoencoder model that learns the normal feature variable derived from the normal insurance claim details data and the abnormal autoencoder model that learns the abnormal feature variable derived from the abnormal insurance claim detail data, the normal autoencoder model, and A new pattern detection unit that detects a new pattern of unfair claims from the error values of each of the abnormal autoencoder models, and a new unfair claim determination unit that determines unfair claims of new insurance claims based on the unfair claims detection model that learns the new pattern. can do.

본원의 일 실시예에 따르면, 상기 비정형 데이터를 포함하는 보험청구 내역 데이터를 저장하는 데이터베이스를 더 포함하고, 상기 보험청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함할 수 있다.According to an embodiment of the present application, further comprising a database for storing insurance claim detail data including the unstructured data, wherein the insurance claim detail data is at least one of billing data, contract data, payment data, insurance planner data, and customer data. It can contain one.

본원의 일 실시예에 따르면, 상기 모델 구축부는, 비지도 학습 기반의 오토인코더 알고리즘에 기초하여 상기 정상 오토인코더 모델 및 상기 이상 오토인코더 모델을 구축할 수 있다.According to the exemplary embodiment of the present application, the model building unit may construct the normal autoencoder model and the abnormal autoencoder model based on an autoencoder algorithm based on unsupervised learning.

본원의 일 실시예에 따르면, 상기 신규 패턴 검출부는, 신규 패턴을 검출하기 위한 임계 구간을 설정하되, 상기 임계 구간은 정상, 의심군 및 이상을 포함할 수 있다.According to an exemplary embodiment of the present disclosure, the new pattern detection unit sets a threshold section for detecting a new pattern, and the threshold section may include normal, suspect, and abnormal.

본원의 일 실시예에 따르면, 상기 신규 패턴 검출부는, 정상 오토인코더 모델의 에러값과, 이상 오토인코더 모델의 에러값의 차이에 기초하여 상기 임계 구간을 구분하여 라벨링할 수 있다.According to an exemplary embodiment of the present disclosure, the new pattern detection unit may classify and label the threshold section based on a difference between an error value of a normal autoencoder model and an error value of an abnormal autoencoder model.

본원의 일 실시예에 따르면, 상기 신규 패턴 검출부는, 상기 의심군으로 라벨링된 에러값과 연계된 학습 데이터로부터 상기 신규 패턴을 검출할 수 있다.According to an exemplary embodiment of the present disclosure, the new pattern detection unit may detect the new pattern from learning data associated with an error value labeled as the suspect group.

본원의 일 실시예에 따르면, 상기 신규 부당청구 판별부는, 지도학습 기반의 분류 알고리즘에 기초한 상기 신규 패턴 학습 모델 및 상기 신규 패턴에 기초하여 신규 보험청구의 부당청구를 판별할 수 있다.According to an exemplary embodiment of the present application, the new unfair claim determination unit may determine an unfair claim of a new insurance claim based on the new pattern learning model and the new pattern based on a supervised learning-based classification algorithm.

본원의 일 실시예에 따른 신규 부당청구 검출 장치에 의한 신규 부당청구 검출 방법은 보험청구 내역 데이터를 전처리하여, 인공지능 학습에 요구되는 특질 변수를 도출하여 정제하는 단계, 정상 보험청구 내역 데이터로부터 도출된 정상 특질 변수를 학습하는 정상 오토인코더 모델 및 이상 보험청구 내역 데이터로부터 도출된 이상 특질 변수를 학습하는 이상 오토인코더 모델을 구축하는 단계, 상기 정상 오토인코더 모델 및 상기 이상 오토인코더 모델 각각의 에러값으로부터 부당청구의 신규 패턴을 검출하는 단계 및 상기 신규 패턴을 학습하는 부당청구 탐지 모델에 기초하여 신규 보험청구의 부당청구를 판별하는 단계를 포함할 수 있다.In the method of detecting a new unfair claim by a new unfair claim detection device according to an embodiment of the present application, the step of deriving and refining the characteristic variables required for artificial intelligence learning by preprocessing the insurance claim details data, and deriving from the normal insurance claim details data Constructing a normal autoencoder model for learning a normal feature variable and an abnormal autoencoder model for learning an abnormal feature variable derived from the abnormal insurance claim details data, the error value of each of the normal autoencoder model and the abnormal autoencoder model The method may include detecting a new pattern of unfair claims from and determining an unfair claim of a new insurance claim based on an unfair claim detection model for learning the new pattern.

본원의 일 실시예에 따르면, 상기 비정형 데이터를 포함하는 보험청구 내역 데이터를 저장하는 단계를 더 포함하고, 상기 보험청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함할 수 있다.According to an embodiment of the present application, further comprising the step of storing insurance claim details data including the unstructured data, wherein the insurance claim details data is at least one of claim data, contract data, payment data, insurance agent data, and customer data. It can contain one.

본원의 일 실시예에 따르면, 상기 모델을 구축하는 단계는, 비지도 학습 기반의 오토인코더 알고리즘에 기초하여 상기 정상 오토인코더 모델 및 이상 오토인코더 모델을 구축할 수 있다.According to an exemplary embodiment of the present application, in the step of constructing the model, the normal autoencoder model and the abnormal autoencoder model may be constructed based on an autoencoder algorithm based on unsupervised learning.

본원의 일 실시예에 따르면, 상기 신규 패턴을 검출하는 단계는, 신규 패턴을 검출하기 위한 임계 구간을 설정하되, 상기 임계 구간은 정상, 의심군 및 이상을 포함할 수 있다.According to an exemplary embodiment of the present disclosure, in the detecting of the new pattern, a threshold section for detecting the new pattern is set, and the threshold section may include normal, suspect, and abnormal.

본원의 일 실시예에 따르면, 상기 신규 패턴을 검출하는 단계는, 정상 오토인코더 모델의 에러값과, 이상 오토인코더 모델의 에러값의 차이에 기초하여 상기 임계 구간을 구분하여 라벨링할 수 있다.According to an exemplary embodiment of the present disclosure, the detecting of the new pattern may divide and label the threshold section based on a difference between an error value of a normal autoencoder model and an error value of an abnormal autoencoder model.

본원의 일 실시예에 따르면, 상기 신규 패턴을 검출하는 단계는, 상기 의심군으로 라벨링된 에러값과 연계된 학습 데이터로부터 상기 신규 패턴을 검출할 수 있다.According to an exemplary embodiment of the present disclosure, the detecting of the new pattern may detect the new pattern from learning data associated with an error value labeled as the suspect group.

본원의 일 실시예에 따르면, 상기 신규 보험청구의 부당청구를 판별하는 단계는, 지도학습 기반의 분류 알고리즘에 기초한 상기 신규 패턴 학습 모델 및 상기 신규 패턴에 기초하여 신규 보험청구의 부당청구를 판별할 수 있다.According to an embodiment of the present application, the step of determining the unfair claim of the new insurance claim includes determining the unfair claim of the new insurance claim based on the new pattern learning model and the new pattern based on a supervised learning-based classification algorithm. I can.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary and should not be construed as limiting the present application. In addition to the above-described exemplary embodiments, additional embodiments may exist in the drawings and detailed description of the invention.

전술한 본원의 과제 해결 수단에 의하면, 보험금의 부당청구 패턴 및 부당청구의 신규 패턴을 검출하기 위한 신규 부당청구 검출 장치 및 방법을 제공할 수 있다.According to the above-described problem solving means of the present application, it is possible to provide a new unfair claim detection apparatus and method for detecting an unfair claim pattern of insurance money and a new pattern of unfair claim.

전술한 본원의 과제 해결 수단에 의하면, 부당청구 데이터를 학습하여 새로운 부당청구 패턴을 분석하고, 신규 보험청구건에 대한 부당청구 여부를 판별할 수 있는 신규 부당청구 검출 장치 및 방법을 제공할 수 있다.According to the above-described problem solving means of the present application, it is possible to provide a new unfair claim detection apparatus and method capable of learning unfair claim data to analyze a new unfair claim pattern, and to determine whether or not a new insurance claim is unfairly claimed. .

도 1은 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 구성을 도시한 도면이다.
도 2는 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 오토인코더 모델 구축의 예를 도시한 도면이다.
도 3은 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 정상 에러값 및 이상 에러값의 비교를 도시한 도면이다.
도 4는 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 라벨링의 예를 도시한 도면이다.
도 5는 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 신규 부당패턴 검출의 예를 도시한 도면이다.
도 6은 본원의 일 실시예에 따른 신규 부당청구 검출 방법의 흐름을 도시한 도면이다.
1 is a diagram showing the configuration of a new unfair claim detection apparatus according to an embodiment of the present application.
2 is a diagram showing an example of building an autoencoder model of a new unfair claim detection apparatus according to an embodiment of the present application.
3 is a diagram illustrating a comparison of a normal error value and an abnormal error value of a new unfair claim detection apparatus according to an embodiment of the present application.
4 is a diagram illustrating an example of labeling of a new unfair claim detection device according to an embodiment of the present application.
5 is a diagram illustrating an example of detection of a new unfair pattern by a new unfair claim detection apparatus according to an embodiment of the present application.
6 is a diagram illustrating a flow of a method for detecting a new unfair claim according to an embodiment of the present application.

아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, exemplary embodiments of the present application will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art may easily implement the present application. However, the present application may be implemented in various different forms and is not limited to the embodiments described herein. In addition, in the drawings, parts not related to the description are omitted in order to clearly describe the present application, and similar reference numerals are attached to similar parts throughout the specification.

본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. Throughout this specification, when a part is said to be "connected" with another part, this includes not only the case that it is "directly connected", but also the case that it is "electrically connected" with another element interposed therebetween. do.

본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.Throughout this specification, when a member is positioned "on", "upper", "upper", "under", "lower", and "lower" of another member, this means that a member is located on another member. It includes not only the case where they are in contact but also the case where another member exists between the two members.

본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification of the present application, when a certain part "includes" a certain component, it means that other components may be further included rather than excluding other components unless specifically stated to the contrary.

도 1은 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 구성을 도시한 도면이다.1 is a diagram showing the configuration of a new unfair claim detection apparatus according to an embodiment of the present application.

도 1을 참조하면, 신규 부당청구 검출 장치(100)는 데이터 전처리부(110), 모델 구축부(120), 신규 패턴 검출부(130), 신규 부당청구 판별부(140) 및 데이터베이스(150)를 포함할 수 있다. 데이터 전처리부(110)는 보험청구 내역 데이터를 전처리하여, 인공지능 학습에 요구되는 특질 변수를 도출하여 정제할 수 있다. Referring to FIG. 1, a new unfair claim detection apparatus 100 includes a data preprocessing unit 110, a model construction unit 120, a new pattern detection unit 130, a new unfair claim determination unit 140, and a database 150. Can include. The data preprocessor 110 may pre-process the insurance claim details data to derive and refine characteristic variables required for artificial intelligence learning.

후술하는 설명은 보험금의 부당청구 뿐만 아니라 보조금, 지원금, 보증금 등의 부당청구를 포함하는 것은 자명하나, 설명의 편의를 위해 보험금 부당청구를 중심으로 설명한다. 상기 보험청구 내역 데이터는 예시적으로, 보험금을 청구한 청구 데이터, 보험 또는 보조금 관련 계약 데이터, 보험금의 지급 데이터, 보험 설계사 데이터, 고객 데이터 및 보험사기 적발 결과 데이터 중 적어도 하나를 포함할 수 있다.Although it is self-evident that the following description includes not only unfair claims for insurance money, but also unfair claims such as subsidies, support funds, and security deposits, the explanation focuses on unfair claims for insurance money for convenience of explanation. The insurance claim detail data may include at least one of claims data for claiming insurance, insurance or subsidy related contract data, insurance payment data, insurance agent data, customer data, and insurance fraud detection result data.

데이터 전처리부(110)는 비정형 데이터를 포함하는 보험청구 내역 데이터를 전처리하여 정형화 할 수 있고, 정형화된 보험청구 내역 데이터로부터 특질 변수를 추출할 수 있다. 보험청구 내역 데이터의 정형화는 예를 들어, 고객 데이터인 경우, 고객의 소득 수준, 고객이 방문한 병원의 수, 고객이 신청한 질병 사유의 개수 등을 수치화하는 것을 의미한다. 또한, 데이터 전처리부(110)에 의해 도출되는 특질 변수는 보험금 청구와 관련되어 수치화된 값을 가질 수 있는 변수로, 예를 들어, 고객 ID 번호, 보험사기자 여부, 동일 병명으로 중복 신청한 개수, 계약 체결 년월 개수, 하루최대 계약 개수, 지불 승인된 증권 개수, 지불 신청한 증권 개수, 고객이 체결한 증권 개수, 보장성 보험 청구 횟수, 신용 등급 변화량, 가입한 계약의 종류, 유의 병원 방문 총 횟수, 고객이 신청한 질병 사유의 개수, 고객이 만난 의사의 명수, 고객이 방문한 병원의 개수, 유효 입/통원 총 일수, 진료 과목 개수, 고객 소득 수준, FP(Financial Planner) 변경 횟수, 실손 처리 개수, 사기 FP 계약 개수 중 적어도 하나를 포함할 수 있다.The data pre-processing unit 110 may pre-process and format insurance claim details data including unstructured data, and may extract characteristic variables from the standardized insurance claim details data. For example, in the case of customer data, the standardization of insurance claim data refers to quantifying the income level of the customer, the number of hospitals visited by the customer, and the number of disease reasons the customer has applied for. In addition, the characteristic variable derived by the data preprocessor 110 is a variable that can have a numerical value related to the insurance claim. For example, the customer ID number, whether the insurance fraudster, the number of duplicate applications under the same name, The number of contracts signed, the maximum number of contracts per day, the number of securities approved for payment, the number of securities applied for payment, the number of securities signed by the customer, the number of insurance claims, the amount of credit rating change, the type of contract signed, the total number of visits to the hospital. The number of reasons for illness requested by the customer, the number of doctors the customer has met, the number of hospitals that the customer has visited, the total number of valid admission/outpatient days, the number of treatment subjects, the customer's income level, the number of FP (Financial Planner) changes, the number of loss treatment, It may include at least one of the number of fraudulent FP contracts.

데이터베이스(150)는 비정형 데이터를 포함하는 보험청구 내역 데이터를 저장할 수 있다. 데이터 전처리부(110)는 데이터베이스에 저장된 보험청구 내역 데이터로부터 특질 변수를 산출할 수 있다. 예시적으로, 데이터베이스(150)에는 정상 청구로 분류된 보험청구 내역 데이터(이하, 정상 보험청구 내역 데이터)와 이상 청구(비정상 청구)로 분류된 보험청구 내역 데이터(이하, 이상 보험청구 내역 데이터)가 구분되어 저장될 수 있다. 데이터 전처리부(110)는 정상 보험청구 내역 데이터 및 이상 보험청구 내역 데이터 각각으로부터 특질 변수를 산출할 수 있다.The database 150 may store insurance claim detail data including unstructured data. The data preprocessor 110 may calculate a characteristic variable from the insurance claim detail data stored in the database. For example, in the database 150, insurance claim details data classified as normal claims (hereinafter, normal insurance claims details data) and insurance claim details data classified as abnormal claims (abnormal claims) (hereinafter, abnormal insurance claim details data). Can be separated and stored. The data preprocessor 110 may calculate characteristic variables from each of the normal insurance claim details data and the abnormal insurance claim details data.

모델 구축부(120)는 정상 보험청구 내역 데이터로부터 도출된 정상 특질 변수를 학습하는 정상 오토인코더 모델 및 이상 보험청구 내역 데이터로부터 도출된 이상 특질 변수를 학습하는 이상 오토인코더 모델을 구축할 수 있다. 본원의 일 실시예에 따르면, 데이터 전처리부(110)는 정상 및 이상으로 구분되지 않은 보험청구 내역 데이터의 전처리를 통한 특질 변수를 산출하는 과정에서 정상 보험청구 내역 데이터와 이상 보험청구 내역 데이터를 구분할 수 있다. 구체적으로, 데이터 전처리부(110)는 상술한 보험청구 내역 데이터에 포함된 각 요소(청구 데이터, 계약 데이터 등) 각각을 정형화하고, 상기 요소 각각에 미리 설정된 임계값의 초과 여부에 따라 해당 보험청구 내역 데이터가 정상 보험청구 내역 데이터인지 이상 보험청구 내역 데이터인지 구분할 수 있다. 또한, 모델 구축부(120)는 데이터 전처리부(110)에서 구분된 정상 보험청구 내역 데이터 및 이상 보험청구 내역 데이터로부터 도출된 특질 변수를 학습할 수 있다.The model building unit 120 may build a normal autoencoder model that learns a normal characteristic variable derived from the normal insurance claim details data and an abnormal autoencoder model that learns an abnormal characteristic variable derived from the abnormal insurance claim details data. According to an embodiment of the present application, the data preprocessing unit 110 may distinguish between normal and abnormal insurance claim details data in the process of calculating characteristic variables through pre-processing of insurance claim details data that are not classified into normal and abnormal. I can. Specifically, the data preprocessing unit 110 standardizes each element (claim data, contract data, etc.) included in the above-described insurance claim detail data, and makes a corresponding insurance claim according to whether or not a preset threshold value is exceeded for each of the elements. It is possible to distinguish whether the historical data is normal insurance claim history data or abnormal insurance claim history data. In addition, the model building unit 120 may learn characteristic variables derived from the normal insurance claim details data and the abnormal insurance claim details data separated by the data preprocessing unit 110.

모델 구축부(120)는 비지도 학습 기반의 오토인코더 알고리즘에 기초하여 정상 오토인코더 모델 및 이상 오토인코더 모델을 구축할 수 있다. 오토인코더 알고리즘은 신경망의 각 층을 단계적으로 학습하여 최종 출력이 최초 입력을 재연하도록 하는 것이 주된 특징이다. 다시 말해, 입력값을 받아들여 동일한 크기의 출력을 산출하는 것을 의미한다. 이때. 히든 레이어에 존재하는 노드의 수는 입력 노드와 출력 노드보다 작다. 다시 말해, 데이터가 압축되는 것을 의미한다. 오토인코더를 통해 데이터가 압축됨에 따라, 데이터의 주요 특징(예를 들어, 특질변수)만으로도 작은 용량으로 고품질의 결과가 산출될 수 있다.The model building unit 120 may build a normal autoencoder model and an abnormal autoencoder model based on an unsupervised learning-based autoencoder algorithm. The main feature of the autoencoder algorithm is to learn each layer of a neural network step by step so that the final output reproduces the initial input. In other words, it means to accept an input value and produce an output of the same size. At this time. The number of nodes in the hidden layer is smaller than that of the input node and the output node. In other words, it means that the data is compressed. As data is compressed through the auto-encoder, high-quality results can be produced in a small capacity with only the main characteristics of the data (eg, characteristic variables).

도 2는 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 오토인코더 모델 구축의 예를 도시한 도면이다.2 is a diagram illustrating an example of building an autoencoder model of a new unfair claim detection apparatus according to an embodiment of the present application.

도 2를 참조하면, 신규 패턴 검출부(130)는 정상 오토인코더 모델 및 이상 오토인코더 모델 각각의 에러값으로부터 부당청구의 신규 패턴을 검출할 수 있다. 신규 패턴 검출부(130)는 정상 특질 변수를 학습하는 정상 오토인코더 모델로부터 정상 에러값을 산출할 수 있고, 이상 특질 변수를 학습하는 이상 오토인코더 모벨로부터 이상 에러값을 각각 산출할 수 있다. 신규 패턴 검출부(130)는 정상 에러값과 이상 에러값을 활용하여 부당청구의 신규 패턴을 검출할 수 있다.Referring to FIG. 2, the new pattern detection unit 130 may detect a new pattern of unfair claims from error values of each of the normal autoencoder model and the abnormal autoencoder model. The new pattern detection unit 130 may calculate a normal error value from the normal autoencoder model for learning the normal feature variable, and may calculate the abnormal error value from the abnormal autoencoder move for learning the abnormal feature variable, respectively. The new pattern detection unit 130 may detect a new pattern of unfair claims by using the normal error value and the abnormal error value.

도 3은 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 정상 에러값 및 이상 에러값의 비교를 도시한 도면이고, 도 4는 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 라벨링의 예를 도시한 도면이다.3 is a diagram showing a comparison of a normal error value and an abnormal error value of a new unfair claim detection device according to an embodiment of the present application, and FIG. 4 is an example of labeling of a new unfair claim detection device according to an embodiment of the present application It is a diagram showing.

신규 패턴 검출부(130)는 정상 에러값 및 이상 에러값의 차이를 부당청구의 신규 패턴 검출에 활용할 수 있다. 도 3을 참조하면, 신규 패턴 검출부(130)는 정상 오토인코더(Normal Auto Encoder)의 에러값(NAE Error)과 이상 오토인코더(Fraud Auto Encoder)의 에러값(FAE Error) 각각의 차이(NAE - FAE)를 산출할 수 있다. 신규 패턴 검출부(130)는 신규 패턴 검출에 앞서, 신규 패턴을 검출하기 위한 임계 구간을 설정할 수 있다. 도 4를 참조하면, 임계 구간은 정상, 의심군 및 이상을 포함할 수 있으며, 신규 패턴 검출부(130)는 상기 차이(NAE - FAE)를 기준으로, 정상, 의심군, 이상 각각을 구분하는 임계 구간 즉 임계값의 범위를 설정할 수 있다. 상기 임계 구간은 사용자에 의해 설정될 수 있고, 상기 차이(NAE - FAE)별로 과거에 설정된 임계 구간을 활용할 수도 있다. 다른 예로, 상기 차이(NAE - FAE)를 이용한 임계 구간은 (|NAE - FAE|) 0.1로 연산된 임계값에 기초하여 설정될 수 있다.The new pattern detection unit 130 may utilize the difference between the normal error value and the abnormal error value to detect a new pattern of unfair claims. Referring to FIG. 3, the new pattern detection unit 130 is the difference between the error value (NAE Error) of the normal auto encoder and the error value (FAE Error) of the Fraud Auto Encoder (NAE − FAE) can be calculated. The new pattern detection unit 130 may set a critical section for detecting a new pattern prior to detecting the new pattern. Referring to FIG. 4, the critical section may include a normal, a suspected group, and an abnormality, and the new pattern detection unit 130 is a threshold for classifying each of a normal, a suspected group, and an abnormality based on the difference (NAE-FAE). The interval, that is, the range of the threshold value can be set. The threshold section may be set by a user, and a threshold section previously set for each difference (NAE-FAE) may be used. As another example, the threshold section using the difference (NAE-FAE) may be set based on a threshold value calculated as (|NAE-FAE|) 0.1.

도 4를 참조하면, 신규 패턴 검출부(130)는 정상 오토인코더 모델의 에러값과, 이상 오토인코더 모델의 에러값의 차이에 기초하여 임계 구간을 구분하여 라벨링할 수 있다. 또한, 신규 패턴 검출부(130)는, 의심군으로 라벨링된 에러값과 연계된 학습 데이터(또는 특질 변수)로부터 신규 패턴을 검출할 수 있다. 예시적으로 신규 패턴 검출부(130)는 의심군으로 라벨링된 에러값이 상기 임계값((|NAE - FAE|) 0.1)을 초과하는 경우, 상기 에러값과 연계된 특질 변수에 기반하여 신규 패턴으로 정의할 수 있다.Referring to FIG. 4, the new pattern detection unit 130 may classify and label a critical section based on a difference between an error value of a normal autoencoder model and an error value of an abnormal autoencoder model. In addition, the new pattern detection unit 130 may detect a new pattern from learning data (or feature variable) associated with an error value labeled as a suspect group. Exemplarily, when the error value labeled as a suspect group exceeds the threshold value ((|NAE-FAE|) 0.1), the new pattern detection unit 130 generates a new pattern based on the feature variable associated with the error value. Can be defined.

도 5는 본원의 일 실시예에 따른 신규 부당청구 검출 장치의 신규 부당패턴 검출의 예를 도시한 도면이다.5 is a diagram illustrating an example of detection of a new unfair pattern by a new unfair claim detection apparatus according to an embodiment of the present application.

본원의 일 실시예에 따르면, 신규 패턴 검출부(130)는 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류할 수 있다. 구체적으로, 비지도 학습이란 학습용 데이터를 구축하는 것이 아닌 데이터 자체를 분석하거나 군집하면서 학습하는 알고리즘을 의미한다. 이는 공지된 사항이므로 구체적인 설명은 생략한다.According to the exemplary embodiment of the present application, the new pattern detection unit 130 may classify a new pattern of unfair claims based on a clustering algorithm based on unsupervised learning that inputs a feature variable. Specifically, unsupervised learning refers to an algorithm that learns while analyzing or clustering the data itself rather than constructing data for learning. Since this is a known matter, a detailed description will be omitted.

신규 패턴 검출부(130)는 보험청구 내역 데이터의 빈도에 기초하여 특질 변수를 복수개의 청구 패턴으로 군집할 수 있다. 예시적으로, 신규 패턴 검출부(130)는 K-means 클러스터링 알고리즘, SOM(Self-Organizing-Maps) 알고리즘 EM & Canopy 알고리즘 중 적어도 하나의 알고리즘에 기초하여 부당청구의 신규 패턴을 분류할 수 있다. K-means 클러스터링 알고리즘은 전통적인 분류기법으로 대상집단을 거리의 평균값(유사도)을 기준으로 K개의 군집으로 반복 세분화 하는 기법이고, SOM알고리즘은 인공신경망을 기반으로 훈련집합의 입력 패턴을 가중치로 학습하여 군집화하는 기법이다. 또한 EM & Canopy 알고리즘은 주어진 초기값으로 가능성이 최대인 것부터 반복 과정을 통해 파라미터 값을 갱신하여 군집화 하는 기법을 의미한다. The new pattern detection unit 130 may cluster characteristic variables into a plurality of claim patterns based on the frequency of the insurance claim details data. As an example, the new pattern detection unit 130 may classify a new pattern of unfair claims based on at least one of a K-means clustering algorithm and a Self-Organizing-Maps (SOM) algorithm and EM & Canopy algorithm. The K-means clustering algorithm is a traditional classification technique that iteratively subdivides the target group into K clusters based on the mean value (similarity) of the distance, and the SOM algorithm learns the input pattern of the training set with weights based on artificial neural networks. It is a technique of clustering. In addition, the EM & Canopy algorithm refers to a method of clustering by updating parameter values through an iterative process starting from the one with the maximum possibility with a given initial value.

신규 패턴 검출부(130)는 특질 변수의 빈도에 기초하여 상기 군집 알고리즘을 통해 신규 패턴을 검출할 수 있다. 도 2는 특질 변수의 빈도에 따라 군집된 패턴을 나타내며, 서로 다른 패턴에 속한 특질 변수들의 빈도가 유사한 경우, 도2에 도시된 바와 같이 동일 내지 유사한 색(파란색)으로 구분될 수 있다. 즉 패턴 상호간 색이 동일 내지 유사한 경우 군집간 분리도가 낮다고 할 수 있다. 또한, 특질 변수간 유사한 빈도로 군집된 청구 패턴은 정상적인 보험 청구로 인해 발생하는 특질 변수의 빈도에 기초하여 군집된 청구 패턴 즉, 부당청구가 아닌 정상적인 청구 패턴인 것으로 판단할 수 있다.The new pattern detection unit 130 may detect a new pattern through the clustering algorithm based on the frequency of the feature variable. FIG. 2 shows patterns clustered according to the frequency of the feature variables, and when the frequencies of feature variables belonging to different patterns are similar, as shown in FIG. 2, they may be classified into the same or similar colors (blue). That is, when the colors between patterns are the same or similar, it can be said that the degree of separation between clusters is low. In addition, it can be determined that the claim pattern clustered at a similar frequency among characteristic variables is a clustered claim pattern, that is, a normal claim pattern rather than an unfair claim based on the frequency of the characteristic variable generated by normal insurance claim.

한편, 유사한 빈도를 가진 특질 변수들과 다른 빈도를 가진 특질 변수들로 군집된 패턴의 경우 도 5에 도시된 바와 같이 전술한 청구 패턴과는 다른 색(빨간색)으로 구분될 수 있다. 이러한 청구 패턴은 정상적인 청구 패턴의 특질 변수의 빈도와는 다르므로(예를 들어, FP변경횟수가 정상적인 청구 패턴의 특질 변수에 비해 상대적으로 많은 경우), 부당청구의 신규 패턴일 수 있고, 신규 패턴 검출부(130)에 의해 검출 될 수 있다. Meanwhile, in the case of a pattern clustered by feature variables having a similar frequency and feature variables having a different frequency, as shown in FIG. 5, a different color (red) from the aforementioned claim pattern may be used. Since this claim pattern is different from the frequency of the characteristic variable of the normal claim pattern (for example, when the number of FP changes is relatively larger than that of the normal claim pattern), it may be a new pattern of unfair claims, and the new pattern. It can be detected by the detection unit 130.

신규 부당청구 판별부(140)는 신규 패턴을 학습하는 부당청구 탐지 모델에 기초하여 신규 보험청구의 부당청구를 판별할 수 있다. 구체적으로 신규 부당청구 판별부(140)는 지도학습 기반의 분류 알고리즘에 기초한 신규 패턴 학습 모델 및 신규 패턴에 기초하여 신규 보험청구의 부당청구를 판별할 수 있다. 상기 분류 알고리즘은 의사결정 알고리즘을 포함하며 의사 결정 알고리즘은 예를 들어 Decision Tree알고리즘일 수 있으나, 이에 한정되는 것은 아니다. 신규 부당청구 판별부(140)는 부당청구의 신규 패턴, 기분류된 패턴, 및 신규 보험청구의 보험청구 내역 데이터에 기초한 특질 변수를 입력으로 하는 지도학습 기반의 부당청구 탐지 모델을 구축하여 라벨링되지 않은 신규 보험청구 내역의 부당 청구 여부를 판별할 수 있다. The new unfair claim determination unit 140 may determine an unfair claim of a new insurance claim based on an unfair claim detection model for learning a new pattern. Specifically, the new unfair claim determination unit 140 may determine an unfair claim of a new insurance claim based on a new pattern learning model and a new pattern based on a supervised learning-based classification algorithm. The classification algorithm includes a decision algorithm, and the decision algorithm may be, for example, a decision tree algorithm, but is not limited thereto. The new unfair claim determination unit 140 constructs a supervised learning-based unfair claim detection model that inputs a new pattern of unfair claims, a pattern of mood, and a characteristic variable based on the insurance claim details data of the new insurance claim and is not labeled. It is possible to determine whether a new insurance claim is unfairly claimed.

도 6은 본원의 일 실시예에 따른 신규 부당청구 검출 방법의 흐름을 도시한 도면이다.6 is a diagram illustrating a flow of a method for detecting a new unfair claim according to an embodiment of the present application.

도 6에 도시된 신규 부당청구 검출 방법은 앞선 도1 내지 도 5를 통해 설명된 신규 부당청구 검출 장치(100)에 의하여 수행될 수 있다. 따라서 이하 생략된 내용이라고 하더라도 도 1 내지 도 5를 통해 신규 부당청구 검출 장치(100)에 대하여 설명된 내용은 도 6에도 동일하게 적용될 수 있다.The method for detecting a new unfair claim shown in FIG. 6 may be performed by the new unfair claim detection apparatus 100 described with reference to FIGS. 1 to 5 above. Therefore, even if omitted below, the description of the new unfair claim detection apparatus 100 through FIGS. 1 to 5 may be equally applied to FIG. 6.

도 6을 참조하면, 단계 S610에서 데이터 전처리부(110)는 비정형 데이터를 포함하는 보험청구 내역 데이터를 전처리하여 정형화 할 수 있고, 정형화된 보험청구 내역 데이터로부터 특질 변수를 추출할 수 있다. 보험청구 내역 데이터의 정형화는 예를 들어, 고객 데이터인 경우, 고객의 소득 수준, 고객이 방문한 병원의 수, 고객이 신청한 질병 사유의 개수 등을 수치화하는 것을 의미한다.Referring to FIG. 6, in step S610, the data preprocessing unit 110 may pre-process and format insurance claim details data including unstructured data, and may extract characteristic variables from the standardized insurance claim details data. For example, in the case of customer data, the standardization of insurance claim data refers to quantifying the income level of the customer, the number of hospitals visited by the customer, and the number of disease reasons the customer has applied for.

단계 S620에서 모델 구축부(120)는 정상 보험청구 내역 데이터로부터 도출된 정상 특질 변수를 학습하는 정상 오토인코더 모델 및 이상 보험청구 내역 데이터로부터 도출된 이상 특질 변수를 학습하는 이상 오토인코더 모델을 구축할 수 있다. 본원의 일 실시예에 따르면, 데이터 전처리부(110)는 정상 및 이상으로 구분되지 않은 보험청구 내역 데이터의 전처리를 통한 특질 변수를 산출하는 과정에서 정상 보험청구 내역 데이터와 이상 보험청구 내역 데이터를 구분할 수 있다. 구체적으로, 데이터 전처리부(110)는 상술한 보험청구 내역 데이터에 포함된 각 요소(청구 데이터, 계약 데이터 등) 각각을 정형화하고, 상기 요소 각각에 미리 설정된 임계값의 초과 여부에 따라 해당 보험청구 내역 데이터가 정상 보험청구 내역 데이터인지 이상 보험청구 내역 데이터인지 구분할 수 있다. 또한, 모델 구축부(120)는 데이터 전처리부(110)에서 구분된 정상 보험청구 내역 데이터 및 이상 보험청구 내역 데이터로부터 도출된 특질 변수를 학습할 수 있다. 모델 구축부(120)는 비지도 학습 기반의 오토인코더 알고리즘에 기초하여 정상 오토인코더 모델 및 이상 오토인코더 모델을 구축할 수 있다.In step S620, the model building unit 120 builds a normal autoencoder model that learns the normal characteristic variable derived from the normal insurance claim details data and the abnormal autoencoder model that learns the abnormal characteristic variable derived from the abnormal insurance claim details data. I can. According to an embodiment of the present application, the data preprocessing unit 110 may distinguish between normal and abnormal insurance claim details data in the process of calculating characteristic variables through pre-processing of insurance claim details data that are not classified into normal and abnormal. I can. Specifically, the data preprocessing unit 110 standardizes each element (claim data, contract data, etc.) included in the above-described insurance claim detail data, and makes a corresponding insurance claim according to whether or not a preset threshold value is exceeded for each of the elements. It is possible to distinguish whether the historical data is normal insurance claim history data or abnormal insurance claim history data. In addition, the model building unit 120 may learn characteristic variables derived from the normal insurance claim details data and the abnormal insurance claim details data separated by the data preprocessing unit 110. The model building unit 120 may build a normal autoencoder model and an abnormal autoencoder model based on an unsupervised learning-based autoencoder algorithm.

단계 S630에서 신규 패턴 검출부(130)는 정상 오토인코더 모델 및 이상 오토인코더 모델 각각의 에러값으로부터 부당청구의 신규 패턴을 검출할 수 있다. 신규 패턴 검출부(130)는 정상 특질 변수를 학습하는 정상 오토인코더 모델로부터 정상 에러값을 산출할 수 있고, 이상 특질 변수를 학습하는 이상 오토인코더 모벨로부터 이상 에러값을 각각 산출할 수 있다. 신규 패턴 검출부(130)는 정상 에러값과 이상 에러값을 활용하여 부당청구의 신규 패턴을 검출할 수 있다. 신규 패턴 검출부(130)는 정상 에러값 및 이상 에러값의 차이를 부당청구의 신규 패턴 검출에 활용할 수 있다. 도 3을 참조하면, 신규 패턴 검출부(130)는 정상 오토인코더(Normal Auto Encoder)의 에러값(NAE Error)과 이상 오토인코더(Fraud Auto Encoder)의 에러값(FAE Error) 각각의 차이(NAE - FAE)를 산출할 수 있다.In step S630, the new pattern detection unit 130 may detect a new pattern of unfair claims from error values of each of the normal autoencoder model and the abnormal autoencoder model. The new pattern detection unit 130 may calculate a normal error value from the normal autoencoder model for learning the normal feature variable, and may calculate the abnormal error value from the abnormal autoencoder move for learning the abnormal feature variable, respectively. The new pattern detection unit 130 may detect a new pattern of unfair claims by using the normal error value and the abnormal error value. The new pattern detection unit 130 may utilize the difference between the normal error value and the abnormal error value to detect a new pattern of unfair claims. Referring to FIG. 3, the new pattern detection unit 130 is the difference between the error value (NAE Error) of the normal auto encoder and the error value (FAE Error) of the Fraud Auto Encoder (NAE − FAE) can be calculated.

신규 패턴 검출부(130)는 신규 패턴 검출에 앞서, 신규 패턴을 검출하기 위한 임계 구간을 설정할 수 있다. 임계 구간은 정상, 의심군 및 이상을 포함할 수 있으며, 신규 패턴 검출부(130)는 상기 차이(NAE - FAE)를 기준으로, 정상, 의심군, 이상 각각을 구분하는 임계 구간 즉 임계값의 범위를 설정할 수 있다. 상기 임계 구간은 사용자에 의해 설정될 수 있고, 상기 차이(NAE - FAE)별로 과거에 설정된 임계 구간을 활용할 수도 있다. 다른 예로, 상기 차이(NAE - FAE)를 이용한 임계 구간은 (|NAE - FAE|) 0.1로 연산된 임계값에 기초하여 설정될 수 있다.The new pattern detection unit 130 may set a critical section for detecting a new pattern prior to detecting the new pattern. The critical section may include a normal, a suspect group, and an abnormality, and the new pattern detection unit 130 divides each of a normal, a suspect group, and an abnormality based on the difference (NAE-FAE), that is, a range of a threshold value. Can be set. The threshold section may be set by a user, and a threshold section previously set for each difference (NAE-FAE) may be used. As another example, the threshold section using the difference (NAE-FAE) may be set based on a threshold value calculated as (|NAE-FAE|) 0.1.

신규 패턴 검출부(130)는 정상 오토인코더 모델의 에러값과, 이상 오토인코더 모델의 에러값의 차이에 기초하여 임계 구간을 구분하여 라벨링할 수 있다. 또한, 신규 패턴 검출부(130)는, 의심군으로 라벨링된 에러값과 연계된 학습 데이터(또는 특질 변수)로부터 신규 패턴을 검출할 수 있다. 예시적으로 신규 패턴 검출부(130)는 의심군으로 라벨링된 에러값이 상기 임계값((|NAE - FAE|) 0.1)을 초과하는 경우, 상기 에러값과 연계된 특질 변수에 기반하여 신규 패턴으로 정의할 수 있다.The new pattern detection unit 130 may classify and label a critical section based on a difference between an error value of a normal autoencoder model and an error value of an abnormal autoencoder model. In addition, the new pattern detection unit 130 may detect a new pattern from learning data (or feature variable) associated with an error value labeled as a suspect group. Exemplarily, when the error value labeled as a suspect group exceeds the threshold value ((|NAE-FAE|) 0.1), the new pattern detection unit 130 generates a new pattern based on the feature variable associated with the error value. Can be defined.

단계 S640에서, 신규 부당청구 판별부(140)는 신규 패턴을 학습하는 부당청구 탐지 모델에 기초하여 신규 보험청구의 부당청구를 판별할 수 있다. 구체적으로 신규 부당청구 판별부(140)는 지도학습 기반의 분류 알고리즘에 기초한 신규 패턴 학습 모델 및 신규 패턴에 기초하여 신규 보험청구의 부당청구를 판별할 수 있다. 상기 분류 알고리즘은 의사결정 알고리즘을 포함하며 의사 결정 알고리즘은 예를 들어 Decision Tree알고리즘일 수 있으나, 이에 한정되는 것은 아니다. 신규 부당청구 판별부(140)는 부당청구의 신규 패턴, 기분류된 패턴, 및 신규 보험청구의 보험청구 내역 데이터에 기초한 특질 변수를 입력으로 하는 지도학습 기반의 부당청구 탐지 모델을 구축하여 신규 보험청구 내역의 부당 청구 여부를 판별할 수 있다.In step S640, the new unfair claim determination unit 140 may determine the unfair claim of the new insurance claim based on the unfair claim detection model for learning a new pattern. Specifically, the new unfair claim determination unit 140 may determine an unfair claim of a new insurance claim based on a new pattern learning model and a new pattern based on a supervised learning-based classification algorithm. The classification algorithm includes a decision algorithm, and the decision algorithm may be, for example, a decision tree algorithm, but is not limited thereto. The new unfair claim discrimination unit 140 constructs a supervised learning-based unfair claim detection model that inputs a new pattern of unfair claim, a pattern that has been changed, and characteristic variables based on the insurance claim details data of the new insurance claim. It is possible to determine whether the billing details are unfairly billed.

본원의 일 실시 예에 따른, 신규 부당청구 검출 방법은, 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.According to an embodiment of the present disclosure, a method for detecting a new unfair claim may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those produced by a compiler but also high-level language codes that can be executed by a computer using an interpreter or the like. The above-described hardware device may be configured to operate as one or more software modules to perform the operation of the present invention, and vice versa.

전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The foregoing description of the present application is for illustrative purposes only, and those of ordinary skill in the art to which the present application pertains will be able to understand that it is possible to easily transform it into other specific forms without changing the technical spirit or essential features of the present application. Therefore, it should be understood that the embodiments described above are illustrative and non-limiting in all respects. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as being distributed may also be implemented in a combined form.

본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present application is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present application.

100: 신규 부당청구 검출 장치
110: 데이터 전처리부
120: 모델 구축부
130: 신규 패턴 검출부
140: 신규 부당청구 판별부
150: 데이터베이스
100: new unfair claim detection device
110: data preprocessor
120: model building section
130: new pattern detection unit
140: New unfair claim determination unit
150: database

Claims (15)

신규 부당청구 검출 장치에 있어서,
보험청구 내역 데이터를 전처리하여, 인공지능 학습에 요구되는 특질 변수를 도출하여 정제하는 데이터 전처리부;
정상 보험청구 내역 데이터로부터 도출된 정상 특질 변수를 학습하는 정상 오토인코더 모델 및 이상 보험청구 내역 데이터로부터 도출된 이상 특질 변수를 학습하는 이상 오토인코더 모델을 구축하는 모델 구축부;
상기 정상 오토인코더 모델 및 상기 이상 오토인코더 모델 각각의 에러값으로부터 부당청구의 신규 패턴을 검출하는 신규 패턴 검출부; 및
상기 신규 패턴을 학습하는 부당청구 탐지 모델에 기초하여 신규 보험청구의 부당청구를 판별하는 신규 부당청구 판별부를 포함하되,
상기 신규 패턴 검출부는,
신규 패턴을 검출하기 위한 임계 구간을 설정하되, 상기 임계 구간은 정상, 의심군 및 이상을 포함하고,
정상 오토인코더 모델의 에러값과, 이상 오토인코더 모델의 에러값의 차이를 기준으로 상기 임계 구간을 구분하는 임계값의 범위를 설정하고,
상기 정상 오토인코더 모델의 에러값과, 상기 이상 오토인코더 모델의 에러값의 차이가 해당하는 상기 임계 구간에 라벨링을 수행하고,
상기 의심군으로 라벨링된 상기 각각의 에러값 중 상기 임계값을 초과하는 에러값이 존재하는 경우, 상기 임계값을 초과한 에러값과 연계된 특질 변수로부터 상기 신규 패턴을 검출하고,
상기 신규 부당청구 판별부는,
지도학습 기반의 분류 알고리즘에 기초한 상기 신규 패턴 학습 모델 및 상기 신규 패턴에 기초하여 신규 보험청구의 부당청구를 판별하는 것인, 신규 부당청구 검출 장치.
In the new unfair claim detection device,
A data preprocessing unit that pre-processes the insurance claim details data to derive and refine characteristic variables required for artificial intelligence learning;
A model building unit for constructing a normal autoencoder model for learning normal characteristic variables derived from normal insurance claim details data and an abnormal autoencoder model for learning abnormal characteristic variables derived from abnormal insurance claim details data;
A new pattern detection unit detecting a new pattern of unfair claims from an error value of each of the normal autoencoder model and the abnormal autoencoder model; And
Including a new unfair claim determination unit for determining the unfair claim of the new insurance claim based on the unfair claim detection model for learning the new pattern,
The new pattern detection unit,
A critical section for detecting a new pattern is set, wherein the critical section includes a normal, a suspect group, and an abnormality,
Based on the difference between the error value of the normal auto-encoder model and the error value of the abnormal auto-encoder model, set a range of threshold values that divide the critical section,
Labeling is performed in the critical section corresponding to the difference between the error value of the normal autoencoder model and the error value of the abnormal autoencoder model,
If there is an error value exceeding the threshold value among the respective error values labeled as the suspicious group, the new pattern is detected from a feature variable associated with the error value exceeding the threshold value,
The new unfair claim determination unit,
The new pattern learning model based on the supervised learning-based classification algorithm and to determine the unfair claim of a new insurance claim based on the new pattern.
제1항에 있어서,
비정형 데이터를 포함하는 보험청구 내역 데이터를 저장하는 데이터베이스를 더 포함하고,
상기 보험청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함하는 것인, 신규 부당청구 검출 장치.
The method of claim 1,
Further comprising a database for storing insurance claim history data including unstructured data,
The insurance claim detail data includes at least one of claim data, contract data, payment data, insurance agent data, and customer data.
제1항에 있어서,
상기 모델 구축부는,
비지도 학습 기반의 오토인코더 알고리즘에 기초하여 상기 정상 오토인코더 모델 및 상기 이상 오토인코더 모델을 구축하는 것인, 신규 부당청구 검출 장치.
The method of claim 1,
The model building unit,
To construct the normal autoencoder model and the abnormal autoencoder model based on an unsupervised learning-based autoencoder algorithm.
삭제delete 삭제delete 삭제delete 삭제delete 신규 부당청구 검출 장치에 의한 신규 부당청구 검출 방법에 있어서,
보험청구 내역 데이터를 전처리하여, 인공지능 학습에 요구되는 특질 변수를 도출하여 정제하는 단계;
정상 보험청구 내역 데이터로부터 도출된 정상 특질 변수를 학습하는 정상 오토인코더 모델 및 이상 보험청구 내역 데이터로부터 도출된 이상 특질 변수를 학습하는 이상 오토인코더 모델을 구축하는 단계;
상기 정상 오토인코더 모델 및 상기 이상 오토인코더 모델 각각의 에러값으로부터 부당청구의 신규 패턴을 검출하는 단계; 및
상기 신규 패턴을 학습하는 부당청구 탐지 모델에 기초하여 신규 보험청구의 부당청구를 판별하는 단계를 포함하고,
상기 신규 패턴을 검출하는 단계는,
신규 패턴을 검출하기 위한 임계 구간을 설정하되, 상기 임계 구간은 정상, 의심군 및 이상을 포함하고,
정상 오토인코더 모델의 에러값과, 이상 오토인코더 모델의 에러값의 차이를 기준으로 상기 임계 구간을 구분하는 임계값의 범위를 설정하고,
상기 정상 오토인코더 모델의 에러값과, 상기 이상 오토인코더 모델의 에러값의 차이가 해당하는 상기 임계 구간에 라벨링을 수행하고,
상기 의심군으로 라벨링된 상기 각각의 에러값 중 상기 임계값을 초과하는 에러값이 존재하는 경우, 상기 임계값을 초과한 에러값과 연계된 특질 변수로부터 상기 신규 패턴을 검출하고,
상기 신규 보험청구의 부당청구를 판별하는 단계는,
지도학습 기반의 분류 알고리즘에 기초한 신규 패턴 학습 모델 및 상기 신규 패턴에 기초하여 신규 보험청구의 부당청구를 판별하는 것인, 신규 부당청구 검출 방법.
In the method for detecting a new unfair claim by a new unfair claim detection device,
Pre-processing the insurance claim details data, deriving and refining characteristic variables required for artificial intelligence learning;
Constructing a normal autoencoder model for learning a normal characteristic variable derived from the normal insurance claim details data and an abnormal autoencoder model for learning the abnormal characteristic variable derived from the abnormal insurance claim details data;
Detecting a new pattern of unfair claims from error values of each of the normal autoencoder model and the abnormal autoencoder model; And
Including the step of determining an unfair claim of a new insurance claim based on the unfair claim detection model for learning the new pattern,
The step of detecting the new pattern,
A critical section for detecting a new pattern is set, wherein the critical section includes a normal, a suspect group and an abnormality,
Based on the difference between the error value of the normal auto-encoder model and the error value of the abnormal auto-encoder model, set a range of threshold values that divide the critical section
Labeling is performed in the critical section corresponding to the difference between the error value of the normal autoencoder model and the error value of the abnormal autoencoder model,
If there is an error value exceeding the threshold value among the respective error values labeled as the suspicious group, the new pattern is detected from a feature variable associated with the error value exceeding the threshold value,
The step of determining the unfair claim of the new insurance claim,
A new pattern learning model based on a supervised learning-based classification algorithm, and to determine an unfair claim of a new insurance claim based on the new pattern.
제8항에 있어서,
비정형 데이터를 포함하는 보험청구 내역 데이터를 저장하는 단계를 더 포함하고,
상기 보험청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함하는 것인, 신규 부당청구 검출 방법.
The method of claim 8,
Further comprising the step of storing the insurance claim details data including unstructured data,
The insurance claim details data includes at least one of claim data, contract data, payment data, insurance agent data, and customer data.
제8항에 있어서,
상기 모델을 구축하는 단계는,
비지도 학습 기반의 오토인코더 알고리즘에 기초하여 상기 정상 오토인코더 모델 및 이상 오토인코더 모델을 구축하는 것인, 신규 부당청구 검출 방법.
The method of claim 8,
The step of building the model,
To construct the normal autoencoder model and the abnormal autoencoder model based on an unsupervised learning-based autoencoder algorithm, a new unfair claim detection method.
삭제delete 삭제delete 삭제delete 삭제delete 제8항 내지 제10항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터에서 판독 가능한 기록매체.A computer-readable recording medium storing a program for executing the method of claim 8 on a computer.
KR1020190155133A 2019-11-28 2019-11-28 Device and method for detecting new fraudulent claims KR102149542B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190155133A KR102149542B1 (en) 2019-11-28 2019-11-28 Device and method for detecting new fraudulent claims

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190155133A KR102149542B1 (en) 2019-11-28 2019-11-28 Device and method for detecting new fraudulent claims

Publications (1)

Publication Number Publication Date
KR102149542B1 true KR102149542B1 (en) 2020-08-28

Family

ID=72265851

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190155133A KR102149542B1 (en) 2019-11-28 2019-11-28 Device and method for detecting new fraudulent claims

Country Status (1)

Country Link
KR (1) KR102149542B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102352853B1 (en) * 2021-03-12 2022-01-18 주식회사 피엔피플래닝 Methof for determining valid order and computing device for executing the method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190063175A (en) * 2017-11-29 2019-06-07 (주)위세아이텍 Device and method for new unfair claim pattern analysis based on artificial intelligence

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190063175A (en) * 2017-11-29 2019-06-07 (주)위세아이텍 Device and method for new unfair claim pattern analysis based on artificial intelligence

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102352853B1 (en) * 2021-03-12 2022-01-18 주식회사 피엔피플래닝 Methof for determining valid order and computing device for executing the method

Similar Documents

Publication Publication Date Title
KR102153912B1 (en) Device and method for insurance unfair claim and unfair pattern detection based on artificial intelligence
KR102085814B1 (en) Device and method for new unfair claim pattern analysis based on artificial intelligence
Sivasankar et al. Hybrid PPFCM-ANN model: an efficient system for customer churn prediction through probabilistic possibilistic fuzzy clustering and artificial neural network
Mohammadi et al. Customer credit risk assessment using artificial neural networks
WO2011133814A2 (en) Automatic rule discovery from large-scale datasets to detect payment card fraud using classifiers
US20200286095A1 (en) Method, apparatus and computer programs for generating a machine-learning system and for classifying a transaction as either fraudulent or genuine
Li et al. Exception prioritization in the continuous auditing environment: A framework and experimental evaluation
Darwish An intelligent credit card fraud detection approach based on semantic fusion of two classifiers
JP7009658B2 (en) Malicious delinquency detection device and method based on artificial intelligence
Moustakidis et al. A novel feature extraction methodology using Siamese convolutional neural networks for intrusion detection
KR102149542B1 (en) Device and method for detecting new fraudulent claims
Liu et al. RS-HeRR: a rough set-based Hebbian rule reduction neuro-fuzzy system
Bui-Thi et al. Clustering association rules to build beliefs and discover unexpected patterns
Li et al. Using known nonself samples to improve negative selection algorithm
Baumann Improving a rule-based fraud detection system with classification based on association rule mining
JP6821885B1 (en) Artificial intelligence-based insurance claim detection device and method
US8078559B2 (en) System and method for the automated discovery of unknown unknowns
Cateni Improving the stability of wrapper variable selection applied to binary classification
KR20200010621A (en) Device and method for insurance unfair claim and unfair pattern detection based on artificial intelligence
Hajizadeh et al. Nearest neighbor classification with locally weighted distance for imbalanced data
Kalutharage et al. Explainable AI and Deep Autoencoders Based Security Framework for IoT Network Attack Certainty
Subudhi et al. A hybrid mobile call fraud detection model using optimized fuzzy C-means clustering and group method of data handling-based network
López et al. Cost Sensitive and Preprocessing for Classification with Imbalanced Data-sets: Similar Behaviour and Potential Hybridizations.
US20060112048A1 (en) System and method for the automated discovery of unknown unknowns
Padhi et al. Use of data mining techniques for data balancing and fraud detection in automobile insurance claims

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant