KR20190063175A - 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법 - Google Patents

인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법 Download PDF

Info

Publication number
KR20190063175A
KR20190063175A KR1020170162068A KR20170162068A KR20190063175A KR 20190063175 A KR20190063175 A KR 20190063175A KR 1020170162068 A KR1020170162068 A KR 1020170162068A KR 20170162068 A KR20170162068 A KR 20170162068A KR 20190063175 A KR20190063175 A KR 20190063175A
Authority
KR
South Korea
Prior art keywords
pattern
new
unjust
data
new pattern
Prior art date
Application number
KR1020170162068A
Other languages
English (en)
Other versions
KR102085814B1 (ko
Inventor
김지혁
이지현
Original Assignee
(주)위세아이텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)위세아이텍 filed Critical (주)위세아이텍
Priority to KR1020170162068A priority Critical patent/KR102085814B1/ko
Publication of KR20190063175A publication Critical patent/KR20190063175A/ko
Application granted granted Critical
Publication of KR102085814B1 publication Critical patent/KR102085814B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

신규 부당청구 패턴 분석 장치 및 방법이 개시되며, 본원의 일 실시예에 따른 신규 부당청구 패턴 분석 장치는, 보험청구 내역 데이터를 정형화하여 특질 변수를 도출하는 데이터 전처리부, 상기 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류하는 부당청구 패턴 분류부, 지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 모형을 구축하는 판별 모형 구축부 및 상기 신규 패턴 판별 모형에 기초하여 신규 청구에 대한 신규 패턴을 판별하는 신규 패턴 판별부를 포함할 수 있다.

Description

인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법{DEVICE AND METHOD FOR NEW UNFAIR CLAIM PATTERN ANALYSIS BASED ON ARTIFICIAL INTELLIGENCE}
본원은 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법에 관한 것이다.
기존의 보험사기 방지시스템은 비즈니스 룰 기반으로 청구된 보험 사건에 대해 심사자의 경험과 지식을 바탕으로 룰을 도출하는 방법으로 조사대상 룰과 조사대상 제외 룰로 구분하여 산출하고 있다 그러나 보험사기는 점점 지능화 및 고도화됨에 따라 새로운 부당청구 패턴 내지 사기패턴에 대한 지속적인 갱신이 필요하다.
또한 보험회사는 보험사기에 대해 아무런 조치도 취하지 않은 채 보험금 누수를 방치할 수도 없고, 보험사기를 완전히 밝혀낸다는 목적 하에 무한대의 조사비용을 지출할 수도 없다. 이에 보험회사는 보험사기로부터 누수보험금을 줄이는 한편 지나치게 많은 조사비용을 지출하지 않는 적정한 선에서 조사노력의 수준을 결정할 필요가 있다.
본원의 배경이 되는 기술은 한국등록특허공보 제10-0862181호에 개시되어 있다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 보험금 부당청구의 신규 패턴을 판별할 수 있는 판별 모형을 제공하는 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법을 제공하는 것을 목적으로 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 부당청구 데이터를 학습하여 새로운 부당청구 패턴을 분석하고, 신규 청구건에 대한 청구 패턴 유형을 판별할 수 있는 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법을 제공하는 것을 목적으로 한다.
다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들도 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 신규 부당청구 패턴 분석 장치는 보험청구 내역 데이터를 정형화하여 특질 변수를 도출하는 데이터 전처리부, 상기 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류하는 부당청구 패턴 분류부, 지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 모형을 구축하는 판별 모형 구축부 및 상기 신규 패턴 판별 모형에 기초하여 신규 청구의 패턴 유형을 판별하는 신규 패턴 판별부를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 보험청구 내역 데이터, 상기 특질 변수 및 상기 신규 패턴 중 적어도 하나를 기록하는 데이터베이스를 더 포함하고, 상기 부당청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 부당청구 패턴 분류부는, 상기 특질 변수의 빈도에 기초하여 상기 군집 알고리즘을 통해 상기 특질 변수를 복수개의 청구 패턴으로 군집하고, 상기 청구 패턴의 군집간 분리도에 기초하여 상기 신규 패턴을 검출할 수 있다.
본원의 일 실시예에 따르면, 상기 부당청구 패턴 분류부는, 상기 신규 패턴 상호간의 유사도에 기초하여 상기 신규 패턴을 복수개의 유사 패턴 그룹으로 분류할 수 있다.
본원의 일 실시예에 따르면, 상기 부당청구 패턴 분류부는, 상기 신규 패턴 각각과 연계된 특질 변수 중 상기 특질 변수 각각에 미리 설정된 임계값 이상의 특질 변수의 수에 기초하여 상기 패턴 그룹의 위험 수준을 설정할 수 있다.
본원의 일 실시예에 따르면, 상기 판별 모형 구축부는, 상기 위험 수준별로 상기 패턴 그룹에 포함된 상기 신규 패턴을 입력으로 하는 의사결정 알고리즘에 기초하여 신규 패턴 판별 규칙을 학습하고, 상기 신규 패턴 판별 규칙을 포함하는 상기 신규 패턴 판별 모형을 구축할 수 있다.
본원의 일 실시예에 따르면, 상기 신규 패턴 판별부는, 상기 신규 패턴 판별 규칙에 기초하여 상기 신규 청구가 정상 청구 패턴, 부당청구 패턴 및 신규 패턴 중 어떠한 패턴 유형인지 판별할 수 있다.
본원의 일 실시예에 따른 신규 부당청구 패턴 분석 방법은, 보험청구 내역 데이터를 정형화하여 특질 변수를 도출하는 단계, 상기 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류하는 단계, 지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 모형을 구축하는 단계 및 상기 신규 패턴 판별 모형에 기초하여 신규 청구에 대한 신규 패턴을 판별하는 단계를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 부당청구 내역 데이터, 상기 특질 변수 및 상기 신규 패턴 중 적어도 하나를 기록하는 단계를 더 포함하고, 상기 부당청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 부당청구의 신규 패턴을 분류하는 단계는, 상기 특질 변수의 빈도에 기초하여 상기 군집 알고리즘을 통해 상기 특질 변수를 복수개의 청구 패턴으로 군집하고, 상기 청구 패턴의 군집간 분리도에 기초하여 상기 신규 패턴을 검출할 수 있다.
본원의 일 실시예에 따르면, 상기 부당청구의 신규 패턴을 분류하는 단계는, 상기 신규 패턴 상호간의 유사도에 기초하여 상기 신규 패턴을 복수개의 유사 패턴 그룹으로 분류할 수 있다.
본원의 일 실시예에 따르면, 상기 부당청구의 신규 패턴을 분류하는 단계는, 상기 신규 패턴 각각과 연계된 특질 변수 중 상기 특질 변수 각각에 미리 설정된 임계값 이상의 특질 변수의 수에 기초하여 상기 패턴 그룹의 위험 수준을 설정할 수 있다.
본원의 일 실시예에 따르면, 상기 신규 패턴 판별 모형을 구축하는 단계는, 상기 위험 수준별로 상기 패턴 그룹에 포함된 상기 신규 패턴을 입력으로 하는 의사결정 알고리즘에 기초하여 신규 패턴 판별 규칙을 학습하고, 상기 신규 패턴 판별 규칙을 포함하는 상기 신규 패턴 판별 모형을 구축할 수 있다.
본원의 일 실시예에 따르면, 상기 신규 패턴을 판별하는 단계는, 상기 신규 패턴 판별 규칙에 기초하여 상기 신규 청구가 정상 청구 패턴, 부당청구 패턴 및 신규 패턴 중 어떠한 패턴 유형인지 판별할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 보험금 부당청구의 신규 패턴을 판별할 수 있는 판별 모형을 제공하는 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법을 제공할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 부당청구 데이터를 학습하여 새로운 부당청구 패턴을 분석하고, 신규 청구건에 대한 패턴 유형을 판별할 수 있는 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법을 제공할 수 있다.
도 1은 본원의 일 실시예에 따른 신규 부당청구 패턴 분석 장치의 구성을 도시한 도면이다.
도 2는 본원의 일 실시예에 따른 신규 부당 청구 패턴 분석 장치의 신규 패턴 검출의 예를 도시한 도면이다.
도 3은 본원의 일 실시예에 따른 신규 부당 청구 패턴 분석 장치의 유사 패턴 그룹 분류의 예를 도시한 도면이다.
도 4는 본원의 일 실시예에 따른 신규 부당 청구 패턴 분석 방법의 흐름을 도시한 도면이다.
아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
도 1은 본원의 일 실시예에 따른 신규 부당청구 패턴 분석 장치의 구성을 도시한 도면이다. 도 1을 참조하면, 신규 부당청구 패턴 분석 장치(100)는 데이터 전처리부(110), 부당청구 패턴 분류부(120), 판별 모형 구축부(130), 신규 패턴 판별부(140) 및 데이터베이스(150)를 포함할 수 있다. 데이터 전처리부(110)는 신규 부당청구의 패턴 분석 대상인 보험청구 내역 데이터를 정형화하여 특질 변수를 도출할 수 있다.
후술하는 설명은 보험금의 부당청구 뿐만 아니라 보조금, 지원금, 보증금 등의 부당청구를 포함하는 것은 자명하나, 설명의 편의를 위해 보험금 부당청구를 중심으로 설명한다. 상기 보험청구 내역 데이터는 예시적으로, 보험금을 청구한 청구 데이터, 보험 또는 보조금 관련 계약 데이터, 보험금의 지급 데이터, 보험 설계사 데이터, 고객 데이터 및 보험사기 적발 결과 데이터 중 적어도 하나를 포함할 수 있다. 데이터 전처리부(110)는 상기 보험청구 내역 데이터를 정형화하여 특질 변수를 도출할 수 있다. 보험청구 내역 데이터의 정형화는 예를 들어, 고객 데이터인 경우, 고객의 소득 수준, 고객이 방문한 병원의 수, 고객이 신청한 질병 사유의 개수 등을 수치화하는 것을 의미한다. 또한 데이터 전처리부(110)에 의해 도출되는 특질 변수는 보험금 청구와 관련되어 수치화된 값을 가질 수 있는 변수로, 예를 들어, 고객 ID 번호, 보험사기자 여부, 동일 병명으로 중복 신청한 개수, 계약 체결 년월 개수, 하루최대 계약 개수, 지불 승인된 증권 개수, 지불 신청한 증권 개수, 고객이 체결한 증권 개수, 보장성 보험 청구 횟수, 신용 등급 변화량, 가입한 계약의 종류, 유의 병원 방문 총 횟수, 고객이 신청한 질병 사유의 개수, 고객이 만난 의사의 명수, 고객이 방문한 병원의 개수, 유효 입/통원 총 일수, 진료 과목 개수, 고객 소득 수준, FP(Financial Planner) 변경 횟수, 실손 처리 개수, 사기 FP 계약 개수 중 적어도 하나를 포함할 수 있다. 데이터베이스(150)는 보험청구 내역 데이터, 상기 특질 변수 및 상기 신규 패턴 중 적어도 하나를 기록할 수 있다. 또한, 데이터베이스(150)는 정상적인 청구 패턴을 저장할 수 있다.
부당청구 패턴 분류부(120)는 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류할 수 있다. 비지도 학습이란 학습용 데이터를 구축하는 것이 아닌 데이터 자체를 분석하거나 군집하면서 학습하는 알고리즘을 의미한다. 이는 공지된 사항이므로 구체적인 설명은 생략한다. 부당 청구 패턴 분류부(120)는 보험청구 내역 데이터의 빈도에 기초하여 특질 변수를 복수개의 청구 패턴으로 군집할 수 있다. 예시적으로, 부당 청구 패턴 분류부(120)는 K-means 클러스터링 알고리즘, SOM(Self-Organizing-Maps) 알고리즘 EM & Canopy 알고리즘 중 적어도 하나의 알고리즘에 기초하여 부당청구의 신규 패턴을 분류할 수 있다. K-means 클러스터링 알고리즘은 전통적인 분류기법으로 대상집단을 거리의 평균값(유사도)을 기준으로 K개의 군집으로 반복 세분화 하는 기법이고, SOM알고리즘은 인공신경망을 기반으로 훈련집합의 입력 패턴을 가중치로 학습하여 군집화하는 기법이다. 또한 EM & Canopy 알고리즘은 주어진 초기값으로 가능성이 최대인 것부터 반복 과정을 통해 파라미터 값을 갱신하여 군집화 하는 기법을 의미한다.
부당청구 패턴 분류부(120)는 상기 특질 변수의 빈도에 기초하여 상기 군집 알고리즘을 통해 상기 특질 변수를 복수개의 청구 패턴으로 군집할 수 있다. 즉 청구 패턴은 동질성 있는 특질 변수들의 군집일 수 있다. 또한, 청구 패턴의 군집간 분리도 즉 군집간 거리에 기초하여 상기 신규 패턴을 검출할 수 있다.
도 2는 본원의 일 실시예에 따른 신규 부당 청구 패턴 분석 장치의 신규 패턴 검출의 예를 도시한 도면이다. 도 2는 특질 변수의 빈도에 따라 군집된 청구 패턴을 나타내며, 서로 다른 청구 패턴에 속한 특질 변수들의 빈도가 유사한 경우, 도2에 도시된 바와 같이 동일 내지 유사한 색(파란색)으로 구분될 수 있다. 즉 청구 패턴 상호간 색이 동일 내지 유사한 경우 군집간 분리도가 낮다고 할 수 있다. 또한, 특질 변수간 유사한 빈도로 군집된 청구 패턴은 정상적인 보험 청구로 인해 발생하는 특질 변수의 빈도에 기초하여 군집된 청구 패턴 즉, 부당청구가 아닌 정상적인 청구 패턴인 것으로 판단할 수 있다.
한편, 유사한 빈도를 가진 특질 변수들과 다른 빈도를 가진 특질 변수들로 군집된 청구 패턴의 경우 도 2에 도시된 바와 같이 전술한 청구 패턴과는 다른 색(빨간색)으로 구분될 수 있다. 이러한 청구 패턴은 정상적인 청구 패턴의 특질 변수의 빈도와는 다르므로(예를 들어, FP변경횟수가 정상적인 청구 패턴의 특질 변수에 비해 상대적으로 많은 경우), 부당청구의 신규 패턴일 수 있고, 부당청구 패턴 분류부(120)에 의해 검출 될 수 있다.
도 3은 본원의 일 실시예에 따른 신규 부당 청구 패턴 분석 장치의 유사 패턴 그룹 분류의 예를 도시한 도면이다.
부당청구 패턴 분류부(120)는 신규 패턴 상호간의 유사도에 기초하여 상기 신규 패턴을 복수개의 유사 패턴 그룹으로 분류할 수 있다. 신규 패턴 상호간의 유사도는 전술한 군집 알고리즘에 기초하여 연산될 수 있으므로 중복되는 설명은 생략한다. 도 3은 신규 패턴 상호간의 유사도에 기초하여 7개의 유사 패턴 그룹으로 분류된 예를 도시한다. 상기 유사 패턴 그룹의 수는 신규 패턴 상호간의 유사도에 따라 변화될 수 있음은 자명하다. 또한, 부당청구 패턴 분류부(120)는 상기 신규 패턴 각각과 연계된 특질 변수 중 상기 특질 변수 각각에 미리 설정된 임계값 이상의 특질 변수의 수에 기초하여 상기 패턴 그룹의 위험 수준을 설정할 수 있다. 예시적으로 상기 위험 수준은 도 3에 도시된 바와 같이 주의군, 저위험군, 중위험군 및 고위험군으로 구분될 수 있으나 이에 한정되는 것은 아니다. 즉, 고위험군으로 분류된 패턴 그룹의 경우, 임계값 이상의 특질 변수가 많은 신규 패턴들을 포함하는 패턴 그룹일 가능성이 높다고 할 수 있다.
판별 모형 구축부(130)는 지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 모형을 구축할 수 있다. 지도 학습이란, 미리 구축된 학습용 데이터(training data)를 활용하여 모델을 학습하는 것을 의미한다. 또한 의사 결정 알고리즘은 예를 들어 Decision Tree알고리즘을 포함할 수 있으나 이에 한정되는 것은 아니다.
판별 모형 구축부(130)는 위험 수준이 설정된 패턴 그룹으로 분류된 상기 청구 패턴을 입력으로 하는 의사결정 알고리즘에 기초하여 신규 패턴 판별 규칙을 학습할 수 있다. 또한, 판별 모형 구축부(130)는 신규 패턴 판별 규칙을 포함하는 신규 부당청구 패턴 판별 모형을 구축할 수 있다. 전술한 비지도 학습 기반의 신규 패턴 분류는 단순히 빈도에 기초하여 신규 패턴을 분류할 수는 있으나, 어떠한 변수에 의해 분류되었는지는 알 수 없다. 따라서 지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 규칙을 학습할 수 있다.
상기 신규 패턴 판별 규칙이란, 임계값 이상의 특질 변수에 기초하여 청구 패턴을 신규 패턴으로 판별할 수 있는 규칙을 의미한다. 또한 이러한 신규 패턴 판별 규칙을 종합하여 판별 모형 구축부(130)에 의해 신규 패턴 판별 모형으로 구축될 수 있다. 상기 고위험군으로 설정된 패턴 그룹의 신규 패턴들은 미리 설정된 임계값 이상의 특질 변수를 가질 확률이 다른 위험군에 비해 상대적으로 높은 것은 자명하다. 그러나, 저위험군의 패턴 그룹이라고 하더라도 부당청구의 여지가 있는 특질 변수(즉, 미리 설정된 임계값 이상의 특질 변수)를 가질 확률이 없지 않기 때문에, 모든 위험 수준 별 패턴 그룹에 포함된 신규 패턴을 입력으로 하여 신규 패턴 판별 규칙이 학습될 수 있다. 또한, 신규 패턴 판별 규칙의 학습은 특질 변수의 중요도가 고려될 수 있다. 즉, 다양한 특질 변수 중에도 부당 청구의 위험성이 높은 특질 변수의 경우, 상대적으로 높은 중요도를 가질 수 있으며, 신규 패턴 판별 규칙의 학습 시 이러한 특질 변수의 중요도가 고려될 수 있다. 예를 들어, 특질 변수 중 유의 병원 방문 총 횟수는 고객이 만난 의사의 명수보다 높은 중요도가 부여될 수 있다. 판별 모형 구축부(130)는 특질 변수의 중요도를 고려함으로써 보다 정확한 신규 패턴 판별 모형을 구축할 수 있다.
신규 패턴 판별부(140)는 상기 신규 패턴 판별 모형에 기초하여 신규 청구의 패턴 유형을 판별할 수 있다. 신규 패턴 판별부(140)는 신규 패턴 판별 규칙에 기초하여 상기 신규 청구가 정상 청구 패턴, 부당청구 패턴 및 신규 패턴 중 어떠한 패턴 유형인지 판별할 수 있다. 다시 말해, 구축된 신규 패턴 판별 모형에 신규 청구의 특질 변수를 입력하여, 정상으로 판단된 청구 패턴인지 부당청구로 판단된 패턴인지 새로운 부당청구의 신규 패턴인지 패턴의 유형을 판별할 수 있다. 또한, 상기 신규 청구가 부당청구로 판단된 패턴 및 부당청구의 신규 패턴으로 판단된 경우, 부당청구 판단의 요인(즉, 특질 변수)으로 작용한 특질 변수를 검출할 수 있다.
예시적으로, 신규 청구 중 건강보험의 분포가 다수이고, 수진자의 나이가 20대 중반이며, 여성이 다수인 특질 변수일 때, 초진 진찰 및 재진 진찰이 높은 분포를 보이는 경우, 유의 해야할 부당 청구의 패턴으로 판단될 수 있다. 또한, 초진에 비해 재진의 비율이 상대적으로 높은 경우 치료, 시술, 수술 전 부당 청구의 패턴으로 판단할 수 있다.
도 4는 본원의 일 실시예에 따른 신규 부당 청구 패턴 분석 방법의 흐름을 도시한 도면이다.
도 4에 도시된 신규 부당 청구 패턴 분석 방법은 앞선 도1 내지 도 3을 통해 설명된 신규 부당 청구 패턴 분석 장치에 의하여 수행될 수 있다. 따라서 이하 생략된 내용이라고 하더라도 도 1 내지 도 3을 통해 신규 부당 청구 패턴 분석 장치에 대하여 설명된 내용은 도 4에도 동일하게 적용될 수 있다.
도 4를 참조하면, 단계 S410에서 데이터 전처리부(110)는 보험청구 내역 데이터를 정형화하여 특질 변수를 도출할 수 있다. 본원의 일 실시예에 따르면, 데이터베이스(150)는 상기 부당청구 내역 데이터, 상기 특질 변수 및 상기 신규 패턴 중 적어도 하나를 기록할 수 있다. 또한, 데이터베이스(150)는 정상적인 청구 패턴을 저장할 수 있다. 상기 부당청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함할 수 있다. 보험청구 내역 데이터의 정형화는 예를 들어, 고객 데이터인 경우, 고객의 소득 수준, 고객이 방문한 병원의 수, 고객이 신청한 질병 사유의 개수 등을 수치화하는 것을 의미한다. 또한 데이터 전처리부(110)에 의해 도출되는 특질 변수는 보험금 청구와 관련되어 수치화된 값을 가질 수 있는 변수를 의미한다.
단계 S420에서 부당청구 패턴 분류부(120)는 상기 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류할 수 있다. 부당 청구 패턴 분류부(120)는 보험청구 내역 데이터의 빈도에 기초하여 특질 변수를 복수개의 청구 패턴으로 군집할 수 있다. 예시적으로, 부당 청구 패턴 분류부(120)는 K-means 클러스터링 알고리즘, SOM(Self-Organizing-Maps) 알고리즘 EM & Canopy 알고리즘 중 적어도 하나의 알고리즘에 기초하여 부당청구의 신규 패턴을 분류할 수 있다. 부당청구 패턴 분류부(120)는 상기 특질 변수의 빈도에 기초하여 상기 군집 알고리즘을 통해 상기 특질 변수를 복수개의 청구 패턴으로 군집할 수 있다. 즉 청구 패턴은 동질성 있는 특질 변수들의 군집일 수 있다. 또한, 청구 패턴의 군집간 분리도 즉 군집간 거리에 기초하여 상기 신규 패턴을 검출할 수 있다.
또한, 부당청구 패턴 분류부(120)는 신규 패턴 상호간의 유사도에 기초하여 상기 신규 패턴을 복수개의 유사 패턴 그룹으로 분류할 수 있다. 신규 패턴 상호간의 유사도는 전술한 군집 알고리즘에 기초하여 연산될 수 있으므로 중복되는 설명은 생략한다.
단계 S430에서 판별 모형 구축부(130)는 지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 모형을 구축할 수 있다. 의사 결정 알고리즘은 예를 들어 Decision Tree알고리즘을 포함할 수 있으나 이에 한정되는 것은 아니다. 판별 모형 구축부(130)는 위험 수준이 설정된 패턴 그룹으로 분류된 상기 청구 패턴을 입력으로 하는 의사결정 알고리즘에 기초하여 신규 패턴 판별 규칙을 학습할 수 있다. 또한, 판별 모형 구축부(130)는 신규 패턴 판별 규칙을 포함하는 신규 부당청구 패턴 판별 모형을 구축할 수 있다. 신규 패턴 판별 규칙의 학습은 특질 변수의 중요도가 고려될 수 있다. 즉, 다양한 특질 변수 중에도 부당 청구의 위험성이 높은 특질 변수의 경우, 상대적으로 높은 중요도를 가질 수 있으며, 신규 패턴 판별 규칙의 학습 시 이러한 특질 변수의 중요도가 고려될 수 있다. 예를 들어, 특질 변수 중 유의 병원 방문 총 횟수는 고객이 만난 의사의 명수보다 높은 중요도가 부여될 수 있다. 판별 모형 구축부(130)는 특질 변수의 중요도를 고려함으로써 보다 정확한 신규 패턴 판별 모형을 구축할 수 있다.
단계 S440에서 신규 패턴 판별부(140)는 상기 신규 패턴 판별 모형에 기초하여 신규 청구의 패턴 유형을 판별할 수 있다. 신규 패턴 판별부(140)는 신규 패턴 판별 규칙에 기초하여 상기 신규 청구가 정상 청구 패턴, 부당청구 패턴 및 신규 패턴 중 어떠한 패턴 유형인지 판별할 수 있다. 다시 말해, 구축된 신규 패턴 판별 모형에 신규 청구의 특질 변수를 입력하여, 정상으로 판단된 청구 패턴인지 부당청구로 판단된 패턴인지 새로운 부당청구의 신규 패턴인지 패턴의 유형을 판별할 수 있다. 또한, 상기 신규 청구가 부당청구로 판단된 패턴 및 부당청구의 신규 패턴으로 판단된 경우, 부당청구 판단의 요인(즉, 특질 변수)으로 작용한 특질 변수를 검출할 수 있다.
본원의 일 실시 예에 따른, 신규 부당청구 패턴 분석 방법은, 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.
100: 신규 부당청구 패턴 분석 장치
110: 데이터 전처리부
120: 부당청구 패턴 분류부
130: 판별 모형 구축부
140: 신규 패턴 판별부
150: 데이터베이스

Claims (15)

  1. 신규 부당청구 패턴 분석 장치에 있어서,
    보험청구 내역 데이터를 정형화하여 특질 변수를 도출하는 데이터 전처리부;
    상기 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류하는 부당청구 패턴 분류부;
    지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 모형을 구축하는 판별 모형 구축부; 및
    상기 신규 패턴 판별 모형에 기초하여 신규 청구의 패턴 유형을 판별하는 신규 패턴 판별부를 포함하는 신규 부당청구 패턴 분석 장치.
  2. 제1항에 있어서,
    상기 보험청구 내역 데이터, 상기 특질 변수 및 상기 신규 패턴 중 적어도 하나를 기록하는 데이터베이스를 더 포함하고,
    상기 부당청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함하는 것인, 신규 부당청구 패턴 분석 장치
  3. 제1항에 있어서,
    상기 부당청구 패턴 분류부는,
    상기 특질 변수의 빈도에 기초하여 상기 군집 알고리즘을 통해 상기 특질 변수를 복수개의 청구 패턴으로 군집하고,
    상기 청구 패턴의 군집간 분리도에 기초하여 상기 신규 패턴을 검출하는 것인, 신규 부당청구 패턴 분석 장치.
  4. 제3항에 있어서,
    상기 부당청구 패턴 분류부는,
    상기 신규 패턴 상호간의 유사도에 기초하여 상기 신규 패턴을 복수개의 유사 패턴 그룹으로 분류하는 것인, 신규 부당청구 패턴 분석 장치.
  5. 제4항에 있어서,
    상기 부당청구 패턴 분류부는,
    상기 신규 패턴 각각과 연계된 특질 변수 중 상기 특질 변수 각각에 미리 설정된 임계값 이상의 특질 변수의 수에 기초하여 상기 패턴 그룹의 위험 수준을 설정하는 것인, 신규 부당청구 패턴 분석 장치.
  6. 제5항에 있어서,
    상기 판별 모형 구축부는,
    상기 위험 수준별로 상기 패턴 그룹에 포함된 상기 신규 패턴을 입력으로 하는 의사결정 알고리즘에 기초하여 신규 패턴 판별 규칙을 학습하고, 상기 신규 패턴 판별 규칙을 포함하는 상기 신규 패턴 판별 모형을 구축하는 것인, 신규 부당청구 패턴 분석 장치.
  7. 제6항에 있어서,
    상기 신규 패턴 판별부는,
    상기 신규 패턴 판별 규칙에 기초하여 상기 신규 청구가 정상 청구 패턴, 부당청구 패턴 및 신규 패턴 중 어떠한 패턴 유형인지 판별하는 것인, 신규 부당청구 패턴 분석 장치.
  8. 신규 부당청구 패턴 분석 방법에 있어서,
    보험청구 내역 데이터를 정형화하여 특질 변수를 도출하는 단계;
    상기 특질 변수를 입력으로 하는 비지도 학습 기반의 군집 알고리즘에 기초하여 부당청구의 신규 패턴을 분류하는 단계;
    지도 학습 기반의 의사결정 알고리즘에 기초하여 신규 패턴 판별 모형을 구축하는 단계; 및
    상기 신규 패턴 판별 모형에 기초하여 신규 청구의 패턴 유형을 판별하는 단계를 포함하는 신규 부당청구 패턴 분석 방법.
  9. 제8항에 있어서,
    상기 부당청구 내역 데이터, 상기 특질 변수 및 상기 신규 패턴 중 적어도 하나를 기록하는 단계를 더 포함하고,
    상기 부당청구 내역 데이터는 청구 데이터, 계약 데이터, 지급 데이터, 보험설계사 데이터, 고객 데이터 중 적어도 하나를 포함하는 것인, 신규 부당청구 패턴 분석 방법.
  10. 제8항에 있어서,
    상기 부당청구의 신규 패턴을 분류하는 단계는,
    상기 특질 변수의 빈도에 기초하여 상기 군집 알고리즘을 통해 상기 특질 변수를 복수개의 청구 패턴으로 군집하고,
    상기 청구 패턴의 군집간 분리도에 기초하여 상기 신규 패턴을 검출하는 것인, 신규 부당청구 패턴 분석 방법.
  11. 제10항에 있어서,
    상기 부당청구의 신규 패턴을 분류하는 단계는,
    상기 신규 패턴 상호간의 유사도에 기초하여 상기 신규 패턴을 복수개의 유사 패턴 그룹으로 분류하는 것인, 신규 부당청구 패턴 분석 방법.
  12. 제11항에 있어서,
    상기 부당청구의 신규 패턴을 분류하는 단계는,
    상기 신규 패턴 각각과 연계된 특질 변수 중 상기 특질 변수 각각에 미리 설정된 임계값 이상의 특질 변수의 수에 기초하여 상기 패턴 그룹의 위험 수준을 설정하는 것인, 신규 부당청구 패턴 분석 방법.
  13. 제12항에 있어서,
    상기 신규 패턴 판별 모형을 구축하는 단계는,
    상기 위험 수준별로 상기 패턴 그룹에 포함된 상기 신규 패턴을 입력으로 하는 의사결정 알고리즘에 기초하여 신규 패턴 판별 규칙을 학습하고, 상기 신규 패턴 판별 규칙을 포함하는 상기 신규 패턴 판별 모형을 구축하는 것인, 신규 부당청구 패턴 분석 방법.
  14. 제13항에 있어서,
    상기 패턴 유형을 판별하는 단계는,
    상기 신규 패턴 판별 규칙에 기초하여 상기 신규 청구가 정상 청구 패턴, 부당청구 패턴 및 신규 패턴 중 어떠한 패턴 유형인지 판별하는 것인, 신규 부당청구 패턴 분석 방법.
  15. 제8항 내지 제14항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터에서 판독 가능한 기록매체.
KR1020170162068A 2017-11-29 2017-11-29 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법 KR102085814B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170162068A KR102085814B1 (ko) 2017-11-29 2017-11-29 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170162068A KR102085814B1 (ko) 2017-11-29 2017-11-29 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190063175A true KR20190063175A (ko) 2019-06-07
KR102085814B1 KR102085814B1 (ko) 2020-03-06

Family

ID=66849677

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170162068A KR102085814B1 (ko) 2017-11-29 2017-11-29 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102085814B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102149541B1 (ko) * 2019-11-28 2020-08-28 (주)위세아이텍 보험금 부당청구 패턴 탐지를 위한 음성 데이터의 변수 도출 장치 및 방법
KR102149542B1 (ko) * 2019-11-28 2020-08-28 (주)위세아이텍 신규 부당청구 검출 장치 및 방법
US20220028006A1 (en) * 2018-12-27 2022-01-27 Futurity Group, Inc. Systems, methods, and platforms for automated quality management and identification of errors, omissions and/or deviations in coordinating services and/or payments responsive to requests for coverage under a policy
US11816741B2 (en) 2021-02-09 2023-11-14 Futurity Group, Inc. Automatically labeling data using natural language processing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070082711A (ko) * 2006-02-17 2007-08-22 동부화재해상보험 주식회사 가상 컨설턴트를 통한 보상처리시스템 및 방법
KR20100106438A (ko) * 2007-11-28 2010-10-01 어슈어런트, 인코포레이티드 자동 청구 처리 시스템
KR20150132726A (ko) * 2014-05-16 2015-11-26 삼성생명보험주식회사 보험사기를 사전 감지하기 위한 장치 및 컴퓨터-판독가능 매체

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070082711A (ko) * 2006-02-17 2007-08-22 동부화재해상보험 주식회사 가상 컨설턴트를 통한 보상처리시스템 및 방법
KR20100106438A (ko) * 2007-11-28 2010-10-01 어슈어런트, 인코포레이티드 자동 청구 처리 시스템
KR20150132726A (ko) * 2014-05-16 2015-11-26 삼성생명보험주식회사 보험사기를 사전 감지하기 위한 장치 및 컴퓨터-판독가능 매체

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220028006A1 (en) * 2018-12-27 2022-01-27 Futurity Group, Inc. Systems, methods, and platforms for automated quality management and identification of errors, omissions and/or deviations in coordinating services and/or payments responsive to requests for coverage under a policy
US11699191B2 (en) * 2018-12-27 2023-07-11 Futurity Group, Inc. Systems, methods, and platforms for automated quality management and identification of errors, omissions and/or deviations in coordinating services and/or payments responsive to requests for coverage under a policy
KR102149541B1 (ko) * 2019-11-28 2020-08-28 (주)위세아이텍 보험금 부당청구 패턴 탐지를 위한 음성 데이터의 변수 도출 장치 및 방법
KR102149542B1 (ko) * 2019-11-28 2020-08-28 (주)위세아이텍 신규 부당청구 검출 장치 및 방법
US11816741B2 (en) 2021-02-09 2023-11-14 Futurity Group, Inc. Automatically labeling data using natural language processing

Also Published As

Publication number Publication date
KR102085814B1 (ko) 2020-03-06

Similar Documents

Publication Publication Date Title
De Roux et al. Tax fraud detection for under-reporting declarations using an unsupervised machine learning approach
Dorronsoro et al. Neural fraud detection in credit card operations
Ogwueleka Data mining application in credit card fraud detection system
KR20190063175A (ko) 인공지능 기반의 신규 부당청구 패턴 분석 장치 및 방법
US9697248B1 (en) Supervised machine learning of data de-duplication
CN108038778A (zh) 互联网金融小微贷款的团伙欺诈识别方法及装置
CN105809448B (zh) 账户交易的聚类方法及其系统
Lucas et al. Dataset shift quantification for credit card fraud detection
KR102153912B1 (ko) 인공지능 기반의 보험금 부당청구 및 부당패턴 탐지 장치 및 방법
CN114298176A (zh) 一种欺诈用户检测方法、装置、介质及电子设备
JP7009658B2 (ja) 人工知能基盤の悪質延滞探知装置及び方法
CN114818999B (zh) 基于自编码器和生成对抗网络的账户识别方法及系统
KR20220071875A (ko) 인공신경망 기반 보험 가입 예정자의 언더라이팅 장치 및 방법
CN117094184B (zh) 基于内网平台的风险预测模型的建模方法、系统及介质
KR101974521B1 (ko) 인공지능 기반의 보험금 부당청구 탐지 장치 및 방법
KR20200010621A (ko) 인공지능 기반의 보험금 부당청구 및 부당패턴 탐지 장치 및 방법
KR102149542B1 (ko) 신규 부당청구 검출 장치 및 방법
Jurgovsky Context-aware credit card fraud detection
KR102512982B1 (ko) 보험사기 검출 시스템
DEB et al. A comparative study on credit card fraud detection
Ghaedi et al. Improving Electricity Theft Detection using Combination of Improved Crow Search Algorithm and Support Vector Machine
Nguyen-Thi et al. Using novel noise filtering techniques to ensemble classifiers for credit scoring: Using noise filtering techniques to ensemble classifiers for credit scoring
Okay Predicting business failures in non-financial turkish companies
Brun et al. Learning and classification of car trajectories in road video by string kernels
Braune et al. Behavioral clustering for point processes

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant