WO2021107337A1

WO2021107337A1 - 강화학습 기반의 사기 대출 분류시스템 및 방법

Info

Publication number: WO2021107337A1
Application number: PCT/KR2020/011165
Authority: WO
Inventors: 노철균; 민예린; 르팜투옌
Original assignee: 주식회사 애자일소다
Priority date: 2019-11-29
Filing date: 2020-08-21
Publication date: 2021-06-03
Also published as: JP7111934B2; JP2022515688A; KR102148880B1

Abstract

강화학습 기반의 사기 대출 분류시스템 및 방법을 개시한다. 본 발명은 강화학습을 이용하여 차량 사기 대출의 분류를 개선함으로써, 사기 대출로 인한 예상 손실 금액의 발생을 최소화할 수 있다. [대표도] 도 2

Description

강화학습 기반의 사기 대출 분류시스템 및 방법

본 발명은 강화학습 기반의 사기 대출 분류시스템 및 방법에 관한 발명으로서, 더욱 상세하게는 강화학습을 이용하여 사기 대출을 선별하는 강화학습 기반의 사기 대출 분류시스템 및 방법에 관한 것이다.

일반적인 자동차 금융 시장 구조에 따르면, 자동차 구매자가 부담하게 될 비용을 산정하는 비용 구조가 지나치게 복잡하여 자동차 구매자가 이해하기 어려우므로 자동차 금융 상품 가입에 따른 업무를 자동차 딜러에게 위임하고 있는 실정이다.

자동차 금융 시장에서 자동차 구매자의 비용 구조 및 자동차 딜러의 수익 구조에서는, 취급 수수료 또는 대출 상품 소개 수수료에 인해 부가적인 비용이 발생할 수 밖에 없다.

따라서 캐피탈사와 같은 금융 회사의 오토론(Auto-Loan)은 상대적으로 고금리 정책을 취하고 있다.

이로 인해, 제2 캐피탈사의 자동차 대출서비스를 이용하는 채무자는 고금리로 인해 경제적 부담이 증가할 수 있다.

또한, 채무자가 캐피탈사와 같은 제2 금융권의 대출서비스를 이용하는 경우에, 채무자의 신용등급이 하락하고 타 금융상품의 대출 부적합 요건으로 작용할 수 있으므로, 추후 경제활동에 악영향을 미친다.

중고차 매매 시장에서는, 중고차를 구매하고자 하는 채무자, 중고차의 이전 주인인 매도자, 중고차 매매를 알선하는 매매상 간에 거래가 이루어지므로 거래 주체가 다양하고, 거래대상인 중고차의 성능, 유지 상태 및 거래 시세가 일정하지 않으므로, 중고차 거래시 각별한 주의가 필요하다.

최근 소비자들의 자동차 교체 주기가 짧아지고 고가의 자동차 거래가 증가하면서 고가의 중고차 매매도 증가하여, 자동차 대출서비스에 대한 관심이 높아지는 추세이다.

이러한 대출서비스를 제공하는 과정에서, 금융사 또는 캐피탈사는 자동차 대출 사기를 방지하기 위해 채무자의 대출 적격을 직접 심사하고, 채무자의 거래 차량, 자동차 매도자 및 매매상에 대한 검증이 완료된 채무자에게 대출 서비스를 제공하는 있다.

그러나, 종래의 대출 서비스는 금융사 또는 캐피탈사에서 미리 설정한 대출 규정에 따른 룰 베이스를 기반으로 대출 적격 심사를 진행하여 정상 대출과 사기 대출을 구분하기 어려운 문제점이 있다.

한편, 강화 학습은 환경(environment)과 상호작용하며 목표를 달성하는 에이전트를 다루는 학습 방법으로서, 로봇이나 인공 지능 분야에서 많이 사용되고 있다.

이러한 강화 학습은 학습의 행동 주체인 강화 학습 에이전트(Agent)가 어떤 행동을 해야 더 많은 보상(Reward)을 받을지 알아내는 것을 목적으로 한다.

즉, 정해진 답이 없는 상태에서도 보상을 최대화시키기 위해 무엇을 할 것인가를 배우는 것으로서, 입력과 출력이 명확한 관계를 갖고 있는 상황에서 사전에 어떤 행위를 할 것인지 듣고 하는 것이 아니라, 시행착오를 거치면서 보상을 최대화시키는 것을 배우는 과정을 거친다.

또한, 에이전트는 시간 스텝이 흘러감에 따라 순차적으로 액션을 선택하게 되고, 상기 액션이 환경에 끼친 영향에 기반하여 보상(reward)을 받게 된다.

도 1은 종래 기술에 따른 강화 학습 장치의 구성을 나타낸 블록도로서, 도 1에 나타낸 바와 같이, 에이전트(10)가 강화 학습 모델의 학습을 통해 액션(Action, 또는 행동) a를 결정하는 방법을 학습시키고, 각 액션인 a는 그 다음 스테이트(state) S에 영향을 끼치며, 성공한 정도는 보상(Reward) r로 측정할 수 있다.

즉, 보상은 강화 학습 모델을 통해 학습을 진행할 경우, 어떤 스테이트(State)에 따라 에이전트(10)가 결정하는 액션(행동)에 대한 보상 점수로서, 학습에 따른 에이전트(10)의 의사 결정에 대한 일종의 피드백이다.

또한, 보상을 어떻게 책정하느냐에 따라 학습 결과에 많은 영향이 발생하므로, 강화 학습을 통해 에이전트(10)는 미래의 보상이 최대가 되도록 액션을 취하게 된다.

그러나, 종래 기술에 따른 강화 학습 장치는 주어진 환경에서 목표 달성과 관련되어 획일적으로 결정되는 보상에 기초하여 학습을 진행함으로써, 목표를 이루기 위해 하나의 행동 패턴을 가질 수 밖에 없는 문제점이 있다.

이러한 문제점을 해결하기 위하여, 본 발명은 강화학습을 이용하여 차량 사기 대출을 선별하는 강화학습 기반의 사기 대출 분류시스템 및 방법을 제공하는 것을 목적으로 한다.

상기한 목적을 달성하기 위하여 본 발명의 일 실시 예는 강화학습 기반의 사기 대출 분류시스템으로서, 정보 입력부로부터 임의의 대출 정보가 입력되면, 임베딩(Embedding)기법을 통해 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 범주형 데이터 또는 비정형 데이터의 정보를 축약 및 정형화하고, 상기 축약 및 정형화한 입력 변수를 이용하여 미리 저장된 분석 프로그램을 통해 상기 대출 정보에 대한 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하며, 상기 산출된 확률값 중에서 높은 쪽의 확률값으로 분류한 예측 결과 - 이때, 예측 결과는 정상 대출일 확률값이 높으면 정상 대출이고, 사기 대출일 확률값이 높으면 사기 대출임 - 를 출력하는 사기 대출 분류 에이전트; 및 상기 분류된 예측 결과를 상기 대출 정보의 실제 결과 - 이때, 실제 결과는 입력된 대출 정보가 정상 대출 또는 사기 대출인지를 나타낸 결과 정보임 - 와 비교하여 상기 예측 결과의 맞고 틀림에 따라 분류된 리워드 정보를 상기 사기 대출 분류 에이전트로 제공하는 리워드 분류부를 포함한다.

또한, 상기 실시 예에 따른 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '- 대출금액'을 리워드 정보로 제공하며, 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '+ 대출금액', 틀리면 '-대출금액'을 리워드 정보로 제공하고, 상기 사기 대출 분류 에이전트는 제공된 리워드 정보를 대출 정보의 확률값 산출에 반영하여 강화학습을 수행하는 것을 특징으로 한다.

또한, 본 발명이 일 실시 예는 강화학습 기반의 사기 대출 분류시스템으로서, 정보 입력부로부터 임의의 대출 정보가 입력되면, 임베딩(Embedding)기법을 통해 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 범주형 데이터 또는 비정형 데이터의 정보를 축약 및 정형화하고, 상기 축약 및 정형화한 입력 변수를 이용하여 미리 저장된 분석 프로그램을 통해 상기 대출 정보에 대한 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하며, 상기 산출된 확률값 중에서 높은 쪽의 확률값으로 분류한 예측 결과 - 이때, 예측 결과는 정상 대출일 확률값이 높으면 정상 대출이고, 사기 대출일 확률값이 높으면 사기 대출임 - 를 출력하는 사기 대출 분류 에이전트; 및 상기 분류된 예측 결과를 상기 대출 정보의 실제 결과 - 이때, 실제 결과는 입력된 대출 정보가 정상 대출 또는 사기 대출인지를 나타낸 결과 정보임 - 와 비교하여 상기 예측 결과의 맞고 틀림에 따라 분류된 리워드 정보를 상기 사기 대출 분류 에이전트로 제공하는 리워드 분류부를 포함한다.

또한, 상기 실시 예에 따른 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '-2 * 대출금액'을 리워드 정보로 제공하며, 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '3 * 대출금액', 틀리면 '-8 * 대출금액'을 리워드 정보로 제공하고, 상기 사기 대출 분류 에이전트는 제공된 리워드 정보를 대출 정보의 확률값 산출에 반영하여 강화학습을 수행하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 리워드 정보는 실제 결과가 정상 대출인 경우, 예상 결과가 맞으면 '대출금액 * 미리 설정된 지표값', 틀리면 '- 대출금액 * 미리 설정된 지표값'을 리워드 정보로 제공하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 대출금액은 '0' ~ '1' 범위의 스케일로 변환하여 반영되는 것을 특징으로 한다.

또한, 본 발명의 일 실시 예는 강화학습 기반의 사기 대출 분류방법으로서, a) 정보 입력부로부터 임의의 대출 정보가 입력되면, 사기 대출 분류 에이전트가 임베딩(Embedding)기법을 통해 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 범주형 데이터 또는 비정형 데이터의 정보를 축약 및 정형화하고, 상기 축약 및 정형화한 입력 변수를 이용하여 미리 저장된 분석 프로그램을 통해 상기 대출 정보에 대한 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하며, 상기 산출된 확률값 중에서 높은 쪽의 확률값으로 분류한 예측 결과 - 이때, 예측 결과는 정상 대출일 확률값이 높으면 정상 대출이고, 사기 대출일 확률값이 높으면 사기 대출임 - 를 출력하는 단계; b) 상기 사기 대출 분류 에이전트로부터 분류된 예측 결과를 리워드 분류부가 상기 대출 정보의 실제 결과 - 이때, 실제 결과는 입력된 대출 정보가 정상 대출 또는 사기 대출을 나타낸 결과 정보임 - 와 비교하여 상기 예측 결과의 맞고 틀림에 따라 분류된 리워드 정보를 상기 사기 대출 분류 에이전트로 제공하는 단계; 및 c) 상기 사기 대출 분류 에이전트가 상기 리워드 분류부로부터 제공된 리워드 정보를 대출 정보의 확률값 산출에 반영하여 강화학습을 수행하는 단계;를 포함한다.

또한, 상기 실시 예에 따른 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '- 대출금액'을 리워드 정보로 제공하고, 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '+ 대출금액', 틀리면 '-대출금액'을 리워드 정보로 제공하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '-2 * 대출금액'을 리워드 정보로 제공하며, 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '3 * 대출금액', 틀리면 '-8 * 대출금액'을 리워드 정보로 제공하는 것을 특징으로 한다.

또한,상기 대출금액은 '0' ~ '1' 범위의 스케일로 변환하여 반영되는 것을 특징으로 한다.

본 발명은 강화학습을 이용하여 차량 사기 대출의 분류를 개선함으로써, 사기 대출로 인한 예상 손실 금액의 발생을 최소화할 수 있는 장점이 있다.

도 1은 종래 기술에 따른 강화 학습 장치의 구성을 나타낸 블록도.

도 2는 본 발명의 일 실시 예에 따른 강화학습 기반의 사기 대출 분류시스템의 구성을 나타낸 블록도.

도 3은 도 2의 실시 예에 따른 강화학습 기반의 사기 대출 분류 시스템의 분류과정을 설명하기 위한 예시도.

도 4는 본 발명의 일 실시 예에 따른 강화학습 기반의 사기 대출 분류방법을 나타낸 흐름도.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시 예에 따른 강화학습 기반의 사기 대출 분류시스템 및 방법의 바람직한 실시예를 상세하게 설명한다.

본 명세서에서 어떤 부분이 어떤 구성요소를 "포함"한다는 표현은 다른 구성요소를 배제하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.

또한, "‥부", "‥기", "‥모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어, 또는 그 둘의 결합으로 구분될 수 있다.

도 2는 본 발명의 일 실시 예에 따른 강화학습 기반의 사기 대출 분류시스템의 구성을 나타낸 블록도이고, 도 3은 도 2의 실시 예에 따른 강화학습 기반의 사기 대출 분류 시스템의 분류과정을 설명하기 위한 예시도이다.

도 2 및 도 3을 참조하여 설명하면, 강화학습 기반의 사기 대출 분류시스템(100)은 정보 입력부(110)와, 사기 대출 분류 에이전트(120)와, 리워드 분류부(130)를 포함하여 구성된다.

정보 입력부(110)는 사기 대출 분류 에이전트(120)의 강화학습을 위한 대출 정보를 제공하는 구성으로서, 키보드 등의 입력수단, 메모리 등의 저장수단, 네트워크를 통해 연결된 외부 단말 등으로 구성될 수 있다.

또한, 대출 정보는 사기 대출 분류 에이전트(120)가 분류할 대출 정보로서, 대출자의 대출신청 정보, 차량의 매매 증빙 정보, 차량의 매도자 정보, 차량의 중계 거래자 정보 또는 기타 부가 정보 등을 포함할 수 있다.

또한, 정보 입력부(110)는 강화학습을 위해 입력된 개별 대출 정보에 대하여 정상 대출인지 또는 사기 대출인지에 대한 실제 결과 정보를 제공할 수 있다.

사기 대출 분류 에이전트(120)는 정보 입력부(110)로부터 임의의 대출 정보가 입력되면, 미리 저장된 분석 프로그램을 이용하여 대출 정보가 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하고, 산출된 확률값 중에서 높은 쪽으로 분류한 예측 결과, 즉 정상 대출일 확률값이 높으면 정상 대출로 분류한 예측 결과를 출력하고, 사기 대출일 확률값이 높으면 사기 대출로 분류한 예측 결과를 출력한다.

즉, 사기 대출 분류 에이전트(120)는 분석 프로그램을 이용하여 대출 정보에 포함된 개인 신용 정보 및 타금융기간 대출 내역을 포함한 대출자 정보, 대출금액, 대출기간, 이자율 등을 포함한 대출 조건, 차량 정보, 차량의 매매 증빙 정보, 차량의 매도자 정보, 차량의 중계 거래자 정보 등을 분석하고, 분석 결과에 기반하여 정상 대출일 확률값과 사기 대출일 확률값을 산출한다.

또한, 사기 대출 분류 에이전트(120)는 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 숫자형이 아닌 범주형 또는 비정형 데이터의 정보 축약을 통해 정형화함으로써, 고차원의 데이터를 저차원의 데이터로 줄인 임베딩(Embedding)기법을 이용한 정보 등을 이용하여 분석할 수도 있다.

또한, 사기 대출 분류 에이전트(120)는 산출된 확률값에 기반하여 대출 정보가 정상 대출인지 또는 사기 대출인지를 예측(또는 의사 결정)할 수 있다.

즉, 사기 대출 분류 에이전트(120)는 도 3에 나타낸 바와 같이, 개별 대출 정보, 예를 들면, 대출 정보 1(210a), 대출 정보 2(210b), 대출 정보 3(210c), ‥ 대출 정보 n(210n)에 대하여 대출자 정보(220a), 대출금(액)(220b), 대출기간(220c) 등에 기반한 정상 대출인지 또는 사기 대출인지 확률값을 산출하고, 산출된 확률값에 기반하여 의사 결정한 결과로서, 정상 대출인지 또는 사기 대출인지를 결정한 예측값(300) 또는 예측 결과를 출력한다.

또한, 사기 대출 분류 에이전트(120)는 산출된 정상 대출에 대한 확률값과 사기 대출에 대한 확률값의 비교를 통해 확률값이 큰 값을 갖는 쪽으로 대출 정보가 결정되도록 한다.

예를 들면, 산출된 정상 대출에 대한 확률값이 "40"이고, 사기 대출에 대한 확률값이 "60"이면, 입력된 대출 정보는 "사기 대출"로 예측한 예측값을 출력한다.

또한, 사기 대출 분류 에이전트(120)는 리워드 분류부(130)로부터 제공된 리워드 정보를 대출 정보의 확률값 산출시에 반영하여 강화학습을 수행할 수 있다.

리워드 분류부(130)는 사기 대출 분류 에이전트(120)가 강화학습을 통해 예측한 확률값에 기반하여 정상 대출 또는 중복 대출로 분류한 예측값(300)을 실제 결과(310), 즉 강화학습을 위해 입력된 대출 정보의 정상 대출 또는 사기 대출을 나타낸 결과 정보와 비교함으로써, 예를 들면, 정상 대출이 '맞다' 또는 '틀리다', 사기 대출이 '맞다' 또는 '틀리다'로 분류한 예측 결과(또는 의사 결정 결과)를 제공할 수 있다.

또한, 리워드 분류부(130)는 사기 대출 분류 에이전트(120)의 예측 결과와 실제 결과의 맞고 틀림에 따라 사기 대출 분류 에이전트(120)의 예측값 분류를 위한 학습 방향을 결정하는 리워드 정보(400)를 사기 대출 분류 에이전트(120)로 제공한다.

여기서, 리워드 정보는 대출금액을 리워드 정보로 제공할 수 있는데, 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '- 대출금액'을 리워드 정보로 제공할 수 있다.

또한, 리워드 정보는 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '+ 대출금액', 틀리면 '-대출금액'을 리워드 정보로 제공할 수 있다.

또한, 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '-2 * 대출금액'을 리워드 정보로 제공할 수 있다.

또한, 리워드 정보는 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '3 * 대출금액', 틀리면 '-8 * 대출금액'을 리워드 정보로 제공할 수 있다.

또한, 리워드 정보는 대출금액이 리워드에 반영되면, 연산 값이 증가될 수 있으므로, 반영되는 대출금액을 '0' ~ '1' 범위의 스케일로 변환하여 제공할 수도 있다.

다음은 본 발명의 일 실시 예에 따른 강화학습 기반의 사기 대출 분류방법을 도 2 내지 도 4를 참조하여 설명한다.

사기 대출 대상 선별부(120)가 정보 입력부(110)로부터 대출 정보를 수신(S100)한다.

사기 대출 분류 에이전트(120)는 미리 저장된 분석 프로그램을 이용하여 대출 정보가 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하고, 산출된 확률값 중에서 높은 쪽으로 분류한 예측 결과, 즉 정상 대출일 확률값이 높으면 정상 대출로 분류하고, 사기 대출일 확률값이 높으면 사기 대출로 분류한 예측값(300)을 출력(S200)한다.

S200 단계에서, 사기 대출 분류 에이전트(120)는 정보 입력부(110)로부터 입력되는 대출 정보에 대하여 분석 프로그램이 대출 정보에 포함된 대출자 정보(220a), 대출금(액)(220b), 대출기간(220c) 임베딩(Embedding) 기법으로 분석한 정보, 기계학습을 통해 분석한 정보 등을 기반으로 확률값을 산출할 수 있다.

S200 단계를 수행한 다음, 사기 대출 분류 에이전트(120)로부터 분류된 예측 값(300)은 리워드 분류부(130)에서 실제 결과(310)와 비교하고, 예측값(300)과 실제 결과(310)의 맞고 틀림에 따라 사기 대출 분류 에이전트(120)의 예측값 산출을 위한 학습 방향을 결정하는 리워드 정보를 분류(S300)한다.

S300 단계에서, 리워드 분류부(130)는 예측 결과와 실제 결과가 맞으면, 일정 대출금액이 가산되도록 하고, 예측 결과와 실제 결과가 틀리면, 정상 대출 및 사기 대출의 확률값을 계산하기 위한 임의의 정보에 대하여 일정 대출금액이 감산 또는 가산되도록 리워드 정보를 설정할 수 있다.

또한, S300 단계에서 설정 및 제공되는 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '- 대출금액'을 리워드 정보로 제공할 수 있다.

또한, 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '+ 대출금액', 틀리면 '-대출금액'을 리워드 정보로 제공할 수도 있다.

여기서, 리워드 정보는 미리 설정된 지표값을 부가하여 설정될 수도 있다.

즉, 실제 결과가 정상 대출인 경우, 예상 결과가 맞으면 '대출금액 * 미리 설정된 지표값', 틀리면 '- 대출금액 * 미리 설정된 지표값'을 리워드 정보로 제공하여 사기 대출 분류 에이전트(120)의 예측값 분류를 위한 학습 방향이 최적의 방향으로 학습될 수 있도록 한다.

또한, S300 단계에서 제공되는 리워드 정보는 사기 대출의 적발 대상 또는 타사를 통한 사기 대출에 대한 적발 등 난이도에 따라 조정될 수 있는데, 이러한 대출 정보의 분류에서 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '-2 * 대출금액'을 리워드 정보로 제공할 수 있다.

또한, 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '3 * 대출금액', 틀리면 '-8 * 대출금액'을 리워드 정보로 제공함으로써, 사기 대출 분류 에이전트(120)의 예측값 분류를 위한 학습 방향이 최적의 방향으로 학습될 수 있도록 한다.

한편, 리워드 정보는 대출금액이 리워드에 반영되면, 연산 값이 증가될 수 있으므로, 반영되는 대출금액을 '0' ~ '1' 범위의 스케일로 변환하여 제공될 수 있다.

S300 단계에서 설정된 리워드 정보는 리워드 분류부(130)로부터 사기 대출 분류 에이전트(120)로 제공되고, 사기 대출 분류 에이전트(120)는 리워드 분류부(130)로부터 제공된 리워드 정보를 결제 정보의 예측 결과 결정을 위한 임의의 정보, 예를 들면, 대출 정보에 포함된 대출자 정보(220a), 대출금(액)(220b), 대출기간(220c) 임베딩(Embedding) 기법으로 분석한 정보, 기계학습을 통해 분석한 정보 등에 기반한 확률값의 산출시에 반영하여 강화학습을 수행(S400)한다.

따라서, 강화학습을 이용하여 차량 사기 대출의 분류를 개선함으로써, 사기 대출로 인한 예상 손실 금액의 발생을 최소화할 수 있다.

상기와 같이, 본 발명의 바람직한 실시 예를 참조하여 설명하였지만 해당 기술 분야의 숙련된 당업자라면 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

또한, 본 발명의 특허청구범위에 기재된 도면번호는 설명의 명료성과 편의를 위해 기재한 것일 뿐 이에 한정되는 것은 아니며, 실시예를 설명하는 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있으며, 상술된 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있으므로, 이러한 용어들에 대한 해석은 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.

[부호의 설명]

100 : 분류 시스템

110 : 정보 입력부

120 : 사기 대출 분류 에이전트

130 : 리워드 분류부

Claims

정보 입력부(110)로부터 임의의 대출 정보가 입력되면, 임베딩(Embedding)기법을 통해 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 범주형 데이터 또는 비정형 데이터의 정보를 축약 및 정형화하고, 상기 축약 및 정형화한 입력 변수를 이용하여 미리 저장된 분석 프로그램을 통해 상기 대출 정보에 대한 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하며, 상기 산출된 확률값 중에서 높은 쪽의 확률값으로 분류한 예측 결과 - 이때, 예측 결과는 정상 대출일 확률값이 높으면 정상 대출이고, 사기 대출일 확률값이 높으면 사기 대출임 - 를 출력하는 사기 대출 분류 에이전트(120); 및

상기 분류된 예측 결과를 상기 대출 정보의 실제 결과 - 이때, 실제 결과는 입력된 대출 정보가 정상 대출 또는 사기 대출인지를 나타낸 결과 정보임 - 와 비교하여 상기 예측 결과의 맞고 틀림에 따라 분류된 리워드 정보를 상기 사기 대출 분류 에이전트(120)로 제공하는 리워드 분류부(130)를 포함하되,

상기 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '- 대출금액'을 리워드 정보로 제공하며,

실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '+ 대출금액', 틀리면 '-대출금액'을 리워드 정보로 제공하고,

상기 사기 대출 분류 에이전트(120)는 제공된 리워드 정보를 대출 정보의 확률값 산출에 반영하여 강화학습을 수행하는 것을 특징으로 강화학습 기반의 사기 대출 분류시스템.
정보 입력부(110)로부터 임의의 대출 정보가 입력되면, 임베딩(Embedding)기법을 통해 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 범주형 데이터 또는 비정형 데이터의 정보를 축약 및 정형화하고, 상기 축약 및 정형화한 입력 변수를 이용하여 미리 저장된 분석 프로그램을 통해 상기 대출 정보에 대한 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하며, 상기 산출된 확률값 중에서 높은 쪽의 확률값으로 분류한 예측 결과 - 이때, 예측 결과는 정상 대출일 확률값이 높으면 정상 대출이고, 사기 대출일 확률값이 높으면 사기 대출임 - 를 출력하는 사기 대출 분류 에이전트(120); 및

상기 분류된 예측 결과를 상기 대출 정보의 실제 결과 - 이때, 실제 결과는 입력된 대출 정보가 정상 대출 또는 사기 대출인지를 나타낸 결과 정보임 - 와 비교하여 상기 예측 결과의 맞고 틀림에 따라 분류된 리워드 정보를 상기 사기 대출 분류 에이전트(120)로 제공하는 리워드 분류부(130)를 포함하되,

상기 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '-2 * 대출금액'을 리워드 정보로 제공하며,

실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '3 * 대출금액', 틀리면 '-8 * 대출금액'을 리워드 정보로 제공하고,

상기 사기 대출 분류 에이전트(120)는 제공된 리워드 정보를 대출 정보의 확률값 산출에 반영하여 강화학습을 수행하는 것을 특징으로 강화학습 기반의 사기 대출 분류시스템.
제 1 항에 있어서,

상기 리워드 정보는 실제 결과가 정상 대출인 경우, 예상 결과가 맞으면 '대출금액 * 미리 설정된 지표값', 틀리면 '- 대출금액 * 미리 설정된 지표값'을 리워드 정보로 제공하는 것을 특징으로 하는 강화학습 기반의 사기 대출 분류시스템.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,

상기 대출금액은 '0' ~ '1' 범위의 스케일로 변환하여 반영되는 것을 특징으로 하는 강화학습 기반의 사기 대출 분류시스템.
a) 정보 입력부(110)로부터 임의의 대출 정보가 입력되면, 사기 대출 분류 에이전트(120)가 임베딩(Embedding)기법을 통해 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 범주형 데이터 또는 비정형 데이터의 정보를 축약 및 정형화하고, 상기 축약 및 정형화한 입력 변수를 이용하여 미리 저장된 분석 프로그램을 통해 상기 대출 정보에 대한 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하며, 상기 산출된 확률값 중에서 높은 쪽의 확률값으로 분류한 예측 결과 - 이때, 예측 결과는 정상 대출일 확률값이 높으면 정상 대출이고, 사기 대출일 확률값이 높으면 사기 대출임 - 를 출력하는 단계;

b) 상기 사기 대출 분류 에이전트(120)로부터 분류된 예측 결과를 리워드 분류부(130)가 상기 대출 정보의 실제 결과 - 이때, 실제 결과는 입력된 대출 정보가 정상 대출 또는 사기 대출을 나타낸 결과 정보임 - 와 비교하여 상기 예측 결과의 맞고 틀림에 따라 분류된 리워드 정보를 상기 사기 대출 분류 에이전트(120)로 제공하는 단계; 및

c) 상기 사기 대출 분류 에이전트(120)가 상기 리워드 분류부(130)로부터 제공된 리워드 정보를 대출 정보의 확률값 산출에 반영하여 강화학습을 수행하는 단계;를 포함하되,

상기 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '- 대출금액'을 리워드 정보로 제공하고, 실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '+ 대출금액', 틀리면 '-대출금액'을 리워드 정보로 제공하는 것을 특징으로 하는 강화학습 기반의 사기 대출 분류방법.
a) 정보 입력부(110)로부터 임의의 대출 정보가 입력되면, 사기 대출 분류 에이전트(120)가 임베딩(Embedding)기법을 통해 대출자 정보, 대출 조건, 차량 정보, 차량의 중계 거래자 정보, 범주형 데이터 또는 비정형 데이터의 정보를 축약 및 정형화하고, 상기 축약 및 정형화한 입력 변수를 이용하여 미리 저장된 분석 프로그램을 통해 상기 대출 정보에 대한 정상 대출일 확률값과 사기 대출일 확률값을 각각 산출하며, 상기 산출된 확률값 중에서 높은 쪽의 확률값으로 분류한 예측 결과 - 이때, 예측 결과는 정상 대출일 확률값이 높으면 정상 대출이고, 사기 대출일 확률값이 높으면 사기 대출임 - 를 출력하는 단계;

b) 상기 사기 대출 분류 에이전트(120)로부터 분류된 예측 결과를 리워드 분류부(130)가 상기 대출 정보의 실제 결과 - 이때, 실제 결과는 입력된 대출 정보가 정상 대출 또는 사기 대출을 나타낸 결과 정보임 - 와 비교하여 상기 예측 결과의 맞고 틀림에 따라 분류된 리워드 정보를 상기 사기 대출 분류 에이전트(120)로 제공하는 단계; 및

c) 상기 사기 대출 분류 에이전트(120)가 상기 리워드 분류부(130)로부터 제공된 리워드 정보를 대출 정보의 확률값 산출에 반영하여 강화학습을 수행하는 단계;를 포함하되,

상기 리워드 정보는 실제 결과가 정상 대출인 대출 정보에 대하여, 예측 결과가 정상 대출로 맞으면, '+ 대출금액', 틀리면, '-2 * 대출금액'을 리워드 정보로 제공하며,

실제 결과가 사기 대출인 대출 정보에 대하여, 예측 결과가 사기 대출로 맞으면 '3 * 대출금액', 틀리면 '-8 * 대출금액'을 리워드 정보로 제공하는 것을 특징으로 하는 강화학습 기반의 사기 대출 분류방법.
제 5 항에 있어서,

상기 리워드 정보는 실제 결과가 정상 대출인 경우, 예상 결과가 맞으면 '대출금액 * 미리 설정된 지표값', 틀리면 '- 대출금액 * 미리 설정된 지표값'을 리워드 정보로 제공하는 것을 특징으로 하는 강화학습 기반의 사기 대출 분류방법.
제 5 항 내지 제 7 항 중 어느 한 항에 있어서,

상기 대출금액은 '0' ~ '1' 범위의 스케일로 변환하여 반영되는 것을 특징으로 하는 강화학습 기반의 사기 대출 분류방법.