KR102336035B1 - 그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 - Google Patents

그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 Download PDF

Info

Publication number
KR102336035B1
KR102336035B1 KR1020210079004A KR20210079004A KR102336035B1 KR 102336035 B1 KR102336035 B1 KR 102336035B1 KR 1020210079004 A KR1020210079004 A KR 1020210079004A KR 20210079004 A KR20210079004 A KR 20210079004A KR 102336035 B1 KR102336035 B1 KR 102336035B1
Authority
KR
South Korea
Prior art keywords
financial transaction
graph
learning
data
gnn
Prior art date
Application number
KR1020210079004A
Other languages
English (en)
Inventor
정현희
백만기
이건혁
김진
Original Assignee
(주)시큐레이어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)시큐레이어 filed Critical (주)시큐레이어
Priority to KR1020210079004A priority Critical patent/KR102336035B1/ko
Application granted granted Critical
Publication of KR102336035B1 publication Critical patent/KR102336035B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법이 개시된다. 즉, (a) 학습 장치가, 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 단계; (b) 상기 학습 장치가, 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 단계를 포함하는 것을 특징으로 하는 방법이 개시된다.

Description

그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치{UNSUPERVISED LEARNING METHOD AND LEARNING DEVICE FOR FRAUD DETECTION SYSTEM BASED ON GRAPH, AND TESTING METHOD AND TESTING DEVICE USING THE SAME}
본 발명은 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치에 관한 것이다.
Fraud Detection System(FDS)은 이상 거래를 탐지하여 사고를 예방하고자 하는 시스템이다. 이와 같은 FDS는 주로 사용자 정보 및 거래 내역 등의 정보를 사용하여 거래 패턴을 확인하고 이상행위를 탐지하는 알고리즘을 사용하여 구현된다. 이를 위해, 종래에는 룰 기반의 오용탐지 알고리즘들이 연구되었으나, 이와 같은 룰 기반의 오용탐지 기법은 새로운 사기 패턴에 대한 탐지가 어렵다는 문제가 있다.
이를 극복하기 위해, 머신러닝에 기반한 새로운 이상탐지 기법, 그 중에서도 지도 학습에 기반한 방법이 최근 많이 연구되었는데, 지도 학습에 기반한 방법들은, 학습 데이터로 사용할 이상 데이터가 현저히 부족하여 학습이 어렵다는 문제점이 있다.
본 발명은 상술한 문제점을 해결하는 것을 목적으로 한다.
또한 본 발명은 데이터 불균형 문제를 극복하기 위해 정상 금융거래 데이터만을 사용하여 학습이 가능한 비지도학습 기반의 딥 러닝 모델을 구현하는 것을 목적으로 한다.
또한 본 발명은 Graph Neural Network를 사용함으로써 각각의 금융거래 데이터들간의 연관성을 함께 고려한 금융거래 상태 벡터를 획득하는 방법을 제공하는 것을 목적으로 한다.
또한 본 발명은 클러스터링 연산을 활용해 정상 데이터의 특징 값들을 군집화하고, 이를 이용해 정상 데이터의 특징 값과 차이가 큰 특징을 가지는 데이터를 이상 데이터로 판단할 수 있는 방법을 제공하는 것을 목적으로 한다.
상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한 본 발명의 특징적인 구성은 하기와 같다.
본 발명의 일 태양에 따르면, 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 있어서, (a) 학습 장치가, 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 단계; (b) 상기 학습 장치가, 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 단계를 포함하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a) 단계는, (a1) 상기 학습 장치가, 상기 제1 그래프형 학습 데이터의 원본 그래프 상의 상기 노드 값 및 상기 에지 값 중 적어도 일부를 변형함으로써 변형 그래프를 획득하는 단계; (a2) 상기 학습 장치가, 상기 GNN으로 하여금, 상기 원본 그래프 및 상기 변형 그래프 각각에 적어도 하나의 인코딩 연산을 가하여, 상기 제1 금융거래 상태 벡터에 포함된, 상기 원본 그래프에 대응하는 제1 원본 금융거래 상태 벡터 및 상기 변형 그래프에 대응하는 제1 변형 금융거래 상태 벡터를 획득하도록 하는 단계; (a3) 상기 학습 장치가, 상기 원본 그래프에 대응하는 리드아웃 벡터가 획득되면, 판별기로 하여금, 상기 리드아웃 벡터를 참조하여, 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터 각각에 적어도 하나의 판별 연산을 가함으로써 제1 원본 판별값 및 제1 변형 판별값을 생성하도록 하는 단계; 및 (a4) 상기 학습 장치가, 상기 제1 원본 판별값, 상기 제1 변형 판별값 및 상기 리드아웃 벡터를 참조하여 적어도 하나의 로스를 생성한 후, 상기 로스를 백프로퍼게이션함으로써 상기 GNN 및 상기 판별기의 파라미터들 중 적어도 일부를 학습함으로써 상기 제1 학습을 수행하는 단계를 포함하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a4) 단계는, 상기 학습 장치가, 상기 변형 연산이 가해지지 않은, 입력될 원본 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제1 속성 범위에 대응하는 값이 출력되고, 상기 입력될 원본 그래프에 상기 변형 연산이 가해진, 입력될 변형 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제2 속성 범위에 대응하는 값이 출력될 수 있도록 상기 GNN 및 상기 판별기의 상기 파라미터를 함께 학습함으로써 상기 제1 학습을 수행하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a4) 단계는, 상기 학습 장치가, 하기 수식을 참조하여 상기 로스를 생성하되,
Figure 112021070169718-pat00001
상기 수식에서, N 및 M은 각각 상기 원본 그래프 및 상기 변형 그래프 상의 노드의 개수를 의미하고,
Figure 112021070169718-pat00002
Figure 112021070169718-pat00003
는 각각 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터를 의미하며,
Figure 112021070169718-pat00004
Figure 112021070169718-pat00005
는 각각 상기 제1 원본 판별값 및 상기 제1 변형 판별값을 의미하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a) 단계 이전에, (a0) 상기 학습 장치가, 각각의 상기 제1 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 제1 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 제1 그래프형 학습 데이터를 획득하는 단계를 더 포함하는 것을 특징으로 하는 방법이 개시된다.
일례로서, (c) 상기 학습 장치가, 상기 GNN으로 하여금, 제3 금융거래 데이터에 대응하는 제3 그래프형 학습 데이터에 상기 대표화 연산을 가하여 제3 금융거래 상태 벡터를 생성하도록 한 후, 상기 기준 클러스터 및 상기 제3 금융거래 상태 벡터를 참조하여 이상 탐지 연산을 수행함으로써 상기 GNN 및 상기 기준 클러스터에 대한 탐지도를 계산하도록 한 다음, 상기 탐지도를 참조하여 (i) 상기 GNN의 정보량 하이퍼파라미터, (ii) 상기 기준 클러스터의 다양성 하이퍼파라미터 및 (iii) 상기 이상 탐지 연산의 민감도 하이퍼파라미터를 조정함으로써 제3 학습을 수행하는 단계를 더 포함하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (b) 단계는, 상기 학습 장치가, K-Means 알고리즘을 통해 상기 클러스터링 연산을 수행함으로써 상기 제2 금융거래 상태 벡터들 중 서로 간의 유사도가 임계치 이상인 것들을 포함하는 적어도 하나의 상기 기준 클러스터를 생성하는 것을 특징으로 하는 방법이 개시된다.
본 발명의 다른 태양에 따르면, 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 기반한 테스트 방법에 있어서, (a) (1) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (2) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스를 수행함으로써 학습이 완료된 상태에서, 테스트 장치가, 각각의 테스트용 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 테스트용 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 그래프형 테스트 데이터가 획득되면, 상기 GNN으로 하여금, 상기 그래프형 테스트 데이터에 상기 대표화 연산을 가하여, 상기 그래프형 테스트 데이터에 대한 정보를 포함하는 테스트용 금융거래 상태 벡터를 생성하도록 하는 단계; 및 (b) 상기 테스트 장치가, 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터를 참조하여 이상 탐지 연산을 수행하는 단계를 포함하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (b) 단계는, 상기 테스트 장치가, 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터들 간의 유사도를 계산한 후, 상기 유사도들 중 적어도 하나가 임계치 이상일 경우 상기 테스트용 금융거래 상태 벡터가 이상 데이터에 대응하고, 상기 유사도들 모두가 상기 임계치 미만일 경우 상기 테스트용 금융거래 상태 벡터가 정상 데이터에 대응하는 것으로 판단함으로써 상기 이상 탐지 연산을 수행하는 것을 특징으로 하는 방법이 개시된다.
일례로서, 상기 (a) 단계 이전에, (a0) 상기 테스트 장치가, 각각의 상기 테스트용 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 테스트용 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 그래프형 테스트용 데이터를 획득하는 단계를 더 포함하는 것을 특징으로 하는 방법이 개시된다.
본 발명의 또 다른 태양에 따르면, 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 있어서, 인스트럭션들을 저장하는 하나 이상의 메모리; 및 상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (II) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스를 수행하는 것을 특징으로 하는 학습 장치가 개시된다.
일례로서, 상기 (I) 프로세스는, 상기 프로세서가, (I1) 상기 제1 그래프형 학습 데이터의 원본 그래프 상의 상기 노드 값 및 상기 에지 값 중 적어도 일부를 변형함으로써 변형 그래프를 획득하는 프로세스; (I2) 상기 GNN으로 하여금, 상기 원본 그래프 및 상기 변형 그래프 각각에 적어도 하나의 인코딩 연산을 가하여, 상기 제1 금융거래 상태 벡터에 포함된, 상기 원본 그래프에 대응하는 제1 원본 금융거래 상태 벡터 및 상기 변형 그래프에 대응하는 제1 변형 금융거래 상태 벡터를 획득하도록 하는 프로세스; (I3) 상기 원본 그래프에 대응하는 리드아웃 벡터가 획득되면, 판별기로 하여금, 상기 리드아웃 벡터를 참조하여, 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터 각각에 적어도 하나의 판별 연산을 가함으로써 제1 원본 판별값 및 제1 변형 판별값을 생성하도록 하는 프로세스; 및 (I4) 상기 제1 원본 판별값, 상기 제1 변형 판별값 및 상기 리드아웃 벡터를 참조하여 적어도 하나의 로스를 생성한 후, 상기 로스를 백프로퍼게이션함으로써 상기 GNN 및 상기 판별기의 파라미터들 중 적어도 일부를 학습함으로써 상기 제1 학습을 수행하는 프로세스를 수행하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I4) 프로세스는, 상기 프로세서가, 상기 변형 연산이 가해지지 않은, 입력될 원본 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제1 속성 범위에 대응하는 값이 출력되고, 상기 입력될 원본 그래프에 상기 변형 연산이 가해진, 입력될 변형 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제2 속성 범위에 대응하는 값이 출력될 수 있도록 상기 GNN 및 상기 판별기의 상기 파라미터를 함께 학습함으로써 상기 제1 학습을 수행하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I4) 프로세스는, 상기 프로세서가, 하기 수식을 참조하여 상기 로스를 생성하되,
Figure 112021070169718-pat00006
상기 수식에서, N 및 M은 각각 상기 원본 그래프 및 상기 변형 그래프 상의 노드의 개수를 의미하고,
Figure 112021070169718-pat00007
Figure 112021070169718-pat00008
는 각각 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터를 의미하며,
Figure 112021070169718-pat00009
Figure 112021070169718-pat00010
는 각각 상기 제1 원본 판별값 및 상기 제1 변형 판별값을 의미하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I) 프로세스 이전에, 상기 프로세서가, (I0) 각각의 상기 제1 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 제1 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 제1 그래프형 학습 데이터를 획득하는 프로세스를 더 수행하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 프로세서가, (III) 상기 GNN으로 하여금, 제3 금융거래 데이터에 대응하는 제3 그래프형 학습 데이터에 상기 대표화 연산을 가하여 제3 금융거래 상태 벡터를 생성하도록 한 후, 상기 기준 클러스터 및 상기 제3 금융거래 상태 벡터를 참조하여 이상 탐지 연산을 수행함으로써 상기 GNN 및 상기 기준 클러스터에 대한 탐지도를 계산하도록 한 다음, 상기 탐지도를 참조하여 (i) 상기 GNN의 정보량 하이퍼파라미터, (ii) 상기 기준 클러스터의 다양성 하이퍼파라미터 및 (iii) 상기 이상 탐지 연산의 민감도 하이퍼파라미터를 조정함으로써 제3 학습을 수행하는 프로세스를 더 수행하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (II) 프로세스는, 상기 프로세서가, K-Means 알고리즘을 통해 상기 클러스터링 연산을 수행함으로써 상기 제2 금융거래 상태 벡터들 중 서로 간의 유사도가 임계치 이상인 것들을 포함하는 적어도 하나의 상기 기준 클러스터를 생성하는 것을 특징으로 하는 장치가 개시된다.
본 발명의 또다른 태양에 따르면, 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 기반한 테스트 장치에 있어서, 인스트럭션들을 저장하는 하나 이상의 메모리; 및 상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) (1) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (2) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스를 수행함으로써 학습이 완료된 상태에서, 각각의 테스트용 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 테스트용 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 그래프형 테스트 데이터가 획득되면, 상기 GNN으로 하여금, 상기 그래프형 테스트 데이터에 상기 대표화 연산을 가하여, 상기 그래프형 테스트 데이터에 대한 정보를 포함하는 테스트용 금융거래 상태 벡터를 생성하도록 하는 프로세스; 및 (II) 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터를 참조하여 이상 탐지 연산을 수행하는 프로세스를 수행하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (II) 프로세스는, 상기 프로세서가, 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터들 간의 유사도를 계산한 후, 상기 유사도들 중 적어도 하나가 임계치 이상일 경우 상기 테스트용 금융거래 상태 벡터가 이상 데이터에 대응하고, 상기 유사도들 모두가 상기 임계치 미만일 경우 상기 테스트용 금융거래 상태 벡터가 정상 데이터에 대응하는 것으로 판단함으로써 상기 이상 탐지 연산을 수행하는 것을 특징으로 하는 장치가 개시된다.
일례로서, 상기 (I) 프로세스 이전에, 상기 프로세서가, (I0) 각각의 상기 테스트용 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 테스트용 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 그래프형 테스트용 데이터를 획득하는 프로세스를 더 수행하는 것을 특징으로 하는 장치가 개시된다.
본 발명은 데이터 불균형 문제를 극복하기 위해 학습 시 정상 데이터만을 사용하는 비지도학습 기반의 딥 러닝 모델을 구현할 수 있는 효과가 있다.
또한 본 발명은 Graph Neural Network를 사용함으로써 각각의 금융거래 데이터들간의 연관성을 함께 고려한 금융거래 상태 벡터를 획득할 수 있는 효과가 있다.
또한 본 발명은 클러스터링 연산을 활용해 정상 데이터의 특징 값들을 군집화하고, 이를 이용해 정상 데이터의 특징 값과 차이가 큰 특징을 가지는 데이터를 이상 데이터로 판단할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법을 수행하는 학습 장치(100)의 구성을 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 그래프 기반 FDS를 위한 비지도 학습 방법을 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 그래프 기반 FDS를 위한 비지도 학습 방법을 수행하기 위해 사용되는 제1 그래프형 학습 데이터의 일 예시를 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 그래프 기반 FDS를 위한 비지도 학습 방법을 나타낸 블록 다이어그램이다.
도 5는 본 발명의 일 실시예에 따른, 그래프 기반 FDS를 위한 비지도 학습 방법을 수행하면서 조정되는 민감도 하이퍼파라미터에 따른 탐지 결과의 변화를 나타낸 예시 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법을 수행하는 학습 장치(100)의 구성을 나타낸 도면이다.
도 1을 참조하면, 학습 장치(100)는 GNN(200) 및 판별기(300)를 포함할 수 있다. 이 때, GNN(200) 및 판별기(300)의 입출력 및 연산 과정은 각각 통신부(110) 및 프로세서(120)에 의해 이루어질 수 있다. 다만, 도 1에서는 통신부(110) 및 프로세서(120)의 구체적인 연결 관계를 생략하였다. 또한, 메모리(115)는 후술할 여러 가지 인스트럭션들을 저장한 상태일 수 있고, 프로세서(120)는 메모리에 저장된 인스트럭션들을 수행하도록 됨으로써 추후 설명할 프로세스들을 수행하여 본 발명을 수행할 수 있다. 이와 같이 학습 장치(100)가 묘사되었다고 하여, 학습 장치(100)가 본 발명을 실시하기 위한 미디엄, 프로세서 및 메모리가 통합된 형태인 integrated 프로세서를 포함하는 경우를 배제하는 것은 아니다. 이상 학습 장치(100)의 구성에 대해 설명한 바, 본 발명의 일 실시예에 따른 그래프 기반 FDS를 위한 비지도 학습 방법에 대해 구체적으로 살필 것이다. 이를 위해 도 2를 참조한다.
도 2는 본 발명의 일 실시예에 따른 그래프 기반 FDS를 위한 비지도 학습 방법을 나타낸 흐름도이다.
도 2를 참조하면, 학습 장치(100)가, 각각의 제1 금융거래 데이터를 벡터화함으로써 각각의 노드 값을 획득하고, 각각의 제1 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 에지 값을 획득함으로써 제1 그래프형 학습 데이터를 획득할 수 있다(S01). 그리고, 학습 장치(100)가, 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)(200)로 하여금, 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 제1 금융거래 상태 벡터를 참조하여 GNN(200)의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하도록 할 수 있다(S02). 여기서 대표화 연산이란 GNN(200)에 의해 수행되는 일련의 인공신경망 연산을 의미할 수 있다. 이후, 학습 장치(100)가, 제1 학습이 완료되면, GNN(200)으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행할 수 있다(S03).
이하 각각의 단계에 대해 더욱 구체적으로 설명하도록 한다.
먼저, 학습 장치(100)는, 제1 금융거래 데이터, 즉 각각의 금융거래 로그 등의 데이터를 학습 데이터로서 사용할 수 있다. 여기서, 학습 장치(100)는, 추가적인 정보, 즉 각각의 금융거래 데이터들 간의 관련성에 대한 정보를 학습에 사용하기 위해, 이와 같은 제1 금융거래 데이터를 그래프화할 수 있다. 즉, 학습 장치(100)는, 각각의 제1 금융거래 데이터를 벡터화함으로써 각각의 노드 값을 획득하고, 각각의 제1 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 에지 값을 획득함으로써 제1 그래프형 학습 데이터를 획득할 수 있다. 여기서, 연관화 연산은, 각 노드들 간의 연관도를 평가할 수 있는 알고리즘을 통한 연산이라면 무엇이든 사용 가능한데, 예를 들어, K-neareast neighbor, Fully-connected with weight decay, cut-off radius edge, cosine 유사도, minimum spanning tree를 통한 노드간 propagation 알고리즘 등의 종래 기술들이 사용될 수 있다. 이에 대한 예시를 살피기 위해 도 3을 참조하도록 한다.
도 3은 본 발명의 일 실시예에 따른 그래프 기반 FDS를 위한 비지도 학습 방법을 수행하기 위해 사용되는 제1 그래프형 학습 데이터의 일 예시를 나타낸 도면이다.
도 3을 참조하면, 노드 1 내지 노드 4 각각에 벡터화된 금융거래 데이터들이 포함된 것을 확인할 수 있다. 또한, 각각의 노드들 간에 0.82, 0.75 등의 weight가 설정된 것을 확인할 수 있는데, 이는 전술한 연관화 연산을 통해 할당된 값일 수 있다.
이와 같이 제1 그래프형 학습 데이터가 획득되면, 학습 장치(100)는, GNN(200)으로 하여금, 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 할 수 있다. 여기서, GNN(200)의 구성은 널리 알려진 그래프를 입력으로 받는 뉴럴넷의 그것과 동일 또는 유사할 수 있고, 통상의 기술자가 쉬이 추측할 수 있는 것이므로 더욱 자세한 설명은 생략할 것이다. 제1 금융거래 상태 벡터가 생성되면, 학습 장치(100)는, 제1 금융거래 상태 벡터를 참조하여 GNN(200)의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행할 수 있다. 이상의 일련의 과정에 대해 설명하기 위해 도 4를 참조하도록 한다.
도 4는 본 발명의 일 실시예에 따른 그래프 기반 FDS를 위한 비지도 학습 방법을 나타낸 블록 다이어그램이다.
도 4를 참조하면, 학습 장치(100)는, 제1 그래프형 학습 데이터의 원본 그래프 상의 노드 값 및 에지 값 중 적어도 일부를 변형함으로써 변형 그래프를 생성할 수 있다. 변형 시에, 노드가 삭제 또는 추가될 수도 있을 것이다. 이후, 원본 그래프 및 변형 그래프가 각각 GNN(200)에 의해 연산될 수 있다. 원본 그래프가 연산된 결과가 제1 원본 금융거래 상태 벡터이고 변형 그래프가 연산된 결과가 제1 변형 금융거래 상태 벡터일 수 있다. 이후, 제1 원본 금융거래 상태 벡터 및 제1 변형 금융거래 상태 벡터는 판별기(300)에 입력될 수 있다.
여기서 판별기(300)는, 입력된 벡터에 대응하는 그래프의 상태, 즉 원본 그래프인지 또는 변형 그래프인지에 따라 다른 값을 출력하도록 구성된 것일 수 있다. 이와 같은 판별기(300)는, 리드아웃 벡터를 참조하여 이와 같은 기능을 수행할 수 있는데, 일례로 리드아웃 벡터는 제1 원본 금융거래 상태 벡터의 평균 벡터일 수 있으나, 이에 한정될 것은 아니다. 리드아웃 벡터가 획득되면, 학습 장치(100)는, 판별기(300)로 하여금, 리드아웃 벡터를 참조하여, 제1 원본 금융거래 상태 벡터 및 변형 금융거래 상태 벡터 각각에 적어도 하나의 판별 연산을 가함으로써 제1 원본 판별값 및 제1 변형 판별값을 생성하도록 할 수 있다.
이후, 학습 장치(100)는, 제1 원본 판별값, 제1 변형 판별값 및 리드아웃 벡터를 참조하여 적어도 하나의 로스를 생성한 후, 상기 로스를 백프로퍼게이션함으로써 GNN(200) 및 판별기(300)의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행할 수 있다. 여기서, 제1 학습은, 변형 연산이 가해지지 않은, 추후 입력될 원본 그래프가 GNN(200) 및 판별기(300)에 의해 연산됨으로써 제1 속성 범위에 대응하는 값이 출력되고, 추후 입력될 원본 그래프에 변형 연산이 가해진, 추후 입력될 변형 그래프가 GNN(200) 및 판별기(300)에 의해 연산됨으로써 제2 속성 범위에 대응하는 값이 출력될 수 있도록 수행되는 것일 수 있다. 제1 속성 범위 및 제2 속성 범위는 이하 설명할 로스 수식에 따라 결정될 수 있다.
Figure 112021070169718-pat00011
상기 수식에서, N 및 M은 각각 원본 그래프 및 변형 그래프 상의 노드의 개수를 의미하고,
Figure 112021070169718-pat00012
Figure 112021070169718-pat00013
는 각각 제1 원본 금융거래 상태 벡터 및 제1 변형 금융거래 상태 벡터를 의미하며,
Figure 112021070169718-pat00014
Figure 112021070169718-pat00015
는 각각 상기 제1 원본 판별값 및 상기 제1 변형 판별값을 의미할 수 있다. 이상의 수식에 따르면, 원본 그래프에 대응하는 원본 판별값은 제1 속성 범위, 즉 1에 가까운 범위로 출력되고, 변형 그래프에 대응하는 변형 판별값은 제2 속성 범위, 즉 0에 가까운 범위로 출력될 수 있음을 알 수 있다. 이와 같은 로스는 판별값에 직접적으로 영향을 끼치면서, 금융거래 상태 벡터에도 간접적으로 영향을 끼치게 된다. 즉, 판별기(300)에 의해 상기 경향성을 가지는 출력이 생성되려면, 이에 입력되는 값, 즉 금융거래 상태 벡터에도 경향성이 있어야만 한다. 따라서 위 로스를 사용하여 학습되는 GNN(300)에 의한 출력 역시, 일반적인 그래프에 대응하는 금융거래 상태 벡터는 특정 경향성을 가지게 되고, 일반적인 그래프가 아닌, 즉 이상 거래가 포함된 금융거래 데이터에 대응하는 그래프에 대한 금융거래 상태 벡터는 또다른 경향성을 가지게 된다. 본 발명은 이와 같은 점에 착안하여 추후 설명할 비지도 학습을 수행하게 된다. 이상의 학습 과정은 통상의 기술자가 Velickovic et al.의 Deep Graph Infomax 논문을 추가로 참조하여 이해할 수 있을 것이므로 더 이상의 설명은 생략하도록 한다.
학습 과정이 완료되면, 학습 장치(100)는, 제2 그래프형 학습 데이터에 클러스터링 연산을 가하여 기준 클러스터를 생성할 수 있다. 제2 그래프형 학습 데이터는 기본적으로 정상 금융거래 데이터에 대응할 수 있으므로 전술한 특정 경향성을 가질 수 있는데, 이들 중에서도 서로 유사한 것들끼리 모음으로써 기준 클러스터를 생성한다는 것이다. 이를 위해, 종래 알려진 기술인 K-means 알고리즘이 사용될 수 있다. K-means 알고리즘은 통상의 기술자에게 널리 알려진 것이므로 더욱 자세한 설명은 생략하도록 한다.
이와 같은 기준 클러스터를 사용하여 금융거래의 정상 여부를 판단하는 방법은, 입력된 그래프형 데이터에 대한 금융거래 상태 벡터가 기준 클러스터들 중 어느 하나에 포함되는지 여부를 판단하여, 적어도 하나에라도 포함된다면 해당 해당 금융거래는 모두 정상인 것으로 보고, 어떤 것에도 포함되지 않는다면 해당 금융거래들 중 적어도 하나가 이상 금융거래인 것으로 보는 이상 탐지 연산을 수행하는 방법일 수 있다.
이상의 과정을 통해 기준 클러스터가 도출되면 일차적인 학습 과정은 완료된 것으로 볼 수 있으나, 더욱 높은 정확도를 위해 추가적으로 실시할 수 있는 하이퍼파라미터 조정 과정에 대해 설명하도록 한다.
즉, 학습 장치(100)가, GNN(200)으로 하여금, 적어도 하나의 이상 금융거래를 포함하는 제3 금융거래 데이터에 대응하는 제3 그래프형 학습 데이터에 대표화 연산을 가하여 제3 금융거래 상태 벡터를 생성하도록 한 후, 상기 기준 클러스터 및 상기 제3 금융거래 상태 벡터를 참조하여 이상 탐지 연산을 수행함으로써 GNN(200) 및 기준 클러스터에 대한 탐지도를 계산하도록 한 다음, 탐지도를 참조하여 (i) GNN(200)의 정보량 하이퍼파라미터, (ii) 기준 클러스터의 다양성 하이퍼파라미터 및 (iii) 이상 탐지 연산의 민감도 하이퍼파라미터를 조정하도록 할 수 있다.
더욱 구체적으로 설명하면, 제3 그래프형 학습 데이터를 이용해 이상 탐지 연산을 수행한 뒤, 이에 대한 정탐률과 오탐률을 계산함으로써 탐지도를 계산할 수 있다. 그리고, 오탐률이 임계치 이상이면서 위양성율이 높은 경우 하이퍼파라미터들을 다소 둔감한 방향으로 조정하고, 위음성율이 높은 경우 하이퍼파라미터들을 민감한 방향으로 조정할 수 있다. 여기서, GNN(200)의 정보량 하이퍼파라미터는 출력 레이어의 차원을 의미할 수 있으며, 이것이 증가하면 금융거래 상태 벡터의 정보량이 증가하므로, 오탐률이 높은 경우에 이를 낮추기 위해 정보량 하이퍼파라미터를 높일 수 있을 것이다. 또한, 다양성 하이퍼파라미터는 기준 클러스터의 개수를 의미할 수 있는데, 역시 오탐률이 높은 경우에 이를 낮추기 위해 다양성 하이퍼파라미터를 높일 수 있을 것이다. 다만, 위 두 하이퍼파라미터의 경우, 증가시킬 경우 컴퓨팅 리소스 사용량도 함께 증가할 수 있는 단점이 있으므로, 트레이드오프를 잘 고려할 필요가 있을 것이다.
이상 탐지 연산의 민감도 하이퍼파라미터는, 각각의 기준 클러스터로부터 어느 정도의 거리만큼 떨어져 있는 값까지 상기 기준 클러스터에 포함되어 있는 것으로 볼지를 결정할 수 있는 값으로, 이를 증가시키면 이상 탐지의 민감도가 증가하고, 감소시키면 민감도가 감소하는 것으로 볼 수 있을 것이다. 이에 대해 설명하기 위해 도 5를 참조하도록 한다.
도 5는 본 발명의 일 실시예에 따른, 그래프 기반 FDS를 위한 비지도 학습 방법을 수행하면서 조정되는 민감도 하이퍼파라미터에 따른 탐지 결과의 변화를 나타낸 예시 도면이다.
도 5에서, 좌측의 (a)는 민감도 하이퍼파라미터가 다소 높게 설정된 경우이고, 우측의 (b)는 민감도 하이퍼파라미터가 다소 낮게 설정된 경우일 수 있다. 이 때, 특정 금융거래 상태 벡터(400)는, (a)의 경우에는 초록색으로 표시된 기준 클러스터에 포함되므로 정상 금융거래에 대응하는 것으로 판단되고, (b)의 경우에는 어떤 클러스터에도 포함되지 않으므로 이상 금융거래에 대응하는 것으로 판단될 것이다. 위음성율이 너무 높은 것으로 판단되는 경우, (b)와 같이 민감도 하이퍼파라미터를 낮출 수 있을 것이다.
이상 본 발명의 일 실시예에 따른 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 대해 설명한 바, 이하 테스트 방법에 대해 설명하도록 한다. 여기서, 테스트 방법을 수행하는 테스트 장치는, 학습 장치(100)과 동일 또는 유사하거나, 학습 장치(100)에서 판별기(300)가 제외된 구성일 수 있다.
즉, (1) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 제1 금융거래 상태 벡터를 참조하여 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (2) 제1 학습이 완료되면, GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스를 수행함으로써 학습이 완료된 상태에서, 테스트 장치가, 각각의 테스트용 금융거래 데이터에 대응하는 각각의 노드 값 및 테스트용 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 그래프형 테스트 데이터가 획득되면, GNN으로 하여금, 그래프형 테스트 데이터에 대표화 연산을 가하여, 그래프형 테스트 데이터에 대한 정보를 포함하는 테스트용 금융거래 상태 벡터를 생성하도록 할 수 있다.
이후, 테스트 장치가, 테스트용 금융거래 상태 벡터 및 기준 클러스터를 참조하여 이상 탐지 연산을 수행할 수 있다. 여기서, 이상 탐지 연산의 경우, 테스트 장치가, 테스트용 금융거래 상태 벡터 및 기준 클러스터들 간의 유사도를 계산한 후, 유사도들 중 적어도 하나가 임계치 이상일 경우 테스트용 금융거래 상태 벡터가 이상 데이터에 대응하고, 유사도들 모두가 임계치 미만일 경우 테스트용 금융거래 상태 벡터가 정상 데이터에 대응하는 것으로 판단함으로써 수행될 수 있다.
또한, 학습 방법의 전처리와 유사하게, 테스트 장치가, 각각의 테스트용 금융거래 데이터를 벡터화함으로써 각각의 노드 값을 획득하고, 각각의 테스트용 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 에지 값을 획득함으로써 그래프형 테스트용 데이터를 획득할 수 있다.
이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기계로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위 뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (20)

  1. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 있어서,
    (a) 학습 장치가, 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 단계;
    (b) 상기 학습 장치가, 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 단계
    를 포함하되,
    상기 (a) 단계는,
    (a1) 상기 학습 장치가, 상기 제1 그래프형 학습 데이터의 원본 그래프 상의 상기 노드 값 및 상기 에지 값 중 적어도 일부를 변형함으로써 변형 그래프를 획득하는 단계;
    (a2) 상기 학습 장치가, 상기 GNN으로 하여금, 상기 원본 그래프 및 상기 변형 그래프 각각에 적어도 하나의 인코딩 연산을 가하여, 상기 제1 금융거래 상태 벡터에 포함된, 상기 원본 그래프에 대응하는 제1 원본 금융거래 상태 벡터 및 상기 변형 그래프에 대응하는 제1 변형 금융거래 상태 벡터를 획득하도록 하는 단계;
    (a3) 상기 학습 장치가, 상기 원본 그래프에 대응하는 리드아웃 벡터가 획득되면, 판별기로 하여금, 상기 리드아웃 벡터를 참조하여, 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터 각각에 적어도 하나의 판별 연산을 가함으로써 제1 원본 판별값 및 제1 변형 판별값을 생성하도록 하는 단계; 및
    (a4) 상기 학습 장치가, 상기 제1 원본 판별값, 상기 제1 변형 판별값 및 상기 리드아웃 벡터를 참조하여 적어도 하나의 로스를 생성한 후, 상기 로스를 백프로퍼게이션함으로써 상기 GNN 및 상기 판별기의 파라미터들 중 적어도 일부를 학습함으로써 상기 제1 학습을 수행하는 단계;
    를 포함하는 것을 특징으로 하는 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 (a4) 단계는,
    상기 학습 장치가, 상기 변형 연산이 가해지지 않은, 입력될 원본 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제1 속성 범위에 대응하는 값이 출력되고, 상기 입력될 원본 그래프에 상기 변형 연산이 가해진, 입력될 변형 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제2 속성 범위에 대응하는 값이 출력될 수 있도록 상기 GNN 및 상기 판별기의 상기 파라미터를 함께 학습함으로써 상기 제1 학습을 수행하는 것을 특징으로 하는 방법.
  4. 제1항에 있어서,
    상기 (a4) 단계는,
    상기 학습 장치가, 하기 수식을 참조하여 상기 로스를 생성하되,
    Figure 112021110128718-pat00016

    상기 수식에서, N 및 M은 각각 상기 원본 그래프 및 상기 변형 그래프 상의 노드의 개수를 의미하고,
    Figure 112021110128718-pat00017
    Figure 112021110128718-pat00018
    는 각각 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터를 의미하며,
    Figure 112021110128718-pat00019
    Figure 112021110128718-pat00020
    는 각각 상기 제1 원본 판별값 및 상기 제1 변형 판별값을 의미하는 것을 특징으로 하는 방법.
  5. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 있어서,
    (a) 학습 장치가, 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 단계;
    (b) 상기 학습 장치가, 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 단계
    를 포함하되,
    상기 (a) 단계 이전에,
    (a0) 상기 학습 장치가, 각각의 상기 제1 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 제1 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 제1 그래프형 학습 데이터를 획득하는 단계
    를 더 포함하는 것을 특징으로 하는 방법.
  6. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 있어서,
    (a) 학습 장치가, 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 단계;
    (b) 상기 학습 장치가, 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 단계
    를 포함하되,
    (c) 상기 학습 장치가, 상기 GNN으로 하여금, 제3 금융거래 데이터에 대응하는 제3 그래프형 학습 데이터에 상기 대표화 연산을 가하여 제3 금융거래 상태 벡터를 생성하도록 한 후, 상기 기준 클러스터 및 상기 제3 금융거래 상태 벡터를 참조하여 이상 탐지 연산을 수행함으로써 상기 GNN 및 상기 기준 클러스터에 대한 탐지도를 계산하도록 한 다음, 상기 탐지도를 참조하여 (i) 상기 GNN의 정보량 하이퍼파라미터, (ii) 상기 기준 클러스터의 다양성 하이퍼파라미터 및 (iii) 상기 이상 탐지 연산의 민감도 하이퍼파라미터를 조정함으로써 제3 학습을 수행하는 단계
    를 더 포함하는 것을 특징으로 하는 방법.
  7. 제1항에 있어서,
    상기 (b) 단계는,
    상기 학습 장치가, K-Means 알고리즘을 통해 상기 클러스터링 연산을 수행함으로써 상기 제2 금융거래 상태 벡터들 중 서로 간의 유사도가 임계치 이상인 것들을 포함하는 적어도 하나의 상기 기준 클러스터를 생성하는 것을 특징으로 하는 방법.
  8. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 기반한 테스트 방법에 있어서,
    (a) (1) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (2) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스를 수행함으로써 학습이 완료된 상태에서, 테스트 장치가, 각각의 테스트용 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 테스트용 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 그래프형 테스트 데이터가 획득되면, 상기 GNN으로 하여금, 상기 그래프형 테스트 데이터에 상기 대표화 연산을 가하여, 상기 그래프형 테스트 데이터에 대한 정보를 포함하는 테스트용 금융거래 상태 벡터를 생성하도록 하는 단계; 및
    (b) 상기 테스트 장치가, 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터를 참조하여 이상 탐지 연산을 수행하는 단계
    를 포함하는 것을 특징으로 하는 방법.
  9. 제8항에 있어서,
    상기 (b) 단계는,
    상기 테스트 장치가, 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터들 간의 유사도를 계산한 후, 상기 유사도들 중 적어도 하나가 임계치 이상일 경우 상기 테스트용 금융거래 상태 벡터가 이상 데이터에 대응하고, 상기 유사도들 모두가 상기 임계치 미만일 경우 상기 테스트용 금융거래 상태 벡터가 정상 데이터에 대응하는 것으로 판단함으로써 상기 이상 탐지 연산을 수행하는 것을 특징으로 하는 방법.
  10. 제8항에 있어서,
    상기 (a) 단계 이전에,
    (a0) 상기 테스트 장치가, 각각의 상기 테스트용 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 테스트용 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 그래프형 테스트 데이터를 획득하는 단계
    를 더 포함하는 것을 특징으로 하는 방법.
  11. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 장치에 있어서,
    인스트럭션들을 저장하는 하나 이상의 메모리; 및
    상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (II) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스
    를 수행하되,
    상기 (I) 프로세스는,
    (I1) 상기 제1 그래프형 학습 데이터의 원본 그래프 상의 상기 노드 값 및 상기 에지 값 중 적어도 일부를 변형함으로써 변형 그래프를 획득하는 프로세스; (I2) 상기 GNN으로 하여금, 상기 원본 그래프 및 상기 변형 그래프 각각에 적어도 하나의 인코딩 연산을 가하여, 상기 제1 금융거래 상태 벡터에 포함된, 상기 원본 그래프에 대응하는 제1 원본 금융거래 상태 벡터 및 상기 변형 그래프에 대응하는 제1 변형 금융거래 상태 벡터를 획득하도록 하는 프로세스; (I3) 상기 원본 그래프에 대응하는 리드아웃 벡터가 획득되면, 판별기로 하여금, 상기 리드아웃 벡터를 참조하여, 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터 각각에 적어도 하나의 판별 연산을 가함으로써 제1 원본 판별값 및 제1 변형 판별값을 생성하도록 하는 프로세스; 및 (I4) 상기 제1 원본 판별값, 상기 제1 변형 판별값 및 상기 리드아웃 벡터를 참조하여 적어도 하나의 로스를 생성한 후, 상기 로스를 백프로퍼게이션함으로써 상기 GNN 및 상기 판별기의 파라미터들 중 적어도 일부를 학습함으로써 상기 제1 학습을 수행하는 프로세스;
    를 포함하는 것을 특징으로 하는 장치.
  12. 삭제
  13. 제11항에 있어서,
    상기 (I4) 프로세스는,
    상기 프로세서가, 상기 변형 연산이 가해지지 않은, 입력될 원본 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제1 속성 범위에 대응하는 값이 출력되고, 상기 입력될 원본 그래프에 상기 변형 연산이 가해진, 입력될 변형 그래프가 상기 GNN 및 상기 판별기에 의해 연산됨으로써 제2 속성 범위에 대응하는 값이 출력될 수 있도록 상기 GNN 및 상기 판별기의 상기 파라미터를 함께 학습함으로써 상기 제1 학습을 수행하는 것을 특징으로 하는 장치.
  14. 제11항에 있어서,
    상기 (I4) 프로세스는,
    상기 프로세서가, 하기 수식을 참조하여 상기 로스를 생성하되,
    Figure 112021110128718-pat00021

    상기 수식에서, N 및 M은 각각 상기 원본 그래프 및 상기 변형 그래프 상의 노드의 개수를 의미하고,
    Figure 112021110128718-pat00022
    Figure 112021110128718-pat00023
    는 각각 상기 제1 원본 금융거래 상태 벡터 및 상기 제1 변형 금융거래 상태 벡터를 의미하며,
    Figure 112021110128718-pat00024
    Figure 112021110128718-pat00025
    는 각각 상기 제1 원본 판별값 및 상기 제1 변형 판별값을 의미하는 것을 특징으로 하는 장치.
  15. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 장치에 있어서,
    인스트럭션들을 저장하는 하나 이상의 메모리; 및
    상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (II) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스
    를 수행하되,
    상기 (I) 프로세스 이전에,
    상기 프로세서가, (I0) 각각의 상기 제1 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 제1 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 제1 그래프형 학습 데이터를 획득하는 프로세스
    를 더 수행하는 것을 특징으로 하는 장치.
  16. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 장치에 있어서,
    인스트럭션들을 저장하는 하나 이상의 메모리; 및
    상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (II) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스
    를 수행하되,
    상기 프로세서가, (III) 상기 GNN으로 하여금, 제3 금융거래 데이터에 대응하는 제3 그래프형 학습 데이터에 상기 대표화 연산을 가하여 제3 금융거래 상태 벡터를 생성하도록 한 후, 상기 기준 클러스터 및 상기 제3 금융거래 상태 벡터를 참조하여 이상 탐지 연산을 수행함으로써 상기 GNN 및 상기 기준 클러스터에 대한 탐지도를 계산하도록 한 다음, 상기 탐지도를 참조하여 (i) 상기 GNN의 정보량 하이퍼파라미터, (ii) 상기 기준 클러스터의 다양성 하이퍼파라미터 및 (iii) 상기 이상 탐지 연산의 민감도 하이퍼파라미터를 조정함으로써 제3 학습을 수행하는 프로세스
    를 더 수행하는 것을 특징으로 하는 장치.
  17. 제11항에 있어서,
    상기 (II) 프로세스는,
    상기 프로세서가, K-Means 알고리즘을 통해 상기 클러스터링 연산을 수행함으로써 상기 제2 금융거래 상태 벡터들 중 서로 간의 유사도가 임계치 이상인 것들을 포함하는 적어도 하나의 상기 기준 클러스터를 생성하는 것을 특징으로 하는 장치.
  18. 그래프 기반 Fraud Detection System(FDS)를 위한 비지도 학습 방법에 기반한 테스트 장치에 있어서,
    인스트럭션들을 저장하는 하나 이상의 메모리; 및
    상기 인스트럭션들을 수행하도록 설정된 하나 이상의 프로세서를 포함하되, 상기 프로세서는, (I) (1) 각각의 제1 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 제1 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 제1 그래프형 학습 데이터가 획득되면, Graph Neural Network(GNN)로 하여금, 상기 제1 그래프형 학습 데이터에 적어도 하나의 대표화 연산을 가하여, 상기 제1 그래프형 학습 데이터에 대한 정보를 포함하는 복수의 제1 금융거래 상태 벡터를 생성하도록 한 후, 상기 제1 금융거래 상태 벡터를 참조하여 상기 GNN의 파라미터들 중 적어도 일부를 학습함으로써 제1 학습을 수행하는 프로세스; (2) 상기 제1 학습이 완료되면, 상기 GNN으로 하여금, 제2 금융거래 데이터에 대응하는 제2 그래프형 학습 데이터에 상기 대표화 연산을 가하여 복수의 제2 금융거래 상태 벡터를 생성하도록 한 후, 상기 제2 금융거래 상태 벡터에 적어도 하나의 클러스터링 연산을 가하여 적어도 하나의 기준 클러스터를 생성함으로써 제2 학습을 수행하는 프로세스를 수행함으로써 학습이 완료된 상태에서, 각각의 테스트용 금융거래 데이터에 대응하는 각각의 노드 값 및 상기 테스트용 금융거래 데이터 간의 연관성에 대응하는 각각의 에지 값에 대한 정보를 포함하는 그래프형 테스트 데이터가 획득되면, 상기 GNN으로 하여금, 상기 그래프형 테스트 데이터에 상기 대표화 연산을 가하여, 상기 그래프형 테스트 데이터에 대한 정보를 포함하는 테스트용 금융거래 상태 벡터를 생성하도록 하는 프로세스; 및 (II) 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터를 참조하여 이상 탐지 연산을 수행하는 프로세스
    를 수행하는 것을 특징으로 하는 장치.
  19. 제18항에 있어서,
    상기 (II) 프로세스는,
    상기 프로세서가, 상기 테스트용 금융거래 상태 벡터 및 상기 기준 클러스터들 간의 유사도를 계산한 후, 상기 유사도들 중 적어도 하나가 임계치 이상일 경우 상기 테스트용 금융거래 상태 벡터가 이상 데이터에 대응하고, 상기 유사도들 모두가 상기 임계치 미만일 경우 상기 테스트용 금융거래 상태 벡터가 정상 데이터에 대응하는 것으로 판단함으로써 상기 이상 탐지 연산을 수행하는 것을 특징으로 하는 장치.
  20. 제18항에 있어서,
    상기 (I) 프로세스 이전에,
    상기 프로세서가, (I0) 각각의 상기 테스트용 금융거래 데이터를 벡터화함으로써 각각의 상기 노드 값을 획득하고, 각각의 상기 테스트용 금융거래 데이터에 적어도 하나의 연관화 연산을 가하여 각각의 상기 에지 값을 획득함으로써 상기 그래프형 테스트 데이터를 획득하는 프로세스
    를 더 수행하는 것을 특징으로 하는 장치.
KR1020210079004A 2021-06-17 2021-06-17 그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 KR102336035B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210079004A KR102336035B1 (ko) 2021-06-17 2021-06-17 그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210079004A KR102336035B1 (ko) 2021-06-17 2021-06-17 그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치

Publications (1)

Publication Number Publication Date
KR102336035B1 true KR102336035B1 (ko) 2021-12-07

Family

ID=78868042

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210079004A KR102336035B1 (ko) 2021-06-17 2021-06-17 그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치

Country Status (1)

Country Link
KR (1) KR102336035B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115801549A (zh) * 2023-01-28 2023-03-14 中国人民解放军国防科技大学 基于关键节点识别的自适应网络恢复方法、装置及设备
KR102521246B1 (ko) * 2023-01-30 2023-04-14 주식회사 그래파이 엣지 기반 트랜잭션 사기 탐지 방법 및 이를 수행하는 장치
CN117745423A (zh) * 2023-09-21 2024-03-22 深圳前海微众银行股份有限公司 一种异常账户的识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Part 1 of an abnormal transaction detection system model using unsupervised deep learning *
Part 1 of Pattern Classification Model Using LVQ Optimized with Fuzzy Membership Function* *
What Happens Behind the Scene? Towards Fraud Community Detection in E-Commerce from Online to Offline 1부* *
비지도학습 딥러닝을 활용한 이상거래탐지 시스템 모델 1부*
퍼지 멤버쉽 함수로 최적화된 LVQ를 이용한 패턴 분류 모델 1부*

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115801549A (zh) * 2023-01-28 2023-03-14 中国人民解放军国防科技大学 基于关键节点识别的自适应网络恢复方法、装置及设备
CN115801549B (zh) * 2023-01-28 2023-06-16 中国人民解放军国防科技大学 基于关键节点识别的自适应网络恢复方法、装置及设备
KR102521246B1 (ko) * 2023-01-30 2023-04-14 주식회사 그래파이 엣지 기반 트랜잭션 사기 탐지 방법 및 이를 수행하는 장치
CN117745423A (zh) * 2023-09-21 2024-03-22 深圳前海微众银行股份有限公司 一种异常账户的识别方法

Similar Documents

Publication Publication Date Title
CN110070141B (zh) 一种网络入侵检测方法
TWI769271B (zh) 基於遷移深度學習的風險識別方法以及系統
Ikram et al. Improving accuracy of intrusion detection model using PCA and optimized SVM
CN111898758B (zh) 一种用户异常行为识别方法、装置及计算机可读存储介质
KR102336035B1 (ko) 그래프 기반 이상 거래 탐지 시스템을 위한 비지도 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치
KR102389094B1 (ko) 이상 패턴 감지 시스템 및 방법
WO2019051941A1 (zh) 车型识别方法、装置、设备及计算机可读存储介质
CN111064721A (zh) 网络流量异常检测模型的训练方法及检测方法
US20200286095A1 (en) Method, apparatus and computer programs for generating a machine-learning system and for classifying a transaction as either fraudulent or genuine
Bigdeli et al. Incremental anomaly detection using two-layer cluster-based structure
US10733385B2 (en) Behavior inference model building apparatus and behavior inference model building method thereof
CN110874471B (zh) 保护隐私安全的神经网络模型的训练方法和装置
US20200265307A1 (en) Apparatus and method with multi-task neural network
CN114298176A (zh) 一种欺诈用户检测方法、装置、介质及电子设备
CN112348080A (zh) 基于工控异常检测的rbf改进方法、装置和设备
CN109388944A (zh) 一种基于kpca和elm的入侵检测方法
KR102283054B1 (ko) Api 호출 그래프 추출 기반 모바일 애플리케이션 악성 행위 패턴 탐지 방법, 이를 수행하기 위한 기록 매체 및 장치
KR20190015160A (ko) 인공 신경망의 훈련 방법
CN113343123B (zh) 一种生成对抗多关系图网络的训练方法和检测方法
KR20200029426A (ko) 인공지능 기반의 보험금 부당청구 및 부당패턴 탐지 장치 및 방법
KR102009376B1 (ko) 인공지능 기반 악성 연체 탐지 장치 및 방법
Yang et al. Subtractive Clustering Based RBF Neural Network Model for Outlier Detection.
CN114003900A (zh) 变电站二次系统网络入侵检测方法、装置及系统
EP3499429A1 (en) Behavior inference model building apparatus and method
Kajal et al. Credit card fraud detection using imbalance resampling method with feature selection

Legal Events

Date Code Title Description
GRNT Written decision to grant