KR102663767B1 - Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법 - Google Patents

Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법 Download PDF

Info

Publication number
KR102663767B1
KR102663767B1 KR1020230086795A KR20230086795A KR102663767B1 KR 102663767 B1 KR102663767 B1 KR 102663767B1 KR 1020230086795 A KR1020230086795 A KR 1020230086795A KR 20230086795 A KR20230086795 A KR 20230086795A KR 102663767 B1 KR102663767 B1 KR 102663767B1
Authority
KR
South Korea
Prior art keywords
virtual asset
risk
wallet
wallet address
transaction
Prior art date
Application number
KR1020230086795A
Other languages
English (en)
Inventor
한태우
박진형
이금강
김건오
박혜연
이한주
정규환
전효연
Original Assignee
주식회사 보난자팩토리
주식회사 하눌컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 보난자팩토리, 주식회사 하눌컴퍼니 filed Critical 주식회사 보난자팩토리
Priority to KR1020230086795A priority Critical patent/KR102663767B1/ko
Application granted granted Critical
Publication of KR102663767B1 publication Critical patent/KR102663767B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/36Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes
    • G06Q20/367Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes involving electronic purses or money safes
    • G06Q20/3678Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes involving electronic purses or money safes e-cash details, e.g. blinded, divisible or detecting double spending
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/36Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes
    • G06Q20/367Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes involving electronic purses or money safes
    • G06Q20/3674Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes involving electronic purses or money safes involving authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3827Use of message hashing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3829Payment protocols; Details thereof insuring higher security of transaction involving key management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/403Solvency checks
    • G06Q20/4037Remote solvency checks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/101Access control lists [ACL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은, AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법에 관한 것으로서, 본 발명에 따른 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법은, 가상자산 관련 블록체인 네트워크의 온체인 데이터를 구성하는 트랜잭션 정보와 가상자산 전자지갑 주소를 수집하여 고위험 가상자산 전자지갑주소를 추정하기 위한 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 1 학습데이터DB를 생성하는 온체인 데이터 기반 제 1 학습데이터DB 생성 단계; 가상자산 지갑주소 정보가 게시되는 특정 웹사이트 리소스를 크롤링하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 2 학습데이터 DB를 생성하는 온라인 리소스 기반 제 2 학습데이터 DB 생성단계; 및 상기 제 1 학습데이터DB 생성단계에서 생성된 제 1 학습데이터DB와 상기 제 2 학습데이터DB 생성단계에서 생성된 제 2 학습데이터DB에 저장된 정보를 이용하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 학습모델을 학습시켜 고위험 가산자산 지갑주소를 추정하는 GAT스코어가 저장된 GAT 블랙리스트DB를 자동으로 생성 및 업데이트 하는 GAT 블랙리스트DB 자동 업데이트 단계;를 포함할 수 있다.
따라서, 본 발명은, 블록체인을 기반으로 하여 별도의 본인인증절차 없이 간단하게 전자지갑을 생성하는 가상자산의 특성상 자금 추적이 어려운 고위험 전자지갑 주소에 대한 블랙리스트 DB를 구축함으로써 고위험 가상자산 지갑주소에 대한 부정사용을 사전에 차단함과 동시에 가상자산 거래소를 보호할 수 있는 효과가 있다.

Description

AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법 { AUTO UPDATE METHOD FOR HIGH-RISK WALLET ADDRESS DATABASE OF VIRTUAL ASSETS BASED ON ARTIFICIAL INTELLIGENCE }
본 발명은 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법에 관한 것으로서, 가상자산 관련 온체인 데이터의 트랜잭션 정보 및 가상자산 지갑주소 정보와 유해정보를 취급하는 온라인 매체를 대상으로 하는 리소스 크롤링을 통해 추출한 고위험 지갑주소 정보를 Graph Attention Network 기반의 인공지능 모델을 이용해 학습시켜 가상자산 고위험 지갑주소 DB를 자동으로 생성 구축함으로써 자금추적이 어려운 고위험 지갑주소의 부정사용을 사전에 차단함과 동시에 가상자산 거래소를 보호할 수 있는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법에 관한 것이다.
가상자산은 지폐·동전 등의 실물이 없고 온라인에서 거래되는 자산을 말한다. 가상자산 거래소는 가상자산을 직접 사고 파는 일을 돕기 위해 가상자산을 가진 사람과 그것을 사고자 하는 사람을 기능적으로 연결시켜 주는 역할을 한다. 우선, 가상자산을 거래하기 위해서는 고객이 거래소 홈페이지에 들어가 회원가입을 한 뒤 실명 확인한 계좌로 자금을 이체한다. 그리고 이체된 자금으로 가상자산을 매매할 수 있고, 또한, 가상자산 거래소가 지급하는 개인 전자지갑을 이용하여 가상자산을 다른 전자지갑 주소로 전송하거나 전송 받을 수 있다.
일반적으로, 가상자산 전자지갑은 암호화 키를 보관하고 있으며, 보관된 암호화 키(또는 개인 키)를 이용한 신원 증명을 통해 가상자산에 접근할 수 있다. 또한, 이러한 가상자산 전자지갑은 가상자산에 접근하여 사용자 간 가상자산을 보내거나 받고, 거래를 수행할 수 있도록 한다. 또한, 가상자산 전자지갑은 해당 지갑 생성 시 지갑주소가 생성되며, 이러한 지갑주소는 다른 사용자에게 가상자산 전송하거나 거래시 사용될 수 있다.
그런데, 고객이 가상자산 거래소 전자지갑에서 보유 가상자산을 다른 가상자산 거래소로 전송하고자 할 때, 수신자 전자지갑의 위험성을 파악할 수 없어 범죄 위험성이 있는 전자지갑으로 가상자산을 전송하고자 하는 고객을 통제할 수 없는 문제점이 있었다.
따라서, 가상자산 거래소는 고객이 이용하는 전자지갑 주소의 위험성을 파악할 수 있는 현실적인 기술이 필요하다.
대한민국 공개특허 제10-2020-0073803호(공개일 2020년 06월 24일)
Velickovic, Petar, et al. "Graph attention networks." arXiv preprint arXiv:1710.10903 (2017)
본 발명은 상기 문제점을 해결하기 위하여 안출된 것으로서, 본 발명은, 블록체인을 기반으로 하여 별도의 본인인증절차 없이 간단하게 전자지갑을 생성하는 가상자산의 특성상 자금 추적이 어려운 고위험 전자지갑 주소에 대한 블랙리스트 DB를 구축함으로써 고위험 가상자산 지갑주소에 대한 부정사용을 사전에 차단함과 동시에 가상자산 거래소를 보호할 수 있는데 목적이 있다.
또한, 본 발명은, 고위험 전자지갑 주소에 대한 블랙리스트 DB구축은 물론 가상자산 거래소에서 사용하는 화이트리스트 DB를 제공하여 가상자산 고위험 지갑주소 DB 관리시스템의 신뢰도를 향상시키는데 목적이 있다.
또한, 본 발명은, 특정 가상자산 관련 블록체인 네트워크의 트랜잭션정보를 포함하는 온체인 데이터의 가상자산 지갑주소 관련 정보와 유해정보를 취급하는 온라인 매체를 대상으로 하는 리소스 크롤링을 통해 추출한 고위험 지갑주소 관련 정보를 추정할 수 있는 GAT스코어를 생성하기 위하여 고위험 지갑주소로 라벨링 되지 않은 정보까지 GAT 기반의 인공지능 모델을 이용해 학습하고 예측함으로써 가상자산 고위험 지갑주소 DB를 자동으로 업데이트 시킬 수 있는데 목적이 있다.
또한, 본 발명은, 가상자산을 구성하는 블록체인 네트워크에서 추출된 트랜잭션 정보를 GAT 기반의 인공지능 모델에 학습이 가능한 형태로 전처리 함으로써 처리효율을 높이고 인공지능 기반의 가상자산 고위험 지갑주소 DB 구축 성능을 향상시키는데 목적이 있다.
또한, 본 발명은, 온라인 리소스 크롤링을 통해 추출한 전자지갑 주소를 추출하고 필터링하는 경우에 고위험 전자지갑 주소에 대한 블랙리스트 DB 뿐만 아니라 국내 가상자산 거래소에서 정상적으로 거래되는 유효 전자지갑 주소에 대한 화이트리스트 DB도 구축함으로써 고위험 가상자산 지갑관련 블랙리스트 DB의 신뢰성을 향상시키는데 목적이 있다.
본 발명의 일 실시예에 따른 I기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법은, 가상자산 관련 블록체인 네트워크의 온체인 데이터를 구성하는 트랜잭션 정보와 가상자산 전자지갑 주소를 수집하여 고위험 가상자산 전자지갑주소를 추정하기 위한 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 1 학습데이터DB를 생성하는 온체인 데이터 기반 제 1 학습데이터DB 생성 단계; 가상자산 지갑주소 정보가 게시되는 특정 웹사이트 리소스를 크롤링하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 2 학습데이터 DB를 생성하는 온라인 리소스 기반 제 2 학습데이터 DB 생성단계; 및 상기 제 1 학습데이터DB 생성단계에서 생성된 제 1 학습데이터DB와 상기 제 2 학습데이터DB 생성단계에서 생성된 제 2 학습데이터DB에 저장된 정보를 이용하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 학습모델을 학습시켜 고위험 가산자산 지갑주소를 추정하는 GAT스코어가 저장된 GAT 블랙리스트DB를 자동으로 생성 및 업데이트 하는 GAT 블랙리스트DB 자동 업데이트 단계;를 포함할 수 있다.
또한, 상기 제 1 학습데이터DB 생성 단계는, 특정 가상자산에 대응되는 클라이언트를 이용해 특정 가상자산의 전체 블록체인 네트워크를 구성하는 단계; 상기 특정 가산자산의 전체 블록체인 네트워크에 접속하여 전체 트랜잭션 데이터를 추출하는 단계; 상기 전체 트랜잭션 데이터로부터 상기 그래프 어텐션 네트워크 기반의 인공지능 학습모델에 사용하는데 필요한 트랜잭션 ID 및 송수신자에 대응되는 가상자산지갑주소를 포함한 공통항목 정보를 추출하는 단계; 상기 추출된 공통항목 정보 중 트랜잭션ID를 순차적인 정수값으로 인덱싱하여 인덱스 넘버를 갖는 트랜잭션 분석 정보를 트랜잭션 인덱스 DB에 저장하는 단계; 및 상기 트랜잭션 인덱스 DB에 저장된 정보 중 가상자산지갑주소에 대응되는 입력 트랜잭션 인덱스 넘버와 출력 트랜잭션 인덱스 넘버를 어드레스 DB에 저장하는 단계;를 포함할 수 있다.
또한, 상기 트랜잭션 인덱스 DB는, Key값 및 Value값을 갖는 DOCUMENT 기반의 DB 자료구조를 가지며, 정수값으로 인덱싱된 트랜잭션 ID, 트랜잭션 해쉬(TXID), 블럭넘버, 전송량, input 가상자산 지갑주소정보, output 가상자산 지갑주소 정보 정보를 포함할 수 있다.
또한, 상기 제 2 학습데이터 DB 생성단계는, 가상자산 거래소 관련 트랜잭션 정보를 분석하여 정상적인 거래가 가능한 가상자산 전자지갑주소가 저장되는 화이트리스트 DB를 생성하는 단계; 및 특정 웹사이트에 대응되는 온라인 리소스 크롤링을 기반으로 하여 추출한 고위험 가상자산 지갑주소가 저장되는 메인 블랙리스트 DB를 생성하는 단계;를 포함할 수 있다.
또한, 상기 화이트리스트 DB를 생성하는 단계는, 오픈웹 커뮤니티에 대한 특정키워드를 이용한 온라인 리소스 크롤링을 통해 화이트리스트 후보군에 해당하는 제 1 가상자산 지갑주소 리스트를 추출하는 단계; 더스팅 기법을 사용하여 가상자산 거래소가 보유한 것으로 추정되는 제 2 가상자산 지갑주소 리스트를 추출하는 단계; 상기 온라인 리소스 크롤링을 통해 추출한 제 1 가상자산 지갑주소 리스트와 상기 더스팅 기법으로 추출한 제 2 가상자산 지갑주소 리스트를 비교 검증하여 베이직 화이트리스트를 생성하는 단계; 상기 베이직 화이트리스트를 생성하는 단계에서 생성된 정상거래 지갑으로 추정되는 가상자산 지갑주소에 대응되는 베이직 화이트리스트의 트랜잭션 패턴 분석을 통해 가상자산 거래소의 지갑주소로 추정되는 스케일업 화이트리스트를 생성하는 단계; 및 상기 스케일업 화이트리스트에 해당하는 다수의 가상자산 지갑주소들에 대해 클러스터링을 수행함으로써 가상자산 거래소의 지갑주소로 추정됨과 동시에 구조화된 파이널 화이트 리스트를 생성하여 화이트리스트 DB에 저장하는 단계;를 포함할 수 있다.
또한, 상기 메인 블랙리스트 DB를 생성하는 단계는, 온라인 리소스 자동 업데이트 모듈을 이용해 고위험 전자지갑 주소가 사용되는 특정 온라인 리소스를 자동으로 업데이트 하는 단계; 상기 자동으로 업데이트 되는 특정 온라인 리소스에서 특정 키워드 및 특정 크기의 가상자산의 전송량을 크롤링하는 단계; 상기 특정 키워드 및 특정 크기의 가상자산의 전송량에 대응되는 해당 가상자산 지갑주소를 고위험 가상자산 지갑주소로 추출하는 단계; 상기 제1차 고위험 가상자산 지갑주소로 추출된 가상자산 지갑주소 리스트에 저장된 가상자산 지갑주소 중 상기 정상적인 거래가 가능한 가상자산 전자지갑주소가 저장되는 화이트리스트 DB에 저장된 가상자산 지갑주소를 제거하고 유의미한 주소를 필터링 하는 단계; 및 상기 필터링이 완료된 고위험 가상자산 지갑주소를 위험도 수준에 따른 리스크 스코어를 기록하여 저장함으로써 메인 블랙리스트DB를 생성하는 단계;를 구비할 수 있다.
또한, 상기 메인 블랙리스트DB에 저장되는 가상자산의 종류가 비트코인일 경우에, 상기 특정 키워드 및 특정 크기의 가상자산의 전송량에 대응되는 해당 가상자산 지갑주소를 고위험 가상자산 지갑주소로 추출하고 유의미한 주소를 필터링 한 단계 이후에 동일 가상자산 지갑주소를 클러스터링하는 과정을 수행할 수 있다.
또한, 상기 GAT 블랙리스트DB 자동 업데이트 단계는, 상기 제 1 학습데이터DB를 구성하는 온체인 트랜잭션 DB를 이용하여 전체 트랜잭션에 대해 그래프 어텐션 네트워크 기반의 GAT 그래프 구조를 추출하는 단계; 상기 추출된 GAT 그래프 구조를 구성하는 연결관계를 엣지로 대응시킨 인접행렬을 생성하는 단계; 상기 제 2 학습데이터DB를 구성하는 메인블랙리스트 DB를 이용하여 원-핫 인코딩 방식으로 위험 카테고리별로 데이터를 행렬화 시키는 단계; 상기 메인블랙리스트 DB의 위험 카테고리별로 행렬화된 데이터에 대해 크롤링 수집시 온라인 원천 사이트별로 사전 설정된 가중치를 부여하여 특성행렬을 생성하는 단계; GAT 그래프 구조의 노드와 엣지를 구성하는 상기 특성행렬과 상기 인접행렬을 어텐션 레이어에 통과시켜 고위험 가상자산 지갑주소로 라벨링된 학습데이터에 대한 사전 학습모델을 생성하는 단계; 상기 사전 학습모델을 활용하여 고위험 가상자산 지갑주소에 대한 라벨이 없는 데이터를 예측하고 그 예측 결과를 고위험 가상자산 지갑주소를 추정하는 GAT 스코어로 사용하는 준지도학습 기반의 메인 학습모델을 수행하는 단계; 및 상기 메인 학습모델을 반복적으로 수행하여 고위험 가상자산 지갑주소를 추정하는 GAT 스코어가 저장된 GAT 블랙스트DB를 자동으로 생성 및 업데이트 하는 단계;를 포함할 수 있다.
또한, 상기 GAT 스코어가 저장된 GAT 블랙스트DB를 자동으로 생성 및 업데이트 하는 단계는, 임의의 가상자산 지갑주소를 입력하는 단계; 상기 임의의 가상자산 지갑주소와 인접한 모든 트랜잭션을 조회하는 단계; 상기 모든 트랜잭션 각각에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소로 추정되는 확률값을 조회하는 단계; 상기 각각의 트랜잭션에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소의 추정되는 확률값을 모두 병합하여 상기 임의의 가상자산 지갑주소에 대한 전체 위험도를 산출하는 단계; 및 상기 임의의 가상자산 지갑주소에 대한 전체 위험도에 일대일 대응되며 고위험 가상자산 지갑주소를 추정하는 GAT 스코어를 출력하는 단계;를 포함할 수 있다.
또한, 상기 특성행렬을 생성하는 단계는, BTC 네트워크의 경우에 전체 트랜잭션을 그래프 구조의 노드로 대응시키고, ETH 네트워크의 경우에는 전체 지갑주소를 그래프 구조의 노드로 대응시켜 고위험 가산자산의 지갑주소 또는 트랜잭션의 카테고리 분류값으로 특성행렬을 생성할 수 있다.
또한, 상기 GAT 그래프 구조를 구성하는 연결관계를 엣지로 대응시킨 인접행렬을 생성하는 단계는, BTC 네트워크의 경우에는 트랜잭션간 연결관계를 엣지로 대응시키고, ETH 네트워크의 경우에는 지갑주소간 연결관계를 엣지로 대응시킨 인접행렬을 생성할 수 있다.
상기 GAT 스코어가 저장된 GAT 블랙스트DB를 자동으로 생성 및 업데이트 하는 단계는, 임의의 가상자산 지갑주소를 입력하는 단계; 상기 임의의 가상자산 지갑주소와 인접한 모든 트랜잭션을 조회하는 단계; 상기 모든 트랜잭션 각각에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소로 추정되는 확률값을 조회하는 단계; 상기 각각의 트랜잭션에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소의 추정되는 확률값을 모두 병합하여 상기 임의의 가상자산 지갑주소에 대한 전체 위험도를 산출하는 단계; 및 상기 임의의 가상자산 지갑주소에 대한 전체 위험도에 일대일 대응되며 고위험 가상자산 지갑주소를 추정하는 GAT 스코어를 출력하는 단계;를 포함할 수 있다.
상기 모든 트랜잭션 각각에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소로 추정되는 확률값을 조회하는 단계는, 상기 GAT 블랙리스트 DB에서 임의의 가상자산 지갑주소와 관련된 블록체인 네트워크 내 모든 트랜잭션을 조회하는 단계; 상기 모든 트랜잭션 중에서 고위험 가상자산 지갑주소를 추정하는 GAT 스코어로 라벨링된 트랜젝션데이터를 활용하여 고위험 가상자산 지갑주소에 대한 라벨이 없는 데이터를 예측하고 그 예측 결과를 고위험 가상자산 지갑주소를 추정하는 위험 확률값으로 사용하는 단계; 및 상기 모든 트랜잭션 각각에 대하여 위험 카테고리 분류 및 고위험 가상자산 지갑주소를 추정하는 확률값을 저장하는 고위험 가상자산 지갑주소 확률 DB를 구축하는 단계;를 포함할 수 있다.
이상에서 설명한 바와 같이, 본 발명은, 블록체인을 기반으로 하여 별도의 본인인증절차 없이 간단하게 전자지갑을 생성하는 가상자산의 특성상 자금 추적이 어려운 고위험 전자지갑 주소에 대한 블랙리스트 DB를 구축함으로써 고위험 가상자산 지갑주소에 대한 부정사용을 사전에 차단함과 동시에 가상자산 거래소를 보호할 수 있는 효과가 있다.
또한, 본 발명은, 고위험 전자지갑 주소에 대한 블랙리스트 DB구축은 물론 가상자산 거래소에서 사용하는 화이트리스트 DB를 제공하여 가상자산 고위험 지갑주소 DB 관리시스템의 신뢰도를 향상시키는 효과가 있다.
또한, 본 발명은, 특정 가상자산 관련 블록체인 네트워크의 트랜잭션정보를 포함하는 온체인 데이터의 가상자산 지갑주소 관련 정보와 유해정보를 취급하는 온라인 매체를 대상으로 하는 리소스 크롤링을 통해 추출한 고위험 지갑주소 관련 정보를 추정할 수 있는 GAT스코어를 생성하기 위하여 고위험 지갑주소로 라벨링 되지 않은 정보까지 GAT 기반의 인공지능 모델을 이용해 학습하고 예측함으로써 가상자산 고위험 지갑주소 DB를 자동으로 업데이트 시킬 수 있는 효과가 있다.
또한, 본 발명은, 가상자산을 구성하는 블록체인 네트워크에서 추출된 트랜잭션 정보를 GAT 기반의 인공지능 모델에 학습이 가능한 형태로 전처리 함으로써 처리효율을 높이고 인공지능 기반의 가상자산 고위험 지갑주소 DB 구축 성능을 향상시키는 효과가 있다.
또한, 본 발명은, 온라인 리소스 크롤링을 통해 추출한 전자지갑 주소를 추출하고 필터링하는 경우에 고위험 전자지갑 주소에 대한 블랙리스트 DB 뿐만 아니라 국내 가상자산 거래소에서 정상적으로 거래되는 유효 전자지갑 주소에 대한 화이트리스트 DB도 구축함으로써 고위험 가상자산 지갑관련 블랙리스트 DB의 신뢰성을 향상시키는 효과가 있다.
도 1은 본 발명의 실시예에 따른 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법을 나타내기 위한 흐름도이다.
도 2는 본 발명의 실시예에 따른 가상자산 고위험 지갑주소 DB 관리시스템을 개략적으로 나타낸 도면이다.
도 3은 도 2에 도시된 AI엔진을 개략적으로 설명하기 위한 도면이다.
도 4 내 도 6은 본 발명의 실시예에 따른 온체인 데이터 분석모듈을 설명하기 위한 도면이다.
도 7 내지 도 11은 본 발명의 실시예에 따른 온라인 블랙리스트 분석모듈을 설명하기 위한 도면이다.
도 12 내지 도 19는 본 발명의 실시예에 따른 GAT 기반의 AI엔진을 설명하기 위한 도면이다.
이상의 본 발명의 목적들, 다른 목적들, 특징들 및 이점들은 첨부된 도면과 관련된 이하의 바람직한 실시 예들을 통해서 쉽게 이해될 것이다. 그러나 본 발명은 여기서 설명되는 실시 예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 오히려, 여기서 소개되는 실시 예들은 개시된 내용이 철저하고 완전해질 수 있도록 그리고 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 제공되는 것이다.
본 명세서에서, 어떤 구성요소가 다른 구성요소 상에 있다고 언급되는 경우에 그것은 다른 구성요소 상에 직접 형성될 수 있거나 또는 그들 사이에 제3의 구성요소가 개재될 수도 있다는 것을 의미한다.
본 명세서에서 제1, 제2 등의 용어가 구성요소들을 기술하기 위해서 사용된 경우, 이들 구성요소들이 이 같은 용어들에 의해서 한정되어서는 안 된다. 이들 용어들은 단지 어느 구성요소를 다른 구성요소와 구별시키기 위해서 사용되었을 뿐이다. 여기에 설명되고 예시되는 실시 예들은 그것의 상보적인 실시 예들도 포함한다.
또한, 제1 엘리먼트 (또는 구성요소)가 제2 엘리먼트(또는 구성요소) 상(ON)에서 동작 또는 실행된다고 언급될 때, 제1 엘리먼트(또는 구성요소)는 제2 엘리먼트(또는 구성요소)가 동작 또는 실행되는 환경에서 동작 또는 실행되거나 또는 제2 엘리먼트(또는 구성요소)와 직접 또는 간접적으로 상호 작용을 통해서 동작 또는 실행되는 것으로 이해되어야 할 것이다.
어떤 엘리먼트, 구성요소, 장치, 또는 시스템이 프로그램 또는 소프트웨어로 이루어진 구성요소를 포함한다고 언급되는 경우, 명시적인 언급이 없더라도, 그 엘리먼트, 구성요소, 장치, 또는 시스템은 그 프로그램 또는 소프트웨어가 실행 또는 동작하는데 필요한 하드웨어(예를 들면, 메모리, CPU 등)나 다른 프로그램 또는 소프트웨어(예를 들면 운영체제나 하드웨어를 구동하는데 필요한 드라이버 등)를 포함하는 것으로 이해되어야 할 것이다.
또한, 어떤 엘리먼트(또는 구성요소)가 구현됨에 있어서 특별한 언급이 없다면, 그 엘리먼트(또는 구성요소)는 소프트웨어, 하드웨어, 또는 소프트웨어 및 하드웨어 어떤 형태로도 구현될 수 있는 것으로 이해되어야 할 것이다.
또한, 본 명세서에서 사용된 용어는 실시 예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소는 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.
이하, 아래의 특정 실시 예들을 기술하는데 있어서, 여러 가지의 특정적인 내용들은 발명을 더 구체적으로 설명하고 이해를 돕기 위해 작성되었다. 하지만 본 발명을 이해할 수 있을 정도로 이 분야의 지식을 갖고 있는 독자는 이러한 여러 가지의 특정적인 내용들이 없어도 사용될 수 있다는 것을 인지할 수 있다.
어떤 경우에는, 발명을 기술하는 데 있어서 흔히 알려졌으면서 발명과 크게 관련 없는 부분들은 본 발명을 설명하는 데 있어 별 이유 없이 혼돈이 오는 것을 막기 위해 기술하지 않음을 미리 언급해 둔다.
이하, 본 명세서의 실시 예를 첨부된 도면을 참조하여 설명한다. 본 명세서에 따른 동작 및 작용을 이해하는 데 필요한 부분을 중심으로 상세히 설명한다. 본 명세서의 실시 예를 설명하면서, 본 명세서가 속하는 기술 분야에 익히 알려졌고 본 명세서와 직접적으로 관련이 없는 기술 내용에 대해서는 설명을 생략한다. 이는 불필요한 설명을 생략함으로써 본 명세서의 요지를 흐리지 않고 더욱 명확히 전달하기 위함이다.
또한, 본 명세서의 구성 요소를 설명하는 데 있어서, 동일한 명칭의 구성 요소에 대하여 도면에 따라 다른 참조부호를 부여할 수도 있으며, 서로 다른 도면임에도 동일한 참조부호를 부여할 수도 있다. 그러나 이와 같은 경우라 하더라도 해당 구성 요소가 실시 예에 따라 서로 다른 기능을 갖는다는 것을 의미하거나, 서로 다른 실시예에서 동일한 기능을 갖는다는 것을 의미하는 것은 아니며, 각각의 구성 요소의 기능은 해당 실시 예에서의 각각의 구성 요소에 대한 설명에 기초하여 판단하여야 할 것이다.
본 명세서에서 각각의 구성들은 기능 및/또는 논리적으로 분리될 수 있음을 나타내는 것이며, 반드시 각각의 구성이 별도의 물리적 장치로 구분되거나 별도의 코드로 작성됨을 의미하는 것은 아님을 본 발명의 기술분야의 평균적 전문가는 용이하게 추론할 수 있을 것이다.
또한, 본 명세서에서 각각의 구성들은, 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 소정의 코드와 소정의 코드가 수행되기 위한 하드웨어 리소스의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것이 아님은 본 발명의 기술분야의 평균적 전문가에게는 용이하게 추론될 수 있다.
본 발명에 따른 그래프 어텐션 네트워크는 Graph Attention Networks(GAT)논문을 통해 소개된 인공지능 기술로서, 보다 상세하게는 GNN(Graph Neural Networks)에 Attention(Self-Attention)을 적용하여 우승한 성능을 보인 기술을 가리킨다.
여기서, 어텐션(Attention)은 Dictionary자료구조인 Key, Query, Value로 구성되어 있고, Query와 Key의 유사도를 계산한 후 Value의 가중합을 계산하는 과정으로서 일반적으로 Attention score란 value에 곱해지는 가중치를 말하는 것이다.
또한, 본 발명의 실시예에서 그래프 어텐션 네트워크는 GNN의 네트워크 구조를 따르고 있는데, 여기서, GNN은 흔히 알고 있는 Neural Network의 input 형태가 아닌 그래프 구조에 대한 정보와 각 노드별 feature 정보의 두가지 input을 받는 Network를 말한다.
보다 상세하게는, 본 발명의 실시예에서 어텐션은 중요노드에 가중치를 부여하는 것으로, 본 발명의 실시예에 따른 어텐션 레이어(attention layer)는 딥러닝 모델에서 사용되는 레이어 중 하나로 시퀀스 데이터를 처리하는데 주로 사용될 수 있다.
여기서, 상기 어텐션 레이어는 입력 시퀀스의 각 요소에 대해 가중치를 계산하여, AI모델이 해당 요소에 더 집중하도록 유도하는 역할을 할 수 있다. 즉, 이를 통해 AI모델은 입력시퀀스에서 중요한 정보를 강조하고, 불필요한 정보는 덜 고려하도록 학습을 할 수 있다.
본 발명의 실시예에 적용된 어텐션 레이어는 다양한 종류가 있으며, 대표적으로 셀프 어텐션(Self-Attention)과 멀티 헤드 어텐션(Multi-head Attention)을 포함할 수 있다.
본 발명의 실시예에 따른 그래프 어텐션 네트워크(GAT)는 GNN(Graph Neural Networks)에 Self-Attention을 적용한 것이 바람직하다.
여기서, 상기 셀프 어텐션은 입력 시퀀스 내에서 각 요소간의 관계를 계산하는 방식으로 트랜스포머(transformer)모델에서 사용되고, 상기 멀티헤드 어텐션은 여러개의 어텐션 레이어를 결합하여 입력시퀀스의 다양한 측면을 고려하는 방식으로 BERT, GPT 등의 모델에 사용될 수 있다.
또한, 본 발명의 실시예에서 그래프 어텐션 네트워크를 설명하기 위해 후술하는 특성행렬(Feature Matrix)은 머신러닝과 통계분석에서 사용되는 데이터 표현 방법 중 하나로, 데이터셋에서 각 샘플의 특성을 열로, 각 샘플을 행으로 하는 행렬을 가리킨다. 즉, 각 열은 해당 특성의 값이고, 각 행은 각각의 샘플을 나타낸다. AI 모델에서 입력데이터로 사용할 수 있는데, 본 발명의 실시예에서는 그래프 구조의 노드에 해당하는 가상자산 지갑주소와 블랙리스트의 고위험 가상자산 지갑주소와의 연관성을 추출하여 특성행렬을 생성할 수 있다.
또한, 본 발명의 실시예에서 후술하는 인접행렬(Adjacency Matrix)은 그래프 이론에서 사용되는 행렬표현중 하나로, 그래프는 노드(node)와 노드 사이의 관계인 엣지(edge)로 구성된 자료구조로 인접행렬은 이러한 그래프를 행렬로 표현한 것이다. 엣지가 있으면 1, 없으면 0으로 표현 될 수 있다, 본 발명의 실시예에서는 멀티 INPUT, 멀티 OUTPUT 구조를 가진 비트코인의 경우에 트랜잭션 자체를 노드로 설정하고 트랜잭션과의 관계를 엣지로 설정하였으며, 이더리움 같은 단일 INPUT, 단일 OUTPUT 트랜잭션 구조는 가상자산의 지갑주소를 노드로 설정하고 상기 가상자산 지갑주소와 관련된 트랜잭션을 엣지로 설정하여 인접행렬을 생산할 수 있다.
이하, 도면을 참조하여 본 발명의 실시예를 설명한다.
도 1은 본 발명의 실시예에 따른 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법을 나타내기 위한 흐름도이고, 도 2는 본 발명의 실시예에 따른 가상자산 고위험 지갑주소 DB 관리시스템을 개략적으로 나타낸 도면이다.
본 발명에 따른 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법을 개략적으로 설명하면 다음과 같다.
먼저, 도 2에 도시된 온체인데이터 분석모듈(100)은 BTC, ETH 등의 가상자산관련 블록체인 네트워크를 통해 각 가상자산에 대한 원시데이터를 수집하고 정해진 규칙에 따라 파싱 및 인덱싱을 수행하여 본 발명의 실시예에 따른 그래프 어텐션 네트워크 모델의 학습데이터로 사용할 수 있는 제1 학습데이터를 제공할 수 있다.
다음으로, 도 2에 도시된 온라인 블랙리스트 분석모듈(200)은, 다크웹, 서피스웹, 텔레그램등의 온라인 리소스를 통해 고위험 가상자산 지갑주소를 수집하여 유의미한 지갑주소를 필터링 한 후 클러스터링 하여 고위험 가상자산 지갑주소에 대한 기본 블랙리스트를 구성할 수 있으며, 이를 본 발명의 실시예에 따른 그래프 어텐션 네트워크 모델의 학습데이터로 사용할 수 있는 제2 학습데이터로 사용할 수 있다.
또한, 도 2에 도시된 GAT AI엔진(300)은, 상술한 제1학습데이터와 제2 학습데이터를 통하여 GAT 모델의 그래프 구조를 구성하는 노드에 대응되는 가상자산 지갑주소의 특성을 분석한 후 티쳐(Teacher)모델을 학습하여 상기 고위험 가상자산 지갑주소에 대한 기본 블랙리스트와 연관된 가상자산 지갑주소(인접노드)를 통해 본 발명의 실시예에 따른 GAT 블랙리스트를 구성할 수 있다.
도 1을 참조하여 본 발명의 일 실시예에 따른 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법을 더욱 상세하게 설명하면, 온체인 데이터 기반 제 1 학습데이터 생성단계(S100)와, 온라인 리소스 기반 제 2 학습데이터 생성단계,(S200) 및 GAT블랙리스트 DB자동업데이트 단계(S300)를 포함할 수 있다.
보다 상세하게는, 상기 온체인 데이터 기반 제 1 학습데이터 생성단계(S100)는, 가상자산 관련 블록체인 네트워크의 온체인 데이터를 구성하는 트랜잭션 정보와 가상자산 전자지갑 주소를 수집하여 고위험 가상자산 전자지갑주소를 추정하기 위한 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 1 학습데이터DB를 생성할 수 있다.
또한, 상기 온라인 리소스 기반 제 2 학습데이터 DB 생성단계(S200)는, 가상자산 지갑주소 정보가 게시되는 특정 웹사이트 리소스를 크롤링하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 2 학습데이터 DB를 생성할 수 있다.
또한, 상기 GAT 블랙리스트DB 자동 업데이트 단계(S300)는, 상기 제 1 학습데이터DB 생성단계에서 생성된 제 1 학습데이터DB와 상기 제 2 학습데이터DB 생성단계에서 생성된 제 2 학습데이터DB에 저장된 정보를 이용하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 학습모델을 학습시켜 고위험 가산자산 지갑주소를 추정하는 GAT스코어가 저장된 GAT 블랙리스트DB를 자동으로 생성 및 업데이트 할 수 있다.
도 3은 도 2에 도시된 AI엔진을 개략적으로 설명하기 위한 도면이다.
도 3을 참조하여 본 발명의 실시예에 적용된 GAT AI엔진(300)에 대해 설명하면 다음과 같다.
도면에 도시된 바와 같이, 본 발명의 실시예에 따른 GAT AI엔진(300)은 먼저, 본 발명의 실시예에 따른 GAT 모델을 학습하기 위해 그래프 구조를 생성한다. 여기서, 가상자산 지갑주소 및 트랜잭션 중 하나를 그래프 구조의 노드로 하고 관련 거래정보를 이용해 인접한 노드를 연결할 수 있다.
다음으로, 고위험 가상자산 지갑주소를 이용해 GAT 기반의 학습모델을 학습할 수 있다.
다음으로, 학습된 모델을 사용하여 새로운 가상자산 지갑주소에 대한 고위험 가상자산 지갑주소 확률을 예측하여 GAT 스코어를 생성할 수 있다.
마지막으로, 상기 새로운 가상자산 지갑주소에 대한 GAT 스코어를 리스크 스코어와 함께 GAT블랙리스트 DB에 저장할 수 있다.
도 4 내지 도 19를 참조하여 본 발명을 구성하는 구성요소들에 대해 상세하게 설명하면 다음과 같다.
도 4 내 도 6은 본 발명의 실시예에 따른 온체인 데이터 분석모듈을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 온체인 데이터 분석모듈은 도면에 도시된 바와 같이, 각각의 가상자산이 속한 전체 블록체인 네트워크(Full Node)상에서 트랜잭션 및 가상자산 지갑주소정보를 추출함으로써 도 2 내지 도 3에 도시된 GAT AI엔진의 GAT 학습모델에 이용가능한 형태로 선별적으로 재가공하여 트랜잭션 INDEX DB와 ADDRESS DB를 포함한 제 1 학습데이터DB를 생성할 수 있다.
보다 상세하게는, 도 4에 도시된 바와 같이, 상기 제 1 학습데이터DB를 생성하는 단계는, 특정 가상자산에 대응되는 클라이언트를 이용해 특정 가상자산의 전체 블록체인 네트워크를 구성하는 단계(S110)와, 상기 특정 가산자산의 전체 블록체인 네트워크에 접속하여 전체 트랜잭션 데이터를 추출하는 단계(S120)와, 상기 전체 트랜잭션 데이터로부터 상기 그래프 어텐션 네트워크 기반의 인공지능 학습모델에 사용하는데 필요한 트랜잭션 ID 및 송수신자에 대응되는 가상자산지갑주소를 포함한 공통항목 정보를 추출하는 단계(S130), 상기 추출된 공통항목 정보 중 트랜잭션ID를 순차적인 정수값으로 인덱싱하여 인덱스 넘버를 갖는 트랜잭션 분석 정보를 트랜잭션 인덱스 DB에 저장하는 단계(S140), 및 상기 트랜잭션 인덱스 DB에 저장된 정보 중 가상자산지갑주소에 대응되는 입력 트랜잭션 인덱스 넘버와 출력 트랜잭션 인덱스 넘버를 어드레스 DB에 저장하는 단계(S150)를 포함할 수 있다.
여기서, 본 발명의 실시예로 제시된 비트코인과 이더리움과 같은 가상자산의 트랜잭션 리스트에서 공통 항목은, 송금자 지갑주소, 수신자 지갑주소, 가상자산 전송량, 송금수수료, 거래시간, 트랜잭션 해쉬, 이전거래출력, 및 서명을 포함할 수 있다.
본 발명의 실시예에서 비트코인 네트워크(BTC Network)는 Bitcoin Core 클라이언트 프로그램을 통해 비트코인 블록체인의 전체 네트워크를 구성하는 블록체인 노드(BTC full node)를 구축하고, 이더리움 네트워크(ETH Network)는 Erigon 클라이언트 프로그램을 통해 ETH Archive Node를 구축할 수 있다.
이때, 각각의 블록체인 네트워크를 구성하는 블록체인 노드에서 모든 거래내역에 해당하는 Raw Data를 추출하며, 특정가산지갑주소를 조회가 가능하도록 트랜잭션 아이디를 순차적인 정수로 재인덱싱하여 트랜잭션 INDEX DB와 ADDRESS DB에 저장할 수 있다.
또한, 상기 트랜잭션 INDEX DB와 ADDRESS DB는 빅데이터 처리를 위해 KEY-VALUE의 DICTIONARY 자료구조를 사용한 DOCUMENT 기반의 mongoDB를 사용할 수 있다.
여기서, 특정 지갑주소를 조회하면 상기 INEDX DB에서 특정지갑주소에 해당하는 트랜잭션을 순차적으로 조회할 수 있다.
더욱 상세하게는, 본 발명의 실시예에 따른 GAT AI학습모델에서는 전체 트랜잭션 데이터가 필요한데, 가상자산 중 대표적인 비트코인을 예로 들면, 비트코인 블록체인 네트워크 클라이언트인 Bitcoin Core의 데이터를 본 발명의 실시예에 따른 GAT AI 학습모델에 적용하기에는 용량 및 메모리 문제가 있다. 따라서, Raw Data를 GAT AI학습모델에 적용할 수 있는 학습데이터로 재가공하여 별도로 저장할 필요가 있다.
본 발명의 실시예에서는 용량을 줄이기 위해 전체 트랜잭션(23년6월8일 기준 약 8억5천만건)에 대한 트랜잭션 ID를 도 5 내지 도 6에 도시된 바와 같이, 순차적인 정수값으로 인덱싱하고, 전체 트랜잭션 정보의 ID값을 순차적인 정수값으로 변환하여 GAT AI학습모델에 필요로 하는 정보를 트랜잭션 INDEX DB에 저장할 수 있다.
상기 트랜잭션 INDEX DB에 저장되는 정보는 도 6 에 도시된 바와 같이, 인덱스 ID, 트랜잭션ID, 블럭, 전송량(VOLUME), INPUT 지갑주소 정보, OUTPUT 지갑주소 정보를 JSON 형태의 파일로 저장할 수 있다. 또한, 어드레스 DB에 저장되는 정보는 Input 트랜잭션들의 index와 Output 트랜잭션들의 Index가 저장이 되며, 필요시 주소 소유 코인량, 위험 카테고리 등이 추가 저장될 수 있다.
한편, 도면에는 기술하지 않았으나 가상자산 중 대표적인 이더리움의 경우엔 다양한 버전 및 다양한 방식의 블록체인 노드가 존재할 수 있다. 특히, Dapp 개발 및 운영의 목적으로 이더리움 블록체인 노드를 필요로 하지만 트랜잭션을 조회하고 분석하기 위하여 'Archive Node'를 Erigon 과 같은 이더리움 1.0클라이언트를 통하여 구축할 수 있다. Erigon의 경우 MBDX등 fsdb로 노드데이터가 저장이 되며, 세부 정보를 조회하기 위하여 JSONRPC와 같은 클라이언트 자체 제공 API를 통한 접근과 동시에 추가적으로 ETHEREUM-ETL과 같은 라이브러리를 통하여 데이터를 접근 및 가공할 수 있다.
이더리움의 경우에도 비트코인과 마찬가지로 GAT AI학습모델에 적용할 수 있는 학습데이터로 재가공하고자 필요한 데이터만 추출할 수 있으며, 추출된 학습데이터는 JSON파일형태로 GAT AI학습모델에 제공할 수 있다.
이와 같이, 본 발명의 실시예에 따른 트랜잭션 인덱스 DB는, Key값 및 Value값을 갖 는DOCUMENT 기반의 DB 자료구조를 가지며, 정수값으로 인덱싱된 트랜잭션 ID, 트랜잭션 해쉬(TXID), 블럭넘버, 전송량, input 가상자산 지갑주소정보, output 가상자산 지갑주소 정보 정보를 포함할 수 있다.
도 7 내지 도 11은 본 발명의 실시예에 따른 온라인 블랙리스트 분석모듈을 설명하기 위한 도면이다.
도 7을 참조하면, 본 발명의 실시예에 따른 온라인 블랙리스 분석모듈은, 앞서 상술한 GAT AI학습모델을 위한 제 2 학습데이터를 생성하기 위하여 화이트리스 DB와 메인블랙리스트 DB를 생성할 수 있다.
즉, 도 7에 도시된 바와 같이, 상기 제 2 학습데이터 DB 생성단계(S200)는, 화이트리스 DB를 생성하는 단계(S210)와 메인블랙리스트 DB를 생성하는 단계(S220)를 포함할 수 있다.
보다 상세하게는, 상기 화이트리스 DB를 생성하는 단계(S210)는, 가상자산 거래소 관련 트랜잭션 정보를 분석하여 정상적인 거래가 가능한 가상자산 전자지갑주소가 저장되는 화이트리스트 DB를 생성하는 단계일 수 있다.
도 8은 화이트리스트 DB를 생성하는 단계를 개략적으로 나타낸 것으로서, 도 8을 참조하면, 본 발명의 실시예에 따른 화이트리스트 DB를 생성하는 단계는, 제 1 가상자산 지갑주소 리스트를 추출하는 단계(S211), 제 2 가상자산 지갑주소 리스트를 추출하는 단계(S212), 베이직 화이트리스트를 생성하는 단계(S213), 스케일업 화이트리스트를 생성하는 단계(S214), 및 클러스터링을 수행하는 단계(215)를 포함할 수 있다.
더욱 상세하게는, 상기 제 1 가상자산 지갑주소 리스트를 추출하는 단계(S211)는, 오픈웹 커뮤니티에 대한 특정키워드를 이용한 온라인 리소스 크롤링을 통해 화이트리스트 후보군에 해당하는 제 1 가상자산 지갑주소 리스트를 추출하는 단계일 수 있다.
여기서, 상기 온라인 리소스 크롤링 과정을 추가로 설명하면, 가상자산 관련 온라인 커뮤니티 등에서, 예를 들어, '수익인증'과 유사한 키워드를 통해 관련 게시물의 텍스트 및 이미지파일을 크롤링 할 수 있으며, 즉, 가상자산 거래소로 송금한 인증이미지가 올라오는 경우에 인증이미지를 바탕으로 송금량과 시간을 추정하고, 거래소 정보를 바탕으로 가상자산 거래소로 추정되는 지갑주소를 추출할 수 있다.
다음으로, 상기 제 2 가상자산 지갑주소 리스트를 추출하는 단계(S212)는, 더스팅 기법을 사용하여 가상자산 거래소가 보유한 것으로 추정되는 제 2 가상자산 지갑주소 리스트를 추출하는 단계일 수 있다.
이때, 본 발명의 실시예에 사용되는 더스팅(Dusting)은, 블록체인에서 사용되는 용어 중 하나로, 매우 작은 양의 가상자산을 전송하는 것을 의미한 것으로서, 더스팅에 사용되는 매우 작은 양의 가상자산은 거의 가치가 없기 때문에 송신자나 수신자에게 혜택을 주지 않은데 반하여, 주로 블럭체인 네트워크에서 사용자의 주소를 추적하거나 그들의 정보를 수집하는 목적으로 사용될 수 있다. 즉, 특정사용자의 거래기록을 추적하거나 블록체인 네트워크 상에서 그들의 신원을 추적하는데 도움을 얻을 수 있다.
보다 상세하게는, 거래소에서 발급되는 개인용 입금주소는 개인마다 배정되어 있지만, 각각의 입금주소에서 거래소 핫월렛으로의 이동 트랜잭션은 특정고객이 다른 거래소 지갑으로 출금요청이 있어야 발생한다는 점을 이용하여 가상자산 거래소의 핫월렛을 추출할 수 있다.
구체적으로는, A거래소에서 전송가능한 최소양만큼의 특정가산자산을 구매하고, A거래소의 지갑에서 B거래소의 지갑으로 구매한 특정가산자산을 전송한다. 이후에, B거래소에서 특정가산자산을 판매하며, B거래소의 지갑에서 발생되는 트랜잭션을 관찰하며, 일정시간을 두고 상술한 과정을 N회 반복한다. 특히, 비트코인일 경우에는 자체 클러스터링을 통해 Multi Address를 확보할 수 있다.
다음으로, 상기 베이직 화이트리스트를 생성하는 단계(S213)는, 상기 온라인 리소스 크롤링을 통해 추출한 제 1 가상자산 지갑주소 리스트와 상기 더스팅 기법으로 추출한 제 2 가상자산 지갑주소 리스트를 비교 검증하여 베이직 화이트리스트를 생성하는 단계일 수 있다.
이와 같이, 본 발명의 실시예에서는, 자체 더스팅 요건에 맞게 효율적인 더스팅으로 정상거래 관련 가상자산 지갑주소를 추출하고 데이터 크롤링을 통해 추정한 주소를 교차 검증할 수 있다.
다음으로, 상기 스케일업 화이트리스트를 생성하는 단계(S214)는, 상기 베이직 화이트리스트를 생성하는 단계에서 생성된 정상거래 지갑으로 추정되는 가상자산 지갑주소에 대응되는 베이직 화이트리스트의 트랜잭션 패턴 분석을 통해 가상자산 거래소의 지갑주소로 추정되는 스케일업 화이트리스트를 생성하는 단계일 수 있다.
이때, 상기 베이직 화이트리스트의 트랜잭션 패턴 분석은, 거래소내 콜드월렛과 핫월렛 트랜잭션시 발생하는 패턴을 분석하는 것으로 특정패턴을 기반으로 하여 클러스터링 전단계의 추가적인 정상거래 지갑주소를 추출할 수 있다.
다음으로, 상기 클러스터링을 수행하는 단계(215)는, 상기 스케일업 화이트리스트에 해당하는 다수의 가상자산 지갑주소들에 대해 클러스터링을 수행함으로써 가상자산 거래소의 지갑주소로 추정됨과 동시에 구조화된 파이널 화이트 리스트를 생성하여 화이트리스트 DB에 저장하는 단계일 수 있다.
이때, 본 발명의 실시예에 따르면, 정상거래로 추정된 지갑주소로 추출된 주소를 기반으로 Multi Input Address, Change Address, Shadow Address를 클러스터링 하는 모듈을 통해 DB의 병합 및 확장을 할 수 있다.
본 발명의 실시예에서, 상기 Multi Input Address 에 대해 설명하면, 대부분의 논문에는 2개 이상의 주소가 하나의 동일한 트랜잭션에 입력되면 2개의 주소가 동일한 지갑에 속한다고 가정한다. 여기서, 한 트랜잭션에서 두 개 이상의 입력주소가 하나의 output 으로 비트코인을 보내는 경우 입력 주소는 모두 동일한 지갑으로 클러스트링이 가능하다. 초기 비트코인 시스템에서는 output수와 관계없이 동일한 사용자에 의해 제어되었지만, 여러 사용자가 하나의 트랜잭션에 참여할 수 있는 Coinjoin의 출현으로 Output이 하나인 경우에만 이 휴리스틱이 가능하게 수정되었다.
또한 본 발명의 실시예에서, 상기 Change Addressdp 대해 설명하면, 비트코인 트랜잭션을 생성하면서 Shadow Address라고 불리는 일회성 변경주소가 출력 주소 중 하나로 생성되고, 입력주소와 동일한 사용자가 소유하게 된다. 이때, Shadow Address는 전송하려는 비트코인 값에서 남는 값을 자신에게 전송하는 주소이다. 다음 설명할 2가지 휴리스틱은 이를 식별하기 위한 휴리스틱이다.
휴리스틱 Shadow Address Heuristic은, 하나의 거래(트랜잭션)에서 입금주소가 2개이며, 그 중 하나가 이전 기록이 없다면 Shadow Address일 확률이 높으므로 클러스터링 한다. Shadow 주소로 의심되는 주소의 최신 거래 시간이 기존 거래 시간과 매우 가까우면 새도 주소로 간주된다.
휴리스틱 Optimal Change Heuristic 의 경우에 지갑 소프트웨어는 트랜잭션 생성시 불필요한 입력주소를 선택하지 않는다는 가정을 기반으로 한다. 기본적으로 트랜잭션이 유효하려면 입력 값의 합계가 출력 값의 합계보다 커야한다. 따라서, 최소 입력 값이 변경 주소의 값보다 작으면 생략 가능한 주소가 선택된 경우이므로 변경 주소의 값은 입력 주소의 값의 최소값보다 작아야 한다. 트랜잭션의 출력이 최소 입력보다 작은 경우 변경 주소일 가능성이 크다. 즉,Output의 최소값이 input의 최소값보다 작으면 해당 output은 변경주소이다.(즉, 동일한 엔티티에 속함) 이 휴리스틱은 지갑이 미사용거래를 부주의하게 사용하지 않는 다는 가정에 기반한다. 또한, Output수에 대한 추가 제한을 추가했다. 그렇지 않으면 코인 Join 거래 등으로 인해 오탐이 될 수 있다.
도 9는 도 8에 도시된 순서대로 수행한 결과 저장되는 본 발명의 실시예에 따른 화이트리스트 DB를 개략적으로 나타내는 도면이다.
한편, 본 발명의 실시예에서, 상기 메인블랙리스트 DB를 생성하는 단계(S220)는, 특정 웹사이트에 대응되는 온라인 리소스 크롤링을 기반으로 하여 추출한 고위험 가상자산 지갑주소가 저장되는 메인 블랙리스트 DB를 생성하는 단계일 수 있다.
여기서, 도 10에 도시된 바와 같이, 상기 메인 블랙리스트 DB를 생성하는 단계는(S220), 특정 온라인 리소스를 자동으로 업데이트 하는 단계(S221), 크롤링하는 단계(S222), 위험주소를 추출하는 단계(S223), 유의미한 주소를 필터링 하는 단계(S224), 및 메인 블랙리스트DB를 생성하는 단계(S225)를 포함할 수 있다.
도 10을 참조하여 상기 메인 블랙리스트 DB를 생성하는 단계는(S220)를 더욱 상세하게 설명하면, 먼저, 상기 특정 온라인 리소스를 자동으로 업데이트 하는 단계(S221)는, 온라인 리소스 자동 업데이트 모듈을 이용해 고위험 전자지갑 주소가 사용되는 특정 온라인 리소스를 자동으로 업데이트 하는 단계일 수 있다.
여기서, 상기 특정 온라인 리소스는, 고위험 가상자산 지갑주소가 사용되는 커뮤니티로서, Surface Web, Dark Web, Telegram 등이 포함될 수 있다.
다음으로, 상기 크롤링하는 단계(S222)는, 상기 자동으로 업데이트 되는 특정 온라인 리소스에서 특정 키워드 및 특정 크기의 가상자산의 전송량을 크롤링하는 단계일 수 있다.
다음으로, 상기 위험주소를 추출하는 단계(S223)는, 상기 특정 키워드 및 특정 크기의 가상자산의 전송량에 대응되는 해당 가상자산 지갑주소를 고위험 가상자산 지갑주소로 추출하는 단계일 수 있다.
다음으로, 상기 유의미한 주소를 필터링 하는 단계(S224)는, 상기 제1차 고위험 가상자산 지갑주소로 추출된 가상자산 지갑주소 리스트에 저장된 가상자산 지갑주소 중 상기 정상적인 거래가 가능한 가상자산 전자지갑주소가 저장되는 화이트리스트 DB에 저장된 가상자산 지갑주소를 제거하고 유의미한 주소를 필터링 하는 단계일 수 있다.
다음으로, 상기 메인 블랙리스트DB를 생성하는 단계(S225)는, 상기 필터링이 완료된 고위험 가상자산 지갑주소를 위험도 수준에 따른 리스크 스코어를 기록하여 저장함으로써 메인 블랙리스트DB를 생성하는 단계일 수 있다.
한편, 도 10에 도시된 바와 같이, 상기 메인 블랙리스트DB에 저장되는 가상자산의 종류가 비트코인 블록체인 네트워크일 경우에, 상기 특정 키워드 및 특정 크기의 가상자산의 전송량에 대응되는 해당 가상자산 지갑주소를 고위험 가상자산 지갑주소로 추출하고 유의미한 주소를 필터링 한 단계 이후에 동일 가상자산 지갑주소를 클러스터링하는 과정을 추가로 수행할 수 있다.
한편, 본 발명의 실시예에서 사용되는 클러스터링(clustering)은 비슷한 특성을 가진 데이터들을 그룹으로 묶는 데이터마이닝 기법 중 하나이다. 유사한 데이터를 같은 그룹으로 분류하여 데이터간의 패턴과 특징을 파악할 수 있다.
도 12 내지 도 19는 본 발명의 실시예에 따른 GAT 기반의 AI엔진을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 GAT기반의 AI엔진의 학습모델은, 가상자산 지갑주소 자체에 대한 분석이 아닌 가상자산 지갑주소와 연결되어 있는 트랜잭션의 위험도를 분석하고, 분석된 트랜잭션들의 리스크를 종합하여 가상자산 지갑주소의 위험도를 계산해 내는 방식을 사용할 수 있다.
즉, 본 발명의 실시예에 적용된 GAT AI학습모델은,트랜잭션들의 입력데이터가 들어오면, 그래프 구조를 고려한 인접행렬에 따라 연결되지 않은 노드(라벨링되지 않은 가상자산 지갑주소)는 마스킹 처리되고, 어텐션 레이어를 통과시켜 트랜잭션들을 분류하고, 예상되는 카테고리별 확률의 형태로 출력시킨다, 여기서, 예상되는 카테고리별 확률이 본 발명의 실시예에서 가상자산 지갑주소에 대한 GAT스코어를 의미할 수 있다.
도 12 내지 도 13을 참조하여 본 발명의 실시예에 따른 GAT 기반의 AI학습모델을 이용하여 GAT 블랙리스트 DB를 자동업데이트 하는 단계를 설명하면 다음과 같다.
도면에 도시된 바와 같이, 상기 GAT 블랙리스트DB 자동 업데이트 단계는, 상기 제 1 학습데이터DB를 구성하는 온체인 트랜잭션 DB를 이용하여 전체 트랜잭션에 대해 그래프 어텐션 네트워크 기반의 GAT 그래프 구조를 추출하는 단계(S310), 상기 GAT 그래프 구조를 구성하는 연결관계를 엣지로 대응시킨 인접행렬을 생성하는 단계(S320), 상기 제 2 학습데이터DB를 구성하는 메인블랙리스트 DB를 이용하여 원-핫 인코딩 방식으로 위험 카테고리별로 데이터를 행렬화 시키는 단계(S330), 상기 메인블랙리스트 DB의 위험 카테고리별로 행렬화된 데이터에 대해 크롤링 수집시 온라인 원천 사이트별로 사전 설정된 가중치를 부여하여 특성행렬을 생성하는 단계(S340),상기 GAT 그래프 구조의 노드와 엣지를 구성하는 특성행렬과 인접행렬을 어텐션 레이어에 통과시켜 고위험 가상자산 지갑주소로 라벨링된 학습데이터에 대한 사전 학습모델을 생성하는 단계(S350), 상기 사전 학습모델을 활용하여 고위험 가상자산 지갑주소에 대한 라벨이 없는 데이터를 예측하고 그 예측 결과를 고위험 가상자산 지갑주소를 추정하는 GAT 스코어로 사용하는 준지도학습 기반의 메인 학습모델을 수행하는 단계(S360), 및 상기 메인 학습모델을 반복적으로 수행하여 고위험 가상자산 지갑주소를 추정하는 GAT 스코어가 저장된 GAT 블랙스트DB를 자동으로 생성 및 업데이트 하는 단계(S370)를 포함할 수 있다.
여기서, 상기 특성행렬을 생성하는 단계(S340)는, BTC 네트워크의 경우에 전체 트랜잭션을 그래프 구조의 노드로 대응시키고, ETH 네트워크의 경우에는 전체 지갑주소를 그래프 구조의 노드로 대응시켜 고위험 가산자산의 지갑주소 또는 트랜잭션의 카테고리 분류값으로 특성행렬을 생성할 수 있다.
또한, 본 발명의 실시예에서, 상기 GAT 그래프 구조를 구성하는 연결관계를 엣지로 대응시킨 인접행렬을 생성하는 단계(S320)는, BTC 네트워크의 경우에는 트랜잭션간 연결관계를 엣지로 대응시키고, ETH 네트워크의 경우에는 지갑주소간 연결관계를 엣지로 대응시킨 인접행렬을 생성할 수 있다.
도 14를 참조하여 더욱 상세하게 설명하면, 여기서, 상기 GAT 스코어가 저장된 GAT 블랙스트DB를 자동으로 생성 및 업데이트 하는 단계(S370)은, 임의의 가상자산 지갑주소를 입력하는 단계, 상기 임의의 가상자산 지갑주소와 인접한 모든 트랜잭션을 조회하는 단계, 상기 모든 트랜잭션 각각에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소로 추정되는 확률값을 조회하는 단계, 상기 각각의 트랜잭션에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소의 추정되는 확률값을 모두 병합하여 상기 임의의 가상자산 지갑주소에 대한 전체 위험도를 산출하는 단계, 및 상기 임의의 가상자산 지갑주소에 대한 전체 위험도에 일대일 대응되며 고위험 가상자산 지갑주소를 추정하는 GAT 스코어를 출력하는 단계를 포함할 수 있다.
이때, 상기 모든 트랜잭션 각각에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소로 추정되는 확률값을 조회하는 단계는, 도면에 도시된 바와 같이, 상기 GAT 블랙리스트 DB에서 임의의 가상자산 지갑주소와 관련된 블록체인 네트워크 내 모든 트랜잭션을 조회하는 단계와, 상기 모든 트랜잭션 중에서 고위험 가상자산 지갑주소를 추정하는 GAT 스코어로 라벨링된 트랜젝션데이터를 활용하여 고위험 가상자산 지갑주소에 대한 라벨이 없는 데이터를 예측하고 그 예측 결과를 고위험 가상자산 지갑주소를 추정하는 위험 확률값으로 사용하는 단계, 및 상기 모든 트랜잭션 각각에 대하여 위험 카테고리 분류 및 고위험 가상자산 지갑주소를 추정하는 확률값을 저장하는 고위험 가상자산 지갑주소 확률 DB를 구축하는 단계;를 포함할 수 있다.
본 발명의 실시예에서, 앞서 상술한 고위험 가상자산 지갑주소를 추정하는 확률값(GA T스코어)을 구하는 과정을 대표적인 가상자산들을 실시예로 하여 대략적으로 설명하면 다음과 같다.
먼저, BTC의 경우에 GAT 기반의 AI학습모델의 입력데이터는 BTC 트랜잭션 데이터, BTC 블랙리스트 데이터, BTC 인덱스 데이터를 포함할 수 있다.
여기서, BTC 트랜잭션 데이터는 처리효율을 높이기 위해 트랜잭션 raw data에서 트랜잭션 id를 가리키는 해쉬값을 양의 정수로 순차적으로 인덱싱 한 BTC인덱스 데이터로 매핑될 수 있다.
또한, BTC 블랙리스트 데이터는 메인 블랙리스트 DB의 가상자산 지갑주소와 연관된 트랜잭션들을 포함할 수 있다.
또한, 최종 출력되는 BTC기반 GAT 스코어는 유의미하게 분류된 트랜잭션들을 걸러내고 그 카테고리와 확률값(0~1의 실수)을 기록한 다음, 트랜잭션에 대한 분류는 오염가능성을 줄이고 신뢰성을 높이기 위해 가장 확률이 높은 카테고리만 기록할 수 있다.
본 발명의 실시예에서, 하기의 표 1 과 같이, 어드레스(가상자산 지갑주소)와 연결된 트랜잭션 분류 결과 값(GAT score to address classification)들을 취합해 각 카테고리별 점수를 정할 수 있다.
어드레스와 연결된 트랜잭션 분류 결과(비트코인)
Address cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8 cat9 cat10
"xxxx" 0 0.16 0.61 0 0 0 0 0 0 0.15
최종적으로 BTC 기반 GAT 스코어는, 먼저, 각 트랜잭션별로 GAT 위험확률 및 위험 카테고리가 산출된다.
본 발명의 실시예에 따른 GAT 기반 AI모델에서 최종 결과물은 비트코인 주소의 위험 확률이 되야 하기 때문에 이를 위해서는, 트랜잭션 위험 확률을 통해 비트코인 가상자산 지갑주소의 위험확률을 구하는 과정이 필요하다.
따라서, 본 발명의 실시에에서 임의의 가상자산 지갑주소 'A'에 대한 위험 확률 공식은 A주소 위험 카테고리별 전송량 중 최대값을 A주소의 총전송량으로 나눈 값일 수 있다.
다음으로, ETH(이더리움)의 경우에 GAT 기반의 AI학습모델의 입력데이터는 ETH 트랜잭션 데이터, ETH 블랙리스트 데이터, ETH 인덱스 데이터를 포함할 수 있다.
여기서, ETH 트랜잭션 데이터는 비트코인(BTC)와 달리 트랜잭션 raw data에서 어드레스(가상자산 지갑주소)를 양의 정수로 순차적으로 인덱싱 한 ETH 인덱스 데이터로 매핑될 수 있으며, ETH 블랙리스트 데이터는 메인 블랙리스트 DB의 가상자산 지갑주소를 포함할 수 있다.
최종 출력되는 ETH(이더리움)기반 GAT 스코어는 상기 [표 1]과 같이 지갑주소에 대한 분류결과를 기록하는 것으로서, 트랜잭션 데이터의 크기를 고려하여 트랜잭션 데이터를 분할 후 학습을 반복시키기 때문에 같은 지갑주소에 대한 학습이 중복될 수 있으며, 따라서, 데이터를 바로 사용하지 않고 취합과정을 거쳐서 GAT 블랙리스트DB에 최종 기록할 수 있다.
즉, ETH 기반 GAT 스코어는, 먼저, 각각의 가상자산 지갑주소별로 GAT 위험확률 및 위험 카테고리가 산출된다.
이때, 상술한 바와 같이, 전체 트랜잭션을 분할시켜 학습시키고 그 결과물을 출력하기 때문에 분할된 트랜잭션 데이터들의 학습결과를 통합시키는 과정이 필요하며, 비트코인과 마찬가지로 A주소에 대한 위험확률 공식은 A주소 위험카테고리별 전송량 중 최대값을 A주소의 총전송량으로 나눈 값일 수 있다.
이하, 도 15 내지 도 19를 참조하여 앞서 상술한 도 12 내지 도 15의 GAT AI학습모델을 추가 설명하면 다음과 같다.
먼저, 도 15는, 본 발명의 실시예에 따라 앞서 상술한 GAT 기반의 AI 학습모델인, 가상자산 지갑주소에 대한 트랜잭션 위험 분류모델을 도식화한 도면이다.
도면에 도시된 바와 같이, 트랜잭션 위험 분류모델의 전체적인 구조는, 트랜잭션 데이터를 입력받았을 때 해당 트랜잭션의 위험 카테고리를 분류시키는 인공지능 모델로, N개의 그래프 어텐션 레이어를 통해 트랜잭션의 임베딩 벡터를 만들어내어 분류시키는 구조이다.
다음으로, 도 16은, 본 발명의 실시예에 따른 그래프 어텐션 레이어를 개략적으로 설명하기 위한 도면이다.
본 발명의 실시예에서, 그래프 어텐션 레이어는 인접한 노드(가상자산 지갑주소와 연결된 트랜잭션)가 가진 Features의 중요도를 계산하는 역할을 맡으며, 여기서,
Figure 112023073682544-pat00001
와 hi는 다음과 같이 구해질 수 있다.
먼저, 그래프 구조를 구성하는 노드 특성을 나타내는 행렬 h=(F,N)에 대해 행렬 W=(F',F)과 a=(2F',1)를 학습변수로 놓고, attention score 행렬을 다음과 같은 식을 구한다. (Ni는 i 노드에 인접한 노드들을 의미한다.)
다음으로, 하기의 식을 통해 hidden Layerm의 출려값을 계산할 수 있다.
다음으로 도 17 내지 도 18은 본 발명의 실시예에 따른 GAT기반 AI학습모델을 이용하여 '라벨링 않은 노드(가상자산 지갑주소)에 대한 고위험 가상자산 지갑주소 위험 확률 산출 및 분류모델'을 개략적으로 설명하기 위한 도면이다.
본 발명의 실시예에 따르면, 온라인 크롤링을 통해 1차적으로 노드(가상자산지갑주소)를 특정 카테고리(Drug, 거래소 등)로 라벨링 하고, 라벨링된 노드 데이터를 기반으로 트랜잭션을 카테고리 별로 라벨링하며, 이와 같이 라벨링된 데이터를 기반으로 특정 노드(가상자산 지갑주소)를 중심으로 한 그래프를 그리면 도 17와 같이 라벨링 되지 않은 노드와 라벨링 되지 않은 트랜잭션이 포함된 그래프로 표현될 수 있다.
여기서, TADropEdge, FlexMatch 등을 활용한 GAT 모델로, 상기 라벨링 되지 않은 트랜잭션을 특정 카테고리로 라벨링(정확히는 특정 카테고리일 확률을 산출)하는 모델을 만들 수 있으며, 이후, 임의의 노드(가상자산 지갑주소)를 입력하였을 때, 해당 노드의 트랜잭션 데이터를 산출하고, 도 18에 도시된 바와 같이, 상기 노드의 트랜잭션이 각각 어떤 카테고리에 대해 얼마의 확율을 가지고 있는지를 종합하여 해당 노드(가상자산 지갑주소)가 어떤 카테고리롤 라벨링 될 수 있는 확률을 나타낼 수 있다.
한편, 본 발명의 실시예에서, 트랜잭션 데이터는 전체 데이터 중에서 라벨링된 데이터의 개수가 매우적고 라벨링된 데이터 중에서도 오류가 있을 수 있다는 점을 감안하여 라벨링된 데이터가 매우 적은 상황에서 경쟁력이 큰 FlexMatch(Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling) 방법론을 채택하였다.
FlexMatch에서 Consistency Regularization 을 위해 필요한 데이터 증강 방법으로는 TADropEdge(Topology Adaptive Edge Dropping)의 방법론을 사용하여 그래프 위상을 최대한 보존하면서 비슷한 그래프를 생성해 낼 수 있도록 하였다.
한편, 본 발명의 실시예에서, FlexMatch를 위해 사용된 데이터 증강방법인 TADropEdge의 과정은 다음과 같다. N개의 노드와 M개의 엣지를 가진 그래프가 q개의 '분할'로 이루어져 있다 가정했을 때, Graph Laplacian의 EigenVector 중 Eigenvalud의 값이 '0'에 가장 가까운 q개의 eigenvector를 추릴 수 있다.
이때, edge weight(aggregate resistance weight)를 기준으로 weight가 작은 엣지들에 대해 확률적으로 edge drop을 적용시키면 그래프 위상을 크게 해치지 않는 선에서 새로운 그래프 데이터로 증강시킬 수 있다.
도 19는 본 발명의 실시예에 적용된 FlexMatch 학습방법을 나타내고 있다.
설명에 앞서, 앞서 상술한 Teacher Model은 기계학습에서 사용되는 모델 학습 기법 중 하나로, 이방법은 지도학습(supervised learning)에서 사용될 수 있다.
지도학습은 입력데이터와 그에 해당되는 출력데이터가 함께 제공될 때 모델이 이를 학습하는 방법으로, Teacher Model은 이전에 학습된 모델의 출력을 새로운 모델의 입력으로 사용하여 새로운 모델을 학습하는 방법이다.
이전에 학습된 모델을 선생님 모델(Teacher model)이라 하며,새로운 모델을 학생모델(Student model)이라고 한다. Teacher model은 대규모 데이터셋에서 학습된 모델을 활용하여 적은양으로 데이터로도 효과적으로 학습할 수 있고, 이는 제한된 데이터셋을 사용해야 하는 상황에서 유용하게 사용될 수 있다.
비지도학습(Unsupervised learning)은 지도학습과 달리 입력데이터에 대한 출력데이터가 주어지지 않는 상황에서 모델을 학습하는 방법이다. 모델이 스스로 입력데이터의 구조와 특성을 학습하게 되는데 이때 사용되는 손실함수가 unsupervised loss이다. 비지도 학습에서는 데이터셋에 대한 레이블이 없기 때문에 모델이 학습하는 동안 데이터 간의 유사성을 측정하고 이를 최대화하거나 최소화하는 방식으로 모델을 학습할 수 있다. 이를 위해 사용되는 비지도 학습 손실함수로는 Autoencoder, K-means Clustering GAM 등이 있다. 예를들어, Autoencoder 모델에서는 입력데이터를 압축하는 인코더와 압축된 데이터를 복원하는 디코더가 사용될 수 있다. 이모델에서 입력데이터와 모델이 생성한 복원 데이터간의 차이를 최소화하는 손실함수가 Unsupervised loss이다.
본 발명의 실시예에서, 도 19에 도시된 FlexMatch는 딥러닝에서 사용되는 준지도학습방법으로, Unlabeled 데이터가 많고 노이즈가 많은 데이터셋에서도 높은 성능을 보이는 학습 방법이다.
즉, 도면에 도시된 바와 같이, Unlabeled 데이터에 대해서 ‘추론’하고 그 확률이 높은 데이터들을 데이터셋에 추가시켜서 새로운 데이터셋을 구성하는 방법이다.
또한, 이와 같은 과정을 반복함으로써 모델의 사용 가능한 데이터 셋의 범위가 추론이 쉬운 데이터 부터 점점 확장되고, 결과적으로 모든 Labeled, Unlabeled 데이터가 학습 데이터셋에 사용되도록 유도할 수 있다.
한편, FlexMatch의 Loss 함수는 다음과 같은 과정으로 구해진다.
도 19 에 도시된 순서도에서 Supervised Loss와 Unsupervised Loss 모두 Cross Entropy 를 사용해서 계산하고, confidence threshold를 나타내는 (는 다음과정을 통해 계산한다.
본 발명의 실시예에서는, Loss 함수는 학습된 모델의 예측과 실제 값 간의 차이를 측정, 모델의 성능을 평가하고 최적화를 위한 기준으로 사용되며, Supervised Loss와 Unsupervised Loss의 합으로 정의된다, 즉, 합이 줄어들도록 학습시켜서 라벨링된 데이터를 맞추는 정확도(Supervised Loss)를 높이고, 데이터 구조를 반영하도록(Unsupervised Loss)학습시키는 것이 목적이다.
상기와 같이, 본 발명은, 블록체인을 기반으로 하여 별도의 본인인증절차 없이 간단하게 전자지갑을 생성하는 가상자산의 특성상 자금 추적이 어려운 고위험 전자지갑 주소에 대한 블랙리스트 DB를 구축함으로써 고위험 가상자산 지갑주소에 대한 부정사용을 사전에 차단함과 동시에 가상자산 거래소를 보호할 수 있는 효과가 있다.
또한, 본 발명은, 고위험 전자지갑 주소에 대한 블랙리스트 DB구축은 물론 가상자산 거래소에서 사용하는 화이트리스트 DB를 제공하여 가상자산 고위험 지갑주소 DB 관리시스템의 신뢰도를 향상시키는 효과가 있다.
또한, 본 발명은, 특정 가상자산 관련 블록체인 네트워크의 트랜잭션정보를 포함하는 온체인 데이터의 가상자산 지갑주소 관련 정보와 유해정보를 취급하는 온라인 매체를 대상으로 하는 리소스 크롤링을 통해 추출한 고위험 지갑주소 관련 정보를 추정할 수 있는 GAT스코어를 생성하기 위하여 고위험 지갑주소로 라벨링 되지 않은 정보까지 GAT 기반의 인공지능 모델을 이용해 학습하고 예측함으로써 가상자산 고위험 지갑주소 DB를 자동으로 업데이트 시킬 수 있는 효과가 있다.
또한, 본 발명은, 가상자산을 구성하는 블록체인 네트워크에서 추출된 트랜잭션 정보를 GAT 기반의 인공지능 모델에 학습이 가능한 형태로 전처리 함으로써 처리효율을 높이고 인공지능 기반의 가상자산 고위험 지갑주소 DB 구축 성능을 향상시키는 효과가 있다.
또한, 본 발명은, 온라인 리소스 크롤링을 통해 추출한 전자지갑 주소를 추출하고 필터링하는 경우에 고위험 전자지갑 주소에 대한 블랙리스트 DB 뿐만 아니라 국내 가상자산 거래소에서 정상적으로 거래되는 유효 전자지갑 주소에 대한 화이트리스트 DB도 구축함으로써 고위험 가상자산 지갑관련 블랙리스트 DB의 신뢰성을 향상시키는 효과가 있다.
이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
1 : 가상자산 고위험 지갑주소 DB 관리시스템
10 : 고객단말
11 : 가상자산 거래소
20 : 고위험 지갑주소 관리부
70 : 데이터베이스
71 : GAT 블랙리스트DB
72 : 메인 블랙리스트DB
73 : 트랜잰셕DB
74 : 어드레스DB
100 : 온체인 데이터 분석모듈
200 : 온라인 블랙리스트 분석모듈
300 : GAT AI엔진

Claims (12)

  1. 가상자산 관련 블록체인 네트워크의 온체인 데이터를 구성하는 트랜잭션 정보와 가상자산 전자지갑 주소를 수집하여 고위험 가상자산 전자지갑주소를 추정하기 위한 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 1 학습데이터DB를 생성하는 온체인 데이터 기반 제 1 학습데이터DB 생성 단계;
    가상자산 지갑주소 정보가 게시되는 특정 웹사이트 리소스를 크롤링하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 모델에 대한 제 2 학습데이터 DB를 생성하는 온라인 리소스 기반 제 2 학습데이터 DB 생성단계;
    상기 제 1 학습데이터DB 생성단계에서 생성된 제 1 학습데이터DB와 상기 제 2 학습데이터DB 생성단계에서 생성된 제 2 학습데이터DB에 저장된 정보를 이용하여 상기 GAT스코어를 산출하는 그래프 어텐션 네트워크 기반의 인공지능 학습모델을 학습시켜 고위험 가산자산 지갑주소를 추정하는 GAT스코어가 저장된 GAT 블랙리스트DB를 자동으로 생성 및 업데이트 하는 GAT 블랙리스트DB 자동 업데이트 단계를 포함하고,
    상기 제 1 학습데이터DB 생성 단계는,
    특정 가상자산에 대응되는 클라이언트를 이용해 특정 가상자산의 전체 블록체인 네트워크를 구성하는 단계;
    상기 특정 가산자산의 전체 블록체인 네트워크에 접속하여 전체 트랜잭션 데이터를 추출하는 단계;
    상기 전체 트랜잭션 데이터로부터 상기 그래프 어텐션 네트워크 기반의 인공지능 학습모델에 사용하는데 필요한 트랜잭션 ID 및 송수신자에 대응되는 가상자산지갑주소를 포함한 공통항목 정보를 추출하는 단계;
    상기 추출된 공통항목 정보 중 트랜잭션ID를 순차적인 정수값으로 인덱싱하여 인덱스 넘버를 갖는 트랜잭션 분석 정보를 트랜잭션 인덱스 DB에 저장하는 단계;
    상기 트랜잭션 인덱스 DB에 저장된 정보 중 가상자산지갑주소에 대응되는 입력 트랜잭션 인덱스 넘버와 출력 트랜잭션 인덱스 넘버를 어드레스 DB에 저장하는 단계를 포함하도록 구성되고,
    상기 추출된 공통항목 정보 중 트랜잭션ID를 순차적인 정수값으로 인덱싱하여 인덱스 넘버를 갖는 트랜잭션 분석 정보를 트랜잭션 인덱스 DB에 저장하는 단계는,
    인덱스 ID, 트랜잭션ID, 블럭, 전송량(VOLUME), INPUT 지갑주소 정보 및 OUTPUT 지갑주소 정보를 추출하여 JSON 형태의 파일로 저장하도록 구성되고,
    상기 트랜잭션 인덱스 DB에 저장된 정보 중 가상자산지갑주소에 대응되는 입력 트랜잭션 인덱스 넘버와 출력 트랜잭션 인덱스 넘버를 어드레스 DB에 저장하는 단계는,
    Input 트랜잭션들의 Index, Output 트랜잭션들의 Index, 주소 소유 코인 및 위험 카테고리를 추출하여 추가 저장하도록 구성되고,
    상기 GAT 블랙리스트DB 자동 업데이트 단계는,
    상기 그래프 어텐션 네트워크에 TADropEdge 알고리즘을 적용하여 그래프의 위상을 증강시키고, 상기 그래프의 위상이 증강된 상태에서 FlexMatch 알고리즘을 적용하여 손실함수를 생성하여 학습하도록 구성되는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법.
  2. 삭제
  3. 제 1항에 있어서, 상기 트랜잭션 인덱스 DB는,
    Key값 및 Value값을 갖는 DOCUMENT 기반의 DB 자료구조를 가지며,
    정수값으로 인덱싱된 트랜잭션 ID, 트랜잭션 해쉬(TXID), 블럭넘버, 전송량, input 가상자산 지갑주소정보, output 가상자산 지갑주소 정보를 포함하는 것을 특징으로 하는 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  4. 제 1항에 있어서, 상기 제 2 학습데이터 DB 생성단계는,
    가상자산 거래소 관련 트랜잭션 정보를 분석하여 정상적인 거래가 가능한 가상자산 전자지갑주소가 저장되는 화이트리스트 DB를 생성하는 단계; 및
    특정 웹사이트에 대응되는 온라인 리소스 크롤링을 기반으로 하여 추출한 고위험 가상자산 지갑주소가 저장되는 메인 블랙리스트 DB를 생성하는 단계;를 포함하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  5. 제 4항에 있어서, 상기 화이트리스트 DB를 생성하는 단계는,
    오픈웹 커뮤니티에 대한 특정키워드를 이용한 온라인 리소스 크롤링을 통해 화이트리스트 후보군에 해당하는 제 1 가상자산 지갑주소 리스트를 추출하는 단계;
    더스팅 기법을 사용하여 가상자산 거래소가 보유한 것으로 추정되는 제 2 가상자산 지갑주소 리스트를 추출하는 단계;
    상기 온라인 리소스 크롤링을 통해 추출한 제 1 가상자산 지갑주소 리스트와 상기 더스팅 기법으로 추출한 제 2 가상자산 지갑주소 리스트를 비교 검증하여 베이직 화이트리스트를 생성하는 단계;
    상기 베이직 화이트리스트를 생성하는 단계에서 생성된 정상거래 지갑으로 추정되는 가상자산 지갑주소에 대응되는 베이직 화이트리스트의 트랜잭션 패턴 분석을 통해 가상자산 거래소의 지갑주소로 추정되는 스케일업 화이트리스트를 생성하는 단계; 및
    상기 스케일업 화이트리스트에 해당하는 다수의 가상자산 지갑주소들에 대해 클러스터링을 수행함으로써 가상자산 거래소의 지갑주소로 추정됨과 동시에 구조화된 파이널 화이트 리스트를 생성하여 화이트리스트 DB에 저장하는 단계;를 포함하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  6. 제 4항에 있어서, 상기 메인 블랙리스트 DB를 생성하는 단계는,
    온라인 리소스 자동 업데이트 모듈을 이용해 고위험 전자지갑 주소가 사용되는 특정 온라인 리소스를 자동으로 업데이트 하는 단계;
    상기 자동으로 업데이트 되는 특정 온라인 리소스에서 특정 키워드 및 특정 크기의 가상자산의 전송량을 크롤링하는 단계;
    상기 특정 키워드 및 특정 크기의 가상자산의 전송량에 대응되는 해당 가상자산 지갑주소를 고위험 가상자산 지갑주소로 추출하는 단계;
    상기 고위험 가상자산 지갑주소로 추출된 가상자산 지갑주소 리스트에 저장된 가상자산 지갑주소 중 상기 정상적인 거래가 가능한 가상자산 전자지갑주소가 저장되는 화이트리스트 DB에 저장된 가상자산 지갑주소를 제거하고 유의미한 주소를 필터링 하는 단계; 및
    상기 필터링이 완료된 고위험 가상자산 지갑주소를 위험도 수준에 따른 리스크 스코어를 기록하여 저장함으로써 메인 블랙리스트DB를 생성하는 단계;를 구비하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  7. 제 6항에 있어서, 상기 메인 블랙리스트DB에 저장되는 가상자산의 종류가 비트코인일 경우에,
    상기 특정 키워드 및 특정 크기의 가상자산의 전송량에 대응되는 해당 가상자산 지갑주소를 고위험 가상자산 지갑주소로 추출하고 유의미한 주소를 필터링 한 단계 이후에 동일 가상자산 지갑주소를 클러스터링하는 과정을 수행하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  8. 제 1항에 있어서, 상기 GAT 블랙리스트DB 자동 업데이트 단계는,
    상기 제 1 학습데이터DB를 구성하는 온체인 트랜잭션 DB를 이용하여 전체 트랜잭션에 대해 그래프 어텐션 네트워크 기반의 GAT 그래프 구조를 추출하는 단계;
    상기 추출된 GAT 그래프 구조를 구성하는 연결관계를 엣지로 대응시킨 인접행렬을 생성하는 단계;
    상기 제 2 학습데이터DB를 구성하는 메인블랙리스트 DB를 이용하여 원-핫 인코딩 방식으로 위험 카테고리별로 데이터를 행렬화 시키는 단계;
    상기 메인블랙리스트 DB의 위험 카테고리별로 행렬화된 데이터에 대해 크롤링 수집시 온라인 원천 사이트별로 사전 설정된 가중치를 부여하여 특성행렬을 생성하는 단계;
    GAT 그래프 구조의 노드와 엣지를 구성하는 상기 특성행렬과 상기 인접행렬을 어텐션 레이어에 통과시켜 고위험 가상자산 지갑주소로 라벨링된 학습데이터에 대한 사전 학습모델을 생성하는 단계;
    상기 사전 학습모델을 활용하여 고위험 가상자산 지갑주소에 대한 라벨이 없는 데이터를 예측하고 그 예측 결과를 고위험 가상자산 지갑주소를 추정하는 GAT 스코어로 사용하는 준지도학습 기반의 메인 학습모델을 수행하는 단계; 및
    상기 메인 학습모델을 반복적으로 수행하여 고위험 가상자산 지갑주소를 추정하는 GAT 스코어가 저장된 GAT 블랙스트DB를 자동으로 생성 및 업데이트 하는 단계;를 포함하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  9. 제 8항에 있어서, 상기 특성행렬을 생성하는 단계는,
    BTC 네트워크의 경우에 전체 트랜잭션을 그래프 구조의 노드로 대응시키고, ETH 네트워크의 경우에는 전체 지갑주소를 그래프 구조의 노드로 대응시켜 고위험 가산자산의 지갑주소 또는 트랜잭션의 카테고리 분류값으로 특성행렬을 생성하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  10. 제 8항에 있어서, 상기 GAT 그래프 구조를 구성하는 연결관계를 엣지로 대응시킨 인접행렬을 생성하는 단계는,
    BTC 네트워크의 경우에는 트랜잭션간 연결관계를 엣지로 대응시키고, ETH 네트워크의 경우에는 지갑주소간 연결관계를 엣지로 대응시킨 인접행렬을 생성하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  11. 제 8항에 있어서, 상기 GAT 스코어가 저장된 GAT 블랙스트DB를 자동으로 생성 및 업데이트 하는 단계는,
    임의의 가상자산 지갑주소를 입력하는 단계;
    상기 임의의 가상자산 지갑주소와 인접한 모든 트랜잭션을 조회하는 단계;
    상기 모든 트랜잭션 각각에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소로 추정되는 확률값을 조회하는 단계;
    상기 각각의 트랜잭션에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소의 추정되는 확률값을 모두 병합하여 상기 임의의 가상자산 지갑주소에 대한 전체 위험도를 산출하는 단계; 및
    상기 임의의 가상자산 지갑주소에 대한 전체 위험도에 일대일 대응되며 고위험 가상자산 지갑주소를 추정하는 GAT 스코어를 출력하는 단계;를 포함하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
  12. 제 11항에 있어서, 상기 모든 트랜잭션 각각에 대한 위험 카테고리 분류 및 고위험 가상자산 지갑주소로 추정되는 확률값을 조회하는 단계는,
    상기 GAT 블랙리스트 DB에서 임의의 가상자산 지갑주소와 관련된 블록체인 네트워크 내 모든 트랜잭션을 조회하는 단계;
    상기 모든 트랜잭션 중에서 고위험 가상자산 지갑주소를 추정하는 GAT 스코어로 라벨링된 트랜젝션데이터를 활용하여 고위험 가상자산 지갑주소에 대한 라벨이 없는 데이터를 예측하고 그 예측 결과를 고위험 가상자산 지갑주소를 추정하는 위험 확률값으로 사용하는 단계; 및
    상기 모든 트랜잭션 각각에 대하여 위험 카테고리 분류 및 고위험 가상자산 지갑주소를 추정하는 확률값을 저장하는 고위험 가상자산 지갑주소 확률 DB를 구축하는 단계;를 포함하는 것을 특징으로 하는 AI기반 가상자산 고위험 지갑주소 DB 자동 업데이트 방법
KR1020230086795A 2023-07-04 2023-07-04 Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법 KR102663767B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230086795A KR102663767B1 (ko) 2023-07-04 2023-07-04 Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230086795A KR102663767B1 (ko) 2023-07-04 2023-07-04 Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법

Publications (1)

Publication Number Publication Date
KR102663767B1 true KR102663767B1 (ko) 2024-05-07

Family

ID=91077951

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230086795A KR102663767B1 (ko) 2023-07-04 2023-07-04 Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법

Country Status (1)

Country Link
KR (1) KR102663767B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118332360A (zh) * 2024-06-06 2024-07-12 山东省计算中心(国家超级计算济南中心) 一种跨区块链交易地址追踪方法、系统、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200073803A (ko) 2018-12-14 2020-06-24 주식회사 큐브시스템 블록체인 전자지갑 관리 시스템
KR102259838B1 (ko) * 2020-09-21 2021-06-02 한성대학교 산학협력단 암호화폐 블랙리스트 구축 장치 및 방법
KR102286473B1 (ko) * 2020-10-14 2021-08-06 (주)헥슬란트 가상 자산 검증 모듈, 이를 포함하는 가상 자산 거래 시스템 및 그 방법
KR20220101952A (ko) * 2021-01-12 2022-07-19 포항공과대학교 산학협력단 비트코인 불법거래 탐지 장치 및 방법
KR102521246B1 (ko) * 2023-01-30 2023-04-14 주식회사 그래파이 엣지 기반 트랜잭션 사기 탐지 방법 및 이를 수행하는 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200073803A (ko) 2018-12-14 2020-06-24 주식회사 큐브시스템 블록체인 전자지갑 관리 시스템
KR102259838B1 (ko) * 2020-09-21 2021-06-02 한성대학교 산학협력단 암호화폐 블랙리스트 구축 장치 및 방법
KR102286473B1 (ko) * 2020-10-14 2021-08-06 (주)헥슬란트 가상 자산 검증 모듈, 이를 포함하는 가상 자산 거래 시스템 및 그 방법
KR20220101952A (ko) * 2021-01-12 2022-07-19 포항공과대학교 산학협력단 비트코인 불법거래 탐지 장치 및 방법
KR102521246B1 (ko) * 2023-01-30 2023-04-14 주식회사 그래파이 엣지 기반 트랜잭션 사기 탐지 방법 및 이를 수행하는 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Velickovic, Petar, et al. "Graph attention networks." arXiv preprint arXiv:1710.10903 (2017)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118332360A (zh) * 2024-06-06 2024-07-12 山东省计算中心(国家超级计算济南中心) 一种跨区块链交易地址追踪方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
Pacheco et al. Uncovering coordinated networks on social media
Bhuvaneshwari et al. Spam review detection using self attention based CNN and bi-directional LSTM
CN113722611B (zh) 政务服务的推荐方法、装置、设备及计算机可读存储介质
CN109255586B (zh) 一种面向电子政务办事的在线个性化推荐方法
CN112989059A (zh) 潜在客户识别方法及装置、设备及可读计算机存储介质
Cao et al. HitFraud: a broad learning approach for collective fraud detection in heterogeneous information networks
KR102663767B1 (ko) Ai기반 가상자산 고위험 지갑주소 db 자동 업데이트 방법
US11551317B2 (en) Property valuation model and visualization
Krivosheev et al. Siamese graph neural networks for data integration
CN116467666A (zh) 一种基于集成学习和主动学习的图异常检测方法和系统
CN115204886A (zh) 账户识别的方法、装置、电子设备和存储介质
Fursov et al. Sequence embeddings help detect insurance fraud
CN118468061A (zh) 一种算法自动匹配及参数优化方法及系统
Baldassini et al. client2vec: towards systematic baselines for banking applications
Usman et al. Intelligent anti-money laundering fraud control using graph-based machine learning model for the financial domain
CN111144453A (zh) 构建多模型融合计算模型的方法及设备、网站数据识别方法及设备
Nguyen et al. A survey of privacy-preserving model explanations: Privacy risks, attacks, and countermeasures
Wang et al. Intent mining: A social and semantic enhanced topic model for operation-friendly digital marketing
CN116805039B (zh) 特征筛选方法、装置、计算机设备和数据扰动方法
Tundis et al. Limits in the data for detecting criminals on social media
Xiao et al. Explainable fraud detection for few labeled time series data
Vaishnaw et al. Development of anti-phishing model for classification of phishing e-mail
Zhang et al. Detecting fake reviewers in heterogeneous networks of buyers and sellers: a collaborative training-based spammer group algorithm
Zhang et al. A ResNet‐LSTM Based Credit Scoring Approach for Imbalanced Data
CN112597390A (zh) 基于数字金融的区块链大数据处理方法及大数据服务器

Legal Events

Date Code Title Description
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant