KR102664101B1 - 주식 이상 거래 탐지 장치 및 방법 - Google Patents

주식 이상 거래 탐지 장치 및 방법 Download PDF

Info

Publication number
KR102664101B1
KR102664101B1 KR1020210022505A KR20210022505A KR102664101B1 KR 102664101 B1 KR102664101 B1 KR 102664101B1 KR 1020210022505 A KR1020210022505 A KR 1020210022505A KR 20210022505 A KR20210022505 A KR 20210022505A KR 102664101 B1 KR102664101 B1 KR 102664101B1
Authority
KR
South Korea
Prior art keywords
data
abnormal
stock price
stock
artificial intelligence
Prior art date
Application number
KR1020210022505A
Other languages
English (en)
Other versions
KR20210107547A (ko
Inventor
이성환
정한슬
엄태산
정홍규
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Publication of KR20210107547A publication Critical patent/KR20210107547A/ko
Application granted granted Critical
Publication of KR102664101B1 publication Critical patent/KR102664101B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Technology Law (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

본 발명의 일 실시예는, 인공지능 학습 모델을 이용한 주식 이상 거래 탐지 장치를 제공한다. 주식 이상 거래 탐지 장치는, 데이터를 입력 받는 입력 모듈과 상기 입력 모듈로 입력되는 데이터를 분석하는 프로세서를 포함한다. 상기 프로세서는, 상기 입력 모듈로 입력되는 분석 대상 주가 데이터를 일정 시간 간격 단위로 분할된 복수개의 구간을 갖는 전처리 데이터로 변환하고, 정상 거래 주가 데이터에 대응되는 정상 패턴 데이터를 출력하도록 학습된 인공지능 모델을 이용하여, 상기 전처리 데이터에 대응되는 패턴 데이터를 생성하고, 상기 전처리 데이터와 상기 패턴 데이터의 차이를 기초로 이상 점수를 산출하고, 그리고, 상기 이상 점수를 기설정된 이상치와 비교하여, 상기 분석 대상 주가 데이터의 정상 여부를 판단하는 것을 수행하도록 구성된다.

Description

주식 이상 거래 탐지 장치 및 방법{APPARATUS AND METHOD FOR ANOMALY STOCK TRADING}
본 발명은 주식 이상 거래 탐지 장치 및 방법에 관한 것으로, 보다 상세하게는, 비지도 학습 방식의 인공지능 기술을 이용하여 시계열적인 주가 데이터를 기초로 주식 이상 거래를 탐지하도록 구성되는 주식 이상 거래 탐지 장치 및 방법에 관한 것이다.
주가는 기업의 가치를 나타내는 지표로서, 매수자와 매도인 사이의 거래를 통해서 매 시점마다 그 가격이 결정된다. 주식 거래 시장에서는 개인의 이익을 취하기 위해 시장에 혼란을 주어 주가를 실제 기업의 가치와는 무관하게 만드는 시장 조작이 빈번히 발생하고 있다. 이와 같은 주가 조작 현상을 방지하기 위해, 이상 거래 탐지를 위한 방법들이 연구되고 있다. 종래의 이상거래 탐지 방법들은 대부분 과거의 주가 데이터를 토대로 산출한 특정 지표들을 이용하여 주가 이상 거래를 검출하도록 구성된다. 그러나, 주가 데이터의 패턴과 주가 조작의 유형은 다양하고 계속해서 변형되기 때문에 과거에 사용된 지표만으로는 새로운 유형의 이상 거래를 탐지하기가 어려운 문제가 있다.
이에 따라, 인공지능 기술을 이용한 주가 이상 탐지 방법들이 제시되고 있다. 인공지능 기술을 이용하여 시계열적인 데이터의 이상치 탐지를 수행하는 경우, 사람의 불필요한 개입을 줄일 수 있고 통계적 기법으로 탐지하기 어려운 비선형적인 이상치도 탐지할 수 있는 장점이 있다. 한편, 기업과 투자자들 모두에게 중대한 영향을 미칠 수 있는 주식 이상 거래 탐지에서는 주가 이상 징후를 탐지하는 것뿐만 아니라 이상 징후의 근거를 제시하는 것도 중요하다. 그러나, 인공지능 모델은 수많은 데이터 간 복잡한 상관관계를 스스로 파악하여 탐지 기준을 설정하기 때문에 모델이 도출한 결과의 원인을 분석할 수 없다는 단점이 존재한다. 따라서, 주식 이상 거래 탐지의 신뢰도를 높이기 위해서는 주식 이상 거래라고 판단한 근거에 대한 구체적인 설명이 뒷받침될 것이 요구된다.
본 발명은 비지도 학습 방식의 인공지능 기술을 이용하여 시계열적인 주가 데이터를 기초로 주식 이상 거래를 탐지하도록 구성되는 주식 이상 거래 탐지 장치 및 방법을 제공하는 것을 기술적 과제로 한다.
본 발명이 이루고자 하는 기술적 과제들은 상기한 기술적 과제로 제한되지 않으며, 이하의 설명으로부터 본 발명의 또 다른 기술적 과제들이 도출될 수 있다.
상술한 기술적 과제를 해결하기 위한 기술적 수단으로서, 본 발명의 제1 측면에 따른 인공지능 학습 모델을 이용한 주식 이상 거래 탐지 장치가 제공된다. 주식 이상 거래 탐지 장치는, 데이터를 입력 받는 입력 모듈과 상기 입력 모듈로 입력되는 데이터를 분석하는 프로세서를 포함한다. 상기 프로세서는, 상기 입력 모듈로 입력되는 분석 대상 주가 데이터를 일정 시간 간격 단위로 분할된 복수개의 구간을 갖는 전처리 데이터로 변환하고, 정상 거래 주가 데이터에 대응되는 정상 패턴 데이터를 출력하도록 학습된 인공지능 모델을 이용하여, 상기 전처리 데이터에 대응되는 패턴 데이터를 생성하고, 상기 전처리 데이터와 상기 패턴 데이터의 차이를 기초로 이상 점수를 산출하고, 그리고, 상기 이상 점수를 기설정된 이상치와 비교하여, 상기 분석 대상 주가 데이터의 정상 여부를 판단하는 것을 수행하도록 구성된다.
또한, 본 발명의 제1 측면에 따라 인공지능 학습 모델을 이용한 주식 이상 거래 탐지 방법이 제공된다. 주식 이상 거래 탐지 방법은, 분석 대상 주가 데이터를 일정 시간 간격 단위로 분할된 복수개의 구간을 갖는 전처리 데이터로 변환하는 단계, 정상 거래 주가 데이터에 대응되는 정상 패턴 데이터를 출력하도록 학습된 인공지능 모델을 이용하여, 상기 전처리 데이터에 대응되는 패턴 데이터를 생성하는 단계, 상기 전처리 데이터와 상기 패턴 데이터의 차이를 기초로 이상 점수를 산출하는 단계 및 상기 이상 점수를 기설정된 이상치와 비교하여, 상기 분석 대상 주가 데이터의 정상 여부를 판단하는 단계를 포함한다.
전술한 본 발명의 과제 해결 수단에 의하면, 주식 거래 과정에서 발생되는 이상 거래를 정상 거래와 구분하여 탐지할 수 있고, 이상 거래 검출 결과와 검출 근거를 제공하여 이상 거래 탐지에 대한 신뢰도를 높일 수 있다.
또한, 본 발명에 따르면, 이상 거래가 의심되는 시점 부근을 대상으로 추가 이상 거래 검출이 가능하고 새로운 이상 거래의 유형을 분석하는 등 효과적인 주식 거래 시장 조작 감시가 가능하다.
또한, 본 발명에 따르면, 비지도학습 방식의 인공지능 기술을 이용하여 정답(라벨)이 없이도 주가 데이터의 패턴 학습이 가능하며, 이상치와 정상 데이터의 클래스 간 편향성이 큰 주식 이상 거래 탐지에도 인공지능 기술을 효과적으로 적용할 수 있다.
또한, 본 발명에 따르면, 주식 이상 거래 징후를 탐지하여 시장의 투명성을 보존하고, 시장 조작으로 인한 투자자들의 피해를 방지할 수 있다.
본 발명의 효과들은 상술한 효과들로 제한되지 않으며, 이하의 기재로부터 이해되는 모든 효과들을 포함한다.
도 1은 본 발명의 일 실시예에 따른 주가 이상 거래 탐지 장치의 구성을 도시한 블록도이다.
도 2 및 도 3은 도 1에 도시된 주가 이상 거래 탐지 장치를 이용한 주가 이상 거래 탐지 과정을 설명하기 위해 도시한 도면이다.
도 4는 본 발명의 다른 실시예에 따른 주가 이상 거래 탐지 방법의 순서를 도시한 흐름도이다.
도 5 및 도 6은 도 4에 도시된 주가 이상 거래 탐지 방법의 단계들 중 일부 단계에 대한 세부 단계를 도시한 흐름도이다.
이하에서는 첨부한 도면을 참조하여 본 발명을 상세히 설명하기로 한다. 다만, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 여기에서 설명하는 실시예들로 한정되는 것은 아니다. 또한, 첨부된 도면은 본 명세서에 개시된 실시예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않는다. 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 도면에 나타난 각 구성요소의 크기, 형태, 형상은 다양하게 변형될 수 있다. 명세서 전체에 대하여 동일/유사한 부분에 대해서는 동일/유사한 도면 부호를 붙였다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 “부” 등은 명세서 작성의 용이함만이 고려되어 부여 되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략하였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결(접속, 접촉 또는 결합)"되어 있다고 할 때, 이는 "직접적으로 연결(접속, 접촉 또는 결합)"되어 있는 경우뿐만 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결 (접속, 접촉 또는 결합)"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함(구비 또는 마련)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 "포함(구비 또는 마련)"할 수 있다는 것을 의미한다.
본 명세서에서 사용되는 제1, 제2 등과 같이 서수를 나타내는 용어들은 하나의 구성 요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 구성 요소들의 순서나 관계를 제한하지 않는다. 예를 들어, 본 발명의 제1구성요소는 제2구성요소로 명명될 수 있고, 유사하게 제2구성요소도 제1구성 요소로 명명될 수 있다.
도 1은 본 발명의 일 실시예에 따른 주가 이상 거래 탐지 장치(100)의 구성을 도시한 블록도이고, 도 2 및 도 3은 주가 이상 거래 탐지 장치(100)를 이용한 주가 이상 거래 탐지 과정을 설명하기 위해 도시한 도면이다. 이하에서, 도 1 내지 도 3을 참조하여 주가 이상 거래 탐지 장치(100)에 대해 상세히 설명하도록 한다.
도 1을 참조하면, 주가 이상 거래 탐지 장치(100)는 입력 모듈(110) 및 프로세서(120)를 포함하여 구성되며, 메모리(130)를 더 포함할 수 있다. 주가 이상 거래 탐지 장치(100)는 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet), LTE(Long Term Evolution) 통신 기반 단말, 스마트폰, 태블릿 PC 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다.
입력 모듈(110)은 특정 종목에 대한 주가 데이터를 입력 받을 수 있다. 주가 데이터는 주가의 시계열적인 흐름이 포함된 데이터로서, 주식 차트의 형태일 수 있으나, 반드시 이에 제한되는 것은 아니다. 본 명세서 상에서 설명되는 주가 데이터는 정상 주가 거래 데이터와 비정상 주가 거래 데이터를 포함한다. 정상 주가 거래 데이터는 주가 이상 거래 탐지 장치(100)에 의해 정상으로 판단된 주가 데이터를 의미하고 비정상 주가 거래 데이터는 주가 이상 거래 탐지 장치(100)에 의해 비정상으로 판단된 주가 데이터를 의미한다. 입력 모듈(110)은 다른 네트워크 장치와 유무선 연결을 통해 제어 신호 또는 데이터 신호와 같은 신호를 송수신하기 위해 필요한 하드웨어 및 소프트웨어를 포함하는 장치를 포함할 수 있다.
프로세서(120)는 입력 모듈(110)로 입력되는 데이터를 분석할 수 있다. 프로세서(120)는 데이터를 제어 및 처리하는 다양한 종류의 장치들을 포함할 수 있다. 프로세서(120)는 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 일 예에서, 프로세서(120)는 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 형태로 구현될 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
프로세서(120)가 수행하는 기능들은 다음과 같다. 프로세서(120)는 입력 모듈(110)로 입력되는 데이터 중 분석 대상이 되는 주가 데이터(이하, “분석 대상 주가 데이터”라 함)를 일정 시간 간격 단위로 분할된 복수개의 구간을 갖는 전처리 데이터로 변환한다. 프로세서(120)는 정상 거래 주가 데이터에 대응되는 정상 패턴 데이터를 출력하도록 학습된 인공지능 모델을 이용하여, 전처리 데이터에 대응되는 패턴 데이터를 생성한다. 프로세서(120)는 전처리 데이터와 패턴 데이터의 차이를 기초로 이상 점수를 산출한다. 이 때, 프로세서(120)는 전처리 데이터와 패턴 데이터의 차이를 절대값 혹은 MSE(Mean Squared Error)를 이용하여 이상 점수를 산출할 수 있다.
프로세서(120)는 산출된 이상 점수를 기설정된 이상치와 비교하여, 분석 대상 주가 데이터의 정상 여부를 판단한다. 일 예에서, 프로세서(120)는 0과 1 사이의 값을 갖는 이상치에 대하여 0.5를 넘는 경우 주가 데이터가 비정상인 것으로 판단하고 0.5 이하인 경우 주가 데이터가 정상인 것으로 판단할 수 있으나, 본 발명의 범위가 이에 제한되는 것은 아니다. 프로세서(120)에 의해 분석 대상 주가 데이터가 비정상으로 판단된 경우, 프로세서(120)는, 전처리 데이터의 복수개의 구간 각각에 대한 이상 점수를 산출하는 것을 더 수행할 수 있다.
프로세서(120)는 입력 모듈(110)로 입력되는 데이터에 대해 정규화 또는 표준화를 수행하여 주가 데이터의 크기를 조절할 수 있다. 구체적으로, 프로세서(120)는 입력 모듈(110)로 입력되는 데이터들이 모두 동일한 길이를 갖도록 표준화 또는 정규화를 수행한다. 예컨대, 입력 모듈(110)로 입력되는 주가 데이터에서 t시점의 종가를 라고 xt라고 가정한다. 이 때, 프로세서(120)는 데이터 내 최소값 xmin과 최대값 xmin을 이용하여 데이터를 0과 1사이의 값으로 변환하는 데이터 정규화 과정, 또는, 주가 데이터 내에서의 평균 xmean과 표준편차 xstd를 이용하여 아래 식 (1) 토대로 표준화하는 과정을 통해 데이터의 크기를 조절할 수 있다. 이후 프로세서(120)는 정규화 또는 표준화 과정을 토대로 생성된 데이터를 일정 시간 단위로 분할하여 전처리 데이터로 변환한다. 일 예로서, 프로세서(120)는 아래 식 (2)와 같이 단위 시간만큼의 길이를 갖는 윈도우로 전처리 데이터를 구성할 수 있다.
(x'=(x-xmean)/xstd)) 식(1)
식(2)
프로세서(120)는 상술한 인공지능 모델을 생성할 수 있다. 프로세서(120)가 정상 거래 주가 데이터를 입력 받아 정상 거래 주가 데이터의 특징 정보를 추출하고, 정상 거래 주가 데이터에 대응되도록 특징 정보를 토대로 재구성한 정상 패턴 데이터를 생성하는 학습을 수행하고, 정상 거래 주가 데이터와 정상 패턴 데이터의 차이에 따른 이상 점수가 기설정된 임계값 이하가 되도록 학습을 반복하여 수행하는 것에 의해, 인공지능 모델이 생성될 수 있다. 일 예에서, 이상 점수가 0이 되도록 인공지능 모델의 학습이 수행될 수 있다. 이에 따라, 정상 거래 주가 데이터와 정상 패턴 데이터는 흡사한 형태를 가질 수 있다.
본 학습 과정에서 프로세서(120)는 Recurrent Neural Networks(RNN), Long-Short Term Memory(LSTM), Gated Recurrent Unit(GRU) 중 어느 하나를 이용하여 상술한 특징 정보를 추출하고, 추출된 특징을 AutoEncoder(AE), Variational AutoEncoder (VAE)중 어느 하나를 이용하여 결과 값을 산출할 수 있다. 또한, 본 학습 과정에서 프로세서(120)는 상술한 주가 데이터에 대한 전처리 과정과 유사하게 정상 거래 주가 데이터에 대한 표준화 또는 정규화를 수행하는 과정을 더 수행할 수 있다.
프로세서(120)는 전처리 데이터를 전처리 데이터가 갖는 복수개의 구간별로 분할한 분할 데이터들을 생성할 수 있다. 프로세서(120)는 상술한 인공지능 모델을 이용하여 분할 데이터들 각각에 대한 패턴 데이터들을 생성할 수 있다. 프로세서(120)는 분할 데이터들 각각과 분할 데이터들 각각에 대응되는 패턴 데이터들 각각의 차이를 기초로 전처리 데이터가 갖는 복수개의 구간별 이상 점수들을 산출할 수 있다. 프로세서(120)는 복수개의 구간별 이상 점수들을 토대로 복수개의 구간 각각에 대한 기여도를 산출하는 것을 더 수행할 수 있다. 여기서 기여도는, 분석 대상 주가 데이터가 비정상인 경우에 프로세서(120)가 분석 대상 주가 데이터를 비정상으로 판단한 근거로서 제공될 수 있다. 기여도를 토대로 분석 대상 주가 데이터 중 어느 부분이 비정상 거래에 해당하는지 도출될 수 있다.
일 예에서, 프로세서(120)는 비정상으로 판단된 전처리 데이터의 각 시점의 값에 노이즈를 추가하여 여러 조합 데이터를 생성한다. 예컨대, w개의 시점에 대해서 정규 분포에서 랜덤으로 K번 샘플링하여 노이즈를 추가하면, 기존의 데이터와 유사한 K-w배 만큼의 데이터가 생성된다. 이를 식으로 나타내면, 에 대해 , )를 생성하는 것으로 표현할 수 있다.
프로세서(120)는 생성된 여러 조합 데이터를 각각 상술한 인공지능 모델에 통과시키고 산출된 각 조합 데이터에 대해 산출된 결과값을 아래 식 3과 같이 한 쌍으로 만든다.
식(3)
프로세서(120)는 이렇게 생성한 여러 쌍의 데이터를 입력 및 라벨로 정하여 모델 분석이 용이한 선형 회귀 방식으로 (linear regression) 인공지능 모델을 학습시킨다. 해당 과정을 통해서, 기존 전처리 데이터 주변에서 이상 점수 산출 방식의 결정 경계를 근사(estimate)할 수 있게 된다. 따라서, 전처리 데이터에서 이상 거래 검출이 이루어질 때 어떤 특징을 중요하게 보았는지 가중치 분석이 가능해진다. 프로세서(120)는 전처리 데이터의 주변 입력 데이터 각 시점의 기여도를 의미하는 입력 값과 학습된 인공 지능 모델의 뉴런 값을 곱한 값을 출력한다. 이러한 출력 값은 어느 시점이 기여도가 높은지 파악할 수 있으며, 이를 토대로 각 시점의 기여도를 시각화할 수 있다.
메모리(130)는 입력 모듈(110)로 입력되는 데이터, 프로세서(120)에 의해 실행되는데 필요한 데이터 및 프로세서(120)의 실행에 따라 생성된 데이터 중 적어도 어느 하나를 저장하도록 구성된다. 메모리(130)는 전원이 공급되지 않아도 저장된 정보를 계속 유지하는 비휘발성 저장장치 및 저장된 정보를 유지하기 위하여 전력을 필요로 하는 휘발성 저장장치를 통칭하는 것으로 해석되어야 한다. 메모리(130)는 프로세서(120)가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행할 수 있다. 메모리(130)는 저장된 정보를 유지하기 위하여 전력이 필요한 휘발성 저장장치 외에 자기 저장 매체(magnetic storage media) 또는 플래시 저장 매체(flash storage media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
상술한 프로세서(120)의 수행 기능에 따른 데이터의 일 예를 도시한 도 2 및 도 3을 참조하면, 입력 모듈(도 1의 110)은 먼저, 관심 종목의 주식 가격 흐름이 시계열적으로 나타난 분석 대상 주가 데이터(210)를 입력 받을 수 있다. 다음, 프로세서(도 1의 120)는 분석 대상 주가 데이터(210)에 표준화 또는 정규화를 수행하여 전처리 데이터(220)를 생성한다. 다음, 프로세서(도 1의 120)는 상술한 인공지능 모델을 이용하여 전처리 데이터(220)로부터 예측되는 패턴 데이터(230)를 생성한다. 이 때, 인공지능 모델은 정상 주가 거래 데이터를 기초로 정상 패턴 데이터를 나타내도록 학습된다. 따라서, 분석 대상 주가 데이터가 비정상인 경우라 하더라도 정상적인 모습의 패턴을 갖는 패턴 데이터(230)가 형성된다. 다음, 프로세서(도 1의 120)는 240과 같이 전처리 데이터(220)와 패턴 데이터(230)의 차이에 따른 이상 점수를 산출한다. 다음, 프로세서(도 1의 120)는, 250과 같이 분석 대상 주가 데이터에 대한 구간별 기여도를 토대로 분석 대상 주가 데이터에서 비정상 거래로 판단된 구간을 표시할 수 있다. 나아가, 도 3에 도시된 바와 같이 프로세서(120)는 전처리 데이터(220)와 패턴 데이터(230)의 차이에 따라 산출된 이상 점수(320)를 토대로 전처리 데이터(220)의 구간별 기여도를 그래프와 같은 형태로 시각화한 자료(330)로 나타낼 수 있다. 구간별 기여도를 그래프와 같은 형태로 시각화한 자료(330)에서, 전처리 데이터(220)의 t7 내지 t9 구간의 기여도가 다른 구간의 기여도보다 높음을 알 수 있다.  
도 4는 본 발명의 다른 실시예에 따른 주가 이상 거래 탐지 방법의 순서를 도시한 흐름도이고, 도 5 및 도 6은 도 4에 도시된 주가 이상 거래 탐지 방법의 단계들 중 일부 단계에 대한 세부 단계를 도시한 흐름도이다. 이하에서, 도 4 내지 도 6을 참조하여 주가 이상 거래 탐지 방법을 상세히 설명하도록 한다.
본 실시예에 따른 주가 이상 거래 탐지 방법은 인공지능 학습 모델을 이용한 주식 이상 거래 탐지 방법으로서, 앞서 도 1 내지 도 3을 참조하여 설명한 주가 이상 거래 탐지 장치(도 1의 100)에 의해 실행될 수 있다. 예컨대, 주가 이상 거래 탐지 장치(도 1의 100)의 프로세서(도 1의 120)에 의해 이하에서 설명되는 단계들이 수행될 수 있다. 따라서, 상술한 주가 이상 거래 탐지 장치(도 1의 100)에 대한 설명은 본 실시예에 따른 주가 이상 거래 탐지 방법에도 동일하게 적용될 수 있다.
본 실시예에 따른 주가 이상 거래 탐지 방법은, 분석 대상 주가 데이터를 일정 시간 간격 단위로 분할된 복수개의 구간을 갖는 전처리 데이터로 변환하는 단계(S110), 정상 거래 주가 데이터에 대응되는 정상 패턴 데이터를 출력하도록 학습된 인공지능 모델을 이용하여, 전처리 데이터에 대응되는 패턴 데이터를 생성하는 단계(S120), 전처리 데이터와 패턴 데이터의 차이를 기초로 이상 점수를 산출하는 단계(S130), 그리고, 이상 점수를 기설정된 이상치와 비교하여, 분석 대상 주가 데이터의 정상 여부를 판단하는 단계(S140)를 포함한다. S110 단계는 분석 대상 주가 데이터에 정규화 또는 표준화를 수행하여 분석 대상 주가 데이터의 크기를 조절하는 단계를 포함할 수 있다.
주가 이상 거래 탐지 방법은 S120 단계에서 인공지능 모델을 생성하는 단계를 포함할 수 있다. 인공지능 모델을 생성하는 단계는, 정상 거래 주가 데이터를 입력 받아 정상 거래 주가 데이터의 특징 정보를 추출하는 단계(S121). 정상 거래 주가 데이터에 대응되도록, 특징 정보를 토대로 재구성한 정상 패턴 데이터를 생성하는 단계(S122), 그리고, 정상 거래 주가 데이터와 정상 패턴 데이터의 차이에 따른 이상 점수가 기설정된 임계값 이하가 되도록 S121 및 S122 단계를 반복하여 수행하는 단계(S123)를 포함할 수 있다. 이러한 과정을 통해 주가 데이터에 대한 학습이 이루어질 수 있다.
본 실시예에 따른 주가 이상 거래 탐지 방법은, S140 단계에서 분석 대상 주가 데이터가 비정상으로 판단된 경우, 전처리 데이터의 복수개의 구간 각각에 대한 이상 점수를 산출하는 단계(S150)를 더 포함할 수 있다. S150 단계는 전처리 데이터를 전처리 데이터가 갖는 복수개의 구간별로 분할한 분할 데이터들을 생성하는 단계(S151), 인공지능 모델을 이용하여 분할 데이터들 각각에 대한 패턴 데이터들을 생성하는 단계(S152), 그리고, 분할 데이터들 각각과 분할 데이터들 각각에 대응되는 패턴 데이터들 각각의 차이를 기초로 전처리 데이터가 갖는 복수개의 구간별 이상 점수들을 산출하는 단계(S153)를 포함할 수 있다. 또한, S150 단계는, S153 단계 이후에, 복수개의 구간별 이상 점수들을 토대로 복수개의 구간 각각에 대한 기여도를 산출하는 단계(S154)를 더 포함할 수 있다.
이상에서 설명한 주가 이상 거래 탐지 방법은, 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 상술한 설명을 기초로 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해되어야만 한다. 본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다

Claims (13)

  1. 인공지능 학습 모델을 이용한 주식 이상 거래 탐지 장치에 있어서,
    데이터를 입력 받는 입력 모듈; 및
    상기 입력 모듈로 입력되는 데이터를 분석하는 프로세서를 포함하고,
    상기 프로세서는,
    상기 입력 모듈로 입력되는 분석 대상 주가 데이터를 일정 시간 간격 단위로 분할된 복수개의 구간을 갖는 전처리 데이터로 변환하고,
    정상 거래 주가 데이터에 대응되는 정상 패턴 데이터를 출력하도록 학습된 인공지능 모델을 이용하여, 상기 전처리 데이터에 대응되는 패턴 데이터를 생성하고,
    상기 전처리 데이터와 상기 패턴 데이터의 차이를 기초로 이상 점수를 산출하고, 그리고,
    상기 이상 점수를 기설정된 이상치와 비교하여, 상기 분석 대상 주가 데이터의 정상 여부를 판단하는 것을 수행하도록 구성되며,
    상기 프로세서에 의해 상기 분석 대상 주가 데이터가 비정상으로 판단된 경우, 상기 프로세서는, 상기 전처리 데이터의 복수개의 구간 각각에 대한 이상 점수를 산출하되, 상기 이상 점수는 상기 전처리 데이터와 상기 패턴 데이터의 차이를 절대값 및 MSE(Mean Squared Error) 중 하나를 이용하여 산출되는 것이고,
    상기 프로세서는, 상기 전처리 데이터를 상기 전처리 데이터가 갖는 복수개의 구간별로 분할한 분할 데이터들을 생성하고, 복수개의 구간별 이상 점수들을 토대로 상기 복수개의 구간 각각에 대한 기여도를 산출하며, 상기 복수개의 구간 각각의 기여도를 의미하는 입력 값과 상기 학습된 인공지능 모델의 뉴런 값을 곱한 값을 출력하되, 상기 곱한 값을 통해 상기 복수개의 구간 중 어느 구간의 기여도가 가장 높은지 파악하고,
    상기 인공지능 모델은 비정상으로 판단된 상기 전처리 데이터의 각 시점의 값에 노이즈를 추가하여 생성된 데이터를 입력으로 하고 상기 기여도를 의미하는 값을 출력하도록 학습되고, 상기 인공지능 모델은 상기 노이즈가 추가된 데이터 및 상기 기여도를 의미하는 출력값을 하나의 데이터 쌍으로 매칭하며, 매칭된 데이터 쌍을 입력 및 라벨로 설정하여 선형 회귀 방식으로 학습된 것인, 주식 이상 거래 탐지 장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    상기 분석 대상 주가 데이터에 정규화 또는 표준화를 수행하여 상기 분석 대상 주가 데이터의 크기를 조절하는 것을 더 수행하도록 구성되는, 주식 이상 거래 탐지 장치.
  3. 제1항에 있어서,
    상기 프로세서는, 상기 인공지능 모델을 생성하는 것을 더 수행하고,
    상기 인공지능 모델은 상기 프로세서가,
    상기 정상 거래 주가 데이터를 입력 받아 상기 정상 거래 주가 데이터의 특징 정보를 추출하고, 상기 정상 거래 주가 데이터에 대응되도록, 상기 특징 정보를 토대로 재구성한 정상 패턴 데이터를 생성하는 학습을 수행하고, 그리고,
    상기 정상 거래 주가 데이터와 상기 정상 패턴 데이터의 차이에 따른 이상 점수가 기설정된 임계값 이하가 되도록 상기 학습을 반복하여 수행하는 것에 의해 생성되는, 주식 이상 거래 탐지 장치.
  4. 삭제
  5. 제1항에 있어서,
    상기 프로세서는,
    상기 인공지능 모델을 이용하여 상기 분할 데이터들 각각에 대한 패턴 데이터들을 생성하고, 그리고,
    상기 분할 데이터들 각각과 상기 분할 데이터들 각각에 대응되는 상기 패턴 데이터들 각각의 차이를 기초로 상기 전처리 데이터가 갖는 복수개의 구간별 이상 점수들을 산출하는 것을 더 수행하도록 구성되는, 주식 이상 거래 탐지 장치.
  6. 삭제
  7. 인공지능 학습 모델을 이용한 주식 이상 거래 탐지 방법에 있어서,
    (a) 분석 대상 주가 데이터를 일정 시간 간격 단위로 분할된 복수개의 구간을 갖는 전처리 데이터로 변환하는 단계;
    (b) 정상 거래 주가 데이터에 대응되는 정상 패턴 데이터를 출력하도록 학습된 인공지능 모델을 이용하여, 상기 전처리 데이터에 대응되는 패턴 데이터를 생성하는 단계;
    (c) 상기 전처리 데이터와 상기 패턴 데이터의 차이를 기초로 이상 점수를 산출하는 단계; 및
    (d) 상기 이상 점수를 기설정된 이상치와 비교하여, 상기 분석 대상 주가 데이터의 정상 여부를 판단하는 단계를 포함하며,
    (e) 상기 (d) 단계에서 상기 분석 대상 주가 데이터가 비정상으로 판단된 경우, 상기 전처리 데이터의 복수개의 구간 각각에 대한 이상 점수를 산출하는 단계를 더 포함하되, 상기 이상 점수는 상기 전처리 데이터와 상기 패턴 데이터의 차이를 절대값 및 MSE(Mean Squared Error) 중 하나를 이용하여 산출되는 것이고,
    상기 (e) 단계는, 상기 전처리 데이터를 상기 전처리 데이터가 갖는 복수개의 구간별로 분할한 분할 데이터들을 생성하고, 복수개의 구간별 이상 점수들을 토대로 상기 복수개의 구간 각각에 대한 기여도를 산출하며, 상기 복수개의 구간 각각의 기여도를 의미하는 입력 값과 상기 학습된 인공지능 모델의 뉴런 값을 곱한 값을 출력하되, 상기 곱한 값을 통해 상기 복수개의 구간 중 어느 구간의 기여도가 가장 높은지 파악하는 단계를 포함하고,
    상기 인공지능 모델은 비정상으로 판단된 상기 전처리 데이터의 각 시점의 값에 노이즈를 추가하여 생성된 데이터를 입력으로 하고 상기 기여도를 의미하는 값을 출력하도록 학습되고, 상기 인공지능 모델은 상기 노이즈가 추가된 데이터 및 상기 기여도를 의미하는 출력값을 하나의 데이터 쌍으로 매칭하며, 매칭된 데이터 쌍을 입력 및 라벨로 설정하여 선형 회귀 방식으로 학습된 것인, 주식 이상 거래 탐지 방법.
  8. 제7항에 있어서,
    상기 (a) 단계는,
    상기 분석 대상 주가 데이터에 정규화 또는 표준화를 수행하여 상기 분석 대상 주가 데이터의 크기를 조절하는 단계를 더 포함하는, 주식 이상 거래 탐지 방법.
  9. 제7항에 있어서,
    상기 (b) 단계는 상기 인공지능 모델을 생성하는 단계를 더 포함하고,
    상기 인공지능 모델을 생성하는 단계는,
    (b-1) 상기 정상 거래 주가 데이터를 입력 받아 상기 정상 거래 주가 데이터의 특징 정보를 추출하는 단계;
    (b-2) 상기 정상 거래 주가 데이터에 대응되도록, 상기 특징 정보를 토대로 재구성한 정상 패턴 데이터를 생성하는 단계; 및
    (b-3) 상기 정상 거래 주가 데이터와 상기 정상 패턴 데이터의 차이에 따른 이상 점수가 기설정된 임계값 이하가 되도록 상기 (b-1) 및 (b-2) 단계들을 반복하여 수행하는 단계를 포함하는, 주식 이상 거래 탐지 방법.
  10. 삭제
  11. 제7항에 있어서,
    상기 (e) 단계는,
    상기 인공지능 모델을 이용하여 상기 분할 데이터들 각각에 대한 패턴 데이터들을 생성하는 단계; 및
    상기 분할 데이터들 각각과 상기 분할 데이터들 각각에 대응되는 상기 패턴 데이터들 각각의 차이를 기초로 상기 전처리 데이터가 갖는 복수개의 구간별 이상 점수들을 산출하는 단계를 더 포함하는, 주식 이상 거래 탐지 방법.
  12. 삭제
  13. 제7항, 제8항, 제9항 및 제11항 중 어느 한 항에 따른 주식 이상 거래 탐지 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 비일시적 컴퓨터 판독가능 기록매체.
KR1020210022505A 2020-02-24 2021-02-19 주식 이상 거래 탐지 장치 및 방법 KR102664101B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200022314 2020-02-24
KR20200022314 2020-02-24

Publications (2)

Publication Number Publication Date
KR20210107547A KR20210107547A (ko) 2021-09-01
KR102664101B1 true KR102664101B1 (ko) 2024-05-09

Family

ID=77780072

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210022505A KR102664101B1 (ko) 2020-02-24 2021-02-19 주식 이상 거래 탐지 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102664101B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115062242B (zh) * 2022-07-11 2023-06-09 金润方舟科技股份有限公司 一种基于区块链和人工智能的信息智能识别方法及大数据系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016062258A (ja) * 2014-09-17 2016-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検出装置、検出方法、およびプログラム
KR101971278B1 (ko) * 2018-12-13 2019-04-26 주식회사 알고리고 인공신경망을 이용한 비정상 데이터 구분 장치
JP2019070930A (ja) * 2017-10-06 2019-05-09 株式会社日立パワーソリューションズ 異常検知装置および異常検知方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016062258A (ja) * 2014-09-17 2016-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検出装置、検出方法、およびプログラム
JP2019070930A (ja) * 2017-10-06 2019-05-09 株式会社日立パワーソリューションズ 異常検知装置および異常検知方法
KR101971278B1 (ko) * 2018-12-13 2019-04-26 주식회사 알고리고 인공신경망을 이용한 비정상 데이터 구분 장치

Also Published As

Publication number Publication date
KR20210107547A (ko) 2021-09-01

Similar Documents

Publication Publication Date Title
JP7167084B2 (ja) 異常検出システム、異常検出方法、異常検出プログラム及び学習済モデル生成方法
Noor et al. Automated sheep facial expression classification using deep transfer learning
Wang et al. Drifted Twitter spam classification using multiscale detection test on KL divergence
Huerta et al. On a partial least squares regression model for asymmetric data with a chemical application in mining
US11468297B2 (en) Unit-level uncertainty and propagation
Omar et al. Using theoretical ROC curves for analysing machine learning binary classifiers
US11216534B2 (en) Apparatus, system, and method of covariance estimation based on data missing rate for information processing
KR102664101B1 (ko) 주식 이상 거래 탐지 장치 및 방법
US20210110409A1 (en) False detection rate control with null-hypothesis
CN115078894B (zh) 一种电力机房异常检测方法、装置、设备及可读存储介质
Wang et al. Data-driven discovery of stochastic differential equations
Maulana et al. Optimizing University Admissions: A Machine Learning Perspective
JP2019105871A (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
Wang et al. Multiple event identification and characterization by retrospective analysis of structured data streams
US20220284332A1 (en) Anomaly detection apparatus, anomaly detection method and program
Priya Linear regression algorithm in machine learning through MATLAB
KR102192461B1 (ko) 불확정성을 모델링할 수 있는 뉴럴네트워크 학습 장치 및 방법
Dwiputranto et al. Machinery equipment early fault detection using Artificial Neural Network based Autoencoder
Wang et al. Outlier detection in non-parametric profile monitoring
Ding Application of support vector machine regression in stock price forecasting
Zhou et al. Variational Bayesian analysis for Wiener degradation model with random effects
Jiang et al. Unsupervised deep learning for data-driven reliability and risk analysis of engineered systems
Harmon et al. Dynamic prediction length for time series with sequence to sequence networks
CN115840774A (zh) 多元时序异常检测方法及装置、计算机设备和存储介质
Kruglov et al. Neural network modeling of vector multivariable functions in ill-posed approximation problems

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)