KR20190048007A - 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법 - Google Patents

증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법 Download PDF

Info

Publication number
KR20190048007A
KR20190048007A KR1020170142459A KR20170142459A KR20190048007A KR 20190048007 A KR20190048007 A KR 20190048007A KR 1020170142459 A KR1020170142459 A KR 1020170142459A KR 20170142459 A KR20170142459 A KR 20170142459A KR 20190048007 A KR20190048007 A KR 20190048007A
Authority
KR
South Korea
Prior art keywords
data
stock
engine module
module
big data
Prior art date
Application number
KR1020170142459A
Other languages
English (en)
Inventor
고경훈
Original Assignee
주식회사 코스콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 코스콤 filed Critical 주식회사 코스콤
Priority to KR1020170142459A priority Critical patent/KR20190048007A/ko
Publication of KR20190048007A publication Critical patent/KR20190048007A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

본 발명은 각종 정보수집매체의 인터넷 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB에 저장시키는 수집엔진모듈과; 상기 수집엔진모듈을 포함하여 빅데이터 기반 페어 트레이딩 전과정을 제어하고 그 페어 트레이딩정보를 가공하여 설정된 종목의 매도/매수 시점 및 예상 시나리오가 산출되도록 제어하는 제어모듈과; 상기 제어모듈의 기능 제어 하에 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 트레이딩 리스트를 필터링하는 분석엔진모듈과; 상기 제어모듈의 기능 제어 하에 분석엔진모듈에 의해 필터링된 상기 증권종목 페어 트레이딩 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키는 결과산출모듈을 포함하는 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법을 제공한다.
상기와 같은 본 발명은 증권관련 빅데이터들을 크롤링하여 다단계로 가공 및 분석하고 증권종목 페어 리스트를 산출한후 실제 매수/매도 진입시점 및 최상 예상 시나리오를 산출하여 설정된 고객에게 전송함으로써, 종목 연관성에 관계없이 전 종목을 대상으로 페어 트레이딩종목군을 발굴하여 서비스를 제공하므로 그에 따라 증권투자자에 대한 고품위서비스를 제공하는 효과가 있다.

Description

증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법{Pair Trading System based on the Stock bigdata and Controlling Method for the Same}
본 발명은 증권 빅데이터 기반 페어 트레이딩시스템 및 그 제어방법에 관한 것으로, 특히 증권관련 빅데이터들을 크롤링하여 다단계로 가공 및 분석하고 증권종목 페어 리스트를 산출한 후 실제 매수/매도 진입시점 및 최상 예상 시나리오를 산출하여 설정된 고객에게 전송함으로써, 증권투자자에 대한 최상의 고수익서비스를 제공하는 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법에 관한 것이다.
일반적으로 통신 및 산업의 발달과 함께 주가지수의 양상도 급변하고 있다. 즉, 지수의 업종별 세분화, 특정주식의 비중증가로 인해 종합지수는 내려가나 특정지수는 오히려 폭등하는 지수 간의 무상관성 심화, 사이버 매매 전산 프로그램의 다양한 지수 제공 및 제공시간의 단축(업종별 지수, 30초 지수 등), 사이버 매매자의 급격한 증가 및 초단타 매매, 특정지수에 속하는 전체종목이 전부상승(상한) 또는 전부 하락(하한)하는 집단화의 심화, 세계증시의 동조화로 인한 미국 다우, 나스닥의 등락에 따른 다음날 국내 주가의 급등락 등으로 인해 주가지수의 변동폭이 확대될 뿐만 아니라 변동시간도 초 스피드화 하고 있다. 향후 주가 등락폭 확대 또는 상하한선 폐지 등이 실행될 경우 지수변화는 더욱 심화될 것으로 예측된다. 따라서, 상기와 같이 지수의 급등락이 상존하므로 주식투자자에게 있어 매매(매수/매도) 의사결정하기가 매우 어렵고 동시에 그러한 의사결정은 전체손익에 상당한 영향을 미치게 된다. 그러므로 최근에는 그러한 변동 위험성이나 수익률 극대화를 위해 상관성이 있는 종목을 추적하는 종목 페어 트레이딩 방법이 사용되고 있다.
그러면, 상기와 같은 종래 종목 페어 트레이딩방법을 도 1을 참고로 살펴보면, 유사업종 내에서 연관성이 있는 종목군을 크롤링하는 제1 단계(S101)와;
상기 제1 단계(S101)후에 크롤링된 연관성이 있는 종목군내의 종목들을 분석하는 제2 단계(S102)와;
상기 제2 단계(S102)후에 분석된 종목 중에서 페어 트레이딩이 가능한 종목들을 산출하여 고객에게 제공하는 제4 단계(S103)를 포함하여 구성된다.
한편, 상기와 같은 종래 종목 페어 트레이딩방법을 좀 더 구체적으로 살펴보면, 예컨대, 한국의 증권거래소의 코스피나 코스닥에 상장된 유사업종 내에서 연관성이 있는 종목군을 먼저 크롤링한다. 그리고 상기와 같이 크롤링된 연관성이 있는 종목군내의 종목 예컨대, 철강을 생산하는 포스코와 현대제철 혹은 전자제품을 생산하는 삼성전자와 LG전자 등 서로 연관성이 있는 종목군내의 종목들을 분석한다. 또한 상기 분석 과정 중에 그 분석된 종목 중에서 예컨대, 전자제품을 생산하는 삼성전자와 LG전자 등 서로 연관성이 있는 종목군내의 종목 중에서 페이 트레이딩이 가능한 종목이 있을 경우 이들을 취합한 다음 매도/매수 시점 등의 정보를 산출하여 고객의 단말기로 제공한다.
그러나, 상기와 같은 종래 종목 페어 트레이딩방법은 페어 트레이딩을 위한 종목들이 유사업종 내에서만 산출이 가능하기 때문에 서비스의 폭이 매우 제한적이어서 투자자에게 제공되는 고품위서비스가 매우 한정적이었으며, 또한 페어 트레이딩 종목의 발굴 시에 단순 가공 처리하여 페어트레이딩 종목을 산출하므로 그에 따라 매수/매도 진입시점에 대한 승률 정밀도가 저조하여 정보의 활용성도 상당히 저하시키는 문제점이 발생되었다.
이에 본 발명은 상기와 같은 종래기술의 문제점을 해결하기 위해 발명된 것으로, 증권관련 빅데이터들을 크롤링하여 다단계로 가공 및 분석하고 증권종목 페어 리스트를 산출한 후 실제 매수/매도 진입시점 및 최상 예상 시나리오를 산출하여 설정된 고객에게 전송함으로써, 종목 연관성에 관계없이 전 종목을 대상으로 산출한 페어 트레이딩종목군을 발굴하여 최상의 고수익서비스를 제공할 수 있는 증권 빅데이터 기반 페어 트레이딩시스템 및 그 제어방법을 제공함에 그 목적이 있다.
본 발명의 또 다른 목적은 주식투자자에게 증권 빅데이터를 기반으로 하여 산출된 페어 트레이딩 종목들에 대한 매수/매도 진입시점 및 최상 예상 시나리오를 제공하여 최적화된 매매결정을 내리도록 하므로 그에 따라 주식투자에 대한 손실을 최소화할 수 있는 증권 빅데이터 기반 페어 트레이딩시스템 및 그 제어방법을 제공하는데 있다.
상기와 같은 목적을 달성하기 위한 본 발명은 각종 정보수집매체의 인터넷 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB에 저장시키는 수집엔진모듈과;
상기 수집엔진모듈을 포함하여 빅데이터 기반 페어 트레이딩 전 과정을 제어하고 그 페어 트레이딩정보를 가공하여 설정된 종목의 매도/매수 시점 및 예상 시나리오가 산출되도록 제어하는 제어모듈과;
상기 제어모듈의 기능 제어 하에 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 트레이딩 리스트를 필터링하는 분석엔진모듈과;
상기 제어모듈의 기능 제어 하에 분석엔진모듈에 의해 필터링된 상기 증권종목 페어 트레이딩 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키는 결과산출모듈을 포함하는 증권 빅데이터기반 페어 트레이딩시스템을 제공한다.
본 발명의 또 다른 특징은 수집엔진모듈이 제어모듈의 기능 제어 하에 각종 정보수집매체의 인터넷 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB에 저장시키는 제1 과정과;
상기 제1 과정 후에 분석엔진모듈이 제어모듈의 기능 제어 하에 상기 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 리스트를 필터링하는 제2 과정과;
상기 제2 과정 후에 결과산출모듈이 제어모듈의 기능 제어 하에 분석엔진모듈에 의해 필터링된 상기 증권종목 페어 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키는 제3 과정을 포함하는 증권 빅데이터 기반 페어 트레이딩시스템의 제어방법을 제공한다.
상기와 같은 본 발명에 의하면, 증권관련 빅데이터들을 크롤링하여 다단계로 가공 및 분석하고 증권종목 페어 리스트를 산출한 후 실제 매수/매도 진입시점 및 최상 예상 시나리오를 산출하여 설정된 고객에게 전송함으로써, 종목 연관성에 관계없이 전 종목을 대상으로 페어 트레이딩종목군을 발굴하여 서비스를 제공하므로 그에 따라 증권투자자에 대한 고품위서비스를 제공할 수 있는 효과가 있다.
상기와 같은 본 발명은 또한 주식투자자에게 증권 빅데이터를 기반으로 하여 산출된 페어 트레이딩 종목들에 대한 매수/매도 진입시점 및 최상 예상 시나리오를 제공하여 최적화된 매매결정을 내리도록 하므로 그에 따라 주식투자에 대한 손실을 최소화함과 더불어 수익률을 극대화시키는 효과도 있다.
도 1은 종래 종목 페어 트레이딩방법의 이례를 설명하는 플로우차트.
도 2는 본 발명에 따른 증권 빅데이터 기반 페어 트레이딩시스템을 설명하는 설명도.
도 3은 본 발명의 플로우차트.
도 4는 본 발명 시스템의 분석엔진모듈에 의해 실행되는 종목 페어링 과정의 일례를 설명하는 설명도.
도 5는 본 발명 시스템의 결과산출모듈에 의해 실행되는 결과산출과정의 일례를 설명하는 설명도.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
이하, 본 발명의 실시예에 대해 관련 도면들을 참조하여 상세히 설명하기로 한다.
도 2는 본 발명에 따른 증권 빅데이터 기반 페어 트레이딩시스템을 설명하는 설명도이고, 도 3은 본 발명의 플로우차트이며, 도 4는 본 발명 시스템의 분석엔진모듈에 의해 실행되는 종목 페어링 과정의 일례를 설명하는 설명도이고, 도 5는 본 발명 시스템의 결과산출모듈에 의해 실행되는 결과산출과정의 일례를 설명하는 설명도이다.
상기 도 2를 참조하면, 각종 정보수집매체(1) 예컨대, 각종 포털사이트, 증권거래소 사이트 및 증권정보제공 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB(2)에 저장시키는 수집엔진모듈(3)과;
상기 수집엔진모듈(3)을 포함하여 빅데이터 기반 페어 트레이딩 전 과정을 제어하고 그 페어 트레이딩정보를 가공하여 설정된 종목의 매도/매수 시점 및 예상 시나리오가 산출되도록 제어하는 제어모듈(4)과;
상기 제어모듈(4)의 기능 제어 하에 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 트레이딩 리스트를 필터링하는 분석엔진모듈(5)과;
상기 제어모듈(4)의 기능 제어 하에 분석엔진모듈(5)에 의해 필터링된 상기 증권종목 페어 트레이딩 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키는 결과산출모듈(6)을 포함하여 구성된다.
그리고, 상기 수집엔진모듈(3)은 제어모듈(4)의 기능 제어 하에 인터넷을 통해 각종 정보수집매체(1) 예컨대, 각종 포털사이트, 코스피, 코스닥 및 각종 선물정보를 제공하는 증권거래소 사이트 및 증권정보제공 사이트로부터 제공되는 각종 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 설정된 분류절차에 따라 구분하여 DB(2)에 저장시킨다. 예컨대, 상기 수집엔진모듈(3)은 코스피 전종목데이터 및 코스닥 전종목데이터를 포함하는 시세데이터와, 코스피 200 및 코스닥 50 을 포함하는 지수데이터 및, 코스피업종 및 코스닥업종을 포함하는 업종데이터를 기간을 정하여 크롤링한다.
또한 상기 분석엔진모듈(5)은 제어모듈(4)의 기능제어하에 상기 수집엔진모듈(3)에 의해 크롤링된 빅데이터중 전종목을 대상으로 상관관계가 있는 지수 및 종목만을 먼저 추출하고, 그 추출된 지수 및 종목간의 스프레드(종목간의 차이)를 산출한다. 더 나아가, 상기 분석엔진모듈(5)은 상기와 같이 가공해서 추출된 결과물을 가지고 1차로 [수학식1]의 상관 관계식을 이용하여 상관 관계가 있는지를 분석한 후 예측을 할 수 없는 랜덤한 종목이 정상성(안정성)이 있는(일정범위의 위치와 설정된 일정기간 내에서의 특정종목의 가격변동성이 적은 경우를 말함)지를 2차로 분석하며, 상기 2차 분석후에 추출된 결과물이 3차로 정규성(정규분포-가격변동의 예측이 쉬운 종목)이 있는지를 분석한다. 예를 들어, 상기 분석엔진모듈(5)은 임의 두 종목을 선택하고 해당 종목들의 상관관계를 수학식 1에 넣어 산출하게 되는데, 이때, 로그차분을 통해 가격 변화량을 산출한 다음 수학식 2를 통해 가격변화량을 구하여 두종목 상관계수를 산출한다.
[수학식 1]
Figure pat00001
Figure pat00002
Figure pat00003
Figure pat00004
[수학식 2]
Figure pat00005
그리고, 상기 분석엔진모듈(5)은 제어모듈(4)의 기능 제어 하에 상기 수학식 1, 2에 의해 얻어진 두 종목들의 상관관계수를 이용하여 정상성(안정성)을 검증하게 되는데, 이 과정에서 먼저 수학식 3의 선형회귀를 통해 변수들을 산출한다.
[수학식 3]
Figure pat00006
Figure pat00007
Figure pat00008
Figure pat00009
또한 상기 분석엔진모듈(5)은 상기와 같이 수학식 3의 선형회귀를 통해 변수들을 산출한 후 다시 수학식 4를 통해 상기 수학식 3에 의해 산출된 회귀 변수를 통해 정상성을 검증하게 된다(검증조건은 수학식 4에 기반한 회귀모형의 p-value<0.05).
[수학식 4]
Figure pat00010
따라서, 상기 분석엔진모듈(5)이 상기와 같은 단계를 거쳐 실행하면, 데이터 사이즈를 줄이고, 페어 트레이딩을 할 수 있는 최적의 종목1 과 종목 2를 산출하게 된다.
더 나아가, 상기 결과산출모듈(6)에서는 상기 분석엔진모듈(5)에 의해 산출된 페어 트레이딩 종목들에 대한 매도/매수 진입시점을 각각 산출하고 예상수익에 대한 시나리오를 만들어서 고객에게 제공하게 된다. 이때, 상기 결과산출모듈(6)을 좀 더 구체적으로 살펴보면, 상기 결과산출모듈(6)은 상기 분석엔진모듈(5)에 의해 산출된 스프레드에서 제트스코어(표준점수)를 구해서 설정된 파라미터 임계치 예컨대, 2(파라미터 임계치)보다 크거나 작은것을 구해서 스프레드가 가장 크게 벌어질 때는 매도/매수 진입시점을 판단하고 그 판단된 매도/매도 진입시점의 가격들을 그래프나 리포트에 날짜별 예상수익에 대한 시나리오를 만들어서 고객에게 제공한다.
즉, 상기 결과산출모듈(6)은 수학식 5을 이용하여 정상성(안정성)을 검증하게 되는데, 이때 상기 결과산출모듈(6)은 먼저 진입시점 전략모델을 산출하고 그 산출결과을 이용하여 최적의 페어트레이딩 종목쌍을 산출하게 된다.
[수학식 5]
Figure pat00011
Figure pat00012
Figure pat00013
Figure pat00014
다음에는 상기와 같은 구성으로 된 본 발명의 제어방법을 설명한다.
본 발명의 방법은 도 3에 도시된 바와같이 수집엔진모듈이 제어모듈의 기능제어하에 각종 정보수집매체의 인터넷 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB에 저장시키는 제1 과정(S1)과;
상기 제1 과정(S1)후에 분석엔진모듈이 제어모듈의 기능 제어 하에 상기 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 리스트를 필터링하는 제2 과정(S2)과;
상기 제2 과정(S2)후에 결과산출모듈이 제어모듈의 기능 제어 하에 분석엔진모듈에 의해 필터링된 상기 증권종목 페어 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키는 제3 과정(S3)을 포함하여 구성된다.
그리고, 상기 제1 과정(S1)에는 수집엔진모듈이 제어모듈의 기능 제어 하에 인터넷을 통해 각종 정보수집매체 예컨대, 각종 포털사이트, 코스피, 코스닥 및 각종 선물정보를 제공하는 증권거래소 사이트 및 증권정보제공 사이트로부터 제공되는 각종 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 설정된 분류절차에 따라 구분하여 DB에 저장시키는 단계를 더 포함한다.
예컨대, 상기 제1 과정(S1)에서는 수집엔진모듈이 코스피 전 종목 데이터 및 코스닥 전 종목 데이터를 포함하는 시세데이터와, 코스피 200 및 코스닥 50 을 포함하는 지수데이터 및, 코스피업종 및 코스닥업종을 포함하는 업종데이터를 크롤링하는 정밀 크롤링단계를 더 포함한다.
또한 상기 제2 과정(S2)에는 분석엔진모듈이 제어모듈의 기능 제어 하에 수집엔진모듈에 의해 크롤링된 빅데이터중 전 종목을 대상으로 상관관계가 있는 지수 및 종목만을 먼저 추출하는 추출단계와,
상기 추출단계후에 그 추출된 지수 및 종목간의 스프레드(종목간의 차이)를 산출하는 데이터 가공단계와,
상기 데이터 가공단계후에 그 다음에서 가공해서 추출된 결과물을 가지고 1차로 상관 관계식을 이용하여 상관 관계가 있는지를 분석하는 1차 분석단계와,
상기 1차 분석단계후에 예측을 할 수 없는 램덤한 종목이 정상성(안정성)이 있는 지를(레인지 범위 안에서 위치 혹은 설정된 일정기간내에 가격변동성이 적게 나타나는 지의 여부를 2차로 분석하는 2차 분석단계와,
상기 2차 분석단계후에 그다음에는 추출된 결과물이 3차로 정규성(정규분포-가격변동의 예측이 쉬운 종목인지의 여부)이 있는지를 분석하는 3차 분석단계를 더 포함한다.
따라서, 상기와 같은 제2 과정(S2)의 세부단계를 거쳐 실행하면, 상기 분석엔진모듈에 의해 데이터 사이즈를 줄일 수 있게 되고, 페어 트레이딩을 할 수 있는 최적의 종목1 과 종목 2를 산출하게 된다.
더 나아가, 상기 제3 과정(S3)에는 결과산출모듈이 분석엔진모듈에 의해 산출된 페어 트레이딩 종목들에 대한 매도/매수 진입시점을 각각 산출하고 예상수익에 대한 시나리오를 만들어서 고객에게 제공하는 단계를 더 포함한다. 이때, 상기 제3 과정(S3)에서, 결과산출모듈은 상기 분석엔진모듈에 의해 산출된 스프레드에서 제트스코어(표준점수)를 구해서 파라미터 임계치 예컨대, 2 보다 크거나 작은것을 구해서 스프레드가 가장 크게 벌어질 때는 매도/매수 진입시점을 판단하는 진입시점 판단단계와, 상기 진입시점 판단단계후에 그 판단된 매도/매도 진입시점의 가격들을 그래프나 리포트에 날짜별 예상수익에 대한 시나리오를 만들어서 고객에게 제공하는 예상 시나리오 산출단계를 더 포함한다.
환언하면, 본발명에 따른 증권 빅데이터기반 페어 트레이딩시스템(7)을 사용하려면, 먼저, 제어모듈(4)은 수집엔진모듈(3)을 통해 각종 정보수집매체(1) 예컨대, 각종 포털사이트, 증권거래소 사이트 및 증권정보제공 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB(2)에 저장시킨다. 그리고, 상기와 같이 크롤링 과정이 완료되면, 상기 제어모듈(4)은 분석엔진모듈(5)을 통해 상기 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 리스트를 필터링한다. 또한 상기와 같은 분석과정후에 제어모듈(4)은 결과산출모듈(6)을 통해 분석엔진모듈(5)에 의해 필터링된 상기 증권종목 페어 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키므로, 증권 빅데이터를 기반으로 하는 페어 트레이딩을 실행하게 된다.
이때, 상기 데이터 크롤링 과정을 좀 더 구체적으로 살펴보면, 상기 수집엔진모듈(3)은 제어모듈(4)의 기능 제어 하에 인터넷을 통해 각종 정보수집매체(1) 예컨대, 각종 포털사이트, 코스피, 코스닥 및 각종 선물정보를 제공하는 증권거래소 사이트 및 증권정보제공 사이트로부터 제공되는 각종 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 설정된 분류절차에 따라 구분하여 DB(2)에 저장시키게 된다. 상기 데이터 크롤링과정에서, 상기 수집엔진모듈(3)은 빅데이터 수집대상을 예컨대, 코스피 전 종목 데이터 및 코스닥 전 종목 데이터를 포함하는 시세데이터와, 코스피 200 및 코스닥 50 을 포함하는 지수데이터 및, 코스피업종 및 코스닥업종을 포함하는 업종데이터를 구분하여 정밀하게 크롤링하게 된다.
또한 상기 분석과정에서 상기 분석엔진모듈(5)은 제어모듈(4)의 기능 제어 하에 수집엔진모듈(3)에 의해 크롤링된 빅데이터중 전종목을 대상으로 상관관계가 있는 지수 및 종목만을 먼저 추출하고, 그 추출된 지수 및 종목간의 스프레드(종목간의 차이)를 산출한다. 이때 상기 분석엔진모듈(5)은 상기와 스프레드 산출과정을 통해 산출된 그 추출된 결과물을 가지고 1차로 상관 관계식을 이용하여 상관 관계가 있는지를 분석하게 되고, 그 후 그 추출된 동일한 결과물을 가지고 예측을 할 수 없는 램덤한 종목이 정상성(안정성)이 있는 지를 2차로 분석하며, 그다음 다시한번 그 추출된 결과물이 정규성(정규분포-가격변동의 예측이 쉬운 종목)이 있는지를 3차로 분석한다. 따라서, 상기와 같은 세부분석과정을 거쳐 실행하면, 상기 분석엔진모듈(5)에 의해 크롤링시 대량으로 많았던 빅데이터의 데이터 사이즈가 상당히 줄어들게 되고, 페어 트레이딩을 할 수 있는 최적의 종목1 과 종목 2를 산출하게 된다.
상기 분석과정을 좀 더 구체적으로 설명하면, 상기 분석엔진모듈(5)은 상기와 같이 가공해서 추출된 결과물을 가지고 1차로 [수학식1]의 상관 관계식을 이용하여 상관 관계가 있는지를 분석한 후 예측을 할 수 없는 랜덤한 종목이 정상성(안정성)이 있는(일정범위의 위치와 설정된 일정기간 내에서의 특정종목의 가격변동성이 적은 경우를 말함)지를 2차로 분석하며, 상기 2차 분석 후에 추출된 결과물이 3차로 정규성(정규분포-가격변동의 예측이 쉬운 종목)이 있는지를 분석한다. 예를들어, 상기 분석엔진모듈(5)은 임의 두 종목을 선택하고 해당 종목들의 상관관계를 수학식 1에 넣어 산출하게 되는데, 이때, 로그차분을 통해 가격 변화량을 산출한 다음 수학식 2를 통해 가격변화량을 구하여 두 종목 상관계수를 산출한다.
[수학식 1]
Figure pat00015
Figure pat00016
Figure pat00017
Figure pat00018
[수학식 2]
Figure pat00019
그리고, 상기 분석엔진모듈(5)은 제어모듈(4)의 기능 제어 하에 상기 수학식 1, 2에 의해 얻어진 두 종목들의 상관관계수를 이용하여 정상성(안정성)을 검증하게 되는데, 이 과정에서 먼저 수학식 3의 선형회귀를 통해 변수들을 산출한다.
[수학식 3]
Figure pat00020
Figure pat00021
Figure pat00022
Figure pat00023
또한 상기 분석엔진모듈(5)은 상기와 같이 수학식 3의 선형회귀를 통해 변수들을 산출한 후 다시 수학식 4를 통해 상기 수학식 3에 의해 산출된 회귀 변수를 통해 정상성을 검중하게 된다(검증조건은 수학식 4에 기반한 회귀모형의 p-value<0.05).
[수학식 4]
Figure pat00024
따라서, 상기 분석엔진모듈(5)이 상기와 같은 단계를 거쳐 실행하면, 데이터 사이즈를 줄이고, 페어 트레이딩을 할 수 있는 최적의 종목1 과 종목 2를 산출하게 된다.
예를 들어, 도 4의 그래프를 참고로 설명하면, 종목 대상을 동일업종이 아닌 비동일 업종으로서 대우증권과 광주신세계를 얻었고 기간은 약 1년(2015년 6월-2016년 6월)으로 설정하여서 상기 수학식 1 내지 4에 넣어 산출한 상관계수는 0.95를 얻게되는데, 상기 대우증권(종목1)과 광주신세계(종목2)은 영업일 기준 180일 동안 0.95의 상관도를 나타내었다.
더 나아가, 상기 결과산출과정에서, 상기 결과산출모듈(6)은 분석엔진모듈(5)에 의해 산출된 페어 트레이딩 종목들에 대한 매도/매수 진입시점을 각각 산출하고 예상수익에 대한 시나리오를 만들어서 고객에게 제공하게되는데, 이때, 상기 결과산출모듈(6)은 상기 분석엔진모듈(5)에 의해 산출된 스프레드에서 제트스코어(표준점수)를 구해서 설정된 파라미터 임계치 예컨대, 2 보다 크거나 작은것을 구해서 스프레드가 가장 크게 벌어질 때는 매도/매수 진입시점을 판단한 다음 그 판단된 매도/매도 진입시점의 가격들을 그래프나 리포트에 날짜별 예상수익에 대한 예상시나리오를 만들어서 고객에게 제공한다.
여기서, 상기 결과산출과정을 좀 더 구체적으로 설명하면, 더 나아가, 상기 결과산출모듈(6)에서는 상기 분석엔진모듈(5)에 의해 산출된 페어 트레이딩 종목들에 대한 매도/매수 진입시점을 각각 산출하고 예상수익에 대한 시나리오를 만들어서 고객에게 제공하게 된다. 이때, 상기 결과산출모듈(6)을 좀 더 구체적으로 살펴보면, 상기 결과산출모듈(6)은 상기 분석엔진모듈(5)에 의해 산출된 스프레드에서 제트스코어(표준점수)를 구해서 설정된 파라미터 임계치 예컨대, 2(파라미터 임계치)보다 크거나 작은것을 구해서 스프레드가 가장 크게 벌어질 때는 매도/매수 진입시점을 판단하고 그 판단된 매도/매도 진입시점의 가격들을 그래프나 리포트에 날짜별 예상수익에 대한 시나리오를 만들어서 고객에게 제공한다.
즉, 상기 결과산출모듈(6)은 수학식 5을 이용하여 정상성(안정성)을 검증하게 되는데, 이때 상기 결과산출모듈(6)은 먼저 진입시점 전략모델을 산출하고 그 산출결과을 이용하여 최적의 페어트레이딩 종목쌍을 산출하게 된다.
[수학식 5]
Figure pat00025
Figure pat00026
Figure pat00027
Figure pat00028
예컨대, 상기 결과산출모듈(6)은 상기 대우증권(종목1)과 광주신세계(종목2)의 표준점수(Z-Score)를 ± 2를 기준으로 가정할 경우 스프레드 부호의 변동 횟수가 영업일 기준 180일 동안 18회로, 해당 기간 동안 거래 가능한 충분한 날짜를 확보한다. 이후 투자자들에게 두 종목 조합을 대상으로 하는 수익금 시뮬레이션을 실행하면되는데, 결과적으로 도 5에 도시된 바와같이 두 종목은 해당 기간동안 안정적으로 가격 변동이 있는 종목 쌍이라 할 수 있다. 또한 상기 해당 종목쌍이 그리는 시세 그래프는 안전성 검정에서 P-value <= 0.5를 갖는 유의미한 회귀모형이 됨을 알 수 있다.
1 : 각종 정보수집매체 2 : DB
3 : 수집엔진모듈 4 ; 제어모듈
5 : 분석엔진모듈 6 : 결과산출모듈
7 : 페어 트레이딩시스템

Claims (11)

  1. 각종 정보수집매체의 인터넷 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB에 저장시키는 수집엔진모듈과;
    상기 수집엔진모듈을 포함하여 빅데이터 기반 페어 트레이딩 전과정을 제어하고 그 페어 트레이딩정보를 가공하여 설정된 종목의 매도/매수 시점 및 예상 시나리오가 산출되도록 제어하는 제어모듈과;
    상기 제어모듈의 기능제어하에 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 트레이딩 리스트를 필터링하는 분석엔진모듈과;
    상기 제어모듈의 기능제어하에 분석엔진모듈에 의해 필터링된 상기 증권종목 페어 트레이딩 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키는 결과산출모듈을 포함하는 증권 빅데이터기반 페어 트레이딩시스템.
  2. 제1항에 있어서,
    상기 수집엔진모듈은 코스피 전종목데이터 및 코스닥 전종목데이터를 포함하는 시세데이터와, 코스피 200 및 코스닥 50 을 포함하는 지수데이터 및, 코스피업종 및 코스닥업종을 포함하는 업종데이터를 크롤링하는 것을 특징으로 하는 증권 빅데이터기반 페어 트레이딩시스템.
  3. 제1항에 있어서,
    상기 분석엔진모듈은 제어모듈의 기능 제어 하에 수집엔진모듈에 의해 크롤링된 빅데이터중 전 종목을 대상으로 상관관계가 있는 지수 및 종목만을 먼저 추출하고, 그 추출된 지수 및 종목간의 스프레드를 산출하는 것을 특징으로 하는 증권 빅데이터기반 페어 트레이딩시스템.
  4. 제3항에 있어서, 상기 분석엔진모듈은 가공 추출된 결과물을 가지고 1차로 상관 관계식을 이용하여 상관 관계가 있는지를 분석한 후 예측을 할 수 없는 랜덤한 종목이 정상성(안정성)이 있는 지를 2차로 분석하며, 상기 2차 분석후에 추출된 결과물이 3차로 정규성이 있는지를 분석하는 것을 특징으로 하는 증권 빅데이터기반 페어 트레이딩시스템.
  5. 제1항에 있어서,
    상기 결과산출모듈은 분석엔진모듈에 의해 산출된 스프레드에서 제트스코어를 구해서 설정된 파라미터 임계치보다 크거나 작은 것을 구한다음 스프레드가 가장 크게 벌어질 때를 매도/매수 진입시점으로 판단하는 것을 특징으로 하는 증권 빅데이터기반 페어 트레이딩시스템.
  6. 제5항에 있어서,
    상기 결과산출모듈은 상기 판단된 매도/매도 진입시점의 가격들을 그래프나 리포트에 날짜별 예상수익에 대한 시나리오를 만들어서 고객에게 제공하는 것을 특징으로 하는 증권 빅데이터 기반 페어 트레이딩시스템.
  7. 수집엔진모듈이 제어모듈의 기능 제어 하에 각종 정보수집매체의 인터넷 사이트로부터 제공되는 증권관련 빅데이터들을 크롤링하고 그 크롤링된 데이터들을 구분하여 DB에 저장시키는 제1 과정과;
    상기 제1 과정 후에 분석엔진모듈이 제어모듈의 기능 제어 하에 상기 크롤딩된 빅데이터들을 다단계로 가공 및 분석하여 빅데이터 기반 증권종목 페어 리스트를 필터링하는 제2 과정과;
    상기 제2 과정 후에 결과산출모듈이 제어모듈의 기능 제어 하에 분석엔진모듈에 의해 필터링된 상기 증권종목 페어 리스트를 대상으로 실제 매수/매도 진입시점을 산출한 다음 수익을 계산하여 최종 예상 시나리오를 산출하여 설정된 고객단말기나 전자주소로 전송시키는 제3 과정을 포함하는 증권 빅데이터 기반 페어 트레이딩시스템의 제어방법.
  8. 제7항에 있어서,
    상기 제1 과정에는 수집엔진모듈이 코스피 전종목데이터 및 코스닥 전종목데이터를 포함하는 시세데이터와, 코스피 200 및 코스닥 50 을 포함하는 지수데이터 및, 코스피업종 및 코스닥업종을 포함하는 업종데이터를 크롤링하는 정밀크롤링단계를 더 포함하는 것을 특징으로 하는 증권 빅데이터 기반 페어 트레이딩시스템의 제어방법.
  9. 제7항에 있어서,
    상기 제2 과정에는 분석엔진모듈이 제어모듈의 기능 제어 하에 수집엔진모듈에 의해 크롤링된 빅데이터중 전 종목을 대상으로 상관관계가 있는 지수 및 종목을 추출하는 추출단계와,
    상기 추출단계후에 그 추출된 지수 및 종목간의 스프레드(종목간의 차이)를 산출하는 데이터 가공단계를 더 포함하는 것을 특징으로 하는 증권 빅데이터 기반 페어 트레이딩시스템의 제어방법.
  10. 제9항에 있어서,
    상기 데이터 가공단계에 의해 가공되어 추출된 결과물을 가지고 1차로 상관 관계식을 이용하여 상관 관계가 있는지를 분석하는 1차 분석단계와,
    상기 1차 분석단계후에 예측을 할 수 없는 랜덤한 종목이 정상성(안정성)이 있는 지를 2차로 분석하는 2차 분석단계와,
    상기 2차 분석단계 후에 상기 추출된 결과물이 3차로 정규성이 있는지를 분석하는 3차 분석단계를 더 포함하는 것을 특징으로 하는 증권 빅데이터 기반 페어 트레이딩시스템의 제어방법.
  11. 제7항에 있어서,
    상기 제3 과정에는 결과산출모듈이 분석엔진모듈에 의해 산출된 스프레드에서 제트스코어(표준점수)를 구해서 설정된 파라미터 임계치 보다 크거나 작은 것을 구해서 스프레드가 가장 크게 벌어질 때는 매도/매수 진입시점을 판단하는 진입시점 판단단계와, 상기 진입시점 판단단계 후에 그 판단된 매도/매도 진입시점의 가격들을 그래프나 리포트에 날짜별 예상수익에 대한 시나리오를 만들어서 고객에게 제공하는 예상 시나리오 산출단계를 더 포함하는 것을 특징으로 하는 증권 빅데이터 기반 페어 트레이딩시스템의 제어방법.

KR1020170142459A 2017-10-30 2017-10-30 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법 KR20190048007A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170142459A KR20190048007A (ko) 2017-10-30 2017-10-30 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170142459A KR20190048007A (ko) 2017-10-30 2017-10-30 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020190145965A Division KR20190130535A (ko) 2019-11-14 2019-11-14 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법

Publications (1)

Publication Number Publication Date
KR20190048007A true KR20190048007A (ko) 2019-05-09

Family

ID=66545458

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170142459A KR20190048007A (ko) 2017-10-30 2017-10-30 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법

Country Status (1)

Country Link
KR (1) KR20190048007A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021002533A1 (ko) * 2019-07-01 2021-01-07 유한책임회사 블루바이저시스템즈 머신러닝 기반의 휴면 자산 관리 방법 및 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021002533A1 (ko) * 2019-07-01 2021-01-07 유한책임회사 블루바이저시스템즈 머신러닝 기반의 휴면 자산 관리 방법 및 시스템

Similar Documents

Publication Publication Date Title
Brummer Disruptive technology and securities regulation
Griffin et al. The dynamics of institutional and individual trading
US8069101B1 (en) Financial methodology to valuate and predict the news impact of major events on financial instruments
Cici et al. Missing the marks? Dispersion in corporate bond valuations across mutual funds
US8930254B2 (en) Financial methodology to valuate and predict the news impact of major events on financial instruments
Wei et al. Twitter volume spikes and stock options pricing
TW201310377A (zh) 基於用戶行為的電子商務資訊推薦方法與裝置
JP2005530232A (ja) 取引コストの評価および最適化のためのシステム並びに方法
KR20190130535A (ko) 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법
CN107437227A (zh) 股票投资分析装置与方法
CN112734559A (zh) 企业信用风险评价方法、装置及电子设备
CN110991936A (zh) 企业评分评级方法、装置、设备及介质
US20070150396A1 (en) Stock value chains
KR20160028701A (ko) 실시간 주식종목 추천시스템
Gupta et al. Stock market prediction accuracy analysis using kappa measure
KR20190048007A (ko) 증권 빅데이터기반 페어 트레이딩시스템 및 그 제어방법
Palma et al. A multiobjective model for the cutting pattern problem with unclear preferences
EP2706500A2 (en) Method for displaying current disparate ratio for enterprise value using difference between market value for enterprise and basic analysis
KR20000053962A (ko) 주식 동시호가시의 매도매수정보를 이용한 선물지수 및주가지수 사전예측 시스템
KR20130042746A (ko) 기업별 실시간 상대가치 평가 방법
Nie High‐frequency price discovery and price efficiency on interest rate futures
An et al. Short‐Term Stock Price Prediction Based on Limit Order Book Dynamics
US20140180964A1 (en) Method for displaying current disparate ratio for enterprise value using difference between market value for enterprise and basic analysis
Muthama et al. An empirical investigation of the random walk hypothesis of stock prices on the Nairobi Stock Exchange
Chang Order imbalance and daily momentum investing: evidence from Taiwan

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
E601 Decision to refuse application
E801 Decision on dismissal of amendment