KR102161256B1 - 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법 - Google Patents

주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법 Download PDF

Info

Publication number
KR102161256B1
KR102161256B1 KR1020180146556A KR20180146556A KR102161256B1 KR 102161256 B1 KR102161256 B1 KR 102161256B1 KR 1020180146556 A KR1020180146556 A KR 1020180146556A KR 20180146556 A KR20180146556 A KR 20180146556A KR 102161256 B1 KR102161256 B1 KR 102161256B1
Authority
KR
South Korea
Prior art keywords
stock
item
correlation
stocks
price
Prior art date
Application number
KR1020180146556A
Other languages
English (en)
Other versions
KR20200061144A (ko
Inventor
이기훈
김동현
조만재
신희민
김홍지
Original Assignee
광운대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광운대학교 산학협력단 filed Critical 광운대학교 산학협력단
Priority to KR1020180146556A priority Critical patent/KR102161256B1/ko
Publication of KR20200061144A publication Critical patent/KR20200061144A/ko
Application granted granted Critical
Publication of KR102161256B1 publication Critical patent/KR102161256B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법이 개시된다. 본 발명은 주식 종목별 주가 데이터를 수집하고, 수집된 주가 데이터로부터 각 주식 종목별 상관관계를 분석하고, 상관관계가 분석된 주식 종목들에 대한 주가 데이터로부터 학습하여 생성된 주가 예측 모델을 이용하여 상관관계가 분석된 주식 종목들에 대한 주가를 예측하고, 예측된 주가를 비교하여 주가 상승이 예측되는 주식 종목을 상관관계가 분석된 주식 종목들 중에서 선택함으로써, 수익률을 높일 수 있다.

Description

주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법 {STOCKS SELECTION APPARATUS FOR CONSTRUCTING STOCK PORTFOLIO AND METHOD THEREOF}
본 발명은 딥러닝 기법을 이용하여 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시 예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
주식투자는 많은 사람들이 이용하는 재테크 방법 중의 하나로, 주식 투자를 함에 있어서 주식의 가치를 파악하여 주가가 상승할지 하락할지를 예측하여야 하고, 이러한 예측을 위해 증권사들은 다양한 기술적 지표, 재무 데이터 등과 같은 다양한 주가지표를 제공하고 있다.
일반적인 개인 투자자의 경우에는 상술한 주가지표에 대한 정교한 분석에 기반을 두지 않은 채 주식 종목에 투자하며, 또한 투자 보다는 투기에 가까운 매매성향으로 소수의 종목에 집중 투자함으로써 수익의 극대화를 추구한다. 하지만, 주가 지표의 분석 없이 이루어지는 투자의 경우 투자의 위험도를 높이며, 결국 개인 투자자에게 큰 손실을 가져오는 문제점이 있다.
상술한 개인 투자자들의 큰 손실을 막을 수 있는 방법은 다수 종목에 분산 투자하여 변동성에 대한 위험성을 줄이는 포트폴리오 투자를 하는 것이지만, 주식 포트폴리오를 구성하는데 있어서 개별 종목의 주가 데이터를 활용하지 않는 문제점이 있으며, 또한 주가에 영향을 미치는 근본 요인들이 너무나도 다양하고 복잡하여 상술한 주가지표만을 이용하여 변동 가능성이 큰 주가를 예측하는 것은 어려운 문제점이 있다.
본 발명은 주식 네트워크 분석 기반의 포트폴리오 투자 방법에 딥러닝을 이용하여 주가를 예측함으로써 수익률을 높이도록, 주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집하고, 수집된 주가 데이터로부터 각 주식 종목별 간 상관관계를 분석하며, 주가 예측 모델을 이용하여 상관관계가 분석된 주식 종목들에 대한 주가 데이터로부터 예측 날짜의 주가를 예측하고, 상관관계가 분석된 주식 종목들에 대해 예측된 주가를 비교하여 주가 상승이 예측되는 주식 종목을 상관관계가 분석된 주식 종목들 중에서 선택하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법을 제공함에 있다.
상술한 목적을 달성하기 위한 본 발명의 또 다른 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치는 주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집하는 주가 데이터 수집부; 상기 수집된 주가 데이터를 이용하여 상기 각 주식 종목별 간 상관관계를 분석하는 상관관계 분석부; 상기 상관관계가 분석된 주식 종목들에 대해 상기 수집된 주가 데이터를 기반으로 학습하여 생성한 주가 예측 모델을 이용하여 주가를 예측하려는 예측 날짜에 대한 상기 상관관계가 분석된 주식 종목들 각각의 주가를 예측하는 주가 예측부; 및 상기 상관관계가 분석된 주식 종목들 각각에 대해 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 상기 상관관계가 분석된 주식 종목들 중에서 선택하는 주식 종목 선택부;를 포함할 수 있다.
상술한 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스에 의한 주식 포트폴리오 구성을 위한 주식 종목 선택 방법은 주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집하는 단계; 상기 수집된 주가 데이터를 이용하여 상기 각 주식 종목별 간 상관관계를 분석하는 단계; 상기 상관관계가 분석된 주식 종목들에 대해 상기 수집된 주가 데이터를 기반으로 학습하여 생성한 주가 예측 모델을 이용하여 주가를 예측하려는 예측 날짜에 대한 상기 상관관계가 분석된 주식 종목들 각각의 주가를 예측하는 단계; 및 상기 상관관계가 분석된 주식 종목들 각각에 대해 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 상기 상관관계가 분석된 주식 종목들 중에서 선택하는 단계;를 포함할 수 있다.
본 발명의 또 다른 목적을 달성하기 위하여 본 발명의 주식 포트폴리오 구성을 위한 주식 종목을 선택하는 방법이 컴퓨터에서 수행하기 위한 컴퓨터에서 판독 가능한 프로그램이 기록된 저장 매체를 제공할 수 있다.
본 발명의 일 실시 예에 따르면 주가 상승이 예측되는 주식 종목에 대해서 분산 투자가 가능하며, 이에 따라 투자 위험도를 낮출 수 있는 주식 포트폴리오를 구성할 수 있다.
또한, 본 발명의 일 실시 예에 따르면 상관관계가 낮은 주식 종목들만을 추출하여 주가를 예측하므로 딥러닝 기법을 이용하여 주식 종목의 주가를 예측하는 예측 속도를 향상시킬 수 있다.
본 발명의 효과들은 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해 될 수 있을 것이다.
도 1은 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치의 구성을 개략적으로 도시한 블록도이다.
도 2는 본 발명의 일 실시 예에 따른 상관관계 분석부의 구성을 구체적으로 도시한 블록도이다.
도 3은 본 발명의 일 실시 예에 따른 각 주식 종목별 간 산출된 상관계수를 설명하기 위한 도면을 나타낸 것이다.
도 4는 본 발명의 일 실시 예에 따라 생성된 주식 네트워크 그래프를 설명하기 위한 도면을 나타낸 것이다.
도 5는 본 발명의 일 실시 예에 따라 구성된 최소신장트리를 설명하기 위한 도면을 나타낸 것이다.
도 6은 본 발명의 또 다른 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치의 구성을 구체적으로 도시한 블록도이다.
도 7은 본 발명의 일 실시 예에 따라 주식 종목의 주가를 예측하는 방법을 설명하기 위한 도면을 나타낸 것이다.
도 8은 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 방법을 설명하기 위한 흐름도이다.
도 9는 본 발명의 일 실시 예에 따른 각 주식 종목별 간 상관관계를 분석하는 방법을 구체적으로 설명하기 위한 흐름도이다.
도 10은 본 발명의 또 다른 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 방법을 설명하기 위한 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명의 실시 예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 명세서에서 “학습”, “러닝” 등의 용어는 인간의 교육 활동과 같은 정신적 작용을 지칭하도록 의도된 것이 아닌 절차에 따른 컴퓨팅(computing)을 통하여 기계 학습(machine learning)을 수행함을 일컫는 용어로 해석한다.
본 명세서에서 "제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
본 명세서에서 각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 명세서에서, “가진다”, “가질 수 있다”, “포함한다” 또는 “포함할 수 있다”등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.
도 1은 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치의 구성을 개략적으로 도시한 블록도이다.
도 1을 참조하면, 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)는 주가 데이터 수집부(110), 상관관계 분석부(120), 주가 예측부(130) 및 주식 종목 선택부(140)를 포함할 수 있다. 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)는 도 1에서 예시적으로 도시한 다양한 구성요소들 중에서 일부 구성요소를 생략하거나 다른 구성요소를 추가로 포함할 수 있다.
본 발명의 일 실시 예에 따른 주식 종목 선택 장치(100)는 거래하려는 주식 종목의 매수/매도에 대한 주식 포트폴리오를 설정하기 위해 각 주식 종목별 주가를 예측하여 주가가 상승할 것으로 예측되는 주식 종목을 선택할 수 있다.
본 발명의 일 실시 예에 따른 주가 데이터 수집부(110)는 주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집할 수 있다.
주가 데이터는 주식 종목에서 일반적으로 사용되는 시가(open), 고가(high), 저가(low), 종가(close), 조정 종가(adjust close) 및 주식의 거래량(volume)을 포함할 수 있다.
시가(open)는 증권거래소에서 형성되는 주식의 가격을 나타내고, 고가(high)는 당일 주식 장 중에서 주식의 가격이 가장 높았던 가격을 나타내며, 저가(low)는 당일 주식 장 중에서 주식의 가격이 가장 낮았던 가격을 나타내고, 종가(close)는 당일 주식 장이 끝나면서 마지막으로 형성된 주식 가격을 나타내며, 조정 종가(adjust close)는 주식 종목에 해당하는 기업에 증자, 액면분할과 같은 이벤트가 발생하여 주가에 변화가 생기는 경우 과거 주가도 함께 조정하는 것을 나타내고, 주식의 거래량(volume)은 일정 기간(시, 일, 주, 달, 년) 동안 거래된 주식 수(매도, 매수)를 나타낸다.
본 발명의 일 실시 예에 따른 주가 데이터는 KOSPI200에 있는 200종목, 예측 날짜를 기준으로 최근 5년간의 시가, 고가, 저가, 종가, 조정 종가, 거래량(open, high, low, close, adjust close, volume)을 나타낼 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 상관관계 분석부(120)는 주가 데이터 수집부(110)에서 수집된 주가 데이터를 이용하여 각 주식 종목별 간 상관관계를 분석할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 상관관계 분석부(120)는 주가 데이터 수집부(110)에서 수집된 주가 데이터를 이용하여 각 주식 종목들 중에서 상관관계가 높은 주식 종목들로 어떠한 주식 종목들이 있는지 분석할 수 있고, 또한 각 주식 종목들 중에서 상관관계가 낮은 주식 종목들로 어떠한 주식 종목들이 있는지 분석할 수 있다.
상술한 각 주식 종목별 상관관계를 분석하기 위한 구체적인 방법은 도 2를 함께 참조하여 설명하도록 한다.
도 2는 본 발명의 일 실시 예에 따른 상관관계 분석부의 구성을 구체적으로 도시한 블록도이다.
도 2를 참조하면, 본 발명의 일 실시 예에 따른 상관관계 분석부(120)는 상관계수 산출부(121), 거리 산출부(122), 주식 네트워크 그래프 생성부(123), 클러스터링부(124) 및 주식 종목 추출부(125)를 포함할 수 있다. 상관관계 분석부(120)는 도 2에서 예시적으로 도시한 다양한 구성요소들 중에서 일부 구성요소를 생략하거나 다른 구성요소를 추가로 포함할 수 있다.
본 발명의 일 실시 예에 따른 상관계수 산출부(121)는 각 주식 종목별 주식 가격의 수익률을 이용하여 각 주식 종목별 간 상관관계를 수치화한 상관계수를 산출할 수 있다.
본 발명의 일 실시 예에 따른 상관계수 산출부(121)는 아래의 수학식 1을 이용하여 주식 종목별 주가 데이터로부터 각각의 로그 수익률을 산출할 수 있다. 즉, 본 발명의 일 실시 예에 따른 상관계수 산출부(121)는 각 주식 종목별 주식 가격의 로그 수익률을 산출할 수 있으며, 산출된 주식 가격의 로그 수익률을 이용하여 각 주식 종목별 상관계수를 산출할 수 있다.
Figure 112018117288943-pat00001
상술한 수학식 1에서, Si는 주식 종목 i에 대한 주식 가격을 나타내고, Gi(t)는 시간 t에서 주식 종목 i의 주식 가격의 로그 수익률을 나타낸다.
본 발명의 일 실시 예에 따른 상관계수 산출부(121)는 상술한 수학식 1을 이용하여 각 주식 종목당 최근 6개월 동안의 일일 로그 수익률을 산출할 수 있다. 단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 상관계수 산출부(121)는 아래의 수학식 2를 이용하여 주식 종목 i와 주식 종목 j 사이의 상관관계를 수치화한 상관계수 Ci,j를 산출할 수 있다.
Figure 112018117288943-pat00002
상술한 수학식 2에서, i와 j는 각각 주식 종목을 나타내고, Gi는 주식 종목 i의 주식 가격의 로그 수익률을 나타내고, <Gi>는 Gi의 평균을 나타낸다. 상술한 i와 j는 같은 값일 수도 있고 다른 값일 수도 있다.
상술한 방법에 의해 산출된 각 주식 종목별 간 상관계수를 도 3을 함께 참조하여 설명하도록 한다.
도 3은 본 발명의 일 실시 예에 따른 각 주식 종목별 간 산출된 상관계수를 설명하기 위한 도면을 나타낸 것이다.
도 3을 참조하면, 본 발명의 일 실시 예에 따른 상관계수 산출부(121)는 제1 내지 제5 주식 종목별 각각의 상관관계에 대해 수치화한 상관계수를 산출할 수 있다.
구체적으로, 상관관계와 관련하여 상술한 방법에 의해 각 제1 내지 제5 주식 종목별 간 산출된 상관계수를 분석함으로써, 제3 주식 종목과 제4 주식 종목 간 산출된 상관계수가 0.52236으로 다른 주식 종목들에 비해 제3 주식 종목과 제4 주식 종목 간의 상관관계가 가장 높은 것을 확인할 수 있다. 또한 제2 주식 종목과 제4 주식 종목 간 산출된 상관계수가 -0.0795으로 다른 주식 종목들에 비해 제2 주식 종목과 제4 주식 종목 간의 상관관계가 가장 낮은 것을 확인할 수 있다.
다시 도 2를 참조하면, 본 발명의 일 실시 예에 따른 클러스터링부(124)는 산출된 상관계수에 따라 상관관계의 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화할 수 있다.
본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 군집화된 주식 종목 그룹 각각에 포함된 상관관계의 유사성을 가지는 주식 종목들 중 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목을 주가를 예측하기 위한 주식 종목의 후보로 추출할 수 있다.
상술한 상관계수는 -1 내지 1의 값을 가질 수 있으며, 임계치는 0일 수 있다. 따라서, 본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 군집화된 주식 종목 그룹 각각에 포함된 상관관계의 유사성을 가지는 주식 종목들 중 상관계수가 0 미만인 적어도 하나의 주식 종목을 주가를 예측하기 위한 주식 종목의 후보로 추출할 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
또한, 본 발명의 또 다른 일 실시 예에 따른 거리 산출부(122)는 상관계수 산출부(121)에서 각 주식 종목별 간 산출된 상관계수를 이용하여 각 주식 종목별 간의 거리 관계를 수치화한 각 주식 종목별 간 떨어져 있는 거리를 산출할 수 있다.
본 발명의 일 실시 예에 따른 거리 산출부(122)는 아래의 수학식 3을 이용하여 상관계수 산출부(121)에서 산출된 각 주식 종목 간의 상관관계를 이용하여 각 주식 종목 간 거리 관계를 수치화한 거리를 산출할 수 있다.
Figure 112018117288943-pat00003
상술한 수학식 3에서 Ci,j가 -1과 1사이의 값에 해당하는 경우 주식 종목 i와 주식 종목 j 간 거리 관계를 수치화한 di,j는 0에서 2사이의 값으로 변환될 수 있다. 따라서, 주식 종목 i와 j 간의 상관관계를 수치화로 나타낸 상관계수인 Ci,j의 값이 클수록 주식 종목 i와 j 간의 거리 관계를 수치화하여 산출된 거리인 di,j의 값은 감소하는 관계를 가지고, Ci,j의 값이 작을수록 di,j의 값은 증가하는 관계를 가질 수 있다.
따라서, 본 발명의 일 실시 예에 따른 주식 종목 i와 주식 종목 j 간의 상관관계가 높을수록 주식 종목 i와 주식 종목 j 간 거리가 가까운 정도를 나타내고, 주식 종목 i와 주식 종목 j 간의 상관관계가 낮을수록 주식 종목 i와 주식 종목 j 간 거리가 먼 정도를 나타낼 수 있다.
본 발명의 일 실시 예에 따른 상관관계 분석부(120)는 거리 산출부(122)에서 산출된 각 주식 종목별 간 거리를 이용하여 각 주식 종목별 간 상관관계 정도를 분석할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 상관관계 분석부(120)는 거리 산출부(122)에서 산출된 각 주식 종목별 간 거리가 가깝다면 각 주식 종목별 간 상관관계가 높다고 분석할 수 있고, 각 주식 종목별 간 거리가 멀다면 각 주식 종목별 간 상관관계가 낮다고 분석할 수 있다.
본 발명의 일 실시 예에 따른 상관관계 분석부(120)는 상술한 거리 산출부(122)에서 산출된 각 주식 종목별 간 거리를 시각적으로 확인할 수 있도록 주식 네트워크 그래프를 생성할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 주식 네트워크 그래프 생성부(123)는 산출된 각 주식 종목별 간의 거리에 따라 각 주식 종목별 간 거리 관계를 나타내는 주식 네트워크 그래프를 생성할 수 있다.
본 발명의 일 실시 예에 따른 주식 네트워크 그래프 생성부(123)는 상술한 방법에 의해 산출된 주식 종목 i와 j간의 거리 di,j 값을 기반으로 주식 네트워크 그래프를 생성할 수 있다.
도 4는 본 발명의 일 실시 예에 따라 생성된 주식 네트워크 그래프를 설명하기 위한 도면을 나타낸 것이다.
도 4를 참조하면, 본 발명의 일 실시 예에 따른 주식 네트워크 그래프 생성부(123)는 50개의 주식 종목에 대한 각각의 주식 종목별 간 상관관계를 나타내는 주식 네트워크 그래프를 생성할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 주식 네트워크 그래프 생성부(123)는 50개의 각 주식 종목별 간 상관관계를 각 주식 종목별 간 거리 관계로 변환하고, 변환된 50개의 각 주식 종목별 간 거리 관계를 나타내는 주식 네트워크 그래프를 생성할 수 있다.
즉, 본 발명의 일 실시 예에 따른 주식 네트워크 그래프 생성부(123)는 수학식 3에서 산출된 50개의 각 주식 종목별 간 거리인 di,j를 바탕으로 주식 네트워크 그래프를 생성할 수 있다.
다시 도 2를 참조하면, 본 발명의 또 다른 일 실시 예에 따른 클러스터링부(124)는 주식 네트워크 그래프 생성부(123)에서 생성된 주식 네트워크 그래프로부터 각 주식 종목별 간 거리 관계에 따라 상관관계의 유사성을 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화할 수 있다.
본 발명의 일 실시 예에 따른 클러스터링부(124)는 모든 주식 종목별 간의 상관계수 값을 가지고 있는 상관계수 행렬에 군집화 알고리즘을 적용하여 주식 네트워크 그래프로부터 미리 설정된 개수의 주식 종목 그룹들로 군집화할 수 있다.
상술한 군집화 알고리즘으로 K-평균(K-means) 알고리즘 또는 K-메도이드(K-medoid) 알고리즘을 적용할 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
K-평균(K-means) 알고리즘은 미리 설정된 개수만큼 무작위로 중심(centroid) 값을 설정하고, 설정된 중심 값과 가까운 주식 종목을 클러스터에 포함시키면서 무작위로 설정된 중심 값을 클러스터의 중앙으로 이동시키는 과정을 반복함으로써 미리 설정된 개수의 주식 종목 그룹들로 군집화할 수 있다.
K-메도이드(K-medoid) 알고리즘은 미리 설정된 개수의 각 주식 종목 그룹들인 군집에서 대표 객체(medoids)인 주식 종목을 임의로 찾음으로써 복수 개의 주식 종목들 중에서 미리 설정된 개수의 군집을 찾는 것을 나타낸다. 구체적으로, 상술한 K-메도이드(K-medoid) 알고리즘은 복수 개의 주식 종목들 중 대표 객체인 대표 주식 종목을 미리 설정된 개수만큼 지정한 후, 나머지 주식 종목들을 유사성이 가장 높은 대표 주식 종목에 배속한다. 상술한 유사성은 거리 산출부(122)에서 산출된 각 주식 종목별 간 거리 관계에 따라 거리가 가까울수록 유사성이 높은 것을 나타낸다.
대표 주식 종목이 아닌 다른 주식 종목을 임의로 지정하고, 본래의 대표 주식 종목과 임의로 지정된 주식 종목 간의 총 비용(cost)을 계산한다. 총 비용은 미리 설정된 개수의 군집을 형성한 후 각 군집에 배속된 주식 종목과 각 군집의 중심과의 거리를 모두 더한 값을 나타낸다.
상술한 총 비용을 모든 경우의 수에서 비교하여 가장 작은 경우일 때의 대표 주식 종목과 군집을 최종적으로 선택함으로써 주식 네트워크 그래프 생성부(123)에서 생성된 주식 네트워크 그래프로부터 각 주식 종목별 간 거리 관계에 따라 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 클러스터링부(124)는 상술한 방법에 의해 최종적으로 선택된 미리 설정된 개수의 군집들 각각의 대표 주식 종목을 중심점으로 설정할 수 있고, 각 군집마다 설정된 중심점을 기준으로 거리 산출부(122)에서 산출된 각 주식 종목들과 상술한 중심점인 대표 주식 종목과의 거리의 값이 1.4 미만에 해당하는 주식 종목들을 하나의 주식 종목 그룹으로 군집화할 수 있고, 상술한 과정을 반복하여 미리 설정된 개수의 주식 종목 그룹들로 각각 군집화할 수 있다.
따라서, 본 발명의 일 실시 예에 따른 클러스터링부(124)는 K-메도이드(K-medoid) 알고리즘을 적용하여 미리 설정된 개수만큼 대표 주식 종목들을 각각 지정하고, 각각 지정된 대표 주식 종목들과 나머지 주식 종목들 간의 거리 관계에 따른 유사성을 고려하여 미리 설정된 개수만큼 임의의 주식 종목 그룹으로 군집화를 형성하고, 형성된 각 주식 종목 그룹의 군집에 배속된 주식 종목과 각 군집의 중심과의 거리를 비교하여 주식 네트워크 그래프 생성부(123)에서 생성된 주식 네트워크 그래프로부터 각 주식 종목별 간 거리 관계에 따라 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화할 수 있다.
본 발명의 또 다른 일 실시 예에 따른 주식 종목 추출부(125)는 각 주식 종목 간의 상관계수가 간선의 가중치가 되는 주식 네트워크 그래프로부터 최소신장트리(Minimum Spanning Tree, MST)를 구성할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 거리 산출부(122)에서 산출된 각 주식 종목별 간 거리에 기초하여 주식 네트워크 그래프 생성부(123)에서 생성된 주식 네트워크 그래프로부터 각 주식 종목들을 연결하는 간선의 가중치를 나타내는 각 주식 종목별 간 상관계수를 최소로 하는 최소신장트리를 구성할 수 있다.
구체적으로, 상술한 최소신장트리는 주식 네트워크 그래프의 각 변(edge)에 각 주식 종목들을 연결하는 간선의 가중치인 각 주식 종목별 간 상관계수가 주어지는 경우 복수의 신장트리들 중 가중치가 최소인 신장트리로, 본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 각 주식 종목들을 연결하는 간선이 최소의 가중치가 최소가 되면서 각 주식 종목들을 연결하는 간선이 순환되지 않게 모든 주식 종목들을 연결하는 최소신장트리를 구성할 수 있다. 즉, 본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 주식 네트워크 그래프로부터 최소신장트리를 구성하는 경우 각각의 노드에 해당하는 주식 종목이 폐루프를 형성하지 않도록 체인을 형성하여 최소 신장트리를 구성할 수 있다.
본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 크루스칼 알고리즘(Kruskal Algorithm) 또는 프림 알고리즘(Prim’s Algorithm)을 적용하여 주식 네트워크 그래프로부터 최소신장트리를 구성할 수 있다.
크루스칼 알고리즘(Kruskal Algorithm)은 모든 주식 종목들을 주식 종목들 간 연결된 간선의 가중치를 나타내는 상관계수를 기준으로 오름차순으로 정렬하고, 오름차순으로 정렬된 간선을 순서대로 선택하며, 선택된 간선으로 연결되는 두 주식 종목들이 선택된 간선으로 연결되어 있지 않으면 해당 두 주식 종목들을 폐루프가 형성되지 않은 경우에 한해 두 주식 종목들을 간선으로 연결시키는 과정을 반복하여 최소신장트리를 구성하는 알고리즘을 나타낸다.
프림 알고리즘(Prim’s Algorithm)은 주식 종목들 중 기준 주식 종목을 선택하고, 선택된 기준 주식 종목에서 간선으로 연결될 수 있는 모든 주식 종목들 중에 최소의 상관계수 값을 가지는 간선으로 이어지는 주식 종목을 선택하며, 최소의 상관계수 값을 가지는 간선으로 이어지는 주식 종목을 선택할 때 이미 선택한 주식 종목은 다시 선택할 수 없도록 하는 과정을 반복하여 최소신장트리를 구성하는 알고리즘을 나타낸다.
본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 상술한 방법에 의해 구성된 최소신장트리를 이용하여 클러스터링부(124)에서 군집화된 주식 종목 각각에 포함된 상관관계의 유사성을 가지는 주식 종목들 중 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목을 주가 예측을 위한 주식 종목의 후보로 추출할 수 있다.
상술한 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목은 상술한 방법에 의해 구성된 최소신장트리에서 차수가 1에 해당하는 에지(edge)가 하나인 주식 종목을 나타낼 수 있다.
본 발명의 일 실시 예에 따른 주식 종목 추출부(125)는 클러스터링부(124)가 주식 네트워크 그래프 생성부(123)에서 생성된 주식 네트워크 그래프로부터 미리 설정된 개수의 주식 종목 그룹들로 군집화하는 과정과 독립적으로 주식 네트워크 그래프로부터 최소신장트리를 구성할 수 있다.
도 5는 본 발명의 일 실시 예에 따라 구성된 최소신장트리를 설명하기 위한 도면을 나타낸 것이다.
구체적으로, 도 5는 본 발명의 일 실시 예에 따른 주식 종목 추출부(125)가 50개의 주식 종목들의 거리 관계에 따라 주식 네트워크 그래프 생성부(123)에서 생성된 주식 네트워크 그래프로부터 상술한 프림(Prim) 알고리즘을 적용하여 구성한 최소신장트리를 나타낸 것이다.
도 5를 참조하면, 본 발명의 일 실시 예에 따른 주식 종목 추출부(125)에서 구성된 최소신장트리에서 1번 내지 50번까지에 해당하는 노드를 나타내는 주식 종목들 중 주식 종목 자신과 연결된 간선에 해당하는 에지(edge)가 하나인 주식 종목들은 1, 3, 8, 5, 10, 13, 16, 18, 22, 23, 25, 31, 33, 34, 35, 36, 38, 41, 43, 45 및 46번에 해당하는 노드인 주식 종목들로 서로 상관관계가 낮은 주식종목들을 나타낼 수 있다.
다시 도 1을 참조하면, 본 발명의 일 실시 예에 따른 주가 예측부(130)는 상관관계 분석부(120)에서 상관관계가 분석된 주식 종목들에 대해 주가 데이터 수집부(110)에서 수집된 주가 데이터를 기반으로 학습하여 생성한 주가 예측 모델을 이용하여 주가를 예측하려는 예측 날짜에 대한 상관관계가 분석된 주식 종목들 각각의 주가를 예측할 수 있다.
상술한 주가 예측부(130)가 주가 예측 모델을 이용하여 상관관계가 분석된 주식 종목들 각각의 주가를 예측하는 구체적인 방법은 도 6 및 도 7을 함께 참조하여 설명하도록 한다.
도 6은 본 발명의 또 다른 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치의 구성을 구체적으로 도시한 블록도이다.
도 6을 참조하면, 본 발명의 또 다른 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)는 주가 데이터 변환부(150)를 더 포함할 수 있다.
본 발명의 일 실시 예에 따른 주가 데이터 변환부(150)는 주가 데이터 수집부(110)에서 수집된 각 날짜 별로 상관관계 분석부(120)에서 상관관계가 분석된 주식 종목들의 주가, 거래량 및 거래 시간을 포함하는 주가 데이터를 가공하여 주가 데이터를 주식 분석에 사용되는 기술적 분석 데이터로 변환할 수 있다.
상술한 기술적 분석 데이터는 기술적 분석 지표인 볼린저 밴드(Bollinger bands, Bband), 이동평균(Moving Average, MA), 이동평균수렴&확산(Moving Average Convergence & Divergence, MACD), 이중 지수 이동 평균(Double Exponential Moving Average, DEMA), 스토캐스틱(Stochastic, STOCH), 트릭스(Triple smoothed Moving Averages, TRIX), 방향성평균지표(Average Directional Movement Index, ADX), 누적 균형거래량(On Balance Volume, OBV), SAR(Stop And Reverse), 중간값(MIDPOINT)인 10개의 기술적 분석 지표 중 적어도 하나의 기술적 분석 지표를 포함할 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정 되는 것은 아니며 기술적 분석 데이터는 주가 데이터를 분석할 수 있는 다양한 기술적 분석 지표들을 포함할 수 있다.
상술한 볼린저밴드(Bband)는 시간에 따른 주식 가격의 변화 정도를 반영한 지표를 나타낸다. 구체적으로, 볼린저밴드(Bband)는 주가가 수렴과 확장을 반복하며 움직일 때 주가의 움직임에 따라 밴드의 폭이 결정되는 것으로, 가격 변동성이 큰 경우 밴드의 폭이 넓어지게 되고, 반대로 가격의 변동성이 작은 경우 밴드의 폭이 좁아지게 된다. 볼린저밴드의 폭은 상한 밴드(upper band), 중심 밴드(middle band) 및 하한 밴드(down band)를 이용하여 산출될 수 있다.
상술한 이동평균수렴&확산(MACD) 지수는 장기 및 단기 두 개의 이동평균 교차접근법을 이용한 운동량 지표를 나타낸다.
상술한 이동 평균(MA)은 미리 정해진 기간 동안의 증권의 평균적 가격을 나타내는 지표를 나타낸다. 본 발명의 일 실시 예에 따른 이동 평균(MA)는 40일 이동 평균을 나타내는 MA(40), 80일 이동 평균을 나타내는 MA(80) 및 120일 이동 평균을 나타내는 MA(120)이 기술적 변환 데이터로 이용될 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
이중 지수 이동 평균(DEMA)는 지수이동평균의 이동 평균을 나타낸다.
스토캐스틱(STOCH)은 현재 주가가 일정 기간의 주가 변동폭 중 어디에 위치하는지를 백분율로 나타낸 현재 주가의 변동폭상 위치(%)를 나타낸다.
트릭스(TRIX)는 삼중 지수이동 평균값을 사용하여 매매시점을 표시한 지표를 나타낸다.
방향성평균지표(ADX)는 주가·환율의 추세 전환을 판단하기 위한 평균 방향 이동 지표를 나타낸다.
누적 균형거래량(OBV) 지표는 거래체결 강도를 나타내는 차트를 나타내며, 차트상의 거래량이 항상 주가에 선행된다는 것을 전제로 주가판단을 하는 기법을 이용한다.
SAR 지표는 추세 전환 시점을 파악하기 위한 지표를 나타낸다.
중간값(MIDPOINT) 지표는 중간 값을 이용한 누적균형거래량을 나타낸다.
본 발명의 일 실시 예에 따른 주가 예측부(130)는 주가 데이터 수집부(110)에서 상관관계가 분석된 주식 종목들에 대해 수집된 주가 데이터를 이용하여 미리 설정된 차원을 가지는 입력 데이터를 생성할 수 있고, 생성된 입력 데이터를 기반으로 주가 예측 모델(131)이 상관관계가 분석된 주식 종목들 각각에 대한 예측 날짜의 주가를 예측하도록 주가 예측 모델(131)을 학습할 수 있다.
또한, 본 발명의 또 다른 일 실시 예에 따른 주가 예측부(130)는 상관관계가 분석된 주식 종목들에 대해 주가 데이터 수집부(110)에서 수집된 주가 데이터 및 주가 데이터 변환부(150)에서 상관관계가 분석된 주식 종목들에 대해 수집된 주가 데이터가 각 날짜 별로 변환된 기술적 분석 데이터로부터 주가의 시계열적인 특성을 고려하여 미리 설정된 차원을 가지는 입력 데이터를 생성할 수 있다.
본 발명의 또 다른 일 실시 예에 따른 주가 예측부(130)는 주가 데이터 수집부(110)에서 수집된 상관관계가 분석된 주식 종목들에 대한 주가 데이터 중 예측 날짜의 상관관계가 분석된 주식 종목들에 대한 주가 데이터를 레이블링하여 상관관계가 분석된 주식 종목들에 각각에 대해 예측된 주가가 레이블링된 예측 날짜의 주가가 되도록 주가 데이터 및 각 날짜 별로 변환된 기술적 분석 데이터로부터 생성된 입력 데이터를 이용하여 주가 예측 모델을 학습할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 주가 예측부(130)는 클러스터링부(124)에서 군집화된 주식 종목 각각에 포함된 상관관계의 유사성을 가지는 주식 종목들 중에서 주식 종목 추출부(125)에서 추출된 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목에 대해 주가 데이터 수집부(110)에서 수집된 주가 데이터 및 주가 데이터 변환부(150)에서 주식 종목 추출부(125)에서 추출된 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목에 대해 수집된 주가 데이터가 각 날짜 별로 변환된 기술적 분석 데이터로부터 주가의 시계열적인 특성을 고려하여 미리 설정된 차원을 가지는 입력 데이터를 생성할 수 있다.
상술한 입력 데이터를 생성하는 구체적인 방법은 후술하는 도 7을 참조하여 설명하도록 한다.
본 발명의 일 실시 예에 따른 주가 예측부(130)는 상관관계가 분석된 주식 종목들 각각에 대해 1 일 단위로 이동하면서 연속 M 일 (M은 자연수)간의 주가 데이터 및 기술적 분석 데이터를 입력 데이터로 생성하고, 생성된 입력 데이터를 이용하여 M 일 이후 연속 N 일 (N은 자연수) 간의 상관관계가 분석된 주식 종목들 각각에 대한 주가를 예측하도록 주가 예측 모델을 학습할 수 있다.본 발명의 일 실시 예에 따른 주가 예측부(130)는 M일 간에 대한 미리 설정된 차원의 입력 데이터를 주가의 시계열적 특성을 반영하여 각 날짜인 M일 별로 분리하여 M 개로 분리된 입력 데이터를 이용하여 주가 예측 모델이 예측 날짜의 주가를 예측하도록 학습할 수 있다.
구체적으로, 본 발명의 또 다른 일 실시 예에 따른 주가 예측부(130)는 상술한 방법에 의해 생성된 입력 데이터를 이용하여 M 일 이후 연속 N 일 간의 상관관계가 분석된 주식 종목들 각각에 대한 주가 데이터를 레이블링하여 예측된 주가가 레이블링된 날짜의 주가가 되도록 주가 예측 모델을 학습할 수 있다.
상술한 주가 데이터로는 시가, 고가, 저가 및 종가를 레이블로 사용할 수 있으나, 상술한 레이블로 사용하는 주가 데이터는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 또 다른 일 실시 예에 따른 주가 예측부(130)는 주가 예측의 정확도를 높이도록 기술적 분석 데이터 및 주가 데이터로부터 생성된 입력 데이터에 최소-최대 정규화(min-max normalization)를 적용하여 정규화된 입력 데이터를 이용하여 주가 예측 모델이 상관관계가 분석된 주식 종목들 각각에 대한 예측 날짜의 주가를 예측하도록 학습할 수 있다.
구체적으로, 본 발명의 또 다른 일 실시 예에 따른 주가 예측부(130)는 시계열적 특성을 가지는 입력 데이터의 최대 값과 최소 값을 이용하여 아래의 수학식 4와 같이 현재 입력 데이터의 값을 정규화시킴으로써, 정규화된 입력 데이터를 이용하여 주가 예측 모델이 상관관계가 분석된 주식 종목들 각각에 대한 예측 날짜의 주가를 예측하도록 학습할 수 있다.
Figure 112018117288943-pat00004
본 발명의 일 실시 예에 따른 주가 예측 모델(131)은 M 일치의 시계열적 특성이 반영된 분리된 M 개의 입력 데이터들을 각각 입력 받아 하나의 주식 종목에 대한 예측 날짜의 주가 예측 값을 출력하는 시계열 데이터 분석이 가능한 순환신경망(Recurrent Neural Network, RNN) 기반의 레이어로 구성될 수 있다.
순환 신경망(RNN)은 은닉층이 체인구조를 이루어 은닉층의 결과가 다시 같은 은닉층의 입력으로 들어가도록 연결 된 루프가 있고, 과거의 데이터가 미래에 영향을 주는 구조를 갖는다. 즉, 순환 신경망(RNN)은 은닉 노드가 방향을 가진 엣지로 연결되어 순환구조를 이룬다.
구체적으로, 본 발명의 일 실시 예에 따른 주가 예측 모델(131)은 시간적 순서를 고려하여 분리된 M 개의 입력 데이터들을 입력 받아 예측 날짜의 주가 예측 값을 출력하도록 현재 메모리 셀에 이전 메모리 셀 상태를 반영할지 여부를 결정하는 망각 게이트(Forget Gate)를 포함하는 장단기 메모리(Long Short Term Memory, LSTM) 셀로 구성된 순환신경망(RNN) 기반의 레이어로 구성될 수 있다.
상술한 장단기 메모리(LSTM) 모델은 장기 의존성 문제를 해결하도록 은닉층에 여러 개의 게이트가 연결된 셀을 추가한 구조이다. 은닉 층은 입력 게이트(Input Gate), 출력 게이트(Output Gate), 망각 게이트(Forget Gate)를 포함하는 메모리 블록(Memory Block)을 갖는다. 망각 게이트는 과거 정보를 잊기를 위한 게이트이고, 입력 게이트는 현재 정보를 기억하기 위한 게이트이다. 게이트는 각각 세기 및 방향을 가진다. 셀은 컨베이어 벨트 역할을 하고, 상태가 오래 경과하더라도 그래디언트가 비교적 전파를 유지할 수 있다.
본 발명의 일 실시 예에 따른 장단기 메모리(LSTM) 모델은 M 개의 장단기 메모리 셀(LSTM cell)들을 포함할 수 있고, 마지막 장단기 메모리 셀(LSTM cell)의 출력만을 고려하는 다대일(many to one) 모델로 구현될 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 장단기 메모리 모델(LSTM)은 출력되는 주가 예측 값의 정확도를 높이도록 마지막 장단기 메모리 셀(LSTM cell)에서 나온 복수 개의 출력 값들이 완전 연결 층으로 전달되어, 완전 연결 층은 하나의 주가 예측 값을 출력할 수 있다.
본 발명의 일 실시 예에 따른 주가 예측 모델(131)은 시간적 순서를 고려하여 분리된 M 개의 입력 데이터들을 입력 받아 예측 날짜의 주가 예측 값을 출력하도록 두 개의 장단기 메모리(LSTM) 셀을 결합하여 양방향으로 상태 전파가 이루어지도록 형성된 양방향 장단기 메모리(Bidirectional LSTM, Bi-LSTM) 셀로 구성된 순환신경망(RNN) 기반의 레이어로 구성될 수 있다.
구체적으로, 상술한 양방향 장단기 메모리(Bi-LSTM) 셀은 k일(k는 자연수, 1≤k<M)이 k+1일의 결과에 영향을 주는 방향과 k+1일이 k일의 결과에 영향을 주는 방향의 두 장단기 메모리 모델(LSTM)을 결합함으로써 형성될 수 있다.
따라서, 주가 예측부(130)가 양방향 장단기 메모리(Bi-LSTM) 셀로 구현된 주가 예측 모델(131)을 이용하여 상관관계가 분석된 주식 종목들 각각에 대한 예측 날짜의 주가를 예측하는 경우 장단기 메모리(LSTM) 셀로 구현된 주가 예측 모델(131)을 이용하여 상관관계가 분석된 주식 종목들 각각에 대한 예측 날짜의 주가를 예측하는 경우보다 더 높은 정확도로 주가를 예측할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 주가 예측부(130)가 양방향 장단기 메모리(Bi-LSTM) 셀로 구현된 주가 예측 모델(131)을 이용하여 주식 종목 추출부(125)에서 추출된 적어도 하나의 주식 종목에 대한 예측 날짜의 주가를 예측하는 경우 장단기 메모리(LSTM) 셀로 구현된 주가 예측 모델(131)을 이용하여 주식 종목 추출부(125)에서 추출된 적어도 하나의 주식 종목에 대한 예측 날짜의 주가를 예측하는 경우보다 더 높은 정확도로 주가를 예측할 수 있다.
상술한 입력 데이터를 입력 받아 예측 날짜의 주가를 예측하는 구체적인 방법은 도 7을 함께 참조하여 설명하도록 한다.
도 7은 본 발명의 일 실시 예에 따라 주식 종목의 주가를 예측하는 방법을 설명하기 위한 도면을 나타낸 것이다.
도 7을 참조하면, 본 발명의 일 실시 예에 따른 주가 예측 모델(131)은 양방향 장단기 메모리(Bi-LSTM) 셀로 구성된 순환신경망(RNN) 기반의 레이어로 구성될 수 있다.
본 발명의 일 실시 예에 따른 주가 예측부(130)는 주가 데이터 수집부(110)에서 수집된 각 주식 종목 별 60 일치의 주가 데이터에 해당하는 시가(open), 고가(high), 저가(low), 종가(close), 조정 종가(adjust close) 및 거래량(volume)과 주가 데이터 변환부(150)에서 상술한 주가 데이터가 변환된 기술적 분석 데이터인 각 주식 종목 별 60 일치의 볼린저 밴드(Bband), 스토캐스틱(STOCH), 이중 지수 이동 평균(DEMA), 이동 평균(MA 40, 80, 120), 이동평균수렴&확산(MACD), 방향성평균지표(ADX), 트릭스(TRIX), 누적 균형거래량(OBV), SAR 및 중간값(MIDPOINT)인 기술적 분석 지표들에 의해 미리 설정된 차원의 입력 데이터(132)를 생성할 수 있다. 단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
상술한 미리 설정된 차원의 입력 데이터(132)는 60일 X 18인 2차원의 입력 데이터(132)일 수 있으며, 상술한 입력 데이터(132)를 이용하여 주가 예측부(130)는 주가 예측 모델(131)이 예측 날짜의 주가를 예측하도록 학습할 수 있다.
본 발명의 일 실시 예에 따른 주가 예측부(130)가 한번에 학습시킬 데이터의 수를 나타내는 배치 사이즈(Batch-size)는 60일 x 18 일 수 있다.
본 발명의 일 실시 예에서 상술한 입력 데이터(132)가 주가 예측 모델(131)에 입력되는 경우, 출력하고자 하는 예측 날짜는 60 일 이후 5 일차에 해당하는 날짜로 설명하도록 한다. 단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 주가 예측부(130)는 상술한 60 x18 인 2차원의 입력 데이터(132)를 1차원의 60 개의 입력 데이터들로 분리할 수 있고, 분리된 60개의 1 x 18인 1차원의 데이터들을 이용하여 주가 예측 모델(131)을 학습할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 제3 주가 예측 모델(431)은 복수 개의 양방향 장단기 메모리 셀(Bi-LSTM cell)들 및 완전 연결 층(Fully Connected Layer)로 구성될 수 있으며, 순환 신경망(RNN) 내부에서 분리된 60개의 1 X 18인 1차원의 입력 데이터들은 각각 60개의 양방향 장단기 메모리 셀(Bi-LSTM cell)들로 입력될 수 있다. 단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 주가 예측 모델(131)은 제1 내지 제3 레이어(131a 내지 131c)로 구성될 수 있다.
본 발명의 일 실시 예에 따른 제1 레이어(131a)는 m 개의 양방향 장단기 메모리(Bi-LSTM) 셀로 구성될 수 있다.
본 발명의 일 실시 예에 따른 제1 레이어(131a)는 M 일치의 주가 데이터와 기술적 지표로 구성된 입력 데이터(132)를 입력 받고, 입력 받은 입력 데이터를 미리 설정된 개수의 제1 특징 값으로 변환할 수 있다.
본 발명의 일 실시 예에 따른 제1 레이어(131a)는 N일 간의 주가를 일별로 예측하도록 상술한 입력 데이터(132)를 미리 설정된 개수의 제1 특징 값으로 변환하여 출력하는 과정을 N번 반복할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 제1 레이어(131a)를 구성하는 양방향 장단기 메모리 셀(Bi-LSTM cell)들 각각은 순환 신경망(RNN) 내부에서 시계열적 특성으로 고려하여 60일치에 해당하는 2차원의 입력 데이터가 분리된 60개의 1 X 18인 1차원의 입력 데이터들을 입력 받을 수 있고, 제1 레이어(131a)는 입력 받은 입력 데이터들로부터 미리 설정된 개수의 제1 특징 값으로 변환하여 출력할 수 있으며, 미리 설정된 개수의 제1 특징 값으로 변환하여 출력하는 과정을 5번 반복할 수 있다. 상술한 제1 특징 값의 미리 설정된 개수는 1024개일 수 있다.
단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 제2 레이어(131b)는 n 개의 양방향 장단기 메모리(Bi-LSTM) 셀이 N 개인 셀로 구성될 수 있다.
본 발명의 일 실시 예에 따른 제2 레이어(131b)를 구성하는 N 개의 셀 각각은 제1 레이어(131a)에서 N 번 반복하여 출력된 미리 설정된 개수의 제1 특징 값을 입력 받을 수 있고, 입력 받은 N번 반복된 미리 설정된 개수의 제1 특징 값을 각 일별로 미리 설정된 개수의 제2 특징 값으로 변환하여 출력할 수 있다.
예를 들어, 본 발명의 일 실시 예에 따른 제2 레이어(131b)는 n 개의 양방향 장단기 메모리(Bi-LSTM) 셀이 5개이고, 5개의 셀 각각에 5번 반복하여 출력된 미리 설정된 개수의 제1 특징 값이 입력될 수 있고, 5개의 셀 각각은 입력된 미리 설정된 개수의 제1 특징 값을 각 일별에 해당하는 5일별로 미리 설정된 개수의 제2 특징 값을 변환하여 출력할 수 있다.
상술한 제1 특징 값의 미리 설정된 개수는 1024개 일 수 있고, 제2 특징 값의 미리 설정된 개수는 512개일 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 제3 레이어(131c)는 N 개의 완전 연결 층(Fully Connected Layer)로 구성될 수 있다.
본 발명의 일 실시 예에 따른 제3 레이어(131c)는 제2 레이어(131b)에서 각 일별인 N 일별로 출력된 미리 설정된 개수의 제2 특징 값들로부터 각 일별로 N 일간의 주식 종목의 주가 데이터를 출력할 수 있다. 상술한 방법에 의해 출력된 N일 간의 주식 종목의 주가 데이터는 N 일 간의 주식 종목의 주가를 예측한 값을 나타낸다.
따라서, 본 발명의 일 실시 예에 따른 제3 레이어(131c)는 제2 레이어(131b)로부터 5일별로 출력된 미리 설정된 개수의 제2 특징 값들로부터 각 일별로 5일 간의 주식 종목의 주가 데이터(133)를 출력할 수 있다. 단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
상술한 주가 데이터는 시가, 고가, 저가, 종가, 조정 종가 및 거래량 중 적어도 하나의 데이터일 수 있다.
예를 들어, 도 7은 본 발명의 일 실시 예에 따른 제1 내지 제3 레이어(131a 내지 131c)로 구성된 주가 예측 모델(131)로부터 2014년 1월 29일부터 2014년 2월 4일까지 예측된 시가, 고가, 저가 및 종가(133)를 나타낸 것이다.
단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 주가 예측부(130)는 주가 데이터 수집부(110)에서 수집된 주가 데이터 중 예측 날짜인 5일차의 실제 주가를 레이블링하여 상술한 방법에 출력된 5일 차의 주가 예측 값(133)이 레이블링된 5일차의 실제 주가가 되도록 주가 예측 모델(131)을 학습할 수 있다.
본 발명의 일 실시 예에 따른 주가 예측부(130)는 상술한 방법에 의해 출력된 N 일 간의 각 주식 종목별 시가, 고가, 저가 및 종가와 레이블로 사용된 N 일 간의 주가 데이터의 평균 제곱 오차가 수렴할 때가지 주가 예측 모델(131)을 학습할 수 있다.
본 발명의 일 실시 예에 따른 주가 예측부(130)는 상술한 방법에 의해 주가 예측 모델(131)을 학습한 후 입력되는 새로운 입력 데이터에 대해 학습된 주가 예측 모델(131)에 새로 입력된 입력 데이터만 다시 학습할 수 있다.
다시 도 1을 참조하면, 본 발명의 일 실시 예에 따른 주식 종목 선택부(140)는 상관관계 분석부(120)에서 상관관계가 분석된 주식 종목들 각각에 대해 주가 예측부(130)에서 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 상관관계가 분석된 주식 종목들 중에서 선택할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 주식 종목 선택부(140)는 상관관계 분석부(120)에서 각 주식 종목별 간 분석된 상관관계를 고려하여 클러스터링부(124)에서 군집화된 주식 종목 각각에 포함된 상관관계의 유사성을 가지는 주식 종목들 중에서 주식 종목 추출부(125)에서 추출된 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목에 대해 주가 예측부(130)에서 예측된 주가를 고려하여 주가 상승이 예측되는 주식 종목을 선택할 수 있다.
본 발명의 일 실시 예에 따른 주식 종목 추출부(125)에서 추출된 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목은 클러스터링부(124)에서 주식 네트워크 그래프(123)로부터 형성된 각 군집 별로 하나의 주식 종목을 선택하기 위해 도 2에서 설명한 최소신장트리에서 차수가 1에 해당하는 에지(edge)가 하나인 주식 종목인 단말인 주식 종목일 수 있다.
즉, 본 발명의 일 실시 예에 따른 주식 종목 선택부(140)는 클러스터링부(124)에서 군집화된 주식 종목 그룹 각각에서 주식 종목 추출부(125)에서 추출된 적어도 하나의 주식 종목에 대해 주가 예측부(130)에서 예측된 주가를 각각 비교하여 미리 설정된 개수만큼 군집화된 주식 종목 그룹 각각에서 누적 수익률이 가장 높은 주식 종목을 하나씩 선택할 수 있다.
따라서, 본 발명의 일 실시 예에 따른 주식 종목 선택부(140)는 클러스터링부(124)에서 형성된 군집화 된 주식 종목의 그룹 각각에서 주식 종목 추출부(125)에서 구성된 최소신장트리에서의 에지(edge)가 1개인 주식 종목들 중 주가 예측부(130)에서 예측된 각 주식 종목 별에 대한 주가로부터 예측된 주가가 가장 높게 상승 하는 주식 종목을 선택할 수 있다.
따라서, 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)는 상술한 방법에 의해 선택된 주식 종목들로 주식 포트폴리오를 구성할 수 있다.
예를 들어, 본 발명의 일 실시 예에 따른 주식 종목 선택부(140)는 클러스터링부(124)에서 군집화된 10개의 주식 종목 그룹 각각에서 상술한 방법에 의해 주식 종목 별 간 상관관계가 적으면서 주가가 상승할 것으로 예측되는 주식 종목을 1개씩 선택할 수 있다. 단, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
구체적으로, 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)는 아래의 표 1의 포트폴리오 추천 알고리즘을 이용하여 누적 수익률이 가장 높은 주식 종목을 선택하여 주식 포트폴리오에 추가할 수 있다.
Figure 112018117288943-pat00005
상술한 표 1의 포트폴리오 추천 알고리즘은 클러스터링부(124)에서 형성된 군집화 된 복수 개의 주식 종목 그룹인 각 군집 CS(i)에서 예측 누적 수익률이 가장 높은 주식 종목 1개를 선정하여 포트폴리오 P에 추가할 수 있다.
구체적으로, 상술한 표 1의 포트폴리오 추천 알고리즘은 각 군집 CS(i)에 포함된 최소신장트리에서 차수가 1인 복수 개의 주식 종목들(sj)에 대해 주가 예측부(130)가 예측 날짜의 주가를 예측하여, 주가가 예측된 복수 개의 주식 종목들(sj)을 비교하여 각 군집 CS(i)에서 예측 누적 수익률이 가장 높은 주식 종목 1개를 선택하여 포트폴리오 P에 추가할 수 있다.
본 발명의 일 실시 예에 따른 상술한 예측 누적 수익률은 N일 간의 예측 종가를 기준으로 산출할 수 있다.
아래의 표 2는 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)의 성능을 평가하기 위해 6일 단위로 진행된 모의 투자 구간을 월 단위로 묶은 후 2014년 1월 3일부터 2014년 12월 22일까지 월 단위에 대한 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)로부터 선택된 주식 종목을 추가한 포트폴리오를 사용하여 획득된 모의 투자 결과에 따른 누적 수익률과 종래의 주식 네트워크 분석 방법을 이용하여 획득된 모의 투자를 한 결과에 따른 누적 수익률을 비교한 결과를 나타낸 것이다.
Figure 112018117288943-pat00006
상술한 표 2에서 실험 데이터로 2018년 5월 기준 코스피 200 종목 중에서 모의투자 시작 이전에 1년 치 이상의 학습 데이터를 확보할 수 있는 175개의 종목을 사용하였으며, 또한 상술한 표 2에서 사용한 평균 수익률은 무작위로 초기 중심점이 선택되는 K-메도이드(K-medoids) 알고리즘 특성을 고려하여 모의 투자를 100회 수행한 평균 수익률로 사용하였다.
본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)는 60일 간의 각 주식 종목별 주가 데이터 및 기술적 분석 데이터로부터 생성된 입력 데이터를 이용하여 학습된 주가 예측 모델(131)을 이용하여 60일 이후 5일간의 주가를 예측할 수 있다.
상술한 표 2에서 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)를 이용하여 모의 투자를 하는 방법은 5일간의 주가 예측치를 기반으로 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)로부터 추천된 주식 종목들에 대한 포트폴리오로 5일 동안 투자하고, 이후 1일간 학습된 주가 예측 모델(131)을 업데이트하는 시간을 가지는데 이때 지난 5일간의 실제 주가를 반영하여 주가 예측 모델(131)을 재학습시키면서 포트폴리오를 재구성하고, 5일간의 투자를 다시 시작하는 방법으로 모의 투자를 하였으며, 이에 따라 표 2에서 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)를 이용한 모의 투자 결과는 2014년 1월부터 2014년 12월까지의 기간 동안의 모의 투자 결과를 나타낸 것이다.
또한, 상술한 표 2에서의 구간 평균 예측 정밀도는 2014년 1월 3일부터 2014년 12월 22일까지 월 단위에 대한 구간 평균 당 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)를 이용하여 획득된 주가의 예측 값에 대한 예측 정밀도를 나타낸 것이다.
구체적으로, 표 2에서의 구간 평균 예측 정밀도는 본 발명의 일 실시 예에 따른 주가 예측 모델(131)의 주가 예측 성능을 확인하기 위해 아래의 수학식 5를 이용하여 175 개의 주식 종목들에 대한 구간 평균 예측 정밀도를 계산할 결과를 나타낸 것이다.
Figure 112018117288943-pat00007
본 발명의 일 실시 예에 따른 주가 예측 모델(131)의 정밀도가 낮은 구간도 존재하나 주식 네트워크 분석을 통해 상관계수 값이 낮은 주식 종목들로 투자가 분산되었기 때문에 주식 종목 투자에 대한 위험도가 낮아져서 정밀도가 낮은 구간에서 종래의 주식 네트워크 분석 방법과 비슷하거나 조금 더 낮은 누적 수익률이 나타난 것을 확인할 수 있다.
따라서, 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 장치(100)를 이용하여 획득된 전체 누적 수익률은 종래의 주식 네트워크 분석만을 사용하여 획득된 전체 누적 수익률보다 약 10.56%P(퍼센트 포인트)가 더 높게 나온 것을 확인할 수 있다.
주식 포트폴리오 구성을 위한 주식 종목 선택 장치에 포함된 구성요소들이 도 1, 도 2 및 도 6에서는 분리되어 도시되어 있으나, 복수의 구성요소들은 상호 결합되어 적어도 하나의 모듈로 구현될 수 있다. 구성요소들은 장치 내부의 소프트웨어적인 모듈 또는 하드웨어적인 모듈을 연결하는 통신 경로에 연결되어 상호 간에 유기적으로 동작한다. 이러한 구성요소들은 하나 이상의 통신 버스 또는 신호선을 이용하여 통신한다.
주식 포트폴리오 구성을 위한 주식 종목 선택 장치는 하드웨어, 펌웨어, 소프트웨어 또는 이들의 조합에 의해 로직회로 내에서 구현될 수 있고, 범용 또는 특정 목적 컴퓨터를 이용하여 구현될 수도 있다. 장치는 고정 배선형(Hardwired) 기기, 필드 프로그램 가능한 게이트 어레이(Field Programmable Gate Array, FPGA), 주문형 반도체(Application Specific Integrated Circuit, ASIC) 등을 이용하여 구현될 수 있다. 또한, 장치는 하나 이상의 프로세서 및 컨트롤러를 포함한 시스템 온 칩(System on Chip, SoC)으로 구현될 수 있다.
주식 포트폴리오 구성을 위한 주식 종목 선택 장치는 하드웨어적 요소가 마련된 컴퓨팅 디바이스에 소프트웨어, 하드웨어, 또는 이들의 조합하는 형태로 탑재될 수 있다. 컴퓨팅 디바이스는 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 프로그램을 실행하기 위한 데이터를 저장하는 메모리, 프로그램을 실행하여 연산 및 명령하기 위한 마이크로프로세서 등을 전부 또는 일부 포함한 다양한 장치를 나타낼 수 있다.
도 8은 본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 방법을 설명하기 위한 흐름도이다. 주식 포트폴리오 구성을 위한 주식 종목 선택 방법은 컴퓨팅 디바이스에 의하여 수행될 수 있으며, 주식 포트폴리오 구성을 위한 주식 종목 선택 장치와 동일한 방식으로 동작한다
도 8을 참조하면, 컴퓨팅 디바이스는 주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집한다(S810). 상술한 주가 데이터는 주식 종목에서 일반적으로 사용되는 시가, 고가, 저가, 종가, 조정 종가 및 주식의 거래량을 포함할 수 있다.
컴퓨팅 디바이스는 수집된 주가 데이터를 이용하여 각 주식 종목별 간 상관관계를 분석한다(S820). 구체적으로, 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 수집된 주가 데이터를 이용하여 각 주식 종목들 중에서 상관관계가 높은 주식 종목들로 어떠한 주식 종목들이 있는지 분석할 수 있고, 또한 각 주식 종목들 중에서 상관관계가 낮은 주식 종목들로 어떠한 주식 종목들이 있는지 분석할 수 있다.
각 주식 종목별 간 상관 관계를 분석하는 구체적인 방법은 도 9에서 후술하도록 한다.
컴퓨팅 디바이스는 상관관계가 분석된 주식 종목들에 대해 주가 데이터 수집부(110)에서 수집된 주가 데이터를 기반으로 학습하여 생성한 주가 예측 모델을 이용하여 주가를 예측하려는 예측 날짜에 대한 상관관계가 분석된 주식 종목들 각각의 주가를 예측한다(S830).
구체적으로, 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 상관관계가 분석된 주식 종목들에 대해 수집된 주가 데이터를 이용하여 미리 설정된 차원을 가지는 입력 데이터를 생성할 수 있고, 생성된 입력 데이터를 기반으로 주가 예측 모델이 예측 날짜에 대한 상관관계가 분석된 주식 종목들 각각의 주가를 예측하도록 주가 예측 모델을 학습할 수 있다.
또한, 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 상관관계가 분석된 주식 종목들에 대해 수집된 주가 데이터 중 예측 날짜의 주가 데이터를 레이블링하여 상관관계가 분석된 주식 종목들 각각에 대해 예측된 주가가 레이블링된 예측 날짜의 주가가 되도록 주가 데이터 및 각 날짜 별로 변환된 기술적 분석 데이터로부터 생성된 입력 데이터를 이용하여 주가 예측 모델을 학습할 수 있다.
상술한 본 발명의 일 실시 예에 따른 주가 예측 모델은 시계열 데이터 분석이 가능한 순환신경망(RNN) 기반의 레이어로 구성될 수 있다.
또한, 본 발명의 또 다른 일 실시 예에 따른 주가 예측 모델은 현재 메모리 셀에 이전 메모리 셀 상태를 반영할지 여부를 결정하는 망각 게이트(Forget Gate)를 포함하는 장단기 메모리(LSTM) 셀로 구성된 순환신경망(RNN) 기반의 레이어로 구성될 수 있다.
또한, 본 발명의 또 다른 일 실시 예에 따른 주가 예측 모델은 상술한 장단기 메모리(LSTM) 셀 2개가 결합하여 양방향으로 상태 전파가 이루어지도록 형성된 양방향 장단기 메모리(Bi-LSTM) 셀로 구성된 순환신경망(RNN) 기반의 레이어로 구성될 수 있다.
상술한 주가 예측 모델 및 이를 이용하여 주가를 예측하는 구체적인 방법은 도 6 및 도 7에서 전술하였으므로 자세한 설명은 생략하도록 한다.
컴퓨팅 디바이스는 상관관계가 분석된 주식 종목들 각각에 대해 주가 예측부(130)에서 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 상관관계가 분석된 주식 종목들 중에서 선택한다(S840). 구체적으로, 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 상관관계가 분석된 각 주식 종목별 중 상관관계가 유사한 주식 종목들을 군집화하고, 군집화된 상관관계가 유사한 주식 종목들 중에서 상대적으로 낮은 상관관계를 가지는 적어도 하나의 주식 종목을 추출하여, 추출된 적어도 하나의 주식 종목에 대해 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 군집화된 상관관계가 유사한 주식 종목들 중에서 선택할 수 있다.
상술한 주식 종목을 선택하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
도 9는 본 발명의 일 실시 예에 따른 각 주식 종목별 간 상관관계를 분석하는 방법을 구체적으로 설명하기 위한 흐름도이다.
도 9를 참조하면, 컴퓨팅 디바이스는 주식 종목별 주가 데이터로부터 각각의 로그 수익률을 산출한다(S821). 구체적으로, 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 상술한 수학식 1을 이용하여 각 주식 종목당 미리 설정된 기간 동안의 일일 로그 수익률을 산출할 수 있다.
상술한 로그 수익률을 산출하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
컴퓨팅 디바이스는 산출된 주식 가격의 로그 수익률을 이용하여 각 주식 종목별 상관계수를 산출한다(S822). 구체적으로, 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 상술한 수학식 2를 이용하여 산출된 주식 가격의 로그 수익률로부터 각 주식 종목별 간 상관관계를 수치화한 상관계수를 산출할 수 있다.
상술한 상관계수를 산출하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
컴퓨팅 디바이스는 각 주식 종목별 간 산출된 상관계수를 이용하여 각 주식 종목별 간의 거리 관계를 수치화한 각 주식 종목별 간 떨어져 있는 거리를 산출한다(S823).
본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 상술한 각 주식 종목별 간 떨어져 있는 거리를 수학식 3을 이용하여 산출할 수 있고, 각 주식 종목별 간 상관관계가 높을 수록 산출된 각 주식 종목별 간 거리는 가까운 특징을 나타낼 수 있다.
컴퓨팅 디바이스는 산출된 각 주식 종목별 간의 거리에 따라 각 주식 종목별 간 거리 관계를 나타내는 주식 네트워크 그래프를 생성한다(S824).
컴퓨팅 디바이스는 생성된 주식 네트워크 그래프로부터 각 주식 종목별 간 거리 관계에 따른 유사성을 갖는 미리 설정된 개수의 주식 종목 그룹들로 군집화한다(S825).
본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 모든 주식 종목별 간의 상관계수 값을 가지고 있는 상관계수 행렬에 군집화 알고리즘을 적용하여 주식 네트워크 그래프로부터 미리 설정된 개수의 주식 종목 그룹들로 군집화할 수 있다.
상술한 군집화 알고리즘으로 K-평균(K-means) 알고리즘 또는 K-메도이드(K-medoid) 알고리즘을 적용할 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
상술한 미리 설정된 개수의 주식 종목 그룹들로 군집화하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
컴퓨팅 디바이스는 군집화된 주식 종목 그룹 각각에 포함된 상관관계의 유사성을 가지는 주식 종목들 중 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목을 주가를 예측하기 위한 주식 종목의 후보로 추출한다(S826).
상술한 상관계수는 -1 내지 1의 값을 가질 수 있으며, 임계치는 0일 수 있으나, 상술한 예시는 본 발명의 일 실시 예를 설명하기 위한 예시일 뿐 이에 한정되는 것은 아니다.
본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 각 주식 종목 간의 상관계수가 간선의 가중치가 되는 주식 네트워크 그래프로부터 최소신장트리(MST)를 구성하고, 구성된 최소신장트리를 이용하여 미리 설정된 개수로 거리 관계에 따른 유사성을 가지는 주식 종목들이 군집화된 주식 종목 그룹들 내에서 서로 상관관계가 낮은 주식 종목들을 추출할 수 있다.
본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 크루스칼 알고리즘 또는 프림 알고리즘을 적용하여 주식 네트워크 그래프로부터 최소신장트리를 구성할 수 있다.
구체적으로, 본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 최소신장트리(MST)에서 차수가 1에 해당하는 에지가 하나인 주식 종목을 미리 설정된 개수로 거리 관계에 따른 유사성을 가지는 주식 종목들이 군집화된 주식 종목 그룹들 내에서 서로 상관관계가 낮은 주식 종목으로 추출할 수 있다.
예를 들어, 상술한 방법에 의해 서로 유사성을 가지는 주식 종목들이 군집화된 주식 종목 그룹들이 10개인 경우, 10개의 주식 종목 그룹들에서 각각 서로 상관관계가 낮은 주식 종목들을 추출할 수 있다.
상술한 군집화된 주식 종목 그룹 각각에 포함된 상관관계의 유사성을 가지는 주식 종목들 중에서 상관관계가 낮은 주식 종목들을 추출하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
도 10은 본 발명의 또 다른 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 방법을 설명하기 위한 흐름도이다. 주식 포트폴리오 구성을 위한 주식 종목 선택 방법은 컴퓨팅 디바이스에 의하여 수행될 수 있으며, 도 8에서 주식 포트폴리오 구성을 위한 주식 종목 선택 방법과 동일한 방식으로 동작하는 단계에 대한 설명은 생략하면서 설명하도록 한다.
도 10을 참조하면, 컴퓨팅 디바이스는 주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집한다(S1010).
상술한 주가 데이터에 대한 구체적인 설명은 전술하였으므로 자세한 설명은 생략하도록 한다.
컴퓨팅 디바이스는 수집된 주가 데이터를 이용하여 각 주식 종목별 간 상관관계를 분석한다(S1020).
상술한 각 주식 종목별 간 상관관계를 분석하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
컴퓨팅 디바이스는 수집된 각 날짜 별로 상관관계가 분석된 주식 종목의 주가, 거래량 및 거래 시간을 포함하는 주가 데이터를 가공하여 주가 데이터를 주식 분석에 사용되는 기술적 분석 데이터로 변환한다(S1030).
상술한 기술적 분석 데이터는 기술적 분석 지표인 볼린저 밴드(Bband), 이동평균(MA), 이동평균수렴&확산(MACD), 이중 지수 이동 평균(DEMA), 스토캐스틱(STOCH), 트릭스(TRIX), 방향성평균지표(ADX), 누적 균형거래량(OBV), SAR, 중간값(MIDPOINT)인 10개의 기술적 분석 지표 중 적어도 하나의 기술적 분석 지표를 포함할 수 있으나, 이에 한정 되는 것은 아니다.
컴퓨팅 디바이스는 상관관계가 분석된 주식 종목에 대해 수집된 주가 데이터 및 주가 데이터가 각 날짜 별로 변환된 기술적 분석 데이터를 기반으로 학습하여 생성한 주가 예측 모델을 이용하여 상관관계가 분석된 주식 종목별로 예측하려는 예측 날짜의 주가를 예측한다(S1040).
본 발명의 일 실시 예에 따른 컴퓨팅 디바이스는 주가 데이터 및 주가 데이터가 각 날짜 별로 변환된 기술적 분석 데이터로부터 주가의 시계열적인 특성을 고려하여 미리 설정된 차원을 가지는 입력 데이터를 생성하고, 생성된 입력 데이터를 기반으로 주가 예측 모델이 상관관계가 분석된 주식 종목별로 예측 날짜의 주가를 예측하도록 주가 예측 모델을 학습할 수 있다.
본 발명의 또 다른 일 실시 예에 따른 컴퓨팅 디바이스는 상관관계가 분석된 주식 종목에 대해 수집된 주가 데이터 중 예측 날짜의 주가 데이터를 레이블링하여 상관관계가 분석된 주식 종목별로 예측된 주가가 레이블링된 예측 날짜의 주가가 되도록 주가 데이터 및 각 날짜 별로 변환된 기술적 분석 데이터로부터 생성된 입력 데이터를 이용하여 주가 예측 모델을 학습할 수 있다.
상술한 주가 예측 모델을 이용하여 각 주식 종목별 주가를 예측하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
컴퓨팅 디바이스는 상관관계가 분석된 주식 종목들 각각에 대해 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 상관관계가 분석된 주식 종목들 중에서 주식 종목을 선택한다(S1050).
상술한 주식 종목을 선택하는 구체적인 방법은 전술하였으므로 자세한 설명은 생략하도록 한다.
도 8 내지 도 10에서는 각각의 과정을 순차적으로 실행하는 것으로 기재하고 있으나 이는 예시적으로 설명한 것에 불과하고, 이 분야의 기술자라면 본 발명의 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 8 내지 도 10에 기재된 순서를 변경하여 실행하거나 또는 하나 이상의 과정을 병렬적으로 실행하거나 다른 과정을 추가하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이다.
본 발명의 일 실시 예에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 방법을 이용하여 주가가 상승할 것으로 예측되는 주식 종목을 선택할 수 있으며, 선택된 주식 종목이 추가하여 투자 위험도를 낮출 수 있는 주식 포트폴리오를 추천할 수 있다.
본 실시 예들에 따른 동작은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 매체에 기록될 수 있다. 컴퓨터 판독 가능한 매체는 실행을 위해 프로세서에 명령어를 제공하는 데 참여한 임의의 매체를 나타낸다. 컴퓨터 판독 가능한 매체는 프로그램 명령, 데이터 파일, 데이터 구조 또는 이들의 조합을 포함할 수 있다. 예를 들면, 자기 매체, 광 기록매체, 메모리 등이 있을 수 있다. 컴퓨터 프로그램은 네트워크로 연결된 컴퓨터 시스템 상에 분산되어 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 본 실시 예를 구현하기 위한 기능적인(Functional) 프로그램, 코드, 및 코드 세그먼트들은 본 실시 예가 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있을 것이다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시 예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
100: 주식 종목 선택 장치 130: 주가 예측부
110: 주가 데이터 수집부 140: 주식 종목 선택부
120: 상관관계 분석부

Claims (17)

  1. 주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집하는 주가 데이터 수집부;
    상기 수집된 주가 데이터를 이용하여 상기 각 주식 종목별 간 상관관계를 분석하는 상관관계 분석부;
    상기 상관관계가 분석된 주식 종목들에 대해 상기 수집된 주가 데이터를 기반으로 학습하여 생성한 주가 예측 모델을 이용하여 주가를 예측하려는 예측 날짜에 대한 상기 상관관계가 분석된 주식 종목들 각각의 주가를 예측하는 주가 예측부; 및
    상기 상관관계가 분석된 주식 종목들 각각에 대해 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 상기 상관관계가 분석된 주식 종목들 중에서 선택하는 주식 종목 선택부;를 포함하며,
    상기 상관관계 분석부는, 상기 각 주식 종목별 주식 가격의 수익률을 이용하여 상기 각 주식 종목별 간 상관관계를 수치화한 상관계수를 산출하는 상관계수 산출부;
    상기 산출된 상관계수에 따라 상기 상관관계의 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화하는 클러스터링부;
    상기 산출된 상관계수를 이용하여 상기 각 주식 종목별 간 거리 관계를 수치화한 거리를 산출하는 거리 산출부; 및
    상기 산출된 각 주식 종목별 간의 거리에 따라 상기 각 주식 종목별 간 거리 관계를 나타내는 주식 네트워크 그래프를 생성하는 주식 네트워크 그래프 생성부;를 포함하고,
    상기 클러스터링부는 상기 생성된 주식 네트워크 그래프로부터 상기 각 주식 종목별 간 거리 관계에 따라 상기 상관관계의 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  2. 제1항에 있어서,
    상기 상관관계 분석부는, 상기 군집화된 주식 종목 그룹 각각에 포함된 상기 상관관계의 유사성을 가지는 주식 종목들 중 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목을 상기 주가를 예측하기 위한 주식 종목의 후보로 추출하는 주식 종목 추출부;를 포함하고,
    상기 주가 예측부는 상기 후보로 추출된 주식 종목의 주가를 예측하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  3. 삭제
  4. 제2항에 있어서,
    상기 주식 종목 추출부는,
    상기 산출된 각 주식 종목별 간 거리에 기초하여, 상기 주식 네트워크 그래프로부터 상기 각 주식 종목들을 연결하는 가중치를 최소로 하는 최소신장트리를 구성하고, 상기 구성된 최소신장트리를 이용하여 상기 군집화된 주식 종목 각각에 포함된 상기 상관관계의 유사성을 가지는 주식 종목들 중 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목을 상기 주가 예측을 위한 주식 종목의 후보로 추출하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  5. 제4항에 있어서,
    상기 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목은 상기 구성된 최소신장트리에서 차수가 1에 해당하는 에지(edge)가 하나인 주식 종목인 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  6. 제4항에 있어서,
    상기 주식 종목 추출부는,
    프림 알고리즘(Prim’s Algorithm)을 적용하여 상기 주식 네트워크 그래프에서 기준 주식 종목을 선택하고, 상기 선택된 기준 주식 종목에서 간선으로 연결될 수 있는 모든 주식 종목들 중에 최소의 상관계수 값을 가지는 간선으로 이어지는 주식 종목을 선택하며, 상기 최소의 상관계수 값을 가지는 간선으로 이어지는 주식 종목을 선택할 때 이미 선택한 주식 종목은 다시 선택할 수 없도록 하는 과정을 반복하여 상기 최소신장트리를 구성하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  7. 제2항에 있어서,
    상기 클러스터링부는,
    K-메도이드(K-medoid) 알고리즘을 적용하여 상기 주식 종목들 중에서 미리 설정된 개수만큼 대표 주식 종목들을 각각 지정하고, 상기 각각 지정된 대표 주식 종목들과 상기 지정된 대표 주식 종목들 이외에 나머지 주식 종목들 간의 거리 관계에 따른 유사성을 고려하여 상기 미리 설정된 개수만큼 임의의 주식 종목들의 그룹으로 군집화하고, 상기 군집화 된 임의의 주식 종목들의 그룹에 배속된 주식 종목들과 상기 각각 군집화 된 임의의 주식 종목들의 그룹의 중심과의 거리를 비교하여 상기 생성된 주식 네트워크 그래프로부터 상기 각 주식 종목별 간 거리 관계에 따라 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  8. 제2항에 있어서,
    상기 주식 종목 선택부는,
    상기 군집화된 주식 종목 그룹 각각에서 추출된 적어도 하나의 주식 종목에 대해 예측된 주가를 각각 비교하여 상기 미리 설정된 개수만큼 군집화된 주식 종목 그룹 각각에서 상기 주가 상승이 예측되는 주식 종목을 선택하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  9. 제2항에 있어서,
    상기 상관계수 산출부는,
    상기 각 주식 종목별 주식 가격의 로그 수익률을 산출하고, 상기 산출된 로그 수익률의 평균 값을 이용하여 상기 각 주식 종목별 상관계수를 산출하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  10. 제1항에 있어서,
    각 날짜 별로 상기 상관관계가 분석된 주식 종목들의 주가, 거래량 및 거래 시간을 포함하는 상기 수집된 주가 데이터를 가공하여 주식 분석에 사용되는 기술적 분석 데이터로 변환하는 주가 데이터 변환부;를 더 포함하고,
    상기 주가 예측부는,
    상기 상관관계가 분석된 주식 종목들에 대해 상기 수집된 주가 데이터 및 상기 변환된 기술적 분석 데이터로부터 입력 데이터를 생성하여, 상기 생성된 입력 데이터로부터 상기 상관관계가 분석된 주식 종목들 각각에 대한 상기 예측 날짜의 주가를 예측하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  11. 제10항에 있어서,
    상기 입력 데이터는
    M 일치(M은 자연수)에 대한 미리 설정된 차원을 가지고,
    상기 주가 예측부는,
    상기 생성된 입력 데이터를 상기 M일 치의 시계열적 특성을 반영하여 M 개로 분리하고,
    상기 주가 예측 모델은,
    상기 M 일치의 시계열적 특성이 반영된 상기 분리된 M 개의 입력 데이터들을 각각 입력 받아 상기 상관관계가 분석된 주식 종목들 각각에 대한 상기 예측 날짜의 주가 예측 값을 출력하는 시계열 데이터 분석이 가능한 순환신경망(Recurrent Neural Network, RNN) 기반의 레이어로 구성되는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  12. 제11항에 있어서,
    상기 주가 예측 모델은,
    시간적 순서를 고려하여 상기 분리된 M 개의 입력 데이터들을 입력 받아 상기 상관관계가 분석된 주식 종목들 각각에 대한 상기 예측 날짜의 주가 예측 값을 출력하도록 현재 메모리 셀에 이전 메모리 셀 상태를 반영할지 여부를 결정하는 망각 게이트(Forget Gate)를 포함하는 장단기 메모리(Long Short Term Memory, LSTM) 셀로 구성된 순환신경망(RNN) 기반의 레이어로 구성되는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  13. 제12항에 있어서,
    상기 주가 예측 모델은,
    시간적 순서를 고려하여 상기 분리된 M 개의 입력 데이터들을 입력 받아 상기 상관관계가 분석된 주식 종목들 각각에 대한 상기 예측 날짜의 주가 예측 값을 출력하도록 두 개의 상기 장단기 메모리(LSTM) 셀을 결합하여 양방향으로 상태 전파가 이루어지도록 형성된 양방향 장단기 메모리(Bidirectional LSTM, Bi-LSTM) 셀로 구성된 순환신경망(RNN) 기반의 레이어로 구성되는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 장치.
  14. 컴퓨팅 디바이스에 의한 주식 포트폴리오 구성을 위한 주식 종목 선택 방법에 있어서,
    주식 종목의 주가와 관련된 주가 데이터를 각 주식 종목별로 수집하는 단계;
    상기 수집된 주가 데이터를 이용하여 상기 각 주식 종목별 간 상관관계를 분석하는 단계;
    상기 상관관계가 분석된 주식 종목들에 대해 상기 수집된 주가 데이터를 기반으로 학습하여 생성한 주가 예측 모델을 이용하여 주가를 예측하려는 예측 날짜에 대한 상기 상관관계가 분석된 주식 종목들 각각의 주가를 예측하는 단계; 및
    상기 상관관계가 분석된 주식 종목들 각각에 대해 예측된 주가를 서로 비교하여 주가 상승이 예측되는 주식 종목을 상기 상관관계가 분석된 주식 종목들 중에서 선택하는 단계;를 포함하며,
    상기 각 주식 종목별 간 상관관계를 분석하는 단계는, 상기 각 주식 종목별 주식 가격의 수익률을 이용하여 상기 각 주식 종목별 간 상관관계를 수치화한 상관계수를 산출하는 단계;
    상기 산출된 상관계수에 따라 상기 상관관계의 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화하는 단계;
    상기 산출된 상관계수를 이용하여 상기 각 주식 종목별 간 거리 관계를 수치화한 거리를 산출하는 단계; 및
    상기 산출된 각 주식 종목별 간의 거리에 따라 상기 각 주식 종목별 간 거리 관계를 나타내는 주식 네트워크 그래프를 생성하는 단계;를 포함하고,
    상기 주가 데이터를 각 주식 종목별로 수집하는 단계는 상기 생성된 주식 네트워크 그래프로부터 상기 각 주식 종목별 간 거리 관계에 따라 상기 상관관계의 유사성을 가지는 주식 종목들을 미리 설정된 개수의 주식 종목 그룹으로 군집화하는 것을 특징으로 하는 주식 포트폴리오 구성을 위한 주식 종목 선택 방법.
  15. 제14항에 있어서,
    상기 각 주식 종목별 간 상관관계를 분석하는 단계는, 상기 군집화된 주식 종목 그룹 각각에 포함된 상기 상관관계의 유사성을 가지는 주식 종목들 중 상관계수가 임계치보다 낮은 적어도 하나의 주식 종목을 상기 주가를 예측하기 위한 주식 종목의 후보로 추출하는 단계;를 더 포함하고,
    상기 주가를 예측하는 단계는,
    상기 후보로 추출된 적어도 하나의 주식 종목의 주가를 예측하는 것을 특징으로 하는 주식 종목 선택 방법.
  16. 제15항에 있어서,
    상기 주가 상승이 예측되는 주식종목을 선택하는 단계는,
    상기 군집화된 주식 종목 그룹 각각에서 추출된 적어도 하나의 주식 종목에 대해 예측된 주가를 각각 비교하여 상기 미리 설정된 개수만큼 군집화된 주식 종목 그룹 각각에서 상기 주가 상승이 예측되는 주식 종목을 선택하는 것을 특징으로 하는 주식 종목 선택 방법.
  17. 제14항 내지 제16항 중 어느 한 항에 따른 주식 포트폴리오 구성을 위한 주식 종목 선택 방법을 컴퓨터에서 수행하기 위한 컴퓨터에서 판독 가능한 프로그램이 기록된 저장 매체.
KR1020180146556A 2018-11-23 2018-11-23 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법 KR102161256B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180146556A KR102161256B1 (ko) 2018-11-23 2018-11-23 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180146556A KR102161256B1 (ko) 2018-11-23 2018-11-23 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20200061144A KR20200061144A (ko) 2020-06-02
KR102161256B1 true KR102161256B1 (ko) 2020-09-29

Family

ID=71090437

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180146556A KR102161256B1 (ko) 2018-11-23 2018-11-23 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR102161256B1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022004957A1 (ko) * 2020-07-02 2022-01-06 유한책임회사 알케미랩 투자자문방법 및 그 장치
KR102554443B1 (ko) * 2020-09-28 2023-08-11 주식회사 웨이커 복합 데이터 처리 알고리즘 기반 투자 대상 기업 분석 솔루션 및 장치
KR102567495B1 (ko) * 2020-10-14 2023-08-16 정병진 오피니언 마이닝 및 인공신경망을 이용한 비지도학습에 기반한 주식 정보 제공 시스템, 주식 정보 제공 방법 및 기록 매체에 저장된 프로그램
CN112634057A (zh) * 2020-12-18 2021-04-09 未鲲(上海)科技服务有限公司 基金相似度计算方法、平台、设备及可读存储介质
KR102532197B1 (ko) * 2021-01-04 2023-05-11 연세대학교 원주산학협력단 객체탐지모형을 적용한 주가등락 예측장치
KR102394096B1 (ko) * 2021-02-09 2022-05-04 김민규 인공지능을 이용하여 최적 검색식 도출하는 시스템 및 시스템의 동작 방법
WO2022270959A1 (ko) * 2021-06-24 2022-12-29 주식회사 이노핀 집합형 투자 상품에 대한 맞춤형 투자 위험 분석 장치 및 방법
KR102496501B1 (ko) * 2021-07-14 2023-02-07 주식회사 신한에이아이 시뮬레이션 데이터를 이용한 자산 배분 정보 산출 방법 및 시뮬레이션 데이터를 이용한 자산 배분 정보 산출 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090102884A (ko) * 2008-03-27 2009-10-01 양용철 주가지수와 연동종목 분석 서비스 장치 및 방법
KR20180117800A (ko) * 2017-04-20 2018-10-30 주식회사 비아이큐브 자산 포트폴리오 추천 방법
KR102094813B1 (ko) * 2017-04-26 2020-03-30 엑스폰 주식회사 금융시장 불안정지수를 이용한 자산배분 방법

Also Published As

Publication number Publication date
KR20200061144A (ko) 2020-06-02

Similar Documents

Publication Publication Date Title
KR102161256B1 (ko) 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법
Sen et al. A robust predictive model for stock price forecasting
KR102185921B1 (ko) 신경망을 이용한 주가 예측 장치 및 그 방법
Farooq et al. Predicting multistage financial distress: Reflections on sampling, feature and model selection criteria
Mustika et al. Analysis accuracy of xgboost model for multiclass classification-a case study of applicant level risk prediction for life insurance
Zhang et al. Attention enhanced long short-term memory network with multi-source heterogeneous information fusion: An application to BGI Genomics
Gurgul et al. Forecasting Cryptocurrency Prices Using Deep Learning: Integrating Financial, Blockchain, and Text Data
Faustryjak et al. Forward forecast of stock prices using LSTM neural networks with statistical analysis of published messages
Priscilla et al. Baseline modeling for early prediction of loan approval system
Guo et al. Forecasting the mid-price movements with high-frequency lob: a dual-stage temporal attention-based deep learning architecture
Sridhar et al. Effect of rate of change of stock prices with news sentiment analysis
Kelany et al. Deep learning model for financial time series prediction
Ansari et al. Analysis of Suitable Approaches for Data Mining Algorithms
Muruganandham et al. Deep Learning based forecast using RNN for stock price prediction
Maknickiene et al. Investigation of Prediction Capabilities using RNN Ensembles.
KR20220109146A (ko) 딥러닝 기술을 활용한 주식 종목 선택과 포트폴리오 구성 방법 및 그 장치
Kh et al. application Deep learning to Predict crypto currency Prices and their relationship to Market adequacy (applied research bitcoin as an example)
Phankokkruad et al. A comparison of extreme gradient boosting and convolutional neural network-long short-term memory for service demand forecasting
Sen et al. Precise Stock Price Prediction for Robust Portfolio Design from Selected Sectors of the Indian Stock Market
CN117312991B (zh) 一种分类识别系统的构建方法及其相关设备
Nayak et al. Forecasting Foreign Currency Exchange Price using Long Short-Term Memory with K-Nearest Neighbour Method
Bilgaeva et al. Neuroevolution Forecasting of the Living Standards of the Population
Clark A pound centric look at the pound vs. krona exchange rate movement from 1844 to 1965
Kushwaha et al. Prospective Stock Analysis Model to improve the investment chances using Machine Learning
Dhanalakshmi et al. Predicting the Price of Stock Using Deep Learning Algorithms

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant