KR20220167039A - 딥러닝과 경제 지표 기반 주가 예측 시스템 - Google Patents

딥러닝과 경제 지표 기반 주가 예측 시스템 Download PDF

Info

Publication number
KR20220167039A
KR20220167039A KR1020210076090A KR20210076090A KR20220167039A KR 20220167039 A KR20220167039 A KR 20220167039A KR 1020210076090 A KR1020210076090 A KR 1020210076090A KR 20210076090 A KR20210076090 A KR 20210076090A KR 20220167039 A KR20220167039 A KR 20220167039A
Authority
KR
South Korea
Prior art keywords
stock price
neural network
stock
indicators
data
Prior art date
Application number
KR1020210076090A
Other languages
English (en)
Other versions
KR102645528B1 (ko
Inventor
진영훈
홍성혁
지세현
Original Assignee
백석대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 백석대학교산학협력단 filed Critical 백석대학교산학협력단
Priority to KR1020210076090A priority Critical patent/KR102645528B1/ko
Publication of KR20220167039A publication Critical patent/KR20220167039A/ko
Application granted granted Critical
Publication of KR102645528B1 publication Critical patent/KR102645528B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

주가에 영향을 미치는 경제 지표를 선행지표로 분석하고, 주가예측을 딥러닝 기반의 예측을 통하여 예측 후 실제 주가를 비교하여 차이가 발생하면 거시지표에 대한 가중치를 조절하여 지속적인 반복학습을 통하여 주가를 예측하는, 딥러닝과 경제 지표 기반 주가 예측 시스템에 관한 것으로서, 주가 정보 및 경제 지표를 시계열 데이터로서 수집하는 데이터 수집부; 각 주가 및 경제지표 각각을 위한 신경망(이하 예측용 신경망)을 학습시키는 예측신경망 관리부; 학습된 예측용 신경망으로 주가 및 경제지표 각각을 예측하는 주가및지표 예측부; 보정치를 위한 신경망(이하 보정용 신경망)을 학습시키는 보정신경망 관리부; 및, 학습된 보정용 신경망으로 보정치를 획득하고, 획득된 보정치를, 예측된 주가에 반영하여 보정하는 주가 보정부를 포함하는 구성을 마련한다.
상기와 같은 시스템에 의하여, 거시지표가 주가에 미치는 영향을 분석하여 보정치로 보정함으로써, 더 정밀하게 주가를 예측할 수 있고, 주식에 대하여 보다 합리적이고 건전한 투자를 제공할 수 있다.

Description

딥러닝과 경제 지표 기반 주가 예측 시스템 { A stock price prediction system based on deep learning and economic indicators }
본 발명은 주가에 영향을 미치는 경제 지표를 선행지표로 분석하고, 주가예측을 딥러닝 기반의 예측을 통하여 예측 후 실제 주가를 비교하여 차이가 발생하면 거시지표에 대한 가중치를 조절하여 지속적인 반복학습을 통하여 주가를 예측하는, 딥러닝과 경제 지표 기반 주가 예측 시스템에 관한 것이다.
일반적으로, 거시경제란 국민경제 전체의 전반적 흐름이며, 경제 성장이나 경기변동을 알려주는 지표로 국가경영을 하기 위한 중요한 지표 중 하나이다. 다양한 거시지표가 있지만 주요지표로는 경제성장률, 실업률, 물가상승률, 빈부격차, 정부 재정적자, 기준금리, 환율, 신용등급 등이 있다[비특허문헌 1].
대외 거시지표가 주가에 영향을 미치는 지표로는 IMF 외환위기 이후에는 미국정책금리, 미국주가의 변화가 외국자본의 유입으로 더욱더 민감하게 반응하고 있다[비특허문헌 2-4]. 국내 주식 시장을 예측하기 위해서는 국내 거시지표와 함께 미국 거시지표도 살펴보고 각 지표별 상관관계를 과거 데이터를 통하여 분석하면 가까운 미래를 예측할 것으로 기대한다.
요약하면, 거시경제는 한 나라 경제 전체의 움직임을 보여주기 때문에 주식을 분석할 때 선행되어 분석되는 지표 중 하나이다. 실업률, 이자율, 물가, 국민소득, 환율, 통화량, 국제수지 등 국가차원의 경제 상황 전반은 주식시장에 직접적인 영향을 미치고, 경제 지표는 개별 주가와의 상관관계가 있기 때문에 주식을 예측하기 위해 많은 증권사 애널리스트들이 관심 있게 지켜보고, 개별 주가에 영향을 고려하여 매수와 매도를 판단하는 주요한 근거자료가 되고 있다.
따라서 대내외 과거 거시 지표를 분석하고 이를 반영하여 개별 주가를 예측하는 기술이 필요하다.
Tobin, J. (1998). World economy and financial markets. Japan and the World Economy, 10(3), 377-379. doi:10.1016/s0922-1425(98) 00038-3 Choi, J., Yoo, S., & Kim, J. (2012). Comparative Analysis of Default Risk of Construction Company during Macroeconomic Fluctuations. Korean Journal of Construction Engineering and Management, 13(4), 60-68. doi:10.6106/kjcem.2012.13.4.060 Choi, J., & Lee, O. (2014). Correlation Analysis Among the Price of Apartments in Seoul, Stock Market and main Economic Indicators. Journal of Digital Convergence, 12(2), 45-59. doi:10.14400/jdc.2014.12.2.45 Tang, J. (2015). The Effect on KOSPI 200 Futures after Launching KOSPI 200 Option. Proceedings of the 2015 International Conference on Industrial Technology and Management Science. doi:10.2991/itms-15.2015.347 Fred Economic Research. (2020). https://fred.stlouisfed.org/graph/?g=w8ko Fear and Greed Index. (2020). https://money.cnn.com/data/fear-and-greed/ Hong, S. (2020). A study on stock price prediction system based on text mining method using LSTM and stock market news. The Society of Digital Policy and Management, 18(7), 223??228. https://doi.org/10.14400/JDC.2020.18.7.223 Joshi, H., Verma, A., & Mishra, A. (2020). Classification of Social Signals Using Deep LSTM-based Recurrent Neural Networks. 2020 International Conference on Signal Processing and Communications (SPCOM). doi:10.1109/spcom50965.2020.9179516 Heesoo Hwang. (2018). Daily Stock Price Forecasting Using Deep Neural Network Model. Journal of the Korea Convergence Society, 9(6), 39-44. Yongtaek Lim,Heuiseok Lim. (2020). A Comparative Analysis of the Prediction Models for the Direction of Stock Price Using the Online Company Reviews. Journal of the Korea Convergence Society, 11(8), 165-171. Gyeahyung Jeon,Sun-young Kwon. (2018). A Study on the Influence of Economic Factors on Library Use. Journal of the Korea Convergence Society, 9(11), 299-306. Yong Jae Shin. (2018). A Study on Effects of 6th Industry types on the Korean Economy. Journal of the Korea Convergence Society, 9(10), 325-338. Billah, M., Waheed, S., & Hanifa, A. (2016). Stock market prediction using an improved training algorithm of neural network. 2016 2nd International Conference on Electrical, Computer & Telecommunication Engineering (ICECTE). doi:10.1109/icecte.2016.7879611 Jeon, S., Hong, B., Kim, J., & Lee, H. (2016). Stock Price Prediction based on Stock Big Data and Pattern Graph Analysis. Proceedings of the International Conference on Internet of Things and Big Data. doi:10.5220/0005876102230231 Ghosh, A., Bose, S., Maji, G., Debnath, N., & Sen, S. (n.d.). Stock Price Prediction Using LSTM on Indian Share Market. doi:10.29007/qgcz Lee Jong-girl. (2008). A comparative analysis of major macro indicators in five Latin American countries. Latin American and Caribbean Studies 26(2), 83-106 Goodfellow, I., Bengio, Y., Courville, A., & Bengio, Y. (2016). Deep learning (Vol. 1, No. 2). Cambridge: MIT press. Qian, Y., Fan, Y., Hu, W., & Soong, F. K. (2014, May). On the training aspects of deep neural network (DNN) for parametric TTS synthesis. In 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 3829-3833). IEEE. Mao, J., Xu, W., Yang, Y., Wang, J., Huang, Z., & Yuille, A. (2014). Deep captioning with multimodal recurrent neural networks (m-rnn). arXiv preprint arXiv:1412.6632. Pascanu, R., Gulcehre, C., Cho, K., & Bengio, Y. (2013). How to construct deep recurrent neural networks. arXiv preprint arXiv:1312.6026. Medsker, L. R., & Jain, L. C. (2001). Recurrent neural networks. Design and Applications, 5. Selvin, S., Vinayakumar, R., Gopalakrishnan, E. A., Menon, V. K., & Soman, K. P. (2017, September). Stock price prediction using LSTM, RNN and CNN-sliding window model. In 2017 international conference on advances in computing, communications and informatics (icacci) (pp. 1643-1647). IEEE.
본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 주가에 영향을 미치는 경제 지표를 선행지표로 분석하고, 주가예측을 딥러닝 기반의 예측을 통하여 예측 후 실제 주가를 비교하여 차이가 발생하면 거시지표에 대한 가중치를 조절하여 지속적인 반복학습을 통하여 주가를 예측하는, 딥러닝과 경제 지표 기반 주가 예측 시스템을 제공하는 것이다.
즉, 본 발명은 대내외 과거 거시 지표를 분석하고, 딥러닝을 통하여 예측한 후 실제 주가와의 상관관계를 분석하고, 머신러닝을 통하여 개별 주가를 예측하고, 실제 주가와 비교하여 차이점을 분석한 후, 거시지표가 주가에 미치는 영향을 분석하여, 더 정밀하게 주식을 예측하는, 딥러닝과 경제 지표 기반 주가 예측 시스템을 제공하는 것이다.
상기 목적을 달성하기 위해 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 관한 것으로서, 주가 정보 및 경제 지표를 시계열 데이터로서 수집하는 데이터 수집부; 각 주가 및 경제지표 각각을 위한 신경망(이하 예측용 신경망)을 학습시키는 예측신경망 관리부; 학습된 예측용 신경망으로 주가 및 경제지표 각각을 예측하는 주가및지표 예측부; 보정치를 위한 신경망(이하 보정용 신경망)을 학습시키는 보정신경망 관리부; 및, 학습된 보정용 신경망으로 보정치를 획득하고, 획득된 보정치를, 예측된 주가에 반영하여 보정하는 주가 보정부를 포함하는 것을 특징으로 한다.
또한, 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서, 상기 시스템은, 상기 시계열 데이터에 대하여 증분을 산출하여 정규화 하는 데이터 정규화부를 더 포함하고, 상기 예측용 신경망에 이용하는 모든 주가 및 경제지표는, 정규화된 데이터로 이용되는 것을 특징으로 한다.
또한, 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서, 상기 예측신경망 관리부는, 전체 정규화된 증분의 시계열 데이터 M(-N+1),M(-N+2), ....,M(0)로부터 순차적으로 다수의 배치 세트를 생성하되, 배치 크기 n+1로 하나의 세트를 형성하여 일련의 N-n개의 배치 세트를 구성하고, 각 배치 세트는 n개의 과거 데이터 세트와, 해당 세트일 때의 예측 데이터의 정답으로 구성함으로써, 학습 데이터를 생성하는 것을 특징으로 한다.
또한, 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서, 상기 정규화된 증분을 다음 수식 1에 의하여 산출하는 것을 특징으로 한다.
[수식 1]
Figure pat00001
단,
Figure pat00002
,
Figure pat00003
이고,
t는 날짜이고, H(t)와 L(t)는 주가 데이터의 각각 t일의 고가와 저가를 나타냄.
또한, 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서, 상기 보정신경망 관리부는 정규화된 거시지표와, 정규화된 주가의 실제값과 예측값 간의 차이 값을 하나의 학습 데이터로 활용하여, 해당 신경망을 학습시키되, 상기 차이 값을 참값으로 활용하여 학습시키는 것을 특징으로 한다.
또한, 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서, 상기 주가 보정부는 예측된 거시지표를 상기 보정용 신경망에 입력하여 보정치를 획득하고, 획득된 보정치를 예측된 주가에 합산하여 최종적인 주가 예측치를 획득하는 것을 특징으로 한다.
또한, 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서, 상기 예측용 신경망은 DNN(Deep Neural Network) 신경망인 것을 특징으로 한다.
또한, 본 발명은 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서, 상기 보정용 신경망은 LSTM(long short-term memory networks) 신경망인 것을 특징으로 한다.
상술한 바와 같이, 본 발명에 따른 딥러닝과 경제 지표 기반 주가 예측 시스템에 의하면, 거시지표가 주가에 미치는 영향을 분석하여 보정치로 보정함으로써, 더 정밀하게 주가를 예측할 수 있고, 주식에 대하여 보다 합리적이고 건전한 투자를 제공할 수 있는 효과가 얻어진다.
도 1은 본 발명을 실시하기 위한 전체 시스템의 예시 구성도.
도 2는 본 발명의 일실시예에 따른 주가에 영향을 미치는 기업 주요 재무제표를 나타낸 표.
도 3은 미국주식에 영향을 미치는 주요 미국내 거시 지표를 나타낸 표.
도 4는 2004년부터 2020년까지 실업률(청색)과 신규 주택 판매 지수(적색)를 비교한 그래프.
도 5는 2004년부터 2020년까지 통화량(청색)과 NASDAQ 지수(적색)를 비교한 그래프.
도 6은 공포와 탐욕지수(Fear and Greedy Index)를 나타낸 그래프.
도 7은 본 발명의 일실시예에 따른 딥러닝과 경제 지표 기반 주가 예측 시스템의 구성에 대한 블록도.
도 8은 본 발명의 일실시예에 따른 거시지표 및 주가에 대한 시계열 데이터를 예시한 표.
도 9는 본 발명의 일실시예에 따른 거시지표 및 주가에 대한 정규화된 시계열 데이터를 예시한 표.
도 10은 본 발명의 일실시예에 따른 LSTM 신경망의 구조를 예시한 도면.
도 11은 본 발명의 일실시예에 따른 주가 및 경제지표의 학습 및 예측 방법에 대한 프로그래밍 코드.
도 12는 본 발명의 일실시예에 따른 주가 예측 분석의 결과를 나타낸 그래프.
도 13은 본 발명의 일실시예에 따른 DNN 신경망의 구조를 예시한 도면.
이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.
또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
먼저, 본 발명을 실시하기 위한 전체 시스템의 구성을 도 1을 참조하여 설명한다.
도 1에서 보는 바와 같이, 본 발명을 실시하기 위한 전체 시스템은 사용자 단말(10), 주가를 예측하는 주가예측 서버(30), 주가 정보를 제공하는 주가정보 서버(50), 및, 경제지표 등을 제공하는 지표정보 서버(60)로 구성된다. 추가적으로, 필요한 데이터를 저장하는 데이터베이스(40)를 더 포함하여 구성될 수 있다.
먼저, 사용자 단말(10)은 사용자가 사용하는 단말로서, 스마트폰, 태블릿PC, 노트북, 개인용 컴퓨터(PC) 등 컴퓨팅 기능을 가지는 통상의 컴퓨터 단말이나 전용 단말이다.
사용자 단말(10)은 주가예측 서버(30)에 접속하여, 주가예측 서버(30)에서 제공하는 주가 예측 서비스를 제공받을 수 있다. 즉, 사용자 단말(10)은 주가예측 서버(30)에서 종목을 입력하고, 입력된 종목에 대한 예상 주가를 요청하여 수신한다.
바람직하게는, 예상 주가는 최고 목표가와 최저 목표가 등으로 구성된다.
다음으로, 주가정보 서버(50)는 주가 정보를 제공하는 통상의 서버로서, 증권사, 주가 정보제공 업체 등에서 운영되는 서버이다. 주가정보 서버(50)는 다수 개가 존재할 수 있으며, 각 주가 정보 서버(50)는 서로 다른 종류의 주가 정보를 제공할 수 있다.
바람직하게는, 주가 정보는 고가, 저가, 종가 등으로 구성된다. 또한, 각 주가 정보는 날짜별 정보(날짜별 데이터)로 구성된다. 즉, 주가 정보는 현재 또는 과거의 거래 영업일에 거래된 주가 정보를 포함한다.
다음으로, 지표정보 서버(60)는 거시지표 또는 경제지표를 제공하는 서버로서, 각 금융기관, 투자기관, 또는 공공 경제 관련 기관 등에 의해 운영되는 서버이다. 지표정보 서버(60)는 온라인 상에 거시지표 또는 경제지표를 제공한다.
경제지표 또는 거시지표는 중앙은행금리(DFF), 실업률(UNRATE), 소비자심리지수(CPIAUCSL), 소비자 물가(CSCICP), 자동차판매지수(PCU), 주택판매지수(HSN), 실업수당청구건수(CCSA), 공포와 탐욕지수(FGI), 하이일드 채권스프레드(BAMLH), 원자재(RAW) 등으로 구성된다.
다음으로, 주가예측 서버(30)은 통상의 서버로서, 사용자 또는 사용자 단말(10)의 요청에 따라, 주가를 예측하고, 예측된 주가 정보를 사용자에게 제공한다. 바람직하게는, 특정 종목명을 입력받아, 해당 종목에 대한 주가를 예측하여, 해당 종목의 예측 주가 데이터를 제공한다.
특히, 주가예측 서버(30)은 LSTM 신경망의 신경망을 구비하고, 과거의 주가 정보를 이용하여 LSTM 신경망을 학습시킨다. 그리고 학습시킨 LSTM 신경망에 현재 주가 정보를 입력하여, 예측된 주가 데이터를 출력한다.
또한, 주가예측 서버(30)는 LSTM 신경망의 신경망을 구비하여 경제지표를 예측하고, CNN 신경망을 이용하여 예측된 경제지표로부터 보정치를 획득한다. 그리고 획득된 보정치로 예측된 주가 데이터를 보정하여, 최종 예측 주가를 획득한다.
또한, 주가예측 서버(30)는 예측된 주가 데이터를 최고 목표가와 최저 목표가로 제공할 수 있다. 이때, 바람직하게는, 예측 주가에서 오차 범위를 설정하여 최고 목표가와 최저 목표가를 추출한다.
또한, 주가예측 서버(30)는 주가정보 서버(50)로부터 주가 정보를 수신하여 활용한다. 또한, 주가예측 서버(30)는 지표정보 서버(60)로부터 경제지표를 수집하고, 수집된 경제지표를 반영하여 주가 정보를 보정한다.
다음으로, 데이터베이스(40)는 주가 정보를 저장하는 주가정보DB(41), 경제지표 또는 거시지표를 저장하는 지표정보DB(42), 거시지표에 의한 주가의 보정치와 관련된 정보를 저장하는 보정정보DB(43)로 이루어진다. 그러나 상기 데이터베이스(40)의 구성은 바람직한 일실시예일 뿐이며, 구체적인 장치를 개발하는데 있어서, 접근 및 검색의 용이성 및 효율성 등을 감안하여 데이터베이스 구축이론에 의하여 다른 구조로 구성될 수 있다.
다음으로, 본 발명에서 사용되는 경제지표 또는 거시지표에 대하여 도 2 내지 도 6을 참조하여 구체적으로 설명한다.
주가는 기업의 미래 가치이고, 그 가치는 재무재표 분석을 통하여 알 수 있기 때문에, 기존의 인공지능을 이용한 주가 예측 시스템은 분석 대상 기업의 재무제표를 분석하여 주가를 예측하고 있다. 하지만, 기업의 재무재표는 큰 틀에서 거시지표가 반영된 것이므로 거시지표 분석을 선행할 경우, 기업의 재무지표의 예측이 용이하고, 매수와 매도의 최적의 시기를 잡을 수 있다.
도 2의 표는 전통적인 기업 분석을 위한 재무제표이다.
최근 연구에 따르면 기업의 재무제표가 주가에 미치는 영향을 최대 19%이기 때문에 기존의 재무제표 분석만으로 기업의 미래 가치를 판단하는 시대는 지났으며, 거시 지표와 같은 선행지표도 함께 분석하고 예측하는 것이 필요하다.
도 3의 표는 미국주식에 영향을 미치는 주요 미국내 거시 지표이다.
도 3의 지표 외에도 다양한 지표들이 존재하지만 본 발명에서는 주요 10개 지표와 개별 주가와의 상관관계를 살펴보고, 특정 거시 지표가 선행인지 후행인지를 판단하여 주가 예측을 좀 더 정확하게 예측한다.
한편, 주택판매지수와 자동차 판매지수는 거시 지표와의 관계는 밀접한 상관관계가 있으며, 미국내 주택 구입 평균 금액은 377,200 달러(2020년 기준)이고, 미국내 자동차 평균 구매 금액은 35,000 달러(2020년 기준)로 소비자 경제 측면에서 살펴보면 높은 비중을 차지하고 있다. 따라서 주택과 자동차 지표는 경기를 예측하는 선행지표로 여겨진다.
자동차의 경우에는 수만 가지의 부품으로 이루어져 있기 때문에 자동차 판매대수는 경기가 회복되는 국면에서는 동행지표 또는 후행지표의 역할을 한다. 신차판매나 리스가 줄어든다면 회사에서 실직을 했거나 비즈니스가 잘 안 되는 의미로 받아들일 수 있다.
또한 소비자 심리 지수는 지수가 오르면 소비 욕구가 넘친다는 의미이고, 낮아지면 소비가 위축된다는 의미이며 경제와 밀접한 관계가 있다. 2008년과 같은 미국발 금융위기때에는 소비자 심리지수가 먼저 하락하고 증시가 저점으로 내려가는 것을 알 수 있다. 소비자 심리지수는 직접 소비자에게 설문을 조사하기 때문에 정확성이 떨어지고 변동성도 크다는 단점은 있다[비특허문헌 5].
도 4는 실업률(Unemployed rate)과 신규 주택 판매 지수(Home Sales Index)를 나타내고 있다. 특히, 도 4에서, 2004년부터 2020년까지 실업률(청색)과 신규 주택 판매 지수(적색)를 비교한 그래프로 표시하고 있는데, 이를 보면, 2개의 지표가 정확하게 정반대로 진행하는 것을 알 수 있다.
다음으로, 도 5는 통화량(Money)과 나스닥 지표(NASDAQ Index)를 나타내고 있다. 도 5에서 보는 바와 같이, 2019년 10월부터 2020년 8월까지 통화량(청색)과 NASDAQ(적색)를 비교한 그래프로 동반 고점으로 진행하는 것을 알 수 있다.
통화량은 시중에 얼마나 통화가 풀렸는지 나타내는 지표로 유통되는 통화와 요구불 예금을 포함한다. 정리하면, 통화량은, 시중에 자금을 얼마나 많이 풀었는지 확인하는 유동성 지표이다. 미국 연방준비은행은 주가 하락 할 때마다 돈을 풀어서 경기를 부양하고 있다. 미국 연방준비은행은 양적완화 완화 정책을 중앙은행의 금리를 통해서 실시한다. 금리를 낮추면 시중에 돈이 많이 풀리게 되어 소비와 기업의 매출이 늘어나지만, 금리를 높이면, 자연스럽게 시장에 돈이 회수 된다. 시장에 돈이 줄어들면 기업은 경영이 어려워 직원을 해고 하게 된다. 따라서 미국 연방준비 은행은 경기 나쁠 때 돈을 유통시키기 위해 기준금리를 거의 제로 금리에 가깝게 유지한다.
주택 판매 지수는 선행지표로 주택이 재산에 차지하는 비중이 크기 때문에 실직을 하거나 은행에서 대출이 불가능할 때 집을 팔아서 부족한 재정을 충당하기 때문에 신규주택 판매 증가는 경기 호황을 의미하고, 기존 주택 판매 증가는 현금을 보유하기 위한 활동으로 경기 위축을 뜻하게 된다.
주간실업수당 청구 건수는 주가 지수가 지속적으로 하락일 경우 후행지표에 해당한다. 2008년 미국발 금융위기 때 주식이 먼저 하락하고 주간실업수당 청구 건수 증가하였다. 실업수당 청구건수는 불황이 시작될 때는 후행지표이지만, 증시가 좋아질 경우에는 선행지표로서 사용된다.
또한, 도 6은 공포와 탐욕지수로 CNN 제공하는 지표로 주식 시장에 포함된 낙관의 상대 강도 및 내재된 공포심을 나타내는 지표이다. 0은 극단적인 공포를 나타내며, 100은 극단적인 낙관을 의미하기 때문에 일반적으로 80이상 시에는 매도하는 것이 이득이고, 20미만 시는 매수하는 것이 일반적이다 [비특허문헌 6-9].
다음으로, 본 발명의 일실시예에 따른 주가 예측 시스템(30)의 구성을 도 7을 참조하여 설명한다.
본 발명에 따른 주가 예측 시스템(30)은 앞서 주가예측 서버(30) 형태로 구현될 수 있다. 또는, 주가 예측 시스템(30)은 서버-클라이언트 형태로 구현되고, 사용자 단말(10)에 클라이언트 모듈이 설치될 수 있다.
도 7에서 보는 바와 같이, 본 발명의 일실시예에 따른 주가 예측 시스템(30)은 주가 정보, 경제지표/거시지표 등 데이터를 수집하는 데이터 수집부(31), 주가, 거시지표 등의 값에 대한 증분을 산출하여 정규화 하는 데이터 정규화부(32), 주가 또는 경제지표를 예측하는 신경망을 구성하고 학습시키는 예측신경망 관리부(33), 주가 및 거시지표를 예측하는 주가및지표 예측부(34), 보정치를 출력하는 신경망을 구성하고 학습시키는 보정신경망 관리부(35), 및, 예측된 주가를 보정하는 주가 보정부(36)로 구성된다.
먼저, 데이터 수집부(31)는 주가 정보, 경제지표(또는 거시지표), 뉴스 등 주가 관련 데이터를 수집한다.
주가 정보는 고가, 저가, 종가 등으로 구성된다. 또한, 각 주가 정보는 날짜별 정보(날짜별 데이터)로 구성된다. 즉, 주가 정보는 현재 또는 과거의 거래 영업일에 거래된 주가 정보를 포함한다.
또한, 거시지표(또는 경제지표)는 특정 국가의 경제상황을 집계한 경제 지표로서, 해당 국가의 경제상황을 나타낸다. 거시지표는 환율, 이자율, 통화량, GDP, GDP증가율, 실업률, 물가상승률, 경상수지, 소비자지수, 소비자 설문, 생산지수, 신규주택공급수, 실업수당 청구 건수, 장기국채 금리, 원자재 등으로 구성된다[비특허문헌 16]. 거시지표 외에도 모든 경제 지표에 적용할 수 있다. 예를 들어, 거시지표 대신, 금리, 환율, 선물 지수 등은 일일 단위로 수집될 수 있다. 또한, 과거 데이터는 fred.stlouisfed.org 사이트 등에서 월 단위로 다운 받아 사용할 수 있다.
또한, 거시지표는 기간별 정보(기간별 데이터)로 구성된다. 바람직하게는, 각 거시지표는 월 단위의 데이터로 구성된다. 즉, 날짜 단위는 월 단위로 설정한다. 경제 지표가 일일 단위로 변화되는 데이터인 경우, 일 단위로 설정할 수 있다. 이하에서 설명의 편의를 위하여 일 단위(또는 날짜 단위)로 설명하나, 날짜 단위는 일 단위, 월 단위, 주 단위 등 통상의 기간 단위로 설정할 수 있다.
GDP 등 분기별로 집계되는 데이터는 월별로 나누어 월 단위 데이터로 변환한다. 분기별 데이터를 나누는 방식은 통상의 방식을 적용한다. 예를 들어, 분기 데이터를 3으로 나누어 각 월의 데이터로 사용하거나, 보간법을 적용하여 직전 분기와 다음 분기의 값에 따라, 각 월의 데이터의 연속성을 가지도록 변환할 수도 있다.
다음으로, 데이터 정규화부(32)는 특정 기간 내의 주가, 경제지표(또는 거시지표) 등의 값에 대한 증분을 산출하여 정규화 한다.
주가와 각 거시지표는 단위가 각각 다르다. 따라서 각 주가 또는 거시지표의 값에 대하여 증분을 구하여, 해당 값 대신 증분 값을 사용한다. 그리고 기준 날의 증분 값을 0으로 설정(초기화) 한다. 예를 들어, 2010년 1월부터 2020년 12월까지의 데이터를 수집한 경우, 2010년 1월의 데이터의 값을 0으로 설정한다.
각 데이터(주가, 거시지표 등)의 증분은 당일(당월) 값에서 전일(전월) 값을 뺀 값을 전일(전월) 값으로 나누어 산출한다. 즉, t일(월)의 증분 △M(t)을 다음 식에 의해 구한다.
[수학식 1]
Figure pat00004
여기서, M(t)는 해당 데이터의 t시간에서의 데이터 값을 나타낸다.
각 증분 데이터는 시계열 데이터이다. 전체 시계열 데이터의 크기를 N이라 하면, 각 주가 또는 거시지표의 시계열 데이터는 일련의 날짜에 의한 데이터로서, M(-N+1), M(-N+2), ...., M(0) 이다. M(0)는 현재 일(월)의 데이터이고, M(-k)는 k 일(월) 이전의 증분 데이터이고, M(0)는 당일(월)의 증분 데이터이다.
또한, 바람직하게는, 주가 데이터는 주가의 중간값(고가와 저가의 중간값)으로 사용한다. 즉, 중간값 은 다음 식과 같이 고가와 저가의 평균으로 구한다.
[수학식 2]
Figure pat00005
여기서, t는 날짜이고, M(t)은 t일의 중간값이고, H(t)와 L(t)는 각각 t일 의 고가와 저가를 나타낸다.
다음으로, 증분 △M(t)을 시그모이드 함수로 정규화 한다. 정규화는 다음 식과 같다.
[수학식 3]
Figure pat00006
여기서, S(t)는 t일의 정규화된 증분이다.
도 9는 도 8의 거시지표 및 주가를 정규화한 데이터를 예시하고 있다.
다음으로, 예측신경망 관리부(33)는 각 주가 및 거시지표 각각을 위한 LSTM(long short memory networks) 신경망을 구성하고, LSTM 신경망을 학습시킨다. 이때의 LSTM 신경망을 예측용 신경망이라 부르기로 한다. 특히, 주가 예측을 위한 신경망을 주가예측용 신경망, 거시지표를 예측하기 위한 신경망을 지표예측용 신경망이라고 부르기로 한다.
인공지능의 정의는 인간의 지각, 추론, 학습과 같은 능력을 인공적으로 구현한 컴퓨터 프로그램 또는 이를 포함한 컴퓨팅 시스템으로 정의한다[비특허문헌 17]. 인공 지능은 일반적인 용어이며, 머신러닝은 인공지능의 분야 중 반복하여 학습 을 스스로 하여 인간의 개입이 없이 스스로 학습해 하는 분야이며, 딥러닝은 머신 러닝에서 더 발전하여 여러 히든 레이어를 두고 더욱 정확한 예측을 하기 위한 방 법이다. 딥러닝 네트워크로는 ANN(Artificial Neural Network), DNN(Deep Neural Network), CNN(Convolution Neural Network), RNN(Recurrent Neural Networks), LSTM(Long Short Term Memory)이 대표적이다[비특허문헌 18-20]. 딥러닝 네트워크를 응용하여 과거 데이터를 바탕으로 예측하기 위해 사용되고 있다.
RNN과 LSTM은 순차적이며 반복적인 데이터 분석에 용이하여 주가 분석에 많이 사용되고 있다[비특허문헌 21]. 과거에 데이터가 현재에 영향을 미치는 것을 가중치(Weight)를 통해 지속적으로 반복하면서 예측한다. 따라서 RNN과 LSTM은 주가 예측에 많이 활용이 되고 있다[비특허문헌 22].
본 발명에서는 주가의 과거 데이터만 활용하여 예측하는 것이 아니라 각각의 거시지표(또는 경제지표)를 분석하여 예측하고 실제 주가와 비교하여 차이나는 만 큼 가중치(Weight) 값을 조절하여 실제 주가에 가장 맞도록 반복학습을 시켜서 주 가를 예측한다. 또한, 거시지표별 상관관계에 따라 가중치(Weight) 값을 조절하여 최적의 예측을 하고 반복적인 학습을 통해서 가중치(Weight) 값도 조절한다.
특히, LSTM(Long Short T erm Memory networks) 신경망은 RNN(순환신경망, Recurrent Neural Network)의 한 종류이며, 과거의 데이터가 미래에 영향을 줄 수 있는 구조를 가진다. 따라서 LSTM 신경망은 주가 예측에 가장 적합한 모델이다.
기존의 RNN 신경망에서는 장 기 의존성 문제점인 체인룰(Chain Rule)에 의해 [-1, 1]사이의 값들 이 계속 곱해지다보니 앞쪽으로 갈수록 그 값이 작아지고 결국에는 소멸한다. 따라서 기존의 RNN 방식은 파라미터(Parameter)들이 업데이트 되지 않는 문제를 가진다. LSTM은 이를 해결하기 위해 제안된 방식이다.
기존의 RNN은 은닉층(Hidden Layer) 에서 은닉 상태(Hidden State, St)를 계산할 때 단순히 St=tanh(Uxt +WSt)로 계산하였지만, LSTM에서는 총 4가지의 계산과정이 있다.
도 10에서 보는 바와 같이, LSTM의 은닉층(Hidden Layer)에서 신경망 레이 어(Neural Network Layer)가 4개가 존재한다. 즉, 도 10의 중앙 사각형 모양 내에 신경망 레이어가 4개 존재함을 확인할 수 있다. 또한 LSTM의 핵심은 뉴럴(A)의 상 단부분에 있는 수평선에 아주 마이너한 선형 연산을 거치고 전체 체인을 관통하여 정보는 큰 변함 없이 다음 단계로 전달하게 된다는 것이다.
한편, 주가, 및, 각 경제 지표(또는 거시 지 표) 각각을 예측하는 LSTM 신경망을 각각 구성한다. 즉, 주가에 대한 LSTM 신경망, 소비자 지수에 대한 LSTM 신경망, 생산지수에 대한 LSTM 신경망 등으로 구성된다.
특히, 각 시계열 데이터에 대해 특정 기간(예를 들어 30일, 이하 반영 기간 ) 동안 과거 데이터를 가지고 훈련시키고 하루를 예측하여 실제 데이 터와 비교한다. 이와 같이 비교하면서 반영 기간(일례로서 30일) 단 위로 훈련 세트가 미래로 이동하면서 학습된다.
또한, 바람직하게는, 주가에 대한 LSTM 신경망은 주식 가격의 고가와 저가를 기본값으로 하여 학습된다. 또한, LSTM 신경망은 하나의 종목의 주가에 대하여 학 습된다. 따라서 새로운 종목(또는 다른 종목)의 주가를 예측하기 위해서는, LSTM 신경망을 초기화 하고, 해당 종목의 과거 주가 데이터로 다시 학습시킨다. 또는, 다른 실시예로서, LSTM 신경망은 예측하고자 하는 각 종목에 대응되는 LSTM 신경망 을 종목별로 구비한다. 즉, 각 종목에 해당하는 LSTM 신경망을 다수 구비하고, 종 목별로 해당 종목의 과거 주가 데이터로 학습한다.
또한, 바람직하게는, LSTM 신경망은 하나의 거시지표 (또는 경제지표)에 대하여 학습된다. 따라서 다른 경제 지표를 예측하기 위해서는, LSTM 신경망을 초기화 하고, 해당 경제지표의 과거 데이터로 다시 학습시킨다. 또는, 다른 실시예로서, LSTM 신경망은 예측하고자 하는 각 경제 지표에 대응되는 LSTM 신경망을 지표별로 구비한다. 즉, 각 지표에 해당하는 LSTM 신경망을 다수 구비하고, 지표별로 해당 지표의 과거 시계열 데이터로 학습한다.
한편, 예측신경망 관리부(33)는 각 주가 또는 각 경제지표(또는 거시지표)의 증분의 시계열 데이터로 해당 신경망을 학습시킨다.
전체 시계열 데이터의 크기를 N이라 하고, 배치 크기를 n으로 설정한다. 이 때, N > n이고, 바람직하게는, N > 2n을 만족하도록 N과 n을 설정한다. 즉, 배치 크기 보다 많은 배치 개수를 만들기 위한 것이다.
전체 증분의 시계열 데이터는 일련의 날짜에 의한 데이터로서, M(-N+1), M(-N+2), ...., M(0) 이다. M(-k)는 k일 이전의 정규화된 증분 데이터이고, M(0)는 당일의 정규화된 증분 데이터이다 .
이때, 배치 크기 n으로 배치(batch)를 생성한다. 전체 데이터 크기 N인 경 우, 다음과 같은 배치들이 N-n개가 생성된다.
[ M(-N+1), M(-N+2), M(-N+3), ..., M(-N+n) ], M(-N+n+1 )
[ M(-N+2), M(-N+3), M(-N+4), ..., M(-N+n+1) ], M(-N+n+2)
...
[ M(-n-1), M(-n), M(-n+1) , ..., M(-2) ], M(-1)
[ M(-n), M(-n+1), M(-n+2), ..., M(-1) ], M(0)
위와 같이, N개의 연속된 시계열 데이터(증분 데이터)를 배치 크기 n+1로 하나의 세트를 구성하되, 순차적으로 세트를 구성하여 일련의 N-n개의 배치 세트를 구성한다. 이때, 각 배치 세트의 마지막 데이터를 해당 세트의 결과 값(진짜 값)으 로 설정한다. 즉, 각 배치는 n개의 과거 주가 데이터 세트와, 해당 세트일 때의 익 일 주가(예측할 주가의 진짜 주가)(정답인 주가)로 구성된다.
그리고 예측신경망 관리부(33)는 각 배치 세트를 하나의 학습 데이터로 하여, LSTM 신경망을 학습시킨다. 학습 후, 다음날 하루 가격(또는 한달 또는 한주의 가격 등)을 예측하여 주식 투자자가 주식을 판매할 것인지 구매할 것인지 결정할 수 있다.
특히, 예측신경망 관리부(33)는 주식 또는 경제 지표를 예측하기 위해 데이 터 세트(또는 배치 세트)를 정규화한다. 바람직하게는, 훈련 데이터와 훈련 데이터를 검증하는 테스트 데이터 세트를 9:1 비율로 나눈다. 즉, 훈련 세트는 데이터 세트의 90%로 설정하고, 테스트 세트는 데이터 세트의 10%로 설정한다. 이러한 비율은 미래에 예측할 주식 또는 경제지표에 따라 해당 비율은 달라질 수 있다.
구체적인, 학습 방법에 대한 슈도우 코드가 도 6에 도시되고 있다.
도 11에서 ① 부분은 csv 파일을 사용하기 위한 pandas, 행렬연산을 위한 numpy, 데이터 시각화를 위한 matplotlib.pyplot, 딥러닝 모델을 작성을 위해 Keras를 사용하였다. ③ 윈도우 사이즈가 20개 단위로 분석하며 20의 의미는 20개 씩 데이터를 분석 후 한 개의 데이터를 예측한다. ④ Sequential()이라는 함수를 사용하여 원도우 사이즈 20개 중 트레이닝 셋(training set)은 90%로 정하고, 나머 지 10%는 테스트 셋(test set)으로 정한다.
도 11에서는 NASDAQ 주가지수 예측을 트레이닝 셋(training set)와 테스트 셋(test set)으로 나눠서 학습시킨다.
다음으로, 주가및지표 예측부(34)는 최근 데이터 세트(셋)를, 학습된 LSTM 신 경망(또는 예측용 신경망)에 입력하여, 해당 데이터의 예측값을 획득한다. 즉, 주가예측용 신경망을 이용하여 주가를 예측하고, 지표예측용 신경망으로 거시지표를 예측한다.
최근 데이터 세트(또는 배치)는 다음과 같다.
[ M(-n+1), M(-n+2), ..., M(-1), M(0) ]
즉, 최근 데이터 세트는, 최근 날짜 또는 당일 날짜를 포함하여 배치 개수만큼의 최근 시계열 데이터들로 구성된다.
상기 최근 데이터 세트를 LSTM 신경망에 입력시키면, LSTM 신경망은 해당 데 이터의 예측값, 즉, 익일(익월)의 예측값 M(1)을 출력한다. 출력된 M(1)이 해당 데 이터의 예측값이다.
주가및지표 예측부(34)는 각 주가, 및, 각 경제지표에 대하여, 각각 예측값 을 구한다.
도 12은 주가에 대하여, 실제 값과 예측된 결과값을 나타내고 있다. 도 12에 서, 빨간색이 실제 주가 데이터이고, 파란색이 예측한 결과 값을 나타낸다.
다음으로, 보정신경망 관리부(35)는 거시지표를 입력하면 보정치를 출력하는 DNN(Deep Neural Network) 신경망을 구성하고, DNN 신경망을 학습시킨다. 한편, 보정치를 획득하기 위한 신경망을 보정용 신경망이라 부르기로 한다.
도 13에서 보는 바와 같이, DNN 신경망은 입력 층(input layer), 출력 층(output layer), 및, 은닉 층(hidden layer)로 구성된다. 특히, 은닉 층은 다수의 층으로 구성된다.
이때, DNN 신경망의 입력 층에는 거시지표가 입력되고, 출력 층에는 보정치가 출력된다.
즉, 입력 층에는 일련의 거시지표, 또는 거시지표(경제지표)의 벡터가 입력된다. 바람직하게는, 입력 층에는 거시지표의 정규화 값, 또는 정규화된 거시지표가 입력된다. 일련의 정규화된 거시지표 값들이 벡터를 형성하여, 해당 벡터가 입력 층에 입력된다. 예를 들어, 경제지표 벡터는 환율, 이자율, 통화량, GDP, GDP증가율, 실업률, 물가상승률 등의 정규화 값들로 구성된다.
따라서 거시지표의 개수가 N개이면, 입력 층의 노드는 N개로 구성된다. 그리고 각 노드에는 거시지표의 각각의 정규화 값들이 입력된다.
또한, 바람직하게는, 출력 층은 하나의 노드로 구성되고, 해당 노드의 출력 값은 보정치이다.
한편, 보정신경망 관리부(35)는 거시지표와, 주가의 실제값과 예측값 간의 차이 값을 이용하여, 해당 신경망을 학습시킨다. 주가의 실제값과 예측값 간의 차이 값을 보정치의 라벨 또는 참값으로 활용한다. 또한, 실제값과 예측값은 모두 정규화된 값이고, 예측값은 앞서 LSTM 신경망을 이용한 예측치이다.
도 12에서 보는 바와 같이, 각 시간(또는 시점) 또는 시계열에 따라, 예측된 주가와, 실제 주가를 구할 수 있다. 또한, 해당 시간 또는 시점에서의 거시지표를 구할 수 있다.
도 9의 예에서, 2019-09-01에서, 정규화된 거시지표는 <-0.0390, -0.0541, ..., -0.0027>이고, 나스닥 지수는 0.0223이다. 이 시점에서 나스닥 지수의 예측치를 구할 수 있다. 즉, 앞서 주가를 예측하기 위한 LSTM 신경망을 이용하여 예측할 수 있다.
따라서, 시점(시간) 2019-09-01에서의 거시지표와, 나스닥 지수의 실제값과 예측 간의 차이 값으로 학습 데이터를 사용한다. 즉, 나스닥 지수의 실제값과 예측값 간의 차이 값이 라벨, 즉, 출력의 참값으로 사용한다.
상기와 같이, 과거의 각 시점의 거시지표와, 주가의 실제값과 예측값의 차이를 하나의 세트로 하여, 학습 데이터를 구성할 수 있다. 다수의 세트로 구성된 학습 데이터를 구성하여, 신경망을 학습시킨다.
다음으로, 주가 보정부(36)는 최근 예측된 거시지표를, 학습된 DNN 신경망(또는 보정용 신경망)에 입력하여, 보정치(또는 예측된 보정치)를 획득한다. 이때의 보정치는 익일(또는 익월)의 보정치이다.
즉, 앞서 주가및지표 예측부(34)를 통해, 예측된 거시지표(또는 거시지표의 예측값)이 획득된다. 획득된 거시지표를 보정용 신경망에 입력하여 그 출력, 즉, 보정치를 획득한다.
주가 보정부(36)는 예측된 주가에 보정치로 보정한다. 즉, 주가 보정부(36)는 예측된 주가에 보정치를 합산하여, 최종 주가 예측치를 획득한다.
따라서, LSTM을 통해서 개별 주가를 예측하고, 예측된 주가에 거시지표의 예측값을 반영시킨다. 이를 통해, 기존의 과거 주가 시계열 데이터만 가지고 분석하는 방법보다 예측의 정확도를 높일 수 있다. 특히, 경제 지표의 실제값과 예측값의 차이를 반영함으로써, 경제 지표의 영향을 반영하여 보다 주가를 정확하게 예측할 수 있다.
미국 주식 거래에서의 자동주가 매매 비중은 꾸준히 상승하여 50%이상 정도로 높은 수준이다. 반면, 빈번한 거래 회사로 공식 분류된 회사의 이익 규모는 2010년 이후 급격히 감소한 후 횡보하는 것으로 조사되었지만, 주식거래 수수료 인하가 될 경우 시스템 매매는 더욱 증가할 것으로 추정한다. 시스템 매매는 초단기로 매매를 반복함으로써 이익을 추구한다. 우리나라의 경우 수수료가 거래금액의 0.25%에서 0.3% 이므로 고빈도 매매는 불가능한 수준이다. 하지만, 우리나라도 수수료 인하를 하게 된다면, 자동매매 프로그램으로 인한 거래가 증가될 것으로 기대한다[비특허문헌 10-12].
현재 증권사에서 사용 중인 인공지능 기반 자동트레이딩 시스템은 펀드매니저가 지정해 놓은 60가지의 지표의 조건절들의 조합으로 특정 조건의 수가 많거나 작으면 매매하는 방식으로 진행하기 때문에 딥러닝을 통한 학습 개념이 있는 것은 아니고, 단지 조건을 따지는 연산을 컴퓨터 프로그램이 대신하여 정확하고 빠르게 처리하고 있는 실정이다[비특허문헌 13-15].
인공지능의 예측을 통하여 완벽한 랜덤인 주가를 예측하는 시도는 많이 진행되고 있으며, 기계학습과 반복되는 일정의 패턴을 찾는 것을 알고리즘이 대신하게 되면 기존의 펀드매니저의 일들을 인공지능이 대신하게 될 것으로 기대한다. 또한 사람은 감정에 사로잡혀 하락장에서 상승을 예측하기 어렵기 때문에 손실 매도하는 경우 빈번히 발생하지만 시스템으로 감정을 배제한 체 매매를 진행하게 된다면, 진정한 시스템 트레이딩으로 인한 손실을 줄일 수 있고, 건전한 주식 투자 문화가 정착될 것으로 기대한다.
이상, 본 발명자에 의해서 이루어진 발명을 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
10 : 사용자 단말 30 : 주가예측 서버
31 : 데이터 수집부 32 : 데이터 정규화부
33 : 예측신경망 관리부 34 : 주가및지표 예측부
35 : 보정신경망 관리부 36 : 주가 보정부
40 : 데이터베이스 50 : 주가정보 서버
60 : 지표정보 서버

Claims (8)

  1. 딥러닝과 경제 지표 기반 주가 예측 시스템에 있어서,
    주가 정보 및 경제 지표를 시계열 데이터로서 수집하는 데이터 수집부;
    각 주가 및 경제지표 각각을 위한 신경망(이하 예측용 신경망)을 학습시키는 예측신경망 관리부;
    학습된 예측용 신경망으로 주가 및 경제지표 각각을 예측하는 주가및지표 예측부;
    보정치를 위한 신경망(이하 보정용 신경망)을 학습시키는 보정신경망 관리부; 및,
    학습된 보정용 신경망으로 보정치를 획득하고, 획득된 보정치를, 예측된 주가에 반영하여 보정하는 주가 보정부를 포함하는 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
  2. 제1항에 있어서, 상기 시스템은,
    상기 시계열 데이터에 대하여 증분을 산출하여 정규화 하는 데이터 정규화부를 더 포함하고,
    상기 예측용 신경망에 이용하는 모든 주가 및 경제지표는, 정규화된 데이터로 이용되는 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
  3. 제2항에 있어서,
    상기 예측신경망 관리부는, 전체 정규화된 증분의 시계열 데이터 M(-N+1),M(-N+2), ....,M(0)로부터 순차적으로 다수의 배치 세트를 생성하되, 배치 크기 n+1로 하나의 세트를 형성하여 일련의 N-n개의 배치 세트를 구성하고, 각 배치 세트는 n개의 과거 데이터 세트와, 해당 세트일 때의 예측 데이터의 정답으로 구성함으로써, 학습 데이터를 생성하는 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
  4. 제2항에 있어서,
    상기 정규화된 증분을 다음 수식 1에 의하여 산출하는 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
    [수식 1]
    Figure pat00007

    단,
    Figure pat00008
    ,
    Figure pat00009
    이고,
    t는 날짜이고, H(t)와 L(t)는 주가 데이터의 각각 t일의 고가와 저가를 나타냄.
  5. 제2항에 있어서,
    상기 보정신경망 관리부는 정규화된 거시지표와, 정규화된 주가의 실제값과 예측값 간의 차이 값을 하나의 학습 데이터로 활용하여, 해당 신경망을 학습시키되, 상기 차이 값을 참값으로 활용하여 학습시키는 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
  6. 제5항에 있어서,
    상기 주가 보정부는 예측된 거시지표를 상기 보정용 신경망에 입력하여 보정치를 획득하고, 획득된 보정치를 예측된 주가에 합산하여 최종적인 주가 예측치를 획득하는 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 예측용 신경망은 DNN(Deep Neural Network) 신경망인 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 보정용 신경망은 LSTM(long short-term memory networks) 신경망인 것을 특징으로 하는 딥러닝과 경제 지표 기반 주가 예측 시스템.
KR1020210076090A 2021-06-11 2021-06-11 딥러닝과 경제 지표 기반 주가 예측 시스템 KR102645528B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210076090A KR102645528B1 (ko) 2021-06-11 2021-06-11 딥러닝과 경제 지표 기반 주가 예측 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210076090A KR102645528B1 (ko) 2021-06-11 2021-06-11 딥러닝과 경제 지표 기반 주가 예측 시스템

Publications (2)

Publication Number Publication Date
KR20220167039A true KR20220167039A (ko) 2022-12-20
KR102645528B1 KR102645528B1 (ko) 2024-03-07

Family

ID=84539036

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210076090A KR102645528B1 (ko) 2021-06-11 2021-06-11 딥러닝과 경제 지표 기반 주가 예측 시스템

Country Status (1)

Country Link
KR (1) KR102645528B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102596740B1 (ko) * 2022-12-23 2023-10-31 중앙대학교 산학협력단 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0895938A (ja) * 1994-09-28 1996-04-12 Nippon Telegr & Teleph Corp <Ntt> 時系列データの学習方法及び時系列データの学習装置
KR20210063769A (ko) * 2019-11-25 2021-06-02 (주)크래프트테크놀로지스 증권 거래를 위한 딥러닝 모델 학습 프로그램과 기록매체
KR20210065790A (ko) * 2019-11-27 2021-06-04 광운대학교 산학협력단 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0895938A (ja) * 1994-09-28 1996-04-12 Nippon Telegr & Teleph Corp <Ntt> 時系列データの学習方法及び時系列データの学習装置
KR20210063769A (ko) * 2019-11-25 2021-06-02 (주)크래프트테크놀로지스 증권 거래를 위한 딥러닝 모델 학습 프로그램과 기록매체
KR20210065790A (ko) * 2019-11-27 2021-06-04 광운대학교 산학협력단 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법

Non-Patent Citations (22)

* Cited by examiner, † Cited by third party
Title
Billah, M., Waheed, S., & Hanifa, A. (2016). Stock market prediction using an improved training algorithm of neural network. 2016 2nd International Conference on Electrical, Computer & Telecommunication Engineering (ICECTE). doi:10.1109/icecte.2016.7879611
Choi, J., & Lee, O. (2014). Correlation Analysis Among the Price of Apartments in Seoul, Stock Market and main Economic Indicators. Journal of Digital Convergence, 12(2), 45-59. doi:10.14400/jdc.2014.12.2.45
Choi, J., Yoo, S., & Kim, J. (2012). Comparative Analysis of Default Risk of Construction Company during Macroeconomic Fluctuations. Korean Journal of Construction Engineering and Management, 13(4), 60-68. doi:10.6106/kjcem.2012.13.4.060
Fear and Greed Index. (2020). https://money.cnn.com/data/fear-and-greed/
Fred Economic Research. (2020). https://fred.stlouisfed.org/graph/?g=w8ko
Ghosh, A., Bose, S., Maji, G., Debnath, N., & Sen, S. (n.d.). Stock Price Prediction Using LSTM on Indian Share Market. doi:10.29007/qgcz
Goodfellow, I., Bengio, Y., Courville, A., & Bengio, Y. (2016). Deep learning (Vol. 1, No. 2). Cambridge: MIT press.
Gyeahyung Jeon,Sun-young Kwon. (2018). A Study on the Influence of Economic Factors on Library Use. Journal of the Korea Convergence Society, 9(11), 299-306.
Heesoo Hwang. (2018). Daily Stock Price Forecasting Using Deep Neural Network Model. Journal of the Korea Convergence Society, 9(6), 39-44.
Hong, S. (2020). A study on stock price prediction system based on text mining method using LSTM and stock market news. The Society of Digital Policy and Management, 18(7), 223??228. https://doi.org/10.14400/JDC.2020.18.7.223
Jeon, S., Hong, B., Kim, J., & Lee, H. (2016). Stock Price Prediction based on Stock Big Data and Pattern Graph Analysis. Proceedings of the International Conference on Internet of Things and Big Data. doi:10.5220/0005876102230231
Joshi, H., Verma, A., & Mishra, A. (2020). Classification of Social Signals Using Deep LSTM-based Recurrent Neural Networks. 2020 International Conference on Signal Processing and Communications (SPCOM). doi:10.1109/spcom50965.2020.9179516
Lee Jong-girl. (2008). A comparative analysis of major macro indicators in five Latin American countries. Latin American and Caribbean Studies 26(2), 83-106
Mao, J., Xu, W., Yang, Y., Wang, J., Huang, Z., & Yuille, A. (2014). Deep captioning with multimodal recurrent neural networks (m-rnn). arXiv preprint arXiv:1412.6632.
Medsker, L. R., & Jain, L. C. (2001). Recurrent neural networks. Design and Applications, 5.
Pascanu, R., Gulcehre, C., Cho, K., & Bengio, Y. (2013). How to construct deep recurrent neural networks. arXiv preprint arXiv:1312.6026.
Qian, Y., Fan, Y., Hu, W., & Soong, F. K. (2014, May). On the training aspects of deep neural network (DNN) for parametric TTS synthesis. In 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 3829-3833). IEEE.
Selvin, S., Vinayakumar, R., Gopalakrishnan, E. A., Menon, V. K., & Soman, K. P. (2017, September). Stock price prediction using LSTM, RNN and CNN-sliding window model. In 2017 international conference on advances in computing, communications and informatics (icacci) (pp. 1643-1647). IEEE.
Tang, J. (2015). The Effect on KOSPI 200 Futures after Launching KOSPI 200 Option. Proceedings of the 2015 International Conference on Industrial Technology and Management Science. doi:10.2991/itms-15.2015.347
Tobin, J. (1998). World economy and financial markets. Japan and the World Economy, 10(3), 377-379. doi:10.1016/s0922-1425(98) 00038-3
Yong Jae Shin. (2018). A Study on Effects of 6th Industry types on the Korean Economy. Journal of the Korea Convergence Society, 9(10), 325-338.
Yongtaek Lim,Heuiseok Lim. (2020). A Comparative Analysis of the Prediction Models for the Direction of Stock Price Using the Online Company Reviews. Journal of the Korea Convergence Society, 11(8), 165-171.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102596740B1 (ko) * 2022-12-23 2023-10-31 중앙대학교 산학협력단 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법

Also Published As

Publication number Publication date
KR102645528B1 (ko) 2024-03-07

Similar Documents

Publication Publication Date Title
Hosaka Bankruptcy prediction using imaged financial ratios and convolutional neural networks
Chen et al. A hybrid approach for portfolio selection with higher-order moments: Empirical evidence from Shanghai Stock Exchange
Chen et al. An intelligent pattern recognition model for supporting investment decisions in stock market
US7529703B2 (en) Method and system for artificial neural networks to predict price movements in the financial markets
WO2011091054A1 (en) Computing trading strategies for portfolio management and associated probability distributions for option pricing
Qin et al. Linear and nonlinear trading models with gradient boosted random forests and application to Singapore stock market
Liang et al. The analysis of global RMB exchange rate forecasting and risk early warning using ARIMA and CNN model
Aycel et al. A new moving average approach to predict the direction of stock movements in algorithmic trading
US20190180376A1 (en) Financial Correlation Prediction System and the Method Thereof
Albahli et al. An improved DenseNet model for prediction of stock market using stock technical indicators
Akyildirim et al. Forecasting high‐frequency excess stock returns via data analytics and machine learning
KR102645528B1 (ko) 딥러닝과 경제 지표 기반 주가 예측 시스템
Tang Application of Nonlinear Autoregressive with Exogenous Input (NARX) neural network in macroeconomic forecasting, national goal setting and global competitiveness assessment
Kim Adaptive trading system integrating machine learning and back-testing: Korean bond market case
KR102614595B1 (ko) 실시간 거시지표 예측 기반 주가 예측 시스템
Prime Forecasting the changes in daily stock prices in Shanghai stock exchange using neural network and ordinary Least Squares regression
AU2020103525A4 (en) IUML- Stock Prices Predictor: Intelligent Stock Prices Predictor Using Machine Learning
KR102355255B1 (ko) Lstm 신경망과 텍스트 마이너를 이용한 주가 실시간 예측 시스템
Grądzki et al. Is attention all you need for intraday Forex trading?
Maddodi Stock Market Forecasting: A Review of Literature
EP3739517A1 (en) Image processing
Jonáková et al. POWER PURCHASE STRATEGY OF RETAIL CUSTOMERS UTILIZING ADVANCED CLASSIFICATION METHODS.
Efat et al. Trend estimation of stock market: an intelligent decision system
Zouaghia et al. A novel AutoCNN model for stock market index prediction
Emamverdi et al. FORECASTING THE TOTAL INDEX OF TEHRAN STOCK EXCHANGE.

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant