KR102329232B1 - 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법 - Google Patents

기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법 Download PDF

Info

Publication number
KR102329232B1
KR102329232B1 KR1020190154932A KR20190154932A KR102329232B1 KR 102329232 B1 KR102329232 B1 KR 102329232B1 KR 1020190154932 A KR1020190154932 A KR 1020190154932A KR 20190154932 A KR20190154932 A KR 20190154932A KR 102329232 B1 KR102329232 B1 KR 102329232B1
Authority
KR
South Korea
Prior art keywords
index
stock price
interest
item
data
Prior art date
Application number
KR1020190154932A
Other languages
English (en)
Other versions
KR20210065790A (ko
Inventor
이기훈
박덕영
Original Assignee
광운대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광운대학교 산학협력단 filed Critical 광운대학교 산학협력단
Priority to KR1020190154932A priority Critical patent/KR102329232B1/ko
Publication of KR20210065790A publication Critical patent/KR20210065790A/ko
Application granted granted Critical
Publication of KR102329232B1 publication Critical patent/KR102329232B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

본 발명의 실시예에 따른 프로세서 및 메모리를 포함하는 컴퓨팅 디바이스에 의해 수행되는 주가 예측 방법은, 상기 프로세서가, 예측하고자 하는 테마주와 관련된 관심종목의 주가에 대한 주가 데이터 및 상기 관심종목에 대한 기사 데이터를 수집하는 단계, 상기 주가 데이터를 이용하여 상기 관심종목의 기술적 지표를 계산하는 단계, 상기 기사 데이터에 포함된 단어들을 분석하여, 분석된 단어들을 기초로 상기 관심종목의 감성 지표를 계산하는 단계 및 상기 계산된 기술적 지표 및 감성 지표를 고려하여 상기 관심종목의 주가를 예측하는 단계를 포함할 수 있다.

Description

기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법{Apparatus and method for predicting stock price based on technical indicator and sentiment indicator}
본 발명은 기술적 지표 및 감성 지표를 기반으로 테마주의 주가를 예측하는 주가 예측 장치 및 방법에 관한 것이다.
주식시장에서 특정 주제에 대한 뉴스가 발생하면 공통적으로 주가가 반응하는 기업들이 있다. 이러한 기업들을 현상의 원인이 되는 특정 주제로 묶어 테마주라고 한다.
최근에는 미사일 발사 실험, 북미 회담 등과 같은 북한 관련 뉴스가 빈번히 발생하고 있어서 테마주 중에서도 대북주가 주목받고 있다.
테마주 투자는 단기간에 높은 수익을 거둘 수 있으나 손실의 위험도 크며 특히 개인투자자는 주가 예측 실패로 인해 수익보다 손실을 보는 경우가 많다.
최근 온라인 뉴스와 기술적 지표를 활용한 주가예측이 연구되고 있지만, 투자 위험이 큰 테마주에 대한 연구는 부족한 한계점이 있다.
본 발명은 상기 전술한 종래의 문제점을 해결하기 위해, 테마주에 속한 기업들의 기술적 지표와, 장중에 발생한 뉴스를 딥러닝 기반 감성분석을 통해 산출되는 감성지표를 이용하여 테마주에 속한 개별 기업의 주가를 보다 정확하게 예측할 수 있도록 하는 주가 예측 장치 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 프로세서 및 메모리를 포함하는 컴퓨팅 디바이스에 의해 수행되는 주가 예측 방법은, 상기 프로세서가, 예측하고자 하는 테마주와 관련된 관심종목의 주가에 대한 주가 데이터 및 상기 관심종목에 대한 기사 데이터를 수집하는 단계, 상기 주가 데이터를 이용하여 상기 관심종목의 기술적 지표를 계산하는 단계, 상기 기사 데이터에 포함된 단어들을 분석하여, 분석된 단어들을 기초로 상기 관심종목의 감성 지표를 계산하는 단계 및 상기 계산된 기술적 지표 및 감성 지표를 고려하여 상기 관심종목의 주가를 예측하는 단계를 포함할 수 있다.
또한, 상기 감성 지표를 계산하는 단계는, 상기 기사 데이터를 단어별로 구분하는 단계, 상기 구분된 단어들 중 미리 정해진 적어도 하나의 품사에 해당하는 제거 대상 단어는 제거하는 단계, 상기 제거 대상 단어가 제거된 단어들을 워드 임베딩(Word Embedding)하여 상기 단어들 각각을 단어 벡터로 변환하는 단계, 상기 단어 벡터들을 신경망 모델에 입력함에 따라 상기 관심종목의 감성 지표 값을 출력하는 단계를 더 포함할 수 있다.
또한, 상기 프로세서는 상기 기사 데이터를 시계열적인 정보인 시계열 데이터(Time-series Date)로 수집하고, 상기 단어 벡터들을 신경망 모델에 입력함에 따라 상기 관심종목의 감성 지표 값을 출력하는 단계는, 상기 시계열 데이터를 시계열적인 상태 파라미터에 따라 업데이트 하는 학습 단계를 더 포함할 수 있다.
또한, 상기 신경망 모델은, 상기 단어 벡터들을 입력 받는 단어 벡터 입력부, 복수 개의 논리 게이트(Gate)들을 포함하며, 상기 논리 게이트들에 적용되는 상태 파라미터를 상기 시계열 데이터에 적용함에 따라 상기 시계열 데이터를 업데이트하는 복수의 순환 유닛들, 상기 복수의 순환 유닛들에 의해 출력되는 출력 값의 분포를 정규화시키는 배치 정규화부 및 상기 배치 정규화된 출력 값을 시그모이드(Sigmoid) 함수를 통해 상기 감성 지표 값을 출력하는 감성 지표 출력부를 더 포함할 수 있다.
또한, 상기 관심종목의 주가를 예측하는 단계는, 상기 관심종목에 대한 복수의 기술적 지표들 및 상기 감성 지표 값을 지표 벡터로 변환하는 단계 및 변환된 지표 벡터를 기초로 주가 예측 모델을 이용하여 상기 관심 종목의 주가를 예측하기 위한 예측 값을 출력하는 단계를 더 포함할 수 있다.
또한, 상기 주가 예측 모델은, 상기 지표 벡터를 입력 받는 지표 벡터 입력부 및 상기 관심 종목의 주가를 예측하기 위한 이진 노드들을 이용하여 수행되는 이진 탐색을 통해 의사 결정 결과값을 출력하는 의사 결정 결과값 출력부를 더 포함할 수 있다.
또한, 상기 지표 벡터 입력부는, 상기 지표 벡터를 입력 받는 제1 입력부 및 상기 지표 벡터에 상기 지표 벡터를 이용하여 출력된 의사 결정 결과값을 기초로 상기 의사 결정 결과값의 오류에 대한 오류 정보가 반영된 지표 벡터를 입력 받는 제2 입력부를 더 포함할 수 있다.
또한, 상기 주가 데이터는, 상기 테마주에 속하는 복수의 기업별 시가, 고가, 저가, 종가, 거래량과 관련된 데이터 중 적어도 하나를 포함할 수 있다.
상기 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 프로세서 및 메모리를 포함하는 주가 예측 장치는, 상기 프로세서가, 예측하고자 하는 테마주와 관련된 관심종목의 주가에 대한 주가 데이터 및 상기 관심종목에 대한 기사 데이터를 수집하는 단계, 상기 주가 데이터를 이용하여 상기 관심종목의 기술적 지표를 계산하는 단계, 상기 기사 데이터에 포함된 단어들을 분석하여, 분석된 단어들을 기초로 상기 관심종목의 감성 지표를 계산하는 단계 및 상기 계산된 기술적 지표 및 감성 지표를 고려하여 상기 관심종목의 주가를 예측하는 단계를 수행할 수 있다.
본 발명의 실시예에 따른 주가 예측 장치 및 방법은, 테마주에 속한 기업들의 기술적 지표와, 장중에 발생한 뉴스를 딥러닝 기반 감성분석을 통해 산출되는 감성지표를 이용함으로써, 테마주에 속한 개별 기업의 주가를 보다 정확하게 예측할 수 있는 효과가 있다.
도1은 본 발명의 일 실시예에 따른 주가 예측 장치의 구성을 개략적으로 도시한 블록도이다.
도2는 본 발명의 일 실시예에 따른 주가를 예측하기 위한 프로세서의 구성을 개략적으로 도시한 블록도이다.
도3은 본 발명의 일 실시예에 따른 프로세서가 주가를 예측하기 위해 수행하는 동작 개념을 설명하기 위해 도시한 블록도이다.
도4는 본 발명의 일 실시예에 따라 기술적 지표 계산부로부터 계산되는 기술적 지표를 나타낸 것이다.
도5는 본 발명의 일 실시예에 따른 감정 지표를 출력하기 위한 신경망 모델의 구성을 개략적으로 나타낸 도면이다.
도6은 본 발명의 일 실시예에 따라 기술적 지표 및 감성 지표를 이용하여 테마주의 주가를 예측하기 위한 주가 예측 모델을 나타낸 것이다.
도7은 본 발명의 일 실시예에 따른 주가 예측 방법을 시간의 흐름에 따라 도시한 흐름도이다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계 없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 “포함” 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 “...부”, “...기”, “모듈”, “블록”등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로구현될 수 있다.
이하, 본 발명의 일 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략할 수 있다.
이하에서는 본 발명의 실시예에 따른 주가 예측 장치 및 방법의 구성을 관련된 도면을 참조하여 상세히 설명한다. 본 발명의 주가 예측 장치 및 방법은 테마에 대한 온라인 뉴스와 기술적 지표를 이용하여 주가를 예측할 수 있다. 테마주에 속한 기업들은 동일한 뉴스에 공통적으로 반응하는 특징이 잇으므로 하나의 뉴스 데이터 세트로 다수 기업의 주가를 예측할 수 있다. 특히, 개별 기업의 주가 흐름을 반영하는 기술적 지표를 추가로 이용하면 개별 기업의 주가를 보다 정확하게 예측할 수 있다.
본 발명의 주가 예측 장치 및 방법은 특정 이슈와 관련된 뉴스와 기업별 기술적 지표를 이용하여 상기 특정 이슈 관련 기업의 당일 시가대비 종가의 등락을 예측할 수 있다. 장중에 발생한 뉴스를 딥러닝 기반 감성분석을 통해 감성지표로 가공한 후, 감성지표와 기술적 지표를 취합한 데이터를 이용하여 주가 등락을 예측할 수 있다. 본 발명의 일 실시예에 따른 주가 예측 장치는 대북주 기업의 주가 등락을 예측할 수 있다.
도1은 본 발명의 일 실시예에 따른 주가 예측 장치의 구성을 개략적으로 도시한 블록도이다. 본 발명의 주가 예측 장치(10)는 도1에 도시된 바와 같이 통신 모듈(100), 프로세서(200), 및 메모리(300)를 포함하는 컴퓨팅 디바이스로 구현될 수 있다.
통신 모듈(100)은 주가 예측 장치(10)와 외부 전자 장치(예: 전자 장치(컴퓨팅 장치), 또는 서버간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(100)은 프로세서(200)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시예에 따르면, 통신 모듈(300)은 무선 통신 모듈 (예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(Global Navigation Satellite System) 통신 모듈) 또는 유선 통신 모듈 (예: LAN(Local Area Network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(예: 블루투스, WiFi direct 또는 IrDA(Infrared Data Association) 같은 근거리 통신 네트워크) 또는 제 2 네트워크 (예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부 전자 장치와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성 요소(예: 단일 칩)으로 통합되거나, 또는 서로 별도의 복수의 구성 요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈은 가입자 식별 모듈에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크 또는 제 2 네트워크와 같은 통신 네트워크 내에서 주가 예측 장치를 확인 및 인증할 수 있다.
프로세서(200)는 예를 들면, 소프트웨어(예: 프로그램)를 실행하여 프로세서(200)에 연결된 전자 장치의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)을 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시 예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(200)는 다른 구성요소(예: 센서 모듈 또는 통신 모듈)로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드하고, 휘발성 메모리에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리에 저장할 수 있다. 일 실시 예에 따르면, 프로세서(200)는 메인 프로세서 (예: 중앙 처리 장치 또는 어플리케이션 프로세서), 및 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 추가적으로 또는 대체적으로, 보조 프로세서는 메인 프로세서보다 저전력을 사용하거나, 또는 지정된 기능에 특화되도록 설정될 수 있다.
메모리(300)는, 컴퓨팅 장치(10)인 주가 예측 장치의 적어도 하나의 구성요소(예: 프로세서(200) 또는 센서모듈)에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(300)는, 휘발성 메모리 또는 비휘발성 메모리를 포함할 수 있다
도2는 본 발명의 일 실시예에 따른 주가를 예측하기 위한 프로세서의 구성을 개략적으로 도시한 블록도이고, 도3은 본 발명의 일 실시예에 따른 프로세서가 주가를 예측하기 위해 수행하는 동작 개념을 설명하기 위해 도시한 블록도이다. 이하에서는, 도2와 도3을 함께 참조하여 본 발명의 주가 예측 장치의 동작 원리를 설명하도록 한다.
본 발명의 실시예에 따른 프로세서(200)는 수집부(220), 지표 계산부(240) 및 주가 예측부(260)를 포함할 수 있다. 그리고, 본 발명의 실시예에 따른 지표 계산부(240)는 기술적 지표 계산부(242), 및 감성 지표 계산부(244)를 더 포함할 수 있다.
수집부(220)는 예측하고자 하는 테마주와 관련된 관심종목의 주가에 대한 주가 데이터 및 관심종목에 대한 기사 데이터를 수집할 수 있다. 여기서, 상기 주가 데이터 및 기사 데이터는 시간의 흐름에 따라 계속해서 생성되는 시계열적인 정보일 수 있다.
예컨대, 본 실시예에 따른 주가 예측 장치는, 북한 관련 뉴스에 따른 기사 데이터를 수집하여 대북관련주의 주가를 예측하는 것으로 가정하여 설명한다.
본 실시예에서 수집부(220)는 대북 관련주에 속하는 복수의 기업들별 시가, 고가, 저가, 종가, 거래량에 대한 데이터 중 적어도 하나인 주가 데이터를 수집할 수 있다.
또한, 수집부(220)는 장중 발생한 대북 관련 뉴스 기사를 수집함에 따라 상기 기사 데이터를 수집할 수 있다. 이때, 수집부(220)는 뉴스 기사를 수집하는데 보수 언론과 진보 언론으로부터 보도되는 뉴스 기사를 모두 수집하여 뉴스의 감성이 편향되지 않도록 할 수 있다.
기술적 지표 계산부(242)는 수집부(220)로부터 수집된 시계열적인 주가 정보들을 포함하는 주가 데이터를 이용하여 대북관련주의 기술적 지표를 계산할 수 있다.
본 실시예에 따른 기술적 지표 계산부(242)는 기술적 지표 중 하나로 주가 데이터를 이용하여 전일 종가대비 당일 시가 변화율을 계산할 수 있다. 여기서, 전일 종가대비 당일 시가 변화율은 아래 <수학식1>을 이용하여 도출할 수 있다.
Figure 112019122648692-pat00001
여기서, Ot는 t일(day)의 시가를 의미하고, Ct-1은 t-1일(day)의 종가를 의미한다.
또한, 본 발명의 기술적 지표 계산부(242)는 상기와 같이 전일 종가대비 당일 시가 변화율 외에도 다른 기술적 지표들을 계산할 수 있다. 예를 들어, 기술적 지표 계산부(242)가 계산하는 기술적 지표들은 추세지표(Directional Movement Index, DMI), 상대강도지수(Relative Strength Index, RSI), 모멘텀(Momentum), 커머더티 채널 인덱스(Commodity Channel Index, CCI), 볼린저 밴드(Bollinger Band)의 고가, 저가, 중가, 이동평균수렴 확산지수(Moving Average Convergence & Divergence, MACD) 등이 있을 수 있다. 도4는 본 발명의 일 실시예에 따라 기술적 지표 계산부(242)로부터 계산되는 기술적 지표를 나타낸 것이다.
본 실시예에서 기술적 지표 계산부(242)는 도4에서 전일 종가대비 당일 시가 변화율 외에 다른 기술적 지표들은 기술적 분석 라이브러리(Technical Analysis Library, Ta-Lib) 알고리즘을 이용하여 계산할 수 있다. 일 실시예에 따르면, 기술적 지표 계산부(242)는 전일 종가대비 당일 시가 변화율을 제외한 다른 모든 기술적 지표는 전일의 기술적 지표를 사용하여 계산할 수 있다.
일 실시예에 따른 기술적 지표 계산부(242)는 도4와 같이 계산한 기술적 지표들 각각을 최소-최대(min-max) 정규화를 이용하여 기술적 지표를 0과 1 사이의 값으로 변환할 수 있다.
그리고, 감성 지표 계산부(244)는 수집부(220)로부터 수집된 시계열적인 기사 데이터에 포함된 단어들을 분석하여, 분석된 단어들을 기초로 대북관련주의 감성 지표를 계산할 수 있다.
보다 구체적으로 설명하면, 본 실시예에 따른 감성 지표 계산부(244)는 대북관련주와 관련된 뉴스 기사를 단어별로 구분하여 분할하고, 이렇게 구분된 단어들을 대상으로 형태소 분석을 하여, 상기 구분된 단어들 중 예컨대, 기호, 숫자, 접사, 부사, 의존명사와 같은 제거 대상 단어는 제거할 수 있다. 예컨대, 감성 지표 계산부(244)는 Mecab 알고리즘을 이용하여 뉴스 기사에 속하는 단어들을 대상으로 형태소 분석을 수행할 수 있다.
그리고, 감성 지표 계산부(244)는 상기와 같이 기호, 숫자, 접사, 부사, 의존명사 등과 같은 제거 대상 단어를 제거하고 남은 단어들을 워드 임베딩(Word Embedding) 알고리즘을 이용하여 각각을 단어 벡터로 변환할 수 있다. 예컨대, 감성 지표 계산부(244)는 Word2Vec의 skip-gram 알고리즘을 이용하여 선별된 단어를 단어 벡터로 변환할 수 있다.
본 발명의 일 실시예에 따라 감성 지표 계산부(244)로부터 변환된 단어 벡터의 크기는 450 내지 550이고, 윈도우의 크기는 2 내지 4, 학습 횟수는 25 내지 35, 최소 빈도수는 5로 설정하여 학습함에 따라 단어 벡터로 변환할 수 있다. 감성 지표 계산부(244)는 효율적인 학습을 위해 학습률은 2x10-3부터 시작하여 2x10-4까지 선형 감소되도록 설정할 수 있다. 감성 지표 계산부(244)는 단어 벡터 시퀀스의 길이를 맞추기 위해 제로 패딩(zero padding)을 이용할 수 있다.
예컨대, 감성 지표 계산부(244)는 뉴스 기사의 제목의 단어를 단어 벡터로 변환하는 것일 수 있다.
이에 따라, 감성 지표 계산부(244)는 도3에서 예측 모델링 단계에서 단어 벡터의 시퀀스(sequence)로 표현된 뉴스 제목을 입력으로 하는 신경망 모델을 이용하여 대북관련주의 감성지표를 계산할 수 있다.
도5는 본 발명의 일 실시예에 따른 감정 지표를 출력하기 위한 신경망 모델의 구성을 개략적으로 나타낸 도면이다.
본 발명의 실시예에 따른 신경망 모델은 단어 벡터 입력부(52), 순환 유닛들(54), 배치 정규화부(56), 및 감성 지표 출력부(58)를 포함하여 구성될 수 있다.
본 실시예에 따른 단어 벡터 입력부(52)는 상기 워드 임베딩 알고리즘을 통해 생성된 단어 벡터들을 입력 받을 수 있다. 여기서, 상기 단어 벡터는 단어 벡터 시퀀스일 수 있다.
그리고, 각 순환 유닛(54)은 복수 개의 논리 게이트(Gate)들을 포함하여, 논리게이트들에 적용되는 상태 파라미터를 시계열 데이터인 단어 벡터에 적용함에 따라 상기 시계열적으로 입력되는 단어 벡터를 업데이트할 수 있다. 일 실시예에 따른 순환 유닛은 Gated Recurrent unit일 수 있으며, 본 발명의 신경망 모델은 순환 신경망(RNN) 중 LSTM(Long Short Term Memory)의 일 종류인 GRU로 구성될 수 있다.
배치 정규화부(56)는 상기 복수의 순환 유닛들에 의해 출력되는 출력 값의 분포를 정규화시킬 수 있다. 일 실시예에 따른 도5를 참고하면, 본 발명의 감성 지표 계산부는 순환 유닛들을 통해 출력되는 출력 값을 2개의 배치 정규화 층과 2개의 완전 연결층(ReLU)을 통과시킬 수 있다.
그리고, 감성 지표 출력부(58)는 상기 배치 정규화 층들과 완전 연결 층들을 포함하는 배치 정규화부에 의해 배치 정규화된 출력 값을 시그모이드(Sigmoid) 함수를 통해 감성 지표 값을 출력할 수 있다. 여기서, 감성 지표 출력부(58)가 출력하는 감성 지표 값은 0과 1 사이의 값으로 출력될 수 있고, 0에 가까운 값일수록 주가가 떨어질 것으로 예측할 수 있는 부정적인 값이고, 1에 가까운 값일 수록 주가가 상승할 것으로 예측할 수 있는 긍정적인 값일 수 있다.
예컨대, 감성 지표 계산부(244)가 감성 지표를 출력하기 위해 신경망 모델을 통해 학습하는 횟수는 60 내지 80회일 수 있고, GRU의 은닉 상태의 크기는 400 내지 600으로 설정될 수 있다. 감성 지표 계산부(244)는 효율적인 학습을 위해 신경망 모델의 학습률의 초기값을 2x10-3으로 설정할 수 있고, 지수적 감쇠(Exponential Decay)를 적용할 수 있다.
다시 도2 및 도3을 참조하면, 본 발명의 실시예에 따른 주가 예측부(260)는 기술적 지표 계산부(242) 및 감성 지표 계산부(244)로부터 계산된 기술적 지표 및 감성 지표를 고려하여 대북관련주의 주가를 예측할 수 있다.
주가 예측부(260)는 복수개의 기술적 지표와 적어도 하나의 감성 지표를 하나의 지표 벡터로 취합하고, 취합된 지표 벡터를 기초로 주가 예측 모델을 이용하여 테마주의 주가를 예측하기 위한 예측 값을 출력할 수 있다. 도6은 본 발명의 일 실시예에 따라 기술적 지표 및 감성 지표를 이용하여 테마주의 주가를 예측하기 위한 주가 예측 모델을 나타낸 것이다.
도6을 참조하면, 본 발명의 실시예에 따른 주가 예측 모델은, 상기 지표 벡터를 입력 받는 지표 벡터 입력부, 및 대북관련주(테마주)의 주가를 예측하기 위한 이진 노드(이진 트리)들을 이용하여 수행되는 이진 탐색을 통해 의사 결정 결과값을 출력하는 의사 결정 결과값 출력부를 포함하여 구성될 수 있다.
본 실시예에 따른 지표 벡터 입력부는, 도6에 도시된 바와 같이 제1 입력부(62) 내지 제n 입력부(68)(여기서, n은 3 이상의 자연수)를 포함하여 구성될 수 있다.
일 실시예에 따른 제1 입력부(62)는 입력 데이터(61)인 지표 벡터를 샘플링한 샘플링된 데이터를 제1 이진 트리(63)의 이진 노드에 입력하고, 이렇게 제1 이진 트리(63)를 구성하는 이진 노드들을 통과하여 출력되는 의사 결정 결과값(64)을 다음 제2 입력부(65)로 전달할 수 있다.
보다 구체적으로 설명하면, 제2 입력부(65)는 제1 이진 트리(63)에 의해 출력된 의사 결정 결과값에 대한 오류 정보 및 상기 제1 입력부(62)에서 샘플링된 데이터를 전달 받아, 다시 샘플링하여 제2 이진 트리(66)로 입력할 수 있다.
상술한 바와 같은 원리로, 제n 이진 트리(69)가 제n 의사 결정 결과값을 출력하면 최종 출력부(71)는 상기 제1 내지 제n 의사 결정 결과값에 서로 다른 가중치를 적용하여 합산함에 따라 주가 예측 값을 산출할 수 있다.
여기서, 주가 예측 값은 0 또는 1의 논리 값으로 출력될 수 있고, 0은 주가가 하락하는 것을 의미하고, 1은 주가가 상승하는 것을 의미할 수 있다.
예컨대, 본 발명의 주가 예측 모델은 Gradient boosting 알고리즘의 XGboost일 수 있고, XGboost의 최대 깊이는 2 내지 4, 학습률은 2x10-3, Minimum Child Weight는 2 내지 4로 설정할 수 있다.
도7은 본 발명의 일 실시예에 따른 주가 예측 방법을 시간의 흐름에 따라 도시한 흐름도이다.
먼저, S710 단계에서 수집부는 예측하고자 하는 테마주와 관련된 관심종목의 주가에 대한 주가 데이터 및 관심종목에 대한 기사 데이터를 수집할 수 있다.
그리고, S720 단계에서 기술적 지표 계산부는 수집부로부터 수집된 시계열적인 주가 정보들을 포함하는 주가 데이터를 이용하여 테마주의 기술적 지표를 계산할 수 있다.
그리고, S730 단계에서 감성 지표 계산부는 수집된 시계열적인 기사 데이터에 포함된 단어들을 분석하여, 분석된 단어들을 기초로 테마주의 감성 지표를 계산할 수 있다.
그리고, S740 단계에서 주가 예측부(260)는 기술적 지표 계산부(242) 및 감성 지표 계산부(244)로부터 계산된 기술적 지표 및 감성 지표를 고려하여 대북관련주의 주가를 예측할 수 있다.
이상에서 설명한 본 발명의 실시예를 구성하는 모든 구성요소들이 하나로 결합하거나 결합하여 동작하는 것으로 기재되어 있다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한, 이와 같은 컴퓨터 프로그램은 USB 메모리, CD 디스크, 플래쉬 메모리 등과 같은 컴퓨터가 읽을 수 있는 기록매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 기록매체로서는 자기 기록매체, 광 기록매체 등이 포함될 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
10: 주가 예측 장치
100: 통신 모듈
200: 프로세서
220: 수집부
242: 기술적 지표 계산부
244: 감성 지표 계산부
260: 주가 예측부
300: 메모리

Claims (14)

  1. 프로세서 및 메모리를 포함하는 컴퓨팅 디바이스에 의해 수행되는 주가 예측 방법으로서,
    상기 프로세서가, 예측하고자 하는 테마주와 관련된 관심종목의 주가에 대한 주가 데이터 및 상기 관심종목에 대한 기사 데이터를 수집하는 단계;
    상기 주가 데이터를 이용하여 상기 관심종목의 기술적 지표를 계산하는 단계;
    상기 기사 데이터에 포함된 단어들을 분석하여, 분석된 단어들을 기초로 상기 관심종목의 감성 지표를 계산하는 단계; 및
    상기 계산된 기술적 지표 및 감성 지표를 고려하여 상기 관심종목의 주가를 예측하는 단계;를 포함하고,
    상기 관심종목의 주가를 예측하는 단계는, 상기 관심종목에 대한 복수의 기술적 지표들 및 상기 관심종목의 감성 지표 값을 지표 벡터로 변환하는 단계; 및 상기 변환된 지표 벡터를 기초로 주가 예측 모델을 이용하여 상기 관심 종목의 주가를 예측하기 위한 예측 값을 출력하는 단계;를 더 포함하며,
    상기 주가 예측 모델은, 상기 지표 벡터를 입력 받는 지표 벡터 입력부; 및 상기 관심 종목의 주가를 예측하기 위한 이진 노드들을 이용하여 수행되는 이진 탐색을 통해 의사 결정 결과값을 출력하는 의사 결정 결과값 출력부;를 각각 복수 개 포함하고,
    상기 주가 예측 모델은,
    상기 복수의 지표 벡터 입력부 중 선행 지표 벡터 입력부에 상기 지표 벡터가 입력되어 상기 지표 벡터를 샘플링한 선행 샘플링된 데이터를 생성하며, 상기 선행 샘플링된 데이터가 이진 트리의 이진 노드에 입력되고, 상기 이진 트리를 구성하는 이진 노드들을 통과하여 선행 의사 결정 결과값을 상기 의사 결정 결과값 출력부를 통해 출력하고, 상기 선행 샘플링된 데이터 및 상기 선행 의사 결정 결과값에 대한 오류 정보를 후행 지표 벡터 입력부에 전달하며,
    상기 선행 지표 벡터 입력부와 연결된 상기 후행 지표 벡터 입력부에 상기 선행 샘플링된 데이터 및 상기 선행 의사 결정 결과값에 대한 오류 정보가 입력되어 샘플링한 후행 샘플링된 데이터를 생성하며, 상기 후행 샘플링된 데이터가 이진 트리의 이진 노드에 입력되고, 상기 이진 트리를 구성하는 이진 노드들을 통과하여 후행 의사 결정 결과값을 상기 의사 결정 결과값 출력부를 통해 출력하고,
    상기 주가 예측 모델은, 복수의 의사 결정 결과값 출력부 각각에서 출력된 복수의 의사 결정 결과값에 서로 다른 가중치를 적용한 후 합산하여 상기 예측 값을 산출하는 것을 특징으로 하는 주가 예측 방법.
  2. 제1항에 있어서, 상기 감성 지표를 계산하는 단계는,
    상기 기사 데이터를 단어별로 구분하는 단계;
    상기 구분된 단어들 중 미리 정해진 적어도 하나의 품사에 해당하는 제거 대상 단어는 제거하는 단계;
    상기 제거 대상 단어가 제거된 단어들을 워드 임베딩(word embedding)하여 상기 단어들 각각을 단어 벡터로 변환하는 단계; 및
    상기 단어 벡터들을 신경망 모델에 입력함에 따라 상기 관심종목의 감성 지표 값을 출력하는 단계;를 더 포함하는 것을 특징으로 하는 주가 예측 방법.
  3. 제2항에 있어서,
    상기 프로세서는 상기 기사 데이터를 시계열적인 정보인 시계열 데이터(time-series date)로 수집하고,
    상기 단어 벡터들을 신경망 모델에 입력함에 따라 상기 관심종목의 감성 지표 값을 출력하는 단계는, 상기 시계열 데이터를 시계열적인 상태 파라미터에 따라 업데이트 하는 학습 단계를 더 포함하는 것을 특징으로 하는 주가 예측 방법.
  4. 제3항에 있어서, 상기 신경망 모델은,
    상기 단어 벡터들을 입력 받는 단어 벡터 입력부;
    복수 개의 논리 게이트(gate)들을 포함하며, 상기 논리 게이트들에 적용되는 상태 파라미터를 상기 시계열 데이터에 적용함에 따라 상기 시계열 데이터를 업데이트하는 복수의 순환 유닛들;
    상기 복수의 순환 유닛들에 의해 출력되는 출력 값의 분포를 정규화시키는 배치 정규화부; 및
    상기 배치 정규화된 출력 값을 시그모이드(sigmoid) 함수를 통해 상기 감성 지표 값을 출력하는 감성 지표 출력부;를 더 포함하는 것을 특징으로 하는 주가 예측 방법.
  5. 삭제
  6. 삭제
  7. 제2항에 있어서, 상기 지표 벡터 입력부는,
    상기 지표 벡터를 입력 받는 제1 입력부; 및
    상기 지표 벡터에 상기 지표 벡터를 이용하여 출력된 의사 결정 결과값을 기초로 상기 의사 결정 결과값의 오류에 대한 오류 정보가 반영된 지표 벡터를 입력 받는 제2 입력부;를 더 포함하는 것을 특징으로 하는 주가 예측 방법.
  8. 제1항에 있어서,
    상기 주가 데이터는, 상기 테마주에 속하는 복수의 기업별 시가, 고가, 저가, 종가, 거래량과 관련된 데이터 중 적어도 하나를 포함하는 것을 특징으로 하는 주가 예측 방법.
  9. 프로세서 및 메모리를 포함하는 주가 예측 장치에 있어서,
    상기 프로세서가, 예측하고자 하는 테마주와 관련된 관심종목의 주가에 대한 주가 데이터 및 상기 관심종목에 대한 기사 데이터를 수집하는 단계;
    상기 주가 데이터를 이용하여 상기 관심종목의 기술적 지표를 계산하는 단계;
    상기 기사 데이터에 포함된 단어들을 분석하여, 분석된 단어들을 기초로 상기 관심종목의 감성 지표를 계산하는 단계; 및
    상기 계산된 기술적 지표 및 감성 지표를 고려하여 상기 관심종목의 주가를 예측하는 단계;를 수행하며,
    상기 관심종목의 주가를 예측하는 단계는, 상기 관심종목에 대한 복수의 기술적 지표들 및 상기 관심종목의 감성 지표 값을 지표 벡터로 변환하는 단계; 및 상기 변환된 지표 벡터를 기초로 주가 예측 모델을 이용하여 상기 관심 종목의 주가를 예측하기 위한 예측 값을 출력하는 단계;를 더 포함하며,
    상기 주가 예측 모델은, 상기 지표 벡터를 입력 받는 지표 벡터 입력부; 및 상기 관심 종목의 주가를 예측하기 위한 이진 노드들을 이용하여 수행되는 이진 탐색을 통해 의사 결정 결과값을 출력하는 의사 결정 결과값 출력부;를 각각 복수 개 포함하고,
    상기 주가 예측 모델은,
    상기 복수의 지표 벡터 입력부 중 선행 지표 벡터 입력부에 상기 지표 벡터가 입력되어 상기 지표 벡터를 샘플링한 선행 샘플링된 데이터를 생성하며, 상기 선행 샘플링된 데이터가 이진 트리의 이진 노드에 입력되고, 상기 이진 트리를 구성하는 이진 노드들을 통과하여 선행 의사 결정 결과값을 상기 의사 결정 결과값 출력부를 통해 출력하고, 상기 선행 샘플링된 데이터 및 상기 선행 의사 결정 결과값에 대한 오류 정보를 후행 지표 벡터 입력부에 전달하며,
    상기 선행 지표 벡터 입력부와 연결된 상기 후행 지표 벡터 입력부에 상기 선행 샘플링된 데이터 및 상기 선행 의사 결정 결과값에 대한 오류 정보가 입력되어 샘플링한 후행 샘플링된 데이터를 생성하며, 상기 후행 샘플링된 데이터가 이진 트리의 이진 노드에 입력되고, 상기 이진 트리를 구성하는 이진 노드들을 통과하여 후행 의사 결정 결과값을 상기 의사 결정 결과값 출력부를 통해 출력하고,
    상기 주가 예측 모델은, 복수의 의사 결정 결과값 출력부 각각에서 출력된 복수의 의사 결정 결과값에 서로 다른 가중치를 적용한 후 합산하여 상기 예측 값을 산출하는 것을 특징으로 하는 주가 예측 장치.
  10. 제9항에 있어서, 상기 프로세서가 상기 감성 지표를 계산하는 단계는,
    상기 기사 데이터를 단어별로 구분하는 단계;
    상기 구분된 단어들 중 미리 정해진 적어도 하나의 품사에 해당하는 제거 대상 단어는 제거하는 단계;
    상기 제거 대상 단어가 제거된 단어들을 워드 임베딩(word embedding)하여 상기 단어들 각각을 단어 벡터로 변환하는 단계;
    상기 단어 벡터들을 신경망 모델에 입력함에 따라 상기 관심종목의 감성 지표 값을 출력하는 단계;를 더 포함하는 것을 특징으로 하는 주가 예측 장치.
  11. 제10항에 있어서,
    상기 프로세서는 상기 기사 데이터를 시계열적인 정보인 시계열 데이터(time-series date)로 수집하고,
    상기 단어 벡터들을 신경망 모델에 입력함에 따라 상기 관심종목의 감성 지표 값을 출력하는 단계는, 상기 시계열 데이터를 시계열적인 상태 파라미터에 따라 업데이트 하는 학습 단계를 더 포함하는 것을 특징으로 하는 주가 예측 장치.
  12. 제11항에 있어서, 상기 신경망 모델은,
    상기 단어 벡터들을 입력 받는 단어 벡터 입력부;
    복수 개의 논리 게이트(gate)들을 포함하며, 상기 논리 게이트들에 적용되는 상태 파라미터를 상기 시계열 데이터에 적용함에 따라 상기 시계열 데이터를 업데이트하는 복수의 순환 유닛들;
    상기 복수의 순환 유닛들에 의해 출력되는 출력 값의 분포를 정규화시키는 배치 정규화부; 및
    상기 배치 정규화된 출력 값을 시그모이드(sigmoid) 함수를 통해 상기 감성 지표 값을 출력하는 감성 지표 출력부;를 더 포함하는 것을 특징으로 하는 주가 예측 장치.
  13. 삭제
  14. 제1항 내지 제4항, 제7항, 제8항 중 어느 한 항에 따른 주가 예측 방법을 컴퓨터에서 실행시키기 위하여 컴퓨터에서 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
KR1020190154932A 2019-11-27 2019-11-27 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법 KR102329232B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190154932A KR102329232B1 (ko) 2019-11-27 2019-11-27 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190154932A KR102329232B1 (ko) 2019-11-27 2019-11-27 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20210065790A KR20210065790A (ko) 2021-06-04
KR102329232B1 true KR102329232B1 (ko) 2021-11-18

Family

ID=76391954

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190154932A KR102329232B1 (ko) 2019-11-27 2019-11-27 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102329232B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102645528B1 (ko) * 2021-06-11 2024-03-07 백석대학교산학협력단 딥러닝과 경제 지표 기반 주가 예측 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101348817B1 (ko) * 2013-01-11 2014-01-08 연세대학교 산학협력단 인공신경망을 이용한 오류 계측값 추정 방법 및 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120076661A (ko) * 2010-12-09 2012-07-09 한국전자통신연구원 정보자산 관리 장치, 서버, 에이전트 및 방법
KR102105744B1 (ko) * 2017-12-01 2020-05-29 신한금융투자 주식회사 지능형 증권 투자 의사결정 지원 방법 및 그 장치
KR20190098106A (ko) * 2019-08-02 2019-08-21 엘지전자 주식회사 배치 정규화 레이어 트레이닝 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101348817B1 (ko) * 2013-01-11 2014-01-08 연세대학교 산학협력단 인공신경망을 이용한 오류 계측값 추정 방법 및 시스템

Also Published As

Publication number Publication date
KR20210065790A (ko) 2021-06-04

Similar Documents

Publication Publication Date Title
Alexandrov et al. Gluonts: Probabilistic and neural time series modeling in python
WO2019174423A1 (zh) 实体情感分析方法及相关装置
CN110390396B (zh) 用于估计观测变量之间的因果关系的方法、装置和系统
US20190122101A1 (en) Fast neural network implementations by increasing parallelism of cell computations
CN109543190A (zh) 一种意图识别方法、装置、设备及存储介质
KR102161256B1 (ko) 주식 포트폴리오 구성을 위한 주식 종목 선택 장치 및 그 방법
US10902311B2 (en) Regularization of neural networks
US11853877B2 (en) Training transfer-focused models for deep learning
US11366806B2 (en) Automated feature generation for machine learning application
KR102109369B1 (ko) 시계열 데이터의 변화를 예측하고 그 이유를 설명하는 인공지능 시스템
CN110490304B (zh) 一种数据处理方法及设备
US11481707B2 (en) Risk prediction system and operation method thereof
CN112214652B (zh) 一种报文生成方法、装置及设备
KR20220130565A (ko) 키워드 검출 방법 및 장치
KR102329232B1 (ko) 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법
Sasani et al. TM-vector: A novel forecasting approach for market stock movement with a rich representation of twitter and market data
Stankovic et al. Tuned long short-term memory model for ethereum price forecasting through an arithmetic optimization algorithm
US11593633B2 (en) Systems, methods, and computer-readable media for improved real-time audio processing
US20200380405A1 (en) Data exposure for transparency in artificial intelligence
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
JP6612277B2 (ja) ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体
CN113269259B (zh) 一种目标信息的预测方法及装置
CN114254622A (zh) 一种意图识别方法和装置
Pasupulety et al. Feature selection using fast ensemble learning for network intrusion detection
KR102596740B1 (ko) 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant