KR102596740B1 - 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법 - Google Patents

기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법 Download PDF

Info

Publication number
KR102596740B1
KR102596740B1 KR1020220182552A KR20220182552A KR102596740B1 KR 102596740 B1 KR102596740 B1 KR 102596740B1 KR 1020220182552 A KR1020220182552 A KR 1020220182552A KR 20220182552 A KR20220182552 A KR 20220182552A KR 102596740 B1 KR102596740 B1 KR 102596740B1
Authority
KR
South Korea
Prior art keywords
news
euns
economic
uncertainty
economic uncertainty
Prior art date
Application number
KR1020220182552A
Other languages
English (en)
Inventor
노승민
자빈 아이샤
야서 무하마드
야스민 사다프
안사리 샤프디
문지훈
Original Assignee
중앙대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 중앙대학교 산학협력단 filed Critical 중앙대학교 산학협력단
Priority to KR1020220182552A priority Critical patent/KR102596740B1/ko
Application granted granted Critical
Publication of KR102596740B1 publication Critical patent/KR102596740B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법, 이를 수행하는 장치 및 컴퓨터 프로그램은, 경제 불확실성 뉴스(economic uncertainty news)로부터 획득한 심리(sentiment) 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률(stock returns)을 예측함으로써, 주식 수익률의 예측 정확도를 향상시킬 수 있다.

Description

기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법{Method for predicting macroeconomic factors and stock returns in the context of economic uncertainty news sentiment using machine learning}
본 발명은 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법에 관한 것으로서, 더욱 상세하게는 주식 수익률(stock returns)을 예측하는, 방법, 장치 및 컴퓨터 프로그램에 관한 것이다.
오늘날의 글로벌 세계에서, 주식 시장의 성과는 경제적 안정과 성장에 매우 중요하다. 반면에, 주식 시장은 경제 상황과 불확실한 사건에 민감하다. 경제학자들은 주식 시장이 경제 성장의 선행 지표라고 주장한다. 주식 시장이 좋아지면 경제가 계획대로 돌아가고 있음을 나타낸다. 예를 들어, 기존 연구에서는 주식 시장의 자본화로 인해 국가의 경제 성장에 긍정적인 영향을 미쳤다고 지적하고 있다. 또한, 여러 거시경제적 요인, 기업 재무 결과 및 정치적 사건이 주식 시장에 더 큰 영향을 미친다는 연구도 잘 이루어졌다. 마찬가지로 다양한 소셜 미디어 플랫폼(social media platform)의 모든 경제 뉴스는 긍정적이든 부정적이든 주식 시장에 상당한 영향을 미칠 수 있다. 다양한 요인에 따른 주식 시장 예측 및 주식 수익률(stock returns) 분석은 오랫동안 고전적이지만 어려운 연구 분야였으며 경제학자와 컴퓨터 과학자 모두의 관심을 끌었다.
주식 시장의 변동성이 매우 크기 때문에 연구자들은 이러한 움직임을 초래하는 근본적인 요인을 탐구하게 된다. 또한, 투자자는 주식 수익률에 영향을 미치는 주요 요인을 추적해야 한다. 투자자는 포트폴리오에서 최적의 수익을 얻기 위해 중요한 거시경제 지표에 주의를 기울여야 한다. 따라서, 주식 시장 예측은 투자자와 정책 입안자에게 매우 중요하다. 재정적으로 위험한 시장에서는 주식 수익률에 대해 매우 구체적인 예측을 하는 것이 중요하다. 정확한 주식 예측은 시장 발전으로 이어지고, 투자 전략을 안내하며, 최적화된 주식 거래를 향한 길을 밝혀준다. 주식은 모든 경제에서 가장 민감한 자산 중 하나로 간주된다. 주식 시장의 공격적인 변동은 경제에 부정적인 영향을 미칠 수 있다. 이러한 위험의 주요 원인은 시장의 불규칙성, 불확실성 및 변동성이다. 이러한 맥락에서 경제의 변동이 때때로 매우 급격하고 갑작스러워서 주식 시장의 하락으로 이어질 수 있기 때문에 주식 예측은 중요한 작업인 경향이 있다.
보다 구체적으로, 다양하고 복잡한 경제적 요인과 시나리오가 주식 수익률에 영향을 미친다. 연구에 따르면, 금리, 환율, 회사 실적, 정치적 상황, 현재 이벤트, 경제 상황, 시장 심리, 자연 재해, 정부 정책 등 주가에 영향을 미치는 많은 주요 요인이 있다. 거시경제적 변수는 이론적으로 주식 변동성의 주요 원인으로 간주된다. 결과적으로 이러한 요소는 주식 수익률의 주요 지표이다. 이러한 변수는 주가를 불안정하게 만들고 높은 정확도로 예측하기 어렵게 만든다. 기존 문헌에는 주가 예측 작업을 위해 다양한 연구자들이 제안한 많은 접근 방식이 포함되어 있다. 일부 연구 조사에서는 예측을 위해 다양한 주식 시장의 과거 주식 데이터를 사용했다. 그러나, 일부 연구에서는 주식 시장 분석을 수행하기 위해 일반적인 심리, 뉴스 및 특정 이벤트에 대한 심리와 같은 소셜 미디어 분석 정보를 사용하기도 했다. 보다 정확하게는, 이러한 이벤트에는 2019년 코로나바이러스 질병(COVID-19), 영국의 유럽 연합 탈퇴(Brexit) 및 2019년 나이지리아 대통령 선거가 포함된다. 두 가지 접근 방식 모두에서 주식 관련 빅 데이터의 소셜 미디어 기반 분석은 투자자에게 개선된 계획 및 의사 결정을 위해 더 명확성을 제공하기 때문에 지난 몇 년 동안 상당한 주목을 받았다. 이러한 모든 주식 시장 예측 관련 작업은 여러 접근 방식을 사용하여 수행되었다. 정치적이거나 예측할 수 없는 사건이 발생할 때마다 주식 시장에 두 가지 영향을 미친다. 첫째, 이러한 사건들이 향후 경제 및 정치 정책의 원동력이 되기 때문에 경제에 직접적인 영향을 미친다. 이러한 일련의 정책의 결과로 거시경제 지표가 변동하고 주식 시장에 영향을 미친다. 둘째, 이러한 사건에 대한 소셜 미디어의 반응은 소셜 미디어로 촉발된 심리를 통해 주식 시장에 미치는 영향을 가속화한다. 이러한 맥락에서 특수한 상황에서 거시경제 지표와 소셜 미디어 심리가 주가 수익률에 미치는 영향을 살펴보는 것은 불가피하다.
본 발명이 이루고자 하는 목적은, 경제 불확실성 뉴스(economic uncertainty news)로부터 획득한 심리(sentiment) 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률(stock returns)을 예측하는, 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법, 이를 수행하는 장치 및 컴퓨터 프로그램을 제공하는 데 있다.
본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.
상기의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법은, 경제 불확실성(economic uncertainty)에 대한 키워드를 이용하여 경제 불확실성 뉴스 심리(economic uncertainty news sentiment, EUNS) 요인 값을 획득하는 단계; 미리 설정된 복수개의 거시경제적 요인 각각에 대한 거시경제적 요인 값을 획득하는 단계; 및 미리 학습되어 구축된 머신 러닝 기반 예측 모델을 이용하여, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 입력 데이터를 기반으로 주식 수익률(stock returns)을 예측하는 단계;를 포함한다.
여기서, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값 획득 단계는, 경제 불확실성에 대해 미리 설정된 복수개의 상기 키워드를 포함하는 키워드 집합을 이용하여, 상기 키워드가 포함된 게시글 정보를 기반으로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득하는 것으로 이루어질 수 있다.
여기서, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값 획득 단계는, 소셜 미디어 플랫폼(social media platform)에 게시된 글 중에서 상기 키워드가 포함된 게시글을 획득하고, 상기 키워드가 포함된 게시글의 개수 및 상기 키워드가 포함된 게시글의 게시 일자를 포함하는 상기 게시글 정보를 획득하는 것으로 이루어질 수 있다.
여기서, 상기 복수개의 거시경제적 요인은, 금 지수(gold index), 원유 가격(crude oil price), 금리(interest rate) 및 환율(exchange rate)을 포함할 수 있다.
여기서, 상기 주식 수익률 예측 단계는, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 상기 입력 데이터를 상기 예측 모델에 입력하고, 상기 예측 모델의 출력 데이터를 기반으로 상기 주식 수익률을 예측하는 것으로 이루어질 수 있다.
여기서, 상기 예측 모델은, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값, 상기 금 지수, 상기 원유 가격, 상기 금리 및 상기 환율이 입력되는 하나의 입력 레이어(input layer)와 상기 주식 수익률의 예측값이 출력되는 하나의 출력 레이어(output layer)를 포함하고, 상기 입력 레이어와 상기 출력 레이어는 가중 연결(weighted connections)되는 단일-계층(single-layer) 신경망 모델일 수 있다.
여기서, 상기 예측 모델은, 평균 제곱 오차(mean squared error, MSE)를 손실 함수(loss function)로 하여 학습 데이터를 기반으로 미리 설정된 에포크(epoch)동안 반복적인 가중치 최적화 과정을 통해 학습될 수 있다.
여기서, 상기 학습 데이터는, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값, 상기 금 지수, 상기 원유 가격, 상기 금리, 상기 환율 및 상기 주식 수익률 각각에 대한 과거 일별 데이터를 토대로 획득될 수 있다.
상기의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 컴퓨터 프로그램은 컴퓨터 판독 가능한 저장 매체에 저장되어 상기한 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법 중 어느 하나를 컴퓨터에서 실행시킨다.
상기의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 장치는, 경제 불확실성 뉴스(economic uncertainty news)로부터 획득한 심리(sentiment) 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률(stock returns)을 예측하기 위한 하나 이상의 프로그램을 저장하는 메모리; 및 상기 메모리에 저장된 상기 하나 이상의 프로그램에 따라 상기 심리 요인과 상기 거시경제적 요인을 기반으로 상기 머신 러닝 기반 예측 모델을 이용하여 상기 주식 수익률을 예측하기 위한 동작을 수행하는 하나 이상의 프로세서;를 포함하며, 상기 프로세서는, 경제 불확실성(economic uncertainty)에 대한 키워드를 이용하여 경제 불확실성 뉴스 심리(economic uncertainty news sentiment, EUNS) 요인 값을 획득하고, 미리 설정된 복수개의 거시경제적 요인 각각에 대한 거시경제적 요인 값을 획득하며, 미리 학습되어 구축된 머신 러닝 기반 예측 모델을 이용하여, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 입력 데이터를 기반으로 주식 수익률(stock returns)을 예측한다.
여기서, 상기 프로세서는, 경제 불확실성에 대해 미리 설정된 복수개의 상기 키워드를 포함하는 키워드 집합을 이용하여, 상기 키워드가 포함된 게시글 정보를 기반으로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득할 수 있다.
여기서, 상기 복수개의 거시경제적 요인은, 금 지수(gold index), 원유 가격(crude oil price), 금리(interest rate) 및 환율(exchange rate)을 포함할 수 있다.
여기서, 상기 프로세서는, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 상기 입력 데이터를 상기 예측 모델에 입력하고, 상기 예측 모델의 출력 데이터를 기반으로 상기 주식 수익률을 예측할 수 있다.
여기서, 상기 예측 모델은, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값, 상기 금 지수, 상기 원유 가격, 상기 금리 및 상기 환율이 입력되는 하나의 입력 레이어(input layer)와 상기 주식 수익률의 예측값이 출력되는 하나의 출력 레이어(output layer)를 포함하고, 상기 입력 레이어와 상기 출력 레이어는 가중 연결(weighted connections)되는 단일-계층(single-layer) 신경망 모델일 수 있다.
본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법, 이를 수행하는 장치 및 컴퓨터 프로그램에 의하면, 경제 불확실성 뉴스(economic uncertainty news)로부터 획득한 심리(sentiment) 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률(stock returns)을 예측함으로써, 주식 수익률의 예측 정확도를 향상시킬 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 장치를 설명하기 위한 블록도이다.
도 2는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 바람직한 실시예에 따른 예측 모델의 구조를 설명하기 위한 도면이다.
도 4는 본 발명의 바람직한 실시예에 따른 거시경제적 변수와 경제 불확실성 뉴스 심리 변수가 주식 시장 수익률에 미치는 영향을 설명하기 위한 방법론을 나타내는 도면이다.
도 5는 본 발명의 바람직한 실시예에 따른 분석에 이용된 국가와 기업을 나타내는 표이다.
도 6은 본 발명의 바람직한 실시예에 따른 거시경제적 변수와 경제 불확실성 뉴스 심리 변수의 계수를 계산하는 과정을 설명하기 위한 도면이다.
도 7은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 모델의 계수 추정 결과를 나타내는 표이다.
도 8은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 모델의 계수 추정 결과를 나타내는 표이다.
도 9는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 모델의 훈련에 따른 손실 곡선을 나타내는 도면이다.
도 10은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 SLP 모델의 결과를 나타내는 표이다.
도 11은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 OLS 방법의 결과를 나타내는 표이다.
도 12는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 모델의 훈련에 따른 손실 곡선을 나타내는 도면이다.
도 13은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 SLP 모델의 결과를 나타내는 표이다.
도 14는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 OLS 방법의 결과를 나타내는 표이다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 명세서에서 "제1", "제2" 등의 용어는 하나의 구성 요소를 다른 구성 요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예컨대, 제1 구성 요소는 제2 구성 요소로 명명될 수 있고, 유사하게 제2 구성 요소도 제1 구성 요소로 명명될 수 있다.
본 명세서에서 각 단계들에 있어 식별부호(예컨대, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 명세서에서, "가진다", "가질 수 있다", "포함한다" 또는 "포함할 수 있다" 등의 표현은 해당 특징(예컨대, 수치, 기능, 동작, 또는 부품 등의 구성 요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.
이하에서 첨부한 도면을 참조하여 본 발명에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법, 이를 수행하는 장치 및 컴퓨터 프로그램의 바람직한 실시예에 대해 상세하게 설명한다.
먼저, 도 1을 참조하여 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 장치에 대하여 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 장치를 설명하기 위한 블록도이다.
도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 장치(이하 '주식 수익률 예측 장치'라 한다)(100)는 경제 불확실성 뉴스(economic uncertainty news)로부터 획득한 심리(sentiment) 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률(stock returns)을 예측할 수 있다.
이에 따라, 본 발명은 주식 수익률의 예측 정확도를 향상시킬 수 있다.
이를 위해, 주식 수익률 예측 장치(100)는 하나 이상의 프로세서(110), 컴퓨터 판독 가능한 저장 매체(130) 및 통신 버스(150)를 포함할 수 있다.
프로세서(110)는 주식 수익률 예측 장치(100)가 동작하도록 제어할 수 있다. 예컨대, 프로세서(110)는 컴퓨터 판독 가능한 저장 매체(130)에 저장된 하나 이상의 프로그램(131)을 실행할 수 있다. 하나 이상의 프로그램(131)은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 컴퓨터 실행 가능 명령어는 프로세서(110)에 의해 실행되는 경우 주식 수익률 예측 장치(100)로 하여금 경제 불확실성 뉴스로부터 획득한 심리 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률을 예측하기 위한 동작을 수행하도록 구성될 수 있다.
컴퓨터 판독 가능한 저장 매체(130)는 심리 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률을 예측하기 위한 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능한 저장 매체(130)에 저장된 프로그램(131)은 프로세서(110)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독 가능한 저장 매체(130)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 주식 수익률 예측 장치(100)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.
통신 버스(150)는 프로세서(110), 컴퓨터 판독 가능한 저장 매체(130)를 포함하여 주식 수익률 예측 장치(100)의 다른 다양한 컴포넌트들을 상호 연결한다.
주식 수익률 예측 장치(100)는 또한 하나 이상의 입출력 장치를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(170) 및 하나 이상의 통신 인터페이스(190)를 포함할 수 있다. 입출력 인터페이스(170) 및 통신 인터페이스(190)는 통신 버스(150)에 연결된다. 입출력 장치(도시하지 않음)는 입출력 인터페이스(170)를 통해 주식 수익률 예측 장치(100)의 다른 컴포넌트들에 연결될 수 있다.
그러면, 도 2 및 도 3을 참조하여 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법에 대하여 설명한다.
도 2는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법을 설명하기 위한 흐름도이고, 도 3은 본 발명의 바람직한 실시예에 따른 예측 모델의 구조를 설명하기 위한 도면이다.
도 2를 참조하면, 주식 수익률 예측 장치(100)의 프로세서(110)는 경제 불확실성(economic uncertainty)에 대한 키워드를 이용하여 경제 불확실성 뉴스 심리 요인 값(economic uncertainty news sentiment, EUNS)을 획득할 수 있다(S110).
즉, 프로세서(110)는 경제 불확실성에 대해 미리 설정된 복수개의 키워드를 포함하는 키워드 집합을 이용하여, 키워드가 포함된 게시글 정보를 기반으로 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득할 수 있다.
예컨대, 경제 불확실성에 대한 키워드에는 '외채(foreign debt)', '무역 수지(trade balance)', '예산 적자(budget deficit)', '환율 하락(exchange rate depreciation)', '질서 있는 법(the law in order)', '테러와의 전쟁(war on terror,)', '금융 위기(financial crisis)', "정치적 불안정(political instability)', '무역 제재(trade sanctions)', '금융 제재(financial sanction)', '혼란 기간(turmoil period)', '경제 다운타임(economic downtime)' 등이 있다.
이때, 프로세서(110)는 트위터 등과 같은 소셜 미디어 플랫폼(social media platform)에 게시된 글 중에서 키워드 집합에 따른 키워드가 포함된 게시글을 획득하고, 키워드가 포함된 게시글의 개수 및 키워드가 포함된 게시글의 게시 일자를 포함하는 게시글 정보를 획득할 수 있다.
예컨대, 프로세서(110)는 미리 설정된 기간(1일, 12시간, 6시간 등)동안 게시된 글의 개수 중에서 해당 기간동안 키워드가 포함된 게시글의 개수의 비율을 토대로, 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득할 수 있다. 또한, 프로세서(110)는 미리 설정된 주기(1일 등)를 간격으로 키워드가 포함된 게시글의 개수의 증감 정도(즉, 가로축이 주기이고 세로축이 게시글 개수인 그래프의 기울기 등)를 토대로, 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득할 수 있다. 물론, 프로세서(110)는 아래와 같이 종래에 알려진 방법론을 이용하여 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득할 수도 있다.
- Z. Jin, Y. Yang, and Y. Liu, "Stock closing price prediction based on sentiment analysis and LSTM," Neural Computing & Applications, vol. 32, no. 13, pp. 9713-9729, 2020.
- H. S. Lee, "Exploring the initial impact of COVID-19 sentiment on US stock market using big data," Sustainability, vol. 12, no. 16, p. 6648, 2020.
- X. Li, P. Wu, and W. Wang, "Incorporating stock prices and news sentiments for stock market prediction: a case of Hong Kong," Information Processing & Management, vol. 57, no. 5, Article ID 102212, 2020.
- I. Gupta, T. K. Madan, S. Singh, and A. K. Singh, "HiSASMFM: historical and sentiment analysis based stock market forecasting model," arXiv preprint arXiv:2203.08143, 2022.
- A. E. Khedr, N. Yaseen, and N. Yaseen, "Predicting stock market behavior using data mining technique and news sentiment analysis," International Journal of Intelligent Systems and Applications, vol. 9, no. 7, pp. 22-30, 2017.
그런 다음, 프로세서(110)는 미리 설정된 복수개의 거시경제적 요인 각각에 대한 거시경제적 요인 값을 획득할 수 있다(S120).
여기서, 복수개의 거시경제적 요인은 금 지수(gold index), 원유 가격(crude oil price), 금리(interest rate) 및 환율(exchange rate)을 포함할 수 있다.
이후, 프로세서(110)는 미리 학습되어 구축된 머신 러닝 기반 예측 모델을 이용하여, 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 거시경제적 요인 값을 포함하는 입력 데이터를 기반으로 주식 수익률을 예측할 수 있다(S130).
즉, 프로세서(110)는 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 거시경제적 요인 값을 포함하는 입력 데이터를 예측 모델에 입력하고, 예측 모델의 출력 데이터를 기반으로 주식 수익률을 예측할 수 있다.
여기서, 예측 모델은 도 3에 도시된 바와 같이, 하나의 입력 레이어(input layer)와 하나의 출력 레이어(output layer)를 포함하고, 입력 레이어와 출력 레이어는 가중 연결(weighted connections)되는 단일-계층(single-layer) 신경망 모델일 수 있다. 하나의 입력 레이어는 경제 불확실성 뉴스 심리(EUNS) 요인 값, 금 지수, 원유 가격, 금리 및 환율이 입력될 수 있다. 하나의 출력 레이어는 주식 수익률의 예측값을 출력할 수 있다.
이때, 예측 모델은 평균 제곱 오차(mean squared error, MSE)를 손실 함수(loss function)로 하여 학습 데이터를 기반으로 미리 설정된 에포크(epoch)동안 반복적인 가중치 최적화 과정을 통해 학습될 수 있다. 여기서, 학습 데이터는 경제 불확실성 뉴스 심리(EUNS) 요인 값, 금 지수, 원유 가격, 금리, 환율 및 주식 수익률 각각에 대한 과거 일별 데이터를 토대로 획득될 수 있다.
그러면, 도 4 내지 도 14를 참조하여 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스를 토대로 획득한 심리 요인과 주식 수익률의 관계에 대하여 보다 자세하게 설명한다.
본 발명은 금 지수, 원유 가격, 금리, 환율 등과 같은 거시경제적 요인뿐만 아니라 경제 불확실성 뉴스 심리(EUNS) 요인까지 이용하여 예측 모델을 토대로 주식 수익률을 예측함으로써, 주식 수익률의 예측 정확도를 향상시킬 수 있다. 이와 관련하여, 경제 불확실성 뉴스 심리(EUNS)의 맥락(context)에서 거시경제적 요인과 주식 수익률의 관계에 대한 분석 연구에 대하여 자세하게 설명한다.
본 연구의 주요 질문은 다음과 같다.
첫째, 가장 정교한 머신 러닝 접근 방식(즉, 단일-계층 신경망)을 토대로 거시경제적 요인을 사용하여 주식 수익률 분석을 수행하면 어떻게 될까요?
둘째, 거시경제적 요인과 경제 불확실성 뉴스 심리(EUNS)를 함께 반영할 경우 주가 수익률의 정확성에 미치는 영향은 어떠한가?
따라서, 본 연구에서는 기존의 통계적, 회귀적 접근 방식이 아닌 단일-계층 신경망을 이용하여 거시경제적 요인과 경제 불확실성 뉴스 심리(EUNS)를 고려하여 기존의 방법과 비교하여 보다 심도 있는 주식 시장 분석을 제공한다. 또한, 기존 연구들이 특정 국가의 주식 시장을 거시경제적 요인으로 분석했다면, 본 연구에서는 홍콩, 미국, 터키 등 3개국의 주식 시장을 분석하였다. 본 연구는 터키, 홍콩 및 미국 기업의 주식 데이터에 대한 주식 수익률에 미치는 영향을 확인하기 위해 금리, 원유 가격, 환율 및 금 지수의 네 가지 주요 거시경제적 요인에 초점을 맞춘다. 본 연구는 모델을 평가하기 위해 2010년 1월부터 2020년 12월까지 주식 데이터 세트를 수집했다. 본 연구는 거래량을 기준으로 이 3개 주식 시장에서 상위 5개 실적 주식을 선택했다. 또한, 소셜 미디어 심리의 영향을 알아보기 위해 트위터의 경제 불확실성 뉴스를 기반으로 지수를 구성했다. '외채', '무역 수지', '예산 적자', '환율 하락', '질서 있는 법', '테러와의 전쟁', '금융 위기', "정치적 불안정", "무역 제재", "금융 제재", "혼란 기간", "경제 다운타임"이라는 키워드 집합은 경제 불확실성 뉴스 심리(EUNS)를 설정하고, 이는 나중에 주식 시장 수익률을 설명하는 독립 변수로 사용된다. 이후, 시계열 모델인 단일-계층 신경망을 사용하여 환율, 금리, 원유 가격, 금 지수, 경제 불확실성에 대한 심리 및 주식 수익률 간의 관계를 조사한다. 본 연구의 기여는 다음과 같다.
(i) 주식 수익률에 대한 거시경제적 변수의 영향을 조사하기 위해 단일-계층 신경망이 사용되는데, 이는 이 맥락에서 매우 드물다.
(ii) 트위터 데이터 세트를 사용하여 텍스트 분석을 적용하여 경제 불확실성 뉴스에 대한 트위터 심리를 구성한다.
(iii) 미국, 터키, 홍콩의 주식 수익률에 미치는 영향을 알아보기 위해 트위터의 경제 불확실성 뉴스와 관련된 심리를 모델에 통합한다.
본 연구의 방법
도 4는 본 발명의 바람직한 실시예에 따른 거시경제적 변수와 경제 불확실성 뉴스 심리 변수가 주식 시장 수익률에 미치는 영향을 설명하기 위한 방법론을 나타내는 도면이다.
이하, 본 연구의 데이터 세트에 대해 자세히 설명하고 연구를 수행하는 방법론적 단계에 대해 설명한다. 먼저, 분석을 위한 데이터 수집 절차를 설명하고, 그 다음으로, 수집된 데이터가 3개국의 주식 시장 수익률에 거시경제적 변수와 경제 불확실성 뉴스 심리(EUNS)의 영향을 연구하는 데 사용되는 방법을 단계별로 설명한다. 도 4에 도시된 그림은 본 연구의 방법론을 보여준다.
1. 데이터 수집
도 5는 본 발명의 바람직한 실시예에 따른 분석에 이용된 국가와 기업을 나타내는 표이다.
기술 분석을 위한 과거 주식 데이터에 대한 본 연구에서 제안된 모델의 성능을 평가하기 위해 도 5에 도시된 표에 나열된 Standard and Poor's 500, 홍콩 증권 거래소 및 Borsa Istanbul 증권 거래소의 상위 5개 실적 주식에서 일일 데이터를 가져온다. 마찬가지로, 환율, 이자율, 금 가격, 원유 가격은 모두 거시경제적 변수로 간주된다. 데이터는 2010년 1월부터 2020년 12월까지 수집되었다. 이후, 근본적인 분석을 위해, '외채', '무역 수지', '예산 적자', '환율 하락', '질서 있는 법', '테러와의 전쟁', '금융 위기', '정치적 불안정', '무역 제재', '금융 제재', '혼란 기간', '경제 다운타임'을 포함한 여러 키워드에 대해 인덱스된 트윗에 대한 심리 분석을 사용한다.
2. 거시경제적 변수를 이용한 주식 및 심리 데이터의 기술적이고 근본적인 분석을 위한 제안 모델
도 6은 본 발명의 바람직한 실시예에 따른 거시경제적 변수와 경제 불확실성 뉴스 심리 변수의 계수를 계산하는 과정을 설명하기 위한 도면이다.
데이터 수집 후, 회귀(regression)를 수행하고 거시경제적 변수 및 경제 불확실성 뉴스 심리(EUNS)에 대한 계수 값을 추정하기 위해 심층 신경망 기반 모델을 설계했다. [수학식 1]과 [수학식 2]는 계수 값을 계산한다.
[수학식 1]과 [수학식 2]에서, Gi, C0, Ir, Ex, S는 각각 금 가격 지수, 원유 가격, 일일 금리, 환율, 경제 불확실성 뉴스 심리(EUNS)를 나타낸다. 구체적으로 선형 회귀 문제는 신경망 기법을 사용한다.
일반적으로, 선형 회귀는 종속 변수와 독립 변수 간의 관계를 모델링하려는 일련의 문제를 나타낸다. 이 방법은 투영된 출력이 연속적이고 기울기가 지속적인 학습을 나타내는 가장 인기 있는 감독 머신 러닝(supervised machine learning) 알고리즘 중 하나이다. 선형 회귀는 단순 선형 회귀와 다중 선형 회귀로 분류된다. 단순 선형 회귀에는 하나의 독립 변수와 편향 항만 있다. 그러나, 다중 선형 회귀에는 둘 이상의 독립 변수가 있어야 한다. 이러한 회귀 문제는 가장 정교한 머신 러닝 알고리즘(예: ANN)으로 공식화할 수 있다. 연결주의 시스템이라고도 하는 이러한 ANN은 인간 두뇌의 구조에서 영감을 얻었으며 예측 또는 회귀 모델을 설계하는 데 매우 효율적인 접근 방식이다. 이러한 신경망을 통해 여러 기계 학습 알고리즘이 복잡한 입력을 조정하고 처리할 수 있다. 이러한 특성으로 인해 알고리즘은 태스크를 수행할 수 있으며 기본 알고리즘은 일반적으로 태스크별 규칙으로 설계되지 않는다. 예를 들어, 컴퓨터 비전에서, 시스템은 다른 도메인에서 이미지 인식 및 물체 감지를 수행할 수 있다. 그러나, 이러한 태스크는 ANN의 가장 진보된 변형(즉, CNN 및 객체 감지 모델)을 사용한다.
실제로, ANN은 입력 및 출력 데이터가 포함된 대규모 훈련 기록 세트에서 ANN을 훈련함으로써 달성할 수 있는 입력 변수와 출력 변수 간의 연관성을 결정하기 위한 강력한 도구이다. 일반적으로, ANN 아키텍처는 그들 사이에 가중 연결(weighted connections)이 있는 유닛 또는 노드로 구성되며, 각 유닛은 특정 정보를 네트워크에 도입하고 전달한다. 이 방법은 먼저 X=(x1, x2, x3, …, xn)과 같은 입력 벡터를 취하고 수학 함수의 도움으로 예측 모델을 생성하는 방식으로 작동한다. 다음 단계에서, ANN은 뉴런 간의 연결에 존재하는 가중치를 미세 조정하여 학습을 시작한 다음, 투영된 모델 출력과 실제 값의 차이인 모델 오류를 측정한다. 이 프로세스는 오류가 0에 가까운 모델을 찾을 때까지 여러 번 또는 설정된 에포크(epochs) 동안 반복된다. ANN을 사용하면 자체-적응형(self-adaptive)이기 때문에 실제 문제를 모델링할 수 있다. ANN은 단일-계층 또는 다중-계층 신경망일 수 있다. 회귀 문제를 모델링하기 위해 하나의 입력 레이어와 하나의 출력 레이어만 있는 단일-계층 네트워크를 사용했다. 모델은 독립 변수의 입력을 세트로 취하고 종속 변수의 값과 모델 출력이 거의 동일하도록 최상의 가중치를 찾는 방법을 학습하도록 설계되었다. 이 경우, 이들 독립 변수는 거시경제적 변수와 경제 불확실성 뉴스 심리(EUNS)의 값이다. 아래의 [수학식 3]에 주어진, 단순 선형 회귀 함수를 고려한다.
[수학식 3]에서, x1, x2, x3 및 xn은 주어진 입력 벡터의 독립 변수 또는 특징이다. 또한, w1, w2, w3, 및 wn은 예측 모델의 계수와 가중치이고, w0는 편향 항(bias term)이다. 본 연구에서 제안하는 아키텍처는 하나의 입력 레이어와 하나의 출력 레이어로 나뉜다. 입력 레이어의 단위 수는 독립 변수의 총 수와 같고, 출력 레이어에는 하나의 단위가 있다. 모든 입력과 출력 단위 및 관련 가중치 사이에는 직접 연결이 있다. 신경망은 Adam 최적화 프로그램을 사용하여 모든 반복에서 이러한 가중치를 최적화한다. 이 알고리즘은 다양한 파라미터에 대한 개별 학습률(learning rate)을 계산한다. 또한, 학습 속도를 조정하기 위해 모델의 각 계수 또는 가중치에 대해 기울기의 첫 번째 및 두 번째 모멘트(moment)도 계산된다. 랜덤 변수의 기대값은 [수학식 4]에 표시된 대로 모멘트로 정의된다.
이 랜덤 변수는 신경망의 손실 함수를 나타내는 데 사용된다. 또한, 한 번의 반복이 끝나면, 선형 회귀 모델의 가중치 또는 계수는 모든 가중치(즉, w0, w1, w2, w3 및 wn)에 대해 [수학식 5]에 설명된 가중치 업데이트 수학식을 사용하여 업데이트된다.
여기서, Wn-1은 이전 가중치의 값이고, η는 스텝 크기이며, 모멘트와 분산을 나타내는 의 값은 각각 [수학식 6]과 [수학식 7]에 의해 계산된다.
여기서, β1과 β2는 [수학식 6]과 [수학식 7]의 하이퍼파라미터이고, [수학식 8]과 [수학식 9]는 mt와 vt를 계산하는 데 사용된다.
첫 번째 모멘트는 평균 mt이고, 두 번째 모멘트는 분산 vt이다. 또한, 매 반복마다 가중치를 개별적으로 업데이트한 후 모델이 수렴하여 최적의 계수를 결정하면, 마지막 반복 후에 가중치 또는 계수를 추출하여 저장한다. 최적화된 손실 함수는 평균 제곱 오차 함수(mean squared error function)이며, 아래의 [수학식 10]과 같이 정의된다.
[수학식 10]에서, N은 주식 데이터의 총 인스턴스 수, Yi는 종속 변수의 실제 값, 는 종속 변수의 예측값을 나타낸다. 다음 단계에서는, 관측되지 않은 각 데이터 포인트에 대해, 저장된 계수를 로드하고 관련 종속 변수를 곱하여 필요한 종속 변수 값을 얻는다. 도 6에 도시된 그림은 본 연구에서 제안된 모델을 보여준다.
본 연구의 실험 결과
1. 회귀 결과 및 계수 계산
도 7은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 모델의 계수 추정 결과를 나타내는 표이고, 도 8은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 모델의 계수 추정 결과를 나타내는 표이다.
회귀 결과를 계산하고 계수를 계산하기 위해, [수학식 1]을 사용하여 금 지수(Gi), 원유 가격(Co), 금리(Ir) 및 환율(Ex)을 포함한 거시경제적 변수의 영향을 조사했다. 마찬가지로, [수학식 2]를 사용하여 모든 국가의 주식 수익률에 대한 경제 불확실성 뉴스 심리(EUNS)(S)의 영향을 조사한다.
먼저, 경제 불확실성 뉴스 심리(EUNS)(S)를 포함하지 않고 미국 주식 시장의 주가 수익률에 대한 금 지수, 원유 가격, 금리, 환율의 영향을 분석하였다. 이를 위해 우리는 Standard and Poor's 500 지수와 함께 상위 5개 기업의 주식 수익률을 사용했다. 도 7에 도시된 표는 각 국가의 결과를 나열한다. 비교 분석을 위해 OLS(ordinary least square) 방법을 기반으로 계수를 추정한 결과도 보고한다. 모든 계수는 대부분 음수이고 중요하다. 그러나, 본 연구에서 제안된 SLP(single-layer perceptron) 모델은 OLS 방법과 달리 대부분의 계수가 매우 중요하기 때문에 OLS 방법보다 성능이 우수하다.
다음으로, 경제 불확실성 뉴스 심리(EUNS)(S)를 또 다른 변수로 포함시킨 결과는 도 8에 도시된 표와 같다. 실험 결과, 금 지수, 금리 및 환율이 매우 중요하고 부정적인 영향을 미친다는 것을 시사한다. 이들 변수의 모든 계수는 1% 수준에서 음의 유의성을 가지며 환율의 양의 충격은 주식 수익률을 증가시킨다. 경제 뉴스에 대한 소셜 미디어 심리 계수는 5%와 1% 유의 수준에서 매우 유의하고 음의 값을 보였다. 경제 불확실성 뉴스 심리(EUNS)의 통계적 유의성은 재정 예산 발표 기간 동안 경제 불확실성 뉴스가 주식 수익률에 부정적인 영향을 미친다는 것을 나타낸다. 비교 분석을 위해 OLS 방법을 기반으로 추정된 계수의 결과도 보고한다. 모든 계수는 대부분 음수이고 중요하다. 그러나, SLP 모델은 OLS 방법과 달리 대부분의 계수가 매우 중요하기 때문에 OLS 방법보다 성능이 우수하다.
2. 경제 불확실성 뉴스 심리(EUNS)없이 거시경제적 요인으로 예측한 결과
도 9는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 모델의 훈련에 따른 손실 곡선을 나타내는 도면이고, 도 10은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 SLP 모델의 결과를 나타내는 표이며, 도 11은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하지 않는 OLS 방법의 결과를 나타내는 표이다.
본 섹션에서는 미국, 터키 및 홍콩에 있는 여러 회사의 수익을 예측하는 관점에서 본 연구를 통해 제안된 모델의 성능을 분석한다. 첫 번째 단계에서는 경제 불확실성 뉴스 심리(EUNS)를 포함하지 않고 거시경제적 요인을 사용하여 모델을 테스트했다. 본 연구는 환율, 이자율, 금 지수, 원유 가격과 같은 거시경제적 변수를 사용하여 50에포크에 걸쳐 SLP 모델을 훈련했다. 회귀에서 이러한 변수는 종속 변수로 간주되는 반면 타겟 변수는 여러 회사의 수익이다.
SLP 모델의 파라미터에는 Adam인 가중치 최적화기가 포함된다. 손실 함수는 "Mean Squared Error"이고, 배치 크기는 4이다. 단일-계층 신경망의 입력 계층은 종속 변수와 동일한 단위로 구성되고 마지막 계층은 출력 값을 나타내는 하나의 단위(뉴런)로 구성된다. 도 9에 도시된 그림은 모든 국가의 기업에 대한 단일-계층 신경망 훈련 중 MSE 손실을 보여준다. 그래프는 단일-계층 신경망이 오류가 거의 없이 매우 원활하게 수렴됨을 보여준다.
또한, SLP 모델과 OLS 방법의 견고성이나 성능을 평가하기 위해 RMSE(root mean square error), MAE(mean absolute error), MSE(mean squared error) 값을 계산한다. 도 10에 도시된 표는 SLP 모델을 사용하는 홍콩, 미국 및 터키 기업의 RMSE, MSE 및 MAE 값을 보여준다. 해당 표의 각 부분은 다른 회사의 결과를 보여준다. 이 점수는 수익의 실제값 및 예측값을 사용하여 계산된다. 해당 표에서 RMSE, MSE 및 MAE의 값이 매우 낮은 것을 관찰할 수 있으며 이는 최상의 성능을 나타낸다. 그러나, AK Bank of Turkey의 RMSE 점수는 다른 국가의 회사에 비해 약간 높다.
또한, 비교를 위해 OLS 방법을 사용하여 동일한 실험을 반복하여 도 11에 도시된 표에 나타낸다. 해당 표에서 OLS 방법을 사용한 RMSE, MSE 및 MAE 값은 일반적으로 SLP 모델과 동일함을 알 수 있다. 그러나, 특정 회사의 경우 OLS 접근 방식의 오류값이 SLP 접근 방식보다 높으며 이는 ANN 기반 접근 방식의 타당성을 보여준다. 또한, SLP 모델은 현재 단일 레이어를 기반으로 하지만 특징에서 더 많은 정보를 캡처하기 위해 깊이를 다중 레이어로 늘리면 성능이 향상된다. 가장 작은 손실값은 또 다른 실현 가능한 값을 반영한다. 거시경제적 요인을 고려할 때 예측이 더 정확해 진다는 것이다.
3. 경제 불확실성 뉴스 심리(EUNS)와 거시경제적 요인으로 예측한 결과
도 12는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 모델의 훈련에 따른 손실 곡선을 나타내는 도면이고, 도 13은 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 SLP 모델의 결과를 나타내는 표이며, 도 14는 본 발명의 바람직한 실시예에 따른 경제 불확실성 뉴스 심리 변수를 포함하는 OLS 방법의 결과를 나타내는 표이다.
두 번째 단계에서는 경제 불확실성 뉴스 심리(EUNS)와 거시경제적 요인을 모두 포함하여 모델의 성능을 평가했다. 이 실험 설정에서 선형 회귀 변수에는 환율, 금리, 금 지수, 원유 가격 및 심리 변수가 포함된다. 우리는 50에포크 동안 이러한 변수를 사용하여 SLP 모델을 훈련하고 예측 작업을 수행했다. 이 모든 실험은 다른 국가의 회사에서 반복된다. 다양한 실험의 학습 손실 곡선이 도 12에 도시된 그림에 나와 있다. 첫 번째 그래프는 홍콩 기업의 손실 곡선을, 두 번째 그래프는 터키 기업의 결과를, 마지막 그래프는 미국 기업의 손실 곡선을 보여준다. 그래프는 SLP 모델이 비교적 빠르게 수렴하고 손실값이 0에 도달함을 보여준다.
또한, 모든 국가의 기업을 대상으로 한 SLP 모델의 RMSE, MSE, MAE 형태의 결과도 도 13에 도시된 표와 같이 산출하였다. 해당 표는 다양한 국가 기업의 조사 결과를 담고 있다. 이러한 결과는 실제 반환 값과 예상 반환 값을 결합하여 계산된다. 해당 표는 RMSE, MSE 및 MAE의 값이 상대적으로 낮아 우수한 성능을 나타낸다.
또한, 도 14에 도시된 표에서 볼 수 있듯이 OLS 방법을 사용하여 거시경제적 요인과 경제 불확실성 뉴스 심리(EUNS) 모두의 성과를 평가하고 추출했다. 경제 불확실성 뉴스 심리(EUNS)를 사용하는 SLP 모델의 오류 값이 OLS 방법보다 더 나은 것으로 나타났다. 예를 들어, SLP 모델의 MSE 값은 1.10인 반면, OLS 방법의 MSE 값은 1.26으로 SLP 모델보다 크다.
본 연구의 결론
본 연구는 경제 불확실성 뉴스 심리(EUNS)의 맥락에서 거시경제적 변수(즉, 금 지수, 원유 가격, 금리 및 환율)가 주식 시장 수익률에 미치는 영향을 조사했다. 경험적 프로세스를 위해 미국, 터키 및 홍콩과 같은 특정 국가 집합에 대해 이러한 모든 변수에 대한 일일 데이터를 사용했다. 나중에 회귀 계수를 계산하기 위해 SLP 모델과 OLS 방법을 사용했다. 실험 결과, 금 지수, 이자율 및 환율이 이 모든 국가에 대해 매우 중요하고 음수임을 나타낸다. 또한, 경제 불확실성 뉴스 심리(EUNS)는 주식 수익률을 추정하는 데 중요하고 부정적임을 알 수 있다. 미국, 터키, 홍콩의 재정 예산 발표 기간에 대해서만 경제 불확실성 뉴스 심리(EUNS)를 계산했다. 경제 불확실성 뉴스 심리(EUNS)는 음의 의미를 지니기 때문에 주식 시장 참여자들에게 패닉을 일으키고 궁극적으로 투자자들이 투자를 철회할 수 있다. 따라서, 본 연구의 정책적 시사점은 민감한 시기에 투자자들을 당황하게 할 수 있는 경제에 대한 부정적인 뉴스를 통제하는 것이 중요하다. 마찬가지로 개인 투자자는 비정상적인 손실을 피하기 위해 불확실한 기간 동안 금과 주식을 포함하는 포트폴리오를 보유해야 한다.
정리하면, 주식 시장은 국가의 경제 건전성을 정확하게 반영하며 주식 수익률은 경제 지표와 밀접한 관련이 있다. 인기 있는 금융 연구 분야 중 하나는 주식 수익률에 영향을 미치는 요인이다. 여러 조사에서 수많은 요소 중 거시경제적 요인을 자주 인용한다. 따라서, 본 발명은 거시경제적 요인과 주식 시장 수익률의 관계에 대한 실증 분석에 초점을 두고 있다. 주식 시장의 변동성이 커지면 경제 불확실성 뉴스와 소셜 미디어 플랫폼의 정보에 민감해진다. 따라서, 본 발명은 주식 수익률 예측을 위해 경제 불확실성 뉴스 심리(EUNS)의 새로운 차원을 통합한다. 본 발명은 2010년 1월부터 2020년 12월까지 일련의 국가에 대한 금 지수, 원유 가격, 금리, 환율 및 주식 수익률의 일별 데이터를 사용하였다. 이후, 계수를 계산하기 위해 보다 정교한 접근법(SLP 모델 및 OLS 방법) 중 하나를 사용하여 회귀 분석을 수행하였다. 또한, 미국, 터키, 홍콩의 경우 재정 예산 발표 기간 동안만 경제 불확실성 뉴스 심리(EUNS)를 산출했다. 분석 결과, 금 지수, 금리 및 환율이 분석된 모든 국가에 대해 매우 중요하고 부정적인 거시경제적 요인임을 나타내는 것을 알 수 있다. 또한, 경제 불확실성 뉴스 심리(EUNS)가 주식 수익률을 예상하는 데 중요한 요인이면서 부정적인 요인임을 알 수 있다.
본 실시예들에 따른 동작은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 저장 매체에 기록될 수 있다. 컴퓨터 판독 가능한 저장 매체는 실행을 위해 프로세서에 명령어를 제공하는데 참여한 임의의 매체를 나타낸다. 컴퓨터 판독 가능한 저장 매체는 프로그램 명령, 데이터 파일, 데이터 구조 또는 이들의 조합을 포함할 수 있다. 예컨대, 자기 매체, 광기록 매체, 메모리 등이 있을 수 있다. 컴퓨터 프로그램은 네트워크로 연결된 컴퓨터 시스템 상에 분산되어 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 본 실시예를 구현하기 위한 기능적인(Functional) 프로그램, 코드, 및 코드 세그먼트들은 본 실시예가 속하는 기술 분야의 프로그래머들에 의해 용이하게 추론될 수 있을 것이다.
본 실시예들은 본 실시예의 기술 사상을 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100 : 주식 수익률 예측 장치,
110 : 프로세서,
130 : 컴퓨터 판독 가능한 저장 매체,
131 : 프로그램,
150 : 통신 버스,
170 : 입출력 인터페이스,
190 : 통신 인터페이스

Claims (14)

  1. 머신 러닝 기반 주식 수익률 예측 장치에 의해 수행되는 머신 러닝 기반 주식 수익률 예측 방법으로서,
    경제 불확실성(economic uncertainty)에 대한 키워드를 이용하여 경제 불확실성 뉴스 심리(economic uncertainty news sentiment, EUNS) 요인 값을 획득하는 단계;
    미리 설정된 복수개의 거시경제적 요인 각각에 대한 거시경제적 요인 값을 획득하는 단계; 및
    미리 학습되어 구축된 머신 러닝 기반 예측 모델을 이용하여, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 입력 데이터를 기반으로 주식 수익률(stock returns)을 예측하는 단계;
    를 포함하며,
    상기 경제 불확실성 뉴스 심리(EUNS) 요인 값 획득 단계는, 경제 불확실성에 대해 미리 설정된 복수개의 상기 키워드를 포함하는 키워드 집합을 이용하여, 상기 키워드가 포함된 게시글 정보를 기반으로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득하는 것으로 이루어지고,
    상기 경제 불확실성 뉴스 심리(EUNS) 요인 값 획득 단계는, 소셜 미디어 플랫폼(social media platform)에 게시된 글 중에서 상기 키워드가 포함된 게시글을 획득하고, 상기 키워드가 포함된 게시글의 개수 및 상기 키워드가 포함된 게시글의 게시 일자를 포함하는 상기 게시글 정보를 획득하는 것으로 이루어지며,
    상기 경제 불확실성 뉴스 심리(EUNS) 요인 값 획득 단계는, 미리 설정된 기간동안 게시된 글의 개수 중에서 상기 기간동안 상기 키워드가 포함된 게시글의 개수의 비율을 토대로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득하거나, 미리 설정된 주기를 간격으로 상기 키워드가 포함된 게시글의 개수의 증감 정도를 토대로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득하는 것으로 이루어지고,
    상기 복수개의 거시경제적 요인은, 금 지수(gold index), 원유 가격(crude oil price), 금리(interest rate) 및 환율(exchange rate)을 포함하며,
    상기 예측 모델은, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값, 상기 금 지수, 상기 원유 가격, 상기 금리 및 상기 환율이 입력되는 하나의 입력 레이어(input layer)와 상기 주식 수익률의 예측값이 출력되는 하나의 출력 레이어(output layer)를 포함하고, 상기 입력 레이어와 상기 출력 레이어는 가중 연결(weighted connections)되는 단일-계층(single-layer) 신경망 모델이고,
    상기 예측 모델은, 평균 제곱 오차(mean squared error, MSE)를 손실 함수(loss function)로 하여 학습 데이터를 기반으로 미리 설정된 에포크(epoch)동안 반복적인 가중치 최적화 과정을 통해 학습되는,
    경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에서,
    상기 주식 수익률 예측 단계는,
    상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 상기 입력 데이터를 상기 예측 모델에 입력하고, 상기 예측 모델의 출력 데이터를 기반으로 상기 주식 수익률을 예측하는 것으로 이루어지는,
    경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법.
  6. 삭제
  7. 삭제
  8. 제5항에서,
    상기 학습 데이터는,
    상기 경제 불확실성 뉴스 심리(EUNS) 요인 값, 상기 금 지수, 상기 원유 가격, 상기 금리, 상기 환율 및 상기 주식 수익률 각각에 대한 과거 일별 데이터를 토대로 획득되는,
    경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법.
  9. 제1항, 제5항 및 제8항 중 어느 한 항에 기재된 경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 방법을 컴퓨터에서 실행시키기 위하여 컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램.
  10. 경제 불확실성 뉴스(economic uncertainty news)로부터 획득한 심리(sentiment) 요인과 거시경제적 요인을 기반으로 머신 러닝 기반 예측 모델을 이용하여 주식 수익률(stock returns)을 예측하기 위한 하나 이상의 프로그램을 저장하는 메모리; 및
    상기 메모리에 저장된 상기 하나 이상의 프로그램에 따라 상기 심리 요인과 상기 거시경제적 요인을 기반으로 상기 머신 러닝 기반 예측 모델을 이용하여 상기 주식 수익률을 예측하기 위한 동작을 수행하는 하나 이상의 프로세서;
    를 포함하며,
    상기 프로세서는,
    경제 불확실성(economic uncertainty)에 대한 키워드를 이용하여 경제 불확실성 뉴스 심리(economic uncertainty news sentiment, EUNS) 요인 값을 획득하고,
    미리 설정된 복수개의 거시경제적 요인 각각에 대한 거시경제적 요인 값을 획득하며,
    미리 학습되어 구축된 머신 러닝 기반 예측 모델을 이용하여, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 입력 데이터를 기반으로 주식 수익률(stock returns)을 예측하고,
    상기 프로세서는, 경제 불확실성에 대해 미리 설정된 복수개의 상기 키워드를 포함하는 키워드 집합을 이용하여, 상기 키워드가 포함된 게시글 정보를 기반으로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득하며,
    상기 프로세서는, 소셜 미디어 플랫폼(social media platform)에 게시된 글 중에서 상기 키워드가 포함된 게시글을 획득하고, 상기 키워드가 포함된 게시글의 개수 및 상기 키워드가 포함된 게시글의 게시 일자를 포함하는 상기 게시글 정보를 획득하며,
    상기 프로세서는, 미리 설정된 기간동안 게시된 글의 개수 중에서 상기 기간동안 상기 키워드가 포함된 게시글의 개수의 비율을 토대로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득하거나, 미리 설정된 주기를 간격으로 상기 키워드가 포함된 게시글의 개수의 증감 정도를 토대로 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값을 획득하고,
    상기 복수개의 거시경제적 요인은, 금 지수(gold index), 원유 가격(crude oil price), 금리(interest rate) 및 환율(exchange rate)을 포함하며,
    상기 예측 모델은, 상기 경제 불확실성 뉴스 심리(EUNS) 요인 값, 상기 금 지수, 상기 원유 가격, 상기 금리 및 상기 환율이 입력되는 하나의 입력 레이어(input layer)와 상기 주식 수익률의 예측값이 출력되는 하나의 출력 레이어(output layer)를 포함하고, 상기 입력 레이어와 상기 출력 레이어는 가중 연결(weighted connections)되는 단일-계층(single-layer) 신경망 모델이고,
    상기 예측 모델은, 평균 제곱 오차(mean squared error, MSE)를 손실 함수(loss function)로 하여 학습 데이터를 기반으로 미리 설정된 에포크(epoch)동안 반복적인 가중치 최적화 과정을 통해 학습되는,
    경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 장치.
  11. 삭제
  12. 삭제
  13. 제10항에서,
    상기 프로세서는,
    상기 경제 불확실성 뉴스 심리(EUNS) 요인 값과 복수개의 상기 거시경제적 요인 값을 포함하는 상기 입력 데이터를 상기 예측 모델에 입력하고, 상기 예측 모델의 출력 데이터를 기반으로 상기 주식 수익률을 예측하는,
    경제 불확실성 뉴스를 이용한 머신 러닝 기반 주식 수익률 예측 장치.
  14. 삭제
KR1020220182552A 2022-12-23 2022-12-23 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법 KR102596740B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220182552A KR102596740B1 (ko) 2022-12-23 2022-12-23 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220182552A KR102596740B1 (ko) 2022-12-23 2022-12-23 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법

Publications (1)

Publication Number Publication Date
KR102596740B1 true KR102596740B1 (ko) 2023-10-31

Family

ID=88543232

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220182552A KR102596740B1 (ko) 2022-12-23 2022-12-23 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법

Country Status (1)

Country Link
KR (1) KR102596740B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102453557B1 (ko) * 2022-01-04 2022-10-14 주식회사 슈페릭스 뉴스 기사에 대한 긍정, 부정 또는 중립 여부를 평가한 결과에 따라 예측 주가를 제공하는 주식 거래 플랫폼 서버 및 이의 동작 방법
KR20220167039A (ko) * 2021-06-11 2022-12-20 백석대학교산학협력단 딥러닝과 경제 지표 기반 주가 예측 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220167039A (ko) * 2021-06-11 2022-12-20 백석대학교산학협력단 딥러닝과 경제 지표 기반 주가 예측 시스템
KR102453557B1 (ko) * 2022-01-04 2022-10-14 주식회사 슈페릭스 뉴스 기사에 대한 긍정, 부정 또는 중립 여부를 평가한 결과에 따라 예측 주가를 제공하는 주식 거래 플랫폼 서버 및 이의 동작 방법

Similar Documents

Publication Publication Date Title
Vargas et al. Deep leaming for stock market prediction using technical indicators and financial news articles
Cho et al. A hybrid approach based on the combination of variable selection using decision trees and case-based reasoning using the Mahalanobis distance: For bankruptcy prediction
Li et al. Individualized indicator for all: Stock-wise technical indicator optimization with stock embedding
Eliasy et al. The role of AI in capital structure to enhance corporate funding strategies
US20210303970A1 (en) Processing data using multiple neural networks
Chen et al. Bankruptcy prediction using machine learning models with the text-based communicative value of annual reports
Malibari et al. Predicting stock closing prices in emerging markets with transformer neural networks: The saudi stock exchange case
US11769210B1 (en) Computer-based management methods and systems
Jabeen et al. An Empirical Study of Macroeconomic Factors and Stock Returns in the Context of Economic Uncertainty News Sentiment Using Machine Learning
Zhang et al. Intraday and interday features in the high-frequency data: Pre-and post-Crisis evidence in China’s stock market
GUMUS et al. Stock market prediction by combining stock price information and sentiment analysis
KR102596740B1 (ko) 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법
Qiang et al. Relationship model between human resource management activities and performance based on LMBP algorithm
Zang Construction of Mobile Internet Financial Risk Cautioning Framework Based on BP Neural Network
NİROB et al. Predicting Stock Price from Historical Data using LSTM Technique
Ma et al. Uncertainty and fluctuation in crude oil price: evidence from machine learning models
Deng et al. Financial futures prediction using fuzzy rough set and synthetic minority oversampling technique
Liu et al. Multi-factor stock trading strategy based on DQN with multi-BiGRU and multi-head ProbSparse self-attention
Shen et al. Bitcoin Return Volatility Forecasting: A Comparative Study of GARCH Model and Machine Learning Model
KR102519878B1 (ko) 금융기관 신용공여 사업에서의 인공지능 기반 리스크 관리 솔루션을 제공하기 위한 장치, 방법 및 명령을 기록한 기록 매체
Boda et al. Prediction of insolvency of Hungarian micro enterprises
Pongsena et al. Deep Learning for Financial Time-Series Data Analytics: An Image Processing Based Approach
Reintjes Automatic Identification and Classification of Share Buybacks and their Effect on Short-, Mid-and Long-Term Returns
Wang et al. Credit Risk Assessment and Early Warning of Supply Chain Finance Based on XGBoost-LSTM-A Model
Setiawan et al. Prediction of Stock Price Data of PT. Ramayana Lestari Sentosa Tbk. using Long Short Term Memory Model

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant