KR20230027903A - Apparatus for predicting fluctuation of stock price based on learning model - Google Patents
Apparatus for predicting fluctuation of stock price based on learning model Download PDFInfo
- Publication number
- KR20230027903A KR20230027903A KR1020210110192A KR20210110192A KR20230027903A KR 20230027903 A KR20230027903 A KR 20230027903A KR 1020210110192 A KR1020210110192 A KR 1020210110192A KR 20210110192 A KR20210110192 A KR 20210110192A KR 20230027903 A KR20230027903 A KR 20230027903A
- Authority
- KR
- South Korea
- Prior art keywords
- learning
- item
- stock
- evaluation
- data
- Prior art date
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 201
- 230000008859 change Effects 0.000 claims description 18
- 238000000926 separation method Methods 0.000 claims description 10
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007790 scraping Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Abstract
Description
본 발명은 사용자가 매매하려는 주식 종목에 대한 주가 변동성을 짧은 시간 주기로 예측 분석하기 위한 머신러닝 기반 지도학습을 수행하는 학습모델에 기초한 주가 변동 예측 장치에 관한 것이다.The present invention relates to a stock price fluctuation prediction device based on a learning model that performs machine learning-based supervised learning for predicting and analyzing the stock price volatility of a stock item that a user intends to trade in a short period of time.
증권사는 자산운용사 등의 기관으로부터 대량의 증권 주문을 위탁받아 증권 거래를 집행하고 거래수수료를 받는다.Securities companies are entrusted with large-volume securities orders from institutions such as asset management companies, execute securities transactions, and receive transaction fees.
만일 증권사가 위탁받은 대량의 증권 주문을 한번에 매도 또는 매수하게 된다면, 증권 시장의 주가가 급락하거나 급등하는 임팩트가 발생하게 되어 적절한 가격에 거래하기 어려워진다. 이러한 이유로, 증권사는 대량의 증권 주문을 나누어 집행하는 알고리즘 트레이딩 시스템을 사용한다.If a securities company sells or buys a large number of entrusted securities orders at once, the impact of a sharp drop or a sharp rise in stock prices in the stock market occurs, making it difficult to trade at an appropriate price. For this reason, securities companies use an algorithm trading system that divides and executes a large number of securities orders.
하지만, 기존의 알고리즘 트레이딩 시스템은 사전에 기설정된 규칙에 따라 주문을 분할하여 집행을 실시하기 때문에 변화하는 증권 시장에 적절히 대응하기 어려웠다.However, it is difficult to respond appropriately to the changing stock market because the existing algorithm-trading system divides and executes orders according to pre-set rules.
예를 들어, TWAP(Time Weighted Average Price) 알고리즘을 이용한 트레이딩 시스템의 경우, 시간이 지남에 따라 균등 분배된 수량으로 주문을 집행하기 때문에 시장에 대한 적응성과 효율성이 떨어질 수밖에 없다.For example, in the case of a trading system using a TWAP (Time Weighted Average Price) algorithm, since orders are executed with uniformly distributed quantities over time, adaptability to the market and efficiency are inevitably reduced.
한편, 최근 들어 금융분야에 IT기술이 도입되면서 인공지능(AI)기술은 영업, 마케팅, 투자관리, 트레이딩 등 다양한 분야에 적용되고 있고, 이에 따라 로보어드바이저(Robo-advisor)의 활용도 증가하고 있다.Meanwhile, with the recent introduction of IT technology in the financial field, artificial intelligence (AI) technology is being applied to various fields such as sales, marketing, investment management, and trading, and accordingly, the use of robo-advisors is increasing.
로보어드바이저(RoboAdvisor)는 로봇(Robot)과 어드바이저(Advisor)의 합성어로 빅데이터, 머신러닝, 알고리즘 등의 IT기술과 현대 포트폴리오 이론(MPT) 등의 금융이론이 결합되어 개인의 투자 성향 등을 반영하여 자동으로 포트폴리오를 구성하고 리밸런싱(재구성)하며, 운용해주는 온라인상의 자산 관리 서비스를 의미한다.RoboAdvisor is a compound word of robot and advisor, which combines IT technologies such as big data, machine learning, and algorithms with financial theories such as modern portfolio theory (MPT) to reflect individual investment propensity. It refers to an online asset management service that automatically composes, rebalances (reconstructs), and operates portfolios.
현재 대부분의 시중 은행들이나 증권사들이 로보어드바이저를 이용한 상품이나 서비스를 제공하고 있고, 로보어드바이저를 제공하는 스타트업 기업도 크게 성장하고 있는 추세이다.Currently, most commercial banks and securities companies are providing products or services using robo-advisors, and startup companies that provide robo-advisors are also growing significantly.
그러나, 이러한 로보어드바이저를 이용하여 제공되는 포트폴리오 서비스의 경우 실제 자산 관리 시 발생할 수 있는 다양한 변수들을 전혀 고려하지 않는 데다 자문의 범위 역시 ETF 등 금융상품간 포트폴리오 배분에 머물러 있다는 점에서 구조적 한계를 가지고 있다.However, portfolio services provided using these robo-advisors have structural limitations in that they do not consider various variables that may occur during actual asset management, and the scope of advice is limited to portfolio allocation among financial products such as ETFs. .
본 발명의 목적은 상기 문제점을 해결하기 위한 것으로서, 사용자가 매매하려는 주식 종목에 대한 주가 변동성을 짧은 시간 주기로 예측 분석하기 위한 머신러닝 기반 지도학습을 수행하는 학습모델에 기초한 주가 변동 예측 장치를 제공하는 것을 목적으로 한다.An object of the present invention is to solve the above problems, and to provide a stock price fluctuation prediction device based on a learning model that performs machine learning-based supervised learning for predicting and analyzing the stock price volatility of a stock item to be traded by a user in a short time period. aims to
상기와 같은 목적을 달성하기 위한 본 발명의 일면에 따른 학습모델에 기초한 주가 변동 예측 장치는, 머신러닝 기반 지도학습을 수행할 학습종목으로서 증권시장에 상장된 복수 개의 주식종목을 입력받는 학습종목 입력부와, 상기 입력받은 학습종목에 대한 과거 특정기간의 증권데이터에 기초하여 상기 학습종목에 포함된 각 주식종목에 대한 항목별 변동 상태를 나타내는 복수 개의 학습종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 학습데이터 생성모듈과, 상기 생성된 제1 학습데이터에 기초하여 미래 특정기간의 주가 변동 정도에 대한 예측 결과에 대응하도록 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 학습모델부와, 상기 학습종목에 포함된 적어도 어느 하나의 상기 주식종목을 사용자로부터 주가 변동성을 예측하고자 하는 평가대상종목으로 입력받는 평가대상종목 입력부와, 상기 입력받은 평가대상종목에 대한 과거 특정기간의 증권데이터에 기초하여 해당 종목에 대한 항목별 변동 상태를 나타내는 복수 개의 평가종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 평가데이터 생성모듈과, 상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 예측 분류부를 포함하는 것을 특징으로 한다.In order to achieve the above object, an apparatus for predicting stock price fluctuations based on a learning model according to an aspect of the present invention is a learning item input unit that receives a plurality of stock items listed on the stock market as learning items to perform machine learning-based supervised learning And, based on the stock data of the past specific period for the input learning item, a plurality of learning item binary codes representing the change status of each item for each stock item included in the learning item are generated, and then according to a preset order A learning data generation module that generates imaged first learning data by assigning pixel values corresponding to the listed results, and a prediction result for the degree of stock price fluctuation in a specific period in the future based on the generated first learning data. A learning model unit that performs supervised learning using a plurality of pre-set supervised learning values for each class, and an evaluation that receives at least one stock item included in the learning item as an evaluation target item to predict stock price volatility from a user Based on the target item input unit and the securities data of the past specific period for the subject item to be evaluated, a plurality of evaluation item binary codes indicating the change status of each item for the item are generated, and then the results are listed in a predetermined order. An evaluation data generation module that generates imaged first evaluation data by assigning a corresponding pixel value; and when receiving the first evaluation data after the supervised learning is completed, the first evaluation data is converted to the supervised learning value. It is characterized in that it includes a prediction classification unit for classifying into one of the plurality of classes according to the comparison.
바람직하게는, 상기 학습데이터 생성모듈은, 상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 일자별 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부와, 상기 학습종목에 대응하여 획득된 증권데이터에 기초하여 각 주식종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 학습종목 이진코드를 생성하는 학습종목 이진코드 생성부와, 상기 학습종목 이진코드 생성부에 의해 복수 개의 상기 학습종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 학습종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 제1 학습데이터 생성부를 포함하는 것을 특징으로 한다.Preferably, the learning data generating module provides stock data including at least one of stock price information by time slot, trading volume information, supply and demand trend information, and daily market capitalization ranking information for each of a plurality of stock issues included in the learning issue. A stock data acquiring unit that acquires in real time, and a plurality of bit values consisting of a preset number of bits for each stock item based on the acquired stock data corresponding to the learning item, a preset item code, a preset type code, and the item Learning to create a learning item binary code by allocating a state code indicating a state value according to a comparison according to a current value or a preset standard corresponding to the code or the type code, and a content code indicating a detailed value corresponding to the state code. When a plurality of learning item binary codes are generated by an item binary code generation unit and the learning item binary code generation unit, they are arranged in a predetermined order, and pixels corresponding to the binary values of the plurality of learning item binary codes listed. It is characterized in that it includes a first learning data generation unit that generates imaged first learning data as a value is assigned.
바람직하게는, 상기 학습데이터 생성모듈은, 상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 소정의 학습기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 각 주식종목별 언급량 변동 추이를 나타내는 복수 개의 제1 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 것이고, 상기 학습모델부는, 상기 제1 학습데이터 또는 상기 제2 학습데이터 각각에 대응하여 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 것을 특징으로 한다.Preferably, the learning data generation module indicates a change in the amount of mention for each stock item based on unstructured data including the amount of keyword mention during a predetermined learning period for each of a plurality of stock items included in the learning item. After generating a plurality of first buzz amount binary codes, pixel values corresponding to the results arranged in a predetermined order are assigned to generate imaged second learning data, and the learning model unit comprises the first learning data or It is characterized in that supervised learning is performed using a plurality of pre-set supervised learning values for each class corresponding to each of the second learning data.
또한, 상기 학습데이터 생성모듈은, 상기 학습종목에 포함된 복수 개의 주식종목 각각에 대응하는 키워드를 이용하여 상기 학습기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 주식종목별 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 비정형데이터 획득부와, 상기 학습종목에 대응하여 획득된 비정형데이터에 기초하여 각 주식 종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제1 항목코드, 상기 제1 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제1 상태코드, 상기 제1 상태코드에 대응되는 세부값을 나타내는 제1 내용코드로 각각 할당하여 제1 버즈량 이진코드를 생성하는 제1 버즈량 이진코드 생성부와, 상기 제1 버즈량 이진코드 생성부에 의해 복수 개의 상기 제1 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 제1 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 제2 학습데이터 생성부를 포함하는 것을 특징으로 한다.In addition, the learning data generating module includes unstructured data including the amount of keyword mentions for each stock item as a result of searching for a web page on the Internet created during the learning period using a keyword corresponding to each of a plurality of stock items included in the learning item. an unstructured data acquisition unit that obtains in real time, and a plurality of bit values consisting of a preset number of bits for each stock item based on the unstructured data acquired in correspondence with the learning item, a first item code set in advance, and the first item Corresponding to the code, a first status code indicating a state value according to comparison according to a current value or a preset standard and a first content code indicating a detailed value corresponding to the first state code are assigned to the first buzz quantity binary code. When a plurality of the first buzz amount binary codes are generated by a first buzz amount binary code generator that generates a buzz amount and the first buzz amount binary code generator, they are arranged in a predetermined order, and a plurality of the listed first buzz amount binary codes are generated. It is characterized in that it includes a second learning data generation unit that generates imaged second learning data by assigning a pixel value corresponding to the binary value of the 1-buzz binary code.
바람직하게는, 상기 평가데이터 생성모듈은, 상기 평가대상종목에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부와, 상기 평가대상종목에 대응하여 획득된 증권데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 평가종목 이진코드를 생성하는 평가종목 이진코드 생성부와, 상기 평가종목 이진코드 생성부에 의해 복수 개의 상기 평가종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 평가종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 제1 평가데이터 생성부를 포함하는 것을 특징으로 한다.Preferably, the evaluation data generation module includes a stock data acquisition unit that acquires stock data including at least one of stock price information, trading volume information, supply and demand trend information, and market capitalization ranking information for each time period for the evaluation target stock in real time and a plurality of bit values composed of a preset number of bits based on the securities data acquired corresponding to the evaluation target issue, a preset item code, a preset type code, a current value corresponding to the item code or the type code, or An evaluation item binary code generation unit for generating an evaluation item binary code by allocating a status code representing a status value according to comparison according to a predetermined standard and a content code representing a detailed value corresponding to the status code, and the evaluation item binary code When a plurality of binary codes for evaluation items are generated by the code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the plurality of binary codes for evaluation items are assigned to the imaged first evaluation data. It is characterized in that it comprises a first evaluation data generation unit for generating.
바람직하게는, 상기 평가데이터 생성모듈은, 상기 평가대상종목에 대한 소정의 평가기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 해당 종목의 언급량 변동 추이를 나타내는 복수 개의 제2 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 것이고, 상기 예측 분류부는, 상기 지도학습이 완료된 후 상기 제1 평가데이터와 상기 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 것을 특징으로 한다.Preferably, the evaluation data generation module includes a plurality of second buzz amount binaries representing changes in the amount of mention of the item based on unstructured data including the amount of mention of keywords for a predetermined evaluation period for the item to be evaluated. After generating a code, pixel values corresponding to the results listed in a predetermined order are assigned to generate imaged second evaluation data, and the prediction classifier generates the first evaluation data and the second evaluation data after the supervised learning is completed. When at least one of the second evaluation data is received, the received evaluation data is compared with the supervised learning value and classified into one of the plurality of classes.
또한, 상기 평가데이터 생성모듈은, 상기 평가대상종목에 대응하는 키워드를 이용하여 상기 평가기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 제2 버즈량데이터 획득부와, 상기 평가대상종목에 대응하여 획득된 비정형데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제2 항목코드, 상기 제2 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제2 상태코드, 상기 제2 상태코드에 대응되는 세부값을 나타내는 제2 내용코드로 각각 할당하여 제2 버즈량 이진코드를 생성하는 제2 버즈량 이진코드 생성부와, 상기 제2 버즈량 이진코드 생성부에 의해 복수 개의 상기 제2 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고 나열된 복수 개의 상기 제2 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 제2 평가데이터 생성부를 포함하는 것을 특징으로 한다.In addition, the evaluation data generating module acquires, in real time, unstructured data including the amount of keyword mentions by searching web pages on the Internet created during the evaluation period using keywords corresponding to the evaluation target items. A data acquisition unit converts a plurality of bit values consisting of a preset number of bits based on unstructured data obtained corresponding to the evaluation target item to a preset second item code, a current value corresponding to the second item code, or a preset A second buzz amount binary code for generating a second buzz amount binary code by allocating a second status code indicating a state value according to comparison according to a standard and a second content code indicating a detailed value corresponding to the second state code. When a plurality of second buzz amount binary codes are generated by a generation unit and the second buzz amount binary code generation unit, they are arranged in a predetermined order and correspond to the binary values of the plurality of second buzz amount binary codes listed. It is characterized in that it includes a second evaluation data generation unit that generates imaged second evaluation data by assigning one pixel value.
바람직하게는, 현재시점 이전의 서로 상이한 제1 시점 및 제2 시점 각각을 기준으로 기설정된 시간 동안의 제1 기간 및 제2 기간을 중복없이 설정하는 학습기간 설정부와, 상기 평가대상종목의 입력시점 이전의 서로 상이한 제3 시점 및 제4 시점 각각을 기준으로 기설정된 시간 동안의 제3 기간 및 제4 기간을 중복없이 설정하는 평가기간 설정부를 더 포함하며, 상기 학습종목 이진코드 생성부 및 상기 평가종목 이진코드 생성부는, 상기 학습종목 입력부 또는 상기 평가대상종목 입력부를 통해 입력받은 적어도 하나의 주식종목에 대응되는 증권데이터에 기초하여 상기 학습종목 이진코드 또는 상기 평가종목 이진코드를 생성하되, 상기 주식종목에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 주식종목에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 주식종목에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 주식종목에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것을 특징으로 한다.Preferably, a learning period setting unit for setting a first period and a second period for a predetermined time based on each of the first and second time points that are different from each other prior to the current time point without overlapping, and the input of the evaluation target item It further includes an evaluation period setting unit for setting a third period and a fourth period for a predetermined time based on each of the third and fourth time points prior to the point in time without overlap, and the learning item binary code generation unit and the The evaluation item binary code generation unit generates the learning item binary code or the evaluation item binary code based on the stock data corresponding to at least one stock item input through the learning item input unit or the evaluation item item input unit, A first binary code generated based on the stock price information for each time period collected for a stock item, a second binary code generated based on the trading volume information collected for the stock item, and a supply and demand trend collected for the stock item. It is characterized in that at least one of a third binary code generated based on information and a fourth binary code generated based on the market capitalization ranking collected for the stock item is generated.
또한, 상기 복수 개의 클래스는, 상기 제1 기간 및 상기 제2 기간에 기초한 지도학습 결과에 기초하여 현재시점 이후의 제5 기간에 대한 주가 추세의 상승 또는 하락 여부와 이에 따른 이격 정도를 분류하여 설정한 것이고, 상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터에 기초한 상기 복수 개의 클래스 각각에 대한 확률 분포를 계산하여 기설정된 군집화 알고리즘에 따라 군집화하는 군집화부를 더 포함하는 것을 특징으로 한다.In addition, the plurality of classes are set by classifying whether the stock price trend for the fifth period after the current time has risen or fallen and the degree of separation accordingly based on the supervised learning results based on the first period and the second period. and, when the first evaluation data is received after the supervised learning is completed, a probability distribution for each of the plurality of classes based on the first evaluation data is calculated and a clustering unit for clustering according to a preset clustering algorithm is further included. It is characterized by doing.
또한, 상기 군집화된 결과에 기초하여 가장 유사도가 높은 클래스에 대응하는 상기 기준학습값에 대한 이격 정도를 기설정된 임계치와 비교한 결과에 따라 상기 평가대상종목에 대한 매수 또는 매도 여부를 결정하는 매매 결정부를 더 포함하는 것을 특징으로 한다.In addition, based on the clustering result, a trading decision to determine whether to buy or sell the evaluation target item according to a result of comparing the degree of separation from the reference learning value corresponding to the class with the highest similarity with a preset threshold It is characterized in that it further includes wealth.
본 발명에 따르면, 지도 학습을 수행할 학습종목에 대한 학습데이터의 생성 시 증권데이터의 과거 주가 변동 상태에 대한 다양한 지표 정보들과 각종 이슈에 따른 버즈량 정보를 모두 반영함으로써 미래 특정기간의 주가 추세 변동 및 정도에 대한 예측 결과값의 정확도를 향상시킬 수 있는 효과가 있다.According to the present invention, when generating learning data for a learning item to perform supervised learning, various index information on the past stock price fluctuation state of stock data and buzz volume information according to various issues are reflected, so that the stock price trend of a specific period in the future There is an effect of improving the accuracy of the predicted result value for the variation and degree.
또한, 본 발명에 따르면, 각 주식종목에 대한 학습 데이터 또는 평가 데이터의 생성 시 필요한 정보들을 압축한 2진수 코드값을 이용하므로 학습모델에 기초한 주가 변동 예측 장치를 단순화하여 구현할 수 있는 이점이 있다.In addition, according to the present invention, since a binary code value in which necessary information is compressed when generating learning data or evaluation data for each stock item is used, there is an advantage in simplifying and implementing a stock price fluctuation prediction device based on a learning model.
또한, 본 발명에 따르면, 지도 학습에 이용되는 학습데이터 또는 예측 분석에 이용되는 평가데이터를 생성할 때 기초가 되는 이진코드의 할당 시 관리자의 입력에 따라 주가 관련 지표들에 대한 설정값을 용이하게 설정 및 변경 가능함으로써, 고객 맞춤형 개별 예측 분석이 가능한 자산 관리 포트폴리오 서비스를 제공할 수 있는 효과가 있다.In addition, according to the present invention, when generating learning data used for supervised learning or evaluation data used for predictive analysis, setting values for stock price-related indicators are easily set according to a manager's input when assigning a binary code as a basis. By being able to set and change, there is an effect of providing an asset management portfolio service capable of individual predictive analysis tailored to customers.
도 1은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치를 개략적으로 설명하기 위한 도면이고,
도 2는 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 구성을 나타내는 블록도이고,
도 3은 도 2의 학습종목 이진코드 생성부 또는 평가종목 이진코드 생성부에 의해 생성되는 학습종목 이진코드 또는 평가종목 이진코드를 할당 영역별로 구분하여 나타낸 도면이고,
도 4는 도 2의 학습모델부에서 지도학습 수행 시 이용하는 복수 개의 클래스별 지도학습값의 일례를 나타낸 도면이고,
도 5는 도 2의 예측 분류부에서 평가대상종목에 대한 과거 평가데이터에 기초하여 미래 특정기간의 주가 변동 예측 정도에 대응하는 클래스로 분류하는 방법을 설명하기 위해 시간별 주가 및 거래량 그래프상에 표시한 도면이고,
도 6은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 동작 흐름을 나타낸 순서도이다.1 is a diagram for schematically explaining an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention;
2 is a block diagram showing the configuration of an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention;
FIG. 3 is a diagram showing the binary codes for learning items or the binary codes for evaluation items generated by the binary code generation unit for learning items or the binary code for evaluation items in FIG. 2 divided into assigned areas;
4 is a diagram showing an example of supervised learning values for each of a plurality of classes used when performing supervised learning in the learning model unit of FIG. 2;
5 is displayed on a graph of stock price and trading volume by hour to explain a method of classifying a method of classifying into a class corresponding to the predicted degree of stock price change in a specific period in the future based on past evaluation data for an item to be evaluated in the prediction classification unit of FIG. 2 is a drawing,
6 is a flowchart illustrating an operation flow of an apparatus for predicting stock price fluctuation based on a learning model according to an embodiment of the present invention.
이상과 같은 본 발명에 대한 해결하려는 과제, 과제의 해결수단, 발명의 효과를 포함한 구체적인 사항들은 다음에 기재할 실시예 및 도면에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예를 참조하면 명확해질 것이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.The specific details, including the problems to be solved, the solutions to the problems, and the effect of the invention for the present invention as described above are included in the embodiments and drawings to be described below. Advantages and features of the present invention, and methods of achieving them, will become clear with reference to the detailed description of the following embodiments taken in conjunction with the accompanying drawings. Like reference numbers designate like elements throughout the specification.
도 1은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치를 개략적으로 설명하기 위한 도면이고, 도 2는 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 구성을 나타내는 블록도이고, 도 3은 도 2의 학습종목 이진코드 생성부 또는 평가종목 이진코드 생성부에 의해 생성되는 학습종목 이진코드 또는 평가종목 이진코드를 할당 영역별로 구분하여 나타낸 도면이고, 도 4는 도 2의 학습모델부에서 지도학습 수행 시 이용하는 복수 개의 클래스별 지도학습값의 일례를 나타낸 도면이고, 도 5는 도 2의 예측 분류부에서 평가대상종목에 대한 과거 평가데이터에 기초하여 미래 특정기간의 주가 변동 예측 정도에 대응하는 클래스로 분류하는 방법을 설명하기 위해 시간별 주가 및 거래량 그래프상에 표시한 도면이고, 도 6은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 동작 흐름을 나타낸 순서도이다.1 is a diagram for schematically explaining an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention, and FIG. 2 shows a configuration of an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention. FIG. 3 is a diagram showing the learning item binary code or the evaluation item binary code generated by the learning item binary code generator or the evaluation item binary code generator of FIG. It is a diagram showing an example of a plurality of supervised learning values for each class used when supervised learning is performed in the learning model unit of FIG. 2, and FIG. 5 is a future specific period based on past evaluation data for an item to be evaluated in the prediction classification unit of FIG. It is a diagram displayed on the hourly stock price and trading volume graph to explain a method of classifying into a class corresponding to the predicted degree of stock price change, and FIG. Here is a flow chart showing the flow.
이하, 전술한 도면들을 참조하여 본 발명의 바람직한 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치에 대해 설명하도록 한다.Hereinafter, an apparatus for predicting stock price fluctuation based on a learning model according to a preferred embodiment of the present invention will be described with reference to the above-described drawings.
도 1을 참조하면, 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치(1000)는 크게 학습종목 입력부(10), 학습기간 설정부(20), 평가대상종목 입력부(30), 평가기간 설정부(40), 학습데이터 생성모듈(100), 학습모델부(200), 평가데이터 생성모듈(300) 및 예측모듈(400)을 포함하여 구성된다.Referring to FIG. 1, the stock price
학습종목 입력부(10)는 머신러닝 기반 지도학습을 수행할 학습종목(IL)을 입력받기 위한 것이다(S610).The learning
학습종목 입력부(10)는 학습종목(IL)으로서 증권시장에 상장된 복수 개의 주식종목을 관리자로부터 입력받는다.The learning
학습종목 입력부(10)는 관리자단말기(1)와 데이터 통신 연결된 상태일 수 있으며, 현재 증권시장에 상장된 모든 주식종목들 중에서 관리자가 선택 입력한 결과를 관리자단말기(1)로부터 수신하여 수신한 선택 입력에 대응하는 주식종목을 학습종목(IL)으로 입력받을 수 있다.The learning
학습기간 설정부(20)는 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 대한 지도학습을 수행하기 위한 학습데이터의 생성 시 기초가 되는 비정형데이터 및 증권데이터의 획득 기간을 특정하여 학습기간(PS)을 설정한다.The learning
학습기간 설정부(20)는 상기 학습기간(PS)을 설정함에 있어서 현재시점 이전의 서로 상이한 제1 시점(T1) 및 제2 시점(T2) 각각을 기준으로 기설정된 시간 동안의 제1 기간(P1) 및 제2 기간(P2)을 중복없이 설정하되, 제2 기간(P2)은 제1 기간(P1) 이후 기설정된 시간간격을 두도록 설정할 수 있다.In setting the learning period (P S ), the learning
학습기간 설정부(20)는 학습종목(IL)에 대한 대량의 학습데이터를 이용하여 지도학습을 반복적으로 수행할 수 있도록 일정 시간 주기 단위마다 학습기간(PS)을 새로 설정하여 업데이트할 수 있다.The learning
평가대상종목 입력부(30)는 주가 변동성을 예측하고자 하는 평가대상종목(IE)을 입력받기 위한 것이다(S640).The evaluation target
평가대상종목 입력부(30)는 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 포함된 복수 개의 주식종목 중에서 적어도 어느 하나의 주식종목을 사용자로부터 평가대상종목(IE)으로 입력받는다.The evaluation target
평가대상종목 입력부(30)는 사용자단말기(3)와 데이터 통신 연결된 상태일 수 있으며, 학습종목(IL)에 포함된 복수 개의 주식종목 중에서 사용자가 선택 입력한 결과를 사용자단말기(3)로부터 수신하여 수신한 선택 입력에 대응하는 주식종목을 평가대상종목(IE)으로 입력받을 수 있다.The evaluation target
평가기간 설정부(40)는 평가대상종목(IE)에 대한 평가데이터의 생성 시 기초가 되는 비정형데이터 및 증권데이터의 획득 기간을 특정하여 평가기간(PE)을 설정하는 것으로, 전술한 학습기간 설정부(20)와 동일한 기능을 수행하는 것일 수 있다.The evaluation
평가기간 설정부(40)는 상기 평가기간(PE)을 설정함에 있어서 평가대상종목(IE)의 입력시점(TC) 이전의 서로 상이한 제3 시점(T3) 및 제4 시점(T4) 각각을 기준으로 기설정된 시간 동안의 제3 기간(P3) 및 제4 기간(P4)을 중복없이 설정하되, 제4 기간(P4)은 제3 기간(P3) 이후 기설정된 시간간격을 두도록 설정할 수 있다.In setting the evaluation period ( PE ), the evaluation
이때, 학습기간(PS)에 기초한 제1 시점(T1) 및 제2 시점(T2)에서 현재시점까지의 시간간격과 평가기간(PE)에 기초한 제3 시점(T3) 및 제4 시점(T4)에서 평가대상종목(IE)의 입력시점(TC)까지의 시간간격은 동일하게 설정될 수 있다.At this time, the time interval from the first time point (T 1 ) and the second time point (T 2 ) based on the learning period ( PS ) to the current time point and the third time point (T 3 ) based on the evaluation period ( PE ) and the second time point (T 3 ) The time interval from the 4th time point (T 4 ) to the input time point (T C ) of the evaluation target item (I E ) can be set identically.
학습데이터 생성모듈(100)은 학습종목(IL) 및 학습기간(PS)에 기초한 지도학습에 기반이 되는 학습데이터를 생성하는 역할을 한다(S620).The learning
학습데이터 생성모듈(100)은 실질적인 주가 변동 상태가 반영된 증권데이터를 기반으로 한 제1 학습데이터와, 각종 이슈에 따른 투자 심리가 반영된 비정형데이터를 기반으로 한 제2 학습데이터 중 적어도 하나를 생성한다.The learning
구체적으로, 학습데이터 생성모듈(100)은 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 대한 과거 특정기간의 증권데이터에 기초하여 학습종목(IL)에 포함된 각 주식종목에 대한 항목별 변동 상태를 나타내는 복수 개의 학습종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성할 수 있다.Specifically, the learning
또한, 학습데이터 생성모듈(100)은, 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대한 소정의 학습기간(PS) 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 각 주식종목별 언급량 변동 추이를 나타내는 복수 개의 제1 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성할 수 있다.In addition, the learning
이와 관련하여, 학습데이터 생성모듈(100)은 도 2에 도시된 바와 같이 제1 학습데이터의 생성에 관여하는 증권데이터 획득부(110), 학습종목 이진코드 생성부(120) 및 제1 학습데이터 생성부(130)와, 제2 학습데이터의 생성에 관여하는 비정형데이터 획득부(140), 제1 버즈량 이진코드 생성부(150) 및 제2 학습데이터 이진코드 생성부(160)를 포함할 수 있다.In this regard, the learning
증권데이터 획득부(110)는 상기 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 일자별 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득한다.The stock
증권데이터 획득부(110)는 다수의 증권사 API를 통해 해당 증권사 서버에 접속하여 파이썬(Python) 언어를 기반으로 하는 웹 스크래핑(Web Scraping) 기법을 이용해 주식종목별 증권데이터를 실시간으로 획득하는 것일 수 있다.The stock
학습종목 이진코드 생성부(120)는 상기 학습종목(IL)에 대응하여 획득된 증권데이터에 기초하여 주식종목별 주가 변동 상태 정보를 이진코드 형태로 생성한다.The learning item binary
학습종목 이진코드 생성부(120)는 각 주식종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 학습종목 이진코드를 생성할 수 있다.The learning item binary
여기서, 학습종목 이진코드 생성부(120)는 학습종목 입력부(10)를 통해 입력받은 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대응되는 증권데이터에 기초하여 학습종목 이진코드를 생성하되, 상기 주식종목에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 주식종목에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 주식종목에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 주식종목에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것일 수 있다.Here, the learning item binary
이때, 학습종목 이진코드 생성부(120)는 도 3에 도시된 바와 같이 헤더 영역(50)을 제외한 복수의 데이터 영역들을 각각 기설정된 비트수에 따른 제1 이진코드 영역(51), 상기 제1 이진코드 영역(51)보다 하위 비트 영역에 할당되는 제2 이진코드 영역(52), 상기 제2 이진코드 영역(52)보다 하위 비트 영역에 할당되는 제3 이진코드 영역(53), 상기 제3 이진코드 영역(53)보다 하위 비트 영역에 할당되는 제4 이진코드 영역(54)으로 구분하여 상기 복수의 데이터 영역들에 대응하는 이진코드값을 생성할 수 있다.At this time, as shown in FIG. 3, the learning item binary
이 경우, 제1 이진코드 영역(51)에 상기 제1 이진코드를 생성하고 제2 이진코드 영역(52)에 상기 제2 이진코드를 생성하고 제3 이진코드 영역(53)에 상기 제3 이진코드를 생성하고 제4 이진코드 영역(54)에 상기 제4 이진코드를 생성할 수 있다.In this case, the first binary code is generated in the first
여기서, 상기 제1 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 각 주식종목에 대한 시간대별 주가 정보를 이용하여, 아래의 표 1에 기재된 바와 같이, 각 주식종목에 대한 소정 단위별 이동평균선(Moving Average)을 기준으로 한 추세 방향 정보가 상기 상태코드로 할당되고, 상기 이동평균선의 단위구분값 및 기준단위값이 상기 종류코드 및 상기 내용코드로 각각 할당되는 것일 수 있다.Here, the first binary code uses stock price information for each time period for each stock item acquired by the stock
이때, 상기 이동평균선은 일정 기간 동안의 주가를 산술 평균한 값인 주가 이동 평균을 차례로 연결해 만든 선을 나타내며, 일반적으로 주식시장에서 주가의 흐름을 관찰하기 위한 기술적 분석을 할 때 기본적으로 사용되는 도구에 속하므로 이에 대한 자세한 설명은 생략하도록 한다.At this time, the moving average line represents a line created by sequentially connecting stock price moving averages, which are arithmetic averages of stock prices over a certain period of time. Therefore, a detailed description thereof will be omitted.
(1100)momentum
(1100)
시
일
주
월minute
city
Day
main
month
010
011
101
110001
010
011
101
110
여기서, 상기 제2 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 시간대별 거래량 정보를 이용하여, 아래의 표 2에 기재된 바와 같이, 학습기간(PS)에 속하는 제1 기간(P1) 동안 누적된 거래량의 평균인 제1 평균 거래량(V1)과 학습기간(PS)에 속하는 제2 기간(P2) 동안 누적된 거래량의 평균인 제2 평균 거래량(V2)에 기초하여, 제1 평균 거래량(V1) 대비 제2 평균 거래량(V2)의 증감 여부 및 정도에 대응되는 상태값 및 세부값이 상기 상태코드 및 상기 내용코드로 각각 할당되는 것일 수 있다.Here, the second binary code is the learning period (P S ) The first average transaction volume ( V1 ), which is the average of the accumulated transaction volumes during the first period (P 1 ) belonging to the learning period (P S ), and the second average, which is the average of the accumulated transaction volumes during the second period (P 2 ) belonging to the learning period (P S ) Based on the transaction volume (V2), the state value and the detailed value corresponding to whether and the degree of increase or decrease of the second average transaction volume (V2) compared to the first average transaction volume (V1) may be assigned to the status code and the content code, respectively. there is.
(0001)trading volume
(0001)
(000)Not applicable
(000)
(-1 이상 하락 또는 1 미만 상승)V1 = V2
(Drop by -1 or rise by less than 1)
여기서, 상기 제3 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 시간대별 수급 동향 정보를 이용하여, 아래의 표 3에 기재된 바와 같이, 과거 소정시점으로부터 현재시점까지의 기간(S) 동안의 연속 매수 또는 매도의 발생 여부 및 정도에 대응되는 상태값 및 세부값이 상기 상태코드 및 상기 내용코드로 각각 할당되는 것일 수 있다.Here, the third binary code corresponds to the learning item ( IL ) by using the supply and demand trend information for each time period acquired by the stock
이때, Ps1과 Ps2는 서로 상이하게 기설정된 제1 수급기간 및 제2 수급기간을 각각 나타내고, G는 기설정된 퍼센트를 나타낸다.At this time, Ps 1 and Ps 2 represent a first supply and demand period and a second supply and demand period that are set differently from each other, and G represents a preset percentage.
(0101)supply and demand I
(0101)
외국인
연기금Agency
foreigner
pension fund
010
011001
010
011
(연속 매도)S > Ps 1
(continuous selling)
(연속 매수)S > Ps 1
(continuous purchase)
(0110)supply and demand II
(0110)
외국인
연기금Agency
foreigner
pension fund
010
011001
010
011
(G 이상 매도)S ⊂ Ps 2
(Sell above G)
(G 이상 매수)S ⊂ Ps 2
(Buy more than G)
여기서, 상기 제4 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 일자별 총액 순위 정보를 이용하여, 아래의 표 4에 기재된 바와 같이, 기설정된 복수 개의 순위 범위 중에서 상기 주식종목이 속하는 순위 범위에 대응되는 상태값이 상기 상태코드로 할당되고, 상기 주식종목이 상장된 시장 종류 정보가 상기 종류코드로 할당되는 것일 수 있다.Here, the fourth binary code corresponds to the learning item ( IL ), using the daily total ranking information obtained by the stock
item code
(1001)Market cap ranking
(1001)
코스닥KOSPI
KOSDAQ
010001
010
(301위 이하)1st scope
(301st and below)
(101위~300위)2nd scope
(101st - 300th)
(51위~100위)3rd scope
(51st to 100th)
(50위 이내)4th scope
(within top 50)
아래의 표 5는 전술한 바에 따라 생성되는 상기 제1 이진코드 내지 상기 제4 이진코드 각각의 일례를 표로 정리하여 나타낸 것이다. Table 5 below shows an example of each of the first to fourth binary codes generated as described above in a table.
(모멘텀)1100
(momentum)
(거래량)0001
(trading volume)
(수급 I)0101
(supply and demand I)
(수급 II)0110
(supply and demand II)
(시가총액순위)1001
(Market cap ranking)
예컨대, 상기 표 5를 참조하면, 상기 제1 이진코드는 '모멘텀'에 대응하는 항목코드 "1100"와, 이동평균선의 단위구분값이 '일(단위)'임을 나타내는 종류코드 "011"과, 현재 주가의 추세 방향이 이동평균선보다 높은 상태(상승 추세)를 나타내는 상태코드 "001"과, 이동평균선의 기준단위값이 '5(일)'임을 나타내는 내용코드 "0101"을 포함할 수 있으며, 이는 현재 주가가 5일 이동평균선 이상인 경우를 나타낸다.For example, referring to Table 5, the first binary code includes item code "1100" corresponding to 'momentum', type code "011" indicating that the unit division value of the moving average line is 'day (unit)', It may include the status code "001" indicating that the trend direction of the current stock price is higher than the moving average line (uptrend), and the content code "0101" indicating that the reference unit value of the moving average line is '5 (day)', This indicates that the current stock price is above the 5-day moving average.
또한, 상기 제2 이진코드는 '거래량'에 대응하는 항목코드 "0001"과, 제1 평균 거래량(V1)이 제2 평균 거래량(V2)보다 작은 상태를 나타내는 상태코드 "001"와, 두 평균 거래량의 차이가 '5[%]'임을 나타내는 내용코드 "0101"을 포함할 수 있으며, 이는 제1 기간 거래량 평균 대비 제2 기간 거래량 평균이 5% 상승한 경우를 나타낸다.In addition, the second binary code includes an item code "0001" corresponding to 'transaction volume', a status code "001" indicating a state in which the first average transaction volume (V1) is smaller than the second average transaction volume (V2), and the average of the two It may include content code "0101" indicating that the difference in trading volume is '5[%]', which indicates a case in which the average trading volume of the second period is increased by 5% compared to the average trading volume of the first period.
또한, 제1 수급기간(PS1)이 '3일'로 기설정된 상태일 때 상기 제3 이진코드는 '수급 I'에 대응하는 항목코드 "0101"과, 수급주체가 '기관'임을 나타내는 종류코드 "001"과, 기설정된 제1 수급기간(PS1)보다 큰 수급기간(S) 동안 연속 매도한 상태를 나타내는 상태코드 "101"과, 수급기간(S)의 상세값이 '5(일)'임을 나타내는 내용코드 "0101"을 포함할 수 있으며, 이는 기관이 5일 연속 매도한 경우를 나타낸다.In addition, when the first supply and demand period (P S1 ) is set to '3 days', the third binary code is the item code "0101" corresponding to 'supply and demand I' and the type indicating that the supply and demand subject is an 'institution'. The code "001", the status code "101" indicating the state of continuous selling during the supply and demand period (S) greater than the preset first supply and demand period (P S1 ), and the detailed value of the supply and demand period (S) are '5 (days) )', which indicates that the institution has sold for 5 consecutive days.
또한, 제2 수급기간(PS2)이 '10일'이고 기준 퍼센트(G)가 '50%'로 기설정된 상태일 때 상기 제3 이진코드는 '수급 II'에 대응하는 항목코드 "0110"과, 수급주체가 '기관'임을 나타내는 종류코드 "001"과, 기설정된 제2 수급기간(PS2)보다 큰 수급기간(S) 동안 50% 이상 연속 매도한 상태를 나타내는 상태코드 "101"과, 수급기간(S)의 상세값이 '7(일)'임을 나타내는 내용코드 "0111"을 포함할 수 있으며, 이는 기관이 최근 10일 중 7일 매도한 경우를 나타낸다.In addition, when the second supply and demand period (P S2 ) is '10 days' and the reference percentage (G) is preset to '50%', the third binary code is item code "0110" corresponding to 'supply and demand II' and "001", a type code indicating that the supply and demand subject is an 'institution', and a status code "101" indicating a state of continuous sales of 50% or more during a supply and demand period (S) greater than the preset second supply and demand period (P S2 ) , The content code "0111" indicating that the detailed value of the supply period (S) is '7 (day)', which indicates that the institution has sold 7 days out of the last 10 days.
또한, 상기 제4 이진코드는 '시가총액순위'에 대응하는 항목코드 "1001"과, 주식종목 A가 상장된 시장 종류가 '코스피'임을 나타내는 종류코드 "001"과, 주식종목 A가 속하는 순위 범위가 '제2 범위'임을 나타내는 상태코드 "001"를 포함할 수 있으며, 이는 코스피 A종목의 시가 총액 순위가 101~300 위인 경우를 나타낸다.In addition, the fourth binary code includes an item code "1001" corresponding to 'market capitalization ranking', a type code "001" indicating that the type of market in which stock item A is listed is 'KOSPI', and a ranking to which stock item A belongs. The status code "001" indicating that the range is 'second range' may be included, which indicates a case where the market capitalization ranking of KOSPI A stock is 101 to 300.
제1 학습데이터 생성부(130)는 학습종목 이진코드 생성부(120)에 의해 복수 개의 상기 학습종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 학습종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성한다.When a plurality of the learning item binary codes are generated by the learning item
여기서, 제1 학습데이터 생성부(130)는 상기 학습종목 이진코드를 소정 비트(bit) 단위로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제1 학습데이터를 생성할 수 있다.Here, the first learning
비정형데이터 획득부(140)는 상기 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대응하는 키워드를 이용하여 상기 학습기간(PS)에 작성된 인터넷상의 웹페이지를 검색함에 따른 주식종목별 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득한다.The unstructured
비정형데이터 획득부(140)는 소정의 프로그래밍 언어, 예컨대, 파이썬(Python)을 이용한 쿼리 기반 접근 방식에 따른 웹 크롤링(Web Crawling) 및 파싱(Parsing) 기법을 통해 각 주식종목에 대응하는 키워드 문자열에 기초한 웹 검색을 수행함에 따른 키워드 언급량을 산출함에 따른 비정형데이터를 실시간으로 획득하는 것일 수 있다.The unstructured
제1 버즈량 이진코드 생성부(150)는 상기 학습종목(IL)에 대응하여 획득된 비정형데이터에 기초하여 주식종목별 이슈에 따른 버즈량 정보를 이진코드 형태로 생성한다.The first buzz amount binary
제1 버즈량 이진코드 생성부(150)는 각 주식 종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제1 항목코드, 상기 제1 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제1 상태코드, 상기 제1 상태코드에 대응되는 세부값을 나타내는 제1 내용코드로 각각 할당하여 제1 버즈량 이진코드를 생성할 수 있다.The first buzz amount binary
제2 학습데이터 생성부(160)는 제1 버즈량 이진코드 생성부(150)에 의해 복수 개의 상기 제1 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 제1 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성한다.When a plurality of first buzz amount binary codes are generated by the first buzz amount
여기서, 제2 학습데이터 생성부(160)는 상기 제1 버즈량 이진코드를 소정 비트 단위(bit)로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제2 학습데이터를 생성할 수 있다.Here, the second learning data generation unit 160 divides the first buzz amount binary code into predetermined bit units to represent one pixel per unit, thereby meeting the specifications of the input layer of the learning model. Second learning data in the form of an image, that is, an image having the same ratio as the ratio of rows and columns of the matrix of the input layer may be generated.
학습모델부(200)는 학습데이터 생성모듈(100)에 의해 생성된 학습데이터에 기초하여 학습종목(IL)의 미래 특정기간의 주가 변동 정도에 대한 예측을 위한 지도학습을 수행한다(S630).The
학습모델부(200)는 제1 학습데이터 생성부(130)에 의해 생성된 제1 학습데이터 또는 제2 학습데이터 생성부(160)에 의해 생성된 제2 학습데이터 각각에 기초하여 학습종목(IL)의 추후 주가 변동 정도에 대한 예측결과에 대응하도록 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행할 수 있다.The
학습모델부(200)는 입력층과, 콘볼루션 연산을 수행하는 복수 개의 콘볼루션층과, 연산된 데이터의 크기를 축소하는 복수 개의 풀링층과, 풀링된 데이터를 비선형적으로 변형함에 따라 클래스별 분류가 용이하도록 하는 복수 개의 활성화함수층을 포함하는 신경망 구조로 이루어진 합성곱 신경망(CNN; Convolution Neural Network)을 기반으로 하는 CNN 학습모델을 포함할 수 있다.The
이 경우, 학습모델부(200)는 이미지 형태의 학습데이터와 이에 대응되는 지도학습값을 입력받으면 기설정된 신경망 구조의 파라미터들이 정리됨에 따라 학습되는 것일 수 있다.In this case, when the
여기서, 상기 복수 개의 클래스는, 제1 기간(P1) 및 제2 기간(P2)에 기초한 지도학습 결과에 기초하여 현재시점 이후의 제5 기간(PF)에 대한 주가 추세의 상승 또는 하락 여부와 이에 따른 이격 정도를 분류하여 설정한 것일 수 있다.Here, the plurality of classes, based on the results of supervised learning based on the first period (P 1 ) and the second period (P 2 ), the rise or fall of the stock price trend for the fifth period (P F ) after the current point in time It may be set by classifying whether or not and the degree of separation accordingly.
아래의 표 6은 복수 개의 클래스 각각에 대응하는 지도학습값에 대한 추세 방향 및 이격 정도를 표로 정리하여 나타낸 것이다.Table 6 below shows the direction of the trend and the degree of separation for the supervised learning values corresponding to each of the plurality of classes.
예컨대, 상기 표 6 및 도 4를 참조하면, 제1 지도학습값(C1)은 과거 특정기간(제1 기간(P1), 제2 기간(P2))에 기초한 지도학습 결과에 기초하여 현재 시점 이후의 제5 기간(PF)에 대한 주가 추세가 제3 범위 내로 하락할 것으로 예측되는 경우에 대응하고, 제4 지도학습값(C4)은 상기 지도학습 결과에 기초하여 상기 제5 기간(PF)에 대한 주가 추세가 변동 없이 보합할 것으로 예측되는 경우에 대응하고, 제6 지도학습값(C6)은 상기 지도학습 결과에 기초하여 상기 제5 기간(PF)에 대한 주가 추세가 제2 범위 내로 상승할 것으로 예측되는 경우에 대응하도록 설정된 것일 수 있다.For example, referring to Table 6 and FIG. 4, the first supervised learning value C1 is currently based on the supervised learning result based on the past specific period (the first period P 1 and the second period P 2 ). Corresponds to a case where the stock price trend for the fifth period (P F ) after the point in time is predicted to fall within the third range, and the fourth supervised learning value (C4) is the fifth period (P F ) based on the supervised learning result. F ) corresponds to a case where the stock price trend is predicted to remain flat without fluctuation, and the sixth supervised learning value (C6) is the stock price trend for the fifth period (P F ) based on the supervised learning result. It may be set to correspond to the case where it is predicted to rise within the range.
평가데이터 생성모듈(300)은 주가 변동성을 예측하고자 하는 평가대상종목(IE) 및 이에 대한 평가기간(PE)에 기초한 평가데이터를 생성하는 역할을 한다(S650).The evaluation
평가데이터 생성모듈(300)은 실질적인 주가 변동 상태가 반영된 증권데이터를 기반으로 한 제1 평가데이터와 각종 이슈에 따른 투자 심리가 반영된 비정형데이터를 기반으로 한 제2 평가데이터 중 적어도 하나를 생성한다.The evaluation
이때, 평가데이터 생성모듈(300)은 전술한 학습데이터 생성모듈(100)과 비교해볼 때 증권데이터 및 비정형데이터의 값만 상이할 뿐 동일한 기능을 수행하는 것일 수 있다.At this time, the evaluation
구체적으로, 평가데이터 생성모듈(300)은 평가대상종목 입력부(30)에 의해 입력받은 평가대상종목(IE)에 대한 과거 특정기간의 증권데이터에 기초하여 해당 종목에 대한 항목별 변동 상태를 나타내는 복수 개의 평가종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성할 수 있다.Specifically, the evaluation
또한, 평가데이터 생성모듈(300)은, 평가대상종목(IE)에 대한 소정의 평가기간(PE) 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 해당 종목의 언급량 변동 추이를 나타내는 복수 개의 제2 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성할 수 있다.In addition, the evaluation
이와 관련하여, 평가데이터 생성모듈(300)은 도 2에 도시된 바와 같이 제1 평가데이터의 생성에 관여하는 증권데이터 획득부(310), 평가종목 이진코드 생성부(320) 및 평가데이터 생성부(330)와, 제2 평가데이터의 생성에 관여하는 비정형데이터 획득부(340), 제2 버즈량 이진코드 생성부(350) 및 제2 평가데이터 이진코드 생성부(360)를 포함할 수 있다.In this regard, the evaluation
증권데이터 획득부(310)는 상기 평가대상종목(IE)에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득한다.The stock
증권데이터 획득부(310)는 다수의 증권사 API를 통해 해당 증권사 서버에 접속하여 파이썬 언어를 기반으로 하는 웹 스크래핑(Web Scraping) 기법을 이용해 평가대상종목(IE)에 대한 증권데이터를 실시간으로 획득하는 것일 수 있다.The securities
평가종목 이진코드 생성부(320)는 상기 평가대상종목(IE)에 대응하여 획득된 증권데이터에 기초하여 평가대상종목에 대한 주가 변동 상태 정보를 이진코드 형태로 생성한다.The evaluation issue binary
평가종목 이진코드 생성부(320)는 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 평가종목 이진코드를 생성할 수 있다.The evaluation item
여기서, 평가종목 이진코드 생성부(320)는, 평가대상종목 입력부(30)를 통해 입력받은 평가대상종목(IE)에 대응되는 증권데이터에 기초하여 평가종목 이진코드를 생성하되, 상기 평가대상종목(IE)에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 평가대상종목(IE)에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 평가대상종목(IE)에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 평가대상종목(IE)에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것일 수 있다.Here, the evaluation item binary
이때, 평가종목 이진코드 생성부(320)는 전술한 학습종목 이진코드 생성부(120)와 동일한 이진코드 생성 알고리즘에 따라 상기 평가종목 이진코드를 생성하는 것일 수 있으며, 해당 이진코드에 대한 구체적인 설명은 전술한 상기 학습종목 이진코드에 대한 내용과 중복되므로 생략하도록 한다.At this time, the evaluation item binary
제1 평가데이터 생성부(330)는 평가종목 이진코드 생성부(320)에 의해 복수 개의 상기 평가종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 평가종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성한다.When a plurality of evaluation item binary codes are generated by the evaluation item
여기서, 제1 평가데이터 생성부(330)는 상기 평가종목 이진코드를 소정 비트(bit) 단위로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제1 평가데이터를 생성할 수 있다.Here, the first evaluation data generation unit 330 divides the evaluation item binary code into predetermined bit units to represent one pixel per unit, so that an image that meets the specifications of the input layer of the learning model, That is, first evaluation data in the form of an image having the same ratio as the ratio of rows and columns of the matrix of the input layer may be generated.
비정형데이터 획득부(340)는 상기 평가대상종목(IE)에 대응하는 키워드를 이용하여 상기 평가기간(PE)에 작성된 인터넷상의 웹페이지를 검색함에 따른 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득한다.The unstructured
비정형데이터 획득부(340)는 소정의 프로그래밍 언어, 예컨대, 파이썬(Python)을 이용한 쿼리 기반 접근 방식에 따른 웹 크롤링(Web Crawling) 및 파싱(Parsing) 기법을 통해 각 주식종목에 대응하는 키워드 문자열에 기초한 웹 검색을 수행함에 따른 키워드 언급량을 산출함에 따른 비정형데이터를 실시간으로 획득하는 것일 수 있다.The unstructured
제2 버즈량 이진코드 생성부(350)는 상기 평가대상종목(IE)에 대응하여 획득된 비정형데이터에 기초하여 평가대상종목(IE)에 대한 이슈에 따른 버즈량 정보를 이진코드 형태로 생성한다.The second buzz quantity binary
제2 버즈량 이진코드 생성부(350)는 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제2 항목코드, 상기 제2 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제2 상태코드, 상기 제2 상태코드에 대응되는 세부값을 나타내는 제2 내용코드로 각각 할당하여 제2 버즈량 이진코드를 생성할 수 있다.The second buzz amount binary
제2 평가데이터 생성부(360)는 제2 버즈량 이진코드 생성부(350)에 의해 복수 개의 상기 제2 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고 나열된 복수 개의 상기 제2 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성한다.The second evaluation data generation unit 360, when a plurality of second buzz amount binary codes are generated by the second buzz amount binary
여기서, 제2 평가데이터 생성부(360)는 상기 제2 버즈량 이진코드를 소정 비트 단위(bit)로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제2 평가데이터를 생성할 수 있다.Here, the second evaluation data generation unit 360 divides the second buzz amount binary code into predetermined bit units to represent one pixel per unit, thereby meeting the specifications of the input layer of the learning model. Second evaluation data in the form of an image, that is, an image having the same ratio as the ratio of rows and columns of the matrix of the input layer may be generated.
예측모듈(400)은 학습데이터 생성모듈(100)에 의해 생성된 학습데이터를 이용한 지도학습 결과에 기초하여 평가데이터 생성모듈(300)에 의해 생성된 평가데이터에 대응되는 평가대상종목(IE)에 대한 주가 변동성을 예측하기 위한 것이다.The
이와 관련하여, 예측모듈(400)은 도 2에 도시된 바와 같이 예측 분류부(420), 군집화부(440) 및 매매 결정부(460)를 포함할 수 있다.In this regard, the
예측 분류부(420)는 상기 지도학습이 완료된 후 평가데이터 생성모듈(300)로부터 소정의 평가데이터를 입력받으면 이를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류한다(S660).When the
예측 분류부(420)는 상기 지도학습이 완료된 후 제1 평가데이터 생성부(330)에 의해 생성된 제1 평가데이터와 제2 평가데이터 생성부(360)에 의해 생성된 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터를 클래스별 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 것일 수 있다.After the supervised learning is completed, the
예컨대, 도 5를 참조하면, 평가대상종목 입력부(30)에 의해 사용자로부터 평가대상종목(IE)을 입력받은 시점이 "TC"일 때, 평가데이터 생성모듈(300)의 제1 평가데이터 생성부(330) 및 제2 평가데이터 생성부(360)에 의해 각각 입력시점(TC) 이전의 제3 기간(P3) 및 제4 기간(P4)에 대응되는 증권데이터 및 비정형데이터에 기초한 제1 평가데이터 또는 제2 평가데이터가 생성되면, 예측 분류부(420)는 제1 평가데이터 또는 제2 평가데이터를 입력받아 이를 기설정된 복수 개의 클래스별 지도학습값들과 비교한 결과 가장 유사한 지도학습값을 평가대상종목(IE)의 제5 기간(PF)에 대한 예측 추세 및 정도를 나타내는 분류값(CP)으로 출력할 수 있다.For example, referring to FIG. 5 , when the time point at which the evaluation target item (I E ) is input from the user through the evaluation target
군집화부(440)는 상기 지도학습이 완료된 후 제1 평가데이터 생성부(330)에 의해 생성된 제1 평가데이터와 제2 평가데이터 생성부(360)에 의해 생성된 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터에 기초한 상기 복수 개의 클래스 각각에 대한 확률 분포를 계산하여 기설정된 군집화 알고리즘에 따라 군집화한다(S670).The
군집화부(440)는 상기 입력받은 평가데이터에 대한 클래스별 확률 분포 상태를 추정하여 클래스별 지도학습값과의 비교 결과에 따른 유사도에 기초하여 군집화하는 것일 수 있으며, 예컨대, 상기 군집화 알고리즘은 K-Means 클러스터링, 평균 이동(Mean Shift) 클러스터링, 가우시안 혼합 모델(GMM; Gaussian Mixture Model), 밀도 기반 클러스터링(DBSCAN)을 포함할 수 있다.The
매매 결정부(460)는 군집화부(440)에 의해 군집화된 결과에 기초하여 가장 유사도가 높은 클래스에 대응하는 상기 기준학습값에 대한 이격 정도를 기설정된 임계치와 비교한 결과에 따라 평가대상종목(IE)에 대한 매수 또는 매도 여부를 결정한다(S680).Based on the result of the clustering by the
매매 결정부(350)는 상기 기준학습값에 대한 이격 정도가 상기 임계치보다 높을 때, 상기 기준학습값에 기초한 평가대상종목(IE)의 추세 방향이 상승 추세를 나타내면 평가대상종목(IE)을 일정 개수만큼 매수하도록 결정할 수 있다.When the degree of separation from the reference learning value is higher than the threshold value, the
매매 결정부(350)는 상기 기준학습값에 대한 이격 정도가 상기 임계치보다 높을 때, 상기 기준학습값에 기초한 평가대상종목(IE)의 추세 방향이 하락 추세를 나타내면 평가대상종목(IE)을 일정 개수만큼 매도하도록 결정할 수 있다.When the degree of separation from the reference learning value is higher than the threshold value, the
한편, 본발명에 따른 학습모델에 기초한 주가 변동 예측 장치는 도 1에 도시된 바와 같이 기준 설정부(60)를 더 포함할 수 있다.Meanwhile, the apparatus for predicting stock price fluctuations based on the learning model according to the present invention may further include a
기준 설정부(60)는 관리자의 입력에 따라 학습기간 설정부(20)에 의해 설정되는 제1 기간(P1)과 제2 기간(P2) 사이의 간격을 설정하거나 또는 제1 기간(P1) 및 제2 기간(P2)의 설정 시 기준이 되는 제1 시점(T1)과 제2 시점(T2) 사이의 간격을 설정할 수 있다.The
기준 설정부(60)는 관리자가 관리자단말기(1)를 통해 제1 시점(T1)과 제2 시점(T2) 사이의 간격 또는 제1 기간(P1)과 제2 기간(P2) 사이의 간격을 설정한 값을 관리자단말기(1)로부터 수신하여 이를 학습기간 설정부(20) 및 평가기간 설정부(40)로 전송할 수 있다.The
이 경우, 학습기간 설정부(20)는 상기 수신한 간격 설정값에 따라 제1 시점(T1)과 제2 시점(T2) 사이의 간격 또는 제1 기간(P1)과 제2 기간(P2) 사이의 간격을 설정하고, 평가기간 설정부(40)는 상기 수신한 간격 설정값에 따라 제3 시점(T3)과 제4 시점(T4) 사이의 간격 또는 제3 기간(P3)과 제4 기간(P4) 사이의 간격을 설정할 수 있다.In this case, the learning
기준 설정부(60)는 학습종목(IL) 또는 평가대상종목(IE)에 대응하여 수집된 수급 동향 정보에 기초하여 학습종목 이진코드 생성부(120) 또는 평가종목 이진코드 생성부(320)에 의해 생성되는 상기 제3 이진코드의 할당 시 비교 기준이 되는 제1 수급기간(PS1) 및 제2 수급기간(PS2)을 관리자의 입력에 따라 설정할 수도 있다.The
기준 설정부(60)는 학습종목(IL) 또는 평가대상종목(IE)에 대응하여 수집된 주가 정보에 기초하여 학습종목 이진코드 생성부(120) 또는 평가종목 이진코드 생성부(320)에 의해 생성되는 상기 제1 이진코드의 할당 시 기준이 되는 이동평균선에 대한 기준단위값을 관리자의 입력에 따라 설정할 수도 있다.The
이에 따라, 전술한 본 발명에 의하면, 지도 학습을 수행할 학습종목에 대한 학습데이터의 생성 시 증권데이터의 과거 주가 변동 상태에 대한 다양한 지표 정보들과 각종 이슈에 따른 버즈량 정보를 모두 반영함으로써 미래 특정기간의 주가 추세 변동 및 정도에 대한 예측 결과값의 정확도를 향상시킬 수 있다.Accordingly, according to the present invention described above, when generating learning data for learning items to be supervised learning, various index information on the past stock price fluctuation state of stock data and buzz information according to various issues are reflected, so that the future It is possible to improve the accuracy of prediction result values for the change and degree of stock price trend in a specific period.
또한, 본 발명에 의하면, 각 주식종목에 대한 학습 데이터 또는 평가 데이터의 생성 시 필요한 정보들을 압축한 2진수 코드값을 이용하므로 학습모델에 기초한 주가 변동 예측 장치를 단순화하여 구현할 수 있다.In addition, according to the present invention, since a binary code value in which necessary information is compressed when generating learning data or evaluation data for each stock issue is used, a stock price fluctuation prediction device based on a learning model can be simplified and implemented.
또한, 본 발명에 의하면, 지도 학습에 이용되는 학습데이터 또는 예측 분석에 이용되는 평가데이터를 생성할 때 기초가 되는 이진코드의 할당 시 관리자의 입력에 따라 주가 관련 지표들에 대한 설정값을 용이하게 설정 및 변경 가능함으로써, 고객 맞춤형 개별 예측 분석이 가능한 자산 관리 포트폴리오 서비스를 제공할 수 있다.In addition, according to the present invention, when generating learning data used for supervised learning or evaluation data used for predictive analysis, setting values for stock price-related indicators are easily set according to a manager's input when assigning a binary code as a basis. By being able to set and change, it is possible to provide asset management portfolio services that enable individual predictive analysis tailored to customers.
이상, 바람직한 실시예를 통하여 본 발명에 관하여 상세히 설명하였으나, 본 발명은 이에 한정되는 것은 아니며 특허청구범위 내에서 다양하게 실시될 수 있다.Above, the present invention has been described in detail through preferred embodiments, but the present invention is not limited thereto and may be variously practiced within the scope of the claims.
특히, 전술한 내용은 후술할 발명의 청구범위를 더욱 잘 이해할 수 있도록 본 발명의 특징과 기술적 강점을 다소 폭넓게 상술하였으므로, 상술한 본 발명의 개념과 특정 실시예는 본 발명과 유사 목적을 수행하기 위한 다른 형상의 설계나 수정의 기본으로써 즉시 사용될 수 있음이 해당 기술 분야의 숙련된 사람들에 의해 인식되어야 한다.In particular, the foregoing has outlined rather broadly the features and technical strengths of the present invention so that the claims of the invention to be described later may be better understood, so that the concept and specific embodiments of the present invention described above are intended to serve similar purposes to the present invention. It should be recognized by those skilled in the art that it can be readily used as a basis for designing or modifying other shapes for the purpose.
또한, 상기에서 기술된 실시예는 본 발명에 따른 하나의 실시예일 뿐이며, 해당 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상의 범위에서 다양한 수정 및 변경된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 따라서, 개시된 실시예는 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 이러한 다양한 수정 및 변경 또한 본 발명의 기술적 사상의 범위에 속하는 것으로 전술한 본 발명의 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.In addition, the embodiment described above is only one embodiment according to the present invention, and can be implemented in various modified and changed forms within the scope of the technical idea of the present invention by those skilled in the art. You will understand. Therefore, the disclosed embodiments should be considered from an explanatory point of view rather than a limiting point of view, and these various modifications and changes are also shown in the claims of the present invention described above as belonging to the scope of the technical idea of the present invention, and the scope equivalent thereto. Any differences within them should be construed as being included in the present invention.
10: 학습종목 입력부
20: 학습기간 설정부
30: 평가대상종목 입력부
40: 평가기간 설정부
60: 기준 설정부
100: 학습데이터 생성모듈
110: 증권데이터 획득부
120: 학습종목 이진코드생성부
130: 제1 학습데이터 생성부
140: 비정형데이터 획득부
150: 제1 버즈량 이진코드생성부
160: 제2 학습데이터 생성부
200: 학습모델부
300: 평가데이터 생성모듈
310: 증권데이터 획득부
320: 평가종목 이진코드생성부
330: 제1 평가데이터 생성부
340: 비정형데이터 획득부
350: 제2 버즈량 이진코드생성부
360: 제2 평가데이터 생성부
400: 예측모듈
420: 예측 분류부
440: 군집화부
460: 매매 결정부
1000: 주가 변동 예측 장치10: learning item input unit 20: learning period setting unit
30: evaluation target item input unit 40: evaluation period setting unit
60: standard setting unit 100: learning data generation module
110: Stock data acquisition unit 120: Learning item binary code generation unit
130: first learning data generation unit 140: unstructured data acquisition unit
150: first buzz quantity binary code generator 160: second learning data generator
200: learning model unit 300: evaluation data generation module
310: Stock data acquisition unit 320: Evaluation item binary code generation unit
330: first evaluation data generation unit 340: unstructured data acquisition unit
350: second buzz quantity binary code generator 360: second evaluation data generator
400: prediction module 420: prediction classification unit
440: clustering unit 460: trading decision unit
1000: stock price fluctuation predictor
Claims (10)
상기 입력받은 학습종목에 대한 과거 특정기간의 증권데이터에 기초하여 상기 학습종목에 포함된 각 주식종목에 대한 항목별 변동 상태를 나타내는 복수 개의 학습종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 학습데이터 생성모듈;
상기 생성된 제1 학습데이터에 기초하여 미래 특정기간의 주가 변동 정도에 대한 예측 결과에 대응하도록 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 학습모델부;
상기 학습종목에 포함된 적어도 어느 하나의 상기 주식종목을 사용자로부터 주가 변동성을 예측하고자 하는 평가대상종목으로 입력받는 평가대상종목 입력부;
상기 입력받은 평가대상종목에 대한 과거 특정기간의 증권데이터에 기초하여 해당 종목에 대한 항목별 변동 상태를 나타내는 복수 개의 평가종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 평가데이터 생성모듈; 및
상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 예측 분류부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.A learning item input unit that receives a plurality of stock items listed on the stock market as learning items to perform machine learning-based supervised learning;
Based on the stock data of the past specific period for the input learning item, a plurality of learning item binary codes representing the change status of each item for each stock item included in the learning item are generated and then listed in a predetermined order. A learning data generation module for generating imaged first learning data by assigning a pixel value corresponding to ;
a learning model unit that performs supervised learning using a plurality of pre-set supervised learning values for each class, based on the generated first learning data;
an evaluation target input unit for receiving at least one stock issue included in the learning issue as an evaluation target issue for which stock price volatility is to be predicted from a user;
Based on the stock data of the past specific period for the received evaluation target item, a plurality of evaluation item binary codes representing the change status of each item for the item are generated, and pixel values corresponding to the results listed in a predetermined order are generated. Evaluation data generation module for generating the imaged first evaluation data according to the grant; and
When receiving the first evaluation data after the supervised learning is completed, a prediction classification unit that classifies the first evaluation data into one of the plurality of classes according to comparing the first evaluation data with the supervised learning value; Stock price fluctuation predictor based on learning model.
상기 학습데이터 생성모듈은,
상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 일자별 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부;
상기 학습종목에 대응하여 획득된 증권데이터에 기초하여 각 주식종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 학습종목 이진코드를 생성하는 학습종목 이진코드 생성부; 및
상기 학습종목 이진코드 생성부에 의해 복수 개의 상기 학습종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 학습종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 제1 학습데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 1,
The learning data generation module,
a stock data acquiring unit that acquires stock data including at least one of stock price information by time period, trading volume information, supply and demand trend information, and daily market capitalization ranking information for each of a plurality of stock items included in the learning item;
Based on the stock data obtained in correspondence with the learning item, a plurality of bit values consisting of a preset number of bits for each stock item is a preset item code, a preset type code, a current value corresponding to the item code or the type code or a learning item binary code generation unit for generating a learning item binary code by allocating a state code indicating a state value according to a comparison according to a predetermined criterion and a content code indicating a detailed value corresponding to the state code; and
When a plurality of binary codes for learning items are generated by the learning item binary code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the listed plurality of binary codes for learning items are given. A stock price fluctuation prediction device based on a learning model comprising a; first learning data generation unit for generating first learning data.
상기 학습데이터 생성모듈은,
상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 소정의 학습기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 각 주식종목별 언급량 변동 추이를 나타내는 복수 개의 제1 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 것이고,
상기 학습모델부는,
상기 제1 학습데이터 또는 상기 제2 학습데이터 각각에 대응하여 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 1,
The learning data generation module,
Based on unstructured data including the amount of keyword mention during a predetermined learning period for each of the plurality of stock items included in the learning item, a plurality of first buzz amount binary codes representing the change in the amount of mention for each stock item are generated Then, by assigning pixel values corresponding to the results listed in a predetermined order, imaged second learning data is generated,
The learning model unit,
A stock price fluctuation prediction device based on a learning model, characterized in that performing supervised learning using a plurality of pre-set supervised learning values for each class corresponding to each of the first learning data or the second learning data.
상기 학습데이터 생성모듈은,
상기 학습종목에 포함된 복수 개의 주식종목 각각에 대응하는 키워드를 이용하여 상기 학습기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 주식종목별 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 비정형데이터 획득부;
상기 학습종목에 대응하여 획득된 비정형데이터에 기초하여 각 주식 종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제1 항목코드, 상기 제1 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제1 상태코드, 상기 제1 상태코드에 대응되는 세부값을 나타내는 제1 내용코드로 각각 할당하여 제1 버즈량 이진코드를 생성하는 제1 버즈량 이진코드 생성부; 및
상기 제1 버즈량 이진코드 생성부에 의해 복수 개의 상기 제1 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 제1 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 제2 학습데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 3,
The learning data generation module,
An unstructured data acquisition unit that obtains, in real time, unstructured data including the amount of keyword mentions for each stock item by searching web pages on the Internet created during the learning period using keywords corresponding to each of a plurality of stock items included in the learning item. ;
Based on the unstructured data obtained in correspondence with the learning item, a plurality of bit values consisting of a preset number of bits for each stock item are converted to a preset first item code, a current value corresponding to the first item code, or a preset standard. A first buzz amount binary code generator for generating a first buzz amount binary code by allocating a first state code indicating a state value according to comparison and a first content code indicating a detailed value corresponding to the first state code, respectively. ; and
When a plurality of the first buzz amount binary codes are generated by the first buzz amount binary code generator, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the plurality of the first buzz amount binary codes are arranged. A stock price fluctuation prediction device based on a learning model comprising a;
상기 평가데이터 생성모듈은,
상기 평가대상종목에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부;
상기 평가대상종목에 대응하여 획득된 증권데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 평가종목 이진코드를 생성하는 평가종목 이진코드 생성부; 및
상기 평가종목 이진코드 생성부에 의해 복수 개의 상기 평가종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 평가종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 제1 평가데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 1,
The evaluation data generation module,
a stock data acquisition unit that acquires stock data including at least one of stock price information, trading volume information, supply and demand trend information, and market capitalization ranking information for each time slot for the subject stock to be evaluated in real time;
A plurality of bit values composed of a preset number of bits based on the securities data acquired corresponding to the evaluation target issue are a preset item code, a preset type code, a current value or a preset value corresponding to the item code or the type code. an evaluation item binary code generation unit for generating an evaluation item binary code by allocating a status code indicating a status value according to comparison according to a standard and a content code indicating a detailed value corresponding to the status code; and
When a plurality of evaluation item binary codes are generated by the evaluation item binary code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the listed plurality of evaluation item binary codes are assigned. A stock price fluctuation prediction device based on a learning model, comprising: a first evaluation data generating unit for generating first evaluation data.
상기 평가데이터 생성모듈은,
상기 평가대상종목에 대한 소정의 평가기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 해당 종목의 언급량 변동 추이를 나타내는 복수 개의 제2 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 것이고,
상기 예측 분류부는,
상기 지도학습이 완료된 후 상기 제1 평가데이터와 상기 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 1,
The evaluation data generation module,
Based on unstructured data including the amount of keyword mentions for a predetermined evaluation period for the evaluation target item, a plurality of second buzz amount binary codes representing the change in the amount of mention of the item are generated and arranged in a predetermined order By assigning a pixel value corresponding to the result, imaged second evaluation data is generated,
The prediction classification unit,
When at least one of the first evaluation data and the second evaluation data is received after the supervised learning is completed, the input evaluation data is compared with the supervised learning value and classified into one of the plurality of classes. Stock price fluctuation prediction device based on a learning model to be.
상기 평가데이터 생성모듈은,
상기 평가대상종목에 대응하는 키워드를 이용하여 상기 평가기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 제2 버즈량데이터 획득부;
상기 평가대상종목에 대응하여 획득된 비정형데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제2 항목코드, 상기 제2 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제2 상태코드, 상기 제2 상태코드에 대응되는 세부값을 나타내는 제2 내용코드로 각각 할당하여 제2 버즈량 이진코드를 생성하는 제2 버즈량 이진코드 생성부; 및
상기 제2 버즈량 이진코드 생성부에 의해 복수 개의 상기 제2 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고 나열된 복수 개의 상기 제2 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 제2 평가데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 6,
The evaluation data generation module,
a second buzz amount data acquisition unit that acquires, in real time, unstructured data including the amount of references to keywords as a result of searching for web pages on the Internet created during the evaluation period using keywords corresponding to the subject items to be evaluated;
A plurality of bit values composed of a preset number of bits based on the unstructured data obtained corresponding to the evaluation target item are compared according to a preset second item code, a current value corresponding to the second item code, or a preset standard a second buzz amount binary code generation unit for generating a second buzz amount binary code by allocating a second status code indicating a state value corresponding to a second state code and a second content code indicating a detailed value corresponding to the second state code; and
When a plurality of second buzz amount binary codes are generated by the second buzz amount binary code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the plurality of second buzz amount binary codes are arranged. A stock price fluctuation prediction device based on a learning model comprising: a second evaluation data generation unit that generates imaged second evaluation data according to the application.
현재시점 이전의 서로 상이한 제1 시점 및 제2 시점 각각을 기준으로 기설정된 시간 동안의 제1 기간 및 제2 기간을 중복없이 설정하는 학습기간 설정부; 및
상기 평가대상종목의 입력시점 이전의 서로 상이한 제3 시점 및 제4 시점 각각을 기준으로 기설정된 시간 동안의 제3 기간 및 제4 기간을 중복없이 설정하는 평가기간 설정부;를 더 포함하며,
상기 학습종목 이진코드 생성부 및 상기 평가종목 이진코드 생성부는,
상기 학습종목 입력부 또는 상기 평가대상종목 입력부를 통해 입력받은 적어도 하나의 주식종목에 대응되는 증권데이터에 기초하여 상기 학습종목 이진코드 또는 상기 평가종목 이진코드를 생성하되, 상기 주식종목에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 주식종목에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 주식종목에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 주식종목에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 1,
a learning period setting unit for setting a first period and a second period for a predetermined time based on different first and second times prior to the current time, respectively, without overlap; and
An evaluation period setting unit for setting a third period and a fourth period for a predetermined time based on different third and fourth times points before the input point of the evaluation target item, respectively, without overlap,
The learning item binary code generator and the evaluation item binary code generator,
The learning item binary code or the evaluation item binary code is generated based on the stock data corresponding to at least one stock item input through the learning item input unit or the evaluation target item input unit, and the time collected for the stock item A first binary code generated based on stock price information for each unit, a second binary code generated based on trading volume information collected for the stock item, and a second binary code generated based on supply and demand trend information collected for the stock item. 3 binary code and a fourth binary code generated based on the market capitalization ranking collected for the stock issue.
상기 복수 개의 클래스는,
상기 제1 기간 및 상기 제2 기간에 기초한 지도학습 결과에 기초하여 현재시점 이후의 제5 기간에 대한 주가 추세의 상승 또는 하락 여부와 이에 따른 이격 정도를 분류하여 설정한 것이고,
상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터에 기초한 상기 복수 개의 클래스 각각에 대한 확률 분포를 계산하여 기설정된 군집화 알고리즘에 따라 군집화하는 군집화부;를 더 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 8,
The plurality of classes,
Based on the supervised learning results based on the first period and the second period, whether the stock price trend for the fifth period after the current point of time rises or falls and the degree of separation accordingly is classified and set,
When the first evaluation data is received after the supervised learning is completed, a clustering unit that calculates a probability distribution for each of the plurality of classes based on the first evaluation data and clusters them according to a preset clustering algorithm; further comprising Stock price fluctuation prediction device based on the learning model, characterized in that.
상기 군집화된 결과에 기초하여 가장 유사도가 높은 클래스에 대응하는 상기 기준학습값에 대한 이격 정도를 기설정된 임계치와 비교한 결과에 따라 상기 평가대상종목에 대한 매수 또는 매도 여부를 결정하는 매매 결정부;를 더 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.According to claim 9,
a trading decision unit that determines whether to buy or sell the evaluation target item according to a result of comparing the degree of separation with respect to the reference learning value corresponding to the class having the highest similarity with a preset threshold based on the clustered result; Stock price fluctuation prediction device based on the learning model, characterized in that it further comprises.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210110192A KR102614106B1 (en) | 2021-08-20 | 2021-08-20 | Apparatus for predicting fluctuation of stock price based on learning model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210110192A KR102614106B1 (en) | 2021-08-20 | 2021-08-20 | Apparatus for predicting fluctuation of stock price based on learning model |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230027903A true KR20230027903A (en) | 2023-02-28 |
KR102614106B1 KR102614106B1 (en) | 2023-12-14 |
Family
ID=85326399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210110192A KR102614106B1 (en) | 2021-08-20 | 2021-08-20 | Apparatus for predicting fluctuation of stock price based on learning model |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102614106B1 (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018028945A (en) * | 2017-11-21 | 2018-02-22 | みずほ証券株式会社 | System, method, and program for transaction management |
KR20180066726A (en) * | 2016-12-09 | 2018-06-19 | 동국대학교 산학협력단 | Apparatus and method for estimating stock price |
KR101909706B1 (en) | 2017-07-06 | 2018-10-18 | 주식회사 닥터퀀트 | Robo advisor system based on investor and financial product and method for providing portfolio using the same |
KR20210003029A (en) | 2019-07-01 | 2021-01-11 | 유한책임회사 블루바이저시스템즈 | Method and system for managing diapause assets based on machine-learning |
KR20210058171A (en) * | 2019-11-13 | 2021-05-24 | 세종대학교산학협력단 | Automated deep learning studio for simplifying stock predictive deep learning models and parameter optimization |
CN113052395A (en) * | 2021-04-15 | 2021-06-29 | 山东咨平信息技术服务有限公司 | Method for predicting financial data by neural network fusing network characteristics |
KR20210099321A (en) * | 2020-02-04 | 2021-08-12 | 울산대학교 산학협력단 | Stock price movement prediction apparatus and method |
-
2021
- 2021-08-20 KR KR1020210110192A patent/KR102614106B1/en active IP Right Grant
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180066726A (en) * | 2016-12-09 | 2018-06-19 | 동국대학교 산학협력단 | Apparatus and method for estimating stock price |
KR101909706B1 (en) | 2017-07-06 | 2018-10-18 | 주식회사 닥터퀀트 | Robo advisor system based on investor and financial product and method for providing portfolio using the same |
JP2018028945A (en) * | 2017-11-21 | 2018-02-22 | みずほ証券株式会社 | System, method, and program for transaction management |
KR20210003029A (en) | 2019-07-01 | 2021-01-11 | 유한책임회사 블루바이저시스템즈 | Method and system for managing diapause assets based on machine-learning |
KR20210058171A (en) * | 2019-11-13 | 2021-05-24 | 세종대학교산학협력단 | Automated deep learning studio for simplifying stock predictive deep learning models and parameter optimization |
KR20210099321A (en) * | 2020-02-04 | 2021-08-12 | 울산대학교 산학협력단 | Stock price movement prediction apparatus and method |
CN113052395A (en) * | 2021-04-15 | 2021-06-29 | 山东咨平信息技术服务有限公司 | Method for predicting financial data by neural network fusing network characteristics |
Also Published As
Publication number | Publication date |
---|---|
KR102614106B1 (en) | 2023-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sarma | Predictive modeling with SAS enterprise miner: Practical solutions for business applications | |
US8930247B1 (en) | System and methods for content-based financial decision making support | |
US10614073B2 (en) | System and method for using data incident based modeling and prediction | |
WO2022105525A1 (en) | Method and apparatus for predicting user probability, and computer device | |
US20210319366A1 (en) | Method, apparatus and device for generating model and storage medium | |
US11080639B2 (en) | Intelligent diversification tool | |
CN108388955A (en) | Customer service strategies formulating method, device based on random forest and logistic regression | |
Li et al. | Stock price prediction incorporating market style clustering | |
KR20210003029A (en) | Method and system for managing diapause assets based on machine-learning | |
CN116503174A (en) | Financial data prediction system based on big data | |
US20210004907A1 (en) | Method and system for managing dormant assets based on machine learning | |
CN111445280A (en) | Model generation method, restaurant ranking method, system, device and medium | |
Mishra et al. | Predictive data mining: Promising future and applications | |
KR102614106B1 (en) | Apparatus for predicting fluctuation of stock price based on learning model | |
Ardyanta et al. | A prediction of stock price movements using support vector machines in Indonesia | |
Sun et al. | Determination of temporal stock investment styles via biclustering trading patterns | |
CN115080868A (en) | Product pushing method, product pushing device, computer equipment, storage medium and program product | |
TWM623354U (en) | investment recommendation system | |
CN114418736A (en) | Bank retail credit customer layering method, storage medium and server | |
Li et al. | Research on listed companies’ credit ratings, considering classification performance and interpretability | |
CN116069959A (en) | Method and device for determining display data | |
Xi et al. | Improved AHP model and neural network for consumer finance credit risk assessment | |
CN113450141A (en) | Intelligent prediction method and device based on electricity selling quantity characteristics of large-power customer groups | |
Abdolbaghi Ataabadi et al. | The effectiveness of the automatic system of fuzzy logic-based technical patterns recognition: Evidence from Tehran stock exchange | |
Lee et al. | Application of machine learning in credit risk scorecard |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |