KR20230027903A - Apparatus for predicting fluctuation of stock price based on learning model - Google Patents

Apparatus for predicting fluctuation of stock price based on learning model Download PDF

Info

Publication number
KR20230027903A
KR20230027903A KR1020210110192A KR20210110192A KR20230027903A KR 20230027903 A KR20230027903 A KR 20230027903A KR 1020210110192 A KR1020210110192 A KR 1020210110192A KR 20210110192 A KR20210110192 A KR 20210110192A KR 20230027903 A KR20230027903 A KR 20230027903A
Authority
KR
South Korea
Prior art keywords
learning
item
stock
evaluation
data
Prior art date
Application number
KR1020210110192A
Other languages
Korean (ko)
Other versions
KR102614106B1 (en
Inventor
황용국
Original Assignee
유한책임회사 블루바이저시스템즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유한책임회사 블루바이저시스템즈 filed Critical 유한책임회사 블루바이저시스템즈
Priority to KR1020210110192A priority Critical patent/KR102614106B1/en
Publication of KR20230027903A publication Critical patent/KR20230027903A/en
Application granted granted Critical
Publication of KR102614106B1 publication Critical patent/KR102614106B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

The present invention relates to an apparatus for predicting fluctuations in stock price based on a learning model. The apparatus for predicting fluctuations in stock price, according to the present invention, comprises: a learning item input unit; a learning data generation module; a learning model unit; an item-to-be-evaluated input unit; an evaluation data generation module; and a prediction classification unit. Therefore, the accuracy of prediction results regarding the fluctuation and extent of stock price trends in a specific period of time in the future can be improved.

Description

학습모델에 기초한 주가 변동 예측 장치{APPARATUS FOR PREDICTING FLUCTUATION OF STOCK PRICE BASED ON LEARNING MODEL}Stock price fluctuation prediction device based on learning model {APPARATUS FOR PREDICTING FLUCTUATION OF STOCK PRICE BASED ON LEARNING MODEL}

본 발명은 사용자가 매매하려는 주식 종목에 대한 주가 변동성을 짧은 시간 주기로 예측 분석하기 위한 머신러닝 기반 지도학습을 수행하는 학습모델에 기초한 주가 변동 예측 장치에 관한 것이다.The present invention relates to a stock price fluctuation prediction device based on a learning model that performs machine learning-based supervised learning for predicting and analyzing the stock price volatility of a stock item that a user intends to trade in a short period of time.

증권사는 자산운용사 등의 기관으로부터 대량의 증권 주문을 위탁받아 증권 거래를 집행하고 거래수수료를 받는다.Securities companies are entrusted with large-volume securities orders from institutions such as asset management companies, execute securities transactions, and receive transaction fees.

만일 증권사가 위탁받은 대량의 증권 주문을 한번에 매도 또는 매수하게 된다면, 증권 시장의 주가가 급락하거나 급등하는 임팩트가 발생하게 되어 적절한 가격에 거래하기 어려워진다. 이러한 이유로, 증권사는 대량의 증권 주문을 나누어 집행하는 알고리즘 트레이딩 시스템을 사용한다.If a securities company sells or buys a large number of entrusted securities orders at once, the impact of a sharp drop or a sharp rise in stock prices in the stock market occurs, making it difficult to trade at an appropriate price. For this reason, securities companies use an algorithm   trading system that divides and executes a large number of securities orders.

하지만, 기존의 알고리즘 트레이딩 시스템은 사전에 기설정된 규칙에 따라 주문을 분할하여 집행을 실시하기 때문에 변화하는 증권 시장에 적절히 대응하기 어려웠다.However, it is difficult to respond appropriately to the changing stock market because the existing algorithm-trading system divides and executes orders according to pre-set rules.

예를 들어, TWAP(Time Weighted Average Price) 알고리즘을 이용한 트레이딩 시스템의 경우, 시간이 지남에 따라 균등 분배된 수량으로 주문을 집행하기 때문에 시장에 대한 적응성과 효율성이 떨어질 수밖에 없다.For example, in the case of a trading system using a TWAP (Time Weighted Average Price) algorithm, since orders are executed with uniformly distributed quantities over time, adaptability to the market and efficiency are inevitably reduced.

한편, 최근 들어 금융분야에 IT기술이 도입되면서 인공지능(AI)기술은 영업, 마케팅, 투자관리, 트레이딩 등 다양한 분야에 적용되고 있고, 이에 따라 로보어드바이저(Robo-advisor)의 활용도 증가하고 있다.Meanwhile, with the recent introduction of IT technology in the financial field, artificial intelligence (AI) technology is being applied to various fields such as sales, marketing, investment management, and trading, and accordingly, the use of robo-advisors is increasing.

로보어드바이저(RoboAdvisor)는 로봇(Robot)과 어드바이저(Advisor)의 합성어로 빅데이터, 머신러닝, 알고리즘 등의 IT기술과 현대 포트폴리오 이론(MPT) 등의 금융이론이 결합되어 개인의 투자 성향 등을 반영하여 자동으로 포트폴리오를 구성하고 리밸런싱(재구성)하며, 운용해주는 온라인상의 자산 관리 서비스를 의미한다.RoboAdvisor is a compound word of robot and advisor, which combines IT technologies such as big data, machine learning, and algorithms with financial theories such as modern portfolio theory (MPT) to reflect individual investment propensity. It refers to an online asset management service that automatically composes, rebalances (reconstructs), and operates portfolios.

현재 대부분의 시중 은행들이나 증권사들이 로보어드바이저를 이용한 상품이나 서비스를 제공하고 있고, 로보어드바이저를 제공하는 스타트업 기업도 크게 성장하고 있는 추세이다.Currently, most commercial banks and securities companies are providing products or services using robo-advisors, and startup companies that provide robo-advisors are also growing significantly.

그러나, 이러한 로보어드바이저를 이용하여 제공되는 포트폴리오 서비스의 경우 실제 자산 관리 시 발생할 수 있는 다양한 변수들을 전혀 고려하지 않는 데다 자문의 범위 역시 ETF 등 금융상품간 포트폴리오 배분에 머물러 있다는 점에서 구조적 한계를 가지고 있다.However, portfolio services provided using these robo-advisors have structural limitations in that they do not consider various variables that may occur during actual asset management, and the scope of advice is limited to portfolio allocation among financial products such as ETFs. .

KRKR 10-2021-0003029 10-2021-0003029 AA KRKR 10-1909706 10-1909706 B1B1

본 발명의 목적은 상기 문제점을 해결하기 위한 것으로서, 사용자가 매매하려는 주식 종목에 대한 주가 변동성을 짧은 시간 주기로 예측 분석하기 위한 머신러닝 기반 지도학습을 수행하는 학습모델에 기초한 주가 변동 예측 장치를 제공하는 것을 목적으로 한다.An object of the present invention is to solve the above problems, and to provide a stock price fluctuation prediction device based on a learning model that performs machine learning-based supervised learning for predicting and analyzing the stock price volatility of a stock item to be traded by a user in a short time period. aims to

상기와 같은 목적을 달성하기 위한 본 발명의 일면에 따른 학습모델에 기초한 주가 변동 예측 장치는, 머신러닝 기반 지도학습을 수행할 학습종목으로서 증권시장에 상장된 복수 개의 주식종목을 입력받는 학습종목 입력부와, 상기 입력받은 학습종목에 대한 과거 특정기간의 증권데이터에 기초하여 상기 학습종목에 포함된 각 주식종목에 대한 항목별 변동 상태를 나타내는 복수 개의 학습종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 학습데이터 생성모듈과, 상기 생성된 제1 학습데이터에 기초하여 미래 특정기간의 주가 변동 정도에 대한 예측 결과에 대응하도록 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 학습모델부와, 상기 학습종목에 포함된 적어도 어느 하나의 상기 주식종목을 사용자로부터 주가 변동성을 예측하고자 하는 평가대상종목으로 입력받는 평가대상종목 입력부와, 상기 입력받은 평가대상종목에 대한 과거 특정기간의 증권데이터에 기초하여 해당 종목에 대한 항목별 변동 상태를 나타내는 복수 개의 평가종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 평가데이터 생성모듈과, 상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 예측 분류부를 포함하는 것을 특징으로 한다.In order to achieve the above object, an apparatus for predicting stock price fluctuations based on a learning model according to an aspect of the present invention is a learning item input unit that receives a plurality of stock items listed on the stock market as learning items to perform machine learning-based supervised learning And, based on the stock data of the past specific period for the input learning item, a plurality of learning item binary codes representing the change status of each item for each stock item included in the learning item are generated, and then according to a preset order A learning data generation module that generates imaged first learning data by assigning pixel values corresponding to the listed results, and a prediction result for the degree of stock price fluctuation in a specific period in the future based on the generated first learning data. A learning model unit that performs supervised learning using a plurality of pre-set supervised learning values for each class, and an evaluation that receives at least one stock item included in the learning item as an evaluation target item to predict stock price volatility from a user Based on the target item input unit and the securities data of the past specific period for the subject item to be evaluated, a plurality of evaluation item binary codes indicating the change status of each item for the item are generated, and then the results are listed in a predetermined order. An evaluation data generation module that generates imaged first evaluation data by assigning a corresponding pixel value; and when receiving the first evaluation data after the supervised learning is completed, the first evaluation data is converted to the supervised learning value. It is characterized in that it includes a prediction classification unit for classifying into one of the plurality of classes according to the comparison.

바람직하게는, 상기 학습데이터 생성모듈은, 상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 일자별 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부와, 상기 학습종목에 대응하여 획득된 증권데이터에 기초하여 각 주식종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 학습종목 이진코드를 생성하는 학습종목 이진코드 생성부와, 상기 학습종목 이진코드 생성부에 의해 복수 개의 상기 학습종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 학습종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 제1 학습데이터 생성부를 포함하는 것을 특징으로 한다.Preferably, the learning data generating module provides stock data including at least one of stock price information by time slot, trading volume information, supply and demand trend information, and daily market capitalization ranking information for each of a plurality of stock issues included in the learning issue. A stock data acquiring unit that acquires in real time, and a plurality of bit values consisting of a preset number of bits for each stock item based on the acquired stock data corresponding to the learning item, a preset item code, a preset type code, and the item Learning to create a learning item binary code by allocating a state code indicating a state value according to a comparison according to a current value or a preset standard corresponding to the code or the type code, and a content code indicating a detailed value corresponding to the state code. When a plurality of learning item binary codes are generated by an item binary code generation unit and the learning item binary code generation unit, they are arranged in a predetermined order, and pixels corresponding to the binary values of the plurality of learning item binary codes listed. It is characterized in that it includes a first learning data generation unit that generates imaged first learning data as a value is assigned.

바람직하게는, 상기 학습데이터 생성모듈은, 상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 소정의 학습기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 각 주식종목별 언급량 변동 추이를 나타내는 복수 개의 제1 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 것이고, 상기 학습모델부는, 상기 제1 학습데이터 또는 상기 제2 학습데이터 각각에 대응하여 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 것을 특징으로 한다.Preferably, the learning data generation module indicates a change in the amount of mention for each stock item based on unstructured data including the amount of keyword mention during a predetermined learning period for each of a plurality of stock items included in the learning item. After generating a plurality of first buzz amount binary codes, pixel values corresponding to the results arranged in a predetermined order are assigned to generate imaged second learning data, and the learning model unit comprises the first learning data or It is characterized in that supervised learning is performed using a plurality of pre-set supervised learning values for each class corresponding to each of the second learning data.

또한, 상기 학습데이터 생성모듈은, 상기 학습종목에 포함된 복수 개의 주식종목 각각에 대응하는 키워드를 이용하여 상기 학습기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 주식종목별 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 비정형데이터 획득부와, 상기 학습종목에 대응하여 획득된 비정형데이터에 기초하여 각 주식 종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제1 항목코드, 상기 제1 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제1 상태코드, 상기 제1 상태코드에 대응되는 세부값을 나타내는 제1 내용코드로 각각 할당하여 제1 버즈량 이진코드를 생성하는 제1 버즈량 이진코드 생성부와, 상기 제1 버즈량 이진코드 생성부에 의해 복수 개의 상기 제1 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 제1 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 제2 학습데이터 생성부를 포함하는 것을 특징으로 한다.In addition, the learning data generating module includes unstructured data including the amount of keyword mentions for each stock item as a result of searching for a web page on the Internet created during the learning period using a keyword corresponding to each of a plurality of stock items included in the learning item. an unstructured data acquisition unit that obtains in real time, and a plurality of bit values consisting of a preset number of bits for each stock item based on the unstructured data acquired in correspondence with the learning item, a first item code set in advance, and the first item Corresponding to the code, a first status code indicating a state value according to comparison according to a current value or a preset standard and a first content code indicating a detailed value corresponding to the first state code are assigned to the first buzz quantity binary code. When a plurality of the first buzz amount binary codes are generated by a first buzz amount binary code generator that generates a buzz amount and the first buzz amount binary code generator, they are arranged in a predetermined order, and a plurality of the listed first buzz amount binary codes are generated. It is characterized in that it includes a second learning data generation unit that generates imaged second learning data by assigning a pixel value corresponding to the binary value of the 1-buzz binary code.

바람직하게는, 상기 평가데이터 생성모듈은, 상기 평가대상종목에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부와, 상기 평가대상종목에 대응하여 획득된 증권데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 평가종목 이진코드를 생성하는 평가종목 이진코드 생성부와, 상기 평가종목 이진코드 생성부에 의해 복수 개의 상기 평가종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 평가종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 제1 평가데이터 생성부를 포함하는 것을 특징으로 한다.Preferably, the evaluation data generation module includes a stock data acquisition unit that acquires stock data including at least one of stock price information, trading volume information, supply and demand trend information, and market capitalization ranking information for each time period for the evaluation target stock in real time and a plurality of bit values composed of a preset number of bits based on the securities data acquired corresponding to the evaluation target issue, a preset item code, a preset type code, a current value corresponding to the item code or the type code, or An evaluation item binary code generation unit for generating an evaluation item binary code by allocating a status code representing a status value according to comparison according to a predetermined standard and a content code representing a detailed value corresponding to the status code, and the evaluation item binary code When a plurality of binary codes for evaluation items are generated by the code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the plurality of binary codes for evaluation items are assigned to the imaged first evaluation data. It is characterized in that it comprises a first evaluation data generation unit for generating.

바람직하게는, 상기 평가데이터 생성모듈은, 상기 평가대상종목에 대한 소정의 평가기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 해당 종목의 언급량 변동 추이를 나타내는 복수 개의 제2 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 것이고, 상기 예측 분류부는, 상기 지도학습이 완료된 후 상기 제1 평가데이터와 상기 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 것을 특징으로 한다.Preferably, the evaluation data generation module includes a plurality of second buzz amount binaries representing changes in the amount of mention of the item based on unstructured data including the amount of mention of keywords for a predetermined evaluation period for the item to be evaluated. After generating a code, pixel values corresponding to the results listed in a predetermined order are assigned to generate imaged second evaluation data, and the prediction classifier generates the first evaluation data and the second evaluation data after the supervised learning is completed. When at least one of the second evaluation data is received, the received evaluation data is compared with the supervised learning value and classified into one of the plurality of classes.

또한, 상기 평가데이터 생성모듈은, 상기 평가대상종목에 대응하는 키워드를 이용하여 상기 평가기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 제2 버즈량데이터 획득부와, 상기 평가대상종목에 대응하여 획득된 비정형데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제2 항목코드, 상기 제2 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제2 상태코드, 상기 제2 상태코드에 대응되는 세부값을 나타내는 제2 내용코드로 각각 할당하여 제2 버즈량 이진코드를 생성하는 제2 버즈량 이진코드 생성부와, 상기 제2 버즈량 이진코드 생성부에 의해 복수 개의 상기 제2 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고 나열된 복수 개의 상기 제2 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 제2 평가데이터 생성부를 포함하는 것을 특징으로 한다.In addition, the evaluation data generating module acquires, in real time, unstructured data including the amount of keyword mentions by searching web pages on the Internet created during the evaluation period using keywords corresponding to the evaluation target items. A data acquisition unit converts a plurality of bit values consisting of a preset number of bits based on unstructured data obtained corresponding to the evaluation target item to a preset second item code, a current value corresponding to the second item code, or a preset A second buzz amount binary code for generating a second buzz amount binary code by allocating a second status code indicating a state value according to comparison according to a standard and a second content code indicating a detailed value corresponding to the second state code. When a plurality of second buzz amount binary codes are generated by a generation unit and the second buzz amount binary code generation unit, they are arranged in a predetermined order and correspond to the binary values of the plurality of second buzz amount binary codes listed. It is characterized in that it includes a second evaluation data generation unit that generates imaged second evaluation data by assigning one pixel value.

바람직하게는, 현재시점 이전의 서로 상이한 제1 시점 및 제2 시점 각각을 기준으로 기설정된 시간 동안의 제1 기간 및 제2 기간을 중복없이 설정하는 학습기간 설정부와, 상기 평가대상종목의 입력시점 이전의 서로 상이한 제3 시점 및 제4 시점 각각을 기준으로 기설정된 시간 동안의 제3 기간 및 제4 기간을 중복없이 설정하는 평가기간 설정부를 더 포함하며, 상기 학습종목 이진코드 생성부 및 상기 평가종목 이진코드 생성부는, 상기 학습종목 입력부 또는 상기 평가대상종목 입력부를 통해 입력받은 적어도 하나의 주식종목에 대응되는 증권데이터에 기초하여 상기 학습종목 이진코드 또는 상기 평가종목 이진코드를 생성하되, 상기 주식종목에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 주식종목에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 주식종목에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 주식종목에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것을 특징으로 한다.Preferably, a learning period setting unit for setting a first period and a second period for a predetermined time based on each of the first and second time points that are different from each other prior to the current time point without overlapping, and the input of the evaluation target item It further includes an evaluation period setting unit for setting a third period and a fourth period for a predetermined time based on each of the third and fourth time points prior to the point in time without overlap, and the learning item binary code generation unit and the The evaluation item binary code generation unit generates the learning item binary code or the evaluation item binary code based on the stock data corresponding to at least one stock item input through the learning item input unit or the evaluation item item input unit, A first binary code generated based on the stock price information for each time period collected for a stock item, a second binary code generated based on the trading volume information collected for the stock item, and a supply and demand trend collected for the stock item. It is characterized in that at least one of a third binary code generated based on information and a fourth binary code generated based on the market capitalization ranking collected for the stock item is generated.

또한, 상기 복수 개의 클래스는, 상기 제1 기간 및 상기 제2 기간에 기초한 지도학습 결과에 기초하여 현재시점 이후의 제5 기간에 대한 주가 추세의 상승 또는 하락 여부와 이에 따른 이격 정도를 분류하여 설정한 것이고, 상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터에 기초한 상기 복수 개의 클래스 각각에 대한 확률 분포를 계산하여 기설정된 군집화 알고리즘에 따라 군집화하는 군집화부를 더 포함하는 것을 특징으로 한다.In addition, the plurality of classes are set by classifying whether the stock price trend for the fifth period after the current time has risen or fallen and the degree of separation accordingly based on the supervised learning results based on the first period and the second period. and, when the first evaluation data is received after the supervised learning is completed, a probability distribution for each of the plurality of classes based on the first evaluation data is calculated and a clustering unit for clustering according to a preset clustering algorithm is further included. It is characterized by doing.

또한, 상기 군집화된 결과에 기초하여 가장 유사도가 높은 클래스에 대응하는 상기 기준학습값에 대한 이격 정도를 기설정된 임계치와 비교한 결과에 따라 상기 평가대상종목에 대한 매수 또는 매도 여부를 결정하는 매매 결정부를 더 포함하는 것을 특징으로 한다.In addition, based on the clustering result, a trading decision to determine whether to buy or sell the evaluation target item according to a result of comparing the degree of separation from the reference learning value corresponding to the class with the highest similarity with a preset threshold It is characterized in that it further includes wealth.

본 발명에 따르면, 지도 학습을 수행할 학습종목에 대한 학습데이터의 생성 시 증권데이터의 과거 주가 변동 상태에 대한 다양한 지표 정보들과 각종 이슈에 따른 버즈량 정보를 모두 반영함으로써 미래 특정기간의 주가 추세 변동 및 정도에 대한 예측 결과값의 정확도를 향상시킬 수 있는 효과가 있다.According to the present invention, when generating learning data for a learning item to perform supervised learning, various index information on the past stock price fluctuation state of stock data and buzz volume information according to various issues are reflected, so that the stock price trend of a specific period in the future There is an effect of improving the accuracy of the predicted result value for the variation and degree.

또한, 본 발명에 따르면, 각 주식종목에 대한 학습 데이터 또는 평가 데이터의 생성 시 필요한 정보들을 압축한 2진수 코드값을 이용하므로 학습모델에 기초한 주가 변동 예측 장치를 단순화하여 구현할 수 있는 이점이 있다.In addition, according to the present invention, since a binary code value in which necessary information is compressed when generating learning data or evaluation data for each stock item is used, there is an advantage in simplifying and implementing a stock price fluctuation prediction device based on a learning model.

또한, 본 발명에 따르면, 지도 학습에 이용되는 학습데이터 또는 예측 분석에 이용되는 평가데이터를 생성할 때 기초가 되는 이진코드의 할당 시 관리자의 입력에 따라 주가 관련 지표들에 대한 설정값을 용이하게 설정 및 변경 가능함으로써, 고객 맞춤형 개별 예측 분석이 가능한 자산 관리 포트폴리오 서비스를 제공할 수 있는 효과가 있다.In addition, according to the present invention, when generating learning data used for supervised learning or evaluation data used for predictive analysis, setting values for stock price-related indicators are easily set according to a manager's input when assigning a binary code as a basis. By being able to set and change, there is an effect of providing an asset management portfolio service capable of individual predictive analysis tailored to customers.

도 1은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치를 개략적으로 설명하기 위한 도면이고,
도 2는 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 구성을 나타내는 블록도이고,
도 3은 도 2의 학습종목 이진코드 생성부 또는 평가종목 이진코드 생성부에 의해 생성되는 학습종목 이진코드 또는 평가종목 이진코드를 할당 영역별로 구분하여 나타낸 도면이고,
도 4는 도 2의 학습모델부에서 지도학습 수행 시 이용하는 복수 개의 클래스별 지도학습값의 일례를 나타낸 도면이고,
도 5는 도 2의 예측 분류부에서 평가대상종목에 대한 과거 평가데이터에 기초하여 미래 특정기간의 주가 변동 예측 정도에 대응하는 클래스로 분류하는 방법을 설명하기 위해 시간별 주가 및 거래량 그래프상에 표시한 도면이고,
도 6은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 동작 흐름을 나타낸 순서도이다.
1 is a diagram for schematically explaining an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention;
2 is a block diagram showing the configuration of an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention;
FIG. 3 is a diagram showing the binary codes for learning items or the binary codes for evaluation items generated by the binary code generation unit for learning items or the binary code for evaluation items in FIG. 2 divided into assigned areas;
4 is a diagram showing an example of supervised learning values for each of a plurality of classes used when performing supervised learning in the learning model unit of FIG. 2;
5 is displayed on a graph of stock price and trading volume by hour to explain a method of classifying a method of classifying into a class corresponding to the predicted degree of stock price change in a specific period in the future based on past evaluation data for an item to be evaluated in the prediction classification unit of FIG. 2 is a drawing,
6 is a flowchart illustrating an operation flow of an apparatus for predicting stock price fluctuation based on a learning model according to an embodiment of the present invention.

이상과 같은 본 발명에 대한 해결하려는 과제, 과제의 해결수단, 발명의 효과를 포함한 구체적인 사항들은 다음에 기재할 실시예 및 도면에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예를 참조하면 명확해질 것이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.The specific details, including the problems to be solved, the solutions to the problems, and the effect of the invention for the present invention as described above are included in the embodiments and drawings to be described below. Advantages and features of the present invention, and methods of achieving them, will become clear with reference to the detailed description of the following embodiments taken in conjunction with the accompanying drawings. Like reference numbers designate like elements throughout the specification.

도 1은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치를 개략적으로 설명하기 위한 도면이고, 도 2는 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 구성을 나타내는 블록도이고, 도 3은 도 2의 학습종목 이진코드 생성부 또는 평가종목 이진코드 생성부에 의해 생성되는 학습종목 이진코드 또는 평가종목 이진코드를 할당 영역별로 구분하여 나타낸 도면이고, 도 4는 도 2의 학습모델부에서 지도학습 수행 시 이용하는 복수 개의 클래스별 지도학습값의 일례를 나타낸 도면이고, 도 5는 도 2의 예측 분류부에서 평가대상종목에 대한 과거 평가데이터에 기초하여 미래 특정기간의 주가 변동 예측 정도에 대응하는 클래스로 분류하는 방법을 설명하기 위해 시간별 주가 및 거래량 그래프상에 표시한 도면이고, 도 6은 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치의 동작 흐름을 나타낸 순서도이다.1 is a diagram for schematically explaining an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention, and FIG. 2 shows a configuration of an apparatus for predicting stock price fluctuations based on a learning model according to an embodiment of the present invention. FIG. 3 is a diagram showing the learning item binary code or the evaluation item binary code generated by the learning item binary code generator or the evaluation item binary code generator of FIG. It is a diagram showing an example of a plurality of supervised learning values for each class used when supervised learning is performed in the learning model unit of FIG. 2, and FIG. 5 is a future specific period based on past evaluation data for an item to be evaluated in the prediction classification unit of FIG. It is a diagram displayed on the hourly stock price and trading volume graph to explain a method of classifying into a class corresponding to the predicted degree of stock price change, and FIG. Here is a flow chart showing the flow.

이하, 전술한 도면들을 참조하여 본 발명의 바람직한 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치에 대해 설명하도록 한다.Hereinafter, an apparatus for predicting stock price fluctuation based on a learning model according to a preferred embodiment of the present invention will be described with reference to the above-described drawings.

도 1을 참조하면, 본 발명의 일 실시예에 따른 학습모델에 기초한 주가 변동 예측 장치(1000)는 크게 학습종목 입력부(10), 학습기간 설정부(20), 평가대상종목 입력부(30), 평가기간 설정부(40), 학습데이터 생성모듈(100), 학습모델부(200), 평가데이터 생성모듈(300) 및 예측모듈(400)을 포함하여 구성된다.Referring to FIG. 1, the stock price fluctuation prediction apparatus 1000 based on the learning model according to an embodiment of the present invention includes a learning item input unit 10, a learning period setting unit 20, an evaluation target item input unit 30, It is composed of an evaluation period setting unit 40, a learning data generation module 100, a learning model unit 200, an evaluation data generation module 300, and a prediction module 400.

학습종목 입력부(10)는 머신러닝 기반 지도학습을 수행할 학습종목(IL)을 입력받기 위한 것이다(S610).The learning item input unit 10 is for receiving an input of a learning item ( IL ) to perform machine learning-based supervised learning (S610).

학습종목 입력부(10)는 학습종목(IL)으로서 증권시장에 상장된 복수 개의 주식종목을 관리자로부터 입력받는다.The learning item input unit 10 receives a plurality of stock items listed on the stock market as a learning item ( IL ) from a manager.

학습종목 입력부(10)는 관리자단말기(1)와 데이터 통신 연결된 상태일 수 있으며, 현재 증권시장에 상장된 모든 주식종목들 중에서 관리자가 선택 입력한 결과를 관리자단말기(1)로부터 수신하여 수신한 선택 입력에 대응하는 주식종목을 학습종목(IL)으로 입력받을 수 있다.The learning item input unit 10 may be connected to the manager terminal 1 by data communication, and receives the result of the manager selecting and inputting from all stock items currently listed on the stock market from the manager terminal 1 and receiving the received selection The stock item corresponding to the input can be input as the learning item ( IL ).

학습기간 설정부(20)는 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 대한 지도학습을 수행하기 위한 학습데이터의 생성 시 기초가 되는 비정형데이터 및 증권데이터의 획득 기간을 특정하여 학습기간(PS)을 설정한다.The learning period setting unit 20 specifies the acquisition period of unstructured data and stock data that is the basis for generating learning data for performing supervised learning for the learning item ( IL ) input by the learning item input unit 10 to set the learning period (P S ).

학습기간 설정부(20)는 상기 학습기간(PS)을 설정함에 있어서 현재시점 이전의 서로 상이한 제1 시점(T1) 및 제2 시점(T2) 각각을 기준으로 기설정된 시간 동안의 제1 기간(P1) 및 제2 기간(P2)을 중복없이 설정하되, 제2 기간(P2)은 제1 기간(P1) 이후 기설정된 시간간격을 두도록 설정할 수 있다.In setting the learning period (P S ), the learning period setting unit 20 sets the first time period (T 1 ) and the second time period (T 2 ) prior to the current time period during a preset time based on each other. The first period (P 1 ) and the second period (P 2 ) are set without overlapping, but the second period (P 2 ) may be set to have a predetermined time interval after the first period (P 1 ).

학습기간 설정부(20)는 학습종목(IL)에 대한 대량의 학습데이터를 이용하여 지도학습을 반복적으로 수행할 수 있도록 일정 시간 주기 단위마다 학습기간(PS)을 새로 설정하여 업데이트할 수 있다.The learning period setting unit 20 can newly set and update the learning period (P S ) at every predetermined time period so that supervised learning can be repeatedly performed using a large amount of learning data for the learning item ( IL ). there is.

평가대상종목 입력부(30)는 주가 변동성을 예측하고자 하는 평가대상종목(IE)을 입력받기 위한 것이다(S640).The evaluation target item input unit 30 is for receiving an evaluation target item (I E ) to predict stock price volatility (S640).

평가대상종목 입력부(30)는 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 포함된 복수 개의 주식종목 중에서 적어도 어느 하나의 주식종목을 사용자로부터 평가대상종목(IE)으로 입력받는다.The evaluation target item input unit 30 inputs at least one stock item among a plurality of stock items included in the learning item ( IL ) input by the learning item input unit 10 as the evaluation target item (I E ) from the user. receive

평가대상종목 입력부(30)는 사용자단말기(3)와 데이터 통신 연결된 상태일 수 있으며, 학습종목(IL)에 포함된 복수 개의 주식종목 중에서 사용자가 선택 입력한 결과를 사용자단말기(3)로부터 수신하여 수신한 선택 입력에 대응하는 주식종목을 평가대상종목(IE)으로 입력받을 수 있다.The evaluation target item input unit 30 may be connected to the user terminal 3 by data communication, and the user selects and inputs a result from a plurality of stock items included in the learning item IL from the user terminal 3. Thus, the stock issue corresponding to the received selection input can be input as the evaluation target issue (I E ).

평가기간 설정부(40)는 평가대상종목(IE)에 대한 평가데이터의 생성 시 기초가 되는 비정형데이터 및 증권데이터의 획득 기간을 특정하여 평가기간(PE)을 설정하는 것으로, 전술한 학습기간 설정부(20)와 동일한 기능을 수행하는 것일 수 있다.The evaluation period setting unit 40 sets the evaluation period ( PE ) by specifying the acquisition period of unstructured data and securities data that are the basis for generating evaluation data for the evaluation target item (I E ). It may be to perform the same function as the period setting unit 20 .

평가기간 설정부(40)는 상기 평가기간(PE)을 설정함에 있어서 평가대상종목(IE)의 입력시점(TC) 이전의 서로 상이한 제3 시점(T3) 및 제4 시점(T4) 각각을 기준으로 기설정된 시간 동안의 제3 기간(P3) 및 제4 기간(P4)을 중복없이 설정하되, 제4 기간(P4)은 제3 기간(P3) 이후 기설정된 시간간격을 두도록 설정할 수 있다.In setting the evaluation period ( PE ), the evaluation period setting unit 40 sets the evaluation target item (I E ) at a different third time point (T 3 ) and fourth time point (T C ) prior to the input time point (T C ). 4 ) Set the third period (P 3 ) and the fourth period (P 4 ) without overlapping during the predetermined time based on each, but the fourth period (P 4 ) is the third period (P 3 ). You can set a time interval.

이때, 학습기간(PS)에 기초한 제1 시점(T1) 및 제2 시점(T2)에서 현재시점까지의 시간간격과 평가기간(PE)에 기초한 제3 시점(T3) 및 제4 시점(T4)에서 평가대상종목(IE)의 입력시점(TC)까지의 시간간격은 동일하게 설정될 수 있다.At this time, the time interval from the first time point (T 1 ) and the second time point (T 2 ) based on the learning period ( PS ) to the current time point and the third time point (T 3 ) based on the evaluation period ( PE ) and the second time point (T 3 ) The time interval from the 4th time point (T 4 ) to the input time point (T C ) of the evaluation target item (I E ) can be set identically.

학습데이터 생성모듈(100)은 학습종목(IL) 및 학습기간(PS)에 기초한 지도학습에 기반이 되는 학습데이터를 생성하는 역할을 한다(S620).The learning data generation module 100 serves to generate learning data based on supervised learning based on the learning item ( IL ) and the learning period ( PS ) (S620).

학습데이터 생성모듈(100)은 실질적인 주가 변동 상태가 반영된 증권데이터를 기반으로 한 제1 학습데이터와, 각종 이슈에 따른 투자 심리가 반영된 비정형데이터를 기반으로 한 제2 학습데이터 중 적어도 하나를 생성한다.The learning data generation module 100 generates at least one of first learning data based on stock data reflecting actual stock price fluctuations and second learning data based on unstructured data reflecting investor sentiment according to various issues. .

구체적으로, 학습데이터 생성모듈(100)은 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 대한 과거 특정기간의 증권데이터에 기초하여 학습종목(IL)에 포함된 각 주식종목에 대한 항목별 변동 상태를 나타내는 복수 개의 학습종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성할 수 있다.Specifically, the learning data generation module 100 is based on the stock data of the past specific period for the learning item ( IL ) input by the learning item input unit 10, each stock item included in the learning item ( IL ) Imaged first learning data may be generated by generating a plurality of learning item binary codes representing the change state for each item and then assigning pixel values corresponding to the results arranged in a predetermined order.

또한, 학습데이터 생성모듈(100)은, 학습종목 입력부(10)에 의해 입력받은 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대한 소정의 학습기간(PS) 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 각 주식종목별 언급량 변동 추이를 나타내는 복수 개의 제1 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성할 수 있다.In addition, the learning data generating module 100 is a keyword reference amount for a predetermined learning period (P S ) for each of a plurality of stock items included in the learning item ( IL ) input by the learning item input unit 10 . After generating a plurality of first buzz amount binary codes representing the trend of change in the amount of mention for each stock item based on unstructured data including data can be generated.

이와 관련하여, 학습데이터 생성모듈(100)은 도 2에 도시된 바와 같이 제1 학습데이터의 생성에 관여하는 증권데이터 획득부(110), 학습종목 이진코드 생성부(120) 및 제1 학습데이터 생성부(130)와, 제2 학습데이터의 생성에 관여하는 비정형데이터 획득부(140), 제1 버즈량 이진코드 생성부(150) 및 제2 학습데이터 이진코드 생성부(160)를 포함할 수 있다.In this regard, the learning data generation module 100, as shown in FIG. 2, includes a securities data acquisition unit 110 involved in generating the first learning data, a learning item binary code generation unit 120, and the first learning data It may include a generator 130, an unstructured data acquisition unit 140 involved in generating second learning data, a first buzz amount binary code generator 150, and a second training data binary code generator 160. can

증권데이터 획득부(110)는 상기 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 일자별 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득한다.The stock data acquisition unit 110 provides stock data including at least one of stock price information, trading volume information, supply and demand trend information by time slot, and daily market capitalization ranking information for each of a plurality of stock items included in the learning item ( IL ). is obtained in real time.

증권데이터 획득부(110)는 다수의 증권사 API를 통해 해당 증권사 서버에 접속하여 파이썬(Python) 언어를 기반으로 하는 웹 스크래핑(Web Scraping) 기법을 이용해 주식종목별 증권데이터를 실시간으로 획득하는 것일 수 있다.The stock data acquisition unit 110 may acquire stock data for each stock item in real time using a web scraping technique based on the Python language by accessing a corresponding stock office server through a plurality of stock company APIs. .

학습종목 이진코드 생성부(120)는 상기 학습종목(IL)에 대응하여 획득된 증권데이터에 기초하여 주식종목별 주가 변동 상태 정보를 이진코드 형태로 생성한다.The learning item binary code generation unit 120 generates stock price fluctuation state information for each stock item in the form of a binary code based on the acquired stock data corresponding to the learning item ( IL ).

학습종목 이진코드 생성부(120)는 각 주식종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 학습종목 이진코드를 생성할 수 있다.The learning item binary code generation unit 120 converts a plurality of bit values consisting of a preset number of bits for each stock item into a preset item code, a preset type code, a current value or a preset value corresponding to the item code or the type code. Binary codes for learning items can be generated by assigning a state code indicating a state value according to comparison according to a standard and a content code indicating a detailed value corresponding to the state code.

여기서, 학습종목 이진코드 생성부(120)는 학습종목 입력부(10)를 통해 입력받은 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대응되는 증권데이터에 기초하여 학습종목 이진코드를 생성하되, 상기 주식종목에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 주식종목에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 주식종목에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 주식종목에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것일 수 있다.Here, the learning item binary code generation unit 120 generates a learning item binary code based on stock data corresponding to each of a plurality of stock items included in the learning item ( IL ) input through the learning item input unit 10 However, the first binary code generated based on the stock price information for each time period collected for the stock item, the second binary code generated based on the trading volume information collected for the stock item, and the collection for the stock item At least one of a third binary code generated based on the collected supply and demand trend information and a fourth binary code generated based on a market capitalization ranking collected for the stock item may be generated.

이때, 학습종목 이진코드 생성부(120)는 도 3에 도시된 바와 같이 헤더 영역(50)을 제외한 복수의 데이터 영역들을 각각 기설정된 비트수에 따른 제1 이진코드 영역(51), 상기 제1 이진코드 영역(51)보다 하위 비트 영역에 할당되는 제2 이진코드 영역(52), 상기 제2 이진코드 영역(52)보다 하위 비트 영역에 할당되는 제3 이진코드 영역(53), 상기 제3 이진코드 영역(53)보다 하위 비트 영역에 할당되는 제4 이진코드 영역(54)으로 구분하여 상기 복수의 데이터 영역들에 대응하는 이진코드값을 생성할 수 있다.At this time, as shown in FIG. 3, the learning item binary code generation unit 120 converts a plurality of data areas except for the header area 50 into a first binary code area 51 according to a preset number of bits, the first A second binary code area 52 allocated to a lower bit area than the binary code area 51, a third binary code area 53 allocated to a lower bit area than the second binary code area 52, Binary code values corresponding to the plurality of data areas may be generated by dividing into a fourth binary code area 54 allocated to a lower bit area than the binary code area 53 .

이 경우, 제1 이진코드 영역(51)에 상기 제1 이진코드를 생성하고 제2 이진코드 영역(52)에 상기 제2 이진코드를 생성하고 제3 이진코드 영역(53)에 상기 제3 이진코드를 생성하고 제4 이진코드 영역(54)에 상기 제4 이진코드를 생성할 수 있다.In this case, the first binary code is generated in the first binary code area 51, the second binary code is generated in the second binary code area 52, and the third binary code is generated in the third binary code area 53. A code may be generated and the fourth binary code may be generated in the fourth binary code area 54 .

여기서, 상기 제1 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 각 주식종목에 대한 시간대별 주가 정보를 이용하여, 아래의 표 1에 기재된 바와 같이, 각 주식종목에 대한 소정 단위별 이동평균선(Moving Average)을 기준으로 한 추세 방향 정보가 상기 상태코드로 할당되고, 상기 이동평균선의 단위구분값 및 기준단위값이 상기 종류코드 및 상기 내용코드로 각각 할당되는 것일 수 있다.Here, the first binary code uses stock price information for each time period for each stock item acquired by the stock data acquisition unit 110 corresponding to the learning item ( IL ), as shown in Table 1 below, Trend direction information based on a moving average for each stock item for each predetermined unit is assigned to the status code, and the unit division value and reference unit value of the moving average line are respectively assigned to the type code and the content code. may be assigned.

이때, 상기 이동평균선은 일정 기간 동안의 주가를 산술 평균한 값인 주가 이동 평균을 차례로 연결해 만든 선을 나타내며, 일반적으로 주식시장에서 주가의 흐름을 관찰하기 위한 기술적 분석을 할 때 기본적으로 사용되는 도구에 속하므로 이에 대한 자세한 설명은 생략하도록 한다.At this time, the moving average line represents a line created by sequentially connecting stock price moving averages, which are arithmetic averages of stock prices over a certain period of time. Therefore, a detailed description thereof will be omitted.

항목코드item code 종류코드type code 상태코드status code 내용코드content code 단위unit value 이상more 이하below 이평선 기간moving average period 모멘텀
(1100)
momentum
(1100)




minute
city
Day
main
month
001
010
011
101
110
001
010
011
101
110
001001 010010 기준되는 이평선에 대한 기준단위값Reference unit value for the moving average to be referenced

여기서, 상기 제2 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 시간대별 거래량 정보를 이용하여, 아래의 표 2에 기재된 바와 같이, 학습기간(PS)에 속하는 제1 기간(P1) 동안 누적된 거래량의 평균인 제1 평균 거래량(V1)과 학습기간(PS)에 속하는 제2 기간(P2) 동안 누적된 거래량의 평균인 제2 평균 거래량(V2)에 기초하여, 제1 평균 거래량(V1) 대비 제2 평균 거래량(V2)의 증감 여부 및 정도에 대응되는 상태값 및 세부값이 상기 상태코드 및 상기 내용코드로 각각 할당되는 것일 수 있다.Here, the second binary code is the learning period (P S ) The first average transaction volume ( V1 ), which is the average of the accumulated transaction volumes during the first period (P 1 ) belonging to the learning period (P S ), and the second average, which is the average of the accumulated transaction volumes during the second period (P 2 ) belonging to the learning period (P S ) Based on the transaction volume (V2), the state value and the detailed value corresponding to whether and the degree of increase or decrease of the second average transaction volume (V2) compared to the first average transaction volume (V1) may be assigned to the status code and the content code, respectively. there is.

항목코드item code 종류코드type code 상태코드status code 101101 000000 001001 거래량
(0001)
trading volume
(0001)
해당없음
(000)
Not applicable
(000)
V1 > V2V1 > V2 V1 = V2
(-1 이상 하락 또는 1 미만 상승)
V1 = V2
(Drop by -1 or rise by less than 1)
V1 < V2V1 < V2

여기서, 상기 제3 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 시간대별 수급 동향 정보를 이용하여, 아래의 표 3에 기재된 바와 같이, 과거 소정시점으로부터 현재시점까지의 기간(S) 동안의 연속 매수 또는 매도의 발생 여부 및 정도에 대응되는 상태값 및 세부값이 상기 상태코드 및 상기 내용코드로 각각 할당되는 것일 수 있다.Here, the third binary code corresponds to the learning item ( IL ) by using the supply and demand trend information for each time period acquired by the stock data acquisition unit 110, as shown in Table 3 below, from a predetermined point in the past. Status values and detailed values corresponding to occurrence and degree of continuous buying or selling during the period S up to the present time may be assigned to the status code and the content code, respectively.

이때, Ps1과 Ps2는 서로 상이하게 기설정된 제1 수급기간 및 제2 수급기간을 각각 나타내고, G는 기설정된 퍼센트를 나타낸다.At this time, Ps 1 and Ps 2 represent a first supply and demand period and a second supply and demand period that are set differently from each other, and G represents a preset percentage.

항목코드item code 종류코드type code 상태코드status code 주체명subject name value 101101 000000 001001 수급 I
(0101)
supply and demand I
(0101)
기관
외국인
연기금
Agency
foreigner
pension fund
001
010
011
001
010
011
S > Ps1
(연속 매도)
S > Ps 1
(continuous selling)
해당없음Not applicable S > Ps1
(연속 매수)
S > Ps 1
(continuous purchase)
수급 II
(0110)
supply and demand II
(0110)
기관
외국인
연기금
Agency
foreigner
pension fund
001
010
011
001
010
011
S ⊂ Ps2
(G 이상 매도)
S ⊂ Ps 2
(Sell above G)
해당없음Not applicable S ⊂ Ps2
(G 이상 매수)
S ⊂ Ps 2
(Buy more than G)

여기서, 상기 제4 이진코드는 학습종목(IL)에 대응하여 증권데이터 획득부(110)에 의해 획득되는 일자별 총액 순위 정보를 이용하여, 아래의 표 4에 기재된 바와 같이, 기설정된 복수 개의 순위 범위 중에서 상기 주식종목이 속하는 순위 범위에 대응되는 상태값이 상기 상태코드로 할당되고, 상기 주식종목이 상장된 시장 종류 정보가 상기 종류코드로 할당되는 것일 수 있다.Here, the fourth binary code corresponds to the learning item ( IL ), using the daily total ranking information obtained by the stock data acquisition unit 110, as shown in Table 4 below, a plurality of predetermined rankings Among the ranges, a status value corresponding to a ranking range to which the stock item belongs may be assigned as the status code, and market type information in which the stock item is listed may be assigned as the type code.

항목코드
item code
종류코드type code 상태코드status code
시장market value 000000 001001 010010 011011 시가총액 순위
(1001)
Market cap ranking
(1001)
코스피
코스닥
KOSPI
KOSDAQ
001
010
001
010
제1범위
(301위 이하)
1st scope
(301st and below)
제2범위
(101위~300위)
2nd scope
(101st - 300th)
제3범위
(51위~100위)
3rd scope
(51st to 100th)
제4범위
(50위 이내)
4th scope
(within top 50)

아래의 표 5는 전술한 바에 따라 생성되는 상기 제1 이진코드 내지 상기 제4 이진코드 각각의 일례를 표로 정리하여 나타낸 것이다. Table 5 below shows an example of each of the first to fourth binary codes generated as described above in a table.

항목코드item code 종류코드type code 상태코드status code 내용코드content code 1100
(모멘텀)
1100
(momentum)
011011 001001 01010101
0001
(거래량)
0001
(trading volume)
000000 001001 01010101
0101
(수급 I)
0101
(supply and demand I)
001001 101101 01010101
0110
(수급 II)
0110
(supply and demand II)
001001 101101 01110111
1001
(시가총액순위)
1001
(Market cap ranking)
001001 001001 00000000

예컨대, 상기 표 5를 참조하면, 상기 제1 이진코드는 '모멘텀'에 대응하는 항목코드 "1100"와, 이동평균선의 단위구분값이 '일(단위)'임을 나타내는 종류코드 "011"과, 현재 주가의 추세 방향이 이동평균선보다 높은 상태(상승 추세)를 나타내는 상태코드 "001"과, 이동평균선의 기준단위값이 '5(일)'임을 나타내는 내용코드 "0101"을 포함할 수 있으며, 이는 현재 주가가 5일 이동평균선 이상인 경우를 나타낸다.For example, referring to Table 5, the first binary code includes item code "1100" corresponding to 'momentum', type code "011" indicating that the unit division value of the moving average line is 'day (unit)', It may include the status code "001" indicating that the trend direction of the current stock price is higher than the moving average line (uptrend), and the content code "0101" indicating that the reference unit value of the moving average line is '5 (day)', This indicates that the current stock price is above the 5-day moving average.

또한, 상기 제2 이진코드는 '거래량'에 대응하는 항목코드 "0001"과, 제1 평균 거래량(V1)이 제2 평균 거래량(V2)보다 작은 상태를 나타내는 상태코드 "001"와, 두 평균 거래량의 차이가 '5[%]'임을 나타내는 내용코드 "0101"을 포함할 수 있으며, 이는 제1 기간 거래량 평균 대비 제2 기간 거래량 평균이 5% 상승한 경우를 나타낸다.In addition, the second binary code includes an item code "0001" corresponding to 'transaction volume', a status code "001" indicating a state in which the first average transaction volume (V1) is smaller than the second average transaction volume (V2), and the average of the two It may include content code "0101" indicating that the difference in trading volume is '5[%]', which indicates a case in which the average trading volume of the second period is increased by 5% compared to the average trading volume of the first period.

또한, 제1 수급기간(PS1)이 '3일'로 기설정된 상태일 때 상기 제3 이진코드는 '수급 I'에 대응하는 항목코드 "0101"과, 수급주체가 '기관'임을 나타내는 종류코드 "001"과, 기설정된 제1 수급기간(PS1)보다 큰 수급기간(S) 동안 연속 매도한 상태를 나타내는 상태코드 "101"과, 수급기간(S)의 상세값이 '5(일)'임을 나타내는 내용코드 "0101"을 포함할 수 있으며, 이는 기관이 5일 연속 매도한 경우를 나타낸다.In addition, when the first supply and demand period (P S1 ) is set to '3 days', the third binary code is the item code "0101" corresponding to 'supply and demand I' and the type indicating that the supply and demand subject is an 'institution'. The code "001", the status code "101" indicating the state of continuous selling during the supply and demand period (S) greater than the preset first supply and demand period (P S1 ), and the detailed value of the supply and demand period (S) are '5 (days) )', which indicates that the institution has sold for 5 consecutive days.

또한, 제2 수급기간(PS2)이 '10일'이고 기준 퍼센트(G)가 '50%'로 기설정된 상태일 때 상기 제3 이진코드는 '수급 II'에 대응하는 항목코드 "0110"과, 수급주체가 '기관'임을 나타내는 종류코드 "001"과, 기설정된 제2 수급기간(PS2)보다 큰 수급기간(S) 동안 50% 이상 연속 매도한 상태를 나타내는 상태코드 "101"과, 수급기간(S)의 상세값이 '7(일)'임을 나타내는 내용코드 "0111"을 포함할 수 있으며, 이는 기관이 최근 10일 중 7일 매도한 경우를 나타낸다.In addition, when the second supply and demand period (P S2 ) is '10 days' and the reference percentage (G) is preset to '50%', the third binary code is item code "0110" corresponding to 'supply and demand II' and "001", a type code indicating that the supply and demand subject is an 'institution', and a status code "101" indicating a state of continuous sales of 50% or more during a supply and demand period (S) greater than the preset second supply and demand period (P S2 ) , The content code "0111" indicating that the detailed value of the supply period (S) is '7 (day)', which indicates that the institution has sold 7 days out of the last 10 days.

또한, 상기 제4 이진코드는 '시가총액순위'에 대응하는 항목코드 "1001"과, 주식종목 A가 상장된 시장 종류가 '코스피'임을 나타내는 종류코드 "001"과, 주식종목 A가 속하는 순위 범위가 '제2 범위'임을 나타내는 상태코드 "001"를 포함할 수 있으며, 이는 코스피 A종목의 시가 총액 순위가 101~300 위인 경우를 나타낸다.In addition, the fourth binary code includes an item code "1001" corresponding to 'market capitalization ranking', a type code "001" indicating that the type of market in which stock item A is listed is 'KOSPI', and a ranking to which stock item A belongs. The status code "001" indicating that the range is 'second range' may be included, which indicates a case where the market capitalization ranking of KOSPI A stock is 101 to 300.

제1 학습데이터 생성부(130)는 학습종목 이진코드 생성부(120)에 의해 복수 개의 상기 학습종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 학습종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성한다.When a plurality of the learning item binary codes are generated by the learning item binary code generator 120, the first learning data generation unit 130 lists them in a predetermined order, and the binary code of the plurality of the learning item binary codes listed. By assigning a pixel value corresponding to the value, imaged first learning data is generated.

여기서, 제1 학습데이터 생성부(130)는 상기 학습종목 이진코드를 소정 비트(bit) 단위로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제1 학습데이터를 생성할 수 있다.Here, the first learning data generation unit 130 divides the learning item binary code into predetermined bit units to represent one pixel per unit, so that an image that meets the specifications of the input layer of the learning model, That is, first learning data in the form of an image having the same ratio as the ratio of rows and columns of the matrix of the input layer may be generated.

비정형데이터 획득부(140)는 상기 학습종목(IL)에 포함된 복수 개의 주식종목 각각에 대응하는 키워드를 이용하여 상기 학습기간(PS)에 작성된 인터넷상의 웹페이지를 검색함에 따른 주식종목별 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득한다.The unstructured data acquisition unit 140 searches web pages on the Internet created during the learning period ( PS ) using keywords corresponding to each of a plurality of stock items included in the learning item ( IL ), and keywords for each stock item. Acquire unstructured data including reference amount in real time.

비정형데이터 획득부(140)는 소정의 프로그래밍 언어, 예컨대, 파이썬(Python)을 이용한 쿼리 기반 접근 방식에 따른 웹 크롤링(Web Crawling) 및 파싱(Parsing) 기법을 통해 각 주식종목에 대응하는 키워드 문자열에 기초한 웹 검색을 수행함에 따른 키워드 언급량을 산출함에 따른 비정형데이터를 실시간으로 획득하는 것일 수 있다.The unstructured data acquisition unit 140 obtains a keyword string corresponding to each stock item through a web crawling and parsing technique according to a query-based approach using a predetermined programming language, for example, Python. It may be to acquire unstructured data in real time according to calculating the amount of keyword mentions as a result of performing a web search based on the web search.

제1 버즈량 이진코드 생성부(150)는 상기 학습종목(IL)에 대응하여 획득된 비정형데이터에 기초하여 주식종목별 이슈에 따른 버즈량 정보를 이진코드 형태로 생성한다.The first buzz amount binary code generation unit 150 generates buzz amount information according to an issue for each stock item in the form of a binary code based on unstructured data obtained in correspondence with the learning item IL .

제1 버즈량 이진코드 생성부(150)는 각 주식 종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제1 항목코드, 상기 제1 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제1 상태코드, 상기 제1 상태코드에 대응되는 세부값을 나타내는 제1 내용코드로 각각 할당하여 제1 버즈량 이진코드를 생성할 수 있다.The first buzz amount binary code generation unit 150 generates a plurality of bit values consisting of a preset number of bits for each stock item according to a preset first item code, a current value corresponding to the first item code, or a preset standard. The first buzz amount binary code may be generated by allocating a first state code indicating a state value according to comparison and a first content code indicating a detailed value corresponding to the first state code.

제2 학습데이터 생성부(160)는 제1 버즈량 이진코드 생성부(150)에 의해 복수 개의 상기 제1 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 제1 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성한다.When a plurality of first buzz amount binary codes are generated by the first buzz amount binary code generator 150, the second learning data generation unit 160 arranges them in a predetermined order, and lists the plurality of first buzz amount binary codes listed. Imaged second learning data is generated by assigning a pixel value corresponding to the binary value of the buzz amount binary code.

여기서, 제2 학습데이터 생성부(160)는 상기 제1 버즈량 이진코드를 소정 비트 단위(bit)로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제2 학습데이터를 생성할 수 있다.Here, the second learning data generation unit 160 divides the first buzz amount binary code into predetermined bit units to represent one pixel per unit, thereby meeting the specifications of the input layer of the learning model. Second learning data in the form of an image, that is, an image having the same ratio as the ratio of rows and columns of the matrix of the input layer may be generated.

학습모델부(200)는 학습데이터 생성모듈(100)에 의해 생성된 학습데이터에 기초하여 학습종목(IL)의 미래 특정기간의 주가 변동 정도에 대한 예측을 위한 지도학습을 수행한다(S630).The learning model unit 200 performs supervised learning to predict the degree of stock price change of a specific future period of the learning item ( IL ) based on the learning data generated by the learning data generation module 100 (S630). .

학습모델부(200)는 제1 학습데이터 생성부(130)에 의해 생성된 제1 학습데이터 또는 제2 학습데이터 생성부(160)에 의해 생성된 제2 학습데이터 각각에 기초하여 학습종목(IL)의 추후 주가 변동 정도에 대한 예측결과에 대응하도록 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행할 수 있다.The learning model unit 200 is a learning item (I) based on the first learning data generated by the first learning data generator 130 or the second learning data generated by the second learning data generator 160, respectively. It is possible to perform supervised learning using a plurality of pre-set supervised learning values for each class to correspond to the predicted result of the future stock price fluctuation of L ).

학습모델부(200)는 입력층과, 콘볼루션 연산을 수행하는 복수 개의 콘볼루션층과, 연산된 데이터의 크기를 축소하는 복수 개의 풀링층과, 풀링된 데이터를 비선형적으로 변형함에 따라 클래스별 분류가 용이하도록 하는 복수 개의 활성화함수층을 포함하는 신경망 구조로 이루어진 합성곱 신경망(CNN; Convolution Neural Network)을 기반으로 하는 CNN 학습모델을 포함할 수 있다.The learning model unit 200 includes an input layer, a plurality of convolution layers that perform convolution operations, a plurality of pooling layers that reduce the size of the calculated data, and non-linearly transforming the pooled data for each class. It may include a CNN learning model based on a convolution neural network (CNN) consisting of a neural network structure including a plurality of activation function layers to facilitate classification.

이 경우, 학습모델부(200)는 이미지 형태의 학습데이터와 이에 대응되는 지도학습값을 입력받으면 기설정된 신경망 구조의 파라미터들이 정리됨에 따라 학습되는 것일 수 있다.In this case, when the learning model unit 200 receives image-type learning data and a corresponding supervised learning value, it may be learned as the parameters of the neural network structure are arranged.

여기서, 상기 복수 개의 클래스는, 제1 기간(P1) 및 제2 기간(P2)에 기초한 지도학습 결과에 기초하여 현재시점 이후의 제5 기간(PF)에 대한 주가 추세의 상승 또는 하락 여부와 이에 따른 이격 정도를 분류하여 설정한 것일 수 있다.Here, the plurality of classes, based on the results of supervised learning based on the first period (P 1 ) and the second period (P 2 ), the rise or fall of the stock price trend for the fifth period (P F ) after the current point in time It may be set by classifying whether or not and the degree of separation accordingly.

아래의 표 6은 복수 개의 클래스 각각에 대응하는 지도학습값에 대한 추세 방향 및 이격 정도를 표로 정리하여 나타낸 것이다.Table 6 below shows the direction of the trend and the degree of separation for the supervised learning values corresponding to each of the plurality of classes.

지도학습값supervised learning value 제5 기간 데이터 예측Fifth Period Data Forecast 추세Trends 이격 정도degree of separation 1One C1C1 하락degradation 제3 범위3rd scope 22 C2C2 하락degradation 제2 범위2nd scope 33 C3C3 하락degradation 제1 범위1st range 44 C4C4 보합bohab ­­ 55 C5C5 상승Increase 제1 범위1st range 66 C6C6 상승Increase 제2 범위2nd range 77 C7C7 상승Increase 제3 범위3rd scope

예컨대, 상기 표 6 및 도 4를 참조하면, 제1 지도학습값(C1)은 과거 특정기간(제1 기간(P1), 제2 기간(P2))에 기초한 지도학습 결과에 기초하여 현재 시점 이후의 제5 기간(PF)에 대한 주가 추세가 제3 범위 내로 하락할 것으로 예측되는 경우에 대응하고, 제4 지도학습값(C4)은 상기 지도학습 결과에 기초하여 상기 제5 기간(PF)에 대한 주가 추세가 변동 없이 보합할 것으로 예측되는 경우에 대응하고, 제6 지도학습값(C6)은 상기 지도학습 결과에 기초하여 상기 제5 기간(PF)에 대한 주가 추세가 제2 범위 내로 상승할 것으로 예측되는 경우에 대응하도록 설정된 것일 수 있다.For example, referring to Table 6 and FIG. 4, the first supervised learning value C1 is currently based on the supervised learning result based on the past specific period (the first period P 1 and the second period P 2 ). Corresponds to a case where the stock price trend for the fifth period (P F ) after the point in time is predicted to fall within the third range, and the fourth supervised learning value (C4) is the fifth period (P F ) based on the supervised learning result. F ) corresponds to a case where the stock price trend is predicted to remain flat without fluctuation, and the sixth supervised learning value (C6) is the stock price trend for the fifth period (P F ) based on the supervised learning result. It may be set to correspond to the case where it is predicted to rise within the range.

평가데이터 생성모듈(300)은 주가 변동성을 예측하고자 하는 평가대상종목(IE) 및 이에 대한 평가기간(PE)에 기초한 평가데이터를 생성하는 역할을 한다(S650).The evaluation data generation module 300 serves to generate evaluation data based on an evaluation target issue (I E ) and an evaluation period ( PE ) for which stock price volatility is to be predicted (S650).

평가데이터 생성모듈(300)은 실질적인 주가 변동 상태가 반영된 증권데이터를 기반으로 한 제1 평가데이터와 각종 이슈에 따른 투자 심리가 반영된 비정형데이터를 기반으로 한 제2 평가데이터 중 적어도 하나를 생성한다.The evaluation data generation module 300 generates at least one of first evaluation data based on stock data reflecting actual stock price fluctuations and second evaluation data based on unstructured data reflecting investor sentiment according to various issues.

이때, 평가데이터 생성모듈(300)은 전술한 학습데이터 생성모듈(100)과 비교해볼 때 증권데이터 및 비정형데이터의 값만 상이할 뿐 동일한 기능을 수행하는 것일 수 있다.At this time, the evaluation data generation module 300 may perform the same function as the learning data generation module 100 described above, only with different values of stock data and unstructured data.

구체적으로, 평가데이터 생성모듈(300)은 평가대상종목 입력부(30)에 의해 입력받은 평가대상종목(IE)에 대한 과거 특정기간의 증권데이터에 기초하여 해당 종목에 대한 항목별 변동 상태를 나타내는 복수 개의 평가종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성할 수 있다.Specifically, the evaluation data generation module 300 represents the change status of each item for the item based on the stock data of the past specific period for the evaluation target item (I E ) input by the evaluation target item input unit 30 Imaged first evaluation data may be generated by generating a plurality of evaluation item binary codes and then assigning pixel values corresponding to the results arranged in a predetermined order.

또한, 평가데이터 생성모듈(300)은, 평가대상종목(IE)에 대한 소정의 평가기간(PE) 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 해당 종목의 언급량 변동 추이를 나타내는 복수 개의 제2 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성할 수 있다.In addition, the evaluation data generation module 300 indicates the change in the amount of mention of the item on the basis of unstructured data including the amount of keyword mention for a predetermined evaluation period (PE ) for the item to be evaluated (I E ). After generating a plurality of second buzz amount binary codes, pixel values corresponding to the results arranged in a predetermined order are assigned, thereby generating imaged second evaluation data.

이와 관련하여, 평가데이터 생성모듈(300)은 도 2에 도시된 바와 같이 제1 평가데이터의 생성에 관여하는 증권데이터 획득부(310), 평가종목 이진코드 생성부(320) 및 평가데이터 생성부(330)와, 제2 평가데이터의 생성에 관여하는 비정형데이터 획득부(340), 제2 버즈량 이진코드 생성부(350) 및 제2 평가데이터 이진코드 생성부(360)를 포함할 수 있다.In this regard, the evaluation data generation module 300 includes a securities data acquisition unit 310 involved in generating the first evaluation data, an evaluation item binary code generation unit 320, and an evaluation data generation unit, as shown in FIG. 330, an unstructured data acquisition unit 340 involved in generating second evaluation data, a second buzz amount binary code generator 350, and a second evaluation data binary code generator 360. .

증권데이터 획득부(310)는 상기 평가대상종목(IE)에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득한다.The stock data acquisition unit 310 acquires stock data including at least one of stock price information, trading volume information, supply and demand trend information, and market capitalization ranking information for each time slot for the stock to be evaluated (I E ) in real time.

증권데이터 획득부(310)는 다수의 증권사 API를 통해 해당 증권사 서버에 접속하여 파이썬 언어를 기반으로 하는 웹 스크래핑(Web Scraping) 기법을 이용해 평가대상종목(IE)에 대한 증권데이터를 실시간으로 획득하는 것일 수 있다.The securities data acquisition unit 310 accesses the securities company server through a plurality of securities company APIs and uses a web scraping technique based on the Python language to acquire stock data for the evaluation target item (I E ) in real time it may be

평가종목 이진코드 생성부(320)는 상기 평가대상종목(IE)에 대응하여 획득된 증권데이터에 기초하여 평가대상종목에 대한 주가 변동 상태 정보를 이진코드 형태로 생성한다.The evaluation issue binary code generation unit 320 generates stock price change state information for the evaluation target issue in the form of a binary code based on the acquired stock data corresponding to the evaluation target issue (I E ).

평가종목 이진코드 생성부(320)는 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 평가종목 이진코드를 생성할 수 있다.The evaluation item binary code generator 320 compares a plurality of bit values composed of a preset number of bits according to a preset item code, a preset type code, a current value corresponding to the item code or the type code, or a preset standard. The evaluation item binary code can be generated by assigning a state code indicating a state value according to the process and a content code indicating a detailed value corresponding to the state code.

여기서, 평가종목 이진코드 생성부(320)는, 평가대상종목 입력부(30)를 통해 입력받은 평가대상종목(IE)에 대응되는 증권데이터에 기초하여 평가종목 이진코드를 생성하되, 상기 평가대상종목(IE)에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 평가대상종목(IE)에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 평가대상종목(IE)에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 평가대상종목(IE)에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것일 수 있다.Here, the evaluation item binary code generation unit 320 generates the evaluation item binary code based on the securities data corresponding to the evaluation target item (I E ) input through the evaluation target item input unit 30, and the evaluation item binary code is generated. A first binary code generated based on stock price information for each time period collected for the item (I E ), and a second binary code generated based on the trading volume information collected for the item (I E ) to be evaluated; Of the third binary code generated based on the collected supply and demand trend information for the evaluation target item (I E ) and the fourth binary code generated based on the market capitalization ranking collected for the evaluation target item (I E ) It may be to create at least one.

이때, 평가종목 이진코드 생성부(320)는 전술한 학습종목 이진코드 생성부(120)와 동일한 이진코드 생성 알고리즘에 따라 상기 평가종목 이진코드를 생성하는 것일 수 있으며, 해당 이진코드에 대한 구체적인 설명은 전술한 상기 학습종목 이진코드에 대한 내용과 중복되므로 생략하도록 한다.At this time, the evaluation item binary code generation unit 320 may generate the evaluation item binary code according to the same binary code generation algorithm as the above-described learning item binary code generation unit 120, and a detailed description of the corresponding binary code Since is redundant with the above-described binary code for the learning item, it is omitted.

제1 평가데이터 생성부(330)는 평가종목 이진코드 생성부(320)에 의해 복수 개의 상기 평가종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 평가종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성한다.When a plurality of evaluation item binary codes are generated by the evaluation item binary code generator 320, the first evaluation data generation unit 330 arranges them in a predetermined order, and the binary codes of the plurality of evaluation item binary codes listed. By assigning a pixel value corresponding to the value, imaged first evaluation data is generated.

여기서, 제1 평가데이터 생성부(330)는 상기 평가종목 이진코드를 소정 비트(bit) 단위로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제1 평가데이터를 생성할 수 있다.Here, the first evaluation data generation unit 330 divides the evaluation item binary code into predetermined bit units to represent one pixel per unit, so that an image that meets the specifications of the input layer of the learning model, That is, first evaluation data in the form of an image having the same ratio as the ratio of rows and columns of the matrix of the input layer may be generated.

비정형데이터 획득부(340)는 상기 평가대상종목(IE)에 대응하는 키워드를 이용하여 상기 평가기간(PE)에 작성된 인터넷상의 웹페이지를 검색함에 따른 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득한다.The unstructured data acquisition unit 340 retrieves unstructured data including the amount of keyword mentions as a result of searching web pages on the Internet created during the evaluation period ( PE ) using keywords corresponding to the evaluation target item (I E ) in real time. Acquire with

비정형데이터 획득부(340)는 소정의 프로그래밍 언어, 예컨대, 파이썬(Python)을 이용한 쿼리 기반 접근 방식에 따른 웹 크롤링(Web Crawling) 및 파싱(Parsing) 기법을 통해 각 주식종목에 대응하는 키워드 문자열에 기초한 웹 검색을 수행함에 따른 키워드 언급량을 산출함에 따른 비정형데이터를 실시간으로 획득하는 것일 수 있다.The unstructured data acquisition unit 340 obtains a keyword string corresponding to each stock item through a web crawling and parsing technique according to a query-based approach using a predetermined programming language, for example, Python. It may be to acquire unstructured data in real time according to calculating the amount of keyword mentions as a result of performing a web search based on the web search.

제2 버즈량 이진코드 생성부(350)는 상기 평가대상종목(IE)에 대응하여 획득된 비정형데이터에 기초하여 평가대상종목(IE)에 대한 이슈에 따른 버즈량 정보를 이진코드 형태로 생성한다.The second buzz quantity binary code generation unit 350 converts buzz quantity information according to issues related to the evaluation target item (I E ) into a binary code form based on unstructured data obtained in correspondence with the evaluation target item (I E ). generate

제2 버즈량 이진코드 생성부(350)는 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제2 항목코드, 상기 제2 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제2 상태코드, 상기 제2 상태코드에 대응되는 세부값을 나타내는 제2 내용코드로 각각 할당하여 제2 버즈량 이진코드를 생성할 수 있다.The second buzz amount binary code generation unit 350 compares a plurality of bit values composed of a preset number of bits according to a preset second item code, a current value corresponding to the second item code, or a preset standard. A second buzz amount binary code may be generated by allocating a second status code representing a value and a second content code representing a detailed value corresponding to the second status code.

제2 평가데이터 생성부(360)는 제2 버즈량 이진코드 생성부(350)에 의해 복수 개의 상기 제2 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고 나열된 복수 개의 상기 제2 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성한다.The second evaluation data generation unit 360, when a plurality of second buzz amount binary codes are generated by the second buzz amount binary code generation unit 350, arranges them in a predetermined order and sets the plurality of second buzz Imaged second evaluation data is generated by assigning a pixel value corresponding to the binary value of the quantity binary code.

여기서, 제2 평가데이터 생성부(360)는 상기 제2 버즈량 이진코드를 소정 비트 단위(bit)로 구분하여 단위당 하나의 픽셀(pixel)을 나타내도록 함에 따라 학습모델의 입력층의 규격에 맞는 이미지, 즉, 입력층의 행렬의 행과 열의 비와 동일한 비율을 가지는 이미지 형태의 제2 평가데이터를 생성할 수 있다.Here, the second evaluation data generation unit 360 divides the second buzz amount binary code into predetermined bit units to represent one pixel per unit, thereby meeting the specifications of the input layer of the learning model. Second evaluation data in the form of an image, that is, an image having the same ratio as the ratio of rows and columns of the matrix of the input layer may be generated.

예측모듈(400)은 학습데이터 생성모듈(100)에 의해 생성된 학습데이터를 이용한 지도학습 결과에 기초하여 평가데이터 생성모듈(300)에 의해 생성된 평가데이터에 대응되는 평가대상종목(IE)에 대한 주가 변동성을 예측하기 위한 것이다.The prediction module 400 is an evaluation target item corresponding to the evaluation data generated by the evaluation data generation module 300 based on the result of supervised learning using the learning data generated by the learning data generation module 100 (I E ) It is to predict stock price volatility for .

이와 관련하여, 예측모듈(400)은 도 2에 도시된 바와 같이 예측 분류부(420), 군집화부(440) 및 매매 결정부(460)를 포함할 수 있다.In this regard, the prediction module 400 may include a prediction classification unit 420, a clustering unit 440, and a trading determination unit 460 as shown in FIG. 2 .

예측 분류부(420)는 상기 지도학습이 완료된 후 평가데이터 생성모듈(300)로부터 소정의 평가데이터를 입력받으면 이를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류한다(S660).When the prediction classification unit 420 receives predetermined evaluation data from the evaluation data generation module 300 after the supervised learning is completed, it is classified into one of the plurality of classes by comparing it with the supervised learning value (S660).

예측 분류부(420)는 상기 지도학습이 완료된 후 제1 평가데이터 생성부(330)에 의해 생성된 제1 평가데이터와 제2 평가데이터 생성부(360)에 의해 생성된 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터를 클래스별 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 것일 수 있다.After the supervised learning is completed, the prediction classification unit 420 selects at least one of the first evaluation data generated by the first evaluation data generator 330 and the second evaluation data generated by the second evaluation data generator 360. When one input is received, the input evaluation data may be classified into one of the plurality of classes by comparing the input evaluation data with the supervised learning value for each class.

예컨대, 도 5를 참조하면, 평가대상종목 입력부(30)에 의해 사용자로부터 평가대상종목(IE)을 입력받은 시점이 "TC"일 때, 평가데이터 생성모듈(300)의 제1 평가데이터 생성부(330) 및 제2 평가데이터 생성부(360)에 의해 각각 입력시점(TC) 이전의 제3 기간(P3) 및 제4 기간(P4)에 대응되는 증권데이터 및 비정형데이터에 기초한 제1 평가데이터 또는 제2 평가데이터가 생성되면, 예측 분류부(420)는 제1 평가데이터 또는 제2 평가데이터를 입력받아 이를 기설정된 복수 개의 클래스별 지도학습값들과 비교한 결과 가장 유사한 지도학습값을 평가대상종목(IE)의 제5 기간(PF)에 대한 예측 추세 및 정도를 나타내는 분류값(CP)으로 출력할 수 있다.For example, referring to FIG. 5 , when the time point at which the evaluation target item (I E ) is input from the user through the evaluation target item input unit 30 is "T C ", the first evaluation data of the evaluation data generating module 300 Securities data and unstructured data corresponding to the third period (P 3 ) and the fourth period (P 4 ) before the input time point (T C ), respectively, by the generation unit 330 and the second evaluation data generation unit 360 When the first evaluation data or the second evaluation data based thereon is generated, the prediction classification unit 420 receives the first evaluation data or the second evaluation data and compares them with a plurality of preset teaching learning values for each class, and as a result, the most similar The supervised learning value can be output as a classification value ( CP ) representing the predicted trend and degree of the 5th period (P F ) of the evaluation target item (I E ).

군집화부(440)는 상기 지도학습이 완료된 후 제1 평가데이터 생성부(330)에 의해 생성된 제1 평가데이터와 제2 평가데이터 생성부(360)에 의해 생성된 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터에 기초한 상기 복수 개의 클래스 각각에 대한 확률 분포를 계산하여 기설정된 군집화 알고리즘에 따라 군집화한다(S670).The clustering unit 440 selects at least one of the first evaluation data generated by the first evaluation data generator 330 and the second evaluation data generated by the second evaluation data generator 360 after the supervised learning is completed. When is received, a probability distribution for each of the plurality of classes based on the input evaluation data is calculated and clustered according to a preset clustering algorithm (S670).

군집화부(440)는 상기 입력받은 평가데이터에 대한 클래스별 확률 분포 상태를 추정하여 클래스별 지도학습값과의 비교 결과에 따른 유사도에 기초하여 군집화하는 것일 수 있으며, 예컨대, 상기 군집화 알고리즘은 K-Means 클러스터링, 평균 이동(Mean Shift) 클러스터링, 가우시안 혼합 모델(GMM; Gaussian Mixture Model), 밀도 기반 클러스터링(DBSCAN)을 포함할 수 있다.The clustering unit 440 may estimate the probability distribution state of each class for the input evaluation data and cluster based on the similarity according to the comparison result with the supervised learning value of each class. For example, the clustering algorithm may perform K- Means clustering, Mean Shift clustering, Gaussian Mixture Model (GMM), and Density Based Clustering (DBSCAN) may be included.

매매 결정부(460)는 군집화부(440)에 의해 군집화된 결과에 기초하여 가장 유사도가 높은 클래스에 대응하는 상기 기준학습값에 대한 이격 정도를 기설정된 임계치와 비교한 결과에 따라 평가대상종목(IE)에 대한 매수 또는 매도 여부를 결정한다(S680).Based on the result of the clustering by the clustering unit 440, the trading decision unit 460 compares the degree of separation with respect to the reference learning value corresponding to the class having the highest degree of similarity with a preset threshold, and determines the item to be evaluated ( It is determined whether to buy or sell I E ) (S680).

매매 결정부(350)는 상기 기준학습값에 대한 이격 정도가 상기 임계치보다 높을 때, 상기 기준학습값에 기초한 평가대상종목(IE)의 추세 방향이 상승 추세를 나타내면 평가대상종목(IE)을 일정 개수만큼 매수하도록 결정할 수 있다.When the degree of separation from the reference learning value is higher than the threshold value, the trading decision unit 350 determines the evaluation target item (I E ) when the trend direction of the evaluation target item (I E ) based on the reference learning value shows an upward trend. It can be decided to buy a certain number of.

매매 결정부(350)는 상기 기준학습값에 대한 이격 정도가 상기 임계치보다 높을 때, 상기 기준학습값에 기초한 평가대상종목(IE)의 추세 방향이 하락 추세를 나타내면 평가대상종목(IE)을 일정 개수만큼 매도하도록 결정할 수 있다.When the degree of separation from the reference learning value is higher than the threshold value, the trading decision unit 350 determines the evaluation target item (I E ) when the trend direction of the evaluation target item (I E ) based on the reference learning value shows a downward trend. may decide to sell a certain number of

한편, 본발명에 따른 학습모델에 기초한 주가 변동 예측 장치는 도 1에 도시된 바와 같이 기준 설정부(60)를 더 포함할 수 있다.Meanwhile, the apparatus for predicting stock price fluctuations based on the learning model according to the present invention may further include a standard setting unit 60 as shown in FIG. 1 .

기준 설정부(60)는 관리자의 입력에 따라 학습기간 설정부(20)에 의해 설정되는 제1 기간(P1)과 제2 기간(P2) 사이의 간격을 설정하거나 또는 제1 기간(P1) 및 제2 기간(P2)의 설정 시 기준이 되는 제1 시점(T1)과 제2 시점(T2) 사이의 간격을 설정할 수 있다.The standard setting unit 60 sets the interval between the first period (P 1 ) and the second period (P 2 ) set by the learning period setting unit 20 according to the manager's input, or sets the first period (P 1 ) and the second period P 2 , an interval between the first time point T 1 and the second time point T 2 serving as a reference may be set.

기준 설정부(60)는 관리자가 관리자단말기(1)를 통해 제1 시점(T1)과 제2 시점(T2) 사이의 간격 또는 제1 기간(P1)과 제2 기간(P2) 사이의 간격을 설정한 값을 관리자단말기(1)로부터 수신하여 이를 학습기간 설정부(20) 및 평가기간 설정부(40)로 전송할 수 있다.The standard setting unit 60 allows the administrator to set the interval between the first time point (T 1 ) and the second time point (T 2 ) or the first period (P 1 ) and the second period (P 2 ) through the manager terminal (1). A value for setting an interval between values may be received from the manager terminal 1 and transmitted to the learning period setting unit 20 and the evaluation period setting unit 40 .

이 경우, 학습기간 설정부(20)는 상기 수신한 간격 설정값에 따라 제1 시점(T1)과 제2 시점(T2) 사이의 간격 또는 제1 기간(P1)과 제2 기간(P2) 사이의 간격을 설정하고, 평가기간 설정부(40)는 상기 수신한 간격 설정값에 따라 제3 시점(T3)과 제4 시점(T4) 사이의 간격 또는 제3 기간(P3)과 제4 기간(P4) 사이의 간격을 설정할 수 있다.In this case, the learning period setting unit 20 determines the interval between the first time point (T 1 ) and the second time point (T 2 ) or the first period (P 1 ) and the second period ( P 2 ), and the evaluation period setting unit 40 determines the interval between the third time point T 3 and the fourth time point T 4 or the third period P according to the received interval setting value. 3 ) and the fourth period P 4 may be set.

기준 설정부(60)는 학습종목(IL) 또는 평가대상종목(IE)에 대응하여 수집된 수급 동향 정보에 기초하여 학습종목 이진코드 생성부(120) 또는 평가종목 이진코드 생성부(320)에 의해 생성되는 상기 제3 이진코드의 할당 시 비교 기준이 되는 제1 수급기간(PS1) 및 제2 수급기간(PS2)을 관리자의 입력에 따라 설정할 수도 있다.The standard setting unit 60 is a learning item binary code generator 120 or an evaluation item binary code generator 320 based on the supply and demand trend information collected in response to the learning item ( IL ) or the evaluation target item (I E ). ), the first supply and demand period (P S1 ) and the second supply and demand period (P S2 ), which are comparison standards when allocating the third binary code generated by .

기준 설정부(60)는 학습종목(IL) 또는 평가대상종목(IE)에 대응하여 수집된 주가 정보에 기초하여 학습종목 이진코드 생성부(120) 또는 평가종목 이진코드 생성부(320)에 의해 생성되는 상기 제1 이진코드의 할당 시 기준이 되는 이동평균선에 대한 기준단위값을 관리자의 입력에 따라 설정할 수도 있다.The criterion setting unit 60 is a learning item binary code generator 120 or an evaluation item binary code generator 320 based on the stock price information collected in response to the learning item ( IL ) or the evaluation target item (I E ). A reference unit value for a moving average line serving as a reference when allocating the first binary code generated by may be set according to a manager's input.

이에 따라, 전술한 본 발명에 의하면, 지도 학습을 수행할 학습종목에 대한 학습데이터의 생성 시 증권데이터의 과거 주가 변동 상태에 대한 다양한 지표 정보들과 각종 이슈에 따른 버즈량 정보를 모두 반영함으로써 미래 특정기간의 주가 추세 변동 및 정도에 대한 예측 결과값의 정확도를 향상시킬 수 있다.Accordingly, according to the present invention described above, when generating learning data for learning items to be supervised learning, various index information on the past stock price fluctuation state of stock data and buzz information according to various issues are reflected, so that the future It is possible to improve the accuracy of prediction result values for the change and degree of stock price trend in a specific period.

또한, 본 발명에 의하면, 각 주식종목에 대한 학습 데이터 또는 평가 데이터의 생성 시 필요한 정보들을 압축한 2진수 코드값을 이용하므로 학습모델에 기초한 주가 변동 예측 장치를 단순화하여 구현할 수 있다.In addition, according to the present invention, since a binary code value in which necessary information is compressed when generating learning data or evaluation data for each stock issue is used, a stock price fluctuation prediction device based on a learning model can be simplified and implemented.

또한, 본 발명에 의하면, 지도 학습에 이용되는 학습데이터 또는 예측 분석에 이용되는 평가데이터를 생성할 때 기초가 되는 이진코드의 할당 시 관리자의 입력에 따라 주가 관련 지표들에 대한 설정값을 용이하게 설정 및 변경 가능함으로써, 고객 맞춤형 개별 예측 분석이 가능한 자산 관리 포트폴리오 서비스를 제공할 수 있다.In addition, according to the present invention, when generating learning data used for supervised learning or evaluation data used for predictive analysis, setting values for stock price-related indicators are easily set according to a manager's input when assigning a binary code as a basis. By being able to set and change, it is possible to provide asset management portfolio services that enable individual predictive analysis tailored to customers.

이상, 바람직한 실시예를 통하여 본 발명에 관하여 상세히 설명하였으나, 본 발명은 이에 한정되는 것은 아니며 특허청구범위 내에서 다양하게 실시될 수 있다.Above, the present invention has been described in detail through preferred embodiments, but the present invention is not limited thereto and may be variously practiced within the scope of the claims.

특히, 전술한 내용은 후술할 발명의 청구범위를 더욱 잘 이해할 수 있도록 본 발명의 특징과 기술적 강점을 다소 폭넓게 상술하였으므로, 상술한 본 발명의 개념과 특정 실시예는 본 발명과 유사 목적을 수행하기 위한 다른 형상의 설계나 수정의 기본으로써 즉시 사용될 수 있음이 해당 기술 분야의 숙련된 사람들에 의해 인식되어야 한다.In particular, the foregoing has outlined rather broadly the features and technical strengths of the present invention so that the claims of the invention to be described later may be better understood, so that the concept and specific embodiments of the present invention described above are intended to serve similar purposes to the present invention. It should be recognized by those skilled in the art that it can be readily used as a basis for designing or modifying other shapes for the purpose.

또한, 상기에서 기술된 실시예는 본 발명에 따른 하나의 실시예일 뿐이며, 해당 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상의 범위에서 다양한 수정 및 변경된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 따라서, 개시된 실시예는 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 이러한 다양한 수정 및 변경 또한 본 발명의 기술적 사상의 범위에 속하는 것으로 전술한 본 발명의 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.In addition, the embodiment described above is only one embodiment according to the present invention, and can be implemented in various modified and changed forms within the scope of the technical idea of the present invention by those skilled in the art. You will understand. Therefore, the disclosed embodiments should be considered from an explanatory point of view rather than a limiting point of view, and these various modifications and changes are also shown in the claims of the present invention described above as belonging to the scope of the technical idea of the present invention, and the scope equivalent thereto. Any differences within them should be construed as being included in the present invention.

10: 학습종목 입력부 20: 학습기간 설정부
30: 평가대상종목 입력부 40: 평가기간 설정부
60: 기준 설정부 100: 학습데이터 생성모듈
110: 증권데이터 획득부 120: 학습종목 이진코드생성부
130: 제1 학습데이터 생성부 140: 비정형데이터 획득부
150: 제1 버즈량 이진코드생성부 160: 제2 학습데이터 생성부
200: 학습모델부 300: 평가데이터 생성모듈
310: 증권데이터 획득부 320: 평가종목 이진코드생성부
330: 제1 평가데이터 생성부 340: 비정형데이터 획득부
350: 제2 버즈량 이진코드생성부 360: 제2 평가데이터 생성부
400: 예측모듈 420: 예측 분류부
440: 군집화부 460: 매매 결정부
1000: 주가 변동 예측 장치
10: learning item input unit 20: learning period setting unit
30: evaluation target item input unit 40: evaluation period setting unit
60: standard setting unit 100: learning data generation module
110: Stock data acquisition unit 120: Learning item binary code generation unit
130: first learning data generation unit 140: unstructured data acquisition unit
150: first buzz quantity binary code generator 160: second learning data generator
200: learning model unit 300: evaluation data generation module
310: Stock data acquisition unit 320: Evaluation item binary code generation unit
330: first evaluation data generation unit 340: unstructured data acquisition unit
350: second buzz quantity binary code generator 360: second evaluation data generator
400: prediction module 420: prediction classification unit
440: clustering unit 460: trading decision unit
1000: stock price fluctuation predictor

Claims (10)

머신러닝 기반 지도학습을 수행할 학습종목으로서 증권시장에 상장된 복수 개의 주식종목을 입력받는 학습종목 입력부;
상기 입력받은 학습종목에 대한 과거 특정기간의 증권데이터에 기초하여 상기 학습종목에 포함된 각 주식종목에 대한 항목별 변동 상태를 나타내는 복수 개의 학습종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 학습데이터 생성모듈;
상기 생성된 제1 학습데이터에 기초하여 미래 특정기간의 주가 변동 정도에 대한 예측 결과에 대응하도록 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 학습모델부;
상기 학습종목에 포함된 적어도 어느 하나의 상기 주식종목을 사용자로부터 주가 변동성을 예측하고자 하는 평가대상종목으로 입력받는 평가대상종목 입력부;
상기 입력받은 평가대상종목에 대한 과거 특정기간의 증권데이터에 기초하여 해당 종목에 대한 항목별 변동 상태를 나타내는 복수 개의 평가종목 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 평가데이터 생성모듈; 및
상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 예측 분류부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
A learning item input unit that receives a plurality of stock items listed on the stock market as learning items to perform machine learning-based supervised learning;
Based on the stock data of the past specific period for the input learning item, a plurality of learning item binary codes representing the change status of each item for each stock item included in the learning item are generated and then listed in a predetermined order. A learning data generation module for generating imaged first learning data by assigning a pixel value corresponding to ;
a learning model unit that performs supervised learning using a plurality of pre-set supervised learning values for each class, based on the generated first learning data;
an evaluation target input unit for receiving at least one stock issue included in the learning issue as an evaluation target issue for which stock price volatility is to be predicted from a user;
Based on the stock data of the past specific period for the received evaluation target item, a plurality of evaluation item binary codes representing the change status of each item for the item are generated, and pixel values corresponding to the results listed in a predetermined order are generated. Evaluation data generation module for generating the imaged first evaluation data according to the grant; and
When receiving the first evaluation data after the supervised learning is completed, a prediction classification unit that classifies the first evaluation data into one of the plurality of classes according to comparing the first evaluation data with the supervised learning value; Stock price fluctuation predictor based on learning model.
제1항에 있어서,
상기 학습데이터 생성모듈은,
상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 일자별 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부;
상기 학습종목에 대응하여 획득된 증권데이터에 기초하여 각 주식종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 학습종목 이진코드를 생성하는 학습종목 이진코드 생성부; 및
상기 학습종목 이진코드 생성부에 의해 복수 개의 상기 학습종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 학습종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 학습데이터를 생성하는 제1 학습데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 1,
The learning data generation module,
a stock data acquiring unit that acquires stock data including at least one of stock price information by time period, trading volume information, supply and demand trend information, and daily market capitalization ranking information for each of a plurality of stock items included in the learning item;
Based on the stock data obtained in correspondence with the learning item, a plurality of bit values consisting of a preset number of bits for each stock item is a preset item code, a preset type code, a current value corresponding to the item code or the type code or a learning item binary code generation unit for generating a learning item binary code by allocating a state code indicating a state value according to a comparison according to a predetermined criterion and a content code indicating a detailed value corresponding to the state code; and
When a plurality of binary codes for learning items are generated by the learning item binary code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the listed plurality of binary codes for learning items are given. A stock price fluctuation prediction device based on a learning model comprising a; first learning data generation unit for generating first learning data.
제1항에 있어서,
상기 학습데이터 생성모듈은,
상기 학습종목에 포함된 복수 개의 주식종목 각각에 대한 소정의 학습기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 각 주식종목별 언급량 변동 추이를 나타내는 복수 개의 제1 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 것이고,
상기 학습모델부는,
상기 제1 학습데이터 또는 상기 제2 학습데이터 각각에 대응하여 기설정된 복수 개의 클래스별 지도학습값들을 이용한 지도학습을 수행하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 1,
The learning data generation module,
Based on unstructured data including the amount of keyword mention during a predetermined learning period for each of the plurality of stock items included in the learning item, a plurality of first buzz amount binary codes representing the change in the amount of mention for each stock item are generated Then, by assigning pixel values corresponding to the results listed in a predetermined order, imaged second learning data is generated,
The learning model unit,
A stock price fluctuation prediction device based on a learning model, characterized in that performing supervised learning using a plurality of pre-set supervised learning values for each class corresponding to each of the first learning data or the second learning data.
제3항에 있어서,
상기 학습데이터 생성모듈은,
상기 학습종목에 포함된 복수 개의 주식종목 각각에 대응하는 키워드를 이용하여 상기 학습기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 주식종목별 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 비정형데이터 획득부;
상기 학습종목에 대응하여 획득된 비정형데이터에 기초하여 각 주식 종목별로 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제1 항목코드, 상기 제1 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제1 상태코드, 상기 제1 상태코드에 대응되는 세부값을 나타내는 제1 내용코드로 각각 할당하여 제1 버즈량 이진코드를 생성하는 제1 버즈량 이진코드 생성부; 및
상기 제1 버즈량 이진코드 생성부에 의해 복수 개의 상기 제1 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 제1 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 학습데이터를 생성하는 제2 학습데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 3,
The learning data generation module,
An unstructured data acquisition unit that obtains, in real time, unstructured data including the amount of keyword mentions for each stock item by searching web pages on the Internet created during the learning period using keywords corresponding to each of a plurality of stock items included in the learning item. ;
Based on the unstructured data obtained in correspondence with the learning item, a plurality of bit values consisting of a preset number of bits for each stock item are converted to a preset first item code, a current value corresponding to the first item code, or a preset standard. A first buzz amount binary code generator for generating a first buzz amount binary code by allocating a first state code indicating a state value according to comparison and a first content code indicating a detailed value corresponding to the first state code, respectively. ; and
When a plurality of the first buzz amount binary codes are generated by the first buzz amount binary code generator, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the plurality of the first buzz amount binary codes are arranged. A stock price fluctuation prediction device based on a learning model comprising a;
제1항에 있어서,
상기 평가데이터 생성모듈은,
상기 평가대상종목에 대한 시간대별 주가 정보, 거래량 정보 및 수급 동향 정보와 시가 총액 순위 정보 중 적어도 하나를 포함하는 증권데이터를 실시간으로 획득하는 증권데이터 획득부;
상기 평가대상종목에 대응하여 획득된 증권데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 항목코드, 기설정된 종류코드, 상기 항목코드 또는 상기 종류코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 상태코드, 상기 상태코드에 대응되는 세부값을 나타내는 내용코드로 각각 할당하여 평가종목 이진코드를 생성하는 평가종목 이진코드 생성부; 및
상기 평가종목 이진코드 생성부에 의해 복수 개의 상기 평가종목 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고, 나열된 복수 개의 상기 평가종목 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제1 평가데이터를 생성하는 제1 평가데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 1,
The evaluation data generation module,
a stock data acquisition unit that acquires stock data including at least one of stock price information, trading volume information, supply and demand trend information, and market capitalization ranking information for each time slot for the subject stock to be evaluated in real time;
A plurality of bit values composed of a preset number of bits based on the securities data acquired corresponding to the evaluation target issue are a preset item code, a preset type code, a current value or a preset value corresponding to the item code or the type code. an evaluation item binary code generation unit for generating an evaluation item binary code by allocating a status code indicating a status value according to comparison according to a standard and a content code indicating a detailed value corresponding to the status code; and
When a plurality of evaluation item binary codes are generated by the evaluation item binary code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the listed plurality of evaluation item binary codes are assigned. A stock price fluctuation prediction device based on a learning model, comprising: a first evaluation data generating unit for generating first evaluation data.
제1항에 있어서,
상기 평가데이터 생성모듈은,
상기 평가대상종목에 대한 소정의 평가기간 동안의 키워드 언급량을 포함하는 비정형데이터에 기초하여 해당 종목의 언급량 변동 추이를 나타내는 복수 개의 제2 버즈량 이진코드를 생성한 후 기설정된 순서에 따라 나열한 결과에 대응하는 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 것이고,
상기 예측 분류부는,
상기 지도학습이 완료된 후 상기 제1 평가데이터와 상기 제2 평가데이터 중 적어도 하나를 입력받는 경우, 상기 입력받은 평가데이터를 상기 지도학습값과 비교함에 따라 상기 복수 개의 클래스 중 어느 하나로 분류하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 1,
The evaluation data generation module,
Based on unstructured data including the amount of keyword mentions for a predetermined evaluation period for the evaluation target item, a plurality of second buzz amount binary codes representing the change in the amount of mention of the item are generated and arranged in a predetermined order By assigning a pixel value corresponding to the result, imaged second evaluation data is generated,
The prediction classification unit,
When at least one of the first evaluation data and the second evaluation data is received after the supervised learning is completed, the input evaluation data is compared with the supervised learning value and classified into one of the plurality of classes. Stock price fluctuation prediction device based on a learning model to be.
제6항에 있어서,
상기 평가데이터 생성모듈은,
상기 평가대상종목에 대응하는 키워드를 이용하여 상기 평가기간에 작성된 인터넷상의 웹페이지를 검색함에 따른 키워드 언급량을 포함하는 비정형데이터를 실시간으로 획득하는 제2 버즈량데이터 획득부;
상기 평가대상종목에 대응하여 획득된 비정형데이터에 기초하여 기설정된 비트수로 이루어지는 복수개의 비트값을 기설정된 제2 항목코드, 상기 제2 항목코드에 대응하여 현재값 또는 기설정된 기준에 따라 비교함에 따른 상태값을 나타내는 제2 상태코드, 상기 제2 상태코드에 대응되는 세부값을 나타내는 제2 내용코드로 각각 할당하여 제2 버즈량 이진코드를 생성하는 제2 버즈량 이진코드 생성부; 및
상기 제2 버즈량 이진코드 생성부에 의해 복수 개의 상기 제2 버즈량 이진코드가 생성되면 이를 기설정된 순서에 따라 나열하고 나열된 복수 개의 상기 제2 버즈량 이진코드의 이진값에 대응한 픽셀값을 부여함에 따라 이미지화된 제2 평가데이터를 생성하는 제2 평가데이터 생성부;를 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 6,
The evaluation data generation module,
a second buzz amount data acquisition unit that acquires, in real time, unstructured data including the amount of references to keywords as a result of searching for web pages on the Internet created during the evaluation period using keywords corresponding to the subject items to be evaluated;
A plurality of bit values composed of a preset number of bits based on the unstructured data obtained corresponding to the evaluation target item are compared according to a preset second item code, a current value corresponding to the second item code, or a preset standard a second buzz amount binary code generation unit for generating a second buzz amount binary code by allocating a second status code indicating a state value corresponding to a second state code and a second content code indicating a detailed value corresponding to the second state code; and
When a plurality of second buzz amount binary codes are generated by the second buzz amount binary code generation unit, they are arranged in a predetermined order, and pixel values corresponding to the binary values of the plurality of second buzz amount binary codes are arranged. A stock price fluctuation prediction device based on a learning model comprising: a second evaluation data generation unit that generates imaged second evaluation data according to the application.
제1항에 있어서,
현재시점 이전의 서로 상이한 제1 시점 및 제2 시점 각각을 기준으로 기설정된 시간 동안의 제1 기간 및 제2 기간을 중복없이 설정하는 학습기간 설정부; 및
상기 평가대상종목의 입력시점 이전의 서로 상이한 제3 시점 및 제4 시점 각각을 기준으로 기설정된 시간 동안의 제3 기간 및 제4 기간을 중복없이 설정하는 평가기간 설정부;를 더 포함하며,
상기 학습종목 이진코드 생성부 및 상기 평가종목 이진코드 생성부는,
상기 학습종목 입력부 또는 상기 평가대상종목 입력부를 통해 입력받은 적어도 하나의 주식종목에 대응되는 증권데이터에 기초하여 상기 학습종목 이진코드 또는 상기 평가종목 이진코드를 생성하되, 상기 주식종목에 대하여 수집된 시간대별 주가 정보에 기초하여 생성되는 제1 이진코드와, 상기 주식종목에 대하여 수집된 거래량 정보에 기초하여 생성되는 제2 이진코드와, 상기 주식종목에 대하여 수집된 수급 동향 정보에 기초하여 생성되는 제3 이진코드와, 상기 주식종목에 대하여 수집된 시가 총액 순위에 기초하여 생성되는 제4 이진코드 중 적어도 하나를 생성하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 1,
a learning period setting unit for setting a first period and a second period for a predetermined time based on different first and second times prior to the current time, respectively, without overlap; and
An evaluation period setting unit for setting a third period and a fourth period for a predetermined time based on different third and fourth times points before the input point of the evaluation target item, respectively, without overlap,
The learning item binary code generator and the evaluation item binary code generator,
The learning item binary code or the evaluation item binary code is generated based on the stock data corresponding to at least one stock item input through the learning item input unit or the evaluation target item input unit, and the time collected for the stock item A first binary code generated based on stock price information for each unit, a second binary code generated based on trading volume information collected for the stock item, and a second binary code generated based on supply and demand trend information collected for the stock item. 3 binary code and a fourth binary code generated based on the market capitalization ranking collected for the stock issue.
제8항에 있어서,
상기 복수 개의 클래스는,
상기 제1 기간 및 상기 제2 기간에 기초한 지도학습 결과에 기초하여 현재시점 이후의 제5 기간에 대한 주가 추세의 상승 또는 하락 여부와 이에 따른 이격 정도를 분류하여 설정한 것이고,
상기 지도학습이 완료된 후 상기 제1 평가데이터를 입력받는 경우, 상기 제1 평가데이터에 기초한 상기 복수 개의 클래스 각각에 대한 확률 분포를 계산하여 기설정된 군집화 알고리즘에 따라 군집화하는 군집화부;를 더 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 8,
The plurality of classes,
Based on the supervised learning results based on the first period and the second period, whether the stock price trend for the fifth period after the current point of time rises or falls and the degree of separation accordingly is classified and set,
When the first evaluation data is received after the supervised learning is completed, a clustering unit that calculates a probability distribution for each of the plurality of classes based on the first evaluation data and clusters them according to a preset clustering algorithm; further comprising Stock price fluctuation prediction device based on the learning model, characterized in that.
제9항에 있어서,
상기 군집화된 결과에 기초하여 가장 유사도가 높은 클래스에 대응하는 상기 기준학습값에 대한 이격 정도를 기설정된 임계치와 비교한 결과에 따라 상기 평가대상종목에 대한 매수 또는 매도 여부를 결정하는 매매 결정부;를 더 포함하는 것을 특징으로 하는 학습모델에 기초한 주가 변동 예측 장치.
According to claim 9,
a trading decision unit that determines whether to buy or sell the evaluation target item according to a result of comparing the degree of separation with respect to the reference learning value corresponding to the class having the highest similarity with a preset threshold based on the clustered result; Stock price fluctuation prediction device based on the learning model, characterized in that it further comprises.
KR1020210110192A 2021-08-20 2021-08-20 Apparatus for predicting fluctuation of stock price based on learning model KR102614106B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210110192A KR102614106B1 (en) 2021-08-20 2021-08-20 Apparatus for predicting fluctuation of stock price based on learning model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210110192A KR102614106B1 (en) 2021-08-20 2021-08-20 Apparatus for predicting fluctuation of stock price based on learning model

Publications (2)

Publication Number Publication Date
KR20230027903A true KR20230027903A (en) 2023-02-28
KR102614106B1 KR102614106B1 (en) 2023-12-14

Family

ID=85326399

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210110192A KR102614106B1 (en) 2021-08-20 2021-08-20 Apparatus for predicting fluctuation of stock price based on learning model

Country Status (1)

Country Link
KR (1) KR102614106B1 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018028945A (en) * 2017-11-21 2018-02-22 みずほ証券株式会社 System, method, and program for transaction management
KR20180066726A (en) * 2016-12-09 2018-06-19 동국대학교 산학협력단 Apparatus and method for estimating stock price
KR101909706B1 (en) 2017-07-06 2018-10-18 주식회사 닥터퀀트 Robo advisor system based on investor and financial product and method for providing portfolio using the same
KR20210003029A (en) 2019-07-01 2021-01-11 유한책임회사 블루바이저시스템즈 Method and system for managing diapause assets based on machine-learning
KR20210058171A (en) * 2019-11-13 2021-05-24 세종대학교산학협력단 Automated deep learning studio for simplifying stock predictive deep learning models and parameter optimization
CN113052395A (en) * 2021-04-15 2021-06-29 山东咨平信息技术服务有限公司 Method for predicting financial data by neural network fusing network characteristics
KR20210099321A (en) * 2020-02-04 2021-08-12 울산대학교 산학협력단 Stock price movement prediction apparatus and method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180066726A (en) * 2016-12-09 2018-06-19 동국대학교 산학협력단 Apparatus and method for estimating stock price
KR101909706B1 (en) 2017-07-06 2018-10-18 주식회사 닥터퀀트 Robo advisor system based on investor and financial product and method for providing portfolio using the same
JP2018028945A (en) * 2017-11-21 2018-02-22 みずほ証券株式会社 System, method, and program for transaction management
KR20210003029A (en) 2019-07-01 2021-01-11 유한책임회사 블루바이저시스템즈 Method and system for managing diapause assets based on machine-learning
KR20210058171A (en) * 2019-11-13 2021-05-24 세종대학교산학협력단 Automated deep learning studio for simplifying stock predictive deep learning models and parameter optimization
KR20210099321A (en) * 2020-02-04 2021-08-12 울산대학교 산학협력단 Stock price movement prediction apparatus and method
CN113052395A (en) * 2021-04-15 2021-06-29 山东咨平信息技术服务有限公司 Method for predicting financial data by neural network fusing network characteristics

Also Published As

Publication number Publication date
KR102614106B1 (en) 2023-12-14

Similar Documents

Publication Publication Date Title
Sarma Predictive modeling with SAS enterprise miner: Practical solutions for business applications
US8930247B1 (en) System and methods for content-based financial decision making support
US10614073B2 (en) System and method for using data incident based modeling and prediction
WO2022105525A1 (en) Method and apparatus for predicting user probability, and computer device
US20210319366A1 (en) Method, apparatus and device for generating model and storage medium
US11080639B2 (en) Intelligent diversification tool
CN108388955A (en) Customer service strategies formulating method, device based on random forest and logistic regression
Li et al. Stock price prediction incorporating market style clustering
KR20210003029A (en) Method and system for managing diapause assets based on machine-learning
CN116503174A (en) Financial data prediction system based on big data
US20210004907A1 (en) Method and system for managing dormant assets based on machine learning
CN111445280A (en) Model generation method, restaurant ranking method, system, device and medium
Mishra et al. Predictive data mining: Promising future and applications
KR102614106B1 (en) Apparatus for predicting fluctuation of stock price based on learning model
Ardyanta et al. A prediction of stock price movements using support vector machines in Indonesia
Sun et al. Determination of temporal stock investment styles via biclustering trading patterns
CN115080868A (en) Product pushing method, product pushing device, computer equipment, storage medium and program product
TWM623354U (en) investment recommendation system
CN114418736A (en) Bank retail credit customer layering method, storage medium and server
Li et al. Research on listed companies’ credit ratings, considering classification performance and interpretability
CN116069959A (en) Method and device for determining display data
Xi et al. Improved AHP model and neural network for consumer finance credit risk assessment
CN113450141A (en) Intelligent prediction method and device based on electricity selling quantity characteristics of large-power customer groups
Abdolbaghi Ataabadi et al. The effectiveness of the automatic system of fuzzy logic-based technical patterns recognition: Evidence from Tehran stock exchange
Lee et al. Application of machine learning in credit risk scorecard

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant