KR20240044722A - AI-based stock trading learning method - Google Patents
AI-based stock trading learning method Download PDFInfo
- Publication number
- KR20240044722A KR20240044722A KR1020220124095A KR20220124095A KR20240044722A KR 20240044722 A KR20240044722 A KR 20240044722A KR 1020220124095 A KR1020220124095 A KR 1020220124095A KR 20220124095 A KR20220124095 A KR 20220124095A KR 20240044722 A KR20240044722 A KR 20240044722A
- Authority
- KR
- South Korea
- Prior art keywords
- stock
- information
- learning
- time
- trading
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000003542 behavioural effect Effects 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 32
- 230000006399 behavior Effects 0.000 claims abstract description 21
- 230000009471 action Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 6
- 230000006403 short-term memory Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 22
- 230000015654 memory Effects 0.000 description 18
- 238000013136 deep learning model Methods 0.000 description 11
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 4
- CONKBQPVFMXDOV-QHCPKHFHSA-N 6-[(5S)-5-[[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]methyl]-2-oxo-1,3-oxazolidin-3-yl]-3H-1,3-benzoxazol-2-one Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C[C@H]1CN(C(O1)=O)C1=CC2=C(NC(O2)=O)C=C1 CONKBQPVFMXDOV-QHCPKHFHSA-N 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- KZEVSDGEBAJOTK-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[5-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CC=1OC(=NN=1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O KZEVSDGEBAJOTK-UHFFFAOYSA-N 0.000 description 2
- HMUNWXXNJPVALC-UHFFFAOYSA-N 1-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C(CN1CC2=C(CC1)NN=N2)=O HMUNWXXNJPVALC-UHFFFAOYSA-N 0.000 description 2
- LDXJRKWFNNFDSA-UHFFFAOYSA-N 2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound C1CN(CC2=NNN=C21)CC(=O)N3CCN(CC3)C4=CN=C(N=C4)NCC5=CC(=CC=C5)OC(F)(F)F LDXJRKWFNNFDSA-UHFFFAOYSA-N 0.000 description 2
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 2
- JQMFQLVAJGZSQS-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-N-(2-oxo-3H-1,3-benzoxazol-6-yl)acetamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)NC1=CC2=C(NC(O2)=O)C=C1 JQMFQLVAJGZSQS-UHFFFAOYSA-N 0.000 description 2
- YJLUBHOZZTYQIP-UHFFFAOYSA-N 2-[5-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NN=C(O1)CC(=O)N1CC2=C(CC1)NN=N2 YJLUBHOZZTYQIP-UHFFFAOYSA-N 0.000 description 2
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011017 operating method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 1
- SXAMGRAIZSSWIH-UHFFFAOYSA-N 2-[3-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,2,4-oxadiazol-5-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NOC(=N1)CC(=O)N1CC2=C(CC1)NN=N2 SXAMGRAIZSSWIH-UHFFFAOYSA-N 0.000 description 1
- WTFUTSCZYYCBAY-SXBRIOAWSA-N 6-[(E)-C-[[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]methyl]-N-hydroxycarbonimidoyl]-3H-1,3-benzoxazol-2-one Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C/C(=N/O)/C1=CC2=C(NC(O2)=O)C=C1 WTFUTSCZYYCBAY-SXBRIOAWSA-N 0.000 description 1
- DFGKGUXTPFWHIX-UHFFFAOYSA-N 6-[2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]acetyl]-3H-1,3-benzoxazol-2-one Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)C1=CC2=C(NC(O2)=O)C=C1 DFGKGUXTPFWHIX-UHFFFAOYSA-N 0.000 description 1
- DEXFNLNNUZKHNO-UHFFFAOYSA-N 6-[3-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-3-oxopropyl]-3H-1,3-benzoxazol-2-one Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)C(CCC1=CC2=C(NC(O2)=O)C=C1)=O DEXFNLNNUZKHNO-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
본 발명의 일실시예에 따른 페어 트레이딩 학습 장치를 이용한 AI 기반 주식 매매 방법은 설정 기간 동안의 제1 주식에 관한 정보 및 상기 제1 주식과 상이한 제2 주식에 관한 정보를 획득하는 단계;, 상기 제1 주식의 공매도 여부, 상기 제2 주식의 매수 여부, 상기 제1 주식의 매수 여부, 상기 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성하는 단계;, 시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성하는 단계; 및 시점 별 상기 제1 주식 및 상기 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 상기 시점 별 행동 정보 및 상기 상태 정보에 기반한 알고리즘을 학습하는 단계;를 포함한다An AI-based stock trading method using a pair trading learning device according to an embodiment of the present invention includes obtaining information about a first stock during a set period and information about a second stock that is different from the first stock; Generating behavioral information for each time point determined based on whether to short sell the first stock, whether to purchase the second stock, whether to purchase the first stock, and whether to sell the second stock; generating status information related or associated with a learning period; And learning an algorithm based on the behavior information and the state information for each time point so that the reward determined based on the prices of the first stock and the second stock for each time point is maximized.
Description
본 발명은 AI를 이용한 주식 매매 방법에 대한 것이며, 상세하게는 강화학습에 기반한 페어 트레이딩 학습 장치를 활용한 주식 매매 학습 방법에 대한 것이다.The present invention relates to a stock trading method using AI, and more specifically, to a stock trading learning method using a pair trading learning device based on reinforcement learning.
특허문헌 001은 주식 예측을 위한 딥러닝 모델 생성 방법에 관한 것으로, 주식 예측을 위한 종목 데이터를 조회하는 단계; 상기 조회된 종목 데이터에 기초하여 딥러닝 모델을 생성하는 단계; 및 상기 생성된 딥러닝 모델을 이용하여 상 기 조회된 종목 데이터를 학습시킴에 따라 종목 데이터에 대한 주가를 예측한 예측 결과를 제공하는 단계를 포함하는 기술을 제시하고 있다.Patent Document 001 relates to a method of creating a deep learning model for stock prediction, including the steps of searching stock data for stock prediction; Generating a deep learning model based on the retrieved item data; and providing a prediction result that predicts the stock price for the item data by learning the retrieved item data using the generated deep learning model.
특허문헌 002는 딥러닝 기반의 주식 스크리닝과 이를 이용한 포트폴리오 자동화 및 고도화 방법 및 장치에 관한 것으로, 딥러닝 기반 주식 스크리닝 방법은, 금융 데이터를 딥러닝(deep learning)에 적합한 데이터로 변환하기 위해 전처리하고, 잡음 제거 오토인코더를 이용하여 금융 시계열에 내포된 잡음을 제거하는 단계; 잡음이 제거된 데이터를 이용하여 딥러닝 기반 예측 모형에 입력하는 단계; 훈련된 상기 예측 모형을 통해 주식 종목별로 주가 예측 수익률을 예측하는 단계; 및 스크리닝 레벨을 설정하여, 설정된 상기 스크리닝 레벨보다 큰 상기 주가 예측 수익률을 갖는 주식을 선택하는 단계를 포함하여 이루어지는 기술을 제시하고 있다. Patent Document 002 relates to deep learning-based stock screening and a method and device for portfolio automation and advancement using the same. The deep learning-based stock screening method preprocesses financial data to convert it into data suitable for deep learning. , removing noise contained in the financial time series using a noise removal autoencoder; Inputting data from which noise has been removed into a deep learning-based prediction model; Predicting the predicted stock price return for each stock item using the trained prediction model; and setting a screening level and selecting stocks with a predicted stock price return greater than the set screening level.
특허문헌 003은 수익률을 향상시킬 수 있는 주식 자동 매매 시스템 및 방법에 관한 것으로, 사용자 디바이스 및 서비스 제 공 서버를 포함하는 주식 자동 매매 시스템에 있어서, 상기 서비스 제공 서버는, 조건식을 통해 매수할 주식 종 목을 추출하는 추출 모듈; 상기 추출 모듈에서 추출된 주식 종목을 저장하는 저장 모듈; 상기 저장 모듈에 저장 된 주식 종목을 상기 사용자 디바이스로 전송하는 전송 모듈;상기 추출 모듈에 의해 추출된 주식 종목을 매수하 는 매수 모듈; 상기 매수 모듈에 의해 매수된 주식 종목의 1차 매도 가격을 설정하는 제1 설정 모듈; 딥 러닝 모 델을 이용하여 상기 제1 설정 모듈이 설정한 상기 1차 매도 가격을 조절하여 2차 매도 가격을 설정하는 제2 설정 모듈; 및 상기 제2 설정 모듈을 통해 설정된 2차 매도 가격에 따라 상기 매수 모듈에 의해 매수된 주식 종목을 매도하는 매도 모듈;을 포함하는, 주식 자동 매매 시스템을 제시하고 있다. .Patent Document 003 relates to an automatic stock trading system and method that can improve returns. In the automatic stock trading system including a user device and a service providing server, the service providing server selects stock items to purchase through a conditional expression. Extraction module to extract; a storage module that stores stock items extracted from the extraction module; A transmission module that transmits the stock items stored in the storage module to the user device; A purchase module that purchases the stock items extracted by the extraction module; a first setting module that sets a primary selling price for stock items purchased by the purchasing module; a second setting module that sets a secondary selling price by adjusting the primary selling price set by the first setting module using a deep learning model; and a selling module that sells stock items purchased by the buying module according to the secondary selling price set through the second setting module. .
특허문헌 004는 본 발명은 증권 거래를 위한 딥러닝 모델 학습방법에 관한 것으로, 적어도 하나의 종목에 대한 거래 데이터를 수 집하는 단계와, 상기 수집된 적어도 하나의 종목에 대한 거래 데이터를 지도학습 기반의 제 1 딥러닝 모델에 입 력하여 기 설정된 단위 시간 마다의 해당 종목에 대한 주가변화율을 예측하도록 제 1 딥러닝 모델을 학습시키는 단계와, 상기 수집된 적어도 하나의 종목에 대한 거래 데이터를 제 2 딥러닝 모델에 입력하여 해당 종목에 있어 서의 초단기 시장 상황에 대한 슬리피지(slippage) 비용 및 주문 집행 비용이 절감되는 주문 집행 전략이 도출되 도록 제 2 딥러닝 모델을 학습시키는 단계와, 실제 증권 시장의 환경에서 상기 주문 집행 전략에 따라 주문 집행 된 주문 집행 전략에 대한 리워드가 결정되면, 상기 결정된 리워드에 기초하여 제 2 딥러닝 모델을 재학습시키는 단계와, 실제 증권 시장의 환경에서 상기 주문 집행 전략에 따라 주문 집행이 종료된 종목의 거래 데이터를 이용 하여 제 1 딥러닝 모델을 재학습시키는 단계를 포함하는 기술을 제시하고 있다.Patent Document 004 relates to a method of learning a deep learning model for securities trading, which includes collecting transaction data for at least one item, and analyzing the collected transaction data for at least one item based on supervised learning. A step of training the first deep learning model to predict the stock price change rate for the corresponding item for each preset unit time by inputting it into the first deep learning model, and sending the collected transaction data for the at least one item to a second A step of learning a second deep learning model by inputting it into the deep learning model to derive an order execution strategy that reduces slippage costs and order execution costs for ultra-short-term market conditions in the relevant item, and actual securities When the reward for the order execution strategy is determined by executing the order according to the order execution strategy in the market environment, retraining the second deep learning model based on the determined reward, and executing the order in the actual securities market environment We present a technology that includes the step of retraining the first deep learning model using transaction data of items for which order execution has ended according to the strategy.
본 발명은 페어 트레이딩을 효과적으로 학습할 수 있는 페어 트레이딩 학습방법 및 이에 활용되는 학습 장치를 제공하는 것을 목적으로 한다. The purpose of the present invention is to provide a pair trading learning method that can effectively learn pair trading and a learning device used in the same.
또한, 본 발명은 제1 주식과 제2 주식의 매수 및 매도에 기반하여 정의되는 행동 정보 및 상태 정보에 기초하여 리워드를 최대화하는 알고리즘을 학습할 수 있는 페어 트레이딩 학습 장치, 및 그것의 동작 방법을 제공하는 것을 목적으로 한다. In addition, the present invention provides a pair trading learning device capable of learning an algorithm for maximizing rewards based on behavioral information and status information defined based on the purchase and sale of the first stock and the second stock, and a method of operating the same. The purpose is to provide
본 발명의 일실시예에 따른 페어 트레이딩 학습 장치를 이용한 AI 기반 주식 매매 방법은 설정 기간 동안의 제1 주식에 관한 정보 및 상기 제1 주식과 상이한 제2 주식에 관한 정보를 획득하는 단계;,상기 제1 주식의 공매도 여부, 상기 제2 주식의 매수 여부, 상기 제1 주식의 매수 여부, 상기 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성하는 단계;,시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성하는 단계; 및 시점 별 상기 제1 주식 및 상기 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 상기 시점 별 행동 정보 및 상기 상태 정보에 기반한 알고리즘을 학습하는 단계; 를 포함할 수 있다. An AI-based stock trading method using a pair trading learning device according to an embodiment of the present invention includes obtaining information about a first stock during a set period and information about a second stock that is different from the first stock; Generating behavioral information for each time point determined based on whether to short sell the first stock, whether to purchase the second stock, whether to purchase the first stock, and whether to sell the second stock; Behavioral information for each time point and generating status information related or associated with a learning period; and learning an algorithm based on the behavior information and the state information for each time point to maximize rewards determined based on the prices of the first stock and the second stock for each time point. may include.
본 발명의 일실시예에서 상기 페어 트레이딩 학습 장치는 설정 기간 동안의 제1 주식에 관한 정보 및 상기 제1 주식과 상이한 제2 주식에 관한 정보를 획득하는 정보 획득부;,상기 제1 주식의 공매도 여부, 상기 제2 주식의 매수 여부, 상기 제1 주식의 매수 여부, 상기 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성하고, 시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성하는 정보 생성부; 및 시점 별 상기 제1 주식 및 상기 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 상기 시점 별 행동 정보 및 상기 상태 정보에 기반한 알고리즘을 학습하는 학습부; 를 포함할 수 있다. In one embodiment of the present invention, the pair trading learning device includes an information acquisition unit that acquires information about the first stock during a set period and information about a second stock that is different from the first stock; short selling of the first stock generates behavioral information determined based on whether to purchase or not to purchase the second stock, whether to purchase the first stock, or sell the second stock at each time point, and is related to the behavioral information at each time point or related to the learning period. an information generation unit that generates status information; and a learning unit that learns an algorithm based on the behavior information and the state information for each time point to maximize the reward determined based on the prices of the first stock and the second stock for each time point. may include.
본 발명의 일실시예에서, 상기 정보 생성부는, 상기 제1 주식이 공매도되면서 상기 제2 주식이 매수되는 시점에는 상기 행동 정보를 행동이 발생함을 나타내는 값으로 생성하고, 상기 제1 주식이 매수되면서 상기 제2 주식이 매도되는 시점에는 상기 행동 정보를 행동이 발생함을 나타내는 값으로 생성하고, 상기 제1 주식 및 상기 제2 주식의 거래가 없는 시점에는 상기 행동 정보를 행동이 발생하지 않음을 나타내는 값으로 생성할 수 있다. In one embodiment of the present invention, the information generation unit generates the action information as a value indicating that an action occurs at the time the first stock is sold short and the second stock is purchased, and the first stock is purchased. At the time when the second stock is sold, the behavior information is generated as a value indicating that an action has occurred, and at the time when there is no transaction of the first stock and the second stock, the behavior information is generated as a value indicating that the action has not occurred. It can be created as a value.
본 발명의 일실시예에서, 상기 제1 주식의 공매도와 상기 제2 주식의 매수가 발생하는 시점을 동일하고, 상기 제1 주식의 매수와 상기 제2 주식의 매도가 발생하는 시점은 동일할 수 있다. In one embodiment of the present invention, the time at which the short sale of the first stock and the purchase of the second stock occur may be the same, and the time at which the purchase of the first stock and the sale of the second stock occur may be the same. there is.
본 발명의 일실시예에서, 상기 상태 정보는, 시점에 따른 상기 제1 주식과 상기 제2 주식의 총 거래 가격의 비율에 관련된 제1 상태 정보, 상기 제1 상태 정보의 변화량에 관련된 제2 상태 정보, 상기 제1 주식 또는 상기 제2 주식이 오픈 상태인지에 관련된 제3 상태 정보 및 오픈된 경우 오픈 상태로 변경된 시점의 거래 금액에 관련된 제4 상태 정보를 포함하고, 상기 오픈 상태는 상기 제1 주식이 공매도되고 상기 제2 주식이 매수된 상태일 수 있다.In one embodiment of the present invention, the state information includes first state information related to the ratio of the total transaction price of the first stock and the second stock according to the time point, and second state related to the amount of change in the first state information. information, third state information related to whether the first stock or the second stock is in an open state, and fourth state information related to the transaction amount at the time the state is changed to open if open, and the open state is the first stock or the second stock. The stock may be sold short and the second stock may be purchased.
본 발명의 일실시예에서, 상기 정보 생성부는, 상기 제1 상태 정보를 [수학식 1]에 기반하여 생성하고, 상기 제2 상태 정보를 [수학식 2]에 기반하여 생성하고, 상기 제4 상태 정보를 [수학식 3]에 기반하여 생성할 수 있다.In one embodiment of the present invention, the information generator generates the first state information based on [Equation 1], generates the second state information based on [Equation 2], and generates the fourth state information based on [Equation 2]. Status information can be generated based on [Equation 3].
[수학식 1][Equation 1]
[수학식 2][Equation 2]
[수학식 3][Equation 3]
본 발명의 일실시예에서 상기 학습부는, 상기 제1 주식 및 상기 제2 주식의 매수, 매도에 따른 거래 비용을 고려하여 상리 리워드를 산출할 수 있다. In one embodiment of the present invention, the learning unit may calculate a mutual reward by considering transaction costs resulting from the purchase and sale of the first stock and the second stock.
본 발명의 일실시예에서 상기 학습부는, 상기 제1 주식 및 상기 제2 주식이 오픈되었다가 클로즈된 경우, 상기 리워드를 [수학식 4]에 기반하여 산출할 수 있다. In one embodiment of the present invention, the learning unit may calculate the reward based on [Equation 4] when the first stock and the second stock are opened and then closed.
[수학식 4][Equation 4]
본 발명의 일실시예에서 상기 학습부는, 상기 리워드 및 상기 상태 정보를 입력 변수로 하는 Q-learning 또는 Double Q-learning에 기반하여 상기 알고리즘을 학습할 수 있다. In one embodiment of the present invention, the learning unit may learn the algorithm based on Q-learning or Double Q-learning using the reward and the state information as input variables.
본 발명의 일실시예에서 상기 학습부는, LSTM(Long Short Term Memory) 셀들을 포함하는 제1 레이어; 전결합 레이어(Fully Connected Layer)인 제2 레이어; 및 행동을 결정하는 출력 레이어인 제3 레이어; 를 포함할 수 있다. In one embodiment of the present invention, the learning unit includes a first layer including Long Short Term Memory (LSTM) cells; A second layer, which is a fully connected layer; and a third layer, which is the output layer that determines the action. may include.
본 발명의 일실시예에서, 상기 제1 주식은 가치보다 높게 평가된 주식을 포함하고, 상기 제2 주식은 가치보다 낮게 평가된 주식을 포함할 수 있다. In one embodiment of the present invention, the first stocks may include stocks valued higher than their value, and the second stocks may include stocks evaluated lower than their value.
본 발명의 일실시예에서, 상기 학습된 알고리즘에 기반하여 미래 시점의 거래를 결정하는 거래 결정부; 를 더 포함할 수 있다. In one embodiment of the present invention, a transaction decision unit that determines a future transaction based on the learned algorithm; It may further include.
본 발명의 일실시예에 따른 컴퓨터 프로그램은, 컴퓨터를 이용하여 페어 트레이딩 학습 방법을 실행시키기 위하여 매체에 저장될 수 있다. A computer program according to an embodiment of the present invention may be stored in a medium to execute a pair trading learning method using a computer.
본 발명은 페어 트레이딩과 관련하여 제1 주식과 제2 주식의 매수 및 매도에 기반하여 정의되는 행동 정보 및 상태 정보에 기초하여 리워드를 최대화하는 알고리즘을 학습할 수 있는 페어 트레이딩 학습 장치 및 그것의 동작 방법을 제공할 수 있다.The present invention is a pair trading learning device capable of learning an algorithm for maximizing rewards based on behavioral information and state information defined based on the purchase and sale of the first stock and the second stock in relation to pair trading, and its operation. A method can be provided.
또한, 본 발명은 강화 학습 중 Q-러닝과 Double Q-learning을 통해 리워드를 최대화하도록 학습할 수 있는 페어 트레이딩 학습 장치 및 그것의 동작 방법을 제공할 수 있다.Additionally, the present invention can provide a pair trading learning device and its operating method that can learn to maximize rewards through Q-learning and Double Q-learning during reinforcement learning.
또한, 본 발명은 매수 또는 매도시의 거래 비용을 고려하여 페어 트레이딩을 학습할 수 있는 페어 트레이딩 학습 장치 및 그것의 동작 방법을 제공할 수 있다. Additionally, the present invention can provide a pair trading learning device and its operating method that can learn pair trading by considering transaction costs when buying or selling.
또한, 본 발명은 비슷한 주가 흐름을 갖는 두 주식의 주가에 관하여 상대적으로 저평가된 주식을 매수하고, 동시에 고평가된 주식을 매도하는 통계적 차익 거래를 효율적으로 수행할 수 있는 페어 트레이딩 학습 장치 및 그것의 동작 방법을 제공할 수 있다. In addition, the present invention is a pair trading learning device and operation thereof that can efficiently perform statistical arbitrage trading by purchasing relatively undervalued stocks and simultaneously selling overvalued stocks with respect to the stock prices of two stocks with similar stock prices. A method can be provided.
도 1은 본 발명의 일실시예에 따른 페어 트레이딩 학습 장치의 블록도이다.
도 2는 본 발명의 다른 실시예에 다른 페어 트레이딩 학습 장치를 보여주는 블록도이다.
도 3은 본 발명의 일실시예에 따른 페어 트레이딩 학습 장치의 학습 결과를 보여주는 도면이다.
도 4는 본 발명의 일실시예에 따른 페어 트레이딩 학습 방법을 나타내는 흐름도이다.
도 5은 본 발명의 일실시예에 따른 방법을 실행할 수 있는 기능적 블록도이다.Figure 1 is a block diagram of a pair trading learning device according to an embodiment of the present invention.
Figure 2 is a block diagram showing a pair trading learning device according to another embodiment of the present invention.
Figure 3 is a diagram showing the learning results of the pair trading learning device according to an embodiment of the present invention.
Figure 4 is a flowchart showing a pair trading learning method according to an embodiment of the present invention.
Figure 5 is a functional block diagram of executing a method according to an embodiment of the present invention.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 설명되는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 아래에서 제시되는 실시 예들로 한정되는 것이 아니라, 서로 다른 다양한 형태로 구현될 수 있고, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. The advantages and features of the present invention and methods for achieving them will become clear by referring to the embodiments described in detail together with the accompanying drawings. However, the present invention is not limited to the embodiments presented below, but may be implemented in various different forms, and should be understood to include all conversions, equivalents, and substitutes included in the spirit and technical scope of the present invention. .
아래에 제시되는 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발 명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.The embodiments presented below are provided to ensure that the disclosure of the present invention is complete and to fully inform those skilled in the art of the scope of the invention. In describing the present invention, if it is determined that a detailed description of related known technologies may obscure the gist of the present invention, the detailed description will be omitted.
본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. The terms used in this application are only used to describe specific embodiments and are not intended to limit the invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this application, terms such as “comprise” or “have” are intended to designate the presence of features, numbers, steps, operations, components, parts, or combinations thereof described in the specification, but are not intended to indicate the presence of one or more other features. It should be understood that this does not exclude in advance the possibility of the existence or addition of elements, numbers, steps, operations, components, parts, or combinations thereof.
본 발명의 실시 예에서 "통신", "통신망" 및 "네트워크"는 동일한 의미로 사용될 수 있다. 상기 세 용어 들은, 파일을 사용자 단말, 다른 사용자들의 단말 및 다운로드 서버 사이에서 송수신할 수 있는 유무선의 근거 리 및 광역 데이터 송수신망을 포함할 수 있다.In the embodiments of the present invention, “communication,” “communication network,” and “network” may be used with the same meaning. The above three terms may include wired and wireless local and wide area data transmission and reception networks that can transmit and receive files between user terminals, other users' terminals, and download servers.
이하, 본 발명에 따른 실시 예들을 첨부된 도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. In the description with reference to the accompanying drawings, identical or corresponding components are assigned the same drawing numbers and duplicate descriptions thereof are omitted. I decided to do it.
(실시예 1-1) 페어 트레이딩 학습 장치를 이용한 AI 기반 주식 매매 방법은 설정 기간 동안의 제1 주식에 관한 정보 및 상기 제1 주식과 상이한 제2 주식에 관한 정보를 획득하는 단계(S110); 상기 제1 주식의 공매도 여부, 상기 제2 주식의 매수 여부, 상기 제1 주식의 매수 여부, 상기 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성하는 단계(S120); 시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성하는 단계(S130); 및 시점 별 상기 제1 주식 및 상기 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 상기 시점 별 행동 정보 및 상기 상태 정보에 기반한 알고리즘을 학습하는 단계(S140); 를 포함할 수 있다. (Example 1-1) An AI-based stock trading method using a pair trading learning device includes the steps of acquiring information about a first stock during a set period and information about a second stock different from the first stock (S110); Generating, at each point in time, behavioral information determined based on whether to short sell the first stock, whether to buy the second stock, whether to buy the first stock, or whether to sell the second stock (S120); Generating state information related to behavioral information for each time point or related to the learning period (S130); and learning an algorithm based on the behavior information and the state information for each time point so that the reward determined based on the prices of the first stock and the second stock for each time point is maximized (S140); may include.
본 발명의 일 실시예에 따르면, 페어 트레이딩 학습 방법은 도 1의 페어 트레이딩 학습 장치(100)를 통해 수행될 수 있다. 페어 트레이딩 학습 장치(100)에 대해서는 후술하기도 한다.According to an embodiment of the present invention, the pair trading learning method can be performed through the pair trading learning device 100 of FIG. 1. The pair trading learning device 100 will be described later.
도 4를 참조하면, S110 단계에서, 정보 획득부(110)는 설정 기간 동안의 제1 주식에 관한 정보 및 제1 주식과 상이한 제2 주식에 관한 정보를 획득할 수 있다. Referring to FIG. 4, in step S110, the information acquisition unit 110 may acquire information about the first stock and information about the second stock that is different from the first stock during the set period.
S120 단계에서, 정보 생성부(120)는 제1 주식의 공매도 여부, 제2 주식의 매수 여부, 제1 주식의 매수 여부, 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성할 수 있다. In step S120, the information generation unit 120 generates behavioral information determined based on whether to short sell the first stock, whether to buy the second stock, whether to buy the first stock, and whether to sell the second stock at each point in time. You can.
S130 단계에서, 정보 생성부(120)는 시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성할 수 있다. In step S130, the information generation unit 120 may generate status information related to behavior information for each time point or related to the learning period.
S140 단계에서, 학습부(130)는 제1 시점 및 제2 시점의 제1 주식 및 제2 주식의 가격에 기반하여 생성되는 리워드가 최대가 되도록 행동 정보 및 상태 정보에 기반한 알고리즘을 학습할 수 있다. In step S140, the learning unit 130 may learn an algorithm based on behavioral information and state information to maximize rewards generated based on the prices of the first stock and the second stock at the first and second time points. .
(실시예 2-1) 실시예 1-1에 있어서, 상기 페어 트레이딩 학습 장치는 장치는 프로세서(410), 메모리(420), 통신회로(430)를 포함할 수 있다. (Example 2-1) In Example 1-1, the pair trading learning device may include a processor 410, a memory 420, and a communication circuit 430.
(실시예 2-2) 실시예 2-1에 있어서, 상기 페어 트레이딩 학습 장치을 수행하는 장치는 디스플레이(440)를 더 포함할 수 있다. (Example 2-2) In Example 2-1, the device for performing the pair trading learning device may further include a display 440.
도 5를 참조하면, 페어 트레이딩 학습 방법을 수행하는 장치는 프로세서(410), 메모리(420), 및 통신 회로(430)를 포함할 수 있다. 일 실시 예에 따르면, 페어 트레이딩 학습 방법을 수행하는 장치는 사용자와 인터페이스를 수행하기 위하여 디스플레이(440)를 더 포함할 수 있다. Referring to FIG. 5, a device that performs a pair trading learning method may include a processor 410, a memory 420, and a communication circuit 430. According to one embodiment, a device for performing a pair trading learning method may further include a display 440 to interface with a user.
프로세서(410)는 페어 트레이딩 학습 방법을 수행하는 장치의 전반적인 동작을 제어할 수 있다. 다양한 실시 예들에서, 프로세서(410)는 하나의 프로세서 코어(single core)를 포함하거나, 복수의 프로세서 코어들을 포함할 수 있다. 예를 들면, 프로세서(410)는 듀얼 코어(dual-core), 쿼드 코어(quad-core), 헥사 코어(hexa-core) 등의 멀티 코어(multi-core)를 포함할 수 있다. 실시 예들에 따라, 프로세서(410)는 내부 또는 외부에 위치된 캐시 메모리(cache memory)를 더 포함할 수 있다. 실시 예들에 따라, 프로세서(410)는 하나 이상의 프로세서들로 구성될(configured with) 수 있다. 예를 들면, 프로세서(410)는, 애플리케이션 프로세서(application processor), 통신 프로세서(communication processor), 또는 GPU(graphical processing unit) 중 적어도 하나를 포함할 수 있다. The processor 410 may control the overall operation of the device that performs the pair trading learning method. In various embodiments, the processor 410 may include one processor core (single core) or may include a plurality of processor cores. For example, the processor 410 may include multi-core, such as dual-core, quad-core, or hexa-core. Depending on embodiments, the processor 410 may further include a cache memory located internally or externally. Depending on embodiments, the processor 410 may be configured with one or more processors. For example, the processor 410 may include at least one of an application processor, a communication processor, or a graphical processing unit (GPU).
프로세서(410)의 전부 또는 일부는 페어 트레이딩 학습 방법을 수행하는 장치 내의 다른 구성 요소(예를 들면, 메모리(420), 통신 회로(430), 또는 디스플레이(440)와 전기적으로(electrically) 또는 작동적으로(operatively) 결합(coupled with)되거나 연결될(connected to) 수 있다. 프로세서(410)는 페어 트레이딩 학습 방법을 수행하는 장치의 다른 구성 요소들의 명령을 수신할 수 있고, 수신된 명령을 해석할 수 있으며, 해석된 명령에 따라 계산을 수행하거나 데이터를 처리할 수 있다. 프로세서(410)는 메모리(420), 통신 회로(430), 또는 디스플레이(440)로부터 수신되는 메시지, 데이터, 명령어, 또는 신호를 해석할 수 있고, 가공할 수 있다. 프로세서(410)는 수신된 메시지, 데이터, 명령어, 또는 신호에 기반하여 새로운 메시지, 데이터, 명령어, 또는 신호를 생성할 수 있다. 프로세서(410)는 가공되거나 생성된 메시지, 데이터, 명령어, 또는 신호를 메모리(420), 통신 회로(430), 또는 디스플레이(440)에게 제공할 수 있다. All or part of the processor 410 may be electrically connected or operative with other components within the device (e.g., memory 420, communication circuitry 430, or display 440) to perform the pair trading learning method. The processor 410 may receive commands from other components of the device performing the pair trading learning method and interpret the received commands. and can perform calculations or process data according to interpreted instructions. The processor 410 may receive messages, data, instructions, or Signals can be interpreted and processed. The processor 410 can generate new messages, data, instructions, or signals based on the received messages, data, instructions, or signals. The processor 410 can generate new messages, data, instructions, or signals. Processed or generated messages, data, commands, or signals may be provided to the memory 420, communication circuit 430, or display 440.
프로세서(410)는 프로그램에서 생성되거나 발생되는 데이터 또는 신호를 처리할 수 있다. 예를 들면, 프로세서(410)는 프로그램을 실행하거나 제어하기 위해 메모리(420)에게 명령어, 데이터 또는 신호를 요청할 수 있다. 프로세서(410)는 프로그램을 실행하거나 제어하기 위해 메모리(420)에게 명령어, 데이터, 또는 신호를 기록(또는 저장)하거나 갱신할 수 있다. The processor 410 can process data or signals generated or generated by a program. For example, the processor 410 may request instructions, data, or signals from the memory 420 to execute or control a program. The processor 410 may record (or store) or update instructions, data, or signals to the memory 420 in order to execute or control a program.
실시예에 따르면, 도 1 및 도 2에 정보 생성부 및 학습부의 역할은 프로세서(410)로부터 수행될 수 있다. 즉, 일 실시예에서, 프로세서(410)는 학습에 필요한 정보를 전처리하는 정보 생성 모듈 및 학습 모듈을 포함할 수 있다. According to the embodiment, the roles of the information generation unit and the learning unit in FIGS. 1 and 2 may be performed by the processor 410. That is, in one embodiment, the processor 410 may include an information generation module and a learning module that preprocess information necessary for learning.
메모리(420)는 페어 트레이딩 학습 방법을 수행하는 장치를 제어하는 명령어, 제어 명령어 코드, 제어 데이터, 또는 사용자 데이터를 저장할 수 있다. 예를 들면, 메모리(420)는 애플리케이션(application) 프로그램, OS(operating system), 미들웨어(middleware), 또는 디바이스 드라이버(device driver) 중 적어도 하나를 포함할 수 있다. The memory 420 may store commands, control command codes, control data, or user data that control a device that performs a pair trading learning method. For example, the memory 420 may include at least one of an application program, an operating system (OS), middleware, or a device driver.
메모리(420)는 휘발성 메모리(volatile memory) 또는 불휘발성(non-volatile memory) 중 하나 이상을 포함할 수 있다. 휘발성 메모리는 DRAM(dynamic random access memory), SRAM(static RAM), SDRAM(synchronous DRAM), PRAM(phase-change RAM), MRAM(magnetic RAM), RRAM(resistive RAM), FeRAM(ferroelectric RAM) 등을 포함할 수 있다. 불휘발성 메모리는 ROM(read only memory), PROM(programmable ROM), EPROM(electrically programmable ROM), EEPROM(electrically erasable programmable ROM), 플래시 메모리(flash memory) 등을 포함할 수 있다. Memory 420 may include one or more of volatile memory or non-volatile memory. Volatile memory includes dynamic random access memory (DRAM), static RAM (SRAM), synchronous DRAM (SDRAM), phase-change RAM (PRAM), magnetic RAM (MRAM), resistive RAM (RRAM), and ferroelectric RAM (FeRAM). It can be included. Non-volatile memory may include read only memory (ROM), programmable ROM (PROM), electrically programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), flash memory, etc.
메모리(420)는 하드 디스크 드라이브(HDD, hard disk drive), 솔리드 스테이트 디스크(SSD, solid state disk), eMMC(embedded multi media card), UFS(universal flash storage)와 같은 불휘발성 매체(medium)를 더 포함할 수 있다. The memory 420 uses non-volatile media such as a hard disk drive (HDD), solid state disk (SSD), embedded multi media card (eMMC), and universal flash storage (UFS). More may be included.
통신 회로(430)는 페어 트레이딩 학습 방법을 수행하는 장치와 외부 전자 장치(예: 단말은 서버로, 서버는 단말로)간의 유선 또는 무선 통신 연결의 수립, 및 수립된 연결을 통한 통신 수행을 지원할 수 있다. 일 실시 예에 따르면, 통신 회로(430)는 무선 통신 회로(예: 셀룰러 통신 회로, 근거리 무선 통신 회로, 또는 GNSS(global navigation satellite system) 통신 회로) 또는 유선 통신 회로(예: LAN(local area network) 통신 회로, 또는 전력선 통신 회로)를 포함하고, 그 중 해당하는 통신 회로를 이용하여 블루투스, WiFi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크 또는 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크와 같은 원거리 통신 네트워크를 통하여 외부 전자 장치와 통신할 수 있다. 상술한 여러 종류의 통신 회로(430)는 하나의 칩으로 구현되거나 또는 각각 별도의 칩으로 구현될 수 있다. The communication circuit 430 supports establishment of a wired or wireless communication connection between a device performing a pair trading learning method and an external electronic device (e.g., terminal to server, server to terminal), and performance of communication through the established connection. You can. According to one embodiment, the communication circuit 430 may be a wireless communication circuit (e.g., a cellular communication circuit, a short-range wireless communication circuit, or a global navigation satellite system (GNSS) communication circuit) or a wired communication circuit (e.g., a local area network (LAN) ) communication circuit, or power line communication circuit), and using the corresponding communication circuit, a short-range communication network such as Bluetooth, WiFi direct, or IrDA (infrared data association) or a long-distance communication such as a cellular network, the Internet, or a computer network It can communicate with external electronic devices through a network. The various types of communication circuits 430 described above may be implemented as one chip or may be implemented as separate chips.
디스플레이(440)는, 컨텐츠, 데이터, 또는 신호를 출력할 수 있다. 다양한 실시 예들에서, 디스플레이(440)는 프로세서(410)에 의해 가공된 이미지 데이터를 표시할 수 있다. 실시예들에 따라, 디스플레이(440)는 터치 입력 등을 수신할 수 있는 복수의 터치 센서들(미도시)과 결합됨으로써, 일체형의 터치 스크린(touch screen)으로 구성될(configured with) 수도 있다. 디스플레이(440)가 터치 스크린으로 구성되는 경우, 복수의 터치 센서들은, 디스플레이(440) 위에 배치되거나, 디스플레이(440) 아래에 배치될 수 있다.The display 440 can output content, data, or signals. In various embodiments, the display 440 may display image data processed by the processor 410. Depending on embodiments, the display 440 may be configured with an integrated touch screen by being combined with a plurality of touch sensors (not shown) capable of receiving touch input, etc. When the display 440 is configured as a touch screen, a plurality of touch sensors may be placed above the display 440 or below the display 440.
(실시예 2-1) 실시예 1-1에 있어서, 상기 페어 트레이딩 학습 장치(100)는, 설정 기간 동안의 제1 주식에 관한 정보 및 상기 제1 주식과 상이한 제2 주식에 관한 정보를 획득하는 정보 획득부(110); 상기 제1 주식의 공매도 여부, 상기 제2 주식의 매수 여부, 상기 제1 주식의 매수 여부, 상기 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성하고, 시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성하는 정보 생성부(120); 시점 별 상기 제1 주식 및 상기 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 상기 시점 별 행동 정보 및 상기 상태 정보에 기반한 알고리즘을 학습하는 학습부(130); 를 포함한다. (Example 2-1) In Example 1-1, the pair trading learning device 100 acquires information about a first stock during a set period and information about a second stock different from the first stock. an information acquisition unit 110; Behavioral information determined based on whether to short sell the first stock, purchase or not to purchase the second stock, purchase or sell the first stock, and sell the second stock are generated at each time point, and are related to the behavioral information at each time point. an information generation unit 120 that generates status information related to the current or learning period; A learning unit 130 that learns an algorithm based on the behavior information and the state information for each time point so that the reward determined based on the prices of the first stock and the second stock for each time point is maximized; Includes.
본 발명은 페어 트레이딩 학습 장치를 이용한 AI 기반 주식 매매 방법에 대한 것으로, 페어 트레이딩 학습 장치는 정보 획득부(110), 정보 생성부(120) 및 학습부(130)를 포함하는 구성으로 이루어질 수 있다. The present invention relates to an AI-based stock trading method using a pair trading learning device. The pair trading learning device may be comprised of an information acquisition unit 110, an information generation unit 120, and a learning unit 130. .
정보 획득부(110)는 설정 기간 동안의 제1 주식에 관한 정보 및 제1 주식과 상이한 제2 주식에 관한 정보를 획득할 수 있다. 예를 들어, 정보 획득부(110)는 설정 기간 동안 A사와 B사의 주식의 가격 정보를 획득할 수 있다. 다른 예를 들어, 정보 획득부(110)는 복수개의 회사의 n년간의 주식 종가 정보 획득할 수 있다. 다만 이에 한정되는 것은 아니고, 정보 획득부(110)는 특정 회사의 특정 기간의 주식 가격(시가, 종가, 그래프 등)에 관련된 정보를 획득할 수 있다. The information acquisition unit 110 may acquire information about the first stock and information about the second stock that is different from the first stock during the set period. For example, the information acquisition unit 110 may obtain price information on stocks of companies A and B during a set period. For another example, the information acquisition unit 110 may acquire stock closing price information for n years for a plurality of companies. However, it is not limited to this, and the information acquisition unit 110 may acquire information related to stock prices (opening price, closing price, graph, etc.) of a specific company during a specific period.
실시예에 따르면, 정보 획득부(110)는 외부 장치(예: 증권사 서버, 주식 관리 장치 등)로부터 제1 주식에 관한 정보 및 제2 주식에 관한 정보를 획득할 수 있다. According to an embodiment, the information acquisition unit 110 may obtain information about the first stock and information about the second stock from an external device (e.g., a securities company server, a stock management device, etc.).
정보 생성부(120)는 제1 주식 및 제2 주식의 거래에 관련된 행동 정보를 생성할 수 있다. 예를 들어, 정보 생성부(120)는 제1 주식의 공매도 여부, 제2 주식의 매수 여부, 제1 주식의 매수 여부, 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성할 수 있다. 다른 예를 들어, 정보 생성부(120)는 제1 시점에 제1 주식이 공매도 되면서 제1 시점에 제2 주식이 매수되는 경우에 행동 정보를 1로 생성할 수 있다. 다른 예를 들어, 정보 생성부(120)는 제1 시점에 제1 주식이 공매도되지 않고 제1 시점에 제2 주식이 매수되지 않는 경우, 즉 아무 거래도 이루어지지 않은 경우 행동 정보를 0으로 생성할 수 있다. The information generation unit 120 may generate behavioral information related to trading of the first stock and the second stock. For example, the information generation unit 120 may generate behavioral information determined based on whether to short sell the first stock, whether to buy the second stock, whether to buy the first stock, and whether to sell the second stock at each point in time. You can. For another example, the information generation unit 120 may generate behavioral information as 1 when the first stock is sold short at the first time and the second stock is purchased at the first time. For another example, the information generation unit 120 generates behavioral information as 0 when the first stock is not sold short at the first time and the second stock is not purchased at the first time, that is, when no transaction is made. can do.
정보 생성부(120)는 제2 시점에 제1 주식의 매수 여부, 제2 시점에 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 생성할 수 있다. 예를 들어, 정보 생성부(120)는 제2 시점에 제1 주식이 매수되면서 제2 시점에 제2 주식이 매도되는 경우에 행동 정보를 1로 생성할 수 있고, 제2 시점에 제1 주식이 매수되지 않고 제1 시점에 제2 주식이 매도되지 않는 경우, 즉 아무 거래도 이루어지지 않은 경우 제2 행동 정보를 0으로 생성할 수 있다. The information generation unit 120 may generate behavioral information determined based on whether to purchase the first stock at a second time and whether to sell the second stock at a second time. For example, the information generation unit 120 may generate behavioral information as 1 when the first stock is purchased at the second time and the second stock is sold at the second time, and the first stock is sold at the second time. If the second stock is not purchased and the second stock is not sold at the first time, that is, if no transaction is made, the second action information can be generated as 0.
실시예에 따르면, 정보 생성부(120)는 행동 정보를 시점 별로 생성할 수 있다. 예를 들어, 정보 생성부(120)는 행동 정보를 제1 주식 및 제2 주식의 거래가 가능한 시점별로 생성할 수 있다. According to the embodiment, the information generator 120 may generate behavioral information at each point in time. For example, the information generation unit 120 may generate behavioral information for each time point when the first stock and the second stock can be traded.
정보 생성부(120)는 시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성할 수 있다. 예를 들어, 정보 생성부(120)는 제1 주식에 관한 정보, 제2 주식에 관한 정보, 행동 정보를 종합적으로 고려하여 상태 정보를 생성할 수 있다. 다른 예를 들어, 정보 생성부(120)는 학습 횟수, 기간 등과 관련된 상태 정보, 즉 행동 정보와 관련되지 않은 상태 정보를 생성할 수 있다. The information generator 120 may generate status information related to behavior information at each point in time or related to a learning period. For example, the information generator 120 may generate status information by comprehensively considering information about the first stock, information about the second stock, and behavioral information. For another example, the information generator 120 may generate status information related to the number of learning times, period, etc., that is, status information not related to behavior information.
즉, 정보 생성부(120)는 정보 획득부(110)에서 획득한 정보를 학습하기 전에 전처리하는 모듈일 수 있다. That is, the information generation unit 120 may be a module that preprocesses the information acquired by the information acquisition unit 110 before learning it.
학습부(130)는 시점 별 제1 주식 및 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 시점 별 행동 정보 및 상태 정보에 기반한 알고리즘을 학습할 수 있다. 예를 들어, 학습부(130)는 인공 신경망에 기반하여 리워드가 최대가 되도록 알고리즘을 학습할 수 있다. 다른 예를 들어, 학습부(130)는 강화 학습(reinforcement learning)을 통해 알고리즘을 학습할 수 있다. 또 다른 예를 들어, 학습부(130)는 정보 생성부(120)에서 생성된 정보 및 시점 별 제1 주식 및 제2 주식에 관한 정보에 기반하여 리워드가 최대가 되도록 제1 주식 및 제2 주식의 매수 또는 매도에 관련된 알고리즘을 학습할 수 있다. The learning unit 130 may learn an algorithm based on behavioral information and state information at each time point to maximize the reward determined based on the prices of the first stock and the second stock at each time point. For example, the learning unit 130 may learn an algorithm to maximize rewards based on an artificial neural network. For another example, the learning unit 130 may learn an algorithm through reinforcement learning. For another example, the learning unit 130 generates the first and second stocks so that the reward is maximized based on the information generated by the information generation unit 120 and information about the first and second stocks at each point in time. You can learn algorithms related to buying or selling.
이와 같은 페어 트레이딩 학습 장치를 통해 서로 다른 제1 주식 및 제2 주식에 관련된 정보를 학습하기 전 전처리 할 수 있고, 리워드를 최대화할 수 있는 알고리즘을 학습 및 제공할 수 있다. Through this pair trading learning device, information related to different first and second stocks can be preprocessed before learning, and an algorithm that can maximize rewards can be learned and provided.
(실시예 2-2) 실시예 2-1에 있어서 행동 정보는 제1 시점에 생성되는 제1 행동 정보 및 제2 시점에 생성되는 제2 행동 정보를 포함할 수 있다. (Example 2-2) In Example 2-1, the behavior information may include first behavior information generated at a first time point and second behavior information generated at a second time point.
실시예에 따르면 제1 시점과 제2 시점은 동일 시점이 아니기 때문에, 제1 시점에 제1 주식이 공매도되는지 여부와, 제1 시점에 제2 주식이 되는지 여부에 기반하여 생성되는 제1 행동 정보와 제2 시점에 제1 주식이 매수되는지 여부와 제2 시점에 제2 주식이 매도되는지 여부에 기반하여 생성되는 제2 행동 정보는 실질적으로 행동 정보에 포함될 수 있다. 즉, 행동 정보는 서로 다른 시점(제1 시점 및 제2 시점)에 제1 주식 및 제2 주식의 거래와 관련된 제1 행동 정보와 제2 행동 정보를 포함할 수 있다. According to the embodiment, since the first time point and the second time point are not the same time point, the first action information is generated based on whether the first stock is sold short at the first time point and whether the second stock is sold short at the first time point. And the second behavioral information generated based on whether the first stock is purchased at the second time and whether the second stock is sold at the second time may be substantially included in the behavioral information. That is, the behavioral information may include first behavioral information and second behavioral information related to trading of the first stock and the second stock at different times (first time point and second time point).
(실시예 2-3) 실시예 2-1에 있어서, 정보 생성부(120)는 상기 제1 주식이 공매도되면서 상기 제2 주식이 매수되는 시점에는 상기 행동 정보를 행동이 발생함을 나타내는 값으로 생성하고, 상기 제1 주식이 매수되면서 상기 제2 주식이 매도되는 시점에는 상기 행동 정보를 행동이 발생함을 나타내는 값으로 생성하고, 상기 제1 주식 및 상기 제2 주식의 거래가 없는 시점에는 상기 행동 정보를 행동이 발생하지 않음을 나타내는 값으로 생성할 수 있다. (Example 2-3) In Example 2-1, the information generator 120 converts the action information into a value indicating that an action occurs at the time the first stock is sold short and the second stock is purchased. Generated, and when the first stock is purchased and the second stock is sold, the action information is generated as a value indicating that the action occurs, and at the time when there is no transaction of the first stock and the second stock, the action information is generated as a value indicating that the action occurs. Information can be generated as a value indicating that an action has not occurred.
정보 생성부(120)는 제1 주식이 공매도되면서 제2 주식이 매수되는 시점에는 행동 정보를 행동이 발생함을 나타내는 값(예를 들어, 1)으로 생성할 수 있다. 또한, 정보 생성부(120)는 제1 주식이 매수되면서 제2 주식이 매도되는 시점에는 행동 정보를 행동이 발생함을 나타내는 값(예를 들어, 1)으로 생성할 수 있다. The information generation unit 120 may generate behavioral information as a value (for example, 1) indicating that an action has occurred at a time when the first stock is sold short and the second stock is purchased. Additionally, the information generation unit 120 may generate behavioral information as a value (for example, 1) indicating that an action occurs at the time the first stock is purchased and the second stock is sold.
또한, 정보 생성부(120)는 제1 주식 및 제2 주식의 거래가 없는 시점에는 행동 정보를 행동이 발생하지 않음을 나타내는 값(예를 들어, 0)으로 생성할 수 있다. Additionally, the information generation unit 120 may generate behavioral information as a value (for example, 0) indicating that no behavior occurs at a time when there is no transaction of the first stock and the second stock.
(실시예 2-4) 실시예 2-1에 있어서 상기 제1 주식의 공매도와 상기 제2 주식의 매수는 동시에 발생하고, 상기 제1 주식의 매수와 상기 제2 주식의 매도는 동시에 발생할 수 있다. (Example 2-4) In Example 2-1, the short sale of the first stock and the purchase of the second stock may occur simultaneously, and the purchase of the first stock and the sale of the second stock may occur simultaneously. .
페어 트레이딩은 비슷한 주가 흐름을 갖는 제1 주식 및 제2 주식의 주가에 관하여 상대적으로 저평가된 주식을 매수하고, 동시에 고평가된 주식을 매도하는 통계적 차익 거래 전략이기 때문에, 제1 주식의 공매도와 제2 주식의 매수는 동시에 발생할 수 있고, 제1 주식의 매수와 제2 주식의 매도는 동시에 발생할 수 있다. Pair trading is a statistical arbitrage strategy that buys relatively undervalued stocks and sells overvalued stocks at the same time with respect to the stock prices of the first and second stocks with similar stock price trends, so short selling of the first stock and the second stock The purchase of stocks can occur simultaneously, and the purchase of the first stock and the sale of the second stock can occur simultaneously.
(실시예 2-5) 실시예 2-1에 있어서 제1 주식은 가치보다 높게 평가된 주식을 포함할 수 있고, 제2 주식은 가치보다 낮게 평가된 주식을 포함할 수 있다. (Example 2-5) In Example 2-1, the first stock may include stocks evaluated higher than its value, and the second stock may include stocks evaluated lower than its value.
(실시예 3-1) 실시예 2-1에 있어서, 상기 상태 정보는, 시점에 따른 상기 제1 주식과 상기 제2 주식의 총 거래 가격의 비율에 관련된 제1 상태 정보, 상기 제1 상태 정보의 변화량에 관련된 제2 상태 정보, 상기 제1 주식 또는 상기 제2 주식이 오픈 상태인지에 관련된 제3 상태 정보 및 오픈된 경우 오픈 상태로 변경된 시점의 거래 금액에 관련된 제4 상태 정보를 포함하고, 상기 오픈 상태는 상기 제1 주식이 공매도되고 상기 제2 주식이 매수된 상태일 수 있다. (Example 3-1) In Example 2-1, the state information includes first state information related to the ratio of the total transaction price of the first stock and the second stock according to the time point, and the first state information. It includes second state information related to the amount of change, third state information related to whether the first stock or the second stock is in an open state, and fourth state information related to the transaction amount at the time the first stock or the second stock is changed to the open state when open, The open state may be a state in which the first stock is sold short and the second stock is purchased.
상태 정보는 제1 상태 정보, 제2 상태 정보, 제3 상태 정보, 제4 상태 정보를 포함할 수 있다. 예를 들어, 제1 상태 정보는 시점에 따른 제1 주식과 제2 주식의 총 거래 가격의 비율에 관련된 정보일 수 있다. 제2 상태 정보는, 제1 상태 정보의 변화량에 관련된 정보일 수 있다. 제3 상태 정보는 제1 주식 또는 제2 주식이 오픈 상태인지에 관련된 정보일 수 있다. 제4 상태 정보는 오픈된 경우 오픈 상태로 변경된 시점의 거래 금액에 관련된 정보일 수 있다. State information may include first state information, second state information, third state information, and fourth state information. For example, the first status information may be information related to the ratio of the total transaction price of the first stock and the second stock according to the time point. The second state information may be information related to the amount of change in the first state information. The third state information may be information related to whether the first stock or the second stock is in an open state. The fourth state information may be information related to the transaction amount at the time the state is changed to open when open.
오픈 상태는 제1 주식이 공매도되고, 제2 주식이 매수된 상태일 수 있다. 오픈되지 않은 상태는 제1 주식이 공매도 후 특정 시점에서 다시 매수되고, 제2 주식이 매수 후 특정 시점에서 다시 매도된 상태일 수 있다. 또는, 오픈되지 않은 상태는 제1 주식이 공매도되기 전 및 제2 주식이 매수되기 전 상태일 수 있다. 즉, 오픈되지 않은 상태는 페어 트레이딩 진행 전 상태이고, 오픈된 상태는 페어 트레이딩이 진행되는 상태일 수 있다. The open state may be a state in which the first stock is sold short and the second stock is purchased. The unopened state may be a state in which the first stock is sold short and then repurchased at a specific point in time, and the second stock is purchased and then resold at a specific point in time. Alternatively, the unopened state may be the state before the first stock is sold short and before the second stock is purchased. That is, the unopened state may be a state before pair trading is in progress, and the open state may be a state in which pair trading is in progress.
실시예에 따르면, 오픈되지 않은 상태는 클로즈 상태로도 참조될 수 있다. 즉, 클로즈 상태는 오픈되지 않은 상태일 수 있다. According to an embodiment, an unopened state may also be referred to as a closed state. That is, the closed state may be a non-open state.
(실시예 3-2) 실시예 3-1에 있어서, 정보 생성부(120)는 제1 상태 정보를 [수학식 1]에 기반하여 생성할 수 있고, 제2 상태 정보를 [수학식 2]에 기반하여 생성할 수 있고, 제4 상태 정보를 [수학식 3]에 기반하여 생성할 수 있다. (Example 3-2) In Example 3-1, the information generator 120 may generate the first state information based on [Equation 1] and the second state information based on [Equation 2] It can be generated based on , and the fourth state information can be generated based on [Equation 3].
[수학식 1][Equation 1]
[수학식 2][Equation 2]
[수학식 3][Equation 3]
제1 상태 정보는 제1 주식의 가격을 제2 주식의 가격으로 나눈 정보일 수 있다. 즉, 제1 상태 정보는 제1 주식과 제2 주식의 가격의 비율에 기반하여 생성될 수 있다. The first state information may be information obtained by dividing the price of the first stock by the price of the second stock. That is, the first state information may be generated based on the ratio of the prices of the first stock and the second stock.
제2 상태 정보는 현재 시점의 제1 상태 정보와 이전 시점의 제1 상태 정보의 차이를 이전 시점의 제1 상태 정보로 나눈 값일 수 있다. 즉, 제2 상태 정보는 제1 상태 정보의 변화량에 관련된 정보로 생성될 수 있다. The second state information may be the difference between the first state information at the current time and the first state information at the previous time divided by the first state information at the previous time. That is, the second state information may be generated as information related to the amount of change in the first state information.
제3 상태 정보는 제1 주식 또는 제2 주식이 해당 시점에 오픈된 상태인 경우 1로 설정될 수 있고, 해당 시점에 오픈되지 않은 상태인 경우(클로즈 상태인 경우) 0으로 설정될 수 있다. The third state information may be set to 1 if the first stock or the second stock is in an open state at that time, and may be set to 0 if it is not open at that time (closed state).
제4 상태 정보는 매도 비용 상수와 오픈 시점의 제1 주식의 가격의 곱과 매수 비용 상수와 오픈 시점의 제2 주식의 가격의 곱의 차이일 수 있다. 즉, 제4 상태 정보는 제1 주식을 공매도하고 제2 주식을 매수하는 시점에 발생하는 비용일 수 있다. The fourth state information may be the difference between the product of the selling cost constant and the price of the first stock at the time of opening and the product of the buying cost constant and the price of the second stock at the time of opening. In other words, the fourth state information may be a cost incurred at the time of short selling the first stock and purchasing the second stock.
(실시예 3-3) 실시예 3-2에 있어서, 제1 주식의 가격과 제2 주식의 가격은 동일하게 맞춰질 수 있다. (Example 3-3) In Example 3-2, the price of the first stock and the price of the second stock can be set to be the same.
예를 들어, 제1 주식의 호가와 제2 주식의 호가의 차이가 존재하는 경우, 페어 트레이딩 학습 장치(100)는 공매도하는 제1 주식의 개수와 매수하는 제2 주식의 개수를 맞춰 공매도 하는 제1 주식의 가격과 매수하는 제2 주식의 가격을 맞출수 있다. For example, if there is a difference between the bid price of the first stock and the bid price of the second stock, the pair trading learning device 100 matches the number of first stocks to be sold short and the number of second stocks to be purchased. You can match the price of one stock with the price of the second stock you are purchasing.
실시예에 따르면, 페어 트레이딩 학습 장치(100)는 분할 매매를 통해 제1 주식 및 제2 주식의 거래 가격을 맞출 수 있다. According to the embodiment, the pair trading learning device 100 can match the trading prices of the first stock and the second stock through split trading.
(실시예 4-1) 실시예 2-1에 있어서, 상기 학습부(130)는 상기 제1 주식 및 상기 제2 주식의 매수, 매도에 따른 거래 비용을 고려하여 상리 리워드를 산출할 수 있다. (Example 4-1) In Example 2-1, the learning unit 130 may calculate a mutual reward by considering transaction costs resulting from the purchase and sale of the first stock and the second stock.
학습부(130)는 제1 주식 및 제2 주식의 매수, 매도에 따른 거래 비용을 고려하여 리워드를 산출할 수 있다. 예를 들어, 주식의 거래에 따른 거래 비용은 매수, 매도에 따라서 다를 수 있기 때문에, 학습부(130)는 제1 주식 및 제2 주식의 매수, 매도에 따른 거래 비용을 고려하여 리워드를 산출할 수 있다. The learning unit 130 may calculate the reward by considering transaction costs resulting from the purchase and sale of the first and second stocks. For example, since transaction costs due to stock trading may vary depending on buying and selling, the learning unit 130 calculates the reward by considering the transaction costs due to buying and selling the first and second stocks. You can.
(실시예 4-2) 실시예 4-1에 있어서, 매도 비용은 1-K이고, 매수 비용은 1+K이다. (Example 4-2) In Example 4-1, the selling cost is 1-K and the buying cost is 1+K.
주식 거래에서 매도하는 경우 수수료가 발생하여 매도하는 가격보다 적은 가격으로 매도되고, 매수하는 경우 수수료가 발생하여 매수하는 가격보다 큰 가격으로 매수되므로, 학습부(130)는 매도 비용을 1-K로 설정하고 매수 비용을 1+K로 설정할 수 있다. 예를 들어, K는 0.001일 수 있지만 이에 한정되지 않는다. When selling in stock trading, a commission is incurred and the sale is made at a lower price than the selling price, and when buying, a commission is incurred and the purchase is made at a higher price than the buying price. Therefore, the learning unit 130 sets the selling cost as 1-K. You can set the purchase cost to 1+K. For example, K may be 0.001, but is not limited thereto.
(실시예 5-1) 실시예 2-1에 있어서, 상기 학습부(130)는 상기 제1 주식 및 상기 제2 주식이 오픈되었다가 클로즈된 경우, 상기 리워드를 [수학식 4]에 기반하여 산출할 수 있다. (Example 5-1) In Example 2-1, the learning unit 130 calculates the reward based on [Equation 4] when the first stock and the second stock are opened and then closed. It can be calculated.
[수학식 4][Equation 4]
학습부(130)는 제1 주식 및 제2 주식이 오픈되었다가 클로즈된 경우 리워드를 [수학식 4]에 기반하여 산출할 수 있다. 예를 들어, 학습부(130)는 오픈 시점에 발생한 제1 비용과 클로즈 시점에 발생한 제2 비용을 합산한 값으로 리워드를 산출할 수 있다. 이 경우, 제1 비용은 매도 비용 상수와 오픈 시점 제1 주식 가격의 곱과 매수 비용 상수와 오픈 시점 제2 주식 가격의 곱과의 차이일 수 있고, 제2 비용은 매도 비용 상수와 클로즈 시점 제2 주식 가격의 곱과 매수 비용 상수와 클로즈 시점의 제1 주식 가격의 곱과의 차이일 수 있다. 즉, 제1 시점에는 제1 주식이 공매도되고 제2 주식이 매수되기 때문에 제1 비용은 로 산출될 수 있고, 제2 시점에는 제1 주식이 매수되고 제2 주식이 매도되기 때문에 제2 비용은 로 산출될 수 있다. The learning unit 130 may calculate the reward based on [Equation 4] when the first stock and the second stock are opened and then closed. For example, the learning unit 130 may calculate the reward as the sum of the first cost incurred at the time of opening and the second cost incurred at the time of closing. In this case, the first cost may be the difference between the selling cost constant and the first stock price at the time of opening and the product of the buying cost constant and the second stock price at the opening, and the second cost may be the difference between the selling cost constant and the first stock price at the closing time. 2 It may be the difference between the product of the stock price and the product of the purchase cost constant and the price of the first stock at the time of closing. That is, at the first point in time, the first stock is sold short and the second stock is purchased, so the first cost is It can be calculated as , and since the first stock is purchased and the second stock is sold at the second time, the second cost is It can be calculated as
(실시예 5-2) 실시예 5-1에 있어서, 학습부(130)는 리워드가 최대가 되도록 제1 주식 및 제2 주식의 거래 시점을 결정하는 알고리즘을 학습할 수 있다. (Example 5-2) In Example 5-1, the learning unit 130 may learn an algorithm for determining the trading timing of the first stock and the second stock so that the reward is maximized.
학습부(130)는 리워드가 최대가 되도록 행동 정보 및 상태 정보에 기반한 알고리즘을 학습할 수 있다. 예를 들어, 학습부(130)는 학습 기간 동안 매 시점 별로 행동 정보를 생성할 수 있고, 시점 별로 생성된 행동 정보는 리워드 탐색을 위한 랜덤 행동이거나, 현재 추정 총 리워드를 최대화하는 행동 중 어느 하나를 일정 비율을 정하여 수행하도록 할 수 있다.The learning unit 130 can learn an algorithm based on behavior information and state information to maximize rewards. For example, the learning unit 130 may generate behavior information at each time point during the learning period, and the behavior information generated at each time point is either a random action for reward search or an action that maximizes the currently estimated total reward. can be performed by setting a certain ratio.
(실시예 5-3) 실시예 5-2에 있어서, 일정 비율은 학습이 진행됨에 따라서 랜덤 행동이 선택되는 비율을 점차 감소시켜 추정된 총 리워드 함수를 최대화하는 방향으로 설정될 수 있다. (Example 5-3) In Example 5-2, a certain ratio can be set to maximize the estimated total reward function by gradually reducing the rate at which random actions are selected as learning progresses.
학습부(130)는 학습 기간 중 전반부에는 총 리워드 함수를 최대화하는 방향을 알 수 없으므로(학습이 진행되기 전이므로) 행동을 랜덤으로 선택하도록 하여 학습을 진행할 수 있고, 학습 기간 중 후반부에는 총 리워드 함수를 최대화 하는 방향이 학습된 이후이므로, 행동을 랜덤으로 선택하도록 하는 비율을 감소시키면서 학습을 진행할 수 있다. Since the learning unit 130 does not know the direction to maximize the total reward function in the first half of the learning period (since it is before learning begins), it can proceed with learning by randomly selecting actions, and in the second half of the learning period, the total reward function is unknown. Since the direction of maximizing the function has been learned, learning can proceed while reducing the rate of randomly selecting actions.
(실시예 5-4) 실시예 5-1에 있어서, 상기 학습부(130)는, Q-learning 또는 Double Q-learning에 기반하여 상기 알고리즘을 학습할 수 있다.(Example 5-4) In Example 5-1, the learning unit 130 may learn the algorithm based on Q-learning or Double Q-learning.
학습부(130)는 Q-learning 또는 Double Q-learning에 기반하여 알고리즘을 학습할 수 있다. 예를 들어, Q-learning은 상태 정보 및 행동 정보에 따른 보상 함수를 추정하는 학습 방법일 수 있다. 다른 예를 들어, Double Q-learning은 학습과 미래의 보상 반영을 위한 2개의 Q 함수를 구분하여 추정하는 학습 방법일 수 있다.The learning unit 130 can learn an algorithm based on Q-learning or Double Q-learning. For example, Q-learning may be a learning method that estimates a reward function according to state information and action information. For another example, Double Q-learning may be a learning method that separately estimates two Q functions for learning and reflecting future rewards.
실시예에 따르면, 학습부(130)는 총 리워드 추정을 위하여 상태 정보와 리워드를 입력 변수로 하여 Q-learning 또는 Double Q-learning으로 총 리워드 함수를 추정할 수 있다.According to the embodiment, the learning unit 130 may estimate the total reward function using Q-learning or Double Q-learning using status information and rewards as input variables to estimate the total reward.
(실시예 5-5) 실시예 5-1에 있어서, 상기 학습부(130)는, LSTM(Long Short Term Memory) 셀들을 포함하는 제1 레이어, 전결합 레이어(Fully Connected Layer)인 제2 레이어 및 행동을 결정하는 출력 레이어인 제3 레이어를 포함할 수 있다.(Example 5-5) In Example 5-1, the learning unit 130 includes a first layer including LSTM (Long Short Term Memory) cells, and a second layer that is a fully connected layer. And it may include a third layer, which is an output layer that determines the action.
학습부(130)는 LSTM(Long Short Term Memory) 셀들을 포함하는 제1 레이어, 전결합 레이어(Fully Connected Layer)인 제2 레이어 및 행동을 결정하는 출력 레이어인 제3 레이어를 포함할 수 있다. 또한, 학습부(130)는 제1 레이어, 제2 레이어 및 제3 레이어에 기반하여 알고리즘을 학습할 수 있다.The learning unit 130 may include a first layer including Long Short Term Memory (LSTM) cells, a second layer being a fully connected layer, and a third layer being an output layer that determines behavior. Additionally, the learning unit 130 may learn an algorithm based on the first layer, second layer, and third layer.
(실시예 6-1) 실시예 2-1에 있어서, 상기 학습된 알고리즘에 기반하여 미래 시점의 거래를 결정하는 거래 결정부(240)를 더 포함할 수 있다.(Example 6-1) In Example 2-1, a transaction decision unit 240 may be further included to determine a future transaction based on the learned algorithm.
도 2를 참조하면, 본 문서에 개시된 일 실시예에 따른 페어 트레이딩 학습 장치(200)는 정보 획득부(210), 정보 생성부(220), 학습부(230) 및 거래 결정부(240)를 포함할 수 있다. 실시예에 따르면, 정보 획득부(210), 정보 생성부(220) 및 학습부(230)는 각각 도 1의 정보 획득부(110). 정보 생성부(120) 및 학습부(130)와 실질적으로 동일할 수 있다.Referring to FIG. 2, the pair trading learning device 200 according to an embodiment disclosed in this document includes an information acquisition unit 210, an information generation unit 220, a learning unit 230, and a transaction decision unit 240. It can be included. According to the embodiment, the information acquisition unit 210, the information generation unit 220, and the learning unit 230 are each the information acquisition unit 110 of FIG. 1. It may be substantially the same as the information generation unit 120 and the learning unit 130.
거래 결정부(240)는 학습부(230)에서 학습된 알고리즘에 기반하여 미래 시점의 거래를 결정할 수 있다. 예를 들어, 학습부(230)는 리워드를 최대로 하도록 하는 알고리즘을 학습할 수 있고, 거래 결정부(240)는 학습된 알고리즘에 각각의 시점의 주식의 가격을 입력하여 제1 주식 및 제2 주식의 거래를 결정할 수 있다. The transaction decision unit 240 may determine a future transaction based on the algorithm learned in the learning unit 230. For example, the learning unit 230 can learn an algorithm that maximizes rewards, and the transaction decision unit 240 inputs the price of the stock at each time into the learned algorithm to determine the first stock and the second stock. You can decide to trade stocks.
도 3을 참조하면, 본 문서에 개시된 일 실시예에 따른 페어 트레이딩 학습 장치(200)는 2016년 데이터를 기준으로 학습할 수 있고, 2017년 데이터를 기준으로 평가를 수행할 수 있다. Referring to FIG. 3, the pair trading learning device 200 according to an embodiment disclosed in this document can learn based on 2016 data and perform evaluation based on 2017 data.
즉, 두개의 주식에 관련된 학습 데이터를 기초로 페어 트레이딩 학습 장치(200)는 페어 트레이딩과 관련된 알고리즘을 학습할 수 있고, 학습된 알고리즘을 기초로 미래의 페어 트레이딩 거래를 결정할 수 있으며, 이 경우 손해의 확률이 적은 페어 트레이딩 알고리즘이 생성될 수 있다. That is, based on learning data related to two stocks, the pair trading learning device 200 can learn an algorithm related to pair trading, and determine future pair trading transactions based on the learned algorithm, in which case there may be a loss. A pair trading algorithm with a low probability of can be created.
(실시예 6-2) 실시예 6-1에 있어서, 거래 결정부(240)는 학습부(230)에서 학습된 Q 함수를 추정하는 인공신경망을 기초로 운영 대상 기간 설정 및 매 시점 제1 주식 및 제2 주식에 관한 정보를 획득할 수 있고, 획득된 정보를 기반으로 Q 함수 추정의 입력 상태 정보를 생성하고, Q 함수에 기반하여 운영 기간 시점에 따라 행동을 선택하고, 행동 선택에 따른 상태 정보를 생성하여 거래를 결정할 수 있다. (Example 6-2) In Example 6-1, the transaction decision unit 240 sets the operation target period based on an artificial neural network that estimates the Q function learned in the learning unit 230 and selects the first stock at each time. and obtain information about the second stock, generate input state information for Q function estimation based on the obtained information, select an action according to the point of the operating period based on the Q function, and state according to the action selection. By generating information, you can decide on a transaction.
거래 결정부(240)는 운영 대상 기간을 설정하고 매 시점 제1 주식 및 제2 주식에 관한 정보를 기초로 학습부(230)에서 학습된 Q 함수를 추정하는 인공 신경망에 입력될 상태 정보를 생성할 수 있고, Q 함수에 기반하여 운영 기간 시점에 따른 행동을 선택(거래를 결정)할 수 있다. The transaction decision unit 240 sets an operation target period and generates state information to be input to an artificial neural network that estimates the Q function learned in the learning unit 230 based on information about the first stock and the second stock at each time. You can do this, and based on the Q function, you can select actions (determine transactions) according to the point of the operating period.
(실시예 6-3) 실시예 6-2에 있어서, 거래 결정부(240)는 학습부(230)에서 학습된 알고리즘을 일정 기간마다 업데이트할 수 있다. (Example 6-3) In Example 6-2, the transaction decision unit 240 may update the algorithm learned by the learning unit 230 at regular intervals.
실시예에 따르면, 거래 결정부(240)는 주식 가격의 시의성 및 최근 변동성을 반영하기 위하여 학습된 알고리즘을 일정 기간마다 업데이트할 수 있다. According to an embodiment, the transaction decision unit 240 may update the learned algorithm at regular intervals to reflect the timeliness and recent volatility of stock prices.
(실시예 7-1) 컴퓨터 프로그램은 실시예 1-1의 방법을 실행시키기 위하여 매체에 저장될 수 있다. (Example 7-1) A computer program can be stored in a medium to execute the method of Example 1-1.
본 발명의 명세서(특히 특허청구범위에서)에서 "상기"의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 본 발명에서 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 적용한 발명을 포함하는 것으로서(이에 반하는 기재가 없다면), 발명의 상세한 설명에 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 같다. In the specification (particularly in the claims) of the present invention, the use of the term “above” and similar referential terms may refer to both the singular and the plural. In addition, when a range is described in the present invention, the invention includes the application of individual values within the range (unless there is a statement to the contrary), and each individual value constituting the range is described in the detailed description of the invention. It's the same.
본 발명에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 발명이 한정되는 것은 아니다. 본 발명에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다. Unless there is an explicit order or statement to the contrary regarding the steps constituting the method according to the invention, the steps may be performed in any suitable order. The present invention is not necessarily limited by the order of description of the above steps. The use of any examples or illustrative terms (e.g., etc.) in the present invention is merely to describe the present invention in detail, and unless limited by the claims, the scope of the present invention is limited by the examples or illustrative terms. It doesn't work. Additionally, those skilled in the art will recognize that various modifications, combinations and changes may be made depending on design conditions and factors within the scope of the appended claims or their equivalents.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다Therefore, the spirit of the present invention should not be limited to the above-described embodiments, and the scope of the patent claims described below as well as all scopes equivalent to or equivalently changed from the scope of the claims are within the scope of the spirit of the present invention. It will be said to belong to
100, 200: 페어 트레이딩 학습 장치
110, 210: 정보 획득부
120, 220: 정보 생성부
130, 230: 학습부
240: 거래 결정부
410: 프로세서
420: 메모리
430: 통신 회로
440: 디스플레이100, 200: Pair Trading Learning Device
110, 210: Information acquisition department
120, 220: Information generation unit
130, 230: Learning Department
240: Transaction decision unit
410: processor
420: memory
430: communication circuit
440: display
Claims (13)
설정 기간 동안의 제1 주식에 관한 정보 및 상기 제1 주식과 상이한 제2 주식에 관한 정보를 획득하는 단계;
상기 제1 주식의 공매도 여부, 상기 제2 주식의 매수 여부, 상기 제1 주식의 매수 여부, 상기 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성하는 단계;
시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성하는 단계; 및
시점 별 상기 제1 주식 및 상기 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 상기 시점 별 행동 정보 및 상기 상태 정보에 기반한 알고리즘을 학습하는 단계; 를 포함하는 AI기반 주식 매매 방법.
In the AI-based stock trading method using a pair trading learning device,
acquiring information about a first stock during a set period and information about a second stock different from the first stock;
Generating behavioral information determined based on whether to sell the first stock short, whether to buy the second stock, whether to buy the first stock, and whether to sell the second stock at each point in time;
Generating state information related to behavioral information for each time point or related to a learning period; and
Learning an algorithm based on the behavior information and the state information for each time point to maximize rewards determined based on the prices of the first stock and the second stock for each time point; AI-based stock trading method including.
상기 페어 트레이딩 학습 장치는
설정 기간 동안의 제1 주식에 관한 정보 및 상기 제1 주식과 상이한 제2 주식에 관한 정보를 획득하는 정보 획득부;
상기 제1 주식의 공매도 여부, 상기 제2 주식의 매수 여부, 상기 제1 주식의 매수 여부, 상기 제2 주식의 매도 여부에 기반하여 결정되는 행동 정보를 시점 별로 생성하고,
시점 별 행동 정보와 관련되거나 학습 기간과 관련되는 상태 정보를 생성하는 정보 생성부; 및
시점 별 상기 제1 주식 및 상기 제2 주식의 가격에 기반하여 결정되는 리워드가 최대가 되도록 상기 시점 별 행동 정보 및 상기 상태 정보에 기반한 알고리즘을 학습하는 학습부; 를 포함하는 AI기반 주식 매매 방법
In claim 1,
The pair trading learning device is
an information acquisition unit that acquires information about a first stock during a set period and information about a second stock different from the first stock;
Generating behavioral information determined based on whether to sell the first stock short, whether to buy the second stock, whether to buy the first stock, and whether to sell the second stock at each point in time,
An information generation unit that generates status information related to behavioral information at each point in time or related to a learning period; and
a learning unit that learns an algorithm based on the behavior information and the state information for each time point to maximize rewards determined based on the prices of the first stock and the second stock for each time point; AI-based stock trading method including
상기 정보 생성부는,
상기 제1 주식이 공매도되면서 상기 제2 주식이 매수되는 시점에는 상기 행동 정보를 행동이 발생함을 나타내는 값으로 생성하고,
상기 제1 주식이 매수되면서 상기 제2 주식이 매도되는 시점에는 상기 행동 정보를 행동이 발생함을 나타내는 값으로 생성하고,
상기 제1 주식 및 상기 제2 주식의 거래가 없는 시점에는 상기 행동 정보를 행동이 발생하지 않음을 나타내는 값으로 생성하는, AI기반 주식 매매 방법.
In claim 2,
The information generator,
At the point when the first stock is sold short and the second stock is purchased, the action information is generated as a value indicating that an action has occurred,
At the point when the first stock is purchased and the second stock is sold, the behavioral information is generated as a value indicating that an action has occurred,
An AI-based stock trading method that generates the behavioral information as a value indicating that no behavior occurs at a time when there is no trading of the first stock and the second stock.
상기 제1 주식의 공매도와 상기 제2 주식의 매수가 발생하는 시점을 동일하고,
상기 제1 주식의 매수와 상기 제2 주식의 매도가 발생하는 시점은 동일한, AI기반 주식 매매 방법.
In claim 2,
The time at which the short sale of the first stock and the purchase of the second stock occur are the same,
An AI-based stock trading method in which the purchase of the first stock and the sale of the second stock occur at the same time.
상기 상태 정보는,
시점에 따른 상기 제1 주식과 상기 제2 주식의 총 거래 가격의 비율에 관련된 제1 상태 정보, 상기 제1 상태 정보의 변화량에 관련된 제2 상태 정보, 상기 제1 주식 또는 상기 제2 주식이 오픈 상태인지에 관련된 제3 상태 정보 및 오픈된 경우 오픈 상태로 변경된 시점의 거래 금액에 관련된 제4 상태 정보를 포함하고,
상기 오픈 상태는 상기 제1 주식이 공매도되고 상기 제2 주식이 매수된 상태인, AI기반 주식 매매 방법.
In claim 2,
The status information is,
First state information related to the ratio of the total transaction price of the first stock and the second stock according to the point in time, second state information related to the amount of change in the first state information, and the first stock or the second stock is opened Contains third state information related to whether the state is in the open state and, if open, fourth state information related to the transaction amount at the time the state was changed to the open state,
The open state is an AI-based stock trading method in which the first stock is sold short and the second stock is purchased.
상기 정보 생성부는,
상기 제1 상태 정보를 [수학식 1]에 기반하여 생성하고,
상기 제2 상태 정보를 [수학식 2]에 기반하여 생성하고,
상기 제4 상태 정보를 [수학식 3]에 기반하여 생성하는, AI기반 주식 매매 방법.
[수학식 1]
[수학식 2]
[수학식 3]
In claim 5,
The information generator,
The first state information is generated based on [Equation 1],
The second state information is generated based on [Equation 2],
An AI-based stock trading method that generates the fourth state information based on [Equation 3].
[Equation 1]
[Equation 2]
[Equation 3]
상기 학습부는, 상기 제1 주식 및 상기 제2 주식의 매수, 매도에 따른 거래 비용을 고려하여 상리 리워드를 산출하는, AI기반 주식 매매 방법.
In claim 2,
An AI-based stock trading method in which the learning unit calculates a mutual reward by considering transaction costs due to the purchase and sale of the first stock and the second stock.
상기 학습부는,
상기 제1 주식 및 상기 제2 주식이 오픈되었다가 클로즈된 경우, 상기 리워드를 [수학식 4]에 기반하여 산출하는, AI기반 주식 매매 방법.
[수학식 4]
In claim 2,
The learning department,
An AI-based stock trading method that calculates the reward based on [Equation 4] when the first stock and the second stock are opened and then closed.
[Equation 4]
상기 학습부는,
상기 리워드 및 상기 상태 정보를 입력 변수로 하는 Q-learning 또는 Double Q-learning에 기반하여 총 리워드 함수를 추정하도록 학습하는, AI기반 주식 매매 방법.
In claim 2,
The learning department,
An AI-based stock trading method that learns to estimate the total reward function based on Q-learning or Double Q-learning using the reward and the status information as input variables.
상기 학습부는,
LSTM(Long Short Term Memory) 셀들을 포함하는 제1 레이어;
전결합 레이어(Fully Connected Layer)인 제2 레이어; 및
행동을 결정하는 출력 레이어인 제3 레이어; 를 포함하는, AI기반 주식 매매 방법.
In claim 2,
The learning department,
A first layer including Long Short Term Memory (LSTM) cells;
A second layer, which is a fully connected layer; and
the third layer, which is the output layer that determines the action; Including, AI-based stock trading method.
상기 제1 주식은 가치보다 높게 평가된 주식을 포함하고,
상기 제2 주식은 가치보다 낮게 평가된 주식을 포함하는, AI기반 주식 매매 방법.
In claim 2,
The first stocks include stocks valued higher than their value,
The second stock is an AI-based stock trading method that includes stocks valued lower than their value.
상기 페어 트레이딩 학습 장치는
학습된 상기 알고리즘에 기반하여 미래 시점의 거래를 결정하는 거래 결정부; 를 더 포함하는 AI기반 주식 매매 방법.
In claim 2,
The pair trading learning device is
a transaction decision unit that determines future transactions based on the learned algorithm; AI-based stock trading method that further includes.
A computer program stored on a medium to execute the method of claim 1 using a computer
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220124095A KR20240044722A (en) | 2022-09-29 | 2022-09-29 | AI-based stock trading learning method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220124095A KR20240044722A (en) | 2022-09-29 | 2022-09-29 | AI-based stock trading learning method |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240044722A true KR20240044722A (en) | 2024-04-05 |
Family
ID=90714393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220124095A KR20240044722A (en) | 2022-09-29 | 2022-09-29 | AI-based stock trading learning method |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20240044722A (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190104919A (en) | 2019-07-11 | 2019-09-11 | 주식회사 리더스트레이딩 | Automatic stock trading system and method |
KR20210058171A (en) | 2019-11-13 | 2021-05-24 | 세종대학교산학협력단 | Automated deep learning studio for simplifying stock predictive deep learning models and parameter optimization |
KR20210061598A (en) | 2019-11-20 | 2021-05-28 | 세종대학교산학협력단 | Method and apparatus for deep learning-based stock screening and its use for advancing and automating portfolio management |
KR20210063767A (en) | 2019-11-25 | 2021-06-02 | (주)크래프트테크놀로지스 | Method for learning deep-learning model for stock trading |
-
2022
- 2022-09-29 KR KR1020220124095A patent/KR20240044722A/en unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190104919A (en) | 2019-07-11 | 2019-09-11 | 주식회사 리더스트레이딩 | Automatic stock trading system and method |
KR20210058171A (en) | 2019-11-13 | 2021-05-24 | 세종대학교산학협력단 | Automated deep learning studio for simplifying stock predictive deep learning models and parameter optimization |
KR20210061598A (en) | 2019-11-20 | 2021-05-28 | 세종대학교산학협력단 | Method and apparatus for deep learning-based stock screening and its use for advancing and automating portfolio management |
KR20210063767A (en) | 2019-11-25 | 2021-06-02 | (주)크래프트테크놀로지스 | Method for learning deep-learning model for stock trading |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | DeepTrader: a deep reinforcement learning approach for risk-return balanced portfolio management with market conditions Embedding | |
Acosta-González et al. | Predicting corporate financial failure using macroeconomic variables and accounting data | |
US20220027993A1 (en) | System and method for facilitating social trading | |
JP2024512076A (en) | Asset class backed tokenization platform | |
JP2023506739A (en) | METHOD AND SYSTEM FOR DETECTING MARGIN CALL FACTORS USING MACHINE LEARNING | |
Gupta et al. | H3O-LGBM: hybrid Harris hawk optimization based light gradient boosting machine model for real-time trading | |
Cao | [Retracted] Predicting the Link between Stock Prices and Indices with Machine Learning in R Programming Language | |
Venkateswararao et al. | LT-SMF: long term stock market price trend prediction using optimal hybrid machine learning technique | |
JP2024114987A (en) | Method and system for high frequency securities trading | |
Korczak et al. | Fundamental analysis in the multi-agent trading system | |
Boutyour et al. | Deep Reinforcement Learning in Financial Markets Context: Review and Open Challenges | |
Rajkar et al. | Stock market price prediction and analysis | |
US20230237575A1 (en) | Self-updating trading bot platform | |
Kirste et al. | How Automated Market Makers Approach the Thin Market Problem in Cryptoeocnomic Systems | |
US20200193486A1 (en) | System and method for determining bid vector transformed predictive click-through rate | |
JP2023155161A (en) | Method and system for highly frequent securities transaction | |
CN116664306A (en) | Intelligent recommendation method and device for wind control rules, electronic equipment and medium | |
KR20240044722A (en) | AI-based stock trading learning method | |
CN116739750A (en) | Lender default prediction method, lender default prediction device, lender default prediction equipment and lender default prediction medium | |
KR20240044759A (en) | Pair traiding learning apparatus | |
KR102374522B1 (en) | Exchange operation method and system for supporting transaction risk management | |
Viéitez et al. | Machine learning Ethereum cryptocurrency prediction and knowledge-based investment strategies | |
TW202207136A (en) | Stock price prediction method and server end for stock price prediction generating a plurality of single stock technical indexes relevant to the single stock according to a plurality of single stock prices relevant to the single stock | |
Corona-Bermudez et al. | On the Computation of Optimized Trading Policies Using Deep Reinforcement Learning | |
Sudhakar et al. | Optimizing parameters in algorithm trading using map reduce on Indian stock exchange (Sensex) |