KR20180066726A - Apparatus and method for estimating stock price - Google Patents

Apparatus and method for estimating stock price Download PDF

Info

Publication number
KR20180066726A
KR20180066726A KR1020160167896A KR20160167896A KR20180066726A KR 20180066726 A KR20180066726 A KR 20180066726A KR 1020160167896 A KR1020160167896 A KR 1020160167896A KR 20160167896 A KR20160167896 A KR 20160167896A KR 20180066726 A KR20180066726 A KR 20180066726A
Authority
KR
South Korea
Prior art keywords
stock
keyword
stock price
news
item
Prior art date
Application number
KR1020160167896A
Other languages
Korean (ko)
Other versions
KR101949794B1 (en
Inventor
이강우
권혜진
신현아
왕인내
최예송
Original Assignee
동국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 산학협력단 filed Critical 동국대학교 산학협력단
Priority to KR1020160167896A priority Critical patent/KR101949794B1/en
Publication of KR20180066726A publication Critical patent/KR20180066726A/en
Application granted granted Critical
Publication of KR101949794B1 publication Critical patent/KR101949794B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F17/27
    • G06F17/30861
    • G06F17/604
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

Disclosed are an apparatus and a method for predicting a stock price. According to an embodiment of the present invention, the apparatus comprises: a keyword extraction unit for extracting one or more keywords from news generated in relation to a stock market; a keyword dictionary construction unit for constructing a keyword dictionary indicating the correlation between the extracted keyword and a stock price of a corresponding stock item changed after the occurrence of the news; an interest item selection unit for selecting an interest item by using one or more stock price trend prediction indices calculated from each stock index from a plurality of stock items; and a stock price up and down prediction unit for predicting up and down of a stock price of an interested item by using keywords extracted from new news and the previously constructed keyword dictionary when the new news is generated in relation to the selected interested item.

Description

주가 예측 장치 및 방법{APPARATUS AND METHOD FOR ESTIMATING STOCK PRICE}[0001] APPARATUS AND METHOD FOR ESTIMATING STOCK PRICE [0002]

본 발명의 실시예들은 주가를 예측하는 기술에 관련된다.Embodiments of the present invention relate to techniques for predicting stock prices.

현대사회는 의학기술의 발전과 사회적 복지인프라의 발전으로 인해 100세 시대에 맞이하고 있다. 실제 보험회사에서는 110세까지 보장해주는 상품이 출시될 정도로 100세시대는 현실이 되었다. 하지만 빠른 산업화로 인해 새로운 일자리는 창출되지 않고있으며, 정년 또한 100세 시대에 걸맞지 않는게 현실이다. 앞으로 사회적 인프라가 과학기술의 발전을 따라가지 못한다면 이러한 현상은 더욱 고도화될 수 밖에 없다.Modern society is welcoming the age of 100 because of the development of medical technology and the development of social welfare infrastructure. In fact, the age of 100 has become a reality, as insurance companies are releasing products that guarantee up to 110 years of age. However, due to rapid industrialization, no new jobs are created, and it is a reality that does not fit the age of retirement and the age of 100. If the social infrastructure can not keep pace with the development of science and technology in the future, this phenomenon will become more sophisticated.

최근의 사회를 살아가는 개인은 스스로 100세 시대를 준비해야 하며, 최근 이러한 수요에 맞춰 여러 재테크 상품들이 출시되고 있다. 가장 보편적인 재테크 중 하나인 주식의 경우 과거에 비해 HTS, MTS와 같이 온라인 거래를 할 수 있게 됨으로써 개인 투자자들이 많이 늘어나고 있는 추세다. 하지만 주식은 기관과 같은 세력들에 비해 개인들은 정보가 늦고 자금력도 부족하며 투자기술자체도 떨어지기 때문에 오히려 마이너스 투자가 되는 경우가 많다.Individuals who are living in a recent society should prepare themselves for the age of 100, and various tech-tech products are being launched to meet these demands. In the case of stocks, which are one of the most popular financial technologies, the number of individual investors is increasing due to online transactions like HTS and MTS. However, stocks tend to be negative investors because they are slower in information, lack funding power, and have less investment technology than institutions such as institutions.

한국등록특허공보 제10-0836066호(2008.06.02)Korean Patent Registration No. 10-0836066 (2008.06.02)

본 발명의 실시예들은 주가의 등락을 정확하게 예측하기 위한 것이다.Embodiments of the present invention are intended to accurately predict fluctuations in stock prices.

본 발명의 예시적인 실시예에 따르면, 주식 시장과 관련하여 발생된 뉴스로부터 하나 이상의 키워드를 추출하는 키워드 추출부; 추출된 상기 키워드와 상기 뉴스의 발생 이후 변동된 해당 주식 종목의 주가 사이의 연관성을 나타내는 키워드 사전을 구축하는 키워드 사전 구축부; 복수의 주식 종목으로부터 각각의 주가 지수로부터 산출된 하나 이상의 주가 동향 예측 지표를 이용하여 관심 종목을 선정하는 관심 종목 선정부; 및 선정된 상기 관심 종목과 관련하여 새로운 뉴스가 발생한 경우, 상기 새로운 뉴스로부터 추출된 키워드 및 기 구축된 상기 키워드 사전을 이용하여 상기 관심 종목의 주가의 등락을 예측하는 주가 등락 예측부를 포함하는, 주가 예측 장치가 제공된다.According to an exemplary embodiment of the present invention, a keyword extracting unit extracts one or more keywords from news generated in connection with a stock market. A keyword dictionary construction unit for constructing a keyword dictionary indicating a relation between the extracted keyword and a stock price of a corresponding stock item changed after the occurrence of the news; An interest item selecting an item of interest using one or more stock price trend indicators calculated from each stock price index from a plurality of stock items; And a stock price fluctuation predicting unit for predicting fluctuation of the stock price of the item of interest using the keyword extracted from the new news and the pre-established keyword dictionary when new news is generated in relation to the selected item of interest, A prediction device is provided.

상기 키워드 사전 구축부는, 상기 새로운 뉴스로부터 추출된 키워드와 상기 새로운 뉴스의 발생에 의해 변동된 상기 관심 종목의 주가에 기초하여 상기 키워드 사전을 업데이트할 수 있다.The keyword dictionary construction unit may update the keyword dictionary based on the keyword extracted from the new news and the stock price of the interest item changed by the generation of the new news.

상기 키워드 추출부는, 상기 뉴스로부터 형태소 분석을 통해 상기 키워드를 추출할 수 있다.The keyword extracting unit may extract the keyword from morpheme analysis from the news.

상기 키워드 사전은, 하나 이상의 상기 키워드의 조합에 각각 대응되는 주가의 등락 결과를 포함할 수 있다.The keyword dictionary may include an up / down result of a stock price corresponding to each combination of one or more keywords.

상기 관심 종목 선정부는, 상기 주식 종목에 대해 서로 다른 유형의 주가 동향 예측 지표를 각각 산출하고, 설정된 수 이상의 주가 동향 예측 지표가 주가의 상승을 나타내는 주식 종목을 관심 종목으로 선정할 수 있다.The interest item selection unit may calculate different types of stock trend indicators for the stock items, and may select a stock item that indicates a rise in stock price index with a predetermined number or more of the stock trend indicators as an item of interest.

상기 주가 등락 예측부는, 상기 키워드 사전에서 상기 새로운 뉴스로부터 추출된 키워드의 조합에 대응되는 주가의 등락 결과에 따라 상기 주가의 등락을 예측할 수 있다.The stock price fluctuation predicting unit predicts the fluctuation of the stock price according to the fluctuation of stock price corresponding to the combination of the keywords extracted from the new news in the keyword dictionary.

상기 주가 등락 예측부는, 상기 키워드 사전 및 추출된 상기 제2 키워드의 조합으로부터 SVM(support vector machine)을 이용하여 상기 주가의 등락을 예측할 수 있다.The stock fluctuation predicting unit may predict the fluctuation of the stock price using a SVM (support vector machine) from the combination of the keyword dictionary and the extracted second keyword.

본 발명의 다른 예시적인 실시예에 따르면, 하나 이상의 프로세서들, 및 상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서, 주식 시장과 관련하여 발생된 뉴스로부터 하나 이상의 키워드를 추출하는 단계; 추출된 상기 키워드와 상기 뉴스의 발생 이후 변동된 해당 주식 종목의 주가 사이의 연관성을 나타내는 키워드 사전을 구축하는 단계; 복수의 주식 종목으로부터 각각의 주가 지수로부터 산출된 하나 이상의 주가 동향 예측 지표를 이용하여 관심 종목을 선정하는 단계; 및 선정된 상기 관심 종목과 관련하여 새로운 뉴스가 발생한 경우, 상기 새로운 뉴스로부터 추출된 키워드 및 기 구축된 상기 키워드 사전을 이용하여 상기 관심 종목의 주가의 등락을 예측하는 딘계를 포함하는, 주가 예측 방법이 제공된다.According to another exemplary embodiment of the present invention there is provided a method performed in a computing device having one or more processors and a memory storing one or more programs executed by the one or more processors, Extracting one or more keywords from the news; Constructing a keyword dictionary indicating a relation between the extracted keyword and a stock price of a corresponding stock item changed after the news is generated; Selecting an item of interest using at least one stock price trend index calculated from each stock index from a plurality of stock indexes; And a system for predicting a change in the stock price of the item of interest using the keyword extracted from the new news and the pre-established keyword dictionary when new news occurs in relation to the selected item of interest / RTI >

상기 구축하는 단계는, 상기 새로운 뉴스로부터 추출된 키워드와 상기 새로운 뉴스의 발생에 의해 변동된 상기 관심 종목의 주가에 기초하여 상기 키워드 사전을 업데이트하는 단계를 포함할 수 있다.The constructing step may include updating the keyword dictionary based on the keyword extracted from the new news and the stock price of the item of interest fluctuated by the occurrence of the new news.

상기 추출하는 단계는, 상기 뉴스로부터 형태소 분석을 통해 상기 키워드를 추출할 수 있다.The extracting may extract the keyword from morpheme analysis from the news.

상기 키워드 사전은, 하나 이상의 상기 키워드의 조합에 각각 대응되는 주가의 등락 결과를 포함할 수 있다.The keyword dictionary may include an up / down result of a stock price corresponding to each combination of one or more keywords.

상기 선정하는 단계는, 상기 주식 종목에 대해 서로 다른 유형의 주가 동향 예측 지표를 각각 산출하고, 설정된 수 이상의 주가 동향 예측 지표가 주가의 상승을 나타내는 주식 종목을 관심 종목으로 선정할 수 있다.The selecting step may calculate different types of stock trend indicators for the stock items, and may select a stock item showing an increase in the stock price index with a predetermined number or more of the stock trend indexes as the items of interest.

상기 예측하는 단계는, 상기 키워드 사전에서 상기 새로운 뉴스로부터 추출된 키워드의 조합에 대응되는 주가의 등락 결과에 따라 상기 주가의 등락을 예측할 수 있다.The predicting step may predict the fluctuation of the stock price in accordance with the result of the fluctuation of the stock price corresponding to the combination of the keywords extracted from the new news in the keyword dictionary.

상기 예측하는 단계는, 상기 키워드 사전 및 추출된 상기 제2 키워드의 조합으로부터 SVM(support vector machine)을 이용하여 상기 주가의 등락을 예측할 수 있다.The predicting step may predict the fluctuation of the stock price using a SVM (support vector machine) from the combination of the keyword dictionary and the extracted second keyword.

본 발명의 실시예들에 따르면, 1차적으로 관심 종목을 선정하고, 선정된 관심 종목들에 대해 구체적인 분석을 수행함으로써 주가 예측의 정확성을 향상시킬 수 있다. 또한, 관심 종목 선정부는 다수의 주식 종목 중에서 1차적으로 관심 종목을 선정함으로써 주식 종목 별 주가 예측에 소모되는 자원과 시간을 절약할 수 있다.According to the embodiments of the present invention, it is possible to improve the accuracy of stock price prediction by primarily selecting the stocks of interest and analyzing the selected stocks in detail. Also, by selecting the stocks of interest first among the stocks of interest, the stock selection department of interest can save resources and time consumed in stock price prediction by stocks.

도 1은 본 발명의 일 실시예에 따른 주가 예측 장치의 상세 구성을 나타낸 블록도
도 2는 본 발명의 일 실시예에 따른 주가 예측 방법을 설명하기 위한 흐름도
도 3은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경을 예시하여 설명하기 위한 블록도
1 is a block diagram showing a detailed configuration of a stock price prediction apparatus according to an embodiment of the present invention;
2 is a flowchart for explaining a stock price prediction method according to an embodiment of the present invention.
3 is a block diagram illustrating and illustrating a computing environment including a computing device suitable for use in the exemplary embodiments.

이하, 도면을 참조하여 본 발명의 구체적인 실시형태를 설명하기로 한다. 이하의 상세한 설명은 본 명세서에서 기술된 방법, 장치 및/또는 시스템에 대한 포괄적인 이해를 돕기 위해 제공된다. 그러나 이는 예시에 불과하며 본 발명은 이에 제한되지 않는다.Hereinafter, specific embodiments of the present invention will be described with reference to the drawings. The following detailed description is provided to provide a comprehensive understanding of the methods, apparatus, and / or systems described herein. However, this is merely an example and the present invention is not limited thereto.

본 발명의 실시예들을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 본 발명의 실시예들을 기술하기 위한 것이며, 결코 제한적이어서는 안 된다. 명확하게 달리 사용되지 않는 한, 단수 형태의 표현은 복수 형태의 의미를 포함한다. 본 설명에서, "포함" 또는 "구비"와 같은 표현은 어떤 특성들, 숫자들, 단계들, 동작들, 요소들, 이들의 일부 또는 조합을 가리키기 위한 것이며, 기술된 것 이외에 하나 또는 그 이상의 다른 특성, 숫자, 단계, 동작, 요소, 이들의 일부 또는 조합의 존재 또는 가능성을 배제하도록 해석되어서는 안 된다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description, well-known functions or constructions are not described in detail since they would obscure the invention in unnecessary detail. The following terms are defined in consideration of the functions of the present invention, and may be changed according to the intention or custom of the user, the operator, and the like. Therefore, the definition should be based on the contents throughout this specification. The terms used in the detailed description are intended only to describe embodiments of the invention and should in no way be limiting. Unless specifically stated otherwise, the singular form of a term includes plural forms of meaning. In this description, the expressions "comprising" or "comprising" are intended to indicate certain features, numbers, steps, operations, elements, parts or combinations thereof, Should not be construed to preclude the presence or possibility of other features, numbers, steps, operations, elements, portions or combinations thereof.

도 1은 본 발명의 일 실시예에 따른 주가 예측 장치(100)의 상세 구성을 나타낸 블록도이다. 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 주가 예측 장치(100)는 키워드 추출부(102), 키워드 사전 구축부(104), 관심 종목 선정부(106) 및 주가 등락 예측부(108)를 포함한다.1 is a block diagram showing a detailed configuration of a stock price prediction apparatus 100 according to an embodiment of the present invention. 1, a stock price prediction apparatus 100 according to an embodiment of the present invention includes a keyword extracting unit 102, a keyword dictionary construction unit 104, an interest item selection unit 106, (108).

키워드 추출부(102)는 주가의 등락 등과 연관된 뉴스로부터 키워드를 추출하기 위한 모듈이다. 일 실시예에 따르면, 키워드 추출부(102)는 주식 시장과 관련하여 기 발생된 뉴스로부터 하나 이상의 키워드를 추출할 수 있다. 뉴스는 증시 관련 웹 등으로부터 수집된 데이터으로서, 주식 종목의 주가에 영향을 미칠 수 있는 모든 정보를 의미한다. 증시 관련 웹은 언론사, 공중파 방송사, 케이블 방송사, 포털 사이트 뉴스, 금융사, 증시 관련 기관 등으로부터 제공되는 웹 페이지를 의미한다. 주식 종목은 주식 매매의 대상이 되는 항목을 의미한다. 예를 들어, 뉴스는 어느 기업의 합병, 인수, 신제품 출시 등과 관련될 수 있으나, 기업의 종류에는 특별히 한정되지 않는다. 또한, 키워드는 뉴스로부터 추출된 핵심 단어로서, 해당 주식 종목의 주가의 등락에 영향을 미칠 정도로 중요한 단어를 의미한다. 한편, 뉴스는 주식 시장에 크고 작은 영향을 미칠 수 있는 넓은 범위의 정보를 가리킨다. The keyword extracting unit 102 is a module for extracting keywords from news related to fluctuation of stock price or the like. According to one embodiment, the keyword extracting unit 102 may extract one or more keywords from the generated news related to the stock market. News is data collected from the stock market web, etc., and means all the information that can affect the stock price of stocks. Web sites related to the stock market refer to web pages provided by media companies, over-the-air broadcasting companies, cable broadcasting companies, portal site news, financial companies, and stock market related organizations. Stock items are items subject to stock trading. For example, news may relate to the merger, acquisition, or launch of a new company, but the type of company is not particularly limited. Also, the keyword is a key word extracted from the news, and it means a word that is important enough to affect the stock price fluctuation of the corresponding stock item. On the other hand, news refers to a wide range of information that can have a large and small impact on the stock market.

구체적으로, 키워드 추출부(102)는 설정된 기간(예를 들어, 최근 10년)동안 소셜 미디어, 증시 관련 웹 등에 개시된 뉴스를 크롤링(crawling)할 수 있다. 크롤링은 무수히 많은 컴퓨터에 분산 저장되어 있는 문서를 수집하여 검색 대상의 색인으로 포함시키는 기술이다. 또한, 키워드 추출부(102)는 크롤링된 상기 뉴스로부터 키워드를 추출할 수 있다. Specifically, the keyword extracting unit 102 may crawl news that has been started on a social media, a stock market related web, and the like for a set period (for example, the last 10 years). Crawling is a technology that collects documents that are stored on a large number of computers and includes them as an index to be searched. In addition, the keyword extracting unit 102 can extract a keyword from the crawled news.

일 실시예에 따르면, 키워드 추출부(102)는 형태소 분석을 통해 뉴스로부터 키워드를 추출할 수 있다. 구체적으로, 키워드 추출부(102)는 뉴스에 포함된 문장을 구성하는 단어들의 품사를 구분하고 상기 단어들 중 명사를 검출할 수 있다. 또한, 키워드 추출부(102)는 상기 명사 중 실제 주가의 등락과 관련된 키워드를 추출할 수 있다. 일 실시예에 따른 키워드 추출부(102)는 복합 명사가 검출된 경우, 상기 복합 명사 및 상기 복합 명사를 구성하는 복수의 명사 각각에 대해 키워드에 해당하는지 여부를 판단할 수 있다. 예를 들어, 뉴스에 '우리나라'라는 단어가 포함되어 있는 경우, 키워드 추출부(102)는 '우리나라'뿐만 아니라, '우리'와 '나라'에 대해서도 키워드로 추출할 수 있다.According to one embodiment, the keyword extracting unit 102 can extract a keyword from news through morphological analysis. Specifically, the keyword extracting unit 102 can distinguish parts of words constituting a sentence included in news and detect nouns among the words. In addition, the keyword extracting unit 102 can extract a keyword related to the change in the actual stock price among the nouns. The keyword extracting unit 102 according to an embodiment can determine whether the compound noun and the compound noun constitute a keyword for each of the plurality of nouns constituting the compound noun when a compound noun is detected. For example, if the news includes the word 'Korea', the keyword extraction unit 102 may extract not only 'Korea' but also 'us' and 'country' by keywords.

키워드 추출부(102)는 키워드뿐만 아니라, 상기 키워드가 포함되어 있는 뉴스가 발생 이후 주가의 변동 결과를 획득할 수 있다. 즉, 키워드 추출부(102)는 상기 뉴스가 해당 주식 종목에 미친 영향을 파악할 수 있다. 구체적으로, 키워드 추출부(102)는 뉴스가 발생된 이후, 상기 뉴스와 관련된 주식 종목의 주가가 증가하였는지, 감소하였는지, 또는 증가 또는 감소한 양은 어느 정도인지에 관한 정보를 획득할 수 있다. 예를 들어, 키워드 추출부(102)는 뉴스와 관련된 주식 종목의 시가, 고가, 저가, 종가, 호가, 체결 여부, 거래량, 거래 대금, 거래원, 상한가, 하한가, 신고가, 신저가 등을 수집할 수 있다. 한편, 키워드 추출부(102)는 회귀 분석 정규화 모델(예를 들어, Elastic Net, Lasso 정규화 방식, 능형 정규화 방식 등)을 이용하여 키워드를 추출할 수 있다. The keyword extracting unit 102 can obtain not only the keyword but also the result of the fluctuation of the stock price after the news including the keyword is generated. That is, the keyword extracting unit 102 can grasp the effect of the news on the stock item. Specifically, the keyword extracting unit 102 may obtain information on how much the stock price of the news item related to the news has increased, decreased, or increased or decreased after the news is generated. For example, the keyword extracting unit 102 may collect market prices, stock prices, high prices, low prices, close prices, quotations, contracts, transaction amounts, transaction prices, transaction sources, upper limit prices, lower limit prices, have. Meanwhile, the keyword extracting unit 102 may extract a keyword using a regression analysis normalization model (for example, Elastic Net, Lasso normalization method, rugged normalization method, or the like).

키워드 사전 구축부(104)는 과거에 발생한 뉴스로부터 키워드 사전을 구축하기 위한 모듈이다. 키워드 사전은 뉴스로부터 추출된 키워드와 상기 뉴스의 발생에 의해 변동된 해당 주식 종목의 주가 사이의 연관성을 나타내기 위한 것이다. 다시 말해, 키워드 사전은 키워드가 뉴스에 포함되어 있는 경우, 이러한 키워드가 주식 시장에 미칠 영향을 정리해 놓은 것이다. 일 실시예에 따르면, 키워드 사전은 하나 이상의 상기 키워드의 조합에 각각 대응되는 주가의 등락 결과를 포함할 수 있다. 표 1은 일 실시예에 따름 키워드 사전에 포함되는 내용을 나타낸 것이다.The keyword dictionary construction unit 104 is a module for building a keyword dictionary from news that has occurred in the past. The keyword dictionary is intended to indicate the relationship between the keyword extracted from the news and the stock price of the corresponding stock item changed by the occurrence of the news. In other words, the keyword dictionary lists the impact of these keywords on the stock market if the keywords are included in the news. According to one embodiment, the keyword dictionary may include an up / down result of a stock price corresponding to each combination of one or more of the keywords. Table 1 shows contents included in the keyword dictionary according to one embodiment.

[표 1][Table 1]

Figure pat00001
Figure pat00001

표 1에서 나타난 바와 같이, 키워드 사전은 복수의 키워드의 조합에 따른 주가의 등락 결과를 나타낸다. 예를 들어, 키워드 1, 키워드 3 및 키워드 5가 포함된 뉴스가 발생된 경우, 상기 뉴스와 관련된 주식 종목의 주가는 1만큼 증가하였다는 것을 나타낸다. 일 실시예에 따르면, 키워드 사전 구축부(104)는 주가 등락 결과에 대한 기여도에 따라 각각의 키워드에 가중치를 부여할 수 있다. 또한, 과거 발생한 뉴스가 주가에 미치는 영향은 당일에 나타날 수도 있지만 그 다음 날 나타날 수도 있으므로, 키워드 사전 구축부(104)는 뉴스가 발생한 다음날의 주가 및 그 다음날의 주가를 모두 고려하여 키워드 사전을 구축할 수 있다. 예를 들어, 키워드 사전 구축부(104)는 당일 및 다음날의 주가에 각각 0.3 및 0.7의 가중치를 부여하여 해당 주가의 등락 결과를 나타낼 수 있다.As shown in Table 1, the keyword dictionary shows the result of the fluctuation of the stock prices according to a combination of a plurality of keywords. For example, when news containing keyword 1, keyword 3, and keyword 5 is generated, it indicates that the stock price of the stock related to the news has increased by one. According to one embodiment, the keyword dictionary construction unit 104 may assign a weight to each keyword in accordance with the degree of contribution to the stock fluctuation result. In addition, since the effect of the news that occurred in the past on the stock price may appear on the same day but may appear the next day, the keyword dictionary construction unit 104 constructs a keyword dictionary considering both the stock price of the day after the news occurs and the stock price of the next day can do. For example, the keyword dictionary construction unit 104 may assign the weighted values of 0.3 and 0.7 to the stock price of the same day and the next day, respectively, so as to indicate the up / down results of the stock price.

또한, 키워드 사전 구축부(104)는 새로운 뉴스가 발생한 경우, 상기 새로운 뉴스로부터 추출된 키워드와 상기 새로운 뉴스의 발생에 의해 변동된 상기 관심 종목의 주가에 기초하여 상기 키워드 사전을 업데이트할 수 있다. 키워드 사전 업데이트부가 상기 키워드 사전을 업데이트하는 방법은 상술한 구축 과정과 동일하게 이루어질 수 있다. 즉, 키워드 사전 구축부(104)는 새롭게 수집된 정보를 미리 구축된 키워드 사전에 추가할 수 있다. 또한, 키워드 사전 구축부는 미리 구축된 키워드 사전을 삭제하고, 새롭게 수집된 뉴스 및 키워드를 기반으로 새로운 키워드 사전을 구축할 수도 있다.The keyword dictionary construction unit 104 may update the keyword dictionary based on the keyword extracted from the new news and the stock price of the interest item changed by the generation of the new news when new news occurs. The method for updating the keyword dictionary by the keyword dictionary update unit may be the same as the above-described construction process. That is, the keyword dictionary construction unit 104 can add the newly collected information to the keyword dictionary that is constructed in advance. In addition, the keyword dictionary construction unit may delete the keyword dictionary constructed in advance and build a new keyword dictionary based on the newly collected news and keywords.

관심 종목 선정부(106)는 무수히 많은 주식 종목 중 주가가 상승할 확률이 높은 주식 종목을 1차적으로 선별하기 위한 모듈이다. 일 실시예에 따르면, 관심 종목 선정부(106)는 복수의 주식 종목으로부터 각각의 주가 지수로부터 산출된 하나 이상(예를 들어, 4가지)의 주가 동향 예측 지표를 이용하여 관심 종목을 선정할 수 있다. 주가 지수(stock price index)는 주식 가격의 전반적인 움직임을 파악하기 위하여 작성하는 지수일 수 있다. 주가 동향 예측 지표는 주가이동평균선, MACD(moving average convergence and divergence), Signal9, Stochastic일 수 있다. The interest item selection section 106 is a module for primarily selecting stock items having a high probability of rising stock prices among a large number of stock items. According to one embodiment, the interested item selection unit 106 can select the item of interest using one or more (for example, four) stock price trend indicators calculated from each stock index from a plurality of stock items have. The stock price index can be an index that is created to understand the overall movement of the stock price. The stock price trend indicator can be the stock moving average, MACD (moving average convergence and divergence), Signal 9, or stochastic.

주가이동평균선은 일정기간 동안의 주가를 산술 평균한 값인 주가이동평균을 연결해 만든 선이다. MACD는 장단기 지수이동평균 간의 차이로, 12일 지수이동평균과 26일 지수이동평균을 사용한다. 즉, MACD = 12일 지수이동평균 ?? 26일 지수이동평균으로, 일반적으로 MACD선이 0을 돌파할 경우 상승신호로 여긴다. Signal 9은 MACD의 9일 지수이동평균선으로, 최근 MACD에 높은 가중치를 두어 계산하기 때문에 MACD보다 추세 트렌드를 더 잘 드러낸다. Stochastic은 종가가 일정기간 동안의 주가 변동폭 중 어디에 위치하는지를 관찰하기 위해 백분율로 나타낸 지표이다. 주가가 상승추세에 있을 때 종가는 최고가 부근에서 형성될 가능성이 높고, 하락 추세에 있을 때 종가는 최저가 부근에서 형성될 가능성이 높다는 것에 착안하여 만들어졌다. 일반적으로 Stochastic이 80이상일 경우 주가가 상승곡선을 그릴 것으로 예상한다.The stock price moving average line is a line connecting the stock moving average which is the arithmetic average of the stock price during a certain period. The MACD is the difference between short and long term exponential moving averages, using 12-day exponential moving average and 26-day exponential moving average. That is, MACD = 12-day exponential moving average ?? The 26-day exponential moving average is generally regarded as a rising signal when the MACD line crosses zero. Signal 9 is the 9-day exponential moving average of MACD, which shows trend trends better than MACD because it calculates the weighted MACD recently. The stochastic is a percentage indicator to see where the closing price is located in the stock price fluctuations over a period of time. When the share price is in an upward trend, the closing price is likely to be formed near the peak price, and when the price falls, the closing price is likely to be formed near the lowest price. In general, if the stochastic is above 80, the stock price is expected to rise.

일 실시예에 따르면, 관심 종목 선정부(106)는 상기 주식 종목에 대해 서로 다른 유형의 주가 동향 예측 지표를 각각 산출하고, 설정된 수 이상의 주가 동향 예측 지표가 주가의 상승을 나타내는 주식 종목을 관심 종목으로 선정할 수 있다. 구체적으로, 관심 종목 선정부(106)는 각각의 주가 동향 예측 지표가 주가의 상승을 예측하는지, 또는 하락을 예측하는지에 기초하여 관심 종목을 선정할 수 있다. 다시 말해, 관심 종목 선정부(106)는 복수의 주가 동향 예측 지표가 나타내는 등락 여부만을 이용하여 관심 종목을 선정할 수 있다. 예를 들어, 관심 종목 선정부(106)는 각각의 주식 종목에 대해 4 가지의 주가 동향 예측 지표를 산출하고, 2 가지 이상의 주가 동향 예측 지표가 주가의 상승을 예측하는 경우, 상기 주식 종목을 관심 종목으로 선정할 수 있다. 또한, 관심 종목 선정부(106)는 몇 가지의 주가 동향 예측 지표가 상승을 예측하는지를 기준으로 관심 종목을 다시 그룹핑할 수 있다.According to one embodiment, the interest item selection unit 106 calculates different types of stock trend indexes for the stocks, and the stock indexes indicating the upward trend of the stock price indexes with a predetermined number or more, . Specifically, the interested item selection unit 106 can select an item of interest based on whether each stock price tendency prediction indicator predicts a rise or a fall of the stock price. In other words, the interested item selection unit 106 can select an item of interest using only the fluctuation indicated by a plurality of stock price trend indicators. For example, the interest item selection unit 106 calculates four stock price trend indicators for each stock item, and if two or more stock price trend predictors predict a stock price increase, It can be selected as an item. In addition, the interest item selection unit 106 may re-group the items of interest based on whether some of the stock trend predictors predict a rise.

이와 같이, 관심 종목 선정부(106)는 다수의 주식 종목 중에서 1차적으로 관심 종목을 선정함으로써 주식 종목 별 주가 예측에 소모되는 자원과 시간을 절약할 수 있다.In this way, the interested item selection unit 106 can save resources and time consumed in predicting the stock price of each stock item by primarily selecting the items of interest among the plurality of stock items.

주가 등락 예측부(108)는 1차적으로 선별된 관심 종목 각각에 대하여 세부적으로 주가 등락을 예측하기 위한 모듈이다. 일 실시예에 따르면, 선정된 상기 관심 종목과 관련하여 새로운 뉴스가 발생한 경우, 상기 새로운 뉴스로부터 추출된 키워드 및 기 구축된 상기 키워드 사전을 이용하여 상기 관심 종목의 주가의 등락을 예측할 수 있다. 새로운 뉴스는 키워드 사전이 구축 또는 업데이트된 이후 발생한 뉴스를 가리킨다. 즉, 새로운 뉴스에 포함된 키워드는 키워드 사전에 아직 반영되지 않은 키워드일 수 있다. The stock price fluctuation predicting unit 108 is a module for predicting stock price fluctuations in detail for each of the primary stocks of interest. According to an embodiment, when new news is generated in relation to the selected interest item, the fluctuation of the stock price of the item of interest can be predicted using the keyword extracted from the new news and the pre-built keyword dictionary. New news refers to news that has occurred since the keyword dictionary was built or updated. That is, the keywords included in the new news may be keywords that have not yet been reflected in the keyword dictionary.

구체적으로, 상기 관심 종목과 관련된 새로운 뉴스가 발생한 경우, 키워드 추출부(102)는 상기 새로운 뉴스로부터 상술한 방법과 같이 키워드를 추출할 수 있다. 이후, 주가 등락 예측부(108)는 상기 새로운 뉴스로부터 추출된 키워드 및 미리 구축된 키워드 사전을 이용하여 상기 관심 종목의 주가의 등락을 예측할 수 있다. 주가의 등락을 예측한다는 것은 주가가 증가 또는 감소하는지 여부뿐만 아니라, 증가 또는 감소하는 정도도 예측한다는 것을 의미할 수 있다. 일 실시예에 따르면, 주가 등락 예측부(108)는 상기 키워드 사전에서 상기 새로운 뉴스로부터 추출된 키워드의 조합에 대응되는 주가의 등락 결과에 따라 상기 주가의 등락을 예측할 수 있다. 예를 들어, 새로운 뉴스로부터 키워드 1, 키워드 3 및 키워드 5가 추출된 경우, 주가 등락 예측부(108)는 해당 관심 종목의 주가는 1만큼 증가하는 것으로 예측할 수 있다.Specifically, when new news related to the item of interest occurs, the keyword extracting unit 102 can extract keywords from the new news as described above. The stock price fluctuation predicting unit 108 can predict the fluctuation of the stock price of the interested stock using the keyword extracted from the new news and the keyword dictionary constructed in advance. Predicting stock price volatility may mean not only whether the stock price is increasing or decreasing but also forecasting the increase or decrease. According to an embodiment, the stock price fluctuation predicting unit 108 can predict the fluctuation of the stock price in accordance with the result of the fluctuation of the stock price corresponding to the combination of the keywords extracted from the new news in the keyword dictionary. For example, when keyword 1, keyword 3, and keyword 5 are extracted from new news, the stock fluctuation predicting unit 108 can predict that the share price of the interested stock increases by one.

한편, 주가 등락 예측부(108)는 상기 키워드 사전 및 추출된 상기 제2 키워드의 조합으로부터 SVM(support vector machine)을 이용하여 상기 주가의 등락을 예측할 수 있다. On the other hand, the stock fluctuation predicting unit 108 can predict the fluctuation of the stock price using a SVM (support vector machine) from the combination of the keyword dictionary and the extracted second keyword.

본 발명의 실시예들에 따르면, 1차적으로 관심 종목을 선정하고, 선정된 관심 종목들에 대해 구체적인 분석을 수행함으로써 주가 예측의 정확성을 향상시킬 수 있다. According to the embodiments of the present invention, it is possible to improve the accuracy of stock price prediction by primarily selecting the stocks of interest and analyzing the selected stocks in detail.

도 2는 본 발명의 일 실시예에 따른 주가 예측 방법(200)을 설명하기 위한 흐름도이다. 도 2에 도시된 방법은 예를 들어, 전술한 주가 예측 장치(100)에 의해 수행될 수 있다. 도시된 흐름도에서는 상기 방법을 복수 개의 단계로 나누어 기재하였으나, 적어도 일부의 단계들은 순서를 바꾸어 수행되거나, 다른 단계와 결합되어 함께 수행되거나, 생략되거나, 세부 단계들로 나뉘어 수행되거나, 또는 도시되지 않은 하나 이상의 단계가 부가되어 수행될 수 있다.FIG. 2 is a flowchart for explaining a stock price prediction method 200 according to an embodiment of the present invention. The method shown in FIG. 2 can be performed, for example, by the above-described stock prediction apparatus 100. FIG. In the illustrated flow chart, the method is described as being divided into a plurality of steps, but at least some of the steps may be performed in reverse order, combined with other steps, performed together, omitted, divided into detailed steps, One or more steps may be added and performed.

키워드 추출부(102)는 주식 시장과 관련하여 발생된 뉴스로부터 하나 이상의 키워드를 추출할 수 있다(S202). 일 실시예에 따르면, 키워드 추출부(102)는 상기 뉴스로부터 형태소 분석을 통해 상기 키워드를 추출할 수 있다.The keyword extracting unit 102 may extract one or more keywords from the news generated in connection with the stock market (S202). According to one embodiment, the keyword extracting unit 102 may extract the keyword from morpheme analysis from the news.

키워드 사전 구축부(104)는 추출된 상기 키워드와 상기 뉴스의 발생에 의해 변동된 해당 주식 종목의 주가 사이의 연관성을 나타내는 키워드 사전을 구축할 수 있다(S204). 키워드 사전은, 하나 이상의 상기 키워드의 조합에 각각 대응되는 주가의 등락 결과를 포함할 수 있다. 또한, 키워드 사전 구축부(104)는 새로운 뉴스로부터 추출된 키워드와 상기 새로운 뉴스의 발생에 의해 변동된 상기 관심 종목의 주가에 기초하여 상기 키워드 사전을 업데이트할 수 있다.The keyword dictionary construction unit 104 may construct a keyword dictionary indicating a correlation between the extracted keyword and the stock price of the corresponding stock item changed by the occurrence of the news (S204). The keyword dictionary may include an up / down result of a stock price corresponding to each combination of one or more of the keywords. Also, the keyword dictionary construction unit 104 can update the keyword dictionary based on the keywords extracted from the new news and the stock price of the interest item changed by the generation of the new news.

관심 종목 선정부(106)는 복수의 주식 종목으로부터 각각의 주가의 등락을 예측하는 하나 이상의 주가 동향 예측 지표를 이용하여 관심 종목을 선정할 수 있다(S206). 일 실시예에 따르면, 관심 종목 선정부(106)는 상기 주식 종목에 대해 서로 다른 유형의 주가 동향 예측 지표를 각각 산출하고, 설정된 수 이상의 주가 동향 예측 지표가 주가의 상승을 나타내는 주식 종목을 관심 종목으로 선정할 수 있다. The interested item selection unit 106 may select an item of interest using one or more stock price trend indicators that predict the fluctuation of each stock price from a plurality of stock items (S206). According to one embodiment, the interest item selection unit 106 calculates different types of stock trend indexes for the stocks, and the stock indexes indicating the upward trend of the stock price indexes with a predetermined number or more, .

주가 등락 예측부(108)는 선정된 상기 관심 종목과 관련하여 새로운 뉴스가 발생한 경우, 상기 새로운 뉴스로부터 추출된 키워드 및 기 구축된 상기 키워드 사전을 이용하여 상기 관심 종목의 주가의 등락을 예측할 수 있다(S208). 일 실시예에 따르면, 주가 등락 예측부(108)는 상기 키워드 사전에서 상기 새로운 뉴스로부터 추출된 키워드의 조합에 대응되는 주가의 등락 결과에 따라 상기 주가의 등락을 예측할 수 있다. 또한, 주가 등락 예측부(108)는 상기 키워드 사전 및 추출된 상기 제2 키워드의 조합으로부터 SVM(support vector machine)을 이용하여 상기 주가의 등락을 예측할 수 있다. The stock price fluctuation predicting unit 108 predicts the fluctuation of the stock price of the interested stock using the keyword extracted from the new news and the pre-established keyword dictionary when new news is generated in relation to the selected interested stock (S208). According to an embodiment, the stock price fluctuation predicting unit 108 can predict the fluctuation of the stock price in accordance with the result of the fluctuation of the stock price corresponding to the combination of the keywords extracted from the new news in the keyword dictionary. Also, the stock fluctuation predicting unit 108 can predict the fluctuation of the stock price using a SVM (support vector machine) from the combination of the keyword dictionary and the extracted second keyword.

도 3은 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경(10)을 예시하여 설명하기 위한 블록도이다. 도시된 실시예에서, 각 컴포넌트들은 이하에 기술된 것 이외에 상이한 기능 및 능력을 가질 수 있고, 이하에 기술되지 것 이외에도 추가적인 컴포넌트를 포함할 수 있다.3 is a block diagram illustrating and illustrating a computing environment 10 that includes a computing device suitable for use in the exemplary embodiments. In the illustrated embodiment, each of the components may have different functions and capabilities than those described below, and may include additional components in addition to those described below.

도시된 컴퓨팅 환경(10)은 컴퓨팅 장치(12)를 포함한다. 일 실시예에서, 컴퓨팅 장치(12)는 주가 예측 장치(100)일 수 있다. The illustrated computing environment 10 includes a computing device 12. In one embodiment, the computing device 12 may be a stock prediction device 100.

컴퓨팅 장치(12)는 적어도 하나의 프로세서(14), 컴퓨터 판독 가능 저장 매체(16) 및 통신 버스(18)를 포함한다. 프로세서(14)는 컴퓨팅 장치(12)로 하여금 앞서 언급된 예시적인 실시예에 따라 동작하도록 할 수 있다. 예컨대, 프로세서(14)는 컴퓨터 판독 가능 저장 매체(16)에 저장된 하나 이상의 프로그램들을 실행할 수 있다. 상기 하나 이상의 프로그램들은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 상기 컴퓨터 실행 가능 명령어는 프로세서(14)에 의해 실행되는 경우 컴퓨팅 장치(12)로 하여금 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있다.The computing device 12 includes at least one processor 14, a computer readable storage medium 16, The processor 14 may cause the computing device 12 to operate in accordance with the exemplary embodiment discussed above. For example, processor 14 may execute one or more programs stored on computer readable storage medium 16. The one or more programs may include one or more computer-executable instructions, which when executed by the processor 14 cause the computing device 12 to perform operations in accordance with the illustrative embodiment .

컴퓨터 판독 가능 저장 매체(16)는 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능 저장 매체(16)에 저장된 프로그램(20)은 프로세서(14)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독 가능 저장 매체(16)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 컴퓨팅 장치(12)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.The computer-readable storage medium 16 is configured to store computer-executable instructions or program code, program data, and / or other suitable forms of information. The program 20 stored in the computer-readable storage medium 16 includes a set of instructions executable by the processor 14. In one embodiment, the computer-readable storage medium 16 may be any type of storage medium such as a memory (volatile memory such as random access memory, non-volatile memory, or any suitable combination thereof), one or more magnetic disk storage devices, Memory devices, or any other form of storage medium that can be accessed by the computing device 12 and store the desired information, or any suitable combination thereof.

통신 버스(18)는 프로세서(14), 컴퓨터 판독 가능 저장 매체(16)를 포함하여 컴퓨팅 장치(12)의 다른 다양한 컴포넌트들을 상호 연결한다.Communication bus 18 interconnects various other components of computing device 12, including processor 14, computer readable storage medium 16.

컴퓨팅 장치(12)는 또한 하나 이상의 입출력 장치(24)를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(22) 및 하나 이상의 네트워크 통신 인터페이스(26)를 포함할 수 있다. 입출력 인터페이스(22) 및 네트워크 통신 인터페이스(26)는 통신 버스(18)에 연결된다. 입출력 장치(24)는 입출력 인터페이스(22)를 통해 컴퓨팅 장치(12)의 다른 컴포넌트들에 연결될 수 있다. 예시적인 입출력 장치(24)는 포인팅 장치(마우스 또는 트랙패드 등), 키보드, 터치 입력 장치(터치패드 또는 터치스크린 등), 음성 또는 소리 입력 장치, 다양한 종류의 센서 장치 및/또는 촬영 장치와 같은 입력 장치, 및/또는 디스플레이 장치, 프린터, 스피커 및/또는 네트워크 카드와 같은 출력 장치를 포함할 수 있다. 예시적인 입출력 장치(24)는 컴퓨팅 장치(12)를 구성하는 일 컴포넌트로서 컴퓨팅 장치(12)의 내부에 포함될 수도 있고, 컴퓨팅 장치(12)와는 구별되는 별개의 장치로 컴퓨팅 장치(102)와 연결될 수도 있다.The computing device 12 may also include one or more input / output interfaces 22 and one or more network communication interfaces 26 that provide an interface for one or more input / output devices 24. The input / output interface 22 and the network communication interface 26 are connected to the communication bus 18. The input / output device 24 may be connected to other components of the computing device 12 via the input / output interface 22. The exemplary input and output device 24 may be any type of device, such as a pointing device (such as a mouse or trackpad), a keyboard, a touch input device (such as a touch pad or touch screen), a voice or sound input device, An input device, and / or an output device such as a display device, a printer, a speaker, and / or a network card. The exemplary input and output device 24 may be included within the computing device 12 as a component of the computing device 12 and may be coupled to the computing device 102 as a separate device distinct from the computing device 12 It is possible.

이상에서 본 발명의 대표적인 실시예들을 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, . Therefore, the scope of the present invention should not be limited to the above-described embodiments, but should be determined by equivalents to the appended claims, as well as the appended claims.

100: 주가 예측 장치
102: 키워드 추출부
104: 키워드 사전 구축부
106: 관심 종목 선정부
108: 주가 등락 예측부
100: stock price prediction device
102: Keyword extracting unit
104: Keyword dictionary construction unit
106: Interested item selection
108: Stock price fluctuation predicting section

Claims (14)

주식 시장과 관련하여 발생된 뉴스로부터 하나 이상의 키워드를 추출하는 키워드 추출부;
추출된 상기 키워드와 상기 뉴스의 발생 이후 변동된 해당 주식 종목의 주가 사이의 연관성을 나타내는 키워드 사전을 구축하는 키워드 사전 구축부;
복수의 주식 종목으로부터 각각의 주가 지수로부터 산출된 하나 이상의 주가 동향 예측 지표를 이용하여 관심 종목을 선정하는 관심 종목 선정부; 및
선정된 상기 관심 종목과 관련하여 새로운 뉴스가 발생한 경우, 상기 새로운 뉴스로부터 추출된 키워드 및 기 구축된 상기 키워드 사전을 이용하여 상기 관심 종목의 주가의 등락을 예측하는 주가 등락 예측부를 포함하는, 주가 예측 장치.
A keyword extracting unit for extracting one or more keywords from the news generated in connection with the stock market;
A keyword dictionary construction unit for constructing a keyword dictionary indicating a relation between the extracted keyword and a stock price of a corresponding stock item changed after the occurrence of the news;
An interest item selecting an item of interest using one or more stock price trend indicators calculated from each stock price index from a plurality of stock items; And
And a stock price fluctuation predicting unit for predicting fluctuation of the stock price of the item of interest using the keyword extracted from the new news and the pre-established keyword dictionary when new news is generated in relation to the selected interest item, Device.
청구항 1에 있어서,
상기 키워드 사전 구축부는, 상기 새로운 뉴스로부터 추출된 키워드와 상기 새로운 뉴스의 발생에 의해 변동된 상기 관심 종목의 주가에 기초하여 상기 키워드 사전을 업데이트하는, 주가 예측 장치.
The method according to claim 1,
Wherein the keyword dictionary construction unit updates the keyword dictionary based on a keyword extracted from the new news and a stock price of the interest item changed by the generation of the new news.
청구항 1에 있어서,
상기 키워드 추출부는, 상기 뉴스로부터 형태소 분석을 통해 상기 키워드를 추출하는, 주가 예측 장치.
The method according to claim 1,
Wherein the keyword extracting unit extracts the keyword from morpheme analysis from the news.
청구항 1에 있어서,
상기 키워드 사전은, 하나 이상의 상기 키워드의 조합에 각각 대응되는 주가의 등락 결과를 포함하는, 주가 예측 장치.
The method according to claim 1,
Wherein the keyword dictionary includes an up-shift result of a stock price corresponding to each combination of one or more keywords.
청구항 1에 있어서,
상기 관심 종목 선정부는, 상기 주식 종목에 대해 서로 다른 유형의 주가 동향 예측 지표를 각각 산출하고, 설정된 수 이상의 주가 동향 예측 지표가 주가의 상승을 나타내는 주식 종목을 관심 종목으로 선정하는, 주가 예측 장치.
The method according to claim 1,
Wherein the interest item selection unit calculates different types of stock trend indicators for the stock items and selects a stock item showing an increase in the stock price as a stock item of interest with a predetermined number or more of the stock trend predictions.
청구항 1에 있어서,
상기 주가 등락 예측부는, 상기 키워드 사전에서 상기 새로운 뉴스로부터 추출된 키워드의 조합에 대응되는 주가의 등락 결과에 따라 상기 주가의 등락을 예측하는, 주가 예측 장치.
The method according to claim 1,
Wherein the stock price fluctuation predicting unit predicts the fluctuation of the stock price in accordance with a result of fluctuation of stock price corresponding to a combination of keywords extracted from the new news in the keyword dictionary.
청구항 1에 있어서,
상기 주가 등락 예측부는, 상기 키워드 사전 및 추출된 상기 제2 키워드의 조합으로부터 SVM(support vector machine)을 이용하여 상기 주가의 등락을 예측하는, 주가 예측 장치.
The method according to claim 1,
Wherein the stock price fluctuation predicting unit predicts the fluctuation of the stock price using a SVM (support vector machine) from the combination of the keyword dictionary and the extracted second keyword.
하나 이상의 프로세서들, 및
상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서,
주식 시장과 관련하여 발생된 뉴스로부터 하나 이상의 키워드를 추출하는 단계;
추출된 상기 키워드와 상기 뉴스의 발생 이후 변동된 해당 주식 종목의 주가 사이의 연관성을 나타내는 키워드 사전을 구축하는 단계;
복수의 주식 종목으로부터 각각의 주가 지수로부터 산출된 하나 이상의 주가 동향 예측 지표를 이용하여 관심 종목을 선정하는 단계; 및
선정된 상기 관심 종목과 관련하여 새로운 뉴스가 발생한 경우, 상기 새로운 뉴스로부터 추출된 키워드 및 기 구축된 상기 키워드 사전을 이용하여 상기 관심 종목의 주가의 등락을 예측하는 딘계를 포함하는, 주가 예측 방법.
One or more processors, and
A method performed in a computing device having a memory storing one or more programs executed by the one or more processors,
Extracting one or more keywords from the news generated in connection with the stock market;
Constructing a keyword dictionary indicating a relation between the extracted keyword and a stock price of a corresponding stock item changed after the news is generated;
Selecting an item of interest using at least one stock price trend index calculated from each stock index from a plurality of stock indexes; And
And a forecasting unit for predicting a change in stock price of the item of interest using the keyword extracted from the new news and the pre-built keyword dictionary when new news occurs related to the selected interest item.
청구항 8에 있어서,
상기 구축하는 단계는, 상기 새로운 뉴스로부터 추출된 키워드와 상기 새로운 뉴스의 발생에 의해 변동된 상기 관심 종목의 주가에 기초하여 상기 키워드 사전을 업데이트하는 단계를 포함하는, 주가 예측 방법.
The method of claim 8,
Wherein the constructing step includes the step of updating the keyword dictionary based on a keyword extracted from the new news and a stock price of the item of interest fluctuated by the generation of the new news.
청구항 8에 있어서,
상기 추출하는 단계는, 상기 뉴스로부터 형태소 분석을 통해 상기 키워드를 추출하는, 주가 예측 방법.
The method of claim 8,
Wherein the extracting step extracts the keyword through morphological analysis from the news.
청구항 8에 있어서,
상기 키워드 사전은, 하나 이상의 상기 키워드의 조합에 각각 대응되는 주가의 등락 결과를 포함하는, 주가 예측 방법.
The method of claim 8,
Wherein the keyword dictionary includes an up / down result of a stock price corresponding to each combination of one or more keywords.
청구항 8에 있어서,
상기 선정하는 단계는, 상기 주식 종목에 대해 서로 다른 유형의 주가 동향 예측 지표를 각각 산출하고, 설정된 수 이상의 주가 동향 예측 지표가 주가의 상승을 나타내는 주식 종목을 관심 종목으로 선정하는, 주가 예측 방법.
The method of claim 8,
Wherein the selecting step calculates each of the different types of stock trend predictive indexes for the stock stock and selects the stock stocks in which the stock trend predictive index with a predetermined number or more indicates the increase in stock price as the stock of interest.
청구항 8에 있어서,
상기 예측하는 단계는, 상기 키워드 사전에서 상기 새로운 뉴스로부터 추출된 키워드의 조합에 대응되는 주가의 등락 결과에 따라 상기 주가의 등락을 예측하는, 주가 예측 방법.
The method of claim 8,
Wherein the predicting step predicts the fluctuation of the stock price in accordance with the result of the fluctuation of the stock price corresponding to the combination of the keywords extracted from the new news in the keyword dictionary.
청구항 8에 있어서,
상기 예측하는 단계는, 상기 키워드 사전 및 추출된 상기 제2 키워드의 조합으로부터 SVM(support vector machine)을 이용하여 상기 주가의 등락을 예측하는, 주가 예측 방법.
The method of claim 8,
Wherein the predicting step predicts the fluctuation of the stock price using a SVM (support vector machine) from a combination of the keyword dictionary and the extracted second keyword.
KR1020160167896A 2016-12-09 2016-12-09 Apparatus and method for estimating stock price KR101949794B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160167896A KR101949794B1 (en) 2016-12-09 2016-12-09 Apparatus and method for estimating stock price

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160167896A KR101949794B1 (en) 2016-12-09 2016-12-09 Apparatus and method for estimating stock price

Publications (2)

Publication Number Publication Date
KR20180066726A true KR20180066726A (en) 2018-06-19
KR101949794B1 KR101949794B1 (en) 2019-02-19

Family

ID=62790504

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160167896A KR101949794B1 (en) 2016-12-09 2016-12-09 Apparatus and method for estimating stock price

Country Status (1)

Country Link
KR (1) KR101949794B1 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489631A (en) * 2019-07-10 2019-11-22 平安科技(深圳)有限公司 Stock market development method, apparatus, computer equipment and storage medium
CN111222051A (en) * 2020-01-16 2020-06-02 深圳市华海同创科技有限公司 Training method and device of trend prediction model
KR20200066455A (en) * 2018-11-30 2020-06-10 주식회사 핀업 Method and system for calculating price influence based on disclosure and media
KR20200083865A (en) * 2018-12-31 2020-07-09 주식회사 핀업 System for providing investment information
KR102194442B1 (en) * 2019-07-11 2020-12-28 이주원 Method for dealing a stock of news breakout trading
KR20210042709A (en) 2019-10-10 2021-04-20 고려대학교 산학협력단 Method and server for stock movement prediction using corporate relation data
KR20220111406A (en) * 2021-02-02 2022-08-09 주식회사 프리시전에스씨엠 Statistical Algorithm for the Short-term Forecasts of Product Prices Based on Natural Language Processing of Domestic and Foreign News
KR20230027903A (en) * 2021-08-20 2023-02-28 유한책임회사 블루바이저시스템즈 Apparatus for predicting fluctuation of stock price based on learning model

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245252A (en) * 2001-02-19 2002-08-30 Ken Millenium Kk Transaction issue determination assisting method, and system
KR100836066B1 (en) 2007-06-29 2008-06-10 장태연 System and method for automatic stock trading, and recording medium recorded with a program therefor
JP2011141833A (en) * 2010-01-08 2011-07-21 Nifty Corp Device, method, and program for stock price prediction
KR101531970B1 (en) * 2013-12-26 2015-06-26 주식회사 코스콤 Method of predicting a stock price through an analysis of a social data and webdata related the securities market and system applying the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245252A (en) * 2001-02-19 2002-08-30 Ken Millenium Kk Transaction issue determination assisting method, and system
KR100836066B1 (en) 2007-06-29 2008-06-10 장태연 System and method for automatic stock trading, and recording medium recorded with a program therefor
JP2011141833A (en) * 2010-01-08 2011-07-21 Nifty Corp Device, method, and program for stock price prediction
KR101531970B1 (en) * 2013-12-26 2015-06-26 주식회사 코스콤 Method of predicting a stock price through an analysis of a social data and webdata related the securities market and system applying the same

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200066455A (en) * 2018-11-30 2020-06-10 주식회사 핀업 Method and system for calculating price influence based on disclosure and media
KR20200083865A (en) * 2018-12-31 2020-07-09 주식회사 핀업 System for providing investment information
CN110489631A (en) * 2019-07-10 2019-11-22 平安科技(深圳)有限公司 Stock market development method, apparatus, computer equipment and storage medium
KR102194442B1 (en) * 2019-07-11 2020-12-28 이주원 Method for dealing a stock of news breakout trading
KR20210042709A (en) 2019-10-10 2021-04-20 고려대학교 산학협력단 Method and server for stock movement prediction using corporate relation data
CN111222051A (en) * 2020-01-16 2020-06-02 深圳市华海同创科技有限公司 Training method and device of trend prediction model
CN111222051B (en) * 2020-01-16 2023-09-12 深圳市华海同创科技有限公司 Training method and device for trend prediction model
KR20220111406A (en) * 2021-02-02 2022-08-09 주식회사 프리시전에스씨엠 Statistical Algorithm for the Short-term Forecasts of Product Prices Based on Natural Language Processing of Domestic and Foreign News
KR20230027903A (en) * 2021-08-20 2023-02-28 유한책임회사 블루바이저시스템즈 Apparatus for predicting fluctuation of stock price based on learning model

Also Published As

Publication number Publication date
KR101949794B1 (en) 2019-02-19

Similar Documents

Publication Publication Date Title
KR101949794B1 (en) Apparatus and method for estimating stock price
US9864741B2 (en) Automated collective term and phrase index
US20180121831A1 (en) Systems and methods for predictive coding
Jonnalagadda et al. A new iterative method to reduce workload in systematic review process
US10073827B2 (en) Method and system to generate a process flow diagram
US20130060769A1 (en) System and method for identifying social media interactions
US10127304B1 (en) Analysis and visualization tool with combined processing of structured and unstructured service event data
US10032448B1 (en) Domain terminology expansion by sensitivity
US11023503B2 (en) Suggesting text in an electronic document
CN114298417A (en) Anti-fraud risk assessment method, anti-fraud risk training method, anti-fraud risk assessment device, anti-fraud risk training device and readable storage medium
KR101541306B1 (en) Computer enabled method of important keyword extraction, server performing the same and storage media storing the same
US9418058B2 (en) Processing method for social media issue and server device supporting the same
JP2020017197A (en) Presentation method of information relating to basis of prediction value output by computing machine system and predictor
Chen et al. A robust web personal name information extraction system
US11275777B2 (en) Methods and systems for generating timelines for entities
US10043511B2 (en) Domain terminology expansion by relevancy
CN103324641A (en) Information record recommendation method and device
KR20210019359A (en) Stock Price Prediction Service Method and System
Uddin et al. A Sciento-text framework to characterize research strength of institutions at fine-grained thematic area level
CN111126073B (en) Semantic retrieval method and device
Neri Mendoza et al. Abstractive multi-document text summarization using a genetic algorithm
CN113569578B (en) User intention recognition method and device and computer equipment
CN114020867A (en) Method, device, equipment and medium for expanding search terms
US11822609B2 (en) Prediction of future prominence attributes in data set
CN115062135A (en) Patent screening method and electronic equipment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant