KR102104316B1 - Apparatus for predicting stock price of company by analyzing news and operating method thereof - Google Patents

Apparatus for predicting stock price of company by analyzing news and operating method thereof Download PDF

Info

Publication number
KR102104316B1
KR102104316B1 KR1020180031638A KR20180031638A KR102104316B1 KR 102104316 B1 KR102104316 B1 KR 102104316B1 KR 1020180031638 A KR1020180031638 A KR 1020180031638A KR 20180031638 A KR20180031638 A KR 20180031638A KR 102104316 B1 KR102104316 B1 KR 102104316B1
Authority
KR
South Korea
Prior art keywords
news
stock price
company
value
preset
Prior art date
Application number
KR1020180031638A
Other languages
Korean (ko)
Other versions
KR20190116590A (en
Inventor
손윤식
이강우
김경민
성주한
조용진
조현우
Original Assignee
동국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 산학협력단 filed Critical 동국대학교 산학협력단
Priority to KR1020180031638A priority Critical patent/KR102104316B1/en
Publication of KR20190116590A publication Critical patent/KR20190116590A/en
Application granted granted Critical
Publication of KR102104316B1 publication Critical patent/KR102104316B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

본 발명에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법은 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류한 후 새롭게 업로드된 뉴스로부터 추출된 적어도 하나의 단어를 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정함으로써 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있다.An apparatus for predicting a stock price of a company by analyzing news according to the present invention and an operation method thereof include a word vector for the extracted word matching the preset plurality of words among the extracted at least one word and the plurality of news classification groups After calculating the similarity between news classification vectors matched to each of them, the average similarity for each of the plurality of news classification groups is calculated based on the calculated similarity, and the newly uploaded, based on the calculated average similarity Classified news into the first news classification group among the plurality of news classification groups, and then inputting at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group Calculate the positive, neutral, and negative impact values of the newly uploaded news and then calculate Different output values can be derived according to the properties of news by determining the fluctuation rate of the stock price of a preset company based on the positive, neutral, and negative impact values.

Description

뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법{APPARATUS FOR PREDICTING STOCK PRICE OF COMPANY BY ANALYZING NEWS AND OPERATING METHOD THEREOF}A device that predicts a company's stock price by analyzing the news and how it works {APPARATUS FOR PREDICTING STOCK PRICE OF COMPANY BY ANALYZING NEWS AND OPERATING METHOD THEREOF}

본 발명은 뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법에 대한 것이다.The present invention relates to an apparatus for predicting a stock price of a company by analyzing news and a method of operating the same.

주식 시장은 특유의 가격 결정 메커니즘이 존재하고, 이러한 가격 결정 메커니즘은 무수히 많은 변수 데이터에 의해서 영향을 받게 된다. 즉, 주가에 영향을 미치는 펀더멘털 요인들은 너무나도 다양하고 복잡하며 이러한 요인들은 시시각각으로 변동되므로, 과거의 변동 요인들이 현재 주가에 영향을 미치는 식의 순환이 발생하기도 한다.The stock market has its own pricing mechanism, which is influenced by a myriad of variable data. In other words, the fundamental factors affecting the stock price are so diverse and complex, and these factors fluctuate from time to time, so there is a cycle of equations in which past fluctuation factors affect the current stock price.

최근에는 인터넷 기술의 발달로 인하여, 인간에 의해서 새롭게 만들어지는 거의 모든 정보가 인터넷을 통해서 전파, 공유, 활용되고 있다. 또한, 인터넷을 통해서 이용가능한 정보는 디지털화된 정보이므로 이를 주가 예측을 위한 입력 데이터로 손쉽게 활용될 수 있다. 이렇게 인터넷에 공유되고 있는 많은 데이터들, 이른바 빅 데이터를 활용하여 주가 변동을 예측하기 위해서는 통계 모델을 활용한 빅테이터 분석이 함께 이루어지고 있다.Recently, due to the development of Internet technology, almost all information newly created by human beings is spread, shared, and utilized through the Internet. In addition, since information available through the Internet is digitized information, it can be easily used as input data for stock price prediction. In order to predict stock price fluctuations using so-called big data, a lot of data shared on the Internet, big data analysis using a statistical model is being performed together.

하지만, 종래의 빅 데이터 분석을 통한 주가 예측은 입력 데이터 간의 영향을 충분히 고려할 수 없었다. 따라서, 주가 변동 예측 결과의 신뢰성을 향상시키기 위해서는 새로운 종류의 통계 모형에 대한 필요성이 요청되고 있다.However, the prediction of stock price through conventional big data analysis could not sufficiently consider the influence between input data. Therefore, there is a need for a new kind of statistical model in order to improve the reliability of prediction results of stock price fluctuations.

이러한 필요성에 따라 한국 등록특허 제10-1458004호에서는 증시 관련 데이터를 입력 데이터로 입력받는 입력부, 입력된 복수의 증시 관련 데이터를 제1 복수 노드에 할당하고, 제1 복수 노드에 할당된 데이터별로 제1 가중치를 적용하여 제2 복수 노드에 할당함으로써 인공 신경망 모형을 모델링하는 모델링부, 제2 복수 노드에 할당된 데이터들에 제2 가중치를 적용하여 가중합을 연산한 뒤 활성화 함수에 입력하여 싱글값으로 산출하고, 싱글값을 기 정의된 임계값과 비교하여 싱글값이 임계값보다 크면 출력값으로 하이 값을 출력하고 싱글값이 임계값보다 작으면 출력값으로 로우 값을 출력하는 출력부를 포함한다.According to this need, in Korean Patent Registration No. 10-1458004, an input unit that receives stock-related data as input data, allocates a plurality of inputted stock-related data to a first plurality of nodes, and provides data for each data allocated to the first plurality of nodes. A modeling unit that models an artificial neural network model by applying 1 weight to a second multiple node and applying a second weight to data allocated to the second multiple node to calculate the weighted sum and input it to the activation function to enter a single value And an output unit that outputs a high value as an output value when a single value is greater than a threshold value and outputs a low value as an output value when the single value is smaller than the threshold value.

그러나, 한국 등록특허 제10-1458004호에서 개시된 주가 예측은 하나의 기업에 대해 하나의 신경망을 운영함으로써, 뉴스의 속성을 구분하지 않은 채 출력 값을 제시한다는 문제점이 있다.However, the stock price prediction disclosed in Korean Patent Registration No. 10-1458004 has a problem in that, by operating one neural network for one company, the output value is presented without distinguishing the properties of news.

따라서, 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있는 알고리즘에 대한 연구가 필요하다.Therefore, it is necessary to study an algorithm that can derive different output values according to the properties of news.

본 발명에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법은 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류한 후 새롭게 업로드된 뉴스로부터 추출된 적어도 하나의 단어를 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정함으로써 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있게 하고자 한다.An apparatus for predicting a stock price of a company by analyzing news according to the present invention and an operation method thereof include a word vector for the extracted word matching the preset plurality of words among the extracted at least one word and the plurality of news classification groups After calculating the similarity between news classification vectors matched to each of them, the average similarity for each of the plurality of news classification groups is calculated based on the calculated similarity, and the newly uploaded, based on the calculated average similarity Classified news into the first news classification group among the plurality of news classification groups, and then inputting at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group Calculate the positive, neutral, and negative impact values of the newly uploaded news and then calculate It is intended to be able to derive different output values according to the properties of news by determining the fluctuation rate of the stock price of a preset company based on the positive, neutral, and negative impact values.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치는 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부, 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부, 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부, 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 형태소 분석부, 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 뉴스 분류부 및 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 주가 예측부를 포함한다.An apparatus for predicting a stock price of a company by analyzing news according to an embodiment of the present invention includes a news site storage unit storing a plurality of preset web site addresses where news data is uploaded, and a plurality of preset news classification groups, respectively. A vector storage unit that matches and stores a news classification vector in a match, and stores a word vector for each of a plurality of preset words, and stores a positive influence value, a neutral influence value, and a negative value of news in each of the plurality of news classification groups. A news analysis neural network storage unit that matches and stores a news analysis neural network capable of calculating an impact value, and when news is uploaded from at least one web site among the plurality of web site addresses, a number included in the newly uploaded news Extracts the sentences, and performs morpheme analysis on each of the plurality of sentences to perform A morpheme analysis unit extracting at least one word constituting each sentence, a word vector for the extracted word matching the preset plurality of words among the extracted at least one word, and each of the plurality of news classification groups After calculating the similarity between news classification vectors matched to, the average similarity for each of the plurality of news classification groups is calculated based on the calculated similarity, and based on the calculated average similarity, the newly uploaded news A news classification unit classifying the first news classification group among the plurality of news classification groups and the input of a news analysis neural network matching the at least one word extracted from the newly uploaded news to the first news classification group By inputting the value, the positive impact value and the neutral impact value of the newly uploaded news After calculating the negative impact value it includes the calculated positive impact value, to determine the price of the stock price deungrakryul of preset companies predicted based on a neutral influence value and negative impact value portion.

또한, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부를 유지하는 단계, 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부를 유지하는 단계, 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부를 유지하는 단계, 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 단계, 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 단계 및 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 단계를 포함한다.In addition, an operation method of a device for predicting a stock price of a company by analyzing news according to an embodiment of the present invention comprises: maintaining a news site storage unit in which a plurality of preset website addresses to which news data are uploaded are stored; Maintaining a vector storage unit for matching and storing a news classification vector to each of a plurality of preset news classification groups, and matching and storing a word vector for each of the preset plurality of words, to each of the plurality of news classification groups Maintaining a news analysis neural network storage unit by matching and storing a news analysis neural network capable of calculating a positive impact value, a neutral impact value, and a negative impact value of news, and news from at least one website among the plurality of website addresses When is uploaded, extract a number of sentences contained in the newly uploaded news , Extracting at least one word constituting each of the plurality of sentences by performing a morpheme analysis on each of the plurality of sentences, and matching the plurality of preset words among the extracted at least one word After calculating the similarity between the word vector for the extracted word and the news classification vector matched to each of the plurality of news classification groups, the average similarity for each of the plurality of news classification groups is calculated based on the calculated similarity. , Classifying the newly uploaded news into a first news classification group among the plurality of news classification groups based on the calculated average similarity, and the at least one word extracted from the newly uploaded news to the first 1 By inputting the input value of the news analysis neural network matched to the news classification group, Calculating a positive impact value, a neutral impact value, and a negative impact value of the newly uploaded news, and then determining a fluctuation rate of the stock price of a preset company based on the calculated positive impact value, the neutral impact value, and the negative impact value Includes.

본 발명에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치 및 이의 동작 방법은 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류한 후 새롭게 업로드된 뉴스로부터 추출된 적어도 하나의 단어를 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정함으로써 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있다.An apparatus for predicting a stock price of a company by analyzing news according to the present invention and an operation method thereof include a word vector for the extracted word matching the preset plurality of words among the extracted at least one word and the plurality of news classification groups After calculating the similarity between news classification vectors matched to each of them, the average similarity for each of the plurality of news classification groups is calculated based on the calculated similarity, and the newly uploaded, based on the calculated average similarity The classified news is classified into the first news classification group among the plurality of news classification groups, and then at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group. Calculate the positive, neutral, and negative impact values of the newly uploaded news and then calculate Different output values can be derived according to the properties of news by determining the fluctuation rate of the stock price of a preset company based on the positive, neutral, and negative impact values.

도 1은 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 구성을 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법을 도시한 흐름도이다.
1 is a diagram showing the configuration of an apparatus for predicting a stock price of a company by analyzing news according to an embodiment of the present invention.
2 is a flowchart illustrating an operation method of an apparatus for predicting a stock price of a company by analyzing news according to an embodiment of the present invention.

이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. It should be understood that these descriptions are not intended to limit the invention to specific embodiments, and include all modifications, equivalents, or substitutes included in the spirit and scope of the invention. In describing each drawing, similar reference numerals have been used for similar components, and unless otherwise defined, all terms used in this specification, including technical or scientific terms, have common knowledge in the technical field to which the present invention pertains. It has the same meaning as commonly understood by people who have it.

도 1은 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 구성을 도시한 도면이다.1 is a diagram illustrating the configuration of a device 100 for predicting a stock price of a company by analyzing news according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)는 뉴스 사이트 저장부(110), 벡터 저장부(120), 뉴스 분석 신경망 저장부(130), 형태소 분석부(140), 뉴스 분류부(150), 주가 예측부(160), 유사 뉴스 카운트부(170), 주가 등락률 연산부(180) 및 뉴스 분석 신경망 업데이트부(190)를 포함할 수 있다.As illustrated in FIG. 1, an apparatus 100 for predicting a stock price of an enterprise by analyzing news according to an embodiment of the present invention includes a news site storage unit 110, a vector storage unit 120, and a news analysis neural network storage The unit 130, the morpheme analysis unit 140, the news classification unit 150, the stock price prediction unit 160, the similar news count unit 170, the stock fluctuation rate calculation unit 180 and the news analysis neural network update unit 190 It can contain.

먼저, 뉴스 사이트 저장부(110)는 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 하기 표 1과 같이 저장될 수 있다.First, the news site storage unit 110 may store a plurality of preset web site addresses to which news data are uploaded as shown in Table 1 below.

웹 사이트 주소 인덱스Web site address index 웹 사이트 주소 Website address 웹 사이트 주소 1Website address 1 www.news.google.co.krwww.news.google.co.kr 웹 사이트 주소 2Website address 2 www.yonhapnews.co.krwww.yonhapnews.co.kr 웹 사이트 주소 3Website address 3 www.newssite.krwww.newssite.kr ...... ......

다음으로, 벡터 저장부(120)는 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 하기 표 2와 같이 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 하기 표 3과 같이 저장할 수 있다.Next, the vector storage unit 120 matches the news classification vector to each of a plurality of preset news classification groups and stores it as shown in Table 2 below, and matches the word vector for each of the preset plurality of words to the following table Can be saved as 3.

뉴스 분류 인덱스News classification index 뉴스 분류 벡터News classification vector 뉴스 분류 1News classification 1 (0.45, 0.31, -0.13, ..., 0.10) (0.45, 0.31, -0.13, ..., 0.10) 뉴스 분류 2News Category 2 (-0.46, 0.13, 0.11, ..., -0.59) (-0.46, 0.13, 0.11, ..., -0.59) 뉴스 분류 3News Category 3 (0.05, -0.22, 0.91, ..., 0.63) (0.05, -0.22, 0.91, ..., 0.63) ...... ......

여기에서, 예를 들어, 상기 뉴스 분류 1은 ‘실적 관련 뉴스’, 상기 뉴스 분류 2는 ‘제품 관련 뉴스’ 및 상기 뉴스 분류 3은 ‘업황 관련 뉴스’일 수 있으며, 상기 뉴스 분류 벡터는 사전 설정된 다수의 단어들의 개수에 상응하는 원소들로 이루어질 수 있으며, 원소들 각각은 -1 내지 1 사이의 실수 값을 가질 수 있다.Here, for example, the news classification 1 may be “performance related news”, the news classification 2 may be “product related news”, and the news classification 3 may be “business related news”, and the news classification vector may be preset. It may consist of elements corresponding to the number of words, and each of the elements may have a real value between -1 and 1.

단어 인덱스Word index 단어 벡터Word vector 단어 1Word 1 (0.75, 0.51, -0.17, ..., 0.75) (0.75, 0.51, -0.17, ..., 0.75) 단어 2Word 2 (0.86, -0.86, -0.46, ..., -0.35) (0.86, -0.86, -0.46, ..., -0.35) 단어 3Word 3 (0.07, 0.56, -0.60, ..., 0.64) (0.07, 0.56, -0.60, ..., 0.64) ...... ......

여기에서, 예를 들어, 상기 단어 1은 ‘실적’, 상기 단어 2는 ‘개선’ 및 상기 단어 3은 ‘악화’일 수 있으며, 상기 단어 벡터는 사전 설정된 다수의 단어들의 개수에 상응하는 원소들로 이루어질 수 있으며, 원소들 각각은 -1 내지 1 사이의 실수 값을 가질 수 있다.뉴스 분석 신경망 저장부(130)는 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 하기 표 4와 같이 저장할 수 있다.Here, for example, the word 1 may be 'performance', the word 2 may be 'improvement', and the word 3 may be 'deterioration', and the word vector is an element corresponding to the number of a plurality of preset words Each of the elements may have a real value between -1 and 1. The news analysis neural network storage unit 130 has a positive impact value, a neutral impact value and a news value for each of the plurality of news classification groups. A news analysis neural network capable of calculating negative influence values can be matched and stored as shown in Table 4 below.

뉴스 분류 인덱스News classification index 뉴스 분석 신경망News analysis neural network 뉴스 분류 1News classification 1 뉴스 분석 신경망 1News analysis neural network 1 뉴스 분류 2News Category 2 뉴스 분석 신경망 2News Analysis Neural Network 2 뉴스 분류 3News Category 3 뉴스 분석 신경망 3News Analysis Neural Network 3 ...... ......

여기에서, 뉴스 분석 신경망은 입력 값에 대해 사전 설정된 N 회의 컨벌루션 처리를 수행함으로써 3개의 출력 값을 획득할 수 있는 N 개의 필터들로 구성될 수 있다. 여기에서 N은 2 이상의 자연수 중에서 선택될 수 있다. 또한, 컨벌루션 처리는 입력에 대하여 필터를 이용한 컨벌루션 곱을 수행하는 제1 처리, 상기 제1 처리의 결과 데이터에 대하여 정류 선형 처리를 수행하는 제2 처리 및 상기 제2 처리의 결과 데이터에 대하여 풀링 처리를 수행하는 제3 처리로 이루어질 수 있다. 한편, 사전 설정된 N 회의 컨벌루션 처리에 이용되는 필터들은 서로 다를 수 있다.형태소 분석부(140)는 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출할 수 있다. 이때, 형태소 분석부(140)는 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어의 중복 횟수를 카운트할 수 있다.Here, the news analysis neural network may be composed of N filters capable of obtaining three output values by performing N preset convolution processing on the input value. Here, N may be selected from two or more natural numbers. In addition, the convolution process includes first processing to perform convolution multiplication using a filter on the input, second processing to perform rectification linear processing on the result data of the first processing, and pooling processing on the result data of the second processing. And a third process to be performed. On the other hand, the filters used for the preset N times convolution processing may be different. When the news is uploaded from at least one web site among the plurality of web site addresses, the morpheme analysis unit 140 may use the newly uploaded news. A plurality of sentences included may be extracted, and morpheme analysis may be performed on each of the plurality of sentences to extract at least one word constituting each of the plurality of sentences. In this case, the morpheme analysis unit 140 may count the number of times of overlapping of at least one word constituting each of the plurality of sentences.

예컨대, 상기 새롭게 업로드된 뉴스에서 “15일 오전11시30분 현재 갑 회사는 전거래일보다 5.91% 오른 가격에 거래되고 있다.”는 첫 번째 문장과 “갑 회사의 중국 파트너사는 지난 11일 항암바이러제 중국 임상3상을 오는 12월까지 완료하고 내년 4월에 허가 신청서를 제출한다고 밝혔다.”는 두 번째 문장을 추출하고, 각 문장에 대해 형태소 분석을 수행하여, 상기 첫 번째 문장에서 “15일”, “오전11시30분”, “현재”, “갑 회사”, “전거래일”, “5.91%”, “오름”, “가격” 및 “거래”라고 하는 단어와 “있다”라는 서술어를 추출하고, 상기 두 번째 문장에서 “갑 회사”, “중국”, “파트너사”, “지난”, “11일”, “항암바이러제”, “중국”, “임상3상”, “오는”, “12월”, “완료”, “내년”, “4월”, “허가”, “신청서” 및 “제출”이라는 단어와 “밝히다”라는 서술어를 추출할 수 있다. 이때, 형태소 분석부(140)는 “갑 회사”, “중국”이라는 단어의 중복 횟수를 2회로 카운트하고, 나머지 단어의 중복 횟수를 1회로 카운트할 수 있다.For example, in the newly uploaded news, the first sentence, “As of 11:30 am on the 15th, the company is trading at 5.91% higher than the previous trading day.” Now, the third phase of clinical trials in China has been completed by December, and it is said that an application for permission will be submitted in April of next year. ”The second sentence was extracted, and morphological analysis was performed for each sentence. The words “day”, “11:30 am”, “present”, “you company”, “pre-trade date”, “5.91%”, “rise”, “price” and “transaction” and the words “have” In the second sentence above, “Gap Company”, “China”, “Partner Company”, “Last”, “11 Days”, “Anti-Cancer Virus”, “China”, “Clinical Phase 3”, “ Coming ”,“ December ”,“ Complete ”,“ Next year ”,“ April ”,“ Permit ”,“ Application ”and“ Submit ” And the word "clarify" that predicates can be extracted. At this time, the morpheme analysis unit 140 may count the number of duplicates of the words “Gap Company” and “China” twice, and count the number of duplicates of the remaining words once.

뉴스 분류부(150)는 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류할 수 있다.The news classification unit 150 compares the similarity between the word vector for the extracted word matching the plurality of preset words among the extracted at least one word and the news classification vector matched to each of the plurality of news classification groups. After the calculation, the average similarity for each of the plurality of news classification groups is calculated based on the calculated similarity, and based on the calculated average similarity, the newly uploaded news is selected from among the plurality of news classification groups. It can be classified into 1 news classification group.

예를 들어, 상기 첫 번째 및 두 번째 문장에서 추출된 단어들 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어가 “갑 회사”, “중국”, “항암바이러제”, “임상3상”, “허가”, “신청서” 및 “제출”인 경우, 뉴스 분류부(150)는 상기 “갑 회사”, “중국”, “항암바이러제”, “임상3상”, “허가”, “신청서” 및 “제출”에 매칭되어 있는 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도들을 연산한 후 연산된 유사도들의 평균 값을 평균 유사도로 결정하고, 결정된 평균 유사도를 이용하여 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류할 수 있다. 여기에서, 뉴스 분류부(150)는 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 하기 수학식 1을 이용하여 연산하며, 평균 유사도는 단어 벡터와 뉴스 분류 벡터 간의 유사도들을 상기 다수의 뉴스 분류 그룹들 각각마다 모두 더한 뒤 유사도들의 개수로 나누어줌으로써 연산할 수 있다.For example, among the words extracted from the first and second sentences, the extracted words matching the plurality of preset words are “Gap Company”, “China”, “An anti-cancer virus”, “Clinical Phase 3 In the case of ”,“ permit ”,“ application ”and“ submit ”, the news classification unit 150 includes the above“ Gap Company ”,“ China ”,“ Anti-Virus Virus ”,“ Clinical Phase 3 ”,“ Permit ”, After calculating the similarities between the word vector matched to "application" and "submission" and the news classification vector matched to each of the plurality of news classification groups, the average value of the calculated similarities is determined as the average similarity, and the determined average The newly uploaded news may be classified into a first news classification group among the plurality of news classification groups using similarity. Here, the news classification unit 150 calculates the similarity between the word vector and the news classification vector matched to each of the plurality of news classification groups using Equation 1 below, and the average similarity is the word vector and the news classification vector. It can be calculated by adding all the similarities between each of the plurality of news classification groups and dividing by the number of similarities.

Figure 112018027378808-pat00001
Figure 112018027378808-pat00001

여기에서,

Figure 112018027378808-pat00002
는 n개의 원소(xi)들로 이루어진 단어 벡터 x와 n개의 원소(yi)들로 이루어진 뉴스 분류 벡터 y 간의 유사도이다. 예컨대, 뉴스 분류부(150)는 “갑 회사”에 매칭되어 있는 단어 벡터와 상기 뉴스 분류 1에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 수학식 1을 이용하여 연산할 수 있다.From here,
Figure 112018027378808-pat00002
It is a news similarity between the classification vector consisting of n elements y (x i) of the word vector x with n elements (y i) consisting of. For example, the news classifying unit 150 may calculate the similarity between the word vector matched to “A Company” and the news classification vector matched to the news class 1 using Equation (1).

주가 예측부(160)는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정할 수 있다. 구체적으로, 주가 예측부(160)는 상기 연산된 긍정 영향 값에서 상기 연산된 부정 영향 값을 감한 값에 30을 곱한 값을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 여기에서, 긍정 영향 값, 중립 영향 값 및 부정 영향 값 각각은 0에서 1 사이의 실수 값을 가지고, 긍정 영향 값, 중립 영향 값 및 부정 영향 값의 총 합은 1이다.The stock price predicting unit 160 inputs the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group, thereby positively affecting the newly uploaded news, After calculating the neutral impact value and the negative impact value, it is possible to determine the fluctuation rate of the stock price of a preset company based on the calculated positive impact value, the neutral impact value, and the negative impact value. Specifically, the stock price predicting unit 160 may determine a value obtained by subtracting the calculated negative effect value from the calculated positive effect value by multiplying by 30 as a fluctuation rate of a stock price of a preset company. Here, each of the positive influence value, the neutral influence value, and the negative influence value has a real value between 0 and 1, and the total sum of the positive influence value, the neutral influence value, and the negative influence value is 1.

예를 들어, 상기 연산된 긍정 영향 값이 0.3이고, 상기 연산된 중립 영향 값이 0.5이며, 상기 연산된 부정 영향 값이 0.2인 경우, 주가 예측부(160)는 상기 연산된 긍정 영향 값인 0.3에서 상기 연산된 부정 영향 값인 0.2를 감한 값인 0.1에 30을 곱한 3을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 즉, 주가 예측부(160)는 3%를 상기 새롭게 업로드된 뉴스에 의한 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다.For example, when the calculated positive influence value is 0.3, the calculated neutral influence value is 0.5, and the calculated negative influence value is 0.2, the stock price predicting unit 160 may calculate the calculated positive influence value from 0.3. The calculated negative impact value of 0.2, which is the value obtained by subtracting 0.2, is multiplied by 30, and 3 can be determined as the fluctuation rate of the stock price of a preset company. That is, the stock price predicting unit 160 may determine 3% as the fluctuation rate of the stock price of a preset company based on the newly uploaded news.

또한, 상기 주가 예측부(160)는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치(또는, 유사 뉴스의 개수의 제곱에 반비례하는 가중치)를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다. 이를 위하여, 유사 뉴스 카운트부(170)는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트할 수 있다. 여기에서, 상기 새롭게 업로드된 뉴스와의 평균 유사도는 상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 각각에서 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 각각에 대한 평균 유사도를 연산함으로써 획득될 수 있다. 이에 따라, 중복되는 뉴스에 의해 상기 기업의 주식 가격의 등락률이 높게 평가되는 것을 방지할 수 있다.In addition, the stock price predicting unit 160 positively affects a weight (or a weight inversely proportional to the square of the number of similar news) counted among the number of similar news counted among news searched during the preset trading day period, By applying to the neutral influence value and the negative influence value, the fluctuation rate of the stock price of the company can be determined. To this end, the similarity news counting unit 170 may count the number of similarities that have an average similarity with the newly uploaded news that is higher than or equal to a predetermined reference similarity among news searched during the preset trading day period. Here, the average similarity with the newly uploaded news is extracted from each of the word vectors for the extracted word matching the plurality of preset words among the extracted at least one word and the news searched during the preset trading day period. After calculating the similarity between word vectors for the extracted words matching the preset plurality of words among the at least one word, the average similarity for each of the news searched during the preset trading day period is calculated based on the calculated similarity. It can be obtained by calculating. Accordingly, it is possible to prevent the corporate stock price from being highly evaluated due to overlapping news.

예를 들어, 상기 연산된 긍정 영향 값이 0.3이고, 상기 연산된 중립 영향 값이 0.5이며, 상기 연산된 부정 영향 값이 0.2이며, 카운트된 유사 뉴스의 개수가 5인 경우, 주가 예측부(160)는 상기 연산된 긍정 영향 값인 0.3에 1/5를 곱한 값에서 상기 연산된 부정 영향 값인 0.2에 1/5를 곱한 값을 감한 값인 0.02에 30을 곱한 0.6을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 즉, 주가 예측부(160)는 0.6%를 상기 새롭게 업로드된 뉴스에 의한 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다.For example, if the calculated positive impact value is 0.3, the calculated neutral impact value is 0.5, the calculated negative impact value is 0.2, and the number of similar news counted is 5, the stock price prediction unit 160 ) Is the calculated positive impact value of 0.3 multiplied by 1/5, and the calculated negative impact value of 0.2 multiplied by 1/5 is 0.6 multiplied by 30 multiplied by 30 to the rate of change in the stock price of a preset company. Can decide. That is, the stock price predicting unit 160 may determine 0.6% as the fluctuation rate of the stock price of a preset company based on the newly uploaded news.

또한, 상기 주가 예측부(160)는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다. 이에 따라, 적은 뉴스 매체에서만 주목하는 뉴스에 의해 상기 기업의 주식 가격의 등락률이 높게 평가되는 것을 방지할 수 있다.In addition, the stock price prediction unit 160 calculates the news upload rate of the similar news for the plurality of website addresses or the website addresses to which the newly uploaded news is uploaded, and then counts the number of similar news counted. In addition, by applying a weight inversely proportional to the value multiplied by the news upload ratio to the positive influence value, the neutral influence value, and the negative influence value, the rate of change of the stock price of the company may be determined. Accordingly, it is possible to prevent the company's stock price fluctuation rate from being highly evaluated by news focused on a small number of news media.

예를 들어, 상기 연산된 긍정 영향 값이 0.3이고, 상기 연산된 중립 영향 값이 0.5이며, 상기 연산된 부정 영향 값이 0.2이며, 카운트된 유사 뉴스의 개수가 5이며, 뉴스 업로드 비율이 1%(즉, 0.01)인 경우, 주가 예측부(160)는 상기 연산된 긍정 영향 값인 0.3에 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값인 1/500을 곱한 값에서 상기 연산된 부정 영향 값인 0.2에 1/500을 곱한 값을 감한 값인 0.0002에 30을 곱한 0.006을 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다. 즉, 주가 예측부(160)는 0.006%를 상기 새롭게 업로드된 뉴스에 의한 사전 설정된 기업의 주식 가격의 등락률로 결정할 수 있다.For example, the calculated positive impact value is 0.3, the calculated neutral impact value is 0.5, the calculated negative impact value is 0.2, the number of similar news counted is 5, and the news upload rate is 1%. In the case of (that is, 0.01), the stock price predicting unit 160 calculates the negative value by multiplying the calculated positive impact value by 0.3, the number of similar news counts multiplied by the news upload rate, and 1/500. The fluctuation rate of the stock price of a preset company can be determined as 0.006 multiplied by 30, multiplied by 1/500 multiplied by 1/500. That is, the stock price prediction unit 160 may determine 0.006% as the fluctuation rate of the stock price of a preset company based on the newly uploaded news.

이후, 주가 등락률 연산부(180)는 상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산할 수 있다.Thereafter, the stock price fluctuation rate calculating unit 180 may calculate the actual fluctuation rate according to the actual stock price of the company between the actual stock price of the company and a preset evaluation time point at the time the newly uploaded news is uploaded.

뉴스 분석 신경망 업데이트부(190)는 상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부(160)에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트할 수 있다.The news analysis neural network update unit 190, if the actual fluctuation rate for the company and the fluctuation rate determined by the stock price prediction unit 160 have different slope codes, the news analysis neural network matching the first news classification group Can be updated.

예를 들어, 상기 기업에 대한 상기 실제 등락률이 -3%이고 상기 주가 예측부(160)에서 결정된 상기 등락률이 2%로 서로 다른 기울기 부호를 가지면, 뉴스 분석 신경망 업데이트부(190)는 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트할 수 있다.For example, if the actual fluctuation rate for the company is -3% and the fluctuation rate determined by the stock price prediction unit 160 is 2%, and has different slope codes, the news analysis neural network update unit 190 is the first The news analysis neural network matched to the news classification group may be updated.

이때, 상기 뉴스 분석 신경망 업데이트부(190)는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트할 수 있다.At this time, the news analysis neural network update unit 190 has a positive effect calculated when the at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group. By modifying the filter coefficients of the news analysis neural network matched to the first news classification group such that the value, the neutral influence value and the negative influence value have a positive influence value, a neutral influence value, and a negative influence value corresponding to the actual fluctuation rate, The news analysis neural network matched to the first news classification group may be updated.

예를 들어, 상기 기업에 대한 상기 실제 등락률이 -3%이고 상기 주가 예측부(160)에서 결정된 상기 등락률이 2%로 서로 다른 기울기 부호를 가지는 경우, 상기 뉴스 분석 신경망 업데이트부(190)는 상기 실제 등락률에 상응하는 긍정 영향 값에서 상기 실제 등락률에 상응하는 부정 영향 값을 감한 값이 -0.001이 나오도록(즉, -0.001에 30을 곱한 값이 -0.03(-3%)이 나오도록) 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정할 수 있다.For example, when the actual fluctuation rate for the company is -3% and the fluctuation rate determined by the stock price prediction unit 160 is 2% and has different slope codes, the news analysis neural network update unit 190 may be From the positive influence value corresponding to the actual fluctuation rate, the value obtained by subtracting the negative influence value corresponding to the actual fluctuation rate is -0.001 (ie, -0.001 multiplied by 30 is -0.03 (-3%)). Filter coefficients of the news analysis neural network matched to the first news classification group may be modified.

상술한 바와 같은 본 발명에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)는 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류한 후 새롭게 업로드된 뉴스로부터 추출된 적어도 하나의 단어를 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정함으로써 뉴스의 속성에 따라 서로 다른 출력 값을 도출할 수 있다.The apparatus 100 for predicting a stock price of a company by analyzing the news according to the present invention as described above includes a word vector and a plurality of word vectors for an extracted word matching the plurality of preset words among at least one extracted word After calculating the similarity between news classification vectors matched to each of the news classification groups, the average similarity for each of the plurality of news classification groups is calculated based on the calculated similarity, and based on the calculated average similarity, After inputting the newly uploaded news into the first news classification group among the plurality of news classification groups, at least one word extracted from the newly uploaded news is matched to the first news classification group. By inputting, after calculating the positive impact value, the neutral impact value and the negative impact value of the newly uploaded news, By determining the computed value of the positive impact Neutral impact and value to deungrakryul the share price of companies based on pre-set negative impact on the property values according to the news you can obtain different output values.

도 2는 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 동작 방법을 도시한 흐름도이다.2 is a flowchart illustrating an operation method of an apparatus 100 for predicting a stock price of a company by analyzing news according to an embodiment of the present invention.

도 2를 참조하면, 단계(S210)에서는 뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부를 유지할 수 있다.Referring to FIG. 2, in step S210, a news site storage unit storing a plurality of preset web site addresses to which news data is uploaded may be maintained.

단계(S220)에서는 사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부를 유지할 수 있다.In step S220, a vector storage unit may be maintained by matching and storing news classification vectors to each of a plurality of preset news classification groups, and matching and storing word vectors for each of the preset plurality of words.

단계(S230)에서는 상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부를 유지할 수 있다.In step S230, a news analysis neural network storage unit that matches and stores a news analysis neural network capable of calculating a positive influence value, a neutral influence value, and a negative influence value of news in each of the plurality of news classification groups may be maintained.

단계(S240)에서는 상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출할 수 있다.In step S240, when news is uploaded from at least one web site among the plurality of web site addresses, a plurality of sentences included in the newly uploaded news are extracted, and a morpheme is analyzed for each of the plurality of sentences At least one word constituting each of the plurality of sentences may be extracted by performing.

단계(S250)에서는 상기 추출된 적어도 하나의 단어에 매칭되어 있는 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 평균 유사도를 연산하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류할 수 있다.In step S250, the average similarity between the word vector matching the extracted at least one word and the news classification vector matching each of the plurality of news classification groups is calculated, and the newly uploaded news is added to the plurality of words. Among the news classification groups, the first news classification group may be classified.

단계(S260)에서는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정할 수 있다.In step S260, by inputting the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group, a positive impact value and a neutral impact of the newly uploaded news After calculating the value and the negative impact value, it is possible to determine the fluctuation rate of the stock price of a preset company based on the calculated positive impact value, the neutral impact value, and the negative impact value.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 동작 방법은 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스에서 상기 추출된 적어도 하나의 단어에 매칭되어 있는 단어 벡터와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트하는 단계를 더 포함하고, 단계(S260)에서는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다.An operation method of the apparatus 100 for predicting a stock price of a company by analyzing news according to an embodiment of the present invention includes at least one word extracted from the newly uploaded news among news searched during the preset trading day period. The method further includes counting the number of similar news whose average similarity with the matched word vector is equal to or greater than a preset reference similarity, and in step S260, the number of similar news counted among the news searched during the preset trading day period is counted. The inverse proportion of the stock price of the company may be determined by applying inversely proportional weights to the positive, neutral, and negative impact values.

또한, 상기 단계(S260)에서는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정할 수 있다.In addition, in the step S260, after calculating the news upload ratio of the similar news for the plurality of website addresses or the website addresses to which the newly uploaded news is uploaded, the counted number of similar news is added to the number of similar news. It is possible to determine the fluctuation rate of the stock price of the company by applying a weight inversely proportional to the multiplied value of the news upload ratio to the positive influence value, the neutral influence value, and the negative influence value.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치(100)의 동작 방법은 상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산하는 단계 및 상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트하는 단계를 더 포함할 수 있다.An operation method of the apparatus 100 for predicting a stock price of a company by analyzing news according to an embodiment of the present invention includes the company between the actual stock price of the company at the time when the newly uploaded news is uploaded and a preset evaluation time Calculating the actual fluctuation rate according to the actual stock price of the company, and analyzing the news matched to the first news classification group when the actual fluctuation rate for the company and the fluctuation rate determined by the stock price prediction unit have different slope signs The method may further include updating the neural network.

또한, 상기 뉴스 분석 신경망 업데이트 단계는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트할 수 있다.Also, in the updating of the news analysis neural network, a positive influence value and a neutral value calculated when the at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group. The first news by modifying the filter coefficients of the news analysis neural network matched to the first news classification group so that the influence value and the negative influence value have a positive influence value, a neutral influence value, and a negative influence value corresponding to the actual fluctuation rate. It is possible to update the news analysis neural network matched to the classification group.

이상, 도 2를 참조하여 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 도 1을 이용하여 설명한 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.As described above, with reference to FIG. 2, an operation method of an apparatus for predicting a stock price of a company by analyzing news according to an embodiment of the present invention has been described. Here, the operation method of the apparatus for predicting the stock price of a company by analyzing the news according to an embodiment of the present invention may correspond to the configuration of the operation of the apparatus for predicting the stock price of the company by analyzing the news described with reference to FIG. Therefore, a more detailed description thereof will be omitted.

본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.An operation method of an apparatus for predicting a stock price of a company by analyzing news according to an embodiment of the present invention may be implemented as a computer program stored in a storage medium for execution through combination with a computer.

또한, 본 발명의 일실시예에 따른 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. In addition, an operation method of an apparatus for predicting a stock price of a company by analyzing news according to an embodiment of the present invention may be implemented in a form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, or the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and available to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs, DVDs, and magnetic media such as floptical disks. -Hardware devices specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language code that can be executed by a computer using an interpreter, etc., as well as machine language codes produced by a compiler.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. As described above, the present invention has been described by specific matters such as specific components, etc. and limited embodiments and drawings, but is provided to help the overall understanding of the present invention, and the present invention is not limited to the above embodiments , Anyone having ordinary knowledge in the field to which the present invention pertains can make various modifications and variations from these descriptions.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention is limited to the described embodiments, and should not be determined, and all claims that are equivalent to or equivalent to the claims, as well as the claims described below, will belong to the scope of the spirit of the present invention. .

Claims (12)

뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부;
사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부;
상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부;
상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 형태소 분석부;
상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 뉴스 분류부; 및
상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 주가 예측부
를 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치.
A news site storage unit storing a plurality of preset web site addresses to which news data is uploaded;
A vector storage unit matching and storing news classification vectors to each of a plurality of preset news classification groups, and matching and storing word vectors for each of the preset plurality of words;
A news analysis neural network storage unit matching and storing a news analysis neural network capable of calculating a positive influence value, a neutral influence value, and a negative influence value of news in each of the plurality of news classification groups;
When news is uploaded from at least one web site among the plurality of web site addresses, a plurality of sentences included in the newly uploaded news are extracted, and a morpheme analysis is performed on each of the plurality of sentences to perform the morphological analysis. A morpheme analysis unit extracting at least one word constituting each of the sentences;
The similarity is calculated after calculating the similarity between the word vector for the extracted word matching the plurality of preset words among the extracted at least one word and the news classification vector matched to each of the plurality of news classification groups. Based on the calculated average similarity for each of the plurality of news classification groups, based on the calculated average similarity, to classify the newly uploaded news to the first news classification group of the plurality of news classification groups News classification; And
Positive and negative influence values and neutral and negative influence values of the newly uploaded news by inputting the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group A stock price prediction unit that determines the fluctuation rate of a stock price of a preset company based on the calculated positive impact value, neutral impact value, and negative impact value after calculating
Device for predicting a company's stock price by analyzing the news containing.
제1항에 있어서,
상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트하는 유사 뉴스 카운트부;
를 더 포함하고,
상기 주가 예측부는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치.
According to claim 1,
A similar news counting unit counting the number of similar news that has an average similarity with the newly uploaded news that is equal to or greater than a preset reference similarity among news searched during the preset trading day period;
Further comprising,
The stock price prediction unit determines a fluctuation rate of the stock price of the company by applying a weight inversely proportional to the number of similar news counted among the news searched during the preset trading day period to the positive impact value, the neutral impact value, and the negative impact value
A device that analyzes news and predicts a company's stock price.
제2항에 있어서,
상기 주가 예측부는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치.
According to claim 2,
The stock price prediction unit calculates the news upload ratio of the similar news for the plurality of website addresses or the website addresses to which the newly uploaded news is uploaded, and then adds the news upload ratio to the counted number of similar news. Determine the fluctuation rate of the stock price of the company by applying a weight inversely proportional to the multiplied value to the positive influence value, the neutral influence value, and the negative influence value
A device that analyzes news and predicts a company's stock price.
제3항에 있어서,
상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산하는 주가 등락률 연산부; 및
상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트하는 뉴스 분석 신경망 업데이트부
를 더 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치.
According to claim 3,
A stock price fluctuation rate calculating unit for calculating an actual fluctuation rate according to the actual stock price of the company between the actual stock price of the company and a preset evaluation time at the time the newly uploaded news is uploaded; And
A news analysis neural network update unit that updates the news analysis neural network matched to the first news classification group when the actual fluctuation rate for the company and the fluctuation rate determined by the stock price prediction unit have different slope codes.
Device for predicting a company's stock price by analyzing the news further comprising.
제4항에 있어서,
상기 뉴스 분석 신경망 업데이트부는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트하는
뉴스를 분석하여 기업의 주가를 예측하는 장치.
According to claim 4,
The news analysis neural network update unit calculates a positive influence value, a neutral influence value, and a calculation result when the at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group, and The first news classification group is modified by modifying the filter coefficients of the news analysis neural network matched to the first news classification group so that the negative impact value has a positive impact value, a neutral impact value, and a negative impact value corresponding to the actual fluctuation rate. Updating the matched news analytics neural network
A device that analyzes news and predicts a company's stock price.
뉴스 데이터가 업로드되는 사전 설정된 다수의 웹 사이트 주소들이 저장되어 있는 뉴스 사이트 저장부를 유지하는 단계;
사전 설정된 다수의 뉴스 분류 그룹들 각각에 뉴스 분류 벡터를 매칭시켜 저장하고, 사전 설정된 다수의 단어들 각각에 대한 단어 벡터를 매칭시켜 저장하는 벡터 저장부를 유지하는 단계;
상기 다수의 뉴스 분류 그룹들 각각에 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산할 수 있는 뉴스 분석 신경망을 매칭시켜 저장하는 뉴스 분석 신경망 저장부를 유지하는 단계;
상기 다수의 웹 사이트 주소들 중 적어도 하나의 웹 사이트에서 뉴스가 업로드되면, 상기 새롭게 업로드된 뉴스에 포함되어 있는 다수의 문장들을 추출하고, 상기 다수의 문장들 각각에 대해 형태소 분석을 수행하여 상기 다수의 문장들 각각을 구성하는 적어도 하나의 단어를 추출하는 단계;
상기 추출된 적어도 하나의 단어 중 상기 사전 설정된 다수의 단어들에 매칭되는 추출 단어에 대한 단어 벡터와 상기 다수의 뉴스 분류 그룹들 각각에 매칭되어 있는 뉴스 분류 벡터 간의 유사도를 연산한 후 상기 연산된 유사도에 기초하여 상기 다수의 뉴스 분류 그룹들 각각에 대한 평균 유사도를 연산하며, 상기 연산된 평균 유사도에 기초하여, 상기 새롭게 업로드된 뉴스를 상기 다수의 뉴스 분류 그룹들 중 제1 뉴스 분류 그룹에 분류하는 단계; 및
상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력함으로써 상기 새롭게 업로드된 뉴스의 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 연산한 후 상기 연산된 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 기초하여 사전 설정된 기업의 주식 가격의 등락률을 결정하는 단계
를 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
Maintaining a news site storage unit in which a plurality of preset web site addresses to which news data are uploaded are stored;
Maintaining a vector storage unit by matching and storing news classification vectors to each of a plurality of preset news classification groups, and matching and storing word vectors for each of the preset plurality of words;
Maintaining a news analysis neural network storage unit matching and storing a news analysis neural network capable of calculating a positive influence value, a neutral influence value, and a negative influence value of news in each of the plurality of news classification groups;
When news is uploaded from at least one web site among the plurality of web site addresses, a plurality of sentences included in the newly uploaded news are extracted, and a morpheme analysis is performed on each of the plurality of sentences to perform the morphological analysis. Extracting at least one word constituting each of the sentences;
The similarity is calculated after calculating the similarity between the word vector for the extracted word matching the plurality of preset words among the extracted at least one word and the news classification vector matched to each of the plurality of news classification groups. Based on the calculated average similarity for each of the plurality of news classification groups, based on the calculated average similarity, to classify the newly uploaded news to the first news classification group of the plurality of news classification groups step; And
Positive and negative influence values and neutral and negative influence values of the newly uploaded news by inputting the at least one word extracted from the newly uploaded news as an input value of a news analysis neural network matched to the first news classification group After calculating the step of determining the fluctuation rate of the stock price of a preset company based on the calculated positive impact value, neutral impact value and negative impact value
Method of operating the device to predict the stock price of the company by analyzing the news containing.
제6항에 있어서,
상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 상기 새롭게 업로드된 뉴스와의 평균 유사도가 사전 설정된 기준 유사도 이상인 유사 뉴스들의 개수를 카운트하는 단계;
를 더 포함하고,
상기 주식 가격 등락률 결정 단계는 상기 사전 설정된 거래일 기간 동안 검색된 뉴스들 중 카운트된 유사 뉴스의 개수에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 6,
Counting the number of similar news among the news searched during the preset trading day period, the average similarity with the newly uploaded news being equal to or greater than a preset reference similarity;
Further comprising,
The step of determining the stock price fluctuation rate applies a weight that is inversely proportional to the number of similar news counted among news searched during the preset trading day period to the positive impact value, the neutral impact value, and the negative impact value, so that the company's stock price fluctuation rate To decide
How the device works to predict the company's stock price by analyzing the news.
제7항에 있어서,
상기 주식 가격 등락률 결정 단계는 상기 다수의 웹 사이트 주소들에 대한 상기 유사 뉴스들 또는 상기 새롭게 업로드된 뉴스가 업로드된 웹 사이트 주소들의 뉴스 업로드 비율을 연산한 후 상기 카운트된 유사 뉴스의 개수에 상기 뉴스 업로드 비율을 승산한 값에 반비례하는 가중치를 상기 긍정 영향 값, 중립 영향 값 및 부정 영향 값에 적용하여 상기 기업의 주식 가격의 등락률을 결정하는
뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 7,
The step of determining the stock price fluctuation rate calculates the news upload ratio of the similar news for the plurality of website addresses or the website addresses to which the newly uploaded news is uploaded, and then adds the news to the counted number of similar news. Determine the fluctuation rate of the stock price of the company by applying weights inversely proportional to the value multiplied by the upload rate to the positive, neutral, and negative impact values.
How the device works to predict the company's stock price by analyzing the news.
제8항에 있어서,
상기 새롭게 업로드된 뉴스가 업로드된 시점의 상기 기업의 실제 주식 가격과 사전 설정된 평가 시점 간의 상기 기업의 실제 주식 가격에 따른 실제 등락률을 연산하는 단계; 및
상기 기업에 대한 상기 실제 등락률과 상기 주가 예측부에서 결정된 상기 등락률이 서로 다른 기울기 부호를 가지면, 상기 제1 뉴스 분류 그룹에 매칭되어 있는 상기 뉴스 분석 신경망을 업데이트하는 단계
를 더 포함하는 뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 8,
Calculating an actual fluctuation rate according to the actual stock price of the company between the actual stock price of the company and a preset evaluation time point when the newly uploaded news is uploaded; And
Updating the news analysis neural network matched to the first news classification group if the actual fluctuation rate for the company and the fluctuation rate determined by the stock price prediction unit have different slope codes.
A method of operating a device for predicting a company's stock price by analyzing the news further including the.
제9항에 있어서,
상기 뉴스 분석 신경망 업데이트 단계는 상기 새롭게 업로드된 뉴스로부터 추출된 상기 적어도 하나의 단어를 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 입력 값으로 입력하였을 때 연산되는 긍정 영향 값, 중립 영향 값 및 부정 영향 값이 상기 실제 등락률에 상응하는 긍정 영향 값, 중립 영향 값 및 부정 영향 값을 가지도록 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망의 필터 계수들을 수정함으로써 상기 제1 뉴스 분류 그룹에 매칭되어 있는 뉴스 분석 신경망을 업데이트하는
뉴스를 분석하여 기업의 주가를 예측하는 장치의 동작 방법.
The method of claim 9,
In the updating of the news analysis neural network, a positive influence value and a neutral influence value are calculated when the at least one word extracted from the newly uploaded news is input as an input value of a news analysis neural network matched to the first news classification group. And the first news classification group by modifying the filter coefficients of the news analysis neural network matched to the first news classification group so that the negative impact value has a positive impact value, a neutral impact value, and a negative impact value corresponding to the actual fluctuation rate. To update the news analysis neural network that is matched on
How the device works to predict the company's stock price by analyzing the news.
제6항 내지 제10항 중 어느 한 항의 방법을 컴퓨터로 하여금 수행하도록 하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.A computer-readable recording medium recording a program that causes a computer to perform the method of any one of claims 6 to 10. 삭제delete
KR1020180031638A 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof KR102104316B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180031638A KR102104316B1 (en) 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180031638A KR102104316B1 (en) 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof

Publications (2)

Publication Number Publication Date
KR20190116590A KR20190116590A (en) 2019-10-15
KR102104316B1 true KR102104316B1 (en) 2020-04-27

Family

ID=68209438

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180031638A KR102104316B1 (en) 2018-03-19 2018-03-19 Apparatus for predicting stock price of company by analyzing news and operating method thereof

Country Status (1)

Country Link
KR (1) KR102104316B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220102181A (en) 2021-01-11 2022-07-20 대한민국(행정안전부 국립재난안전연구원장) Apparatus for Searching Fraudulent News and Driving Method Thereof, and Computer Readable Recording Medium

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210069888A (en) 2019-12-04 2021-06-14 한국전자통신연구원 Method and apparatus of predicting stock price direction based on machine learning using supply and demand data
KR102142928B1 (en) * 2020-01-13 2020-08-10 미래에셋대우 주식회사 Method for forecast range of future stock price, and system for stock price prediction using the same
JP7364228B2 (en) 2020-03-31 2023-10-18 久美子 石井 Information processing device, its control method, program, and learned model
CN112036157A (en) * 2020-08-04 2020-12-04 林树 Foundation manager tone text analysis method and device
KR102617839B1 (en) 2021-02-02 2024-01-23 주식회사 프리시전에스씨엠 Statistical Algorithm for the Short-term Forecasts of Product Prices Based on Natural Language Processing of Domestic and Foreign News

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100771506B1 (en) * 2006-02-13 2007-10-30 주식회사 디알에프앤 Stock information providing system using news

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220102181A (en) 2021-01-11 2022-07-20 대한민국(행정안전부 국립재난안전연구원장) Apparatus for Searching Fraudulent News and Driving Method Thereof, and Computer Readable Recording Medium

Also Published As

Publication number Publication date
KR20190116590A (en) 2019-10-15

Similar Documents

Publication Publication Date Title
KR102104316B1 (en) Apparatus for predicting stock price of company by analyzing news and operating method thereof
JP7169369B2 (en) Method, system for generating data for machine learning algorithms
Lasrado et al. Maturity models development in is research: a literature review
CN110287477B (en) Entity emotion analysis method and related device
Nasa et al. Evaluation of different classification techniques for web data
CN108491511B (en) Data mining method and device based on graph data and model training method and device
US10579651B1 (en) Method, system, and program for evaluating intellectual property right
US10983786B2 (en) Automatically evaluating software project requirements
CN111222976A (en) Risk prediction method and device based on network diagram data of two parties and electronic equipment
CN111199474A (en) Risk prediction method and device based on network diagram data of two parties and electronic equipment
KR101625124B1 (en) The Technology Valuation Model Using Quantitative Patent Analysis
US11308128B2 (en) Refining classification results based on glossary relationships
KR101585644B1 (en) Apparatus, method and computer program for document classification using term association analysis
Obermann et al. Interpretable multiclass models for corporate credit rating capable of expressing doubt
CN106874286B (en) Method and device for screening user characteristics
US11922326B2 (en) Data management suggestions from knowledge graph actions
US10509809B1 (en) Constructing ground truth when classifying data
US20140324523A1 (en) Missing String Compensation In Capped Customer Linkage Model
CN113343700B (en) Data processing method, device, equipment and storage medium
US20140324524A1 (en) Evolving a capped customer linkage model using genetic models
CN111427880B (en) Data processing method, device, computing equipment and medium
CN112785095A (en) Loan prediction method, loan prediction device, electronic device, and computer-readable storage medium
CN114443803A (en) Text information mining method and device, electronic equipment and storage medium
Hsu et al. Similarity search over personal process description graph
Kuznietsova et al. Business Intelligence Techniques for Missing Data Imputations

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant