KR102595682B1 - 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템 - Google Patents

기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템 Download PDF

Info

Publication number
KR102595682B1
KR102595682B1 KR1020230043864A KR20230043864A KR102595682B1 KR 102595682 B1 KR102595682 B1 KR 102595682B1 KR 1020230043864 A KR1020230043864 A KR 1020230043864A KR 20230043864 A KR20230043864 A KR 20230043864A KR 102595682 B1 KR102595682 B1 KR 102595682B1
Authority
KR
South Korea
Prior art keywords
stock
item
news
news article
analysis
Prior art date
Application number
KR1020230043864A
Other languages
English (en)
Inventor
송민상
유주현
Original Assignee
주식회사 에프앤가이드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에프앤가이드 filed Critical 주식회사 에프앤가이드
Priority to KR1020230043864A priority Critical patent/KR102595682B1/ko
Application granted granted Critical
Publication of KR102595682B1 publication Critical patent/KR102595682B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 의하면, 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법에 있어서, 뉴스 기사 크롤링부에 의해, 뉴스 기사를 수집하는 단계, 종목 태깅부에 의해, 뉴스 기사로부터 기업명을 추출하여 주식 종목을 결정하는 단계, 및 감성 분석부에 의해, 주식 종목에 대한 긍정, 부정 및 중립 중 어느 하나의 감성 분석 결과를 생성하는 단계를 포함하는 감성 분석 제공 방법을 제공할 수 있다.

Description

기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템{METHOD FOR PROVIDING EMOTION ANALYSIS OF STOCK USING CORPORATE NEWS ARTICLE AND DEVICE AND SYSTEM USING THE SAME}
본 발명은 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템에 관한 것이다. 보다 구체적으로, 본 발명은 기업의 개별 뉴스 기사에서 주식 종목을 정확히 태깅하여 결정하고, 해당 주식 종목에 대한 주가 긍정 또는 부정 등의 감성 분석을 위한 방법, 장치 및 시스템에 관한 것이다.
최근 금융 분야에 인공 지능 기술을 적용하고 있으며, 특히 이와 같은 기술을 이용하여 주식 시장의 많은 기업 종목들에 대한 주가의 방향성을 예측하기 위한 시스템이 개발되고 있다. 이를 위해 기업의 주가 예측 등에 활용하기 위해 온라인상의 비정형 데이터를 활용하여 이에 대한 긍정 또는 부정으로 감성을 분석하는 기술이 요구된다.
그러나, 종래 기술에서는 감성에 대한 단어 사전을 기반으로 하여 긍정 또는 부정의 강도를 판단하는 경우가 많아 감성 분석의 정확도가 낮다는 문제가 있었다. 또한, 개별 뉴스의 형태에 기인하여 각 기업의 뉴스는 다양한 내용을 담아내기 때문에 모든 기사가 주가에 영향을 주는 기사일 수는 없기 때문에 이를 미리 구별해 내는 것이 관건이며, 이 중에서도 특히 많은 수를 차지하는 단순 광고성 기사나 정보성 기사를 미리 걸러내는 것이 중요하다.
또한, 하나의 기사에 다수의 기업명 또는 주식 종목명이 등장하여 해당 기사가 어떤 기업에 대한 기사인지 정확히 구별하기 어려운 경우가 많은데, 해당 뉴스 기사가 어떤 기업을 대상으로 하고 있는지 정확히 식별하는 것이 매우 중요하다.
이에 따라 뉴스 기사로부터 해당 주식 종목의 정확한 식별 및 광고성 기사에 대한 필터링을 통해 주식 종목에 대한 감성 분석의 정확도를 향상시킬 수 있는 방법 및 시스템이 요구된다.
대한민국 등록특허공보 제10-1987301호
본 발명은 뉴스 기사를 이용하여 해당 주식 종목의 정확한 식별 및 광고성 기사에 대한 필터링을 통해 주식 종목에 대한 감성 분석의 정확도를 향상시킬 수 있는 방법, 장치 및 시스템을 제공하는 것을 목적으로 한다.
또한, 본 발명은 개별 뉴스 기사에서 대상이 되는 기업명 또는 주식 종목을 정확히 식별하기 위해 제목, 첫 문장과 본문 전체를 각각 분석하기 위한 3개의 분석 모형을 통해 종목 태깅의 정확도를 향상시킴으로써, 감성 분석의 정확도를 향상시킬 수 있는 종목 식별 방법, 장치 및 시스템을 제공하는 것을 목적으로 한다.
또한, 본 발명은 동음이의어 단어로 기업명이 이루어진 경우 별도의 개체명 인식(NER)을 이용한 딥러닝 언어 모델을 통해 종목 태깅의 정확도를 향상시킴으로써, 감성 분석의 정확도를 향상시킬 수 있는 종목 식별 방법, 장치 및 시스템을 제공하는 것을 목적으로 한다.
또한, 본 발명은 단순 광고성 기사나 정보성 기사를 필터링함으로써 뉴스 독자에게 투자에 직접적으로 도움이 되는 정보만을 감성 분석 대상으로 한정함으로써 감성 분석의 정확도를 향상시킬 수 있는 방법, 장치 및 시스템을 제공하는 것을 목적으로 한다.
또한, 본 발명은 뉴스 기사의 감성 분석을 통해 해당 기업의 긍정, 부정, 중립 등의 감성 분석 결과를 제공함으로써, 해당 기업에 긍정적 이슈가 많은 지 아니면 부정적 이슈가 많은 지 정확히 판단할 수 있는 근거를 마련하고, 이를 통해 투자자들이 보다 신중한 투자 결정을 내릴 수 있도록 보조하며, 투자자들의 실질적 수익 개선에 일조하는 것을 목적으로 한다.
본 발명의 해결 과제들은 이상에서 언급한 내용들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 따르면, 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법에 있어서, 뉴스 기사 크롤링부에 의해, 뉴스 기사를 수집하는 단계; 종목 태깅부에 의해, 상기 뉴스 기사로부터 기업명을 추출하여 주식 종목을 결정하는 단계; 및 감성 분석부에 의해, 상기 주식 종목에 대한 긍정, 부정 및 중립 중 어느 하나의 감성 분석 결과를 생성하는 단계를 포함하는 감성 분석 제공 방법을 제공할 수 있다.
또한, 뉴스 기사 필터링부에 의해, 상기 뉴스 기사가 광고성 기사인지 여부를 판단하는 단계; 및 상기 뉴스 기사가 광고성 기사로 판단되는 경우, 상기 뉴스 기사를 상기 감성 분석 결과를 생성하는 대상에서 제외하는 단계를 더 포함하는 감성 분석 제공 방법을 제공할 수 있다.
또한, 상기 주식 종목을 결정하는 단계는, 상기 뉴스 기사의 원문으로부터 제목, 첫 문장 및 본문 전체에서 각각 하나 이상의 피쳐를 추출하여 주식 종목 후보군을 생성하는 피쳐 추출 단계; 및 상기 제목, 첫 문장 및 본문 전체 각각에서 생성된 상기 주식 종목 후보군 각각에 대해 제목 분석 모형, 첫 문장 분석 모형 및 본문 분석 모형에서 상기 뉴스 기사가 해당 주식 종목에 대한 뉴스 기사일 확률을 산출하는 확률 산출 단계를 포함하고, 상기 제목 분석 모형, 상기 첫 문장 분석 모형 및 상기 본문 분석 모형은 각각 사전 학습된 딥러닝 언어 모델을 이용하는 것일 수 있다.
또한, 상기 피쳐 추출 단계에서 주어 명사와 함께 사용된 조사들의 수에 기초하여 상기 주식 종목 후보군을 생성하는 것일 수 있다.
또한, 상기 주식 종목을 결정하는 단계는, 상기 확률 산출 단계에서 도출된 상기 제목 분석 모형, 상기 첫 문장 분석 모형 및 상기 본문 분석 모형에서 산출된 확률 값에 기초하여 적어도 2가지 분석 모형에서 해당 주식 종목에 대한 뉴스 기사일 확률이 임계값 이상인 경우 상기 해당 주식 종목을 태깅 종목으로 결정하는 단계를 더 포함할 수 있다.
또한, 상기 주식 종목을 결정하는 단계는, 상기 뉴스 기사로부터 추출된 기업명이 미리 결정된 동음이의어 종목인지 여부를 판단하는 단계; 및 상기 추출된 기업명이 미리 결정된 동음이의어 종목인 경우, 자연어 처리 기술을 이용한 딥러닝 언어 모델을 이용하여 태깅 종목을 결정하는 단계를 더 포함할 수 있다.
또한, 상기 감성 분석 결과를 생성하는 단계는, 광고성 기사가 아닌 것으로 분류된 뉴스 기사에 대해 사전 학습된 딥러닝 언어 모델에 기초하여 상기 뉴스 기사에 대해 긍정 또는 부정일 확률값을 도출하고, 상기 긍정 또는 부정일 확률값이 임계값 이상인지 여부를 판단하여 상기 뉴스 기사에 대한 감성 분석 결과를 결정하는 것일 수 있다.
또한, 본 발명의 다른 실시예에 따르면, 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 장치에 있어서, 뉴스 기사를 수집하도록 구성된 뉴스 기사 크롤링부; 상기 뉴스 기사로부터 기업명을 추출하여 주식 종목을 결정하도록 구성된 종목 태깅부; 및 상기 주식 종목에 대한 긍정, 부정 및 중립 중 어느 하나의 감성 분석 결과를 생성하도록 구성된 감성 분석부를 포함하는 감성 분석 제공 장치를 제공할 수 있다.
본 발명에 의하면, 뉴스 기사를 이용하여 해당 주식 종목의 정확한 식별 및 광고성 기사에 대한 필터링을 통해 주식 종목에 대한 감성 분석의 정확도를 향상시킬 수 있는 방법, 장치 및 시스템을 제공할 수 있다.
또한, 본 발명에 의하면, 개별 뉴스 기사에서 대상이 되는 기업명 또는 주식 종목을 정확히 식별하기 위해 제목, 첫 문장과 본문 전체를 각각 분석하기 위한 3개의 분석 모형을 통해 종목 태깅의 정확도를 향상시킴으로써, 감성 분석의 정확도를 향상시킬 수 있는 종목 식별 방법, 장치 및 시스템을 제공할 수 있다.
또한, 본 발명에 의하면, 동음이의어 단어로 기업명이 이루어진 경우 별도의 개체명 인식(NER)을 이용한 딥러닝 언어 모델을 통해 종목 태깅의 정확도를 향상시킴으로써, 감성 분석의 정확도를 향상시킬 수 있는 종목 식별 방법, 장치 및 시스템을 제공할 수 있다.
또한, 본 발명에 의하면, 단순 광고성 기사나 정보성 기사를 필터링함으로써 뉴스 독자에게 투자에 직접적으로 도움이 되는 정보만을 감성 분석 대상으로 한정함으로써 감성 분석의 정확도를 향상시킬 수 있는 방법, 장치 및 시스템을 제공할 수 있다.
또한, 본 발명에 의하면, 뉴스 기사의 감성 분석을 통해 해당 기업의 긍정, 부정, 중립 등의 감성 분석 결과를 제공함으로써, 해당 기업에 긍정적 이슈가 많은 지 아니면 부정적 이슈가 많은 지 정확히 판단할 수 있는 근거를 마련하고, 이를 통해 투자자들이 보다 신중한 투자 결정을 내릴 수 있도록 보조하며, 투자자들의 실질적 수익 개선에 일조할 수 있다.
본 발명의 효과들은 이상에서 언급한 내용들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 종래 기술에 따른 감성 분석 분류의 오답 비율을 나타내는 표이다.
도 2는 본 발명의 일 실시예에 따른 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 장치의 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 일 실시예에 따라 주식 종목에 대한 감성 분석 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시예에 따라 주식 종목을 태깅하기 위한 방법을 설명하기 위한 예시도이다.
도 5는 본 발명의 일 실시예에 따라 주식 종목을 태깅하기 위한 방법의 각 단계의 구성을 설명하기 위한 예시도이다.
도 6a는 본 발명의 일 실시예에 따라 동음이의어 종목에 대한 NER 레이블링이 진행된 모습을 나타내는 예시도이며, 도 6b는 학습된 NER 모델의 입력 및 출력 예시를 나타내는 예시도이다.
도 7은 본 발명의 일 실시예에 따라 광고성 뉴스를 분류한 모델 출력의 결과를 나타내는 예시도이다.
도 8은 본 발명의 일 실시예에 따라 뉴스 기사의 감성 분석의 결과값을 나타내는 예시도이다.
도 9는 본 발명의 일 실시예에 따라 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 진행하기 위한 방법을 설명하기 위한 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
본 명세서에서 사용되는 "포함한다(comprises)", "포함하는(comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
또한, 본 발명에서 사용되는 제1, 제2 등과 같이 서수를 포함하는 용어는 구성 요소들을 설명하는데 사용될 수 있지만, 구성 요소들은 용어들에 의해 한정되어서는 안 된다. 이와 같은 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. 또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
또한, 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 기술되고, 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 본 발명의 구성 및 그에 따른 작용 효과는 이하의 상세한 설명을 통해 명확하게 이해될 것이다.
도 1은 종래 기술에 따른 감성 분석 분류의 오답 비율을 나타내는 표이다.
도 1을 참조하면, 종래 기술로 개발된 감성 분석 분류기를 통해 뉴스 기사의 감성 분석을 진행한 결과 뉴스 긍정 분류의 오답 비율은 24%이고, 뉴스 부정 분류의 오답 비율은 21%로서, 20%가 넘는 오류가 발생하였음을 확인할 수 있다.
본 발명에서는 이와 같은 감성 분석 오류의 주요 원인으로 파악된, 광고 정보성 뉴스가 포함되는 문제, 뉴스 기사가 어느 기업 종목에 대한 것인지 정확히 식별되지 않는 문제, 종목명이 동음이의어인 경우 태깅 오류가 발생하는 문제를 모두 해결하고자 한다.
도 2는 본 발명의 일 실시예에 따른 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 장치의 구성을 설명하기 위한 블록도이다.
도 2를 참조하면, 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 감성 분석 장치는 뉴스 기사 크롤링부(100), 뉴스 기사 발생 식별부(200), 뉴스 기사 감성 분석 처리부(300) 및 데이터베이스(DB)(400) 등을 포함할 수 있으며, 이들 구성 요소는 하나 이상의 프로세서(processor)에 의해 실행될 수 있는 프로그램 또는 프로그램 모듈을 포함할 수 있다. 감성 분석 장치에 포함된 프로그램 또는 프로그램 모듈들은 운영 체제(operating system), 어플리케이션 프로그램(application program) 또는 프로그램 등의 형태로 구성될 수 있으며, 널리 사용되는 다양한 종류의 저장 장치 상에 물리적으로 저장될 수 있다. 이와 같은 프로그램 또는 프로그램 모듈은 하나 이상의 루틴(routine), 서브루틴(subroutine), 프로그램(program), 오브젝트(object), 콤포넌트(component), 명령(instructions), 데이터 구조(data structure) 및 특정 작업(task)을 수행하거나 특정 데이터 유형을 실행하기 위한 다양한 형태를 포함할 수 있으며, 이들 형태로 제한되지 않는다.
뉴스 기사 크롤링부(100)는 웹 사이트 등에서 크롤링을 통해 다양한 뉴스 기사를 수집하도록 구성되고, 수집된 뉴스 기사들은 데이터베이스(DB)(400)에 저장되어 적재될 수 있다.
뉴스 기사 발생 식별부(200)는 데이터베이스(DB)(400)에 뉴스 기사가 적재 시에 분석할 뉴스 기사가 발생하였다는 이벤트를 식별하고, 해당 뉴스 기사에 대한 정보를 뉴스 기사 감성 분석 처리부(300)에 알려주도록 구성될 수 있다. 뉴스 기사의 발생 이벤트는 예컨대 미리 설정된 주기에 따라 뉴스 기사 발생 여부를 판단하거나, 발생된 뉴스 기사의 개수가 미리 설정된 개수에 도달할 때 생성될 수 있다.
뉴스 기사 감성 분석 처리부(300)는 수집된 뉴스 기사의 감성 분석을 처리하도록 구성되며, 예컨대 종목 태깅부(310), 뉴스 기사 필터링부(320) 및 감성 분석부(330)를 포함하도록 구성될 수 있다.
먼저 종목 태깅부(310)는 뉴스 기사로부터 기업명을 추출하여 주식 종목을 결정하도록 구성될 수 있으며, 주식 종목은 상장된 기업명으로 한정되지 않고, 비상장 기업이나 스타트업, 외국 기업 종목까지 포함할 수 있다. 여기서 주식 종목을 태깅하여 결정하는 단계는, 뉴스 기사의 원문으로부터 제목, 첫 문장 및 본문 전체에서 각각 하나 이상의 피쳐(feature)를 추출하여 주식 종목 후보군을 생성하는 피쳐 추출 단계와, 제목, 첫 문장 및 본문 전체 각각에서 생성된 주식 종목 후보군 각각에 대해 제목 분석 모형, 첫 문장 분석 모형 및 본문 분석 모형에서 뉴스 기사가 해당 주식 종목에 대한 뉴스 기사일 확률을 산출하는 확률 산출 단계와, 확률 산출 단계에서 도출된 3가지 모형에서 산출된 확률 값에 기초하여 적어도 2가지 분석 모형에서 해당 주식 종목에 대한 뉴스 기사일 확률이 임계값 이상인 경우 해당 주식 종목을 태깅 종목으로 결정하는 단계의 3 단계로 구성될 수 있다. 여기서, 피쳐 추출 단계에서 주어 명사와 함께 사용된 조사들의 수에 기초하여 주식 종목 후보군을 생성할 수 있다. 또한, 주식 종목을 태깅하여 결정할 때, 뉴스 기사로부터 추출된 기업명이 미리 결정된 동음이의어 종목인지 여부를 판단하고, 추출된 기업명이 미리 결정된 동음이의어 종목인 경우 종목 태깅의 정확도가 떨어지는 문제점을 해결하기 위해, 개체명 인식(Named Entity Recognition, NER) 방식을 이용한 딥러닝 언어 모델을 이용하여 위의 3 단계와 상이한 방식으로 태깅 종목을 결정하도록 구성될 수 있다. 이와 같은 종목 태깅 관련 프로세스는 이하 도 3 내지 도 6을 참조하여 더욱 구체적으로 설명될 것이다.
다음으로 뉴스 기사 필터링부(320)는 뉴스 기사가 광고성 기사인지 여부를 판단하고, 뉴스 기사가 광고성 기사로 판단되는 경우, 해당 뉴스 기사를 감성 분석 결과를 생성하는 대상에서 제외하도록 구성될 수 있다. 뉴스 기사 필터링부(320)는 광고성 기사나 정보성 기사인지 아닌지 레이블링(labeling)된 학습 데이터로 학습한 딥러닝 언어 모델을 사용할 수 있으며, 이와 같은 식별 모델을 이용하여 종목 태깅이 완료된 뉴스 기사가 단순히 광고성 기사이거나 또는 주가에 영향이 전혀 없는 단순 정보성 기사인 경우 최종 감성 분석 대상에서 제외하도록 구성될 수 있다. 뉴스 기사 필터링부(320)의 학습 모델은 광고성 뉴스와 금융 뉴스의 데이터 셋을 구성하여, 광고성 뉴스와 금융 뉴스를 분류하는 분류 모델의 학습을 진행하고, 해당 분류 모델에서 산출된 광고성 뉴스일 확률이 특정 임계값 이상인 경우 해당 뉴스 기사를 광고성 뉴스로 판단할 수 있다. 이와 같이 뉴스 기사 필터링부(320)에 의해 광고성 뉴스를 필터링하여 감성 분석을 진행한 결과 종래 대비 감성 분석의 정확성을 약 20% 이상 개선할 수 있었다.
다음으로 감성 분석부(330)는 감성 분석 대상으로 결정된 뉴스 기사에 대해, 즉 종목 태깅부(310)에 의해 주식 종목이 정상적으로 태깅되고, 뉴스 기사 필터링부(320)에 의해 광고성 기사가 아닌 것으로 분류된 뉴스 기사에 대해 긍정, 부정의 이진 분류 또는 긍정, 부정, 중립의 3개의 다중 분류를 수행하도록 구성될 수 있으며, 사전 학습된 딥러닝 언어 모델을 사용한 분류 모델로 구성될 수 있다. 여기서, 분류 모델에서 긍정 또는 부정 확률이 특정 임계값 이상일 경우 해당 뉴스 기상의 감성을 긍정 또는 부정으로 최종 분류할 수 있다.
데이터베이스(DB)(400)는 크롤링을 통해 수집한 다양한 뉴스 기사를 저장하고, 뉴스 기사 감성 분석 처리부(300)를 통해 처리된 감성 분석 결과값 등을 저장하고 수집하도록 구성될 수 있다.
도 3은 본 발명의 일 실시예에 따라 주식 종목에 대한 감성 분석 방법을 설명하기 위한 흐름도이다.
도 3을 참조하면, 뉴스 기사 감성 분석 처리부(300)를 통해 뉴스 기사의 감성 분석을 실행하는 과정이 도시되며, 먼저 주식 종목 태깅 단계(S310)를 통해 뉴스 기사로부터 기업명을 추출하여 주식 종목을 결정하고, 이때 주식 종목이 태깅되었는지 여부를 판단하는 단계(S320)를 통해 주식 종목이 정상적으로 태깅된 것으로 판단된 경우 다음 단계로 광고성 기사 여부 판단 단계(S330)로 넘어가고, 주식 종목이 정상적으로 태깅되지 않은 경우 감성 분석 대상에 제외한다.(S360) 또한, 주식 종목 태깅 단계(S310)는 뉴스 기사로부터 추출된 기업명이 미리 결정된 동음 이의어 종목에 포함되었는지 여부에 따라 상이한 방식으로 종목 태깅 프로세스가 수행될 수 있다.
광고성 기사 여부 판단 단계(S330)를 통해 해당 뉴스 기사가 광고성 기사인지 아닌지 판단하는 단계(S340)를 수행하고, 해당 기사가 광고성 기사가 아닌 일반 금융 뉴스로 판단되는 경우 감성 분석 진행 단계(S350)를 수행하고, 해당 기사가 광고성 기사로 판단되는 경우 감성 분석 대상에 제외할 수 있다.(S360)
이와 같이, 본 발명에 따른 감성 분석 프로세스는 주식 종목 태깅 프로세스를 통해 해당 주식 종목의 정확한 식별을 구현하고, 광고성 기사의 필터링을 통해 광고성 기사는 감성 분석 대상에서 제외함으로써, 주식 종목에 대한 감성 분석의 정확도를 향상시킬 수 있다.
도 4는 본 발명의 일 실시예에 따라 주식 종목을 태깅하기 위한 방법을 설명하기 위한 예시도이다.
도 4의 프로세스는 주식 종목 태깅 단계(S310)에서 태깅 종목을 결정하는 프로세스로서, 주식 종목 태깅 단계(S310)에서 결정된 종목이 동음이의어 종목 리스트에 포함된 종목이 아닌 경우에는 도 4 및 도 5와 같은 방법으로 태깅 종목이 결정될 수 있고, 예컨대 주식 종목 태깅 단계(S310)에서 결정된 종목이 동음이의어 종목 리스트에 포함되는 경우 도 6에서와 같은 NER 모델을 추가로 진행하여 해당 종목이 실제 주식 종목인지, 아니면 종목명이 아닌 동음이의어인지 식별하는 프로세스가 추가될 수 있다.
먼저 기업 뉴스의 제목, 첫 문장, 본문 전체와 같이 3부분으로 구분하고, 3가지 분석 모형, 즉 제목 분석 모형, 첫 문장 분석 모형 및 본문 분석 모형에서 각각 뉴스 기사가 해당 주식 종목에 대한 뉴스 기사일 확률을 산출하여 특정 임계값 이상의 확률로 인식되는 기업명을 해당 뉴스의 종목명으로 태깅하고, 이 확률 산출 값에 기초하여 최종 투표 방식을 통해 태깅 종목을 결정할 수 있다. 이는 기업 종목에 대한 뉴스는 제목과 첫 문장에서 그 기업명 또는 종목명이 표시될 확률이 높다는 실증적 분석 하에 구성된 것으로서, 해당 뉴스 기사에서 다루는 종목명은 주어의 자리에 올 확률이 높기 때문에, 주어와 주로 같이 동행하는 조사를 통계적으로 확인하고, 예컨대 은, 는, 이, 가, 의, 에, 도, 에 따르면 등과 같은 미리 결정된 조사들과 함께 나타나는 명사에 대해서 제목, 첫 문장 그리고 본문 전체에서 해당 명사가 기업명일 확률을 판단하는 세 개의 모형을 예컨대 랜덤 포레스트(random forest) 방식의 머신 러닝 모델로 구성하고, 각 모형에서의 결과값을 투표하는 방식으로 태깅 종목 프로세스를 구성할 수 있다.
도 5는 본 발명의 일 실시예에 따라 주식 종목을 태깅하기 위한 방법의 각 단계의 구성을 설명하기 위한 예시도이다.
먼저 도 5a에 도시된 피쳐 추출 단계에서는 뉴스 기사의 원문으로부터 제목, 첫 문장 및 본문 전체에서 각각 하나 이상의 피쳐(feature)를 추출하여 주식 종목 후보군을 생성하며, 이때 주어 명사와 함께 사용된 조사들의 수에 기초하여 피쳐를 추출함으로써 주식 종목 후보군을 생성할 수 있다.
도 5b에 도시된 확률 산출 단계에서는 제목, 첫 문장 및 본문 전체 각각에서 생성된 주식 종목 후보군 각각에 대해 제목 분석 모형, 첫 문장 분석 모형 및 본문 분석 모형에서 해당 뉴스 기사가 해당 주식 종목에 대한 뉴스 기사일 확률을 산출하며, 이때, 각 주식 종목 후보군에 대해 제목, 첫 문장 및 본문 전체에서 해당 후보군에 대한 뉴스 기사일 확률이 각각 산출될 수 있다.
도 5c에 도시된 주식 종목 결정 단계에서는 확률 산출 단계에서 도출된 제목 분석 모형, 첫 문장 분석 모형 및 본문 분석 모형에서 산출된 확률 값에 기초하여 적어도 2가지 분석 모형에서 해당 주식 종목에 대한 뉴스 기사일 확률이 임계값 이상인 경우 해당 주식 종목을 태깅 종목으로 결정할 수 있다. 예컨대, 3가지 분석 모형 모두 해당 주식 종목에 대한 뉴스 기사일 확률이 특정 임계값 이상인 경우를 판단하는 만장일치 방식이나, 3가지 분석 모형 중 2가지 이상의 분석 모형에서 해당 주식 종목에 대한 뉴스 기사일 확률이 특정 임계값 이상인 경우를 판단하는 과반수 방식을 사용할 수 있다. 여기서, 만장일치 방식의 특정 임계값보다 과반수 방식의 특정 임계값이 더 크게 설정될 수 있다.
도 6a는 본 발명의 일 실시예에 따라 동음이의어 종목에 대한 NER 레이블링이 진행된 모습을 나타내는 예시도이며, 도 6b는 학습된 NER 모델의 입력 및 출력 예시를 나타내는 예시도이다.
본 발명의 주식 종목 태깅 단계(S310)에서 뉴스 기사에서 추출된 종목명이 동음이의어 종목 리스트에 포함되는 경우, 예컨대 예컨대 주식 종목 태깅 단계(S310)에서 결정된 종목이 동음이의어 종목 리스트에 포함되는 경우 NER(Named Entity Recognition) 모델을 추가로 진행하여 해당 종목이 실제 주식 종목인지, 아니면 종목명이 아닌 동음이의어인지 식별하는 프로세스가 추가될 수 있다.
예컨대, 동음이의어 종목으로는 대상, 레이, 남성, 국보, 대교 등이 있으며, 이와 같은 동음이의어 종목들을 따로 식별하기 위해 자연어 처리(Natural Language Processing) 기술 중 NER(Named Entity Recognition) 개체명 인식 방식을 사용한 딥러닝 언어 모델을 이용함으로써, 단어간 관계와 문맥에 대한 분석을 수행함으로써 기업 종목명인지 여부를 보다 정확하게 식별함으로써, 종목 태깅의 오류를 감소시킬 수 있다.
도 6a를 참조하면, 동음이의어 종목 중 뉴스 태깅이 잘못되는 종목들에 대해, 해당 종목이 포함된 뉴스 문장들을 뽑아서 NER 레이블링을 진행하는 모습을 나타내며, 예컨대 기업명을 ORG, 기업명이 아닌 동음이의어를 NRG, 상품명을 PDT로 구분하여 레이블링을 진행하였다.
도 6b를 참조하면, 개체명이 태깅된 문장 데이터 셋을 생성하고 NER 모델을 통해 학습을 진행한 결과, NER 모델 입력 예시와 NER 모델 출력 예시 화면에서와 같이 종목명(ORG), 종목이 아닌 동음이의어(NRG), 상품명(PDT)를 구분하여 동음이의어 종목명을 정확히 식별함으로써 동음이의어가 포함된 뉴스 기사에서의 종목 태깅의 정확성을 2배 이상 향상시키는 결과를 얻을 수 있었다.
도 7은 본 발명의 일 실시예에 따라 광고성 뉴스를 분류한 모델 출력의 결과를 나타내는 예시도이다.
본 발명의 광고성 기사 여부 판단 단계(S330)에서 종목 태깅이 완료된 뉴스 기사는 단순히 광고성 또는 정보성 기사인지, 주가에 영향을 주는 금융 뉴스인지 분류하기 위해 광고성 뉴스 기사를 필터링하는 구성을 수행하며, 이때 광고성 기사인지 아닌지 레이블링된 학습 데이터로 사전 학습한 딥러닝 언어 모델을 사용할 수 있으며, 이와 같은 학습 모델 분류기에서 필터링된 광고성 기사를 제외한 나머지 기사들이 최종 감성 분석의 대상이 될 수 있다.
도 7을 참조하면, 입력된 뉴스 기사 샘플에 대해 광고성 뉴스일 확률이 산출된 결과값을 나타내며, 이와 같이 해당 뉴스 기사가 광고성 뉴스일 확률이 특정 임계값 이상인 경우 해당 뉴스 기사를 광고성 뉴스로 판단할 수 있다.
도 8은 본 발명의 일 실시예에 따라 뉴스 기사의 감성 분석의 결과값을 나타내는 예시도이다.
본 발명에 따른 최종 감성 분석 진행 단계(S350)는 앞서 종목이 정상적으로 태깅되고, 이어서 광고 또는 정보성 기사가 아닌 것으로 분류된 뉴스 기사에 대해서만 수행되며, 사전 학습된 딥러닝 언어 모델을 기반으로 긍정, 부정의 이진 분류 또는 중립까지 3개의 다중 분류 모델로 미세조정을 거친 언어 모델을 사용할 수 있다. 이를 통해 최종적으로 감성 분석의 결과로서 긍정 또는 부정일 확률값이 도출되며, 이 확률값이 특정 임계값 이상일 경우, 긍정, 부정 또는 중립으로 최종 식별될 수 있으며, 필요에 따라 매우 긍정, 약간 긍정, 중립, 약간 부정, 매우 부정 등의 3개 이상의 감성 분석 결과로 발전할 수 있다.
도 8을 참조하면, 샘플 뉴스 기사에 대한 감성 분석 결과의 예시로서 해당 뉴스의 긍정 확률값이 도출될 수 있으며, 이와 같은 긍정 또는 부정 확률이 특정 임계값 이상인 경우 최종 감성 분석 결과를 생성할 수 있다.
도 9는 본 발명의 일 실시예에 따라 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 진행하기 위한 방법을 설명하기 위한 흐름도이다.
도 9를 참조하면, 먼저 뉴스 기사 크롤링부(100)에서 뉴스 기사 크롤링을 통해 뉴스 기사를 수집할 수 있다.(S910)
다음으로, 뉴스 기사 발생 식별부(200)에서 뉴스 기사 발생 여부를 식별하고 특정 기준에 따라 뉴스 기사가 발생하는 경우 감성 분석 프로세스를 진행시킬 수 있다.(S920)
다음으로, 뉴스 기사 감성 분석 처리부(300)의 종목 태깅부(310)에서 뉴스 기사로부터 기업명을 추출하여 주식 종목을 태깅할 수 있다.(S930) 이때, 뉴스 기사로부터 추출된 기업명이 미리 결정된 동음이의어 종목인지 여부를 판단하고, 추출된 기업명이 미리 결정된 동음이의어 종목인 경우 종목 태깅의 정확도가 떨어지는 문제점을 해결하기 위해, 개체명 인식(NER) 방식을 이용한 딥러닝 언어 모델을 이용함으로써 보다 정확한 종목 태깅을 수행할 수 있다.
다음으로, 뉴스 기사 감성 분석 처리부(300)의 뉴스 기사 필터링부(320)에서 광고성 기사 필터링을 통해 광고성 기사를 감성 분석 대상에서 제외함으로써 감성 분석 대상을 결정할 수 있다.(S940)
다음으로, 뉴스 기사 감성 분석 처리부(300)의 감성 분석부(330)에서 종목 태깅이 정상적이고, 광고성 기사가 아닌 것으로 판단된 뉴스 기사에 대해 주식 종목에 대한 긍정, 부정, 중립 등의 감성 분석 결과를 생성할 수 있다.(S950)
마지막으로, 감성 분석 결과값을 DB(400)에 저장하고 각 기업 종목에 대한 감성 분석 결과값을 수집할 수 있다.(S960)
이상 본 발명의 실시예에 따른 다양한 방법, 장치 및 시스템을 구체적인 다양한 실시 형태로서 설명하였으나, 이는 예시에 불과한 것으로서, 본 발명은 이에 한정되지 않는 것이며, 본 명세서에 개시된 기초 사상에 따르는 최광의 범위를 갖는 것으로 해석되어야 한다. 당업자는 개시된 실시형태들을 조합, 치환하여 적시되지
않은 형상의 패턴을 실시할 수 있으나, 이 역시 본 발명의 범위를 벗어나지 않는 것이다. 이외에도 당업자는 본 명세서에 기초하여 개시된 실시형태를 용이하게 변경 또는 변형할 수 있으며, 이러한 변경 또는 변형도 본 발명의 권리범위에 속함은 명백하다.
100: 뉴스 기사 크롤링부
200: 뉴스 기사 발생 식별부
300: 뉴스 기사 감성 분석 처리부
310: 종목 태깅부
320: 뉴스 기사 필터링부
330: 감성 분석부
400: 데이터베이스

Claims (8)

  1. 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법에 있어서,
    뉴스 기사 크롤링부에 의해, 뉴스 기사를 수집하는 단계;
    종목 태깅부에 의해, 상기 뉴스 기사로부터 기업명을 추출하여 주식 종목을 결정하는 단계; 및
    감성 분석부에 의해, 상기 주식 종목에 대한 긍정, 부정 및 중립 중 어느 하나의 감성 분석 결과를 생성하는 단계
    를 포함하고,
    상기 주식 종목을 결정하는 단계는,
    주식 종목 후보군을 생성하기 위해 상기 뉴스 기사의 원문으로부터 제목, 첫 문장 및 본문 전체에서 각각 하나 이상의 피쳐를 추출하는 피쳐 추출 단계;
    상기 제목, 첫 문장 및 본문 전체 각각에서 생성된 상기 주식 종목 후보군 각각에 대해 제목 분석 모형, 첫 문장 분석 모형 및 본문 분석 모형에서 상기 뉴스 기사가 해당 주식 종목에 대한 뉴스 기사일 확률을 산출하는 확률 산출 단계; 및
    상기 확률 산출 단계에서 도출된 상기 제목 분석 모형, 상기 첫 문장 분석 모형 및 상기 본문 분석 모형에서 산출된 확률 값에 기초하여 적어도 2가지 분석 모형에서 해당 주식 종목에 대한 뉴스 기사일 확률이 임계값 이상인 경우 상기 해당 주식 종목을 태깅 종목으로 결정하는 단계
    를 포함하고, 상기 제목 분석 모형, 상기 첫 문장 분석 모형 및 상기 본문 분석 모형은 각각 사전 학습된 머신러닝 모델을 이용하는 것인, 감성 분석 제공 방법.
  2. 제1항에 있어서,
    뉴스 기사 필터링부에 의해, 상기 뉴스 기사가 광고성 기사인지 여부를 판단하는 단계; 및
    상기 뉴스 기사가 광고성 기사로 판단되는 경우, 상기 뉴스 기사를 상기 감성 분석 결과를 생성하는 대상에서 제외하는 단계
    를 더 포함하는 감성 분석 제공 방법.
  3. 삭제
  4. 제1항에 있어서, 상기 피쳐 추출 단계에서 주어 명사와 함께 사용된 조사들의 수에 기초하여 상기 주식 종목 후보군을 생성하는 것인, 감성 분석 제공 방법.
  5. 삭제
  6. 제1항에 있어서, 상기 주식 종목을 결정하는 단계는,
    상기 뉴스 기사로부터 추출된 기업명이 미리 결정된 동음이의어 종목인지 여부를 판단하는 단계; 및
    상기 추출된 기업명이 미리 결정된 동음이의어 종목인 경우, 자연어 처리 기술을 이용한 딥러닝 언어 모델을 이용하여 태깅 종목을 결정하는 단계
    를 더 포함하는 것인, 감성 분석 제공 방법.
  7. 제1항에 있어서, 상기 감성 분석 결과를 생성하는 단계는,
    광고성 기사가 아닌 것으로 분류된 뉴스 기사에 대해 사전 학습된 딥러닝 언어 모델에 기초하여 상기 뉴스 기사에 대해 긍정 또는 부정일 확률값을 도출하고, 상기 긍정 또는 부정일 확률값이 임계값 이상인지 여부를 판단하여 상기 뉴스 기사에 대한 감성 분석 결과를 결정하는 것인, 감성 분석 제공 방법.
  8. 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 장치에 있어서,
    뉴스 기사를 수집하도록 구성된 뉴스 기사 크롤링부;
    상기 뉴스 기사로부터 기업명을 추출하여 주식 종목을 결정하도록 구성된 종목 태깅부; 및
    상기 주식 종목에 대한 긍정, 부정 및 중립 중 어느 하나의 감성 분석 결과를 생성하도록 구성된 감성 분석부
    를 포함하고,
    상기 종목 태깅부는,
    주식 종목 후보군을 생성하기 위해 상기 뉴스 기사의 원문으로부터 제목, 첫 문장 및 본문 전체에서 각각 하나 이상의 피쳐를 추출하는 피쳐 추출 단계를 수행하고,
    상기 제목, 첫 문장 및 본문 전체 각각에서 생성된 상기 주식 종목 후보군 각각에 대해 제목 분석 모형, 첫 문장 분석 모형 및 본문 분석 모형에서 상기 뉴스 기사가 해당 주식 종목에 대한 뉴스 기사일 확률을 산출하는 확률 산출 단계를 수행하고,
    상기 확률 산출 단계에서 도출된 상기 제목 분석 모형, 상기 첫 문장 분석 모형 및 상기 본문 분석 모형에서 산출된 확률 값에 기초하여 적어도 2가지 분석 모형에서 해당 주식 종목에 대한 뉴스 기사일 확률이 임계값 이상인 경우 상기 해당 주식 종목을 태깅 종목으로 결정하는 태깅 종목 결정 단계를 수행하도록 구성되며,
    상기 제목 분석 모형, 상기 첫 문장 분석 모형 및 상기 본문 분석 모형은 각각 사전 학습된 머신러닝 모델을 이용하는 것인, 감성 분석 제공 장치.
KR1020230043864A 2023-04-04 2023-04-04 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템 KR102595682B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230043864A KR102595682B1 (ko) 2023-04-04 2023-04-04 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230043864A KR102595682B1 (ko) 2023-04-04 2023-04-04 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템

Publications (1)

Publication Number Publication Date
KR102595682B1 true KR102595682B1 (ko) 2023-10-30

Family

ID=88557847

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230043864A KR102595682B1 (ko) 2023-04-04 2023-04-04 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템

Country Status (1)

Country Link
KR (1) KR102595682B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070081548A (ko) * 2006-02-13 2007-08-17 주식회사 디알에프앤 뉴스를 이용한 증권정보 제공시스템
KR20100082980A (ko) * 2009-01-12 2010-07-21 울산대학교 산학협력단 품사 및 동형이의어 태깅 방법 및 이를 이용한 단말 장치
KR101987301B1 (ko) 2017-10-30 2019-06-10 주식회사 코스콤 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 감성레벨산출시스템 및 그 제어방법
KR20190114195A (ko) * 2018-03-29 2019-10-10 네이버 주식회사 핵심 키워드 추출 방법 및 시스템
KR102095022B1 (ko) * 2019-10-02 2020-03-30 김근수 기사 분석을 이용한 주식 자동 매매 방법, 장치 및 프로그램
KR102349624B1 (ko) * 2020-09-24 2022-01-10 주식회사 포스코아이씨티 뉴스 크롤링 시스템 및 뉴스 크롤링 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070081548A (ko) * 2006-02-13 2007-08-17 주식회사 디알에프앤 뉴스를 이용한 증권정보 제공시스템
KR20100082980A (ko) * 2009-01-12 2010-07-21 울산대학교 산학협력단 품사 및 동형이의어 태깅 방법 및 이를 이용한 단말 장치
KR101987301B1 (ko) 2017-10-30 2019-06-10 주식회사 코스콤 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 감성레벨산출시스템 및 그 제어방법
KR20190114195A (ko) * 2018-03-29 2019-10-10 네이버 주식회사 핵심 키워드 추출 방법 및 시스템
KR102095022B1 (ko) * 2019-10-02 2020-03-30 김근수 기사 분석을 이용한 주식 자동 매매 방법, 장치 및 프로그램
KR102349624B1 (ko) * 2020-09-24 2022-01-10 주식회사 포스코아이씨티 뉴스 크롤링 시스템 및 뉴스 크롤링 방법

Similar Documents

Publication Publication Date Title
Day et al. Deep learning for financial sentiment analysis on finance news providers
CN110276054B (zh) 一种保险文本结构化实现方法
US20130159348A1 (en) Computer-Implemented Systems and Methods for Taxonomy Development
CN110705286A (zh) 一种基于评论信息的数据处理方法及装置
KR20120109943A (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법
CN111831824A (zh) 一种舆情正负面分类方法
CN111563377A (zh) 数据增强方法与装置
Altaheri et al. Exploring machine learning models to predict harmonized system code
CN116151233A (zh) 数据标注、生成方法、模型训练方法、设备和介质
Shivagangadhar et al. Fraud detection in online reviews using machine learning techniques
Giri et al. Analysis of consumer emotions about fashion brands: An exploratory study
Haddi Sentiment analysis: text, pre-processing, reader views and cross domains
KR102595682B1 (ko) 기업에 대한 뉴스 기사를 이용하여 주식 종목에 대한 감성 분석을 제공하기 위한 방법 및 이를 이용한 장치와 시스템
KR20210001625A (ko) 뉴스 기사의 감성 정보 레이블링에 기초한 기업 부실 정보 서비스 제공 방법 및 그 장치
Tapia et al. Twitter sentiment polarity analysis: A novel approach for improving the automated labeling in a text corpora
US20120265519A1 (en) System and method for object detection
Jayashree et al. Sentimental analysis on voice based reviews using fuzzy logic
Jishtu et al. Prediction of the stock market based on machine learning and sentiment analysis
Barrows et al. Sentiment and objectivity in Iranian state-sponsored propaganda on twitter
Singh et al. Sentiment analysis of Twitter data during Farmers' Protest in India through Machine Learning
Urkude et al. Comparative analysis on machine learning techniques: a case study on Amazon product
Buche et al. Stock Market Forecasting Techniques: A Survey
KR101697992B1 (ko) 다중 개발자 네트워크 기반의 버그 정정 개발자 추천 시스템 및 방법
AlZaabi Correlating Sentiment in Reddit’s Wallstreetbets with the Stock Market Using Machine Learning Techniques
Nam et al. Online Document Mining Approach to Predicting Crowdfunding Success

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant