KR102146546B1 - 상황인지 기반의 기업주가예측 알고리즘 제공 방법 - Google Patents

상황인지 기반의 기업주가예측 알고리즘 제공 방법 Download PDF

Info

Publication number
KR102146546B1
KR102146546B1 KR1020180131717A KR20180131717A KR102146546B1 KR 102146546 B1 KR102146546 B1 KR 102146546B1 KR 1020180131717 A KR1020180131717 A KR 1020180131717A KR 20180131717 A KR20180131717 A KR 20180131717A KR 102146546 B1 KR102146546 B1 KR 102146546B1
Authority
KR
South Korea
Prior art keywords
data
stock price
company
online
indicators
Prior art date
Application number
KR1020180131717A
Other languages
English (en)
Other versions
KR20200053005A (ko
Inventor
이혜영
엄인성
Original Assignee
주식회사 알스피릿
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 알스피릿 filed Critical 주식회사 알스피릿
Priority to KR1020180131717A priority Critical patent/KR102146546B1/ko
Publication of KR20200053005A publication Critical patent/KR20200053005A/ko
Application granted granted Critical
Publication of KR102146546B1 publication Critical patent/KR102146546B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Technology Law (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 일 실시예에 따라, 온라인 데이터에 영향성이 강한 기업을 선정하고, 기업과 연관성이 있는 통계지표와 함께 기업에 대한 온라인 데이터를 크롤링하여 감성분석을 수행하여 기업의 주가를 예측할 수 있다. 또한, 온라인상에서 크롤링한 데이터에 대해 빈도 분석, 감성 분석, 워드 임베딩을 수행하여, 정확도가 높은 키워드를 선별하고 과거 데이터 및 과거 기업의 주가를 통해 예측모델을 생성하고, 이를 통해 미래 주가를 예측하여 정확도가 상대적으로 높은 예측 값을 제공할 수 있다.

Description

상황인지 기반의 기업주가예측 알고리즘 제공 방법 {METHOD FOR PROVIDE ENTERPRISE STOCK FORECASTING ALGORITHM BASED ON SITUATION COGNITION}
본 발명은 상황인지 기반의 기업주가예측 알고리즘 제공 방법에 관한 것으로서, 보다 상세하게는, 온라인 상의 뉴스나, 온라인 서비스 상의 데이터를 크롤링하여, 분석하고 이에 기초하여 예측 모델을 생성하여, 기업의 미래 주가를 예측하는 알고리즘에 관한 것이다.
국내외 기업에 대한 대용량의 기업에 대한 연구 정보들은 누적되어 있으나 다양한 각도에서의 경영 환경분석은 미흡하며 주식시장 온/오프라인 데이터 서비스들 또한 근거 기반한 과학적인 환경 분석 및 투자예측 정확률은 높지 않다는 문제점이 존재하고 있다.
또한, 온라인 뉴스, SNS 등의 온라인 정보가 다양해지면서, 기업의 주가가 온라인 상의 정보나 데이터의 영향을 받는 기업이 다수 존재하며, 이로인해 온라인에서 수집한 데이터의 신뢰성이 높아지고 있다.
이러한 온라인의 데이터에 대해 분석하여, 기업의 이미지나 인지도를 분석하는 방식은 다수 존재하고 있으나, 이에 대한 정확도는 높지 않으며, 단편적인 부분에서만 적용이 되고 있다.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 기업에 대한 온라인 데이터(뉴스, SNS 정보 등)를 크롤링하여, 감성분석을 수행하고, 통계 데이터와 감성지표를 통해 예측 모델을 생성하여, 기업의 미래 주가를 예측하는데 그 목적이 있다.
또한, 업종별로, 유의미한 지표 데이터들을 수집하고, 정제하여 제공 함으로써, 분석과 연구에 있어서, 소요되는 시간을 줄이고, 정확도가 높은 데이터를 제공하여, 신뢰성있는 예측 값을 제공하는데 그 목적이 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예에 따라, 서버에 의해 수행되는 상황인지 기반의 기업주가예측 알고리즘 제공 방법은, (a) 특정 기업에 대한 온라인 상의 데이터를 크롤링 하는 단계; (b) 상기 크롤링 된 온라인 상의 데이터를 감성분석을 수행하여 감성지수를 추출하고, 통계 데이터를 수집하는 단계; (c) 상기 감성지수 및 통계 데이터, 상기 기업의 주가를 기초로 딥러닝을 수행하여 예측 모델을 생성하는 단계; (d) 상기 예측 모델에 기초하여 기업의 미래 주가 예측 값을 산출하는 단계; 를 포함하되, 상기 예측 모델은, 순환 신경망(RNN) 알고리즘에 기반하여 딥러닝 모델인 것이고, 통계 데이터는, 경제지표, 온라인 서비스를 통해 수집된 키워드 데이터를 포함하는 것이고, 상기 기업의 미래 주가 예측 값은, 상기 기업의 실시간 주가를 고려하여 생성될 수 있다.
본 발명의 일 실시예에 따라, 온라인 데이터에 영향성이 강한 기업을 선정하고, 기업과 연관성이 있는 통계지표와 함께 기업에 대한 온라인 데이터를 크롤링하여 감성분석을 수행하여 기업의 주가를 예측할 수 있다.
온라인상에서 크롤링한 데이터에 대해 빈도 분석, 감성 분석, 워드 임베딩을 수행하여, 정확도가 높은 키워드를 선별하고 과거 데이터 및 과거 기업의 주가를 통해 예측모델을 생성하고, 이를 통해 미래 주가를 예측하여 정확도가 상대적으로 높은 예측 값을 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 수행하기 위한 시스템의 구조도 이다.
도 2는 본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 설명하기 위한 순서도 이다.
도 3 내지 도 4는 본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법의 데이터셋을 이용한 알고리즘에 대해 설명하기 위한 순서도 이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.
이하에서 언급되는 " 단말"은 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), VR HMD(예를 들어, HTC VIVE, Oculus Rift, GearVR, DayDream, PSVR 등)등을 포함할 수 있다. 여기서, VR HMD 는 PC용 (예를 들어, HTC VIVE, Oculus Rift, FOVE, Deepon 등)과 모바일용(예를 들어, GearVR, DayDream, 폭풍마경, 구글 카드보드 등) 그리고 콘솔용(PSVR)과 독립적으로 구현되는 Stand Alone 모델(예를 들어, Deepon, PICO 등) 등을 모두 포함한다. 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 스마트폰(smart phone), 태블릿 PC, 웨어러블 디바이스뿐만 아니라, 블루투스(BLE, Bluetooth Low Energy), NFC, RFID, 초음파(Ultrasonic), 적외선, 와이파이(WiFi), 라이파이(LiFi) 등의 통신 모듈을 탑재한 각종 디바이스를 포함할 수 있다. 또한, "네트워크"는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.
이하, 도 1을 참조하여 본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 수행하기 위한 시스템에 대해 구체적으로 설명한다.
본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 수행하기 위한 시스템(10)은, 서버(100) 및 단말(200)을 포함할 수 있으며, 유/무선 네트워크를 통해 통신 연결될 수 있다.
본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 수행하기 위한 서버(100)는, 특정 기업에 대한 온라인 상의 데이터를 크롤링 하고, 크롤링 된 온라인 상의 데이터를 감성분석을 수행하여 감성지수를 추출하고, 통계 데이터를 수집하고 감성지수 및 통계 데이터, 기업의 주가를 기초로 딥러닝을 수행하여 예측 모델을 생성하고 예측 모델에 기초하여 기업의 미래 주가 예측 값을 산출할 수 있다.
이때, 예측 모델은 순환 신경망(RNN) 알고리즘에 기반하여 딥러닝 모델이 될 수 있으며, 통계 데이터는 경제지표, 온라인 서비스를 통해 수집된 키워드 데이터를 포함하고 기업의 미래 주가 예측 값은 기업의 실시간 주가를 고려하여 생성될 수 있다.
또한, 본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 수행하기 위한 단말(200)은, 사용자가 소지하는 디바이스 또는 특정 장소에 설치된 컴퓨팅 장치로서, 기업주가예측 알고리즘 제공 프로그램이 내장되어 있을 수 있다.
단말(200)은, 기업주가예측 알고리즘을 통해 분석하고자 하는 기업을 서버(100)로 제공할 수 있으며, 분석에 대한 결과값을 서버(100)로부터 수신하여, 사용자에게 제공할 수 있다.
이하 도 2를 참조하여, 본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법에 대해 구체적으로 설명한다.
본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법은, 분석 대상 기업이 선정되면, 기업에 대한 온라인 상의 데이터를 크롤링 할 수 있다(S310).
이때, 특정 기업은 경제지표, 온라인 서비스를 통해 수집된 키워드 데이터를 포함하는 온라인 지표에 영향을 받는 기업이며, 영향을 받는 기업에 대한 판단은, 상기 (S310) 단계에서, 크롤링 된 온라인 상의 데이터가 기 설정된 범위를 초과하는 하는 경우, 온라인 지표에 영향을 받는 기업으로 판단할 수 있다.
기 설정된 온라인 상의 데이터에 대한 범위는 데이터의 량이 될 수 있으며, 온라인 뉴스의 개수, SNS를 통해 수집되는 데이터의 개수, 워드 임베딩을 통해 추출되는 데이터의 정확도 등을 기초로 범위를 설정할 수 있다.
이후, 서버(100)는 크롤링 된 온라인 상의 데이터를 감성분석을 수행하여 감성지수를 추출하고, 통계 데이터를 수집할 수 있다(S320).
이때, 온라인 데이터에 대한 감성분석(Sentimental Analysis)은, 소비자의 감성과 관련된 텍스트 정보를 자동으로 추출하는 텍스트 마이닝(Text Mining) 기술로, 문서 또는 온라인 상에서 텍스트를 작성한 사람의 감정을 추출해 내는 기술이며, 문서의 주제보다 어떠한 감정을 가지고 있는가를 판단하여 분석하는 방법이 될 수 있다.
예를 들어, 온라인 쇼핑몰이나 SNS에서 사용자의 상품평에 대한 분석이 대표적 사례가 될 수 있으며, 하나의 상품에 대해 사용자의 좋고 나쁨에 대한 감정을 표현한 결과를 추출하는 형태의 방법이 될 수 있다.
이를 통해 추출된 결과는 감성 지표로 정량화하여, 딥러닝을 수행하기 위한 입력 데이터로 사용될 수 있다.
서버(100)는 크롤링 된 온라인 상의 데이터에 대해, 빈도분석, 워드 임베딩(word embedding)을 수행하여 수집할 통계 지표를 추출할 수 있다.
예를 들어, 대상 기업에 대해, 특정 기간 동안 검색(또는 언급)된, 키워드들에 대해, 검색된 빈도에 따라, 빈도수가 높은 키워드 순으로 선별하여, 제공할 수 있으며, 검색 빈도가 높은 키워드 중 통계 데이터가 존재하는 키워드에 대한 통계 데이터를 수집할 수 있다.
또한, 워드 임베딩(Word Embedding)은, 텍스트를 숫자로 변환한 것으로 동일한 텍스트에 대해 다른 숫자로 표현할 있으며, 단어간의 의미 연관성을 거리 단위의 숫자로 변환하는 방법이 될 수 있다.
예를 들어, 머신 러닝 알고리즘과 딥러닝 아키텍처는 원시 형식의 문자열이나 일반 텍스트를 처리 할 수 없으며, 일종의 직업을 수행하기 위해 숫자가 입력 값으로 입력되어야 하며, 분류, 회귀 등 넓은 의미에서 필요로 하기 때문에 텍스트 형식으로 제공되는 크롤링 된 데이터를 추출하고 워드 임베딩을 수행하여, 딥러닝 모델을 생성하기 위한 입력 데이터를 추출할 수 있다.
즉, 빈도 분석 및 워드 임베딩을 통해 감성지표 이외 입력될 입력 데이터를 추출하고, 수집해야할 통계 데이터를 선별하여, 통계 데이터를 수집할 수 있다.
이후, 서버(100)는 감성지수 및 통계 데이터, 상기 기업의 주가를 기초로 딥러닝을 수행하여 예측 모델을 생성할 수 있다(S330).
즉, (S320) 단계에서 추출된 감성지수 및 (S320) 단계에서 수집된 통계 데이터를 예측모델의 입력 데이터로 설정하고, 기업의 과거 주가를 출력 데이터로 설정하여 딥러닝 모델링을 수행할 수 있다.
예를 들어, 기업의 과거 특정 시점의 통계 데이터 및 온라인 데이터를 수집하여, 입력 데이터로 선별하고, 동일한 시점의 해당 기업의 주가를 출력 데이터로 선별하여, 딥러닝 모델링을 수행할 수 있다.
입력 데이터는 업종, 기업의 이미지, 주력 제품 등의 다양한 요인에 의해 변경될 수 있으며, 특정 기간동안 해당 기업에 대한 연관 검색 등과 같은 키워드에 의해 선정될 수 있다.
본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 수행하기 위한 서버(100)는, (S330) 단계에서 생성된 예측 모델에 기초하여, 기업의 미래 주가를 예측할 수 있다(S340).
이때, 미래 주가 예측을 위해, 입력 데이터는 실시간으로 수집되는 감성지수 및 통계 데이터가 될 수 있다.
본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법의 예측 모델은, 순환 신경망(RNN) 알고리즘에 기반하여 딥러닝 모델이 될 수 있다.
또한, 통계 데이터는 경제지표, 온라인 서비스를 통해 수집된 키워드 데이터를 포함하고 (S340) 단계에서 산출되는 기업의 미래 주가 예측 값은 해당 기업의 실시간 주가를 고려하여 산출될 수 있다.
이하, 도 3 내지 도 4를 참조하여 본 발명의 추가 실시예에 대해 구체적으로 설명한다.
이하에서, 도 4를 참조하여, 상황인지 기반의 기업주가예측 알고리즘 제공 방법의 데이터셋을 이용한 알고리즘에 대해 구체적으로 설명한다.
서버(100)는, 특정 기업의 업종에 대해 복수의 지표 데이터를 수집할 수 있다(S410).
이때, 수집되는 지표는 정량 데이터가 될 수 있으며, 해당 기업의 업종에 대한 사전조사를 통해, 관계성이 있는 데이터를 수집할 수 있다.
이후 서버(100)는, 복수의 지표 데이터에 대해 상관관계분석 및 회귀분석을 통해, 전 업종공통 지표, 업종 필수지표, 업종 활용가능지표를 추출하여, 데이터 셋을 분류할 수 있다(S420).
상관관계분석 및 회귀분석은 각 지표 데이터 간의 관계의 밀접한 정도, 즉 상관관계를 분석하는 통계적 분석 방법으로, 회귀분석에서 지표 데이터 사이의 관계의 신뢰성을 확인할 수 있다.
즉, 도 3에 도시된 바와 같이, 업종별 사전 조사를 수행하고, 해당 업종에 대한 관계성이 있는 데이터를 수집하여, 각 지표 데이터 간 상관관계분석 및 회귀분석을 수행하여, 유의미한 데이터 셋을 분류하여 생성할 수 있다.
(S420)단계에서 분류된 데이터 셋을 기초로, 딥러닝을 수행하여 예측 모델을 생성할 수 있다(S430).
본 발명의 일 실시예에 따르는, 상황인지 기반의 기업주가예측 알고리즘 제공 방법을 수행하기 위한 서버(100)는, (S430) 단계에서 생성된 예측모델에 기초하여, 기업의 미래 주가 예측 값을 산출할 수 있다(S440).
아울러, 본 발명의 추가 실시예에서 사용되는 지표 데이터는 다음과 같은 특징을 가질 수 있다.
전 업종공통 지표, 업종 필수지표, 업종 활용가능지표로 분류될 수 있다.
전 업종 공통 지표는 업종 분석에 있어서, 공통적으로 중요하게 활용되는 지표가 될 수 있으며, ECOS(한국은행 경제통계 시스템)에서 제공하는 소비자 물가지수, 경제심리지수, 관광 수지 등이 될 수 있으며, KOSIS(국가 통계포털)에서 제공하는 유가 및 환율 등이 될 수 있다.
업종 필수 지표는 각 업종 별 판매액이나, 타겟층의 현황이 될 수 있다.
예를 들어, 식품 업종은, 편의점 판매액 지수, 유가 등이 될 수 있으며, 가구 업종의 경우, 혼인 건수, 신설 법인 수 등이 될 수 있다.
활용 가능 지표는, 업종에 따라 연관성이 있는 데이터가 적용될 수 있으며, 업종 필수 지표와 연관성 있는 지표가 선정될 수 있다.
즉, 추가 실시예에 따라, 서버에 의해 수행되는 상황인지 기반의 기업주가예측 알고리즘 제공 방법은 ECOS, KOSIS 등 신뢰성이 높은 통계 데이터를 지표 데이터로 활용하고, 이를 분류하여, 전 처리가 완료된 데이터셋을 생성하고, 이에 기초하여 예측 모델을 생성할 수 있다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능 한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10: 시스템
100: 서버 200: 단말

Claims (6)

  1. 서버에 의해 수행되는 상황인지 기반의 기업주가예측 알고리즘 제공 방법에 있어서,
    (a) 특정 기업에 대한 온라인 상의 데이터를 크롤링 하는 단계;
    (b) 상기 크롤링 된 온라인 상의 데이터를 감성분석을 수행하여 감성지수를 추출하고, 통계 데이터를 수집하는 단계;
    (c) 상기 감성지수 및 통계 데이터, 상기 기업의 주가를 기초로 딥러닝을 수행하여 예측 모델을 생성하는 단계;
    (d) 상기 예측 모델에 기초하여 기업의 미래 주가 예측 값을 산출하는 단계;
    를 포함하되,
    상기 (c) 단계는,
    기 저장된 지표 데이터를 사용하는 경우,
    특정 기업의 업종에 대해, 복수의 지표 데이터를 수집하는 단계;
    상기 복수의 지표 데이터에 대해 상관관계분석 및 회귀분석을 통해, 전 업종공통 지표, 업종 필수지표, 업종 활용가능지표를 추출하여, 데이터 셋을 분류하는 단계;
    상기 데이터셋을 기초로 딥러닝을 수행하여 예측 모델을 생성하는 단계;
    를 포함하며,
    상기 예측 모델은,
    순환 신경망(RNN) 알고리즘에 기반하여 딥러닝 모델인 것이고,
    통계 데이터는,
    경제지표, 온라인 서비스를 통해 수집된 키워드 데이터를 포함하는 것이고,
    상기 기업의 미래 주가 예측 값은,
    상기 기업의 실시간 주가를 고려하여 산출되는 것인,
    상황인지 기반의 기업주가예측 알고리즘 제공 방법.
  2. 제 1 항에 있어서,
    상기 (b) 단계는,
    상기 크롤링 된 온라인 상의 데이터에 대해, 빈도분석, 워드 임베딩(word embedding)을 수행하여 수집할 통계 지표를 추출하는 단계를 더 포함하는,
    상황인지 기반의 기업주가예측 알고리즘 제공 방법.
  3. 제 2 항에 있어서,
    상기 (c) 단계는,
    상기 감성지수 및 상기 통계 데이터를 예측모델의 입력 데이터로 설정하고, 상기 특정 기업의 과거 주가를 출력 데이터로 설정하여 딥러닝 모델링을 수행하는 단계를 더 포함하는,
    상황인지 기반의 기업주가예측 알고리즘 제공 방법.
  4. 제 1 항에 있어서,
    상기 특정 기업은,
    경제지표, 온라인 서비스를 통해 수집된 키워드 데이터를 포함하는 온라인 지표에 영향을 받는 기업이며,
    상기 영향은,
    상기 (a) 단계에서,
    상기 크롤링 된 온라인 상의 데이터 중 온라인 뉴스의 개수, SNS를 통해 수집되는 데이터의 개수가 기 설정된 값을 초과하는 하는 경우, 상기 온라인 지표에 영향을 받는 기업으로 판단하는 것인,
    상황인지 기반의 기업주가예측 알고리즘 제공 방법.
  5. 제 3 항에 있어서,
    상기 (d) 단계는,
    상기 예측모델에 실시간으로 수집된 감성지수 및 상기 통계 데이터를 입력 데이터로 설정하여, 출력 데이터인 상기 미래 주가 예측 값을 산출하는 단계를 더 포함하는,
    상황인지 기반의 기업주가예측 알고리즘 제공 방법.
  6. 삭제
KR1020180131717A 2018-10-31 2018-10-31 상황인지 기반의 기업주가예측 알고리즘 제공 방법 KR102146546B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180131717A KR102146546B1 (ko) 2018-10-31 2018-10-31 상황인지 기반의 기업주가예측 알고리즘 제공 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180131717A KR102146546B1 (ko) 2018-10-31 2018-10-31 상황인지 기반의 기업주가예측 알고리즘 제공 방법

Publications (2)

Publication Number Publication Date
KR20200053005A KR20200053005A (ko) 2020-05-18
KR102146546B1 true KR102146546B1 (ko) 2020-08-21

Family

ID=70912999

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180131717A KR102146546B1 (ko) 2018-10-31 2018-10-31 상황인지 기반의 기업주가예측 알고리즘 제공 방법

Country Status (1)

Country Link
KR (1) KR102146546B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102439206B1 (ko) * 2021-09-14 2022-09-01 주식회사 다인바인 잡 서비스 제공 시스템 및 그의 동작 방법
WO2024058509A1 (ko) * 2022-09-15 2024-03-21 한국과학기술정보연구원 원부자재 공급망 예측 방법 및 그 시스템
KR20240037815A (ko) 2022-09-15 2024-03-22 한국과학기술정보연구원 원부자재 공급망 예측 방법 및 그 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102567495B1 (ko) * 2020-10-14 2023-08-16 정병진 오피니언 마이닝 및 인공신경망을 이용한 비지도학습에 기반한 주식 정보 제공 시스템, 주식 정보 제공 방법 및 기록 매체에 저장된 프로그램
KR102614595B1 (ko) * 2021-04-28 2023-12-14 백석대학교산학협력단 실시간 거시지표 예측 기반 주가 예측 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018041443A (ja) * 2016-07-14 2018-03-15 株式会社シーサイドジャパン ディープラーニング人工神経網基盤のタスク提供プラットフォーム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150015889A (ko) * 2013-08-02 2015-02-11 주식회사 코스콤 선별적 분석 대상의 분석을 통한 주가 예측 방법 및 그 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018041443A (ja) * 2016-07-14 2018-03-15 株式会社シーサイドジャパン ディープラーニング人工神経網基盤のタスク提供プラットフォーム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102439206B1 (ko) * 2021-09-14 2022-09-01 주식회사 다인바인 잡 서비스 제공 시스템 및 그의 동작 방법
WO2024058509A1 (ko) * 2022-09-15 2024-03-21 한국과학기술정보연구원 원부자재 공급망 예측 방법 및 그 시스템
KR20240037815A (ko) 2022-09-15 2024-03-22 한국과학기술정보연구원 원부자재 공급망 예측 방법 및 그 시스템

Also Published As

Publication number Publication date
KR20200053005A (ko) 2020-05-18

Similar Documents

Publication Publication Date Title
KR102146546B1 (ko) 상황인지 기반의 기업주가예측 알고리즘 제공 방법
KR101419504B1 (ko) 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법
Visconti et al. Big data-driven value chains and digital platforms: From value co-creation to monetization
Su et al. Risk assessment for global supplier selection using text mining
Khan Development of an e-commerce sales Chatbot
CN108021651B (zh) 一种网络舆情风险评估方法及装置
KR20200039852A (ko) 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법
TWI705411B (zh) 社交業務特徵用戶的識別方法和裝置
Dinh et al. A survey on context awareness in big data analytics for business applications
Murthy et al. An REA ontology-based model for mapping big data to accounting information systems elements
Saleem et al. Data science and machine learning approach to improve E-commerce sales performance on social web
Puri et al. Survey big data analytics, applications and privacy concerns
Yordanova et al. Major technologies and practical aspects of the digital transformation of business in a big data environment
Mounica et al. Feature selection method on twitter dataset with part-of-speech (PoS) pattern applied to traffic analysis
CN115659995B (zh) 一种文本情感分析方法和装置
CN112685618A (zh) 用户特征识别方法、装置、计算设备及计算机存储介质
KR102322212B1 (ko) 학습 콘텐츠 추천 장치 및 방법
Zheng et al. Big data usage in marketing research
Bhatt et al. Web Scraping: Huge Data Collection from Web
Liu et al. User-generated content analysis for customer needs elicitation
No’aman et al. A Multi-Source Big Data Framework for Capturing and Analyzing Customer Feedback
Patel et al. Opinion Mining of Movie Reviews Using Hybrid Deep Learning Technique
Sakhare et al. E-commerce Product Price Monitoring and Comparison using Sentiment Analysis
Zaghloul et al. Predicting E-commerce customer satisfaction: Traditional machine learning vs. deep learning approaches
Axenbeck et al. Web-Based Innovation Indicators–Which Firm Website Characteristics Relate to Firm-Level Innovation Activity?

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant