KR102105744B1 - 지능형 증권 투자 의사결정 지원 방법 및 그 장치 - Google Patents

지능형 증권 투자 의사결정 지원 방법 및 그 장치 Download PDF

Info

Publication number
KR102105744B1
KR102105744B1 KR1020170163906A KR20170163906A KR102105744B1 KR 102105744 B1 KR102105744 B1 KR 102105744B1 KR 1020170163906 A KR1020170163906 A KR 1020170163906A KR 20170163906 A KR20170163906 A KR 20170163906A KR 102105744 B1 KR102105744 B1 KR 102105744B1
Authority
KR
South Korea
Prior art keywords
company
credit
data
risk
deriving
Prior art date
Application number
KR1020170163906A
Other languages
English (en)
Other versions
KR20190064749A (ko
Inventor
윤병운
정유진
노태연
Original Assignee
신한금융투자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신한금융투자 주식회사 filed Critical 신한금융투자 주식회사
Priority to KR1020170163906A priority Critical patent/KR102105744B1/ko
Publication of KR20190064749A publication Critical patent/KR20190064749A/ko
Application granted granted Critical
Publication of KR102105744B1 publication Critical patent/KR102105744B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)

Abstract

지능형 증권 투자 의사결정 지원 방법에 있어서, (a) 분석 대상 기업과 관련된 뉴스, SNS, 보고서, 공시 자료, 재무제표 데이터, 금융 관련 커뮤니티 게시판 내 게시물 및 댓글 중 적어도 하나를 수집하는 단계; (b) 상기 수집된 공시 자료, 재무제표 데이터 및 뉴스 중 적어도 하나를 이용하여 위험 기업을 스크리닝하는 단계; (c) 상기 뉴스 및 SNS 데이터를 이용하여 단어별 및 문서별 감성값을 도출하고, 상기 도출된 단어별 및 문서별 감성값의 변동 추이를 통해 신용 위험도를 도출하는 단계; 및 (d) 상기 도출된 신용 위험도를 기반으로 시그널을 도출하며, 상기 도출된 시그널을 이용하여 크레딧 이벤트 발생 확률을 예측하는 단계를 포함하는 지능형 증권 투자 의사결정 지원 방법에 제공된다.

Description

지능형 증권 투자 의사결정 지원 방법 및 그 장치{Method and device for intelligent decision support in stock investment}
본 발명은 지능형 증권 투자 의사결정 지원 방법 및 그 장치에 관한 것이다.
최근 인공지능 기술에 관한 관심이 증폭되면서, 기계학습(machine learning), 딥러닝(deep learning) 등에 대한 연구가 활발히 진행되고 있다. 특히 핀테크(Fin-tech) 산업에서는 결제 시스템, 금융 서비스, 은행융자 서비스, 투자 자산운용, 보험 및 시장 인프라 등을 중심으로 기존의 금융 서비스 양사에 큰 변화를 줄 수 있는 혁신이 이루어지고 있다.
또한, 해외 글로벌 ICT(Information and communication technology) 선진 기업들과 여러 스타트업(Start-up) 기업들을 선두로 하여 핀테크 산업이 점점 더 활성화 되고 있다. 특히, 소셜 네트워크 서비스 중 하나인 트위터 게시글 분석을 통해 고객의 성향을 파악하고, 이를 기반으로 한 맞춤형 정보 및 서비스를 제공함으로써 수익 성장률을 향상시키고 있다.
하지만 국내에서는 이러한 성공 사례가 드문데, 이는 국내 모바일 환경과 기술력은 우수한 수준인 반면에 낮은 자율성, 사전 보안성 심의 등 엄격한 국내 금융서비스 규제 환경이 국내 핀테크 산업 내 혁신 활동을 저해하고 있기 때문이다.
인공지능의 한 분야인 기계학습은 훈련데이터를 통해 학습된 속성을 기반으로 예측할 수 있어, 시점 별로 많은 양이 누적된 주가 데이터나 재무제표에 기계학습을 적용하여 주가를 예측하려는 시도가 많이 이루어 졌으나, 예측 수준으로만 진행되었으며 실제 성공사례가 거의 없다.
본 발명은 뉴스 및 SNS에서 수집된 데이터를 기반으로 오피니언 마이닝과 기계학습을 통해 투자 의사결정을 지원할 수 있는 지능형 증권 투자 의사결정 지원 방법 및 그 장치를 제공하기 위한 것이다.
또한, 본 발명은 뉴스 및 SNS 등에서 수집된 데이터를 이용하여 오피니언 마이닝, 감성분석 및 기계학습을 통해 신용 위험도를 예측하며, 이를 통해 위험 시그널을 정의하여 최종적으로 기업의 크레딧 이벤트 발생 가능성을 예측할 수 있는 지능형 증권 투자 의사결정 지원 방법 및 그 장치를 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, 뉴스 및 SNS에서 수집된 데이터를 기반으로 오피니언 마이닝과 기계학습을 통해 투자 의사결정을 지원할 수 있는 지능형 증권 투자 의사결정 지원 방법이 제공된다.
본 발명의 일 실시예에 따르면, 지능형 증권 투자 의사결정 지원 방법에 있어서, (a) 분석 대상 기업과 관련된 뉴스, SNS, 보고서, 공시 자료, 재무제표 데이터, 금융 관련 커뮤니티 게시판 내 게시물 및 댓글 중 적어도 하나를 수집하는 단계; (b) 상기 수집된 공시 자료, 재무제표 데이터 및 뉴스 중 적어도 하나를 이용하여 위험 기업을 스크리닝하는 단계; (c) 상기 뉴스 및 SNS 데이터를 이용하여 단어별 및 문서별 감성값을 도출하고, 상기 도출된 단어별 및 문서별 감성값의 변동 추이를 통해 신용 위험도를 도출하는 단계; 및 (d) 상기 도출된 신용 위험도를 기반으로 시그널을 도출하며, 상기 도출된 시그널을 이용하여 크레딧 이벤트 발생 확률을 예측하는 단계를 포함하는 지능형 증권 투자 의사결정 지원 방법이 제공될 수 있다.
상기 (b) 단계는, 상기 분석 대상 기업이 상장 기업이면, 상기 공시 자료 및 상기 재무 제표 데이터를 이용하여 공시 지표와 재무 지표를 각각 도출하는 단계; 상기 도출된 공지 지표와 재무 지표를 학습된 SVM(support vector machine)에 적용하여 정상 기업과 위험 기업으로 1차 분류하는 단계; 상기 수집된 데이터에서 기정의된 크레딧 이벤트 키워드 출현 빈도를 분석하여 위험 기업을 2차 도출하는 단계; 및 상기 1차 분류와 상기 2차 도출 결과를 종합하여 최종 위험 후보 기업을 선정하는 단계를 포함할 수 있다.
상기 크레딧 이벤트는 유상 증자, 자본 잠식, 회사채, 자사주처분, 액면병합, 분식회계, 무상 감자, 사모펀드, 최대주주 또는 주요 주주 매도, 타인에 대한 채무 보증, 부도, 기업회생절차, 대출원리금 연체사실 발생, 사채원리금 미지급 발생, 조회 공시 및 감면보고서 지연 중 적어도 하나일 수 있다.
상기 (b) 단계는, 상기 분석 대상 기업이 비상장 기업이면, 상기 수집된 뉴스 및 공시 자료 데이터에서 크레딧 이벤트 키워드 발생 빈도를 각각 도출하여 위험 기업을 스크리닝할 수 있다.
상기 (c) 단계는, 상기 분석 대상 기업이 상장 기업인 경우, 상기 수집된 데이터에 포함된 오피니언(opinion)별로 주가를 이용하여 감성극성값을 할당하는 단계; 상기 감성값을 기반으로 긍정 및 부정에 따른 핵심 키워드를 선별하는 단계; 상기 수집된 데이터에서 유의미한 단어를 선별하여 데이터 셋을 만들고, 상기 데이터 셋에 포함된 각 단어의 벡터값을 도출하여 임베딩하는 단계; 상기 벡터 스페이스에서의 상기 핵심 키워드와 상기 단어간의 벡터값을 이용한 거리를 도출하고, 상기 도출된 거리를 기반으로 각각의 단어의 감성값을 도출하는 단계; 문서내에 포함된 각 단어의 감성값을 총합산하여 문서별 감성값을 도출하는 단계; 및 상기 도출된 문서별 감성값의 변동 추이를 이용하여 신용 위험도를 계산하는 단계를 포함할 수 있다.
상기 (c) 단계는, 상기 분석 대상 기업이 비상장 기업인 경우, 감성 사전을 정의하는 단계; 상기 수집된 데이터에서 유의미한 단어를 선별하여 데이터 셋을 만들고, 상기 데이터 셋에 포함된 각 단어의 벡터값을 도출하여 임베딩하는 단계; 상기 감성 사전을 이용하여 상기 벡터 스페이스내의 각 단어에 대한 감성값을 도출하는 단계; 문서내에 포함된 각 단어의 감성값을 합산하여 문서별 감성값을 도출하는 단계; 및 상기 도출된 문서별 감성값의 변동 추이를 이용하여 신용 위험도를 계산하는 단계를 포함할 수 있다.
상기 감성 사전을 정의하는 단계는, 주식 투자 관련 오피니언 별로 감성을 표현하고 있는 데이터를 수집하는 단계; 및 상기 수집된 데이터를 나이브 베이즈 분류(naㅿve bayes classifier)를 이용하여 각 단어의 감성값을 도출하는 단계를 포함할 수 있다.
상기 (d) 단계에서, 상기 시그널의 도출은, 상기 문서별 감성값의 일별 변동 추이를 이용하여 도출될 수 있다.
상기 도출되는 시그널은 문서별 감성값을 이용하여 일정 기간(예를 들어, 3일) 이상 긍정 또는 부정으로 유지하는 시그널, 일 평균 감성값의 증감 시그널, 일 평균 감성값의 교차 시그널, 문서별 감성값의 비율 시그널 및 문서별 주간 감성값 평균 증가율 시그널 중 적어도 하나일 수 있다.
상기 (d) 단계는, 동종 산업 내 기업들의 데이터를 수집하여 로지스틱 회귀분석을 수행하여 일정 기간내에 기정의된 크레딧 이벤트의 발생 여부를 체크하여 산업별 유효 시그널을 각각 도출하는 단계; 상기 산업별 유효 시그널을 이용하여 회귀식을 구축하는 단계; 및 상기 도출된 시그널을 동종 산업의 회귀식에 반영하여 크레딧 이벤트 발생 확률을 예측하는 단계를 포함할 수 있다.
본 발명의 다른 측면에 따르면, 뉴스 및 SNS에서 수집된 데이터를 기반으로 오피니언 마이닝과 기계학습을 통해 투사 의사결정을 지원할 수 있는 지능형 증권 투자 의사결정 지원 방법이 실행되는 장치가 제공될 수 있다.
본 발명의 일 실시예에 따르면, 지능형 증권 투자 의사결정 지원 방법이 실행되는 컴퓨터 장치에 있어서, 통신부; 적어도 하나의 명령어들이 저장되는 메모리; 및 상기 메모리에 저장된 명령어들을 실행하는 프로세서를 포함하되, 상기 프로세서에 의해 실행된 명령어들은, (a) 분석 대상 기업과 관련된 뉴스, SNS, 보고서, 공시 자료, 재무제표 데이터, 금융 관련 커뮤니티 게시판 내 게시물 및 댓글 중 적어도 하나를 수집하는 단계; (b) 상기 수집된 공시 자료, 재무제표 데이터 및 뉴스 중 적어도 하나를 이용하여 위험 기업을 스크리닝하는 단계; (c) 상기 뉴스 및 SNS 데이터를 이용하여 단어별 및 문서별 감성값을 도출하고, 상기 도출된 단어별 및 문서별 감성값의 변동 추이를 통해 신용 위험도를 도출하는 단계; 및 (d) 상기 도출된 신용 위험도를 기반으로 시그널을 도출하며, 상기 도출된 시그널을 이용하여 크레딧 이벤트 발생 확률을 예측하는 단계를 수행하는 것을 특징으로 하는 컴퓨터 장치가 제공될 수 있다.
본 발명의 일 실시예에 따른 지능형 증권 투자 의사결정 지원 방법 및 그 장치를 제공함으로써, 뉴스 및 SNS에서 수집된 데이터를 기반으로 오피니언 마이닝과 기계학습을 통해 투사 의사결정을 지원할 수 있다.
또한, 본 발명은 뉴스 및 SNS 등에서 수집된 데이터를 이용하여 오피니언 마이닝, 감성분석 및 기계학습을 통해 신용 위험도를 예측하며, 이를 통해 위험 시그널을 정의하여 최종적으로 기업의 크레딧 이벤트 발생 가능성을 예측할 수 있다.
도 1은 본 발명의 일 실시예에 따른 지능형 증권 투자 의사결정 지원 장치의 내부 구성을 개략적으로 도시한 블록도.
도 2는 본 발명의 일 실시예에 따른 데이터 수집 모듈의 내부 구성을 도시한 도면.
도 3은 본 발명의 일 실시예에 따른 위험 기업 스크리닝 모듈의 내부 구성을 도시한 도면.
도 4는 본 발명의 일 실시예에 따른 상장 기업에 대한 재무 건전성을 평가하여 위험 기업을 스크리닝하는 방법을 나타낸 순서도.
도 5는 본 발명의 일 실시예에 따른 재무 지표를 예시한 도면.
도 6은 본 발명의 일 실시예에 다른 공시 지표를 예시한 도면.
도 7은 본 발명의 일 실시예에 따른 테스트 기업의 공시 지표 및 재무 지표를 기반으로 SVM을 통해 재무 건전성을 평가하여 위험 기업을 예측한 결과와 실제 기업 크레딧 결과를 비교한 결과를 나타낸 도면.
도 8은 본 발명의 일 실시예에 따른 각 기업별 수집된 데이터내에서의 크레딧 이벤트 발생 빈도를 각각의 키워드별로 정리한 일 예를 설명하기 위해 도시한 도면.
도 9는 본 발명의 일 실시예에 따른 비상장 기업에 대한 재무 건전성을 평가하는 방법.
도 10은 본 발명의 일 실시예에 따른 신용 위험도 계산 모듈을 내부 구성을 도시한 도면.
도 11은 본 발명의 일 실시예에 따른 상장 기업의 신용 위험도를 평가하는 방법을 나타낸 도면.
도 12는 본 발명의 일 실시예에 따른 비상장 기업의 신용 위험도를 평가하는 방법을 나타낸 도면.
도 13은 본 발명의 일 실시예에 따른 의견별 감성값 할당을 설명하기 위해 도시한 도면.
도 14는 본 발명의 일 실시예에 따른 감성 사전 설명을 위해 도시한 도면.
도 15는 본 발명의 일 실시예에 따른 크레딧 이벤트 발생가능성 예측 모듈의 세부 구성을 도시한 도면.
도 16은 본 발명의 일 실시예에 따른 크레딧 이벤트 발생 가능성을 예측 방법을 나타낸 순서도.
도 17은 에는 본 발명의 일 실시예에 따른 시그널들을 설명하기 위해 도시한 도면.
본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세히 설명한다.
본 발명은 공시자료, 재무지표, 텍스트 기반 방법에 의해 위험 기업군을 1차적으로 스크리닝하고, 선정된 기업에 대한 오피니언 마이닝을 통해 위험 시그널을 감지한 후 최종적으로 크레딧 이벤트를 예측하기 위한 것이다.
여기서, 공시 자료에 의해 확인 가능한 크레딧 이벤트는 유상 증자, 자본 잠식, 회사채, 자사주처분, 액면병합, 분식회계, 무상 감자, 사모펀드, 최대주주 또는 주유주주 매도, 타인에 대한 채무 보증, 부도, 기업회생절차, 대출원리금 연체사실 발생, 사채원리금 미지급 발생, 조회 공시 및 감면보고서 지연 중 적어도 하나일 수 있다.
각 크레딧 이벤트에 대해 간략하게 설명하면 다음과 같다. 각 크레딧 이벤트 유형은 경제 용어로 이해와 설명의 편의를 도모하기 위해 간략하게 각 크레딧 이벤트 유형에 대해 간략하게 설명하기로 한다.
유상 증자는 자금을 받고 신규로 추가적인 주식을 발행하여 주식시장을 통해 매각하는 것을 의미한다. 유상 증자는 거래되는 주식의 수가 늘어나기 때문에 기존 주주들의 지분이 희석되는 경향이 있으며, 즉 주식의 수가 증가한다는 것은 회사의 지분을 더 많은 사람들과 나눠야 한다는 의미가 있으므로 이는 주가 하락에 영향을 미치게 된다.
또한, 자본 잠식은 자본금 결손이 일어난 상태로, 적자 등으로 인해 잉여금이 바닥나 원래 기업이 가지고 있는 자기 자본이 줄어드는 현상, 누적된 결손금으로 자기 자본이 자본금보다 적어지는 상태이다. 자본 잠식은 일반적으로 상장 폐지의 조건으로, 50% 이상 자본잠식이 된 경우 관리 종목 편입 사유가 되며, 2년 연석 50% 이상 자본 잠식 상태이거나 완전 자본 잠식 상태인 경우 즉시 퇴출, 상장폐지가 고려된다. 이러한 자본잠식을 벗어나기 위한 가장 손쉬운 방법이 '무상 감자'이다.
또한, 회사채는 유형에 따라 BW(Bond with warrants)와 CB(Conve rtible bond)로 구분된다. BW는 신주인수권과 신주인수권부사채로 구분되며, 신주인수권은 증자를 위해 신주가 발행되는 경우, 우선적으로 신주를 할당받을 수 있는 권리이며, 신주인수권부사채는 신주인수권이 부여된 회사채로 일반 사채와 달리 추가 상장 주식에 대한 매수기회가 포함되어 있는 회사채이다.
BW는 신주를 발행한 만큼 주식수가 증가하는 반면, 기업의 실적에는 변동이 없다. 실적의 개선사항이 없이 주식수만 늘어나게 되므로 한 주식당 이익배분이 줄어들게 되므로 주가 하락의 요인이 된다.
신주인수권 발행 물량이 하루 거래량 수준이면 위험적인 요소가 아니지만, 발행물량이 지분의 10% 이상이라면 주가에 부담으로 작용하게 되며 기존 주주에게 불리하게 작용하여 주가 하락으로 이어진다.
전환사채의 발행은 기존 주주들에게는 좋은 소식이 아니다. 전환사채의 악용 사례를 제외하소 정상적인 경우라면 전화사태의 발행은 기업에 자금이 필요하다는 것을 의미한다. 이는 재무 상태가 악화되어 현금이 필요한 경우 OR 기업의 발전에 긍정적인 투자가 목적일 수도 있다.
자기주식은 회사가 발행한 주식을 일정한 조건이나 사유 등으로 회사가 다시 취득하여 보유 중인 주식을 의미한다. 자사주 처분은 기업의 운영자금 조달을 의미한다. 자사주처분은 시중에 주식 물량이 늘어나기 때문에 주가에 부정적인 영향을 미친다. 자사주처분을 통해 자금을 확보한 기업이 새로운 투자를 통해 기업의 가치를 올릴 수 있기 때문에 단기적으로 악재일 수 있으나 장기적으로는 호재가 될 수도 있다.
액면병합은 액면가가 적은 주식을 합쳐 액면가를 높이는 것을 의미하며, 주식수를 줄이고 주가를 높일 수 있는 방법이다. 액면병합은 주식수를 줄이면서 주가를 높이는 방법으로 기업에서 주가를 끌어 올릴 때 일반적으로 사용하는 방법이다. 또는 낮은 주가의 가격 때문에 기업 이미지가 싸보일 수 있기 때문에 이를 방지하는 효과가 있으며, 회전율은 낮아지지만 주가 관리가 상대적으로 용이해지는 장점도 있다.
분식회계는 재무제표 또는 회계 보고서의 수치를 인위적으로 조작하는 행위로, 과장분식회계, 역분식 회계 등 재무제표 상에서 파악하기 어려우나 한번 발생시 기업 부도 및 상장 폐지 등으로 직접적인 영향을 미칠 수 있다.
무상감자는 주주들에게 아무런 보상도 없이 감자 비율만큼 주식을 가져가 소각하는 것으로 여러 주식을 합친 후 더 적은 수의 주식으로 다시 발생하는 방식을 취하는 게 일반적이다. 감자차익으로 결손금을 메워 자본금을 줄여나가는 것으로 주주 입장에서는 최악이지만, 기업이 유상증자를 추가로 단행하여 주가 부양이 일어나는 경우도 있다. 무상 감자는 대부분 기업으로서는 주주에게 보상을 지급하지 않으므로 자산 총액은 변함이 없으나 무상감자 시 주가는 하락할 수 있다.
사모펀드는 소수의 투자자들로부터 자금을 모아 주식이나 채권 등에 운용하는 펀드이다. 사모펀드는 소수의 장기투자자들로부터 사모방식으로 자금을 끌어 모아 기업 및 금용 기관을 인수하고 구조 조정한 뒤 이를 매각하거나 재상장시켜 투자 자금을 회사하는 전략을 의미한다. 사모펀드는 제한 없이 특정 기업의 주식을 사들일 수 있다는 특성 때문에 재벌들 간의 계열 지원이나 내부 자금 이동의 수단으로 악용된다.
최대주주 또는 주유주주 매도는 기업의 주주들이 자사에 대한 주식을 매도하는 것을 의미한다. 최대 주주가 자주 바뀌는 경우 기업의 사업성이 불안정하다는 방증이다. 또한 내부자 거래 또는 불공정 거래 행위 등이 발생할 가능성이 존재하며, 이는 악재로 작용할 수 있다.
타인에 대한 채무 보증은 타인, 즉 제3 자(최대 주주, 경영진, 타법인 등)이 대출할 때 담보가 부족하여 원하는 만큼의 대출을 하지 못할 경우 회사가 이에 대한 보증인이 되어 대출을 도와주는 것을 의미한다. 이는 부채로 잡히지 않은 부채가 갑자기 발생하여 부수적인 비용이 지출될 수 있어 악재에 해당한다.
부도는 만기가 되어 돌아온 어음이나 수표가 정상적으로 당일 영업시간 종료 전까지 결제되지 못한 경우를 의미한다. 부도가 난 기업은 채무에 대해 상환할 능력이 되지 않은 기업으로, 이에 대한 투자 시 회수가능성은 거의 없다. 부도는 주식시장 및 투자에 직접적인 영향을 미치며, 부도 기업에 대해서는 당좌거래 정지 및 관리종목 지정 등의 불이익을 받게 된다.
기업회생절차는 부채가 과도한 기업에게 재기할 수 있는 기회를 제공하는 제도를 의미한다. 기업회생절차는 한 기업이 사업을 계속할 만한 가치가 있지만 과잉투자 및 금융 사고 등의 문제로 인해 부채를 영업 이익으로 충분히 감당할 수 없을 때 밟게 된다. 회생절차가 불가능할 경우 상장폐지까지 이어질 수 있다.
조회 공시는 주요 경영 사항에 관한 풍문 또는 보도, 발생 주권 등의 가격이나 거래량의 현저한 변동이 있는 경우, 거래소가 답변을 요구하고 반일 이내에 답변하는 공시를 의미한다. 조회 공시는 주식시장에 미미하게 영향을 미칠 수 있으나, 특정 이벤트 발생시 거래소가 직접 답변을 요구하는 공시이므로 관심을 가질 필요가 있다.
감사보고서 지연은 기업 내에 중요한 불확실성이 발생했는데 기업이 자구책을 제시하지 못하거나, 중요한 왜곡표시에 대해 회사가 수정을 거부할 때 주로 발생한다. 이러한 감사보고서 '거절' 의견도 관련 크레딧 이벤트로 볼 수 있으며, '적정' 인 기업 역시 영업 손실 등을 함께 살펴봄으로써 재무불 건전성을 파악할 수 있다.
도 1은 본 발명의 일 실시예에 따른 지능형 증권 투자 의사결정 지원 장치의 내부 구성을 개략적으로 도시한 블록도이며, 도 2는 본 발명의 일 실시예에 따른 데이터 수집 모듈의 내부 구성을 도시한 도면이고, 도 3은 본 발명의 일 실시예에 따른 위험 기업 스크리닝 모듈의 내부 구성을 도시한 도면이며, 도 4는 본 발명의 일 실시예에 따른 상장 기업에 대한 재무 건전성을 평가하여 위험 기업을 스크리닝하는 방법을 나타낸 순서도이며, 도 5는 본 발명의 일 실시예에 따른 재무 지표를 예시한 도면이고, 도 6은 본 발명의 일 실시예에 다른 공시 지표를 예시한 도면이며, 도 7은 본 발명의 일 실시예에 따른 테스트 기업의 공시 지표 및 재무 지표를 기반으로 SVM을 통해 재무 건전성을 평가하여 위험 기업을 예측한 결과와 실제 기업 크레딧 결과를 비교한 결과를 나타낸 도면이며, 도 8은 본 발명의 일 실시예에 따른 각 기업별 수집된 데이터내에서의 크레딧 이벤트 발생 빈도를 각각의 키워드별로 정리한 일 예를 설명하기 위해 도시한 도면이고, 도 9는 본 발명의 일 실시예에 따른 비상장 기업에 대한 재무 건전성을 평가하는 방법이며, 도 10은 본 발명의 일 실시예에 따른 신용 위험도 계산 모듈을 내부 구성을 도시한 도면이고, 도 11은 본 발명의 일 실시예에 따른 상장 기업의 신용 위험도를 평가하는 방법을 나타낸 도면이며, 도 12는 본 발명의 일 실시예에 따른 비상장 기업의 신용 위험도를 평가하는 방법을 나타낸 도면이고, 도 13은 본 발명의 일 실시예에 따른 의견별 감성값 할당을 설명하기 위해 도시한 도면이며, 도 14는 본 발명의 일 실시예에 따른 감성 사전 설명을 위해 도시한 도면이고, 도 15는 본 발명의 일 실시예에 따른 크레딧 이벤트 발생가능성 예측 모듈의 세부 구성을 도시한 도면이며, 도 16은 본 발명의 일 실시예에 따른 크레딧 이벤트 발생 가능성을 예측 방법을 나타낸 순서도이고, 도 17은 에는 본 발명의 일 실시예에 따른 시그널들을 설명하기 위해 도시한 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 지능형 증권 투자 의사결정 지원 장치(100)는 데이터 수집 모듈(110), 위험 기업 스크리닝 모듈(115), 신용 위험도 계산 모듈(120), 크레딧 이벤트 발생가능성 예측 모듈(125)을 포함하여 구성된다.
데이터 수집 모듈(110)은 분석 대상 기업에 대한 온라인 및 SNS상의 데이터를 수집하여 데이터베이스에 저장하기 위한 수단이다.
데이터 수집 모듈(110)은 분석 대상 기업과 관련된 다양한 정보들을 온라인 및 SNS상에서 수집할 수 있다. 다만, 본 발명의 목적이 증권 투자 의사결정을 지원하는 것이므로, 데이터 수집 모듈(110)은 이와 연관된 데이터들을 수집할 수 있다. 데이터 수집 모듈(110)은 웹 크롤링 기법을 통해 온라인 및 SNS상에서 분석 대상 기업과 관련된 데이터를 수집하여 저장할 수 있다. 웹 크롤링 기법 자체는 당업자에게는 자명한 사항이므로 이에 대한 별도의 설명은 생략하기로 한다.
예를 들어, 데이터 수집 모듈(110)은 분석 대상 기업과 관련된 뉴스, 보고서, SNS, 금융 관련 커뮤니티 게시판 내 게시물과 댓글, 공시 자료, 재무제표 데이터 등을 수집하여 데이터베이스에 저장할 수 있다.
도 2에는 데이터 수집 모듈(110)의 내부 구성이 개략적으로 도시되어 있다. 도 2를 참조하면, 본 발명의 일 실시예에 따른 데이터 수집 모듈(110)은 분석 대상 기업과 관련된 뉴스를 수집하여 뉴스 데이터베이스에 저장하고, SNS 데이터를 수집하여 SNS 데이터에 저장하며, 재무제표 데이터를 수집하여 재무제표 데이터베이스에 저장하고, 공시자료를 수집하여 공시자료 데이터베이스에 각각 저장할 수 있다
위험 기업 스크리닝 모듈(115)은 기업별 수집된 데이터(예를 들어, 공시 자료와 재무제표 데이터)를 분석하여 재무 건전성을 평가한 후 위험 기업을 스크리닝하기 위한 수단이다.
분석 대상 기업에 따라 공시 자료와 재무제표 데이터를 이용 가능한 경우와 이용이 불가능한 경우로 구분된다. 즉, 상장된 기업의 경우 공시 자료와 재무제표 데이터를 이용 가능하나 비상장 기업의 경우 공시 자료와 재무제표 데이터 이용이 불가능하다.
따라서, 이를 각각 구분하여 별도로 설명하기로 한다.
도 3에는 위험 기업 스크리닝 모듈(115)의 내부 구성이 도시되어 있다. 도 3에 도시된 바와 같이, 위험 기업 스크리닝 모듈(115)은 기업 유형이 상장 기업인지 비상장 기업인지에 따라 재무 건전성 평가 방법을 달리하여 위험 기업을 스크리닝할 수 있다.
우선, 상장 기업에 대한 재무 건전성을 평가하여 위험 기업을 스크리닝하는 방법에 대해 도 4를 참조하여 보다 상세히 설명하기로 한다.
단계 410에서 위험 기업 스크리닝 모듈(115)은 기업별로 수집된 데이터를 구조화한다.
데이터 구조화 단계에서는 우선, 기업별로 수집된 데이터를 기반으로 재무제표 데이터에서 크레딧 이벤트에 영향을 미치는 세부 항목들을 계산하여 재무지표를 도출한다.
또한, 재무제표를 이용하여 SPL 등급 산출 모형을 기반으로 사업성, 수익성 및 안정성 지표를 각각 도출한 후 이들 각각의 지표를 지정된 비율로 반영하여 최종적으로 재무지표를 도출할 수 있다. 즉, 위험 기업 스크리닝 모듈(115)은 도출된 재무지표를 기반으로 분석 대상 기업의 재무 건전성을 평가하여 위험 기업을 스크리닝할 수 있다.
재무 지표를 도출하기 위한 각 세부 지표들에 대한 도출 방법 및 각 세부 지표들의 반영 비율은 도 4에 도시된 바와 같다.
도 5를 참조하여, 각각의 재무 지표를 도출하기 위한 세부 지표들을 도출하는 방법에 대해 간략하게 설명하기로 한다.
도 5에 도시된 바와 같이, 재무 지표를 도출하기 위해, 사업성 지표, 수익성 지표 및 안정성 지표를 각각 도출해야 하며, 사업성 지표를 30%, 수익성 지표를 35%, 그리고 안정성 지표를 35% 반영하여 최종적으로 재무 지표를 도출할 수 있다.
각각의 지표를 도출하는 방법에 대해 설명하기로 한다.
사업성 지표는 자산 규모 지표와 자산의 질 지표를 도출한 후 이를 각각 45%와 55% 반영하여 사업성 지표를 도출할 수 있다. 이때, 자산 규모 지표와 자산의 질 지표는 각각 도 5에 정의된 방법 중 어느 하나의 방법으로 도출될 수 있다.
또한, 수익성 지표는 사업성과 지표와 성과의 질 지표를 도출한 후 이를 각각 60%와 40% 반영하여 최종 수익성 지표를 도출할 수 있다. 사업성과 지표와 성과의 질 지표를 도출하는 수식은 도 4에 도시된 바와 같다.
안정성 지표는 재무부담 지표와 상환 능력 지표를 각각 도 5에 정의된 수식으로 도출한 후 이를 각각 55%, 45% 반영하여 안정성 지표를 도출할 수 있다.
또한, 위험 기업 스크리닝 모듈(115)은 공지 지표를 도출한다. 예를 들어, 위험 기업 스크리닝 모듈(115)은 크레딧 이벤트 발생년도를 포함하여 과거 일정 기간(예를 들어, 2년 또는 4년 등)의 공시 자료를 분석하여 지표로 활용할 수 있다. 위험 기업 스크리닝 모듈(115)은 공시 지표를 도출함에 있어 도 6에 도시된 지표들의 발생 횟수를 도출하여 공시 지표를 도출할 수 있다.
본 발명의 일 실시예에서 크레딧 이벤트 발생에 영향을 미치는 공시 자료를 정리한 일 예가 도 6에 도시되어 있다.
데이터 구조화를 통해 재무 지표와 각 세부 항목이 도출되며, 공시 지표(공시 건수)가 각각 도출되면, 단계 415에서 위험 기업 스크리닝 모듈(115)은 구조화된 데이터를 SVM(support vector machine)에 적용하여 정상 기업과 위험 기업으로 각각 분류한다. SVM 알고리즘 자체는 공지된 기술이므로 이에 대한 별도의 설명은 생략하기로 한다.
SVM은 수집된 과거 기업 데이터로 크레딧 이벤트 발생군과 정상상환 군을 구분하여 학습되어 있는 것을 가정하기로 한다. 이와 같이, 학습된 SVM에 독립 변수로 재무지표(사업성, 수익성, 안정성을 평가하는 세부 항목)와 비재무지표(신용도에 영향을 미치는 것으로 판단되는 공시 지표(건수))를 이용하며, 종속 변수로 크레딧 이벤트 발생 여부를 설정하여 정상 기업과 위험 기업을 1차적으로 스크리닝할 수 있다.
도 7에는 테스트 기업의 공시 지표 및 재무 지표를 기반으로 SVM을 통해 재무 건전성을 평가하여 위험 기업을 예측한 결과와 실제 기업 크레딧 결과를 비교한 결과가 예시되어 있다.
도 7에 도시된 바와 같이, 기업별 공시 지표 및 재무지표를 SVM에 적용하여 정상 기업과 위험 기업을 각각 분류할 수 있다. 그러나, 도 7에 도시된 바와 같이, 위험 기업 스크리닝 모듈(115)은 각 기업의 공시 지표 및 재무 지표를 기반으로 SVM을 통해 재무 건전성을 평가하여 위험 기업을 예측하는 경우 재무 건전성이 양호한 것으로 평가되었으나, 실제적으로는 위험 기업인 경우가 있을 수 있다.
도 7에서 보여지는 바와 같이, SVM 분석을 통해 부도 기업으로 예측된 우전 기업의 경우 실제 상장 폐지된 결과와 일치하는 것을 알 수 있다. 그러나 SVM 분석 결과 정상 기업으로 예측되었으나, 실제 상장 폐지 또는 워크 아웃된 위험 기업이 포함되어 있는 것을 알 수 있다.
따라서, 단계 420에서 위험 기업 스크리닝 모듈(115)은 수집된 데이터에서 기정의된 크레딧 이벤트 키워드 발생여부를 파악하여 위험 기업들을 선별할 수 있다.
예를 들어, 위험 기업 스크리닝 모듈(115)은 수집된 데이터내에서 기정의된 크레딧 이벤트 키워드들의 발생 횟수를 각각 카운트하여 크레딧 이벤트가 발생하는지를 분석하여 위험 기업들을 스크리닝할 수 있다.
도 8에는 각 기업별 수집된 데이터내에서의 크레딧 이벤트 발생 빈도를 각각의 키워드별로 정리한 후 위험 기업들을 선별한 일 예가 도시되어 있다.
지금까지 도 4 내지 도 8을 참조하여 상장 기업에 대한 재무 건전성을 평가하여 위험 기업을 스크리닝하는 방법에 대해 설명하였다.
도 9를 참조하여 비상장 기업에 대한 재무 건전성을 평가하는 방법에 대해 설명하기로 한다.
단계 910에서 위험 기업 스크리닝 모듈(115)은 수집된 뉴스 및 공시 보고서를 기반으로 기업별/기사별 크레딧 이벤트를 정의한다.
비상장 기업은 재무제표 데이터를 이용할 수 없으므로, 비상장 기업의 경우 뉴스나 공시 보고서만을 이용하여 재무 건전성을 평가해야 한다. 따라서, 뉴스 및 공시 보고서에서 크레딧 이벤트에 관련된 특정 키워드를 도출함으로써 비상장 기업별로 어떤 크레딧 이벤트가 발생하였는지를 정의한다.
단계 915에서 위험 기업 스크리닝 모듈(115)은 크레딧 이벤트 관련 키워드의 출현 여부를 기사별로 파악한다.
단계 920에서 위험 기업 스크리닝 모듈(115)은 시점별 크레딧 이벤트 발생 빈도(키워드 출현 빈도) 및 성장률을 계산하여 비상장 기업 중 위험 기업을 1차적으로 스크리닝한다.
도 9에서 도시된 바와 같이, 위험 기업 스크리닝 모듈(115)은 비상장 기업의 경우 재무제표 데이터를 이용할 수 없으므로, 뉴스 및 공시 자료를 기반으로 크레딧 이벤트 발생 여부를 활용하여 위험 기업을 선정할 수 있다.
다시 도 1을 참조하면, 신용 위험도 계산 모듈(120)은 위험 기업으로 선정된 기업들에 대한 신용 위험도를 도출하기 위한 수단이다.
신용 위험도 계산 모듈(120)은 위험 기업으로 선정된 기업들에 대해 현재 신용 위험도를 도출하기 위한 수단이다. 여기서, 신용 위험도는 뉴스 및 SNS 데이터를 이용하여 텍스트 및 문서 수준에서의 감성값, 감성값의 변동 추이 등을 활용한 지표를 의미한다.
도 10에는 신용 위험도 계산 모듈(120)의 상세 구조가 도시되어 있다. 도 10에 도시된 바와 같이, 신용 위험도 계산 모듈(120)은 상장 기업과 비상장 기업에 따라 일부 구성이 상이할 수 있다.
우선, 이해와 설명의 편의를 도모하기 위해 도 11을 참조하여 상장 기업의 신용 위험도를 도출하는 방법에 대해 설명하기로 한다.
단계 1110에서 신용 위험도 계산 모듈(120)은 분석 대상 기업에 대해 수집된 데이터를 전처리한다. 뉴스 또는 SNS상에서 분석 대상 기업에 대해 수집된 데이터에서 불필요한 정보와 광고 등을 제거하며, 감성 분석 및 워드 임베딩 분석을 위해 파싱할 수 있다.
단계 1115에서 신용 위험도 계산 모듈(120)은 주가를 이용하여 의견별로 감성값을 할당한다.
신용 위험도 계산 모듈(120)은 전처리된 데이터에서 각 의견 데이터에 대해 주가를 이용하여 긍정 또는 부정의 감성값을 할당할 수 있다.
당일 주가는 과거 3일간의 의견이 주가 등락에 영향을 미치는 것을 반영하기 위해, 본 발명의 일 실시예에 따른 신용 위험도 계산 모듈(120)은 당일 주가를 기준으로 1일, 2일, 3일전 주가와 비교하여 1일, 2일 및 3일전 의견 데이터에 각각 감성값을 할당할 수 있다. 여기서, 감성값은 긍정 또는 부정일 수 있다.
이와 같이, 의견 데이터에 대해 감성값이 할당된 이후, 신용 위험도 계산 모듈(120)은 감정이 할당된 의견 데이터를 나이브 베이즈 분류(Navie Bayes classifier) 를 이용하여 각 단어의 감성극성값을 할당한다. 여기서, 나이브 베이즈 분류를 통해 상대적으로 긍정 데이터에서 많이 출현하는 단어는 양수, 부정적 데이터에서 많이 출연하는 단어는 음수로 도출될 수 있다.
나이브 베이즈 분류 자체는 공지된 기술이므로 이를 기반으로 각 단어의 극성값을 도출하는 상세한 설명은 생략하기로 한다.
단계 1120에서 신용 위험도 계산 모듈(120)은 나이브 베이즈 분류에 의해 감성값이 할당된 단어들 중에서 감성값의 절대값이 큰 가장 큰 n(자연수)개의 긍정 및 부정 단어를 핵심 키워드로 각각 선정한다.
단계 1125에서 신용 위험도 계산 모듈(120)은 수집된 데이터에서 유의미한 단어를 추출한 후 추출된 단어들의 벡터값을 도출하여 임베딩한다.
예를 들어, 신용 위험도 계산 모듈(120)은 수집된 데이터에 대해 불필요한 정보인 기호, 숫자 등과 같은 노이즈를 제거한다. 이어, 신용 위험도 계산 모듈(120)은 수집된 데이터에서 각각의 단어를 추출하고, 각 단어에 대해 품사를 태깅할 수 있다. 이때, 명사와 동사를 제외한 불필요한 데이터를 제거하여 단어의 데이터 셋을 만들 수 있다.
신용 위험도 계산 모듈(120)은 이와 같이 구성된 단어 데이터 셋에 포함된 각 단어들에 대한 벡터값을 생성한 후 임베딩할 수 있다. 이때 벡터의 차원은 n차원일 수 있다.
신용 위험도 계산 모듈(120)은 단어 데이터 셋에 대해 단어들의 동시 출현 빈도를 기반으로 벡터값을 생성할 수 있다.
예를 들어, 신용 위험도 계산 모듈(120)은 word2vec를 이용하여 각 단어를 임베딩할 수 있다. 여기서, word2vec는 당업자에는 자명한 사항이므로 이에 대한 별도의 설명은 생략하기로 한다.
단계 1130에서 신용 위험도 계산 모듈(120)은 워드 임베딩된 각 단어와 핵심 키워드의 거리를 이용하여 단어별및 문서별 감성값을 도출한다.
예를 들어, 각 단어 및 핵심 키워드는 각각 벡터값으로 변환되어 임베딩되어 있으므로, 벡터 스페이스에서 핵심 키워드와 각 단어의 벡터값간의 차이를 기반으로 거리를 도출할 수 있으며, 이를 기반으로 단어별 감성값을 도출할 수 있다.
예를 들어, 단어별 감성값을 이용하여 문서 내 단어의 출현 빈도와 각 단어의 감성값을 곱한 후 이를 총합하여 문서별 감성값을 계산할 수 있다.
단계 1135에서 신용 위험도 계산 모듈(120)은 문서별 감성값의 변동 추이를 기반으로 신용 위험도를 계산하고, 이를 이용하여 크레딧 이벤트 발생 이전의 위험 시그널을 감지한다. 이때, 각 일자별 감성값은 앞에서 계산한 문서별 감성값의 평균값을 이용하여 도출될 수 있다.
예를 들어, 신용 위험도 계산 모듈(120)은 문서별 감성값의 변동 추이, 즉 3일 이상 유지 여부 등을 통해 신용 위험도를 계산할 수 있다.
본 발명의 일 실시예에 따른 신용 위험도는 수집된 뉴스 및 소셜 데이터를 활용하여 텍스트 및 문서 수준에서의 감성점수(감성값), 감성 점수의 변동 추이 등을 활용한 통합 모니터링 지표를 나타낸다. 따라서, 신용 위험도 지표를 통해 향후 투자에 위험이 발생할 수 있는 시그널을 정의할 수 있다.
지금까지 도 11을 이용하여 상장 기업에 대한 신용 위험도를 평가하는 방법에 대해 설명하였다.
이하에서는 도 12를 참조하여 비상장 기업에 대한 신용 위험도를 평가하는 방법에 대해 상세히 설명하기로 한다.
단계 1210에서 신용 위험도 계산 모듈(120)은 감성 사전을 정의한다.
시가 정보가 없는 비상장 기업은 주가 관점에서 감성값 할당이 어려우므로, 금융 시장에서 많이 활용하는 용어들에 대한 감성 사전을 정의하여 이를 별도로 이용하기로 한다.
예를 들어, 네이버 등 포탈 금융에 등록되어 있는 모든 기업 관련 의견(opinion)을 기반으로 각 의견에 대한 감성극성값을 먼저 할당한 후 나이브 베이즈 분류를 통해 각 단어에 대한 감성값을 할당한다. 해당 문서가 부정이면 문서 내 단어들에 대해 부정 감성값이 할당되고 전체 문서에 대해 이 과정을 반복함으로써 단어별 감성점수가 도출될 수 있다.
의견별 감성값을 할당한 일 예가 도 13에 도시되어 있다. 이를 기반으로 사전 정의된 감성 사전의 일부가 도 14에 도시되어 있다.
도 14에서 보여지는 바와 같이, 감성 사전내의 각 단어는 긍정 단어와 부정 단어로 구분되며, 각각의 단어는 감성값을 가지고 있다.
단계 1215에서 신용 위험도 계산 모듈(120)은 수집된 데이터에서 유의미한 단어를 추출한 후 추출된 단어들의 벡터값을 도출하여 임베딩한다.
단계 1220에서 신용 위험도 계산 모듈(120)은 감성 사전을 이용하여 단어별/문서별 감성값을 계산한다.
예를 들어, 신용 위험도 계산 모듈(120)은 사전에 정의된 감성 사전을 이용하여 단어별 감성값을 전파할 수 있다. 이어, 각 단어별 감성값을 이용하여 문서별 감성값을 도출할 수 있다.
단계 1225에서 신용 위험도 계산 모듈(120)은 문서별 감성값의 변동 추이를 기반으로 신용 위험도를 계산하고, 이를 이용하여 크레딧 이벤트 발생 이전의 위험 시그널을 감지한다. 이때, 각 일자별 감성값은 앞에서 계산한 문서별 감성값의 평균값을 이용하여 도출될 수 있다.
예를 들어, 신용 위험도 계산 모듈(120)은 문서별 감성값의 변동 추이, 즉 3일 이상 유지 여부 등을 통해 신용 위험도를 계산할 수 있다.
다시 도 1을 참조하여 크레딧 이벤트 발생가능성 예측 모듈(125)은 신용 위험도가 높은 기업들에 대해 로지스틱 회귀분석을 통해 개별 크레딧 이벤트 발생 가능성을 예측한다.
도 15에는 크레딧 이벤트 발생가능성 예측 모듈(125)의 세부 구성이 도시되어 있으며, 이를 기반으로 크레딧 이벤트 발생 가능성을 예측하는 방법이 도 16에 도시되어 있다.
도 16을 참조하여 이에 대해 보다 상세히 설명하기로 한다.
단계 1610에서 크레딧 이벤트 발생가능성 예측 모듈(125)은 일자별 감성값의 변동 추이(증감 추이)를 이용하여 신용 위험도 관점에서의 시그널을 도출한다. 도 17에는 본 발명의 일 실시예에 따른 시그널들이 정의되어 있다.
문서별 감성값을 이용하여 일정 기간(예를 들어, 3일) 이상 긍정 또는 부정으로 유지하는 시그널, 일 평균 감성값의 증감 시그널, 일 평균 감성값의 교차 시그널, 문서별 감성값의 비율 시그널, 문서별 주간 감성값 평균 증가율 시그널을 각각 정의할 수 있다.
단계 1615에서 크레딧 이벤트 발생가능성 예측 모듈(125)은 도출된 시그널을 이용하여 산업 수준에서의 유효 시그널을 정의한다.
동종 산업 내 기업들의 데이터를 수집하여 로지스틱 회귀분석을 수행하여, 영향력이 있는 시그널(유효 시그널)만을 이용하여 회귀식을 구축한다. 예를 들어, 로지스틱 회귀분석을 통해 크레딧 이벤트에 영향을 미치는 유효 시그널은 크레딧 이벤트 별로 다르게 정의되며, 이를 이용하여 산업별, 크레딧 이벤트별 예측 모형을 각각 구축할 수 있다. .
단계 1620에서 크레딧 이벤트 발생가능성 예측 모듈(125)은 분석 대상 기업에 대해 도출된 시그널을 이용하여 크레딧 이벤트 발생 가능성(확률)을 예측한다.
예를 들어, 크레딧 이벤트 발생가능성 예측 모듈(125)은 분석 대상 기업에 상응하는 크레딧 이벤트 예측 모형(즉, 회귀식)에 분석 대상 기업에 상응하여 도출된 시그널을 입력함으로써 크레딧 이벤트 발생 확률을 예측할 수 있다.
이와 같이, 본 발명의 일 실시예에 따른 지능형 증권 투자 의사결정 지원 장치(100)는 분석 대상 기업에 대한 온라인 및 SNS상 데이터를 수집한 후 오피니언 마이닝과 기계 학습을 이용하여 분석 대상 기업의 증권 투자 위험 시그널을 감지함으로써 변동성이 높은 증권 시장에서의 예측을 가능하게 할 수 있다.
또한, 도 1에 따른 지능형 증권 투자 의사결정 지원 장치(100)는 컴퓨터일 수 있다. 만일 지능형 증권 투자 의사결정 지원 장치(100)가 컴퓨터인 경우, 메모리 및 프로세서를 포함할 수 있으며, 도 1에서 설명된 각각의 구성은 프로세서에서 수행되는 논리적 구성일 수 있다.
본 발명의 실시 예에 따른 장치 및 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야 통상의 기술자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

Claims (12)

  1. 지능형 증권 투자 의사결정 지원 방법에 있어서,
    (a) 데이터 수집 모듈이 웹 크롤링 기법을 통해 분석 대상 기업과 관련된 정보로서, 금융 관련 커뮤니티 게시판 내 게시물 및 댓글, 뉴스, SNS, 보고서, 공시 자료, 재무제표 데이터를 수집하는 단계;
    (b) 위험 기업 스크리닝 모듈이 상기 수집된 공시 자료, 재무제표 데이터 및 뉴스 중 적어도 하나를 이용하여 위험 기업을 스크리닝하는 단계;
    (c) 신용 위험도 계산 모듈이 상기 뉴스 및 SNS 데이터를 이용하여 단어별 및 문서별 감성값을 도출하고, 상기 도출된 단어별 및 문서별 감성값의 변동 추이를 통해 신용 위험도를 도출하는 단계; 및
    (d) 크레딧 이벤트 발생가능성 예측 모듈이 상기 도출된 신용 위험도를 기반으로 시그널을 도출하며, 상기 도출된 시그널을 이용하여 크레딧 이벤트 발생 확률을 예측하는 단계를 포함하고,
    상기 (b) 단계는,
    상기 위험 기업 스크리닝 모듈은, 상기 분석 대상 기업이 상장 기업이면, 상기 공시 자료 및 상기 재무 제표 데이터를 이용하여 공시 지표와 재무 지표를 각각 도출하여, 상기 도출된 공지 지표와 재무 지표를 크레딧 이벤트 발생군과 정상상환 군을 구분하여 학습된 SVM(support vector machine)에 적용하여 정상 기업과 위험 기업으로 분류하고, 상기 수집된 데이터에서 기정의된 크레딧 이벤트 키워드 출현 빈도를 분석하여 위험 기업을 도출하여 최종 분석 후보 기업을 선정하고,
    상기 위험 기업 스크리닝 모듈은, 상기 분석 대상 기업이 비상장 기업이면, 상기 수집된 뉴스 및 공시 자료 데이터에서 크레딧 이벤트 키워드 발생 빈도를 각각 도출하여 위험 기업을 스크리닝하고,
    상기 (c) 단계는,
    상기 신용 위험도 계산 모듈은, 상기 분석 대상 기업이 비상장 기업인 경우, 오피니언 별로 감성을 표현하는 데이터를 수집하는 단계;
    상기 신용 위험도 계산 모듈이 상기 수집된 데이터를 나이브 베이즈 분류(naive bayes classifier)에 기초할 때 긍정 데이터에서 상대적으로 많이 출현하는 단어는 양수로 도출하고 부정적 데이터에서 상대적으로 많이 출현하는 단어는 음수로 하여 각 단어의 감성값을 도출하는 단계;
    상기 신용 위험도 계산 모듈이 상기 수집된 데이터에서 유의미한 단어를 선별하여 데이터 셋을 만들고, 상기 데이터 셋에 포함된 각 단어의 벡터값을 도출하여 임베딩하는 단계;
    상기 신용 위험도 계산 모듈이 감성 사전을 이용하여 벡터 스페이스내의 각 단어에 대한 감성값을 도출하는 단계;
    상기 신용 위험도 계산 모듈이 문서내에 포함된 각 단어의 감성값을 합산하여 문서별 감성값을 도출하는 단계; 및
    상기 신용 위험도 계산 모듈이 상기 도출된 문서별 감성값의 변동 추이를 이용하여 신용 위험도를 계산하는 단계;
    를 포함하는 지능형 증권 투자 의사결정 지원 방법.
  2. 제1 항에 있어서,
    상기 (b) 단계는,
    상기 위험 기업 스크리닝 모듈은, 상기 분석 대상 기업이 상장 기업이면, 상기 공시 자료 및 상기 재무 제표 데이터를 이용하여 공시 지표와 재무 지표를 각각 도출하는 단계;
    상기 위험 기업 스크리닝 모듈이 상기 도출된 공지 지표와 재무 지표를 학습된 SVM(support vector machine)에 적용하여 정상 기업과 위험 기업으로 1차 분류하는 단계;
    상기 위험 기업 스크리닝 모듈이 상기 수집된 데이터에서 기정의된 크레딧 이벤트 키워드 출현 빈도를 분석하여 위험 기업을 2차 도출하는 단계; 및
    상기 위험 기업 스크리닝 모듈이 상기 1차 분류와 상기 2차 도출 결과를 종합하여 최종 분석 후보 기업을 선정하는 단계를 포함하는 것을 특징으로 하는 지능형 증권 투자 의사결정 지원 방법.
  3. 제2 항에 있어서,
    상기 크레딧 이벤트는 유상 증자, 자본 잠식, 회사채, 자사주처분, 액면병합, 분식회계, 무상 감자, 사모펀드, 최대주주 또는 주주 매도, 타인에 대한 채무 보증, 부도, 기업회생절차, 대출원리금 연체사실 발생, 사채원리금 미지급 발생, 감면보고서 지연 및 조회 공시 중 적어도 하나인 것을 특징으로 하는 지능형 증권 투자 의사결정 지원 방법.
  4. 삭제
  5. 제1 항에 있어서, 상기 (c) 단계는,
    상기 신용 위험도 계산 모듈은, 상기 분석 대상 기업이 상장 기업인 경우, 상기 수집된 데이터에 포함된 오피니언(opinion)별로 주가를 이용하여 감성극성값을 할당하는 단계;
    상기 신용 위험도 계산 모듈이 상기 감성극성값을 기반으로 긍정 및 부정에 따른 핵심 키워드를 선별하는 단계;
    상기 신용 위험도 계산 모듈이 상기 수집된 데이터에서 유의미한 단어를 선별하여 데이터 셋을 만들고, 상기 데이터 셋에 포함된 각 단어의 벡터값을 도출하여 임베딩하는 단계;
    상기 신용 위험도 계산 모듈이 상기 임베딩 된 벡터 값의 벡터 스페이스에서의 상기 핵심 키워드와 상기 단어간의 벡터값을 이용한 거리를 도출하고, 상기 도출된 거리를 기반으로 각각의 단어의 감성값을 도출하는 단계;
    상기 신용 위험도 계산 모듈이 문서내에 포함된 각 단어의 감성값을 총합산하여 문서별 감성값을 도출하는 단계; 및
    상기 신용 위험도 계산 모듈이 상기 도출된 문서별 감성값의 변동 추이를 이용하여 신용 위험도를 계산하는 단계를 포함하는 것을 특징으로 하는 지능형 증권 투자 의사결정 지원 방법.
  6. 삭제
  7. 삭제
  8. 제1 항에 있어서,
    상기 (d) 단계에서,
    상기 크레딧 이벤트 발생가능성 예측 모듈이 상기 문서별 감성값의 일별 변동 추이를 이용하여 상기 시그널을 도출하는 것을 특징으로 하는 지능형 증권 투자 의사결정 지원 방법.
  9. 제8 항에 있어서,
    상기 도출되는 시그널은 문서별 감성값을 이용하여 일정 기간 이상 긍정 또는 부정으로 유지하는 시그널, 일 평균 감성값의 증감 시그널, 문서별 감성값의 비율 시그널 및 문서별 주간 감성값 평균 증가율 시그널 중 적어도 하나인 것을 특징으로 하는 지능형 증권 투자 의사결정 지원 방법.
  10. 제1 항에 있어서,
    상기 (d) 단계는,
    상기 크레딧 이벤트 발생가능성 예측 모듈이 동종 산업 내 기업들의 데이터를 수집하여 로지스틱 회귀분석을 수행하여 일정 기간내에 기정의된 크레딧 이벤트의 발생 여부를 체크하여 산업별 유효 시그널을 각각 도출하는 단계;
    상기 크레딧 이벤트 발생가능성 예측 모듈이 상기 산업별 유효 시그널을 이용하여 회귀식을 구축하는 단계; 및
    상기 크레딧 이벤트 발생가능성 예측 모듈이 상기 도출된 시그널을 동종 산업의 회귀식에 반영하여 크레딧 이벤트 발생 확률을 예측하는 단계를 포함하는 것을 특징으로 하는 지능형 증권 투자 의사결정 지원 방법.
  11. 제1 항, 제2항, 제3항, 제5항, 제8항, 제9항, 제10 항 중 어느 하나의 항에 따른 방법을 수행하기 위한 프로그램 코드를 기록한 컴퓨터로 판독 가능한 기록매체.
  12. 삭제
KR1020170163906A 2017-12-01 2017-12-01 지능형 증권 투자 의사결정 지원 방법 및 그 장치 KR102105744B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170163906A KR102105744B1 (ko) 2017-12-01 2017-12-01 지능형 증권 투자 의사결정 지원 방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170163906A KR102105744B1 (ko) 2017-12-01 2017-12-01 지능형 증권 투자 의사결정 지원 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20190064749A KR20190064749A (ko) 2019-06-11
KR102105744B1 true KR102105744B1 (ko) 2020-05-29

Family

ID=66847120

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170163906A KR102105744B1 (ko) 2017-12-01 2017-12-01 지능형 증권 투자 의사결정 지원 방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR102105744B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024058509A1 (ko) * 2022-09-15 2024-03-21 한국과학기술정보연구원 원부자재 공급망 예측 방법 및 그 시스템
KR20240051453A (ko) 2022-10-13 2024-04-22 주식회사 빅머니랩 주식 종목별 맞춤형 파라미터와 프로그램 코드를 생성하는 서버의 작동 방법, 컴퓨터 프로그램, 및 이를 이용한 주식 매매 정보 제공 방법

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102225859B1 (ko) * 2019-04-02 2021-03-11 주식회사 자이냅스 기업 부실 징후 시점 예측 장치 및 방법
CN110543475A (zh) * 2019-08-29 2019-12-06 深圳市原点参数科技有限公司 一种基于机器学习的财务报表数据自动识别和分析方法
KR102342321B1 (ko) 2019-11-20 2021-12-22 세종대학교산학협력단 딥러닝 기반의 주식 스크리닝과 이를 이용한 포트폴리오 자동화 및 고도화 방법 및 장치
KR102329232B1 (ko) * 2019-11-27 2021-11-18 광운대학교 산학협력단 기술적 지표 및 감성 지표를 기반으로 하는 테마주 주가 예측 장치 및 방법
KR20210082880A (ko) 2019-12-26 2021-07-06 주식회사 하나금융티아이 주제 키워드 기반 투자 유니버스 구성 방법 및 시스템
KR102345481B1 (ko) * 2019-12-30 2022-01-03 주식회사 씽크풀 인공지능 기반의 종목연관 키워드 결정방법 및 그 시스템
KR102193228B1 (ko) * 2020-02-19 2020-12-18 주식회사 페어랩스 딥러닝 기반 비재무정보 평가 장치 및 그 방법
KR102686760B1 (ko) * 2020-11-26 2024-07-19 주식회사 씽크풀 인공지능 기반의 이슈 금융종목 결정방법 및 그 시스템
KR102541636B1 (ko) * 2022-10-02 2023-07-04 주식회사 마블트리 비상장기업의 주식 거래를 위한 정보제공 및 중개 서비스 제공방법
KR102534656B1 (ko) * 2022-11-17 2023-05-26 주식회사 도킹블록 뉴럴 네트워크를 이용하여 특정 지표에 따라 특정 데이터에 대해 리밸런싱을 수행하는 방법 및 장치
KR102666173B1 (ko) * 2022-11-24 2024-05-17 주식회사 티톡 금융 소비자 맞춤형 공시 분석 정보 제공 장치 및 방법
CN118096393B (zh) * 2024-04-24 2024-07-16 华安证券股份有限公司 金融产品的违约预警方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100771506B1 (ko) * 2006-02-13 2007-10-30 주식회사 디알에프앤 뉴스를 이용한 증권정보 제공시스템
KR101597939B1 (ko) * 2015-07-02 2016-02-25 한국기업데이터 주식회사 거시경제지표를 활용한 산업별 신용위험도 예측 장치 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090076673A (ko) * 2008-01-09 2009-07-13 (주)엠위즈텍 증권종목별 등급에 따른 투자제한형 투자관리시스템
KR101907041B1 (ko) * 2012-12-17 2018-10-11 한국전자통신연구원 소셜 웹 콘텐츠에서의 예측 기반 리스크 관리 장치 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100771506B1 (ko) * 2006-02-13 2007-10-30 주식회사 디알에프앤 뉴스를 이용한 증권정보 제공시스템
KR101597939B1 (ko) * 2015-07-02 2016-02-25 한국기업데이터 주식회사 거시경제지표를 활용한 산업별 신용위험도 예측 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024058509A1 (ko) * 2022-09-15 2024-03-21 한국과학기술정보연구원 원부자재 공급망 예측 방법 및 그 시스템
KR20240051453A (ko) 2022-10-13 2024-04-22 주식회사 빅머니랩 주식 종목별 맞춤형 파라미터와 프로그램 코드를 생성하는 서버의 작동 방법, 컴퓨터 프로그램, 및 이를 이용한 주식 매매 정보 제공 방법

Also Published As

Publication number Publication date
KR20190064749A (ko) 2019-06-11

Similar Documents

Publication Publication Date Title
KR102105744B1 (ko) 지능형 증권 투자 의사결정 지원 방법 및 그 장치
Bariviera et al. Where do we stand in cryptocurrencies economic research? A survey based on hybrid analysis
Veganzones et al. Corporate failure prediction models in the twenty-first century: a review
Olson et al. Using accounting ratios to distinguish between Islamic and conventional banks in the GCC region
Chen Classifying credit ratings for Asian banks using integrating feature selection and the CPDA-based rough sets approach
Cai et al. Trends in fintech research and practice: Examining the intersection with the information systems field
Miyajima Exchange rate volatility and pass‐through to inflation in South Africa
Yoshino et al. A comprehensive method for credit risk assessment of small and medium-sized enterprises based on Asian data
Allen et al. Tax specific versus generic accounting-based textual analysis and the relationship with effective tax rates: Building context
Dimitras et al. Evaluation of empirical attributes for credit risk forecasting from numerical data
Felix et al. Effect of global financial meltdown on the Nigerian banking industry and economy
Vuković et al. Corporate bankruptcy prediction: evidence from wholesale companies in the Western European countries
Umar et al. Board of directors and bankruptcy risk using GMM approach
Okezie et al. Capital ratios as predictors of distress: A case study of the Nigerian banking system
Vartholomatou et al. Corporate bonds, exchange rates and business strategy
Yohannes Financial Distress Conditions of Commercial Banks in Ethiopia: An Application of Altman's Z-Score 1993 Model.
Meursault The language of earnings announcements
Wahua et al. Coronavirus pandemic and financial soundness of fidelity bank Ghana limited: Evidence from 2019 and 2020 financials
Chen et al. Understand funding liquidity and market liquidity in a regime‐switching model
Oladutire et al. Return on assets and market stock prices of quoted deposit money banks in Nigeria
Karthik et al. Prediction of wilful defaults: an empirical study from Indian corporate loans
Ghosh et al. Is Altman’s Model efficient in predicting bankruptcy?–A comparison among the Altman Z-score, DEA, and ANN models
Moore BANK PERFORMANCE PREDICTION DURING THE'GREAT RECESSION'OF 2008-'09: A PATTERN-RECOGNITION APPROACH.
Jacobs Jr Benchmarking alternative interpretable machine learning models for corporate probability of default
Khojasteh et al. Credit Risk Measurement of Trusted Customers Using Logistic Regression and Neural Networks

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant