KR102105319B1 - Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법 - Google Patents

Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법 Download PDF

Info

Publication number
KR102105319B1
KR102105319B1 KR1020190115921A KR20190115921A KR102105319B1 KR 102105319 B1 KR102105319 B1 KR 102105319B1 KR 1020190115921 A KR1020190115921 A KR 1020190115921A KR 20190115921 A KR20190115921 A KR 20190115921A KR 102105319 B1 KR102105319 B1 KR 102105319B1
Authority
KR
South Korea
Prior art keywords
esg
unit
news
news articles
company
Prior art date
Application number
KR1020190115921A
Other languages
English (en)
Other versions
KR20190110084A (ko
Inventor
윤덕찬
대히야 와순다라
임지연
세르게이 렉시코브
Original Assignee
지속가능발전소 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지속가능발전소 주식회사 filed Critical 지속가능발전소 주식회사
Priority to KR1020190115921A priority Critical patent/KR102105319B1/ko
Publication of KR20190110084A publication Critical patent/KR20190110084A/ko
Application granted granted Critical
Publication of KR102105319B1 publication Critical patent/KR102105319B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)

Abstract

ESG 기반의 기업 평가 수행 장치 및 이의 작동 방법이 개시된다. 본 발명의 다양한 실시예 중 하나에 따른 ESG 기업 평가 장치는 인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터링을 수행하는 뉴스 수집부; 상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 뉴스 분류부; 및 클러스터 단위로 해당 클러스터에 대한 ESG 리스크를 계산하고 계산한 값을 토대로 ESG 기업 평가 점수를 산출하는 평가 결과 도출부를 포함하여 구성될 수 있으며, 상기 평가 결과 도출부는, 상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 클러스터 단위로 증거 레벨 산출을 수행하는 증거 레벨 산출부; 상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 ESG 확률 산출부; 및 ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 점수산출부를 포함하여 구성될 수 있다.

Description

ESG 기반의 기업 평가 수행 장치 및 이의 작동 방법{ESG BASED ENTERPRISE ASSESSMENT DEVICE AND OPERATING METHOD THEREOF}
본 발명의 다양한 실시예는 ESG 기반의 기업 평가 수행 장치 및 이의 작동 방법에 관한 것으로, 인터넷 상의 뉴스 기사들을 수집하고 분석하여 기업들이 가지고 있는 환경, 사회 또는 지배구조의 이슈와 관련된 리스크를 분석하고 점수화하는 장치 및 이의 작동 방법에 관한 기술이다.
최근 기업들이 리스크 관리에 보다 많은 신경을 기울이면서, 자 기업과 타 기업들을 다방면으로 평가하고 이와 같은 평가 결과를 투자, 합병, 생산 라인에 대한 리스크 관리 등에 응용하고 있다.
일반적으로 기업들은 정량적으로 획득할 수 있는 재무적인 데이터들을 토대로 기업들을 평가하는 것이 일반적이었으나, 최근 들어서 비재무적인 데이터를 토대로 기업을 평가하고 리스크를 분석하는 방법론이 부각되고 있다. 기업들이 공개하는 재무적 데이터에는 해당 기업에게 불리한 내용이 반영되지 않으며, 기업이 제공하는 재무 관련 보고서에 대한 신뢰성 또한 의문시되는 실정이다. 비재무 데이터를 통한 기업 분석이 필요한 이유를 살펴보면, 사람들의 인터넷을 통한 SNS 활동이 활발해지면서, 기업 또는 제품에 대한 특정한 소문이 퍼지거나 하는 사건 등에 의해 기업 평판이 흔들리는 경우도 있으며 기업 오너의 범죄나 건강 관련 소문들에 의해 해당 기업이 가지는 리스크가 높아지는 경우도 있으나 이와 같은 사건들은 재무적 데이터를 통해 분석하기 어려운 것이 현실이다. 따라서, 재무적인 데이터뿐 아니라 비재무적인 데이터를 통해 기업을 분석함으로써 보다 정밀한 기업 평가가 가능해질 수 있다.
이와 같은 흐름에서, 비재무 데이터들을 ESG(Environmnet, Social, Governance)의 세 주제로 나누어서 분석하는 방법론이 부각되고 있다.
ESG와 같은 비재무 데이터를 토대로 기업들에 대한 평가 보고서를 작성하는 기업들이 생겨났지만, 비재무 데이터는 주관적 성격이 강하고 보고서가 작성되는 속도도 상대적으로 느려 기업들이 이를 활용하기에 힘든 점들이 존재하였다. 이러한 단점들을 개선하기 위해 컴퓨터 프로그램 등이 인터넷 상에서 ESG에 관한 뉴스 기사들을 수집하여 자동으로 분석하여 기업 평가를 수행하게 함에 있어서도, 뉴스 기사들은 정형화된 데이터가 아니어서 뉴스 기사들의 분류와 평가를 자동화하는 과정에서 어려움이 다수 존재하였다.
국내공개특허 제 10-2006-0096432호
본 발명의 다양한 실시예는 상기와 같은 문제점을 해결하기 위해 도출된 것으로, 인터넷 상의 뉴스 기사들을 수집하여 이를 토대로 기업들에 대한 평가를 ESG 기반으로 수행하는 것을 목적으로 한다.
본 발명의 다른 목적은 수집한 뉴스 기사들 간의 유사도 분석을 통해 동일한 사건에 대해 다루고 있는 뉴스 기사들을 클러스터링하는 것이다.
본 발명의 또다른 목적은 ESG 기업 평가를 수행하는 장치가 머신 러닝 알고리즘을 채택하고 학습을 수행하도록 함으로써, 수집한 뉴스들을 카테고리화 함에 있어서의 성능을 향상시키는 것이다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위해, 본 발명의 일 실시예는 ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 ESG 기업 평가 장치에 있어서, 인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터링을 수행하는 뉴스 수집부; 상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 뉴스 분류부; 및 클러스터 단위로 해당 클러스터에 대한 ESG 리스크를 계산하고 계산한 값을 토대로 ESG 기업 평가 점수를 산출하는 평가 결과 도출부를 포함하며, 상기 평가 결과 도출부는, 상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 클러스터 단위로 증거 레벨 산출을 수행하는 증거 레벨 산출부; 상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 ESG 확률 산출부; 및 ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 점수산출부를 포함하는, ESG 기업 평가 장치를 제공한다.
상기 증거 레벨 산출부는, 각 카테고리 항목에 포함되는 단어의 빈도수를 토대로 상기 카테고리 항목에 대한 순위 설정 또는 증거 레벨 산출을 클러스터 단위로 수행할 수 있다.
상기 ESG 확률 산출부는, 상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 환경, 사회, 지배구조, 기업리스크 및 기타 관련 문제의 분류를 가지는 집합으로 분류할 수 있다.
상기 ESG 확률 산출부는, 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산함에 있어, 환경, 사회 또는 지배구조에 대해 산출된 증거 레벨을 기초로 하는 것을 특징으로 할 수 있다.
상기와 같은 목적을 달성하기 위해, 본 발명의 다른 실시예는 ESG 기업 평가 장치가 ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 방법에 있어서, 인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터화를 수행하는 단계; 상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 단계; 상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 하여 클러스터 단위로 증거 레벨 산출을 수행하는 단계; 추출된 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 단계; 및 ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 단계를 포함하는, ESG 기업 평가 장치의 점수 산출 방법을 제공한다.
본 발명의 일 실시예에 따르면, ESG 기업 평가가 자동화되어 수행됨으로써, ESG 기업 평가가 도출되는 속도가 향상될 수 있다.
본 발명의 다른 실시예에 따르면, 머신 러닝에 의하여 뉴스 기사들을 분류하는 성능이 계속하여 향상되는 기업 평가 장치가 제공될 수 있다.
본 발명의 또다른 실시예에 따르면, 다양한 종류의 언어로 작성된 뉴스 기사들에 대한 분석을 수행하여 이를 토대로 기업을 평가할 수 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 ESG 기업 평가가 수행되는 흐름을 개략적으로 나타낸 개념도이다.
도 2는 본 발명의 일 실시예에 따른 EGS 기업 평가 모듈의 구성을 개략적으로 표시한 블록도이다.
도 3은 증거 레벨 산출부가 뉴스 기사들에서 추출된 명사들을 카테고리화 하는 방법을 설명하기 위한 도표이다.
도 4는 증거 레벨 산출부가 카테고리 항목에 포함되는 단어의 개수를 토대로 항목의 순위를 설정하고, 정규화하며, 정규화한 수치를 토대로 증거 레벨을 산출하는 방법을 설명하기 위한 도표이다.
도 5는 본 발명의 일 실시예에 따른 ESG 확률 산출부가 각 클러스터에 대한 ESG 확률 산출을 수행한 결과를 나타내는 도표이다.
도 6은 본 발명의 일 실시예에 따른 ESG 기업 평가 장치가 뉴스 기사들을 수집하는 과정부터 ESG 기업 평가 점수를 도출하는 과정을 개략적으로 나타낸 블록도이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
도 1은 본 발명의 일 실시예에 따른 ESG 기업 평가가 수행되는 흐름을 개략적으로 나타낸 개념도이다.
본 발명에서 개시하는 ESG 기업 평가는 컴퓨터 소프트웨어의 형태로 구현된 프로그램에 의해 자동화되어 수행될 수 있다. 즉, 도 1에서 예시되는 각각의 방법들은 ESG 기업 평가를 수행하는 ESG 기업 평가 장치(100)에 탑재된 소프트웨어에 의해 연산 처리됨으로써 수행될 수 있다.
도 1을 참조하면, ESG 기업 평가 장치(100)는 세 가지 단계를 통해 최종 기업 평가 결과를 산출할 수 있다. 도 1의 (a)를 살펴보면, ESG 기업 평가 장치(100)는 우선적으로 기업 평가를 수행할 기본 자료인 뉴스 기사들을 인터넷 상에서 수집할 수 있다. ESG 기업 평가 장치(100)는 뉴스 기사들을 수집함에 있어, 형태소 분석 및 문서 간 유사도 계산 등을 통해 뉴스가 어떠한 기업에 대한 것인지, 어떠한 주제에 대한 것인지 등을 판단하고 일차적으로 유사한 기사들끼리 분류하는 클러스터링을 수행할 수 있다.
도 1의 (b)를 참조하면, ESG 기업 평가 장치(100)는 수집되어 일차적으로 클러스터링된 뉴스 기사들을 바탕으로, 보다 정밀한 뉴스 기사 분류 작업을 수행할 수 있다. ESG 기업 평가 장치(100)는 뉴스 기사 분류 작업을 수행함에 있어, 수집된 뉴스가 ESG와 관련된 것인지, 즉, 환경, 사회 또는 지배구조 중 적어도 어느 하나와 관련된 것인지를 우선적으로 판단하고, 이후에 수집된 뉴스가 환경, 사회, 지배구조 중 어느 주제와 관련이 있는지를 판단하여 분류할 수 있다. 최종적으로, ESG 기업 평가 장치(100)는 환경, 사회, 지배구조의 세가지 주제로 분류된 뉴스 기사 각각에 대해 보다 세밀한 카테고리 분류를 수행할 수 있다.
도 1의 (c)를 참조하면, ESG 기업 평가 장치(100)는 분류된 뉴스 기사들을 토대로, 최종적인 기업 평가 점수를 도출할 수 있다. 이 과정에서 ESG 기업 평가 장치(100)는 뉴스 기사에 포함된 주요 단어들에 대한 증거 레벨 산출, 뉴스 기사들이 환경, 사회, 지배구조 중 어디에 속할지에 대한 확률 산출 등을 클러스터 단위로 수행할 수 있다.
설명의 편의를 위해 본 발명의 ESG 기업 평가 장치(100)가 세 단계를 거쳐 최종적인 ESG 기업 평가 점수를 도출하는 것으로 도시하고 설명하였으나, 이와 같은 단계는 분할되거나 통합되어 이보다 적은 수 혹은 많은 수의 단계로 구현될 수 있음은 물론이다.
도 2는 본 발명의 일 실시예에 따른 EGS 기업 평가 모듈(100)의 구성을 개략적으로 표시한 블록도이다.
도 2를 참조하면, ESG 기업 평가 장치(100)는 제어부(110), 뉴스 수집부(120), 뉴스 분류부(130), 평가 결과 도출부(140), 통신부(150) 및 저장부(160)를 포함하여 구성될 수 있다. 또한, 뉴스 수집부(120)는 형태소 분석부(121), 기업 및 날짜 분류부(122) 및 뉴스 클러스터링부(123)를, 뉴스 분류부(130)는 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)를, 평가 결과 도출부(140)는 증거 레벨 산출부(141), ESG 확률 산출부(142) 및 점수 산출부(143)를 각각 포함할 수 있다.
설명의 편의를 위하여 ESG 기업 평가 장치(100) 내에서 각각의 역할을 수행하는 주체들을 ~부의 형태로 표시하였으나, 각각의 부분들은 ESG 기업 평가 장치(100) 내에서 동작하는 서브 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 각 동작을 수행하거나, 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하는 개념이지만, 이에 제한되지는 않는다.
일 실시예에 따른 제어부(110)는 뉴스 수집부(120), 형태소 분석부(121), 기업 및 날짜 분류부(122), 뉴스 클러스터링부(123), 뉴스 분류부(133), 이원 분류부(131), ESG 분류부(132), 카테고리 분류부(133), 평가 결과 도출부(140), 증거 레벨 산출부(141), ESG 확률 산출부(142), 점수 산출부(143), 통신부(150) 및 저장부(160) 간의 데이터 흐름을 제어하는 기능을 수행할 수 있다. 즉, 본 발명에 따른 제어부(110)는 뉴스 수집부(120), 형태소 분석부(121), 기업 및 날짜 분류부(122), 뉴스 클러스터링부(123), 뉴스 분류부(133), 이원 분류부(131), ESG 분류부(132), 카테고리 분류부(133), 평가 결과 도출부(140), 증거 레벨 산출부(141), ESG 확률 산출부(142), 점수 산출부(143), 통신부(150) 및 저장부(160)에서 각각 고유한 기능을 수행하도록 제어할 수 있다.
일 실시예에 따른 뉴스 수집부(120)는 전술한 바와 같이 형태소 분석부(121), 기업 및 날짜 분류부(122) 및 뉴스 클러스터링부(123)를 포함할 수 있다. ESG 기업 평가 장치(100)가 기업 평가를 수행하기 위해서는 인터넷 상에서 발행되는 수많은 뉴스 기사들 중에 기업의 환경, 사회 또는 지배구조와 관련 있는 뉴스 기사만을 수집할 필요가 있으며, 신뢰할 수 있는 출처로부터 뉴스를 획득하여야 허위의 뉴스 등에 의한 잘못된 평가를 생성하지 않을 수 있다. 뉴스 수집부(120)는 인터넷 상에서 업데이트되는 뉴스 기사들을 주기적인 시간 간격을 가지고 수집할 수 있으며, 뉴스 기사들을 수집함에 있어 각각의 뉴스 기사가 발행된 날짜 정보, 해당 뉴스를 발행한 언론 매체 정보 등을 함께 수집할 수 있다. 뉴스 수집부(120)의 뉴스 기사 수집은 ESG 기업 평가 장치(100) 내의 통신부(150)를 통해 이루어질 수 있다.
형태소 분석부(121)는 수집한 뉴스 기사의 텍스트 전체를, 의미를 갖는 최소 단위인 형태소 단위로 분석할 수 있다. 일 실시예에 따른 형태소 분석부(121)는 한국어로 작성된 뉴스 기사를 분석할 경우, 다양한 한국어 형태소 분석기 중 하나를 선택하여 이를 통한 분석을 수행할 수 있다. 일 실시예에 따르면, 한국어 형태소 분석기로는 kiwi, HAM, HLX, Mecab 등 다양한 종류가 존재하는데, 형태소 분석부(121)는 이 중 하나를 이용하여 형태소 분석을 수행하고 그 결과를 활용할 수 있다. 다른 실시예에 따르면, 형태소 분석부(121)는 한국어가 아닌 다른 언어로 작성된 뉴스를 분석함에 있어서는 해당 언어에 해당하는 형태소 분석기를 이용하여 형태소 분석을 수행할 수 있다.
기업 및 날짜 분류부(122)는 수집된 뉴스 기사들을 기업별 및 날짜별로 분류할 수 있다. 기업 및 날짜 분류부(122)는 기업명들이 데이터베이스 형태로 구축되어 있는 기업 사전을 활용하여 특정 기사가 어느 기업에 대한 기사인지를 판단할 수 있다. 기업 및 날짜 분류부(122)는 특정 기사가 어느 기업에 대한 기사인지를 판단한 후, 해당 기사가 발행된 날짜를 확인하여, 기간별로 뉴스 기사들을 정리할 수 있다. 일 실시예에 따르면, 기업 및 날짜 분류부(122)는 기업별로 뉴스 기사들을 분류한 후에, 같은 기업에 관련된 뉴스를 일주일 기간 별로 혹은 한달 기간 별로 분류할 수 있다. 이와 같은 기간별 분류는 ESG 기업 평가 장치(100)가 추후에 기업 평가를 수행함에 있어 최신의 뉴스 기사가 가중치를 갖는 방식으로 계산하는데 활용될 수 있다.
뉴스 클러스터링부(123)는 수집된 뉴스 기사들에서 동일한 이슈를 다루는 관련 뉴스들을 하나의 클러스터로 구성할 수 있다. 뉴스 클러스터링부(123)는 다수의 뉴스 기사가 동일 이슈를 다루는 관련 뉴스인지를 확인하기 위해 뉴스 기사들간의 유사도 계산을 수행할 수 있다.
일 실시예에 따르면, 뉴스 클러스터링부(123)가 뉴스 기사들 간의 유사도 계산을 수행하는 방식은, 각 문서를 벡터화한 후 각 벡터간의 코사인 유사도 계산을 통하는 것일 수 있다.
뉴스 클러스링부(123)는 TF-IDF(Term Frequency - Inverse Document Frequency)를 이용하여 각 뉴스 기사를 벡터화 할 수 있다. TF(Term Frequency)는 특정한 단어가 문서 내에서 등장하는 빈도수를 나타내는 값으로, 이 값이 높을수록 문서에서 해당 단어가 중요하다고 여겨질 수 있다. 수집된 복수의 뉴스 기사들 내에서 특정 단어가 등장하는 빈도수를 DF(Document Frequency)로 나타낼 수 있는데, 이 값의 역수가 IDF(Inverse Document Frequency)이다. 특정 단어가 복수의 뉴스 기사들 사이에서 빈번하게 등장한다면 그 단어는 상투적인 단어가 되어 뉴스 기사에서 핵심적인 단어가 될 수 없기 때문에 DF가 아닌 IDF를 사용하는 것이다. TF-IDF는 TF와 IDF를 곱한 값으로 정의되며, 본 발명의 일 실시예에 따른 뉴스 클러스터링부(123)가 뉴스 기사에 대한 TF-IDF를 계산하는 방식은 수학식 1을 사용하는 것일 수 있다.
Figure 112019096328484-pat00001
상기 수학식 1에서 tfi.j는 뉴스 기사 j에서 단어 i가 등장하는 빈도를 나타내며, dfi는 뉴스 기사들로 구성된 집단에서 단어 i를 포함하고 있는 뉴스 기사의 수를 나타낸다.
뉴스 클러스터링부(123)는 상기 수학식 1을 토대로 각각의 뉴스 기사를 벡터화할 수 있으며, 각각의 뉴스 기사의 벡터값을 토대로 뉴스 기사들 간의 유사도를 계산할 수 있다.
Figure 112019096328484-pat00002
일 실시예에 따르면, 뉴스 클러스터링부(123)는 상기 수학식 2를 통해 뉴스 기사들 간의 유사도를 계산할 수 있다. 수학식 2에서 A와 B는 각각의 벡터이며, Ai와 Bi는 각각 A와 B 벡터에서의 i번째 성분을 의미한다. 뉴스 기사들 간의 코사인 유사도는 0에서 1 사이의 숫자로 계산되며, 0은 뉴스 기사들이 서로 독립적인 경우, 1은 뉴스 기사들이 서로 완전히 동일한 경우를 의미한다.
뉴스 클러스링부(123)는 뉴스 기사들 간의 유사도를 계산한 후, 사전에 실험을 통해 설정된 기준값을 토대로 뉴스 기사들이 유사한지 아닌지를 판단할 수 있으며, 유사하다고 판단된 뉴스 기사들을 하나의 클러스터로 묶을 수 있다. 이하, 명세서에서 '클러스터'라 함은 뉴스 클러스터링부(123)에 의해 유사한 뉴스로 판단된 뉴스 기사들의 집합을 의미한다.
일 실시예에 따른 뉴스 분류부(130)는 전술한 바와 같이 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)를 포함할 수 있다. 뉴스 분류부(130)는 뉴스 수집부(120)에 의해 수집된 뉴스 기사들을 세 가지 기준에 따라 분류할 수 있다. 뉴스 분류부(130)는 이원 분류부(131)를 통해 뉴스 기사들을 일차적으로 분류하고, 다음으로 ESG 분류부(132)를 통해 분류하며, 최종적으로 카테고리 분류부(133)를 통해 분류할 수 있다. 이 과정에서 뉴스 기사들은 보다 세밀한 기준으로 분류될 수 있다.
이원 분류부(131)는 수집된 뉴스 기사 각각이 ESG와 관련된 것인지를 판단하여 참거짓(True or false)의 방식으로 분류할 수 있다. 즉, 이원 분류부(131)는 수집된 뉴스가 ESG 기업 평가에 사용될 수 있는 데이터인지를 판단하는데, 환경, 사회, 지배구조 중 적어도 하나와 관련이 있다고 판단하면 TRUE로 분류하고, 그렇지 않다면 FALSE로 분류할 수 있다. 따라서, 이원 분류부(131)는 스포츠, 연예, 정치, 예술 등과 같이 ESG 기업 평가에 있어 필요하지 않은 뉴스 기사들을 FALSE로 분류함으로써, ESG 기업 평가 장치(100)가 처리해야 할 뉴스 기사들의 양을 상당히 감소시킬 수 있다.
일 실시예에 따르면, ESG 분류부(132)는 이원 분류부(131)에서 TRUE로 분류된 뉴스 기사들을 환경, 사회, 지배구조의 세 이슈로 분류할 수 있다. 이후, 분류된 뉴스 기사들은 카테고리 분류부(133)에 의해 보다 세분화된 카테고리들로 분류될 수 있다. 즉, 환경, 사회, 지배구조의 이슈가 각각 보다 세밀한 하부 카테고리들로 나누어지며, 하나의 뉴스 기사는 카테고리 분류부(130)에 의해 하부 카테고리 중 어느 하나에 속하게 된다.
일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 머신 러닝 알고리즘을 이용하여 뉴스 기사들의 분류를 수행할 수 있다.
이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)가 머신 러닝 알고리즘을 이용하여 분류를 수행하는 방식을 살펴보면, 우선적으로 자연어 분석을 통해 뉴스 기사에서 명사만을 추출할 수 있다. 일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 한국어로 구성된 뉴스 기사에서 명사만을 추출함에 있어 자연어 분석 패키지의 한 종류인 KoNLP를 사용할 수 있다. 다른 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 다른 언어로 구성된 뉴스 기사에서 명사를 추출하기 위해서 해당 언어에 알맞은 분석 툴을 사용할 수 있다.
이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 뉴스 기사에서 명사만을 추출한 후에, 수학식 1을 통해 전술한 TF-IDF를 이용하여 행렬을 생성할 수 있다. TF-IDF를 이용하여 생성되는 행렬은 뉴스 클러스링부(123)에 의해 분류된 클러스터 별로 생성될 수 있다. 일 실시예에 따르면, 생성된 행렬에서 행에는 각각의 뉴스 기사에 포함된 단어(명사)가 나열될 수 있고, 열에는 각각의 단어(명사)에 대해 해당 단어가 포함되어 있는 뉴스 기사가 나열될 수 있다.
이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 이후, TF-IDF를 이용하여 생성한 행렬을 토대로 머신 러닝 알고리즘을 통해 각각의 분류부의 역할에 맞는 분류를 수행할 수 있다. 일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 특정 머신 러닝 알고리즘을 채용한 후 사용자가 미리 분류해 놓은 연습용 데이터를 입력받아 학습을 수행함에 따라 분류 능력이 향상될 수 있다. 이후, 연습용 데이터를 통해 일정 정도 학습을 수행하고 난 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)에는 테스트 데이터가 입력될 수 있으며, 테스트를 통과한 각 분류부는 해당 머신 러닝 알고리즘을 통해 뉴스 기사들의 분류를 수행할 수 있다.
일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 Multinomial Bayes, Bernoulli Bayes, SGD(Stochastic Gradient Descend), Linear SVC, Perceptron, Random Forest 등의 머신 러닝 알고리즘 중 하나를 선택하여 채용할 수 있다.
일 실시예에 따른 평가 결과 도출부(140)는 뉴스 수집부(120)에 의해 수집되어 뉴스 분류부(130)에 의해 카테고리별로 분류된 뉴스 기사들을 토대로, ESG 기업 평가를 수행할 수 있다. 즉, 평가 결과 도출부(140)는 ESG 관련 기사를 토대로 기업별 점수화를 수행하며 점수를 통해 기업 평가를 수행할 수 있다. 전술한 바와 같이 평가 결과 도출부(140)는 증거 레벨 산출부(141), ESG 확률 산출부(142) 및 점수 산출부(143)를 포함할 수 있다.
증거 레벨 산출부(141)는 뉴스 기사들에서 추출된 명사들을 복수개의 단어 카테고리로 분류할 수 있다. 일 실시예에 따르면, 증거 레벨 산출부(141)는 환경 피해(Environment Damage, D_Env), 회사 이해관계인(Company Stakeholder, S_Company), 일반적인 피해(General Dagmae, D_gen) 등으로 명사들을 분류할 수 있다.
도 3은 증거 레벨 산출부(141)가 뉴스 기사들에서 추출된 명사들을 카테고리화 하는 방법을 설명하기 위한 도표이다.
도 3을 참조하면, 증거 레벨 산출부(141)는 추출된 명사들이 ESG 중 어느 항목에 해당하는지와, 해당 항목에서도 어떠한 요소와 관련이 있는지를 판단하여 최종적으로 카테고리화를 수행할 수 있다. 이와 같은 명사들의 카테고리화는 전술한 카테고리 분류부(133)가 수행하는 카테고리화와는 상이할 수 있다. 즉, 카테고리 분류부(133)가 수행하는 카테고리화는 각 뉴스 기사들을 환경, 사회, 지배구조의 이슈보다 세밀한 하부 카테고리들로 분류한 것이고, 증거 레벨 산출부(141)가 수행하는 카테고리화는 뉴스 기사들에서 추출된 명사들에 대한 카테고리화일 수 있다. 즉, 카테고리 분류부(133)는 뉴스 기사들 각각에 대한 카테고리화를 수행하며, 증거 레벨 산출부(1410는 명사들에 대한 카테고리화를 수행하는 것으로 카테고리에 속하는 개체들이 각각 뉴스 기사와 명사로 상이할 수 있다.
일 실시예에 따르면, 증거 레벨 산출부(141)는 상기와 같은 카테고리화를 수행한 후, 뉴스 클러터링부(123)에 의해 분류된 뉴스 기사들의 집합인 클러스터별로 각 카테고리 항목에 몇 개의 단어가 포함되는지를 계산할 수 있다. 이와 같은 단어는 도 3에 표시된 것과 같이 증거 레벨 산출부(141)에 의해 추출되어 카테고리화가 완료된 명사들일 수 있다.
증거 레벨 산출부(141)는 카테고리 항목에 포함되는 단어의 개수를 토대로 각 카테고리 항목의 순위를 설정할 수 있고, 단어의 개수를 정규화하여 정규화된 수치를 토대로 각 카테고리 항목의 증거 레벨을 산출할 수 있다.
도 4는 증거 레벨 산출부(141)가 카테고리 항목에 포함되는 단어의 개수를 토대로 항목의 순위를 설정하고, 정규화하며, 정규화한 수치를 토대로 증거 레벨을 산출하는 방법을 설명하기 위한 도표이다.
도 4를 참조하면, 하나의 클러스터에 대해서 각각의 카테고리별로 몇 개의 단어가 포함되어 있는지, 어떠한 단어가 포함되어 있는지가 표시되어 있으며, 포함된 단어의 개수를 토대로 카테고리별 순위가 설정되어 있다. 또한, 각 카테고리별 포함된 단어의 개수가 정규화된 수치로 나타나 있으며, 이와 같은 정규화 수치를 토대로 증거 레벨이 표시되어 있다. 증거 레벨 산출부(141)는 정규화된 수치를 일정한 기준치에 따라 구간별로 분류하여 증거 레벨을 산출할 수 있다.
ESG 확률 산출부(142)는 증거 레벨 산출부(141)에서 사용하는 카테고리의 항목을 토대로 유사한 뉴스들의 집합인 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 속할지에 대한 확률을 산출할 수 있다.
ESG 확률 산출부(142)는 각 클러스터가 ESG 중 어느 이슈에 속할지에 대한 확률을 산출하기 전, 증거 레벨 산출부(141)가 사용한 카테고리 항목을 보다 적은 수의 집합으로 규정할 수 있다. 일 실시예에 따르면, 이와 같은 집합들은 환경, 사회, 지배구조, 기업 리스크 및 기타 관련 문제로 분류될 수 있다.
Figure 112019096328484-pat00003
ESG 확률 산출부(142)는 상기 수학식 3을 이용하여 특정 클러스터에 대한 환경, 사회 또는 지배구조 이슈에 대한 증거 레벨을 산출할 수 있다. ESG 확률 산출부(142)가 환경에 대한 증거 레벨을 산출하는 방법을 예로 들면, 수학식 3에서 Ci는 환경에 대한 카테고리 중 i번째 카테고리를 의미하고, n은 환경에 관한 카테고리의 개수를 의미하며, E(Ci-)는 환경에 대한 i번째 카테고리의 증거 레벨로 증거 레벨 산출부(141)에서 전술한 바와 같이 산출된 것을 의미한다. 즉, 증거 레벨 산출부(141)에서 산출한 증거 레벨은 추출된 명사를 분류하는데 이용한 카테고리들에 대한 증거 레벨이며, ESG 확률 산출부(142)가 산출하는 증거 레벨은 환경, 사회, 지배구조의 세 종류의 이슈에 대한 증거 레벨이다.
ESG 확률 산출부(142)는 각 클러스터가 환경, 사회, 지배구조의 세 종류 중 어느 것과 관련있는지에 대한 확률을 산출할 수 있다.
Figure 112019096328484-pat00004
ESG 확률 산출부(142)는 상기 수학식 4를 이용하여 각 클러스터의 ESG 확률을 산출할 수 있다.
도 5는 본 발명의 일 실시예에 따른 ESG 확률 산출부(142)가 각 클러스터에 대한 ESG 확률 산출을 수행한 결과를 나타내는 도표이다.
도 5를 참조하면, 복수의 클러스터들에 대해서, 환경, 사회, 지배구조의 세 종류의 이슈에 대한 증거 레벨과 그에 따른 ESG 확률이 나타나 있다. 특정 클러스터가 환경, 사회, 지배구조 이슈 중 어느 것과 관련 있는지에 대한 확률을 모두 더하면 1이 되는 것을 확인할 수 있다.
일 실시예에 따른 점수 산출부(143)는 ESG 기업 평가의 최종 단계인 ESG 기업 평가 점수를 계산하기에 앞서, 각종 보조 지표들을 계산한 후에 계산된 보조 지표들을 이용하여 ESG 기업 평가 점수를 계산할 수 있다. 상기와 같은 보조 지표들 및 ESG 기업 평가 점수는 전술한 바와 같이 계산된 증거 레벨 및 ESG 확률을 통해 계산될 수 있다.
일 실시예에 따르면, 각종 보조 지표들은 ESG 리스크 점수, 기업 리스크 점수 및 관련성 점수 등으로 구성될 수 있다. 이와 같은 보조 지표들은 상기와 같은 세 종류에 한정되는 것은 아니고 다양한 수와 계산 방식으로 정의될 수 있음은 물론이다.
Figure 112019096328484-pat00005
일 실시예에 따르면, 점수 산출부(143)는 최종적으로 상기 수학식 5와 같은 방식으로 ESG 기업 평가 점수를 산출할 수 있다. 수학식 5에서 ESGrisk, CompanyRisk, Relevance는 각종 보조 지표들을 나타낸다. 수학식 5에서 ESGrisk, CompanyRisk, Relevance는 각종 보조 지표들을 나타낸다. ESGrisk는 특정 클러스터로 분류된 뉴스 기사들의 집합이 환경, 사회, 기업구조와 관련하여 얼마만큼의 위험성을 갖는지를 각각 계산하여 합산한 값일 수 있고, CompanyRisk는 ESG 확률 산출부(142)가 규정한 집합들 중 기업 리스크에 관련된 집합과 해당 집합으로 분류된 단어 카테고리들과 관련된 값일 수 있으며, Relevance는 ESG 확률 산출부(142)가 규정한 집합들 중 기타로 분류된 집합과 해당 집합으로 분류된 단어 카테고리들과 관련된 값일 수 있다.
일 실시예에 따른 통신부(150)는 ESG 기업 평가 장치(100)와 외부 장치 간의 통신이 가능하도록 한다. 구체적으로는, ESG 기업 평가 장치(100)가 해당 장치의 사용자 단말기와 통신할 수 있도록 하며, 인터넷 연결을 통해 뉴스 수집부(120)가 발행되는 뉴스를 수집할 수 있도록 한다.
일 실시예에 따른 저장부(160)는 ESG 기업 평가 장치(100)의 동작에 있어 필요한 데이터들을 저장할 수 있다. 저장부(160)는 수집한 뉴스 기사, 뉴스 기사들에 대한 분류 정보, 점수화 정보, 머신 러닝 알고리즘들의 학습 이력 등을 데이터의 형식으로 보관할 수 있다.
전술한 바와 같은 방식으로, ESG 기업 평가 장치(100)는 유사한 기사들의 집합인 각 클러스터 별로 ESG 기업 평가 점수를 최종적으로 도출할 수 있다.
도 6은 본 발명의 일 실시예에 따른 ESG 기업 평가 장치(100)가 뉴스 기사들을 수집하는 과정부터 ESG 기업 평가 점수를 도출하는 과정을 개략적으로 나타낸 블록도이다.
도 6을 참조하면, ESG 기업 평가 장치(100)는 기업 평가를 수행함에 있어 기초가 되는 데이터인 뉴스 기사들을 인터넷 상에서 정기적 또는 비정기적인 시간 간격을 가지고 수집할 수 있다(S601).
이후, ESG 기업 평가 장치(100)는 수집한 뉴스 기사들을 기업별 및 날짜별로 분류할 수 있으며(S603), 수집한 뉴스 기사들이 작성된 언어에 따라 알맞은 형태소 분석기를 사용하여 해당 기사를 분석할 수 있다(S605).
ESG 기업 평가 장치(100)는 형태소 분석이 완료된 뉴스 기사들을 토대로 각 뉴스 기사를 벡터화 한 후, 벡터들 간의 유사도 분석을 통해 뉴스 기사들 간의 유사도를 계산하여, 관련 뉴스들끼리 모아서 클러스터화를 수행할 수 있다(S607). 이 과정에서, ESG 기업 평가 장치(100)는 TF-IDF를 이용하여 각 뉴스 기사를 벡터화 할 수 있으며, 코사인 유사도 계산을 통해 각 뉴스 기사 간의 유사도를 계산할 수 있다.
ESG 기업 평가 장치(100)는 수집한 뉴스 기사들 각각이 환경, 사회 및 지배구조 중 어느 이슈에 속하는 것인지와, 환경, 사회 및 지배구조 이슈 각각에 속하는 세부 카테고리 중 어디에 속하는 것인지를 분류할 수 있다(S609). 이 과정에서 ESG 기업 평가 장치(100)는 선결적으로 각 뉴스 기사가 ESG 기업 평가를 수행하는데 관련이 있는 기사인지 아닌지를 TRUE or FALSE 형태로 분류할 수 있으며, 각 분류 단계에서 알맞은 머신 러닝 알고리즘을 채택하고 연습용 데이터를 생성하여 ESG 기업 평가 장치(100)가 해당 알고리즘을 통해 학습을 수행하도록 할 수 있다. EGG 기업 평가 장치(100)의 사용자는 머신 러닝 알고리즘과 연습용 데이터들을 통해 학습을 수행한 ESG 기업 평가 장치(100)를 테스트 데이터들을 통해 검증하고, 이를 통해 S609 단계의 각 분류가 수행되도록 할 수 있다.
ESG 기업 평가 장치(100)는 S607 단계에서 분류된 각 클러스터 단위로, 해당 클러스터의 ESG 이슈 각각에 대한 증거 레벨값을 산출하고, 해당 클러스터에 대한 ESG 확률값을 산출할 수 있다(S611). 이 과정에서 ESG 기업 평가 장치(100)는 뉴스 기사들에서 추출된 명사들을 복수개의 단어 카테고리로 분류하고 이를 환경, 사회, 지배구조, 기업 리스크, 기타 관련 문제와 같은 집합들로 분류할 수 있다. 이후, ESG 기업 평가 장치(100)는 상기 집합들 중에서 환경, 사회, 지배구조에 대한 증거 레벨값을 산출하고 ESG 확률값 또한 산출 할 수 있다.
최종적으로, ESG 기업 평가 장치(100)는 S611 단계에서 산출한 증거 레벨값 및 ESG 확률값 등을 토대로 최종적인 ESG 기업 평가 점수를 산출할 수 있다(S613). 이 과정에서 ESG 기업 평가 장치(100)는 S611 단계에서 산출한 ESG 확률값과, 기업 리스크로 분류한 집합의 증거 레벨값 등을 활용할 수 있다.
본 발명의 일 실시예에 따르면, ESG 기업 평가 장치(100)는 ESG 기업 평가 결과를 활용하는 개인 또는 기업이 특정 기업에 대해 평가 점수가 나온 근거를 요구할 때에 해당 점수가 나오는 근거를 제공하는 기능을 포함할 수 있다. 즉, 특정 기업의 기사들에 대한 평가 점수가 산출되었을 때에, 해당 평가 점수는 기사들에 존재하는 특정 단어의 빈도수에 따라 영향을 많이 받았다는 정보를 제공할 수 있으며, 해당 단어가 포함되는 기사들을 검색하여 젝공할 수도 있다.
이와 같이, 본 발명의 실시예들에 의해 개시된 ESG 기업 평가 장치(100)가 자동화된 기업 평가를 수행함으로써, 인터넷 상에서 특정 기업에 대한 유사한 뉴스 기사들이 발행되었을 때에, 해당 뉴스 기사들이 환경, 사회, 지배구조 중 어느 이슈에 대한 것이고 해당 이슈에 대한 리스크가 얼마나 중대한 것인지를 판단할 수 있게 된다.
한편, 본 발명의 일 실시예에 따른 ESG 기업 평가 장치(100)는 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다.
예컨대, 컴퓨터가 읽을 수 있는 기록매체로는 롬(ROM), 램(RAM), 시디-롬(CD-ROM), 자기 테이프, 하드디스크, 플로피디스크, 이동식 저장장치, 비휘발성 메모리(Flash Memory), 광 데이터 저장장치 등이 있다.
또한, 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
100: ESG 기업 평가 장치 110: 제어부
120: 뉴스 수집부 121: 형태소 분석부
122: 기업 및 날짜 분류부 123: 뉴스 클러스터링부
130: 뉴스 분류부 131: 이원 분류부
132: ESG 분류부 133: 카테고리 분류부
140: 평가 결과 도출부 141: 증거 레벨 산출부
142: ESG 확률 산출부 143: 점수 산출부

Claims (5)

  1. ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 ESG 기업 평가 장치에 있어서,
    인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터링을 수행하는 뉴스 수집부;
    상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 뉴스 분류부; 및
    클러스터 단위로 해당 클러스터에 대한 ESG 리스크를 계산하고 계산한 값을 토대로 ESG 기업 평가 점수를 산출하는 평가 결과 도출부를 포함하며,
    상기 평가 결과 도출부는, 상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 클러스터 단위로 증거 레벨 산출을 수행하는 증거 레벨 산출부;
    상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 ESG 확률 산출부; 및
    ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 점수산출부를 포함하며,
    상기 뉴스 수집부는 수집된 뉴스 기사들을 발행된 날짜에 기초하여 기간별로 분류하며, 상기 평가 결과 도출부는 뉴스 기사들에 대한 기간별 분류 정보를 기초로 최신의 뉴스 기사가 가중치를 갖는 방식으로 ESG 기업 평가 점수를 산출하는, ESG 기업 평가 장치.
  2. 제1항에 있어서,
    상기 증거 레벨 산출부는, 각 카테고리 항목에 포함되는 단어의 빈도수를 토대로 상기 카테고리 항목에 대한 순위 설정 또는 증거 레벨 산출을 클러스터 단위로 수행하는, ESG 기업 평가 장치.
  3. 제1항에 있어서,
    상기 ESG 확률 산출부는, 상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 환경, 사회, 지배구조, 기업리스크 및 기타 관련 문제의 분류를 가지는 집합으로 분류하는, ESG 기업 평가 장치.
  4. 제1항에 있어서,
    상기 ESG 확률 산출부는, 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산함에 있어, 환경, 사회 또는 지배구조에 대해 산출된 증거 레벨을 기초로 하는 것을 특징으로 하는, ESG 기업 평가 장치.
  5. ESG 기업 평가 장치가 ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 방법에 있어서,
    인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 수집된 뉴스 기사들을 발행된 날짜에 기초하여 기간별로 분류하며, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터화를 수행하는 단계;
    상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 단계;
    상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 하여 클러스터 단위로 증거 레벨 산출을 수행하는 단계;
    추출된 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 단계; 및
    ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 단계를 포함하며,
    상기 ESG 기업 평가 점수는 뉴스 기사들에 대한 기간별 분류 정보를 기초로 최신의 뉴스 기사가 가중치를 갖는 방식으로 산출되는 것인, ESG 기업 평가 장치의 점수 산출 방법.
KR1020190115921A 2019-09-20 2019-09-20 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법 KR102105319B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190115921A KR102105319B1 (ko) 2019-09-20 2019-09-20 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190115921A KR102105319B1 (ko) 2019-09-20 2019-09-20 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170157068A Division KR102026304B1 (ko) 2017-11-23 2017-11-23 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법

Publications (2)

Publication Number Publication Date
KR20190110084A KR20190110084A (ko) 2019-09-27
KR102105319B1 true KR102105319B1 (ko) 2020-04-28

Family

ID=68097085

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190115921A KR102105319B1 (ko) 2019-09-20 2019-09-20 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법

Country Status (1)

Country Link
KR (1) KR102105319B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022155710A1 (en) * 2021-01-25 2022-07-28 Build-Apps Llc Methods, systems, apparatuses, and devices for facilitating dynamic sustainability mapping of real estate
US11481707B2 (en) * 2018-12-12 2022-10-25 Isd Inc. Risk prediction system and operation method thereof
KR102535522B1 (ko) 2022-08-05 2023-05-26 김종웅 소프트웨어 기반 기업 esg 경영 관리 장치 및 그 수행 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102462728B1 (ko) * 2022-06-17 2022-11-03 주식회사 에코나인 Esg경영 중요 이슈 선정 방법
KR102641853B1 (ko) * 2023-06-19 2024-03-04 신용보증기금 환경, 사회, 지배구조 평가시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165599A (ja) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology 風評情報抽出装置及び風評情報抽出方法
KR101599675B1 (ko) * 2015-07-02 2016-03-03 한국기업데이터 주식회사 빅 데이터 기술에 기반한 기업 뉴스 검색 기술을 이용한 기업 신용 위험도 예측 장치 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136271A1 (en) 2003-10-23 2007-06-14 Hiroaki Masuyama Enterprise evaluation device and enterprise evaluation program
KR20100113423A (ko) * 2009-04-13 2010-10-21 (주)미디어레 역 벡터 공간 모델을 이용한 키워드 추천방법 및 그 장치
KR101741509B1 (ko) * 2015-07-01 2017-06-15 지속가능발전소 주식회사 뉴스의 데이터마이닝을 통한 기업 평판 분석 장치 및 방법, 그 방법을 수행하기 위한 기록 매체

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165599A (ja) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology 風評情報抽出装置及び風評情報抽出方法
KR101599675B1 (ko) * 2015-07-02 2016-03-03 한국기업데이터 주식회사 빅 데이터 기술에 기반한 기업 뉴스 검색 기술을 이용한 기업 신용 위험도 예측 장치 및 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11481707B2 (en) * 2018-12-12 2022-10-25 Isd Inc. Risk prediction system and operation method thereof
WO2022155710A1 (en) * 2021-01-25 2022-07-28 Build-Apps Llc Methods, systems, apparatuses, and devices for facilitating dynamic sustainability mapping of real estate
KR102535522B1 (ko) 2022-08-05 2023-05-26 김종웅 소프트웨어 기반 기업 esg 경영 관리 장치 및 그 수행 방법
KR20240020168A (ko) 2022-08-05 2024-02-14 주식회사 아이이에스지 대내외 esg 요구에 대한 대응을 용이하게 하는 기업 esg 경영 관리 장치 및 그 수행 방법
KR20240020167A (ko) 2022-08-05 2024-02-14 주식회사 아이이에스지 평가 대상 기업의 esg 수준을 판단하고 미래 전략 수립에 도움을 줄 수 있는 기업 esg 경영 관리 장치 및 그 수행 방법

Also Published As

Publication number Publication date
KR20190110084A (ko) 2019-09-27

Similar Documents

Publication Publication Date Title
KR102026304B1 (ko) Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
KR102105319B1 (ko) Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
US20190080253A1 (en) Analytic system for graphical interpretability of and improvement of machine learning models
US20170061285A1 (en) Data analysis system, data analysis method, program, and storage medium
KR20180072167A (ko) 유사특허 추출 시스템 및 그 방법
CN106599065A (zh) 一种基于Storm分布式框架的食品安全网络舆情预警系统
US20140297628A1 (en) Text Information Processing Apparatus, Text Information Processing Method, and Computer Usable Medium Having Text Information Processing Program Embodied Therein
Jonathan et al. Sentiment analysis of customer reviews in zomato bangalore restaurants using random forest classifier
CN115063035A (zh) 基于神经网络的客户评估方法、系统、设备及存储介质
US20170154294A1 (en) Performance evaluation device, control method for performance evaluation device, and control program for performance evaluation device
Shyam Mohan et al. Product recommendation systems based on customer reviews using machine learning techniques
Ergu et al. Predicting personality with twitter data and machine learning models
Silva et al. Developing and Assessing a Human-Understandable Metric for Evaluating Local Interpretable Model-Agnostic Explanations.
Gürbüz et al. Research article classification with text mining method
Saptono et al. Examiners recommendation system at proposal seminar of undergraduate thesis by using content-based filtering
Setiawan et al. Implementation of Decision Tree C4. 5 for Big Five Personality Predictions with TF-RF and TF-CHI2 on Social Media Twitter
CN117150245B (zh) 一种企业智能诊断信息生成方法、装置、设备和存储介质
JP7405724B2 (ja) 作業分析システム、及び作業分析方法
Al Mahmud et al. A New Technique to Classification of Bengali News Grounded on ML and DL Models
Kollu et al. Social and Movie Video Data Analysis for Representing Sentiments based on ML Approaches
Golub Modernized Mathematical Model of Text Document Classification.
Zahra et al. Sentiment Analysis Of Twitter Dataset Using Lle And Classification Methods
Miazga et al. An evaluation of machine learning and latent semantic analysis in text sentiment classification
Lisangan et al. The Automatic Classification System for Academic Performance Evaluation at the Faculty of Information Technology Atma Jaya University of Makassar
Ambareesh et al. Resume Shortlisting Using NLP

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant