KR20190110084A - Esg based enterprise assessment device and operating method thereof - Google Patents

Esg based enterprise assessment device and operating method thereof Download PDF

Info

Publication number
KR20190110084A
KR20190110084A KR1020190115921A KR20190115921A KR20190110084A KR 20190110084 A KR20190110084 A KR 20190110084A KR 1020190115921 A KR1020190115921 A KR 1020190115921A KR 20190115921 A KR20190115921 A KR 20190115921A KR 20190110084 A KR20190110084 A KR 20190110084A
Authority
KR
South Korea
Prior art keywords
esg
news
unit
company
news articles
Prior art date
Application number
KR1020190115921A
Other languages
Korean (ko)
Other versions
KR102105319B1 (en
Inventor
윤덕찬
대히야 와순다라
임지연
세르게이 렉시코브
Original Assignee
지속가능발전소 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지속가능발전소 주식회사 filed Critical 지속가능발전소 주식회사
Priority to KR1020190115921A priority Critical patent/KR102105319B1/en
Publication of KR20190110084A publication Critical patent/KR20190110084A/en
Application granted granted Critical
Publication of KR102105319B1 publication Critical patent/KR102105319B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06F17/27
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Abstract

Disclosed are a company evaluation performing apparatus based on ESG and an operation method thereof. According to one of various embodiments of the present invention, an ESG company evaluation apparatus may include: a news collecting unit collecting a plurality of news articles on the Internet, classifying the same by date or company, and analyzing similarity between the news articles to perform clustering for news articles having a similarity equal to or greater than a reference value; a news classifying unit classifying each of the news articles to determine which issue among environment, society, or hierarchy structure is related to each article; and an evaluation result deriving unit calculating ESG risk for a corresponding cluster in a cluster unit and calculating ESG company evaluation score based on the calculated value. The evaluation result deriving unit may include: an evidence level calculating unit which performs categorization for nouns extracted from the news articles and performs evidence level calculation in a cluster unit based on nouns included in each category; an ESG probability calculating unit which calculates probability which issue among environment, society, or hierarchy structure each cluster belongs to based on the category item extracted from the evidence level calculating unit; and a score calculating unit which calculates ESG related risks, company risks, and other risks for related issues in different ways and then calculates an ESG company evaluation score based on the calculated risks. According to one embodiment of the present invention, it is possible to increase calculation speed of deriving ESG company evaluation by automatically performing ESG company evaluation.

Description

ESG 기반의 기업 평가 수행 장치 및 이의 작동 방법{ESG BASED ENTERPRISE ASSESSMENT DEVICE AND OPERATING METHOD THEREOF}ESG-Based Enterprise Assessment Device and How It Works {ESG BASED ENTERPRISE ASSESSMENT DEVICE AND OPERATING METHOD THEREOF}

본 발명의 다양한 실시예는 ESG 기반의 기업 평가 수행 장치 및 이의 작동 방법에 관한 것으로, 인터넷 상의 뉴스 기사들을 수집하고 분석하여 기업들이 가지고 있는 환경, 사회 또는 지배구조의 이슈와 관련된 리스크를 분석하고 점수화하는 장치 및 이의 작동 방법에 관한 기술이다.Various embodiments of the present invention relate to an ESG-based enterprise evaluation performing apparatus and a method of operating the same, and collects and analyzes news articles on the Internet to analyze and score risks related to environmental, social, or governance issues of enterprises. To a device and a method of operating the same.

최근 기업들이 리스크 관리에 보다 많은 신경을 기울이면서, 자 기업과 타 기업들을 다방면으로 평가하고 이와 같은 평가 결과를 투자, 합병, 생산 라인에 대한 리스크 관리 등에 응용하고 있다.Recently, as companies pay more attention to risk management, they are evaluating their own companies and other companies in various ways and applying these evaluation results to investment, merger, and production line risk management.

일반적으로 기업들은 정량적으로 획득할 수 있는 재무적인 데이터들을 토대로 기업들을 평가하는 것이 일반적이었으나, 최근 들어서 비재무적인 데이터를 토대로 기업을 평가하고 리스크를 분석하는 방법론이 부각되고 있다. 기업들이 공개하는 재무적 데이터에는 해당 기업에게 불리한 내용이 반영되지 않으며, 기업이 제공하는 재무 관련 보고서에 대한 신뢰성 또한 의문시되는 실정이다. 비재무 데이터를 통한 기업 분석이 필요한 이유를 살펴보면, 사람들의 인터넷을 통한 SNS 활동이 활발해지면서, 기업 또는 제품에 대한 특정한 소문이 퍼지거나 하는 사건 등에 의해 기업 평판이 흔들리는 경우도 있으며 기업 오너의 범죄나 건강 관련 소문들에 의해 해당 기업이 가지는 리스크가 높아지는 경우도 있으나 이와 같은 사건들은 재무적 데이터를 통해 분석하기 어려운 것이 현실이다. 따라서, 재무적인 데이터뿐 아니라 비재무적인 데이터를 통해 기업을 분석함으로써 보다 정밀한 기업 평가가 가능해질 수 있다.In general, firms have generally assessed firms based on financial data that can be quantitatively acquired, but recently, a methodology of evaluating firms and analyzing risks based on non-financial data has emerged. Financial data disclosed by companies does not reflect adverse effects on the company, and the reliability of financial reports provided by the company is also questioned. The reason why corporate analysis is needed through non-financial data is that people's SNS activity through the internet is active, and the reputation of the company or product is spread, and the reputation of the company is shaken. The rumors may increase the risks of the company, but such events are difficult to analyze through financial data. Thus, by analyzing the company not only through financial data but also through non-financial data, more accurate evaluation of the company can be achieved.

이와 같은 흐름에서, 비재무 데이터들을 ESG(Environmnet, Social, Governance)의 세 주제로 나누어서 분석하는 방법론이 부각되고 있다.In this trend, a methodology for analyzing non-financial data by dividing it into three themes of ESG (Environmnet, Social, Governance) is emerging.

ESG와 같은 비재무 데이터를 토대로 기업들에 대한 평가 보고서를 작성하는 기업들이 생겨났지만, 비재무 데이터는 주관적 성격이 강하고 보고서가 작성되는 속도도 상대적으로 느려 기업들이 이를 활용하기에 힘든 점들이 존재하였다. 이러한 단점들을 개선하기 위해 컴퓨터 프로그램 등이 인터넷 상에서 ESG에 관한 뉴스 기사들을 수집하여 자동으로 분석하여 기업 평가를 수행하게 함에 있어서도, 뉴스 기사들은 정형화된 데이터가 아니어서 뉴스 기사들의 분류와 평가를 자동화하는 과정에서 어려움이 다수 존재하였다.There are companies that produce evaluation reports on companies based on non-financial data such as ESG. However, non-financial data is subjective and the report is relatively slow, making it difficult for companies to use it. In order to remedy these shortcomings, computer programs, etc., collect and automatically analyze news articles about ESG on the Internet to conduct corporate evaluations. There were many difficulties in the process.

국내공개특허 제 10-2006-0096432호Domestic Publication No. 10-2006-0096432

본 발명의 다양한 실시예는 상기와 같은 문제점을 해결하기 위해 도출된 것으로, 인터넷 상의 뉴스 기사들을 수집하여 이를 토대로 기업들에 대한 평가를 ESG 기반으로 수행하는 것을 목적으로 한다.Various embodiments of the present invention are derived to solve the above problems, and aims to perform an ESG based evaluation of companies based on the collection of news articles on the Internet.

본 발명의 다른 목적은 수집한 뉴스 기사들 간의 유사도 분석을 통해 동일한 사건에 대해 다루고 있는 뉴스 기사들을 클러스터링하는 것이다.Another object of the present invention is to cluster news articles dealing with the same event through similarity analysis between collected news articles.

본 발명의 또다른 목적은 ESG 기업 평가를 수행하는 장치가 머신 러닝 알고리즘을 채택하고 학습을 수행하도록 함으로써, 수집한 뉴스들을 카테고리화 함에 있어서의 성능을 향상시키는 것이다.It is another object of the present invention to improve the performance in categorizing the news gathered by having the device performing the ESG enterprise assessment adopt a machine learning algorithm and perform the learning.

본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.Problems to be solved by the present invention are not limited to the above-mentioned problems, and other problems not mentioned will be clearly understood by those skilled in the art from the following description.

상기와 같은 목적을 달성하기 위해, 본 발명의 일 실시예는 ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 ESG 기업 평가 장치에 있어서, 인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터링을 수행하는 뉴스 수집부; 상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 뉴스 분류부; 및 클러스터 단위로 해당 클러스터에 대한 ESG 리스크를 계산하고 계산한 값을 토대로 ESG 기업 평가 점수를 산출하는 평가 결과 도출부를 포함하며, 상기 평가 결과 도출부는, 상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 클러스터 단위로 증거 레벨 산출을 수행하는 증거 레벨 산출부; 상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 ESG 확률 산출부; 및 ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 점수산출부를 포함하는, ESG 기업 평가 장치를 제공한다.In order to achieve the above object, an embodiment of the present invention is an ESG company evaluation device for calculating the score by evaluating the enterprise in terms of ESG (Environmnet, Social, Governance), by collecting a plurality of news articles on the Internet A news collector configured to classify by date or company and perform clustering on news articles having a similarity or more than a reference value through similarity analysis between the news articles; A news classification unit for classifying each of the news articles as related to environmental, social or governance issues; And an evaluation result derivation unit configured to calculate an ESG enterprise evaluation score based on the calculated ESG risk for the cluster in cluster units, and the evaluation result derivation unit includes a category for nouns extracted from the news articles. An evidence level calculator configured to perform speech conversion and to calculate an evidence level in cluster units based on nouns included in each category item; An ESG probability calculator for calculating a probability of whether each cluster is included in an environment, a society, or a governance structure based on the category item extracted by the evidence level calculator; And a score calculation unit that calculates ESG enterprise evaluation scores based on the risks of ESG related risks, enterprise risks, and other related problems in different ways.

상기 증거 레벨 산출부는, 각 카테고리 항목에 포함되는 단어의 빈도수를 토대로 상기 카테고리 항목에 대한 순위 설정 또는 증거 레벨 산출을 클러스터 단위로 수행할 수 있다.The evidence level calculation unit may perform ranking setting or evidence level calculation for each category item in a cluster unit based on the frequency of words included in each category item.

상기 ESG 확률 산출부는, 상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 환경, 사회, 지배구조, 기업리스크 및 기타 관련 문제의 분류를 가지는 집합으로 분류할 수 있다.The ESG probability calculator may classify the category item extracted by the evidence level calculator into a set having a classification of environment, society, governance, corporate risk, and other related problems.

상기 ESG 확률 산출부는, 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산함에 있어, 환경, 사회 또는 지배구조에 대해 산출된 증거 레벨을 기초로 하는 것을 특징으로 할 수 있다.The ESG probability calculator may be based on a level of evidence calculated for the environment, society, or governance structure in calculating a probability of whether each cluster is included in an environment, a society, or a governance structure. have.

상기와 같은 목적을 달성하기 위해, 본 발명의 다른 실시예는 ESG 기업 평가 장치가 ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 방법에 있어서, 인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터화를 수행하는 단계; 상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 단계; 상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 하여 클러스터 단위로 증거 레벨 산출을 수행하는 단계; 추출된 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 단계; 및 ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 단계를 포함하는, ESG 기업 평가 장치의 점수 산출 방법을 제공한다.In order to achieve the above object, another embodiment of the present invention is a method for estimating the enterprise from the ESG (Environmnet, Social, Governance) perspective to calculate the score in the ESG company evaluation device, a plurality of news articles on the Internet Collecting and classifying by date or company and performing clustering on news articles having a similarity or more than a reference value through similarity analysis between the news articles; Classifying each of the news articles as relating to environmental, social or governance issues; Performing categorization on nouns extracted from the news articles, and performing evidence level calculation on a cluster basis based on nouns included in each category item; Calculating a probability of whether each cluster is included in an environment, a society, or a governance based on the extracted category item; And calculating an ESG enterprise valuation score based on the calculation of the risks for the ESG-related risks, the corporate risks, and other related problems in different ways, respectively.

본 발명의 일 실시예에 따르면, ESG 기업 평가가 자동화되어 수행됨으로써, ESG 기업 평가가 도출되는 속도가 향상될 수 있다.According to an embodiment of the present invention, the ESG company evaluation is automatically performed, so that the speed at which the ESG company evaluation is derived can be improved.

본 발명의 다른 실시예에 따르면, 머신 러닝에 의하여 뉴스 기사들을 분류하는 성능이 계속하여 향상되는 기업 평가 장치가 제공될 수 있다.According to another embodiment of the present invention, an enterprise evaluation apparatus may be provided in which the performance of classifying news articles by machine learning continues to be improved.

본 발명의 또다른 실시예에 따르면, 다양한 종류의 언어로 작성된 뉴스 기사들에 대한 분석을 수행하여 이를 토대로 기업을 평가할 수 있다.According to another embodiment of the present invention, an analysis of news articles written in various kinds of languages may be performed to evaluate a company based on the analysis.

본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.Effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the following description.

도 1은 본 발명의 일 실시예에 따른 ESG 기업 평가가 수행되는 흐름을 개략적으로 나타낸 개념도이다.
도 2는 본 발명의 일 실시예에 따른 EGS 기업 평가 모듈의 구성을 개략적으로 표시한 블록도이다.
도 3은 증거 레벨 산출부가 뉴스 기사들에서 추출된 명사들을 카테고리화 하는 방법을 설명하기 위한 도표이다.
도 4는 증거 레벨 산출부가 카테고리 항목에 포함되는 단어의 개수를 토대로 항목의 순위를 설정하고, 정규화하며, 정규화한 수치를 토대로 증거 레벨을 산출하는 방법을 설명하기 위한 도표이다.
도 5는 본 발명의 일 실시예에 따른 ESG 확률 산출부가 각 클러스터에 대한 ESG 확률 산출을 수행한 결과를 나타내는 도표이다.
도 6은 본 발명의 일 실시예에 따른 ESG 기업 평가 장치가 뉴스 기사들을 수집하는 과정부터 ESG 기업 평가 점수를 도출하는 과정을 개략적으로 나타낸 블록도이다.
1 is a conceptual diagram schematically illustrating a flow in which ESG company evaluation is performed according to an embodiment of the present invention.
Figure 2 is a block diagram schematically showing the configuration of the EGS company evaluation module according to an embodiment of the present invention.
3 is a diagram for explaining a method of categorizing nouns extracted from news articles by the evidence level calculator.
FIG. 4 is a diagram for describing a method of estimating, normalizing, and estimating an evidence level based on a numerical value of an item based on the number of words included in a category item.
5 is a diagram illustrating a result of the ESG probability calculation unit performing ESG probability calculation for each cluster according to an embodiment of the present invention.
6 is a block diagram schematically illustrating a process of deriving an ESG company evaluation score from a process of collecting news articles by an ESG company evaluation apparatus according to an embodiment of the present invention.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.The terminology used herein is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. In this specification, the singular also includes the plural unless specifically stated otherwise in the phrase. As used herein, "comprises" and / or "comprising" does not exclude the presence or addition of one or more other components in addition to the mentioned components. Like reference numerals refer to like elements throughout, and "and / or" includes each and all combinations of one or more of the mentioned components. Although "first", "second", etc. are used to describe various components, these components are of course not limited by these terms. These terms are only used to distinguish one component from another. Therefore, of course, the first component mentioned below may be a second component within the technical spirit of the present invention.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.When any part of the specification is to "include" any component, this means that it may further include other components, except to exclude other components unless otherwise stated. In addition, the terms "... unit", "module", etc. described in the specification mean a unit for processing at least one function or operation, which may be implemented in hardware or software or a combination of hardware and software. .

도 1은 본 발명의 일 실시예에 따른 ESG 기업 평가가 수행되는 흐름을 개략적으로 나타낸 개념도이다.1 is a conceptual diagram schematically illustrating a flow in which ESG company evaluation is performed according to an embodiment of the present invention.

본 발명에서 개시하는 ESG 기업 평가는 컴퓨터 소프트웨어의 형태로 구현된 프로그램에 의해 자동화되어 수행될 수 있다. 즉, 도 1에서 예시되는 각각의 방법들은 ESG 기업 평가를 수행하는 ESG 기업 평가 장치(100)에 탑재된 소프트웨어에 의해 연산 처리됨으로써 수행될 수 있다.ESG company evaluation disclosed in the present invention can be automated and performed by a program implemented in the form of computer software. That is, each of the methods illustrated in FIG. 1 may be performed by arithmetic processing by software installed in the ESG company evaluation apparatus 100 that performs ESG company evaluation.

도 1을 참조하면, ESG 기업 평가 장치(100)는 세 가지 단계를 통해 최종 기업 평가 결과를 산출할 수 있다. 도 1의 (a)를 살펴보면, ESG 기업 평가 장치(100)는 우선적으로 기업 평가를 수행할 기본 자료인 뉴스 기사들을 인터넷 상에서 수집할 수 있다. ESG 기업 평가 장치(100)는 뉴스 기사들을 수집함에 있어, 형태소 분석 및 문서 간 유사도 계산 등을 통해 뉴스가 어떠한 기업에 대한 것인지, 어떠한 주제에 대한 것인지 등을 판단하고 일차적으로 유사한 기사들끼리 분류하는 클러스터링을 수행할 수 있다.Referring to FIG. 1, the ESG company evaluation apparatus 100 may calculate a final company evaluation result through three steps. Referring to FIG. 1A, the ESG company evaluation apparatus 100 may first collect news articles, which are basic materials for performing corporate evaluation, on the Internet. In collecting news articles, the ESG company evaluation apparatus 100 determines whether a news is about a company or a topic through a morphological analysis and a similarity calculation between documents, and primarily classifies similar articles. Clustering can be performed.

도 1의 (b)를 참조하면, ESG 기업 평가 장치(100)는 수집되어 일차적으로 클러스터링된 뉴스 기사들을 바탕으로, 보다 정밀한 뉴스 기사 분류 작업을 수행할 수 있다. ESG 기업 평가 장치(100)는 뉴스 기사 분류 작업을 수행함에 있어, 수집된 뉴스가 ESG와 관련된 것인지, 즉, 환경, 사회 또는 지배구조 중 적어도 어느 하나와 관련된 것인지를 우선적으로 판단하고, 이후에 수집된 뉴스가 환경, 사회, 지배구조 중 어느 주제와 관련이 있는지를 판단하여 분류할 수 있다. 최종적으로, ESG 기업 평가 장치(100)는 환경, 사회, 지배구조의 세가지 주제로 분류된 뉴스 기사 각각에 대해 보다 세밀한 카테고리 분류를 수행할 수 있다.Referring to FIG. 1B, the ESG company evaluation apparatus 100 may perform more precise news article classification based on the collected and primarily clustered news articles. In performing the news article classification operation, the ESG company evaluation apparatus 100 first determines whether the collected news is related to ESG, that is, at least one of environment, society, or governance structure, and then collects the news. You can determine and classify the news as it relates to the environment, society, or governance. Finally, the ESG company evaluation apparatus 100 may perform more detailed categorization for each news article classified into three subjects of environment, society, and governance.

도 1의 (c)를 참조하면, ESG 기업 평가 장치(100)는 분류된 뉴스 기사들을 토대로, 최종적인 기업 평가 점수를 도출할 수 있다. 이 과정에서 ESG 기업 평가 장치(100)는 뉴스 기사에 포함된 주요 단어들에 대한 증거 레벨 산출, 뉴스 기사들이 환경, 사회, 지배구조 중 어디에 속할지에 대한 확률 산출 등을 클러스터 단위로 수행할 수 있다.Referring to FIG. 1C, the ESG company evaluation apparatus 100 may derive a final enterprise evaluation score based on the classified news articles. In this process, the ESG enterprise evaluation apparatus 100 may calculate the level of evidence for key words included in the news article, and calculate the probability of whether the news articles belong to the environment, society, or governance in cluster units. have.

설명의 편의를 위해 본 발명의 ESG 기업 평가 장치(100)가 세 단계를 거쳐 최종적인 ESG 기업 평가 점수를 도출하는 것으로 도시하고 설명하였으나, 이와 같은 단계는 분할되거나 통합되어 이보다 적은 수 혹은 많은 수의 단계로 구현될 수 있음은 물론이다.For convenience of explanation, the ESG enterprise evaluation apparatus 100 of the present invention is shown and described as deriving the final ESG enterprise evaluation score through three steps, but such steps are divided or integrated so that fewer or more Of course, it can be implemented in steps.

도 2는 본 발명의 일 실시예에 따른 EGS 기업 평가 모듈(100)의 구성을 개략적으로 표시한 블록도이다.2 is a block diagram schematically showing the configuration of the EGS company evaluation module 100 according to an embodiment of the present invention.

도 2를 참조하면, ESG 기업 평가 장치(100)는 제어부(110), 뉴스 수집부(120), 뉴스 분류부(130), 평가 결과 도출부(140), 통신부(150) 및 저장부(160)를 포함하여 구성될 수 있다. 또한, 뉴스 수집부(120)는 형태소 분석부(121), 기업 및 날짜 분류부(122) 및 뉴스 클러스터링부(123)를, 뉴스 분류부(130)는 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)를, 평가 결과 도출부(140)는 증거 레벨 산출부(141), ESG 확률 산출부(142) 및 점수 산출부(143)를 각각 포함할 수 있다. Referring to FIG. 2, the ESG company evaluation apparatus 100 includes a control unit 110, a news collection unit 120, a news classification unit 130, an evaluation result derivation unit 140, a communication unit 150, and a storage unit 160. It may be configured to include). In addition, the news collector 120 is a morphological analysis unit 121, the company and date classification unit 122 and the news clustering unit 123, the news classification unit 130 is a binary classification unit 131, ESG classification unit 132 and the category classifier 133, the evaluation result deriving unit 140 may include an evidence level calculator 141, an ESG probability calculator 142, and a score calculator 143, respectively.

설명의 편의를 위하여 ESG 기업 평가 장치(100) 내에서 각각의 역할을 수행하는 주체들을 ~부의 형태로 표시하였으나, 각각의 부분들은 ESG 기업 평가 장치(100) 내에서 동작하는 서브 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 각 동작을 수행하거나, 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하는 개념이지만, 이에 제한되지는 않는다.For convenience of description, the subjects performing the respective roles in the ESG enterprise evaluation apparatus 100 are shown in the form of ~, but each of the parts may be sub-program modules operating in the ESG enterprise evaluation apparatus 100. . Such program modules include, but are not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform respective operations or execute particular abstract data types.

일 실시예에 따른 제어부(110)는 뉴스 수집부(120), 형태소 분석부(121), 기업 및 날짜 분류부(122), 뉴스 클러스터링부(123), 뉴스 분류부(133), 이원 분류부(131), ESG 분류부(132), 카테고리 분류부(133), 평가 결과 도출부(140), 증거 레벨 산출부(141), ESG 확률 산출부(142), 점수 산출부(143), 통신부(150) 및 저장부(160) 간의 데이터 흐름을 제어하는 기능을 수행할 수 있다. 즉, 본 발명에 따른 제어부(110)는 뉴스 수집부(120), 형태소 분석부(121), 기업 및 날짜 분류부(122), 뉴스 클러스터링부(123), 뉴스 분류부(133), 이원 분류부(131), ESG 분류부(132), 카테고리 분류부(133), 평가 결과 도출부(140), 증거 레벨 산출부(141), ESG 확률 산출부(142), 점수 산출부(143), 통신부(150) 및 저장부(160)에서 각각 고유한 기능을 수행하도록 제어할 수 있다.According to an embodiment, the controller 110 may include a news collector 120, a morpheme analyzer 121, a company and date classifier 122, a news clustering unit 123, a news classifier 133, and a binary classifier. 131, ESG classification unit 132, category classification unit 133, evaluation result derivation unit 140, evidence level calculation unit 141, ESG probability calculation unit 142, score calculation unit 143, communication unit The data flow between the 150 and the storage 160 may be controlled. That is, the controller 110 according to the present invention includes a news collector 120, a morphological analyzer 121, a company and date classifier 122, a news clustering unit 123, a news classifier 133, and a binary classification. The unit 131, the ESG classification unit 132, the category classification unit 133, the evaluation result derivation unit 140, the evidence level calculation unit 141, the ESG probability calculation unit 142, the score calculation unit 143, Each of the communicator 150 and the storage 160 may perform a unique function.

일 실시예에 따른 뉴스 수집부(120)는 전술한 바와 같이 형태소 분석부(121), 기업 및 날짜 분류부(122) 및 뉴스 클러스터링부(123)를 포함할 수 있다. ESG 기업 평가 장치(100)가 기업 평가를 수행하기 위해서는 인터넷 상에서 발행되는 수많은 뉴스 기사들 중에 기업의 환경, 사회 또는 지배구조와 관련 있는 뉴스 기사만을 수집할 필요가 있으며, 신뢰할 수 있는 출처로부터 뉴스를 획득하여야 허위의 뉴스 등에 의한 잘못된 평가를 생성하지 않을 수 있다. 뉴스 수집부(120)는 인터넷 상에서 업데이트되는 뉴스 기사들을 주기적인 시간 간격을 가지고 수집할 수 있으며, 뉴스 기사들을 수집함에 있어 각각의 뉴스 기사가 발행된 날짜 정보, 해당 뉴스를 발행한 언론 매체 정보 등을 함께 수집할 수 있다. 뉴스 수집부(120)의 뉴스 기사 수집은 ESG 기업 평가 장치(100) 내의 통신부(150)를 통해 이루어질 수 있다. As described above, the news collector 120 may include a morpheme analyzer 121, a company and date classifier 122, and a news clustering unit 123. In order for the ESG enterprise evaluation apparatus 100 to perform an enterprise evaluation, it is necessary to collect only news articles related to the environment, society, or governance structure of a company from among numerous news articles published on the Internet, and collect news from a reliable source. Acquisition may not produce false assessments, such as by false news. The news collector 120 may collect news articles updated on the Internet at regular time intervals, and in collecting news articles, date information of each news article is published, media information, etc. that publish the news. Can be collected together. The news article collection of the news collector 120 may be performed through the communicator 150 in the ESG company evaluation apparatus 100.

형태소 분석부(121)는 수집한 뉴스 기사의 텍스트 전체를, 의미를 갖는 최소 단위인 형태소 단위로 분석할 수 있다. 일 실시예에 따른 형태소 분석부(121)는 한국어로 작성된 뉴스 기사를 분석할 경우, 다양한 한국어 형태소 분석기 중 하나를 선택하여 이를 통한 분석을 수행할 수 있다. 일 실시예에 따르면, 한국어 형태소 분석기로는 kiwi, HAM, HLX, Mecab 등 다양한 종류가 존재하는데, 형태소 분석부(121)는 이 중 하나를 이용하여 형태소 분석을 수행하고 그 결과를 활용할 수 있다. 다른 실시예에 따르면, 형태소 분석부(121)는 한국어가 아닌 다른 언어로 작성된 뉴스를 분석함에 있어서는 해당 언어에 해당하는 형태소 분석기를 이용하여 형태소 분석을 수행할 수 있다.The morpheme analysis unit 121 may analyze the entire text of the collected news articles in a morpheme unit that is a minimum unit having a meaning. When analyzing the news article written in Korean, the morpheme analysis unit 121 may select one of various Korean morpheme analyzers and analyze the same. According to an embodiment, there are various types of Korean morphological analyzers such as kiwi, HAM, HLX, Mecab, etc. The morphological analyzer 121 may perform morphological analysis using one of them and use the result. According to another embodiment, the morpheme analysis unit 121 may analyze the news written in a language other than Korean by using a morpheme analyzer corresponding to the corresponding language.

기업 및 날짜 분류부(122)는 수집된 뉴스 기사들을 기업별 및 날짜별로 분류할 수 있다. 기업 및 날짜 분류부(122)는 기업명들이 데이터베이스 형태로 구축되어 있는 기업 사전을 활용하여 특정 기사가 어느 기업에 대한 기사인지를 판단할 수 있다. 기업 및 날짜 분류부(122)는 특정 기사가 어느 기업에 대한 기사인지를 판단한 후, 해당 기사가 발행된 날짜를 확인하여, 기간별로 뉴스 기사들을 정리할 수 있다. 일 실시예에 따르면, 기업 및 날짜 분류부(122)는 기업별로 뉴스 기사들을 분류한 후에, 같은 기업에 관련된 뉴스를 일주일 기간 별로 혹은 한달 기간 별로 분류할 수 있다. 이와 같은 기간별 분류는 ESG 기업 평가 장치(100)가 추후에 기업 평가를 수행함에 있어 최신의 뉴스 기사가 가중치를 갖는 방식으로 계산하는데 활용될 수 있다.The company and date classification unit 122 may classify the collected news articles by company and date. The company and date classification unit 122 may determine which company the article is about by using a company dictionary in which company names are constructed in the form of a database. The company and date classification unit 122 may determine which company the article is about, and then check the date the article is published, and organize the news articles by period. According to an embodiment of the present disclosure, the company and date classification unit 122 may classify news articles by companies, and then classify news related to the same company by a week period or a month period. Such period-based classification may be used to calculate the latest news articles in a weighted manner in the ESG company evaluation apparatus 100 to perform the company evaluation later.

뉴스 클러스터링부(123)는 수집된 뉴스 기사들에서 동일한 이슈를 다루는 관련 뉴스들을 하나의 클러스터로 구성할 수 있다. 뉴스 클러스터링부(123)는 다수의 뉴스 기사가 동일 이슈를 다루는 관련 뉴스인지를 확인하기 위해 뉴스 기사들간의 유사도 계산을 수행할 수 있다.The news clustering unit 123 may configure related news, which covers the same issue in the collected news articles, into a cluster. The news clustering unit 123 may perform a similarity calculation between news articles to confirm whether a plurality of news articles are related news dealing with the same issue.

일 실시예에 따르면, 뉴스 클러스터링부(123)가 뉴스 기사들 간의 유사도 계산을 수행하는 방식은, 각 문서를 벡터화한 후 각 벡터간의 코사인 유사도 계산을 통하는 것일 수 있다.According to an embodiment of the present disclosure, the news clustering unit 123 may perform similarity calculation between news articles by performing cosine similarity calculation between each vector after vectorizing each document.

뉴스 클러스링부(123)는 TF-IDF(Term Frequency - Inverse Document Frequency)를 이용하여 각 뉴스 기사를 벡터화 할 수 있다. TF(Term Frequency)는 특정한 단어가 문서 내에서 등장하는 빈도수를 나타내는 값으로, 이 값이 높을수록 문서에서 해당 단어가 중요하다고 여겨질 수 있다. 수집된 복수의 뉴스 기사들 내에서 특정 단어가 등장하는 빈도수를 DF(Document Frequency)로 나타낼 수 있는데, 이 값의 역수가 IDF(Inverse Document Frequency)이다. 특정 단어가 복수의 뉴스 기사들 사이에서 빈번하게 등장한다면 그 단어는 상투적인 단어가 되어 뉴스 기사에서 핵심적인 단어가 될 수 없기 때문에 DF가 아닌 IDF를 사용하는 것이다. TF-IDF는 TF와 IDF를 곱한 값으로 정의되며, 본 발명의 일 실시예에 따른 뉴스 클러스터링부(123)가 뉴스 기사에 대한 TF-IDF를 계산하는 방식은 수학식 1을 사용하는 것일 수 있다.The news clustering unit 123 may vectorize each news article using TF-IDF (Term Frequency-Inverse Document Frequency). TF (Term Frequency) is a value representing the frequency of occurrence of a specific word in a document. The higher this value, the more important the word in the document. The frequency at which a particular word appears in a plurality of collected news articles may be represented as a document frequency (DF), which is an inverse document frequency (IDF). If a word appears frequently among multiple news articles, it is an IDF rather than a DF because the word becomes a conventional word and cannot be a key word in the news article. The TF-IDF is defined as a value obtained by multiplying the TF and the IDF, and the manner in which the news clustering unit 123 calculates the TF-IDF for the news article according to an embodiment of the present invention may use Equation 1. .

Figure pat00001
Figure pat00001

상기 수학식 1에서 tfi.j는 뉴스 기사 j에서 단어 i가 등장하는 빈도를 나타내며, dfi는 뉴스 기사들로 구성된 집단에서 단어 i를 포함하고 있는 뉴스 기사의 수를 나타낸다.In Equation 1, tf ij denotes the frequency of occurrence of the word i in the news article j, and df i denotes the number of news articles including the word i in the group consisting of news articles.

뉴스 클러스터링부(123)는 상기 수학식 1을 토대로 각각의 뉴스 기사를 벡터화할 수 있으며, 각각의 뉴스 기사의 벡터값을 토대로 뉴스 기사들 간의 유사도를 계산할 수 있다.The news clustering unit 123 may vectorize each news article based on Equation 1, and calculate a similarity between news articles based on the vector value of each news article.

Figure pat00002
Figure pat00002

일 실시예에 따르면, 뉴스 클러스터링부(123)는 상기 수학식 2를 통해 뉴스 기사들 간의 유사도를 계산할 수 있다. 수학식 2에서 A와 B는 각각의 벡터이며, Ai와 Bi는 각각 A와 B 벡터에서의 i번째 성분을 의미한다. 뉴스 기사들 간의 코사인 유사도는 0에서 1 사이의 숫자로 계산되며, 0은 뉴스 기사들이 서로 독립적인 경우, 1은 뉴스 기사들이 서로 완전히 동일한 경우를 의미한다.According to an embodiment, the news clustering unit 123 may calculate the similarity between news articles through Equation 2 above. In Equation 2, A and B are the respective vectors, and A i and B i are the i th component in the A and B vectors, respectively. The cosine similarity between news articles is calculated as a number between 0 and 1, where 0 means that the news articles are independent of each other, and 1 means that the news articles are completely identical to each other.

뉴스 클러스링부(123)는 뉴스 기사들 간의 유사도를 계산한 후, 사전에 실험을 통해 설정된 기준값을 토대로 뉴스 기사들이 유사한지 아닌지를 판단할 수 있으며, 유사하다고 판단된 뉴스 기사들을 하나의 클러스터로 묶을 수 있다. 이하, 명세서에서 '클러스터'라 함은 뉴스 클러스터링부(123)에 의해 유사한 뉴스로 판단된 뉴스 기사들의 집합을 의미한다.After calculating the similarity between news articles, the news clustering unit 123 may determine whether the news articles are similar or not based on a reference value set through an experiment in advance. Can tie Hereinafter, the term 'cluster' in the specification means a set of news articles determined by the news clustering unit 123 as similar news.

일 실시예에 따른 뉴스 분류부(130)는 전술한 바와 같이 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)를 포함할 수 있다. 뉴스 분류부(130)는 뉴스 수집부(120)에 의해 수집된 뉴스 기사들을 세 가지 기준에 따라 분류할 수 있다. 뉴스 분류부(130)는 이원 분류부(131)를 통해 뉴스 기사들을 일차적으로 분류하고, 다음으로 ESG 분류부(132)를 통해 분류하며, 최종적으로 카테고리 분류부(133)를 통해 분류할 수 있다. 이 과정에서 뉴스 기사들은 보다 세밀한 기준으로 분류될 수 있다. As described above, the news classifier 130 may include a binary classifier 131, an ESG classifier 132, and a category classifier 133. The news classifier 130 may classify the news articles collected by the news collector 120 according to three criteria. The news classifier 130 may first classify the news articles through the binary classifier 131, then classify the news articles through the ESG classifier 132, and finally classify the news articles through the category classifier 133. . In this process, news articles can be classified on a more detailed basis.

이원 분류부(131)는 수집된 뉴스 기사 각각이 ESG와 관련된 것인지를 판단하여 참거짓(True or false)의 방식으로 분류할 수 있다. 즉, 이원 분류부(131)는 수집된 뉴스가 ESG 기업 평가에 사용될 수 있는 데이터인지를 판단하는데, 환경, 사회, 지배구조 중 적어도 하나와 관련이 있다고 판단하면 TRUE로 분류하고, 그렇지 않다면 FALSE로 분류할 수 있다. 따라서, 이원 분류부(131)는 스포츠, 연예, 정치, 예술 등과 같이 ESG 기업 평가에 있어 필요하지 않은 뉴스 기사들을 FALSE로 분류함으로써, ESG 기업 평가 장치(100)가 처리해야 할 뉴스 기사들의 양을 상당히 감소시킬 수 있다.The binary classification unit 131 may determine whether each of the collected news articles is related to the ESG and classify the data in a true or false manner. That is, the binary classification unit 131 determines whether the collected news is data that can be used to evaluate the ESG company. If it is determined to be related to at least one of the environment, society, and governance, the binary classification unit 131 classifies as TRUE, otherwise, FALSE. Can be classified. Therefore, the binary classification unit 131 classifies the news articles that are not necessary for the ESG company evaluation, such as sports, entertainment, politics, art, etc. as FALSE, so that the ESG company evaluation apparatus 100 processes the amount of news articles to be processed. Can be significantly reduced.

일 실시예에 따르면, ESG 분류부(132)는 이원 분류부(131)에서 TRUE로 분류된 뉴스 기사들을 환경, 사회, 지배구조의 세 이슈로 분류할 수 있다. 이후, 분류된 뉴스 기사들은 카테고리 분류부(133)에 의해 보다 세분화된 카테고리들로 분류될 수 있다. 즉, 환경, 사회, 지배구조의 이슈가 각각 보다 세밀한 하부 카테고리들로 나누어지며, 하나의 뉴스 기사는 카테고리 분류부(130)에 의해 하부 카테고리 중 어느 하나에 속하게 된다.According to an embodiment, the ESG classification unit 132 may classify news articles classified as TRUE in the binary classification unit 131 into three issues of environment, society, and governance. Thereafter, the classified news articles may be classified into more subdivided categories by the category classification unit 133. That is, the issues of environment, society, and governance are divided into more detailed subcategories, and one news article belongs to any one of subcategories by the category classification unit 130.

일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 머신 러닝 알고리즘을 이용하여 뉴스 기사들의 분류를 수행할 수 있다.According to an embodiment, the binary classifier 131, the ESG classifier 132, and the category classifier 133 may classify news articles using a machine learning algorithm.

이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)가 머신 러닝 알고리즘을 이용하여 분류를 수행하는 방식을 살펴보면, 우선적으로 자연어 분석을 통해 뉴스 기사에서 명사만을 추출할 수 있다. 일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 한국어로 구성된 뉴스 기사에서 명사만을 추출함에 있어 자연어 분석 패키지의 한 종류인 KoNLP를 사용할 수 있다. 다른 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 다른 언어로 구성된 뉴스 기사에서 명사를 추출하기 위해서 해당 언어에 알맞은 분석 툴을 사용할 수 있다.Looking at how the binary classifier 131, the ESG classifier 132, and the category classifier 133 classify using a machine learning algorithm, it is possible to first extract only nouns from news articles through natural language analysis. . According to an embodiment, the binary classifier 131, the ESG classifier 132, and the category classifier 133 may use KoNLP, which is a type of natural language analysis package, to extract only nouns from a news article composed of Korean. . According to another exemplary embodiment, the binary classifier 131, the ESG classifier 132, and the category classifier 133 may use an analysis tool suitable for a corresponding language to extract a noun from a news article composed of another language.

이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 뉴스 기사에서 명사만을 추출한 후에, 수학식 1을 통해 전술한 TF-IDF를 이용하여 행렬을 생성할 수 있다. TF-IDF를 이용하여 생성되는 행렬은 뉴스 클러스링부(123)에 의해 분류된 클러스터 별로 생성될 수 있다. 일 실시예에 따르면, 생성된 행렬에서 행에는 각각의 뉴스 기사에 포함된 단어(명사)가 나열될 수 있고, 열에는 각각의 단어(명사)에 대해 해당 단어가 포함되어 있는 뉴스 기사가 나열될 수 있다.The binary classifier 131, the ESG classifier 132, and the category classifier 133 may extract a noun only from a news article and then generate a matrix using the above-described TF-IDF through Equation 1. The matrix generated using the TF-IDF may be generated for each cluster classified by the news clustering unit 123. According to an embodiment, in the generated matrix, a row may include a word (noun) included in each news article, and a column may list a news article including the word for each word (noun). Can be.

이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 이후, TF-IDF를 이용하여 생성한 행렬을 토대로 머신 러닝 알고리즘을 통해 각각의 분류부의 역할에 맞는 분류를 수행할 수 있다. 일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 특정 머신 러닝 알고리즘을 채용한 후 사용자가 미리 분류해 놓은 연습용 데이터를 입력받아 학습을 수행함에 따라 분류 능력이 향상될 수 있다. 이후, 연습용 데이터를 통해 일정 정도 학습을 수행하고 난 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)에는 테스트 데이터가 입력될 수 있으며, 테스트를 통과한 각 분류부는 해당 머신 러닝 알고리즘을 통해 뉴스 기사들의 분류를 수행할 수 있다.The binary classifier 131, the ESG classifier 132, and the category classifier 133 may then perform a classification suitable for the role of each classifier through a machine learning algorithm based on a matrix generated using the TF-IDF. Can be. According to an embodiment, the binary classification unit 131, the ESG classification unit 132, and the category classification unit 133 employ a specific machine learning algorithm and then receive the training data pre-classified by the user to perform the learning. Therefore, the sorting ability can be improved. Subsequently, test data may be input to the binary classification unit 131, the ESG classification unit 132, and the category classification unit 133, which have been trained to some degree through the training data, and each classification unit that has passed the test corresponds to the corresponding classification unit. Machine learning algorithms can be used to classify news articles.

일 실시예에 따르면, 이원 분류부(131), ESG 분류부(132) 및 카테고리 분류부(133)는 Multinomial Bayes, Bernoulli Bayes, SGD(Stochastic Gradient Descend), Linear SVC, Perceptron, Random Forest 등의 머신 러닝 알고리즘 중 하나를 선택하여 채용할 수 있다.According to an embodiment, the binary classification unit 131, the ESG classification unit 132, and the category classification unit 133 may be machines such as Multinomial Bayes, Bernoulli Bayes, Stochastic Gradient Descend (SGD), Linear SVC, Perceptron, Random Forest, and the like. One of the running algorithms can be selected and employed.

일 실시예에 따른 평가 결과 도출부(140)는 뉴스 수집부(120)에 의해 수집되어 뉴스 분류부(130)에 의해 카테고리별로 분류된 뉴스 기사들을 토대로, ESG 기업 평가를 수행할 수 있다. 즉, 평가 결과 도출부(140)는 ESG 관련 기사를 토대로 기업별 점수화를 수행하며 점수를 통해 기업 평가를 수행할 수 있다. 전술한 바와 같이 평가 결과 도출부(140)는 증거 레벨 산출부(141), ESG 확률 산출부(142) 및 점수 산출부(143)를 포함할 수 있다.Evaluation result deriving unit 140 according to an embodiment may perform the ESG company evaluation based on the news articles collected by the news collector 120 and classified by category by the news classification unit 130. That is, the evaluation result deriving unit 140 may perform the scoring for each company based on the ESG-related article and perform the company evaluation through the score. As described above, the evaluation result deriving unit 140 may include an evidence level calculating unit 141, an ESG probability calculating unit 142, and a score calculating unit 143.

증거 레벨 산출부(141)는 뉴스 기사들에서 추출된 명사들을 복수개의 단어 카테고리로 분류할 수 있다. 일 실시예에 따르면, 증거 레벨 산출부(141)는 환경 피해(Environment Damage, D_Env), 회사 이해관계인(Company Stakeholder, S_Company), 일반적인 피해(General Dagmae, D_gen) 등으로 명사들을 분류할 수 있다.The evidence level calculator 141 may classify nouns extracted from news articles into a plurality of word categories. According to an embodiment, the evidence level calculator 141 may classify nouns into environmental damage (D_Env), company stakeholder (S_Company), general damage (General Dagmae, D_gen), and the like.

도 3은 증거 레벨 산출부(141)가 뉴스 기사들에서 추출된 명사들을 카테고리화 하는 방법을 설명하기 위한 도표이다.3 is a diagram for explaining a method of categorizing nouns extracted from news articles by the evidence level calculator 141.

도 3을 참조하면, 증거 레벨 산출부(141)는 추출된 명사들이 ESG 중 어느 항목에 해당하는지와, 해당 항목에서도 어떠한 요소와 관련이 있는지를 판단하여 최종적으로 카테고리화를 수행할 수 있다. 이와 같은 명사들의 카테고리화는 전술한 카테고리 분류부(133)가 수행하는 카테고리화와는 상이할 수 있다. 즉, 카테고리 분류부(133)가 수행하는 카테고리화는 각 뉴스 기사들을 환경, 사회, 지배구조의 이슈보다 세밀한 하부 카테고리들로 분류한 것이고, 증거 레벨 산출부(141)가 수행하는 카테고리화는 뉴스 기사들에서 추출된 명사들에 대한 카테고리화일 수 있다. 즉, 카테고리 분류부(133)는 뉴스 기사들 각각에 대한 카테고리화를 수행하며, 증거 레벨 산출부(1410는 명사들에 대한 카테고리화를 수행하는 것으로 카테고리에 속하는 개체들이 각각 뉴스 기사와 명사로 상이할 수 있다.Referring to FIG. 3, the evidence level calculator 141 may finally perform categorization by determining which items of the extracted nouns correspond to which items in the ESG and which elements are also related to the items. The categorization of such nouns may be different from the categorization performed by the category classification unit 133 described above. That is, the categorization performed by the category classifier 133 categorizes each news article into subcategories finer than the issues of environment, society, and governance, and the categorization performed by the evidence level calculator 141 is news. It may be a categorization of nouns extracted from articles. That is, the category classifier 133 performs categorization on each of the news articles, and the evidence level calculator 1410 performs categorization on the nouns. The entities belonging to the categories differ from the news articles and the nouns, respectively. can do.

일 실시예에 따르면, 증거 레벨 산출부(141)는 상기와 같은 카테고리화를 수행한 후, 뉴스 클러터링부(123)에 의해 분류된 뉴스 기사들의 집합인 클러스터별로 각 카테고리 항목에 몇 개의 단어가 포함되는지를 계산할 수 있다. 이와 같은 단어는 도 3에 표시된 것과 같이 증거 레벨 산출부(141)에 의해 추출되어 카테고리화가 완료된 명사들일 수 있다.According to an embodiment, the evidence level calculator 141 performs the categorization as described above, and then a few words are added to each category item for each cluster, which is a collection of news articles classified by the news cluttering unit 123. Can be calculated. Such words may be nouns extracted by the evidence level calculator 141 and categorized as shown in FIG. 3.

증거 레벨 산출부(141)는 카테고리 항목에 포함되는 단어의 개수를 토대로 각 카테고리 항목의 순위를 설정할 수 있고, 단어의 개수를 정규화하여 정규화된 수치를 토대로 각 카테고리 항목의 증거 레벨을 산출할 수 있다.The evidence level calculator 141 may set the rank of each category item based on the number of words included in the category item, and may calculate the evidence level of each category item based on the normalized number by normalizing the number of words. .

도 4는 증거 레벨 산출부(141)가 카테고리 항목에 포함되는 단어의 개수를 토대로 항목의 순위를 설정하고, 정규화하며, 정규화한 수치를 토대로 증거 레벨을 산출하는 방법을 설명하기 위한 도표이다.FIG. 4 is a diagram for describing a method of the evidence level calculating unit 141 calculating the level of evidence based on the number of words included in the category item, normalizing the item, and calculating the evidence level based on the normalized value.

도 4를 참조하면, 하나의 클러스터에 대해서 각각의 카테고리별로 몇 개의 단어가 포함되어 있는지, 어떠한 단어가 포함되어 있는지가 표시되어 있으며, 포함된 단어의 개수를 토대로 카테고리별 순위가 설정되어 있다. 또한, 각 카테고리별 포함된 단어의 개수가 정규화된 수치로 나타나 있으며, 이와 같은 정규화 수치를 토대로 증거 레벨이 표시되어 있다. 증거 레벨 산출부(141)는 정규화된 수치를 일정한 기준치에 따라 구간별로 분류하여 증거 레벨을 산출할 수 있다.Referring to FIG. 4, how many words are included in each category and which words are included in one cluster is displayed, and the ranking for each category is set based on the number of words included. In addition, the number of words included in each category is shown as a normalized value, and the evidence level is displayed based on the normalized value. The evidence level calculator 141 may calculate the evidence level by classifying the normalized numerical value by the section according to a predetermined reference value.

ESG 확률 산출부(142)는 증거 레벨 산출부(141)에서 사용하는 카테고리의 항목을 토대로 유사한 뉴스들의 집합인 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 속할지에 대한 확률을 산출할 수 있다.The ESG probability calculator 142 may calculate a probability of whether each cluster, which is a set of similar news, belongs to an environment, a society, or a governance structure, based on the category of the category used by the evidence level calculator 141. have.

ESG 확률 산출부(142)는 각 클러스터가 ESG 중 어느 이슈에 속할지에 대한 확률을 산출하기 전, 증거 레벨 산출부(141)가 사용한 카테고리 항목을 보다 적은 수의 집합으로 규정할 수 있다. 일 실시예에 따르면, 이와 같은 집합들은 환경, 사회, 지배구조, 기업 리스크 및 기타 관련 문제로 분류될 수 있다.The ESG probability calculator 142 may define the category items used by the evidence level calculator 141 in a smaller number of sets before calculating the probability of which issue each cluster belongs to. According to one embodiment, such sets may be classified as environmental, social, governance, corporate risk and other related issues.

Figure pat00003
Figure pat00003

ESG 확률 산출부(142)는 상기 수학식 3을 이용하여 특정 클러스터에 대한 환경, 사회 또는 지배구조 이슈에 대한 증거 레벨을 산출할 수 있다. ESG 확률 산출부(142)가 환경에 대한 증거 레벨을 산출하는 방법을 예로 들면, 수학식 3에서 Ci는 환경에 대한 카테고리 중 i번째 카테고리를 의미하고, n은 환경에 관한 카테고리의 개수를 의미하며, E(Ci-)는 환경에 대한 i번째 카테고리의 증거 레벨로 증거 레벨 산출부(141)에서 전술한 바와 같이 산출된 것을 의미한다. 즉, 증거 레벨 산출부(141)에서 산출한 증거 레벨은 추출된 명사를 분류하는데 이용한 카테고리들에 대한 증거 레벨이며, ESG 확률 산출부(142)가 산출하는 증거 레벨은 환경, 사회, 지배구조의 세 종류의 이슈에 대한 증거 레벨이다.The ESG probability calculator 142 may calculate the level of evidence on environmental, social or governance issues for a particular cluster using Equation 3 above. As an example of how the ESG probability calculator 142 calculates the evidence level for the environment, in Equation 3, C i means the i-th category among the categories for the environment, and n means the number of categories for the environment. Where E (C i− ) is calculated as described above in the evidence level calculator 141 as the evidence level of the i th category for the environment. That is, the evidence level calculated by the evidence level calculator 141 is an evidence level for categories used to classify the extracted nouns, and the evidence level calculated by the ESG probability calculator 142 is based on environmental, social, and governance structures. Level of evidence for three types of issues.

ESG 확률 산출부(142)는 각 클러스터가 환경, 사회, 지배구조의 세 종류 중 어느 것과 관련있는지에 대한 확률을 산출할 수 있다.The ESG probability calculator 142 may calculate a probability of which of the three types of clusters are related to the environment, society, and governance.

Figure pat00004
Figure pat00004

ESG 확률 산출부(142)는 상기 수학식 4를 이용하여 각 클러스터의 ESG 확률을 산출할 수 있다.The ESG probability calculator 142 may calculate the ESG probability of each cluster by using Equation 4 above.

도 5는 본 발명의 일 실시예에 따른 ESG 확률 산출부(142)가 각 클러스터에 대한 ESG 확률 산출을 수행한 결과를 나타내는 도표이다.5 is a diagram illustrating a result of ESG probability calculation for each cluster performed by the ESG probability calculator 142 according to an embodiment of the present invention.

도 5를 참조하면, 복수의 클러스터들에 대해서, 환경, 사회, 지배구조의 세 종류의 이슈에 대한 증거 레벨과 그에 따른 ESG 확률이 나타나 있다. 특정 클러스터가 환경, 사회, 지배구조 이슈 중 어느 것과 관련 있는지에 대한 확률을 모두 더하면 1이 되는 것을 확인할 수 있다.Referring to FIG. 5, for a plurality of clusters, evidence levels and three ESG probabilities are shown for three types of issues: environment, society, and governance. If you add up the probabilities of whether a cluster is related to environmental, social, or governance issues, you can see that it becomes 1.

일 실시예에 따른 점수 산출부(143)는 ESG 기업 평가의 최종 단계인 ESG 기업 평가 점수를 계산하기에 앞서, 각종 보조 지표들을 계산한 후에 계산된 보조 지표들을 이용하여 ESG 기업 평가 점수를 계산할 수 있다. 상기와 같은 보조 지표들 및 ESG 기업 평가 점수는 전술한 바와 같이 계산된 증거 레벨 및 ESG 확률을 통해 계산될 수 있다.According to an embodiment, the score calculator 143 may calculate the ESG company valuation score using the auxiliary indicators calculated after calculating various auxiliary indicators before calculating the ESG company valuation score, which is the final stage of ESG company evaluation. have. Such supplementary indicators and ESG company valuation score can be calculated through the level of evidence and ESG probability calculated as described above.

일 실시예에 따르면, 각종 보조 지표들은 ESG 리스크 점수, 기업 리스크 점수 및 관련성 점수 등으로 구성될 수 있다. 이와 같은 보조 지표들은 상기와 같은 세 종류에 한정되는 것은 아니고 다양한 수와 계산 방식으로 정의될 수 있음은 물론이다.  According to one embodiment, the various supplementary indicators may be composed of an ESG risk score, a corporate risk score and a relevance score. Such auxiliary indicators are not limited to the above three types but may be defined in various numbers and calculation methods.

Figure pat00005
Figure pat00005

일 실시예에 따르면, 점수 산출부(143)는 최종적으로 상기 수학식 5와 같은 방식으로 ESG 기업 평가 점수를 산출할 수 있다. 수학식 5에서 ESGrisk, CompanyRisk, Relevance는 각종 보조 지표들을 나타낸다. 수학식 5에서 ESGrisk, CompanyRisk, Relevance는 각종 보조 지표들을 나타낸다. ESGrisk는 특정 클러스터로 분류된 뉴스 기사들의 집합이 환경, 사회, 기업구조와 관련하여 얼마만큼의 위험성을 갖는지를 각각 계산하여 합산한 값일 수 있고, CompanyRisk는 ESG 확률 산출부(142)가 규정한 집합들 중 기업 리스크에 관련된 집합과 해당 집합으로 분류된 단어 카테고리들과 관련된 값일 수 있으며, Relevance는 ESG 확률 산출부(142)가 규정한 집합들 중 기타로 분류된 집합과 해당 집합으로 분류된 단어 카테고리들과 관련된 값일 수 있다. According to an embodiment, the score calculator 143 may finally calculate the ESG company evaluation score in the same manner as in Equation 5 above. In Equation 5, ESGrisk, CompanyRisk, and Relevance represent various auxiliary indicators. In Equation 5, ESGrisk, CompanyRisk, and Relevance represent various auxiliary indicators. ESGrisk can be calculated by summing and calculating how many risks related to the environment, society, and corporate structure of a set of news articles classified into a specific cluster, and CompanyRisk is a set defined by ESG probability calculation unit 142. Among the sets defined by the ESG probability calculation unit 142 and other categories and word categories classified into the set, Relevance may be a value related to a set related to corporate risk and word categories classified into the set. It may be a related value.

일 실시예에 따른 통신부(150)는 ESG 기업 평가 장치(100)와 외부 장치 간의 통신이 가능하도록 한다. 구체적으로는, ESG 기업 평가 장치(100)가 해당 장치의 사용자 단말기와 통신할 수 있도록 하며, 인터넷 연결을 통해 뉴스 수집부(120)가 발행되는 뉴스를 수집할 수 있도록 한다.The communication unit 150 according to an embodiment enables communication between the ESG company evaluation apparatus 100 and an external device. In detail, the ESG company evaluation apparatus 100 may communicate with the user terminal of the corresponding apparatus, and the news collector 120 may collect the published news through the Internet connection.

일 실시예에 따른 저장부(160)는 ESG 기업 평가 장치(100)의 동작에 있어 필요한 데이터들을 저장할 수 있다. 저장부(160)는 수집한 뉴스 기사, 뉴스 기사들에 대한 분류 정보, 점수화 정보, 머신 러닝 알고리즘들의 학습 이력 등을 데이터의 형식으로 보관할 수 있다.The storage unit 160 according to an embodiment may store data necessary for the operation of the ESG company evaluation apparatus 100. The storage unit 160 may store the collected news articles, classification information on the news articles, scoring information, learning history of machine learning algorithms, and the like in the form of data.

전술한 바와 같은 방식으로, ESG 기업 평가 장치(100)는 유사한 기사들의 집합인 각 클러스터 별로 ESG 기업 평가 점수를 최종적으로 도출할 수 있다.In the manner as described above, the ESG enterprise evaluation apparatus 100 may finally derive the ESG enterprise evaluation score for each cluster, which is a set of similar articles.

도 6은 본 발명의 일 실시예에 따른 ESG 기업 평가 장치(100)가 뉴스 기사들을 수집하는 과정부터 ESG 기업 평가 점수를 도출하는 과정을 개략적으로 나타낸 블록도이다.6 is a block diagram schematically illustrating a process of deriving an ESG company evaluation score from a process of collecting news articles by the ESG company evaluation apparatus 100 according to an embodiment of the present invention.

도 6을 참조하면, ESG 기업 평가 장치(100)는 기업 평가를 수행함에 있어 기초가 되는 데이터인 뉴스 기사들을 인터넷 상에서 정기적 또는 비정기적인 시간 간격을 가지고 수집할 수 있다(S601).Referring to FIG. 6, the ESG company evaluation apparatus 100 may collect news articles, which are basic data in performing enterprise evaluation, at regular or irregular time intervals on the Internet (S601).

이후, ESG 기업 평가 장치(100)는 수집한 뉴스 기사들을 기업별 및 날짜별로 분류할 수 있으며(S603), 수집한 뉴스 기사들이 작성된 언어에 따라 알맞은 형태소 분석기를 사용하여 해당 기사를 분석할 수 있다(S605).Thereafter, the ESG company evaluation apparatus 100 may classify the collected news articles by company and date (S603), and analyze the corresponding articles using an appropriate stemmer according to the language in which the collected news articles are written. (S605).

ESG 기업 평가 장치(100)는 형태소 분석이 완료된 뉴스 기사들을 토대로 각 뉴스 기사를 벡터화 한 후, 벡터들 간의 유사도 분석을 통해 뉴스 기사들 간의 유사도를 계산하여, 관련 뉴스들끼리 모아서 클러스터화를 수행할 수 있다(S607). 이 과정에서, ESG 기업 평가 장치(100)는 TF-IDF를 이용하여 각 뉴스 기사를 벡터화 할 수 있으며, 코사인 유사도 계산을 통해 각 뉴스 기사 간의 유사도를 계산할 수 있다.The ESG company evaluation apparatus 100 vectorizes each news article based on the news articles for which morphological analysis is completed, calculates similarity among news articles through similarity analysis between vectors, and collects related news and performs clustering. It may be (S607). In this process, the ESG company evaluation apparatus 100 may vectorize each news article by using the TF-IDF, and calculate the similarity between each news article through cosine similarity calculation.

ESG 기업 평가 장치(100)는 수집한 뉴스 기사들 각각이 환경, 사회 및 지배구조 중 어느 이슈에 속하는 것인지와, 환경, 사회 및 지배구조 이슈 각각에 속하는 세부 카테고리 중 어디에 속하는 것인지를 분류할 수 있다(S609). 이 과정에서 ESG 기업 평가 장치(100)는 선결적으로 각 뉴스 기사가 ESG 기업 평가를 수행하는데 관련이 있는 기사인지 아닌지를 TRUE or FALSE 형태로 분류할 수 있으며, 각 분류 단계에서 알맞은 머신 러닝 알고리즘을 채택하고 연습용 데이터를 생성하여 ESG 기업 평가 장치(100)가 해당 알고리즘을 통해 학습을 수행하도록 할 수 있다. EGG 기업 평가 장치(100)의 사용자는 머신 러닝 알고리즘과 연습용 데이터들을 통해 학습을 수행한 ESG 기업 평가 장치(100)를 테스트 데이터들을 통해 검증하고, 이를 통해 S609 단계의 각 분류가 수행되도록 할 수 있다.The ESG company evaluation apparatus 100 may classify whether each of the news articles collected belongs to an environment, a society, and a governance issue, and a category belonging to each of the environmental, social, and governance issues. (S609). In this process, the ESG enterprise evaluation apparatus 100 may preemptively classify whether each news article is related to performing ESG enterprise evaluation in the form of TRUE or FALSE, and select an appropriate machine learning algorithm in each classification step. By adopting and generating the training data, the ESG company evaluation apparatus 100 may perform the learning through the corresponding algorithm. The user of the EGG enterprise evaluation apparatus 100 may verify the ESG enterprise evaluation apparatus 100 that has learned through the machine learning algorithm and the training data through the test data, and may allow each classification of the step S609 to be performed. .

ESG 기업 평가 장치(100)는 S607 단계에서 분류된 각 클러스터 단위로, 해당 클러스터의 ESG 이슈 각각에 대한 증거 레벨값을 산출하고, 해당 클러스터에 대한 ESG 확률값을 산출할 수 있다(S611). 이 과정에서 ESG 기업 평가 장치(100)는 뉴스 기사들에서 추출된 명사들을 복수개의 단어 카테고리로 분류하고 이를 환경, 사회, 지배구조, 기업 리스크, 기타 관련 문제와 같은 집합들로 분류할 수 있다. 이후, ESG 기업 평가 장치(100)는 상기 집합들 중에서 환경, 사회, 지배구조에 대한 증거 레벨값을 산출하고 ESG 확률값 또한 산출 할 수 있다.The ESG company evaluation apparatus 100 may calculate an evidence level value for each ESG issue of the corresponding cluster in each cluster unit classified in step S607, and calculate an ESG probability value for the corresponding cluster (S611). In this process, the ESG enterprise evaluation apparatus 100 may classify nouns extracted from news articles into a plurality of word categories and classify them into sets such as environment, society, governance, corporate risk, and other related issues. Subsequently, the ESG company evaluation apparatus 100 may calculate an evidence level value for the environment, society, and governance structure among the sets, and also calculate an ESG probability value.

최종적으로, ESG 기업 평가 장치(100)는 S611 단계에서 산출한 증거 레벨값 및 ESG 확률값 등을 토대로 최종적인 ESG 기업 평가 점수를 산출할 수 있다(S613). 이 과정에서 ESG 기업 평가 장치(100)는 S611 단계에서 산출한 ESG 확률값과, 기업 리스크로 분류한 집합의 증거 레벨값 등을 활용할 수 있다.Finally, the ESG company evaluation apparatus 100 may calculate the final ESG company evaluation score based on the evidence level value and the ESG probability value calculated in step S611 (S613). In this process, the ESG company evaluation apparatus 100 may utilize the ESG probability value calculated in step S611 and the evidence level value of the set classified as the enterprise risk.

본 발명의 일 실시예에 따르면, ESG 기업 평가 장치(100)는 ESG 기업 평가 결과를 활용하는 개인 또는 기업이 특정 기업에 대해 평가 점수가 나온 근거를 요구할 때에 해당 점수가 나오는 근거를 제공하는 기능을 포함할 수 있다. 즉, 특정 기업의 기사들에 대한 평가 점수가 산출되었을 때에, 해당 평가 점수는 기사들에 존재하는 특정 단어의 빈도수에 따라 영향을 많이 받았다는 정보를 제공할 수 있으며, 해당 단어가 포함되는 기사들을 검색하여 젝공할 수도 있다.According to an embodiment of the present invention, ESG company evaluation apparatus 100 provides a function for providing a basis for the score is obtained when an individual or a company using the ESG company evaluation results request the basis for the evaluation score for a particular company. It may include. That is, when the evaluation scores for articles of a specific company are calculated, the evaluation scores can provide information that the influence of the specific scores on the articles is affected by the frequency of a specific word, and search for articles containing the words. It can also be used.

이와 같이, 본 발명의 실시예들에 의해 개시된 ESG 기업 평가 장치(100)가 자동화된 기업 평가를 수행함으로써, 인터넷 상에서 특정 기업에 대한 유사한 뉴스 기사들이 발행되었을 때에, 해당 뉴스 기사들이 환경, 사회, 지배구조 중 어느 이슈에 대한 것이고 해당 이슈에 대한 리스크가 얼마나 중대한 것인지를 판단할 수 있게 된다.As such, when the ESG enterprise evaluation apparatus 100 disclosed by the embodiments of the present invention performs an automated enterprise evaluation, when similar news articles about a specific company are published on the Internet, the news articles are displayed in the environment, society, It is possible to determine which issues of governance are relevant and how critical the risks are to those issues.

한편, 본 발명의 일 실시예에 따른 ESG 기업 평가 장치(100)는 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다.Meanwhile, the ESG enterprise evaluation apparatus 100 according to an embodiment of the present invention may also be embodied as computer readable codes on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored.

예컨대, 컴퓨터가 읽을 수 있는 기록매체로는 롬(ROM), 램(RAM), 시디-롬(CD-ROM), 자기 테이프, 하드디스크, 플로피디스크, 이동식 저장장치, 비휘발성 메모리(Flash Memory), 광 데이터 저장장치 등이 있다.For example, the computer-readable recording medium may be a ROM, a RAM, a CD-ROM, a magnetic tape, a hard disk, a floppy disk, a removable storage device, a nonvolatile memory (Flash memory). Optical data storage.

또한, 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.The computer readable recording medium can also be distributed over computer systems connected over a computer network so that the computer readable code is stored and executed in a distributed fashion.

이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다. In the above, embodiments of the present invention have been described with reference to the accompanying drawings, but those skilled in the art to which the present invention pertains may implement the present invention in other specific forms without changing the technical spirit or essential features. I can understand that. Therefore, it should be understood that the embodiments described above are exemplary in all respects and not restrictive.

100: ESG 기업 평가 장치 110: 제어부
120: 뉴스 수집부 121: 형태소 분석부
122: 기업 및 날짜 분류부 123: 뉴스 클러스터링부
130: 뉴스 분류부 131: 이원 분류부
132: ESG 분류부 133: 카테고리 분류부
140: 평가 결과 도출부 141: 증거 레벨 산출부
142: ESG 확률 산출부 143: 점수 산출부
100: ESG company evaluation device 110: control unit
120: news collection 121: morphological analysis
122: corporate and date classification unit 123: news clustering unit
130: news classification unit 131: binary classification unit
132: ESG classification unit 133: category classification unit
140: evaluation result deriving unit 141: evidence level calculating unit
142: ESG probability calculator 143: Score calculator

Claims (5)

ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 ESG 기업 평가 장치에 있어서,
인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터링을 수행하는 뉴스 수집부;
상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 뉴스 분류부; 및
클러스터 단위로 해당 클러스터에 대한 ESG 리스크를 계산하고 계산한 값을 토대로 ESG 기업 평가 점수를 산출하는 평가 결과 도출부를 포함하며,
상기 평가 결과 도출부는, 상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 클러스터 단위로 증거 레벨 산출을 수행하는 증거 레벨 산출부;
상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 ESG 확률 산출부; 및
ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 점수산출부를 포함하는, ESG 기업 평가 장치.
In the ESG company evaluation device for calculating the score by evaluating the company in terms of ESG (Environmnet, Social, Governance),
A news collector configured to collect a plurality of news articles on the Internet, classify them by date or by company, and perform clustering on news articles having a similarity or more through a similarity analysis between the news articles;
A news classification unit for classifying each of the news articles as related to environmental, social or governance issues; And
It includes an evaluation result derivation unit that calculates ESG enterprise valuation scores based on the calculated and calculated ESG risk for the cluster on a cluster basis.
The evaluation result deriving unit may include: an evidence level calculator configured to categorize nouns extracted from the news articles and to calculate an evidence level in cluster units based on nouns included in each category item;
An ESG probability calculator for calculating a probability of whether each cluster is included in an environment, a society, or a governance structure based on the category item extracted by the evidence level calculator; And
ESG enterprise evaluation apparatus comprising a score calculation unit for calculating the risk for ESG-related risks, corporate risks and other related problems in a different manner, and then calculates ESG enterprise valuation scores based thereon.
제1항에 있어서,
상기 증거 레벨 산출부는, 각 카테고리 항목에 포함되는 단어의 빈도수를 토대로 상기 카테고리 항목에 대한 순위 설정 또는 증거 레벨 산출을 클러스터 단위로 수행하는, ESG 기업 평가 장치.
The method of claim 1,
The evidence level calculation unit, ESG enterprise evaluation apparatus for performing the ranking setting or evidence level calculation for the category item in the cluster unit based on the frequency of the words included in each category item.
제1항에 있어서,
상기 ESG 확률 산출부는, 상기 증거 레벨 산출부가 추출한 상기 카테고리 항목을 환경, 사회, 지배구조, 기업리스크 및 기타 관련 문제의 분류를 가지는 집합으로 분류하는, ESG 기업 평가 장치.
The method of claim 1,
And the ESG probability calculating unit classifies the category item extracted by the evidence level calculating unit into a set having a classification of environment, society, governance, corporate risk, and other related problems.
제1항에 있어서,
상기 ESG 확률 산출부는, 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산함에 있어, 환경, 사회 또는 지배구조에 대해 산출된 증거 레벨을 기초로 하는 것을 특징으로 하는, ESG 기업 평가 장치.
The method of claim 1,
The ESG probability calculation unit is based on the level of evidence calculated for the environment, society or governance in calculating the probability of each cluster is included in the issue of environmental, social or governance, ESG enterprise evaluation device.
ESG 기업 평가 장치가 ESG(Environmnet, Social, Governance) 관점에서 기업을 평가하여 점수를 산출하는 방법에 있어서,
인터넷 상에서 복수의 뉴스 기사들을 수집하여 날짜별 또는 기업별로 분류하고, 상기 뉴스 기사들 간의 유사도 분석을 통해 유사도가 기준치 이상인 뉴스 기사들에 대한 클러스터화를 수행하는 단계;
상기 뉴스 기사들 각각을 환경, 사회 또는 지배구조 중 어느 이슈와 관련된 것인지 분류하는 단계;
상기 뉴스 기사들에서 추출된 명사들에 대한 카테고리화를 수행하고, 각 카테고리 항목에 포함되는 명사들을 기초로 하여 클러스터 단위로 증거 레벨 산출을 수행하는 단계;
추출된 카테고리 항목을 기초로 하여 각 클러스터가 환경, 사회 또는 지배구조 중 어느 이슈에 포함되는지에 대한 확률을 계산하는 단계; 및
ESG 관련 리스크, 기업 리스크 및 기타 관련 문제에 대한 리스크를 각각 상이한 방식으로 계산한 후 이를 토대로 ESG 기업 평가 점수를 산출하는 단계를 포함하는, ESG 기업 평가 장치의 점수 산출 방법.
In the method by which the ESG company evaluation device evaluates the company in terms of ESG (Environmnet, Social, Governance) to calculate the score,
Collecting a plurality of news articles on the Internet, classifying them by date or company, and performing clustering on news articles having a similarity or more than a reference value through similarity analysis between the news articles;
Classifying each of the news articles as relating to environmental, social or governance issues;
Performing categorization on nouns extracted from the news articles, and performing evidence level calculation on a cluster basis based on nouns included in each category item;
Calculating a probability of whether each cluster is included in an environment, a society, or a governance based on the extracted category item; And
A method for calculating the score of an ESG enterprise evaluation device, comprising calculating the ESG enterprise valuation score based on the calculation of the risk for the ESG related risk, the enterprise risk and other related problems in different ways.
KR1020190115921A 2019-09-20 2019-09-20 Esg based enterprise assessment device and operating method thereof KR102105319B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190115921A KR102105319B1 (en) 2019-09-20 2019-09-20 Esg based enterprise assessment device and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190115921A KR102105319B1 (en) 2019-09-20 2019-09-20 Esg based enterprise assessment device and operating method thereof

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170157068A Division KR102026304B1 (en) 2017-11-23 2017-11-23 Esg based enterprise assessment device and operating method thereof

Publications (2)

Publication Number Publication Date
KR20190110084A true KR20190110084A (en) 2019-09-27
KR102105319B1 KR102105319B1 (en) 2020-04-28

Family

ID=68097085

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190115921A KR102105319B1 (en) 2019-09-20 2019-09-20 Esg based enterprise assessment device and operating method thereof

Country Status (1)

Country Link
KR (1) KR102105319B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102462728B1 (en) * 2022-06-17 2022-11-03 주식회사 에코나인 Method for selecting ESG management material Issues
KR102641853B1 (en) * 2023-06-19 2024-03-04 신용보증기금 Environmental, Social and Governance Evaluation System

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102168198B1 (en) * 2018-12-12 2020-10-20 지속가능발전소 주식회사 Business default prediction system and operation method thereof
US20220237715A1 (en) * 2021-01-25 2022-07-28 Liam John Murray Methods, systems, apparatuses, and devices for facilitating dynamic sustainability mapping of real estate
KR102535522B1 (en) 2022-08-05 2023-05-26 김종웅 Apparatus and method for esg management based on data-driven software

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060096432A (en) 2003-10-23 2006-09-11 가부시키가이샤 아이.피.비. Enterprise evaluation device and enterprise evaluation program
JP2008165599A (en) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology Rumor information extraction device and rumor information extraction method
KR20100113423A (en) * 2009-04-13 2010-10-21 (주)미디어레 Method for representing keyword using an inversed vector space model and apparatus thereof
KR101599675B1 (en) * 2015-07-02 2016-03-03 한국기업데이터 주식회사 Apparatus and method for predicting degree of corporation credit risk using corporation news searching technology based on big data technology
KR20170004165A (en) * 2015-07-01 2017-01-11 지속가능발전소 주식회사 Device and method for analyzing corporate reputation by data mining of news, recording medium for performing the method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060096432A (en) 2003-10-23 2006-09-11 가부시키가이샤 아이.피.비. Enterprise evaluation device and enterprise evaluation program
JP2008165599A (en) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology Rumor information extraction device and rumor information extraction method
KR20100113423A (en) * 2009-04-13 2010-10-21 (주)미디어레 Method for representing keyword using an inversed vector space model and apparatus thereof
KR20170004165A (en) * 2015-07-01 2017-01-11 지속가능발전소 주식회사 Device and method for analyzing corporate reputation by data mining of news, recording medium for performing the method
KR101599675B1 (en) * 2015-07-02 2016-03-03 한국기업데이터 주식회사 Apparatus and method for predicting degree of corporation credit risk using corporation news searching technology based on big data technology

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102462728B1 (en) * 2022-06-17 2022-11-03 주식회사 에코나인 Method for selecting ESG management material Issues
KR102641853B1 (en) * 2023-06-19 2024-03-04 신용보증기금 Environmental, Social and Governance Evaluation System

Also Published As

Publication number Publication date
KR102105319B1 (en) 2020-04-28

Similar Documents

Publication Publication Date Title
KR102026304B1 (en) Esg based enterprise assessment device and operating method thereof
Teinemaa et al. Outcome-oriented predictive process monitoring: Review and benchmark
US11663254B2 (en) System and engine for seeded clustering of news events
KR102105319B1 (en) Esg based enterprise assessment device and operating method thereof
Guzman et al. Ensemble methods for app review classification: An approach for software evolution (n)
US9292491B2 (en) Method and system for analyzing text
US8489538B1 (en) Systems and methods for predictive coding
CN110928764A (en) Automated mobile application crowdsourcing test report evaluation method and computer storage medium
KR20180072167A (en) System for extracting similar patents and method thereof
CA2956627A1 (en) System and engine for seeded clustering of news events
CN115063035A (en) Customer evaluation method, system, equipment and storage medium based on neural network
Rahman et al. Application of classification models on maintenance records through text mining approach in industrial environment
Fritsche et al. Deciphering professional forecasters' stories: Analyzing a corpus of textual predictions for the German economy
Jeyaraman et al. Practical Machine Learning with R: Define, build, and evaluate machine learning models for real-world applications
Saptono et al. Examiners recommendation system at proposal seminar of undergraduate thesis by using content-based filtering
CN115577890A (en) Intelligent quality management method, electronic device and storage medium
Silva et al. Developing and Assessing a Human-Understandable Metric for Evaluating Local Interpretable Model-Agnostic Explanations.
CN112258095B (en) Standard normal distribution based scoring method, device, equipment and storage medium
Ambareesh et al. Resume Shortlisting Using NLP
CN111881287B (en) Classification ambiguity analysis method and device
Houstis et al. A Systematic Survey of Business Intelligence Literature Using Machine Learning Techniques
Lisangan et al. The Automatic Classification System for Academic Performance Evaluation at the Faculty of Information Technology Atma Jaya University of Makassar
Amalia et al. Mining User Reviews for Software Requirements of A New Mobile Banking Application
SundaraPandiyan Diagnosis and Classification of Mental Disorders using Machine Learning Techniques
Prasetyaningrum et al. Comparison Of Support Vector Machine Radial Base And Linear Kernel Functions For Mobile Banking Customer Satisfaction Analysis

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant