KR102574784B1 - Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템 - Google Patents

Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템 Download PDF

Info

Publication number
KR102574784B1
KR102574784B1 KR1020220097981A KR20220097981A KR102574784B1 KR 102574784 B1 KR102574784 B1 KR 102574784B1 KR 1020220097981 A KR1020220097981 A KR 1020220097981A KR 20220097981 A KR20220097981 A KR 20220097981A KR 102574784 B1 KR102574784 B1 KR 102574784B1
Authority
KR
South Korea
Prior art keywords
esg
text
corpus
token
input
Prior art date
Application number
KR1020220097981A
Other languages
English (en)
Inventor
김종웅
Original Assignee
주식회사 아이이에스지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아이이에스지 filed Critical 주식회사 아이이에스지
Priority to KR1020220097981A priority Critical patent/KR102574784B1/ko
Priority to PCT/KR2023/011363 priority patent/WO2024029939A1/ko
Application granted granted Critical
Publication of KR102574784B1 publication Critical patent/KR102574784B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

실시예들은 사용자의 전자 장치로부터 상기 ESG 문서의 내용 중 일부 내용으로 기재될 ESG 텍스트를 완성하기 위한 기초 텍스트를 수신하는 단계; 수신한 기초 텍스트를 미리 학습된 ESG 자동완성 모델에 입력하여 기초 텍스트의 다음 순번에 배치될 추천 텍스트를 예측하는 단계; 및 ESG 문서의 형식에 추천 텍스트를 기재하는 단계를 포함하는 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템에 관한 것이다.

Description

ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템 {Method for recommending suitable texts to auto-complete ESG documents and ESG service providing system performing the same}
본 출원의 실시 예들은 자연어 처리 기술을 이용하여 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템에 관한 것이다.
최근 기업들이 리스크 관리에 보다 많은 신경을 기울이면서, 기업들을 다방면으로 평가하고 이와 같은 평가 결과를 투자, 합병, 생산 라인에 대한 리스크 관리 등에 응용하고 있다.
일반적으로 기업들은 정량적으로 획득할 수 있는 재무적인 데이터들을 토대로 기업들을 평가하는 것이 일반적이었으나, 최근 들어서 비재무적인 데이터를 토대로 기업을 평가하고 리스크를 분석하는 방법론이 부각되고 있다. 기업들이 공개하는 재무적 데이터에는 해당 기업에게 불리한 내용이 반영되지 않으며, 기업이 제공하는 재무 관련 보고서에 대한 신뢰성 또한 의문시되는 실정이다. 비재무 데이터를 통한 기업 분석이 필요한 이유를 살펴보면, 사람들의 인터넷을 통한 SNS 활동이 활발해지면서, 기업 또는 제품에 대한 특정한 소문이 퍼지거나 하는 사건 등에 의해 기업 평판이 흔들리는 경우도 있으며 기업 오너의 범죄나 건강 관련 소문들에 의해 해당 기업이 가지는 리스크가 높아지는 경우도 있으나 이와 같은 사건들은 재무적 데이터를 통해 분석하기 어려운 것이 현실이다. 따라서, 재무적인 데이터뿐 아니라 비재무적인 데이터를 통해 기업을 분석함으로써 보다 정밀한 기업 평가가 가능해질 수 있다.
이와 같은 흐름에서, 비재무 데이터들을 ESG(Environmnet, Social, Governance)의 세 주제로 나누어서 분석하는 방법론이 부각되고 있다. 기업의 ESG 담당자는 해당 기업의 ESG 관련 지속 가능 보고서를 작성해서 배포해야 하는 의무를 가진다.
한편, 기업의 담당자가 ESG 관련 지속가능보고서를 작성하여 배포하는 목적은 주요이해관계자들에게 기업의 ESG 활동을 효과적으로 전달하기 위함이며, 이러한 과정에서 이해관계자의 국가, 특성 등에 따라 보고서상 적절한 표현과 문장을 활용하여야 할 필요성이 있음에도 불구하고 국문뿐만 아니라 다른 국가 언어의 보고서로 작성하고 싶을 때 키보드 자판을 통해 일일이 보고서를 작성하는 방식은 어문규범(語文規範) 준수 및 ESG 관련 지식과 단어를 숙지해야 한다는 번거로움이 있다.
특허공개공보 제10-2019-0059449호 (2019.05.31.)
상술한 문제를 해결하기 위해, 본 출원의 실시 예들은 사용자가 ESG 문서를 생성하는 작업을 보다 용이하게 수행할 수 있도록, 미리 학습된 자연어 처리 모델을 활용해 사용자의 입력 텍스트의 다음 순번에 배치될, ESG 분야에 적합한 텍스트의 말뭉치(예컨대, 단어, 문구 또는 문장)를 예측하는 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템을 제공하고자 한다
본 출원의 일 측면에 따른 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법은 하나 이상의 컴퓨팅 장치에 의해 수행된다. 상기 방법은,
사용자의 전자 장치로부터 상기 ESG 문서의 내용 중 일부 내용으로 기재될 ESG 텍스트를 완성하기 위한 기초 텍스트를 수신하는 단계;
수신한 기초 텍스트를 미리 학습된 ESG 자동완성 모델에 입력하여 기초 텍스트의 다음 순번에 배치될 추천 텍스트를 예측하는 단계; 및
ESG 문서의 형식에 추천 텍스트를 기재하는 단계를 포함할 수도 있다. 여기서, 상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치될 텍스트의 말뭉치를 예측하도록 학습된, 인공 신경망 구조를 포함한 모델일 수도 있다.
일 실시 예에서, 상기 ESG 자동완성 모델은, 샘플 텍스트 데이터를 자연어 처리하는 전처리 동작 및 샘플 텍스트의 토큰에 기초하여 트래이닝 데이터 세트를 형성하는 동작을 통해 형성된, 트래이닝 데이터 세트를 이용하여 미리 설계된 신경망 구조를 갖는 ESG 자동완성 모델을 학습하여 생성된 것일 수도 있다.
상기 전처리 동작은 입력 텍스트의 말뭉치를 복수의 토큰으로 분할하는 토큰화 처리 동작을 포함하고,
상기 ESG 자동완성 모델의 신경망 구조는 학습 과정에서 입력 텍스트의 말뭉치의 다음에 위치할 텍스트의 말뭉치를 복원하도록 설계된 것일 수도 있다.
일 실시 예에서, 상기 트래이닝 데이터 세트는 복수의 샘플 텍스트를 전처리하여 생성된 복수의 트래이닝 샘플로 이루어지고, 각각의 트래이닝 샘플은 트래이닝 데이터 및 레이블 데이터를 포함할 수도 있다.
상기 트래이닝 데이터는 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰을 해당 샘플 텍스트의 말뭉치 상의 순서대로 배열한 토큰 배열을 포함할 수도 있다.
상기 레이블 데이터는 트래이닝 데이터와 동일한 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰 중 일부 토큰을 제거하고 나머지 토큰을 샘플 텍스트의 말뭉치 상의 순서대로 배열한 잔여 토큰 배열을 포함하고, 상기 나머지 토큰은 미리 설정된 순번의 텍스트 토큰으로부터 맨 끝까지의 텍스트 토큰을 포함할 수도 있다.
일 실시 예에서, 상기 잔여 토큰 배열은 상기 샘플 텍스트로부터 획득된 토큰 세트에서 맨 처음의 텍스트 토큰의 다음 텍스트 토큰으로부터 맨 끝의 텍스트 토큰을 포함하는 것일 수도 있다.
일 실시 예에서, 상기 인공신경망 구조는 입력 토큰을 자연어 처리하여 입력 토큰의 특징을 추출하도록 구성된 인코더 및 입력 토큰의 특징에 기초하여 잔여 토큰 배열을 복원하도록 구성된 디코더를 포함할 수도 있다.
상기 ESG 자동완성 모델의 파라미터는, 텍스트를 추천하는 것을 학습하기 위해, 산출된 예측 값과 실제 값 간의 오차가 최소화되도록 파라미터가 조절된 것일 수도 있다.
일 실시 예에서, 상기 디코더는 ESG 자동완성 모델이 입력 텍스트에 함축된 의미를 적어도 부분적으로 학습하기 위한 핏팅 레이어를 포함할 수도 있다.
상기 핏팅 레이어는 추천 문장이 출력되기 이전에, 입력 텍스트가 입력될 경우 예측되어 출력될 다음 순번의 텍스트에 대해서 ESG 형식에 보다 가까운 데이터에 가중치를 부여하도록 구성될 수도 있다.
일 실시 예에서, 상기 샘플 텍스트는 상기 하나 이상의 컴퓨팅 장치에 연동된 데이터 웨어하우스 시스템으로부터 추출된 ESG 텍스트일 수도 있다.
상기 데이터 웨어하우스 시스템은 국내외 기업의 ESG 지속가능 보고서를 포함한 ESG 문서를 저장한다.
일 실시 예에서, 상기 방법은, 예측된 추천 텍스트를 상기 ESG 자동완성 모델에 입력하여 상기 추천 텍스트의 다음 순번에 배치될 새로운 추천 텍스트를 예측하는 단계; 및 출력된 새로운 추천 텍스트를, 상기 기초 텍스트 및 추천 텍스트의 내용을 포함한 상기 ESG 문서의 형식에 추가 기재하는 단계를 더 포함할 수도 있다.
일 실시 예에서, 상기 ESG 자동완성 모델은
복수의 추천 텍스트의 말뭉치를 산출하고, 각 추천 텍스트의 말뭉치별 확률 값에 기초하여 일부 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력하도록 학습된 것일 수도 있다.
상기 추천 텍스트를 예측하는 단계는,
상기 기초 텍스트의 다음 순번에 배치될 가능성이 있는 복수의 추천 텍스트를 출력하고 사용자의 전자 장치로 전송하는 단계; 및
선택된 추천 텍스트의 정보를 수신하여 기초 텍스트의 다음 순번에 기재될 추천 텍스트를 결정하는 단계를 포함할 수도 있다.
본 출원의 다른 일 측면에 따른 컴퓨터 판독가능한 기록매체는 상술한 실시 예들에 따른 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법을 수행하기 위한 프로그램을 기록할 수도 있다.
본 출원의 또 다른 일 측면에 따른 ESG 서비스 제공 시스템은,
미리 학습된 ESG 자동완성 모델을 이용하여 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하여 ESG 문서 완성 서비스를 제공하는 서비스 서버를 포함할 수도 있다. 상기 서비스 서버는,
사용자의 전자 장치로부터 수신한 입력 값을 미리 학습된 ESG 자동완성 모델에 적용하여 입력 값 다음 순서에 배치될 텍스트를 예측하고, 예측 결과를 사용자의 전자 장치로 전달하도록 구성된 문서 생성부를 포함한다.
일 실시 예에서, 상기 ESG 서비스 제공 시스템은,
상기 ESG 자동완성 모델을 학습하는데 이용된 샘플 텍스트가 추출되는, ESG 문서를 저장하는 데이터 웨어하우스 시스템을 더 포함할 수도 있다.
본 발명의 일 측면에 따른 ESG 서비스 제공 시스템은 ESG 문서 특화 문맥(context) 및 단어 데이터를 포함한 ESG 텍스트 데이터를 수집하고 상기 ESG 텍스트 데이터에 자연어 처리 기술을 적용함으로써, ESG 지속가능 보고서와 같은 ESG 문서를 작성하는데 일부 내용만 기재하면 나머지 내용 중 일부 또는 전부에 대해 기재 가능한 텍스트를 자동으로 완성해주는 ESG 문서 생성 지원 서비스를 제공할 수도 있다. 상기 자동 완성되는 텍스트는 ESG 문서의 형식을 만족하는 텍스트 데이터로 학습된 자연어 처리 모델을 활용하여 예측되는 ESG 문서에 특화된 텍스트이다. 상기 자동 완성되는 텍스트는 ESG 관련 분야에서 이용되는 텍스트의 말뭉치(예컨대, 단어, 문구 또는 문장)를 포함한다.
그 결과, 상기 ESG 서비스 제공 시스템은 사용자가 ESG 문서의 내용 전부를 키보드와 같은 입력 기기를 통해 일일이 수작업으로 기재할 필요가 없다. 자동 완성되는 텍스트는 ESG 문서의 형식을 만족하는 어문규범 및 관련 지식을 표현하므로, 사용자는 ESG 분야의 어문규범과 관련지식에 대한 깊은 이해 없이도 쉽게 원하는 ESG 문서를 생성할 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명 또는 종래 기술의 실시 예의 기술적 해결책을 보다 명확하게 설명하기 위해, 실시 예에 대한 설명에서 필요한 도면이 아래에서 간단히 소개된다. 아래의 도면들은 본 명세서의 실시 예를 설명하기 목적일 뿐 한정의 목적이 아니라는 것으로 이해되어야 한다. 또한, 설명의 명료성을 위해 아래의 도면들에서 과장, 생략 등 다양한 변형이 적용된 일부 요소들이 도시될 수 있다.
도 1은, 본 출원의 일 측면에 따른, ESG 서비스 제공 시스템의 개략도이다.
도 2는, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델을 생성하는 과정의 개략도이다.
도 3은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델에서 출력 텍스트를 예측하는 동작의 개략도이다.
도 4는, 본 출원의 다른 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법의 흐름도이다.
도 5는, 본 출원의 일 실시 예예 따른, 추천 텍스트의 말뭉치의 출력 결과를 도시한다.
도 6은, 본 출원의 다양한 실시 예들에 따른, ESG 진단, 중요성 주제 선별, 보고서 작성를 수행하는 전자 장치(110)의 구성을 나타낸 블록도이다.
도 7은 본 발명의 다양한 실시예들에 따른 ESG 진단, 중요성 주제 선별, 보고서 작성를 수행하는 방법을 나타낸 동작 흐름도이다.
도 8는 본 출원의 다양한 실시예들에 따른 ESG 진단 시스템을 나타낸 블록도이다.
도 9는 도 8에 도시된 ESG 진단 결과를 생성하는 단계(S301)의 일 실시예를 나타낸 동작 흐름도이다.
도 10 내지 13은 본 발명의 다양한 실시예들에 따른 ESG 진단 항목과 그에 상응하는 진단 피드백의 예시를 나타낸 도면들이다.
도 14는 본 발명의 다양한 실시예들에 따른 ESG 진단 피드백의 예시를 나타낸 도면이다.
도 15 및 16은 본 출원의 다양한 실시예들에 따른 ESG 진단 결과의 예시를 나타낸 도면이다.
도 17은 본 발명의 다양한 실시예들에 따른 중요성 주제 선별 시스템을 나타낸 블록도이다.
도 18는 도 7에 도시된 중요성 주제를 선별하는 단계(S302)의 일 실시예를 나타낸 동작 흐름도이다.
도 19 및 20은 본 발명의 다양한 실시예들에 따른 중요성 주제 선별 결과의 예시를 나타낸 도면이다.
도 21은, 본 출원의 또 다른 일 측면에 따른, ESG 보고서 생성 시스템을 나타낸 블록도이다.
도 22는, 도 7에 도시된 ESG 보고서를 생성하는 단계(S303)의 일 실시예를 나타낸 동작 흐름도이다.
이하에서, 도면을 참조하여 본 출원의 실시 예들에 대하여 상세히 살펴본다.
그러나, 이는 본 개시(disclosure)를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
본 명세서에서, "가진다," "가질 수 있다,""포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 단계, 부품, 요소 및/또는 성분 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재나 부가를 제외시키는 것이 아니다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
다양한 실시 예에서 사용된 "제 1", "제 2", "첫째" 또는 "둘째" 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 해당 구성요소들을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 수 있다. 예를 들면, 제1 구성요소와 제2 구성요소는, 순서 또는 중요도와 무관하게, 서로 다른 구성요소를 나타낼 수 있다.
본 명세서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to),"또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성(또는 설정)된"은 하드웨어적으로 "특별히 설계된(specifically designed to)"것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성(또는 설정)된 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.
도 1은, 본 출원의 일 측면에 따른, ESG 서비스 제공 시스템의 개략도이고, 도 2는, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델을 생성하는 과정의 개략도이다.
실시예들에 따른 ESG 서비스 제공 시스템(1)은 전적으로 하드웨어이거나, 전적으로 소프트웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 시스템은 데이터 처리 능력이 구비된 하드웨어 및 이를 구동시키기 위한 운용 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부(unit)", "시스템" 및 "장치" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 하드웨어는 CPU(Central Processing Unit), GPU(Graphic Processing Unit) 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.
도 1 및 도 2를 참조하면, 상기 ESG 서비스 제공 시스템(1)이 제공하는 ESG 서비스는 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 서비스를 포함한다. 상기 ESG 서비스 제공 시스템(1)은 이 서비스를 제공하기 위해, 데이터 웨어하우스 시스템(300)과 연결된 서비스 서버(200)를 포함한다.
데이터 웨어하우스 시스템(300)는 클라우드 데이터 웨어하우스 시스템 또는 기타 데이터 웨어하우스 시스템을 간단히 지칭하는 것으로서, 데이터 분석 및 보고를 위해, 하나 이상의 다른 소스(disparate sources)로부터 통합된 데이터의 중앙 저장소를 포함한 네트워크-기반 저장 시스템이다. 상기 데이터 웨어하우스 시스템(300)는 기업용 분석 보고서를 생성하기 위해 사용될 수 있는 현재, 과거 데이터를 저장할 수도 있다. 이를 위해, 데이터 웨어하우스 시스템(300)는 비즈니스 인텔리전스 도구(business intelligence tools), 데이터를 추출하고, 변환하며, 이를 저장소로 로드하기 위한 도구, 및 메타데이터를 관리하고 검색하기 위한 도구를 제공한다.
상기 데이터 웨어하우스 시스템(300)는 함수(예를 들어, 구조화된 질의 언어(structured Query Langague, SQL) 함수), 테이블 함수, 또는 프로시저(procedure)를 데이터 웨어하우스 시스템 외부에 있고, 웹 애플리케이션 프로그램 인터페이스(Web application programming interface)로서 노출된 원격 소프트웨어 코드로 바인딩(bind)하기 위한 기능을 제공하도록 구성될 수도 있다.
상기 데이터 웨어하우스 시스템(300)는 외부에서 관리되는 웹 API 관리 시스템 제공된 클라우드 컴퓨팅 서비스 플랫폼(예를 들어, Amazon Web Services®(AWS), Microsoft Azure® 또는 Google Cloud Services®)에서 외부에서 구현된 웹 엔드포인트(web endpoint)(예를 들어, 하이퍼텍스트 전송 프로토콜(HyperText Transfer Protocol, HTTP) 표현 상태 변경(Representational State Transfer, REST) 엔드포인트)에 의해 지원되는(backed) 함수 및 저장된 프로시저를 작성하기(author) 위한 메커니즘을 사용자에게 제공한다. 사용자는 웹 엔드포인트를 제공하고(provisioning), 저장 플랫폼 내의 비즈니스 로직을 기초로 엔드포인트를 구성할 책임이 있다. 일부 경우에서, 웹 API 관리 시스템은 람다 함수(Lambda functions)에 대한 요청을 프록시하고, 다른 경우에서, 웹 API 관리 시스템은 요청을 변환하며, 이를 데이터 웨어하우스 시스템 외부에 있는 제3자 소프트웨어 구성요소로 전달한다. 데이터 웨어하우스 시스템(300)은 이의 외부 소프트웨어 구성요소에 의해 제공되는 외부 함수가 사용자 정의 함수, 사용자-정의 테이블 함수 및 저장된 프로시저와 같이 질의에서 사용되는 것을 가능하게 한다.
데이터 웨어하우스 시스템(300)은 원격 소프트웨어 구성요소에 의해 제공된 외부 기능의 호출을 가능 하게 하기 위해 다양한 데이터 객체를 저장한다. 데이터 객체는 클라우드 컴퓨팅 플랫폼에 의해 제공되는 웹 API 관리 시스템을 통해 외부 기능을 호출하는 데 사용될 임시 보안 크리덴셜(credentials)을 획득하기 위해 네트워크-기반 데이터 웨어하우스에서 사용하는 정보를 저장한다. 질의의 실행 중에, 네트워크-기반 데이터 웨어 하우스 시스템은 임시 보안 크리덴셜을 사용하여 클라우드 컴퓨팅 서비스 플랫폼의 인증 시스템을 통해 타겟 엔 드포인트로 인증하고, 질의에서 정의된 타겟 데이터의 배치(batches)로 엔드포인트에서 기능을 호출한다. 타겟 데이터는 예를 들어, 이진 데이터, 자바스크립트 객체 표기법(JavaScript Object Notation, JSON) 인코딩된 데 이터, 또는 확장 가능한 마크업 언어(extensible Markup Language, XML)와 같은 다른 텍스트 포맷을 포함한다. 타겟 데이터는 HTTP 요청/응답과 함께 인라인으로(inline) 전달되거나, 또는 클라우드 컴퓨팅 서비스 플랫폼(예를 들어, Amazon® Simple Storage Service(S3®))에 의해 제공되는 일반적으로 액세스되는 저장소에 기록될 수 있다. 데이터 웨어하우스 시스템(300)에 저장된 사용자 데이터는 HTTP 요청 및 응답을 통해 전달하기에 적합한 포맷으로 인코딩된다.
도 2를 참조하면, 상기 시스템(1)에서 국문, 영문 또는 제3 언어로 기재된 ESG 문서로부터 ESG 텍스트를 추출하고 이를 상기 데이터 웨어하우스 시스템(300)에 저장한다.
상기 ESG 텍스트는 ESG 문서로부터 추출되었기 때문에, ESG 형식에 맞는 의미 및 표현을 가지는 텍스트이다. 상기 ESG 형식에 맞는 텍스트는 ESG 형식의 카테고리로 분류될 수도 있다. 상기 ESG 텍스트는 ESG 분야에서 활용되는 단어(예컨대, 키워드) 또는 문장을 포함할 수도 있다. 또한, 상기 ESG 텍스트는 ESG 분야와 관련된 타-분야에서 활용되는 단어, 문구(phrase) 또는 문장을 더 포함할 수도 있다. ESG 분야와 관련된 타-분야는 ESG 문서를 생성하는데 활용된 참조 문서의 분야일 수도 있다.
상기 ESG 문서는 정부 웹 페이지, 기업 웹 페이지, 기타 웹 사이트 등에서 이미 공개되어 있는 국/내외 평가 대상 기업의 ESG 지속가능 보고서, 또는 개별 기업의 ESG 담당자가 작성하여 배포한 기타 ESG 문서를 포함한다. 상기 평가 대상 기업은 사업체로서의 기업만을 지칭하지 않고 기관, 비영리 단체 등의 다양한 형태의 단체를 포괄하여 지칭할 수 있다.
일부 실시 예들에서, 상기 ESG 문서는 정부 문서 DB(310), 고객 문서 DB(320), 및 웹 사이트 문서 DB(330) 중 하나 이상의 외부 DB로부터 획득되어 상기 데이터 웨어하우스 시스템(300)에 저장될 수도 있다.
상기 정부 문서 DB(310)는 정부 데이터 포털에 액세스하여 검색된 적어도 하나의 기업에 대한 ESG 문서를 수집할 수도 있다.
상기 고객 문서 DB(320)는 상기 시스템(1)과 관련된 고객, 예를 들어, 상기 시스템(1)에서 제공하는 서비스에 가입한 고객 기업의 데이터 포털에 액세스하여 해당 고객에 대한 ESG 문서를 수집할 수도 있다. 단일 고객에 대해 다수의 ESG 문서가 수집될 수도 있다.
상기 웹 사이트 문서 DB(330)는 주요 웹 사이트로 미리 지정된 하나 이상의 웹 사이트 각각에 액세스하고 액세스한 웹 사이트에서 공개된 ESG 문서를 검색하여 수집할 수도 있다.
서비스 서버(200)는 네트워크 서버로 구현되는 다수의 컴퓨터 시스템 또는 컴퓨터 소프트웨어이다. 여기서, 네트워크 서버란, 사설 인트라넷 또는 인터넷과 같은 컴퓨터 네트워크를 통해 다른 네트워크 서버와 통신할 수 있는 하위 장치와 연결되어 작업 수행 요청을 접수하고 그에 대한 작업을 수행하여 수행 결과를 제공하는 컴퓨터 시스템 및 컴퓨터 소프트웨어(네트워크 서버 프로그램)를 의미한다. 그러나 이러한 네트워크 서버 프로그램 이외에도, 네트워크 서버 상에서 동작하는 일련의 응용 프로그램과 경우에 따라서는 내부에 구축되어 있는 각종 데이터베이스를 포함하는 넓은 개념으로 이해되어야 할 것이다. 상기 서비스 서버(200)는 네트워크 서버, 웹 서버, 파일 서버, 슈퍼컴퓨터, 데스크탑 컴퓨터 등과 같은 컴퓨팅 장치들의 임의의 유형 또는 유형들의 조합으로 구현될 수도 있다. 이를 위해, 서비스 서버(200)는 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다.
서비스 서버(200)는 사용자의 ESG 문서를 보다 쉽게 작성하기 위해 ESG 형식에 맞는 텍스트(예컨대, 문장)을 추천하는, ESG 문서 자동완성 서비스를 제공할 수도 있다. 이를 위해, 서비스 서버(200)는 사용자의 전자 장치(100)로부터 수신한 입력 값을 미리 학습된 ESG 자동완성 모델에 적용하여 입력 값 다음 순서에 배치될 텍스트, 단어(예컨대, 키워드) 또는 문장을 예측한다. 또한, 상기 서비스 서버(200)는 예측 결과를 상기 사용자의 전자 장치(100)로 전달하도록 구성될 수도 있다.
일부 실시 예들에서, 상기 서비스 서버(200)는 학습부(210)를 더 포함할 수도 있다. 도 2에 도시된 것처럼, 상기 데이터 웨어하우스 시스템(300)은 저장한 ESG 텍스트 데이터를 ESG 자동완성 모델을 생성하기 위한 샘플 텍스트 데이터로 학습부(210)로 공급할 수도 있다.
학습부(210)는 샘플 텍스트 데이터를 자연어 처리하여 미리 설계된 ESG 자동완성 모델을 학습할 수도 있다. 특정 실시 예들에서, 상기 학습부(210)는 샘플 텍스트 데이터를 자연어 처리하는 전처리 동작, 샘플 텍스트의 토큰에 기초하여 트래이닝 데이터 세트를 형성하는 동작, 및 상기 트래이닝 데이터 세트를 이용하여 미리 설계된 신경망 구조를 갖는 ESG 자동완성 모델을 학습하는 동작을 수행하도록 구성될 수도 있다.
도 2에 도시된 것처럼, 학습부(210)는 수신한 샘플 텍스트의 말뭉치(예컨대, 문장)를 자연어 처리하는, 학습을 위한 전처리 동작을 수행한다.
상기 전처리 동작은, 토큰화 처리 동작 및/또는 특수 토큰 부가 동작을 포함할 수도 있다.
토큰화 처리 동작은 전처리 대상 텍스트의 말뭉치를 미리 설정된 최소 분할 단위인 토큰 단위로 분할하여 복수의 토큰을 생성하는 동작이다. 상기 토큰 단위는, 예를 들어 단어 단위 또는 형태소 단위로 미리 설정될 수도 있다. 문장이 학습부(210)로 제공되면, 상기 학습부(210)는 문장을 토큰 단위로 분할하여 해당 문장의 토큰 세트를 형성할 수도 있다. 각 토큰 세트는 단일 말뭉치로부터 생성된 복수의 토큰으로 이루어진다.
상기 특수 토큰 부가 동작은 미리 정의된 복수의 특수 토큰 중 하나 이상의 특수 토큰을 전처리 대상 텍스트의 말뭉치에 부가하는 동작이다. 상기 특수 토큰은 상기 ESG 자동완성 모델의 출력 텍스트가 보다 자연스러운 텍스트 스타일로 표현되는데 사용되는 특수 토큰이다. 텍스트를 가리키는 상기 토큰과 달리, 상기 특수 토큰은 텍스트를 가리키지 않을 수도 있다. 이하, 설명의 명료성을 위해, 말뭉치의 텍스트를 토큰 단위로 분할하여 생성된 토큰을 텍스트 토큰으로 지칭하여, 본 출원의 실시 예들을 보다 상세히 서술한다.
상기 특수 토큰은, 예를 들어, 모르는 단어에 대한 토큰, 배치 데이터의 길이를 맞추기 위한 토큰, 문장의 시작을 가리키는 토큰, 문장의 종결을 가리키는 토큰, 및/또는 문장 텍스트 이외 기타 토큰을 포함할 수도 있다. 특수 토큰이 샘플 텍스트에 부가되고 특수 토큰이 부가된 샘플 텍스트의 말뭉치가 토큰화될 경우, 특수 토큰이 부가된 샘플 텍스트의 말뭉치의 토큰 세트가 입력되는 상기 ESG 자동완성 모델은 입력 토큰의 텍스트를 보다 용이하게 디코딩할 수도 있다.
일부 실시 예들에서, 상기 특수 토큰 부가 동작은 상기 전처리 대상 텍스트의 말뭉치를 토큰으로 분할할 필요가 없거나 또는 ESG 자동완성 모델의 출력 텍스트가 표현되는 언어에 대해 미리 연관된 언어 규칙이 있을 경우에 수행될 수도 있다.
이러한 전처리 동작을 통해, 상기 학습부(210)는 샘플 텍스트의 말뭉치가 토큰 단위로 분할된 텍스트 토큰으로 이루어진 토큰 세트, 분할 없이 특수 토큰만이 부가된 토큰(들)로 이루어진 토큰 세트, 또는 특수 토큰이 샘플 텍스트의 말뭉치에 부가된 뒤 분할된 텍스트 토큰으로 이루어진 토큰 세트를 이용하여 트래이닝 데이터 세트를 형성한다.
일부 실시 예들에서, 상기 학습부(210)는 복수의 트래이닝 샘플로 이루어진 트래이닝 데이터 세트를 형성할 수도 있다. 각각의 트래이닝 샘플은 트래이닝 데이터 및 레이블 데이터를 포함한다.
상기 복수의 트래이닝 샘플 각각은 복수의 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트로부터 각각 형성될 수도 있다. 각 트래이닝 샘플의 트래이닝 데이터, 레이블 데이터는 동일한 샘플 텍스트의 말뭉치에 대응한 토큰 세트로부터 획득된다.
상기 트래이닝 데이터는 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰(들)을 해당 샘플 텍스트의 말뭉치 상의 순서대로 배열한 토큰 배열을 포함할 수도 있다. 예를 들어, 트래이닝 데이터는 해당 샘플 문장에서 맨 처음의 토큰으로부터 맨 끝의 토큰까지의 토큰 배열을 포함할 수도 있다. 트래이닝 데이터의 토큰 배열은 입력 텍스트(즉, 샘플 텍스트)의 말뭉치의 전부에 대응한다.
상기 레이블 데이터는 트래이닝 데이터와 동일한 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰(들) 중 일부 토큰을 제거하고 나머지 토큰을 샘플 텍스트의 말뭉치 상의 순서대로 배열한 토큰 배열을 포함할 수도 있다. 즉, 레이블 데이터의 토큰 배열은 트래이닝 데이터의 토큰 배열에서 일부 토큰이 제거된 것이므로, 잔여 토큰 배열로 지칭될 수도 있다.
상기 잔여 토큰 배열을 이루는 토큰은 샘플 텍스트의 말뭉치 상에서 미리 설정된 순번의 텍스트 토큰부터 맨 끝의 텍스트 토큰을 포함할 수도 있다. 일부 실시예 들에서, 상기 미리 설정된 순번은 맨 처음의 다음 순번일 수도 있다. 그러면, 레이블 데이터는 해당 샘플 텍스트의 말뭉치(예컨대, 샘플 문장)에서 맨 처음의 텍스트 토큰의 다음 텍스트 토큰으로부터 맨 끝의 텍스트 토큰을 포함한 잔여 토큰 배열을 포함할 수도 있다. 즉, 레이블 데이터의 잔여 토큰 배열은 입력 텍스트(즉, 샘플 텍스트)의 말뭉치의 전부에서 상기 미리 설정된 순번의 직전 순번의 텍스트 토큰까지가 제거된, 일부 텍스트의 말뭉치에 대응한다.
학습부(210)에 의해 생성된 상기 트래이닝 데이터, 레이블 데이터를 포함한 트래이닝 데이터 세트는 ESG 자동완성 모델을 학습하는데 이용된다.
상기 ESG 자동완성 모델은 입력 텍스트를 자연어 처리하여 적어도 부분적으로 복원하도록 설계된 뉴럴 네트워크를 포함한다. 예를 들어, 상기 ESG 자동완성 모델은 PLM 또는 기타 자연어 처리 기반 네트워크 모델일 수도 있다. 상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치의 다음 순번에 배치되기에 적합한 텍스트의 말뭉치를 복원하도록 구성될 수도 있다. 일 예에서, 상기 ESG 자동완성 모델은 인코더 및 디코더를 포함할 수도 있다.
학습부(210)에 의해, 상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치되기 적합한 텍스트의 말뭉치를 예측하도록 학습된다. 여기서 텍스트의 말뭉치는 단어(예컨대, 키워드), 문구 또는 문장일 수도 있다. 잔여 텍스트의 말뭉치는 전술한 미리 설정된 순번의 텍스트 토큰으로부터 맨 끝의 텍스트 토큰까지의 잔여 토큰 배열이 나타낸 텍스트의 말뭉치이다.
상기 학습부(210)에 의해, ESG 자동완성 모델은 학습을 위한 샘플 텍스트의 말뭉치에서 특정 텍스트 말뭉치의 다음에 위치한 텍스트 말뭉치를 적절하게 복원하는 동작을 반복함으로써, 모델 내 파라미터가 특정 텍스트 말뭉치의 다음에 위치하기 적합한 텍스트 말뭉치를 예측하도록 학습된다.
이하, 인코더 및 디코더를 포함한 상기 일 예시의 ESG 자동완성 모델을 이용하여 학습 과정에 대해 보다 상세히 서술한다.
학습부(210)는 트래이닝 세트 내 각 트래이닝 샘플의 트래이닝 데이터를 상기 ESG 자동완성 모델에 입력한다. 상기 인코더는 입력 토큰을 자연어 처리하여 입력 토큰의 특징을 추출하도록 구성된다. 상기 특징은 벡터 형태 또는 맵과 같은 행렬 형태로 추출될 수도 있다. 상기 일 예에서, 상기 인코더의 입력 토큰은 트래이닝 데이터에 포함된 토큰 배열이다.
디코더는 입력 토큰의 특징에 기초하여 트래이닝 데이터의 토큰 배열 중에서 미리 설정된 순번의 텍스트 토큰으로부터 맨 끝의 텍스트 토큰을 포함한 잔여 토큰 배열을 복원하도록 구성된다. 전술한 트래이닝 데이터에 포함된 토큰 배열이 인코더에 입력되면, 상기 디코더는 상기 미리 설정된 순번의 텍스트 토큰으로부터 맨 끝의 텍스트 토큰까지 복원할 수도 있다. 디코더의 복원 값은 입력 텍스트의 말뭉치에서 맨 처음의 텍스트 토큰의 다음 텍스트 토큰으로부터 맨 끝까지의 텍스트 토큰을 복원한 결과로서, 각 트래이닝 샘플별 예측 값으로 활용된다.
도 3은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델에서 출력 텍스트를 예측하는 동작의 개략도이다.
도 3을 참조하면, 상기 디코더는 그리드 탐색 방식으로 잔여 토큰 배열을 복원할 수도 있다. 상기 디코더는 특정 토큰의 다음 순서에 배치 가능한 복수의 후보 토큰 중 가능성이 가장 높은 토큰을 선택하여, 잔여 토큰 배열을 복원한다. 도 3에 도시된 것처럼 복수의 후보 토큰은 ESG 분야의 텍스트로 이루어진 토큰이다. 디코더는 잔여 토큰 배열의 앞/뒤 맥락에 기초하여 잔여 토큰 배열의 위치에 배치될 가능성이 가장 높은 토큰을 선택한다.
상기 학습부(210)는 추천 텍스트를 추천하는 기능을 학습하기 위해, ESG 자동완성 모델의 파라미터를 조정할 수도 있다. 상기 ESG 자동완성 모델의 파라미터는 미리 설계된 인공 신경망 구조의 파라미터를 포함할 수도 있다.
상기 학습부(210)는 산출된 예측 값(예컨대, 디코더의 출력 값)과 실제 값 간의 오차가 감소하거나 최소화되도록 ESG 자동완성 모델의 파라미터를 조정할 수도 있다. 여기서, 실제 값은 출력 값을 산출하는데 이용된 트래이닝 샘플에 함께 포함된 레이블 데이터의 값이다.
상기 출력 값과 실제 값 간의 오차가 최소화될 경우, 학습된 ESG 자동완성 모델은 입력 텍스트의 말뭉치의 다음 순번에 배치될 텍스트의 말뭉치를 정확하게 예측할 수도 있다. ESG 자동완성 모델이 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 보다 정확하게 추론했다면, 상기 입력 텍스트의 말뭉치에서 미리 설정된 순번 이전까지의 텍스트 토큰을 제외한 나머지 텍스트의 말뭉치가 보다 정확하게 예측될 것이다.
이러한 과정을 통해 학습 완료된 ESG 자동완성 모델은 ESG 문서 상에서 입력 텍스트의 말뭉치의 다음 위치에 배치되기 적합한 텍스트를 추천 텍스트로 예측하도록 구성된다. 상기 출력 텍스트는 ESG 문서의 형식을 만족하는 텍스트로서, 입력 텍스트의 맥락에 연결되는 맥락을 가지면서 ESG 분야에 특화된 표현을 갖는 텍스트일 수도 있다.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 단일 입력 텍스트의 말뭉치가 입력될 경우, 상기 단일 입력 텍스트의 말뭉치의 다음 순번에 배치될 텍스트의 말뭉치를 하나 이상의 텍스트 말뭉치로 산출할 수도 있다. 예를 들어, 상기 ESG 자동완성 모델은 단일 문장이 입력될 경우 상기 단일 문장의 다음 순번에 배치되기에 적합한 후보 문장을 하나 또는 복수 개 산출할 수도 있다.
또한, 일부 실시 예들에서, 상기 ESG 자동완성 모델은 복수의 추천 텍스트의 말뭉치를 산출하고, 각 추천 텍스트의 말뭉치별 확률 값에 기초하여 일부 또는 전부의 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력할 수도 있다.
예를 들어, 상기 ESG 자동완성 모델은 입력 텍스트의 다음에 위치할 추천 텍스트를 산출하는 동작을 수행할 때마다 모델의 시드 값이 임의의 값을 갖도록 설정될 수도 있다. 동일한 입력 텍스트에 대해서 해당 추천 텍스트를 산출하는 동작을 복수 회 반복할 경우, 상기 복수 회 중 2이상의 서로 다른 추천 텍스트의 말뭉치를 산출할 수도 있다.
이 경우, 상기 추천 텍스트의 개수는 동일한 입력 텍스트에 대해 해당 추천 텍스트를 산출하는 동작의 반복 회수를 가리키는, 미리 지정된 하이퍼 파라미터에 의존할 수도 있다.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 각 추천 텍스트의 말뭉치별 확률 값이 미리 설정된 임계 확률 값 이상인 일부 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력할 수도 있다. 그러면, 상기 시스템(1)은 사용자의 선택 명령에 대응한 추천 텍스트의 말뭉치를 상기 입력 텍스트의 다음 위치에 배치할 수도 있다. 사용자의 선택에 따라 배치된 추천 텍스트의 말뭉치는 다다음 순서의 추천 텍스트의 말뭉치를 산출하기 위한 새로운 입력 텍스트로 이용된다. 이러한 과정의 반복으로 인해, 사용자는 몇 번의 선택 명령을 통해 ESG 문서의 내용의 일부 또는 전부를 완성할 수도 있다.
특정 실시 예들에서, 상기 디코더는 핏팅 레이어를 포함할 수도 있다. 상기 핏팅 레이어는 ESG 자동완성 모델이 입력 텍스트의 다음 순번의 텍스트로서 상기 ESG 형식에 맞는 의미 및/또는 표현의 텍스트를 예측하기 위해 상기 디코더의 말단에 배치된다. 일부 실시 예들에서, 상기 디코더가 (예컨대, 소프트맥스와 같은) 확률 함수를 포함할 경우, 상기 핏팅 레이어는 상기 확률 함수 이전의 데이터 경로 상에 배치될 수도 있다.
상기 학습부(210)는, 상기 핏팅 레이어를 이용하여 상기 ESG 자동완성 모델이 입력 텍스트에 함축된 의미를 적어도 부분적으로 학습하는, 강화 학습 동작을 수행할 수도 있다.
상기 핏팅 레이어는 추천 문장이 출력되기 이전에, 입력 텍스트가 입력될 경우 예측되어 출력될 다음 순번의 텍스트(예컨대, 단어, 문구 또는 문장)에 대해서 ESG 형식에 보다 가까운 데이터에 가중치를 부여하도록 구성된다. 일부 실시 예들에서, ESG 형식에 적합한 정도에 따라 보다 높은 가중치 값이 부여될 수도 있다. 상기 핏팅 레이어에 의해 상기 ESG 자동완성 모델은 ESG 형식에 맞는 ESG 분야의 텍스트에 함축된 의미론적 부분을 적어도 부분적으로 학습할 수 있다.
일부 실시 예들에서, 상기 ESG 형식에 적합한 정도는 ESG 문서에 나타난 빈도에 기초할 수도 있다.
만약 상기 ESG 자동완성 모델이 GPT(Generative Pre-trained Transformer) 모델에 기반하여 설계될 경우를 가정해보자. 상기 ESG 자동완성 모델이 핏팅 레이어를 포함하지 않고 입력 텍스트의 다음 단어, 문구 또는 문장을 예측하도록 미리 학습될 경우, 여러 카테고리의 말뭉치 데이터가 상기 다음 단어, 문구 또는 문장으로 예측될 수도 있다. 상기 특정 실시 예들에서, 상기 ESG 자동완성 모델은 핏팅 레이어를 통해 ESG 형식 카테고리의 말뭉치 데이터에서 입력 텍스트의 다음 단어, 문구 또는 문장을 구현할 수도 있다.
그 결과, 상기 핏팅 레이어를 포함한 ESG 자동완성 모델은 ESG 문서의 형식을 만족하면서 입력 텍스트의 말뭉치의 다음 위치에 배치되기에 적합한(즉, 가능성이 가장 높은) 텍스트의 말뭉치를 예측하도록 학습된다.
상기 서비스 서버(200)는 도 2와 같이 학습된 ESG 자동완성 모델을 활용하여 사용자가 ESG 문서를 작성하는 작업을 지원한다. 일부 실시 예들에서, 상기 서비스 서버(200)는 사용자의 입력 텍스트의 다음 위치에 배치될 추천 텍스트를 예측하여 사용자의 ESG 문서 완성을 지원하는 ESG 문서 생성부(250)를 더 포함할 수도 있다. 상기 ESG 문서 생성부(250)는 상기 ESG 자동완성 모델을 이용하도록 구성된다. 상기 ESG 문서 생성부(250)의 동작에 대해서는 아래의 도 5를 참조해 보다 상세히 서술한다.
상기 전자 장치(100)는 서비스 서버(200)의 예측 동작을 개시하기 위한 입력 텍스트를 입력하고, 서비스 서버(200)에서 예측한 추천 텍스트 또는 입력 텍스트 및 예측한 추천 텍스트를 포함한, 적어도 부분적으로 자동완성된 ESG 문서의 내용을 출력하도록 구성된다. 또한, 일부 실시 예들에서, 상기 전자 장치(100)는 예측한 추천 텍스트 중 문서 내용으로 이용할 하나의 텍스트를 선택하도록 더 구성될 수도 있다.
상기 전자 장치(100)는 서비스 서버(200)와 통신하는 클라이언트 단말 장치로서, 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다. 상기 전자 장치는, 예를 들어, 랩탑 컴퓨터, 기타 컴퓨팅 장치, 태블릿, 셀룰러 폰, 스마트 폰, 스마트 워치, 스마트 글래스, 헤드 마운트 디스플레이(HMD), 기타 모바일 장치, 기타 웨어러블 장치일 수도 있다.
상기 전자 장치(100), 서비스 서버(200) 또는 시스템(1)이 다른 구성요소를 포함할 수도 있다는 것이 통상의 기술자에게 명백할 것이다. 예를 들어, 상기 서비스 서버(200)는 데이터 엔트리를 위한 입력 장치, 및 인쇄 또는 다른 데이터 표시를 위한 출력 장치를 포함하는, 본 명세서에 서술된 동작에 필요한 다른 하드웨어 요소를 포함할 수도 있다. 또한, 상기 시스템(1)은 서비스 서버(200)와 외부 장치(예를 들어, 사용자 단말, 또는 외부 데이터베이스 등) 사이를 연결하는 네트워크, 네트워크 인터페이스 및 프로토콜 등을 더 포함할 수 있다.
대안적인 실시 예들에서, 상기 학습부(210)는 서비스 서버(200)의 내부에 포함되는 것으로 제한되지 않는다. 상기 학습부(210)는 서비스 서버(200)의 외부 구성요소로 구현될 수도 있다. 이 경우, 상기 학습부(210)는 데이터 웨어하우스 시스템(300), 서비스 서버(200)와 전기 통신하도록 구성된다. 상기 서비스 서버(200)는 외부의 학습부(210)로부터 미리 학습된 ESG 자동완성 모델을 수신하고, 수신된 모델을 활용하여 사용자의 ESG 문서를 보다 쉽게 작성하기 위해 ESG 형식에 맞는 문장을 추천하는, ESG 텍스트 자동완성 서비스를 제공할 수도 있다.
도 4는, 본 출원의 다른 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법의 흐름도이다.
도 4의 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법(이하, ESG 텍스트 추천 방법)은 도 1의 ESG 서비스 제공 시스템(1)의 적어도 일부 구성요소(예컨대, 서비스 서버(100))와 같은 하나 이상의 컴퓨팅 장치에 의해 수행될 수도 있다. 여기서, ESG 텍스트는 ESG 문서의 형식을 만족하는 텍스트를 지칭한다.
도 4를 참조하면, 상기 ESG 텍스트 자동완성 방법은, 사용자의 전자 장치(100)로부터 상기 ESG 문서의 내용 중 일부 내용으로 기재될 ESG 텍스트를 완성하기 위한 기초 텍스트를 수신하는 단계(S410)를 포함한다. 상기 기초 텍스트는 다음 순번에 배치될 텍스트를 예측하는 단서로 활용된다.
상기 기초 텍스트를 수신하는 단계(S410)에서 기초 텍스트는 ESG 문서에 기재될 단어(예컨대, 키워드), 문구 또는 문장이다. 상기 기초 텍스트는, 예를 들어 해당 ESG 문서를 완성하는데 요구되는 필수 텍스트 중 일부 또는 전부의 텍스트, 또는 ESG 문서의 내용 전체 중 일부분의 내용을 나타낸 텍스트일 수도 있다.
완성할 ESG 문서의 내용 전체가 해당 ESG 문서에 기재되기 위해, 내용 전체 중 일부분에 속하는 기초 텍스트가 입력되면, 나머지 내용 중 일부 또는 전부가 추천되어 ESG 문서가 자동 완성된다.
일부 실시 예들에서, 상기 단계(S410)의 기초 텍스트는 상기 ESG 서비스 제공 시스템(1)이 운영하는 특정 웹 페이지에 액세스할 경우 제공되는 인터페이스 화면을 통해 입력될 수도 있다.
상기 인터페이스 화면은 완성하길 원하는 ESG 형식을 표현하도록 구성될 수도 있다. 상기 인터페이스 화면을 통해 사용자는 자신이 완성할 ESG 문서의 형식에 내용을 직접 입력하거나 또는 자동 완성 결과를 실시간으로 제공받을 수도 있다.
또한, 상기 ESG 텍스트 추천 방법은, 상기 단계(S410)에서 수신한 기초 텍스트를 미리 학습된 ESG 자동완성 모델에 입력하여 기초 텍스트의 다음 순번에 배치될 추천 텍스트를 예측하는 단계(S420)를 포함한다.
일부 실시 예들에서, 상기 추천 텍스트를 산출하는 단계(S420)는, 상기 기초 텍스트의 말뭉치를 전처리하여 입력 데이터를 형성하는 단계, 및 형성된 입력 데이터를 상기 미리 학습된 ESG 자동완성 모델에 입력하여 적어도 하나의 추천 텍스트를 산출하는 단계를 포함할 수도 있다.
상기 단계(S420)에서 수행되는 전처리 동작은 토큰화 처리 동작 및/또는 특수 토큰 부가 동작을 포함한다. 상기 전처리 동작은 ESG 자동완성 모델의 트래이닝 데이터를 생성하는데 이용된 전처리 동작에 대응할 수도 있다. 예를 들어, 상기 트래이닝 데이터가 토큰화 처리 동작만 전처리해서 생성될 경우, 서비스 서버(200)는 추천 텍스트를 산출하기 위해 기초 텍스트의 말뭉치를 토큰화 처리 동작하여 입력 데이터를 생성할 수도 있다.
상기 단계(S420)의 ESG 자동완성 모델은 단계(S410)의 기초 텍스트의 다음 순번에 배치되기에 적합한, ESG 텍스트의 말뭉치를 예측하도록 미리 학습된다. 상기 ESG 자동완성 모델은 기초 텍스트의 다음 순번에 배치될 가능성이 있는 하나 이상의 텍스트의 말뭉치를 산출하고, 산출된 하나 이상의 텍스트의 말뭉치 중 적어도 하나의 텍스트의 말뭉치를 추천 텍스트의 말뭉치로 출력하도록 구성될 수도 있다.
상기 ESG 텍스트의 말뭉치는 단어(예컨대, 키워드), 문구 또는 문장일 수도 있다.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 하나 이상의 ESG 텍스트의 말뭉치를 추천 텍스트의 말뭉치로 출력할 수도 있다.
서비스 서버(200)는 출력된 하나 이상의 추천 텍스트의 말뭉치를 전자 장치(100)로 전송할 수도 있다. 상기 전자 장치(100)는 수신한 추천 텍스트를 사용자에게 제공할 수도 있다. 일부 실시 예들에서, 상기 전자 장치(100)는 기초 텍스트 및 각각의 추천 텍스트를 순서대로 배열한 결과를 제공할 수도 있다.
도 5는, 본 출원의 일 실시 예예 따른, 추천 텍스트의 말뭉치의 출력 결과를 도시한다.
도 5를 참조하면, 상기 단계(S410)에서 "대상㈜는 온실가스 감출을 위해 적극적인 설비 투자와 활동을 꾸준히 수행하고 있습니다"의 문장이 기초 텍스트로 입력될 경우, 해당 문장의 다음 순번에 배치되기 적합한 하나 이상의 추천 텍스트가 상기 ESG 자동완성 모델로부터 출력될 수도 있다. 상기 ESG 자동완성 모델은 복수의 추천 문장을 산출하고, 상기 복수의 추천 문장별 확률 값에 기초하여 도 5에 도시된 것처럼 제1 문장 내지 제5 문장을 추천 텍스트로 출력할 수도 있다. 상기 제1 문장 내지 제5 문장 각각은 기초 문장의 다음 순번에 배치되어 제공될 수도 있다.
상기 단계(S420)에서 이용되는 ESG 자동완성 모델은 도 2, 도 3을 참조해서 위에서 서술하였는 바, 자세한 설명은 생략한다.
다시 도 4를 참조하면, 상기 ESG 텍스트 추천 방법은, ESG 문서의 형식에 추천 텍스트를 기재하는 단계(S430)를 더 포함할 수도 있다.
상기 단계(S420)에서 단일 추천 텍스트가 출력될 경우, 출력된 단일 추천 텍스트는 기초 텍스트의 다음 순번에 곧바로 기재될 수도 있다.
상기 단계(S420)에서 복수의 추천 텍스트가 출력될 경우, 상기 단계(S430)에서 기재되는 추천 텍스트는 복수의 추천 텍스트 중 어느 하나의 텍스트이다. 기재될 추천 텍스트는 사용자의 선택에 의해 결정될 수도 있다. 예를 들어, 사용자의 전자 장치(100)는 도 5의 화면을 표시하여 제1 문장 내지 제5 문장 중 어느 하나의 추천 문장을 기초 문장의 다음 순번에 기재할 추천 문장으로 선택하는 사용자 명령을 유도한다. 어느 하나의 문장이 선택되면, 전자 장치(100)는 선택된 추천 문장의 정보를 서비스 서버(200)로 전송하여 상기 기초 텍스트 및 추천 텍스트의 내용으로 상기 ESG 문서의 현재 내용을 업데이트한다.
또한, 상기 ESG 텍스트 추천 방법은, 단계(S420)에서 예측된 추천 텍스트를 상기 ESG 자동완성 모델에 입력하여 상기 단계(S420)의 추천 텍스트의 다음 순번에 배치될 새로운 추천 텍스트를 예측하는 단계(S440)를 더 포함할 수도 있다. 그러면, ESG 자동완성 모델은 추천 텍스트의 맥락에 연결되는 맥락을 가지면서 ESG 분야에 특화된 표현을 갖는 새로운 추천 텍스트를 출력한다.
또한, 상기 ESG 텍스트 추천 방법은, 단계(S440)에서 출력된 새로운 추천 텍스트를 단계(S430)의 ESG 문서의 형식에 추가 기재하는 단계(S450)를 더 포함할 수도 있다. 상기 단계(S430)의 ESG 문서의 형식은 기초 텍스트 및 추천 텍스트의 내용을 포함한 상태이다.
상기 단계(S450)에서 새로운 추천 텍스트가 기재되면, 작성 중인 ESG 문서는 단계(S410)의 기초 텍스트, 단계(S420)의 추천 텍스트 및 단계(S440)의 새로운 추천 텍스트의 내용을 포함하도록 업데이트된다. 단계(S450)의 동작은, 단계(S430)의 동작과 유사하므로 자세한 설명은 생략한다.
일부 실시 예들에서, 상기 ESG 텍스트 추천 방법은, ESG 문서 전체 내용이 완성될 때까지 상기 단계(S440, S450)를 반복하는 단계(S460)를 더 포함할 수도 있다.
그러면, 사용자는 단계(S410)에서 전자 장치(100)를 통해 최소한의 텍스트를 기초 텍스트로 입력하여, ESG 문서를 자동 완성할 수도 있다.
추가적으로, 상기 데이터 웨어하우스 시스템(300)에 구축되는 ESG 문서는 전술한 것처럼, 개별 기업에 의해 공개된 ESG 지속가능 보고서 또는 기타 ESG 문서와 더불어, ESG 보고서를 생성하기 위해 설계된 시스템에 의해 생성된 ESG 보고서를 더 포함할 수도 있다.
상기 ESG 보고서는 아래의 도 6의 전자 장치(110)에서 생성될 수도 있다.
도 6은, 본 출원의 다양한 실시 예들에 따른, ESG 진단, 중요성 주제 선별, 보고서 작성를 수행하는 전자 장치(110)의 구성을 나타낸 블록도이다.
도 6을 참조하면, 본 발명의 다양한 실시예들에 따른 전자 장치(110)는 메모리(111), 송수신부(112), 프로세서(113), 입력부(114) 및 출력부(115) 중에서 적어도 하나 이상을 포함할 수 있다.
전자 장치(110)는 보고서 작성자의 입력에 기초하여 ESG 보고서를 생성할 수도 있다.
메모리(111)는 데이터를 영구적, 반영구적 또는 임시적으로 저장하는 다양한 저장 장치를 지칭할 수 있다. 예컨대, 메모리(111)에는 HDD(Hard Disk Drive), SSD(Solid State Drive), CD(Compact Disc), RAM(Random Access Memory), Rom(Read Only Memory) 등이 포함될 수 있다.
메모리(111)는, 프로세서(113)와 연결되고 프로세서(113)의 동작을 위한 기본 프로그램, 응용 프로그램, 설정 정보, 프로세서(113)의 연산에 의하여 생성된 정보 등의 데이터를 저장할 수 있다. 메모리(111)는 휘발성 메모리, 비휘발성 메모리 또는 휘발성 메모리와 비휘발성 메모리의 조합으로 구성될 수 있다. 그리고, 메모리(111)는 프로세서(113)의 요청에 따라 저장된 데이터를 제공할 수 있다.
메모리(111)는 송수신부(112)에서 수신한 데이터, 카메라와 녹음장치에서 생성한 데이터, 프로세서(113)에서 생성되거나 처리된 데이터를 영구적으로 또는 임시로 저장할 수 있다. 예컨대, 메모리(111)는 송수신부(112)를 통해 수신한 추천 컨텐츠, 카메라에서 생성한 영상 데이터, 녹음장치에서 생성한 음성 데이터, 프로세서(113)에서 생성한 연산 데이터 등을 저장할 수 있다.
메모리(111)는 ESG 평가 항목 풀, ESG 주제 풀, ESG 진단 결과, 기업 ESG 공시 정보, 진단 결과, 기업 재무 정보, ESG 공시 기준 및 생성된 ESG 보고서 등을 임시 또는 영구적으로 저장할 수 있다. ESG 평가 항목 풀에는 환경(environmental) 평가 항목, 사회(social) 평가 항목, 지배구조(governance) 평가 항목 및 일반 평가 항목이 포함될 수 있다. ESG 주제 풀에는 중요성(materiality) 주제로 선별될 수 있는 ESG 주제들이 포함될 수 있다.
일반 평가 항목은 환경 카테고리, 사회 카테고리, 지배구조 카테고리가 아닌 평가 기업에 대한 일반적인 평가를 위한 항목을 의미할 수 있다.
송수신부(112)는, 프로세서(113)와 연결되어 데이터를 송수신하며, 다른 전자 장치(110) 또는 서버(130) 등의 외부 장치들과 데이터를 송수신할 수 있다. 송수신부(113)의 전부 또는 일부는 송신기(transmitter), 수신기(receiver), 송수신기(transceiver), 통신부(communication unit), 통신 모뎀(communication model) 또는 통신 회로(communication circuit)로 지칭할 수 있다. 송수신기(112)는 유선 접속 시스템 및 무선 접속 시스템들인 IEEE(institute of electrical and electronics engineers) 802.xx 시스템, IEEE Wi-Fi 시스템, 3GPP(3rd generation partnership project) 시스템, 3GPP LTE(long term evolution) 시스템, 3GPP 5G NR(new radio) 시스템, 3GPP2 시스템, 블루투스(Bluetooth) 등 다양한 무선 통신 규격 중 적어도 하나를 지원할 수 있다.
프로세서(113)는, 본 발명에서 제안한 절차 및/또는 방법들을 구현하도록 구성될 수 있다. 그리고, 프로세서(113)는 전자 장치(110)의 구성 요소들을 제어하여, 결정된 동작을 수행할 수 있다. 이를 위해, 프로세서(113)는 메모리(111)의 데이터를 요청, 검색, 수신 또는 활용할 수 있고, 상기 적어도 하나의 실행 가능한 동작 중 예측되는 동작이나, 바람직한 것으로 판단되는 동작을 실행하도록 전자 장치(110)의 구성 요소들을 제어할 수 있다.
프로세서(113)는 결정된 동작을 수행하기 위하여 서버와 같은 외부 장치와의 연계가 필요한 경우, 해당 외부 장치를 제어하기 위한 제어 신호를 생성하고, 통신부(111)를 통해 해당 외부 장치에 생성된 제어 신호를 전송할 수 있다.
프로세서(113)는 사용자 입력에 대하여 의도 정보를 획득하고, 획득한 의도 정보에 기초하여 사용자(100)의 요구 사항을 결정할 수 있다. 예컨대, 프로세서(113)는 음성 입력을 문자열로 변환하기 위한 STT(Speech To Text) 엔진 또는 자연어의 의도 정보를 획득하기 위한 자연어 처리(NLP: Natural Language Processing) 엔진 중에서 적어도 하나 이상을 이용하여, 사용자 입력에 상응하는 의도 정보를 획득할 수 있다. STT 엔진 또는 NLP 엔진 중에서 적어도 하나 이상은 적어도 일부가 머신 러닝 알고리즘에 따라 학습된 인공 신경망으로 구성될 수 있다.
프로세서(113)는 복수의 프로세서들로 구성될 수 있고, 인간의 뇌의 신경세포와 시냅스를 모하여 인공 신경망의 연산에 유리하게 설계된 뉴로모픽 프로세서(Neuromorphic processor) 등을 포함하여 구성될 수도 있다.
프로세서(113)는 ESG 진단 모듈(아래의 도 4의 410 참조)을 통해 복수의 ESG 평가 항목에 기초하여 평가 대상 기업에 대한 ESG 진단 결과를 생성하고, 중요성 주제 선별 모듈(도 17의 1310 참조)을 통해 ESG 주제 풀에 포함된 ESG 주제들 중에서 평가 대상 기업에 상응하는 중요성 주제를 선별하고, ESG 보고서 생성 모듈(도 21의 1720 참조)을 통해 ESG 진단 결과와 중요성 주제에 대한 응답에 기초하여 ESG 보고서를 생성할 수도 있다.
입력부(114)는 입력 인터페이스, 카메라 또는 녹음장치 중에서 적어도 하나 이상을 포함할 수 있다. 입력 인터페이스는 키보드, 마우스, 조이스틱 등을 포함할 수 있다. 카메라는 이미지 센서에 의해 얻어지는 정지 영상 또는 동영상 등의 화상 프레임을 처리할 수 있다. 카메라는 하나 또는 복수 개로 구성될 수 있다. 처리된 화상 프레임은 출력부(115)의 디스플레이(Display)에 표시되거나, 송수신부(112)를 통해 외부 장치에 전송되거나, 프로세서(113)에 의해 처리되거나, 메모리(111)에 저장될 수 있다. 녹음장치는 음파를 수신하여 전기적인 음성 데이터로 변환할 수 있으며, 녹음장치는 마이크로폰(microphone)을 지칭할 수 있다. 변환된 음성 데이터는 전자 장치(110)에서 수행 중인 기능(또는 실행 중인 응용 프로그램)에 따라 다양하게 활용될 수 있다. 한편, 마이크로폰(122)에는 외부의 음파를 수신하는 과정에서 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 적용될 수 있다.
출력부(115)는 디스플레이 또는 스피커 중에서 하나 이상을 포함할 수 있다. 출력부(115)는 프로세서(113)의 제어에 따라서 컨텐츠를 출력할 수 있다. 디스플레이는 전자 장치(110)에서 처리되는 정보를 화상으로 표시할 수 있다. 예컨대, 디스플레이는 전자 장치(100)에서 구동되는 응용 프로그램의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다. 디스플레이는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써 터치 스크린으로 구현되어 입력 인터페이스와 출력 인터페이스를 동시에 제공할 수 있다. 스피커는 전자 장치(110)에서 처리된 오디오 데이터를 오디오 데이터를 음파로 출력할 수 있다.
도 7은 본 발명의 다양한 실시예들에 따른 ESG 진단, 중요성 주제 선별, 보고서 작성를 수행하는 방법을 나타낸 동작 흐름도이다.
도 7을 참조하면, S301 단계에서, 전자 장치(110)의 프로세서(113)는 환경 평가 항목, 사회 평가 항목, 지배구조 평가 항목 및 일반 평가 항목을 포함하는 복수의 ESG 평가 항목에 기초하여 평가 대상 기업에 대한 ESG 진단 결과를 생성한다.
ESG 평가 항목들은 예/아니오 중에서 하나로 대답할 수 있는 질문으로 구성되어, ESG 보고서를 생성하고자 하는 보고서 작성자의 예/아니오 답변에 따라 간편하게 점수를 산출할 수 있다.
ESG 진단 결과는 ESG 진단 점수를 포함하며, ESG 진단 점수는 환경 점수, 사회 점수, 지배구조 점수, 정보공시 점수 또는 종합 진단 점수 중에서 적어도 하나 이상을 포함할 수 있다. 또한, ESG 진단 결과는 평가 대상 기업의 과거 ESG 진단 점수에 기초한 ESG 진단 점수 히스토리, 평가 대상 기업과 동일/유사한 업종의 기업들 또는 전체 기업들(이하, 벤치마크 기업)과의 비교를 통한 벤치마크 기업 비교 정보를 포함할 수 있다. 또한, ESG 진단 결과는 카테고리별 점수 상세 정보, ESG 진단 피드백 등을 포함할 수 있다.
S302 단계에서, 전자 장치(110)의 프로세서(113)는 ESG 주제 풀에 포함된 ESG 주제들 중에서 평가 대상 기업에 상응하는 중요성 주제를 선별한다.
중요성 주제는 광범위한 ESG 주제 중에서 평가 대상 기업의 ESG 경영에서 중요하다고 평가되는 주제를 의미하며, 평가 대상 기업의 경영에 큰 영향을 끼치는 주제 또는 평가 대상 기업의 이해관계자들에게 중요하다고 인식되는 주제 등을 포함할 수 있다. 중요성 주제는 기업에 효과적인 ESG 전략 수립 및 이행이 가능케 한다.
프로세서(113)는 보고서 작성자의 우선 순위 입력 또는 평가 대상 기업의 이해관계자(미도시)의 우선 순위 설문/인터뷰 결과 중에서 적어도 하나 이상에 기초하여 중요성 주제를 선별할 수 있다.
S303 단계에서, 전자 장치(110)의 프로세서(113)는 ESG 진단 결과 및 중요성 주제에 대한 응답에 기초하여 ESG 보고서를 생성한다.
S303 단계에서 하나의 선택된 ESG 작성 기준에 기초하여 ESG 보고서를 생성할 수 있다.
도 8는 본 출원의 다양한 실시예들에 따른 ESG 진단 시스템을 나타낸 블록도이다.
도 8을 참조하면, ESG 진단 시스템은 ESG 진단 모듈(410), 정보 제공 모듈(420), 시각화 모듈(430), 정보 수집 모듈(440), 진단 항목 DB(450), 진단 결과 DB(460), 벤치마크 DB(470) 등을 포함할 수 있다.
도 8에 도시된 구성요소들은 전자 장치(110)의 하드웨어들의 동작에 따라 기능적으로 구현된 소프트웨어 관점에서의 구성요소들을 의미한다. 예컨대, ESG 진단 모듈(410) 및 시각화 모듈(430)은 프로세서(113)에 의해, 정보 제공 모듈(420) 및 정보 수집 모듈(440)은 송수신부(112) 및 프로세서(113)에 의해, 진단 항목 DB(450), 진단 결과 DB(460) 및 벤치마크 DB(470)는 메모리(111)에 의해 구현될 수 있다.
진단 항목 DB(450)는 ESG 평가 항목 풀을 저장하고, 진단 결과 DB(460)는 평가 대상 기업에 대한 ESG 진단 결과를 저장하고, 벤치마크 DB(470)는 기업들의 ESG 진단 결과, 재무 정보, ESG 공시 정보 등을 저장한다.
정보 수집 모듈(440)은 ESG 평가 항목들을 수집하여 진단 항목 DB(450)에 저장하고, 벤치마크 기업들의 ESG 진단 결과, 재무 정보, ESG 공시 정보 등을 벤치마크 DB(470)에 저장한다.
ESG 진단 모듈(410)은 진단 항목 DB(450)에 저장된 ESG 평가 항목들을 보고서 작성자에 제공하고, 이에 대한 응답에 기초하여 ESG 진단 점수를 포함하는 ESG 진단 결과를 생성할 수 있다. 나아가, ESG 진단 모듈(410)은 진단 결과 DB(460)에 저장된 과거 ESG 진단 결과에 기초하여 ESG 진단 점수 추이 정보를 생성하고, 벤치마크 DB(470)에 저장된 다른 기업의 ESG 진단 결과, 재무 정보, ESG 공시 정보 등에 기초하여 벤치마크 기업 비교 정보 등을 생성할 수 있다.
정보 제공 모듈(420)은 생성된 ESG 진단 결과를 다른 장치(미도시)에 제공할 수 있다.
시각화 모듈(430)은 ESG 진단 결과를 시각화하여 도표나 그래프 등을 생성할 수 있다.
도 9는 도 8에 도시된 ESG 진단 결과를 생성하는 단계(S301)의 일 실시예를 나타낸 동작 흐름도이다.
도 9를 참조하면, S501 단계에서, 전자 장치(110)의 프로세서(113)는 ESG 평가 항목 풀에서 ESG 평가 항목들을 선별한다.
프로세서(113)는 ESG 평가 항목 풀에 포함된 평가 항목들 중에서 각 카테고리별로 미리 정해진 개수만큼의 평가 항목을 선택하여 ESG 평가 항목을 구성할 수 있다.
ESG 평가 항목 풀은 국내외 기업 평가 기관의 평가 항목들이나 대기업의 평가 항목들로 구성될 수 있고, 프로세서(113)는 ESG 평가 항목 풀에 포함된 평가 항목들 중에서 카테고리별로 미리 정해진 수의 평가 항목들을 선별할 수 있다. 예컨대, 프로세서(113)는 카테고리별로 빈도 수가 높은 순서대로 평가 항목을 선별하여 ESG 평가 항목을 구성할 수 있다.
또한, ESG 평가 항목 풀은 ESG 공급망 관리 모듈을 통해 관리되는 상기 평가 대상 기업에서 관리하는 공급망 기업에 상응하는 평가 항목들을 포함할 수 있고, 프로세서(113)는 공급망 기업에 상응하는 평가 항목들 중에서 하나 이상을 선택하여 ESG 평가 항목을 구성할 수 있다. 구체적으로, ESG 보고서를 발간하는 일정 규모 이상의 평가 대상 기업(예컨대, 대기업)은 해당 평가 대상 기업이 관리하는 공급망 기업이 있으며, 공급망 기업들도 평가 대상 기업에 ESG 보고서를 제출해야하는 의무가 생길 수 있다. 이 경우 평가 대상 기업은 자신들이 원하는 방향에 맞게 공급망 기업에 ESG 보고서를 요청할 수 있으며, 이때 해당 공급망 기업에 상응하는 평가항목을 선택하여 별도로 공급망 기업의 ESG 평가 보고서를 발간할 수 있다. 공급망 기업의 ESG 평가 보고서를 발간하는데에 공급망 기업에 상응하는 평가 항목들에서 선택된 ESG 평가 항목이 사용될 수 있다.
프로세서(113)는 평가 대상 기업에 상응하여 각 카테고리별 평가 항목의 수를 조절할 수 있다. 평가 대상 기업에 상응하는 평가 항목을 선택한다는 것의 의미는, 평가 대상 기업의 업종, 기업 규모, 매출액 등의 기업 정보를 고려하여 평가 항목을 선택하는 것을 의미할 수 있다.
S502 단계에서, 전자 장치(110)의 프로세서(113)는 ESG 보고서를 생성하고자 하는 보고서 작성자로부터 선별된 ESG 평가 항목들에 대한 응답을 수신한다.
프로세서(113)는 출력부(115)를 통해 ESG 평가 항목들을 출력하고, 입력부(114)를 통해 ESG 평가 항목들에 대한 응답을 수신할 수 있다.
S503 단계에서, 전자 장치(110)의 프로세서(113)는 수집된 응답에 기초하여 ESG 진단 점수를 산출하고, ESG 진단 점수 히스토리 정보를 생성한다.
프로세서(113)는 ESG 평가 항목 풀에 포함된 평가 항목들 중에서 평가 대상 기업에 상응하는 평가 항목을 선택하여 ESG 평가 항목을 구성할 수 있고, 평가 대상 기업에 상응하여 ESG 평가 항목 각각에 대한 가중치를 설정하여 ESG 진단 결과를 생성할 수 있다.
ESG 평가 항목에 대한 가중치는 모든 ESG 평가 항목에 동일하게 설정될 수도 있고, 평가 대상 기업의 업종이나 규모에 기초하여 설정될 수도 있으며, 평가 대상 기업의 이해관계자에 대한 설문/인터뷰에 따라 설정될 수도 있다. 공급망 기업에 상응하는 평가 항목 각각에 대한 평가 항목 가중치는 공급망 기업에 대한 ESG 진단 결과를 생성하는데 사용될 수 있다.
또한, 프로세서(113)는 평가 대상 기업에 대한 과거 ESG 진단 점수와 현재 산출된 ESG 진단 점수를 비교하여 ESG 진단 점수 히스토리 정보를 생성할 수 있다. ESG 진단 점수 히스토리는 미리 정해진 개수(예컨대, 2개)만큼의 최근 ESG 진단 점수와 최초의 ESG 진단 점수를 포함하여 구성될 수 있다.
S504 단계에서, 전자 장치(110)의 프로세서(113)는 평가 대상 기업의 ESG 진단 점수와 벤치마크 기업의 ESG 진단 점수를 비교하여 벤치마크 기업 비교 정보를 생성한다.
벤치마크 기업 비교 정보는 벤치마크 기업의 ESG 진단 점수의 최댓값, 최솟값, 중간값, 평균값 중 적어도 하나 이상, 그리고 벤치마크 기업들의 ESG 진단 점수 분포에 따른 평가 대상 기업의 ESG 진단 점수의 백분위수(percentile) 등을 포함할 수 있다.
S505 단계에서, 전자 장치(110)의 프로세서(113)는 ESG 진단 점수 히스토리 정보 및 벤치마크 기업 비교 정보를 시각화한다.
S506 단계에서, 전자 장치(110)의 프로세서(113)는 ESG 진단 점수, 시각화된 ESG 진단 점수 히스토리 및 시각화된 벤치마크 기업 비교 정보를 포함하는 ESG 진단 결과를 생성한다. 나아가, 프로세서(113)는 ESG 평가 항목들에 응답에 상응하는 ESG 진단 피드백을 포함하는 ESG 진단 결과를 생성할 수 있다.
또한, 프로세서(113)는 생성된 ESG 진단 결과를 미리 정해진 포맷(format)의 파일로 생성하여 다운로드 기능을 제공하거나 미리 정해진 이메일로 제공할 수 있다.
도 10 내지 13은 본 발명의 다양한 실시예들에 따른 ESG 진단 항목과 그에 상응하는 진단 피드백의 예시를 나타낸 도면들이다.
도 10 내지 13을 참조하면, ESG 평가 항목은 3개의 일반 평가 항목, 10개의 환경 평가 항목, 10개의 사회 평가 항목 및 10개의 지배구조 평가 항목으로 구성될 수 있으나, 각 문항의 수는 달라질 수 있다.
진단 피드백은 각 평가 항목의 응답이 아니오인 경우에 제공될 수 있다.
각 평가 항목에는 점수(예컨대, 10점)이 배정될 수 있고, 각 평가 항목에 대한 응답에 기초하여 각 카테고리별로 진단 점수가 산출될 수 있다. 각 평가 항목별로 설정된 가중치가 존재하는 경우, 가중합을 통해 각 카테고리별로 진단 점수가 산출될 수 있다.
도 14는 본 발명의 다양한 실시예들에 따른 ESG 진단 피드백의 예시를 나타낸 도면이다.
도 14를 참조하면, ESG 종합 진단 점수, ESG 카테고리별 진단 점수에 상응하는 진단 피드백을 제공할 수 있다. 도 10에서 i-ESG는 본 발명의 다양한 실시예들에 따른 ESG 보고서 생성 서비스를 의미한다.
도 15 및 16은 본 출원의 다양한 실시예들에 따른 ESG 진단 결과의 예시를 나타낸 도면이다.
도 15 및 16을 참조하면, ESG 진단 결과는 ESG 종합 진단 점수, ESG 카테고리별 진단 점수, ESG 진단 결과에 기초한 ESG 진단 피드백, ESG 진단 점수 히스토리, 벤치마크 기업 비교 정보 등을 포함할 수 있다.
도 17은 본 발명의 다양한 실시예들에 따른 중요성 주제 선별 시스템을 나타낸 블록도이다.
도 17을 참조하면, 중요성 주제 선별 시스템은 중요성 주제 선별 모듈(1310), 정보 제공 모듈(1320), 시각화 모듈(1330), 우선 순위 DB(1340), ESG 주제 DB(1350), 이해관계자 DB(1360) 등을 포함할 수 있다.
도 17에 도시된 구성요소들은 전자 장치(110)의 하드웨어들의 동작에 따라 기능적으로 구현된 소프트웨어 관점에서의 구성요소들을 의미한다. 예컨대, 중요성 주제 선별 모듈(1310) 및 시각화 모듈(1330)은 프로세서(113)에 의해, 정보 제공 모듈(1320)은 송수신부(112) 및 프로세서(113)에 의해, 우선 순위 DB(1340), ESG 주제 DB(1350) 및 이해관계자 DB(1360)는 메모리(111)에 의해 구현될 수 있다.
우선 순위 DB(1340)는 ESG 주제들에 대한 우선 순위 정보를 저장하고, ESG 주제 DB(1350)는 ESG 주제 풀을 저장하고, 이해관계자 DB(1360)는 기업들의 이해관계자와 그 연락처 등을 저장한다.
평가 대상 기업의 이해관계자는 지속가능성 공시 기준인 GRI(Global Reporting Initiative)의 중요성 평가 방식에 기초하여 정의될 수 있다.
ESG 주제 풀은 보고서 작성자가 직접 입력하거나 동종 업계 내에서 자주 쓰이는 ESG 키워드 및 ESG 주제 항목을 포함할 수 있다. 이러한 ESG 키워드 및 ESG 주제 항목은 미국 지속가능회계기준위원회, SASB(Sustainability Accounting Standards Board)가 제공하는 산업별로 구분한 중요성 주제에 주로 기반한다. 한 예로 SASB는 '정보 보안' 키워드를 헬스케어 산업에는 중요한 주제로 선정했지만, 전력 산업에는 중요한 주제로 선정하지 않았다.
정보 수집 모듈(440)은 ESG 평가 항목들을 수집하여 ESG 주제 DB(1350)에 저장하고, 기업들의 ESG 진단 결과, 재무 정보, ESG 공시 정보 등을 이해관계자 DB(1360)에 저장한다.
중요성 주제 선별 모듈(1310)은 ESG 주제 DB(1350)에 저장된 ESG 주제들을 보고서 작성자에 제공하여 이에 대한 우선 순위 입력을 획득하고, 저장된 ESG 주제들을 이해관계자 DB(1360)에 미리 등록된 이해관계자들에게 제공하여 이에 대한 우선 순위 설문 결과를 수집하고, 우선 순위 입력과 우선 순위 설문 결과에 기초한 ESG 주제들에 대한 우선 순위 정보를 생성하고, 생성한 우선 순위 정보를 우선 순위 DB(1340)에 저장할 수 있다.
정보 제공 모듈(1320)은 ESG 주제들을 이해관계자들에게 제공할 수 있다.
시각화 모듈(1330)은 ESG 주제들에 대한 우선 순위 입력 또는 우선 순위 설문을 위한 ESG 주제들 사이의 우선 순위를 선택하는 시각화된 인터페이스를 생성하고, 우선 순위 설문 결과를 정량화 및 시각화하고, 우선 순위 정보에 기초하여 ESG 주제들을 정렬한 시각화된 목록을 생성하고, 우선 순위 입력과 우선 순위 설문 결과를 비교하는 중요도 비교 도면을 생성할 수 있다.
도 18는 도 7에 도시된 중요성 주제를 선별하는 단계(S302)의 일 실시예를 나타낸 동작 흐름도이다.
도 18을 참조하면, S1401 단계에서, 전자 장치(110)의 프로세서(113)는 평가 대상 기업에 상응하는 이해관계자를 선별한다.
메모리(111)에는 다양한 기업들에 상응하는 이해관계자 및 그 연락처에 대한 정보가 저장될 수 있고, 프로세서(113)는 이해관계자 목록에서 평가 대상 기업에 상응하는 이해관계자를 선별할 수 있다. 이해관계자에는 시민사회, 고객, 임직원, 근로자, 지역사회, 주주, 투자자, 공급업체 등이 포함될 수 있다.
S1402 단계에서, 전자 장치(110)의 프로세서(113)는 선별된 이해관계자들로부터 ESG 주제들에 대한 우선 순위 설문 결과를 수집한다.
프로세서(113)는 송수신부(112)를 통해 선별된 이해관계자들의 연락처(예컨대, 전자메일(email), 모바일 메신저, 비즈니스 챗봇)로 ESG 주제들을 전달하고, 그 응답으로 우선 순위 설문 결과를 수집한다. 일 예에서, 이해관계자들에게 전달되는 ESG 주제들에 대한 우선 순위 설문은 드래그 앤 드롭과 같은 상호작용을 통해 순서를 변경할 수 있는 목록 인터페이스로 제공될 수도 있다.
프로세서(113)는 응답하지 않은 이해관계자에 대해서 동일한 연락 수단으로 다시 우선 순위 설문 결과의 수집을 시도할 수도 있고, 또는 등록된 다른 연락 수단을 이용하여 우선 순위 설문 결과의 수집을 시도할 수도 있다.
이해관계자에게 제공되는 ESG 주제들은 ESG 주제 풀에 저장된 모든 ESG 주제들일 수도 있지만, 보고서 작성자에 의하여 사전에 선택된 주제들일 수도 있다.
S1403 단계에서, 전자 장치(110)의 프로세서(113)는 보고서 작성자로부터 ESG 주제들에 대한 우선 순위 입력을 획득한다.
S1404 단계에서, 전자 장치(110)의 프로세서(113)는 우선 순위 입력 및 우선 순위 설문 결과에 기초하여 ESG 주제들 중에서 중요성 주제를 선별한다.
프로세서(113)는 우선 순위 입력 및 우선 순위 설문 결과에 기초하여 ESG 주제들에 대한 우선 순위 정보를 생성하고, 생성한 우선 순위 정보에 기초하여 중요성 주제를 선별할 수 있다.
보고서 작성자의 우선 순위 입력은 평가 대상 기업의 비즈니스 영향도를 나타내며, 이해관계자의 우선 순위 설문 결과는 평가 대상 기업에 대한 이해관계자의 관심도를 나타낼 수 있다.
S1405 단계에서, 전자 장치(110)의 프로세서(113)는 우선 순위 입력 및 우선 순위 설문 결과를 비교하는 중요도 비교 도면 생성한다.
중요도 비교 도면은 평가 대상 기업과 평가 대상 기업의 이해관계자가 ESG 주제들에 대해 갖는 우선 순위의 시각 차이를 나타낼 수 있는 도면이다. 예컨대, 중요도 비교 도면의 x축은 비즈니스 영향도를 나타내는 우선 순위 입력에 대한 축이며, y축은 이해관계자의 관심도를 나타내는 우선 순위 설문 결과에 대한 축일 수 있다.
도 19 및 20은 본 발명의 다양한 실시예들에 따른 중요성 주제 선별 결과의 예시를 나타낸 도면이다.
도 19 및 20을 참조하면, 중요성 주제 선별 결과는 중요도 비교 도면과 이해관계자들에 대한 우선 순위 설문 결과를 포함할 수 있다.
도 21은, 본 출원의 또 다른 일 측면에 따른, ESG 보고서 생성 시스템을 나타낸 블록도이다.
도 21을 참조하면, ESG 보고서 생성 시스템은 공시 기준 추천 모듈(1710), ESG 보고서 생성 모듈(1720), 정보 수집 모듈(1730), 공시 기준 DB(1740), 벤치마크 DB(1750) 등을 포함할 수 있다.
일부 실시 예들에서, 상기 ESG 보고서 생성 시스템은 전자 장치(100) 및 서비스 서버(200)를 포함할 수도 있다. 이 경우, 도 6에 도시된 구성요소들은 전자 장치(100) 또는 서비스 서버(200)의 하드웨어들의 동작에 따라 기능적으로 구현된 소프트웨어 관점에서의 구성요소들을 의미한다. 예컨대, 공시 기준 추천 모듈(1710) 및 ESG 보고서 생성 모듈(1720)은 전자 장치(100)의 프로세서에 의해, 정보 수집 모듈(1730)은 전자 장치(100)의 통신부 및 프로세서에 의해, 공시 기준 DB(1740) 및 벤치마크 DB(1750)는 전자 장치(100)의 메모리에 의해 구현될 수 있다.
다른 일부 실시 예들에서, 상기 ESG 보고서 생성 시스템은, ESG 보고서 생성 서비스를 제공하도록 특화된 다른 서비스 서버를 포함할 수도 있다. 상기 다른 서비스 서버 역시 서비스 서버(200)와 동일 또는 유사한 구성(예컨대, 프로세서, 통신부, 메모리)을 포함할 수도 있다.
공시 기준 DB(1740)는 다양한 공시 기준을 저장하고, 벤치마크 DB(1750)는 벤치마크 기업들의 기업 정보와 벤치마크 기업들이 사용한 ESG 공시 기준, 벤치마크 기업들의 ESG 보고서를 저장할 수 있다. 예컨대, 공시 기준 DB(1740)에는 GRI, SASB, TCFD(Task Force on Climate-Related Financial Disclosures), UN SDGs(Sustainable Development Goals), K-ESG 등이 포함될 수 있다.
정보 수집 모듈(1730)은 벤치마크 기업들의 기업 정보, 벤치마크 기업들의 ESG 보고서에 사용된 공시 기준, 벤치마크 기업들의 ESG 보고서 등을 벤치마크 DB(1750)에 저장한다.
공시 기준 추천 모듈(1710)은 벤치마크 기업에 대한 정보와 평가 대상 기업에 대한 정보에 기초하여 평가 대상 기업에 적합한 공시 기준을 추천할 수 있다. 벤치마크 기업에 대한 정보와 평가 대상 기업에 대한 정보에는 벤치마크 기업과 평가 대상 기업의 산업군, 회사 규모, 주요 시장, 공시 대상 또는 공시 목적 중에서 적어도 하나 이상이 포함될 수 있다. 평가 대상 기업의 산업군, 회사 규모, 주요 시장, 공시 대상 또는 공시 목적은 보고서 작성자에 의해 입력될 수 있다.
한 실시예에 따르면, 매출규모 1000억 대의 제조업의 평가 대상 기업이 신규 거래 확대를 리포팅의 주요 목적으로 선택하고 기존 공시 이력이 있을 경우, GRI를 추천할 수 있다. GRI는 가장 광범위한 정보를 요구하는 기준으로 다양한 이해관계자들을 대상으로 하기 때문이다. 반면, 매출규모가 500억대이며, 글로벌 투자 유치를 주요 목적으로 하는 수출 기업에는 SASB가 추천될 수 있다. SASB는 투자자들의 의사결정을 위한 정보 제공을 목적으로 만들어졌으며, 산업별로 필수 정보만 요구해 효율적이라는 특징이 있기 때문이다. 알고리즘 작동에서 가장 높은 비중을 차지하는 항목은 공시 목적과 공시 대상이며, 그 뒤를 매출 규모, 산업군이 뒤따른다.
ESG 보고서 생성 모듈(1720)은 공시 기준 추천 모듈(1710)에서 추천된 공시 기준 또는 보고서 작성자에 의해 선택된 공시 기준에 기초하여 ESG 보고서에 포함될 항목들을 제공하며, 이에 기초하여 ESG 보고서를 생성할 수 있다. 또한, ESG 보고서 생성 모듈(1720)은 평가 대상 기업의 ESG 보고서에 사용될 공시 기준에 상응하는 벤치마크 기업들의 우수 ESG 보고서 중 일부를 제공할 수 있다.
도 22는, 도 7에 도시된 ESG 보고서를 생성하는 단계(S303)의 일 실시예를 나타낸 동작 흐름도이다.
도 22를 참조하면, S1801 단계에서, 전자 장치(110)의 프로세서(113)는 벤치마크 기업에 대한 정보와 평가 대상 기업에 대한 정보에 기초하여 평가 대상 기업에 적합한 공시 기준을 추천한다.
프로세서(113)는 평가 대상 기업의 산업군, 상기 회사 규모 및 상기 주요 시장의 중요도보다 공시 대상 및 상기 공시 목적의 중요도를 높게 반영하여 공시 기준을 추천할 수 있다.
프로세서(113)는 하나 이상의 공시 기준을 추천할 수 있다.
S1802 단계에서, 전자 장치(110)의 프로세서(113)는 추천된 공시 기준 또는 보고서 작성자에 의해 선택된 공시 기준에 기초하여, ESG 진단 결과 및 중요성 주제에 대한 응답에 기초한 ESG 보고서를 생성한다.
보고서 작성자는 추천된 공시 기준 중에서 또는 추천되지 않은 공시 기준 중에서 ESG 보고서의 생성에 사용된 공시 기준을 선택할 수 있다. 일 실시예에서, 프로세서(113)는 공시 기준을 추천할 때 각 추천 공시 기준에 상응하는 우수 ESG 보고서 사례를 함께 제공할 수 있다.
또한, 보고서 작성자는 선별된 중요성 주제에 대한 응답을 입력하면, 프로세서(113)는 그 응답에 기초하여 ESG 보고서를 생성할 수 있다. 보고서 작성자가 중요성 주제에 대한 응답을 입력하는 것은 중요성 주제에 대하여 내용을 작성하는 것을 의미할 수 있다.
일 실시예에서, 프로세서(113)는 ESG 보고서에 대한 디자인 템플릿을 제공하거나, 내용 검증 옵션을 제공할 수 있다. 예컨대, 보고서 작성자는 ESG 보고서 커버이미지와 레이아웃을 선택할 수 있으며, 기 설정된 복수의 템플릿 중 하나를 선택하여 원하는 스타일의 ESG 보고서를 발간할 수 있다. 또한, 보고서 작성자가 내용 검증 옵션을 선택하는 경우, 프로세서(113)는 내용 검증을 위해 미리 설정된 제3자 또는 보고서 작성자에 의해 선택된 제3자에 생성된 ESG 보고서를 송부하여 ESG 보고서에 대한 내용 검증 피드백을 받아 이를 다시 보고서 작성자에 제공할 수 있다.
일부 실시 예들에서, 상기 ESG 보고서를 생성하는 시스템(1) 내의 전자 장치(110)의 동작은 도 1의 전자 장치(100) 및/또는 서비스 서버(200) 상에서 구현될 수도 있다. 이 경우 도 6의 전자 장치(110)는 도 1의 전자 장치(100), 서비스 서버(200) 내에 통합된다.
예를 들어, 상기 ESG 보고서를 생성하는 시스템(1)의 전자 장치(110)의 동작은 서비스 서버(200) 상에서 수행되도록 구성될 수도 있다. 그러면, 서비스 서버(200)는 평가 대상 기업에 대한 ESG 진단 결과를 생성하고, 평가 대상 기업에 상응하는 중요성 주제를 선별한 뒤 ESG 진단 결과 및 중요성 주제에 대한 응답에 기초하여 ESG 보고서를 생성하는 도중에 적어도 일부 문장을 도 1의 ESG 자동완성 모델을 이용하여 보고서 내에 삽입할 수도 있다.
하드웨어를 이용하여 본 발명의 실시 예를 구현하는 경우에는, 본 출원의 실시 예들을 수행하도록 구성된 ASICs(application specific integrated circuits) 또는 DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays) 등이 본 출원의 구성요소에 구비될 수 있다.
이상에서 설명한 본 출원의 실시 예들에 따른 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템(1)에 의한 동작은 적어도 부분적으로 컴퓨터 프로그램으로 구현되어, 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 예를 들어, 프로그램 코드를 포함하는 컴퓨터-판독가능 매체로 구성되는 프로그램 제품과 함께 구현되고, 이는 기술된 임의의 또는 모든 단계, 동작, 또는 과정을 수행하기 위한 프로세서에 의해 실행될 수 있다.
상기 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등을 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.
이상에서 살펴본 본 발명은 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.

Claims (12)

  1. 사용자의 전자 장치와 통신하는 서비스 서버에 의해 수행되는, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법에 있어서,
    사용자의 전자 장치로부터 상기 ESG 문서의 내용 중 일부 내용으로 기재될 ESG 텍스트를 완성하기 위한 기초 텍스트를 수신하는 단계;
    수신한 기초 텍스트를 미리 학습된 ESG 자동완성 모델에 입력하여 기초 텍스트의 다음 순번에 배치될 추천 텍스트를 예측하는 단계; 및
    ESG 문서의 형식에 추천 텍스트를 기재하는 단계를 포함하고,
    상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치될 텍스트의 말뭉치를 예측하도록 샘플 텍스트를 이용해 학습된, 인공 신경망 구조를 포함한 모델인 것이고,
    상기 인공 신경망 구조는 학습 과정에서 입력 텍스트의 자연어 처리 결과로부터 입력 텍스트의 말뭉치의 다음에 위치할 텍스트의 말뭉치를 복원하도록 설계된 것으로서, 입력 토큰을 자연어 처리하여 입력 토큰의 특징을 추출하도록 구성된 인코더 및 입력 토큰의 특징에 기초하여 잔여 토큰 배열을 복원하도록 구성된 디코더를 포함하고,
    상기 ESG 자동완성 모델은 샘플 텍스트 데이터를 자연어 처리하는 전처리 동작 및 샘플 텍스트의 토큰에 기초하여 트래이닝 데이터 세트를 형성하는 동작을 통해 형성된, 트래이닝 데이터 세트를 이용하여 미리 설계된 상기 인공 신경망 구조를 갖는 ESG 자동완성 모델을 학습하여 생성된 것으로서,
    상기 전처리 동작은 입력 텍스트의 말뭉치를 복수의 토큰으로 분할하는 토큰화 처리 동작을 포함하고,
    상기 트래이닝 데이터 세트는 복수의 샘플 텍스트를 전처리하여 생성된 복수의 트래이닝 샘플로 이루어지고, 각각의 트래이닝 샘플은 트래이닝 데이터 및 레이블 데이터를 포함하며,
    상기 트래이닝 데이터는 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰을 해당 샘플 텍스트의 말뭉치 상의 순서대로 배열한 토큰 배열을 포함하고,
    상기 레이블 데이터는 트래이닝 데이터와 동일한 샘플 텍스트의 말뭉치로부터 획득된 잔여 토큰 배열을 포함하고,
    상기 잔여 토큰 배열은 상기 샘플 텍스트로부터 획득된 토큰 세트에서 맨 처음의 텍스트 토큰의 다음 텍스트 토큰으로부터 맨 끝의 텍스트 토큰을 샘플 텍스트의 말뭉치 상의 순서대로 배열한 것이고,
    상기 서비스 서버는 데이터 웨어하우스 시스템에 연동되고,
    상기 데이터 웨어하우스 시스템은 개별 기업에 의해 공개된 ESG 문서 또는 ESG 보고서를 생성하기 위해 설계된 시스템에 의해 생성된 ESG 보고서를 저장하며,
    상기 샘플 텍스트는 상기 서비스 서버에 연동된 데이터 웨어하우스 시스템에 저장된 ESG 문서로부터 추출된 것이고,
    상기 ESG 보고서를 생성하기 위해 설계된 시스템은,
    환경(Environmental) 평가 항목, 사회(Social) 평가 항목, 지배구조(Governance) 평가 항목 및 일반 평가 항목을 포함하는 복수의 ESG 평가 항목에 기초하여 평가 대상 기업에 대한 ESG 진단 결과를 생성하는 단계;
    ESG 주제 풀에 포함된 ESG 주제들 중에서 상기 평가 대상 기업에 상응하는 중요성(materiality) 주제를 선별하는 단계;
    상기 ESG 진단 결과 및 상기 중요성 주제에 대한 응답에 기초하여 ESG 보고서를 생성하는 단계; 및
    상기 ESG 진단 결과, 상기 중요성 주제 또는 및 상기 ESG 보고서 중에서 적어도 하나를 포함하는 ESG 관리 화면을 제공하는 단계를 수행하고,
    상기 ESG 진단 결과를 생성하는 단계는,
    ESG 평가 항목 풀에 포함된 평가 항목들 중에서 빈도수 기반으로 선별되고 지속 업데이트되는 ESG 평가 항목을 구성하는
    것을 특징으로 하는,
    방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 ESG 자동완성 모델의 파라미터는, 텍스트를 추천하는 것을 학습하기 위해, 산출된 예측 값과 실제 값 간의 오차가 최소화되도록 파라미터가 조절된 것을 특징으로 하는,
    방법.
  6. 제5항에 있어서,
    상기 디코더는 ESG 자동완성 모델이 입력 텍스트에 함축된 의미를 적어도 부분적으로 학습하기 위한 핏팅 레이어를 포함하고,
    상기 핏팅 레이어는 추천 문장이 출력되기 이전에, 입력 텍스트가 입력될 경우 예측되어 출력될 다음 순번의 텍스트에 대해서 ESG 형식에 보다 가까운 데이터에 가중치를 부여하도록 구성되는 것을 특징으로 하는,
    방법.
  7. 삭제
  8. 제1항에 있어서,
    예측된 추천 텍스트를 상기 ESG 자동완성 모델에 입력하여 상기 추천 텍스트의 다음 순번에 배치될 새로운 추천 텍스트를 예측하는 단계; 및
    출력된 새로운 추천 텍스트를, 상기 기초 텍스트 및 추천 텍스트의 내용을 포함한 상기 ESG 문서의 형식에 추가 기재하는 단계를 더 포함하는,
    방법.
  9. 제1항에 있어서, 상기 ESG 자동완성 모델은
    복수의 추천 텍스트의 말뭉치를 산출하고, 각 추천 텍스트의 말뭉치별 확률 값에 기초하여 일부 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력하도록 학습되고,
    상기 추천 텍스트를 예측하는 단계는,
    상기 기초 텍스트의 다음 순번에 배치될 가능성이 있는 복수의 추천 텍스트를 출력하고 사용자의 전자 장치로 전송하는 단계; 및
    선택된 추천 텍스트의 정보를 수신하여 기초 텍스트의 다음 순번에 기재될 추천 텍스트를 결정하는 단계를 포함하는 것을 특징으로 하는,
    방법.
  10. 청구항 제1항, 제5항, 제6항, 제8항, 제9항 중 어느 하나의 항에 따른 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법을 수행하기 위한 프로그램이 기록된, 컴퓨터 판독가능한 기록매체.
  11. ESG 서비스 제공 시스템에 있어서,
    미리 학습된 ESG 자동완성 모델을 이용하여 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하여 ESG 문서 완성 서비스를 제공하는 서비스 서버를 포함하고,
    상기 서비스 서버는 사용자의 전자 장치와 통신하는 것으로서,
    상기 사용자의 전자 장치로부터 수신한 입력 값을 미리 학습된 ESG 자동완성 모델에 적용하여 입력 값 다음 순서에 배치될 텍스트를 예측하고, ESG 문서의 형식에 추천 텍스트가 기재되도록 예측 결과를 사용자의 전자 장치로 전달하도록 구성된 문서 생성부를 포함하고,
    상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치될 텍스트의 말뭉치를 예측하도록 샘플 텍스트를 이용해 학습된, 인공 신경망 구조를 포함한 모델인 것이고,
    상기 인공 신경망 구조는 입력 텍스트를 자연어 처리하고 자연어 처리 결과로부터 입력 텍스트의 말뭉치의 다음에 위치할 텍스트의 말뭉치를 복원하도록 설계된 것으로서, 입력 토큰을 자연어 처리하여 입력 토큰의 특징을 추출하도록 구성된 인코더 및 입력 토큰의 특징에 기초하여 잔여 토큰 배열을 복원하도록 구성된 디코더를 포함하고,
    상기 ESG 자동완성 모델은 샘플 텍스트 데이터를 자연어 처리하는 전처리 동작 및 샘플 텍스트의 토큰에 기초하여 트래이닝 데이터 세트를 형성하는 동작을 통해 형성된, 트래이닝 데이터 세트를 이용하여 미리 설계된 신경망 구조를 갖는 ESG 자동완성 모델을 학습하여 생성된 것으로서,
    상기 전처리 동작은 입력 텍스트의 말뭉치를 복수의 토큰으로 분할하는 토큰화 처리 동작을 포함하고,
    상기 트래이닝 데이터 세트는 복수의 샘플 텍스트를 전처리하여 생성된 복수의 트래이닝 샘플로 이루어지고, 각각의 트래이닝 샘플은 트래이닝 데이터 및 레이블 데이터를 포함하며,
    상기 트래이닝 데이터는 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰을 해당 샘플 텍스트의 말뭉치 상의 순서대로 배열한 토큰 배열을 포함하고,
    상기 레이블 데이터는 트래이닝 데이터와 동일한 샘플 텍스트의 말뭉치로부터 획득된 잔여 토큰 배열을 포함하고,
    상기 잔여 토큰 배열은 상기 샘플 텍스트로부터 획득된 토큰 세트에서 맨 처음의 텍스트 토큰의 다음 텍스트 토큰으로부터 맨 끝의 텍스트 토큰을 샘플 텍스트의 말뭉치 상의 순서대로 배열한 것이고,
    상기 ESG 서비스 제공 시스템은,
    상기 서비스 서버에 연동된 데이터 웨어하우스 시스템을 더 포함하고,
    상기 데이터 웨어하우스 시스템은 개별 기업에 의해 공개된 ESG 문서 또는 ESG 보고서를 생성하기 위해 설계된 시스템에 의해 생성된 ESG 보고서를 저장하며, 상기 샘플 텍스트는 상기 서비스 서버에 연동된 데이터 웨어하우스 시스템에 저장된 ESG 문서로부터 추출된 것이고, 상기 ESG 보고서를 생성하기 위해 설계된 시스템은,
    환경(Environmental) 평가 항목, 사회(Social) 평가 항목, 지배구조(Governance) 평가 항목 및 일반 평가 항목을 포함하는 복수의 ESG 평가 항목에 기초하여 평가 대상 기업에 대한 ESG 진단 결과를 생성하는 ESG 진단 모듈;
    ESG 주제 풀에 포함된 ESG 주제들 중에서 상기 평가 대상 기업에 상응하는 중요성(materiality) 주제를 선별하는 중요성 주제 선별 모듈;
    상기 ESG 진단 결과 및 상기 중요성 주제에 대한 응답에 기초하여 ESG 보고서를 생성하는 ESG 보고서 생성 모듈; 및
    상기 ESG 진단 결과, 상기 중요성 주제 및 상기 ESG 보고서 중에서 적어도 하나를 포함하는 ESG 관리 화면을 제공하는 ESG 경영 지원 모듈
    을 포함하고,
    상기 ESG 진단 모듈은
    국내외 기업 평가 기관의 평가 항목 또는 대기업의 각 카테고리별 평가 항목들을 취합한 ESG 평가 항목 풀로부터 평가 항목들을 선별하되, 각 카테고리별로 빈도수가 높은 순서대로 선별되고 지속 업데이트되는 ESG 평가 항목을 구성하고,
    상기 평가 대상 기업이 관리하는 공급망 기업 정보를 저장하고, 상기 공급망 기업에 상응하는 평가 항목 중에서 하나 이상을 선택하여 상기 ESG 평가 항목을 구성하는 ESG 공급망 관리 모듈을 더 포함하는 것
    을 특징으로 하는,
    ESG 서비스 제공 시스템.
  12. 삭제
KR1020220097981A 2022-08-05 2022-08-05 Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템 KR102574784B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220097981A KR102574784B1 (ko) 2022-08-05 2022-08-05 Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
PCT/KR2023/011363 WO2024029939A1 (ko) 2022-08-05 2023-08-02 Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220097981A KR102574784B1 (ko) 2022-08-05 2022-08-05 Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템

Publications (1)

Publication Number Publication Date
KR102574784B1 true KR102574784B1 (ko) 2023-09-06

Family

ID=87974054

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220097981A KR102574784B1 (ko) 2022-08-05 2022-08-05 Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템

Country Status (1)

Country Link
KR (1) KR102574784B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190059449A (ko) 2017-11-23 2019-05-31 지속가능발전소 주식회사 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
KR20200135607A (ko) * 2019-05-22 2020-12-03 삼성전자주식회사 학습 네트워크 모델 기반의 언어 처리 방법 및 장치
KR20210108293A (ko) * 2020-02-25 2021-09-02 휴멜로 주식회사 텍스트 생성 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190059449A (ko) 2017-11-23 2019-05-31 지속가능발전소 주식회사 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
KR102026304B1 (ko) * 2017-11-23 2019-09-30 지속가능발전소 주식회사 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
KR20200135607A (ko) * 2019-05-22 2020-12-03 삼성전자주식회사 학습 네트워크 모델 기반의 언어 처리 방법 및 장치
KR20210108293A (ko) * 2020-02-25 2021-09-02 휴멜로 주식회사 텍스트 생성 장치 및 방법

Similar Documents

Publication Publication Date Title
US11775494B2 (en) Multi-service business platform system having entity resolution systems and methods
US10958748B2 (en) Resource push method and apparatus
US20240046043A1 (en) Multi-turn Dialogue Response Generation with Template Generation
US10650311B2 (en) Suggesting resources using context hashing
US9892414B1 (en) Method, medium, and system for responding to customer requests with state tracking
US20170185904A1 (en) Method and apparatus for facilitating on-demand building of predictive models
US11604980B2 (en) Targeted crowd sourcing for metadata management across data sets
CN107533670B (zh) 数字实体的预测热门
US11765267B2 (en) Tool for annotating and reviewing audio conversations
US20190138637A1 (en) Automated document assistant using quality examples
El-Ansari et al. Sentiment analysis for personalized chatbots in e-commerce applications
US20200410056A1 (en) Generating machine learning training data for natural language processing tasks
KR102682244B1 (ko) Esg 보조 툴을 이용하여 정형화된 esg 데이터로 기계학습 모델을 학습하는 방법 및 기계학습 모델로 자동완성된 esg 문서를 생성하는 서비스 서버
US11816618B1 (en) Method and system for automatically managing and displaying a hypergraph representation of workflow information
CN114036398A (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN111221881B (zh) 用户特征数据合成方法、装置及电子设备
US20240187358A1 (en) Intelligent Assistant Content Generation
CN117635341A (zh) 参数推荐的方法、装置、设备和计算机可读介质
US20240020538A1 (en) Systems and methods for real-time search based generative artificial intelligence
US20230316186A1 (en) Multi-service business platform system having entity resolution systems and methods
KR102574784B1 (ko) Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
CN117132323A (zh) 推荐内容的分析方法、装置、设备、介质及程序产品
US10877964B2 (en) Methods and systems to facilitate the generation of responses to verbal queries
US12038958B1 (en) System, method, and user interface for a search engine based on multi-document summarization
Ma The microblog sentiment analysis based on latent dirichlet allocation and deep learning approaches

Legal Events

Date Code Title Description
N231 Notification of change of applicant
GRNT Written decision to grant