WO2024029939A1 - Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템 - Google Patents

Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템 Download PDF

Info

Publication number
WO2024029939A1
WO2024029939A1 PCT/KR2023/011363 KR2023011363W WO2024029939A1 WO 2024029939 A1 WO2024029939 A1 WO 2024029939A1 KR 2023011363 W KR2023011363 W KR 2023011363W WO 2024029939 A1 WO2024029939 A1 WO 2024029939A1
Authority
WO
WIPO (PCT)
Prior art keywords
esg
data
item
document
text
Prior art date
Application number
PCT/KR2023/011363
Other languages
English (en)
French (fr)
Inventor
김종웅
Original Assignee
주식회사 아이이에스지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220097981A external-priority patent/KR102574784B1/ko
Priority claimed from KR1020220097982A external-priority patent/KR102532216B1/ko
Application filed by 주식회사 아이이에스지 filed Critical 주식회사 아이이에스지
Publication of WO2024029939A1 publication Critical patent/WO2024029939A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Definitions

  • Embodiments of the present application relate to a method of building an ESG database by organizing ESG data in various unstructured formats in non-unified ESG documents into ESG data in a standardized format using an ESG auxiliary tool, and an ESG service provision system that performs this. will be.
  • ESG data by these companies is increasing every year, and through this, more and more ESG data of companies is being accumulated.
  • corporate ESG management will become increasingly important in the future, the demand to utilize accumulated ESG data from a big data perspective is gradually increasing.
  • ESG documents such as sustainability reports disclosed and published by companies
  • ESG documents are unstructured data in the form of PDF files.
  • it is necessary to organize and store them in a database in a standardized format.
  • embodiments of the present application provide a method for building an ESG database composed of standardized ESG data using an ESG auxiliary tool that can store and manage unstructured ESG data of companies, and how to perform this.
  • embodiments of the present application provide a method of building an ESG database composed of standardized ESG data using an ESG auxiliary tool that can provide an interface screen for accurately converting unstructured ESG data into structured data, and providing an ESG service that performs the same.
  • an ESG auxiliary tool that can provide an interface screen for accurately converting unstructured ESG data into structured data, and providing an ESG service that performs the same.
  • the method of constructing an ESG database consisting of standardized ESG data using an ESG auxiliary tool may be performed by one or more computing devices.
  • the one or more computing devices are connected to an ESG management item database that pre-stores a plurality of ESG management items.
  • the method includes parsing and processing an ESG document subject to structured processing, wherein the ESG document includes unstructured ESG data; Screening whether the parsed ESG document includes an item corresponding to at least one of a plurality of pre-stored ESG management items; Specifying a selection status for items in an ESG document according to whether an item corresponding to the ESG management item is included in the document; activating or deactivating an input box for the final input field value for a plurality of pre-stored ESG management items according to the result of specifying the selection state; And it may include the step of generating standardized data by obtaining the contents of items corresponding to ESG management items determined to be included in the document.
  • the screening step may determine whether the parsed ESG document includes the corresponding item based on at least one of a code value and a data set value for each ESG management item stored in the ESG management item database. there is.
  • the method may further include determining whether there is an abnormality in the screening result.
  • the step of determining whether there is an abnormality includes determining whether there is an abnormality in the screening result based on the user's confirmation input or based on surrounding data for data matching at least one of a code value and a data set value in the ESG document. It may be that you do it.
  • the step of specifying the selection status designates the ESG document as a first selection status if the corresponding item is included in the parsed ESG document, and designates the ESG document as a second selection status if the corresponding item is not included in the parsed ESG document. It may also be designated as a screening status.
  • the step of generating standardized data by obtaining content of an item corresponding to the ESG management item includes: providing a location within the ESG document of an ESG management item specified in a first selection state; Obtaining the contents of the corresponding ESG management item based on the provided location; And a step of generating structured data by performing table conversion on the list of selected ESG management items and the contents of each obtained ESG management item.
  • the step of obtaining the contents of the corresponding ESG management item may be acquiring the contents of the 'final field input value' based on the user's contents input or based on surrounding data about the provided location.
  • the one or more computing devices may be further connected to an ESG document database that stores structured and unstructured ESG data from other ESG documents.
  • the step of generating standardized data by obtaining the content of an item corresponding to the ESG management item includes, when receiving a user input to use data in an existing ESG document, acquiring data in the other ESG document as content for the item. Additional steps may be included.
  • the method may further include managing already stored ESG management items.
  • Management of the ESG management items may include modifying, deleting, or creating them.
  • the step of managing the ESG management items includes checking whether already saved ESG management items have been saved; If stored, receiving requests to modify, delete or create ESG management items; When receiving the modification, deletion or creation request, it may include displaying an auxiliary tool interface screen showing the stored ESG management item set in an item level structure.
  • the step of managing the ESG management item includes: deactivating an input box for the contents of the target item when the requested item is not the lowest level item; activating an input box for the contents of the target item when the request target item is a lowest level item; A step of inputting the contents of a target item to be modified or created through an activated input box; And it may further include the step of storing the contents of the entered items in the ESG management item database.
  • the step of receiving the content of the target item through the activated input box may include providing an auxiliary tool interface screen for inputting the content of the target item.
  • the auxiliary tool interface screen includes a first sub-area including an activated input box and a second sub-area including an item structure level, and in the second sub-area, a set of items for each major category is classified and displayed for each same item level. .
  • a computer-readable recording medium may record a program for performing a method of building an ESG database composed of standardized ESG data using the ESG auxiliary tool according to the above-described embodiments.
  • an electronic device for building an ESG database composed of standardized ESG data using an ESG auxiliary tool may be connected to an ESG management item database that stores a plurality of ESG management items in advance.
  • the electronic device obtains an item corresponding to at least one of a plurality of ESG management items pre-stored in the ESG management item database and the contents of the item within an ESG document containing unstructured ESG data, and generates a standardized ESG information for the ESG document.
  • a structured data processing unit configured to generate data; and an interface providing unit that provides an auxiliary tool interface screen that receives user input for changing unstructured data of the ESG document into standardized data through an output unit.
  • the ESG service provision system can reduce the inefficiency of existing manual work and overcome the problem of constraints that make full automation difficult by using an ESG auxiliary tool that provides a unique auxiliary tool interface screen.
  • the auxiliary tool interface screen provides the effect of efficiently classifying, storing, and managing data in ESG documents.
  • the ESG service provision system can collect, convert, store and manage ESG data from the company's sustainability report and identify the company's ESG management status based on it.
  • unstructured ESG data can be parsed and processed according to the process of the auxiliary tool.
  • ESG data can be appropriately utilized according to analysis and processing from a big data perspective.
  • FIG. 1 is a schematic diagram of an ESG service provision system, according to one aspect of the present application.
  • FIGS. 2A and 2B are flowcharts of a method for building an ESG database consisting of standardized ESG data using an ESG auxiliary tool, according to another aspect of the present application.
  • Figure 3 shows an auxiliary tool interface screen including an input box for the final input field value of an item, according to an embodiment of the present application.
  • Figure 4 is a flowchart of a process for managing ESG management items according to an embodiment of the present application.
  • Figure 5 shows an auxiliary tool interface screen displaying an item level structure according to an embodiment of the present application.
  • Figure 6 is a schematic diagram of a system configured to recommend text suitable for auto-completion of ESG documents, according to an aspect of the present application.
  • Figure 7 is a schematic diagram of a process for generating an ESG auto-complete model according to an embodiment of the present application.
  • Figure 8 is a schematic diagram of an operation for predicting output text in an ESG auto-completion model, according to an embodiment of the present application.
  • Figure 9 is a flowchart of a method for recommending text suitable for automatically completing an ESG document, according to another aspect of the present application.
  • Figure 10 shows the output result of a corpus of recommended text according to an embodiment of the present application.
  • expressions such as “have,” “may have,” “includes,” or “may include” refer to the corresponding features (e.g., numerical values, functions, operations, steps, parts, elements, and/or components). It refers to the presence of components such as etc.) and does not exclude the presence or addition of additional features.
  • Expressions such as “first,” “second,” “first,” or “second” used in various embodiments may modify various elements regardless of order and/or importance, and limit the elements. I never do that.
  • the above expressions can be used to distinguish one component from another.
  • the first component and the second component may represent different components, regardless of order or importance.
  • the expression “configured to” may mean, for example, “suitable for,” “having the capacity to,” or “having the capacity to.” ,” can be used interchangeably with “designed to,” “adapted to,” “made to,” or “capable of.”
  • the term “configured (or set) to” may not necessarily mean “specifically designed to” in hardware.
  • the expression “a device configured to” may mean that the device is “capable of” working with other devices or components.
  • the phrase “processor configured (or set) to perform A, B, and C” refers to a processor dedicated to performing the operations (e.g., an embedded processor), or executing one or more software programs stored on a memory device. By doing so, it may mean a general-purpose processor (eg, CPU or application processor) capable of performing the corresponding operations.
  • FIG. 1 is a schematic diagram of an ESG service provision system, according to one aspect of the present application.
  • the ESG service provision system 1 may be entirely hardware, entirely software, or may have aspects that are partly hardware and partly software.
  • a system may collectively refer to hardware equipped with data processing capabilities and operating software for running it.
  • terms such as “unit,” “system,” and “device” are intended to refer to a combination of hardware and software driven by the hardware.
  • the hardware may be a data processing device that includes a Central Processing Unit (CPU), Graphics Processing Unit (GPU), or other processor.
  • software may refer to a running process, object, executable, thread of execution, program, etc.
  • the ESG service provided by the ESG service providing system 1 includes a standardization auxiliary tool providing service that changes ESG data in an unstructured format within an ESG document into a structured format.
  • the ESG service providing system 1 includes an electronic device 100 connected to a database server 200 to provide this service.
  • the database server 200 includes a communication unit 210 and one or more storage units.
  • the database server 200 may include one or more of an ESG document DB 220, an ESG management item DB 230, and a parsed text DB 240.
  • the communication unit 210 is configured to transmit and receive data with external devices such as the electronic device 100 through wired/wireless electrical communication.
  • the database server 200 may store data in one or more storages or provide the stored data to an external device through the communication unit 210.
  • the communication unit 210 may be referred to as a transmitter, receiver, transceiver, communication unit, communication modem, or communication circuit.
  • the communication unit 210 uses wired access systems and wireless access systems such as the IEEE (institute of electrical and electronics engineers) 802.xx system, IEEE Wi-Fi system, 3rd generation partnership project (3GPP) system, and 3GPP LTE (long term evolution) system. , 3GPP 5G NR (new radio) system, 3GPP2 system, and Bluetooth can support at least one of various wireless communication standards.
  • the ESG document DB 220 stores data obtained by formalizing and processing ESG documents, which will be described below, obtained by the structured data processing unit 140.
  • the ESG document DB 220 may store items and their values for each ESG document that has been table converted by the structured data processing unit 140.
  • the table conversion processing result data stored in the ESG document DB 220 is described in more detail below with reference to the structured data processing unit 140.
  • the ESG management item DB 230 stores management items required to convert unstructured ESG data into standardized data.
  • the ESG management item DB 230 may store item sets for one or more major categories.
  • the above major categories are comprised of reporting standards and ESG topic pools.
  • the major categories are the Global Reporting Initiative (GRI), which is a disclosure standard for sustainability reports, or the U.S. Sustainability Accounting Standards Board (SASB), Task Force on climate-Related Financial Disclosures (TCFD), and the United Nations. It may also include important topics and standards classified by industry provided by SDGs (UN Sustainable Development Goals) and the Ministry of Trade, Industry and Energy's ESG guidelines (or referred to as K-ESG).
  • the ESG management item DB 230 may store major classifications based on GRI, SASB, TCFD, UN-SDGs, K-ESG, and/or other standards.
  • the item set for each subcategory may include the criteria for that subcategory, ESG keywords required to be created in the topic, and ESG topic items.
  • the item set for each major category may include topic items that each major category includes in common (common topic items). Additionally, the item set for each subcategory may include a plurality of other items that are unique to the individual subcategory.
  • the item set of the GRI major category may include document items of GRI200, GRI300, and GRI400.
  • the ESG management item DB 230 may store each item in the item set as a corresponding code value and/or data set value.
  • the item sets for the major categories may be further classified based on the industry of the company being evaluated. Even if the same major classification is applied, the item set may be different depending on the industry group of the company being evaluated. For example, SASB selected 'information security' as an important topic for the healthcare industry, but did not select it as an important topic for the electric power industry. Therefore, when SASB is applied to companies subject to evaluation belonging to the healthcare industry, the 'information security' keyword and related items are used to extract corresponding unstructured ESG data, and when SASB is applied to companies subject to evaluation belonging to the electric power industry, 'information security' keywords and related items are used to extract corresponding unstructured ESG data. ' Keywords and related items may not be used to extract corresponding unstructured ESG data.
  • multiple items in the ESG document may be specified in a hierarchical structure.
  • Each item within the item set of each major category may be further classified from the highest level to the lowest level.
  • the highest level may include common topics, GRI200, GRI300, and GRI400.
  • the next level from level 1 of common topics may include organizational profile, strategy, and governance.
  • the next level (level 3) from level 2 of the organization profile may include the size of the organization and its employees.
  • the next level from level 3 (level 4) of the size of the organization may include the number of domestic employees, number of overseas employees, number of business locations, and net sales.
  • the ESG document items and the ESG management item DB 230 that stores them are described in more detail in FIG. 2A below.
  • the parsed text DB 240 stores the text of the parsed ESG document.
  • the text of the parsed ESG document may be obtained from the structured data processor 140, which will be described below.
  • the text of the parsed ESG document is described in more detail below with reference to the structured data processing unit 140.
  • the electronic device 100 may be, for example, a laptop computer, other computing device, tablet, cellular phone, smart phone, smart watch, smart glasses, head mounted display (HMD), other mobile device, or other wearable device.
  • a laptop computer other computing device
  • tablet cellular phone
  • smart phone smart watch
  • smart glasses head mounted display
  • HMD head mounted display
  • the electronic device 100 includes an auxiliary tool for standardizing unstructured ESG data.
  • the electronic device 100 is configured to extract unstructured ESG data included in the obtained ESG document and standardize the extracted unstructured ESG data using the auxiliary tool. Additionally, the electronic device 100 is configured to support building a database by supplying standardized ESG data to the database server 200.
  • the electronic device 100 is a client terminal device that communicates with the service server 200 and includes at least one processor capable of processing data, a memory for storing data, and a communication unit for transmitting/receiving data.
  • the electronic device 100 may include a communication unit 110, an input unit 120, an interface provider 130, a structured data processing unit 140, and an output unit 150, as shown in FIG. 1. It may be possible.
  • the communication unit 110 is configured to transmit and receive data with external devices such as the database server 200 through wired/wireless electrical communication.
  • the electronic device 100 provides data to the input unit 120, the interface provider 130, the structured data processing unit 140, and the output unit 150 through the communication unit 110, or provides processing results to an external device. It may be possible.
  • the communication unit 110 is similar to the communication unit 210, detailed description is omitted. The description of the communication unit 110 focuses on differences from the communication unit 210.
  • the communication unit 110 is configured to receive ESG documents including unstructured ESG data.
  • the user may collect a plurality of ESG documents from a web page through the communication unit 110 and upload them to the input unit 120.
  • ESG documents include ESG sustainability reports of companies subject to domestic and foreign evaluation that are already publicly available on government web pages, corporate web pages, and other websites, or other ESG documents prepared and distributed by ESG managers of individual companies.
  • the company subject to the evaluation may not only refer to a business as a business, but may also encompass various types of organizations such as institutions and non-profit organizations.
  • the ESG documents can also be collected from a public database on the company's website, government portal, etc.
  • the ESG document may be obtained from one or more external DBs including government document DB 310, customer document DB 320, and website document DB 330.
  • the government document DB 310 may collect ESG documents for at least one searched company by accessing a government data portal.
  • the customer document DB 320 accesses the data portal of a customer related to the system 1, for example, a customer company that has subscribed to the service provided by the system 1, and collects ESG documents for the customer. It may be possible. Multiple ESG documents may be collected for a single customer.
  • the website document DB 330 may collect ESG documents by accessing each of one or more websites pre-designated as major websites and searching for ESG documents disclosed in the accessed websites.
  • the ESG data represents information describing the ESG status of the company subject to evaluation that created the document.
  • the ESG document may be a Portable Document Format (PDF) document, but is not limited thereto.
  • PDF Portable Document Format
  • the unstructured ESG data is data that represents ESG information in an unstructured format.
  • Unstructured data is data that does not have a structure that can be recognized by the database server 200.
  • the unstructured ESG data may include unstructured text and images.
  • the input unit 120, the interface providing unit 130, and the structured data processing unit 140 may be implemented with at least one processor.
  • the input unit 120 is configured to supply an ESG document including unstructured ESG data input from the communication unit 110 to the structured data processing unit 140.
  • the interface provider 130 is configured to receive a user's input for changing unstructured data of an ESG document into structured data.
  • the interface providing unit 130 is configured to allow the user to modify the contents of ESG items, code values, data set values, answer contents, and/or final input field values.
  • the interface provider 130 searches for the location of an item to apply user input in a document based on a code value and a data set value in the ESG management item DB 230 of the database server 200. , it may be configured to control the output device to move the screen to the corresponding location or the page containing it.
  • the interface provider 130 may provide an auxiliary tool interface screen so that the user can directly edit the item if there is an error in the selection process result.
  • the auxiliary tool interface screen is configured to receive correction input for items, etc.
  • the structured data processing unit 140 obtains items corresponding to a plurality of ESG management items pre-stored in the ESG management item DB 230 of the database server 200 in the ESG document and the contents of the items, and formats the ESG document. It is configured to generate ESG data.
  • the structured data processing unit 140 is configured to parse and process the ESG document (eg, PDF data of a sustainability report).
  • ESG document eg, PDF data of a sustainability report
  • the structured data processing unit 140 is configured to search for corresponding items in the document based on a plurality of ESG management items pre-stored in the ESG management item DB 230 and obtain the contents of the corresponding items using an auxiliary tool. do.
  • this structured data processing unit 140 will be described in more detail with reference to FIG. 2 below.
  • the output unit 150 may include one or more of a display or a speaker.
  • the output unit 150 may output content under the control of the processor, the interface providing unit 130, or the structured data processing unit 140.
  • the display can display information processed by the electronic device 110 as an image.
  • the display may display execution screen information of an application running on the electronic device 100, or user interface (UI) and graphic user interface (GUI) information according to the execution screen information.
  • the display may include, for example, an LCD, OLED, flexible display, or other display components.
  • the display may be implemented as a touch panel formed in a layered structure or integrated with a touch sensor, and may simultaneously provide an input interface screen and an output interface screen. Touch input is input by a pointing object (eg, including the user's body, a tool, etc.).
  • a pointing object eg, including the user's body, a tool, etc.
  • the output unit 150 is configured to display an auxiliary tool interface screen provided by the interface provider 130.
  • the output unit 150 may display an input box for modifying information about items, etc.
  • the output unit 150 may output an ESG image. Additionally, the output unit 150 may output parsed text. In some embodiments, the output unit 150 places and outputs an image of an ESG document on a portion (e.g., one side) of the screen of the output portion 150, and arranges parsed text on another portion (e.g., the top). You can also print it out.
  • the electronic device 100, service server 200, or system 1 may include other components.
  • the service server 200 may include other hardware elements necessary for the operations described herein, including input devices for data entry and output devices for printing or other data display.
  • the system 1 may further include a network, network interface, and protocol connecting the service server 200 and an external device (eg, a user terminal, an external database, etc.).
  • FIGS. 2A and 2B are flowcharts of a method for building an ESG database consisting of standardized ESG data using an ESG auxiliary tool, according to another aspect of the present application.
  • FIGS. 2A and 2B may be performed by one or more computing devices, such as the ESG service providing system of FIG. 1.
  • the method includes receiving an ESG document (eg, by the communication unit 110) (S100).
  • S100 an ESG document
  • a plurality of ESG documents may be collected in step S100.
  • the method parses the ESG document received in step S100 (e.g., by the structured data processing unit 140), and stores items corresponding to pre-stored management items contained in the parsed ESG document. It may also include a step (S200) of acquiring data and generating standardized ESG data.
  • the step (S200) includes uploading the ESG document received in step (S100) to the structured data processing unit 140 (S210); and parsing the ESG document (S220).
  • the structured data processing unit 140 is configured to parse and process the ESG document (eg, PDF data of a sustainability report).
  • the structured data processing unit 140 may include a parsing tool.
  • the structured data processing unit 140 may parse unstructured data using a parsing tool.
  • the parsing tool may be, but is not limited to, PDFMiner.
  • the structured data processing unit 140 may apply the parsing tool to an ESG document in PDF format to generate parsed PDF data.
  • the parsing tool may extract text blocks containing one or more lines of text, images, and/or geometric shapes from an ESG document in PDF format.
  • the extracted text block may have at least one attribute among text, bounding box, and text line attributes.
  • parsed PDF data may contain extracted text blocks, each text block containing one or more lines of text.
  • each text line may have at least one attribute among the text of the line and the attribute of a bounding box surrounding the line.
  • the bounding box of the text block or text line is the box around the text block, defining the area of the page that each text block or text line generally occupies.
  • the bounding box may also refer to a rectangular box.
  • the structured data processing unit 140 is further configured to recognize the unstructured text by OCR (Optical Character Recognition) processing of the image data of the ESG document prior to parsing processing. It could be.
  • the parsing tool may be configured to enable OCR processing. Then, by simultaneously performing OCR processing and parsing processing using a parsing tool, the text in the text box can be recognized and the structure (eg, text attributes) in the PDF page where the text is recognized can be analyzed.
  • Images extracted by a parsing tool may be associated with each bounding box.
  • Geometric shapes extracted by a parsing tool may include, for example, lines, curves, rectangles, and other geometric objects shown in tables or vector drawings.
  • the parsing tool can also find and extract bounding boxes around images and tables on PDF pages.
  • the parsing result of the structured data processing unit 140 may include various bounding boxes that define the area or portion of the page of the ESG PDF document occupied by text blocks, text lines, images, and/or geometric shapes.
  • the structured data processing unit 140 may transmit the text of the parsed ESG document included in the parsing result to the database server 200 and store it in the parsed text DB 240.
  • the method includes a step (S230) of screening whether the ESG document parsed in step (S220) includes an item corresponding to at least one of a plurality of pre-stored ESG management items.
  • the step (S230) determines whether the parsed ESG document includes the corresponding item based on the code value and/or data set value for each ESG management item stored in the ESG management item DB 230. It may be that you do it.
  • the structured data processing unit 140 performs a screening operation to determine whether the parsed ESG document includes the corresponding item based on the code value and/or data set value stored in the ESG management item DB 230. It is configured to perform.
  • the ESG management item DB 230 stores a plurality of ESG management items. Each ESG management item may include at least one code value and/or at least one data set value. Then, the code value and data set value constituting the ESG document item stored in the ESG management item DB 230 may be used as a standard for determining whether the parsed ESG document includes the stored item.
  • the structured data processing unit 140 determines that the parsed ESG document has at least one of the ESG document items stored in the ESG management item DB 230. It is determined that items corresponding to the searched code value and data set value are included in the parsed ESG document.
  • the structured data processing unit 140 may obtain a list of items corresponding to ESG management items that are estimated to be included in the parsed ESG document.
  • the method may further include determining whether there is an abnormality in the screening result (S240).
  • the step (S240) may be performed before the step (S250) described below.
  • the abnormal screening result indicates that it was incorrectly selected as an ESG management item even though it was not an ESG management item in the ESG document.
  • ESG management items according to GRI standards have a structure of '3-digit number', 'hyphen (-)', and '1 or 2-digit number' arranged sequentially, such as 102-1.
  • ESG documents may accidentally contain separate data with the same structure rather than ESG management items according to GRI standards.
  • data unrelated to ESG management items may be searched as a result matching the code value and/or data set value, and then the structured data processing unit 140 produces a screening result in which the ESG document includes the ESG management item. It could be.
  • the step (S240) determines whether the screening result is abnormal based on the user's confirmation input and/or surrounding data for data matching the code value and/or data set value in the ESG document. It may be possible.
  • the structured data processing unit 140 provides the location of data matching the code value and/or data set value corresponding to the pre-stored ESG management item, and may determine that there is no abnormality when a confirmation input is received for the provided location. (S240).
  • the interface provider 130 displays an auxiliary tool interface screen including the location of the matched data, and the data at each location is displayed. User input may be induced to check whether it is an ESG management item (S240).
  • the structured data processing unit 140 may determine that the data matched based on surrounding data, placed within a certain range based on the location of the data matching the code value and/or data set value corresponding to the pre-stored ESG management item, is actually It is also possible to determine whether it corresponds to ESG management items (S240).
  • step (S240) may include a step of modifying at least some of the results selected to be included in the ESG document if there is an error.
  • the interface providing unit 130 may provide an auxiliary tool interface screen for modifying data with the abnormal screening result.
  • the auxiliary tool interface screen is configured to receive an input for removing data incorrectly selected as ESG management items from the selection results.
  • the structured data processing unit 140 may receive this removal input, modify the selection result, and finally select a list of ESG management items to be converted to structured data.
  • the method includes a step (S250) of specifying a selection status for items in the ESG document depending on whether an item corresponding to the ESG management item stored in the ESG management item DB 230 is included in the document. .
  • step S250 may be performed when there is no abnormality in the screening result in step S240.
  • the data processing unit 140 designates the ESG document as the first selection status if the parsed ESG document contains the corresponding item, and If the item is not included, the ESG document may be assigned a second screening status.
  • the step of specifying the selection status of the ESG document may be implemented by turning on/off a check box indicating whether the ESG document is selected.
  • designation of the first selection state or the second selection state may be implemented by turning on/off a check box indicating whether to select. For example, if the corresponding item is included in the parsed ESG document, the structured data processing unit 140 turns on a check box to designate the ESG document as the first selection state, and if the corresponding item is not included, the The ESG document may be designated as a second selection state by processing off.
  • the method includes a step (S260) of activating or deactivating the input box of the final input field value for a plurality of pre-stored ESG management items according to the result of specifying the selection state.
  • the structured data processing unit 140 may receive a signal indicating that there is no abnormality in the selection processing result from the interface providing unit 130.
  • the structured data processing unit 140 may activate/deactivate the input box of the 'final input field value' of the corresponding item in response to receiving the signal (S260).
  • the structured data processing unit 140 When the structured data processing unit 140 receives a signal indicating that the selection process is normal, it turns on the checkbox and activates the input box of the 'final input field value' of the corresponding item when it is designated as the first selection state, or If the checkbox is turned off and the second selection state is set, the input box of the 'final input field value' of the corresponding item can be deactivated.
  • step S260 the structured data processing unit 140 may activate or deactivate the input box for the 'final input field value' of the corresponding item determined to be included in the document.
  • the result of activating or deactivating the input box may be provided through the auxiliary tool interface screen.
  • Figure 3 shows an auxiliary tool interface screen including an input box for the final input field value of an item, according to an embodiment of the present application.
  • the auxiliary tool interface screen may include corresponding items determined to be included in the document.
  • the method includes a step (S270) of obtaining content of an item corresponding to an ESG management item determined to be included in the document.
  • FIG. 2B is a detailed flowchart of step S270 of FIG. 2A.
  • the structured data processing unit 140 is configured to obtain the input value of the ESG management item specified in the first selection state.
  • the structured data processing unit 140 may extract data from the parsed ESG document or another registered ESG document to obtain the contents of the item corresponding to the ESG management item designated in the first selection state.
  • the structured data processing unit 140 determines the registration value of the registered item matching the ESG management item corresponding to the item included in the document among the registered items in the ESG document DB 220.
  • the item contents included in the parsed ESG document You can also copy it as an input value.
  • the structured data processing unit 140 utilizes the registration data of the specific item in another ESG document stored in the database server 200 instead of the data (e.g., recorded value) recognized in the parsed ESG document. You can.
  • the structured data processing unit 140 may receive input values for items of the ESG document through an auxiliary tool interface screen provided by the interface providing unit 130.
  • the step (S270) includes providing a location in the ESG document of an ESG management item designated as a first selection state (S271); and a step (S273) of acquiring the contents of the corresponding ESG management item based on the provided location.
  • the step (S273) may be to obtain the content of the 'final field input value' based on the user's content input or based on surrounding data for the provided location.
  • the structured data processing unit 140 provides the location of data matching the code value and/or data set value corresponding to the pre-stored ESG management item, and when a user's content input for the ESG management item at the provided location is received, the corresponding input is received.
  • the value can also be obtained as the contents of the ‘final field input value’.
  • the interface providing unit 130 displays an auxiliary tool interface screen including the location of the matched data, and displays the contents of the corresponding item.
  • User input may be induced (S270).
  • the structured data processing unit 140 may determine whether data matched based on surrounding data placed within a certain range based on the provided location actually corresponds to an ESG management item (S270).
  • the range is set based on the text arrangement structure (e.g., text block, text line, etc.) around the location, and the number of texts.
  • the range may be a block of text below a given location. Then, the content of the item may be obtained as part or all of the text in the text block at the bottom.
  • the step (S270) further includes, when receiving a user input to use data in the existing ESG document, obtaining the data in the existing ESG document as content for the corresponding item (S275). You may.
  • the steps (S271, S273) may be performed after receiving a user input indicating not to use data in an existing ESG document.
  • the existing ESG documents include previous ESG documents of the company being evaluated.
  • ESG documents are typically created by a single company subject to evaluation in a time series sequence. Because changes in the companies being evaluated are relatively slow, ESG documents that differ by a short period of time (e.g., quarter, half-year, or year) may have partially identical content on the same items. In this case, the structured data processing unit 140 may use the data of the existing ESG document as is in the newly created ESG document.
  • the method includes a step (S280) of generating structured data by performing table conversion on the list of ESG management items selected in step (S250) and the contents of each ESG management item obtained in step (S270). .
  • the structured data generated in step S280 is unstructured ESG data converted to have a data structure recognizable by the ESG service providing system 1.
  • step S270 The information obtained in step S270 is mapped to each ESG management item selected in step S250. Then, the structured data processing unit 140 may convert the data into a table consisting of item/content values, thereby converting it into structured data.
  • the structured data processing unit 140 may transmit the table conversion processing result as structured data to the database server 200 and store it in the ESG management item DB 230.
  • the ESG service providing system 1 may be further configured to perform a series of management operations, such as modifying, deleting, or creating already stored ESG management items.
  • Figure 4 is a flowchart of a process for managing ESG management items according to an embodiment of the present application.
  • the process includes a step (S291) of displaying an auxiliary tool interface screen to receive a request for modification, deletion, or creation of an ESG management item.
  • display of the auxiliary tool interface screen may be performed according to an operation of initiating a management function for an ESG management item.
  • the auxiliary tool interface screen is configured to guide selection of an item to be modified or deleted and/or to create a new target item based on the relationship structure with existing items.
  • Figure 5 shows an auxiliary tool interface screen displaying an item level structure according to an embodiment of the present application.
  • the auxiliary tool interface screen may display a set of items for each major category, categorized by the same item level.
  • the process includes checking whether already saved ESG management items have been saved (S292); If the ESG management item is stored, receiving a request to modify, delete, or create the ESG management item (S293); and, if the ESG management item is not stored, receiving a request to create the ESG management item (S294).
  • the electronic device 100 may select an item to be modified or deleted through the auxiliary tool interface screen of FIG. 5, and may modify the contents of the target item or delete the target item from the ESG management item DB 230. Alternatively, new target items may be added based on the item level structure.
  • step S293 the electronic device 100 may select an item to be modified in the 'item level structure' displayed on the auxiliary tool interface screen of FIG. 5 and receive a request to modify the item.
  • the creation request in step S293 is to add a new management item to the existing set of ESG management items.
  • the electronic device 100 may receive a request to add an item according to the 'item level structure' displayed on the auxiliary tool interface screen of FIG. 5.
  • the item modification request, item addition request, etc. are received through the auxiliary tool interface screen, and then the electronic device 100 obtains the item level of the selected item.
  • step S294 the request is to create a new ESG management item. Since this is similar to adding items in step S293, detailed description is omitted.
  • the process of FIG. 5 may further include activating or deactivating an input box depending on whether the requested item in step S293 is the lowest level item.
  • the activating or deactivating step includes: deactivating the input box for the contents of the target item when the requested target item in steps S293 and S294 is not the lowest level item (S295); and a step (S296) of activating an input box for the contents of the target item when the request target item in steps (S293, S294) is the lowest level item.
  • one or more item information of 'answer type' for the item, 'final input field value' of the item content, 'code value' to represent the item, and 'data set value' may be input through the input box. It may be possible.
  • the interface providing unit 130 provides the content of the target item, such as one or more item information among the 'answer type' for the item, 'final input field value' of the item content, 'code value' to represent the item, and 'data set value'.
  • An auxiliary tool interface screen may be provided to receive input.
  • the auxiliary tool interface screen may include a first sub-area including an activated input box and a second sub-area including an item structure level. Inputs for 'answer type', 'final input field value', 'code value', and 'data set value' may be located at the bottom (i.e., first sub-area) of the auxiliary tool interface screen in FIG. 5. In the second sub-area, item sets for each major category are classified and displayed for each same item level.
  • the above process includes, after step S296, a step of receiving input of the contents of the target item to be modified or created through the activated input box (S297); And it may further include a step (S298) of storing the contents of the item entered in step (S297) in the ESG management item DB 230.
  • the unstructured ESG data is parsed and standardized by the ESG service provision system 1 and built into a database, so that the ESG data can be appropriately utilized according to analysis and processing from a big data perspective.
  • the text of the parsed ESG document can be used as training data for a machine learning model to automatically complete the ESG document.
  • the ESG service providing system 1 may be connected to a system configured to recommend text suitable for automatically completing ESG documents and provide the text of the parsed ESG document.
  • Figure 6 is a schematic diagram of a system configured to recommend text suitable for automatically completing ESG documents, according to an aspect of the present application
  • Figure 7 is a process for generating an ESG auto-complete model, according to an embodiment of the present application. This is a schematic diagram.
  • the ESG service providing system 1 is connected to a system configured to recommend text suitable for automatically completing ESG documents, so that the ESG service provided by the ESG service providing system 1 is ESG. It further includes a service that recommends text suitable for automatically completing documents.
  • a system configured to recommend text suitable for automatically completing the ESG document includes a service server 200-1 connected to the data warehouse system 300.
  • Data warehouse system 300 refers simply to a cloud data warehouse system or other data warehouse system, which is a network containing a central repository of integrated data from one or more disparate sources for data analysis and reporting. It is a -based storage system.
  • the data warehouse system 300 may store current and historical data that can be used to generate analysis reports for businesses. To this end, the data warehouse system 300 provides business intelligence tools, tools for extracting data, transforming it, and loading it into storage, and tools for managing and retrieving metadata.
  • the data warehouse system 300 provides functions (e.g., structured query language (SQL) functions), table functions, or procedures outside the data warehouse system and in a web application program. It may be configured to provide functionality for binding to remote software code exposed as an interface (Web application programming interface).
  • SQL structured query language
  • Web application programming interface Web application programming interface
  • the data warehouse system 300 is an externally managed web API management system provided by an externally implemented web service platform (e.g., Amazon Web Services® (AWS), Microsoft Azure®, or Google Cloud Services®).
  • An endpoint for example, a HyperText Transfer Protocol (HTTP) Representational State Transfer (REST) endpoint
  • HTTP HyperText Transfer Protocol
  • REST Representational State Transfer
  • the user is responsible for provisioning the web endpoint and configuring the endpoint based on the business logic within the storage platform.
  • the web API management system proxies the request to Lambda functions, and in other cases, the web API management system transforms the request and sends it to a third-party software component outside of the data warehouse system. Pass it to Data warehouse system 300 enables external functions provided by its external software components to be used in queries, such as user-defined functions, user-defined table functions, and stored procedures.
  • Data warehouse system 300 stores various data objects to enable invocation of external functions provided by remote software components.
  • Data objects store information used by network-based data warehouses to obtain temporary security credentials to be used to call external functions through a web API management system provided by the cloud computing platform.
  • the network-based data warehouse system uses temporary security credentials to authenticate to the target endpoint through the cloud computing service platform's authentication system and sends the endpoint to batches of target data defined in the query. Call a function from a point.
  • Target data includes, for example, binary data, JavaScript Object Notation (JSON) encoded data, or other text formats such as extensible Markup Language (XML).
  • JSON JavaScript Object Notation
  • Target data can be passed inline with HTTP requests/responses, or written to commonly accessed storage provided by a cloud computing service platform (e.g., Amazon® Simple Storage Service (S3®)). there is.
  • a cloud computing service platform e.g., Amazon® Simple Storage Service (S3®)
  • S3® Amazon® Simple Storage Service
  • a system configured to recommend text suitable for automatically completing the ESG document extracts ESG text from an ESG document written in Korean, English, or a third language and stores it in the data warehouse system 300. .
  • ESG text is extracted from an ESG document, it is a text that has meaning and expression suitable for the ESG format.
  • Text matching the ESG format may be classified into an ESG format category.
  • the ESG text may include words (eg, keywords) or sentences used in the ESG field.
  • the ESG text may further include words, phrases, or sentences used in other fields related to the ESG field.
  • Other-fields related to the ESG field may be those whose reference documents were utilized to create the ESG document.
  • ESG documents include ESG sustainability reports of companies subject to domestic and foreign evaluation that are already publicly available on government web pages, corporate web pages, and other websites, or other ESG documents prepared and distributed by ESG managers of individual companies.
  • the company subject to the evaluation may not only refer to a business as a business, but may also encompass various types of organizations such as institutions and non-profit organizations.
  • the ESG document is obtained from one or more external DBs of government document DB 310, customer document DB 320, and website document DB 330, shown in FIGS. 1 and 6. It may also be stored in the data warehouse system 300.
  • the government document DB 310 may collect ESG documents for at least one searched company by accessing a government data portal.
  • the customer document DB 320 accesses the data portal of a customer associated with a system configured to recommend text suitable for automatically completing the ESG document, for example, a customer company that has subscribed to the service provided by the system 1. You can also collect ESG documentation for that customer. Multiple ESG documents may be collected for a single customer.
  • the website document DB 330 may collect ESG documents by accessing each of one or more websites pre-designated as major websites and searching for ESG documents disclosed in the accessed websites.
  • the service server 200-1 is a plurality of computer systems or computer software implemented as network servers.
  • a network server is a computer system and computer that is connected to a sub-device that can communicate with other network servers through a computer network such as a private intranet or the Internet, receives a request to perform a task, performs the task, and provides a performance result.
  • a computer network such as a private intranet or the Internet
  • receives a request to perform a task performs the task, and provides a performance result.
  • network server program software
  • the service server 200-1 may be implemented as any type or combination of types of computing devices, such as a network server, web server, file server, supercomputer, desktop computer, etc.
  • the service server 200-1 includes at least one processor capable of processing data, a memory for storing data, and a communication unit for transmitting/receiving data.
  • the service server 200-1 may provide an ESG document auto-completion service that recommends text (eg, sentences) suitable for the ESG format to make it easier for users to write ESG documents.
  • the service server 200-1 applies the input value received from the user's electronic device 100-1 to a pre-learned ESG auto-completion model to place text or words (e.g., keywords) to be placed in the order following the input value. ) or predict the sentence.
  • the service server 200-1 may be configured to deliver the prediction result to the user's electronic device 100-1.
  • the service server 200-1 may further include a learning unit 210-1.
  • the data warehouse system 300 may supply the stored ESG text data to the learning unit 210-1 as sample text data for generating an ESG auto-completion model.
  • the learning unit 210-1 may learn a pre-designed ESG auto-completion model by processing sample text data in natural language.
  • the learning unit 210-1 may perform a preprocessing operation of natural language processing sample text data, an operation of forming a training data set based on tokens of the sample text, and a pre-designed neural network using the training data set. It may be configured to perform an operation of learning an ESG auto-completion model with a structure.
  • the learning unit 210-1 performs a pre-processing operation for learning, such as processing a corpus (eg, sentence) of the received sample text into natural language.
  • a corpus eg, sentence
  • the preprocessing operation may include a tokenization processing operation and/or a special token addition operation.
  • the tokenization processing operation is an operation that generates a plurality of tokens by dividing the corpus of text subject to preprocessing into token units, which are the preset minimum division units.
  • the token unit may be preset, for example, in word units or morpheme units.
  • the learning unit 210-1 may divide the sentence into token units to form a token set of the sentence.
  • Each token set consists of multiple tokens generated from a single corpus.
  • the special token addition operation is an operation of adding one or more special tokens among a plurality of predefined special tokens to the corpus of text subject to preprocessing.
  • the special token is a special token used to express the output text of the ESG auto-complete model in a more natural text style. Unlike the token that points to text, the special token may not point to text.
  • tokens generated by dividing the text of the corpus into token units will be referred to as text tokens, and embodiments of the present application will be described in more detail.
  • the special tokens may include, for example, tokens for unknown words, tokens for matching the length of batch data, tokens indicating the beginning of a sentence, tokens indicating the end of a sentence, and/or tokens other than the sentence text. there is.
  • the ESG autocomplete model to which a set of tokens from the corpus of sample text to which the special token has been added, is input, looks at the text of the input token. It can also be easily decoded.
  • the special token addition operation may be performed when there is no need to split the corpus of text to be preprocessed into tokens or when there are pre-associative language rules for the language in which the output text of the ESG auto-completion model is expressed. there is.
  • the learning unit 210-1 generates a corpus of sample text into a token set consisting of text tokens divided into token units, a token set consisting of token(s) to which only special tokens are added without division, or Special tokens are added to the corpus of sample text, and then a token set consisting of segmented text tokens is used to form a training data set.
  • the learning unit 210-1 may form a training data set consisting of a plurality of training samples. Each training sample includes training data and label data.
  • Each of the plurality of training samples may be formed from a token set obtained from a corpus of a plurality of sample texts.
  • the training data and label data of each training sample are obtained from a set of tokens corresponding to a corpus of the same sample text.
  • the training data may be an arrangement of two or more tokens included in a token set obtained from a sample text corpus in order of the corresponding sample text corpus.
  • the token array of training data corresponds to part or all of a corpus of input text (i.e., sample text).
  • the training data set may be subset by sample sentence.
  • Training data for each sample sentence may be a token array including the first token in the sample sentence.
  • the training data in the subset for the sample sentence is the first token in the sample sentence, an array of tokens containing the first to second tokens in the sample sentence, or the first to third tokens in the sample sentence. It may be an array of tokens including ...., or an array of tokens from the first token to the previous token of the last token in the sample sentence above.
  • the label data may be a remaining array token in which the remaining tokens excluding the token array of training data from the entire token array representing the sample sentence are arranged according to the corpus order of the sample sentence.
  • the remaining sequence tokens may include the last token in the sample sentence.
  • a plurality of label data corresponds to each of a plurality of training data.
  • the label data for the training data in the subset generated from the same sample sentence may each be as follows:
  • the label data corresponding to the training data with the first token in the sample sentence is the second text token in the sample sentence.
  • the to last text tokens are the remaining array tokens arranged sequentially, and the label data corresponding to the training data having a token array including the first to second tokens in the sample sentence is the third to last text token in the sample sentence.
  • the remaining array tokens are sequentially arranged, and the label data corresponding to the training data having a token array including the first to third tokens in the sample sentence is the residual array in which the fourth to last text tokens in the sample sentences are sequentially arranged. It is an array token, and...., the label data corresponding to the training data having a token array from the first token to the previous token of the last token in the above sample sentence may be the last text token.
  • the training data set including the training data and label data generated by the learning unit 210-1 is used to learn the ESG auto-completion model.
  • the ESG auto-completion model infers the association between the corpus of the input text constituting part of the sentence and the corpus of remaining text constituting the remaining part of the sentence, and determines the corpus of the input text. It is then learned to predict a corpus of texts suitable for placement in the next order.
  • the corpus of text may be words (eg, keywords), phrases, or sentences.
  • the remaining text corpus can be placed after the input text corpus and may be a text corpus corresponding to the label data.
  • the ESG auto-completion model includes a neural network designed to process input text in natural language to at least partially restore remaining text that can be located in the input text.
  • the ESG autocomplete model may be a PLM or other natural language processing-based network model.
  • the ESG auto-completion model may be configured to restore a corpus of text suitable for being placed in the next order of the corpus of input text.
  • the ESG autocomplete model may include an encoder and decoder.
  • the encoder extracts features from the input token array, and the decoder is configured to restore a corpus of text that can be placed in the next order of the input corpus indicated by the input token array based on the extracted features.
  • the extraction capability of the encoder and the restoration capability of the decoder can be learned by the learning unit 210-1 using the training data set.
  • the ESG auto-completion model repeats the operation of appropriately restoring the text corpus located next to the specific text corpus in the corpus of sample texts for learning, so that the parameters in the model are adjusted to the specific text corpus. It is learned to predict a text corpus suitable to be located next to .
  • the learning unit 210-1 inputs training data of each training sample in the training set into the ESG auto-completion model.
  • the encoder is configured to extract features of the input token by processing the input token as natural language.
  • the features may be extracted in vector form or matrix form such as a map.
  • the input token to the encoder is a single token or array of tokens included in training data.
  • the decoder is configured to restore a text token to be located next in the token array of the training data based on the characteristics of the token of the input training data.
  • the decoder sequentially proceeds with the process of restoring a specific text token to be located next to the input token and restoring other specific text tokens to be located next to the restored specific text token, thereby creating a sentence composed of the input token and the predicted text tokens. is learned to finally restore.
  • the tokens that the decoder restores may match or be similar to the remaining token arrangement of the label data corresponding to the training data. As described above, the remaining token arrangement may be a single token (i.e., the last token).
  • the decoder When the token array of the training data mentioned in the above example is input to the encoder, the decoder is trained to restore at least one other token that can be located in the input token array in the sentence comprised by the input token array.
  • the decoder's restoration value may be at least one text token predicted to be suitable for placement next to the input text among sentences that can be created from the input text, and is used as a prediction value for each training sample.
  • Figure 8 is a schematic diagram of an operation for predicting output text in an ESG auto-completion model, according to an embodiment of the present application.
  • the decoder may restore the remaining token arrangement using a grid search method.
  • the decoder predicts a plurality of candidate tokens that can be placed in the next order of a specific token, selects the token with the highest probability among the predicted plurality of candidate tokens, and restores the remaining token arrangement.
  • the plurality of candidate tokens are tokens composed of text in the ESG field.
  • the decoder selects the token most likely to be placed at the position of the remaining token array based on the context before and after the remaining token array. By sequentially selecting tokens according to this probability, tokens that can be placed next to the input token in the sentence composed by the input token and are predicted to constitute the sentence can be determined.
  • the learning unit 210-1 may adjust the parameters of the ESG auto-completion model in order to learn the function of recommending recommended text.
  • the parameters of the ESG auto-complete model may include parameters of a pre-designed artificial neural network structure.
  • the learning unit 210-1 may adjust the parameters of the ESG auto-completion model so that the error between the calculated predicted value (eg, output value of the decoder) and the actual value is reduced or minimized.
  • the actual value is the value of the label data included in the training sample used to calculate the output value.
  • the label data corresponds to the training data of the input token that provides the prediction value.
  • the learned ESG auto-completion model may accurately predict the corpus of text to be placed in the next order of the corpus of the input text. If the ESG autocomplete model more accurately infers the association between the corpus of the input text and the corpus of the remaining text, then the corpus of the remaining text suitable to be located after the input text in the sentence composed of the input text in the corpus of the input text is more accurately determined. It will be predicted.
  • the ESG auto-completion model trained through this process is configured to predict a text suitable to be placed in the next position of the input text corpus on the ESG document as a recommended text.
  • the output text is a text that satisfies the format of an ESG document, and may be a text that has a context connected to the context of the input text and has an expression specialized for the ESG field.
  • the ESG autocomplete model may calculate a corpus of text to be placed next to the corpus of the single input text as one or more text corpora. For example, when a single sentence is input, the ESG auto-completion model may calculate one or more candidate sentences suitable to be placed next to the single sentence. Additionally, in some embodiments, the ESG autocomplete model calculates a corpus of a plurality of recommended texts, and outputs some or all of the recommended text corpora as a final recommended text corpus based on the probability value for each corpus of each recommended text. You may.
  • the ESG auto-completion model may be set so that the seed value of the model has a random value each time an operation for calculating a recommended text to be located next to the input text is performed.
  • the operation of calculating the recommended text for the same input text is repeated multiple times, two or more different corpora of recommended texts may be calculated among the multiple times.
  • the number of recommended texts may depend on a pre-specified hyper parameter that indicates the number of repetitions of the operation to calculate the recommended text for the same input text.
  • the ESG auto-completion model may output a corpus of some recommended texts whose probability value for each corpus of each recommended text is greater than or equal to a preset threshold probability value as a corpus of the final recommended text. Then, the system 1 may place the corpus of recommended text corresponding to the user's selection command at the next position of the input text. The corpus of recommended texts arranged according to the user's selection is used as a new input text to calculate a corpus of new recommended texts in the next order of the predicted recommended text. Due to repetition of this process, the user may complete part or all of the contents of the ESG document through several selection commands.
  • the decoder may include a fitting layer.
  • the fitting layer is placed at the end of the decoder so that the ESG auto-completion model predicts a text whose meaning and/or expression fits the ESG format as the next text of the input text.
  • the fitting layer may be placed on the data path before the probability function.
  • the learning unit 210-1 may perform a reinforcement learning operation in which the ESG auto-completion model at least partially learns the meaning implied in the input text using the fitting layer.
  • the fitting layer is configured to give weight to data closer to the ESG format for the next text (e.g., word, phrase, or sentence) to be predicted and output when the input text is input before the recommended sentence is output. .
  • a higher weight value may be assigned depending on the degree of suitability for the ESG format.
  • the ESG auto-completion model can at least partially learn the semantic part implied in the text in the ESG field that fits the ESG format.
  • the degree of compliance with the ESG format may be based on the frequency with which it appears in the ESG document.
  • the ESG auto-completion model is designed based on a GPT (Generative Pre-trained Transformer) model. If the ESG autocomplete model does not include a fitting layer and is pre-trained to predict the next word, phrase, or sentence of the input text, multiple categories of corpus data may be predicted as the next word, phrase, or sentence. In the specific embodiments above, the ESG autocomplete model may implement the next word, phrase, or sentence of the input text from corpus data of the ESG format category through a fitting layer.
  • GPT Geneative Pre-trained Transformer
  • the ESG autocompletion model including the fitting layer is trained to predict a corpus of text that satisfies the format of the ESG document and is suitable (i.e., most likely) to be placed in the next position in the corpus of input text.
  • the service server 200-1 supports users in creating ESG documents using the learned ESG auto-completion model as shown in FIG. 7.
  • the service server 200-1 may further include an ESG document generator 250-1 that supports the user's ESG document completion by predicting a recommended text to be placed in the next position of the user's input text. It may be possible.
  • the ESG document creation unit 250-1 is configured to use the ESG auto-completion model. The operation of the ESG document generator 250-1 will be described in more detail with reference to FIG. 10 below.
  • the electronic device 100-1 inputs an input text to initiate a prediction operation of the service server 200-1, and selects a recommended text predicted by the service server 200-1 or the input text and the predicted recommended text. It is configured to output the contents of the ESG document, including, but not limited to, at least partially auto-completed. Additionally, in some embodiments, the electronic device 100-1 may be further configured to select one text to be used as document content from among the predicted recommended texts.
  • the electronic device 100-1 is a client terminal device that communicates with the service server 200-1, and includes at least one processor capable of processing data, a memory for storing data, and a communication unit for transmitting/receiving data. do.
  • the electronic device may be, for example, a laptop computer, other computing device, tablet, cellular phone, smart phone, smart watch, smart glasses, head mounted display (HMD), other mobile device, or other wearable device.
  • HMD head mounted display
  • the electronic device 100-1, service server 200-1, or system 1 may include other components.
  • the service server 200-1 may include other hardware elements necessary for the operations described herein, including input devices for data entry and output devices for printing or other data display.
  • the system 1 may further include a network, network interface, and protocol connecting the service server 200-1 and an external device (eg, a user terminal, an external database, etc.).
  • the learning unit 210-1 is not limited to being included within the service server 200-1.
  • the learning unit 210-1 may be implemented as an external component of the service server 200-1.
  • the learning unit 210-1 is configured to communicate electrically with the data warehouse system 300 and the service server 200-1.
  • the service server 200-1 receives a pre-trained ESG auto-complete model from the external learning unit 210-1, and uses the received model to fit the ESG format to more easily create a user's ESG document.
  • An ESG text auto-completion service that recommends sentences can also be provided.
  • Figure 9 is a flowchart of a method for recommending text suitable for automatically completing an ESG document, according to another aspect of the present application.
  • the method of recommending text suitable for automatically completing the ESG document of FIG. 9 (hereinafter referred to as the ESG text recommendation method) recommends text suitable for automatically completing the ESG document of FIG. 6 connected to the ESG service provision system 1 of FIG. 1. It may be performed by one or more computing devices, such as a configured system.
  • ESG text refers to text that satisfies the format of the ESG document.
  • the ESG text auto-completion method includes receiving basic text for completing the ESG text to be described as part of the contents of the ESG document from the user's electronic device 100-1 (S410). Includes.
  • the basic text is used as a clue to predict the text to be placed next.
  • the basic text is a word (eg, keyword), phrase, or sentence to be written in the ESG document.
  • the basic text may be, for example, text representing some or all of the essential texts required to complete the ESG document, or text representing a portion of the entire contents of the ESG document.
  • the basic text of step S410 may be input through an interface screen provided when accessing a specific web page operated by a system configured to recommend appropriate text.
  • the interface screen may be configured to represent the ESG format desired to be completed. Through the above interface screen, users can directly input content into the form of the ESG document to be completed or receive auto-complete results in real time.
  • the ESG text recommendation method includes a step (S420) of inputting the basic text received in the step (S410) into a pre-trained ESG auto-completion model to predict a recommended text to be placed next to the basic text. .
  • the step of calculating the recommended text includes forming input data by preprocessing the corpus of the base text, and inputting the formed input data into the pre-trained ESG auto-completion model to form at least one It may also include the step of calculating recommended text.
  • the preprocessing operation performed in step S420 includes a tokenization processing operation and/or a special token addition operation.
  • the preprocessing operation may correspond to the preprocessing operation used to generate training data for the ESG autocomplete model.
  • the service server 200-1 may generate input data by tokenizing the corpus of the basic text to calculate the recommended text. .
  • the ESG auto-completion model of step S420 is trained in advance to predict a corpus of ESG text suitable for placement in the next order of the basic text of step S410.
  • the ESG auto-completion model will be configured to calculate a corpus of one or more texts that are likely to be placed in the next order of the basic text, and output a corpus of at least one text among the corpora of the calculated one or more texts as a corpus of recommended texts. It may be possible.
  • the corpus of ESG text may be words (eg, keywords), phrases, or sentences.
  • the ESG autocomplete model may output a corpus of one or more ESG texts as a corpus of recommended text.
  • the service server 200-1 may transmit a corpus of one or more output recommended texts to the electronic device 100-1.
  • the electronic device 100-1 may provide the received recommended text to the user.
  • the electronic device 100-1 may provide a result of arranging the basic text and each recommended text in order.
  • Figure 10 shows the output result of a corpus of recommended text according to an embodiment of the present application.
  • step S410 if the sentence “Daesang Co., Ltd. is steadily carrying out active facility investment and activities to hide greenhouse gases” is entered as the basic text, it is placed in the next order of the sentence.
  • One or more suitable recommended texts may be output from the ESG autocomplete model.
  • the ESG auto-completion model may calculate a plurality of recommended sentences and output the first to fifth sentences as recommended text, as shown in FIG. 10, based on the probability value for each of the plurality of recommended sentences.
  • Each of the first to fifth sentences may be provided in the order following the basic sentence.
  • the ESG text recommendation method may further include the step of writing recommended text in the format of an ESG document (S430).
  • the output single recommended text may be written immediately in the next order of the basic text.
  • the recommended text written in step S430 is one of the plurality of recommended texts.
  • the recommended text to be written may be determined by the user's selection. For example, the user's electronic device 100-1 displays the screen of FIG. 10 and provides a user command to select any one of the first to fifth sentences as the recommended sentence to be written next to the basic sentence. induces. When one sentence is selected, the electronic device 100-1 transmits information on the selected recommended sentence to the service server 200-1 to update the current content of the ESG document with the contents of the base text and recommended text. .
  • the ESG text recommendation method includes inputting the recommended text predicted in step S420 into the ESG auto-completion model to predict a new recommended text to be placed next to the recommended text in step S420 (S440). ) may further be included. Then, the ESG autocomplete model outputs a new recommended text with a context that is connected to the context of the recommended text and an expression specialized for the ESG field.
  • the ESG text recommendation method may further include a step (S450) of additionally writing the new recommended text output in step (S440) into the format of the ESG document in step (S430).
  • the format of the ESG document in step S430 includes the contents of the basic text and recommended text.
  • step S450 If a new recommended text is described in step S450, the ESG document being created is updated to include the basic text of step S410, the recommended text of step S420, and the contents of the new recommended text of step S440. Since the operation of step S450 is similar to the operation of step S430, detailed description is omitted.
  • the ESG text recommendation method may further include (S460) repeating the steps (S440, S450) until the entire contents of the ESG document are completed.
  • the user may automatically complete the ESG document by inputting the minimum text as the basic text through the electronic device 100-1 in step S410.
  • ASICs application specific integrated circuits
  • DSPs digital signal processors
  • DSPDs digital signal processing devices
  • PLDs programmable PLDs
  • logic devices field programmable gate arrays (FPGAs), etc. may be included in the components of the present application.
  • the method of building an ESG database consisting of standardized ESG data using the ESG auxiliary tool according to the embodiments of the present application described above, and the operation by the ESG service provision system 1 that performs the method, are at least partially implemented as a computer program. and can be recorded on a computer-readable recording medium.
  • a program product comprised of a computer-readable medium containing program code, which can be executed by a processor to perform any or all steps, operations, or processes described.
  • the computer-readable recording medium includes all types of recording devices that store data that can be read by a computer. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical data storage devices. Additionally, computer-readable recording media may be distributed across computer systems connected to a network, and computer-readable codes may be stored and executed in a distributed manner. Additionally, functional programs, codes, and code segments for implementing this embodiment can be easily understood by those skilled in the art to which this embodiment belongs.
  • the ESG service provision system of this application is an invention in the ESG technology field, and can provide the effect of efficiently classifying, storing and managing data in ESG documents used for ESG evaluation, thereby providing ESG evaluation standards for corporate valuation. Based on the emerging industry trends, high industrial applicability is expected.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Educational Administration (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

실시예들은 정형화 처리 대상의 ESG 문서를 파싱 처리하는 단계 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함; 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계; 상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계; 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계; 및 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계를 포함한 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템에 관한 것이다.

Description

ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템
본 출원의 실시 예들은 ESG 보조 툴을 이용하여 통일되지 않은 ESG 문서 내 다양한 비정형 포맷의 ESG 데이터를 정형화된 포맷의 ESG 데이터로 정리함으로써 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템에 관한 것이다.
최근 기업들이 리스크 관리에 보다 많은 신경을 기울이면서, 기업들을 다방면으로 평가하고 이와 같은 평가 결과를 투자, 합병, 생산 라인에 대한 리스크 관리 등에 응용하고 있다.
일반적으로 기업들은 정량적으로 획득할 수 있는 재무적인 데이터들을 토대로 기업들을 평가하는 것이 일반적이었으나, 최근 들어서 비재무적인 데이터를 토대로 기업을 평가하고 리스크를 분석하는 방법론이 부각되고 있다. 기업들이 공개하는 재무적 데이터에는 해당 기업에게 불리한 내용이 반영되지 않으며, 기업이 제공하는 재무 관련 보고서에 대한 신뢰성 또한 의문시되는 실정이다. 비재무 데이터를 통한 기업 분석이 필요한 이유를 살펴보면, 사람들의 인터넷을 통한 SNS 활동이 활발해지면서, 기업 또는 제품에 대한 특정한 소문이 퍼지거나 하는 사건 등에 의해 기업 평판이 흔들리는 경우도 있으며 기업 오너의 범죄나 건강 관련 소문들에 의해 해당 기업이 가지는 리스크가 높아지는 경우도 있으나 이와 같은 사건들은 재무적 데이터를 통해 분석하기 어려운 것이 현실이다. 따라서, 재무적인 데이터뿐 아니라 비재무적인 데이터를 통해 기업을 분석함으로써 보다 정밀한 기업 평가가 가능해질 수 있다.
이와 같은 흐름에서, 비재무 데이터들을 ESG(Environmnet, Social, Governance)의 세 주제로 나누어서 분석하는 방법론이 부각되고 있다.
최근에는 기후변화 위기 등으로 인해 기업의 사회적 책임이 더욱 강조되어 ESG 평가 방식이 더욱 주목을 받고 있으며, 이는 범 글로벌 차원의 ESG 규제로 확인된다.
이러한 급변하는 대외환경 변화에 따라 기업들은 다양한 이해관계자들의 공시 요구에 대응하여, ESG 평가 방식을 만족하기 위해 자신들의 ESG 경영활동에 대한 내용을 담은 데이터를 공시하고 있다. 이러한 데이터는 지속가능성 보고서(Sustainability report, SR)로 흔히 지칭되는, PDF 파일 형태의 문서로 발간되어 공시되고 있다.
이러한 기업들의 ESG 데이터 공개는 해가 갈수록 증가하고 있으며, 이를 통해 축적되는 기업들의 ESG 데이터가 많아지고 있다. 향후 기업의 ESG 경영이 갈수록 중요해질 것이기 때문에, 이렇게 축적된 ESG 데이터를 빅데이터 관점에서 활용하고자 하는 수요가 점차 증가하고 있다.
하지만 기업들이 공시 및 발간하는 지속가능성 보고서와 같은 ESG 문서는 대부분 PDF 파일 형태의 비정형 데이터이다. 이러한 ESG 문서 내 비정형 데이터를 빅데이터 관점에서 활용하기 위해는 데는 정형화된 포맷의 데이터베이스로 정리 및 저장할 필요가 있다.
상술한 문제를 해결하기 위해, 본 출원의 실시 예들은 기업들의 정형화되지 않은 ESG 데이터를 정형화하여 저장 관리 가능한, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템을 제공하고자 한다.
또한, 본 출원의 실시 예들은 비정형 ESG 데이터를 정형 데이터로 정확하게 변환하기 위한 인터페이스 화면을 제공 가능한, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템을 제공하고자 한다.
본 출원의 일 측면에 따른 ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법은 하나 이상의 컴퓨팅 장치에 의해 수행될 수도 있다. 상기 하나 이상의 컴퓨팅 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결된다.
상기 방법은, 정형화 처리 대상의 ESG 문서를 파싱 처리하는 단계 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함; 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계; 상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계; 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계; 및 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계를 포함할 수도 있다.
일 실시 예에서, 상기 스크리닝하는 단계는, 상기 ESG 관리 항목 데이터베이스에 저장된 각 ESG 관리 항목별 코드 값 및 데이터 세트 값 중 적어도 하나를 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단할 수도 있다.
일 실시 예에서, 상기 방법은, 스크리닝 결과에 이상이 없는지 여부를 판단하는 단계를 더 포함할 수도 있다. 상기 이상이 없는지 여부를 판단하는 단계는, 사용자의 확인 입력에 기초하거나 또는 ESG 문서 내에서 코드 값, 데이터 세트 값 중 적어도 하나에 매칭한 데이터에 대한 주변 데이터 중에 기초하여 스크리닝 결과의 이상 여부를 판단하는 것일 수도 있다.
일 실시 예에서, 상기 선별 상태를 지정하는 단계는, 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정하는 것일 수도 있다.
일 실시 예에서, 상기 ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계는, 제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계; 제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계; 및 선별된 ESG 관리 항목의 목록 및 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성하는 단계를 포함할 수도 있다.
일 실시 예에서, 상기 해당 ESG 관리 항목의 내용을 획득하는 단계는, 사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 '최종 필드 입력 값'의 내용을 획득하는 것일 수도 있다.
일 실시 예에서, 상기 하나 이상의 컴퓨팅 장치는 다른 ESG 문서의 비정형 ESG 데이터를 정형화하여 저장한 ESG 문서 데이터베이스와 더 연결될 수도 있다. 상기 ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계는, 기존 ESG 문서 내 데이터를 이용하겠다는 사용자 입력을 수신한 경우, 상기 다른 ESG 문서 내 데이터를 해당 항목에 대한 내용으로 획득하는 단계를 더 포함할 수도 있다.
일 실시 예에서, 상기 방법은, 이미 저장된 ESG 관리 항목을 관리하는 단계를 더 포함할 수도 있다. 상기 ESG 관리 항목의 관리는 수정, 삭제 또는 생성하는 것일 수도 있다. 상기 ESG 관리 항목을 관리하는 단계는, 이미 저장된 ESG 관리 항목이 저장되었는지 확인하는 단계; 저장된 경우, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하는 단계; 상기 수정, 삭제 또는 생성 요청을 수신할 경우, 저장된 ESG 관리 항목 세트를 항목 레벨 구조로 나타낸 보조 툴 인터페이스 화면을 표시하는 단계;를 포함할 수도 있다.
일 실시 예에서, 상기 ESG 관리 항목을 관리하는 단계는, 요청 대상 항목이 최하위 레벨 항목이 아닐 경우 대상 항목의 내용에 대한 입력 칸을 비활성화하는 단계; 상기 요청 대상 항목이 최하위 레벨 항목일 경우 대상 항목의 내용에 대한 입력 칸을 활성화하는 단계; 활성화된 입력 칸을 통해 수정 또는 생성할 대상 항목의 내용을 입력받는 단계; 및 입력된 항목의 내용을 ESG 관리 항목 데이터베이스에 저장하는 단계를 더 포함할 수도 있다.
일 실시 예에서, 상기 활성화된 입력 칸을 통해 대상 항목의 내용을 입력받는 단계는, 상기 대상 항목의 내용을 입력받기 위한 보조 툴 인터페이스 화면을 제공하는 단계를 포함할 수도 있다. 상기 보조 툴 인터페이스 화면은 활성화된 입력 칸을 포함한 제1 서브 영역 및 항목 구조 레벨을 포함한 제2 서브 영역을 포함하고, 제2 서브 영역에는 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시된다.
본 출원의 다른 일 측면에 따른 컴퓨터 판독가능한 기록매체는 상술한 실시 예들에 따른 ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법을 수행하기 위한 프로그램을 기록할 수도 있다.
본 출원의 또 다른 일 측면에 따른, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하기 위한 전자 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결될 수도 있다. 상기 전자 장치는, 비정형 ESG 데이터를 포함한 ESG 문서 내에서 상기 ESG 관리 항목 데이터베이스에 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응한 항목 및 해당 항목의 내용을 획득하여 상기 ESG 문서에 대한 정형화된 ESG 데이터를 생성하도록 구성된 정형 데이터 처리부; 및 ESG 문서의 비정형 데이터를 정형화된 데이터로 변경하기 위한 사용자 입력을 수신하는 보조 툴 인터페이스 화면을 출력부를 통해 제공하는 인터페이스 제공부를 포함할 수도 있다.
본 발명의 일 측면에 따른 ESG 서비스 제공 시스템은 고유한 보조 툴 인터페이스 화면을 제공하는 ESG 보조 툴을 이용하여 기존 수작업의 비효율을 줄이고, 완전 자동화가 어려운 제약조건의 문제점을 극복할 수 있다. 상기 보조 툴 인터페이스 화면은 ESG 문서 내 데이터의 분류, 저장 및 관리를 효율적으로 수행하는 효과를 제공한다.
그 결과, 상기 ESG 서비스 제공 시스템은 기업의 지속가능성 보고서로부터 ESG 데이터를 수집 변환하여 저장 관리하고 이에 기초한 기업의 ESG 경영현황을 파악할 수 있으며, 특히 비정형 ESG 데이터가 상기 보조 툴의 프로세스를 따라 파싱 및 정형화되어 데이터베이스로 구축됨으로써, 빅데이터 관점에서 분석 및 가공 처리에 따라 적절하게 ESG 데이터를 활용할 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명 또는 종래 기술의 실시 예의 기술적 해결책을 보다 명확하게 설명하기 위해, 실시 예에 대한 설명에서 필요한 도면이 아래에서 간단히 소개된다. 아래의 도면들은 본 명세서의 실시 예를 설명하기 목적일 뿐 한정의 목적이 아니라는 것으로 이해되어야 한다. 또한, 설명의 명료성을 위해 아래의 도면들에서 과장, 생략 등 다양한 변형이 적용된 일부 요소들이 도시될 수 있다.
도 1은, 본 출원의 일 측면에 따른, ESG 서비스 제공 시스템의 개략도이다.
도 2a 및 도 2b는, 본 출원의 다른 일 측면에 다른, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법의 흐름도이다.
도 3은, 본 출원의 일 실시 예에 따른, 항목의 최종 입력 필드 값의 입력 칸을 포함한 보조 툴 인터페이스 화면을 도시한다.
도 4는, 본 출원의 일 실시 예에 따른, ESG 관리 항목을 관리하는 과정의 흐름도이다.
도 5는, 본 출원의 일 실시 예에 따른, 항목 레벨 구조를 표시한 보조 툴 인터페이스 화면을 도시한다.
도 6은, 본 출원의 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템의 개략도이다.
도 7은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델을 생성하는 과정의 개략도이다.
도 8은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델에서 출력 텍스트를 예측하는 동작의 개략도이다.
도 9는, 본 출원의 다른 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법의 흐름도이다.
도 10은, 본 출원의 일 실시 예예 따른, 추천 텍스트의 말뭉치의 출력 결과를 도시한다.
이하에서, 도면을 참조하여 본 출원의 실시 예들에 대하여 상세히 살펴본다.
그러나, 이는 본 개시(disclosure)를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
본 명세서에서, "가진다," "가질 수 있다,""포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 단계, 부품, 요소 및/또는 성분 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재나 부가를 제외시키는 것이 아니다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
다양한 실시 예에서 사용된 "제 1", "제 2", "첫째" 또는 "둘째" 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 해당 구성요소들을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 수 있다. 예를 들면, 제1 구성요소와 제2 구성요소는, 순서 또는 중요도와 무관하게, 서로 다른 구성요소를 나타낼 수 있다.
본 명세서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to),"또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성(또는 설정)된"은 하드웨어적으로 "특별히 설계된(specifically designed to)"것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성(또는 설정)된 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.
도 1은, 본 출원의 일 측면에 따른, ESG 서비스 제공 시스템의 개략도이다.
실시예들에 따른 ESG 서비스 제공 시스템(1)은 전적으로 하드웨어이거나, 전적으로 소프트웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 시스템은 데이터 처리 능력이 구비된 하드웨어 및 이를 구동시키기 위한 운용 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부(unit)", "시스템" 및 "장치" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 하드웨어는 CPU(Central Processing Unit), GPU(Graphic Processing Unit) 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.
도 1을 참조하면, 상기 ESG 서비스 제공 시스템(1)이 제공하는 ESG 서비스는 ESG 문서 내 비정형 형식의 ESG 데이터를 정형 형식으로 변경하는 정형화 보조 툴 제공 서비스를 포함한다. 상기 ESG 서비스 제공 시스템(1)은 이 서비스를 제공하기 위해, 데이터베이스 서버(200)와 연결된 전자 장치(100)를 포함한다.
상기 데이터베이스 서버(200)는 통신부(210) 및 하나 이상의 저장소를 포함한다. 특정 실시 예들에서, 상기 데이터베이스 서버(200)는 ESG 문서 DB(220), ESG 관리 항목 DB(230) 및 파싱 텍스트 DB(240) 중 하나 이상의 저장소를 포함할 수도 있다.
통신부(210)는 전자 장치(100)와 같은 외부 장치들과 데이터를 유/무선의 전기 통신으로 송수신하도록 구성된다. 상기 데이터베이스 서버(200)는 통신부(210)를 통해 하나 이상의 저장소에 데이터를 저장하거나 저장된 데이터를 외부 장치로 제공할 수도 있다.
상기 통신부(210)는 송신기(transmitter), 수신기(receiver), 송수신기(transceiver), 통신부(communication unit), 통신 모뎀(communication model) 또는 통신 회로(communication circuit)로 지칭할 수 있다. 통신부(210)는 유선 접속 시스템 및 무선 접속 시스템들인 IEEE(institute of electrical and electronics engineers) 802.xx 시스템, IEEE Wi-Fi 시스템, 3GPP(3rd generation partnership project) 시스템, 3GPP LTE(long term evolution) 시스템, 3GPP 5G NR(new radio) 시스템, 3GPP2 시스템, 블루투스(Bluetooth) 등 다양한 무선 통신 규격 중 적어도 하나를 지원할 수 있다.
ESG 문서 DB(220)는 아래에서 서술할, 정형 데이터 처리부(140)에 의해 획득된, ESG 문서를 정형화 처리한 데이터를 저장한다. 일부 실시 예들에서, ESG 문서 DB(220)는 정형 데이터 처리부(140)에 의해 테이블 변환 처리된 각각의 ESG 문서별 항목 및 그 값을 저장할 수도 있다.
ESG 문서 DB(220)에 저장되는 테이블 변환 처리 결과 데이터는 아래에서 정형 데이터 처리부(140)를 참조해 보다 상세히 서술한다.
ESG 관리 항목 DB(230)는 비정형 ESG 데이터를 정형화 데이터로 변환하는데 요구되는 관리 항목을 저장한다.
일부 실시 예들에서, ESG 관리 항목 DB(230)는 하나 이상의 대분류에 대한 항목 세트를 저장할 수도 있다. 상기 대분류는 보고서의 작성 기준, ESG 주제 풀로 이루어진다. 일부 실시 예들에서, 상기 대분류는 지속가능성 보고서의 공시 기준인 GRI(Global Reporting Intiative) 또는 미국 지속가능회계기준위원회, SASB(Sustainability Accounting Standards Board), TCFD(Task Force on Climate-Related Financial Disclosures), UN SDGs(UN Sustainable Development Goals), 산업통상부의 ESG 가이드라인(또는 K-ESG로 지칭됨)가 제공하는 산업별로 구분한 중요성 주제, 기준을 포함할 수도 있다.
예를 들어, 상기 ESG 관리 항목 DB(230)는 GRI, SASB, TCFD, UN-SDGs, K-ESG, 및/또는 기타 기준으로 이루어진 대분류를 저장할 수도 있다.
각 대분류에 대한 항목 세트는 해당 대분류의 기준, 주제에서 작성을 요구하는 ESG 키워드, ESG 주제 항목을 포함할 수도 있다. 각 대분류에 대한 항목 세트는 각각의 대분류가 공통으로 포함하는 주제 항목(공통 주제 항목)을 포함할 수도 있다. 또한, 각 대분류에 대한 항목 세트는 개별 대분류에 고유한 복수의 다른 항목을 포함할 수도 있다. 예를 들어, GRI 대분류의 항목 세트는 GRI200, GRI300, GRI400의 문서 항목을 포함할 수도 있다.
상기 ESG 관리 항목DB(230)는 항목 세트 내 각각의 항목을 해당 코드 값 및/또는 데이터 세트 값으로 저장할 수도 있다.
일부 실시 예들에서, 상기 대분류에 대한 항목 세트는 평가 대상 기업의 산업에 기초하여 더 분류될 수도 있다. 동일 대분류가 적용되어도 평가 대상 기업의 산업 군에 따라 항목 세트가 상이할 수도 있다. 예를 들어, SASB는 헬스케어 산업에 대해서는 '정보 보안'을 중요 주제로 선정한 반면 전력 산업에 대해서는 중요 주제로 선정하지 않았다. 따라서, SASB가 헬스케어 산업에 속하는 평가 대상 기업에 적용될 경우 '정보 보안' 키워드, 관련 항목은 대응한 비정형 ESG 데이터를 추출하는데 이용되고, SASB가 전력 산업에 속하는 평가 대상 기업에 적용될 경우 '정보 보안' 키워드, 관련 항목은 대응한 비정형 ESG 데이터를 추출하는데 이용되지 않을 수도 있다.
일부 실시 예들에서, 상기 ESG 문서 내 복수의 항목은 계층 구조로 지정될 수도 있다. 각각의 대분류의 항목 세트 내 각각의 항목은 최상위 레벨부터 최하위 레벨별로 추가 분류될 수도 있다. 예를 들어, GRI 대분류의 항목 세트에서 최상위 레벨(레벨 1)은 공통 주제, GRI200, GRI300, GRI400을 포함할 수도 있다. 공통 주제의 레벨 1에서 다음 레벨(레벨 2)은 조직프로필, 전략, 거버넌스를 포함할 수도 있다. 조직프로필의 레벨 2에서 다음 레벨(레벨 3)은 조직의 규모, 임직원을 포함할 수도 있다. 조직의 규모의 레벨 3에서 다음 레벨(레벨 4)은 국내 임직원 수, 해외 임직원 수, 사업장 수, 순매출액을 포함할 수도 있다.
상기 ESG 문서 항목 및 이를 저장하는 ESG 관리 항목 DB(230)에 대해서는 아래의 도 2a에서 보다 상세히 서술한다.
파싱 텍스트 DB(240)는 파싱된 ESG 문서의 텍스트를 저장한다. 일부 실시 예들에서, 상기 파싱된 ESG 문서의 텍스트는 아래에서 서술할, 정형 데이터 처리부(140)로부터 획득될 수도 있다.
상기 파싱된 ESG 문서의 텍스트에 대해서는 정형 데이터 처리부(140)를 참조해 아래에서 보다 상세히 서술한다.
상기 전자 장치(100)는 예를 들어, 랩탑 컴퓨터, 기타 컴퓨팅 장치, 태블릿, 셀룰러 폰, 스마트 폰, 스마트 워치, 스마트 글래스, 헤드 마운트 디스플레이(HMD), 기타 모바일 장치, 기타 웨어러블 장치일 수도 있다.
상기 전자 장치(100)는 비정형 ESG 데이터를 정형화하는 보조 툴을 포함한다. 상기 전자 장치(100)는 획득한 ESG 문서에 포함된 비정형 ESG 데이터를 추출하고, 상기 보조 툴을 이용하여 추출된 비정형 ESG 데이터를 정형화하도록 구성된다. 또한, 상기 전자 장치(100)는 정형화된 ESG 데이터를 데이터베이스 서버(200)로 공급하여 데이터베이스를 구축하는 것을 지원하도록 구성된다.
상기 전자 장치(100)는 서비스 서버(200)와 통신하는 클라이언트 단말 장치로서, 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다.
특정 실시 예들에서 상기 전자 장치(100)는 도 1에 도시된 것처럼, 통신부(110), 입력부(120), 인터페이스 제공부(130), 정형 데이터 처리부(140) 및 출력부(150)를 포함할 수도 있다.
상기 통신부(110)는 데이터베이스 서버(200)와 같은 외부 장치들과 데이터를 유/무선의 전기 통신으로 송수신하도록 구성된다. 상기 전자 장치(100)는 통신부(110)를 통해 입력부(120), 인터페이스 제공부(130), 정형 데이터 처리부(140) 및 출력부(150)에 데이터를 제공하거나 처리 결과를 외부 장치로 제공할 수도 있다.
상기 통신부(110)는 통신부(210)와 유사하므로, 자세한 설명은 생략한다. 상기 통신부(110)에 대한 설명은 상기 통신부(210)와의 차이점을 위주로 서술한다.
통신부(110)는 비정형 ESG 데이터를 포함한 ESG 문서를 수신하도록 구성된다. 사용자는 통신부(110)를 통해 복수의 ESG 문서를 웹 페이지에서 수집하고 상기 입력부(120)에 업로드할 수도 있다.
상기 ESG 문서는 정부 웹 페이지, 기업 웹 페이지, 기타 웹 사이트 등에서 이미 공개되어 있는 국내외 평가 대상 기업의 ESG 지속가능 보고서, 또는 개별 기업의 ESG 담당자가 작성하여 배포한 기타 ESG 문서를 포함한다. 상기 평가 대상 기업은 사업체로서의 기업만을 지칭하지 않고 기관, 비영리 단체 등의 다양한 형태의 단체를 포괄하여 지칭할 수 있다.
상기 ESG 문서는 해당 기업의 홈페이지, 정부 포털 등에서 공개된 DB로 수집할 수도 있다.
일부 실시 예들에서, 상기 ESG 문서는 정부 문서 DB(310), 고객 문서 DB(320), 및 웹 사이트 문서 DB(330) 중 하나 이상의 외부 DB로부터 획득될 수도 있다.
상기 정부 문서 DB(310)는 정부 데이터 포털에 액세스하여 검색된 적어도 하나의 기업에 대한 ESG 문서를 수집할 수도 있다.
상기 고객 문서 DB(320)는 상기 시스템(1)과 관련된 고객, 예를 들어, 상기 시스템(1)에서 제공하는 서비스에 가입한 고객 기업의 데이터 포털에 액세스하여 해당 고객에 대한 ESG 문서를 수집할 수도 있다. 단일 고객에 대해 다수의 ESG 문서가 수집될 수도 있다.
상기 웹 사이트 문서 DB(330)는 주요 웹 사이트로 미리 지정된 하나 이상의 웹 사이트 각각에 액세스하고 액세스한 웹 사이트에서 공개된 ESG 문서를 검색하여 수집할 수도 있다.
상기 ESG 데이터는 문서를 생성한 평가 대상 기업의 ESG 현황을 서술하는 정보를 나타낸다. 상기 ESG 문서는 Portable Document Format (PDF) 문서일 수도 있으나, 이에 제한되진 않는다.
상기 비정형 ESG 데이터는 비정형 포맷으로 ESG 정보를 나타낸 데이터이다. 비정형 데이터는 데이터베이스 서버(200)에서 인식 가능한 구조를 가지지 않는 데이터이다. 상기 비정형 ESG 데이터는 구조화되지 않은 텍스트, 이미지를 포함할 수도 있다.
입력부(120), 인터페이스 제공부(130), 정형 데이터 처리부(140)는 적어도 하나의 프로세서로 구현될 수도 있다.
입력부(120)는 통신부(110)로부터 입력된 비정형 ESG 데이터를 포함한 ESG 문서를 정형 데이터 처리부(140)로 공급하도록 구성된다.
인터페이스 제공부(130)는 ESG 문서의 비정형 데이터를 정형 데이터로 변경하기 위한 사용자의 입력을 수신하도록 구성된다. 상기 인터페이스 제공부(130)는 사용자가 ESG 항목, 코드 값, 데이터 세트 값, 답변 내용 및/또는 최종 입력 필드 값의 내용을 수정하도록 구성된다.
일부 실시 예들에서, 상기 인터페이스 제공부(130)는 데이터베이스 서버(200)의 ESG 관리 항목 DB(230) 내 코드 값, 데이터 세트 값을 기준으로 문서 내에서 사용자 입력을 적용할 항목의 위치를 검색하고, 해당 위치 또는 이를 포함한 페이지로 화면을 이동하도록 출력장치를 제어하도록 구성될 수도 있다.
일부 실시 예들에서, 상기 인터페이스 제공부(130)는 선별 처리 결과에 이상이 있을 경우 사용자가 직접 항목을 수정하도록 보조 툴 인터페이스 화면을 제공할 수도 있다. 상기 보조 툴 인터페이스 화면은 항목 등에 대한 수정 입력을 수신하도록 구성된다.
인터페이스 제공부(130)의 동작에 대해서는 아래의 도 2를 참조해 보다 상세히 서술한다.
상기 정형 데이터 처리부(140)는 ESG 문서 내에 데이터베이스 서버(200)의 ESG 관리 항목 DB(230)에 미리 저장된 복수의 ESG 관리 항목에 대응한 항목 및 상기 항목의 내용을 획득하여 상기 ESG 문서에 대한 정형화된 ESG 데이터를 생성하도록 구성된다.
상기 정형 데이터 처리부(140)는 상기 ESG 문서(예를 들어, 지속 가능성 보고서의 PDF 데이터)를 파싱 처리하도록 구성된다.
또한, 상기 정형 데이터 처리부(140)는 ESG 관리 항목 DB(230)에 미리 저장된 복수의 ESG 관리 항목을 기준으로 문서 내 대응한 항목을 검색하고, 보조 툴을 이용하여 해당 항목의 내용을 획득하도록 구성된다.
이러한 정형 데이터 처리부(140)의 동작에 대해서는 아래의 도 2를 참조해 보다 상세히 서술한다.
출력부(150)는 디스플레이 또는 스피커 중에서 하나 이상을 포함할 수 있다. 출력부(150)는 프로세서, 또는 인터페이스 제공부(130), 정형 데이터 처리부(140)의 제어에 따라서 컨텐츠를 출력할 수 있다. 디스플레이는 전자 장치(110)에서 처리되는 정보를 화상으로 표시할 수 있다. 예컨대, 디스플레이는 전자 장치(100)에서 구동되는 응용 프로그램의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다. 상기 디스플레이는 예를 들어, LCD, OLED, 플렉서블 디스플레이, 기타 디스플레이 구성요소 등을 포함할 수도 있다.
많은 실시 예들에서, 디스플레이는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성된 터치 패널로 구현되어, 입력 인터페이스 화면과 출력 인터페이스 화면을 동시에 제공할 수도 있다. 터치 입력은 (예컨대, 사용자의 신체, 또는 도구 등을 포함한) 포인팅 객체에 의해 입력된다.
출력부(150)는 인터페이스 제공부(130)에서 제공하는 보조 툴 인터페이스 화면을 표시하도록 구성된다. 상기 출력부(150)는 항목 등에 대한 정보를 수정하는 입력칸을 표시할 수도 있다.
또한, 상기 출력부(150)는 ESG 이미지를 출력할 수도 있다. 또한, 상기 출력부(150)는 파싱 텍스트를 출력할 수도 있다. 일부 실시 예들에서, 상기 출력부(150)는 출력부(150)의 화면 일 부분(예컨대, 일 측면)에 ESG 문서의 이미지를 배치해 출력하고, 다른 일부분 (예컨대, 상단)에 파싱 텍스트를 배치해 출력할 수도 있다.
상기 전자 장치(100), 서비스 서버(200) 또는 시스템(1)이 다른 구성요소를 포함할 수도 있다는 것이 통상의 기술자에게 명백할 것이다. 예를 들어, 상기 서비스 서버(200)는 데이터 엔트리를 위한 입력 장치, 및 인쇄 또는 다른 데이터 표시를 위한 출력 장치를 포함하는, 본 명세서에 서술된 동작에 필요한 다른 하드웨어 요소를 포함할 수도 있다. 또한, 상기 시스템(1)은 서비스 서버(200)와 외부 장치(예를 들어, 사용자 단말, 또는 외부 데이터베이스 등) 사이를 연결하는 네트워크, 네트워크 인터페이스 및 프로토콜 등을 더 포함할 수 있다.
도 2a 및 도 2b는, 본 출원의 다른 일 측면에 다른, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법의 흐름도이다.
도 2a 및 도 2b의 방법은 도 1의 ESG 서비스 제공 시스템과 같은 하나 이상의 컴퓨팅 장치에 의해 수행될 수도 있다.
도 2a를 참조하면, 상기 방법은, (예컨대, 통신부(110)에 의해) ESG 문서를 수신하는 단계(S100);를 포함한다.
단계(S100)에서 복수의 ESG 문서가 수집될 수도 있다.
또한, 상기 방법은, (예컨대, 정형 데이터 처리부(140)에 의해) 단계(S100)에서 수신한 ESG 문서를 파싱 처리하고, 파싱된 ESG 문서에 포함되어 있는, 미리 저장된 관리 항목에 해당한 항목의 데이터를 획득하여 정형화된 ESG 데이터를 생성하는 단계(S200)를 포함할 수도 있다.
상기 단계(S200)는, 단계(S100)에서 수신한 ESG 문서를 상기 정형 데이터 처리부(140)로 업로드 하는 단계(S210); 및 상기 ESG 문서를 파싱 처리하는 단계(S220)를 포함한다.
상기 정형 데이터 처리부(140)는 상기 ESG 문서(예를 들어, 지속 가능성 보고서의 PDF 데이터)를 파싱 처리도록 구성된다. 일부 실시 예들에서, 상기 정형 데이터 처리부(140)는 파싱 툴(parsing tool)을 포함할 수도 있다. 상기 정형 데이터 처리부(140)는 파싱 툴을 이용하여 비정형 데이터를 파싱 처리할 수도 있다. 상기 파싱 툴은 PDFMiner일 수도 있으나, 이에 제한되진 않는다.
예를 들어, 상기 정형 데이터 처리부(140)는 상기 파싱 툴을 PDF 포맷의 ESG 문서에 적용하여 파싱된 PDF 데이터를 생성할 수도 있다. 상기 파싱 툴은 PDF 포맷의 ESG 문서로부터 하나 이상의 텍스트 줄을 포함한 텍스트 블록, 이미지, 및/또는 기하학 형상(geometric shapes)을 추출할 수도 있다.
일부 실시 예들에서, 추출된 텍스트 블록은 텍스트, 바운딩 박스, 텍스트 라인의 속성 중 적어도 하나의 속성을 가질 수도 있다. 예를 들어, 파싱된 PDF 데이터는 추출된 텍스트 블록을 포함하며, 각 텍스트 블록은 하나 이상의 텍스트 라인을 포함할 수도 있다.
일부 실시 예들에서, 각각의 텍스트 라인은 해당 라인의 텍스트, 및 라인을 둘러싼 바운딩 박스의 속성 중 적어도 하나의 속성을 가질 수도 있다. 상기 텍스트 블록 또는 텍스트 라인의 바운딩 박스는 각각의 텍스트 블록 또는 텍스트 라인이 일반적으로 차지하는 페이지의 영역을 정의하는, 텍스트 블록 주위의 박스이다. 상기 바운딩 박스는 직사각형 형상의 박스를 지칭할 수도 있다.
일부 실시 예들에서, 상기 비정형 ESG 데이터가 이미지 데이터를 포함할 경우, 상기 정형 데이터 처리부(140)는 파싱 처리 이전에 ESG 문서의 이미지 데이터를 OCR(Optical Character Recognition) 처리하여 비정형 텍스트를 인식하도록 더 구성될 수도 있다. 일부 실시 예들에서, 상기 파싱 툴은 OCR 처리 가능하도록 구성될 수도 있다. 그러면, 파싱 툴을 이용하여 OCR 처리 및 파싱 처리를 동시에 수행함으로써, 텍스트 박스 내 텍스트를 인식하고 텍스트가 인식된 PDF 페이지 내 구조(예컨대, 텍스트 속성)를 분석할 수도 있다.
파싱 툴에 의해 추출된 이미지는 각각의 바운딩 박스와 연관될 수도 있다.
파싱 툴에 의해 추출되는 기하학적 형상은, 예를 들어 테이블, 벡터 그림에 나타난 선, 곡선, 직사각형, 기타 도형 객체를 포함할 수도 있다. 파싱 툴은 PDF 페이지의 이미지, 테이블 주변의 바운딩 박스를 찾아 추출할 수도 있다.
이와 같이 정형 데이터 처리부(140)의 파싱 결과는 텍스트 블록, 텍스트 라인, 이미지, 및/또는 기하학적 형상이 차지하는 ESG PDF 문서의 페이지의 영역, 부분을 정의하는 다양한 바운딩 박스를 포함할 수도 있다.
일부 실시 예들에서, 상기 정형 데이터 처리부(140)는 파싱 결과에 포함된 파싱된 ESG 문서의 텍스트를 데이터베이스 서버(200)로 전송하여 파싱 텍스트 DB(240)에 저장할 수도 있다.
또한, 상기 방법은, 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 단계(S220)에서 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계(S230)를 포함한다.
일부 실시 예들에서, 상기 단계(S230)는, ESG 관리 항목 DB(230)에 저장된 각 ESG 관리 항목별 코드 값 및/또는 데이터 세트 값을 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하는 것일 수도 있다.
상기 일부 실시 예들에서, 정형 데이터 처리부(140)는 ESG 관리 항목 DB(230)에 저장된 코드 값 및/또는 데이터 세트 값을 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하는, 스크리닝 동작을 수행하도록 구성된다.
상기 ESG 관리 항목 DB(230)는 복수의 ESG 관리 항목을 저장한다. 각각의 ESG 관리 항목은 적어도 하나의 코드 값 및/또는 적어도 하나의 데이터 세트 값을 포함할 수도 있다. 그러면, 상기 ESG 관리 항목 DB(230)에 저장된 ESG 문서 항목을 구성하는 코드 값, 데이터 세트 값은 파싱된 ESG 문서가 저장된 해당 항목을 포함하고 있는 지를 판단하기 위한 기준으로 이용될 수도 있다.
상기 정형 데이터 처리부(140)는 코드 값, 데이터 세트 값이 파싱된 ESG 문서에서 검색된 경우, 파싱된 ESG 문서가 ESG 관리 항목 DB(230)에 저장된 ESG 문서 항목 중 적어도 하나를 갖고 있는 것으로 판단한다. 검색된 코드 값, 데이터 세트 값에 대응한 항목이 상기 파싱된 ESG 문서에 포함된 것으로 판단된다.
그러면, 단계(S230)에서 정형 데이터 처리부(140)는 파싱된 ESG 문서가 포함하는 것으로 추정되는, ESG 관리 항목에 대응한 항목의 목록을 획득할 수도 있다.
일부 실시 예들에서, 상기 방법은, 스크리닝 결과에 이상이 없는지 여부를 판단하는 단계(S240)를 더 포함할 수도 있다. 상기 단계(S240)는 아래에서 서술할 단계(S250) 이전에 수행될 수도 있다.
여기서 이상 스크리닝 결과는 ESG 문서 내 ESG 관리 항목이 아닌데도 ESG 관리 항목으로 잘못 선별된 것을 나타낸다.
ESG 문서 내에 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭되는 코드 값 및/또는 데이터 세트 값이 검색되어도, 검색된 값이 실제로는 문서 내 ESG 관리 항목과 관련이 없는 데이터일 수도 있다. 예를 들어, GRI 기준에 따른 ESG 관리 항목은 102-1과 같이 '3자리 숫자', '붙임표(hyphen, -)', '1 또는 2자리 숫자'가 순차적으로 배열된 구조를 가진다. ESG 문서 내에 GRI 기준에 따른 ESG 관리 항목이 아닌, 별도의 동일 구조의 데이터가 우연히 포함되어 있을 수가 있다. 이 경우, ESG 관리 항목과 관련이 없는 데이터가 코드 값 및/또는 데이터 세트 값에 매칭되는 결과로 검색될 수도 있고, 그러면 정형 데이터 처리부(140)는 ESG 문서가 ESG 관리 항목을 포함한 스크리닝 결과가 산출될 수도 있다.
일부 실시 예들에서, 상기 단계(S240)는, 사용자의 확인 입력 및/또는 ESG 문서 내에서 코드 값 및/또는 데이터 세트 값에 매칭한 데이터에 대한 주변 데이터에 기초하여 스크리닝 결과의 이상 여부를 판단할 수도 있다.
정형 데이터 처리부(140)는 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭한 데이터의 위치를 제공하고, 제공된 위치에 대해 확인 입력이 수신되면 이상이 없는 것으로 판단할 수도 있다(S240). 정형 데이터 처리부(140)가 매칭한 데이터의 위치를 인터페이스 제공부(130)로 공급하면, 인터페이스 제공부(130)는 매칭한 데이터의 위치를 포함한 보조 툴 인터페이스 화면을 표시하여, 각 위치의 데이터가 ESG 관리 항목인지를 확인하는 사용자 입력을 유도할 수도 있다(S240).
또한, 정형 데이터 처리부(140)는 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭한 데이터의 위치를 기준으로 일정 범위 이내에 배치된, 주변 데이터에 기초하여 매칭한 데이터가 실제로 ESG 관리 항목에 대응하는 지를 판단할 수도 있다(S240).
또한, 상기 단계(S240)는, 이상이 있을 경우 ESG 문서에 포함된 것으로 선별된 결과 중 적어도 일부를 수정하는 단계를 포함할 수도 있다.
상기 단계(S240)에서 정형 데이터 처리부(140)에서 스크리닝 결과에 이상이 있다고 판단된 경우 인터페이스 제공부(130)는 이상 스크리닝 결과를 갖는 데이터를 수정하기 위한 보조 툴 인터페이스 화면을 제공할 수도 있다. 상기 보조 툴 인터페이스 화면은 ESG 관리 항목으로 잘못 선별된 데이터를 선별 결과에서 제거하는 입력을 수신하도록 구성된다. 정형 데이터 처리부(140)는 이 제거 입력을 수신하여 선별 결과를 수정하고, 정형 데이터로 변환할 ESG 관리 항목 목록을 최종 선별할 수도 있다.
또한, 상기 방법은, ESG 관리 항목 DB(230)에 저장하고 있는 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계(S250)를 포함한다. 일부 실시 예들에서, 상기 단계(S250)는 단계(S240)에서 스크리닝 결과에 이상이 없는 경우에 수행될 수도 있다.
상기 단계(S250)에서 상기 데이터 처리부(140)는, 파싱된 ESG 문서의 선별 상태를 지정하기 위해, 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정할 수도 있다.
일부 실시 예들에서, 상기 ESG 문서의 선별 상태를 지정하는 단계(S250)는, 선별 여부를 가리키는 체크 박스를 온/오프 처리하는 것으로 구현될 수도 있다. 상기 일부 실시 예들에서, 상기 제1 선별 상태 또는 제2 선별 상태의 지정은 선별 여부를 가리키는 체크 박스를 온/오프 처리하는 것으로 구현될 수도 있다. 예를 들어, 상기 정형 데이터 처리부(140)는 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 체크 박스를 온 처리하여 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 체크 박스를 오프 처리하여 상기 ESG 문서를 제2 선별 상태로 지정할 수도 있다.
또한, 상기 방법은, 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계(S260)를 포함한다.
일부 실시 예들에서, 상기 정형 데이터 처리부(140)는 인터페이스 제공부(130)로부터 선별 처리 결과에 이상이 없음을 나타낸 신호를 수신할 수도 있다. 상기 정형 데이터 처리부(140)는 해당 항목의 '최종 입력 필드 값'의 입력 칸의 활성화/비활성화는 상기 신호의 수신에 반응하여 수행될 수도 있다(S260).
상기 정형 데이터 처리부(140)는 선별 처리가 이상 없음을 나타낸 신호를 수신하면, 체크박스를 온 처리하여 제1 선별 상태로 지정한 경우 해당 항목의 '최종 입력 필드 값'의 입력 칸을 활성화하거나, 또는 체크박스를 오프 처리하여 제2 선별 상태로 지정한 경우 해당 항목의 '최종 입력 필드 값'의 입력 칸을 비활성화할 수도 있다.
상기 단계(S260)에서 상기 정형 데이터 처리부(140)는 문서에 포함된 것으로 판단된 해당 항목의 '최종 입력 필드 값'의 입력 칸을 활성화 또는 비활성화할 수도 있다. 상기 입력 칸의 활성화 또는 비활성화 결과는 보조 툴 인터페이스 화면을 통해 제공될 수도 있다.
도 3은, 본 출원의 일 실시 예에 따른, 항목의 최종 입력 필드 값의 입력 칸을 포함한 보조 툴 인터페이스 화면을 도시한다.
도 3을 참조하면, 상기 보조 툴 인터페이스 화면은 문서에 포함된 것으로 판단된 해당 항목을 포함할 수도 있다..
다시 도 2를 참조하면, 상기 방법은, 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하는 단계(S270)를 포함한다.
도 2b는, 도 2a의 단계(S270)의 세부 흐름도이다.
정형 데이터 처리부(140)는 제1 선별 상태로 지정된 ESG 관리 항목의 입력 값을 획득하도록 구성된다.
정형 데이터 처리부(140)는 제1 선별 상태로 지정된 ESG 관리 항목에 대응한 항목에 대해서, 그 내용을 획득하기 위해 파싱된 ESG 문서 또는 등록된 다른 ESG 문서 내 데이터를 추출할 수도 있다.
정형 데이터 처리부(140)는, ESG 문서 DB(220) 내 등록된 항목 중 상기 문서에 포함된 항목에 대응한 ESG 관리 항목에 매칭하는 등록 항목의 등록 값을 상기 파싱된 ESG 문서에 포함된 항목 내용의 입력 값으로 복사할 수도 있다. 그러면, 정형 데이터 처리부(140)는 상기 특정 항목에 대해서는, 파싱된 ESG 문서에서 인식된 데이터(예컨대, 기록 값) 대신 데이터베이스 서버(200)에 저장된 다른 ESG 문서 내 상기 특정 항목의 등록 데이터를 그대로 활용할 수 있다.
또는, 정형 데이터 처리부(140)는 인터페이스 제공부(130)가 제공한 보조 툴 인터페이스 화면을 통해 상기 ESG 문서의 항목에 대한 입력 값을 입력받을 수도 있다.
일부 실시 예들에서, 상기 단계(S270)는, 제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계(S271); 및 제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계(S273)를 포함한다.
또한, 일부 실시 예들에서, 상기 단계(S273)는, 사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 '최종 필드 입력 값'의 내용을 획득하는 것일 수도 있다.
정형 데이터 처리부(140)는 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭한 데이터의 위치를 제공하고, 제공된 위치의 ESG 관리 항목에 대한 사용자의 내용 입력이 수신되면 해당 입력 값을 '최종 필드 입력 값'의 내용으로 획득할 수도 있다. 정형 데이터 처리부(140)가 매칭한 데이터의 위치를 인터페이스 제공부(130)로 공급하면, 인터페이스 제공부(130)는 매칭한 데이터의 위치를 포함한 보조 툴 인터페이스 화면을 표시하여, 해당 항목의 내용에 대한 사용자 입력을 유도할 수도 있다(S270).
또한, 상기 정형 데이터 처리부(140)는 제공된 위치를 기준으로 일정 범위 이내에 배치된, 주변 데이터에 기초하여 매칭한 데이터가 실제로 ESG 관리 항목에 대응하는 지를 판단할 수도 있다(S270). 상기 범위는 해당 위치 주변의 텍스트 배치 구조(예컨대, 텍스트 블록, 텍스트 라인 등), 텍스트의 수에 기초하여 설정된다. 예를 들어, 상기 범위는 제공된 위치 하단의 텍스트 블록일 수도 있다. 그러면, 해당 항목의 내용은 상기 하단의 텍스트 블록 내 텍스트의 일부 또는 전부로 획득될 수도 있다.
일부 실시 예들에서, 상기 단계(S270)는, 기존 ESG 문서 내 데이터를 이용하겠다는 사용자 입력을 수신한 경우, 상기 기존 ESG 문서 내 데이터를 해당 항목에 대한 내용으로 획득하는 단계(S275);를 더 포함할 수도 있다. 상기 단계(S271, S273)는 기존 ESG 문서 내 데이터를 이용하지 않겠다는 사용자 입력을 수신한 이후에 수행될 수도 있다.
상기 기존 ESG 문서는 평가 대상 기업의 이전 ESG 문서를 포함한다.
ESG 문서는 단일 평가 대상 기업이 시계열 순서에 따라 생성하는 것이 일반적이다. 평가 대상 기업의 변화는 상대적으로 느리므로, 근시일 단위(예컨대, 분기, 반기, 년도) 차이의 ESG 문서는 부분적으로 동일한 항목에 대해 동일한 내용을 가질 수도 있다. 이 경우, 상기 정형 데이터 처리부(140)는 기존 ESG 문서의 데이터를 이번에 새롭게 생성할 ESG 문서에 그대로 이용할 수도 있다.
또한, 상기 방법은, 단계(S250)에서 선별된 ESG 관리 항목의 목록 및 단계(S270)에서 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성하는 단계(S280)를 포함한다.
상기 단계(S280)에서 생성된 정형 데이터는 비정형 ESG 데이터가 ESG 서비스 제공 시스템(1)에서 인식 가능한 데이터 구조를 갖도록 변환된 것이다.
단계(S270)에서 획득된 내용은 단계(S250)에서 선별된 각각의 ESG 관리 항목에 매핑된다. 그러면, 정형 데이터 처리부(140)에서 항목/내용 값으로 이루어진 테이블로 변환 처리됨으로써 정형화된 데이터로 변환될 수도 있다.
정형 데이터 처리부(140)는 테이블 변환 처리 결과를 정형화된 데이터로 데이터베이스 서버(200)로 전송하여 ESG 관리 항목 DB(230)에 저장할 수도 있다.
다시 도 1을 참조하면, 상기 ESG 서비스 제공 시스템(1)은 이미 저장된 ESG 관리 항목을 수정, 삭제 또는 생성하는, 일련의 관리 동작을 수행하도록 더 구성될 수도 있다.
도 4는, 본 출원의 일 실시 예에 따른, ESG 관리 항목을 관리하는 과정의 흐름도이다.
도 4를 참조하면, 상기 과정은, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하기 위해 보조 툴 인터페이스 화면을 표시하는 단계(S291)를 포함한다.
일부 실시 예들에서, 상기 보조 툴 인터페이스 화면의 표시는 ESG 관리 항목에 대한 관리 기능을 개시하는 동작에 따라 수행될 수도 있다.
상기 보조 툴 인터페이스 화면은 수정 또는 삭제 대상 항목의 선택을 유도하거나 및/또는 기존의 항목과의 관계 구조에 기초하여 신규 대상 항목을 생성하는 것을 유도하기 위해 구성된다.
도 5는, 본 출원의 일 실시 예에 따른, 항목 레벨 구조를 표시한 보조 툴 인터페이스 화면을 도시한다.
도 5를 참조하면, 상기 보조 툴 인터페이스 화면은 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시할 수도 있다.
다시 도 4를 참조하면, 상기 과정은, 이미 저장된 ESG 관리 항목이 저장되었는지 확인하는 단계(S292); ESG 관리 항목이 저장되어 있는 경우, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하는 단계(S293); 및 ESG 관리 항목이 저장되어 있지 않는 경우, ESG 관리 항목에 대한 생성 요청을 수신하는 단계(S294)를 포함한다.
상기 전자 장치(100)는 도 5의 보조 툴 인터페이스 화면을 통해 수정 또는 삭제 대상 항목을 선택받고, 대상 항목의 내용을 수정하거나 대상 항목을 ESG 관리 항목 DB(230)에서 삭제할 수도 있다. 또는, 항목 레벨 구조에 기초하여 신규 대상 항목이 추가될 수도 있다.
단계(S293)에서 전자 장치(100)는 도 5의 보조 툴 인터페이스 화면 상에 표시된 '항목 레벨 구조'에서 수정할 항목을 선택하여 항목 수정 요청을 수신할 수도 있다.
단계(S293)에서 생성 요청은 기존의 ESG 관리 항목 세트에 새로운 관리 항목을 추가하는 것이다. 상기 전자 장치(100)는 도 5의 보조 툴 인터페이스 화면 상에 표시된 '항목 레벨 구조'에 따라 항목 추가 요청을 수신할 수도 있다.
상기 항목 수정 요청, 항목 추가 요청 등은 보조 툴 인터페이스 화면을 통해 수신하며, 그러면, 상기 전자 장치(100)는 선택된 항목의 항목 레벨을 획득한다.
단계(S294)에서 생서 요청은 ESG 관리 항목을 신설하는 것이다. 이는 단계(S293)의 항목 추가와 유사하므로, 자세한 설명은 생략한다.
또한, 일부 실시 예들에서, 도 5의 상기 과정은, 단계(S293)의 요청 대상 항목이 최하위 레벨 항목인지 여부에 따라 입력칸을 활성화 또는 비활성화하는 단계를 더 포함할 수도 있다.
상기 활성화 또는 비활성화하는 단계는, 단계(S293, S294)의 요청 대상 항목이 최하위 레벨 항목이 아닐 경우 대상 항목의 내용에 대한 입력 칸을 비활성화하는 단계(S295); 및 단계(S293, S294)의 요청 대상 항목이 최하위 레벨 항목일 경우 대상 항목의 내용에 대한 입력 칸을 활성화하는 단계(S296)를 포함한다.
상기 단계(S296)에서 상기 입력 칸을 통해 항목에 대한 '답변유형', 항목 내용의 '최종 입력 필드 값', 항목을 나타낼 '코드 값', '데이터 세트 값' 중 하나 이상의 항목 정보를 입력받을 수도 있다.
상기 인터페이스 제공부(130)는 항목에 대한 '답변유형', 항목 내용의 '최종 입력 필드 값', 항목을 나타낼 '코드 값', '데이터 세트 값' 중 하나 이상의 항목 정보와 같이 대상 항목의 내용을 입력받기 위한 보조 툴 인터페이스 화면을 제공할 수도 있다.
일부 실시 예들에서, 상기 보조 툴 인터페이스 화면은 활성화된 입력 칸을 포함한 제1 서브 영역 및 항목 구조 레벨을 포함한 제2 서브 영역을 포함할 수도 있다. '답변유형', '최종 입력 필드 값', '코드 값, '데이터 세트 값'에 대한 입력은 도 5의 보조 툴 인터페이스 화면의 하단(즉, 제1 서브 영역)에 위치할 수도 있다. 제2 서브 영역에는 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시된다.
또한, 상기 과정은 단계(S296) 이후, 활성화된 입력 칸을 통해 수정 또는 생성할 대상 항목의 내용을 입력받는 단계(S297); 및 단계(S297)에서 입력된 항목의 내용을 ESG 관리 항목 DB(230)에 저장하는 단계(S298)를 더 포함할 수도 있다.
이와 같이 상기 ESG 서비스 제공 시스템(1)에 의해 비정형 ESG 데이터가 파싱 및 정형화되어 데이터베이스로 구축됨으로써, 빅데이터 관점에서 분석 및 가공 처리에 따라 적절하게 ESG 데이터를 활용할 수 있다.
추가적으로, 파싱된 ESG 문서의 텍스트는 ESG 문서를 자동완성하기 위한 기계학습 모델의 학습 데이터로 이용될 수도 있다. 이를 위해, 상기 ESG 서비스 제공 시스템(1)은 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템에 연결되어, 상기 파싱된 ESG 문서의 텍스트를 제공할 수도 있다.
도 6은, 본 출원의 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템의 개략도이고, 도 7은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델을 생성하는 과정의 개략도이다.
도 6 및 도 7을 참조하면, 상기 ESG 서비스 제공 시스템(1)은 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템과 연결됨으로써, 상기 ESG 서비스 제공 시스템(1)이 제공하는 ESG 서비스는 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 서비스를 더 포함한다. 상기 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템은 데이터 웨어하우스 시스템(300)과 연결된 서비스 서버(200-1)를 포함한다.
데이터 웨어하우스 시스템(300)는 클라우드 데이터 웨어하우스 시스템 또는 기타 데이터 웨어하우스 시스템을 간단히 지칭하는 것으로서, 데이터 분석 및 보고를 위해, 하나 이상의 다른 소스(disparate sources)로부터 통합된 데이터의 중앙 저장소를 포함한 네트워크-기반 저장 시스템이다. 상기 데이터 웨어하우스 시스템(300)는 기업용 분석 보고서를 생성하기 위해 사용될 수 있는 현재, 과거 데이터를 저장할 수도 있다. 이를 위해, 데이터 웨어하우스 시스템(300)는 비즈니스 인텔리전스 도구(business intelligence tools), 데이터를 추출하고, 변환하며, 이를 저장소로 로드하기 위한 도구, 및 메타데이터를 관리하고 검색하기 위한 도구를 제공한다.
상기 데이터 웨어하우스 시스템(300)는 함수(예를 들어, 구조화된 질의 언어(structured Query Langague, SQL) 함수), 테이블 함수, 또는 프로시저(procedure)를 데이터 웨어하우스 시스템 외부에 있고, 웹 애플리케이션 프로그램 인터페이스(Web application programming interface)로서 노출된 원격 소프트웨어 코드로 바인딩(bind)하기 위한 기능을 제공하도록 구성될 수도 있다.
상기 데이터 웨어하우스 시스템(300)는 외부에서 관리되는 웹 API 관리 시스템 제공된 클라우드 컴퓨팅 서비스 플랫폼(예를 들어, Amazon Web Services®(AWS), Microsoft Azure® 또는 Google Cloud Services®)에서 외부에서 구현된 웹 엔드포인트(web endpoint)(예를 들어, 하이퍼텍스트 전송 프로토콜(HyperText Transfer Protocol, HTTP) 표현 상태 변경(Representational State Transfer, REST) 엔드포인트)에 의해 지원되는(backed) 함수 및 저장된 프로시저를 작성하기(author) 위한 메커니즘을 사용자에게 제공한다. 사용자는 웹 엔드포인트를 제공하고(provisioning), 저장 플랫폼 내의 비즈니스 로직을 기초로 엔드포인트를 구성할 책임이 있다. 일부 경우에서, 웹 API 관리 시스템은 람다 함수(Lambda functions)에 대한 요청을 프록시하고, 다른 경우에서, 웹 API 관리 시스템은 요청을 변환하며, 이를 데이터 웨어하우스 시스템 외부에 있는 제3자 소프트웨어 구성요소로 전달한다. 데이터 웨어하우스 시스템(300)은 이의 외부 소프트웨어 구성요소에 의해 제공되는 외부 함수가 사용자 정의 함수, 사용자-정의 테이블 함수 및 저장된 프로시저와 같이 질의에서 사용되는 것을 가능하게 한다.
데이터 웨어하우스 시스템(300)은 원격 소프트웨어 구성요소에 의해 제공된 외부 기능의 호출을 가능 하게 하기 위해 다양한 데이터 객체를 저장한다. 데이터 객체는 클라우드 컴퓨팅 플랫폼에 의해 제공되는 웹 API 관리 시스템을 통해 외부 기능을 호출하는 데 사용될 임시 보안 크리덴셜(credentials)을 획득하기 위해 네트워크-기반 데이터 웨어하우스에서 사용하는 정보를 저장한다. 질의의 실행 중에, 네트워크-기반 데이터 웨어 하우스 시스템은 임시 보안 크리덴셜을 사용하여 클라우드 컴퓨팅 서비스 플랫폼의 인증 시스템을 통해 타겟 엔 드포인트로 인증하고, 질의에서 정의된 타겟 데이터의 배치(batches)로 엔드포인트에서 기능을 호출한다. 타겟 데이터는 예를 들어, 이진 데이터, 자바스크립트 객체 표기법(JavaScript Object Notation, JSON) 인코딩된 데 이터, 또는 확장 가능한 마크업 언어(extensible Markup Language, XML)와 같은 다른 텍스트 포맷을 포함한다. 타겟 데이터는 HTTP 요청/응답과 함께 인라인으로(inline) 전달되거나, 또는 클라우드 컴퓨팅 서비스 플랫폼(예를 들어, Amazon® Simple Storage Service(S3®))에 의해 제공되는 일반적으로 액세스되는 저장소에 기록될 수 있다. 데이터 웨어하우스 시스템(300)에 저장된 사용자 데이터는 HTTP 요청 및 응답을 통해 전달하기에 적합한 포맷으로 인코딩된다.
도 7을 참조하면, 상기 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템에서 국문, 영문 또는 제3 언어로 기재된 ESG 문서로부터 ESG 텍스트를 추출하고 이를 상기 데이터 웨어하우스 시스템(300)에 저장한다.
상기 ESG 텍스트는 ESG 문서로부터 추출되었기 때문에, ESG 형식에 맞는 의미 및 표현을 가지는 텍스트이다. 상기 ESG 형식에 맞는 텍스트는 ESG 형식의 카테고리로 분류될 수도 있다. 상기 ESG 텍스트는 ESG 분야에서 활용되는 단어(예컨대, 키워드) 또는 문장을 포함할 수도 있다. 또한, 상기 ESG 텍스트는 ESG 분야와 관련된 타-분야에서 활용되는 단어, 문구(phrase) 또는 문장을 더 포함할 수도 있다. ESG 분야와 관련된 타-분야는 ESG 문서를 생성하는데 활용된 참조 문서의 분야일 수도 있다.
상기 ESG 문서는 정부 웹 페이지, 기업 웹 페이지, 기타 웹 사이트 등에서 이미 공개되어 있는 국/내외 평가 대상 기업의 ESG 지속가능 보고서, 또는 개별 기업의 ESG 담당자가 작성하여 배포한 기타 ESG 문서를 포함한다. 상기 평가 대상 기업은 사업체로서의 기업만을 지칭하지 않고 기관, 비영리 단체 등의 다양한 형태의 단체를 포괄하여 지칭할 수 있다.
일부 실시 예들에서, 상기 ESG 문서는, 도 1 및 도 6에 도시된, 정부 문서 DB(310), 고객 문서 DB(320), 및 웹 사이트 문서 DB(330) 중 하나 이상의 외부 DB로부터 획득되어 상기 데이터 웨어하우스 시스템(300)에 저장될 수도 있다.
상기 정부 문서 DB(310)는 정부 데이터 포털에 액세스하여 검색된 적어도 하나의 기업에 대한 ESG 문서를 수집할 수도 있다.
상기 고객 문서 DB(320)는 상기 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템과 관련된 고객, 예를 들어, 상기 시스템(1)에서 제공하는 서비스에 가입한 고객 기업의 데이터 포털에 액세스하여 해당 고객에 대한 ESG 문서를 수집할 수도 있다. 단일 고객에 대해 다수의 ESG 문서가 수집될 수도 있다.
상기 웹 사이트 문서 DB(330)는 주요 웹 사이트로 미리 지정된 하나 이상의 웹 사이트 각각에 액세스하고 액세스한 웹 사이트에서 공개된 ESG 문서를 검색하여 수집할 수도 있다.
서비스 서버(200-1)는 네트워크 서버로 구현되는 다수의 컴퓨터 시스템 또는 컴퓨터 소프트웨어이다. 여기서, 네트워크 서버란, 사설 인트라넷 또는 인터넷과 같은 컴퓨터 네트워크를 통해 다른 네트워크 서버와 통신할 수 있는 하위 장치와 연결되어 작업 수행 요청을 접수하고 그에 대한 작업을 수행하여 수행 결과를 제공하는 컴퓨터 시스템 및 컴퓨터 소프트웨어(네트워크 서버 프로그램)를 의미한다. 그러나 이러한 네트워크 서버 프로그램 이외에도, 네트워크 서버 상에서 동작하는 일련의 응용 프로그램과 경우에 따라서는 내부에 구축되어 있는 각종 데이터베이스를 포함하는 넓은 개념으로 이해되어야 할 것이다. 상기 서비스 서버(200-1)는 네트워크 서버, 웹 서버, 파일 서버, 슈퍼컴퓨터, 데스크탑 컴퓨터 등과 같은 컴퓨팅 장치들의 임의의 유형 또는 유형들의 조합으로 구현될 수도 있다. 이를 위해, 서비스 서버(200-1)는 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다.
서비스 서버(200-1)는 사용자의 ESG 문서를 보다 쉽게 작성하기 위해 ESG 형식에 맞는 텍스트(예컨대, 문장)을 추천하는, ESG 문서 자동완성 서비스를 제공할 수도 있다. 이를 위해, 서비스 서버(200-1)는 사용자의 전자 장치(100-1)로부터 수신한 입력 값을 미리 학습된 ESG 자동완성 모델에 적용하여 입력 값 다음 순서에 배치될 텍스트, 단어(예컨대, 키워드) 또는 문장을 예측한다. 또한, 상기 서비스 서버(200-1)는 예측 결과를 상기 사용자의 전자 장치(100-1)로 전달하도록 구성될 수도 있다.
일부 실시 예들에서, 상기 서비스 서버(200-1)는 학습부(210-1)를 더 포함할 수도 있다. 도 7에 도시된 것처럼, 상기 데이터 웨어하우스 시스템(300)은 저장한 ESG 텍스트 데이터를 ESG 자동완성 모델을 생성하기 위한 샘플 텍스트 데이터로 학습부(210-1)로 공급할 수도 있다.
학습부(210-1)는 샘플 텍스트 데이터를 자연어 처리하여 미리 설계된 ESG 자동완성 모델을 학습할 수도 있다. 특정 실시 예들에서, 상기 학습부(210-1)는 샘플 텍스트 데이터를 자연어 처리하는 전처리 동작, 샘플 텍스트의 토큰에 기초하여 트래이닝 데이터 세트를 형성하는 동작, 및 상기 트래이닝 데이터 세트를 이용하여 미리 설계된 신경망 구조를 갖는 ESG 자동완성 모델을 학습하는 동작을 수행하도록 구성될 수도 있다.
도 7에 도시된 것처럼, 학습부(210-1)는 수신한 샘플 텍스트의 말뭉치(예컨대, 문장)를 자연어 처리하는, 학습을 위한 전처리 동작을 수행한다.
상기 전처리 동작은, 토큰화 처리 동작 및/또는 특수 토큰 부가 동작을 포함할 수도 있다.
토큰화 처리 동작은 전처리 대상 텍스트의 말뭉치를 미리 설정된 최소 분할 단위인 토큰 단위로 분할하여 복수의 토큰을 생성하는 동작이다. 상기 토큰 단위는, 예를 들어 단어 단위 또는 형태소 단위로 미리 설정될 수도 있다. 문장이 학습부(210-1)로 제공되면, 상기 학습부(210-1)는 문장을 토큰 단위로 분할하여 해당 문장의 토큰 세트를 형성할 수도 있다. 각 토큰 세트는 단일 말뭉치로부터 생성된 복수의 토큰으로 이루어진다.
상기 특수 토큰 부가 동작은 미리 정의된 복수의 특수 토큰 중 하나 이상의 특수 토큰을 전처리 대상 텍스트의 말뭉치에 부가하는 동작이다. 상기 특수 토큰은 상기 ESG 자동완성 모델의 출력 텍스트가 보다 자연스러운 텍스트 스타일로 표현되는데 사용되는 특수 토큰이다. 텍스트를 가리키는 상기 토큰과 달리, 상기 특수 토큰은 텍스트를 가리키지 않을 수도 있다. 이하, 설명의 명료성을 위해, 말뭉치의 텍스트를 토큰 단위로 분할하여 생성된 토큰을 텍스트 토큰으로 지칭하여, 본 출원의 실시 예들을 보다 상세히 서술한다.
상기 특수 토큰은, 예를 들어, 모르는 단어에 대한 토큰, 배치 데이터의 길이를 맞추기 위한 토큰, 문장의 시작을 가리키는 토큰, 문장의 종결을 가리키는 토큰, 및/또는 문장 텍스트 이외 기타 토큰을 포함할 수도 있다. 특수 토큰이 샘플 텍스트에 부가되고 특수 토큰이 부가된 샘플 텍스트의 말뭉치가 토큰화될 경우, 특수 토큰이 부가된 샘플 텍스트의 말뭉치의 토큰 세트가 입력되는 상기 ESG 자동완성 모델은 입력 토큰의 텍스트를 보다 용이하게 디코딩할 수도 있다.
일부 실시 예들에서, 상기 특수 토큰 부가 동작은 상기 전처리 대상 텍스트의 말뭉치를 토큰으로 분할할 필요가 없거나 또는 ESG 자동완성 모델의 출력 텍스트가 표현되는 언어에 대해 미리 연관된 언어 규칙이 있을 경우에 수행될 수도 있다.
이러한 전처리 동작을 통해, 상기 학습부(210-1)는 샘플 텍스트의 말뭉치가 토큰 단위로 분할된 텍스트 토큰으로 이루어진 토큰 세트, 분할 없이 특수 토큰만이 부가된 토큰(들)로 이루어진 토큰 세트, 또는 특수 토큰이 샘플 텍스트의 말뭉치에 부가된 뒤 분할된 텍스트 토큰으로 이루어진 토큰 세트를 이용하여 트래이닝 데이터 세트를 형성한다.
상기 학습부(210-1)는 복수의 트래이닝 샘플로 이루어진 트래이닝 데이터 세트를 형성할 수도 있다. 각각의 트래이닝 샘플은 트래이닝 데이터 및 레이블 데이터를 포함한다.
상기 복수의 트래이닝 샘플 각각은 복수의 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트로부터 각각 형성될 수도 있다. 각 트래이닝 샘플의 트래이닝 데이터, 레이블 데이터는 동일한 샘플 텍스트의 말뭉치에 대응한 토큰 세트로부터 획득된다.
상기 트래이닝 데이터는 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 둘 이상의 토큰을 해당 샘플 텍스트의 말뭉치 상의 순서대로 배열한 것일 수도 있다. 트래이닝 데이터의 토큰 배열은 입력 텍스트(즉, 샘플 텍스트)의 말뭉치의 일부 또는 전부에 대응한다.
일부 실시 예들에서, 상기 트래이닝 데이터 세트는 샘플 문장별로 서브 세트화될 수 있다. 샘플 문장별 트래이닝 데이터는 샘플 문장에서 맨 처음의 토큰을 포함한 토큰 배열일 수 있다. 일 예에서, 상기 샘플 문장에 대한 서브 세트 내 트래이닝 데이터는 샘플 문장에서 첫번째 토큰이거나, 상기 샘플 문장에서 첫번째 토큰 내지 두 번째 토큰을 포함한 토큰 배열이거나, 또는 상기 샘플 문장에서 첫번째 토큰 내지 세 번째 토큰을 포함한 토큰 배열이거나, .... , 상기 샘플 문장에서 첫번째 토큰 내지 마지막 토큰의 이전 토큰까지의 토큰 배열일 수 있다.
상기 레이블 데이터는 상기 샘플 문장을 나타낸 토큰 배열 전체에서 트래이닝 데이터의 토큰 배열을 제외한 나머지 토큰들이 상기 샘플 문장의 말뭉치 순번에 따라 배열된 잔여 배열 토큰일 수 있다. 상기 잔여 배열 토큰은 상기 샘플 문장에서 마지막 토큰을 포함할 수 있다. 복수의 레이블 데이터는 복수의 트레이닝 데이터 각각에 대응한다.
상기 일 예에서, 동일한 샘플 문장으로부터 생성된 서브 세트 내 트레이닝 데이터에 대한 레이블 데이터는 각각 다음과 같을 수 있다: 샘플 문장에서 첫번째 토큰을 갖는 트래이닝 데이터에 대응한 레이블 데이터는 상기 샘플 문장에서 두번째 텍스트 토큰 내지 마지막 텍스트 토큰이 순차적으로 배열된 잔여 배열 토큰이고, 상기 샘플 문장에서 첫번째 토큰 내지 두 번째 토큰을 포함한 토큰 배열을 갖는 트래이닝 데이터에 대응한 레이블 데이터는 상기 샘플 문장에서 세번째 텍스트 토큰 내지 마지막 텍스트 토큰이 순차적으로 배열된 잔여 배열 토큰이며, 상기 샘플 문장에서 첫번째 토큰 내지 세 번째 토큰을 포함한 토큰 배열을 갖는 트래이닝 데이터에 대응한 레이블 데이터는 상기 샘플 문장에서 네번째 텍스트 토큰 내지 마지막 텍스트 토큰이 순차적으로 배열된 잔여 배열 토큰이고, .... , 상기 샘플 문장에서 첫번째 토큰 내지 마지막 토큰의 이전 토큰까지의 토큰 배열을 갖는 트래이닝 데이터에 대응한 레이블 데이터는 마지막 텍스트 토큰일 수 있다.
학습부(210-1)에 의해 생성된 상기 트래이닝 데이터, 레이블 데이터를 포함한 트래이닝 데이터 세트는 ESG 자동완성 모델을 학습하는데 이용된다. 학습부(210-1)에 의해, 상기 ESG 자동완성 모델은 문장의 일부를 구성하는 입력 텍스트의 말뭉치와 상기 문장의 나머지 일부를 구성하는 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치되기 적합한 텍스트의 말뭉치를 예측하도록 학습된다. 여기서 텍스트의 말뭉치는 단어(예컨대, 키워드), 문구 또는 문장일 수도 있다. 잔여 텍스트의 말뭉치는 입력 텍스트의 말뭉치 이후에 배치 가능한 것으로서, 상기 레이블 데이터에 대응한 텍스트의 말뭉치일 수 있다.
상기 ESG 자동완성 모델은 입력 텍스트를 자연어 처리하여 입력 텍스트에 위치 가능한 잔여 텍스트를 적어도 부분적으로 복원하도록 설계된 뉴럴 네트워크를 포함한다. 예를 들어, 상기 ESG 자동완성 모델은 PLM 또는 기타 자연어 처리 기반 네트워크 모델일 수도 있다. 상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치의 다음 순번에 배치되기에 적합한 텍스트의 말뭉치를 복원하도록 구성될 수도 있다.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 인코더 및 디코더를 포함할 수도 있다. 상기 인코더는 입력된 토큰 배열에서 특징을 추출하고, 디코더는 추출된 특징에 기초하여 입력된 토큰 배열이 가리키는 입력 말뭉치의 다음 순번으로 배치 가능한 텍스트의 말뭉치를 복원하도록 구성된다. 이러한 인코더의 추출 능력, 디코더의 복원 능력은 상기 학습부(210-1)에 의해, 상기 트래이닝 데이터 세트를 이용하여 학습될 수 있다.
상기 학습부(210-1)에 의해, ESG 자동완성 모델은 학습을 위한 샘플 텍스트의 말뭉치에서 특정 텍스트 말뭉치의 다음에 위치한 텍스트 말뭉치를 적절하게 복원하는 동작을 반복함으로써, 모델 내 파라미터가 특정 텍스트 말뭉치의 다음에 위치하기 적합한 텍스트 말뭉치를 예측하도록 학습된다.
이하, 인코더 및 디코더를 포함한 상기 일 예시의 ESG 자동완성 모델을 이용하여 학습 과정에 대해 보다 상세히 서술한다.
학습부(210-1)는 트래이닝 세트 내 각 트래이닝 샘플의 트래이닝 데이터를 상기 ESG 자동완성 모델에 입력한다.
상기 인코더는 입력 토큰을 자연어 처리하여 입력 토큰의 특징을 추출하도록 구성된다. 상기 특징은 벡터 형태 또는 맵과 같은 행렬 형태로 추출될 수도 있다. 상기 일 예에서, 상기 인코더의 입력 토큰은 트래이닝 데이터에 포함된 단일 토큰 또는 토큰 배열이다.
디코더는 입력된 트래이닝 데이터의 토큰의 특징에 기초하여 트래이닝 데이터의 토큰 배열의 다음에 위치할 텍스트 토큰을 복원하도록 구성된다. 디코더는 입력 토큰의 다음에 위치할 특정 텍스트 토큰을 복원하고, 복원된 특정 텍스트 토큰에 위치할 다른 특정 텍스트 토큰을 복원하는 과정을 순차적으로 진행하여, 상기 입력 토큰과 예측된 텍스트 토큰들로 구성된 문장을 최종적으로 복원하도록 학습된다. 디코더가 학습되면, 디코더가 복원하는 토큰들은 상기 트래이닝 데이터에 대응한 레이블 데이터의 잔여 토큰 배열에 일치하거나 유사할 수 있다. 전술한 바와 같이 잔여 토큰 배열은 단일 토큰(즉, 마지막 토큰)일 수 있다. 상기 일 예에서 언급한 트래이닝 데이터의 토큰 배열이 인코더에 입력되면, 상기 디코더는 입력된 토큰 배열이 구성하는 문장에서 상기 입력된 토큰 배열에 위치 가능한 적어도 하나의 다른 토큰을 복원하도록 학습된다. 디코더의 복원 값은 입력 텍스트로 만들 수 있는 문장 중에서 상기 입력 텍스트의 다음에 배치되기 적합한 것으로 예측된 적어도 하나의 텍스트 토큰일 수 있으며, 각 트래이닝 샘플별 예측 값으로 활용된다.
도 8은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델에서 출력 텍스트를 예측하는 동작의 개략도이다.
도 8을 참조하면, 상기 디코더는 그리드 탐색 방식으로 잔여 토큰 배열을 복원할 수도 있다. 상기 디코더는 특정 토큰의 다음 순서에 배치 가능한 복수의 후보 토큰을 예측하고, 예측된 복수의 후보 토큰 중 가능성이 가장 높은 토큰을 선택하여, 잔여 토큰 배열을 복원한다. 도 8에 도시된 것처럼 복수의 후보 토큰은 ESG 분야의 텍스트로 이루어진 토큰이다. 디코더는 잔여 토큰 배열의 앞/뒤 맥락에 기초하여 잔여 토큰 배열의 위치에 배치될 가능성이 가장 높은 토큰을 선택한다. 이러한 확률에 따라 순차적으로 토큰을 선택하여, 입력된 토큰이 구성하는 문장에서 상기 입력된 토큰의 다음에 배치될 수 있으면서 상기 문장을 구성하는 것으로 예측되는 토큰들을 결정할 수 있다.
상기 학습부(210-1)는 추천 텍스트를 추천하는 기능을 학습하기 위해, ESG 자동완성 모델의 파라미터를 조정할 수도 있다. 상기 ESG 자동완성 모델의 파라미터는 미리 설계된 인공 신경망 구조의 파라미터를 포함할 수도 있다.
상기 학습부(210-1)는 산출된 예측 값(예컨대, 디코더의 출력 값)과 실제 값 간의 오차가 감소하거나 최소화되도록 ESG 자동완성 모델의 파라미터를 조정할 수도 있다. 여기서, 실제 값은 출력 값을 산출하는데 이용된 트래이닝 샘플에 함께 포함된 레이블 데이터의 값이다. 상기 레이블 데이터는 예측 값을 제공한 입력된 토큰의 트레이닝 데이터에 대응한다.
상기 출력 값과 실제 값 간의 오차가 최소화될 경우, 학습된 ESG 자동완성 모델은 입력 텍스트의 말뭉치의 다음 순번에 배치될 텍스트의 말뭉치를 정확하게 예측할 수도 있다. ESG 자동완성 모델이 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 보다 정확하게 추론했다면, 상기 입력 텍스트의 말뭉치에서 상기 입력 텍스트로 구성된 문장에서 상기 입력 텍스트 뒤에 위치하기 적합한 나머지 텍스트의 말뭉치가 보다 정확하게 예측될 것이다.
이러한 과정을 통해 학습 완료된 ESG 자동완성 모델은 ESG 문서 상에서 입력 텍스트의 말뭉치의 다음 위치에 배치되기 적합한 텍스트를 추천 텍스트로 예측하도록 구성된다. 상기 출력 텍스트는 ESG 문서의 형식을 만족하는 텍스트로서, 입력 텍스트의 맥락에 연결되는 맥락을 가지면서 ESG 분야에 특화된 표현을 갖는 텍스트일 수도 있다.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 단일 입력 텍스트의 말뭉치가 입력될 경우, 상기 단일 입력 텍스트의 말뭉치의 다음 순번에 배치될 텍스트의 말뭉치를 하나 이상의 텍스트 말뭉치로 산출할 수도 있다. 예를 들어, 상기 ESG 자동완성 모델은 단일 문장이 입력될 경우 상기 단일 문장의 다음 순번에 배치되기에 적합한 후보 문장을 하나 또는 복수 개 산출할 수도 있다. 또한, 일부 실시 예들에서, 상기 ESG 자동완성 모델은 복수의 추천 텍스트의 말뭉치를 산출하고, 각 추천 텍스트의 말뭉치별 확률 값에 기초하여 일부 또는 전부의 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력할 수도 있다.
예를 들어, 상기 ESG 자동완성 모델은 입력 텍스트의 다음에 위치할 추천 텍스트를 산출하는 동작을 수행할 때마다 모델의 시드 값이 임의의 값을 갖도록 설정될 수도 있다. 동일한 입력 텍스트에 대해서 해당 추천 텍스트를 산출하는 동작을 복수 회 반복할 경우, 상기 복수 회 중 2이상의 서로 다른 추천 텍스트의 말뭉치를 산출할 수도 있다.
이 경우, 상기 추천 텍스트의 개수는 동일한 입력 텍스트에 대해 해당 추천 텍스트를 산출하는 동작의 반복 회수를 가리키는, 미리 지정된 하이퍼 파라미터에 의존할 수도 있다.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 각 추천 텍스트의 말뭉치별 확률 값이 미리 설정된 임계 확률 값 이상인 일부 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력할 수도 있다. 그러면, 상기 시스템(1)은 사용자의 선택 명령에 대응한 추천 텍스트의 말뭉치를 상기 입력 텍스트의 다음 위치에 배치할 수도 있다. 사용자의 선택에 따라 배치된 추천 텍스트의 말뭉치는 예측된 추천 텍스트의 그 다음 순서의 새로운 추천 텍스트의 말뭉치를 산출하기 위한 새로운 입력 텍스트로 이용된다. 이러한 과정의 반복으로 인해, 사용자는 몇 번의 선택 명령을 통해 ESG 문서의 내용의 일부 또는 전부를 완성할 수도 있다.
특정 실시 예들에서, 상기 디코더는 핏팅 레이어를 포함할 수도 있다. 상기 핏팅 레이어는 ESG 자동완성 모델이 입력 텍스트의 다음 순번의 텍스트로서 상기 ESG 형식에 맞는 의미 및/또는 표현의 텍스트를 예측하기 위해 상기 디코더의 말단에 배치된다. 일부 실시 예들에서, 상기 디코더가 (예컨대, 소프트맥스와 같은) 확률 함수를 포함할 경우, 상기 핏팅 레이어는 상기 확률 함수 이전의 데이터 경로 상에 배치될 수도 있다.
상기 학습부(210-1)는, 상기 핏팅 레이어를 이용하여 상기 ESG 자동완성 모델이 입력 텍스트에 함축된 의미를 적어도 부분적으로 학습하는, 강화 학습 동작을 수행할 수도 있다.
상기 핏팅 레이어는 추천 문장이 출력되기 이전에, 입력 텍스트가 입력될 경우 예측되어 출력될 다음 순번의 텍스트(예컨대, 단어, 문구 또는 문장)에 대해서 ESG 형식에 보다 가까운 데이터에 가중치를 부여하도록 구성된다. 일부 실시 예들에서, ESG 형식에 적합한 정도에 따라 보다 높은 가중치 값이 부여될 수도 있다. 상기 핏팅 레이어에 의해 상기 ESG 자동완성 모델은 ESG 형식에 맞는 ESG 분야의 텍스트에 함축된 의미론적 부분을 적어도 부분적으로 학습할 수 있다.
일부 실시 예들에서, 상기 ESG 형식에 적합한 정도는 ESG 문서에 나타난 빈도에 기초할 수도 있다.
만약 상기 ESG 자동완성 모델이 GPT(Generative Pre-trained Transformer) 모델에 기반하여 설계될 경우를 가정해보자. 상기 ESG 자동완성 모델이 핏팅 레이어를 포함하지 않고 입력 텍스트의 다음 단어, 문구 또는 문장을 예측하도록 미리 학습될 경우, 여러 카테고리의 말뭉치 데이터가 상기 다음 단어, 문구 또는 문장으로 예측될 수도 있다. 상기 특정 실시 예들에서, 상기 ESG 자동완성 모델은 핏팅 레이어를 통해 ESG 형식 카테고리의 말뭉치 데이터에서 입력 텍스트의 다음 단어, 문구 또는 문장을 구현할 수도 있다.
그 결과, 상기 핏팅 레이어를 포함한 ESG 자동완성 모델은 ESG 문서의 형식을 만족하면서 입력 텍스트의 말뭉치의 다음 위치에 배치되기에 적합한(즉, 가능성이 가장 높은) 텍스트의 말뭉치를 예측하도록 학습된다.
상기 서비스 서버(200-1)는 도 7과 같이 학습된 ESG 자동완성 모델을 활용하여 사용자가 ESG 문서를 작성하는 작업을 지원한다. 일부 실시 예들에서, 상기 서비스 서버(200-1)는 사용자의 입력 텍스트의 다음 위치에 배치될 추천 텍스트를 예측하여 사용자의 ESG 문서 완성을 지원하는 ESG 문서 생성부(250-1)를 더 포함할 수도 있다. 상기 ESG 문서 생성부(250-1)는 상기 ESG 자동완성 모델을 이용하도록 구성된다. 상기 ESG 문서 생성부(250-1)의 동작에 대해서는 아래의 도 10을 참조해 보다 상세히 서술한다.
상기 전자 장치(100-1)는 서비스 서버(200-1)의 예측 동작을 개시하기 위한 입력 텍스트를 입력하고, 서비스 서버(200-1)에서 예측한 추천 텍스트 또는 입력 텍스트 및 예측한 추천 텍스트를 포함한, 적어도 부분적으로 자동완성된 ESG 문서의 내용을 출력하도록 구성된다. 또한, 일부 실시 예들에서, 상기 전자 장치(100-1)는 예측한 추천 텍스트 중 문서 내용으로 이용할 하나의 텍스트를 선택하도록 더 구성될 수도 있다.
상기 전자 장치(100-1)는 서비스 서버(200-1)와 통신하는 클라이언트 단말 장치로서, 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다. 상기 전자 장치는, 예를 들어, 랩탑 컴퓨터, 기타 컴퓨팅 장치, 태블릿, 셀룰러 폰, 스마트 폰, 스마트 워치, 스마트 글래스, 헤드 마운트 디스플레이(HMD), 기타 모바일 장치, 기타 웨어러블 장치일 수도 있다.
상기 전자 장치(100-1), 서비스 서버(200-1) 또는 시스템(1)이 다른 구성요소를 포함할 수도 있다는 것이 통상의 기술자에게 명백할 것이다. 예를 들어, 상기 서비스 서버(200-1)는 데이터 엔트리를 위한 입력 장치, 및 인쇄 또는 다른 데이터 표시를 위한 출력 장치를 포함하는, 본 명세서에 서술된 동작에 필요한 다른 하드웨어 요소를 포함할 수도 있다. 또한, 상기 시스템(1)은 서비스 서버(200-1)와 외부 장치(예를 들어, 사용자 단말, 또는 외부 데이터베이스 등) 사이를 연결하는 네트워크, 네트워크 인터페이스 및 프로토콜 등을 더 포함할 수 있다.
대안적인 실시 예들에서, 상기 학습부(210-1)는 서비스 서버(200-1)의 내부에 포함되는 것으로 제한되지 않는다. 상기 학습부(210-1)는 서비스 서버(200-1)의 외부 구성요소로 구현될 수도 있다. 이 경우, 상기 학습부(210-1)는 데이터 웨어하우스 시스템(300), 서비스 서버(200-1)와 전기 통신하도록 구성된다. 상기 서비스 서버(200-1)는 외부의 학습부(210-1)로부터 미리 학습된 ESG 자동완성 모델을 수신하고, 수신된 모델을 활용하여 사용자의 ESG 문서를 보다 쉽게 작성하기 위해 ESG 형식에 맞는 문장을 추천하는, ESG 텍스트 자동완성 서비스를 제공할 수도 있다.
도 9는, 본 출원의 다른 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법의 흐름도이다.
도 9의 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법(이하, ESG 텍스트 추천 방법)은 도 1의 ESG 서비스 제공 시스템(1)에 연결된 도 6의 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템과 같은 하나 이상의 컴퓨팅 장치에 의해 수행될 수도 있다. 여기서, ESG 텍스트는 ESG 문서의 형식을 만족하는 텍스트를 지칭한다.
도 9를 참조하면, 상기 ESG 텍스트 자동완성 방법은, 사용자의 전자 장치(100-1)로부터 상기 ESG 문서의 내용 중 일부 내용으로 기재될 ESG 텍스트를 완성하기 위한 기초 텍스트를 수신하는 단계(S410)를 포함한다. 상기 기초 텍스트는 다음 순번에 배치될 텍스트를 예측하는 단서로 활용된다.
상기 기초 텍스트를 수신하는 단계(S410)에서 기초 텍스트는 ESG 문서에 기재될 단어(예컨대, 키워드), 문구 또는 문장이다. 상기 기초 텍스트는, 예를 들어 해당 ESG 문서를 완성하는데 요구되는 필수 텍스트 중 일부 또는 전부의 텍스트, 또는 ESG 문서의 내용 전체 중 일부분의 내용을 나타낸 텍스트일 수도 있다.
완성할 ESG 문서의 내용 전체가 해당 ESG 문서에 기재되기 위해, 내용 전체 중 일부분에 속하는 기초 텍스트가 입력되면, 나머지 내용 중 일부 또는 전부가 추천되어 ESG 문서가 자동 완성된다.
일부 실시 예들에서, 상기 단계(S410)의 기초 텍스트는 적합한 텍스트를 추천하도록 구성된 시스템이 운영하는 특정 웹 페이지에 액세스할 경우 제공되는 인터페이스 화면을 통해 입력될 수도 있다.
상기 인터페이스 화면은 완성하길 원하는 ESG 형식을 표현하도록 구성될 수도 있다. 상기 인터페이스 화면을 통해 사용자는 자신이 완성할 ESG 문서의 형식에 내용을 직접 입력하거나 또는 자동 완성 결과를 실시간으로 제공받을 수도 있다.
또한, 상기 ESG 텍스트 추천 방법은, 상기 단계(S410)에서 수신한 기초 텍스트를 미리 학습된 ESG 자동완성 모델에 입력하여 기초 텍스트의 다음 순번에 배치될 추천 텍스트를 예측하는 단계(S420)를 포함한다.
일부 실시 예들에서, 상기 추천 텍스트를 산출하는 단계(S420)는, 상기 기초 텍스트의 말뭉치를 전처리하여 입력 데이터를 형성하는 단계, 및 형성된 입력 데이터를 상기 미리 학습된 ESG 자동완성 모델에 입력하여 적어도 하나의 추천 텍스트를 산출하는 단계를 포함할 수도 있다.
상기 단계(S420)에서 수행되는 전처리 동작은 토큰화 처리 동작 및/또는 특수 토큰 부가 동작을 포함한다. 상기 전처리 동작은 ESG 자동완성 모델의 트래이닝 데이터를 생성하는데 이용된 전처리 동작에 대응할 수도 있다. 예를 들어, 상기 트래이닝 데이터가 토큰화 처리 동작만 전처리해서 생성될 경우, 서비스 서버(200-1)는 추천 텍스트를 산출하기 위해 기초 텍스트의 말뭉치를 토큰화 처리 동작하여 입력 데이터를 생성할 수도 있다.
상기 단계(S420)의 ESG 자동완성 모델은 단계(S410)의 기초 텍스트의 다음 순번에 배치되기에 적합한, ESG 텍스트의 말뭉치를 예측하도록 미리 학습된다. 상기 ESG 자동완성 모델은 기초 텍스트의 다음 순번에 배치될 가능성이 있는 하나 이상의 텍스트의 말뭉치를 산출하고, 산출된 하나 이상의 텍스트의 말뭉치 중 적어도 하나의 텍스트의 말뭉치를 추천 텍스트의 말뭉치로 출력하도록 구성될 수도 있다.
상기 ESG 텍스트의 말뭉치는 단어(예컨대, 키워드), 문구 또는 문장일 수도 있다.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 하나 이상의 ESG 텍스트의 말뭉치를 추천 텍스트의 말뭉치로 출력할 수도 있다.
서비스 서버(200-1)는 출력된 하나 이상의 추천 텍스트의 말뭉치를 전자 장치(100-1)로 전송할 수도 있다. 상기 전자 장치(100-1)는 수신한 추천 텍스트를 사용자에게 제공할 수도 있다. 일부 실시 예들에서, 상기 전자 장치(100-1)는 기초 텍스트 및 각각의 추천 텍스트를 순서대로 배열한 결과를 제공할 수도 있다.
도 10은, 본 출원의 일 실시 예예 따른, 추천 텍스트의 말뭉치의 출력 결과를 도시한다.
도 10을 참조하면, 상기 단계(S410)에서 "대상㈜는 온실가스 감출을 위해 적극적인 설비 투자와 활동을 꾸준히 수행하고 있습니다"의 문장이 기초 텍스트로 입력될 경우, 해당 문장의 다음 순번에 배치되기 적합한 하나 이상의 추천 텍스트가 상기 ESG 자동완성 모델로부터 출력될 수도 있다. 상기 ESG 자동완성 모델은 복수의 추천 문장을 산출하고, 상기 복수의 추천 문장별 확률 값에 기초하여 도 10에 도시된 것처럼 제1 문장 내지 제5 문장을 추천 텍스트로 출력할 수도 있다. 상기 제1 문장 내지 제5 문장 각각은 기초 문장의 다음 순번에 배치되어 제공될 수도 있다.
상기 단계(S420)에서 이용되는 ESG 자동완성 모델은 도 7, 도 8을 참조해서 위에서 서술하였는 바, 자세한 설명은 생략한다.
다시 도 9를 참조하면, 상기 ESG 텍스트 추천 방법은, ESG 문서의 형식에 추천 텍스트를 기재하는 단계(S430)를 더 포함할 수도 있다.
상기 단계(S420)에서 단일 추천 텍스트가 출력될 경우, 출력된 단일 추천 텍스트는 기초 텍스트의 다음 순번에 곧바로 기재될 수도 있다.
상기 단계(S420)에서 복수의 추천 텍스트가 출력될 경우, 상기 단계(S430)에서 기재되는 추천 텍스트는 복수의 추천 텍스트 중 어느 하나의 텍스트이다. 기재될 추천 텍스트는 사용자의 선택에 의해 결정될 수도 있다. 예를 들어, 사용자의 전자 장치(100-1)는 도 10의 화면을 표시하여 제1 문장 내지 제5 문장 중 어느 하나의 추천 문장을 기초 문장의 다음 순번에 기재할 추천 문장으로 선택하는 사용자 명령을 유도한다. 어느 하나의 문장이 선택되면, 전자 장치(100-1)는 선택된 추천 문장의 정보를 서비스 서버(200-1)로 전송하여 상기 기초 텍스트 및 추천 텍스트의 내용으로 상기 ESG 문서의 현재 내용을 업데이트한다.
또한, 상기 ESG 텍스트 추천 방법은, 단계(S420)에서 예측된 추천 텍스트를 상기 ESG 자동완성 모델에 입력하여 상기 단계(S420)의 추천 텍스트의 다음 순번에 배치될 새로운 추천 텍스트를 예측하는 단계(S440)를 더 포함할 수도 있다. 그러면, ESG 자동완성 모델은 추천 텍스트의 맥락에 연결되는 맥락을 가지면서 ESG 분야에 특화된 표현을 갖는 새로운 추천 텍스트를 출력한다.
또한, 상기 ESG 텍스트 추천 방법은, 단계(S440)에서 출력된 새로운 추천 텍스트를 단계(S430)의 ESG 문서의 형식에 추가 기재하는 단계(S450)를 더 포함할 수도 있다. 상기 단계(S430)의 ESG 문서의 형식은 기초 텍스트 및 추천 텍스트의 내용을 포함한 상태이다.
상기 단계(S450)에서 새로운 추천 텍스트가 기재되면, 작성 중인 ESG 문서는 단계(S410)의 기초 텍스트, 단계(S420)의 추천 텍스트 및 단계(S440)의 새로운 추천 텍스트의 내용을 포함하도록 업데이트된다. 단계(S450)의 동작은, 단계(S430)의 동작과 유사하므로 자세한 설명은 생략한다.
일부 실시 예들에서, 상기 ESG 텍스트 추천 방법은, ESG 문서 전체 내용이 완성될 때까지 상기 단계(S440, S450)를 반복하는 단계(S460)를 더 포함할 수도 있다.
그러면, 사용자는 단계(S410)에서 전자 장치(100-1)를 통해 최소한의 텍스트를 기초 텍스트로 입력하여, ESG 문서를 자동 완성할 수도 있다.
하드웨어를 이용하여 본 발명의 실시 예를 구현하는 경우에는, 본 출원의 실시 예들을 수행하도록 구성된 ASICs(application specific integrated circuits) 또는 DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays) 등이 본 출원의 구성요소에 구비될 수 있다.
이상에서 설명한 본 출원의 실시 예들에 따른 ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템(1)에 의한 동작은 적어도 부분적으로 컴퓨터 프로그램으로 구현되어, 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 예를 들어, 프로그램 코드를 포함하는 컴퓨터-판독가능 매체로 구성되는 프로그램 제품과 함께 구현되고, 이는 기술된 임의의 또는 모든 단계, 동작, 또는 과정을 수행하기 위한 프로세서에 의해 실행될 수 있다.
상기 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등을 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.
이상에서 살펴본 본 발명은 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.
본 출원의 ESG 서비스 제공 시스템은 ESG 기술분야에 관한 발명으로서, ESG 평가에 사용되는 ESG 문서 내 데이터를 효율적으로 분류, 저장 및 관리하는 효과를 제공할 수 있어, 기업의 가치평가에 ESG 평가 기준을 접목하는 산업 동향에 기초할 때 높은 산업상 이용가능성이 기대된다.

Claims (12)

  1. 하나 이상의 컴퓨팅 장치에 의해 수행되는, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법에 있어서,
    상기 하나 이상의 컴퓨팅 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결되고,
    상기 방법은,
    정형화 처리 대상의 ESG 문서를 파싱 처리하는 단계 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함;
    미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계;
    상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계;
    선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계; 및
    문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계를 포함하는,
    방법.
  2. 청구항 제1항에 있어서, 상기 스크리닝하는 단계는,
    상기 ESG 관리 항목 데이터베이스에 저장된 각 ESG 관리 항목별 코드 값 및 데이터 세트 값 중 적어도 하나를 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하는 것을 특징으로 하는,
    방법.
  3. 청구항 제2항에 있어서,
    스크리닝 결과에 이상이 없는지 여부를 판단하는 단계를 더 포함하고,
    상기 이상이 없는지 여부를 판단하는 단계는,
    사용자의 확인 입력에 기초하거나 또는 ESG 문서 내에서 코드 값, 데이터 세트 값 중 적어도 하나에 매칭한 데이터에 대한 주변 데이터 중에 기초하여 스크리닝 결과의 이상 여부를 판단하는 것을 특징으로 하는,
    방법.
  4. 청구항 제1항에 있어서, 상기 선별 상태를 지정하는 단계는,
    파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정하는 것을 특징으로 하는,
    방법.
  5. 청구항 제4항에 있어서, 상기 ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계는,
    제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계;
    제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계; 및
    선별된 ESG 관리 항목의 목록 및 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는,
    방법.
  6. 청구항 제5항에 있어서, 상기 해당 ESG 관리 항목의 내용을 획득하는 단계는,
    사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 '최종 필드 입력 값'의 내용을 획득하는 것을 특징으로 하는,
    방법.
  7. 청구항 제5항에 있어서,
    상기 하나 이상의 컴퓨팅 장치는 다른 ESG 문서의 비정형 ESG 데이터를 정형화하여 저장한 ESG 문서 데이터베이스와 더 연결되고,
    상기 ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계는,
    기존 ESG 문서 내 데이터를 이용하겠다는 사용자 입력을 수신한 경우, 상기 다른 ESG 문서 내 데이터를 해당 항목에 대한 내용으로 획득하는 단계를 더 포함하는 것을 특징으로 하는,
    방법.
  8. 청구항 제1항에 있어서,
    이미 저장된 ESG 관리 항목을 관리하는 단계를 더 포함하고 - 상기 ESG 관리 항목의 관리는 수정, 삭제 또는 생성하는 것이고,
    상기 ESG 관리 항목을 관리하는 단계는,
    이미 저장된 ESG 관리 항목이 저장되었는지 확인하는 단계;
    저장된 경우, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하는 단계;
    상기 수정, 삭제 또는 생성 요청을 수신할 경우, 저장된 ESG 관리 항목 세트를 항목 레벨 구조로 나타낸 보조 툴 인터페이스 화면을 표시하는 단계;를 포함하는 것을 특징으로 하는,
    방법.
  9. 청구항 제8항에 있어서, 상기 ESG 관리 항목을 관리하는 단계는,
    요청 대상 항목이 최하위 레벨 항목이 아닐 경우 대상 항목의 내용에 대한 입력 칸을 비활성화하는 단계;
    상기 요청 대상 항목이 최하위 레벨 항목일 경우 대상 항목의 내용에 대한 입력 칸을 활성화하는 단계;
    활성화된 입력 칸을 통해 수정 또는 생성할 대상 항목의 내용을 입력받는 단계; 및
    입력된 항목의 내용을 ESG 관리 항목 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는,
    방법.
  10. 청구항 제9항에 있어서, 상기 활성화된 입력 칸을 통해 대상 항목의 내용을 입력받는 단계는,
    상기 대상 항목의 내용을 입력받기 위한 보조 툴 인터페이스 화면을 제공하는 단계를 포함하고,
    상기 보조 툴 인터페이스 화면은 활성화된 입력 칸을 포함한 제1 서브 영역 및 항목 구조 레벨을 포함한 제2 서브 영역을 포함하고,
    제2 서브 영역에는 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시되는 것을 특징으로 하는,
    방법.
  11. 청구항 제1항 내지 청구항 제10항 중 어느 하나의 항에 따른 ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법을 수행하기 위한 프로그램이 기록된, 컴퓨터 판독가능한 기록매체.
  12. ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하기 위한 전자 장치에 있어서,
    상기 전자 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결되고,
    비정형 ESG 데이터를 포함한 ESG 문서 내에서 상기 ESG 관리 항목 데이터베이스에 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응한 항목 및 해당 항목의 내용을 획득하여 상기 ESG 문서에 대한 정형화된 ESG 데이터를 생성하도록 구성된 정형 데이터 처리부; 및
    ESG 문서의 비정형 데이터를 정형화된 데이터로 변경하기 위한 사용자 입력을 수신하는 보조 툴 인터페이스 화면을 출력부를 통해 제공하는 인터페이스 제공부를 포함하는,
    전자 장치.
PCT/KR2023/011363 2022-08-05 2023-08-02 Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템 WO2024029939A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020220097981A KR102574784B1 (ko) 2022-08-05 2022-08-05 Esg 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
KR10-2022-0097982 2022-08-05
KR1020220097982A KR102532216B1 (ko) 2022-08-05 2022-08-05 Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
KR10-2022-0097981 2022-08-05

Publications (1)

Publication Number Publication Date
WO2024029939A1 true WO2024029939A1 (ko) 2024-02-08

Family

ID=89849595

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/011363 WO2024029939A1 (ko) 2022-08-05 2023-08-02 Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템

Country Status (1)

Country Link
WO (1) WO2024029939A1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101695277B1 (ko) * 2016-04-26 2017-01-11 (주)시큐레이어 비정형 데이터의 정규화를 수행하도록 지원하는 방법 및 이를 이용한 컴퓨팅 장치
KR102026304B1 (ko) * 2017-11-23 2019-09-30 지속가능발전소 주식회사 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
KR20200059730A (ko) * 2018-11-21 2020-05-29 동신대학교산학협력단 정보 보안 수준 자동화 평가 시스템 및 방법
KR20210109914A (ko) * 2020-02-28 2021-09-07 주식회사 포시에스 대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법
US20220050838A1 (en) * 2020-08-11 2022-02-17 Castellum.AI System and method for processing data for electronic searching
KR102532216B1 (ko) * 2022-08-05 2023-05-12 김종웅 Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101695277B1 (ko) * 2016-04-26 2017-01-11 (주)시큐레이어 비정형 데이터의 정규화를 수행하도록 지원하는 방법 및 이를 이용한 컴퓨팅 장치
KR102026304B1 (ko) * 2017-11-23 2019-09-30 지속가능발전소 주식회사 Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법
KR20200059730A (ko) * 2018-11-21 2020-05-29 동신대학교산학협력단 정보 보안 수준 자동화 평가 시스템 및 방법
KR20210109914A (ko) * 2020-02-28 2021-09-07 주식회사 포시에스 대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법
US20220050838A1 (en) * 2020-08-11 2022-02-17 Castellum.AI System and method for processing data for electronic searching
KR102532216B1 (ko) * 2022-08-05 2023-05-12 김종웅 Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템

Similar Documents

Publication Publication Date Title
WO2020138928A1 (en) Information processing method, apparatus, electrical device and readable storage medium
WO2010087566A1 (en) Document analysis system
WO2019242090A1 (zh) 智能客服应答方法、设备、存储介质及装置
WO2018034426A1 (ko) 커널 rdr을 이용한 태깅 말뭉치 오류 자동수정방법
WO2012091360A2 (ko) 유저 맞춤형 컨텐츠 제공 방법 및 시스템
WO2021157897A1 (en) A system and method for efficient multi-relational entity understanding and retrieval
WO2014035199A1 (en) User interface apparatus in a user terminal and method for supporting the same
WO2019177182A1 (ko) 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
WO2014035195A2 (en) User interface apparatus in a user terminal and method for supporting the same
EP4000016A1 (en) Method and apparatus for providing content based on knowledge graph
WO2022255632A1 (ko) Ux-bit를 이용한 자동 디자인 생성 인공신경망 장치 및 방법
WO2022164192A1 (ko) 사용자의 발화 입력에 관련된 추천 문장을 제공하는 디바이스 및 방법
WO2015178716A1 (en) Search method and device
WO2021246642A1 (ko) 폰트를 추천하는 방법 및 이를 구현하는 장치
KR101446154B1 (ko) 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법
WO2014044167A1 (en) Method and computer for indexing and searching structures
CN111538817A (zh) 人机交互方法和装置
WO2011068315A4 (ko) 최대 개념강도 인지기법을 이용한 최적의 데이터베이스 선택장치 및 그 방법
WO2024029939A1 (ko) Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
WO2020149655A1 (ko) 장치 속성에 기반한 공유 데이터의 제공 방법 및 그 전자 장치
WO2023132657A1 (ko) 상품 트렌드 예측 서비스 제공 장치, 방법 및 프로그램
KR102532216B1 (ko) Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
WO2017191877A1 (ko) 프로버넌스 관리를 위한 압축 장치 및 방법
WO2020141706A1 (en) Method and apparatus for generating annotated natural language phrases
WO2017094967A1 (ko) 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23850439

Country of ref document: EP

Kind code of ref document: A1