KR102240303B1 - Method and electronic device for producing natural language from data table - Google Patents

Method and electronic device for producing natural language from data table Download PDF

Info

Publication number
KR102240303B1
KR102240303B1 KR1020190178779A KR20190178779A KR102240303B1 KR 102240303 B1 KR102240303 B1 KR 102240303B1 KR 1020190178779 A KR1020190178779 A KR 1020190178779A KR 20190178779 A KR20190178779 A KR 20190178779A KR 102240303 B1 KR102240303 B1 KR 102240303B1
Authority
KR
South Korea
Prior art keywords
field
natural language
value
processing
virtual
Prior art date
Application number
KR1020190178779A
Other languages
Korean (ko)
Inventor
한일
Original Assignee
(주)제타큐브사이언스
한일
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)제타큐브사이언스, 한일 filed Critical (주)제타큐브사이언스
Priority to KR1020190178779A priority Critical patent/KR102240303B1/en
Application granted granted Critical
Publication of KR102240303B1 publication Critical patent/KR102240303B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Abstract

The present invention relates to a method for generating a natural language from a data table, and an electronic device for generating a natural language from a data table. According to an embodiment of the present invention, the method comprises the steps of: receiving, by a processor, setting information to generate a natural language for analyzing a data table comprising a plurality of fields; checking whether at least one or more natural language generating fields according to settings exist in a read data table; generating and feeding back at least one virtual field which is a natural language generating field which is not included in a data table read for natural language generation when a natural language generating field does not exist; and generating a natural language which analyzes the data table according to the settings in the presence of the natural language generation field. In the case of virtual field feedback, in the step of checking whether the natural language generation field exists, it is checked whether the natural language generation field exists in the data table including the virtual field. The step for generating natural language includes the steps of: generating an entire connecting word applied to all records in the natural language generation field according to a setting; and getting at least one of a field value and a field name of the natural language generation field according to the setting, wherein the field includes a field name and at least one or more field values. Also, provided is an electronic device for generating a natural language from a data table according to the method for generating a natural language from a data table. Therefore, the present invention is to eliminate the cost and time inefficiency that occurs in a collaborative system between a programmer and a data analysis expert.

Description

데이터 테이블로부터의 자연어 생성 방법 및 데이터 테이블로부터의 자연어 생성을 수행하는 전자 장치{METHOD AND ELECTRONIC DEVICE FOR PRODUCING NATURAL LANGUAGE FROM DATA TABLE}A method for generating natural language from a data table and an electronic device that performs natural language generation from a data table TECHNICAL FIELD [METHOD AND ELECTRONIC DEVICE FOR PRODUCING NATURAL LANGUAGE FROM DATA TABLE]

본 발명은 자연어 생성 방법 및 그를 수행하는 전자 장치, 그 중에서도 데이터 테이블로부터의 자연어 생성 방법 및 그 방식에 따라 데이터 테이블로부터의 자연어 생성을 수행하는 전자 장치에 관한 것이다. 구체적으로, 본 발명은 예컨대 사람이 데이터 테이블 등에 포함된 데이터의 의미 해석을 할 경우, 의미해석 규칙을 쉽게 자연어로 생성시키는 방법 및 그를 수행하는 전자장치에 관한 것으로서, 예를 들면, 전문 프로그래머가 아닌 데이터 분석 전문가라 하더라도 데이터를 분석 후에 해석한 결과를 쉽게 자연어로 생성할 수 있도록 지원 하기 위한 데이터 테이블로부터의 자연어 생성 방법 및 그 방법을 수행하는 전자장치에 관한 것이다.The present invention relates to a natural language generation method and an electronic device that performs the same, among others, to a natural language generation method from a data table, and an electronic device that performs natural language generation from a data table according to the method. Specifically, the present invention relates to a method for easily generating a semantic interpretation rule in natural language when a person interprets the meaning of data included in a data table, and an electronic device that performs the same. The present invention relates to a method for generating natural language from a data table and an electronic device that performs the method for supporting the data analysis expert to easily generate natural language results after analyzing data.

본 발명의 기술분야는 인공지능분야에서 자연어처리기술(Natural Language Processing)에 속한다. 자연어처리기술은 작성된 글에서 제품에 대한 사용자의 평가정보를 분석하는 오피니언 마이닝(Opinion Mining), 자연어 인터페이스를 제공해 사용 편의성을 향상시키는 예컨대 애플사의 시리(Siri)와 같은 퍼스널 어시스턴트(Personal Assistant)나 IBM사의 왓슨(Watson)과 같이 주어진 질문에 대한 정답을 제공하는 질의응답(Question Answering) 기술, 서비스에서 사용자가 즐겨 보는 글의 내용을 분석하여 선호하는 컨텐츠를 먼저 배치해 주는 큐레이션(Curation)기술 등이 있고, 게다가, 수치, 통계 등의 데이터를 사람들이 쉽게 이해할 수 있도록 자연스러운 글로 표현하는 자연어생성기술(Narrative Technology)도 있다. 이때, 본 발명은 자연어처리기술 중 자연어생성기술에 해당한다.The technical field of the present invention belongs to natural language processing technology in the field of artificial intelligence. Natural language processing technology includes Opinion Mining, which analyzes user's evaluation information for products in written text, and Personal Assistant such as Apple's Siri or IBM, which improves usability by providing a natural language interface. Question Answering technology that provides the correct answer to a given question, such as Watson of the company, Curation technology that analyzes the content of articles that users enjoy in the service and places their preferred content first, etc. In addition, there is also a natural language generation technology that expresses data such as numerical values and statistics in natural text so that people can easily understand them. At this time, the present invention corresponds to a natural language generation technology among natural language processing technologies.

자연어(Natural Language)는 인간이 일상 생활 속에서 서로 소통하기 위하여 사용되는 언어를 의미한다.Natural language refers to the language used by humans to communicate with each other in daily life.

종래에는 정보통신분야에서 데이터의 의미를 자연어로 생성하기 위해 프로그램에 예컨대 하드코딩하여 사용하고 있다. 예를 들면, “월소득이 얼마이다"라고 할 경우에 프로그램 소스 안에 “월소득이 ( )이다"라고 표현하고 “( )“값에 해당하는 값을 데이터에서 읽어서 표출하는 형태이다. 이러한 방법은 데이터의 의미를 해석하는 전문가가 문구를 작성하고, 전문가가 작성한 문구가 작성될 수 있도록 프로그래머가 개발하는 방법 즉, 데이터 분석 전문가와 프로그래머가 협업을 통하여 수행하는 방법이다.Conventionally, in the field of information and communication, in order to generate the meaning of data in a natural language, it is used, for example, by hard-coding it into a program. For example, in the case of “what is monthly income”, it is expressed as “monthly income is ()” in the program source, and the value corresponding to the “( )” value is read from the data and displayed. This method is a method developed by a programmer so that an expert who interprets the meaning of data writes a phrase and a phrase written by an expert can be written, that is, a method performed by a data analysis expert and a programmer through collaboration.

이러한 종래의 방식에서는, 적용업무에 따라 업무별 전문용어의 상이성과 데이타 해석 방법이 달라서, 자연어 생성을 위해서는 데이터분석 전문가와 프로그래머가 협업을 통해 항상 새로이 개발해야 함으로 시간과 비용이 많이 소요되는 단점이 있다.In such a conventional method, the difference in terminology and data interpretation method for each task are different depending on the applied task. Therefore, in order to generate natural language, a data analysis expert and a programmer must always develop a new one through collaboration, which takes a lot of time and cost. have.

또한, 종래에는 동일 컨텐츠를 한국어로 개발한 경우에 영어,일어로 적용하기 위해서는 처음부터 다시 개발해야 함으로 시간과 비용이 많이 소요되는 단점이 있다.In addition, conventionally, when the same content is developed in Korean, it takes a lot of time and cost because it has to be re-developed from the beginning in order to apply it in English or Japanese.

대한민국 공개특허공보 제10-2018-0077689호 (2018년 7월 9일 공개)Republic of Korea Patent Publication No. 10-2018-0077689 (published on July 9, 2018) 대한민국 공개특허공보 제10-2019-0019748호 (2019년 2월 27일 공개)Korean Patent Application Publication No. 10-2019-0019748 (published on February 27, 2019) 대한민국 공개특허공보 제10-2019-0011031호 (2019년 2월 1일 공개)Republic of Korea Patent Publication No. 10-2019-0011031 (published on February 1, 2019)

종래의 자연어 생성 방법의 단점을 극복하기 위하여 프로그래머와 데이터 해석 전문가의 협업 체계시 발생하는 비용과 시간의 비효율성을 제거하기 위하여 프로그래밍에 능숙치 못한 데이터 전문가 단독으로도 자연어를 생성시킬 수 있도록 할 뿐 만 아니라, 적용업무 종류에 상관없이, 게다가 한국어, 일본어, 영어 등 언어에 상관없이 쉽게 자연어를 범용적으로 생성할 수 있는 방법이 필요하게 되었다. In order to overcome the shortcomings of the conventional natural language generation method, in order to eliminate the cost and time inefficiency incurred when the programmer and data analysis expert collaborate, only a data expert who is not proficient in programming can generate natural language. In addition, there is a need for a method that can easily and universally generate natural language regardless of the type of work applied, and regardless of languages such as Korean, Japanese, and English.

종래의 자연어 생성 방법에 있어서, 자연어 생성시 적용업무마다 매번 처음부터 다시 새롭게 구현해야 하는 문제를 해결하고 업무에 관계없이 범용적인 자연어 생성 방법을 제시하여 이를 해결하고자 한다. 게다가, 프로그래밍에 능숙하지 못하는 인력이 복잡한 프로그래밍없이 자연어 생성을 위한 간단한 조작만으로 자연어 생성을 위한 프로그래밍이 자동적으로 생성되는 방법으로 이를 해결하고자 한다. In the conventional natural language generation method, it is intended to solve the problem that needs to be re-implemented from the beginning every time when natural language is generated, and by presenting a general natural language generation method irrespective of the task. In addition, it is intended to solve this problem by a method in which programming for natural language generation is automatically generated by simple manipulations for natural language generation without complicated programming by personnel who are not proficient in programming.

전술한 목적을 달성하기 위하여, 본 발명의 하나의 모습에 따라, 프로세서에서, 다수의 필드를 포함하는 데이터 테이블을 분석하는 자연어를 생성하기 위하여 설정 사항을 입력받는 단계; 읽어들인 데이터 테이블에 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 존재하는지를 확인하는 단계, 자연어생성 필드는 자연어를 생성하는 대상이 되는 필드임; 자연어생성 필드의 부존재 시 자연어 생성을 위하여 읽어들인 데이터 테이블에 포함되지 않은 자연어생성 필드인 적어도 하나 이상의 가상필드를 생성하고 피드백하는 단계; 및 자연어생성 필드의 존재 시 프로세서에서 설정 사항에 따라 데이터 테이블을 분석하는 자연어를 생성하는 단계를 포함하고, 가상필드의 피드백의 경우 자연어생성 필드가 존재하는지를 확인하는 단계에서, 가상필드가 포함되는 데이터 테이블에 자연어생성 필드가 존재하는지를 확인하고, 자연어를 생성하는 단계는: 설정 사항에 따라 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하는 단계; 및 설정 사항에 따른 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져오는 단계를 포함하고, 필드는 필드명 및 적어도 하나 이상의 필드 값을 포함하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성 방법이 제안된다.In order to achieve the above object, in accordance with one aspect of the present invention, the method comprising: receiving, in a processor, setting items to generate a natural language for analyzing a data table including a plurality of fields; Checking whether at least one or more natural language generation fields according to setting items exist in the read data table, the natural language generation field being a field to generate natural language; Generating and feeding back at least one virtual field that is a natural language generation field that is not included in a data table read for natural language generation when the natural language generation field does not exist; And generating a natural language for analyzing the data table according to the settings in the processor when the natural language generation field exists, and in the step of checking whether the natural language generation field exists in the case of feedback from the virtual field, data including the virtual field The step of checking whether the natural language generation field exists in the table and generating the natural language may include: generating a global connection word applied to the entire record of the natural language generation field according to the settings; And obtaining at least one or more of a field value and a field name of a natural language generation field according to a setting, wherein the field includes a field name and at least one field value. Is suggested.

하나의 예에서, 설정 사항을 입력받는 단계에서 설정 사항은 자연어를 생성하기 위한 자연어 생성기준을 포함하고, 자연어 생성기준은 전체 연결어에 관한 사항 및 자연어생성 필드에 관한 사항을 포함하고, 자연어생성 필드에 관한 사항은 자연어생성 필드에서 필드 값 가져오기, 필드 값 호출조건에 부합하는 자연어생성 필드의 필드명 가져오기 중 적어도 하나 이상을 포함하고, 자연어생성 필드가 존재하는지를 확인하는 단계에서 확인대상 필드는 필드 값 가져오기의 대상이 되는 필드, 필드 값 호출조건에 포함된 필드 값을 보유하는 필드 중 어느 하나 이상일 수 있다.In one example, in the step of receiving the setting items, the setting items include the natural language generation criteria for generating natural language, the natural language generation criteria include all related words and the natural language generation field, and the natural language generation field The matters on include at least one of getting a field value from a natural language generation field and getting a field name of a natural language generation field that meets the field value calling condition, and in the step of checking whether a natural language generation field exists, the field to be checked is It may be any one or more of a field to which the field value is fetched or a field that holds a field value included in a field value call condition.

이때, 하나의 예에서, 가상필드 각각은 확인대상 필드의 부존재 시 생성되는 필드로서, 데이터 테이블의 적어도 하나 이상의 필드의 필드 값을 처리, 가공 내지 평가하여 생성되는 필드 값을 보유하고, 필드 값 처리는 2이상의 필드의 수치 필드 값의 연산처리, 하나의 필드에서의 수치 필드 값의 표준화, 이격도 내지 순위 처리 중의 하나이고, 필드 값 가공은 기존 필드 내지 필드 값 처리에 의해 생성된 필드에서, 적어도 2 이상의 필드 값의 그룹화를 이용한 필드 값에 대한 재분류 가공 내지 하나의 필드의 필드 값과 동일한 그룹의 다른 수치 필드의 필드 값에 대한 평균 내지 표준화 가공이고, 필드 값 평가는 기존 필드, 필드 값 처리에 의해 생성된 필드, 필드 값 가공에 의해 생성된 필드 중 어느 하나 이상에서 적어도 수치 필드 값을 보유하는 하나 이상의 필드에 대해 수치 필드 값의 범위에 기반한 평가이고, 필드 값 가공 내지 필드 값 평가는 설정 사항을 입력받는 단계에서 설정 사항에 포함되는 가상필드 생성기준에 따라 수행되고, 필드 값 처리는 생성되는 가상필드명에 대한 미리 설정된 정의에 따라 또는 사용자의 설정에 따라 수행될 수 있다.In this case, in one example, each virtual field is a field created when the field to be checked does not exist, and holds field values generated by processing, processing, or evaluating field values of at least one field of the data table, and field value processing Is one of arithmetic processing of numerical field values of two or more fields, standardization of numerical field values in one field, separation degree or rank processing, and field value processing is at least 2 in fields created by processing existing fields or field values. Field values are reclassified using the grouping of the above field values, or averaged or standardized processing for field values of one field value and another numerical field in the same group, and field value evaluation is used to process existing fields and field values. For one or more fields that have at least a numeric field value in one or more of the fields generated by the field generated by and the field generated by field value processing, it is an evaluation based on the range of the numeric field value, and field value processing or field value evaluation is a setting item. In the step of receiving the input, it is performed according to the virtual field creation criterion included in the setting items, and field value processing may be performed according to a preset definition for the generated virtual field name or according to a user's setting.

이때, 또 하나의 예에서, 수치 필드 값의 연산처리는 연산자를 이용한 연산자 연산이고, 수치 필드 값의 표준화 처리는 하나의 필드에서 백분위 점수, Z 점수, T 점수 및 해당 점수로부터 변환된 변환 점수를 이용한 표준화 처리이고, 수치 필드 값의 이격도 처리는 하나의 필드에서 평균값, 최대값, 최소값 및 중위수 중 어느 하나를 기준값으로 하는 이격도 값 내지 이격도 증감율을 이용한 이격도 처리이고, 수치 필드 값의 순위 처리는 하나의 필드에서 오름차순 순위, 내림차순 순위, 현재자료 상의 순번 순위 중 어느 하나에 따른 처리이고, 수치 필드 값의 표준화, 이격도 및 순위 처리의 대상인 필드는 기존 필드 내지 연산처리에 따라 생성된 필드이고, 필드 값에 대한 재분류 가공은 재분류에 따른 문자 가공 내지 재분류에 따른 수치 가공이고, 필드 값 처리 및 필드 값 가공 중 평균 내지 표준화 가공과 필드 값에 대한 재분류 가공 중의 수치 가공 각각은 수치값 가상필드를 생성하고, 필드 값에 대한 재분류 가공 중 문자 가공 및 필드 값 평가 각각은 디멘젼 가상필드를 생성할 수 있다.At this time, in another example, the operation processing of the numerical field value is an operator operation using an operator, and the standardization processing of the numerical field value is the percentile score, Z score, T score, and the converted score converted from the corresponding score in one field. This is the standardization processing used, and the separation processing of numerical field values is the separation processing using either the average value, the maximum value, the minimum value, and the median number as a reference value or the separation rate increase/decrease rate in one field, and the ranking processing of the numerical field value is one The field is processed according to any one of the ascending order, descending order, and order order in the current data, and the fields subject to standardization of numerical field values, separation degree, and ranking processing are fields created according to existing fields or calculation processing, and field values The reclassification processing for reclassification is character processing according to reclassification or numerical processing according to reclassification, and average or standardization processing during field value processing and field value processing, and numerical processing during reclassification processing for field values, respectively, are numerical values virtual fields. And, each of the character processing and field value evaluation during reclassification processing for the field value can create a dimension virtual field.

또한, 하나의 예에서, 필드 값 호출조건은 필드의 특정값과의 일치, 2이상의 특정값 중의 선택적 일치, 필드 값 특정범위의 만족 중 어느 하나에 관한 것이고, 자연어를 생성하는 단계에서 자연어 생성기준에 포함되는 처리순위에 따라 자연어를 생성하고, 자연어를 생성하는 단계는 생성되는 자연어 문장이 종결된 경우에 다음 문장을 위하여 줄을 바꾸는 과정을 포함할 수 있다.In addition, in one example, the field value calling condition relates to any one of matching with a specific value of a field, selective matching of two or more specific values, and satisfaction of a specific range of field values, and natural language generation criteria in the step of generating natural language. Generating the natural language according to the processing order included in the and generating the natural language may include a process of changing a line for the next sentence when the generated natural language sentence is terminated.

또 하나의 예에서, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 하나의 가상필드 생성 후 생성된 가상필드에 대한 자연어를 생성하는 과정을 반복할 수 있다.In another example, when there are a plurality of natural language generating fields and a plurality of generated virtual fields, a process of generating a natural language for the generated virtual field after generating one virtual field may be repeated.

또한 하나의 예에서, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 다수의 가상필드의 생성 후 생성된 다수의 가상필드를 포함한 다수의 자연어생성 필드에 대하여 자연어를 생성할 수 있다.In addition, in an example, when there are a plurality of natural language generation fields and a plurality of virtual fields to be generated, natural language may be generated for a plurality of natural language generation fields including a plurality of virtual fields generated after the generation of the plurality of virtual fields.

다음으로, 전술한 목적을 달성하기 위하여, 본 발명의 또 하나의 모습에 따라, 적어도 하나의 프로세서를 포함하는 전자 장치에 있어서, 프로세서는, 다수의 필드를 포함하는 데이터 테이블을 분석하는 자연어를 생성하기 위하여 설정 사항을 입력받고, 읽어들인 데이터 테이블에 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 존재하는지를 확인하고, 자연어생성 필드는 자연어를 생성하는 대상이 되는 필드이고, 자연어생성 필드의 부존재 시 자연어 생성을 위하여 읽어들인 데이터 테이블에 포함되지 않은 자연어생성 필드인 적어도 하나 이상의 가상필드를 생성하여 피드백하고, 가상필드의 피드백의 경우 가상필드가 포함되는 데이터 테이블에 자연어생성 필드가 존재하는지를 확인하고, 자연어생성 필드의 존재 시 설정 사항에 따라 데이터 테이블을 분석하는 자연어를 생성하되, 설정 사항에 따라 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하는 과정과 설정 사항에 따른 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져오는 과정을 포함하여 자연어를 생성하고, 필드는 필드명 및 적어도 하나 이상의 필드 값을 포함하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치가 제안된다.Next, in order to achieve the above object, according to another aspect of the present invention, in an electronic device including at least one processor, the processor generates a natural language for analyzing a data table including a plurality of fields. In order to do so, it receives the setting information, checks whether at least one natural language generation field according to the setting item exists in the read data table, and the natural language generation field is a field to generate natural language, and when the natural language generation field does not exist, natural language At least one virtual field, which is a natural language generation field not included in the data table read for generation, is generated and fed back, and in the case of virtual field feedback, it is checked whether a natural language generation field exists in the data table containing the virtual field, and natural language In the presence of the generated field, a natural language that analyzes the data table is generated according to the settings, but the process of creating a global link that is applied to the entire record of the natural language generation field according to the settings and the field value of the natural language generation field according to the settings , An electronic device for generating natural language from a data table, characterized in that a natural language is generated including a process of obtaining at least one of the field names, and the field includes a field name and at least one field value is proposed. .

하나의 예에서, 프로세서에서 입력받는 설정 사항은 자연어를 생성하기 위한 자연어 생성기준을 포함하고, 자연어 생성기준은 전체 연결어에 관한 사항 및 자연어생성 필드에 관한 사항을 포함하고, 자연어생성 필드에 관한 사항은 자연어생성 필드에서 필드 값 가져오기, 필드 값 호출조건에 부합하는 자연어생성 필드의 필드명 가져오기 중 적어도 하나 이상을 포함하고, 프로세서에서 존재여부 확인대상이 되는 자연어생성 필드인 확인대상 필드는 필드 값 가져오기의 대상이 되는 필드, 필드 값 호출조건에 포함된 필드 값을 보유하는 필드 중 어느 하나 이상일 수 있다.In one example, the settings received from the processor include natural language generation criteria for generating natural language, and the natural language generation criteria include information on all linked words and natural language generation fields, and details on natural language generation fields. Includes at least one of getting a field value from a natural language generation field and getting a field name of a natural language generation field that meets the condition of calling the field value, and the field to be checked, which is a natural language generation field to be checked for existence in the processor, is a field. It may be one or more of a field that is a target of getting a value or a field that holds a field value included in a field value calling condition.

이때, 하나의 예에서, 프로세서는 확인대상 필드의 부존재 시, 데이터 테이블의 적어도 하나 이상의 필드의 필드 값을 처리, 가공 내지 평가하여 생성되는 필드 값을 보유하는 가상필드를 생성하고, 필드 값 처리는 2이상의 필드의 수치 필드 값의 연산처리, 하나의 필드에서의 수치 필드 값의 표준화, 이격도 내지 순위 처리 중의 하나이고, 필드 값 가공은 기존 필드 내지 필드 값 처리에 의해 생성된 필드에서, 적어도 2 이상의 필드 값의 그룹화를 이용한 필드 값에 대한 재분류 가공 내지 하나의 필드의 필드 값과 동일한 그룹의 다른 수치 필드의 필드 값에 대한 평균 내지 표준화 가공이고, 필드 값 평가는 기존 필드, 필드 값 처리에 의해 생성된 필드, 필드 값 가공에 의해 생성된 필드 중 어느 하나 이상에서 적어도 수치 필드 값을 보유하는 하나 이상의 필드에 대해 수치 필드 값의 범위에 기반한 평가이고, 필드 값 가공 내지 필드 값 평가는 입력받은 설정 사항에 포함되는 가상필드 생성기준에 따라 수행되고, 필드 값 처리는 생성되는 가상필드명에 대한 미리 설정된 정의에 따라 또는 사용자의 설정에 따라 수행될 수 있다.In this case, in one example, the processor creates a virtual field that holds the field value generated by processing, processing, or evaluating the field value of at least one field of the data table when the field to be checked does not exist, and the field value processing is It is one of arithmetic processing of numerical field values of two or more fields, standardization of numerical field values in one field, separation degree or rank processing, and field value processing is at least two or more in fields created by processing existing fields or field values. Field values are reclassified using grouping of field values, or averaged or standardized for field values of one field value and another numerical field in the same group, and field value evaluation is performed by processing existing fields and field values. Evaluation based on the range of numerical field values for one or more fields that have at least a numerical field value in one or more of the generated fields and fields created by field value processing, and field value processing or field value evaluation are input settings It is performed according to the virtual field generation criterion included in the item, and field value processing may be performed according to a preset definition for the generated virtual field name or according to a user's setting.

이때, 또 하나의 예에서, 수치 필드 값의 연산처리는 연산자를 이용한 연산자 연산이고, 수치 필드 값의 표준화 처리는 하나의 필드에서 백분위 점수, Z 점수, T 점수 및 해당 점수로부터 변환된 변환 점수를 이용한 표준화 처리이고, 수치 필드 값의 이격도 처리는 하나의 필드에서 평균값, 최대값, 최소값 및 중위수 중 어느 하나를 기준값으로 하는 이격도 값 내지 이격도 증감율을 이용한 이격도 처리이고, 수치 필드 값의 순위 처리는 하나의 필드에서 오름차순 순위, 내림차순 순위, 현재자료 상의 순번 순위 중 어느 하나에 따른 처리이고, 수치 필드 값의 표준화, 이격도 및 순위 처리의 대상인 필드는 기존 필드 내지 연산처리에 따라 생성된 필드이고, 필드 값에 대한 재분류 가공은 재분류에 따른 문자 가공 내지 재분류에 따른 수치 가공이고, 프로세서는 필드 값 처리 및 필드 값 가공 중 평균 내지 표준화 가공과 필드 값에 대한 재분류 가공 중의 수치 가공 각각에 따라 수치값 가상필드를 생성하고, 필드 값에 대한 재분류 가공 중 문자 가공 및 필드 값 평가 각각에 따라 디멘젼 가상필드를 생성할 수 있다.At this time, in another example, the operation processing of the numerical field value is an operator operation using an operator, and the standardization processing of the numerical field value is the percentile score, Z score, T score, and the converted score converted from the corresponding score in one field. This is the standardization processing used, and the separation processing of numerical field values is the separation processing using either the average value, the maximum value, the minimum value, and the median number as a reference value or the separation rate increase/decrease rate in one field, and the ranking processing of the numerical field value is one The field is processed according to any one of the ascending order, descending order, and order order in the current data, and the fields subject to standardization of numerical field values, separation degree, and ranking processing are fields created according to existing fields or calculation processing, and field values The reclassification processing for reclassification is character processing according to reclassification or numerical processing according to reclassification, and the processor is numerical processing according to the average or standardization processing during field value processing and field value processing, and numerical processing during reclassification processing for field values. A value virtual field can be created, and a dimension virtual field can be created according to each character processing and field value evaluation during reclassification processing for the field value.

또한, 하나의 예에서, 필드 값 호출조건은 필드의 특정값과의 일치, 2이상의 특정값 중의 선택적 일치, 필드 값 특정범위의 만족 중 어느 하나에 관한 것이고, 프로세서는 자연어 생성기준에 포함되는 처리순위에 따라 자연어를 생성하고, 프로세서는, 생성되는 자연어 문장이 종결된 경우에 다음 문장을 위하여 줄을 바꾸는 과정을 수행할 수 있다.In addition, in one example, the field value calling condition relates to any one of matching with a specific value of the field, selective matching among two or more specific values, and satisfying a specific range of the field value, and the processor is processed to be included in the natural language generation criteria. The natural language is generated according to the ranking, and the processor may perform a process of changing lines for the next sentence when the generated natural language sentence is terminated.

또 하나의 예에서, 프로세서는, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 하나의 가상필드 생성 후 생성된 가상필드에 대한 자연어를 생성하는 과정을 반복할 수 있다. 또는, 다른 예에서, 프로세서는, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 다수의 가상필드의 생성 후 생성된 다수의 가상필드를 포함한 다수의 자연어생성 필드에 대하여 자연어를 생성할 수 있다.In another example, when there are a plurality of natural language generation fields and a plurality of generated virtual fields, the processor may repeat the process of generating a natural language for the generated virtual field after generating one virtual field. Alternatively, in another example, the processor may generate natural language for a plurality of natural language generation fields including a plurality of virtual fields generated after generation of a plurality of virtual fields, when there are a plurality of natural language generation fields and a plurality of virtual fields to be generated. I can.

본 발명의 하나의 예에 따라 프로그래밍에 능숙치 못한 비 전산인력, 예컨대 데이터 분석가가 복잡한 프로그래밍 없이 자연어 생성을 위한 간단한 조작만으로 자연어 생성을 위한 프로그래밍이 자동적으로 생성되는 방법으로 수행하여 시간의 최소화, 작업 비용의 최소화를 달성할 수 있는 장점이 있다. According to an example of the present invention, non-computational personnel who are not proficient in programming, such as a data analyst, perform programming for natural language generation automatically with a simple operation for natural language generation without complex programming to minimize time and work. There is an advantage in that minimization of cost can be achieved.

게다가 종래에 자연어 생성시 적용업무마다 매번 처음부터 다시 새롭게 구현해야 하는 문제를 해결하여 업무에 관계없이 범용적인 자연어 생성 방법을 제시하여 타 업무에 쉽게 적용할 수 있어 시간과 비용의 최소화를 달성할 수 있는 장점이 있다.In addition, by solving the problem of re-implementing the conventional natural language creation every time applied from the beginning, it can be easily applied to other tasks by presenting a general natural language generation method regardless of the task, thus minimizing time and cost. There is an advantage.

또한, 한국어, 영어, 중국어, 일본어 등 언어의 배열 순서와 문자의 상이성으로 특정업무에 자연어를 생성해도 타언어로 적용하기 위해서는 처음부터 다시 개발해야 하는 문제를 해결하여, 언어에 상관없이 자연어를 쉽게 생성할 수 있는 범용적인 자연어 생성 방법을 제시하여 시간과 비용의 최소화를 달성할 수 있는 장점이 있다.In addition, even if a natural language is generated for a specific task due to the difference in the order of arrangement of languages such as Korean, English, Chinese, Japanese, etc., in order to apply it to another language, the problem of having to be re-developed from the beginning has been solved. There is an advantage of minimizing time and cost by presenting a general-purpose natural language generation method that can be easily generated.

도 1은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법을 개략적으로 나타내는 순서도이다.
도 2는 본 발명의 또 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법을 개략적으로 나타내는 순서도이다.
도 3은 본 발명의 또 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법을 개략적으로 나타내는 순서도이다.
도 4a는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 4b는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 4c는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 4d는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 4e는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 4f는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 4g는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 5a는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 5a는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 5b는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 5c는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 5d는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 5e는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 5f는 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 또 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.
도 6은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치를 나타내는 개략적인 도면이다.
도 7은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치의 프로세서를 나타내는 개략적인 구성도이다.
1 is a flowchart schematically illustrating a method of generating natural language from a data table according to an embodiment of the present invention.
2 is a flowchart schematically illustrating a method of generating natural language from a data table according to another embodiment of the present invention.
3 is a flowchart schematically illustrating a method of generating natural language from a data table according to another embodiment of the present invention.
4A is a diagram schematically illustrating generation of one virtual field in a method for generating natural language from a data table according to an embodiment of the present invention.
4B is a diagram schematically illustrating another virtual field generation in a natural language generation method from a data table according to an embodiment of the present invention.
4C is a diagram schematically illustrating another virtual field generation in a natural language generation method from a data table according to an embodiment of the present invention.
4D is a diagram schematically illustrating another virtual field generation in a natural language generation method from a data table according to an embodiment of the present invention.
4E is a diagram schematically illustrating another virtual field generation in a natural language generation method from a data table according to an embodiment of the present invention.
4F is a diagram schematically illustrating another virtual field generation in a natural language generation method from a data table according to an embodiment of the present invention.
4G is a diagram schematically illustrating another virtual field generation in a natural language generation method from a data table according to an embodiment of the present invention.
5A is a diagram schematically illustrating a natural language generation in a method of generating a natural language from a data table according to an embodiment of the present invention.
5A is a diagram schematically illustrating a natural language generation in a method of generating a natural language from a data table according to an embodiment of the present invention.
5B is a diagram schematically illustrating another natural language generation in a natural language generation method from a data table according to an embodiment of the present invention.
5C is a diagram schematically illustrating another natural language generation in a natural language generation method from a data table according to an embodiment of the present invention.
5D is a diagram schematically illustrating another natural language generation in a natural language generation method from a data table according to an embodiment of the present invention.
5E is a diagram schematically illustrating another natural language generation in a natural language generation method from a data table according to an embodiment of the present invention.
5F is a diagram schematically illustrating another natural language generation in a natural language generation method from a data table according to an embodiment of the present invention.
6 is a schematic diagram illustrating an electronic device for generating natural language from a data table according to an embodiment of the present invention.
7 is a schematic configuration diagram illustrating a processor of an electronic device that generates natural language from a data table according to an embodiment of the present invention.

전술한 과제를 달성하기 위한 본 발명의 실시예들이 첨부된 도면을 참조하여 설명될 것이다. 본 설명에 있어서, 동일부호는 동일한 구성을 의미하고, 당해 분야의 통상의 지식을 가진 자에게 본 발명의 특징에 대한 이해를 도모하기 위하여 부차적인 설명은 생략될 수도 있다.Embodiments of the present invention for achieving the above object will be described with reference to the accompanying drawings. In the present description, the same reference numerals mean the same configuration, and a secondary description may be omitted in order to promote an understanding of the features of the present invention to those of ordinary skill in the art.

본 명세서에서 하나의 구성요소가 다른 구성요소와의 관계에서 연결 내지 결합 등의 결합관계, 또는 전송 내지 이송 등의 전달관계 등을 형성하는 경우 '직접'이라는 한정이 없는 이상, '직접적인' 결합관계 내지 전달관계 등의 형태뿐만 아니라 그들 사이에 또 다른 구성요소가 관계됨으로써 매개체에 의한 결합관계 내지 경유되는 전달관계 등의 형태로도 존재할 수 있다. 또한, '상에', '위에', '하부에', '아래에' 등의 '접촉'의 의미를 내포할 수 있는 용어들이 포함된 경우도 마찬가지이다. 게다가, 방향을 나타내는 용어들은 기준이 되는 요소에 대한 상대적 개념으로 해석되어야 한다.In the present specification, when one component forms a coupling relationship such as connection or coupling in a relationship with another component, or a transmission relationship such as transmission or transfer, unless there is a limitation of'direct', a'direct' coupling relationship Not only in the form of a transmission relationship, but also in the form of a coupling relationship by a medium or a transmission relationship through a transmission relationship, as another component is related therebetween. In addition, the same applies when terms that can imply the meaning of'contact' such as'top','above','bottom', and'below' are included. In addition, terms indicating direction should be interpreted as a relative concept to the element on which they are referenced.

또한, 본 명세서에서 비록 단수로 표현된 구성일지라도, 발명의 개념에 반하거나 모순되게 해석되지 않는 이상 복수의 구성들 전체를 대표하는 개념으로 사용될 수 있다는 점에 유의하여야 한다.In addition, it should be noted that even though the configuration is expressed in the singular in the present specification, it may be used as a concept representing all of a plurality of configurations unless interpreted contrary to or contradictory to the concept of the invention.

게다가, 본 명세서에서 '포함하다', '포함하여 이루어진다' 등의 단어 및 그들로부터 파생된 용어의 기재는 본래의 요소 내지 요소들에 하나 또는 그 이상의 다른 구성요소의 부가, 조합 내지 결합의 가능성을 배제하지 않으며, 나아가, '구비하다', '구성되다' 등의 의미를 갖는 단어 및 그들로부터 파생된 용어의 기재도 본래의 요소 내지 요소들에 하나 또는 그 이상의 다른 구성요소의 부가, 조합 내지 결합에 의하여 본래의 요소 내지 요소들이 자신의 특징, 기능 및/또는 성질이 상실되지 않는 경우라면 그러한 하나 또는 그 이상의 다른 구성요소의 부가 내지 결합 가능성이 배제되지 않아야 한다.In addition, in this specification, the description of words such as'comprise' and'comprising' and terms derived therefrom may indicate the possibility of addition, combination, or combination of one or more other elements to the original element or elements. It is not excluded, and further, the description of words having meanings such as'to have','to be composed', and terms derived from them are also the addition, combination, or combination of one or more other elements to the original elements or elements. The possibility of addition or combination of one or more other components should not be excluded if the original element or elements are not lost in their features, functions, and/or properties.

본 발명은 종래의 자연어 생성 방법의 단점을 극복하기 위하여 프로그래머와 데이터 해석 전문가의 협업 체계시 발생하는 비용과 시간의 비효율성을 제거하기 위하여 프로그래밍에 능숙치 않은 데이터 전문가 단독으로도 자연어를 생성시킬 수 있도록 할 뿐 만 아니라, 적용업무 종류에 상관없이, 한국어,일본어,영어 등 언어에 상관없이 쉽게 자연어를 범용적으로 생성할 수 있도록 한 것이다. 본 발명에서는, 종래의 자연어 생성 방법에 있어서 자연어 생성시 적용업무마다 매번 처음부터 다시 새롭게 구현해야 하는 문제, 예를 들면, 증시 관련 자연어를 생성하기 위해서는 증시 관련 전문용어 등을 반영한 자연어를 생성하여야 하고, 상권분석 관련 자연어를 생성하기 위해서는 상권분석 관련 전문용어 등을 반영한 자연어를 생성하여야 하고, 영업점 특성 분석 관련 자연어를 생성하기 위해서는 영업점 관련 전문용어등을 반영한 자연어를 생성하여야 함에 따라 기존에 만들어진 자연어 생성 알고리즘을 타 분야에 적용할 수 없는 문제를 해결하고, 복잡한 프로그래밍 없이 자연어 생성을 위한 간단한 조작만으로 자연어 생성을 위한 프로그래밍이 자동적으로 생성되는 방법을 제시하여 업무에 관계없이 범용적인 자연어 생성이 가능한 기술을 제시한다. 또한, 종래의 자연어 생성 방법에 있어서 한국어, 영어, 중국어, 일본어등 언어의 배열 순서와 문자의 상이성으로 특정 회사에서 특정업무에 자연어를 생성해도 타언어로 적용하기 위해서는 처음부터 다시 개발해야 하는 문제가 있었으나, 본 발명에서 언어에 상관없이 자연어를 쉽게 생성할 수 있는 범용적인 자연어 생성 방법을 제시하여 이를 해결하고자 한다.In the present invention, in order to overcome the shortcomings of the conventional natural language generation method, in order to eliminate the cost and time inefficiency incurred when a programmer and a data interpretation expert collaborate, a natural language can be generated even by a data expert who is not proficient in programming. Not only does it not only make it possible, but it also makes it possible to create natural language universally, regardless of the type of work applied, regardless of language such as Korean, Japanese, or English. In the present invention, in the conventional natural language generation method, a problem that needs to be re-implemented from the beginning for each application task when natural language is generated, for example, in order to generate a stock market-related natural language, a natural language that reflects stock market-related terminology should be generated. In order to generate natural language related to commercial area analysis, natural language should be generated that reflects terminology related to commercial area analysis, and natural language that reflects technical terms related to business area must be generated to generate natural language related to business area analysis. It solves the problem that the algorithm cannot be applied to other fields, and proposes a method that automatically generates programming for natural language generation with simple manipulation for natural language generation without complex programming, thus providing a technology that enables general natural language generation regardless of work. present. In addition, in the conventional natural language generation method, even if a specific company generates a natural language for a specific task due to the difference in the order of arrangement of languages such as Korean, English, Chinese, and Japanese, it is a problem that needs to be re-developed from the beginning in order to apply it to other languages. However, in the present invention, a general natural language generation method capable of easily generating natural language regardless of language is proposed to solve this problem.

[자연어 생성 방법][How to generate natural language]

먼저, 본 발명의 하나의 예에 따른 데이터 테이블로부터의 자연어 생성 방법을 도면을 참조하여 구체적으로 살펴보도록 한다. 이때, 후술되는 발명의 하나의 예에 따른 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치에 대한 설명이 참조될 수 있다.First, a method of generating natural language from a data table according to an example of the present invention will be described in detail with reference to the drawings. In this case, a description of an electronic device that generates natural language from a data table according to an example of the invention to be described later may be referred to.

도 1은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법을 개략적으로 나타내는 순서도이고, 도 2는 본 발명의 또 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법을 개략적으로 나타내는 순서도이고, 도 3은 본 발명의 또 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법을 개략적으로 나타내는 순서도이다. 도 4a 내지 4g 각각은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 하나의 가상필드 생성에 관한 개략적인 설명을 나타내는 도면이고, 도 5a 내지 5f 각각은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성 방법에서 하나의 자연어 생성에 관한 개략적인 설명을 나타내는 도면이다.1 is a flowchart schematically illustrating a method of generating natural language from a data table according to an embodiment of the present invention, and FIG. 2 is a schematic flowchart illustrating a method of generating natural language from a data table according to another embodiment of the present invention. FIG. 3 is a flowchart schematically illustrating a method of generating natural language from a data table according to another embodiment of the present invention. Each of FIGS. 4A to 4G is a diagram showing a schematic description of the generation of one virtual field in a method for generating natural language from a data table according to an embodiment of the present invention, and each of FIGS. 5A to 5F is an implementation of the present invention. A diagram schematically illustrating the generation of one natural language in a method of generating a natural language from a data table according to an example.

도 1 내지 3을 참조하면, 하나의 예에 따른 데이터 테이블로부터의 자연어 생성 방법은 프로세서(도 6 내지 7의 도면부호 10 참조), 예컨대 적어도 하나 이상의 프로세서(10)를 구비하는 전자장치(도 6의 도면부호 1 참조)의 프로세서(10)에서 수행될 수 있다. 이때, 전자장치(1)는 PC, 노트북, 태블릿, 휴대용단말이 될 수 있고, 그들을 포함하는 시스템장치일 수도 있다.1 to 3, a method of generating a natural language from a data table according to an example includes a processor (refer to reference numeral 10 in FIGS. 6 to 7), for example, an electronic device having at least one processor 10 (FIG. 6). It may be performed in the processor 10 of (see reference numeral 1). In this case, the electronic device 1 may be a PC, notebook, tablet, or portable terminal, or may be a system device including them.

도 1 내지 3을 참조하면, 하나의 예에 따른 데이터 테이블로부터의 자연어 생성 방법은 설정사항 입력단계(S100, S100'), 자연어생성 필드 존재확인 단계(S200, S200'), 가상필드 생성단계(S300, S300') 및 자연어 생성단계(S400, S400', S400")를 포함하여 이루어질 수 있다. 설정사항 입력단계(S100, S100')에서는, 프로세서(10)에서, 다수의 필드를 포함하는 데이터 테이블을 분석하는 자연어를 생성하기 위하여 설정 사항을 입력받는다. 자연어생성 필드 존재확인 단계(S200, S200')에서는, 프로세서(10)에서, 읽어들인 데이터 테이블에 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 존재하는지를 확인한다. 이때, 자연어생성 필드는 자연어를 생성하는 대상이 되는 필드이다. 가상필드 생성단계(S300, S300')에서는, 프로세서(10)에서, 자연어생성 필드의 부존재 시 자연어 생성을 위하여 읽어들인 데이터 테이블에 포함되지 않은 자연어생성 필드인 적어도 하나 이상의 가상필드를 생성하고 피드백한다. 자연어 생성단계(S400, S400')에서는, 프로세서(10)에서, 자연어생성 필드의 존재 시 프로세서(10)에서 설정 사항에 따라 데이터 테이블을 분석하는 자연어를 생성한다. 이때, 가상필드의 피드백의 경우 자연어생성 필드가 존재하는지를 확인하는 단계(S200, S200')에서, 프로세서(10)는, 가상필드가 포함되는 데이터 테이블에 자연어생성 필드가 존재하는지를 확인한다. 이때, 필드는 필드명 및 적어도 하나 이상의 필드 값을 포함한다.1 to 3, a method of generating a natural language from a data table according to an example includes inputting settings (S100, S100'), checking the existence of a natural language generation field (S200, S200'), and generating a virtual field ( S300, S300') and the natural language generation step (S400, S400', S400"). In the setting information input step (S100, S100'), in the processor 10, data including a plurality of fields In order to generate a natural language that analyzes the table, setting items are input In the step of confirming the existence of the natural language generation field (S200, S200'), at least one or more natural language generation fields according to settings in the read data table in the processor 10 At this time, the natural language generation field is a field that is a target for generating natural language In the virtual field generation step (S300, S300'), in the processor 10, for natural language generation when the natural language generation field does not exist, At least one virtual field, which is a natural language generation field not included in the read data table, is generated and fed back In the natural language generation step (S400, S400'), in the processor 10, when the natural language generation field exists, the processor 10 Generates a natural language that analyzes the data table according to the settings in. At this time, in the step of checking whether the natural language generation field exists in the case of feedback of a virtual field (S200, S200'), the processor 10 includes a virtual field. It is checked whether a natural language generation field exists in the data table to be used, in which case, the field includes a field name and at least one field value.

또한, 자연어 생성단계(S400, S400')는 전체연결어 생성단계(S410, S410') 및 필드값/필드명 가져오기 단계(S430, S430')를 포함한다. 전체연결어 생성단계(S410, S410')에서는, 설정 사항에 따라 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하고, 필드값/필드명 가져오기 단계(S430, S430')에서는 설정 사항에 따른 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져온다.In addition, the natural language generation step (S400, S400') includes a whole connection word generation step (S410, S410') and a field value/field name import step (S430, S430'). In the whole connection word generation step (S410, S410'), a global connection word that is applied to the entire record of the natural language generation field is generated according to the settings, and in the field value/field name import step (S430, S430'), the settings are At least one of a field value and a field name of the corresponding natural language generation field is retrieved.

도면을 참조하여 각 단계별로 구체적으로 살펴보도록 한다.Let's look at each step in detail with reference to the drawings.

설정사항 입력단계(S100, S100')Setting information input step (S100, S100')

먼저, 도 1 내지 3을 참조하여, 설정사항 입력단계(S100, S100')를 살펴본다. 설정사항 입력단계(S100, S100')에서는, 프로세서(10)에서, 다수의 필드를 포함하는 데이터 테이블을 분석하는 자연어를 생성하기 위하여 설정 사항을 입력받는다. 이때, 필드는 필드명 및 적어도 하나 이상의 필드 값을 포함한다.First, with reference to FIGS. 1 to 3, the setting information input step (S100, S100') will be described. In the setting information input step (S100, S100'), the processor 10 receives the setting information in order to generate a natural language for analyzing a data table including a plurality of fields. In this case, the field includes a field name and at least one field value.

예컨대, 도 2를 참조하면, 설정 사항을 입력받는 단계(S100')에서 설정 사항은 자연어를 생성하기 위한 자연어 생성기준을 포함한다. 이때, 자연어 생성기준은 전체 연결어에 관한 사항 및 자연어생성 필드에 관한 사항을 포함할 수 있다. 자연어생성 필드에 관한 사항은 자연어생성 필드에서 필드 값 가져오기, 필드 값 호출조건에 부합하는 자연어생성 필드의 필드명 가져오기 중 적어도 하나 이상을 포함할 수 있다. 예컨대, 도 5a 내지 5c는 자연어 생성기준 중 자연어생성 필드에 관한 사항의 예를 나타내고, 도 5d 내지 5e는 전체 연결어에 관한 사항과 자연어생성 필드에 관한 사항 중 필드 값 가져오기를 포함하는 자연어 생성기준을 나타내고, 도 5g는 전체 연결어에 관한 사항과 자연어생성 필드에 관한 사항 중 필드명 가져오기를 포함하는 자연어 생성기준을 나타내고 있다. 도 5a는 자연어생성 필드(예컨대, 생성기준의 필드 값 가져오기 대상 필드 선택에 해당하는 '총세대수')로부터 필드 값(예컨대, 생성테이블의 '가져온 값' 참조)을 가져오는 것을 나타내고 있다. 도 5d는 자연어 생성기준(예컨대, 전체연결어 생성과 필드값 가져오기)에 따라 전체연결어를 생성(예컨대, 생성기준에서 '스페이스'에 따른 생성테이블에서의 스페이스 ' '와 생성기준에서 '지역의 특성 분석 결과입니다.'에 따른 생성테이블에서의 '지역의 특성 분석 결과입니다.' 참조)하고 필드 값 가져오기(예컨대, 생성테이블에서의 식별아이디의 일종인 행정코드 1171063100에 대응하는 자연어 생성결과에서의 '서울특별시', '송파구', '가락1동' 등)을 수행한 결과(예컨대, 생성테이블에서의 '자연어 생성결과' 필드 참조)를 나타내고 있다. 도 5f는 자연어 생성기준에 따라 전체연결어(예컨대, 생성기준에서의 '연령대별 인구수 구성비 분석결과' 등에 따라 생성된 생성테이블에서의 자연어 생성결과 참조)와 필드명 가져오기(예컨대, 생성기준에서의 필드명 가져오기의 '높음 호출 조건' 등에 따라 생성된 생성테이블에서 식별아이디 일종인 행정코드 1171063100에 대응하는 자연어 생성결과 '10대, 20대, 40대, 50대' 등 참조)가 통합 수행된 결과를 나타내고 있다.For example, referring to FIG. 2, in the step S100' of receiving the setting item, the setting item includes a natural language generation criterion for generating a natural language. In this case, the natural language generation criterion may include matters about the entire linked language and matters about the natural language generation field. The matters regarding the natural language generation field may include at least one of fetching a field value from the natural language generation field and fetching a field name of a natural language generation field meeting a field value calling condition. For example, FIGS. 5A to 5C show examples of matters related to a natural language generation field among natural language generation criteria, and FIGS. 5D to 5E are natural language generation criteria including importing field values among matters related to all linked words and natural language generation fields. 5G shows a natural language generation criterion including import of a field name among items related to all linked words and natural language generation fields. FIG. 5A shows that a field value (eg, refer to a'imported value' of a generation table) is obtained from a natural language generation field (eg,'total number of generations' corresponding to a field value to be fetched from a generation criterion). 5D shows that the entire connection word is generated according to the natural language generation criterion (e.g., the generation of the entire connection word and the import of the field value) (e.g., the space in the generation table according to the'space' in the generation criterion and the characteristic of the region In the generated table according to the analysis result, refer to'The result of regional characteristic analysis.') and get the field value (e.g., in the natural language generation result corresponding to the administrative code 1171063100, which is a kind of identification ID in the generated table). It shows the results of performing'Seoul Metropolitan City','Songpa-gu','Garak 1-dong', etc. (for example, refer to the'Natural Language Generation Result' field in the generation table). Figure 5f is a whole connection word according to the natural language generation criterion (for example, refer to the natural language generation result in the generation table generated according to the'population ratio analysis result by age group' in the generation criterion) and import the field name (e.g., in the generation criterion). The result of natural language generation corresponding to the administrative code 1171063100, which is a kind of identification ID, in the generated table created according to the'high calling condition' of the field name import, is integrated. The results are shown.

예컨대, 하나의 예에서, 필드 값 호출조건은 필드의 특정값과의 일치, 2이상의 특정값 중의 선택적 일치, 필드 값 특정범위의 만족 중 어느 하나에 관한 것일 수 있다. 예컨대, 도 5g는 필드명 가져오기의 호출조건(예컨대, 생성기준에서의 필드명 가져오기의 '높음 호출 조건' 등)을 나타내고 있다.For example, in one example, the field value calling condition may be any one of matching with a specific value of a field, selective matching among two or more specific values, and satisfaction of a specific range of a field value. For example, FIG. 5G shows a calling condition for fetching a field name (eg, a “high calling condition” for fetching a field name in the generation criterion).

자연어생성 필드 존재확인 단계(S200, S200')Natural language generation field existence check step (S200, S200')

다음으로, 도 1 내지 3을 참조하여 자연어생성 필드 존재확인 단계(S200, S200')를 살펴본다. 자연어생성 필드 존재확인 단계(S200, S200')에서는, 프로세서(10)에서, 읽어들인 데이터 테이블에 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 존재하는지를 확인한다. 이때, 후술되는 가상필드 생성단계(S300, S300')에서 가상필드가 피드백된 경우, 자연어생성 필드가 존재하는지를 확인하는 단계(S200, S200')에서, 프로세서(10)는, 가상필드가 포함되는 데이터 테이블에 자연어생성 필드가 존재하는지를 확인한다. Next, steps S200 and S200' confirming the existence of a natural language generation field will be described with reference to FIGS. 1 to 3. In the steps of confirming the existence of the natural language generation field (S200 and S200'), the processor 10 checks whether at least one or more natural language generation fields according to setting items are present in the read data table. At this time, when the virtual field is fed back in the virtual field generation step (S300, S300') to be described later, in the step of checking whether the natural language generation field exists (S200, S200'), the processor 10 includes the virtual field. Check whether the natural language generation field exists in the data table.

예컨대, 도 2를 참조하면, 하나의 예에서, 자연어생성 필드가 존재하는지를 확인하는 단계(S200')에서 확인대상 필드는 설정사항 입력단계(S100')에서 입력받은 설정 사항에 포함된 자연어 생성기준에 포함된 사항에 의해 정해질 수 있다. 예컨대, 자연어 생성기준에 포함되는 자연어생성 필드에 관한 사항에 의해 정해질 수 있다. 구체적으로는, 확인대상 필드는 필드 값 가져오기의 대상이 되는 필드, 필드 값 호출조건에 포함된 필드 값을 보유하는 필드 중 어느 하나 이상일 수 있다.For example, referring to FIG. 2, in one example, in the step of checking whether a natural language generation field exists (S200'), the field to be checked is a natural language generation criterion included in the setting items inputted in the setting item input step (S100'). It can be determined by the items contained in For example, it may be determined by matters related to the natural language generation field included in the natural language generation criteria. Specifically, the field to be checked may be one or more of a field to be retrieved from a field value and a field holding a field value included in a field value calling condition.

가상필드 생성단계(S300, S300')Virtual field creation step (S300, S300')

다음으로, 도 1 내지 4g를 참조하여 가상필드 생성단계(S300, S300')를 살펴본다. 가상필드 생성단계(S300, S300')에서는, 프로세서(10)에서, 자연어생성 필드의 부존재 시 자연어 생성을 위하여 읽어들인 데이터 테이블에 포함되지 않은 자연어생성 필드인 적어도 하나 이상의 가상필드를 생성하고 피드백한다. Next, a virtual field generation step (S300, S300') will be described with reference to FIGS. 1 to 4G. In the virtual field generation steps S300 and S300', the processor 10 generates and feeds back at least one virtual field that is a natural language generation field that is not included in the data table read for natural language generation when the natural language generation field does not exist. .

예컨대, 도 2를 참조하면, 가상필드 생성단계(S300')에서 생성되는 가상필드 각각은 확인대상 필드의 부존재 시 생성되는 필드로서, 데이터 테이블의 적어도 하나 이상의 필드의 필드 값을 처리, 가공 내지 평가하여 생성되는 필드 값을 보유한다.For example, referring to FIG. 2, each of the virtual fields generated in the virtual field generation step (S300') is a field that is generated when the field to be checked does not exist, and processes, processes, or evaluates field values of at least one field of the data table. It holds the field value created by doing so.

이때, 필드 값 처리는 2이상의 필드의 수치 필드 값의 연산처리, 하나의 필드에서의 수치 필드 값의 표준화, 이격도 내지 순위 처리 중의 하나일 수 있다. 예컨대 이때, 필드 값 처리의 대상이 되는 필드는 기존 필드이거나 선행된 필드 값 처리에 의해 생성되는 가상필드를 포함하는 필드일 수 있다. 필드 값 가공은 기존 필드 내지 필드 값 처리에 의해 생성된 필드에서, 적어도 2 이상의 필드 값의 그룹화를 이용한 필드 값에 대한 재분류 가공 내지 하나의 필드의 필드 값과 동일한 그룹의 다른 수치 필드의 필드 값에 대한 평균 내지 표준화 가공일 수 있다. 예컨대 이때, 동일한 필드 값 그룹을 갖는 하나의 필드는 기존 필드이거나 재분류 가공에 의해 생성된 가상필드일 수 있다. 필드 값 평가는 기존 필드, 필드 값 처리에 의해 생성된 필드, 필드 값 가공에 의해 생성된 필드 중 어느 하나 이상에서 적어도 수치 필드 값을 보유하는 하나 이상의 필드에 대해 수치 필드 값의 범위에 기반한 평가일 수 있다.In this case, the field value processing may be one of arithmetic processing of numerical field values of two or more fields, standardization of numerical field values in one field, and separation or ranking processing. For example, in this case, the field to be processed for field value may be an existing field or a field including a virtual field generated by processing a previous field value. Field value processing is a reclassification of field values using grouping of at least two or more field values in existing fields or fields created by field value processing, or field values of other numeric fields in the same group as the field value of one field. It may be average to standardized processing for. For example, at this time, one field having the same field value group may be an existing field or a virtual field created by reclassification processing. Field value evaluation is an evaluation date based on the range of numeric field values for one or more fields that have at least a numeric field value in one or more of an existing field, a field generated by field value processing, or a field generated by field value processing. I can.

이때, 필드 값 가공 내지 필드 값 평가는 설정 사항을 입력받는 단계(S100, S100')에서 설정 사항에 포함되는 가상필드 생성기준에 따라 수행될 수 있다. 예컨대, 가상필드 생성기준은 자연어 생성기준에 포함되거나 자연어 생성기준과 별개로 구비될 수 있다. 예컨대, 도 4d 내지 4g는 가상필드 생성기준에 따른 필드 값 가공 내지 필드 값 평가에 따라 가상필드를 생성하는 것을 도시하고 있다. 도 4d는 가상필드 생성기준에 따라 하나의 필드에서 적어도 2이상의 필드 값의 그룹화(예컨대, 원본테이블에서의 '소득계층' 필드에서 '고소득층'과 '중산층'의 그룹화)에 따른 재분류 가공을 통한 가상필드(예컨대, 생성테이블에서의 '소득계층 가상그룹' 필드)를 생성하는 것을 나타내고 있다. 도 4g는 가상필드 생성기준에 따른 하나의 필드의 필드 값과 동일한 그룹(예컨대, 원본테이블에서의 '소득계층 가상그룹' 필드에서 '고소득층과 중산층' 그룹)의 다른 수치 필드(예컨대, '월소득' 필드)의 필드 값에 대한 평균 가공(예컨대, 월소득 평균)에 따라 생성되는 가상필드(예컨대, 생성테이블에서의 '평균 월소득' 필드)를 나타내고 있다. 도 4g에서 가상필드 생성기준으로 디멘젼 그룹필드로서 '소득계층 가상그룹', 디멘젼 뷰 필드로서 '월소득', 그리고 필드요약기준으로 '평균'을 나타내는 가상필드 생성기준을 이용하여 가상필드를 생성하는 것을 나타내고 있다. 도 4e는 가상필드 생성기준(예컨대, 총세대수 평가기준)에 따른 수치 필드 값(예컨대, 원본테이블에서의 '총세대수 백분위' 필드의 필드 값)의 범위에 기반한 평가(예컨대, 가상필드 생성기준에서의 '총세대수 백분위 평가기준')에 따라 수치 필드 값을 보유하는 필드로부터 가상필드(예컨대, 생성테이블에서의 '총세대수 평가' 필드)를 생성하는 것을 나타내고 있다. 도 4f는 가상필드 생성기준(예컨대, 소득과 가구수 평가기준)에 따른 2개 필드에서의 수치 필드 값(예컨대, 원본테이블에서의 '총세대수' 필드와 '월소득 평가' 필드의 필드 값)의 범위(예컨대, 생성기준에서 '총세대수'에 대한 '9,000' 이상과 '월소득'에 대한 '고소득지역' 등의 기준)에 기반한 평가(예컨대, 가상필드 생성기준에서의 '소득과 가구수 평가')에 따라 가상필드(예컨대, 생성테이블에서의 '소득과 가구수 평가 결과별 출점 전략' 필드)를 생성하는 것을 나타내고 있다.In this case, field value processing or field value evaluation may be performed according to a virtual field generation criterion included in the setting item in the step of receiving the setting item (S100, S100'). For example, the virtual field generation criterion may be included in the natural language generation criterion or may be provided separately from the natural language generation criterion. For example, FIGS. 4D to 4G illustrate generating a virtual field according to field value processing or field value evaluation according to the virtual field generation criterion. 4D is a reclassification process according to grouping of at least two or more field values in one field according to the virtual field creation criterion (e.g., grouping of'high income class' and'middle class' in the'income class' field in the original table) It represents the creation of a virtual field (for example, the'income class virtual group' field in the generation table). 4G shows another numerical field (eg,'monthly income') of the same group as the field value of one field according to the virtual field generation criterion (e.g., the'high income group and the middle class' group in the'income class virtual group' field in the original table). Field) represents a virtual field (eg,'average monthly income' field in the generation table) generated according to the average processing (eg, monthly income average) of the field value. In Fig. 4g, the virtual field is generated using the virtual field generation criterion representing'income class virtual group' as the dimension group field as the dimension group field,'monthly income' as the dimension view field, and'average' as the field summary criterion. Is shown. 4E shows an evaluation based on a range of numerical field values (eg, field values of the'total households percentile' field in the original table) according to the virtual field generation criterion (eg, the total number of households evaluation criterion) (eg,'in the virtual field generation criterion). It represents the generation of a virtual field (for example, a'total number of households evaluation' field in the generation table) from a field that holds a numeric field value according to the'total number of households evaluation criteria'. 4F shows a range of numerical field values in two fields (e.g., field values of'total households' field and'monthly income evaluation' field in the original table) according to the virtual field generation criteria (e.g., income and household size evaluation criteria) ( For example, according to evaluation based on '9,000' or more for'total number of households' and'high-income area' for'monthly income' in the generation criteria (e.g.,'evaluation of income and number of households' in the virtual field generation criterion) It represents the creation of a field (for example, the'opening strategy for each income and household size evaluation result' field in the generation table).

또한, 필드 값 처리는 생성되는 가상필드명에 대한 미리 설정된 정의에 따라 또는 사용자의 설정에 따라 수행될 수 있다. 필드 값 처리 중 예컨대 각 필드 내에서의 필드 값들의 평균, 최대값, 최소값, 중간값, 최대빈도값, 최소빈도값, 중간빈도값, 필드 값 백분위, Z점수, T점수, 필드 값 순위, 순위 백분위, 이격 값(평균, 중간값, 최대값, 최소값 등으로부의 이격 값), 이격율(평균, 중간값, 최대값, 최소값 등으로부의 이격 값의 최대치 내지 필드 값평균에 대한 비율) 등은 미리 설정된 바에 따라 연산될 수 있고, 2이상 필드에서의 동일한 식별아이디에 대응하는 필드 값들의 합, 차, 곱 등의 연산도 미리 설정된 정의에 따라 처리될 수 있다. 예컨대, 미리 설정된 정의 따라 필드 값 처리가 수행되는 경우 자연어 생성기준 중 자연어생성 필드에 관한 사항에 관한 설정 사항의 분석을 통해 미리 설정된 정의에 따라 필드 값 처리를 수행하여 가상필드를 생성할 수 있다. 예컨대, 필드 값 처리는 사용자의 설정 입력에 따라 정해지는 바에 따라 처리될 수도 있다.In addition, field value processing may be performed according to a preset definition for a generated virtual field name or according to a user's setting. During field value processing, for example, average, maximum, minimum, median, maximum frequency, minimum frequency, median frequency, field value percentile, Z score, T score, field value ranking, ranking of field values within each field. Percentiles, separation values (average, median, maximum, minimum, etc.), and separation rates (maximum of separation values by average, median, maximum, minimum, etc. or ratio to the average of field values), etc. It may be calculated according to a preset setting, and operations such as sum, difference, and product of field values corresponding to the same identification ID in two or more fields may be processed according to a preset definition. For example, when field value processing is performed according to a preset definition, a virtual field may be generated by performing field value processing according to a preset definition through analysis of setting items related to a natural language generation field among natural language generation criteria. For example, field value processing may be processed according to a user's setting input.

도 4a는 사용자의 설정 입력에 따른 가상필드 생성기준에 따라 2개 필드의 필드 값에 대한 더하기 연산 처리(내국인계+외국인계)를 통해 '내외국인 총인구수'에 대한 가상필드를 생성하는 것을 나타내고 있다. 도 4b는 미리 설정된 바에 따라 필드 값의 백분위에 따른 가상필드(총세대수 백분위)를 생성하는 것을 나타내고 있다. 도 4c는 사용자의 설정 입력에 따른 가상필드 생성기준(내외국인 총인구수 과부족 = 내외국인 총인구수 - 내외국인 총인구수 평균)에 따라 빼기 연산을 통해 '내외국인 총인구수 과부족'에 대한 가상필드를 생성하는 것을 나타내고 있다.Figure 4a shows that the virtual field for the'total number of domestic and foreign populations' is generated through the addition operation processing (domestic personage + foreigner personage) for the field values of two fields according to the virtual field generation standard according to the user's setting input. have. FIG. 4B shows the generation of a virtual field (the total number of households percentile) according to the percentile of the field value according to a preset setting. Figure 4c shows a virtual field generation criterion according to the user's setting input (total domestic and foreign population oversufficient = domestic and foreign total population-domestic and foreign total population average) through subtraction operation to create a virtual field for'overs or shortages of total number of domestic and foreigners' It shows that.

예컨대, 하나의 예에서, 수치 필드 값의 연산처리는 연산자를 이용한 연산자 연산일 수 있다. 연산자 연산은 가감승제 등의 연산일 수 있고, 이에 한정되지 않는다. 예컨대, 수치 필드 값의 표준화 처리는 하나의 필드에서 백분위 점수, Z 점수, T 점수 및 해당 점수로부터 변환된 변환 점수를 이용한 표준화 처리일 수 있다. 예컨대, 수치 필드 값의 이격도 처리는 하나의 필드에서 평균값, 최대값, 최소값 및 중위수 중 어느 하나를 기준값으로 하는 이격도 값 내지 이격도 증감율을 이용한 이격도 처리일 수 있고, 이에 한정되지 않는다. 예컨대, 수치 필드 값의 순위 처리는 하나의 필드에서 오름차순 순위, 내림차순 순위, 현재자료 상의 순번 순위 중 어느 하나에 따른 처리일 수 있고, 이에 한정되지 않는다. 이때, 수치 필드 값의 표준화, 이격도 및 순위 처리의 대상인 필드는 기존 필드 내지 연산처리에 따라 생성된 필드일 수 있다.For example, in one example, the operation of a numeric field value may be an operator operation using an operator. The operator operation may be an operation such as addition or subtraction, but is not limited thereto. For example, the standardization process of a numerical field value may be a standardization process using a percentile score, a Z score, a T score, and a converted score converted from the corresponding score in one field. For example, the distance processing of the numerical field value may be a separation value using any one of an average value, a maximum value, a minimum value, and a median number as a reference value in one field or a separation degree processing using a distance increase/decrease rate, but is not limited thereto. For example, the ranking processing of the numerical field values may be processing according to any one of an ascending order, a descending order, and an order order on the current data in one field, but is not limited thereto. In this case, a field that is an object of standardization, separation, and ranking processing of a numerical field value may be an existing field or a field generated according to an operation process.

예컨대, 필드 값에 대한 재분류 가공은 재분류에 따른 문자 가공 내지 재분류에 따른 수치 가공일 수 있다. 도 4d는 재분류에 따른 문자 가공의 예를 나타내고 있다. 예컨대, 필드 값 처리 및 필드 값 가공 중 평균 내지 표준화 가공과 필드 값에 대한 재분류 가공 중의 수치 가공 각각은 수치값 가상필드를 생성할 수 있다. 도 4a는 필드 값의 연산처리에 따른 수치값 가상필드, 예컨대 '내외국인 총인구수' 필드를 나타내고, 도 4b는 필드 값의 백분위 처리에 따른 수치값 가상필드, 예컨대 '총세대수 백분위' 필드를 나타내고, 도 4c는 필드 값의 이격도 처리에 따른 수치값 가상필드, 예컨대 '내외국인 총인구수 과부족' 필드를 나타내고 있다. 또한, 도 4g는 필드 값 가공 중 평균 가공에 따른 수치값 가상필드, 예컨대 '평균 월소득' 필드를 나타내고 있다. 도 4g의 수치값 가상필드인 '평균 월소득' 필드는 디멘젼 필드, 예컨대 '소득계층 가상그룹' 필드의 디멘젼 뷰 필드(예컨대, 생성기준에서의 '월소득' 필드)에 관한 요약필드(예컨대, 요약기준으로서 '평균')일 수 있다. 예컨대, 본 명세서에서 디멘젼 필드는 필드 값이 수치가 아닌 문자만으로 또는 문자를 포함하여 이루어진 필드를 의미하고, 디멘젼 뷰 필드는 디멘젼 필드의 필드 값에 대응하는 식별아이디에 대응하는 수치 필드 값을 포함하는 필드로서 수치값 필드의 일종이다. 즉, 디멘젼 뷰 필드는 디멘젼 필드의 필드 값에 대응하여 수치 필드 값을 갖는 수치값 필드를 의미한다.For example, the reclassification processing for the field value may be character processing according to the reclassification or numerical processing according to the reclassification. 4D shows an example of character processing according to reclassification. For example, each of the average or normalization processing during field value processing and field value processing, and numerical processing during reclassification processing for field values may generate a numerical value virtual field. FIG. 4A shows a numerical value virtual field according to an operation process of a field value, for example, a'total number of domestic and foreigners' field, and FIG. 4B shows a numerical value virtual field according to the percentile processing of a field value, for example, a'total number of households percentile' field, FIG. 4C shows a numerical value virtual field according to the processing of the separation of the field value, for example, a field of'oversufficient total number of domestic and foreign nationals'. In addition, FIG. 4G shows a virtual field of numerical values according to average processing during field value processing, for example, a'average monthly income' field. The'average monthly income' field, which is a numerical value virtual field in FIG. 4G, is a summary field (e.g., a summary criterion) for a dimension field, for example, a dimension view field (e.g., a'monthly income' field in the generation criterion) of the'income class virtual group' field. As'average'). For example, in this specification, the dimension field means a field in which the field value is composed of only characters or including characters, and the dimension view field includes a numeric field value corresponding to the identification ID corresponding to the field value of the dimension field. As a field, it is a kind of numeric value field. That is, the dimension view field means a numeric value field having a numeric field value corresponding to the field value of the dimension field.

예컨대, 필드 값에 대한 재분류 가공 중 문자 가공 및 필드 값 평가 각각은 디멘젼 가상필드를 생성할 수 있다. 도 4d는 재분류 가공 중 문자 가공에 따라 생성된 디멘젼 가상필드, 예컨대 '소득계층 가상그룹' 필드를 나타내고 있고, 도 4e 내지 4f는 필드 값 평각에 따라 생성된 디멘젼 가상필드, 예컨대 '총세대수 평가' 필드, '소득과 가구수 평가 결과별 출점 전략' 필드를 나타내고 있다. For example, during reclassification processing for field values, each of character processing and field value evaluation may create a dimension virtual field. 4D shows a dimension virtual field generated according to text processing during reclassification processing, for example, a'income class virtual group' field, and FIGS. 4E to 4F are a dimension virtual field generated according to the field value square, for example,'Evaluation of the total number of households' Field, and'Shopping strategy by income and household size evaluation results' field are shown.

자연어 생성단계(S400, S400', S400")Natural language generation step (S400, S400', S400")

다음으로, 도 1 내지 3, 및 도 5a 내지 5f를 참조하여 자연어 생성단계(S400, S400')를 살펴본다. 자연어 생성단계(S400, S400', S400")에서는, 프로세서(10)에서, 자연어생성 필드의 존재 시 프로세서(10)에서 설정 사항에 따라 데이터 테이블을 분석하는 자연어를 생성한다. 이때, 자연어 생성단계(S400, S400', S400")는 전체연결어 생성단계(S410) 및 필드값/필드명 가져오기 단계(S430, S430')를 포함한다. 전체연결어 생성단계(S410)에서는, 설정 사항에 따라 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하고, 필드값/필드명 가져오기 단계(S430)에서는 설정 사항에 따른 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져온다.Next, natural language generation steps S400 and S400' will be described with reference to FIGS. 1 to 3 and 5A to 5F. In the natural language generation step (S400, S400', S400"), the processor 10 generates a natural language that analyzes the data table according to the settings in the processor 10 when the natural language generation field exists. In this case, the natural language generation step (S400, S400', S400") includes a whole connection word generation step (S410) and a field value/field name import step (S430, S430'). In the whole connection word generation step (S410), the entire connection word applied to each record of the natural language generation field is generated according to the setting, and in the field value/field name import step (S430), the field of the natural language generation field according to the setting Gets at least one of a value and a field name.

예컨대, 도 2를 참조하면, 하나의 예에서, 자연어 생성단계(S400')에서는, 자연어 생성기준에 따라 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하고(S410), 자연어 생성기준에 따른 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져올 수 있다(S430). 예컨대, 필드값/필드명 가져오기 단계(S430)에서, 자연어생성 필드에서 필드 값 가져오기, 필드 값 호출조건에 부합하는 자연어생성 필드의 필드명 가져오기 중 적어도 하나 이상이 수행될 수 있다. 예컨대, 도 5a는 자연어 생성기준(예컨대, 필드 값 가져오기)에 따라 자연어생성 필드(예컨대, 도 5a의 생성기준에서 필드값 가져오기 대상 필드 선택에 해당하는 '총세대수')로부터 필드 값(예컨대, 생성테이블의 '가져온 값' 참조)을 가져오는 것을 나타내고 있다. 도 5b는 자연어 생성기준(예컨대, 디멘젼 필드의 필드 값 내용과 디멘젼 뷰 필드의 수치 필드 값을 함께 가져오기)에 따라 2개의 자연어생성 필드(예컨대, 생성기준에서 디멘젼 필드선택에서 설정된 '소득계측 가상그룹' 필드와 디멘젼 뷰 필드 선택에서 설정된 '평균 월소득' 필드)로부터 2개의 필드 값(예컨대, 생성테이블에서의 자연어 생성 결과의 '고속득층과 중산층, 6164157' 등의 필드 값)을 가져오는 것을 나타내고 있다. 도 5c는 자연어 생성기준인 필드 값 호출조건(예컨대, 생성기준에서 높음 호출 조건, 낮음 호출 조건)에 따라 필드 값 호출조건에 부합하는 필드명(예컨대, 생성테이블에서 식별아이디의 일종인 행정코드 1171063100에 대응하는 높음 호출조건 가져온 필드명은 '10대, 20대'이고 낮음 호출조건 가져온 필드명은 '10세미만' 등)을 나타내고 있다. 도 5d는 자연어 생성기준(예컨대, 전체연결어 생성과 필드값 가져오기)에 따라 전체연결어를 생성(예컨대, 생성기준에서 '스페이스'에 따른 생성테이블에서의 스페이스 ' '와 생성기준에서 '지역의 특성 분석 결과입니다.'에 따른 생성테이블에서의 '지역의 특성 분석 결과입니다.' 참조)하고 필드 값 가져오기(예컨대, 생성테이블에서의 식별아이디의 일종인 행정코드 1171063100에 대응하는 자연어 생성결과에서의 '서울특별시', '송파구', '가락1동' 등)을 수행한 결과(예컨대, 생성테이블에서의 '자연어 생성결과' 필드 참조)를 나타내고 있다. 도 5e는 자연어 생성기준에 따라 전체연결어(예컨대, 생성기준에서의 '지역 전체 평균 대비', '명으로' 등에 따라 생성된 생성테이블에서의 자연어 생성결과 참조)와 필드 값 가져오기(예컨대, 생성기준에서의 '내외국인 총인구수 과부족', '내외국인 통인구수 과부족 평가' 등에 따라 생성된 생성테이블에서의 자연어 생성결과 참조)가 통합 수행된 결과를 나타내고 있다. 도 5f는 자연어 생성기준에 따라 전체연결어(예컨대, 생성기준에서의 '연령대별 인구수 구성비 분석결과' 등에 따라 생성된 생성테이블에서의 자연어 생성결과 참조)와 필드명 가져오기(예컨대, 생성기준에서의 필드명 가져오기의 '높음 호출 조건' 등에 따라 생성된 생성테이블에서 식별아이디 일종인 행정코드 1171063100에 대응하는 자연어 생성결과 '10대, 20대, 40대, 50대' 등 참조)가 통합 수행된 결과를 나타내고 있다.For example, referring to FIG. 2, in one example, in the natural language generation step (S400'), a full connection word applied to the entire record of the natural language generation field is generated according to the natural language generation criterion (S410), and the natural language generation criterion is applied. At least one or more of a field value and a field name of the corresponding natural language generation field may be obtained (S430). For example, in the field value/field name fetching step (S430), at least one of fetching a field value from a natural language generation field and fetching a field name of a natural language generation field meeting a field value calling condition may be performed. For example, FIG. 5A shows a field value (eg, a field value corresponding to selection of a field to be imported in the generation criterion of FIG. 5A) according to a natural language generation criterion (eg, field value import). Refers to'Imported Value' of the generated table). 5B shows two natural language generation fields (e.g.,'income measurement virtual) set in dimension field selection in the generation criterion according to the natural language generation criteria (e.g., bringing together the field value contents of the dimension field and the numerical field value of the dimension view field) This indicates that two field values (e.g., field values such as'high-income and middle-class, 6164157' of the natural language generation result in the generation table) are obtained from the'Group' field and the'average monthly income' field set in the dimension view field selection. have. 5C is a field name matching the field value calling condition according to the field value calling condition (e.g., high calling condition, low calling condition in the generation criteria), which is a natural language generation criterion (for example, administrative code 1171063100, which is a kind of identification ID in the generation table) The field name of the high calling condition imported is '10s, 20s', and the field name of the low calling condition imported is'under 10 years old', etc.). 5D shows that the entire connection word is generated according to the natural language generation criterion (e.g., the generation of the entire connection word and the import of the field value) (e.g., the space in the generation table according to the'space' in the generation criterion and the characteristic of the region In the generated table according to the analysis result, refer to'The result of regional characteristic analysis.') and get the field value (e.g., in the natural language generation result corresponding to the administrative code 1171063100, which is a kind of identification ID in the generated table). It shows the results of performing'Seoul Metropolitan City','Songpa-gu','Garak 1-dong', etc. (for example, refer to the'Natural Language Generation Result' field in the generation table). Figure 5e shows an entire connection word according to the natural language generation criterion (e.g., refer to the natural language generation result in the generation table generated according to the'regional overall average' in the generation criterion,'by name') and the field value import (e.g., generation The results of the integration are shown in the results of natural language generation in the generation table generated according to the'total number of domestic and foreigners oversufficient' and'overs or shortages of the total number of domestic and foreigners' in the standard. Figure 5f is a whole connection word according to the natural language generation criterion (for example, refer to the natural language generation result in the generation table generated according to the'population ratio analysis result by age group' in the generation criterion) and import the field name (e.g., in the generation criterion). The result of natural language generation corresponding to the administrative code 1171063100, which is a kind of identification ID, in the generated table created according to the'high calling condition' of the field name import, is integrated. The results are shown.

예컨대, 도 5d 내지 5f를 참조하면, 자연어를 생성하는 단계(S400, S400', S400")에서 자연어 생성기준에 포함되는 처리순위에 따라 자연어를 생성한다.For example, referring to FIGS. 5D to 5F, in the steps of generating natural language (S400, S400', S400"), natural language is generated according to a processing priority included in the natural language generation criteria.

예컨대, 도 5d 내지 5f를 참조하면, 자연어를 생성하는 단계(S400, S400', S400")는 생성되는 자연어 문장이 종결된 경우에 다음 문장을 위하여 줄을 바꾸는 과정(예컨대, 생성기준에서의 '줄바뀜 주기'에 따른 생성테이블에서의 자연어 생성결과 참조)을 포함할 수 있다.For example, referring to FIGS. 5D to 5F, the steps of generating natural language (S400, S400', S400") are a process of changing lines for the next sentence when the generated natural language sentence is terminated (e.g., ' (Refer to the natural language generation result in the generation table according to the'line break period') can be included.

예컨대, 도 3을 참조하면, 하나의 예에서, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 하나의 가상필드 생성 후 생성된 가상필드에 대한 자연어를 생성하는 과정을 반복할 수 있다.For example, referring to FIG. 3, in an example, when there are a plurality of natural language generation fields and a plurality of virtual fields are generated, a process of generating a natural language for a virtual field generated after one virtual field may be repeated. .

또한, 도 3을 참조하면, 하나의 예에서, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 다수의 가상필드의 생성 후 생성된 다수의 가상필드를 포함한 다수의 자연어생성 필드에 대하여 자연어를 생성할 수 있다.In addition, referring to FIG. 3, in an example, when there are a plurality of natural language generation fields and a plurality of virtual fields are generated, a plurality of natural language generation fields including a plurality of virtual fields generated after the generation of a plurality of virtual fields are Can generate natural language.

다음으로, 본 발명의 또 하나의 실시예에 따라, 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치의 예를 살펴본다. 이때, 전술한 데이터 테이블로부터의 자연어 생성 방법의 실시예들 및 도 1 내지 5f를 참조하여 이해할 수 있다.Next, an example of an electronic device that generates natural language from a data table according to another embodiment of the present invention will be described. In this case, it can be understood with reference to embodiments of the natural language generation method from the above-described data table and FIGS. 1 to 5F.

도 6은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치를 나타내는 개략적인 도면이고, 도 7은 본 발명의 하나의 실시예에 따른 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치의 프로세서를 나타내는 개략적인 구성도이다.FIG. 6 is a schematic diagram illustrating an electronic device that generates natural language from a data table according to an embodiment of the present invention, and FIG. 7 is a schematic diagram illustrating a natural language generation from a data table according to an embodiment of the present invention. It is a schematic configuration diagram showing a processor of an electronic device.

도 6을 참조하면, 하나의 예에 따른 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치(1)는 적어도 하나의 프로세서(10)를 포함하는 전자 장치(1)이다. 이때, 적어도 하나의 프로세서(10)는 다수의 필드를 포함하는 데이터 테이블을 분석하는 자연어를 생성하기 위하여 설정 사항을 입력받고, 읽어들인 데이터 테이블에 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 존재하는지를 확인한다. 자연어생성 필드는 자연어를 생성하는 대상이 되는 필드이다. 이때, 데이터 테이블의 필드는 필드명 및 적어도 하나 이상의 필드 값을 포함한다. 도 6을 참조하면, 입력장치(20)를 통해 사용자로부터 설정 사항을 입력받고, 프로세서(10)는 입력장치(20)로부터 설정 사항을 전송 내지 입력 받는다. 예컨대, 도 6의 프로세서(10)에서 자연어를 생성하기 위하여 데이터 테이블을 읽어들인다. 예컨대 도 6의 프로세서(10) 내지 예컨대, 도 7의 자연어생성 필드 확인모듈(11)에서 전송 내지 입력 받은 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 읽어들인 데이터 테이블에 존재하는지를 확인한다. 적어도 하나의 프로세서(10)는 자연어생성 필드의 부존재 시 자연어 생성을 위하여 읽어들인 데이터 테이블에 포함되지 않은 자연어생성 필드인 적어도 하나 이상의 가상필드를 생성하여 피드백한다. 예컨대 도 6의 프로세서(10) 내지 예컨대, 도 7의 가상필드 생성모듈(13)에서 가상필드를 생성하여 피드백한다. 적어도 하나의 프로세서(10)는 가상필드의 피드백의 경우 가상필드가 포함되는 데이터 테이블에 자연어생성 필드가 존재하는지를 확인한다. 예컨대 도 6의 프로세서(10) 내지 예컨대, 도 7의 자연어생성 필드 확인모듈(11)에서 가상필드의 피드백의 경우에 자연어생성 필드의 존재여부를 확인한다. 적어도 하나의 프로세서(10)는 자연어생성 필드의 존재 시 설정 사항에 따라 데이터 테이블을 분석하는 자연어를 생성하되, 설정 사항에 따라 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하는 과정과 설정 사항에 따른 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져오는 과정을 포함하여 자연어를 생성한다. 예컨대, 도 6의 프로세서(10) 내지 예컨대, 도 7의 자연어 생성모듈(15)에서 자연어를 생성한다.Referring to FIG. 6, an electronic device 1 for generating natural language from a data table according to an example is an electronic device 1 including at least one processor 10. At this time, the at least one processor 10 receives setting items to generate a natural language for analyzing a data table including a plurality of fields, and determines whether at least one or more natural language generation fields according to the settings are present in the read data table. Confirm. The natural language generation field is a field that generates natural language. In this case, the field of the data table includes a field name and at least one field value. Referring to FIG. 6, setting items are input from a user through the input device 20, and the processor 10 transmits or receives the setting items from the input device 20. For example, the processor 10 of FIG. 6 reads a data table to generate a natural language. For example, it is checked whether at least one or more natural language generation fields according to settings transmitted or received from the processor 10 of FIG. 6 to the natural language generation field verification module 11 of FIG. 7 exist in the read data table. When the natural language generation field does not exist, the at least one processor 10 generates and feeds back at least one virtual field that is a natural language generation field that is not included in a data table read for natural language generation. For example, the processor 10 of FIG. 6 to the virtual field generation module 13 of FIG. 7 generate and feed back a virtual field. In the case of feedback of a virtual field, the at least one processor 10 checks whether a natural language generation field exists in a data table including the virtual field. For example, in the case of the feedback of the virtual field in the processor 10 of FIG. 6 to the natural language generation field verification module 11 of FIG. 7, the existence of the natural language generation field is checked. At least one processor 10 generates a natural language that analyzes the data table according to the settings when the natural language generation field exists, but generates and sets the entire connection word applied to the entire record of the natural language generation field according to the settings. A natural language is generated by including a process of obtaining at least one of a field value and a field name of a natural language generation field according to the item. For example, the processor 10 of FIG. 6 to the natural language generation module 15 of FIG. 7 generate natural language.

예컨대, 도 6을 참조하면, 전자장치(1)는 메모리(30)를 포함할 수 있다. 메모리(30)는 프로세서(10)에서 읽어들이는 데이터 테이블을 저장하고 있거나 외부 데이터 베이스(3)로부터 프로세서(10)가 데이터 테이블을 읽어들이는 경우 읽어들인 데이터 테이블을 임시 저장할 수 있다. 또한, 메모리(30)는 사용자에 의해 입력장치(20)로부터 입력된 설정 사항을 저장할 수도 있다.For example, referring to FIG. 6, the electronic device 1 may include a memory 30. The memory 30 may temporarily store the data table read by the processor 10 or when the processor 10 reads the data table from the external database 3. In addition, the memory 30 may store setting items input from the input device 20 by the user.

하나의 예에서, 프로세서(10)에서 입력받는 설정 사항은 자연어를 생성하기 위한 자연어 생성기준을 포함할 수 있다. 이때, 자연어 생성기준은 전체 연결어에 관한 사항 및 자연어생성 필드에 관한 사항을 포함할 수 있다. 자연어생성 필드에 관한 사항은 자연어생성 필드에서 필드 값 가져오기, 필드 값 호출조건에 부합하는 자연어생성 필드의 필드명 가져오기 중 적어도 하나 이상을 포함할 수 있다. 예컨대, 프로세서(10) 내지 자연어생성 필드 확인모듈(11)에서 존재여부 확인대상이 되는 자연어생성 필드인 확인대상 필드는 필드 값 가져오기의 대상이 되는 필드, 필드 값 호출조건에 포함된 필드 값을 보유하는 필드 중 어느 하나 이상일 수 있다.In one example, the setting item input from the processor 10 may include a natural language generation criterion for generating a natural language. In this case, the natural language generation criterion may include matters about the entire linked language and matters about the natural language generation field. The matters regarding the natural language generation field may include at least one of fetching a field value from the natural language generation field and fetching a field name of a natural language generation field meeting a field value calling condition. For example, in the processor 10 or the natural language generation field verification module 11, the verification target field, which is a natural language generation field that is to be checked for existence, is a field to which the field value is fetched, and the field value included in the field value calling condition. It may be any one or more of the owned fields.

예컨대, 하나의 예에서, 도 6의 프로세서(10) 내지 도 7의 가상필드 생성모듈(13)은 확인대상 필드의 부존재 시, 데이터 테이블의 적어도 하나 이상의 필드의 필드 값을 처리, 가공 내지 평가하여 생성되는 필드 값을 보유하는 가상필드를 생성할 수 있다. 이때, 필드 값 처리는 2이상의 필드의 수치 필드 값의 연산처리, 하나의 필드에서의 수치 필드 값의 표준화, 이격도 내지 순위 처리 중의 하나일 수 있다. 필드 값 가공은 기존 필드 내지 필드 값 처리에 의해 생성된 필드에서, 적어도 2 이상의 필드 값의 그룹화를 이용한 필드 값에 대한 재분류 가공 내지 하나의 필드의 필드 값과 동일한 그룹의 다른 수치 필드의 필드 값에 대한 평균 내지 표준화 가공일 수 있다. 필드 값 평가는 기존 필드, 필드 값 처리에 의해 생성된 필드, 필드 값 가공에 의해 생성된 필드 중 어느 하나 이상에서 적어도 수치 필드 값을 보유하는 하나 이상의 필드에 대해 수치 필드 값의 범위에 기반한 평가일 수 있다. 필드 값 가공 내지 필드 값 평가는 입력받은 설정 사항에 포함되는 가상필드 생성기준에 따라 수행될 수 있다. 필드 값 처리는 생성되는 가상필드명에 대한 미리 설정된 정의에 따라 또는 사용자의 설정에 따라 수행될 수 있다.For example, in one example, the processor 10 of FIG. 6 to the virtual field generation module 13 of FIG. 7 process, process, or evaluate field values of at least one field of the data table when the field to be checked does not exist. You can create a virtual field that holds the generated field value. In this case, the field value processing may be one of arithmetic processing of numerical field values of two or more fields, standardization of numerical field values in one field, and separation or ranking processing. Field value processing is a reclassification of field values using grouping of at least two or more field values in existing fields or fields created by field value processing, or field values of other numeric fields in the same group as the field value of one field. It may be average to standardized processing for. Field value evaluation is an evaluation date based on the range of numeric field values for one or more fields that have at least a numeric field value in one or more of an existing field, a field generated by field value processing, or a field generated by field value processing. I can. Field value processing or field value evaluation may be performed according to the virtual field generation criterion included in the input settings. Field value processing may be performed according to a predefined definition of a virtual field name to be created or according to a user's setting.

예컨대, 하나의 예에서, 수치 필드 값의 연산처리는 연산자를 이용한 연산자 연산일 수 있다. 수치 필드 값의 표준화 처리는 하나의 필드에서 백분위 점수, Z 점수, T 점수 및 해당 점수로부터 변환된 변환 점수를 이용한 표준화 처리일 수 있다. 수치 필드 값의 이격도 처리는 하나의 필드에서 평균값, 최대값, 최소값 및 중위수 중 어느 하나를 기준값으로 하는 이격도 값 내지 이격도 증감율을 이용한 이격도 처리일 수 있다. 수치 필드 값의 순위 처리는 하나의 필드에서 오름차순 순위, 내림차순 순위, 현재자료 상의 순번 순위 중 어느 하나에 따른 처리일 수 있다. 수치 필드 값의 표준화, 이격도 및 순위 처리의 대상인 필드는 기존 필드 내지 연산처리에 따라 생성된 필드일 수 있다. 필드 값에 대한 재분류 가공은 재분류에 따른 문자 가공 내지 재분류에 따른 수치 가공일 수 있다. 도 6의 프로세서(10) 내지 도 7의 가상필드 생성모듈(13)은 필드 값 처리 및 필드 값 가공 중 평균 내지 표준화 가공과 필드 값에 대한 재분류 가공 중의 수치 가공 각각에 따라 수치값 가상필드를 생성할 수 있다. 도 6의 프로세서(10) 내지 도 7의 가상필드 생성모듈(13)은 필드 값에 대한 재분류 가공 중 문자 가공 및 필드 값 평가 각각에 따라 디멘젼 가상필드를 생성할 수 있다.For example, in one example, the operation of a numeric field value may be an operator operation using an operator. The standardization process of the numerical field value may be a standardization process using a percentile score, a Z score, a T score, and a converted score converted from the corresponding score in one field. The separation degree processing of the numerical field value may be a separation degree processing using one of an average value, a maximum value, a minimum value, and a median number as a reference value or a separation degree increase/decrease rate in one field. The ranking processing of the numerical field values may be processing according to any one of an ascending order, a descending order, and an order order on the current data in one field. Fields subject to standardization, separation, and ranking processing of numerical field values may be existing fields or fields generated according to calculation processing. Reclassification processing for field values may be character processing according to reclassification or numerical processing according to reclassification. The processor 10 of FIG. 6 to the virtual field generation module 13 of FIG. 7 generate a numerical value virtual field according to the average or standardization processing during field value processing and field value processing, and numerical processing during reclassification processing for field values. Can be generated. The processor 10 of FIG. 6 to the virtual field generation module 13 of FIG. 7 may generate a dimension virtual field according to character processing and field value evaluation during reclassification processing for field values.

또한, 하나의 예에서, 필드 값 호출조건은 필드의 특정값과의 일치, 2이상의 특정값 중의 선택적 일치, 필드 값 특정범위의 만족 중 어느 하나에 관한 것일 수 있다. 도 6의 프로세서(10) 내지 도 7의 자연어 생성모듈(15)은 자연어 생성기준에 포함되는 처리순위에 따라 자연어를 생성할 수 있다. 도 6의 프로세서(10) 내지 도 7의 자연어 생성모듈(15)은, 생성되는 자연어 문장이 종결된 경우에 다음 문장을 위하여 줄을 바꾸는 과정을 수행할 수 있다.In addition, in an example, the field value calling condition may be any one of matching with a specific value of a field, selective matching among two or more specific values, and satisfaction of a specific range of a field value. The processor 10 of FIG. 6 to the natural language generation module 15 of FIG. 7 may generate natural language according to a processing order included in the natural language generation criterion. The processor 10 of FIG. 6 to the natural language generation module 15 of FIG. 7 may perform a process of changing lines for the next sentence when the generated natural language sentence is terminated.

또 하나의 예에서, 도 6 내지 7의 프로세서(10)는, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 하나의 가상필드 생성 후 생성된 가상필드에 대한 자연어를 생성하는 과정을 반복할 수 있다. 또는, 다른 예에서, 도 6 내지 7의 프로세서(10)는, 자연어생성 필드가 다수이고 생성되는 가상필드가 다수인 경우, 다수의 가상필드의 생성 후 생성된 다수의 가상필드를 포함한 다수의 자연어생성 필드에 대하여 자연어를 생성할 수 있다.In another example, the processor 10 of FIGS. 6 to 7 performs a process of generating a natural language for a virtual field generated after generating one virtual field when there are a plurality of natural language generation fields and a plurality of generated virtual fields. Can repeat. Or, in another example, the processor 10 of FIGS. 6 to 7 may include a plurality of natural language generation fields and a plurality of virtual fields generated after generation of a plurality of virtual fields, when there are a plurality of natural language generation fields and a plurality of generated virtual fields. Natural language can be generated for the generated field.

[도면 실시예][Drawing Example]

다음으로, 도 3 내지 5f를 참조하여, 구체적인 실시예를 살펴본다.Next, a specific embodiment will be described with reference to FIGS. 3 to 5F.

도 3을 참조하면, 분석의 대상이 되는 원본 필드의 데이터 입수후 자연어 생성을 위한 필드가 존재할 경우에 자연어를 생성하여 자연어 생성 결과를 도출한다. 자연어 생성 수행시에는 전체연결어, 필드값 가져오기, 필드명 가져오기, 줄바뀜 주기의 기능을 수행할 수 있다. 또한 원본 데이터 테이블에 자연어를 생성시킬 필드가 존재하지 않은 경우에는 자연어 생성을 위한 가상필드 만들기를 수행하여, 가상필드를 생성한다. 가상필드 만들기 수행에는 가상수치 필드 만들기, 가상 이격도 필드 만들기, 가상 디멘젼 필드 만들기, 가상 디멘젼 요약 필드 만들기 등을 수행할 수 있다. 이때, 가상수치 필드, 가상 이격도 필드, 가상디멘젼 요약 필드는 수치값 가상필드일 수 있고, 가상 디멘젼 필드는 필드 값이 문자 필드 값이거나 숫자와 문자혼합된 혼합 필드 값인 경우의 가상필드일 수 있다. 예컨대, 가상필드 생성은 자연어 생성조건에 포함되거나 별도로 구비되는 가상필드 생성조건에 따라 수행될 수 있다. 또는 자연어 생성조건에 따라 생성되는 필드명에 따른 미리 설정된 정의에 따라 가상필드가 생성될 수도 있다. 사용자가 필요로 하는 가상필드가 생성된 경우에는 자연어 생성을 위한 필드가 존재하는 것으로 판단하고, 필드가 존재할 경우의 자연어 생성과정과 동일한 방법으로 자연어를 수행한다. 필드란 데이터에서 필드명과 적어도 하나 이상의 필드 값을 포함하고, 적어도 하나 이상의 필드 값은 각각 식별아이디에 대응한다. 필드는 데이터 테이블에서 한 개만을 의미하는 것은 아니고, 여러 개의 필드를 포함한다. 자연어 생성후 추가로 생성할 자연어가 있는 경우에는 반복적으로 수행하며, 최종적으로 추가로 생성할 자연어가 없는 경우에 종료가 된다. 자연어 생성은 가상필드 만들기 수행과 자연어 생성 수행을 순차적으로 수행하는 것 뿐 만 아니라, 자연어 생성을 위한 가상 필드 만들기 작업을 모두 수행후, 이를 활용하여 자연어 생성 수행 모두 수행하는 방법 즉, 2개의 단계로 수행하는 것을 포함한다.Referring to FIG. 3, when a field for generating natural language exists after obtaining data of an original field to be analyzed, a natural language is generated to derive a natural language generation result. When performing natural language generation, functions such as full connection word, field value import, field name import, and line break cycle can be performed. In addition, when there is no field to generate natural language in the original data table, virtual field is created by creating a virtual field for natural language generation. Virtual field creation can be performed by creating a virtual numeric field, creating a virtual separation field, creating a virtual dimension field, and creating a virtual dimension summary field. In this case, the virtual numeric field, the virtual separation field, and the virtual dimension summary field may be a numeric value virtual field, and the virtual dimension field may be a virtual field when the field value is a character field value or a mixed field value mixed with numbers and characters. For example, the virtual field generation may be performed according to the virtual field generation condition included in the natural language generation condition or provided separately. Alternatively, a virtual field may be generated according to a predefined definition according to a field name generated according to a natural language generation condition. When a virtual field required by the user is generated, it is determined that a field for natural language generation exists, and the natural language is performed in the same manner as the natural language generation process when the field exists. A field includes a field name and at least one field value in the data, and the at least one field value corresponds to an identification ID, respectively. A field does not mean only one in the data table, but includes multiple fields. If there is an additional natural language to be generated after the natural language is generated, it is repeatedly performed, and finally, when there is no additional natural language to be generated, it is terminated. Natural language generation is not only sequentially performing virtual field creation and natural language generation, but also performing all the virtual field creation operations for natural language generation, and then using them to perform both natural language generation, that is, in two steps. Includes performing.

도 3을 참조하면, 가상 필드 만들기 수행에는 필드에 대한 연산자를 이용한 가상 수치 필드 만들기, 필드의 분포상에서 얼마나 이격이 있는지에 관한 가상 이격도 필드 만들기, 디멘젼 필드의 그룹화등 가상 디멘젼 필드 만들기, 디멘젼 필드의 요약등 가상 디멘젼 요약 필드 만들기 등이 선택적으로 포함될 수 있다. 예컨대, 가상 수치 필드 만들기에는 연사자를 이용한 가상 수치 필드 만들기, 표준지수를 이용한 가상 수치 필드 만들기, 정렬을 이용한 가상 수치 필드 만들기 등이 선택적으로 포함될 수 있고, 가상 이격도 필드 만들기는 연산자를 이용한 가상 이격도 값 필드 만들기, 연사자를 이용한 가상 이격도 증감율 필드 만들기 등이 선택적으로 포함될 수 있고, 가상 디멘젼 필드 만들기는 디멘젼 필드의 가상 디멘젼 필드 만들기, 단일 수치 필드의 가상 디멘젼 필드 만들기, 복수 수치 필드의 가상 디멘젼 필드 만들기, 복수의 문자, 수치 혼합형 필드의 가상 디멘젼 필드 만들기 등이 선택적으로 포함될 수 있다.Referring to FIG. 3, in performing virtual field creation, creating a virtual numeric field using an operator for a field, creating a virtual separation field regarding how far apart is in the field distribution, creating a virtual dimension field such as grouping dimension fields, and creating a dimension field. The creation of a virtual dimension summary field such as a summary can be optionally included. For example, creating a virtual numeric field can optionally include creating a virtual numeric field using a speaker, creating a virtual numeric field using a standard index, and creating a virtual numeric field using alignment, and creating a virtual separation field is a virtual separation value using an operator. Creating a field, creating a virtual separation rate field using a speaker, etc. can be optionally included, and creating a virtual dimension field includes creating a virtual dimension field of a dimension field, creating a virtual dimension field of a single numeric field, creating a virtual dimension field of multiple numeric fields, The creation of a virtual dimension field of a plurality of characters and a numeric hybrid field may be optionally included.

또한, 도 3을 참조하면, 자연어 생성 수행에 관한 예를 도시하고 있다. 자연어 생성 수행에는 각 레코드별 연결어를 주는 것이 아니라 모든 레코드에 적용되는 전체연결어, 각 레코드에 해당하는 필드 값을 가져오는 필드 값 가져오기, 각 레코드에 해당하는 필드 값이 조건에 부합할 경우에 필드명을 가져오는 필드명 가져오기, 자연어 문장이 종결된 경우에 다음 문장을 위하여 줄을 바꾸는 줄 바뀜 주기 등이 포함될 수 있다. 예컨대, 전체연결어와 필드 값 가져오기나 필드명 가져오기를 기본으로 자연여 생성을 수행할 수 있다. 전체연결어에는 전체연결어로 구성되며, 필드 값 가져오기에는 수치 필드 값 가져오기, 문자 필드 값 가져오기, 디멘젼의 뷰 필드 값 가져오기 등이 포함될 수 있으며, 필드명 가져오기는 필드명 가져오기로 구성되며, 줄바뀜 주기는 줄 바뀜 주기로 구성될 수 있다.Also, referring to FIG. 3, an example of performing natural language generation is shown. To perform natural language generation, a linkage word for each record is not given, but a global linkage applied to all records, a field value that gets a field value corresponding to each record, and a field when a field value corresponding to each record meets the conditions. It may include fetching the field name for fetching the name, and the line break cycle for changing the line for the next sentence when the natural language sentence is terminated. For example, natural word generation can be performed based on the import of the entire connection word and the field value or the import of the field name. Global concatenation consists of all concatenation words, and field value import can include numeric field value import, character field value import, dimension view field value, etc., field name import consists of field name import. And, the line break cycle can be composed of a line break cycle.

도 4a는 본 발명에서 가상필드 만들기 수행에서 가상수치 필드 만들기 중 연산자를 이용한 가상수치필드 만들기 예시를 나타내고 있다. 원본 필드 값에 연산자를 이용하여 별도의 가상 수치 필드를 만드는 작업으로 한 개 이상의 필드에 사칙연산등을 사용하여 가상 수치 필드를 만들 수 있다. 본 도면에서는 내구인계와 외국인계를 더하여 내외국인 총인구수 가상 필드를 만드는 과정에 관한 예시이다. 연산자에는 + - × ÷ 등 사칙연산 기호 외에도 = ( ) 루트 제곱 등의 연산을 위한 통상적인 기호를 포함한다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다. 4A shows an example of creating a virtual numeric field using an operator while creating a virtual numeric field in performing virtual field creation in the present invention. A virtual numeric field can be created using four arithmetic operations on one or more fields by creating a separate virtual numeric field by using an operator on the original field value. This figure is an example of the process of creating a virtual field for the total number of domestic and foreign populations by adding endurance and foreigners. In addition to the four arithmetic symbols, such as +-× ÷, the operator includes general symbols for operations such as = () root square. The virtual field created through this process, that is, the generation table, may be composed of the identification ID of the original field, the virtual field name defined by the user, and the value of the virtual field.

도 4b는 본 발명의 가상 필드 만들기 수행에서 가상 수치 필드 만들기 중 표준지수를 이용한 가상 수치 필드 만들기 예시를 나타낸 도면이다. 표준지수를 이용한 가상수치 필드 만들기는 레코드 전체의 필드 값 분포 중 해당 레코드의 위치를 파악하기 위한 것으로 백분위지수를 사용할 수 있다. 본 도면에서는 총세대수에 대한 백분위지수를 산출한 과정에 관한 예시이다. 표준지수 산출시 사용은 백분위로 하고 있으나, 표준화지수인 표준화 Z점수등 표준화를 위한 통계적인 지수를 포함한다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다. 4B is a diagram showing an example of creating a virtual numeric field using a standard index during virtual numeric field creation in performing virtual field creation according to the present invention. Creating a virtual numeric field using a standard index is to determine the location of a corresponding record among the distribution of field values across the record, and a percentile index can be used. This figure is an example of the process of calculating the percentile index for the total number of households. When calculating the standard index, it is used as a percentile, but includes statistical indexes for standardization such as standardized Z score, which is a standardized index. The virtual field created through this process, that is, the generation table, may be composed of the identification ID of the original field, the virtual field name defined by the user, and the value of the virtual field.

도 4c는 본 발명의 가상필드 만들기 수행에서 가상 이격도 필드 만들기 중 연산자를 이용한 가상 이격도 값 필드 만들기 예시를 나타낸 도면이다. 연산자를 이용한 가상 이격도 값 필드 만들기는 특정 레코드가 레코드 전체의 필드 값 평균 대비 몇 정도 값의 이격이 있는 지를 파악하기 위한 것일 수 있다. 이격의 기준 값으로 평균을 사용하고 있으나, 최대값,최소값, 중위수등을 포함하며, 이격의 기준 값은 별도의 연산자 없이 내부적인 알고리즘에 의하여 계산할 수 있다. 본 도면에서는 전체 레코드의 내외국인총인구수 필드 값의 평균 대비 특정 레코드의 내외국인총인구수 필드 값의 과부족을 산출하는 과정에 관한 예시이다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다.4C is a diagram showing an example of creating a virtual separation value field using an operator during virtual separation field creation in performing virtual field creation according to the present invention. Creating a virtual separation value field using an operator may be to determine how many values are separated by a specific record compared to the average field value of the entire record. The average is used as the reference value of the separation, but includes the maximum value, minimum value, and median, and the reference value of the separation can be calculated by an internal algorithm without a separate operator. This drawing is an example of a process of calculating an excess or shortage of a field value of the total number of foreigners and foreigners of a specific record compared to the average of the field value of the total number of foreigners and foreigners of all records. The virtual field created through this process, that is, the generation table, may be composed of the ID of the original field, the name of the virtual field defined by the user, and the value of the virtual field.

도 4d는 본 발명의 가상 필드 만들기 수행에서 가상 디멘젼 필드 만들기 중 디멘젼 필드의 가상 디멘젼 필드 만들기 예시를 나타낸 도면이다. 디멘젼 필드의 가상 디멘젼 필드 만들기는 현재 디멘젼의 관점에서 다른 관점의 디멘젼으로 분석하기 위하여 사용되는 경우에 사용하며, 디멘젼 필드의 가상 디멘젼 필드 만들기는 한 개 필드내의 디멘젼을 그룹핑하여 가상 디멘젼 필드로 생성하는 것으로, 디멘젼에는 숫자형, 문자형, 숫자문자 혼합형등을 모두 포함할 수 있다. 본 도면에서는 원본에 소득계층 필드에는 고소득층, 중산층, 일반층, 저소득층으로 구성되어 있는 것을 “고소득층”과 “중산층”을 통합하여 “고소득층과 중산층"값으로 변경하고, “일반층“, “저소득층” 은 동일하게 가상적으로 구성하는 과정에 관한 예시이다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다. 디멘젼 필드의 가상 디멘젼 필드 만들기는 원본의 한 개 디멘젼 필드뿐 만 아니라, 2개 이상의 디멘젼 필드를 대상으로 가상 디멘젼 필드 만드는 것을 포함한다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다. 4D is a diagram illustrating an example of creating a virtual dimension field of a dimension field during virtual dimension field creation in performing virtual field creation according to the present invention. Creating a virtual dimension field of a dimension field is used when it is used to analyze a dimension from a different perspective from the current dimension point of view, and creating a virtual dimension field of a dimension field creates a virtual dimension field by grouping dimensions within one field. As a result, the dimension can include all of the numeric type, character type, and mixed type of numeric characters. In this drawing, in the original income class field, what consists of high-income, middle-class, general and low-income class is changed to "high-income class" and "middle class" value by integrating "high-income class" and "middle class", and "general class", "low-income class" Is an example of the process of virtually configuring the same. The virtual field created through this process, that is, the generation table, may be composed of the identification ID of the original field, the virtual field name defined by the user, and the value of the virtual field. Creating a virtual dimension field of a dimension field involves creating a virtual dimension field for not only one dimension field of the original, but also two or more dimension fields. The virtual field created through this process, that is, the generation table, may be composed of the ID of the original field, the name of the virtual field defined by the user, and the value of the virtual field.

도 4e는 본 발명의 가상 필드 만들기 수행에서 가상 디멘젼 필드 만들기 중 단일 수치 필드의 가상 디멘젼 필드 만들기 예시를 나타낸 도면이다. 단일 수치 필드의 가상 디멘젼 필드 만들기는 한 개 필드의 수치 값을 수치 조건 범위에 따라 디멘젼으로 분류하는 경우에 사용한다. 각 레코드별 단일 수치 필드의 값에 대하여 수치조건 범위에 있는지는 단일 수치 필드의 시작 값과 종료 값을 설정하고 시작 값과 종료 값의 포함여부를 등호 및 부등호로 정의할 수 있다. 등호 및 부등호는 = < > ≠ ≤ ≥ 등의 기호로 설정할 수 있다. 본 도면에서는 각 레코드의 총세대수백분위 필드 값을 10%미만이면 “매우 적은 편은 편입니다.” , 10%이상이면서 35%미만이면 “적습니다.”, 35%이상이면서 65%미만이면 “보통입니다.”, 65%이상이면서 90%미만이면 “많읍니다.”, 95%이상이면서 “매우 많은 편입니다.” 로 정의후에 총세대수 평가 결과를 각 레코드별로 산출하는 과정에 관한 예시입니다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다.4E is a diagram illustrating an example of creating a virtual dimension field of a single numeric field during virtual dimension field creation in performing virtual field creation according to the present invention. Creating a virtual dimension field of a single numeric field is used to classify a numeric value of one field into a dimension according to a range of numeric conditions. To determine whether the value of a single numeric field for each record is within the numerical condition range, the start value and the end value of a single numeric field can be set, and whether the start value and the end value are included can be defined with equal signs and inequality signs. Equal sign and inequality sign can be set with symbols such as = <> ≠ ≤ ≥. In this drawing, if the value of the total number of households percentile field of each record is less than 10%, it is "very small." , If it is more than 10% and less than 35%, it is “little”, if it is more than 35% and less than 65%, it is “normal”, if it is more than 65% and less than 90%, it is “a lot”, and if it is more than 95% and “very much” is." This is an example of the process of calculating the total number of households evaluation result for each record after it is defined as. The virtual field created through this process, that is, the generation table, may be composed of the identification ID of the original field, the virtual field name defined by the user, and the value of the virtual field.

도 4f는 본 발명의 가상 필드 만들기 수행에서 가상 디멘젼 필드 만들기 중 복수의 문자 수치 혼합형 필드의 가상 디멘젼 필드 만들기 예시를 나타낸 도면이다. 복수의 문자수치 혼합형 필드의 가상 디멘젼 필드 만들기는 2개 이상의 문자와 수치가 혼합된 필드를 대상으로 가상 디멘젼을 만드는 경우에 사용한다. 복수의 문자수치 혼합형 필드의 가상 디멘젼 필드 만들기는 사용할 필드를 2개 이상을 선택할 수 있으며, 선택한 각 필드의 시작 값과 종료 값에 대하여 부등호로 포함관계를 부등호로 정의하며, 각 레코드의 필드 값이 시작 값과 종료 값 범위에 포함될 경우에 분류한다. 부등호는 = < > ≠ ≤ ≥ 등의 기호로 설정할 수 있다.4F is a diagram showing an example of creating a virtual dimension field of a plurality of character-numeric hybrid fields while creating a virtual dimension field in performing virtual field creation according to the present invention. Creating a virtual dimension field of multiple character value hybrid fields is used to create a virtual dimension for a field in which two or more characters and numbers are mixed. To create a virtual dimension field of multiple character-value hybrid fields, you can select two or more fields to use, and the inclusion relationship is defined as an inequality sign with an inequality sign for the start value and the end value of each selected field, and the field value of each record is Classified when included in the range of the start value and the end value. The inequality sign can be set with a symbol such as = <> ≠ ≤ ≥.

도 4f에서는 각 레코드의 총세대수와 월소득 평가 필드 값을 기준으로 작성된 예시이며, 이를 설명하면, 총세대수 9,000이상이면서 월소득 평가 필드 값이 고소득지역 이면 "고소득가구수가 많은 지역임으로 중고가브랜드의 매장 출점을 우선적으로 고려하여야 합니다.", 총세대수 9,000미만이면서 월소득평가 필드 값이 고소득지역 이면 "고소득지역이나, 가구수가 적음으로 매장 출점을 할 필요가 없다고 사료됩니다.", 총세대수 9,000 이상이면서 월소득평가 필드 값이 저소득지역 이면 "저소득지역이나 가구수가 많음으로 저가 브랜드 매장 출점을 우선적으로 고려해 볼 필요가 있습니다.", 총세대수 9,000 미만이면서 월소득평가 필드 값이 저소득지역이면 "저소득지역이면서, 가구수도 적은 지역임으로 매장 출점을 할 필요가 없다고 사료됩니다."로 정의 후에 각 레코드별로 평가한 결과를 산출하는 과정에 관한 예시이다. 본 도면에서는 2개의 필드를 기준으로 설명하였으나, 3개이상의 복수 문자수치 혼합형 필드를 대상으로 가상 디멘젼 필드 만드는 것을 포함한다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다.Figure 4f is an example written based on the total number of households and monthly income evaluation field value of each record. To explain this, if the total number of households is 9,000 or more and the monthly income evaluation field value is a high-income area, "The area with a large number of high-income households is given priority to opening stores of middle- and high-end brands If the total number of households is less than 9,000 and the monthly income evaluation field value is high-income area, it is considered that there is no need to open a store in a high-income area or because the number of households is small.”, When the total number of households is 9,000 or more and the monthly income evaluation field value is low-income If it is a region, "It is necessary to first consider opening a low-cost brand store because of the large number of low-income regions or households.", If the total number of households is less than 9,000 and the monthly income evaluation field value is low-income region, then, "It is a low-income region and has a small number of households. This is an example of the process of calculating the evaluation result for each record after definition as "I don't think there is a need to do it." In this drawing, although the description is made based on two fields, it includes creating a virtual dimension field for three or more multi-character numeric hybrid fields. The virtual field created through this process, that is, the generation table, may be composed of the identification ID of the original field, the virtual field name defined by the user, and the value of the virtual field.

도 4g는 본 발명의 가상 필드 만들기 수행에서 가상 요약 필드 만들기 예시를 나타낸 도면이다. 가상 디멘젼 요약 필드 만들기는 디멘젼 필드 기준으로 분석하고 자 하는 필드 즉, 뷰 필드의 값을 요약하여 분석하고자 하는 경우에 사용한다. 가상 디멘젼 요약 필드 만들기는 디멘젼 필드를 선택 후에 분석의 대상 필드 즉, 뷰 필드 선택과 선택된 뷰 필드의 값에 대한 요약 기준 설정으로 구성된다. 뷰 필드의 요약기준은 평균, 최소값, 최대값, 중위수 등을 사용할 수 있다. 본 도면에서는 디멘젼 그룹 필드로 "소득계층 가상 그룹"을 선택하였으며, 디멘젼 뷰 필드로 “월소득”, 디멘젼 뷰필드의 요약 기준을 “평균"으로 정의하여 소득계층 가상그룹별 평균 월소득을 도출하는 과정에 관한 예시이다. 본 과정을 통하여 생성된 가상필드 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 가상필드명과 가상필드의 값으로 구성될 수 있다.4G is a diagram showing an example of creating a virtual summary field in performing virtual field creation according to the present invention. Creating a virtual dimension summary field is used when a field to be analyzed based on the dimension field, that is, a view field value, is to be summarized and analyzed. Creating a virtual dimension summary field consists of selecting a field to be analyzed, that is, a field of view, and setting a summary criterion for the value of the selected field of view after selecting the dimension field. Average, minimum, maximum, median, etc. can be used as the summary criterion for the field of view. In this drawing, "income class virtual group" was selected as the dimension group field, and "monthly income" as the dimension view field, and the summary standard of the dimension view field was defined as "average". This is an example. The virtual field created through this process, that is, the generation table, may be composed of the identification ID of the original field, the virtual field name defined by the user, and the value of the virtual field.

도 4a 내지 4g의 가상 필드 만들기는 사례를 구체적으로 설명하기 위하여 제시하였으나, 각 부문은 통합하여 만들 수 있음은 자명하다. 예를 들면, 가상 수치 필드 만들기에 연산자를 이용한 가상수치필드만들기, 표준지수를 이용한 가상 수치 필드 만들기, 정렬을 이용한 가상 수치 필드 만들기의 적어도 2 이상을 통합하여 가상수치필드 만들기를 수행할 수 있다. 도 4a 내지 4g의 가상 필드 만들기는 사례를 구체적으로 설명하기 위하여 각 부문별로 필드를 생성하는 것을 예시로 하여 여러 개의 가상 필드 테이블이 구성되는 것을 예시로 하고 있으나, 한 개의 가상 테이블에 식별아이디와 사용자가 정의하는 가상필드를 모두 포함하는 형태로 생성하는 것을 포함할 수 있다. Although the creation of the virtual field in FIGS. 4A to 4G has been presented to explain the case in detail, it is obvious that each section can be integrated. For example, creating a virtual numeric field may be performed by integrating at least two or more of creating a virtual numeric field using an operator, creating a virtual numeric field using a standard index, and creating a virtual numeric field using alignment. Creating a virtual field in FIGS. 4A to 4G is an example of creating a field for each section in order to describe the case in detail, and it is an example that several virtual field tables are configured, but an identification ID and a user are in one virtual table. It may include creating in a form that includes all the virtual fields defined by.

도 5a는 본 발명의 자연어 생성 수행에서 수치 필드 값 가져오기 예시를 나타낸 도면이다. 수치 필드 값 가져오기는 특정 레코드의 필드 값을 가져와 자연어를 생성시키는 경우에 사용할 수 있다. 본 도면에서는 총세대수 필드의 값을 가져오는 것을 등록하여 각 레코드별로 총세대수 필드의 값을 가져와 자연어를 생성시키는 과정에 관한 예시 도면이다. 본 과정을 통하여 생성된 자연어 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 기준에 의한 자연어 생성 결과로 구성될 수 있다.5A is a diagram showing an example of obtaining a value of a numeric field in performing natural language generation according to the present invention. Get numeric field value can be used to generate natural language by getting the field value of a specific record. In this drawing, it is an exemplary diagram of a process of generating natural language by registering to get the value of the total number of households field and getting the value of the total number of households field for each record. The natural language generated through this process, that is, the generation table, may be composed of an identification ID of an original field and a natural language generation result according to a user-defined criterion.

도 5b는 본 발명의 자연어 생성 수행에서 디멘젼의 뷰 필드 값 가져오기 예시를 나타낸 도면이다. 디멘젼의 뷰 필드 값 가져오기는 디멘젼 필드의 디멘젼 내용과 일치하는 디멘젼 뷰 필드의 값을 가져오고자 하는 경우에 사용할 수 있다. 디멘젼 뷰 필드 값 가져오기는 디멘젼 필드선택, 디멘젼 필드내용, 디멘젼 뷰 필드 선택, 가져올 값, 2개이상 가져올 시 삽입 문자로 구성되며, 삽입문자는 콤마( , )등 특수기호와 사용자가 정의하는 연결문장 등을 사용할 수 있다. 본 도면에서는 원본 데이터에서 소득계층 가상 그룹 디멘젼과 평균 월소득 뷰 필드를 대상으로 디멘젼 필드 선택은 “소득계층가상그룹“, 디멘젼필드내용은 “고소득층과 중산층“, 디멘젼 뷰 필드 선택은 소득계층 가상그룹에서 고소득층과 중산층인 경우에 고소득층과 중산층 및 평균 월소득 값을 가져 오며, 2개이상 가져올시 삽입 문자를 콤마( , )을 표시하여 자연어를 생성시키는 과정에 관한 예시 도면이다. 본 과정을 통하여 생성된 자연어 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 기준에 의한 자연어 생성 결과로 구성될 수 있다.5B is a diagram showing an example of obtaining a dimension view field value in performing natural language generation according to the present invention. Get the dimension view field value can be used when you want to get the dimension view field value that matches the dimension content of the dimension field. Dimension view field value import consists of dimension field selection, dimension field content, dimension view field selection, value to be imported, and insertion characters when importing more than two, and the insertion character is a connection defined by the user with special symbols such as commas (, ). You can use sentences, etc. In this drawing, for the income class virtual group dimension and the average monthly income view field in the original data, the dimension field selection is “income class virtual group”, the dimension field content is “high income and middle class”, and the dimension view field selection is in the income class virtual group. In the case of high-income and middle-class, the high-income, middle-class, and average monthly income are imported, and when two or more are imported, a comma (,) is displayed to create natural language. The natural language generated through this process, that is, the generation table, may be composed of an identification ID of an original field and a natural language generation result according to a user-defined criterion.

도 5c는 본 발명의 자연어 생성 수행에서 필드명 가져오기 예시를 나타낸 도면이다. 필드명 가져오기는 특정 레코드의 필드 값이 사용자 조건에 일치할 경우에 각 레코드별로 필드명을 가져오는 것으로 하나의 필드명만 가져오는 것이 아니라, 필드별로 사용자 조건에 부합하는 필드가 2개 이상인 경우에도 가져 오는 것을 포함한다. 사용자 조건을 만족하는 필드가 여러 개인 경우에 필드명과 필드명 사이에 콤마( , )등 문자를 삽입할 수 있는데, 이러한 경우에는 2개이상 필드명 가져올 시 삽입 문자 명령에 의하여 수행한다. 본 도면에서는 높음 호출 조건으로 10세미만,10대, 20대, 30대 필드에 대하여 “높음” 인 경우에, 낮음 호출 조건으로는 10세미만, 10대, 20대, 30대 필드에 대하여 “낮음"인 경우에 필드명을 레코드별로 자연어를 생성하며, 생성시 2개이상 필드명 가져올 시 삽입 문자 명령에 콤마 ( , ) 표시하도록 하는 자연어를 생성 과정에 관한 예시 도면이다. 본 과정을 통하여 생성된 자연어 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 기준에 의한 자연어 생성 결과로 구성될 수 있다.5C is a diagram showing an example of getting a field name in performing natural language generation according to the present invention. Field name import is to import field names for each record when the field value of a specific record matches user conditions. Not only one field name is imported, but when there are two or more fields that meet user conditions for each field. Also includes bringing. When there are several fields that satisfy the user condition, characters such as commas (,) can be inserted between the field name and the field name. In this case, when importing two or more field names, it is executed by the insert character command. In this drawing, in the case of “High” for fields under 10, 10, 20, and 30 as a high calling condition, “High” for fields under 10, 10, 20, and 30 as a low calling condition. In the case of low”, a natural language is generated for each record, and when two or more field names are generated, a comma (,) is displayed in the inserted character command. The natural language generated through this process, that is, the generation table, may be composed of an identification ID of an original field and a natural language generation result according to a user-defined criterion.

도 5a 내지 5c는 자연어 생성 사례를 구체적으로 설명하기 위하여 제시하였으나, 각 부문은 통합하여 만들 수 있음은 자명하다. 예를 들면, 필드 값 가져오기에 수치 필드 값 가져오기, 문자 필드 값 가져오기, 디멘젼의 뷰 필드 값 가져오기 중 적어도 2 이상을 통합하여 필드 값 가져오기를 수행할 수 있다.5A to 5C are presented to specifically explain the case of natural language generation, but it is obvious that each section can be integrated and created. For example, the field value can be imported by integrating at least two of the field value import, the numeric field value import, the character field value import, and the dimension view field value import.

도 5d는 본 발명의 자연어 생성을 이용한 실시 중 필드값 가져오기, 전체 연결어, 줄바뀜주기를 활용한 자연어 생성 예시를 나타낸 도면이다. 본 도면은 각 레코드에 대하여 일차 필드에 대하여 필드값 가져오기, 스페이스 전체연결어, 이차 필드에 대하여 필드값 가져오기, 스페이스 전체연결어, 행정동명 필드에 대하여 필드값 가져오기, 스페이스전체연결어, “지역의 특성 분석 결과입니다.“ 전체 연결어, 줄바뀜주기 를 순차적으로 적용하여 자연어를 생성시키는 과정에 관한 예시이다. 본 과정을 통하여 생성된 자연어 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 기준에 의한 자연어 생성 결과로 구성될 수 있다.5D is a diagram showing an example of generating a natural language using a field value import, an entire connection word, and a line break period during execution using natural language generation according to the present invention. This figure shows the field value for the primary field for each record, the entire space linkage, the field value for the secondary field, the entire space linkage, the field value for the administrative name field, the space linkage, This is the result of characteristic analysis.” This is an example of the process of generating natural language by sequentially applying the entire connection word and line break cycle. The natural language generated through this process, that is, the generation table, may be composed of an identification ID of an original field and a natural language generation result according to a user-defined criterion.

도 5e는 본 발명의 자연어 생성 실시 중 전체연결어, 필드값 가져오기, 줄바뀜주기를 활용한 자연어 생성 예시를 나타낸 도면이다. 본 도면에서 내외국인 총인구수 과부족 평가 필드는 원본 내외국인 총인구수 필드를 활용하여 가상 수치 필드 만들기 과정에서 만들어진 내외국인 총인구수 과부족 필드 값을 단일 수치 가상 디멘젼 조건에 의하여 생성한 필드일 수 있다. 본 도면은 각 레코드에 대하여 “지역 전체 평균 대비“ 전체 연결어, 스페이스 전체연결어, “내외구인총인구과부족” 필드값 가져오기, “명으로 “ 전체연결어, 스페이스 전체연결어, “내외국인 총인구수 과부족 평가” 필드 값 가져오기, 줄바뀜주기를 순차적으로 적용하여 자연어를 생성시키는 과정에 관한 예시이다. 본 과정을 통하여 생성된 자연어 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 기준에 의한 자연어 생성 결과로 구성될 수 있다.5E is a diagram showing an example of natural language generation using an entire connection word, a field value import, and a line feed period during natural language generation according to the present invention. In this drawing, the field for evaluating the total number of domestic/foreigners oversufficiency may be a field generated by using the total number of domestic/foreigners field to generate a field value of the total number of domestic/foreigners oversufficiency fields created in the process of creating a virtual numeric field using a single numeric virtual dimension condition. This drawing is for each record, “total concatenation word, space total concatenation word, “total population and shortage” field values for each record, “total concatenation word, space total concatenation word, “total domestic and foreign population surplus and shortage evaluation” for each record. This is an example of the process of generating natural language by sequentially applying field value and line break cycles. The natural language generated through this process, that is, the generation table, may be composed of an identification ID of an original field and a natural language generation result according to a user-defined criterion.

도 5f는 본 발명의 자연어 생성 실시 중 전체연결어, 필드명 가져오기, 줄바뀜주기를 활용한 자연어 생성 예시를 나타낸 도면이다. 본 도면에서 연령대별 평가 결과는 연령대별 백분위 필드를 단일 수치 가상 필드 만들기에 의하여 생성한 필드일 수 있다. 본 도면은 각 레코드의 연령대별 평가 필드 값이 필드명 호출에 부합하는 경우에 자연어를 생성시키는 예시에 관한 것이다. 본 도면은 각 레코드별 연령대별 평가 결과에 대하여 “연령대별 인구수 구성비 분석 결과“ 전체 연결어, “스페이스“ 전체연결어, “높음 호출 조건“ 필드명 가져오기, “스페이스"전체연결어, “낮음호출조건“ 필드명 가져오기, “인구구성비는 낮은 지역입니다.” 전체연결어, 줄바뀜주기 를 순차적으로 적용하여 자연어를 생성시키는 과정에 관한 예시이다. 본 과정을 통하여 생성된 자연어 즉, 생성테이블은 원본 필드의 식별아이디와 사용자가 정의한 기준에 의한 자연어 생성 결과로 구성될 수 있다.FIG. 5F is a diagram showing an example of natural language generation using an entire connection word, a field name import, and a line break period during natural language generation according to the present invention. In this drawing, the evaluation result for each age group may be a field generated by creating a single numerical virtual field for the percentile field for each age group. This drawing relates to an example of generating a natural language when an evaluation field value for each age group of each record corresponds to a field name call. This drawing shows the results of the evaluation by age group for each record, “Results of Analysis of Population Ratio by Age Group” All concatenation words, “Space” total concatenation words, “High call condition” field names import, “Space” all concatenation words, “Low call condition” Get field name, “Population ratio is low.” This is an example of the process of generating natural language by sequentially applying the whole connection word and the line break period. The natural language generated through this process, that is, the generation table, may be composed of an identification ID of an original field and a natural language generation result according to a user-defined criterion.

도 5d 내지 5f의 자연어 생성 결과들은 적어도 2이상 결합하여 자연어를 생성할 수도 있다.The natural language generation results of FIGS. 5D to 5F may be combined to generate a natural language by combining at least two.

이상에서, 전술한 실시 예들 및 첨부된 도면들은 본 발명의 범주를 제한하는 것이 아니라 본 발명에 대한 당해 기술분야에서 통상의 지식을 가진 자의 이해를 돕기 위해 예시적으로 설명된 것이다. 즉, 본 발명의 다양한 실시 예는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 전술한 구성요소들의 다양한 조합에 따라 다양한 변형된 형태로도 구현될 수 있다. 따라서, 본 발명의 범위는 특허청구범위에 기재된 발명에 따라 해석되어야 하며 전술된 실시 예들뿐만 아니라 당해 기술분야에서 통상의 지식을 가진 자에 의한 다양한 변경, 대안, 균등 실시 예들을 포함하고 있다.In the above, the above-described embodiments and the accompanying drawings are not intended to limit the scope of the present invention, but are illustratively described to help those of ordinary skill in the art understand the present invention. That is, various embodiments of the present invention may be implemented in various modified forms according to various combinations of the above-described components without departing from the essential characteristics of the present invention. Accordingly, the scope of the present invention should be interpreted according to the invention described in the claims, and includes not only the above-described embodiments, but also various modifications, alternatives, and equivalent embodiments by those of ordinary skill in the art.

1: 전자장치 3: 데이터 베이스
10: 프로세서 11: 자연어생성 필드 확인모듈
13: 가상필드 생성모듈 15: 자연어 생성모듈
20: 입력장치 30: 메모리
1: electronics 3: database
10: processor 11: natural language generation field verification module
13: Virtual field generation module 15: Natural language generation module
20: input device 30: memory

Claims (14)

프로세서에서, 다수의 필드를 포함하는 데이터 테이블을 분석하는 자연어를 생성하기 위하여 설정 사항을 입력받는 단계;
읽어들인 상기 데이터 테이블에 상기 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 존재하는지를 확인하는 단계, 상기 자연어생성 필드는 상기 자연어를 생성하는 대상이 되는 필드임;
상기 자연어생성 필드의 부존재 시 자연어 생성을 위하여 읽어들인 상기 데이터 테이블에 포함되지 않은 상기 자연어생성 필드인 적어도 하나 이상의 가상필드를 생성하고 피드백하는 단계; 및
상기 자연어생성 필드의 존재 시 상기 프로세서에서 상기 설정 사항에 따라 상기 데이터 테이블을 분석하는 자연어를 생성하는 단계를 포함하고,
상기 가상필드의 피드백의 경우 상기 자연어생성 필드가 존재하는지를 확인하는 단계에서, 상기 가상필드가 포함되는 상기 데이터 테이블에 상기 자연어생성 필드가 존재하는지를 확인하고,
상기 자연어를 생성하는 단계는:
상기 설정 사항에 따라 상기 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하는 단계; 및
상기 설정 사항에 따른 상기 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져오는 단계를 포함하고,
상기 필드는 상기 필드명 및 적어도 하나 이상의 상기 필드 값을 포함하고,
상기 설정 사항을 입력받는 단계에서 상기 설정 사항은 상기 자연어를 생성하기 위한 자연어 생성기준을 포함하고, 상기 자연어 생성기준은 상기 전체 연결어에 관한 사항 및 상기 자연어생성 필드에 관한 사항을 포함하고,
상기 자연어생성 필드에 관한 사항은 상기 자연어생성 필드에서 필드 값 가져오기, 필드 값 호출조건에 부합하는 상기 자연어생성 필드의 필드명 가져오기 중 적어도 하나 이상을 포함하고,
상기 자연어생성 필드가 존재하는지를 확인하는 단계에서 확인대상 필드는 상기 필드 값 가져오기의 대상이 되는 필드, 상기 필드 값 호출조건에 포함된 필드 값을 보유하는 필드 중 어느 하나 이상이고,
상기 가상필드 각각은 상기 확인대상 필드의 부존재 시 생성되는 필드로서, 상기 데이터 테이블의 적어도 하나 이상의 필드의 필드 값을 처리, 가공 내지 평가하여 생성되는 필드 값을 보유하고,
상기 필드 값 처리는 2이상의 필드의 수치 필드 값의 연산처리, 하나의 필드에서의 상기 수치 필드 값의 표준화, 이격도 내지 순위 처리 중의 하나이고,
상기 필드 값 가공은 상기 기존 필드 내지 상기 필드 값 처리에 의해 생성된 필드에서, 적어도 2 이상의 필드 값의 그룹화를 이용한 상기 필드 값에 대한 재분류 가공 내지 하나의 필드의 필드 값과 동일한 그룹의 다른 수치 필드의 필드 값에 대한 평균 내지 표준화 가공이고,
상기 필드 값 평가는 상기 기존 필드, 상기 필드 값 처리에 의해 생성된 필드, 상기 필드 값 가공에 의해 생성된 필드 중 어느 하나 이상에서 적어도 상기 수치 필드 값을 보유하는 하나 이상의 필드에 대해 상기 수치 필드 값의 범위에 기반한 평가이고,
상기 필드 값 가공 내지 상기 필드 값 평가는 상기 설정 사항을 입력받는 단계에서 상기 설정 사항에 포함되는 가상필드 생성기준에 따라 수행되고,
상기 필드 값 처리는 생성되는 가상필드명에 대한 미리 설정된 정의에 따라 또는 사용자의 설정에 따라 수행되는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성 방법.
Receiving, by a processor, setting items to generate a natural language for analyzing a data table including a plurality of fields;
Checking whether at least one or more natural language generation fields according to the settings are present in the read data table, the natural language generation field being a field to generate the natural language;
Generating and feeding back at least one virtual field that is the natural language generation field that is not included in the data table read for natural language generation when the natural language generation field does not exist; And
In the presence of the natural language generation field, the processor generating a natural language for analyzing the data table according to the setting item,
In the step of checking whether the natural language generation field exists in the case of the feedback of the virtual field, it is checked whether the natural language generation field exists in the data table including the virtual field,
The step of generating the natural language is:
Generating an entire connection word applied to the entire record of the natural language generation field according to the setting item; And
Including the step of obtaining at least one or more of a field value and a field name of the natural language generation field according to the setting item,
The field includes the field name and at least one field value,
In the step of receiving the setting item, the setting item includes a natural language generation criterion for generating the natural language, and the natural language generation criterion includes a matter on the entire linked language and a matter on the natural language generation field,
The matters regarding the natural language generation field include at least one of fetching a field value from the natural language generation field and fetching a field name of the natural language generation field meeting a field value calling condition,
In the step of checking whether the natural language generation field exists, the verification target field is at least one of a field to be retrieved from the field value and a field holding a field value included in the field value calling condition,
Each of the virtual fields is a field generated when the field to be checked does not exist, and holds a field value generated by processing, processing, or evaluating field values of at least one field of the data table,
The field value processing is one of arithmetic processing of numerical field values of two or more fields, standardization of the numerical field values in one field, and separation or ranking processing,
The field value processing is performed by reclassifying the field value using grouping of at least two or more field values in the existing field or the field generated by the field value processing, or another numerical value in the same group as the field value of one field. It is the average or standardized processing of the field value of the field,
The field value evaluation is the numerical field value for one or more fields holding at least the numerical field value in one or more of the existing field, a field generated by processing the field value, and a field generated by processing the field value. Is an evaluation based on the scope of
The field value processing to the field value evaluation are performed according to a virtual field generation criterion included in the setting item in the step of receiving the setting item,
The field value processing is performed according to a preset definition for a generated virtual field name or a user's setting.
삭제delete 삭제delete 청구항 1에서,
상기 수치 필드 값의 연산처리는 연산자를 이용한 연산자 연산이고,
상기 수치 필드 값의 표준화 처리는 하나의 필드에서 백분위 점수, Z 점수, T 점수 및 해당 점수로부터 변환된 변환 점수를 이용한 표준화 처리이고,
상기 수치 필드 값의 이격도 처리는 하나의 필드에서 평균값, 최대값, 최소값 및 중위수 중 어느 하나를 기준값으로 하는 이격도 값 내지 이격도 증감율을 이용한 이격도 처리이고,
상기 수치 필드 값의 순위 처리는 하나의 필드에서 오름차순 순위, 내림차순 순위, 현재자료 상의 순번 순위 중 어느 하나에 따른 처리이고,
상기 수치 필드 값의 상기 표준화, 이격도 및 순위 처리의 대상인 필드는 기존 필드 내지 상기 연산처리에 따라 생성된 필드이고,
상기 필드 값에 대한 재분류 가공은 재분류에 따른 문자 가공 내지 재분류에 따른 수치 가공이고,
상기 필드 값 처리 및 상기 필드 값 가공 중 평균 내지 표준화 가공과 상기 필드 값에 대한 재분류 가공 중의 상기 수치 가공 각각은 수치값 가상필드를 생성하고,
상기 필드 값에 대한 상기 재분류 가공 중 상기 문자 가공 및 상기 필드 값 평가 각각은 디멘젼 가상필드를 생성하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성 방법.
In claim 1,
The operation processing of the numerical field value is an operator operation using an operator,
The standardization process of the numerical field value is a standardization process using a percentile score, a Z score, a T score, and a converted score converted from the corresponding score in one field,
The separation degree processing of the numerical field value is a separation degree processing using a separation degree value or a separation degree increase/decrease rate using any one of an average value, a maximum value, a minimum value, and a median number as a reference value in one field,
The ranking processing of the numerical field values is processing according to any one of an ascending order, a descending order, and an order order on the current data in one field,
A field that is the target of the standardization, separation, and ranking processing of the numerical field value is an existing field or a field generated according to the calculation process,
Reclassification processing for the field value is character processing according to reclassification or numerical processing according to reclassification,
Each of the numerical processing during the field value processing and the average or normalization processing during the field value processing and the reclassification processing for the field value creates a numerical value virtual field,
Each of the character processing and the field value evaluation during the reclassification processing of the field value generates a dimension virtual field.
청구항 1 또는 4 중 어느 하나에서,
상기 필드 값 호출조건은 필드의 특정값과의 일치, 2이상의 상기 특정값 중의 선택적 일치, 필드 값 특정범위의 만족 중 어느 하나에 관한 것이고,
상기 자연어를 생성하는 단계에서 상기 자연어 생성기준에 포함되는 처리순위에 따라 상기 자연어를 생성하고,
상기 자연어를 생성하는 단계는 생성되는 자연어 문장이 종결된 경우에 다음 문장을 위하여 줄을 바꾸는 과정을 포함하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성 방법.
In any one of claims 1 or 4,
The field value calling condition relates to any one of matching with a specific value of a field, selective matching of two or more of the specific values, and satisfaction of a specific range of a field value,
In the step of generating the natural language, the natural language is generated according to the processing priority included in the natural language generation criterion,
The generating of the natural language includes a process of changing a line for a next sentence when the generated natural language sentence is terminated.
청구항 1 또는 4 중의 어느 하나에서,
상기 자연어생성 필드가 다수이고 생성되는 상기 가상필드가 다수인 경우, 하나의 상기 가상필드 생성 후 생성된 상기 가상필드에 대한 상기 자연어를 생성하는 과정을 반복하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성 방법.
In any one of claims 1 or 4,
When the number of natural language generation fields is plural and the virtual fields to be generated are plural, natural language generation from a data table, characterized in that the process of generating the natural language for the virtual field generated after generating one virtual field is repeated. Way.
청구항 1 또는 4 중의 어느 하나에서,
상기 자연어생성 필드가 다수이고 생성되는 상기 가상필드가 다수인 경우, 다수의 상기 가상필드의 생성 후 생성된 다수의 상기 가상필드를 포함한 다수의 상기 자연어생성 필드에 대하여 상기 자연어를 생성하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성 방법.
In any one of claims 1 or 4,
When there are a plurality of natural language generation fields and a plurality of virtual fields are generated, the natural language is generated for a plurality of the natural language generation fields including the plurality of virtual fields generated after the generation of the plurality of virtual fields. How to generate natural language from a data table.
적어도 하나의 프로세서를 포함하는 전자 장치에 있어서,
상기 프로세서는,
다수의 필드를 포함하는 데이터 테이블을 분석하는 자연어를 생성하기 위하여 설정 사항을 입력받고, 읽어들인 상기 데이터 테이블에 상기 설정 사항에 따른 적어도 하나 이상의 자연어생성 필드가 존재하는지를 확인하고, 상기 자연어생성 필드는 상기 자연어를 생성하는 대상이 되는 필드이고,
상기 자연어생성 필드의 부존재 시 자연어 생성을 위하여 읽어들인 상기 데이터 테이블에 포함되지 않은 상기 자연어생성 필드인 적어도 하나 이상의 가상필드를 생성하여 피드백하고, 상기 가상필드의 피드백의 경우 상기 가상필드가 포함되는 상기 데이터 테이블에 상기 자연어생성 필드가 존재하는지를 확인하고,
상기 자연어생성 필드의 존재 시 상기 설정 사항에 따라 상기 데이터 테이블을 분석하는 자연어를 생성하되, 상기 설정 사항에 따라 상기 자연어생성 필드의 각 레코드 전체에 적용되는 전체연결어를 생성하는 과정과 상기 설정 사항에 따른 상기 자연어생성 필드의 필드 값, 필드명 중 적어도 하나 이상을 가져오는 과정을 포함하여 상기 자연어를 생성하고,
상기 필드는 상기 필드명 및 적어도 하나 이상의 상기 필드 값을 포함하고,
상기 프로세서에서 입력받는 상기 설정 사항은 상기 자연어를 생성하기 위한 자연어 생성기준을 포함하고, 상기 자연어 생성기준은 상기 전체 연결어에 관한 사항 및 상기 자연어생성 필드에 관한 사항을 포함하고, 상기 자연어생성 필드에 관한 사항은 상기 자연어생성 필드에서 필드 값 가져오기, 필드 값 호출조건에 부합하는 상기 자연어생성 필드의 필드명 가져오기 중 적어도 하나 이상을 포함하고,
상기 프로세서에서 존재여부 확인대상이 되는 상기 자연어생성 필드인 확인대상 필드는 상기 필드 값 가져오기의 대상이 되는 필드, 상기 필드 값 호출조건에 포함된 필드 값을 보유하는 필드 중 어느 하나 이상이고,
상기 프로세서는 상기 확인대상 필드의 부존재 시, 상기 데이터 테이블의 적어도 하나 이상의 필드의 필드 값을 처리, 가공 내지 평가하여 생성되는 필드 값을 보유하는 상기 가상필드를 생성하고,
상기 필드 값 처리는 2이상의 필드의 수치 필드 값의 연산처리, 하나의 필드에서의 상기 수치 필드 값의 표준화, 이격도 내지 순위 처리 중의 하나이고,
상기 필드 값 가공은 상기 기존 필드 내지 상기 필드 값 처리에 의해 생성된 필드에서, 적어도 2 이상의 필드 값의 그룹화를 이용한 상기 필드 값에 대한 재분류 가공 내지 하나의 필드의 필드 값과 동일한 그룹의 다른 수치 필드의 필드 값에 대한 평균 내지 표준화 가공이고,
상기 필드 값 평가는 상기 기존 필드, 상기 필드 값 처리에 의해 생성된 필드, 상기 필드 값 가공에 의해 생성된 필드 중 어느 하나 이상에서 적어도 상기 수치 필드 값을 보유하는 하나 이상의 필드에 대해 상기 수치 필드 값의 범위에 기반한 평가이고,
상기 필드 값 가공 내지 상기 필드 값 평가는 입력받은 상기 설정 사항에 포함되는 가상필드 생성기준에 따라 수행되고,
상기 필드 값 처리는 생성되는 가상필드명에 대한 미리 설정된 정의에 따라 또는 상기 사용자의 설정에 따라 수행되는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치.
In the electronic device including at least one processor,
The processor,
In order to generate a natural language for analyzing a data table including a plurality of fields, setting items are input, and it is checked whether at least one or more natural language generation fields according to the setting items exist in the read data table, and the natural language generation field is It is a field that is a target for generating the natural language,
In the absence of the natural language generation field, at least one virtual field that is the natural language generation field not included in the data table read for natural language generation is generated and fed back, and in the case of the feedback of the virtual field, the virtual field is included. Check whether the natural language generation field exists in the data table,
In the presence of the natural language generation field, a natural language for analyzing the data table is generated according to the setting details, and the process of generating a global connection word applied to the entire record of the natural language generation field according to the setting details and the setting details Generating the natural language, including the process of obtaining at least one or more of a field value and a field name of the natural language generation field according to,
The field includes the field name and at least one field value,
The setting information received from the processor includes a natural language generation criterion for generating the natural language, and the natural language generation criterion includes a matter on the entire linked language and a matter on the natural language generation field, and the natural language generation field Regarding matters includes at least one or more of fetching a field value from the natural language generation field and fetching a field name of the natural language generation field meeting a field value calling condition,
The verification target field, which is the natural language generation field to be checked for existence in the processor, is at least one of a field to be retrieved from the field value and a field to hold a field value included in the field value calling condition,
The processor generates the virtual field that holds field values generated by processing, processing, or evaluating field values of at least one field of the data table when the field to be checked does not exist,
The field value processing is one of arithmetic processing of numerical field values of two or more fields, standardization of the numerical field values in one field, and separation or ranking processing,
The field value processing is performed by reclassifying the field value using grouping of at least two or more field values in the existing field or the field generated by the field value processing, or another numerical value in the same group as the field value of one field. It is the average or standardized processing of the field value of the field,
The field value evaluation is the numerical field value for one or more fields holding at least the numerical field value in one or more of the existing field, a field generated by processing the field value, and a field generated by processing the field value. Is an evaluation based on the scope of
The field value processing to the field value evaluation are performed according to the virtual field creation criterion included in the input settings,
The field value processing is performed according to a predefined definition of a virtual field name to be generated or according to the user's setting.
삭제delete 삭제delete 청구항 8에서,
상기 수치 필드 값의 연산처리는 연산자를 이용한 연산자 연산이고,
상기 수치 필드 값의 표준화 처리는 하나의 필드에서 백분위 점수, Z 점수, T 점수 및 해당 점수로부터 변환된 변환 점수를 이용한 표준화 처리이고,
상기 수치 필드 값의 이격도 처리는 하나의 필드에서 평균값, 최대값, 최소값 및 중위수 중 어느 하나를 기준값으로 하는 이격도 값 내지 이격도 증감율을 이용한 이격도 처리이고,
상기 수치 필드 값의 순위 처리는 하나의 필드에서 오름차순 순위, 내림차순 순위, 현재자료 상의 순번 순위 중 어느 하나에 따른 처리이고,
상기 수치 필드 값의 상기 표준화, 이격도 및 순위 처리의 대상인 필드는 기존 필드 내지 상기 연산처리에 따라 생성된 필드이고,
상기 필드 값에 대한 재분류 가공은 재분류에 따른 문자 가공 내지 재분류에 따른 수치 가공이고,
상기 프로세서는 상기 필드 값 처리 및 상기 필드 값 가공 중 평균 내지 표준화 가공과 상기 필드 값에 대한 재분류 가공 중의 상기 수치 가공 각각에 따라 수치값 가상필드를 생성하고, 상기 필드 값에 대한 상기 재분류 가공 중 상기 문자 가공 및 상기 필드 값 평가 각각에 따라 디멘젼 가상필드를 생성하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치.
In claim 8,
The operation processing of the numerical field value is an operator operation using an operator,
The standardization process of the numerical field value is a standardization process using a percentile score, a Z score, a T score, and a converted score converted from the corresponding score in one field,
The separation degree processing of the numerical field value is a separation degree processing using a separation degree value or a separation degree increase/decrease rate using any one of an average value, a maximum value, a minimum value, and a median number as a reference value in one field,
The ranking processing of the numerical field values is processing according to any one of an ascending order, a descending order, and an order order on the current data in one field,
A field that is the target of the standardization, separation, and ranking processing of the numerical field value is an existing field or a field generated according to the calculation process,
Reclassification processing for the field value is character processing according to reclassification or numerical processing according to reclassification,
The processor generates a numerical value virtual field according to each of the average or standardized processing during the field value processing and the field value processing, and the numerical processing during the reclassification processing for the field value, and the reclassification processing for the field value And generating a dimension virtual field according to each of the character processing and evaluation of the field value.
청구항 8 또는 11 중 어느 하나에서,
상기 필드 값 호출조건은 필드의 특정값과의 일치, 2이상의 상기 특정값 중의 선택적 일치, 필드 값 특정범위의 만족 중 어느 하나에 관한 것이고,
상기 프로세서는 상기 자연어 생성기준에 포함되는 처리순위에 따라 상기 자연어를 생성하고,
상기 프로세서는, 생성되는 자연어 문장이 종결된 경우에 다음 문장을 위하여 줄을 바꾸는 과정을 수행하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치.
In any one of claims 8 or 11,
The field value calling condition relates to any one of matching with a specific value of a field, selective matching of two or more of the specific values, and satisfaction of a specific range of a field value,
The processor generates the natural language according to the processing priority included in the natural language generation criterion,
The processor is an electronic device for generating natural language from a data table, characterized in that when the generated natural language sentence is terminated, the process of changing a line for a next sentence is performed.
청구항 8 또는 11 중의 어느 하나에서,
상기 프로세서는, 상기 자연어생성 필드가 다수이고 생성되는 상기 가상필드가 다수인 경우, 하나의 상기 가상필드 생성 후 생성된 상기 가상필드에 대한 상기 자연어를 생성하는 과정을 반복하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치.
In any one of claims 8 or 11,
The processor, when the number of natural language generation fields is plural and the virtual fields to be generated are plural, repeats the process of generating the natural language for the virtual field generated after one virtual field is generated. An electronic device that performs natural language generation from
청구항 8 또는 11 중의 어느 하나에서,
상기 프로세서는, 상기 자연어생성 필드가 다수이고 생성되는 상기 가상필드가 다수인 경우, 다수의 상기 가상필드의 생성 후 생성된 다수의 상기 가상필드를 포함한 다수의 상기 자연어생성 필드에 대하여 상기 자연어를 생성하는 것을 특징으로 하는 데이터 테이블로부터의 자연어 생성을 수행하는 전자장치.
In any one of claims 8 or 11,
The processor generates the natural language for a plurality of the natural language generation fields including the plurality of virtual fields generated after the generation of the plurality of virtual fields when the number of natural language generation fields is plural and the generated virtual fields are plural. An electronic device for generating natural language from a data table.
KR1020190178779A 2019-12-30 2019-12-30 Method and electronic device for producing natural language from data table KR102240303B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190178779A KR102240303B1 (en) 2019-12-30 2019-12-30 Method and electronic device for producing natural language from data table

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190178779A KR102240303B1 (en) 2019-12-30 2019-12-30 Method and electronic device for producing natural language from data table

Publications (1)

Publication Number Publication Date
KR102240303B1 true KR102240303B1 (en) 2021-05-27

Family

ID=76135371

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190178779A KR102240303B1 (en) 2019-12-30 2019-12-30 Method and electronic device for producing natural language from data table

Country Status (1)

Country Link
KR (1) KR102240303B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150309990A1 (en) * 2014-04-25 2015-10-29 International Business Machines Corporation Producing Insight Information from Tables Using Natural Language Processing
KR20180077689A (en) 2016-12-29 2018-07-09 주식회사 엔씨소프트 Apparatus and method for generating natural language
US20180276204A1 (en) * 2013-08-29 2018-09-27 Arria Data2Text Limited Text generation from correlated alerts
KR20190011031A (en) 2017-07-24 2019-02-01 삼성전자주식회사 Electronic device and metohd for expressing natural language
KR20190019748A (en) 2017-08-18 2019-02-27 삼성전자주식회사 Method and apparatus for generating natural language

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180276204A1 (en) * 2013-08-29 2018-09-27 Arria Data2Text Limited Text generation from correlated alerts
US20150309990A1 (en) * 2014-04-25 2015-10-29 International Business Machines Corporation Producing Insight Information from Tables Using Natural Language Processing
KR20180077689A (en) 2016-12-29 2018-07-09 주식회사 엔씨소프트 Apparatus and method for generating natural language
KR20190011031A (en) 2017-07-24 2019-02-01 삼성전자주식회사 Electronic device and metohd for expressing natural language
KR20190019748A (en) 2017-08-18 2019-02-27 삼성전자주식회사 Method and apparatus for generating natural language

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
K. Nishida et al., Understanding the Semantic Structures of Tables with a Hybrid Deep Neural Network Architecture, Proc. of 31st AAAI conf. on AI (AAAI-17) pp.168-174 (2017). *
Tang, Duyu, et al. "Effective LSTMs for Target-Dependent Sentiment Classification." arXiv preprint arXiv:1512.01100v2. 2016.9.29. *
박소윤 외, TabQA: 표 양식의 데이터에 대한 질의응답 모델, 제30회 한글및한국어정보처리학술대회 논문집 pp.263-269 (2018) *

Similar Documents

Publication Publication Date Title
WO2013003008A2 (en) Automatic classification of electronic content into projects
Morales-Ramirez et al. Speech-acts based analysis for requirements discovery from online discussions
Chen et al. Mining user requirements to facilitate mobile app quality upgrades with big data
US20050076037A1 (en) Method and apparatus for computerized extracting of scheduling information from a natural language e-mail
CN108153729B (en) Knowledge extraction method for financial field
CN110555205B (en) Negative semantic recognition method and device, electronic equipment and storage medium
KR20170118983A (en) Counseling system and method through robo advisor
CN111143505A (en) Document processing method, device, medium and electronic equipment
CN112667209A (en) Flow component system for realizing full-connection rapid development framework based on computer software
CN111667923B (en) Data matching method and device, computer readable medium and electronic equipment
Ciravegna et al. LearningPinocchio: Adaptive information extraction for real world applications
WO2020219750A1 (en) Management of annotation jobs
Yuan et al. Isea: An interactive pipeline for semantic error analysis of nlp models
US8745050B2 (en) Definitions in master documents
KR102240303B1 (en) Method and electronic device for producing natural language from data table
CN112966482A (en) Report generation method, device and equipment
CN111581937A (en) Document generation method and device, computer readable medium and electronic equipment
Allen et al. A directed topic model applied to call center improvement
CN111339214A (en) Automatic knowledge base construction method and system
CN112789636A (en) Information processing apparatus, information processing method, and program
CN109657073A (en) Method and apparatus for generating information
KR20170142964A (en) Counseling system and method through robo advisor
Kagkelidis et al. Lumina: an adaptive, automated and extensible prototype for exploring, enriching and visualizing data
Youdeowei The B_Rule Methodology: A Business Rule Approach to Information Systems Development
CN112949274A (en) Document data entry method and system

Legal Events

Date Code Title Description
GRNT Written decision to grant