KR20210134588A - Method for preprocessing structured learning data - Google Patents

Method for preprocessing structured learning data Download PDF

Info

Publication number
KR20210134588A
KR20210134588A KR1020210149898A KR20210149898A KR20210134588A KR 20210134588 A KR20210134588 A KR 20210134588A KR 1020210149898 A KR1020210149898 A KR 1020210149898A KR 20210149898 A KR20210149898 A KR 20210149898A KR 20210134588 A KR20210134588 A KR 20210134588A
Authority
KR
South Korea
Prior art keywords
data
learning
neural network
artificial neural
level
Prior art date
Application number
KR1020210149898A
Other languages
Korean (ko)
Other versions
KR102408186B1 (en
Inventor
유태준
황이규
조면철
박영선
최홍섭
Original Assignee
주식회사 마인즈랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마인즈랩 filed Critical 주식회사 마인즈랩
Publication of KR20210134588A publication Critical patent/KR20210134588A/en
Application granted granted Critical
Publication of KR102408186B1 publication Critical patent/KR102408186B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

According to one embodiment of the present invention, provided is a method for preprocessing structured learning data, which includes the steps of: receiving structured learning data comprising one or more data; identifying a structured form of the structured learning data; determining a level character corresponding to each level of the one or more data with reference to the structured form; and generating preprocessing learning data in which the one or more data and level characters of each of the one or more data are listed in the predetermined form.

Description

구조화된 학습 데이터의 전처리 방법{Method for preprocessing structured learning data}Method for preprocessing structured learning data

본 발명의 실시예들은 구조화된 학습 데이터의 전처리 방법에 관한 것으로, 데이터의 구조화 정보를 문자로 변환하여 학습 데이터에 삽입하는 방법에 관한 것이다.Embodiments of the present invention relate to a method of pre-processing structured learning data, and to a method of converting structured information of data into text and inserting it into learning data.

인공 지능이라는 개념은 1956년 미국 다트머스 대학에 있던 존 매카시 교수가 개최한 다트머스 회의에서 처음 등장했으며, 최근 몇 년 사이 폭발적으로 성장하고 있는 중이다.The concept of artificial intelligence first appeared in 1956 at a Dartmouth conference held by Professor John McCarthy at Dartmouth University, USA, and has been growing explosively in recent years.

특히 2015년 이후 신속하고 강력한 병렬 처리 성능을 제공하는 GPU의 도입으로 더욱 가속화되고 있으며, 폭발적으로 늘어나고 있는 저장 용량과 이미지, 텍스트, 매핑 데이터 등 모든 영역의 데이터가 범람하게 된 '빅데이터' 시대의 도래도 이러한 성장세에 큰 영향을 미쳤다.In particular, since 2015, it has been accelerated by the introduction of GPUs that provide fast and powerful parallel processing performance, and in the era of 'big data', where the explosively increasing storage capacity and data in all areas, such as images, texts, and mapping data, overflowed. The advent also had a significant impact on this growth.

머신 러닝은 기본적으로 알고리즘을 이용해 데이터를 분석하고, 분석을 통해 학습하며, 학습한 내용을 기반으로 판단이나 예측을 한다. 따라서 궁극적으로는 의사 결정 기준에 대한 구체적인 지침을 소프트웨어에 직접 코딩해 넣는 것이 아닌, 대량의 데이터와 알고리즘을 통해 컴퓨터 그 자체를 '학습'시켜 작업 수행 방법을 익히는 것을 목표로 한다.Machine learning basically uses algorithms to analyze data, learns through analysis, and makes decisions or predictions based on what has been learned. Therefore, ultimately, the goal is to learn how to perform tasks by 'learning' the computer itself through a large amount of data and algorithms, rather than directly coding specific guidelines for decision-making standards into the software.

머신 러닝은 초기 인공 지능 연구자들이 직접 제창한 개념에서 나온 것이며, 알고리즘 방식에는 의사 결정 트리 학습, 귀납 논리 프로그래밍, 클러스터링, 강화 학습, 베이지안(Bayesian) 네트워크 등이 포함된다. Machine learning stems from the concepts proposed by early artificial intelligence researchers, and algorithmic methods include decision tree learning, inductive logic programming, clustering, reinforcement learning, and Bayesian networks.

이와 같은 머신 러닝은 다양한 분야에서 충분한 성능을 구현하지만, 표와 같이 단순하게 해석이 불가능한 데이터의 경우 인공 신경망을 학습시키기 위한 데이터로 적합하지 않은 문제점이 있다. 따라서 인공 신경망에 표와 같은 데이터를 입력하기 위해서는 사용자가 수작업으로 데이터를 변환하는 등의 번거로운 과정이 수반되는 번거로움이 있었다.Such machine learning implements sufficient performance in various fields, but there is a problem that data that cannot be simply interpreted as in a table is not suitable as data for training artificial neural networks. Therefore, in order to input data such as a table into the artificial neural network, there is a cumbersome process that the user manually converts the data.

본 발명은 전술한 문제점을 해결하기 위한 것으로, 구조화된 학습 데이터를 인공 신경망의 학습에 적합한 형태로 변환하고자 한다.The present invention is to solve the above-mentioned problems, and to convert structured learning data into a form suitable for learning of an artificial neural network.

또한 본 발명은 구조화된 학습 데이터의 구조화 정보까지 인공 신경망의 학습에 사용하고자 한다.In addition, the present invention intends to use up to the structured information of the structured learning data for learning of the artificial neural network.

본 발명의 일 실시예에 따른 구조화된 학습 데이터의 전처리 방법은, 하나 이상의 데이터를 포함하는 구조화된 학습 데이터를 수신하는 단계; 상기 구조화된 학습 데이터의 구조화 형태를 식별하는 단계; 상기 구조화 형태를 참조하여, 상기 하나 이상의 데이터 각각의 레벨에 대응되는 레벨 문자를 결정하는 단계; 및 상기 하나 이상의 데이터 및 상기 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성하는 단계;를 포함할 수 있다.A pre-processing method of structured learning data according to an embodiment of the present invention, the method comprising: receiving structured learning data including one or more data; identifying a structured form of the structured learning data; determining a level character corresponding to each level of the one or more data with reference to the structured form; and generating pre-processing learning data in which the one or more data and level characters of each of the one or more data are listed in a predetermined form.

상기 학습 데이터의 구조화 형태를 식별하는 단계는 상기 구조화된 학습 데이터의 구조화 형태가 표(表) 형태인지 식별하는 단계; 및 상기 구조화된 학습 데이터의 구조화 형태가 개조식(個條式) 형태인지 식별하는 단계;를 포함할 수 있다.The step of identifying the structured form of the learning data may include: identifying whether the structured form of the structured learning data is a table form; and identifying whether the structured form of the structured learning data is a remodeled form.

상기 구조화된 학습 데이터는 하나 이상의 행 및 하나 이상의 열로 이루어 지는 표 데이터이고, 제1 데이터, 상기 제1 데이터와 동일한 행에 위치하고 상기 제1 데이터와 인접하는 열에 위치하는 제2 데이터, 상기 제1 데이터와 동일한 행의 제일 마지막 열에 위치하는 제3 데이터 및 상기 제1 데이터의 다음 행의 가장 첫 열에 위치하는 제4 데이터를 포함할 수 있다. 이때 상기 학습 데이터의 구조화 형태를 식별하는 단계는 상기 구조화된 학습 데이터의 구조화 형태를 상기 표 형태로 식별하고, 상기 레벨 문자를 결정하는 단계는 상기 제1 데이터를 고려하여, 상기 제2 데이터의 레벨 문자를 제1 문자로 결정하고, 상기 제1 문자는 열 바꿈에 대응되는 문자일 수 있다. 또한 상기 레벨 문자를 결정하는 단계는 상기 제3 데이터를 고려하여, 상기 제4 데이터의 레벨 문자를 제2 문자로 결정하고, 상기 제2 문자는 상기 제1 문자와 상이한 문자로, 행 바꿈에 대응되는 문자일 수 있다.The structured learning data is tabular data consisting of one or more rows and one or more columns, and first data, second data positioned in the same row as the first data and in a column adjacent to the first data, and the first data It may include third data positioned in the last column of the same row and fourth data positioned in the first column of the next row of the first data. In this case, the step of identifying the structured form of the learning data identifies the structured form of the structured learning data in the tabular form, and the determining of the level character considers the first data, and the level of the second data A character may be determined as a first character, and the first character may be a character corresponding to a column change. In the determining of the level character, the level character of the fourth data is determined as a second character in consideration of the third data, and the second character is a character different from the first character, corresponding to a line break It can be a character

상기 구조화된 학습 데이터는 하나 이상의 레벨로 이루어지는 개조식 데이터 이고, 상기 구조화된 학습 데이터는 제1 레벨의 제5 데이터, 상기 제5 데이터의 하위 데이터로 제2 레벨의 데이터인 제6 데이터 및 상기 제6 데이터의 이후 데이터로 상기 제1 레벨인 제7 데이터를 포함할 수 있다. 이때 상기 학습 데이터의 구조화 형태를 식별하는 단계는 상기 구조화된 학습 데이터의 구조화 형태를 상기 개조식 형태로 식별하고, 상기 레벨 문자를 결정하는 단계는 상기 제5 데이터를 고려하여, 상기 제6 데이터의 레벨 문자를 제4 문자로 결정하고, 상기 제4 문자는 상기 제2 레벨에 대응되는 문자일 수 있다. 또한 상기 레벨 문자를 결정하는 단계는 상기 제6 데이터를 고려하여, 상기 제7 데이터의 레벨 문자를 제3 문자로 결정하고, 상기 제3 문자는 상기 제4 문자와 상이한 문자로, 상기 제1 레벨에 대응되는 문자일 수 있다.The structured learning data is modified data consisting of one or more levels, and the structured learning data is fifth data of a first level, sixth data that is data of a second level as lower data of the fifth data, and the sixth data The seventh data, which is the first level, may be included as subsequent data of the data. In this case, the step of identifying the structured form of the learning data identifies the structured form of the structured learning data as the modified form, and the determining of the level character considers the fifth data, the level of the sixth data A character may be determined as a fourth character, and the fourth character may be a character corresponding to the second level. Also, in the determining of the level character, the level character of the seventh data is determined as a third character in consideration of the sixth data, and the third character is a character different from the fourth character, and the first level character may be a character corresponding to .

본 발명의 일 실시예에 따른 구조화된 학습 데이터를 이용하여 인공 신경망을 학습시키는 방법은, 상기 구조화된 학습 데이터에 포함되는 하나 이상의 데이터 및 상기 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성하는 단계; 인공 신경망의 학습을 위한 질의 및 상기 소정의 형태의 전처리 학습 데이터를 구성하는 적어도 일부 문자열의 범위를 상기 질의에 대한 답변으로써 획득하는 단계; 및 상기 전처리 학습 데이터, 상기 질의 및 상기 문자열의 범위에 기초하여 상기 인공 신경망을 학습시키는 단계;를 포함할 수 있다.In a method for training an artificial neural network using structured learning data according to an embodiment of the present invention, one or more data included in the structured learning data and a level character of each of the one or more data are preprocessed in a predetermined form generating training data; obtaining, as an answer to the query, a range of at least some character strings constituting a query for learning of an artificial neural network and the predetermined form of preprocessing learning data; and learning the artificial neural network based on the preprocessing learning data, the query, and the range of the character string.

상기 적어도 일부 문자열의 범위 내에는 상기 전처리 학습 데이터에 포함되는 제8 데이터 및 상기 제8 데이터의 레벨 문자가 포함되고, 상기 인공 신경망을 학습시키는 단계는 상기 제8 데이터의 레벨 문자를 고려하여, 상기 제8 데이터와 연관된 적어도 하나의 제9 데이터 및 상기 제9 데이터의 레벨 문자를 함께 참조하여 상기 인공 신경망을 학습시킬 수 있다.The eighth data included in the pre-processing learning data and the level characters of the eighth data are included within the range of the at least some character strings, and the training of the artificial neural network is performed in consideration of the level characters of the eighth data, the The artificial neural network may be trained by referring to at least one ninth data associated with the eighth data and a level character of the ninth data together.

본 발명의 일 실시예에 따른 인공 신경망의 학습을 위해 표 형태의 데이터를 전처리 하는 방법은, 하나 이상의 데이터를 포함하는 표 데이터를 수신하는 단계로써, 상기 하나 이상의 데이터는 상기 표 데이터를 구성하는 개별 데이터이고; 상기 하나 이상의 데이터 각각의 레벨에 대응되는 레벨 문자를 결정하는 단계로써, 상기 레벨 문자는 상기 하나 이상의 데이터 각각의 상기 표 데이터 내에서의 행과 열을 나타내는 문자이고; 및 상기 하나 이상의 데이터 및 상기 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성하는 단계;를 포함할 수 있다.A method of pre-processing data in a tabular form for learning of an artificial neural network according to an embodiment of the present invention includes receiving table data including one or more data, wherein the one or more data is an individual constituting the table data. data; determining a level character corresponding to each level of the one or more data, wherein the level character is a character representing a row and a column in the table data of each of the one or more data; and generating pre-processing learning data in which the one or more data and level characters of each of the one or more data are listed in a predetermined form.

본 발명의 일 실시예에 따른 인공 신경망의 학습을 위해 개조식 형태의 데이터를 전처리 하는 방법은, 하나 이상의 데이터를 포함하고, 하나 이상의 레벨로 이루어지는 개조식 데이터를 수신하는 단계로써, 상기 하나 이상의 데이터는 상기 개조식 데이터를 구성하는 개별 데이터이고; 상기 하나 이상의 데이터 각각의 레벨에 대응되는 레벨 문자를 결정하는 단계로써, 상기 레벨 문자는 상기 하나 이상의 데이터 각각의 상기 개조식 데이터 내에서의 절대적 레벨을 나타내는 문자이고; 및 상기 하나 이상의 데이터 및 상기 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성하는 단계;를 포함할 수 있다.A method of preprocessing data in a modified form for learning of an artificial neural network according to an embodiment of the present invention includes receiving the modified data including one or more data and consisting of one or more levels, wherein the one or more data is the individual data constituting the retrofitted data; determining a level character corresponding to each level of the one or more data, wherein the level character is a character representing an absolute level within the modified data of each of the one or more data; and generating pre-processing learning data in which the one or more data and level characters of each of the one or more data are listed in a predetermined form.

본 발명은 데이터의 구조화 정보를 레벨 문자로 변환하고, 변환된 문자를 학습 데이터에 포함시켜 데이터의 구조화 정보까지 인공 신경망의 학습에 사용한다.The present invention converts structured information of data into level text, and includes the converted text in learning data to use even structured information of data for learning of an artificial neural network.

또한 본 발명은 표 형태의 데이터에 있어서, 각 개별 데이터의 행/열 정보를 문자의 형태로 변환하여 학습 데이터에 포함시켜, 해당 데이터의 학습에 있어서 행/열의 정보까지 고려하여 학습이 이루어 지도록 할 수 있다.In addition, in the present invention, in tabular data, the row/column information of each individual data is converted into a character form and included in the learning data, so that learning is performed in consideration of the row/column information in the learning of the corresponding data. can

또한 본 발명은 개조식 형태의 데이터에 있어서, 각 개별 데이터의 레벨 정보를 문자의 형태로 변환하여 학습 데이터에 포함시켜, 해당 데이터의 학습에 있어서 레벨 정보까지 고려하여 학습이 이루어 지도록 할 수 있다.Also, according to the present invention, in the modified form of data, the level information of each individual data is converted into the form of characters and included in the learning data, so that learning can be performed in consideration of the level information in the learning of the corresponding data.

도 1은 본 발명의 일 실시예에 따른 인공 신경망 학습 시스템의 구성을 개략적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 인공 신경망 학습 서버(100)에 구비되는 인공 신경망 학습 장치(110)의 구성을 개략적으로 도시한 도면이다.
도 3 및 도 4는 본 발명의 인공 신경망 학습 장치(110)에 의해 학습되는 인공 신경망의 예시적인 구조를 설명하기 위한 도면이다.
도 5a 및 도 5b는 제어부(112)가 표 데이터로부터 전처리 학습 데이터를 생성하는 과정을 설명하기 위한 도면이다.
도 6a 및 도 6b는 제어부(112)가 개조식 데이터로부터 전처리 학습 데이터를 생성하는 과정을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)에 의해 수행되는 학습 데이터의 전처리 방법을 설명하기 위한 흐름도이다.
도 8은 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)에 의해 수행되는 구조화된 학습 데이터를 이용하여 인공 신경망 학습 방법을 설명하기 위한 흐름도이다.
1 is a diagram schematically illustrating the configuration of an artificial neural network learning system according to an embodiment of the present invention.
2 is a diagram schematically illustrating the configuration of the artificial neural network learning apparatus 110 provided in the artificial neural network learning server 100 according to an embodiment of the present invention.
3 and 4 are diagrams for explaining an exemplary structure of an artificial neural network learned by the artificial neural network learning apparatus 110 of the present invention.
5A and 5B are diagrams for explaining a process in which the control unit 112 generates pre-processing learning data from table data.
6A and 6B are diagrams for explaining a process in which the control unit 112 generates pre-processing learning data from the modified data.
7 is a flowchart illustrating a method of preprocessing learning data performed by the artificial neural network learning apparatus 110 according to an embodiment of the present invention.
8 is a flowchart illustrating an artificial neural network learning method using structured learning data performed by the artificial neural network learning apparatus 110 according to an embodiment of the present invention.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다. Since the present invention can apply various transformations and can have various embodiments, specific embodiments are illustrated in the drawings and described in detail in the detailed description. Effects and features of the present invention, and a method of achieving them, will become apparent with reference to the embodiments described below in detail in conjunction with the drawings. However, the present invention is not limited to the embodiments disclosed below and may be implemented in various forms.

이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, and when described with reference to the drawings, the same or corresponding components are given the same reference numerals, and the overlapping description thereof will be omitted. .

이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다. 이하의 실시예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 이하의 실시예에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다. 도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 형태는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다. In the following embodiments, terms such as first, second, etc. are used for the purpose of distinguishing one component from another, not in a limiting sense. In the following examples, the singular expression includes the plural expression unless the context clearly dictates otherwise. In the following embodiments, terms such as include or have means that the features or components described in the specification are present, and the possibility of adding one or more other features or components is not excluded in advance. In the drawings, the size of the components may be exaggerated or reduced for convenience of description. For example, since the size and shape of each configuration shown in the drawings are arbitrarily indicated for convenience of description, the present invention is not necessarily limited to the illustrated bar.

도 1은 본 발명의 일 실시예에 따른 인공 신경망 학습 시스템의 구성을 개략적으로 도시한 도면이다.1 is a diagram schematically illustrating the configuration of an artificial neural network learning system according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 인공 신경망 학습 시스템은 인공 신경망 학습 서버(100), 사용자 단말(200) 및 통신망(400)을 포함할 수 있다.Referring to FIG. 1 , an artificial neural network learning system according to an embodiment of the present invention may include an artificial neural network learning server 100 , a user terminal 200 , and a communication network 400 .

본 발명의 일 실시예에 따른 인공 신경망 학습 시스템은 인공 신경망의 학습을 위한 학습 데이터에 구조화된 데이터가 포함된 경우, 데이터의 구조화 정보를 문자의 형태로 변환하여 인공 신경망이 학습할 수 있는 형태로 변환할 수 있다.The artificial neural network learning system according to an embodiment of the present invention, when structured data is included in the learning data for learning the artificial neural network, converts the structured information of the data into the form of a character to form a form that the artificial neural network can learn. can be converted

또한 본 발명의 일 실시예에 따른 인공 신경망 학습 시스템은 구조화 정보가 문자의 형태로 포함된 학습 데이터, 학습 데이터와 관련된 질의 및 이에 대한 답변으로써 학습 데이터를 구성하는 적어도 일부 문자열의 범위를 획득하여 인공 신경망을 학습시킬 수 있다.In addition, the artificial neural network learning system according to an embodiment of the present invention acquires the range of at least some character strings constituting the learning data as an answer to the learning data including the structured information in the form of text, the query related to the learning data, and the artificial Neural networks can be trained.

본 발명에서 구조화된 학습 데이터와 같은 '구조화된 데이터'는 전체 데이터 내에서 데이터의 상대적 위치 및/또는 수준을 고려하여 해당 데이터의 의미를 해석할 필요가 있는 데이터를 의미할 수 있다. 가령 도 5a에 도시된 표 형태의 데이터 및 도 6a에 도시된 개조식 형태의 데이터가 이해 해당할 수 있다. In the present invention, 'structured data' such as structured learning data may refer to data that needs to interpret the meaning of the data in consideration of the relative position and/or level of the data within the entire data. For example, the tabular data shown in FIG. 5A and the modified data shown in FIG. 6A may be understood.

본 발명에서 '인공 신경망'은 소정의 목적을 위해 머신 러닝(Machine Learning) 또는 딥러닝(Deep Learning) 기법으로 학습된 신경망을 의미할 수 있다. 이와 같은 인공 신경망의 구조에 대해서는 도 3 및 도 4를 참조하여 후술한다.In the present invention, an 'artificial neural network' may mean a neural network trained by machine learning or deep learning for a predetermined purpose. The structure of such an artificial neural network will be described later with reference to FIGS. 3 and 4 .

본 발명의 일 실시예에 따른 사용자 단말(200)은 사용자가 인공 신경망 학습 서버(100)에 의해 제공되는 다양한 서비스를 이용할 수 있도록 사용자와 인공 신경망 학습 서버(100)를 매개하는 다양한 형태의 장치를 의미할 수 있다. The user terminal 200 according to an embodiment of the present invention provides various types of devices that mediate the user and the artificial neural network learning server 100 so that the user can use various services provided by the artificial neural network learning server 100 . can mean

바꾸어 말하면, 본 발명의 일 실시예에 따른 사용자 단말(200)은 인공 신경망 학습 서버(100)와 데이터를 송수신 하는 다양한 장치를 의미할 수 있다.In other words, the user terminal 200 according to an embodiment of the present invention may refer to various devices for transmitting and receiving data to and from the artificial neural network learning server 100 .

이와 같은 사용자 단말(200)은 도 1에 도시된 바와 같이, 휴대용 단말(201, 202, 203)을 의미할 수도 있고, 컴퓨터(204)를 의미할 수도 있다. As shown in FIG. 1 , such a user terminal 200 may mean portable terminals 201 , 202 , and 203 , or may mean a computer 204 .

한편 사용자 단말(200)은 상술한 기능을 수행하기 위해 콘텐츠 등을 표시하기 위한 표시수단, 이러한 콘텐츠에 대한 사용자의 입력을 획득하기 위한 입력수단을 구비할 수 있다. 이 때 입력수단 및 표시수단은 다양하게 구성될 수 있다. 가령 입력수단은 키보드, 마우스, 트랙볼, 마이크, 버튼, 터치패널 등을 포함할 수 있으나 이에 한정되지 않는다. Meanwhile, the user terminal 200 may include a display means for displaying content and the like in order to perform the above-described function, and an input means for obtaining a user's input for the content. In this case, the input means and the display means may be configured in various ways. For example, the input means may include, but is not limited to, a keyboard, a mouse, a trackball, a microphone, a button, a touch panel, and the like.

본 발명의 일 실시예에 따른 통신망(400)은 인공 신경망 학습 시스템의 각 구성 간의 데이터 송수신을 매개하는 통신망을 의미할 수 있다. 가령 통신망(400)은 LANs(Local Area Networks), WANs(Wide Area Networks), MANs(Metropolitan Area Networks), ISDNs(Integrated Service Digital Networks) 등의 유선 네트워크나, 무선 LANs, CDMA, 블루투스, 위성 통신 등의 무선 네트워크를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.The communication network 400 according to an embodiment of the present invention may mean a communication network that mediates data transmission/reception between each component of the artificial neural network learning system. For example, the communication network 400 may include wired networks such as Local Area Networks (LANs), Wide Area Networks (WANs), Metropolitan Area Networks (MANs), Integrated Service Digital Networks (ISDNs), wireless LANs, CDMA, Bluetooth, satellite communication, and the like. may cover a wireless network, but the scope of the present invention is not limited thereto.

본 발명의 일 실시예에 따른 인공 신경망 학습 서버(100)는 인공 신경망의 학습을 위한 학습 데이터에 구조화된 데이터가 포함된 경우, 데이터의 구조화 정보를 문자의 형태로 변환하여 인공 신경망이 학습할 수 있는 형태로 변환할 수 있다.The artificial neural network learning server 100 according to an embodiment of the present invention, when structured data is included in the learning data for learning the artificial neural network, converts the structured information of the data into the form of text so that the artificial neural network can learn. can be converted into the form

또한 인공 신경망 학습 서버(100)는 구조화 정보가 문자의 형태로 포함된 학습 데이터, 학습 데이터와 관련된 질의 및 이에 대한 답변으로써 학습 데이터를 구성하는 적어도 일부 문자열의 범위를 획득하여 인공 신경망을 학습시킬 수 있다.In addition, the artificial neural network learning server 100 can learn the artificial neural network by acquiring the range of at least some character strings constituting the learning data as an answer to the learning data including structured information in the form of text, the query related to the learning data, and the answer. have.

도 2는 본 발명의 일 실시예에 따른 인공 신경망 학습 서버(100)에 구비되는 인공 신경망 학습 장치(110)의 구성을 개략적으로 도시한 도면이다.2 is a diagram schematically showing the configuration of the artificial neural network learning apparatus 110 provided in the artificial neural network learning server 100 according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 통신부(111), 제어부(112) 및 메모리(113)를 포함할 수 있다. 또한 도면에는 도시되지 않았으나, 본 실시예에 따른 인공 신경망 학습 장치(110)는 입/출력부, 프로그램 저장부 등을 더 포함할 수 있다. Referring to FIG. 2 , an artificial neural network learning apparatus 110 according to an embodiment of the present invention may include a communication unit 111 , a control unit 112 , and a memory 113 . Also, although not shown in the drawings, the artificial neural network learning apparatus 110 according to the present embodiment may further include an input/output unit, a program storage unit, and the like.

통신부(111)는 인공 신경망 학습 장치(110)가 사용자 단말(200)과 같은 다른 네트워크 장치와 유무선 연결을 통해 제어 신호 또는 데이터 신호와 같은 신호를 송수신하기 위해 필요한 하드웨어 및 소프트웨어를 포함하는 장치일 수 있다. The communication unit 111 may be a device including hardware and software necessary for the artificial neural network learning apparatus 110 to transmit and receive signals such as control signals or data signals through wired/wireless connection with other network devices such as the user terminal 200 . have.

제어부(112)는 프로세서(Processor)와 같이 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 여기서, '프로세서(Processor)'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(Microprocessor), 중앙처리장치(Central Processing Unit: CPU), 프로세서 코어(Processor Core), 멀티프로세서(Multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.The controller 112 may include any type of device capable of processing data, such as a processor. Here, the 'processor' may refer to, for example, a data processing device embedded in hardware having a physically structured circuit to perform a function expressed as a code or command included in a program. As an example of the data processing device embedded in the hardware as described above, a microprocessor, a central processing unit (CPU), a processor core, a multiprocessor, an application-specific integrated (ASIC) Circuit) and a processing device such as an FPGA (Field Programmable Gate Array) may be included, but the scope of the present invention is not limited thereto.

메모리(113)는 인공 신경망 학습 장치(110)가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행한다. 메모리는 자기 저장 매체(Magnetic Storage Media) 또는 플래시 저장 매체(Flash Storage Media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다. The memory 113 performs a function of temporarily or permanently storing data processed by the artificial neural network learning apparatus 110 . The memory may include a magnetic storage medium or a flash storage medium, but the scope of the present invention is not limited thereto.

가령 메모리(113)는 소정의 방식에 따라 전처리된 학습 데이터를 일시적 및/또는 영구적으로 저장할 수 있다. 물론 메모리(113)는 전처리 이전의 구조화된 학습 데이터도 저장할 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.For example, the memory 113 may temporarily and/or permanently store preprocessed learning data according to a predetermined method. Of course, the memory 113 may also store structured learning data before preprocessing. However, this is an example, and the spirit of the present invention is not limited thereto.

도 3 및 도 4는 본 발명의 인공 신경망 학습 장치(110)에 의해 학습되는 인공 신경망의 예시적인 구조를 설명하기 위한 도면이다.3 and 4 are diagrams for explaining an exemplary structure of an artificial neural network learned by the artificial neural network learning apparatus 110 of the present invention.

본 발명의 일 실시예에 따른 인공 신경망은 도 3에 도시된 바와 같은 합성 곱 인공 신경망(CNN: Convolutional Neural Network) 모델에 따른 인공 신경망일 수 있다. 이때 CNN 모델은 복수의 연산 레이어(Convolutional Layer, Pooling Layer)를 번갈아 수행하여 최종적으로는 입력 데이터의 특징을 추출하는 데 사용되는 계층 모델일 수 있다.The artificial neural network according to an embodiment of the present invention may be an artificial neural network according to a convolutional neural network (CNN) model as shown in FIG. 3 . In this case, the CNN model may be a layer model used to extract features of input data by alternately performing a plurality of computational layers (Convolutional Layer, Pooling Layer).

본 발명의 일 실시예에 따른 제어부(112)는 학습 데이터를 지도학습(Supervised Learning) 기법에 따라 처리하여 인공 신경망 모델을 구축하거나 학습시킬 수 있다. The controller 112 according to an embodiment of the present invention may construct or train an artificial neural network model by processing the learning data according to a supervised learning technique.

본 발명의 일 실시예에 따른 제어부(112)는 입력 데이터의 특징 값을 추출하기 위한 컨볼루션 레이어(Convolution layer), 추출된 특징 값을 결합하여 특징 맵을 구성하는 풀링 레이어(pooling layer)를 생성할 수 있다. The control unit 112 according to an embodiment of the present invention generates a convolution layer for extracting feature values of input data, and a pooling layer that forms a feature map by combining the extracted feature values. can do.

또한 본 발명의 일 실시예에 따른 제어부(112)는 생성된 특징 맵을 결합하여, 입력 데이터가 복수의 항목 각각에 해당할 확률을 결정할 준비를 하는 풀리 커넥티드 레이어(Fully Conected Layer)를 생성할 수 있다. In addition, the control unit 112 according to an embodiment of the present invention combines the generated feature maps to generate a fully connected layer that prepares to determine the probability that the input data corresponds to each of a plurality of items. can

마지막으로 제어부(112)는 입력 데이터가 복수의 항목 각각에 해당할 확률을 포함하는 아웃풋 레이어(Output Layer)를 산출할 수 있다.Finally, the controller 112 may calculate an output layer including a probability that the input data corresponds to each of the plurality of items.

도 3에 도시된 예시에서는, 입력 데이터가 이미지 형태의 데이터로, 5X7 형태의 블록으로 나누어지며, 컨볼루션 레이어의 생성에 5X3 형태의 단위 블록이 사용되고, 풀링 레이어의 생성에 1X4 또는 1X2 형태의 단위 블록이 사용되는 것으로 도시되었지만, 이는 예시적인 것으로 본 발명의 사상이 이에 한정되는 것은 아니다. 따라서 입력 데이터의 종류 및/또는 각 블록의 크기는 다양하게 구성될 수 있다.In the example shown in FIG. 3 , input data is image data, which is divided into 5X7 blocks, a 5X3 unit block is used to generate a convolution layer, and a 1X4 or 1X2 type unit is used to generate a pooling layer. Although blocks are shown to be used, these are exemplary and the spirit of the present invention is not limited thereto. Accordingly, the type of input data and/or the size of each block may be variously configured.

한편 이와 같은 인공 신경망은 전술한 메모리(113)에 인공 신경망을 구성하는 적어도 하나의 노드의 계수, 노드의 가중치 및 인공 신경망을 구성하는 복수의 레이어 간의 관계를 정의하는 함수의 계수들의 형태로 저장될 수 있다. 물론 인공 신경망의 구조 또한 메모리(113)에 소스코드 및/또는 프로그램의 형태로 저장될 수 있다.On the other hand, such an artificial neural network may be stored in the above-described memory 113 in the form of coefficients of at least one node constituting the artificial neural network, weights of nodes, and coefficients of a function defining a relationship between a plurality of layers constituting the artificial neural network. can Of course, the structure of the artificial neural network may also be stored in the memory 113 in the form of source code and/or a program.

본 발명의 일 실시예에 따른 인공 신경망은 도 4에 도시된 바와 같은 순환 인공 신경망(Recurrent Neural Network, RNN) 모델에 따른 인공 신경망일 수 있다.The artificial neural network according to an embodiment of the present invention may be an artificial neural network according to a recurrent neural network (RNN) model as shown in FIG. 4 .

도 4를 참조하면, 이와 같은 순환 인공 신경망(RNN) 모델에 따른 인공 신경망은 적어도 하나의 입력 노드(N1)를 포함하는 입력 레이어(L1), 복수의 히든 노드(N2)를 포함하는 히든 레이어(L2) 및 적어도 하나의 출력 노드(N3)를 포함하는 출력 레이어(L3)를 포함할 수 있다. 이때 입력 레이어(L1)의 적어도 하나의 입력 노드(N1)에는 제어부(112)가 획득한 입력 데이터에 대응되는 값들이 입력될 수 있다.Referring to FIG. 4, the artificial neural network according to such a recurrent artificial neural network (RNN) model includes an input layer L1 including at least one input node N1, and a hidden layer including a plurality of hidden nodes N2 ( L2) and an output layer L3 including at least one output node N3. In this case, values corresponding to the input data obtained by the controller 112 may be input to at least one input node N1 of the input layer L1 .

히든 레이어(L2)는 도시된 바와 같이 전체적으로 연결된(Fully Connected) 하나 이상의 레이어를 포함할 수 있다. 히든 레이어(L2)가 복수의 레이어를 포함하는 경우, 인공 신경망은 각각의 히든 레이어 사이의 관계를 정의하는 함수(미도시)를 포함할 수 있다.The hidden layer L2 may include one or more fully connected layers as illustrated. When the hidden layer L2 includes a plurality of layers, the artificial neural network may include a function (not shown) defining a relationship between each hidden layer.

출력 레이어(L3)의 적어도 하나의 출력 노드(N3)는 제어부(112)의 제어에 따라 인공 신경망이 입력 레이어(L1)의 입력 값으로부터 생성한 출력 값을 포함할 수 있다.At least one output node N3 of the output layer L3 may include an output value generated from the input value of the input layer L1 by the artificial neural network under the control of the controller 112 .

각 레이어의 각 노드에 포함되는 값은 벡터일 수 있다. 또한 각 노드는 해당 노드의 중요도에 대응되는 가중치를 포함할 수도 있다.A value included in each node of each layer may be a vector. In addition, each node may include a weight corresponding to the importance of the corresponding node.

한편 인공 신경망은 입력 레이어(L1)와 히든 레이어(L2)의 관계를 정의하는 제1 함수(F1) 및 히든 레이어(L2)와 출력 레이어(L3)의 관계를 정의하는 제2 함수(F2)를 포함할 수 있다. Meanwhile, the artificial neural network uses a first function (F1) defining the relationship between the input layer (L1) and the hidden layer (L2) and a second function (F2) defining the relationship between the hidden layer (L2) and the output layer (L3). may include

제1 함수(F1)는 입력 레이어(L1)에 포함되는 입력 노드(N1)와 히든 레이어(L2)에 포함되는 히든 노드(N2)간의 연결관계를 정의할 수 있다. 이와 유사하게, 제2 함수(F2)는 히든 레이어(L2)에 포함되는 히든 노드(N2)와 출력 레이어(L2)에 포함되는 출력 노드(N2)간의 연결관계를 정의할 수 있다.The first function F1 may define a connection relationship between the input node N1 included in the input layer L1 and the hidden node N2 included in the hidden layer L2. Similarly, the second function F2 may define a connection relationship between the hidden node N2 included in the hidden layer L2 and the output node N2 included in the output layer L2.

이와 같은 제1 함수(F1), 제2 함수(F2) 및 히든 레이어 사이의 함수들은 이전 노드의 입력에 기초하여 결과물을 출력하는 순환 인공 신경망 모델을 포함할 수 있다.The functions between the first function F1, the second function F2, and the hidden layer may include a recurrent neural network model that outputs a result based on an input of a previous node.

제어부(112)에 의해 인공 신경망이 학습되는 과정에서, 복수의 학습 데이터(또는 전처리된 학습 데이터)에 기초하여 제1 함수(F1) 및 제2 함수(F2)가 학습될 수 있다. 물론 인공 신경망이 학습되는 과정에서 전술한 제1 함수(F1) 및 제2 함수(F2) 외에 복수의 히든 레이어 사이의 함수들 또한 학습될 수 있다.In the process of learning the artificial neural network by the controller 112 , the first function F1 and the second function F2 may be learned based on a plurality of learning data (or preprocessed learning data). Of course, in the process of learning the artificial neural network, functions between the plurality of hidden layers in addition to the above-described first function F1 and second function F2 may also be learned.

본 발명의 일 실시예에 따른 인공 신경망은 표지(Labeled)된 학습 데이터를 기반으로 지도학습(Supervised Learning) 방식으로 학습될 수 있다. The artificial neural network according to an embodiment of the present invention may be trained in a supervised learning method based on labeled learning data.

본 발명의 일 실시예에 따른 제어부(112)는 복수의 학습 데이터(또는 전처리된 학습 데이터)를 이용하여, 어느 하나의 입력 데이터를 인공 신경망에 입력하여 생성된 출력 값이 해당 학습 데이터에 표지된 값에 근접하도록 전술한 함수들(F1, F2, 히든 레이어 사이의 함수들 등)을 갱신하는 과정을 반복하여 수행함으로써 인공 신경망을 학습시킬 수 있다. The control unit 112 according to an embodiment of the present invention uses a plurality of learning data (or pre-processed learning data) to input any one input data to an artificial neural network, and an output value generated by the corresponding learning data is marked. The artificial neural network can be trained by repeating the process of updating the above-described functions (F1, F2, functions between hidden layers, etc.) to approximate the value.

이때 본 발명의 일 실시예에 따른 제어부(112)는 역전파(Back Propagation) 알고리즘에 따라 전술한 함수들(F1, F2, 히든 레이어 사이의 함수들 등)을 갱신할 수 있다. 다만 이는 예시적인 것으로 본 발명의 사상이 이에 한정되는 것은 아니다.At this time, the control unit 112 according to an embodiment of the present invention may update the above-described functions (F1, F2, functions between hidden layers, etc.) according to a back propagation algorithm. However, this is an example, and the spirit of the present invention is not limited thereto.

한편 도 3 및 도 4에서 설명한 인공 신경망의 종류 및/또는 구조는 예시적인 것으로 본 발명의 사상이 이에 한정되는 것은 아니다. 따라서 다양한 종류의 모델의 인공 신경망이 명세서를 통하여 설명하는 '인공 신경망'에 해당할 수 있다.Meanwhile, the types and/or structures of the artificial neural networks described in FIGS. 3 and 4 are exemplary and the spirit of the present invention is not limited thereto. Accordingly, artificial neural networks of various types of models may correspond to the 'artificial neural networks' described throughout the specification.

이하에서는 제어부(112)가 전처리 학습 데이터를 생성하는 과정을 중심으로 설명한다.Hereinafter, a process in which the control unit 112 generates pre-processing learning data will be mainly described.

본 발명의 일 실시예에 따른 제어부(112)는 하나 이상의 데이터를 포함하는 구조화된 학습 데이터를 수신할 수 있다. 이때 '하나 이상의 데이터'는 구조화된 학습 데이터를 구성하는 개별 데이터를 의미할 수 있다.The control unit 112 according to an embodiment of the present invention may receive structured learning data including one or more data. In this case, 'one or more data' may refer to individual data constituting the structured learning data.

선택적 실시예에서, 본 발명의 일 실시예에 따른 제어부(112)는 수신된 학습 데이터에서 구조화된 학습 데이터 만을 선별하여 후술하는 과정에 따라 전처리 학습 데이터의 형태로 변환할 수 있다. In an optional embodiment, the control unit 112 according to an embodiment of the present invention may select only structured learning data from the received learning data and convert it into the form of pre-processing learning data according to a process to be described later.

제어부(112)는 전술한 사용자 단말(200)로부터 구조화된 학습 데이터를 수신할 수도 있고, 메모리(113)로부터 수신(또는 독출)할 수 있다.The control unit 112 may receive the structured learning data from the aforementioned user terminal 200 or may receive (or read) the structured learning data from the memory 113 .

본 발명의 일 실시예에 따른 제어부(112)는 수신된 학습 데이터의 구조화 형태를 식별할 수 있다.The control unit 112 according to an embodiment of the present invention may identify a structured form of the received learning data.

일 실시예에서 제어부(112)는 구조화된 학습 데이터의 구조화 형태가 표(表) 형태인지 식별할 수 있다. 또한 제어부(112)는 구조화된 학습 데이터의 구조화 형태가 개조식(個條式) 형태인지 식별할 수도 있다. 다만 이와 같은 구조화 형태는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.In an embodiment, the controller 112 may identify whether the structured form of the structured learning data is a table form. In addition, the control unit 112 may identify whether the structured form of the structured learning data is a modified form. However, such a structured form is exemplary and the spirit of the present invention is not limited thereto.

본 발명의 일 실시예에 따른 제어부(112)는 상술한 과정에 따라 식별된 구조화 형태를 참조하여, 구조화 데이터에 포함되는 하나 이상의 데이터 각각의 레벨에 대응되는 레벨 문자를 결정할 수 있다. 또한 하나 이상의 데이터와 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성할 수 있다.The control unit 112 according to an embodiment of the present invention may determine a level character corresponding to each level of one or more data included in the structured data with reference to the structured form identified according to the above-described process. In addition, it is possible to generate one or more data and the preprocessing learning data in which the level characters of each of the one or more data are listed in a predetermined form.

이하에서는 도 5a 및 도 5b를 참조하여 제어부(112)가 표 데이터로부터 전처리 학습 데이터를 생성하는 과정을 설명한다.Hereinafter, a process in which the control unit 112 generates preprocessing learning data from table data will be described with reference to FIGS. 5A and 5B .

설명의 편의를 위해, 구조화된 학습 데이터가 도 5a에 도시된 바와 같이 하나 이상의 행 및 하나 이상의 열로 이루어 지고, 복수의 개별 데이터(511 내지 518)를 포함하는 표 데이터(510)임을 전제로 설명한다. 또한 이러한 표 데이터(510)가 제1 데이터(511), 제1 데이터(511)와 동일한 행에 위치하고 제1 데이터(511)와 인접하는 열에 위치하는 제2 데이터(512), 제1 데이터(511)와 동일한 행의 제일 마지막 열에 위치하는 제3 데이터(514) 및 제1 데이터(511)의 다음 행의 가장 첫 열에 위치하는 제4 데이터(515)를 포함하는 것을 전제로 설명한다.For convenience of explanation, it is assumed that the structured learning data is tabular data 510 including a plurality of individual data 511 to 518, which consists of one or more rows and one or more columns as shown in FIG. 5A. . In addition, the table data 510 is positioned in the same row as the first data 511 and the first data 511 and the second data 512 and the first data 511 are positioned in a column adjacent to the first data 511 . ) and the third data 514 positioned in the last column of the same row and the fourth data 515 positioned in the first column of the next row of the first data 511 will be described.

상술한 가정 하에, 제어부(112)는 도 5a의 데이터(510)의 구조화 형태를 '표 형태'로 식별할 수 있다. 또한 제어부(112)는 제1 데이터(511)를 고려하여, 제2 데이터(512)의 레벨 문자를 제1 문자로 결정할 수 있다. 이때 제1 문자는 열 바꿈에 대응되는 문자로 가령 "#"일 수 있다. Under the above-mentioned assumption, the controller 112 may identify the structured form of the data 510 of FIG. 5A as a 'table form'. Also, the controller 112 may determine the level character of the second data 512 as the first character in consideration of the first data 511 . In this case, the first character is a character corresponding to a column change and may be, for example, “#”.

선택적 실시예에서, 제어부(112)는 표 데이터(510) 내에서의 제2 데이터(512)의 위치를 고려하여, 제2 데이터(512)의 레벨 문자를 제1 문자로 결정할 수도 있다. 이러한 경우 제어부(112)는 제2 데이터(512)와 같은 각 개별 데이터의 행/열을 식별하여 레벨 문자를 결정할 수 있다.In an optional embodiment, the controller 112 may determine the level character of the second data 512 as the first character in consideration of the position of the second data 512 in the table data 510 . In this case, the controller 112 may determine a level character by identifying a row/column of each individual data such as the second data 512 .

마찬가지 방법으로 제어부(112)는 제2 데이터(512)를 고려하거나, 데이터의 행/열을 고려하여, 다음 데이터(513)의 레벨 문자를 제1 문자로 결정할 수 있다.In the same way, the controller 112 may determine the level character of the next data 513 as the first character by considering the second data 512 or considering the row/column of the data.

가령 제어부(112)는 도 5b에 도시된바와 같이 "[제1 데이터("구분")] [제1 문자("#")] [제2 데이터("일반 기업")].."과 같이 데이터와 레벨 문자가 나열된 전처리 학습 데이터(520)를 생성할 수 있다.For example, as shown in FIG. 5B , the control unit 112 may be configured as "[First data ("Division")] [First character ("#")] [Second data ("General company")].." Pre-processing learning data 520 in which data and level characters are listed may be generated.

한편 제어부(112)는 제3 데이터(514)를 고려하여, 제4 데이터(515)의 레벨 문자를 제2 문자로 결정할 수 있다. 이때 제2 문자는 행 바꿈에 대응되는 문자로 가령 "@"일 수 있다. Meanwhile, the controller 112 may determine the level character of the fourth data 515 as the second character in consideration of the third data 514 . In this case, the second character is a character corresponding to a line break and may be, for example, “@”.

가령 제어부(112)는 도 5b에 도시된바와 같이 "[제3 데이터("선정 기업")] [제2 문자("@")] [제4 데이터("최대 한도")].."와 같이 데이터와 레벨 문자가 나열된 전처리 학습 데이터(520)를 생성할 수 있다.For example, as shown in FIG. 5B , the control unit 112 may include "[third data ("selected company")] [second character ("@")] [fourth data ("maximum limit")].." and Similarly, preprocessing learning data 520 in which data and level characters are listed may be generated.

이와 같이 본 발명은 각 데이터의 구조화 정보를 레벨 문자로 변환하고, 변환된 문자를 학습 데이터에 포함시켜, 데이터의 구조화 정보까지 인공 신경망의 학습에 사용될 수 있도록 한다. As described above, the present invention converts the structured information of each data into level text, and includes the converted text in the learning data, so that even the structured information of the data can be used for learning of the artificial neural network.

특히 본 발명은 표 형태의 데이터에 있어서, 각 개별 데이터의 행/열 정보를 문자의 형태로 변환하여 학습 데이터에 포함시켜, 해당 데이터의 학습에 있어서 행/열의 정보까지 고려하여 학습이 이루어 지도록 할 수 있다.In particular, in the present invention, in tabular data, the row/column information of each individual data is converted into a character form and included in the learning data, so that learning is performed in consideration of the row/column information in the learning of the corresponding data. can

이하에서는 도 6a 및 도 6b를 참조하여 제어부(112)가 개조식 데이터(610)로부터 전처리 학습 데이터를 생성하는 과정을 설명한다.Hereinafter, a process in which the control unit 112 generates preprocessing learning data from the modified data 610 will be described with reference to FIGS. 6A and 6B .

설명의 편의를 위해, 구조화된 학습 데이터가 도 6a에 도시된 바와 같이 하나 이상의 레벨(또는 수준)을 포함하고, 복수의 개별 데이터(611 내지 616)를 포함하는 개조식 데이터(610)임을 전제로 설명한다. For convenience of explanation, it is assumed that the structured learning data includes one or more levels (or levels) as shown in FIG. 6A , and is modified data 610 including a plurality of individual data 611 to 616 . do.

또한 이러한 개조식 데이터(610)가 제1 레벨의 제5 데이터(611), 제5 데이터(611)의 하위 데이터로 제2 레벨의 데이터인 제6 데이터(612) 및 제6 데이터(612)의 이후 데이터로 제1 레벨인 제7 데이터(616)를 포함하는 것을 전제로 설명한다.In addition, the modified data 610 is the fifth data 611 of the first level, the lower data of the fifth data 611, and the sixth data 612 and the sixth data 612 that are the second level data after The description will be made on the assumption that the seventh data 616, which is the first level, is included as the data.

먼저 제어부(112)는 도 6a의 데이터(610)의 구조화 형태를 '개조식 형태'로 식별할 수 있다. 또한 제어부(112)는 제5 데이터(611)를 고려하여, 제6 데이터(612)의 레벨 문자를 제4 문자로 결정할 수 있다. 이때 제4 문자는 제2 레벨에 대응되는 문자로 가령 ";;"일 수 있다.First, the controller 112 may identify the structured form of the data 610 of FIG. 6A as a 'modified form'. Also, the controller 112 may determine the level character of the sixth data 612 as the fourth character in consideration of the fifth data 611 . In this case, the fourth character may be, for example, “;;” as a character corresponding to the second level.

선택적 실시예에서, 제어부(112)는 개조식 데이터(610) 내에서의 제6 데이터(612)의 절대적 레벨(또는 수준)을 고려하여 제6 데이터(612)의 레벨 문자를 제4 문자로 결정할 수도 있다. 이러한 경우 제어부(112)는 제6 데이터(612)와 같은 각 개별 데이터의 레벨 또는 수준을 식별하여 레벨 문자를 결정할 수 있다.In an optional embodiment, the controller 112 may determine the level character of the sixth data 612 as the fourth character in consideration of the absolute level (or level) of the sixth data 612 in the adapted data 610 . have. In this case, the controller 112 may determine the level character by identifying the level or level of each individual data, such as the sixth data 612 .

마찬가지 방법으로 제어부(112)는 제6 데이터(612)를 고려하거나, 데이터의 행/열을 고려하여, 다음 데이터(613)의 레벨 문자를 ";;;"로 결정할 수 있다.In the same way, the controller 112 may determine the level character of the next data 613 as “;;” in consideration of the sixth data 612 or rows/columns of the data.

가령 제어부(112)는 도 6b에 도시된바와 같이 "[제5 데이터("수수료 등 비용")][제3 문자";"][제6 데이터("근저당권 설정비용")][제4 문자(";;")].."과 같이 데이터와 레벨 문자가 나열된 전처리 학습 데이터(620)를 생성할 수 있다.For example, as shown in FIG. 6B , the control unit 112 controls "[fifth data ("fees, etc. cost")][third character";"][sixth data ("root mortgage setting cost")][fourth character It is possible to generate the pre-processing learning data 620 in which data and level characters are listed, such as (";;")]..".

한편 제어부(112)는 제6 데이터(612)를 고려하여, 제7 데이터(616)의 레벨 문자를 제3 문자로 결정할 수 있다. 이때 제3 문자는 제1 레벨에 대응되는 문자로 가령 ";"일 수 있다.Meanwhile, the controller 112 may determine the level character of the seventh data 616 as the third character in consideration of the sixth data 612 . In this case, the third character may be a character corresponding to the first level, for example, “;”.

이와 같이 본 발명은 각 데이터의 구조화 정보를 레벨 문자로 변환하고, 변환된 문자를 학습 데이터에 포함시켜, 데이터의 구조화 정보까지 인공 신경망의 학습에 사용될 수 있도록 한다. As described above, the present invention converts the structured information of each data into level text, and includes the converted text in the learning data, so that even the structured information of the data can be used for learning of the artificial neural network.

특히 본 발명은 개조식 형태의 데이터에 있어서, 각 개별 데이터의 레벨 정보를 문자의 형태로 변환하여 학습 데이터에 포함시켜, 해당 데이터의 학습에 있어서 레벨 정보까지 고려하여 학습이 이루어 지도록 할 수 있다.In particular, the present invention can convert level information of each individual data into a character form and include it in the learning data in the modified form of data, so that learning can be performed in consideration of the level information in the learning of the corresponding data.

도 7은 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)에 의해 수행되는 학습 데이터의 전처리 방법을 설명하기 위한 흐름도이다. 이하에서는 도 1 내지 도 6b에서 설명한 내용되 중복되는 내용의 설명은 생략하되, 도 1 내지 도 6b를 함께 참조하여 설명한다.7 is a flowchart illustrating a method of preprocessing learning data performed by the artificial neural network learning apparatus 110 according to an embodiment of the present invention. Hereinafter, descriptions of overlapping contents described with reference to FIGS. 1 to 6B will be omitted, but will be described with reference to FIGS. 1 to 6B together.

본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 하나 이상의 데이터를 포함하는 구조화된 학습 데이터를 수신할 수 있다.(S71) 이때 '하나 이상의 데이터'는 구조화된 학습 데이터를 구성하는 개별 데이터를 의미할 수 있다.The artificial neural network learning apparatus 110 according to an embodiment of the present invention may receive structured learning data including one or more data (S71). In this case, 'one or more data' is an individual constituting the structured learning data. It can mean data.

선택적 실시예에서, 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 수신된 학습 데이터에서 구조화된 학습 데이터 만을 선별하여 후술하는 과정에 따라 전처리 학습 데이터의 형태로 변환할 수 있다. In an optional embodiment, the artificial neural network learning apparatus 110 according to an embodiment of the present invention may select only structured training data from the received training data and convert it into the form of pre-processing training data according to a process to be described later.

인공 신경망 학습 장치(110)는 전술한 사용자 단말(200)로부터 구조화된 학습 데이터를 수신할 수도 있고, 메모리(113)로부터 수신(또는 독출)할 수 있다.The artificial neural network learning apparatus 110 may receive structured learning data from the aforementioned user terminal 200 or may receive (or read) structured learning data from the memory 113 .

본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 수신된 학습 데이터의 구조화 형태를 식별할 수 있다.(S72)The artificial neural network learning apparatus 110 according to an embodiment of the present invention may identify a structured form of the received learning data (S72).

일 실시예에서 인공 신경망 학습 장치(110)는 구조화된 학습 데이터의 구조화 형태가 표(表) 형태인지 식별할 수 있다. 또한 인공 신경망 학습 장치(110)는 구조화된 학습 데이터의 구조화 형태가 개조식(個條式) 형태인지 식별할 수도 있다. 다만 이와 같은 구조화 형태는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.In an embodiment, the artificial neural network learning apparatus 110 may identify whether the structured form of the structured learning data is a table form. In addition, the artificial neural network learning apparatus 110 may identify whether the structured form of the structured learning data is a modified form. However, such a structured form is exemplary and the spirit of the present invention is not limited thereto.

본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 상술한 과정에 따라 식별된 구조화 형태를 참조하여, 구조화 데이터에 포함되는 하나 이상의 데이터 각각의 레벨에 대응되는 레벨 문자를 결정할 수 있다.(S73) 또한 하나 이상의 데이터와 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성할 수 있다.(S74)The artificial neural network learning apparatus 110 according to an embodiment of the present invention may determine a level character corresponding to each level of one or more data included in the structured data with reference to the structured form identified according to the above-described process. (S73) It is also possible to generate preprocessing learning data in which one or more data and one or more data level characters are listed in a predetermined form. (S74)

이하에서는 도 5a 및 도 5b를 다시 참조하여 단계 S72 내지 단계 S74를 설명한다. 설명의 편의를 위해, 구조화된 학습 데이터가 도 5a에 도시된 바와 같이 하나 이상의 행 및 하나 이상의 열로 이루어 지고, 복수의 개별 데이터(511 내지 518)를 포함하는 표 데이터(510)임을 전제로 설명한다. 또한 이러한 표 데이터(510)가 제1 데이터(511), 제1 데이터(511)와 동일한 행에 위치하고 제1 데이터(511)와 인접하는 열에 위치하는 제2 데이터(512), 제1 데이터(511)와 동일한 행의 제일 마지막 열에 위치하는 제3 데이터(514) 및 제1 데이터(511)의 다음 행의 가장 첫 열에 위치하는 제4 데이터(515)를 포함하는 것을 전제로 설명한다.Hereinafter, steps S72 to S74 will be described with reference to FIGS. 5A and 5B again. For convenience of explanation, it is assumed that the structured learning data is tabular data 510 including a plurality of individual data 511 to 518, which consists of one or more rows and one or more columns as shown in FIG. 5A. . In addition, the table data 510 is positioned in the same row as the first data 511 and the first data 511 and the second data 512 and the first data 511 are positioned in a column adjacent to the first data 511 . ) and the third data 514 positioned in the last column of the same row and the fourth data 515 positioned in the first column of the next row of the first data 511 will be described.

상술한 가정 하에, 인공 신경망 학습 장치(110)는 도 5a의 데이터(510)의 구조화 형태를 '표 형태'로 식별할 수 있다. 또한 인공 신경망 학습 장치(110)는 제1 데이터(511)를 고려하여, 제2 데이터(512)의 레벨 문자를 제1 문자로 결정할 수 있다. 이때 제1 문자는 열 바꿈에 대응되는 문자로 가령 "#"일 수 있다. Under the above assumption, the artificial neural network learning apparatus 110 may identify the structured form of the data 510 of FIG. 5A as a 'table form'. Also, the artificial neural network learning apparatus 110 may determine the level character of the second data 512 as the first character in consideration of the first data 511 . In this case, the first character is a character corresponding to a column change and may be, for example, “#”.

선택적 실시예에서, 인공 신경망 학습 장치(110)는 표 데이터(510) 내에서의 제2 데이터(512)의 위치를 고려하여, 제2 데이터(512)의 레벨 문자를 제1 문자로 결정할 수도 있다. 이러한 경우 인공 신경망 학습 장치(110)는 제2 데이터(512)와 같은 각 개별 데이터의 행/열을 식별하여 레벨 문자를 결정할 수 있다.In an optional embodiment, the artificial neural network learning apparatus 110 may determine the level character of the second data 512 as the first character in consideration of the position of the second data 512 in the table data 510 . . In this case, the artificial neural network learning apparatus 110 may determine a level character by identifying a row/column of each individual data such as the second data 512 .

마찬가지 방법으로 인공 신경망 학습 장치(110)는 제2 데이터(512)를 고려하거나, 데이터의 행/열을 고려하여, 다음 데이터(513)의 레벨 문자를 제1 문자로 결정할 수 있다.In the same way, the artificial neural network learning apparatus 110 may determine the level character of the next data 513 as the first character by considering the second data 512 or considering the row/column of the data.

가령 인공 신경망 학습 장치(110)는 도 5b에 도시된바와 같이 "[제1 데이터("구분")] [제1 문자("#")] [제2 데이터("일반 기업")].."과 같이 데이터와 레벨 문자가 나열된 전처리 학습 데이터(520)를 생성할 수 있다.For example, as shown in FIG. 5B , the artificial neural network learning apparatus 110 "[first data ("classification")] [first character ("#")] [second data ("general company")].. It is possible to generate the preprocessing learning data 520 in which data and level characters are listed, such as ".

한편 인공 신경망 학습 장치(110)는 제3 데이터(514)를 고려하여, 제4 데이터(515)의 레벨 문자를 제2 문자로 결정할 수 있다. 이때 제2 문자는 행 바꿈에 대응되는 문자로 가령 "@"일 수 있다. Meanwhile, the artificial neural network learning apparatus 110 may determine the level character of the fourth data 515 as the second character in consideration of the third data 514 . In this case, the second character is a character corresponding to a line break and may be, for example, “@”.

가령 인공 신경망 학습 장치(110)는 도 5b에 도시된바와 같이 "[제3 데이터("선정 기업")] [제2 문자("@")] [제4 데이터("최대 한도")].."와 같이 데이터와 레벨 문자가 나열된 전처리 학습 데이터(520)를 생성할 수 있다.For example, as shown in FIG. 5B , the artificial neural network learning apparatus 110 includes "[third data ("selected company")] [second character ("@")] [fourth data ("maximum limit")]. It is possible to generate the preprocessing training data 520 in which data and level characters are listed, such as .".

이와 같이 본 발명은 각 데이터의 구조화 정보를 레벨 문자로 변환하고, 변환된 문자를 학습 데이터에 포함시켜, 데이터의 구조화 정보까지 인공 신경망의 학습에 사용될 수 있도록 한다. As described above, the present invention converts the structured information of each data into level text, and includes the converted text in the learning data, so that even the structured information of the data can be used for learning of the artificial neural network.

특히 본 발명은 표 형태의 데이터에 있어서, 각 개별 데이터의 행/열 정보를 문자의 형태로 변환하여 학습 데이터에 포함시켜, 해당 데이터의 학습에 있어서 행/열의 정보까지 고려하여 학습이 이루어 지도록 할 수 있다.In particular, in the present invention, in tabular data, the row/column information of each individual data is converted into a character form and included in the learning data, so that learning is performed in consideration of the row/column information in the learning of the corresponding data. can

이하에서는 도 6a 및 도 6b를 다시 참조하여 단계 S72 내지 단계 S74를 설명한다. 설명의 편의를 위해, 구조화된 학습 데이터가 도 6a에 도시된 바와 같이 하나 이상의 레벨(또는 수준)을 포함하고, 복수의 개별 데이터(611 내지 616)를 포함하는 개조식 데이터(610)임을 전제로 설명한다. Hereinafter, steps S72 to S74 will be described with reference to FIGS. 6A and 6B again. For convenience of explanation, it is assumed that the structured learning data includes one or more levels (or levels) as shown in FIG. 6A , and is modified data 610 including a plurality of individual data 611 to 616 . do.

또한 이러한 개조식 데이터(610)가 제1 레벨의 제5 데이터(611), 제5 데이터(611)의 하위 데이터로 제2 레벨의 데이터인 제6 데이터(612) 및 제6 데이터(612)의 이후 데이터로 제1 레벨인 제7 데이터(616)를 포함하는 것을 전제로 설명한다.In addition, the modified data 610 is the fifth data 611 of the first level, the lower data of the fifth data 611, and the sixth data 612 and the sixth data 612 that are the second level data after The description will be made on the assumption that the seventh data 616, which is the first level, is included as the data.

먼저 인공 신경망 학습 장치(110)는 도 6a의 데이터(610)의 구조화 형태를 '개조식 형태'로 식별할 수 있다. 또한 인공 신경망 학습 장치(110)는 제5 데이터(611)를 고려하여, 제6 데이터(612)의 레벨 문자를 제4 문자로 결정할 수 있다. 이때 제4 문자는 제2 레벨에 대응되는 문자로 가령 ";;"일 수 있다.First, the artificial neural network learning apparatus 110 may identify the structured form of the data 610 of FIG. 6A as a 'reformed form'. Also, the artificial neural network learning apparatus 110 may determine the level character of the sixth data 612 as the fourth character in consideration of the fifth data 611 . In this case, the fourth character may be, for example, “;;” as a character corresponding to the second level.

선택적 실시예에서, 인공 신경망 학습 장치(110)는 개조식 데이터(610) 내에서의 제6 데이터(612)의 절대적 레벨(또는 수준)을 고려하여 제6 데이터(612)의 레벨 문자를 제4 문자로 결정할 수도 있다. 이러한 경우 인공 신경망 학습 장치(110)는 제6 데이터(612)와 같은 각 개별 데이터의 레벨 또는 수준을 식별하여 레벨 문자를 결정할 수 있다.In an optional embodiment, the artificial neural network learning apparatus 110 considers the absolute level (or level) of the sixth data 612 in the adapted data 610 to convert the level character of the sixth data 612 into the fourth character. may be decided as In this case, the artificial neural network learning apparatus 110 may determine the level character by identifying the level or level of each individual data, such as the sixth data 612 .

마찬가지 방법으로 인공 신경망 학습 장치(110)는 제6 데이터(612)를 고려하거나, 데이터의 행/열을 고려하여, 다음 데이터(613)의 레벨 문자를 ";;;"로 결정할 수 있다.In the same way, the artificial neural network learning apparatus 110 may determine the level character of the next data 613 as “;;” in consideration of the sixth data 612 or rows/columns of the data.

가령 인공 신경망 학습 장치(110)는 도 6b에 도시된바와 같이 "[제5 데이터("수수료 등 비용")][제3 문자";"][제6 데이터("근저당권 설정비용")][제4 문자(";;")].."과 같이 데이터와 레벨 문자가 나열된 전처리 학습 데이터(620)를 생성할 수 있다.For example, as shown in FIG. 6b , the artificial neural network learning apparatus 110 "[fifth data ("fees, etc. cost")] [third character";"] [sixth data ("root mortgage setting cost")] [ The fourth character (“;;”)]..” may generate the pre-processing learning data 620 in which data and level characters are listed.

한편 인공 신경망 학습 장치(110)는 제6 데이터(612)를 고려하여, 제7 데이터(616)의 레벨 문자를 제3 문자로 결정할 수 있다. 이때 제3 문자는 제1 레벨에 대응되는 문자로 가령 ";"일 수 있다.Meanwhile, the artificial neural network learning apparatus 110 may determine the level character of the seventh data 616 as the third character in consideration of the sixth data 612 . In this case, the third character may be a character corresponding to the first level, for example, “;”.

이와 같이 본 발명은 각 데이터의 구조화 정보를 레벨 문자로 변환하고, 변환된 문자를 학습 데이터에 포함시켜, 데이터의 구조화 정보까지 인공 신경망의 학습에 사용될 수 있도록 한다. As described above, the present invention converts the structured information of each data into level text, and includes the converted text in the learning data, so that even the structured information of the data can be used for learning of the artificial neural network.

특히 본 발명은 개조식 형태의 데이터에 있어서, 각 개별 데이터의 레벨 정보를 문자의 형태로 변환하여 학습 데이터에 포함시켜, 해당 데이터의 학습에 있어서 레벨 정보까지 고려하여 학습이 이루어 지도록 할 수 있다.In particular, the present invention can convert level information of each individual data into a character form and include it in the learning data in the modified form of data, so that learning can be performed in consideration of the level information in the learning of the corresponding data.

도 8은 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)에 의해 수행되는 구조화된 학습 데이터를 이용하여 인공 신경망 학습 방법을 설명하기 위한 흐름도이다.8 is a flowchart illustrating an artificial neural network learning method using structured learning data performed by the artificial neural network learning apparatus 110 according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 구조화된 학습 데이터에 포함되는 하나 이상의 데이터 및 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성할 수 있다.(S81) 구조화된 학습 데이터로부터 전처리 학습 데이터를 생성하는 과정은 도 1 내지 도 7에서 설명하였으므로, 이에 대한 상세한 설명은 생략한다.The artificial neural network learning apparatus 110 according to an embodiment of the present invention may generate preprocessing learning data in which one or more data included in the structured learning data and a level character of each one or more data are listed in a predetermined form. ( S81) Since the process of generating the pre-processing learning data from the structured learning data has been described with reference to FIGS. 1 to 7 , a detailed description thereof will be omitted.

이어서 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 인공 신경망의 학습을 위한 질의 및 이러한 질의에 대한 답변을 획득할 수 있다.(S82) 이때 답변은 전처리 학습 데이터를 구성하는 적어도 일부 문자열의 범위의 형태로 획득될 수 있다.Subsequently, the artificial neural network learning apparatus 110 according to an embodiment of the present invention may obtain a query for learning of the artificial neural network and an answer to the query (S82). In this case, the answer is at least a part of preprocessing learning data. It can be obtained in the form of a range of strings.

가령 구조화된 학습 데이터가 도 5a에 도시된 표 데이터(510)이고, 질의가 "주거래 기업의 최대 한도는 얼마인가?"인 경우, 답변은 전처리 학습 데이터(520)를 구성하는 일부 문자열인 "#2억원"의 형태로 획득될 수 있다. For example, if the structured learning data is the table data 510 shown in FIG. 5A , and the query is "What is the maximum limit of the main trading company?", the answer is "#, which is some string constituting the preprocessing learning data 520 200 million" can be obtained.

인공 신경망의 학습에 사용되는 질의는 사용자에 의해 생성된 것이거나 질의를 생성하는 별도의 인공 신경망(미도시)에 의해 생성된 것일 수 있다. 한편 인공 신경망의 학습에 사용되는 답변은 사용자에 의해 입력(또는 선택)된 것일 수 있다.The query used for learning of the artificial neural network may be generated by a user or may be generated by a separate artificial neural network (not shown) that generates the query. On the other hand, the answer used for learning of the artificial neural network may be input (or selected) by the user.

본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 획득된 전처리 학습 데이터, 질의 및 문자열의 범위(즉 답변)에 기초하여 인공 신경망을 학습시킬 수 있다.(S83)The artificial neural network learning apparatus 110 according to an embodiment of the present invention may train the artificial neural network based on the obtained pre-processing learning data, the query and the range (ie, the answer) of the character string. (S83)

보다 구체적으로, 본 발명의 일 실시예에 따른 인공 신경망 학습 장치(110)는 답변에 포함되는 데이터와 연관된 적어도 하나의 데이터를 참조하여 인공 신경망을 학습시킬 수 있다.More specifically, the artificial neural network learning apparatus 110 according to an embodiment of the present invention may train the artificial neural network with reference to at least one data related to data included in an answer.

가령 답변으로써 획득한 적어도 일부 문자열의 범위 내에 전처리 학습 데이터에 포함되는 제8 데이터 및 상기 제8 데이터의 레벨 문자가 포함되는 경우, 인공 신경망 학습 장치(110)는 제8 데이터의 레벨 문자를 고려하여, 제8 데이터와 연관된 적어도 하나의 제9 데이터를 함께 참조하여 인공 신경망을 학습시킬 수 있다.For example, when the eighth data included in the preprocessing learning data and the level characters of the eighth data are included within the range of at least some character strings obtained as answers, the artificial neural network learning apparatus 110 considers the level characters of the eighth data. , the artificial neural network may be trained by referring to at least one ninth data associated with the eighth data together.

전술한 예시에서와 같이 구조화된 학습 데이터가 도 5a에 도시된 표 데이터(510)이고, 질의가 "주거래 기업의 최대 한도는 얼마인가?"인 경우, 답변은 전처리 학습 데이터(520)를 구성하는 일부 문자열인 "#2억원"의 형태로 획득되었다고 가정해 보자. 이러한 경우 인공 신경망 학습 장치(110)는 제8 데이터("2억원") 및 제8 데이터의 레벨 문자("#")를 고려하여, 제8 데이터와 연관된 제9 데이터("주거래 기업" 및 "최대 한도") 및 제9 데이터의 레벨 문자를 함께 참조하여 인공 신경망을 학습시킬 수 있다. 다만 인공 신경망 학습 장치(110)가 참조하는 제9 데이터의 종류 및/또는 위치가 정형화된 규칙에 따라 결정되는 것은 아니며, 상술한 제9 데이터는 예시적인 것에 불과하다.As in the above example, if the structured learning data is the table data 510 shown in FIG. 5A, and the query is "What is the maximum limit of the main trading company?", the answer is the preprocessing learning data 520. Let's assume that it is obtained in the form of some string "#200 million". In this case, the artificial neural network learning apparatus 110 considers the eighth data (“200 million won”) and the level character (“#”) of the eighth data, and the ninth data (“main transaction company” and “ The artificial neural network can be trained by referring to the "maximum limit") and the level character of the ninth data together. However, the type and/or location of the ninth data referenced by the artificial neural network learning apparatus 110 is not determined according to a standardized rule, and the above-described ninth data is merely exemplary.

이상 설명된 본 발명에 따른 실시예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 저장하는 것일 수 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. The embodiment according to the present invention described above may be implemented in the form of a computer program that can be executed through various components on a computer, and such a computer program may be recorded in a computer-readable medium. In this case, the medium may be to store a program executable by a computer. Examples of the medium include a hard disk, a magnetic medium such as a floppy disk and a magnetic tape, an optical recording medium such as CD-ROM and DVD, a magneto-optical medium such as a floppy disk, and those configured to store program instructions, including ROM, RAM, flash memory, and the like.

한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.Meanwhile, the computer program may be specially designed and configured for the present invention, or may be known and used by those skilled in the computer software field. Examples of the computer program may include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

본 발명에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 발명의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 본 발명의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.The specific implementations described in the present invention are only examples, and do not limit the scope of the present invention in any way. For brevity of the specification, descriptions of conventional electronic components, control systems, software, and other functional aspects of the systems may be omitted. In addition, the connections or connecting members of the lines between the components shown in the drawings illustratively represent functional connections and/or physical or circuit connections, and in an actual device, various functional connections, physical connections that are replaceable or additional may be referred to as connections, or circuit connections. In addition, unless there is a specific reference such as "essential" or "importantly", it may not be a necessary component for the application of the present invention.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the above-described embodiments, and the scope of the spirit of the present invention is not limited to the scope of the scope of the present invention. will be said to belong to

100: 인공 신경망 학습 서버
110: 인공 신경망 학습 장치
111: 통신부
112: 제어부
113: 메모리
200: 사용자 단말
400: 통신망
100: artificial neural network learning server
110: artificial neural network learning device
111: communication department
112: control unit
113: memory
200: user terminal
400: communication network

Claims (2)

인공 신경망의 학습을 위해 표 형태의 데이터를 전처리 하는 방법에 있어서,
하나 이상의 데이터를 포함하는 표 데이터를 수신하는 단계로써, 상기 하나 이상의 데이터는 상기 표 데이터를 구성하는 개별 데이터이고;
상기 하나 이상의 데이터 각각의 레벨에 대응되는 레벨 문자를 결정하는 단계로써, 상기 레벨 문자는 상기 하나 이상의 데이터 각각의 상기 표 데이터 내에서의 행과 열을 나타내는 문자이고; 및
상기 하나 이상의 데이터 및 상기 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성하는 단계;를 포함하는, 인공 신경망의 학습을 위해 표 형태의 데이터를 전처리 하는 방법.
In a method of pre-processing tabular data for learning of an artificial neural network,
receiving table data comprising one or more data, wherein the one or more data are individual data constituting the table data;
determining a level character corresponding to each level of the one or more data, the level character being a character representing a row and a column in the table data of each of the one or more data; and
Generating pre-processing learning data in which the one or more data and the level characters of each of the one or more data are listed in a predetermined form; A method of pre-processing data in a tabular form for learning of an artificial neural network, comprising a.
인공 신경망의 학습을 위해 개조식 형태의 데이터를 전처리 하는 방법에 있어서,
하나 이상의 데이터를 포함하고, 하나 이상의 레벨로 이루어지는 개조식 데이터를 수신하는 단계로써, 상기 하나 이상의 데이터는 상기 개조식 데이터를 구성하는 개별 데이터이고;
상기 하나 이상의 데이터 각각의 레벨에 대응되는 레벨 문자를 결정하는 단계로써, 상기 레벨 문자는 상기 하나 이상의 데이터 각각의 상기 개조식 데이터 내에서의 절대적 레벨을 나타내는 문자이고; 및
상기 하나 이상의 데이터 및 상기 하나 이상의 데이터 각각의 레벨 문자가 소정의 형태로 나열된 전처리 학습 데이터를 생성하는 단계;를 포함하는, 인공 신경망의 학습을 위해 개조식 형태의 데이터를 전처리 하는 방법.
In a method of preprocessing data in a modified form for learning of an artificial neural network,
receiving adapted data comprising one or more data and consisting of one or more levels, wherein the one or more data are individual data constituting the adapted data;
determining a level character corresponding to each level of the one or more data, wherein the level character is a character indicating an absolute level within the modified data of each of the one or more data; and
Generating preprocessing learning data in which the one or more data and the level characters of each of the one or more data are listed in a predetermined form; A method of preprocessing data in a modified form for learning of an artificial neural network, comprising a.
KR1020210149898A 2018-05-31 2021-11-03 Method for preprocessing structured learning data KR102408186B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20180062905 2018-05-31
KR1020180062905 2018-05-31
KR1020190064067A KR102329290B1 (en) 2018-05-31 2019-05-30 Method for preprocessing structured learning data and Method for learning artificial neural network using the structured learning data

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020190064067A Division KR102329290B1 (en) 2018-05-31 2019-05-30 Method for preprocessing structured learning data and Method for learning artificial neural network using the structured learning data

Publications (2)

Publication Number Publication Date
KR20210134588A true KR20210134588A (en) 2021-11-10
KR102408186B1 KR102408186B1 (en) 2022-06-13

Family

ID=69002584

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020190064067A KR102329290B1 (en) 2018-05-31 2019-05-30 Method for preprocessing structured learning data and Method for learning artificial neural network using the structured learning data
KR1020210149896A KR102408189B1 (en) 2018-05-31 2021-11-03 Method for preprocessing tabular data for training of artificial neural network
KR1020210149898A KR102408186B1 (en) 2018-05-31 2021-11-03 Method for preprocessing structured learning data
KR1020210149897A KR102408185B1 (en) 2018-05-31 2021-11-03 Method for preprocessing bullet form data for training of artificial neural network
KR1020210149895A KR102430548B1 (en) 2018-05-31 2021-11-03 Method for preprocessing structured learning data

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020190064067A KR102329290B1 (en) 2018-05-31 2019-05-30 Method for preprocessing structured learning data and Method for learning artificial neural network using the structured learning data
KR1020210149896A KR102408189B1 (en) 2018-05-31 2021-11-03 Method for preprocessing tabular data for training of artificial neural network

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020210149897A KR102408185B1 (en) 2018-05-31 2021-11-03 Method for preprocessing bullet form data for training of artificial neural network
KR1020210149895A KR102430548B1 (en) 2018-05-31 2021-11-03 Method for preprocessing structured learning data

Country Status (1)

Country Link
KR (5) KR102329290B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100835307B1 (en) * 2006-12-08 2008-06-04 부산대학교 산학협력단 Agent system and method for crawling schedule on the web
KR100911620B1 (en) * 2007-12-11 2009-08-12 한국전자통신연구원 Method and system for sampling web documents information
JP2012098797A (en) * 2010-10-29 2012-05-24 Internatl Business Mach Corp <Ibm> Method for producing rule for classifying structured documents, computer program therefor and computer
KR20130116669A (en) * 2012-04-16 2013-10-24 삼성전자주식회사 A data processing method and a data processing unit using thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4226261B2 (en) * 2002-04-12 2009-02-18 三菱電機株式会社 Structured document type determination system and structured document type determination method
KR100972479B1 (en) * 2008-07-25 2010-07-26 에스케이커뮤니케이션즈 주식회사 Method and System for Recommending Contents and Building Database by Machine Learning
JP6618735B2 (en) * 2015-08-31 2019-12-11 国立研究開発法人情報通信研究機構 Question answering system training apparatus and computer program therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100835307B1 (en) * 2006-12-08 2008-06-04 부산대학교 산학협력단 Agent system and method for crawling schedule on the web
KR100911620B1 (en) * 2007-12-11 2009-08-12 한국전자통신연구원 Method and system for sampling web documents information
JP2012098797A (en) * 2010-10-29 2012-05-24 Internatl Business Mach Corp <Ibm> Method for producing rule for classifying structured documents, computer program therefor and computer
KR20130116669A (en) * 2012-04-16 2013-10-24 삼성전자주식회사 A data processing method and a data processing unit using thereof

Also Published As

Publication number Publication date
KR20210134586A (en) 2021-11-10
KR20190137009A (en) 2019-12-10
KR102329290B1 (en) 2021-11-22
KR20210135450A (en) 2021-11-15
KR102408185B1 (en) 2022-06-13
KR102430548B1 (en) 2022-08-09
KR102408189B1 (en) 2022-06-13
KR20210134587A (en) 2021-11-10
KR102408186B1 (en) 2022-06-13

Similar Documents

Publication Publication Date Title
CN109002852B (en) Image processing method, apparatus, computer readable storage medium and computer device
KR102071582B1 (en) Method and apparatus for classifying a class to which a sentence belongs by using deep neural network
KR102532749B1 (en) Method and apparatus for hierarchical learning of neural networks based on weak supervised learning
CN105122279B (en) Deep neural network is conservatively adapted in identifying system
US10990852B1 (en) Method and apparatus for training model for object classification and detection
CN109993102B (en) Similar face retrieval method, device and storage medium
KR102177412B1 (en) System and Method for Matching Similarity between Image and Text
KR20190056720A (en) Method and device for learning neural network
US11640634B2 (en) Deep learning based visual compatibility prediction for bundle recommendations
CN115129848B (en) Method, device, equipment and medium for processing visual question-answering task
KR20190056940A (en) Method and device for learning multimodal data
JP6908302B2 (en) Learning device, identification device and program
CN112418292B (en) Image quality evaluation method, device, computer equipment and storage medium
KR102264232B1 (en) An explanation-added document classification method by an artificial neural network that learns the correlation between words, sentence feature values, and word weights
CN116664719B (en) Image redrawing model training method, image redrawing method and device
CN113158554B (en) Model optimization method and device, computer equipment and storage medium
CN114494718A (en) Image classification method and device, storage medium and terminal
CN111046178A (en) Text sequence generation method and system
CN112418320A (en) Enterprise association relation identification method and device and storage medium
KR20210050087A (en) Method and apparatus for measuring confidence
CN112132269B (en) Model processing method, device, equipment and storage medium
KR102329290B1 (en) Method for preprocessing structured learning data and Method for learning artificial neural network using the structured learning data
CN115906861B (en) Sentence emotion analysis method and device based on interaction aspect information fusion
KR102168541B1 (en) A method and computer program of learning a second neural network using a first neural network
CN114328904A (en) Content processing method, content processing device, computer equipment and storage medium

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant