KR101986345B1 - Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance - Google Patents

Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance Download PDF

Info

Publication number
KR101986345B1
KR101986345B1 KR1020190014828A KR20190014828A KR101986345B1 KR 101986345 B1 KR101986345 B1 KR 101986345B1 KR 1020190014828 A KR1020190014828 A KR 1020190014828A KR 20190014828 A KR20190014828 A KR 20190014828A KR 101986345 B1 KR101986345 B1 KR 101986345B1
Authority
KR
South Korea
Prior art keywords
meta
sentence
image
data set
generation unit
Prior art date
Application number
KR1020190014828A
Other languages
Korean (ko)
Inventor
김학수
김민철
정영오
이준호
Original Assignee
주식회사 스위트케이
강원대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 스위트케이, 강원대학교산학협력단 filed Critical 주식회사 스위트케이
Priority to KR1020190014828A priority Critical patent/KR101986345B1/en
Application granted granted Critical
Publication of KR101986345B1 publication Critical patent/KR101986345B1/en

Links

Images

Classifications

    • G06F17/2827
    • G06F17/2705
    • G06F17/289

Abstract

According to the present invention, an apparatus for generating meta sentences in tables or images to improve machine reading comprehension (MRC) performance comprises: a meta sentence data set (200) in which example data converting information included in tables or images into meta sentences are stored; and a meta sentence generation unit (100) to use the example data stored in the meta sentence data set (200) to generate meta sentences from information included in tables or images from an original document including the tables or the images, and then supply a document with the meta sentences to an MRC processing unit (300) for performing MRC. According to the present invention, meta sentences for tables or images are generated in an original document including the tables or the images to supply the meta sentences to the MRC processing unit to allow questions and answers for information about the tables or the images while using a vacant MRC system without modifying the vacant MRC system to drastically improve machine reading comprehension performance.

Description

기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치{Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance}BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and a method for generating meta sentences in a table or an image,

본 발명은 기계독해(MRC) 시스템에 관한 것으로서, 보다 상세하게는 기계독해(MRC) 시스템에서의 기계독해 성능향상을 위해 표나 이미지가 포함된 원본 문서에 메타 문장을 생성하여 기계독해 시스템(MRC)에 제공하는 장치에 관한 것이다.The present invention relates to a machine readable (MRC) system, and more particularly, to a machine readable system (MRC) system for generating a meta sentence in an original document including a table or an image, To the apparatus.

기계독해(MRC:Machine Reading Comprehension)란, 알려진 바와 같이 딥러닝(Deep Learning) 기반의 인공지능(AI) 기술이 사람처럼 주어진 문서를 읽고 이해한 후 질문에 대한 정답을 찾아내는 기계독해 능력을 의미한다. 즉 기계독해(MRC:Machine Reading Comprehension)는 텍스트 문서에서 자연어 질문 답변을 도출하는 인공지능 기술을 의미하며, 사람이 신문, 잡지를 읽고 질문 답변을 추론하듯이 인공지능(AI)이 문장 속에서 의미를 찾고 답변하는 것이 가능하다. Machine Reading Comprehension (MRC), as we know, is the machine reading ability of Deep Learning based AI which reads and interprets a given document like a human and finds the correct answer to the question . Machine Reading Comprehension (MRC) refers to artificial intelligence technology that derives natural language question answering from a text document. As a person reads newspapers and magazines and deduces question answers, artificial intelligence (AI) It is possible to find and answer.

MRC 기술이 발전할수록 답변 정확도와 수준이 높아지는데, MRC 핵심은 데이터셋(Data Set)이다. 즉, 얼마나 다양한 데이터를 확보, 분석하느냐가 MRC의 성능 향상을 위해 중요하다. As the MRC technology develops, the accuracy and level of answers increase. At the core of the MRC is the data set. In other words, how to obtain and analyze various data is important for MRC performance improvement.

한편, 실용 영역에서의 문서는 텍스트 외에 표나 이미지(그림)와 같은 다양한 정보가 포함되어 있는데, 기존의 MRC 시스템은 텍스트 문서에서 정보를 찾아 질문에 대한 답변을 하므로 결국 답변 정확도에 한계가 있다. 따라서 MRC 시스템의 성능 향상을 위해서는 표나 이미지와 같은 정보에 대한 처리 방안이 필요하다.On the other hand, the document in the practical area includes various information such as a table or an image (picture) in addition to the text. However, the conventional MRC system finds information in the text document and answers the question. Therefore, in order to improve the performance of MRC system, it is necessary to process information such as tables and images.

본 발명은 상기와 같은 점을 감안하여 안출된 것으로써, 표나 이미지를 포함하는 원본 문서에서 표나 이미지 같은 일반 텍스트 이외의 정보에 대해, 공지의 MRC 시스템을 수정하지 않고 그대로 이용하면서 성능 향상을 할 수 있도록 표나 이미지에 메타 문장을 생성하여 MRC 시스템에 제공하는 장치를 제공하는데 그 목적이 있다.SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and it is an object of the present invention to improve the performance of an original document including a table or an image by using the known MRC system without modifying the information other than plain text such as a table or an image And to provide a meta sentence to the MRC system by generating a meta sentence in a table or an image.

상기 목적을 달성하기 위한 본 발명에 따른 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치는, 표에 포함되는 정보를 예시 문장으로 변환된 예시 문장 데이터가 저장되는 메타 문장 데이터 셋(data set)(200): 및, 상기 메타 문장 데이터 셋(200)에 저장된 예시 문장 데이터를 이용하여, 표를 포함하는 원본 문서로부터 상기 표에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착한 후, 메타 문장이 생성된 문서를 기계독해(MRC:Machine Reading Comprehension)를 수행하는 MRC 처리부(300)로 제공하는 메타 문장 생성부(100);를 포함한다.According to another aspect of the present invention, there is provided an apparatus for generating a meta sentence in a table and an image, the apparatus comprising: a meta sentence data set in which information included in a table is converted into an example sentence, (200): generating information from the original document including the table as meta sentences using the example sentence data stored in the meta sentence data set (200) And a meta sentence generator 100 for providing a meta sentence generated document to an MRC processor 300 that performs machine reading comprehension (MRC).

본 발명의 일 실시예에 의하면, 상기 메타 문장 데이터 셋(200)은 표에 포함되는 정보를 예시 문장으로 변환된 예시 문장 데이터가 저장되는 표 메타 문장 데이터 셋(220)을 포함하고, 상기 메타 문장 생성부(100)는 상기 표 메타 문장 데이터 셋(220)의 예시 문장 데이터을 이용하여, 표를 포함하는 원본 문서로부터 상기 표에 포함되는 정보를 메타(meta) 문장으로 생성하는 표 메타 문장 생성부(120)를 포함한다. 여기서 상기 표 메타 문장 생성부(120)는 표의 각 열에 대한 메타 문장과 각 행에 대한 메타 문장 중 적어도 하나를 생성하여 원본 문서에 부착한다.According to an embodiment of the present invention, the meta-sentence data set 200 includes a meta- meta-sentence data set 220 in which example sentence data converted into an example sentence is stored, The generating unit 100 generates a table meta-sentence generating unit for generating information included in the table as a meta sentence from the original document including the table using the example sentence data of the table meta-sentence data set 220 120). The table meta-sentence generation unit 120 generates at least one of a meta sentence for each column of the table and a meta sentence for each line, and attaches the generated meta sentence to the original document.

본 발명의 다른 실시예에 의하면, 상기 표 메타 문장 데이터 셋(220)은 표의 종류와 형태에 따라 복수의 패턴으로 구분되게 저장되는 표 패턴 템플릿(222)을 포함하고, 상기 표 메타 문장 데이터 셋(220)에는 상기 표 패턴 템플릿(222)의 각 패턴에 대응되는 각 열 또는 각 행에 대한 예시 문장으로 변환된 예시 문장 데이터가 저장되며, 상기 표 메타 문장 생성부(120)는 원본 문서에 포함된 표의 종류와 형태에 따라 상기 표 패턴 템플릿(222)에 저장된 복수의 패턴 중 대응되는 패턴을 찾아, 해당 패턴에 대응되는 각 열 또는 각 행에 대한 예시 문장 데이터를 이용하여 상기 원본 문서의 표에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착한다. According to another embodiment of the present invention, the table meta-sentence data set 220 includes a table pattern template 222 that is stored in a plurality of patterns in accordance with the type and the type of the table, 220) stores example sentence data converted into an example sentence for each column or each row corresponding to each pattern of the table pattern template 222. The table meta sentence generation unit 120 generates a table meta sentence A corresponding pattern among a plurality of patterns stored in the table pattern template 222 is searched according to the type and form of the table and is included in the table of the original document using the example sentence data for each column or each row corresponding to the pattern Information is created as a meta sentence and attached to the original document.

본 발명의 또 다른 실시예에 의하면, 상기 표 메타 문장 생성부(120)는 원본 문서에 포함된 표가 상기 표 패턴 템플릿(222)에 저장된 복수의 패턴 중 대응되는 패턴을 찾지 못한 경우 사용자에게 알림 표시하여, 사용자로부터 원본 문서에 포함된 표에 대응되는 새로운 패턴과 그에 대응되는 예시 문장으로 변환된 예시 문장 데이터를 표 메타 문장 데이터 셋(220)에 저장하도록 하고, 상기 표 메타 문장 생성부(120)는 상기 새로운 패턴 및 그에 대응되는 예시 문장 데이터를 이용하여 상기 원본 문서의 표에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착한다.According to another embodiment of the present invention, the table meta-sentence generation unit 120 notifies a user when a table included in an original document can not find a corresponding pattern among a plurality of patterns stored in the table pattern template 222 And stores the new pattern corresponding to the table included in the original document and the example sentence data converted into the example sentence corresponding to the new pattern in the table meta sentence data set 220 from the user, Uses the new pattern and the corresponding sentence data corresponding thereto to generate information included in the table of the original document as a meta sentence and attaches the information to the original document.

본 발명의 또 다른 실시예에 의하면, 상기 메타 문장 데이터 셋(200)은 이미지에 포함되는 정보를 메타(meta) 문장으로 변환된 예시 데이터가 저장되는 이미지 메타 문장 데이터 셋(240)을 더 포함하고, 상기 메타 문장 생성부(100)는 상기 이미지 메타 문장 데이터 셋(240) 및 이미지에 대한 메타 문장을 자동으로 생성하는 이미지 캡셔닝 엔진(image captioning engine)(250)을 이용하여, 이미지를 포함하는 원본 문서로부터 상기 이미지에 포함되는 정보를 메타(meta) 문장으로 생성하는 이미지 메타 문장 생성부(140)를 더 포함한다. According to another embodiment of the present invention, the meta-sentence data set 200 may further include an image meta-sentence data set 240 in which example data converted into meta data is stored, The meta sentence generation unit 100 may generate the meta sentence data set 240 using the image meta sentence data set 240 and an image captioning engine 250 that automatically generates a meta sentence for the image, And an image meta sentence generation unit 140 for generating information included in the image from the original document as a meta sentence.

본 발명의 또 다른 실시예에 의하면, 상기 메타 문장 생성부(100)는 상기 표 메타 문장 데이터 셋(220)과 이미지 메타 문장 데이터 셋(240)을 이용하여, 상기 표에 이미지를 포함하는 원본 문서로부터 상기 표 및 이미지에 포함되는 정보를 메타(meta) 문장으로 생성하는 표·이미지 메타 문장 생성부(160)를 더 포함한다.According to another embodiment of the present invention, the meta-sentence generation unit 100 uses the table meta-sentence data set 220 and the image meta-sentence data set 240 to generate an original document And a table / image meta sentence generator 160 for generating information included in the table and the image as a meta sentence.

본 발명에 의하면 표나 이미지를 포함하는 원본 문서에 표나 이미지에 대한 메타 문장을 생성하여 MRC 처리부에 제공함으로써, 공지의 MRC 시스템을 수정하지 않고 그대로 이용하면서 표나 이미지에 대한 정보에 대해 질의응답이 가능하므로, 결국 기계독해 성능향상이 획기적으로 좋아지는 효과가 있다.According to the present invention, a meta sentence about a table or an image is generated in an original document including a table or an image and provided to the MRC processing unit, so that it is possible to inquire about information about the table or image while using the known MRC system without modification As a result, the improvement of machine reading performance is remarkably improved.

도 1은 본 발명의 실시예에 따른 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치의 블록 구성도,
도 2는 도 1의 요부 확대도,
도 3은 도 1의 표 패턴 템플릿에 저장되는 표 패턴의 일 예를 설명하는 도면,
도 4 내지 도 7은 본 발명의 실시예에 따른 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치의 동작을 설명하기 위한 참고 도면이다.
FIG. 1 is a block diagram of an apparatus for generating a meta sentence in a table / image in order to improve the machine reading performance according to an embodiment of the present invention.
Fig. 2 is an enlarged view of the main part of Fig. 1,
FIG. 3 is a view for explaining an example of a table pattern stored in the table pattern template of FIG. 1,
FIGS. 4 to 7 are views for explaining the operation of an apparatus for generating a meta sentence in a table / image in order to improve the machine reading performance according to the embodiment of the present invention.

본 발명의 상기와 같은 목적, 특징 및 다른 장점들은 첨부도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명함으로써 더욱 명백해질 것이다. 이하 첨부된 도면을 참조하여 본 발명의 실시예에 따른 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치에 대해 상세히 설명하기로 한다.These and other objects, features and other advantages of the present invention will become more apparent by describing in detail preferred embodiments of the present invention with reference to the accompanying drawings. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an apparatus for generating a meta sentence in a table and an image will be described in detail with reference to the accompanying drawings in order to improve the machine reading performance according to an embodiment of the present invention.

도 1 및 도 2를 참조하면, 본 발명의 실시예에 따른 표·이미지에 메타 문장을 생성하는 장치는, 메타 문장 생성부(100) 및 메타 문장 데이터 셋(data set)(200)을 포함한다.1 and 2, an apparatus for generating a meta sentence in a table image according to an exemplary embodiment of the present invention includes a meta sentence generation unit 100 and a meta sentence data set 200 .

메타 문장 데이터 셋(200)은 표나 이미지에 포함되는 정보를 예시 문장으로 변환된 예시 문장 데이터가 저장된다. 구체적으로 메타 문장 데이터 셋(200)은, 표에 포함되는 정보를 예시 문장으로 변환된 예시 문장 데이터가 저장되는 표 메타 문장 데이터 셋(220)과, 이미지에 포함되는 정보를 메타 예시 문장으로 변환된 예시 문장 데이터가 저장되는 이미지 메타 문장 데이터 셋(240)을 포함한다.In the meta-sentence data set 200, the example sentence data converted from the information included in the table or the image into the example sentence is stored. Specifically, the meta-sentence data set 200 includes a table meta-sentence data set 220 in which the example sentence data converted from the information included in the table is converted into an example sentence, And an image meta sentence data set 240 in which the example sentence data is stored.

표 메타 문장 데이터 셋(data set)(220)은 표의 종류와 형태에 따라 복수의 패턴으로 구분되게 저장되는 표 패턴 템플릿(222)를 구비한다. 여기서 표의 종류와 형태란 표의 종류나 형태(예를 들어 하나의 열과 행이 단일 셀로만 형성되는지 또는 복수의 셀로 구분되어 있는지 여부), 표에 포함된 내용(예를 들어 첫 번째 행과 첫 번째 열의 각 셀에 기재된 내용)등을 일정 패턴으로 구분되게 저장되는 것을 의미하며, 이러한 패턴은 수십 내지 수천 개일 수 있다. 전술한 바와 같이 데이터 셋(Data Set)이 많을수록 MRC의 성능이 향상되므로, 상기 표 패턴이 많을수록 좋다. The table meta-sentence data set 220 includes a table pattern template 222 that is stored in a plurality of patterns in accordance with the type and shape of the table. The type and form of a table is the type and form of the table (for example, whether a column and a row are formed as a single cell or divided into a plurality of cells), the contents of the table (for example, the first row and the first column The contents described in each cell) are stored in a predetermined pattern, and the pattern may be several tens to several thousands. As described above, since the performance of the MRC improves as the number of data sets increases, the number of the table patterns increases.

표 메타 문장 데이터 셋(220)은 표 패턴 템플릿(222)의 각 패턴에 대응되는 예시 문장으로 변환된 예시 문장 데이터가 저장된다. 즉 각각의 표 패턴에 따른 대응되는 예시 문장이 저장된다. 하나의 표 패턴에 대응되는 예시 문장은 하나이거나 또는 그 이상일 수 있다. 즉 하나의 표 패턴에는 복수의 행과 열을 가질 수 있고, 이에 대응되는 예시 문장은 각 행과 열의 대응되는 조합으로 문장을 생성할 수 있기 때문에 복수 개일 수 있다. 이에 대한 구체적 내용은 후술하기로 한다. The table meta-sentence data set 220 stores the example sentence data converted into the example sentences corresponding to the respective patterns of the table pattern template 222. That is, corresponding example sentences corresponding to each table pattern are stored. The number of example sentences corresponding to one table pattern may be one or more. That is, one table pattern may have a plurality of rows and columns, and the corresponding example sentences corresponding to the plurality of rows and columns may be plural because a sentence can be generated by a corresponding combination of each row and column. The details of this will be described later.

이미지 메타 문장 데이터 셋(240)은 이미지에 포함되는 정보를 예시 문장으로 변환된 예시 문장 데이터가 저장된다. The image meta-sentence data set 240 stores the example sentence data converted from the information included in the image into an example sentence.

메타 문장 생성부(100)는 메타 문장 데이터 셋(200)에 저장된 예시 문장 데이터를 이용하여, 표나 이미지를 포함하는 원본 문서(10)로부터 상기 표나 이미지에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착한다. 그리고 메타 문장 생성부(100)는 메타 문장이 생성된 문서를 기계독해(MRC:Machine Reading Comprehension)를 수행하는 MRC 처리부(300)로 제공한다. 즉, 메타 문장 생성부(100)는 표나 이미지를 MRC 처리부(300)가 인식가능 하도록 문맥이 있는 문장을 생성하여 제공하게 된다. 이러한 메타 문장은 원본 문서의 해당 표 주변에 부착시킬 수 있다. The meta sentence generation unit 100 generates information included in the table or image as a meta sentence from the original document 10 including the table or image by using the example sentence data stored in the meta sentence data set 200 To the original document. Then, the meta sentence generation unit 100 provides the MRC processing unit 300, which performs machine reading comprehension (MRC), with the document in which the meta sentence is generated. That is, the meta-sentence generation unit 100 generates a sentence having a context so that the MRC processing unit 300 can recognize the table or the image. These meta-sentences can be attached around the table in the original document.

메타 문장 생성부(100)는 표 메타 문장 생성부(120)와 이미지 메타 문장 생성부(140) 및 표·이미지 메타 문장 생성부(160)를 포함한다.The meta sentence generation unit 100 includes a table meta sentence generation unit 120, an image meta sentence generation unit 140, and a table / image meta sentence generation unit 160.

표 메타 문장 생성부(120)는 표 메타 문장 데이터 셋(220)의 예시 문장 데이터를 이용하여 표를 포함하는 원본 문서로부터 상기 표에 포함되는 정보를 메타(meta) 문장으로 생성하는 원본 문서에 부착하게 된다. The table meta sentence generation unit 120 attaches the original document including the table to the original document that generates the information included in the table as a meta sentence using the example sentence data of the table meta sentence data set 220 .

표 메타 문장 생성부(120)는 원본 문서에 포함된 표를 인식하고, 해당 표의 종류와 형태에 따라 표 패턴 템플릿(222)에 저장된 복수의 패턴 중 대응되는 패턴을 찾아 해당 패턴의 예시 문장 데이터를 이용하여, 해당 표에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착한다.The table meta sentence generation unit 120 recognizes a table included in the original document and finds a corresponding pattern among a plurality of patterns stored in the table pattern template 222 according to the type and the type of the table, , The information included in the table is created as a meta sentence and attached to the original document.

한편 표 메타 문장 생성부(120)는 원본 문서에 포함된 표가 상기 표 패턴 템플릿(222)에 저장된 복수의 패턴들 중 대응되는 패턴을 찾지 못한 경우 사용자에게 알림 표시한다. 이에 의해 사용자는 원본 문서에 포함된 표에 대응되는 새로운 패턴과 그에 대응되는 예시 문장으로 변환된 예시 데이터를 표 메타 문장 데이터 셋(220)에 저장하도록 하고, 상기 표 메타 문장 생성부(120)는 표 메타 문장 데이터 겟(220)에 저장된 상기 새로운 패턴 및 그에 대응되는 예시 문장 데이터를 이용하여 메타(meta) 문장으로 생성하여 원본 문서에 부착한다. On the other hand, the table meta-sentence generation unit 120 notifies the user when a table included in the original document can not find a corresponding pattern among a plurality of patterns stored in the table pattern template 222. [ Accordingly, the user can save the new pattern corresponding to the table included in the original document and the example data converted into the corresponding sentence corresponding to the table in the table meta sentence data set 220, and the table meta sentence generation unit 120 A meta sentence is generated using the new pattern stored in the meta sentence data table 220 and the corresponding sentence data corresponding to the new pattern and attached to the original document.

이미지 메타 문장 생성부(140)는 이미지 메타 문장 데이터 셋(240) 및 이미지에 대한 메타 문장을 자동으로 생성하는 이미지 캡셔닝 엔진(image captioning engine)(250)을 이용하여, 이미지를 포함하는 원본 문서로부터 상기 이미지에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착하게 된다. 이미지 캡셔닝 엔진(250)은 GAN(Generative Adversarial Networks)과 같은 공지의 인공지능 엔진을 사용할 수 있으며, 이미지를 텍스트 문장으로 변환시켜 준다. 본 발명의 실시예에 의하면 이미지 메타 문장 생성부(140)는 이미지 캡셔닝 엔진(250)을 포함할 수 있다. The image meta sentence generation unit 140 generates an image meta sentence using the image meta sentence data set 240 and the image captioning engine 250 that automatically generates a meta sentence for the image, The information included in the image is generated as a meta sentence and attached to the original document. The image capturing engine 250 may use a known artificial intelligence engine such as GAN (Generative Adversarial Networks), which converts images into text sentences. According to an embodiment of the present invention, the image meta sentence generation unit 140 may include an image captioning engine 250.

한편, 표에 이미지가 포함될 수 있는데(즉 표의 어느 셀에 이미지가 있는 경우), 표·이미지 메타 문장 생성부(160)는 표 메타 문장 데이터 셋(220)과 이미지 메타 문장 데이터 셋(240)을 이용하여, 표에 이미지를 포함하는 원본 문서로부터 상기 표 및 이미지에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착하게 된다.The table / image meta-sentence generation unit 160 generates a table meta-sentence data set 220 and an image meta-sentence data set 240 in the form of an image Information included in the table and the image is generated as a meta sentence from an original document including an image in the table and is attached to the original document.

MRC 처리부(300)는 메타 문장 생성부(100)에 의해 제공된 메타 문장이 생성된 문서(50)를 이용하여 기계독해 즉, 문서를 읽고 이해한 후 질문에 대한 정답을 찾아내서 제공하게 된다. 이러한 MRC 처리부(300)는 공지의 MRC 모델이 사용될 수 있으며, 예를 들어 BiDaF, Document-QA, ReasoNet, R-NET, SynNet, OpenNMT 등과 같이 다양한 모델이 적용될 수 있다.The MRC processing unit 300 reads the machine using the document 50 in which the meta sentence generated by the meta sentence generation unit 100 is generated, reads and comprehends the document, and finds and provides an answer to the question. A known MRC model can be used as the MRC processing unit 300. Various models such as BiDaF, Document-QA, ReasoNet, R-NET, SynNet, and OpenNMT can be applied.

이하 도 3 내지 도 7을 참조하여, 본 발명의 실시예에 따른 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치의 동작에 대해 상세히 설명하기로 한다.3 to 7, the operation of the apparatus for generating meta sentences in tables and images will be described in detail in order to improve the machine reading performance according to the embodiment of the present invention.

먼저 표에 메타 문장을 생성하는 동작에 대해 설명하기로 한다.First, the operation of generating the meta sentence in the table will be described.

도 4과 같은 3*3 크기의 표 및 도 5와 같은 4*4 크기의 표가 원본 문서(10)에 존재할 경우, 메타 문장 생성부(100)의 표 메타 문장 생성부(120)는 표 메타 문장 데이터 셋(220)을 이용하여(기반으로 하여) 행과 열에 대한 메타(meta) 문장을 자동으로 생성한다. 메타 문장은 일반적인 문장일 수 있고 또는 특정 패턴 형태일 수 있다. 4, the table meta-sentence generation unit 120 of the meta-sentence generation unit 100 generates a table meta sentence having the size of 3 * And automatically generates meta statements for the rows and columns (using the sentence data set 220). Meta sentences can be general sentences or they can be in the form of specific patterns.

도 4 및 도 5는 가장 일반적이고 전형적인 표의 형태(즉, 각 행과 열이 하나의 셀로만 이루어진 경우)인데, 도 4과 5는 하나의 패턴으로 구분될 수 있으며, 이 패턴에 대응되는 패턴이 도 3의 패턴으로 가정한다. 즉, 도 3의 표 패턴이 표 패턴 템플릿(222)에 저장되는데, 이 패턴은 표 패턴 템플릿(222)에 저장되는 수십 내지 수천 가지 패턴 중 하나의 패턴이 될 수 있다.FIGS. 4 and 5 show the most typical and typical table form (i.e., each row and column are composed of only one cell). FIGS. 4 and 5 can be divided into a single pattern, Assume the pattern of FIG. That is, the table pattern of FIG. 3 is stored in the table pattern template 222, which may be one of dozens to thousands of patterns stored in the table pattern template 222.

보통 첫 번째 행(맨 상단 행)과 첫 번째 열(맨 좌측 열)의 셀에 기재된 내용은 표의 분류, 종류 등의 항목 표시이고, 나머지 행과 열의 셀에 기재된 내용은 각 항복의 구체적 내용을 표시한다. Normally, the contents in the cells in the first row (top row) and the first column (left column) are item displays such as table classification and type, and the contents in the cells in the remaining rows and columns indicate the contents of each yield do.

한편, 표 메타 문장 데이터 셋(220)에는 이러한 표 패턴에 대응되는 예시 문장으로 변환된 예시 데이터 문장이 저장된다.On the other hand, the table meta-sentence data set 220 stores the example data sentences converted into the example sentences corresponding to the table patterns.

예를 들어, 도 3의 표 패턴에 대한 행에 대한 예시 문장은 ‘[Header 1](인) [a]는(또는 은) [Header 2]가(또는 이) [a1](이)고, [Header 3]가(또는 이) [a2](이)다.’와, ‘[Header 1](인) [b]는(또는 은) [Header 2]가(또는 이) [b1](이)고, [Header 3]가 [b2](이)다.’일 수 있다, 또한, 도 3의 표 패턴에 대한 열에 대한 예시 문장은 ‘[Headr 1]는(또는 은) [a]과(또는 와), [b](이)다.’ 와, ‘[Headr 2]는(또는 은) [a1]과(또는 와), [b1](이)다.’와, ‘[Headr 3]는(또는 은) [a2]과(또는 와), [b2](이)다.’일 수 있다. For example, the example sentence for a row of the table pattern of FIG. 3 is '[Header 1]' [a] is [or Header 2] [Header 3] is (or is) [a2], and [Header 1] [b] is [or Header 2] ), And [Header 3] is [b2], and the example sentence for the column of the table pattern of FIG. 3 is' [Headr 1] And [Header 2] are [a1] and [or b1], and [Headr 3] and [Header 2] Can be [a2] and (or), [b2] (or).

보통 첫 번째 열의 셀에 기재된 내용은 주어가 되는 경우가 많으므로 ‘은, 는, 이, 가’와 같은 주어 조사를 붙이고, 마지막 열의 셀에 기재된 내용은 서술어가 되는 경우가 많으므로 ‘~다, ~이다’와 같은 조사를 붙여 예시 문장을 생성한다. 그리고 중간 열의 셀에 기재된 내용은 각 셀의 내용을 분석하여 그 형태에 맞는 조사 예를 들어 ‘~(이)고, ~와(또는 과), ~에서, ~로부터, ~부터’등을 붙이게 된다.Usually, the contents written in the cells in the first column are often given as subjects. Therefore, it is often the case that the contents written in the cells in the last column are often used as descriptive words, such as',,,, To create an example sentence with an investigation such as 'is'. The contents in the cells in the middle column are analyzed to analyze the contents of each cell, and then, for example, "~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~" .

본 발명의 바람직한 실시예에 의하면 표 패턴 템플릿(222)에 저장되는 각 패턴에는 맨 윗 행을 제외한 행의 개수(도 3의 경우 2개)와 열의 개수(도 3의 경우 3개)를 합친 수만큼의 예시 문장(도 3의 경우 5개)이 최소한 표 메타 문장 데이터 셋(220)에 저장된다. According to the preferred embodiment of the present invention, each pattern stored in the table pattern template 222 includes a sum of the number of rows (two in FIG. 3) and the number of columns (three in FIG. 3) (Five in the case of FIG. 3) are stored in the table meta-sentence data set 220 at least.

다시 도 4 및 도 5를 참조하면, 도 4와 같은 표가 원본 문서(10)에 존재할 경우, 메타 문장 생성부(100)의 표 메타 문장 생성부(120)는 먼저 도 3의 표를 인식하고 이 표의 종류와 형태에 따라 대응되는 표 패턴을 표 패턴 템플릿(220)에서 찾게 된다. 전술한 바와 같이 도 4에 대응되는 표 패턴을 도 3으로 예시하였는데, 표 메타 문장 생성부(120)는 해당 표 패턴에 대응되는 예시 문장을 이용하여 상기 표에 포함되는 정보를 이용하여 메타(meta) 문장을 생성하게 된다. 4 and 5, when the table as shown in FIG. 4 exists in the original document 10, the table meta-sentence generation unit 120 of the meta-sentence generation unit 100 first recognizes the table of FIG. 3 A table pattern corresponding to the type and form of the table is found in the table pattern template 220. [ As described above, the table pattern corresponding to FIG. 4 is illustrated in FIG. 3. The table meta sentence generation unit 120 generates a meta pattern using the information included in the table using the example sentence corresponding to the corresponding table pattern, ) Sentence.

전술한 바와 같이 도 3의 패턴에 대한 각 행의 예시 문장은 ‘[Header 1](인) [a]는(또는 은) [Header 2]가(또는 이) [a1](이)고, [Header 3]가 [a2](이)다.’와, ‘[Header 1]인 [b]는(또는 은) [Header 2]가 [b1](이)고, [Header 3]가 [b2](이)다.’이므로, 이를 이용하여 도 4의 표의 행에 대한 메타 문장은 ‘상품명(인) A는 월정액이 A1이고, 데이터는 A2이다.’, ‘상품명(인) B는 월정액이 B1이고, B의 데이터는 B2 이다.’등으로 생성될 수 있다.As described above, the example sentence of each line for the pattern of FIG. 3 is '[Header 1]' [a] is [or Header 2] Header 2] is [b1], [Header 3] is [a2], and [Header 1] is [b2] 4, the meta-sentence for the row of the table in Fig. 4 is as follows: "Product name (person) A has a monthly salary of A1, data of A2", " And the data of B is B2. &Quot;

또한, 도 3의 패턴에 대한 각 열의 예시 문장은‘[Headr 1]는(또는 은) [a]과(또는 와), [b](이)다.’ 와, ‘[Headr 2]는(또는 은) [a1]과(또는 와), [b1](이)다.’와, ‘[Headr 3]는(또는 은) [a2]과(또는 와), [b2](이)다.’이므로, 이를 이용하여 도 4의 표의 열에 대한 메타 문장은 ‘상품명은 A와, B이다.’, ‘월정액은 A1과 B1이다.’, ‘ 데이터는 A2, B2이다.’등으로 생성될 수 있다.In addition, the example sentence of each column for the pattern of FIG. 3 is '[Headr 1]' (or silver) [a] and (or), [b] Or [a1], [b1], and [Headr 3] are [a2] and [or] and [b2], respectively. , The meta sentence for the column of the table in FIG. 4 can be generated as 'Product Name is A and B,' 'Monthly Amount is A1 and B1', 'Data is A2 and B2', etc. have.

한편, 이러한 기본적인 메타 문장 이외에 사용자가 자주 물을 것 같은 질문에 대한 메타 문장을 아래와 같이 생성할 수 있다. 예를 들어, ‘월정액이 A1인 상품명은 A이다.’, ‘데이터가 A2인 상품명은 A이다.’등을 생성할 수 있다. 또한, ‘월정액이 X 이상이며 데이터가 Y 이하인 상품은 A이다.’와 같이 복잡한 조건이 들어간 문장도 생성할 수 있다. 물론, 이러한 복잡한 조건이 들어간 메타 문장을 생성하기 위해서는 표 메타 문장 데이터 셋(220)에 어느 정도 비슷한 예시 문장 데이터가 저장되어 있어야 하지만, 기본적으로 표 메타 문장 생성부(120)는 표 메타 문장 데이터 셋(220)을 이용하여, 표를 포함하는 원본 문서(10)로부터 상기 표에 포함되는 정보를 메타(meta) 문장으로 생성할 수 있다. On the other hand, in addition to these basic meta sentences, a meta sentence for a question that a user may frequently ask may be generated as follows. For example, a product name having a monthly salary of A is A, a product name of A2 is A, and so on. Also, it is possible to generate a sentence having a complex condition such as 'a product whose monthly amount is X or more and data is Y or less is A'. Of course, in order to generate a meta sentence containing such a complicated condition, it is necessary to store some similar sentence data in the table meta sentence data set 220. However, basically, the table meta sentence generation unit 120 generates a meta sentence data set The information included in the table can be generated as a meta sentence from the original document 10 including the table by using the table 220.

마찬가지로 도 5와 같은 4*4 크기의 표가 원본 문서(10)에 존재할 경우, 이러한 표는 도 4의 표 종류와 같은 패턴으로 인식될 수 있으므로 표 패턴 템플릿(222)에 저장된 도 3의 표 패턴을 찾고, 해당 패턴에 대응되는 예시 문장 데이터를 이용하여 메타 문장을 생성하게 된다. 예를 들어 두 번째 행에 대한 메타 문장은 ‘화산이름(이) Mt.Lassen은 위치가 California이고, 가장최근의 분출이 1914-17이고, 분출종류가 Explosive Eruption이다’로 생성될 수 있다. Similarly, when a 4 * 4 size table as shown in FIG. 5 exists in the original document 10, such a table can be recognized as a pattern similar to the table type of FIG. 4, And generates a meta sentence using the example sentence data corresponding to the pattern. For example, the meta-sentence for the second row can be generated as 'volcano name Mt.Lassen is California, most recent eruption is 1914-17, and eruption type is explosive eruption'.

한편, 도 6a 및 도 6b를 참조하면, 이러한 표는 앞선 표들과 다른 종류의 패턴을 갖는 것인데, 예를 들어 도 5a와 같이 병합된 셀이 있는 표인 경우에는 도 5b와 같이 모든 병합된 셀을 찾아, 병합을 해제한 후 각 행 또는 열을 각각 모두 문장화시킨다.  Referring to FIGS. 6A and 6B, the table has patterns different from those of the preceding tables. For example, in the case of a table having merged cells as shown in FIG. 5A, all the merged cells are found , And after the merging is canceled, each row or column is made into a sentence.

따라서 이러한 표 패턴이 표 패턴 텔플릿(222)에 저장되고, 표 메타 문장 데이터 셋(220)에는 이에 대응되는 예시 문장이 저장되는데, 예를 들어 2번째 행에 대한 예시 문장은‘[Header 1]이(또는 가) [첫번째 셀내용]은 [Header 2]이(또는 가) [두번째 셀내용]이고, [Header 3]이(또는 가) [세번째 셀내용]이다’와 같은 방식의 예시 문장이 저장된다. 그리고 표 메타 문장 생성부(120)는 상기 예시 문장 데이터를 이용하여 메타 문장을 생성시키는데, 예를 들어 ‘분류가 과일은 항목이 사과이고 색이 빨강이다’와 같은 방식으로 메타 문장을 생성시킬 수 있다. Accordingly, the table pattern is stored in the table pattern teletext 222, and the corresponding sentence is stored in the table meta data set 220. For example, the example sentence for the second row is' [Header 1] This (or a) [first cell content] is an example sentence such that [Header 2] is (or a) [second cell content], and [Header 3] is (or a) [third cell content] . Then, the table meta sentence generation unit 120 generates a meta sentence using the example sentence data. For example, the meta sentence can be generated in such a manner that 'the category is apple and the color is red' have.

원본 문서의 종류는 예를 들어 인터넷 표준문서(HTML), MS OFFICE 파일 등 여러 종류가 있을 수 있는데, 표 메타 문장 생성부(120)는 이러한 표를 인식하고, 표를 이루는 행, 열, 셀 및 셀 내부에 있는 내용을 인식할 수 있다.The table meta-sentence generation unit 120 recognizes such a table, and generates a list of the rows, columns, cells, and the like that form the table. The contents inside the cell can be recognized.

다음으로 그림에 메타 문장을 생성하는 동작에 대해 설명하기로 한다.Next, the operation of generating the meta sentence in the figure will be described.

먼저 사진에 대한 메타 문장은 이미지 캡셔닝 엔진(250)을 이용하여 자동으로 생성한다. 그리고 메타 문장 생성부(100)의 이미지 메타 문장 생성부(140)는 이미지 메타 문장 데이터 셋(220) 및 이미지 캡셔닝 엔진(250)에 의해 생성된 메타 문장을 이용하여(기반으로 하여) 사진에 대한 메타(meta) 문장을 생성한다.First, the meta sentence about the photograph is automatically generated using the image capturing engine 250. The image meta sentence generation unit 140 of the meta sentence generation unit 100 generates a meta sentence using the meta sentence generated by the image meta sentence data set 220 and the image captioning engine 250 Generate a meta sentence.

예를 들어, 도 7과 같은 이미지에 대해 이미지 캡셔닝 엔진(250)은‘두 사람이 악수를 하고 있다’라는 문장을 생성시키며, 이미지 메타 문장 생성부(140)은 ‘문재인 대통령과 시진핑 중국 주석이 악수를 하고 있다’와 같은 메타 문장을 생성시킬 수 있다. 물론, 이러한 복잡한 조건이 들어간 메타 문장을 생성하기 위해서는 이미지 메타 문장 데이터 셋(240)에 어느 정도 비슷한 예시 문장이 저장되어 있어야 하지만, 기본적으로 이미지 메타 문장 생성부(140)는 이미지 메타 문장 데이터 셋(240)을 이용하여, 이미지를 포함하는 원본 문서(10)로부터 상기 표나 이미지에 포함되는 정보를 메타(meta) 문장으로 생성할 수 있다. For example, the image captioning engine 250 generates a sentence 'Two people are shaking hands' for the image shown in FIG. 7, and the image meta sentence generating unit 140 generates' This handshake is being done. ' Of course, in order to generate meta sentences including such a complex condition, an example sentence similar to a certain degree should be stored in the image meta sentence data set 240. Basically, the image meta sentence generation unit 140 generates an image meta sentence data set 240), information included in the table or image can be generated as a meta sentence from the original document 10 including the image.

여기서 이미지는 도 7과 같은 사진을 포함할 뿐 아니라, 그래프나 이미지 형태의 표를 포함하는 것으로 해석될 수 있다. Here, the image includes not only the photograph as shown in FIG. 7 but also a graph or an image.

한편, 원본 문서(10)에는 표의 셀 내부에 이미지가 들어갈 수 있는데, 표·이미지 메타 생성부(160)는 표 메타 문장 데이터 셋(220), 이미지 메타 문장 데이터 셋(240), 이미지 캡셔닝 엔진(250)을 이용하여 메타 문장을 생성할 수 있다.The table / image meta generator 160 includes a table meta sentence data set 220, an image meta sentence data set 240, an image captioning engine 210, The meta sentence can be generated by using the meta sentence.

그리고 메타 문장 생성부(100)에 의해 생성된 각종 메타 문장은 다시 메타 문장 데이터 셋(200)에 저장될 수 있어, 데이터 셋의 데이터 확보가 커질 수 있게 된다. In addition, various meta sentences generated by the meta sentence generation unit 100 can be stored in the meta sentence data set 200, so that the data of the data set can be secured.

이와 같이 메타 문장 생성부(100)에 의해 원본 문서의 표나 이미지에는 메타 문장이 생성되어 부착되고, 이 메타 문장이 생성된 문서(20)는 MRC 처리부(300)에 제공된다. MRC 처리부(300)는 이 메타 문장이 생성된 문서(20)를 이용하여 표나 그림이 나타내는 정보에 대해 질의 응답이 가능할 수 있다.In this way, a meta sentence is generated and attached to a table or an image of an original document by the meta sentence generation unit 100, and the document 20 in which the meta sentence is generated is provided to the MRC processing unit 300. The MRC processing unit 300 may be able to perform a query response to information represented by a table or figure using the document 20 in which the meta sentence is generated.

이와 같이, 본 발명에 의하면 표나 이미지에 메타 문장을 생성하여 MRC 처리부에 제공함으로써 즉, 표나 이미지를 MRC 처리부가 인식가능 하도록 문맥이 있는 문장을 생성하여 제공함으로써, 공지의 MRC 시스템(엔진 또는 모델)을 수정하지 않고 그대로 이용하면서 표나 이미지에 대한 정보에 대해 질의 응답이 가능하므로, 결국 MCR 성능향상이 획기적으로 좋아지는 효과가 있다. MCR 성능향상이 획기적으로 좋아짐으로써 종래에 MCR 시스템의 적용분야 한정되는 단점을 극복하고, 문서의 내용을 이해하고 사용자 질의에 답변을 제시해야 하는 모든 영역(예를 들어 검색 엔진 뿐만 아니라, 지능형 약관 심사나 독소 조항 판별, 지능형 챗봇, 책 내용을 기반으로 하는 교육용 로봇 등)에 활용 가능할 수 있다. As described above, according to the present invention, a known MRC system (engine or model) can be provided by generating a meta sentence in a table or an image and providing it to the MRC processing unit by generating a sentence having a context so that the MRC processing unit can recognize the table or image, It is possible to inquire about the information of the table or the image without using the correction, so that the improvement of the MCR performance is remarkably improved. MCR performance improvement has been dramatically improved to overcome the disadvantages of the application fields of the conventional MCR system and to overcome all the areas where the content of the document should be understood and an answer should be provided to the user query (for example, Such as identification of toxin clauses, intelligent chatbots, educational robots based on book content, etc.).

이상에서 본 발명의 바람직한 실시예에 대하여 설명하였으나 본 발명은 상술한 특정의 실시예에 한정되지 아니한다. 즉, 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자라면 첨부된 특허청구범위의 사상 및 범주를 일탈함이 없이 본 발명에 대한 다수의 변경 및 수정이 가능하며, 그러한 모든 적절한 변경 및 수정의 균등물들도 본 발명의 범위에 속하는 것으로 간주되어야 할 것이다.Although the preferred embodiments of the present invention have been described, the present invention is not limited to the specific embodiments described above. It will be apparent to those skilled in the art that numerous modifications and variations can be made in the present invention without departing from the spirit or scope of the appended claims. And equivalents should also be considered to be within the scope of the present invention.

10. 원본 문서 20. 메타 문장이 생성된 문서
100. 메타 문장 생성부 120. 표 메타 문장 생성부
140. 이미지 메타 문장 생성부 200. 메타 문장 데이터 셋
220. 표 메타 문장 데이터 셋 222. 표 패턴 템플릿
240. 이미지 메타 문장 데이터 셋 300. MRC 처리부
10. Original document 20. Meta sentence generated document
100. Meta sentence generation unit 120. Table meta sentence generation unit
140. An image meta sentence generation unit 200. A meta sentence data set
220. Table meta-sentence data set 222. Table pattern template
Image meta-sentence data set 300. MRC processing unit

Claims (6)

표에 포함되는 정보를 메타(meta) 문장으로 변환된 예시 문장 데이터가 저장되는 메타 문장 데이터 셋(data set)(200): 및,
상기 메타 문장 데이터 셋(200)에 저장된 예시 문장 데이터를 이용하여, 표를 포함하는 원본 문서로부터 상기 표에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착한 후, 메타 문장이 생성된 문서를 기계독해(MRC:Machine Reading Comprehension)를 수행하는 MRC 처리부(300)로 제공하는 메타 문장 생성부(100);
를 포함하고,
상기 메타 문장 데이터 셋(200)은 표에 포함되는 정보를 예시 문장으로 변환된 예시 데이터가 저장되는 표 메타 문장 데이터 셋(220)을 포함하고,
상기 메타 문장 생성부(100)는 상기 표 메타 문장 데이터 셋(220)의 예시 문장 데이터을 이용하여, 표를 포함하는 원본 문서로부터 상기 표에 포함되는 정보를 메타(meta) 문장으로 생성하는 표 메타 문장 생성부(120)를 포함하며,
상기 표 메타 문장 생성부(120)는 표의 각 열에 대한 메타 문장과 각 행에 대한 메타 문장 중 적어도 하나를 생성하여 원본 문서에 부착하는 것을 특징으로 하는 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치.
A meta-sentence data set 200 in which example sentence data converted into a meta sentence is stored,
Using the example sentence data stored in the meta sentence data set 200, information included in the table is generated as a meta sentence from an original document including the table, attached to the original document, and then a meta sentence is generated To a MRC processing unit (300) for performing a machine reading comprehension (MRC);
Lt; / RTI >
The meta-sentence data set 200 includes a table meta-sentence data set 220 in which example data converted into an example sentence is stored,
The meta-sentence generation unit 100 generates a meta-sentence sentence using meta sentence data of the meta-sentence data set 220 to generate information included in the meta- Generating unit 120,
The table meta sentence generation unit 120 generates at least one of a meta sentence for each column of the table and a meta sentence for each row and attaches the meta sentence to each of the original documents. / RTI >
삭제delete 제 1 항에 있어서,
상기 표 메타 문장 데이터 셋(220)은 표의 종류와 형태에 따라 복수의 패턴으로 구분되게 저장되는 표 패턴 템플릿(222)을 포함하고, 상기 표 메타 문장 데이터 셋(220)에는 상기 표 패턴 템플릿(222)의 각 패턴에 대응되는 각 열 또는 각 행에 대한 예시 문장으로 변환된 예시 문장 데이터가 저장되며,
상기 표 메타 문장 생성부(120)는 원본 문서에 포함된 표의 종류와 형태에 따라 상기 표 패턴 템플릿(222)에 저장된 복수의 패턴 중 대응되는 패턴을 찾아, 해당 패턴에 대응되는 각 열 또는 각 행에 대한 예시 문장 데이터를 이용하여 상기 원본 문서의 표에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착하는 것을 특징으로 하는 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치.
The method according to claim 1,
The table meta-sentence data set 220 includes a table pattern template 222 that is stored in a plurality of patterns in accordance with the type and the type of the table, and the table meta-sentence data set 220 includes the table- ), The example sentence data converted into the example sentence for each column or for each row is stored,
The table meta-sentence generation unit 120 finds a corresponding pattern among a plurality of patterns stored in the table pattern template 222 according to the type and the type of the table included in the original document, A meta sentence is created in a table or image in order to improve the machine reading performance by generating the meta information in the original document using the example sentence data for the meta sentence. Device.
제 3 항에 있어서,
상기 표 메타 문장 생성부(120)는 원본 문서에 포함된 표가 상기 표 패턴 템플릿(222)에 저장된 복수의 패턴 중 대응되는 패턴을 찾지 못한 경우 사용자에게 알림 표시하여, 사용자로부터 원본 문서에 포함된 표에 대응되는 새로운 패턴과 그에 대응되는 예시 문장으로 변환된 예시 문장 데이터를 표 메타 문장 데이터 셋(220)에 저장하도록 하고, 상기 표 메타 문장 생성부(120)는 상기 새로운 패턴 및 그에 대응되는 예시 문장 데이터를 이용하여 상기 원본 문서의 표에 포함되는 정보를 메타(meta) 문장으로 생성하여 원본 문서에 부착하는 것을 특징으로 하는 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치.
The method of claim 3,
If the table included in the original document does not find a corresponding pattern among a plurality of patterns stored in the table pattern template 222, the table meta-sentence generation unit 120 notifies the user of the pattern, And stores the new pattern corresponding to the table and the example sentence data converted into the corresponding example sentence into the table meta sentence data set 220. The table meta sentence generation unit 120 generates the new pattern and the corresponding example And the information included in the table of the original document is generated as a meta sentence using the sentence data and attached to the original document. The apparatus for generating a meta sentence in a table / image for improving the machine reading performance.
제 1 항에 있어서,
상기 메타 문장 데이터 셋(200)은 이미지에 포함되는 정보를 예시 문장으로 변환된 예시 문장 데이터가 저장되는 이미지 메타 문장 데이터 셋(240)을 더 포함하고,
상기 메타 문장 생성부(100)는 상기 이미지 메타 문장 데이터 셋(240) 및 이미지에 대한 메타 문장을 자동으로 생성하는 이미지 캡셔닝 엔진(image captioning engine)(250)을 이용하여, 이미지를 포함하는 원본 문서로부터 상기 이미지에 포함되는 정보를 메타(meta) 문장으로 생성하는 이미지 메타 문장 생성부(140)를 더 포함하는 것을 특징으로 하는 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치.
The method according to claim 1,
The meta-sentence data set 200 further includes an image meta-sentence data set 240 in which example sentence data converted into an example sentence is stored,
The meta sentence generator 100 generates a meta sentence using the image meta sentence data set 240 and an image captioning engine 250 that automatically generates a meta sentence for the image, Further comprising an image meta sentence generation unit (140) for generating information included in the image from a document as a meta sentence, wherein the image meta sentence generation unit (140) generates the meta sentence in the table / image.
제 5 항에 있어서,
상기 메타 문장 생성부(100)는 상기 표 메타 문장 데이터 셋(220)과 이미지 메타 문장 데이터 셋(240)을 이용하여, 상기 표에 이미지를 포함하는 원본 문서로부터 상기 표 및 이미지에 포함되는 정보를 메타(meta) 문장으로 생성하는 표·이미지 메타 문장 생성부(160)를 더 포함하는 것을 특징으로 하는 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치.
6. The method of claim 5,
The meta sentence generation unit 100 generates the meta sentence data set 220 and the image meta sentence data set 240 using the table meta sentence data set 220 and the image meta sentence data set 240, And a table / image meta sentence generation unit (160) for generating a meta sentence in a meta (meta) sentence.
KR1020190014828A 2019-02-08 2019-02-08 Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance KR101986345B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190014828A KR101986345B1 (en) 2019-02-08 2019-02-08 Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190014828A KR101986345B1 (en) 2019-02-08 2019-02-08 Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance

Publications (1)

Publication Number Publication Date
KR101986345B1 true KR101986345B1 (en) 2019-06-10

Family

ID=66848034

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190014828A KR101986345B1 (en) 2019-02-08 2019-02-08 Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance

Country Status (1)

Country Link
KR (1) KR101986345B1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633472A (en) * 2019-09-19 2019-12-31 电子科技大学 Article and question fusion method based on attention and aggregation mechanism
KR20210076871A (en) 2019-12-16 2021-06-24 부산대학교 산학협력단 System and Method for Machine Reading Comprehension to Table-centered Web Documents
WO2021235815A1 (en) * 2020-05-18 2021-11-25 주식회사 딥하이 Method for extracting user profile from unstructured data, and system therefor
KR20220064595A (en) * 2020-11-12 2022-05-19 (주)아이브릭스 The method of developing multi-choice question answering system capable of learning and reasoning by ai machine for non text question-answering
KR20220074695A (en) 2020-11-27 2022-06-03 부산대학교 산학협력단 System and Method for Table Specialized Machine Reading Comprehension using Structured and Unstructured and Semi-Structured Information
KR20230075322A (en) 2021-11-22 2023-05-31 부산대학교 산학협력단 System and Method for Realtime Table Question Answering for Long Sequence

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050086478A (en) * 2002-12-10 2005-08-30 인터내셔널 비지네스 머신즈 코포레이션 Multimodal speech-to-speech language translation and display
KR20080072648A (en) * 2005-10-10 2008-08-06 야후! 인크. A data container and set of metadata for association with a media item and composite media items
KR20110024074A (en) * 2009-09-01 2011-03-09 한국전자통신연구원 Database regularity apparatus and its method, it used speech understanding apparatus and its method
KR20130065866A (en) * 2011-12-06 2013-06-20 전중철 System for publishing records and publishing method using the same
KR20140114496A (en) * 2013-03-14 2014-09-29 한국과학기술원 Method and system for providing summery of text document using word cloud

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050086478A (en) * 2002-12-10 2005-08-30 인터내셔널 비지네스 머신즈 코포레이션 Multimodal speech-to-speech language translation and display
KR20080072648A (en) * 2005-10-10 2008-08-06 야후! 인크. A data container and set of metadata for association with a media item and composite media items
KR20110024074A (en) * 2009-09-01 2011-03-09 한국전자통신연구원 Database regularity apparatus and its method, it used speech understanding apparatus and its method
KR20130065866A (en) * 2011-12-06 2013-06-20 전중철 System for publishing records and publishing method using the same
KR20140114496A (en) * 2013-03-14 2014-09-29 한국과학기술원 Method and system for providing summery of text document using word cloud

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
박천음 외, S2-Net: SRU 기반 Self-matching Network를 이용한 한국어 기계 독해, 제29회 한글 및 한국어 정보처리 학술대회 논문집 pp.35-40, (2017.) 1부.* *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633472A (en) * 2019-09-19 2019-12-31 电子科技大学 Article and question fusion method based on attention and aggregation mechanism
CN110633472B (en) * 2019-09-19 2021-03-12 电子科技大学 Article and question fusion method based on attention and aggregation mechanism
KR20210076871A (en) 2019-12-16 2021-06-24 부산대학교 산학협력단 System and Method for Machine Reading Comprehension to Table-centered Web Documents
WO2021235815A1 (en) * 2020-05-18 2021-11-25 주식회사 딥하이 Method for extracting user profile from unstructured data, and system therefor
KR20210143120A (en) * 2020-05-18 2021-11-26 주식회사 딥하이 Method and System for extractinging user profile from unformal contents
KR20220026551A (en) * 2020-05-18 2022-03-04 주식회사 딥하이 Method and System for hybrid user profile extraction
KR102426236B1 (en) * 2020-05-18 2022-08-02 주식회사 딥하이 Method and System for hybrid user profile extraction
KR102629876B1 (en) * 2020-05-18 2024-01-30 주식회사 딥하이 Method and System for extractinging user profile from unformal contents
KR20220064595A (en) * 2020-11-12 2022-05-19 (주)아이브릭스 The method of developing multi-choice question answering system capable of learning and reasoning by ai machine for non text question-answering
KR102449567B1 (en) 2020-11-12 2022-09-30 (주)아이브릭스 The method of developing multi-choice question answering system capable of learning and reasoning by ai machine for non text question-answering
KR20220074695A (en) 2020-11-27 2022-06-03 부산대학교 산학협력단 System and Method for Table Specialized Machine Reading Comprehension using Structured and Unstructured and Semi-Structured Information
KR20230075322A (en) 2021-11-22 2023-05-31 부산대학교 산학협력단 System and Method for Realtime Table Question Answering for Long Sequence

Similar Documents

Publication Publication Date Title
KR101986345B1 (en) Apparatus for generating meta sentences in a tables or images to improve Machine Reading Comprehension perfomance
Choi et al. Visualizing for the non‐visual: Enabling the visually impaired to use visualization
Ye et al. Recognizing american sign language gestures from within continuous videos
WO2018207723A1 (en) Abstract generation device, abstract generation method, and computer program
AU2021212025B2 (en) Intelligent question answering on tabular content
CN109389061A (en) Paper recognition methods and system
US20060177808A1 (en) Apparatus for ability evaluation, method of evaluating ability, and computer program product for ability evaluation
CN111538894A (en) Query feedback method and device, computer equipment and storage medium
JPH02297188A (en) Document preparation supporting device
CN109740159B (en) Processing method and device for named entity recognition
CN113886567A (en) Teaching method and system based on knowledge graph
CN104881428B (en) A kind of hum pattern extraction, search method and the device of hum pattern webpage
CN113486189A (en) Open knowledge graph mining method and system
CN106709055A (en) Method and device for processing picture test questions
JP7082333B2 (en) Question automatic generation program and question automatic generation device
CN104408403B (en) A kind of referee method that secondary typing is inconsistent and device
Davis How many glyphs and how many scribes? Digital paleography and the Voynich Manuscript
Upadhyay Comparing non-visual and visual information foraging on the web
Oyama et al. Visual clarity analysis and improvement support for presentation slides
CN111914801A (en) Classroom analysis method for intelligent education
CN110390032A (en) Method and system are read and made comments in a kind of hand-written composition
CN112347742B (en) Method for generating document image set based on deep learning
KR102569381B1 (en) System and Method for Machine Reading Comprehension to Table-centered Web Documents
CN116306506A (en) Intelligent mail template method based on content identification
CN114331932A (en) Target image generation method and device, computing equipment and computer storage medium

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant