KR20160049210A - Apparatus and method for question-answering using user interest information based on keyword input - Google Patents

Apparatus and method for question-answering using user interest information based on keyword input Download PDF

Info

Publication number
KR20160049210A
KR20160049210A KR1020140145683A KR20140145683A KR20160049210A KR 20160049210 A KR20160049210 A KR 20160049210A KR 1020140145683 A KR1020140145683 A KR 1020140145683A KR 20140145683 A KR20140145683 A KR 20140145683A KR 20160049210 A KR20160049210 A KR 20160049210A
Authority
KR
South Korea
Prior art keywords
keyword
matching
triple
natural language
database
Prior art date
Application number
KR1020140145683A
Other languages
Korean (ko)
Other versions
KR101662399B1 (en
Inventor
이근배
한상도
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020140145683A priority Critical patent/KR101662399B1/en
Publication of KR20160049210A publication Critical patent/KR20160049210A/en
Application granted granted Critical
Publication of KR101662399B1 publication Critical patent/KR101662399B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Disclosed are an apparatus and a method for question-answering using user interest information based on keyword input. The apparatus includes: a keyword matching module for matching a keyword query input of a user with an entity and a property of a database; a query generator for generating a query for extracting appropriate data to be outputted to the user based on the matched entity and property; a triple extractor for extracting an appropriate triple from a knowledge-based database by using the generated query; and an answer generator for outputting the extracted triple into a natural language by using resources for generating the natural language. Accordingly, related information is extracted and outputted in a form of the natural language when the user inputs a keyword, so that information requested by the user is obtained simply, comprehensively and readably.

Description

키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법{APPARATUS AND METHOD FOR QUESTION-ANSWERING USING USER INTEREST INFORMATION BASED ON KEYWORD INPUT}BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to a query response apparatus and method using user interest information based on keyword input,

본 발명은 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법에 관한 것으로, 더욱 상세하게는 사용자가 키워드를 입력하면 관심정보를 출력하는 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and a method for responding to a query using user interest information based on keyword input, and more particularly, to a query response apparatus and method using user interest information based on keyword input for outputting interest information when a user inputs a keyword .

최근에 웹 사이트 상에서 무수히 많은 웹 문서 정보를 처리하여 사용자의 요구에 해당하는 것만을 추출하여 사용자에게 제공하는 정보 검색 시스템이 널리 이용되고 있다. 그러나, 일반적으로 방대한 웹 문서 집합에서 정보 요구자가 원하는 문서를 정확히 추출하고 특정 질의에 대한 응답을 정확히 얻는 것은 매우 어렵다.Recently, an information retrieval system has been widely used in which a large amount of web document information is processed on a web site, and only the information corresponding to a user's request is extracted and provided to a user. In general, however, it is very difficult for an information requester to accurately extract the desired document from a large set of Web documents and accurately obtain a response to a specific query.

따라서, 단어가 매칭된 문서를 찾아주는 기존의 검색 시스템과는 달리 사용자의 의도를 파악하여 적합한 문서와 정답을 추천하는 자연어 질의-응답 검색 시스템이 출현하였다.Therefore, unlike existing search systems that search for documents with matching words, a natural language query - response retrieval system has emerged that grasps user 's intention and recommends appropriate documents and correct answers.

기존의 질의 응답 시스템은 사용자의 질문을 문장으로 입력받아 정확한 질문 의도를 분석하여 사용자에게 해당 정보를 전달하는 역할을 하였다. 그러나 사용자가 특정 키워드에 해당하는 정보를 광범위하게 얻는 것을 원하거나 질문의 의도가 명확치 않은 경우에는 기존 시스템이 한계를 가지고 있었다.The existing question and answer system was used to transmit the information to the user by analyzing the exact question intention by inputting the user 's question as a sentence. However, existing systems have limitations in the case where users want to obtain information corresponding to a specific keyword widely or the intention of the question is not clear.

상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 사용자가 입력한 키워드로부터 관련 데이터를 추출하고 추출된 데이터를 자연어로 만들어 출력하는 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법을 제공하는데 있다.In order to solve the above problems, an object of the present invention is to provide a query response device and method using user interest information based on keyword input, which extracts related data from a keyword input by a user and outputs extracted data as a natural language .

상기 목적을 달성하기 위한 본 발명은, 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭시켜주는 키워드 매칭 모듈; 상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 질의 생성기; 상기 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 트리플 추출기; 및 자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력해주는 응답 생성기를 제공할 수 있다.According to an aspect of the present invention, there is provided a keyword matching module for matching a keyword included in a query input of a user with an entity and a property of a database. A query generator for generating a query that can extract data to be output to a user based on the matched entities and properties; A triple extractor for extracting a triple from a knowledge base database using the generated query; And a response generator for outputting the extracted triple to a natural language using natural language generation resources.

이때, 상기 키워드 매칭 모듈은 상기 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 모듈; 및 상기 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 모듈을 포함할 수 있다.The keyword matching module may include a keyword entity matching module for matching the keyword with an entity of the knowledge base database. And a keyword property matching module that matches the keyword with a meaningful property of the knowledge base database.

한편, 상기 키워드 엔티티 매칭 모듈은 엔티티 사전과 웹에 존재하는 다양한 문장을 포함하며 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 데이터베이스와 연동하여 상기 키워드와 엔티티를 매칭할 수 있다.The keyword entity matching module may include an entity dictionary and various sentences existing on the web, and may match the keyword with an entity in cooperation with a keyword entity matching database that matches the keyword with an entity of the knowledge base database.

한편, 상기 키워드 엔티티 매칭 모듈은 상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련하는 키워드 엔티티 매칭 훈련기를 더 포함할 수 있다.The keyword entity matching module may further include a keyword entity matching trainer for training a keyword entity matching model so as to find an appropriate entity based on a machine learning method, a rule based method, or similarity between words based on the keyword entity matching database .

한편, 상기 키워드 프로퍼티 매칭 모듈은 상기 키워드와 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 데이터베이스와 연동하여 상기 키워드와 프로퍼티를 매칭할 수 있다.Meanwhile, the keyword property matching module may match the keyword with the property by interlocking with the keyword property matching database that matches the keyword with the property.

한편, 상기 키워드 프로퍼티 매칭 모듈은 상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련하는 키워드 프로퍼티 매칭 훈련기를 더 포함할 수 있다.The keyword property matching module may further include a keyword property matching trainer for training a keyword property matching model based on a machine learning basis or a rule based on the triple of the knowledge base database and the natural language database connected thereto.

한편, 상기 트리플 추출기는 인물 정보나 개념에 대한 설명을 포함하고, 상기 트리플 추출기의 질의에 대응한 트리플을 제공하는 지식 기반 데이터베이스와 연동하여 질의에 대응한 트리플을 추출할 수 있다.Meanwhile, the triple extractor may include a description of a person information or a concept, and may extract a triple corresponding to a query in conjunction with a knowledge base database providing a triple corresponding to the query of the triple extractor.

한편, 상기 응답 생성기는 지식 기반 데이터베이스의 트리플, 및 상기와 관련된 자연어 생성 자원 데이터베이스와 연동하여 상기 자연어 생성 자원을 만들 수 있다.Meanwhile, the response generator can create the natural language generating resource in conjunction with the triple of the knowledge base database and the natural language resource database related to the above.

한편, 상기 응답 생성기는 상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 자연어 생성 자원 생성기를 포함할 수 있다.Meanwhile, the response generator may include a natural language generation resource generator for generating the natural language generation resource for converting the extracted triple into a natural language.

한편, 상기 자연어 생성 자원은 상기 추출된 트리플을 프로퍼티에 알맞은 템플릿, 혹은 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다.On the other hand, the natural language generation resource is a resource for generating the extracted triple in a natural language according to a template or word and tense information suitable for a property.

상기 다른 목적을 달성하기 본 발명은, 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭하는 단계; 상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 단계; 상기 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 단계; 및 자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력하는 단계를 제공할 수 있다.According to another aspect of the present invention, there is provided a method for searching a database, the method comprising: matching a keyword included in a query input of a user with an entity and a property of a database; Generating a query that can extract data to be output to a user based on the matched entities and properties; Extracting a triple from a knowledge base database using the generated query; And outputting the extracted triple to the natural language using the natural language generating resource.

이때, 상기 매칭하는 단계은 상기 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 단계; 및 상기 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭하는 단계를 포함할 수 있다.The matching step may include matching the keyword with an entity of a knowledge base database; And matching the keyword with a meaningful property of the knowledge base database.

한편, 상기 엔티티를 매칭하는 단계는 키워드 엔티티 매칭 데이터베이스의 엔티티 사전과 웹에 존재하는 복수의 문장을 기반으로 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 단계를 포함할 수 있다.The step of matching the entity may include matching the keyword with an entity of the knowledge base database based on a plurality of sentences existing on the web and an entity dictionary of the keyword entity matching database.

한편, 상기 엔티티를 매칭하는 단계는 상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련하는 단계를 포함할 수 있다.The step of matching the entities may include training a keyword entity matching model to find an appropriate entity based on the machine learning method, the rule based method, or the similarity between words based on the keyword entity matching database have.

한편, 상기 프로퍼티를 매칭하는 단계는 상기 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스를 기반으로 상기 키워드와 프로퍼티를 매칭하는 단계를 포함할 수 있다.The step of matching the property may include matching the keyword with a property based on a natural language database linked with a triple of the knowledge base database.

한편, 상기 프로퍼티를 매칭하는 단계는 상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련하는 단계를 포함할 수 있다.The step of matching the property may include training a keyword property matching model based on a machine learning basis or a rule based on the triple of the knowledge base database and the natural language database connected thereto.

한편, 상기 트리플을 추출하는 단계는 인물 정보나 개념에 대한 설명을 기반으로 상기 질의에 대응한 트리플을 제공하는 단계를 포함할 수 있다.The step of extracting the triple may include providing a triple corresponding to the query based on the description of the person information or the concept.

한편, 상기 출력하는 단계는 지식 기반 데이터베이스의 트리플, 및 상기와 관련된 자연어 데이터베이스를 기반으로 상기 자연어 생성 자원을 만드는 단계를 포함할 수 있다.Meanwhile, the outputting may include a step of creating the natural language generating resource based on the triple of the knowledge base database and the natural language database related to the triple.

한편, 상기 출력하는 단계는 상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 단계를 포함할 수 있다.The outputting may include generating the natural language generating resource for converting the extracted triple into a natural language.

한편, 상기 자연어 생성 자원은 상기 추출된 트리플을 프로퍼티에 알맞은 템플릿, 또는 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다.On the other hand, the natural language generation resource is a resource for generating the extracted triple as a natural language according to a template or word and tense information suitable for a property.

상기와 같은 본 발명에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법을 이용할 경우에는 사용자가 키워드를 입력하면 관련 정보를 추출하고 이를 자연어 형태로 출력함으로써 사용자가 원하는 정보를 간편하고 포괄적이며 읽기 쉽게 얻을 수 있다.In the case of using the apparatus and method of query response using user interest information based on the keyword input according to the present invention, when a user inputs a keyword, relevant information is extracted and outputted in a natural language form, And is easy to read.

도 1은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치의 구성을 보인 블록도이다.
도 2는 도 1의 키워드 엔티티 매칭 모듈의 동작을 설명하는 예시도이다.
도 3은 도 1의 키워드 프로퍼티 매칭 모듈의 동작을 설명하는 예시도이다.
도 4는 도 1의 질의 생성기의 동작을 설명하는 예시도이다.
도 5는 도 1의 트리플 추출기의 동작을 설명하는 예시도이다.
도 6은 도 1의 응답 생성기의 동작을 설명하는 예시도이다.
도 7은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법의 동작 흐름도이다.
1 is a block diagram illustrating a configuration of a query response apparatus using user interest information based on a keyword according to an embodiment of the present invention.
2 is an exemplary diagram illustrating the operation of the keyword entity matching module of FIG.
3 is an exemplary diagram illustrating the operation of the keyword property matching module of FIG.
4 is an exemplary diagram illustrating the operation of the query generator of FIG.
5 is an exemplary view for explaining the operation of the triple extractor of FIG.
6 is an exemplary diagram illustrating the operation of the response generator of FIG.
7 is a flowchart illustrating a query response method using user interest information based on keyword input according to an exemplary embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail. It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention. Like reference numerals are used for like elements in describing each drawing.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. The terms first, second, A, B, etc. may be used to describe various elements, but the elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component. And / or < / RTI > includes any combination of a plurality of related listed items or any of a plurality of related listed items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the terms "comprises" or "having" and the like are used to specify that there is a feature, a number, a step, an operation, an element, a component or a combination thereof described in the specification, But do not preclude the presence or addition of one or more other features, integers, steps, operations, elements, components, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the contextual meaning of the related art and are to be interpreted as either ideal or overly formal in the sense of the present application Do not.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치는 사용자로부터 키워드를 입력받고 입력된 키워드에 상응하여 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성하고 생성된 질의를 이용하여 적절한 트리플을 추출하고 자연어 생성 자원을 기반으로 추출된 트리플을 자연어로 출력한다. 입력된 키워드에 대응한 자연어를 출력하는 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치의 구성에 대해 실시예를 들어 설명한다.A query response apparatus using user interest information based on keyword input generates a query capable of extracting appropriate data to be output to a user in response to a keyword input from a user, extracts an appropriate triple using the generated query, And output the extracted triples based on natural language generation resources in a natural language. A configuration of a question answering device using user interest information based on a keyword input for outputting a natural language corresponding to an input keyword will be described with reference to an embodiment.

도 1은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치의 구성을 보인 블록도이다.1 is a block diagram illustrating a configuration of a query response apparatus using user interest information based on a keyword according to an embodiment of the present invention.

키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치(100)는 질의 입력에 포함된 키워드를 엔티티와 프로퍼티로 매칭하는 키워드 매칭 모듈(110); 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성하는 질의 생성기(120); 생성된 질의를 이용하여 지식 기반 데이터베이스에서 적절한 트리플을 추출하는 트리플 추출기(130); 자연어 생성 자원을 기반으로 추출된 트리플을 자연어로 출력하는 응답 생성기(140)를 포함한다.A query response apparatus 100 using user interest information based on keyword input includes a keyword matching module 110 for matching a keyword included in a query input with an entity and a property; A query generator 120 for generating a query that can extract appropriate data to be output to a user based on matched entities and properties; A triple extractor 130 for extracting an appropriate triple from the knowledge base database using the generated query; And a response generator 140 for outputting the triple extracted in the natural language based on the natural language generation resource.

질의응답 장치(100)에서 엔티티와 프로퍼티 매칭을 담당하는 키워드 매칭 모듈(110)이 있다. 키워드 매칭 모듈(110)은 사용자가 입력한 키워드를 엔티티와 프로퍼티로 매칭한다.There is a keyword matching module 110 that performs entities and property matching in the Q & A apparatus 100. The keyword matching module 110 matches the keyword inputted by the user with an entity and a property.

키워드 매칭 모듈(110)은 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭시켜준다. 엔티티는 개체명이고, 프로퍼티는 의미상 적절한 속성이다.The keyword matching module 110 matches the keywords included in the user's query input with the entities and properties of the database. An entity is an object name, and a property is a semantically appropriate property.

키워드 매칭 모듈(110)은 사용자가 입력한 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 모듈(111); 및 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 모듈(112)을 포함한다.The keyword matching module 110 includes a keyword entity matching module 111 for matching a keyword inputted by a user with an entity of a knowledge base database; And a keyword property matching module 112 that matches the semantic proper property of the keyword with the knowledge base database.

키워드 엔티티 매칭 모듈(111)은 엔티티 사전과 웹에 존재하는 다양한 문장을 포함하며 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 데이터베이스(113)와 연동하여 키워드와 엔티티를 매칭한다.The keyword entity matching module 111 includes a dictionary of entities and a variety of sentences existing on the web. The keyword entity matching module 111 interlocks with a keyword entity matching database 113 that matches keywords and entities of a knowledge base database to match keywords and entities.

도 2는 도 1의 키워드 엔티티 매칭 모듈의 동작을 설명하는 예시도이다.2 is an exemplary diagram illustrating the operation of the keyword entity matching module of FIG.

예를 들어 사용자가 “오바마” 라는 입력을 하거나 “버락오바마”, “Obama”와 같이 다양한 형태로 하나의 개념을 입력한다고 할 때, 키워드 엔티티 매칭 모듈(111)은 지식기반 데이터베이스에 존재하는 “Barak_Obama”라는 엔티티(개체명)로 변경하는 모듈이다.For example, when a user inputs an " Obama " or a concept in various forms such as " Barack Obama ", " Obama ", the keyword entity matching module 111 searches for " Barak_Obama "(Entity name).

키워드 엔티티 매칭 훈련기(114)는 키워드 엔티티 매칭 데이터베이스(113)를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련한다.The keyword entity matching trainer 114 trains a keyword entity matching model so as to find an appropriate entity based on a machine learning method, a rule based method, or similarity between words based on the keyword entity matching database 113. [

키워드 프로퍼티 매칭 모듈(112)은 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스와 연동하며 키워드와 적절한 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 데이터베이스(115)와 연동하여 키워드와 프로퍼티를 매칭한다.The keyword property matching module 112 interlocks with a natural language database linked with a triple of a knowledge base database and operates in conjunction with a keyword property matching database 115 that matches keywords and appropriate properties to match keywords and properties.

도 3은 도 1의 키워드 프로퍼티 매칭 모듈의 동작을 설명하는 예시도이다.3 is an exemplary diagram illustrating the operation of the keyword property matching module of FIG.

예를 들어, 사용자가 messi, club이라는 키워드 질의를 입력하였을 때, club은 지식 기반 데이터베이스 내에 있는 ‘team’이라는 property와 같은 의미이기 때문에 키워드 프로퍼티 매칭 모듈(112)은‘team’이라는 프로퍼티와 매칭시켜준다. For example, when a user inputs a keyword query such as messi and club, since the club has the same meaning as the property 'team' in the knowledge base database, the keyword property matching module 112 matches the property 'team' give.

키워드 프로퍼티 매칭 훈련기(116)는 지식 기반 데이터베이스의 트리플과 이에 연결된 자연어 데이터베이스(위키피디아)를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련한다.The keyword property matching trainer 116 trains a keyword property matching model based on a machine learning basis or a rule based on a triple of knowledge base databases and a natural language database (Wikipedia) linked thereto.

질의응답 장치(100)에서 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성하는 질의 생성기(120)가 있다. 질의 생성기(120)는 키워드 매칭 모듈(110)에서 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성한다.And a query generator 120 for generating a query based on entities and properties matched in the Q & A apparatus 100. The query generator 120 generates a query based on the matched entities and properties in the keyword matching module 110.

질의 생성기(120)는 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성한다. 질의 생성기(120)는 키워드 셋으로부터 변형된 개체명 셋을 입력으로 받는다.The query generator 120 generates a query that can extract appropriate data to be output to the user based on the matched entities and properties. The query generator 120 receives a set of modified object names from the set of keywords.

도 4는 도 1의 질의 생성기의 동작을 설명하는 예시도이다.4 is an exemplary diagram illustrating the operation of the query generator of FIG.

예를 들어, 키워드 입력이 “Obama, school”이고, 이로부터 키워드 매칭 모듈에서 전달받은 입력 셋이 “Barak_Obama almaMater”이라면, 질의 생성기(120)는 Barak_Obama의 트리플 중 almaMater의 프로퍼티를 가지는 트리플을 추출하는 질의를 생성한다. 만일, 키워드 입력이 “messi, fc barcelona”와 같이 엔티티의 조합이라면 두 엔티티가 함께 존재하는 트리플을 추출하도록 한다. 이와 같이 입력 키워드에 알맞은 질의를 생성한다.For example, if the keyword input is " Obama, school ", and the input set received from the keyword matching module is " Barak_Obama almaMater ", the query generator 120 extracts a triple having a property of almaMater among triples of Barak_Obama Create a query. If the keyword input is a combination of entities such as "messi, fc barcelona", the two entities are extracted together. Thus, a query suitable for the input keyword is generated.

질의응답 장치(100)에서 생성된 질의를 이용하여 적절한 트리플을 추출하는 트리플 추출기(130)가 있다. 트리플 추출기(130)는 질의 생성기(120)에서 생성된 질의를 이용하여 적절한 트리플을 추출한다.And a triple extractor 130 for extracting an appropriate triple using the query generated by the Q & A apparatus 100. The triple extractor 130 extracts an appropriate triple using the query generated by the query generator 120.

트리플 추출기(130)는 생성된 질의를 이용하여 지식 기반 데이터베이스에서 적절한 트리플을 추출한다.The triple extractor 130 extracts the appropriate triple from the knowledge base database using the generated query.

트리플 추출기(130)는 인물 정보나 개념에 대한 설명을 포함하고, 질의 생성기(120)의 질의에 대응한 트리플을 제공하는 지식 기반 데이터베이스(131)와 연동하여 트리플을 추출한다.The triple extractor 130 extracts a triple in association with a knowledge base database 131 that includes a description of the person information or concept and provides a triple corresponding to the query of the query generator 120.

지식 기반 데이터베이스(131)는 인물 정보나 개념에 대한 설명을 포함하는 데이터베이스로, 본 시스템은 해당 데이터베이스로부터 출력할 데이터베이스를 추출한다. 디비피디아와 같은 데이터베이스가 해당 데이터베이스의 예이다.The knowledge base database 131 is a database containing descriptions of person information or concepts, and the system extracts a database to be output from the corresponding database. A database such as dividea is an example of that database.

도 5는 도 1의 트리플 추출기의 동작을 설명하는 예시도이다.5 is an exemplary view for explaining the operation of the triple extractor of FIG.

예를 들면 트리플 추출기(130)에 연동하는 지식 기반 데이터베이스(131)는 “Barak_Obama/almaMater/Harvard_University”와 같이 오바마가 하버드 대학교에서 수학했다는 정보를 가지고 있다. 트리플 추출기(130)는 지식 기반 데이터베이스(131)를 기반으로 오바마 질의에 대응한 “Barak_Obama/almaMater /Harvard_University”트리플을 추출한다.For example, the knowledge base database 131 associated with the triple extractor 130 has information that Obama has studied at Harvard University, such as " Barak_Obama / almaMater / Harvard_University ". The triple extractor 130 extracts the "Barak_Obama / almaMater / Harvard_University" triple corresponding to the Obama query based on the knowledge base database 131.

질의응답 장치(100)에서 자연어 생성 자원을 기반으로 트리플 추출기(130)에서 추출된 트리플을 자연어로 출력하는 응답 생성기(140)가 있다. 응답 생성기(140)는 자연어 생성 자원을 이용하여 트리플 추출기(130)에서 추출된 트리플을 자연어로 출력한다.And a response generator 140 for outputting the triples extracted from the triple extractor 130 to the natural language based on the natural language resource in the Q & A apparatus 100. The response generator 140 outputs the triple extracted by the triple extractor 130 to the natural language using the natural language generating resource.

응답 생성기(140)는 자연어 생성 자원을 기반으로 트리플 추출기(130)에서 추출된 트리플을 자연어로 출력해준다.The response generator 140 outputs the triple extracted from the triple extractor 130 to the natural language based on the natural language generating resource.

응답 생성기(140)는 지식 기반 데이터베이스의 트리플, 그리고 이와 관련된 자연어 데이터베이스와 연동하고, 자연어 생성 자원(141)을 만드는 자연어 생성 자원 데이터베이스(142)와 연동하여 트리플을 자연어로 출력한다. The response generator 140 interlocks with the triple of the knowledge base database and the natural language database related thereto and outputs the triple in a natural language in cooperation with the natural language generation resource database 142 that generates the natural language generation resource 141.

응답 생성기(140)는 추출된 트리플을 자연어로 만들기 위한 자연어 생성 자원(141)을 생성하는 자연어 생성 자원 생성기(143)를 포함한다. 자연어 생성 자원 생성기(143)는 추출한 데이터를 자연어로 만들기 위한 자연어 생성 자원을 생성한다.The response generator 140 includes a natural language generation resource generator 143 for generating a natural language generation resource 141 for converting the extracted triple into a natural language. The natural language generation resource generator 143 generates a natural language generation resource for converting the extracted data into natural language.

도 6은 도 1의 응답 생성기의 동작을 설명하는 예시도이다.6 is an exemplary diagram illustrating the operation of the response generator of FIG.

예를 들어 “Barak_Obama/almaMater/Harvard_University”라는 데이터를 지식 기반 데이터베이스로부터 받으면, 응답 생성기(140)는 이를 문장으로 만들 수 있는 템플릿인 “<subj> graduate <obj>”, 그리고 “past”와 같은 시제 정보 등을 출력한다.For example, when receiving data from &quot; Barak_Obama / almaMater / Harvard_University &quot; from the knowledge base database, the response generator 140 generates a template, &quot; <subj> graduate <obj> Information and the like.

응답 생성기(140)는 “<subj> graduate <obj>”템플릿을 이용하여 "Barak Obama graduated in Harvard University."를 출력할 수 있다.The response generator 140 may output "Barak Obama graduated in Harvard University." Using the template "<subj> graduate <obj>".

자연어 생성 자원(141)은 추출된 트리플을 프로퍼티에 알맞은 템플릿, 혹은 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다. 예를 들면, “Linonel_Messi team FC_Barcelona”라는 트리플을 출력할 때, team이라는 프로퍼티에 해당하는 템플릿인 “<subj> play at <obj>”를 이용하여 자연어를 생성할 수 있으며, 이러한 템플릿이 자연어 생성 자원의 예가 될 수 있다.The natural language generation resource 141 is a resource for generating the extracted triple in a natural language according to a template suitable for the property or word and tense information. For example, when outputting a triple named "Linonel_Messi team FC_Barcelona", a natural language can be created using the template "<subj> play at <obj>" corresponding to the property named team, . &Lt; / RTI &gt;

응답 생성기(140)는 “<subj> play at <obj>”템플릿을 이용하여 "Linonel Messi play at FC Barcelona."를 출력할 수 있다.The response generator 140 may output "Linonel Messi play at FC Barcelona." Using the template "<subj> play at <obj>".

도 7은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법의 동작 흐름도이다.7 is a flowchart illustrating a query response method using user interest information based on keyword input according to an exemplary embodiment of the present invention.

질의응답 장치가 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법(이하, 질의응답 방법으로 표기)을 수행하는 동작을 설명한다.A description will be given of an operation in which a QA device performs a QA method using user interest information based on keyword input (hereinafter referred to as a QA method).

질의응답 방법은 키워드를 엔티티와 프로퍼티로 매칭하는 단계; 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성하는 단계; 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 단계; 자연어 생성 자원을 기반으로 추출된 트리플을 자연어로 출력하는 단계를 포함한다.The query response method comprises: matching a keyword with an entity and a property; Generating a query based on matched entities and properties; Extracting a triple from the knowledge base database using the generated query; And outputting the extracted triple to the natural language based on the natural language generation resource.

질의응답 방법에서 질의응답 장치가 키워드를 엔티티와 프로퍼티로 매칭하는 단계를 수행한다.In the query response method, the query response device performs a step of matching a keyword with an entity and a property.

질의응답 장치는 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭한다.The query response device matches the keywords contained in the user's query input with the entities and properties of the database.

질의응답 장치는 사용자가 입력한 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하고, 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭한다.The query response device matches the keywords entered by the user with the entities of the knowledge base database and matches the semantic proper properties of the keyword and the knowledge base database.

질의응답 장치는 엔티티 사전과 웹에 존재하는 복수의 문장에 기반하여 키워드와 지식 기반 데이터베이스의 엔티티를 매칭한다(210). 예를 들어 사용자가 “오바마”라는 입력을 하거나 “버락오바마”, “Obama”와 같이 다양한 형태로 하나의 개념을 입력한다고 할 때, 질의응답 장치는 지식기반 데이터베이스에 존재하는 “Barak_Obama”라는 엔티티(개체명)로 변경한다.The query response device 210 matches the entities of the knowledge base database with the keywords based on the entity dictionary and a plurality of sentences present on the web. For example, when a user enters "Obama" or a concept in various forms such as "Barack Obama" or "Obama", the QA device will generate an entity called "Barak_Obama" Object name).

질의응답 장치는 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련한다. 키워드 엔티티 매칭 데이터베이스는 키워드에 매칭되는 엔티티를 제공한다. 질의응답 장치는 기계학습 방법, 규칙 기반 방법, 혹은 단어간의 유사도를 이용하여 키워드 엔티티 매칭 모델에서 알맞은 엔티티를 검색할 수 있다.The query response device trains a keyword entity matching model to find an appropriate entity based on a machine learning method, a rule based method, or similarity between words based on a keyword entity matching database. The keyword entity matching database provides entities that match the keywords. The query response device can search for an appropriate entity in a keyword entity matching model using a machine learning method, a rule based method, or similarity between words.

질의응답 장치는 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스에 기반하여 입력된 키워드와 적절한 프로퍼티를 매칭한다(220). 예를 들어, 사용자가 messi, club 이라는 키워드 질의를 입력하였을 때, club은 지식 기반 데이터베이스 내에 있는 ‘team’이라는 property와 같은 의미이기 때문에 질의응답 장치는‘team’이라는 프로퍼티와 매칭시켜준다. 질의응답 장치는 키워드 프로퍼티 매칭 데이터베이스를 기반으로 입력된 키워드와 적절한 프로퍼티를 매칭한다.The query response device 220 matches the input keyword with an appropriate property based on the natural language database linked with the triple of the knowledge base database. For example, when a user enters a keyword query such as messi, club, the query response device matches the property 'team' because club has the same meaning as the 'team' property in the knowledge base database. The query response device matches the input keyword and the appropriate property based on the keyword property matching database.

질의응답 장치는 지식 기반 데이터베이스의 트리플과 이에 연결된 자연어 데이터베이스(위키피디아)를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련한다.The QA device trains a keyword property matching model based on a machine learning basis or rule based on a triple of knowledge base databases and associated natural language databases (Wikipedia).

질의응답 방법에서 질의응답 장치가 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성하는 단계를 수행한다.In the query response method, the query response device performs a step of generating a query based on matched entities and properties.

질의응답 장치는 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성한다(230). 질의응답 장치는 키워드 셋으로부터 변형된 개체명 셋을 입력으로 받는다. 예를 들어, 키워드 입력이 “Obama, school”이고, 이로부터 키워드 매칭 모듈에서 전달받은 입력 셋이 “Barak_Obama almaMater”이라면, 질의응답 장치는 Barak_Obama의 트리플 중 almaMater 의 프로퍼티를 가지는 트리플을 추출하는 질의를 생성한다. 만일, 키워드 입력이 “messi, fc barcelona”와 같이 엔티티의 조합이라면 두 엔티티가 함께 존재하는 트리플을 추출하도록 한다. 이와 같이 질의응답 장치는 입력 키워드에 알맞은 질의를 생성한다.The query response device generates a query (230) that can extract appropriate data to be output to the user based on the matched entities and properties. The query response device receives input of a set of modified object names from a set of keywords. For example, if the keyword input is "Obama, school" and the input set received from the keyword matching module is "Barak_Obama almaMater", then the query response device will query the triple of Barak_Obama triple with the property of almaMater . If the keyword input is a combination of entities such as "messi, fc barcelona", the two entities are extracted together. Thus, the QA device generates a query suitable for the input keyword.

질의응답 방법에서 질의응답 장치가 생성된 질의를 이용하여 적절한 트리플을 추출하는 단계를 수행한다.In the query response method, the query response device performs a step of extracting an appropriate triple using the generated query.

질의응답 장치는 생성된 질의를 이용하여 지식 기반 데이터베이스에서 적절한 트리플을 추출한다(240).The query response device extracts the appropriate triple from the knowledge base database using the generated query (240).

질의응답 장치는 인물 정보나 개념에 대한 설명에 기반하여 질의에 대응한 트리플을 제공한다.The query response device provides a triple corresponding to the query based on the description of the person information or concept.

지식 기반 데이터베이스는 인물 정보나 개념에 대한 설명을 포함하는 데이터베이스로, 질의응답 장치는 해당 데이터베이스로부터 출력할 트리플을 추출한다. 디비피디아와 같은 데이터베이스가 해당 데이터베이스의 예이다. 예를 들면 “Barak_Obama/almaMater/Harvard_University”와 같이 오바마가 하버드 대학교에서 수학했다는 정보를 가지고 있다.A knowledge base database is a database containing descriptions of person information or concepts. The query response device extracts triples to be output from the database. A database such as dividea is an example of that database. For example, "Barak_Obama / almaMater / Harvard_University" has information that Obama has studied at Harvard University.

질의응답 방법에서 질의응답 장치가 추출된 트리플을 자연어로 출력하는 단계를 수행한다.In the query response method, a step of outputting the triple extracted from the query response device to the natural language is performed.

질의응답 장치는 자연어 생성 자원을 이용하여 추출된 트리플을 자연어로 출력해준다(250).The query response device outputs the extracted triple using a natural language resource (250).

질의응답 장치는 지식 기반 데이터베이스의 트리플, 그리고 이와 관련된 자연어 데이터베이스를 포함하고, 자연어 생성 자원을 만드는 자연어 생성 자원 데이터베이스를 포함한다. The query response device includes a triple of knowledge base databases, and a database of natural language related thereto, and a natural language generation resource database for creating natural language generation resources.

질의응답 장치는 추출된 트리플을 자연어로 만들기 위한 자연어 생성 자원을 생성한다. 자연어 생성 자원은 추출된 트리플을 프로퍼티에 알맞은 템플릿, 혹은 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다. 예를 들면, “Linonel_Messi team FC_Barcelona” 라는 트리플을 출력할 때, team이라는 프로퍼티에 해당하는 템플릿인 “<subj> play at <obj>”를 이용하여 자연어를 생성할 수 있으며, 이러한 템플릿이 자연어 생성 자원의 예가 될 수 있다. 질의 응답 장치는 “<subj> play at <obj>”템플릿을 이용하여 "Linonel Messi play at FC Barcelona."를 출력할 수 있다.The QA unit generates a natural language resource to make the extracted triple a natural language. Natural language generation resources are resources for generating extracted triple as a template suitable for a property, or as a natural language based on words and tense information. For example, when outputting a triple named "Linonel_Messi team FC_Barcelona", a natural language can be created using the template "<subj> play at <obj>" corresponding to the property named team, . &Lt; / RTI &gt; The query response device can output "Linonel Messi play at FC Barcelona." Using the template "<subj> play at <obj>".

질의응답 장치는 추출한 트리플을 자연어로 만들기 위한 자연어 생성 자원을 생성하고 자연어 생성 자원을 이용하여 트리플을 자연어로 출력한다. 예를 들어 “Barak_Obama/almaMater/Harvard_University”라는 데이터를 지식 기반 데이터베이스로부터 받으면, 이를 문장으로 만들 수 있는 템플릿인 “<subj> graduate <obj>”, 그리고 “past”와 같은 시제 정보 등을 출력한다. 질의응답 장치는 문장으로 만들 수 있는 템플릿을 이용하여 트리플을 자연어로 만들어 출력한다. 질의응답 장치는 "Barak Obama graduated in Havard University."를 출력할 수 있다.The query response device generates a natural language resource for making the extracted triple as a natural language, and outputs the triple as a natural language using the natural language resource. For example, if you receive the data "Barak_Obama / almaMater / Harvard_University" from the knowledge base database, it outputs the template information such as "<subj> graduate <obj>" and "past" The Q & A device outputs the triple as a natural language using a template that can be made into sentences. The question and answer device can output "Barak Obama graduated in Havard University."

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the present invention as defined by the following claims It can be understood that

100: 키워드 입력 사용자 관심정보 질의응답 장치
110: 키워드 매칭 모듈 120: 질의 생성기
130: 트리플 추출기 140: 응답 생성기
100: Keyword input User interest information query device
110: keyword matching module 120: query generator
130: Triple extractor 140: Response generator

Claims (20)

사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭시켜주는 키워드 매칭 모듈;
상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 질의 생성기;
상기 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 트리플 추출기; 및
자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력해주는 응답 생성기를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
A keyword matching module for matching the keywords included in the user's query input with entities and properties of the database;
A query generator for generating a query that can extract data to be output to a user based on the matched entities and properties;
A triple extractor for extracting a triple from a knowledge base database using the generated query; And
And a response generator for outputting the extracted triple in a natural language using natural language generation resources.
제1항에 있어서,
상기 키워드 매칭 모듈은,
상기 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 모듈; 및
상기 키워드와 지식 기반 데이터베이스의 의미상 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 모듈을 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
The method according to claim 1,
The keyword matching module includes:
A keyword entity matching module for matching the keyword with an entity of a knowledge base database; And
And a keyword property matching module for matching the keyword with a semantic property of the knowledge base database.
제2항에 있어서,
상기 키워드 엔티티 매칭 모듈은,
엔티티 사전과 웹에 존재하는 복수의 문장을 포함하며 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 데이터베이스와 연동하여 상기 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
3. The method of claim 2,
Wherein the keyword entity matching module comprises:
Based user interest that matches an entity of the knowledge base database with an entity dictionary and a plurality of sentences existing on the web and is interlocked with a keyword entity matching database that matches the keyword with an entity of the knowledge base database, Question and answer device using information.
제3항에 있어서,
상기 키워드 엔티티 매칭 모듈은,
상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련하는 키워드 엔티티 매칭 훈련기를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
The method of claim 3,
Wherein the keyword entity matching module comprises:
And a keyword entity matching trainer for training a keyword entity matching model to search for an entity based on a machine learning method, a rule based method, or similarity between words based on the keyword entity matching database. .
제2항에 있어서,
상기 키워드 프로퍼티 매칭 모듈은,
상기 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스와 연동하여 상기 키워드와 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 데이터베이스로부터 상기 키워드와 지식 기반 데이터베이스의 의미상 프로퍼티를 매칭하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
3. The method of claim 2,
Wherein the keyword property matching module comprises:
A query based on keyword input based on user interest information that matches the keyword with a semantic property of the knowledge base database from a keyword property matching database that matches the keyword with a property in cooperation with a natural language database linked with a triple of the knowledge base database Response device.
제5항에 있어서,
상기 키워드 프로퍼티 매칭 모듈은,
상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련하는 키워드 프로퍼티 매칭 훈련기를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
6. The method of claim 5,
Wherein the keyword property matching module comprises:
And a keyword property matching trainer for training a keyword property matching model based on a machine learning basis or a rule based on the triple of the knowledge base database and the natural language database connected thereto, .
제1항에 있어서,
상기 트리플 추출기는,
인물 정보나 개념에 대한 설명을 포함하고, 상기 트리플 추출기의 질의에 대응한 트리플을 제공하는 상기 지식 기반 데이터베이스와 연동하여 트리플을 추출하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
The method according to claim 1,
The triple extractor includes:
A query response apparatus using keyword interest based user interest information, comprising a description of person information or concepts, and extracting a triple in conjunction with the knowledge base database providing a triple corresponding to the query of the triple extractor.
제1항에 있어서,
상기 응답 생성기는,
지식 기반 데이터베이스의 트리플, 및 상기와 관련된 자연어 생성 자원 데이터베이스를 연동하여 상기 추출된 트리플을 자연어로 출력하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
The method according to claim 1,
Wherein the response generator comprises:
A triple of a knowledge base database, and a natural language resource database associated with the keyword, and outputting the extracted triple as a natural language.
제1항에 있어서,
상기 응답 생성기는,
상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 자연어 생성 자원 생성기를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
The method according to claim 1,
Wherein the response generator comprises:
And a natural language generation resource generator for generating the natural language generation resource for converting the extracted triple into a natural language.
제1항에 있어서,
상기 자연어 생성 자원은,
상기 추출된 트리플을 프로퍼티에 알맞은 템플릿, 또는 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원인, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
The method according to claim 1,
The natural language generating resource includes:
Wherein the extracted triple is a template suitable for the property or a resource for generating in natural language according to the word and tense information.
사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭하는 단계;
상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 단계;
상기 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 단계; 및
자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
Matching a keyword included in a user's query input with an entity and a property of the database;
Generating a query that can extract data to be output to a user based on the matched entities and properties;
Extracting a triple from a knowledge base database using the generated query; And
And outputting the extracted triple in a natural language using a natural language generating resource.
제11항에 있어서,
상기 매칭하는 단계은,
상기 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 단계; 및
상기 키워드와 지식 기반 데이터베이스의 의미상 프로퍼티를 매칭하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
12. The method of claim 11,
The matching step comprises:
Matching the keyword with an entity of a knowledge base database; And
And matching the keyword with a semantic property of the knowledge base database.
제12항에 있어서,
상기 엔티티를 매칭하는 단계는,
키워드 엔티티 매칭 데이터베이스의 엔티티 사전과 웹에 존재하는 복수의 문장을 기반으로 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
13. The method of claim 12,
The step of matching the entity comprises:
And matching an entity of the knowledge base database with the keyword based on a plurality of sentences existing in the entity dictionary and the web in the keyword entity matching database.
제13항에 있어서,
상기 엔티티를 매칭하는 단계는,
상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
14. The method of claim 13,
The step of matching the entity comprises:
Training a keyword entity matching model to find entities based on a machine learning method, a rule based method, or similarity between words based on the keyword entity matching database, How to respond.
제12항에 있어서,
상기 프로퍼티를 매칭하는 단계는,
상기 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스를 기반으로 상기 키워드와 프로퍼티를 매칭하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
13. The method of claim 12,
The matching of the properties may comprise:
And matching the keyword with a property based on a natural language database linked with a triple of the knowledge base database.
제15항에 있어서,
상기 프로퍼티를 매칭하는 단계는,
상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
16. The method of claim 15,
The matching of the properties may comprise:
Training a keyword property matching model based on a machine learning basis or a rule based on a triple of the knowledge base database and the natural language database connected to the knowledge base database.
제11항에 있어서,
상기 트리플을 추출하는 단계는,
인물 정보나 개념에 대한 설명을 기반으로 상기 질의에 대응한 트리플을 제공하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
12. The method of claim 11,
Wherein the extracting of the triple comprises:
And providing a triple corresponding to the query based on the description of the person information or the concept.
제11항에 있어서,
상기 출력하는 단계는,
상기 지식 기반 데이터베이스의 트리플, 및 상기와 관련된 자연어 데이터베이스를 기반으로 상기 자연어 생성 자원을 만드는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
12. The method of claim 11,
Wherein the outputting step comprises:
And generating the natural language generation resource based on the triple of the knowledge base database and the natural language database related to the keyword.
제11항에 있어서,
상기 출력하는 단계는,
상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
12. The method of claim 11,
Wherein the outputting step comprises:
And generating the natural language generation resource for converting the extracted triple into a natural language.
제11항에 있어서,
상기 자연어 생성 자원은,
상기 추출된 트리플을 프로퍼티에 알맞은 템플릿, 또는 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원인, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
12. The method of claim 11,
The natural language generating resource includes:
Wherein the extracted triple is a template suitable for the property or a resource for generating in natural language according to the word and the tense information.
KR1020140145683A 2014-10-27 2014-10-27 Apparatus and method for question-answering using user interest information based on keyword input KR101662399B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140145683A KR101662399B1 (en) 2014-10-27 2014-10-27 Apparatus and method for question-answering using user interest information based on keyword input

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140145683A KR101662399B1 (en) 2014-10-27 2014-10-27 Apparatus and method for question-answering using user interest information based on keyword input

Publications (2)

Publication Number Publication Date
KR20160049210A true KR20160049210A (en) 2016-05-09
KR101662399B1 KR101662399B1 (en) 2016-10-04

Family

ID=56020270

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140145683A KR101662399B1 (en) 2014-10-27 2014-10-27 Apparatus and method for question-answering using user interest information based on keyword input

Country Status (1)

Country Link
KR (1) KR101662399B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019164144A1 (en) * 2018-02-22 2019-08-29 삼성전자주식회사 Electronic device and natural language generation method thereof
KR20220010070A (en) * 2017-12-08 2022-01-25 구글 엘엘씨 Graphical user interface rendering management by voice-driven computing infrastructure

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100468514B1 (en) * 2004-07-02 2005-01-31 (주)에이티허브 System of information retrieval using instant messenger
KR20100049353A (en) * 2008-11-03 2010-05-12 한국과학기술원 Real-time semantic annotation device and the method of creating ontology documents on-the-fly from natural language strings entered by user
KR20100066919A (en) * 2008-12-10 2010-06-18 한국전자통신연구원 Triple indexing and searching scheme for efficient information retrieval
KR20120031669A (en) * 2010-09-27 2012-04-04 한국과학기술연구원 Highlight providing system based on hot topic event extraction and highlight service providing method using the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100468514B1 (en) * 2004-07-02 2005-01-31 (주)에이티허브 System of information retrieval using instant messenger
KR20100049353A (en) * 2008-11-03 2010-05-12 한국과학기술원 Real-time semantic annotation device and the method of creating ontology documents on-the-fly from natural language strings entered by user
KR20100066919A (en) * 2008-12-10 2010-06-18 한국전자통신연구원 Triple indexing and searching scheme for efficient information retrieval
KR20120031669A (en) * 2010-09-27 2012-04-04 한국과학기술연구원 Highlight providing system based on hot topic event extraction and highlight service providing method using the same

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220010070A (en) * 2017-12-08 2022-01-25 구글 엘엘씨 Graphical user interface rendering management by voice-driven computing infrastructure
WO2019164144A1 (en) * 2018-02-22 2019-08-29 삼성전자주식회사 Electronic device and natural language generation method thereof
KR20190105175A (en) * 2018-02-22 2019-09-16 삼성전자주식회사 Electronic device and Method for generating Natural Language thereof
US11657237B2 (en) 2018-02-22 2023-05-23 Samsung Electronics Co., Ltd. Electronic device and natural language generation method thereof

Also Published As

Publication number Publication date
KR101662399B1 (en) 2016-10-04

Similar Documents

Publication Publication Date Title
US9558264B2 (en) Identifying and displaying relationships between candidate answers
CN106649786B (en) Answer retrieval method and device based on deep question answering
US9754207B2 (en) Corpus quality analysis
US10720071B2 (en) Dynamic identification and validation of test questions from a corpus
US9621601B2 (en) User collaboration for answer generation in question and answer system
Ferrández et al. The QALL-ME Framework: A specifiable-domain multilingual Question Answering architecture
CN107644062B (en) Knowledge content weight analysis system and method based on knowledge graph
US20090119090A1 (en) Principled Approach to Paraphrasing
CN102955848B (en) A kind of three-dimensional model searching system based on semanteme and method
CN102663129A (en) Medical field deep question and answer method and medical retrieval system
US20220405484A1 (en) Methods for Reinforcement Document Transformer for Multimodal Conversations and Devices Thereof
CN101872349A (en) Method and device for treating natural language problem
Ta'a et al. Al-Quran ontology based on knowledge themes
US9430952B2 (en) Determining comprehensiveness of question paper given syllabus
KR20230005797A (en) Apparatus, method and computer program for processing inquiry
Dhandapani et al. Question answering system over semantic web
Banerjee et al. Dblp-quad: A question answering dataset over the dblp scholarly knowledge graph
KR101662399B1 (en) Apparatus and method for question-answering using user interest information based on keyword input
Bakar The development of an integrated corpus for Malay language
Nguyen et al. A novel approach for automatic extraction of semantic data about football transfer in sport news
Sorrentino et al. Semantic annotation and publication of linked open data
KR101567904B1 (en) System and Method for Retrieving Plain Text Query Based Mathematical Formula
Rao et al. Automatic identification of concepts and conceptual relations from patents using machine learning methods
Furbach et al. Cognitive systems and question answering
Dejica-Cartis et al. USING FRAME ANALYSIS FOR DEVELOPING FOREIGN LANGUAGE COMPETENCE IN ENGINEERING STUDENTS.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant