KR101662399B1 - 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법 - Google Patents

키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법 Download PDF

Info

Publication number
KR101662399B1
KR101662399B1 KR1020140145683A KR20140145683A KR101662399B1 KR 101662399 B1 KR101662399 B1 KR 101662399B1 KR 1020140145683 A KR1020140145683 A KR 1020140145683A KR 20140145683 A KR20140145683 A KR 20140145683A KR 101662399 B1 KR101662399 B1 KR 101662399B1
Authority
KR
South Korea
Prior art keywords
keyword
triple
natural language
matching
database
Prior art date
Application number
KR1020140145683A
Other languages
English (en)
Other versions
KR20160049210A (ko
Inventor
이근배
한상도
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020140145683A priority Critical patent/KR101662399B1/ko
Publication of KR20160049210A publication Critical patent/KR20160049210A/ko
Application granted granted Critical
Publication of KR101662399B1 publication Critical patent/KR101662399B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법이 개시된다. 사용자의 키워드 질의 입력을 데이터베이스의 엔티티와 프로퍼티로 매칭시켜주는 키워드 매칭 모듈; 상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성하는 질의 생성기; 상기 생성된 질의를 이용하여 지식 기반 데이터베이스에서 적절한 트리플을 추출하는 트리플 추출기; 및 자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력해주는 응답 생성기를 구성한다. 따라서, 사용자가 키워드를 입력하면 관련 정보를 추출하고 이를 자연어 형태로 출력함으로써 사용자가 원하는 정보를 간편하고 포괄적이며 읽기 쉽게 얻을 수 있다.

Description

키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법{APPARATUS AND METHOD FOR QUESTION-ANSWERING USING USER INTEREST INFORMATION BASED ON KEYWORD INPUT}
본 발명은 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법에 관한 것으로, 더욱 상세하게는 사용자가 키워드를 입력하면 관심정보를 출력하는 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법에 관한 것이다.
최근에 웹 사이트 상에서 무수히 많은 웹 문서 정보를 처리하여 사용자의 요구에 해당하는 것만을 추출하여 사용자에게 제공하는 정보 검색 시스템이 널리 이용되고 있다. 그러나, 일반적으로 방대한 웹 문서 집합에서 정보 요구자가 원하는 문서를 정확히 추출하고 특정 질의에 대한 응답을 정확히 얻는 것은 매우 어렵다.
따라서, 단어가 매칭된 문서를 찾아주는 기존의 검색 시스템과는 달리 사용자의 의도를 파악하여 적합한 문서와 정답을 추천하는 자연어 질의-응답 검색 시스템이 출현하였다.
기존의 질의 응답 시스템은 사용자의 질문을 문장으로 입력받아 정확한 질문 의도를 분석하여 사용자에게 해당 정보를 전달하는 역할을 하였다. 그러나 사용자가 특정 키워드에 해당하는 정보를 광범위하게 얻는 것을 원하거나 질문의 의도가 명확치 않은 경우에는 기존 시스템이 한계를 가지고 있었다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 사용자가 입력한 키워드로부터 관련 데이터를 추출하고 추출된 데이터를 자연어로 만들어 출력하는 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법을 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명은, 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭시켜주는 키워드 매칭 모듈; 상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 질의 생성기; 상기 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 트리플 추출기; 및 자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력해주는 응답 생성기를 제공할 수 있다.
이때, 상기 키워드 매칭 모듈은 상기 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 모듈; 및 상기 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 모듈을 포함할 수 있다.
한편, 상기 키워드 엔티티 매칭 모듈은 엔티티 사전과 웹에 존재하는 다양한 문장을 포함하며 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 데이터베이스와 연동하여 상기 키워드와 엔티티를 매칭할 수 있다.
한편, 상기 키워드 엔티티 매칭 모듈은 상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련하는 키워드 엔티티 매칭 훈련기를 더 포함할 수 있다.
한편, 상기 키워드 프로퍼티 매칭 모듈은 상기 키워드와 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 데이터베이스와 연동하여 상기 키워드와 프로퍼티를 매칭할 수 있다.
한편, 상기 키워드 프로퍼티 매칭 모듈은 상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련하는 키워드 프로퍼티 매칭 훈련기를 더 포함할 수 있다.
한편, 상기 트리플 추출기는 인물 정보나 개념에 대한 설명을 포함하고, 상기 트리플 추출기의 질의에 대응한 트리플을 제공하는 지식 기반 데이터베이스와 연동하여 질의에 대응한 트리플을 추출할 수 있다.
한편, 상기 응답 생성기는 지식 기반 데이터베이스의 트리플, 및 상기와 관련된 자연어 생성 자원 데이터베이스와 연동하여 상기 자연어 생성 자원을 만들 수 있다.
한편, 상기 응답 생성기는 상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 자연어 생성 자원 생성기를 포함할 수 있다.
한편, 상기 자연어 생성 자원은 상기 추출된 트리플을 프로퍼티에 알맞은 템플릿, 혹은 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다.
상기 다른 목적을 달성하기 본 발명은, 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭하는 단계; 상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 단계; 상기 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 단계; 및 자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력하는 단계를 제공할 수 있다.
이때, 상기 매칭하는 단계은 상기 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 단계; 및 상기 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭하는 단계를 포함할 수 있다.
한편, 상기 엔티티를 매칭하는 단계는 키워드 엔티티 매칭 데이터베이스의 엔티티 사전과 웹에 존재하는 복수의 문장을 기반으로 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 단계를 포함할 수 있다.
한편, 상기 엔티티를 매칭하는 단계는 상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련하는 단계를 포함할 수 있다.
한편, 상기 프로퍼티를 매칭하는 단계는 상기 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스를 기반으로 상기 키워드와 프로퍼티를 매칭하는 단계를 포함할 수 있다.
한편, 상기 프로퍼티를 매칭하는 단계는 상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련하는 단계를 포함할 수 있다.
한편, 상기 트리플을 추출하는 단계는 인물 정보나 개념에 대한 설명을 기반으로 상기 질의에 대응한 트리플을 제공하는 단계를 포함할 수 있다.
한편, 상기 출력하는 단계는 지식 기반 데이터베이스의 트리플, 및 상기와 관련된 자연어 데이터베이스를 기반으로 상기 자연어 생성 자원을 만드는 단계를 포함할 수 있다.
한편, 상기 출력하는 단계는 상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 단계를 포함할 수 있다.
한편, 상기 자연어 생성 자원은 상기 추출된 트리플을 프로퍼티에 알맞은 템플릿, 또는 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다.
상기와 같은 본 발명에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법을 이용할 경우에는 사용자가 키워드를 입력하면 관련 정보를 추출하고 이를 자연어 형태로 출력함으로써 사용자가 원하는 정보를 간편하고 포괄적이며 읽기 쉽게 얻을 수 있다.
도 1은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치의 구성을 보인 블록도이다.
도 2는 도 1의 키워드 엔티티 매칭 모듈의 동작을 설명하는 예시도이다.
도 3은 도 1의 키워드 프로퍼티 매칭 모듈의 동작을 설명하는 예시도이다.
도 4는 도 1의 질의 생성기의 동작을 설명하는 예시도이다.
도 5는 도 1의 트리플 추출기의 동작을 설명하는 예시도이다.
도 6은 도 1의 응답 생성기의 동작을 설명하는 예시도이다.
도 7은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법의 동작 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치는 사용자로부터 키워드를 입력받고 입력된 키워드에 상응하여 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성하고 생성된 질의를 이용하여 적절한 트리플을 추출하고 자연어 생성 자원을 기반으로 추출된 트리플을 자연어로 출력한다. 입력된 키워드에 대응한 자연어를 출력하는 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치의 구성에 대해 실시예를 들어 설명한다.
도 1은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치의 구성을 보인 블록도이다.
키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치(100)는 질의 입력에 포함된 키워드를 엔티티와 프로퍼티로 매칭하는 키워드 매칭 모듈(110); 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성하는 질의 생성기(120); 생성된 질의를 이용하여 지식 기반 데이터베이스에서 적절한 트리플을 추출하는 트리플 추출기(130); 자연어 생성 자원을 기반으로 추출된 트리플을 자연어로 출력하는 응답 생성기(140)를 포함한다.
질의응답 장치(100)에서 엔티티와 프로퍼티 매칭을 담당하는 키워드 매칭 모듈(110)이 있다. 키워드 매칭 모듈(110)은 사용자가 입력한 키워드를 엔티티와 프로퍼티로 매칭한다.
키워드 매칭 모듈(110)은 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭시켜준다. 엔티티는 개체명이고, 프로퍼티는 의미상 적절한 속성이다.
키워드 매칭 모듈(110)은 사용자가 입력한 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 모듈(111); 및 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 모듈(112)을 포함한다.
키워드 엔티티 매칭 모듈(111)은 엔티티 사전과 웹에 존재하는 다양한 문장을 포함하며 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 데이터베이스(113)와 연동하여 키워드와 엔티티를 매칭한다.
도 2는 도 1의 키워드 엔티티 매칭 모듈의 동작을 설명하는 예시도이다.
예를 들어 사용자가 “오바마” 라는 입력을 하거나 “버락오바마”, “Obama”와 같이 다양한 형태로 하나의 개념을 입력한다고 할 때, 키워드 엔티티 매칭 모듈(111)은 지식기반 데이터베이스에 존재하는 “Barak_Obama”라는 엔티티(개체명)로 변경하는 모듈이다.
키워드 엔티티 매칭 훈련기(114)는 키워드 엔티티 매칭 데이터베이스(113)를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련한다.
키워드 프로퍼티 매칭 모듈(112)은 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스와 연동하며 키워드와 적절한 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 데이터베이스(115)와 연동하여 키워드와 프로퍼티를 매칭한다.
도 3은 도 1의 키워드 프로퍼티 매칭 모듈의 동작을 설명하는 예시도이다.
예를 들어, 사용자가 messi, club이라는 키워드 질의를 입력하였을 때, club은 지식 기반 데이터베이스 내에 있는 ‘team’이라는 property와 같은 의미이기 때문에 키워드 프로퍼티 매칭 모듈(112)은‘team’이라는 프로퍼티와 매칭시켜준다.
키워드 프로퍼티 매칭 훈련기(116)는 지식 기반 데이터베이스의 트리플과 이에 연결된 자연어 데이터베이스(위키피디아)를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련한다.
질의응답 장치(100)에서 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성하는 질의 생성기(120)가 있다. 질의 생성기(120)는 키워드 매칭 모듈(110)에서 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성한다.
질의 생성기(120)는 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성한다. 질의 생성기(120)는 키워드 셋으로부터 변형된 개체명 셋을 입력으로 받는다.
도 4는 도 1의 질의 생성기의 동작을 설명하는 예시도이다.
예를 들어, 키워드 입력이 “Obama, school”이고, 이로부터 키워드 매칭 모듈에서 전달받은 입력 셋이 “Barak_Obama almaMater”이라면, 질의 생성기(120)는 Barak_Obama의 트리플 중 almaMater의 프로퍼티를 가지는 트리플을 추출하는 질의를 생성한다. 만일, 키워드 입력이 “messi, fc barcelona”와 같이 엔티티의 조합이라면 두 엔티티가 함께 존재하는 트리플을 추출하도록 한다. 이와 같이 입력 키워드에 알맞은 질의를 생성한다.
질의응답 장치(100)에서 생성된 질의를 이용하여 적절한 트리플을 추출하는 트리플 추출기(130)가 있다. 트리플 추출기(130)는 질의 생성기(120)에서 생성된 질의를 이용하여 적절한 트리플을 추출한다.
트리플 추출기(130)는 생성된 질의를 이용하여 지식 기반 데이터베이스에서 적절한 트리플을 추출한다.
트리플 추출기(130)는 인물 정보나 개념에 대한 설명을 포함하고, 질의 생성기(120)의 질의에 대응한 트리플을 제공하는 지식 기반 데이터베이스(131)와 연동하여 트리플을 추출한다.
지식 기반 데이터베이스(131)는 인물 정보나 개념에 대한 설명을 포함하는 데이터베이스로, 본 시스템은 해당 데이터베이스로부터 출력할 데이터베이스를 추출한다. 디비피디아와 같은 데이터베이스가 해당 데이터베이스의 예이다.
도 5는 도 1의 트리플 추출기의 동작을 설명하는 예시도이다.
예를 들면 트리플 추출기(130)에 연동하는 지식 기반 데이터베이스(131)는 “Barak_Obama/almaMater/Harvard_University”와 같이 오바마가 하버드 대학교에서 수학했다는 정보를 가지고 있다. 트리플 추출기(130)는 지식 기반 데이터베이스(131)를 기반으로 오바마 질의에 대응한 “Barak_Obama/almaMater /Harvard_University”트리플을 추출한다.
질의응답 장치(100)에서 자연어 생성 자원을 기반으로 트리플 추출기(130)에서 추출된 트리플을 자연어로 출력하는 응답 생성기(140)가 있다. 응답 생성기(140)는 자연어 생성 자원을 이용하여 트리플 추출기(130)에서 추출된 트리플을 자연어로 출력한다.
응답 생성기(140)는 자연어 생성 자원을 기반으로 트리플 추출기(130)에서 추출된 트리플을 자연어로 출력해준다.
응답 생성기(140)는 지식 기반 데이터베이스의 트리플, 그리고 이와 관련된 자연어 데이터베이스와 연동하고, 자연어 생성 자원(141)을 만드는 자연어 생성 자원 데이터베이스(142)와 연동하여 트리플을 자연어로 출력한다.
응답 생성기(140)는 추출된 트리플을 자연어로 만들기 위한 자연어 생성 자원(141)을 생성하는 자연어 생성 자원 생성기(143)를 포함한다. 자연어 생성 자원 생성기(143)는 추출한 데이터를 자연어로 만들기 위한 자연어 생성 자원을 생성한다.
도 6은 도 1의 응답 생성기의 동작을 설명하는 예시도이다.
예를 들어 “Barak_Obama/almaMater/Harvard_University”라는 데이터를 지식 기반 데이터베이스로부터 받으면, 응답 생성기(140)는 이를 문장으로 만들 수 있는 템플릿인 “<subj> graduate <obj>”, 그리고 “past”와 같은 시제 정보 등을 출력한다.
응답 생성기(140)는 “<subj> graduate <obj>”템플릿을 이용하여 "Barak Obama graduated in Harvard University."를 출력할 수 있다.
자연어 생성 자원(141)은 추출된 트리플을 프로퍼티에 알맞은 템플릿, 혹은 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다. 예를 들면, “Linonel_Messi team FC_Barcelona”라는 트리플을 출력할 때, team이라는 프로퍼티에 해당하는 템플릿인 “<subj> play at <obj>”를 이용하여 자연어를 생성할 수 있으며, 이러한 템플릿이 자연어 생성 자원의 예가 될 수 있다.
응답 생성기(140)는 “<subj> play at <obj>”템플릿을 이용하여 "Linonel Messi play at FC Barcelona."를 출력할 수 있다.
도 7은 본 발명의 일 실시예에 따른 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법의 동작 흐름도이다.
질의응답 장치가 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법(이하, 질의응답 방법으로 표기)을 수행하는 동작을 설명한다.
질의응답 방법은 키워드를 엔티티와 프로퍼티로 매칭하는 단계; 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성하는 단계; 생성된 질의를 이용하여 지식 기반 데이터베이스에서 트리플을 추출하는 단계; 자연어 생성 자원을 기반으로 추출된 트리플을 자연어로 출력하는 단계를 포함한다.
질의응답 방법에서 질의응답 장치가 키워드를 엔티티와 프로퍼티로 매칭하는 단계를 수행한다.
질의응답 장치는 사용자의 질의 입력에 포함된 키워드를 데이터베이스의 엔티티와 프로퍼티로 매칭한다.
질의응답 장치는 사용자가 입력한 키워드와 지식 기반 데이터베이스의 엔티티를 매칭하고, 키워드와 지식 기반 데이터베이스의 의미상 적절한 프로퍼티를 매칭한다.
질의응답 장치는 엔티티 사전과 웹에 존재하는 복수의 문장에 기반하여 키워드와 지식 기반 데이터베이스의 엔티티를 매칭한다(210). 예를 들어 사용자가 “오바마”라는 입력을 하거나 “버락오바마”, “Obama”와 같이 다양한 형태로 하나의 개념을 입력한다고 할 때, 질의응답 장치는 지식기반 데이터베이스에 존재하는 “Barak_Obama”라는 엔티티(개체명)로 변경한다.
질의응답 장치는 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 알맞은 엔티티를 찾을 수 있도록 키워드 엔티티 매칭 모델을 훈련한다. 키워드 엔티티 매칭 데이터베이스는 키워드에 매칭되는 엔티티를 제공한다. 질의응답 장치는 기계학습 방법, 규칙 기반 방법, 혹은 단어간의 유사도를 이용하여 키워드 엔티티 매칭 모델에서 알맞은 엔티티를 검색할 수 있다.
질의응답 장치는 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스에 기반하여 입력된 키워드와 적절한 프로퍼티를 매칭한다(220). 예를 들어, 사용자가 messi, club 이라는 키워드 질의를 입력하였을 때, club은 지식 기반 데이터베이스 내에 있는 ‘team’이라는 property와 같은 의미이기 때문에 질의응답 장치는‘team’이라는 프로퍼티와 매칭시켜준다. 질의응답 장치는 키워드 프로퍼티 매칭 데이터베이스를 기반으로 입력된 키워드와 적절한 프로퍼티를 매칭한다.
질의응답 장치는 지식 기반 데이터베이스의 트리플과 이에 연결된 자연어 데이터베이스(위키피디아)를 기반으로 기계학습 기반, 또는 규칙 기반으로 키워드 프로퍼티 매칭 모델을 훈련한다.
질의응답 방법에서 질의응답 장치가 매칭된 엔티티와 프로퍼티를 기반으로 질의를 생성하는 단계를 수행한다.
질의응답 장치는 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 적절한 데이터를 추출할 수 있는 질의를 생성한다(230). 질의응답 장치는 키워드 셋으로부터 변형된 개체명 셋을 입력으로 받는다. 예를 들어, 키워드 입력이 “Obama, school”이고, 이로부터 키워드 매칭 모듈에서 전달받은 입력 셋이 “Barak_Obama almaMater”이라면, 질의응답 장치는 Barak_Obama의 트리플 중 almaMater 의 프로퍼티를 가지는 트리플을 추출하는 질의를 생성한다. 만일, 키워드 입력이 “messi, fc barcelona”와 같이 엔티티의 조합이라면 두 엔티티가 함께 존재하는 트리플을 추출하도록 한다. 이와 같이 질의응답 장치는 입력 키워드에 알맞은 질의를 생성한다.
질의응답 방법에서 질의응답 장치가 생성된 질의를 이용하여 적절한 트리플을 추출하는 단계를 수행한다.
질의응답 장치는 생성된 질의를 이용하여 지식 기반 데이터베이스에서 적절한 트리플을 추출한다(240).
질의응답 장치는 인물 정보나 개념에 대한 설명에 기반하여 질의에 대응한 트리플을 제공한다.
지식 기반 데이터베이스는 인물 정보나 개념에 대한 설명을 포함하는 데이터베이스로, 질의응답 장치는 해당 데이터베이스로부터 출력할 트리플을 추출한다. 디비피디아와 같은 데이터베이스가 해당 데이터베이스의 예이다. 예를 들면 “Barak_Obama/almaMater/Harvard_University”와 같이 오바마가 하버드 대학교에서 수학했다는 정보를 가지고 있다.
질의응답 방법에서 질의응답 장치가 추출된 트리플을 자연어로 출력하는 단계를 수행한다.
질의응답 장치는 자연어 생성 자원을 이용하여 추출된 트리플을 자연어로 출력해준다(250).
질의응답 장치는 지식 기반 데이터베이스의 트리플, 그리고 이와 관련된 자연어 데이터베이스를 포함하고, 자연어 생성 자원을 만드는 자연어 생성 자원 데이터베이스를 포함한다.
질의응답 장치는 추출된 트리플을 자연어로 만들기 위한 자연어 생성 자원을 생성한다. 자연어 생성 자원은 추출된 트리플을 프로퍼티에 알맞은 템플릿, 혹은 단어와 시제 정보에 따라 자연어로 생성하기 위한 자원이다. 예를 들면, “Linonel_Messi team FC_Barcelona” 라는 트리플을 출력할 때, team이라는 프로퍼티에 해당하는 템플릿인 “<subj> play at <obj>”를 이용하여 자연어를 생성할 수 있으며, 이러한 템플릿이 자연어 생성 자원의 예가 될 수 있다. 질의 응답 장치는 “<subj> play at <obj>”템플릿을 이용하여 "Linonel Messi play at FC Barcelona."를 출력할 수 있다.
질의응답 장치는 추출한 트리플을 자연어로 만들기 위한 자연어 생성 자원을 생성하고 자연어 생성 자원을 이용하여 트리플을 자연어로 출력한다. 예를 들어 “Barak_Obama/almaMater/Harvard_University”라는 데이터를 지식 기반 데이터베이스로부터 받으면, 이를 문장으로 만들 수 있는 템플릿인 “<subj> graduate <obj>”, 그리고 “past”와 같은 시제 정보 등을 출력한다. 질의응답 장치는 문장으로 만들 수 있는 템플릿을 이용하여 트리플을 자연어로 만들어 출력한다. 질의응답 장치는 "Barak Obama graduated in Havard University."를 출력할 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 키워드 입력 사용자 관심정보 질의응답 장치
110: 키워드 매칭 모듈 120: 질의 생성기
130: 트리플 추출기 140: 응답 생성기

Claims (20)

  1. 사용자의 질의 입력에 포함된 키워드를 지식 기반 데이터베이스의 엔티티와 프로퍼티로 매칭시켜주는 키워드 매칭 모듈;
    상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 질의 생성기;
    상기 생성된 질의를 이용하여 상기 지식 기반 데이터베이스에서 트리플을 추출하는 트리플 추출기; 및
    자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력해주는 응답 생성기를 포함하되,
    상기 키워드 매칭 모듈은,
    미리 훈련된 키워드 엔티티 매칭 모델을 이용하여 상기 키워드를 상기 키워드와 매칭되는 상기 지식 기반 데이터베이스의 엔티티로 변경하고, 미리 훈련된 키워드 프로퍼티 매칭 모델을 이용하여 상기 키워드를 상기 키워드와 매칭되는 상기 지식 기반 데이터베이스의 의미상 프로퍼티로 변경하며,
    상기 응답 생성기는,
    상기 추출된 트리플의 프로퍼티를 기반으로 탬플릿, 단어 및 시제 정보를 포함하는 상기 자연어 생성 자원을 생성하고, 상기 생성된 자연어 생성 자원을 상기 추출된 트리플로 치환하여 상기 자연어로 출력하는 것을 특징으로 하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 키워드 매칭 모듈은,
    엔티티 사전과 웹에 존재하는 복수의 문장을 포함하며 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 키워드 엔티티 매칭 데이터베이스와 연동하여 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  4. 제3항에 있어서,
    상기 키워드 매칭 모듈은,
    상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 엔티티를 찾을 수 있도록 상기 키워드 엔티티 매칭 모델을 훈련하는 키워드 엔티티 매칭 훈련기를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  5. 제1항에 있어서,
    상기 키워드 매칭 모듈은,
    상기 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스와 연동하여 상기 키워드와 프로퍼티를 매칭하는 키워드 프로퍼티 매칭 데이터베이스로부터 상기 키워드와 상기 지식 기반 데이터베이스의 의미상 프로퍼티를 매칭하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  6. 제5항에 있어서,
    상기 키워드 매칭 모듈은,
    상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 상기 키워드 프로퍼티 매칭 모델을 훈련하는 키워드 프로퍼티 매칭 훈련기를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  7. 제1항에 있어서,
    상기 트리플 추출기는,
    인물 정보나 개념에 대한 설명을 포함하고, 상기 트리플 추출기의 질의에 대응한 트리플을 제공하는 상기 지식 기반 데이터베이스와 연동하여 트리플을 추출하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  8. 제1항에 있어서,
    상기 응답 생성기는,
    지식 기반 데이터베이스의 트리플, 및 상기 지식 기반 데이터베이스의 트리플과 관련된 자연어 생성 자원 데이터베이스를 연동하여 상기 추출된 트리플을 자연어로 출력하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  9. 제1항에 있어서,
    상기 응답 생성기는,
    상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 자연어 생성 자원 생성기를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치.
  10. 삭제
  11. 사용자의 질의 입력에 포함된 키워드를 지식 기반 데이터베이스의 엔티티와 프로퍼티로 매칭하는 단계;
    상기 매칭된 엔티티와 프로퍼티를 기반으로 사용자에게 출력할 데이터를 추출할 수 있는 질의를 생성하는 단계;
    상기 생성된 질의를 이용하여 상기 지식 기반 데이터베이스에서 트리플을 추출하는 단계; 및
    자연어 생성 자원을 이용하여 상기 추출된 트리플을 자연어로 출력하는 단계를 포함하되,
    상기 매칭하는 단계는,
    미리 훈련된 키워드 엔티티 매칭 모델을 이용하여 상기 키워드를 상기 키워드와 매칭되는 상기 지식 기반 데이터베이스의 엔티티로 변경하고, 미리 훈련된 키워드 프로퍼티 매칭 모델을 이용하여 상기 키워드를 상기 키워드와 매칭되는 상기 지식 기반 데이터베이스의 의미상 프로퍼티로 변경하며,
    상기 출력하는 단계는,
    상기 추출된 트리플의 프로퍼티를 기반으로 탬플릿, 단어 및 시제 정보를 포함하는 상기 자연어 생성 자원을 생성하고, 상기 생성된 자연어 생성 자원을 상기 추출된 트리플로 치환하여 상기 자연어로 출력하는 것을 특징으로 하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  12. 삭제
  13. 제11항에 있어서,
    상기 매칭하는 단계는,
    키워드 엔티티 매칭 데이터베이스의 엔티티 사전과 웹에 존재하는 복수의 문장을 기반으로 상기 키워드와 상기 지식 기반 데이터베이스의 엔티티를 매칭하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  14. 제13항에 있어서,
    상기 매칭하는 단계는,
    상기 키워드 엔티티 매칭 데이터베이스를 기반으로 기계학습 방법, 규칙 기반 방법, 또는 단어간의 유사도를 이용하여 엔티티를 찾을 수 있도록 상기 키워드 엔티티 매칭 모델을 훈련하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  15. 제11항에 있어서,
    상기 매칭하는 단계는,
    상기 지식 기반 데이터베이스의 트리플과 연동되는 자연어 데이터베이스를 기반으로 상기 키워드와 프로퍼티를 매칭하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  16. 제15항에 있어서,
    상기 매칭하는 단계는,
    상기 지식 기반 데이터베이스의 트리플과 이에 연결된 상기 자연어 데이터베이스를 기반으로 기계학습 기반, 또는 규칙 기반으로 상기 키워드 프로퍼티 매칭 모델을 훈련하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  17. 제11항에 있어서,
    상기 트리플을 추출하는 단계는,
    인물 정보나 개념에 대한 설명을 기반으로 상기 질의에 대응한 트리플을 제공하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  18. 제11항에 있어서,
    상기 출력하는 단계는,
    상기 지식 기반 데이터베이스의 트리플, 및 상기 지식 기반 데이터베이스의 트리플과 관련된 자연어 데이터베이스를 기반으로 상기 자연어 생성 자원을 만드는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  19. 제11항에 있어서,
    상기 출력하는 단계는,
    상기 추출된 트리플을 자연어로 만들기 위한 상기 자연어 생성 자원을 생성하는 단계를 포함하는, 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 방법.
  20. 삭제
KR1020140145683A 2014-10-27 2014-10-27 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법 KR101662399B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140145683A KR101662399B1 (ko) 2014-10-27 2014-10-27 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140145683A KR101662399B1 (ko) 2014-10-27 2014-10-27 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20160049210A KR20160049210A (ko) 2016-05-09
KR101662399B1 true KR101662399B1 (ko) 2016-10-04

Family

ID=56020270

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140145683A KR101662399B1 (ko) 2014-10-27 2014-10-27 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101662399B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10558426B2 (en) * 2017-12-08 2020-02-11 Google Llc Graphical user interface rendering management by voice-driven computing infrastructure
KR102469712B1 (ko) * 2018-02-22 2022-11-22 삼성전자주식회사 전자 장치 및 이의 자연어 생성 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100468514B1 (ko) * 2004-07-02 2005-01-31 (주)에이티허브 메신저를 이용한 정보검색 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101045762B1 (ko) * 2008-11-03 2011-07-01 한국과학기술원 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법
KR101095866B1 (ko) * 2008-12-10 2011-12-21 한국전자통신연구원 웹 기반의 정보 저장 및 검색 방법, 이를 위한 정보 관리 시스템
KR101169377B1 (ko) * 2010-09-27 2012-07-30 한국과학기술연구원 핫 토픽 이벤트 추출에 기반한 실시간 이벤트의 하이라이트 제공 시스템 및 이를 이용한 하이라이트 서비스 제공방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100468514B1 (ko) * 2004-07-02 2005-01-31 (주)에이티허브 메신저를 이용한 정보검색 시스템

Also Published As

Publication number Publication date
KR20160049210A (ko) 2016-05-09

Similar Documents

Publication Publication Date Title
Dietz et al. TREC Complex Answer Retrieval Overview.
CN106649786B (zh) 基于深度问答的答案检索方法及装置
US9558264B2 (en) Identifying and displaying relationships between candidate answers
US10503828B2 (en) System and method for answering natural language question
US9621601B2 (en) User collaboration for answer generation in question and answer system
Ferrández et al. The QALL-ME Framework: A specifiable-domain multilingual Question Answering architecture
CN107644062B (zh) 一种基于知识图谱的知识内容权重分析系统及方法
CN102955848B (zh) 一种基于语义的三维模型检索系统和方法
US20150178623A1 (en) Automatically Generating Test/Training Questions and Answers Through Pattern Based Analysis and Natural Language Processing Techniques on the Given Corpus for Quick Domain Adaptation
US20090119090A1 (en) Principled Approach to Paraphrasing
CN102663129A (zh) 医疗领域深度问答方法及医学检索系统
KR102491172B1 (ko) 자연어 질의응답 시스템 및 그 학습 방법
CN109947952B (zh) 基于英语知识图谱的检索方法、装置、设备及存储介质
CN101872349A (zh) 处理自然语言问题的方法和装置
CN107402912B (zh) 解析语义的方法和装置
US20220405484A1 (en) Methods for Reinforcement Document Transformer for Multimodal Conversations and Devices Thereof
JP2020191075A (ja) Web APIおよび関連エンドポイントの推薦
Ta'a et al. Al-Quran ontology based on knowledge themes
CN111414763A (zh) 一种针对手语计算的语义消歧方法、装置、设备及存储装置
Rasywir et al. Removal of Modulo as Hashing Modification Process in Essay Scoring System Using Rabin-Karp
Dhandapani et al. Question answering system over semantic web
KR20230005797A (ko) 질의어를 처리하는 장치, 방법 및 컴퓨터 프로그램
Banerjee et al. Dblp-quad: A question answering dataset over the dblp scholarly knowledge graph
CN114141384A (zh) 用于检索医学数据的方法、设备和介质
KR101662399B1 (ko) 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant