KR20160060253A - 자연어 질의 응답 시스템 및 방법 - Google Patents

자연어 질의 응답 시스템 및 방법 Download PDF

Info

Publication number
KR20160060253A
KR20160060253A KR1020140161904A KR20140161904A KR20160060253A KR 20160060253 A KR20160060253 A KR 20160060253A KR 1020140161904 A KR1020140161904 A KR 1020140161904A KR 20140161904 A KR20140161904 A KR 20140161904A KR 20160060253 A KR20160060253 A KR 20160060253A
Authority
KR
South Korea
Prior art keywords
unit
document
index
query
database
Prior art date
Application number
KR1020140161904A
Other languages
English (en)
Other versions
KR102094934B1 (ko
Inventor
배용진
김현기
류법모
오효정
이충희
임수종
임준호
장명길
최미란
허정
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020140161904A priority Critical patent/KR102094934B1/ko
Priority to US14/737,130 priority patent/US10503828B2/en
Publication of KR20160060253A publication Critical patent/KR20160060253A/ko
Application granted granted Critical
Publication of KR102094934B1 publication Critical patent/KR102094934B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

본 발명은 자연어 질의 응답 시스템 및 방법에 관한 것으로, 상기 자연어 질의 응답 시스템은, 저장부에 저장되어 있는 비정형 문서의 텍스트를 분석하여, 문장이나 단락의 의미에 따라 비정형 문서를 분류 및 색인하는 색인부; 상기 색인부로부터 전송되는 의미별로 색인된 비정형 문서를 수신 및 저장하는 데이터베이스; 입력되는 질의어를 의미적으로 분석하여 색인어를 추출하고, 추출된 색인어와 관련된 문서를 상기 데이터베이스에서 검색하는 검색부; 및 상기 검색부에 의해 검색된 문서를 분석하여, 질의어에 대한 정답을 생성하고, 검색 결과와 정답을 제공하는 제공부로 구성될 수 있다.

Description

자연어 질의 응답 시스템 및 방법{Natural Language Question-Answering System and method}
본 발명은 자연어 질의 응답 시스템 및 방법에 관한 것으로, 상세하게는 비정형 문서의 문장이나 단락을 분석하여 의미에 따라 문서를 분류 및 색인하여 질의어에 대한 응답을 제공하는데 이용함으로써 정보 검색의 성능을 향상시킬 수 있고, 정확한 응답을 할 수 있는 자연어 질의 응답 시스템 및 방법에 관한 것이다.
최근에 웹 사이트 상에서 무수히 많은 웹 문서 정보를 처리하여 사용자의 요구에 해당하는 것만을 추출하여 사용자에게 제공하는 정보 검색 시스템이 널리 이용되고 있다. 그러나, 일반적으로 방대한 웹 문서 집합에서 정보 요구자가 원하는 문서를 정확히 추출하고 특정 질의에 대한 응답을 정확히 얻는 것은 매우 어렵다.
따라서, 단어가 매칭된 문서를 찾아주는 기존의 검색 시스템과는 달리 사용자의 의도를 파악하여 적합한 문서와 정답을 추천하는 자연어 질의-응답 검색 시스템이 출현하였다.
일반적으로, 질의응답 시스템은 질문에 대한 결과로 정답을 제시한다. 대부분의 질의응답 시스템은 정답을 추출하기 위해, 먼저 문서나 단락을 검색하고, 검색된 문서나 단락으로부터 정답을 추출하는데, 문서나 단락을 검색하고 정답을 추출하기 위해서는 형태소분석 및 구문분석 등의 언어분석 결과를 이용한다. 하지만 아직 언어분석 결과에 많은 오류가 있고, 정확한 답을 추출하기 위해서는 언어분석결과를 이용할 수 밖에 없으므로 질의응답 시스템의 전체적인 성능은 낮은 편이다.
기존에 제안된 한국어 인터넷 자연어에 대한 질의 응답형 정보 검색 엔진을 구축하는 방법에서는 자연어 형태의 사용자 질문에 대하여 축적해 놓은 데이터 베이스를 이용하여, 질의 구문에 해당하는 결과를 2차 및 3차에 걸쳐 사용자에게 재질의 구문을 보여주고 선택하게 하는 인터넷 정보검색 방법을 개시하고 있다.
또한, 구문구조를 이용하여 정답을 추출하는 질의응답 시스템[참고문헌: 이대연, 서영훈, 제15회 한글 및 한국어 정보처리 학술대회, pp. 89-94, 2003]에서는 질의문 내에 포함된 동사를 중심으로 한 질의어 확장 및 정답 추출 기법을 이용한 질의 응답 시스템이 개시되어 있다. 동사에 대한 활용은 구축된 동사구문 사전의 정보를 이용하며, 동사 모호성을 배제하기 위해 명사 의미사전을 사용한다.
개념어의 습득을 위한 지식기반 질의응답 시스템[참고문헌: 이재홍, 최호섭, 옥철영, 제15회 한글 및 한국어 정보처리 학술대회, pp. 95-100, 2003]에서는 현실 세계가 가지고 있는 지식이 어느 정도 체계적으로 정제되어 있는 국어사전, 백과사전 등을 중심으로, 하이브리드 방법(Hybrid Method)을 이용한 통계 기반 지식베이스와, 어휘분류 기반 지식베이스를 효율적으로 구축하여 질의응답 시스템에 활용한다.
그런데, 이러한 종래의 한국어 질의응답 시스템을 위한 기존의 연구들은 키워드 및 구문구조 정보를 이용하여 정답을 추출하는 모델로서, 언어분석 결과의 신뢰도가 떨어지므로 질의응답 시스템의 전체 성능도 낮다는 문제를 안고 있었다.
또한, 과거의 정보검색 대상은 질의어와 유사한 정보를 담고 있는 원문을 검색하거나, 문서를 구조적으로 나누어 검색된 결과를 제공하는 경우가 일반적이었다.
그러나, 자연어 질의응답 시스템에서는 불필요하게 제공되는 검색 결과가 잘못 사용되어 전체 시스템의 성능을 저하시키는 원인이 되기도 한다. 질문의 요점과 질문에서 요구하는 정보를 잘못 이해한 결과이기도 하다.
따라서, 이러한 질의응답 시스템의 성능 저하를 일으키지 않으면서도 정확한 응답을 해 줄 수 있는 방안에 대한 연구가 필요하다.
따라서, 본 발명은 상기와 같은 종래 기술의 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은, 본 발명은 자연어 질의 응답 시스템 및 방법에 관한 것으로, 상세하게는 비정형 문서의 문장이나 단락을 분석하여 의미에 따라 문서를 분류 및 색인하여 질의어에 대한 응답을 제공하는데 이용함으로써 정보 검색의 성능을 향상시킬 수 있고, 정확한 응답을 할 수 있는 자연어 질의 응답 시스템 및 방법을 제공함에 있다.
상기와 같은 목적을 달성하기 위한 본 발명의 일 측면에 따른 자연어 질의 응답 시스템은,
본 발명의 타 측면에 따른 자연어 질의 응답 방법은,
이와 같은 본 발명에 따르면, 문서 색인 및 검색 시 검색 대상을 원 문서 그대로를 사용하지 않고, 의미적으로 분류된 단락으로 사용하였다. 이렇게 의미적으로 분류된 단락들을 이용하면, 검색된 문서 전체를 검색하는 것이 아니라 의미적으로 관련되어 있는 문장이나 단락을 검색하기 때문에 사용자들은 적은 노력으로 원하는 정보를 찾을 수 있다.
또한, 현재 사용중인 검색 서비스는 하나의 검색 질의어로 검색 가능한 모든 형태의 문서들을 사용자에게 제공하기 때문에 사용자가 검색 결과에서 원하는 정보를 찾아야 하였다. 그러나 본 발명은 사용자의 질의에서 어떤 정보를 얻고 싶은지를 분석하여 사용자가 원하는 정보만 제공한다.
또한, 종래와 달리 질문과 검색 대상을 의미 단락으로 분류하여 색인하였으며, 사용자에게 정답을 제공 시 정답과 함께 정답을 포함하는 문서를 제공하기 때문에 사용자로부터 높은 신뢰를 받을 수 있다.
도 1은 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 구성을 도시한 블록도이다.
도 2는 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 색인부의 상세 구성도이다.
도 3은 본 발명의 실시 예에 따른 문서 분석부가 문서의 텍스트를 분석한 결과의 일례를 도시한 도면이다.
도 4는 본 발명의 실시 예에 따른 의미 분류부가 뉴스 문서를 구조적으로 분류한 단락의 예제를 도시한 도면이다.
도 5는 본 발명의 실시 예에 따른 문서 색인부가 색인 대상 문장을 색인 단위별로 색인한 예제를 도시한 도면이다.
도 6은 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 검색부의 상세 구성도이다.
도 7은 본 발명의 제공부가 제공하는 화면의 일례를 도시한 도면이다.
도 8은 본 발명의 실시 예에 따른 자연어 질의 응답 방법에 따른 동작 순서를 도시한 플로우챠트이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 도면부호는 동일 구성 요소를 지칭한다.
본 발명의 실시 예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시 예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
이하, 본 발명의 실시 예에 따른 자연어 질의 응답 시스템 및 방법에 대하여 첨부한 도면을 참조하여 상세하게 설명해 보기로 한다.
도 1은 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 구성을 도시한 블록도이다.
도 1을 참조하면, 본 발명의 실시 예에 따른 자연어 질의 응답 시스템은 저장부(110), 색인부(120), 데이터베이스(130), 검색부(140) 및 제공부(150)로 구성될 수 있다.
상기 저장부(110)는 다양한 종류의 비정형 데이터를 문서 형태로 저장하고 있으며, 상기 저장부(110)에 저장되는 비정형 데이터의 획득은 웹 상에서 다양한 경로를 통해 이루질 수 있다.
이때, 상기 비정형 데이터는 뉴스, 논문, 특허, 사전, 블로그, 카페, 페이스북 등 다양한 채널에서 수집되는 대용량의 데이터를 말한다.
상기 색인부(120)는 저장부(110)에 저장되어 있는 비정형 문서의 텍스트를 분석하여, 문장이나 단락의 의미에 따라 비정형 문서를 분류 및 색인한다. 이때, 상기 색인부(120)는 의미별로 색인된 비정형 문서를 데이터 베이스(130)로 전송한다.
상기 데이터베이스(130)는 색인부(120)로부터 전송되는 의미별로 색인된 비정형 문서를 수신 및 저장한다.
이때, 다수의 비정형 문서들이 색인별로 그룹핑되어 데이터베이스(130)에 저장되는 것이 바람직하며, 상기 데이터베이스(130)는 그룹핑된 비정형 문서들이 일정 영역 내에 인접하여 저장될 수 있도록 구획되어 있는 것이 바람직하다.
따라서, 상기 데이터베이스(130)는 색인별로 구분되는 다수의 색인 데이터베이스로 구성될 수 있다.
상기 검색부(140)는 입력되는 질의어를 의미적으로 분석하여 색인어를 추출하고, 추출된 색인어와 관련된 문서를 데이터베이스(130)에서 검색한다.
이때, 상기 검색부(140)가 데이터베이스(130)에서 문서를 검색하는 경우, 상기 검색부(140)는 데이터베이스(130)의 전 영역을 검색하는 것이 아니라, 색인별로 구분된 다수의 색인 데이터베이스 중 색인어에 해당하는 색인 데이터베이스 내에서 문서를 검색한다.
이때, 상기 검색부(140)는 질의어를 분석하여 다수의 색인어를 추출할 수 있는데, 이와 같이 다수의 색인어를 추출하는 경우, 각 색인어에 해당하는 색인 데이터베이스에서 각각 문서를 검색한다.
상기 제공부(150)는 검색부(140)에 의해 검색된 문서를 분석하여, 질의어에 대한 정답을 생성하고, 검색 결과와 정답을 제공한다.
도 2는 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 색인부의 상세 구성도이다.
도 2를 참조하면, 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 색인부(120)는 저장부(110)에 저장되어 있는 비정형 문서의 텍스트를 분석하여, 문장이나 단락의 의미에 따라 비정형 문서를 분류 및 색인한다.
이때, 상기 색인부(120)는 문서 분석부(121), 의미 분류부(123) 및 문서 색인부(125)로 구성될 수 있다.
상기 문서 분석부(121)는 저장부(110)에 저장되어 있는 비정형 문서의 텍스트를 분석한다.
도 3은 상기 문서 분석부(121)가 문서의 텍스트를 분석한 결과의 일례를 도시한 것으로, 도 3에 도시된 바와 같이, 상기 문서 분석부(121)는 다양한 색인 단위를 적용하기 위해, 형태소 분석, 개체명 인식과 같은 어휘적 분석, 구문 분석, 문장 구조 분석을 한다.
상기 문서 분석부(121)에 의해 심층 분석된 텍스트들은 이후 문서 색인 단계뿐 아니라 의미 분류 단계에서도 활용된다.
상기 의미 분류부(123)는 문서 분석부(121)에 의해 분석된 텍스트를 입력받아, 입력된 텍스트의 의미를 분류한다. 이때, 상기 의미 분류부(123)는 입력되는 텍스트를 문장이나 단락 단위로 분류한다.
즉, 상기 의미 분류부(123)는 문서 분석부(121)로부터 텍스트를 입력받아, 문장이나 단락 단위로 의미에 따라 텍스트를 분류한다.
한편, 도 4는 뉴스 문서를 구조적으로 분류한 단락의 예제를 도시하고 있는 것으로, 도 4에 도시된 바와 같이, 문장이나 단락은 문서 내의 구조적 정보나 자연어 이해 결과를 바탕으로 구분된다.
상기 의미 분류부(123)는 시스템 요구에 맞게 다양한 카테고리로 분류할 수 있는데, 예를 들면 작품, 평가, 구성, 원인, 효과, 인물, 성장 배경 등으로 텍스트를 분류할 수 있다.
또한, 상기 의미 분류부(123)는 문장 특징을 추출하여 패턴을 생성하여 분류하거나 기계학습 기법을 사용하여 분류할 수 있다.
이에 더하여, 상기 의미 분류부(123)는 하나의 문장이나 단락을 2개 이상의 의미로 분류할 수 있다.
예를 들어, 상기 의미 분류부(123)가 예제 문장 “이순신은 한성 출신으로 조선 중기 무과에 합격하였다.”를 분류하는 경우, 상기 의미 분류부(123)는 예제 문장을 "직업"과 "출생"의 2가지 의미로 분류할 수 있다.
이와 같이, 상기 의미 분류부(123)가 분류 대상을 2가지 이상의 의미로 분류하는 경우 각 의미에 가중치를 부여할 수 있다.
즉, 상기와 바와 같이, 상기 의미 분류부(123)가 예제 문장을 "직업"과 "출생"의 2가지 의미로 분류하는 경우, "직업"에 0.7의 가중치를, 그리고 "출생"에 0.3의 가중치를 부여할 수 있다.
분류 대상을 2가지 이상의 의미로 분류하는 경우, 각 의미에 가중치를 부여하면, 검색 결과의 적중률을 높일 수 있다.
상기 문서 색인부(125)는 문서에 대한 색인을 하는 것으로, 의미 분류부(123)에 의해 의미에 따라 분류된 문장이나 단락별로 색인을 한다.
이때, 상기 문서 색인부(125)는 형태소 단위, 개체명 단위, 구 단위, 구문 구조 단위, 의미 구조 단위로 색인할 수 있으며, 문장 구조를 분석하여 튜플(주어-동사, 목적어-동사)와 트리플(주어-동사-목적어)을 하나의 단위로 하여 색인할 수 있다.
도 5는 색인 대상 문장을 색인 단위별로 색인한 예제를 도시하고 있는 것으로, 색인 대상 문장으로 “앞서 1일 중국 최대 전자상거래업체 알리바바는 회사 공식 블로그를 통해 지문인식 경제 시스템을 준비하고 있다고 밝혔다.”을 이용하고 있다.
도 5의 색인 대상 문장은 “주어(알리바바가)-목적어(지문인식 경제 시스템을-동사(준비한다)”라는 구문 구조를 포함하고 있다.
그러나, 다른 문서에서 뜻은 같으나 다른 문장의 형태로도 나타날 수 있는데, 예를 들면 “주어(알리바바가)-목적어(지문인식 경제 시스템을)-동사(착수하다)”라는 문장으로 나타날 수도 있다.
이 두 문장의 의미는 같으나 표현방식이 달라 종래에는 다른 의미를 가진 문장으로 인식되고 색인되었으며, 동일한 뜻을 가진 문서로 검색되지 않았다.
하지만, 본 발명에서는 이러한 단점을 보완하기 위해, 문장의 의미 구조 단위까지 색인하고, 문장의 의미 분류에 따라 색인 데이터베이스가 생성된다.
도 6은 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 검색부의 상세 구성도이다.
도 6을 참조하면, 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 검색부(140)는 입력되는 질의어를 의미적으로 분석하여 색인어를 추출하고, 추출된 색인어와 동일한 색인어를 갖는 문서를 데이터베이스(130)에서 검색한다.
이때, 상기 검색부(140)는 질의어 입력부(141), 질의어 분석부(143), 질의어 분류부(145) 및 문서 검색부(147)로 구성될 수 있다.
상기 질의어 입력부(141)는 외부로부터 질의어를 입력받기 위해 구성되는 것으로, 예를 들면 키보드, 터치패드 등일 수 있으며, 이에 국한되는 것은 아니다.
상기 질의어 분석부(143)는 질의어 입력부(141)를 통해 입력되는 질의어를 분석한다. 이때, 상기 질의어 분석부(143)는 다양한 색인 단위를 적용하기 위해, 형태소 분석, 개체명 인식과 같은 어휘적 분석, 구문 분석, 문장 구조 분석을 한다.
상기 질의어 분류부(145)는 질의어 분석부(143)에 의해 분석된 질의어를 입력받아 의미를 분류하여 색인어를 추출한다. 이때, 상기 질의어 분류부(145)는 입력되는 질의어를 문장이나 단락 단위로 분류하며, 상기 질의어 분류부(145)에 의해 추출되는 색인어는 2개 이상일 수 있다.
상기 문서 검색부(147)는 질의어 분류부(145)에 의해 추출된 색인어와 관련된 문서를 데이터베이스(130)에서 검색한다.
이때, 상기 문서 검색부(147)가 데이터베이스(130)에서 문서를 검색하는 경우, 상기 문서 검색부(147)는 데이터베이스(130)의 전 영역을 검색하는 것이 아니라, 색인별로 구분된 다수의 색인 데이터베이스 중 색인어에 해당하는 색인 데이터베이스 내에서 문서를 검색한다.
또한, 상기 질의어 분류부(145)에 의해 다수의 색인어가 추출되는 경우, 각 색인어에 해당하는 색인 데이터베이스에서 각각 문서를 검색한다.
상기 제공부(150)는 검색부(140)에 의해 검색된 문서를 분석하여, 질의어에 대한 정답을 생성하고, 검색 결과와 정답을 제공한다.
이때, 상기 제공부(150)는 몇 개의 색인어에 따라 문서 검색이 이루어졌는지, 다수의 색인어에 따라 문서 검색이 이루어진 경우 각 색인어의 가중치는 얼마인지, 어떤 문서가 질의어 결과에 적합한지 등을 분석한다.
또한, 다수의 색인어에 의해 문서가 검색된 경우, 상기 제공부(150)는 각 색인어의 가중치를 판단하여, 가중치에 따라 검색 결과를 제공한다.
또한, 다수의 색인어에 의해 문서가 검색된 경우, 각 색인어의 가중치를 판단한 결과, 어느 하나의 가중치가 너무 작으면(예, 0.1), 가중치가 높은 색인어의 비중을 높이기 위하여, 가중치가 작은 색인어를 바탕으로 검색된 결과를 제공하지 않을 수 있다.
도 7은 본 발명의 제공부가 제공하는 화면의 일례를 도시한 도면이다.
도 7을 참조하면, 검색란에 입력된 “조선 중기 한성에서 출생하여 무관에 합격한 장군은 누구인가?”라는 질의어에 대한 검색 결과와 정답을 제공하며, 이때, 질의어 “조선 중기 한성에서 출생하여 무관에 합격한 장군은 누구인가?”으로부터 추출된 2개의 색인어인 "직업", "출생"에 대한 각각의 검색 결과와 정답을 제공한다.
이때, 색인어 "직업"에 대한 가중치가 0.6이고, 색인어 "출생"에 대한 가중치가 0.4인 경우, 상기 제공부(150)는 직업 색인 데이터베이스에서 검색된 결과의 60%를 검색 결과로 제공하고, 출생 색인 데이터베이스에서 검색된 결과의 40%를 검색 결과로 제공할 수 있다.
또한, 색인어 "직업"에 대한 가중치가 0.9이고, 색인어 "출생"에 대한 가중치가 0.1인 경우, 상기 제공부(150)는 출생 색인 데이터베이스에서 검색된 결과로 제공하지 하고 직업 색인 데이터베이스에서 검색된 결과만을 제공할 수 있다.
이상에서는 본 발명의 실시 예에 따른 자연어 질의 응답 시스템의 구체적인 구성 및 기능에 대해서 살펴보았다. 이하에서는 본 발명의 실시 예에 따른 자연어 질의 응답 방법에 대해서 단계적으로 살펴보기로 한다.
도 8은 본 발명의 실시 예에 따른 자연어 질의 응답 방법에 따른 동작 순서를 도시한 플로우챠트이다.
도 1, 8을 참조하면, 색인부(120)가 저장부(110)에 저장된 비정형 문서를 분석하여(S810), 문서 내의 문장이나 단락의 의미에 따라 문서를 분류 및 색인한다(S820).
한편, 도면에는 도시되어 있지 않으나, 저장부(110)에 다양한 종류의 비정형 문서를 저장하는 과정이 더 이루어질 수 있다. 이때, 저장부(110)에 비정형 문서를 저장하는 과정은 웹 상의 다양한 채널에서 정보를 획득하는 과정을 포함할 수 있다.
이때, 단계 S810에서는 문서에 대해 형태소 분석, 어휘적 분석, 구문 분석, 문장 구조 분석을 하며, 문장 특징을 추출하고 패턴을 생성하여 분류하거나 기계학습 기법을 이용하여 분류할 수 있다.
또한, 단계 S820에서 문서 내의 문장이나 단락은 구조적 정보나 자연어 이해 결과를 바탕으로 구분된다.
또한, 단계 S820에서는 하나의 문장이나 단락에 대해서 2개 이상의 의미로 분류할 수 있다.
한편, 단계 S820에 따라 문서를 색인하는 경우, 형태소 단위, 개체명 단위, 구 단위, 구문 구조 단위, 의미 구조 단위로 색인할 수 있으며, 이에 더하여, "주어-동사", "목적어-동사"와 같은 튜플 구조 및 "주어_동사_목적어"와 같은 트리플 구조를 하나의 단위로 하여 색인할 수 있다.
한편, 단계 S820에 따라 비정형 문서를 색인한 후, 색인부(120)는 의미별로 색인된 문서를 데이터베이스(130)로 전송하여 데이터베이스(130)에 저장한다(S830).
이때, 단계 S830에 따라 데이트베이스(130)에 문서를 저장하는 경우, 데이터베이스(130)를 다수의 색인 데이터베이스로 구분하고, 의미별로 색인된 문서를 상응하는 색인 데이터베이스에 저장하는 것이 바람직하다.
단계 S830에 따라 데이터베이스(130)에 질의에 응답하기 위해 검색되는 문서가 저장된 상태에서, 검색부(140)가 질의어가 입력되는지를 지속적으로 판단한다(S840).
단계 S840에 따른 판단 결과, 질의어가 입력된 것으로 판단하면(S840-Yes), 검색부(140)는 질의어를 분석하여 색인어를 추출하고(S850), 추출된 색인어와 관련된 문서를 데이터베이스(130)에서 검색한다(S860).
단계 S850에 따라 질의어를 분석하는 경우, 형태소 분석, 어휘적 분석, 구문 분석, 문장 구조 분석이 이루어진다.
이때, 단계 S860에 따라 문서를 검색하는 경우, 검색부(140)는 색인별로 구분된 다수의 색인 데이터베이스 중 색인어에 해당하는 색인 데이터베이스 내에서 문서를 검색한다.
한편, 단계 S850에 따라 색인어를 추출하는 경우, 다수의 색인어가 추출될 수 있는데, 이와 같이 다수의 색인어가 추출되는 경우, 단계 S860에서는 추출된 다수의 색인어에 각각 해당하는 색인 데이터베이스에서 문서를 검색한다.
단계 S860에 따라 문서 검색이 이루어지면, 제공부(150)는 단계 S860에 따라 검색된 문서를 분석하여, 질의어에 대한 검색 결과와 정답을 제공한다(S870).
이와 같은 본 발명에 따르면, 문서 색인 및 검색 시 검색 대상을 원 문서 그대로를 사용하지 않고, 의미적으로 분류된 단락으로 사용하였다. 이렇게 의미적으로 분류된 단락들을 이용하면, 검색된 문서 전체를 검색하는 것이 아니라 의미적으로 관련되어 있는 문장이나 단락을 검색하기 때문에 사용자들은 적은 노력으로 원하는 정보를 찾을 수 있다.
또한, 현재 사용중인 검색 서비스는 하나의 검색 질의어로 검색 가능한 모든 형태의 문서들을 사용자에게 제공하기 때문에 사용자가 검색 결과에서 원하는 정보를 찾아야 하였다. 그러나 본 발명은 사용자의 질의에서 어떤 정보를 얻고 싶은지를 분석하여 사용자가 원하는 정보만 제공한다.
또한, 종래와 달리 질문과 검색 대상을 의미 단락으로 분류하여 색인하였으며, 사용자에게 정답을 제공 시 정답과 함께 정답을 포함하는 문서를 제공하기 때문에 사용자로부터 높은 신뢰를 받을 수 있다.
한편, 본 발명에 따른 자연어 질의 응답 시스템 및 방법을 실시 예에 따라 설명하였지만, 본 발명의 범위는 특정 실시 예에 한정되는 것은 아니며, 본 발명과 관련하여 통상의 지식을 가진 자에게 자명한 범위 내에서 여러 가지의 대안, 수정 및 변경하여 실시할 수 있다.
따라서, 본 발명에 기재된 실시 예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
110 : 저장부 120: 색인부
121 : 문서 분석부 123 : 의미 분류부
125 : 문서 색인부 130 : 데이터베이스
140 : 검색부 141 : 질의어 입력부
143 : 질의어 분석부 145 : 질의어 분류부
147 : 문서 검색부 150 : 제공부

Claims (18)

  1. 저장부에 저장되어 있는 비정형 문서의 텍스트를 분석하여, 문장이나 단락의 의미에 따라 비정형 문서를 분류 및 색인하는 색인부;
    상기 색인부로부터 전송되는 의미별로 색인된 비정형 문서를 수신 및 저장하는 데이터베이스;
    입력되는 질의어를 의미적으로 분석하여 색인어를 추출하고, 추출된 색인어와 관련된 문서를 상기 데이터베이스에서 검색하는 검색부; 및
    상기 검색부에 의해 검색된 문서를 분석하여, 질의어에 대한 정답을 생성하고, 검색 결과와 정답을 제공하는 제공부로 구성되는 자연어 질의 응답 시스템.
  2. 제 1 항에 있어서,
    상기 데이터베이스는 색인별로 구분되는 다수의 색인 데이터베이스로 구성되는 자연어 질의 응답 시스템.
  3. 제 2 항에 있어서,
    상기 검색부는 상기 다수의 색인 데이터베이스 중 상기 색인어에 해당하는 색인 데이터베이스 내에서 문서를 검색하는 자연어 질의 응답 시스템.
  4. 제 2 항에 있어서,
    상기 검색부는 질의어를 분석하여 다수의 색인어를 추출하는 자연어 질의 응답 시스템.
  5. 제 4 항에 있어서,
    상기 검색부는 상기 다수의 색인어에 해당하는 색인 데이터베이스에서 각각 문서를 검색하는 자연어 질의 응답 시스템.
  6. 제 1 항에 있어서,
    상기 색인부는,
    상기 저장부에 저장되어 있는 비정형 문서의 텍스트를 분석하는 문서 분석부;
    상기 문서 분석부에 의해 분석된 텍스트를 입력받아, 입력된 텍스트의 의미를 문장이나 단락 단위로 분류하는 의미 분류부; 및
    상기 의미 분류부에 의해 의미에 따라 분류된 문장이나 단락별로 색인하는 문서 색인부로 구성되는 자연어 질의 응답 시스템.
  7. 제 6 항에 있어서,
    상기 문서 분석부는 텍스트에 대해 형태소 분석, 어휘적 분석, 구문 분석, 문장 구조 분석하는 자연어 질의 응답 시스템.
  8. 제 6 항에 있어서,
    상기 의미 분류부는 문장 특징을 추출하여 패턴을 생성하여 분류하거나 기계학습 기법을 사용하여 분류하는 자연어 질의 응답 시스템.
  9. 제 6 항에 있어서,
    상기 문서 색인부는 형태소 단위, 개체명 단위, 구 단위, 구문 구조 단위, 의미 구조 단위, 문장 구조 단위, 주어-동사구조 단위, 목적어-동사구조 단위, 주어-동사-목적 구조 단위로 색인하는 자연어 질의 응답 시스템.
  10. 제 1 항에 있어서,
    상기 검색부는,
    외부로부터 질의어를 입력받는 질의어 입력부;
    상기 질의어 입력부를 통해 입력되는 질의어를 분석하는 질의어 분석부;
    상기 질의어 분석부에 의해 분석된 질의어를 입력받아 의미를 분류하여 색인어를 추출하는 질의어 분류부; 및
    상기 질의어 분류부에 의해 추출된 색인어와 관련된 문서를 상기 데이터베이스에서 검색하는 문서 검색부로 구성되는 자연어 질의 응답 시스템.
  11. 제 1 항에 있어서,
    상기 제공부는, 다수의 색인어에 의해 검색된 경우, 각 색인어의 가중치를 판단하여, 가중치에 따라 검색 결과를 제공하는 자연어 질의 응답 시스템.
  12. 저장부에 저장된 비정형 문서를 분석하여, 문서 내의 문장이나 단락의 의미에 따라 문서를 분류 및 색인하는 단계;
    의미별로 색인된 문서를 데이터베이스로 전송하여 데이터베이스에 저장하는 단계;
    질의어가 입력되면, 질의어를 분석하여 색인어를 추출하고, 추출된 색인어와 관련된 문서를 상기 데이터베이스에서 검색하는 단계; 및
    검색된 문서를 분석하여, 질의어에 대한 검색 결과와 정답을 제공하는 단계로 이루어지는 자연어 질의 응답 방법.
  13. 제 12 항에 있어서,
    상기 문서 내의 문장이나 단락은 구조적 정보나 자연어 이해 결과를 바탕으로 구분되는 것을 특징으로 하는 자연어 질의 응답 방법.
  14. 제 12 항에 있어서,
    상기 문서 내의 문장이나 단락의 의미에 따라 문서를 분류하는 것은 하나의 문장이나 단락에 대해서 2개 이상의 의미로 분류하는 것을 포함하는 자연어 질의 응답 방법.
  15. 제 12 항에 있어서,
    상기 문서 내의 문장이나 단락의 의미에 따라 문서를 분류 및 색인하는 단계에 있어서 색인은 형태소 단위, 개체명 단위, 구 단위, 구문 구조 단위, 의미 구조 단위, 주어-동사 구조 단위, 목적어-동사구조 단위 및 주어-동사-목적어 구조 단위로 이루어지는 것을 특징으로 하는 자연어 질의 응답 방법.
  16. 제 12 항에 있어서,
    상기 저장부에 저장된 비정형 문서를 분석하는 것은 문서에 대해 형태소 분석, 어휘적 분석, 구문 분석, 문장 구조 분석하는 것인 자연어 질의 응답 방법.
  17. 제 12 항에 있어서,
    상기 추출된 색인어와 관련된 문서를 상기 데이터베이스에서 검색하는 단계는 색인별로 구분된 다수의 색인 데이터베이스 중 색인어에 해당하는 색인 데이터베이스 내에서 문서를 검색하는 것인 자연어 질의 응답 방법.
  18. 제 12 항에 있어서,
    상기 문서 내의 문장이나 단락의 의미에 따라 문서를 분류하는 것은 문장 특징을 추출하고 패턴을 생성하여 분류하거나 기계학습 기법을 이용하여 분류하는 것인 자연어 질의 응답 방법.



KR1020140161904A 2014-11-19 2014-11-19 자연어 질의 응답 시스템 및 방법 KR102094934B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140161904A KR102094934B1 (ko) 2014-11-19 2014-11-19 자연어 질의 응답 시스템 및 방법
US14/737,130 US10503828B2 (en) 2014-11-19 2015-06-11 System and method for answering natural language question

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140161904A KR102094934B1 (ko) 2014-11-19 2014-11-19 자연어 질의 응답 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20160060253A true KR20160060253A (ko) 2016-05-30
KR102094934B1 KR102094934B1 (ko) 2020-03-31

Family

ID=55961880

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140161904A KR102094934B1 (ko) 2014-11-19 2014-11-19 자연어 질의 응답 시스템 및 방법

Country Status (2)

Country Link
US (1) US10503828B2 (ko)
KR (1) KR102094934B1 (ko)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180101955A (ko) * 2017-03-06 2018-09-14 주식회사 수브이 문헌 스코어링 방법 및 문헌 검색 시스템
KR20190108838A (ko) * 2018-03-15 2019-09-25 주식회사 노다멘 미술 작품 추천 큐레이션 방법 및 시스템
WO2021049706A1 (ko) * 2019-09-09 2021-03-18 주식회사 솔트룩스 앙상블 질의 응답을 위한 시스템 및 방법
WO2021154540A1 (en) * 2020-01-28 2021-08-05 Schlumberger Technology Corporation Oilfield data file classification and information processing systems
KR20210135831A (ko) 2020-05-06 2021-11-16 송형석 홈페이지의 질의 자동 답변 서비스 제공 시스템
KR102339794B1 (ko) * 2020-12-04 2021-12-16 주식회사 애자일소다 질의 응답 서비스 장치 및 방법
KR20220046276A (ko) * 2020-10-07 2022-04-14 한국전자통신연구원 기계 독해 학습 데이터 자동 생성 장치 및 그 방법
WO2022102827A1 (ko) * 2020-11-16 2022-05-19 주식회사 솔트룩스 과학 기술 논문을 위한 지식 추출 시스템
KR20230056278A (ko) 2021-10-20 2023-04-27 주식회사 엘지유플러스 자연어 처리 방법 및 장치
WO2023074943A1 (ko) * 2021-10-26 2023-05-04 (주) 글루시스 사물 인터넷 환경에서 비정형 데이터 활용을 위한 정형 데이터 베이스 구성 및 그 사용 방법
KR20240042933A (ko) 2022-09-26 2024-04-02 주식회사 엘지유플러스 자연어 처리 방법 및 장치
US11983501B2 (en) 2020-10-07 2024-05-14 Electronics And Telecommunications Research Institute Apparatus and method for automatic generation of machine reading comprehension training data

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10078632B2 (en) * 2016-03-12 2018-09-18 International Business Machines Corporation Collecting training data using anomaly detection
US10339168B2 (en) * 2016-09-09 2019-07-02 International Business Machines Corporation System and method for generating full questions from natural language queries
US10339167B2 (en) * 2016-09-09 2019-07-02 International Business Machines Corporation System and method for generating full questions from natural language queries
JP6929539B2 (ja) * 2016-10-07 2021-09-01 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
KR102091240B1 (ko) 2016-11-23 2020-03-20 한국전자통신연구원 결정적 및 비결정적 지식 처리의 융합을 위한 데이터 처리 장치 및 방법
CN110019644B (zh) * 2017-09-06 2022-10-14 腾讯科技(深圳)有限公司 对话实现中的搜索方法、装置和计算机可读存储介质
KR20190123540A (ko) 2018-04-24 2019-11-01 한국전자통신연구원 뉴럴 기억 컴퓨팅 시스템 및 방법
JP6537211B1 (ja) * 2018-07-06 2019-07-03 Jeインターナショナル株式会社 検索装置およびプログラム
US11366814B2 (en) * 2019-06-12 2022-06-21 Elsevier, Inc. Systems and methods for federated search with dynamic selection and distributed relevance
CN110597952A (zh) * 2019-08-20 2019-12-20 深圳壹账通智能科技有限公司 信息处理方法、服务器及计算机存储介质
CN111538805A (zh) * 2020-05-25 2020-08-14 武汉烽火普天信息技术有限公司 一种基于深度学习和规则引擎的文本信息抽取方法及系统
CN113779203A (zh) * 2020-06-09 2021-12-10 北京金山数字娱乐科技有限公司 生成段落集的方法和装置、推理方法和装置
CN111858878B (zh) * 2020-06-18 2023-12-22 达观数据有限公司 从自然语言文本中自动提取答案的方法、系统及存储介质
CN112417155B (zh) * 2020-11-27 2022-06-10 浙江大学 基于指针-生成Seq2Seq模型的庭审询问生成方法、装置、介质
CN113139048B (zh) * 2021-04-19 2022-11-04 中国人民解放军91054部队 一种检索结果提供方法及系统
CN113076431B (zh) * 2021-04-28 2022-09-02 平安科技(深圳)有限公司 机器阅读理解的问答方法、装置、计算机设备及存储介质
CN113849601A (zh) * 2021-09-17 2021-12-28 上海数熙传媒科技有限公司 一种针对问答任务模型的输入剪枝加速方法
CN113836283B (zh) * 2021-09-24 2024-04-12 上海金仕达软件科技股份有限公司 答案的生成方法、装置、电子设备及存储介质
CN115828893B (zh) * 2022-11-28 2023-11-17 北京海致星图科技有限公司 非结构化文档问答的方法、装置、存储介质和设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020072092A (ko) * 2001-03-08 2002-09-14 서정연 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템
KR20050032937A (ko) * 2003-10-02 2005-04-08 한국전자통신연구원 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템
KR20060063345A (ko) * 2004-12-07 2006-06-12 한국전자통신연구원 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법
KR20060070610A (ko) * 2004-12-21 2006-06-26 한국전자통신연구원 질의응답시스템에서의 정답색인 시스템 및 방법
KR20100067285A (ko) * 2008-12-11 2010-06-21 주식회사 네오패드 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
KR20140128346A (ko) * 2012-02-23 2014-11-05 도쿠리츠 교세이 호진 죠호 츠신 켄큐 키코 논팩토이드형 질의 응답 시스템 및 컴퓨터 프로그램

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5704060A (en) * 1995-05-22 1997-12-30 Del Monte; Michael G. Text storage and retrieval system and method
EP0859330A1 (en) * 1997-02-12 1998-08-19 Kokusai Denshin Denwa Co., Ltd Document retrieval apparatus
KR20010004404A (ko) 1999-06-28 2001-01-15 정선종 키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법
KR20020045343A (ko) 2000-12-08 2002-06-19 오길록 표준화된 문장 구문구조 및 의미구조에 기반한 정보생성/검색 장치 및 그 방법
AU2002237495A1 (en) * 2001-03-13 2002-09-24 Intelligate Ltd. Dynamic natural language understanding
US20030101182A1 (en) * 2001-07-18 2003-05-29 Omri Govrin Method and system for smart search engine and other applications
KR100533810B1 (ko) * 2003-10-16 2005-12-07 한국전자통신연구원 백과사전 질의응답 시스템의 지식베이스 반자동 구축 방법
KR100745367B1 (ko) 2004-12-14 2007-08-02 한국전자통신연구원 템플릿에 기반한 기록정보 색인 및 검색 방법과 이를이용한 질의응답 시스템
US20070073533A1 (en) * 2005-09-23 2007-03-29 Fuji Xerox Co., Ltd. Systems and methods for structural indexing of natural language text
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
KR100756921B1 (ko) 2006-02-28 2007-09-07 한국과학기술원 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체.
US8275803B2 (en) * 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
US8332394B2 (en) * 2008-05-23 2012-12-11 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation
KR100880531B1 (ko) * 2008-07-11 2009-01-28 정종선 단일 데이터 검색을 위한 파일 생성 방법 및 단일 데이터파일의 검색방법 그리고 단일 파일 검색을 위한 rat파일이 저장된 기록매체
US20100057708A1 (en) * 2008-09-03 2010-03-04 William Henry Billingsley Method and System for Computer-Based Assessment Including a Search and Select Process
KR101173556B1 (ko) * 2008-12-11 2012-08-13 한국전자통신연구원 토픽맵 기반 색인 장치, 토픽맵 기반 검색 장치, 토픽맵 기반 검색 시스템 및 그 방법
IL202028A (en) * 2009-11-10 2016-06-30 Icts Holding Company Ltd Product, devices and methods for computerized authentication of electronic documents
KR101667232B1 (ko) 2010-04-12 2016-10-19 삼성전자주식회사 의미기반 검색 장치 및 그 방법과, 의미기반 메타데이터 제공 서버 및 그 동작 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020072092A (ko) * 2001-03-08 2002-09-14 서정연 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템
KR20050032937A (ko) * 2003-10-02 2005-04-08 한국전자통신연구원 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템
KR20060063345A (ko) * 2004-12-07 2006-06-12 한국전자통신연구원 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법
KR20060070610A (ko) * 2004-12-21 2006-06-26 한국전자통신연구원 질의응답시스템에서의 정답색인 시스템 및 방법
KR20100067285A (ko) * 2008-12-11 2010-06-21 주식회사 네오패드 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
KR20140128346A (ko) * 2012-02-23 2014-11-05 도쿠리츠 교세이 호진 죠호 츠신 켄큐 키코 논팩토이드형 질의 응답 시스템 및 컴퓨터 프로그램

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180101955A (ko) * 2017-03-06 2018-09-14 주식회사 수브이 문헌 스코어링 방법 및 문헌 검색 시스템
KR20190108838A (ko) * 2018-03-15 2019-09-25 주식회사 노다멘 미술 작품 추천 큐레이션 방법 및 시스템
WO2021049706A1 (ko) * 2019-09-09 2021-03-18 주식회사 솔트룩스 앙상블 질의 응답을 위한 시스템 및 방법
WO2021154540A1 (en) * 2020-01-28 2021-08-05 Schlumberger Technology Corporation Oilfield data file classification and information processing systems
KR20210135831A (ko) 2020-05-06 2021-11-16 송형석 홈페이지의 질의 자동 답변 서비스 제공 시스템
KR20220046276A (ko) * 2020-10-07 2022-04-14 한국전자통신연구원 기계 독해 학습 데이터 자동 생성 장치 및 그 방법
US11983501B2 (en) 2020-10-07 2024-05-14 Electronics And Telecommunications Research Institute Apparatus and method for automatic generation of machine reading comprehension training data
WO2022102827A1 (ko) * 2020-11-16 2022-05-19 주식회사 솔트룩스 과학 기술 논문을 위한 지식 추출 시스템
KR102339794B1 (ko) * 2020-12-04 2021-12-16 주식회사 애자일소다 질의 응답 서비스 장치 및 방법
KR20230056278A (ko) 2021-10-20 2023-04-27 주식회사 엘지유플러스 자연어 처리 방법 및 장치
WO2023074943A1 (ko) * 2021-10-26 2023-05-04 (주) 글루시스 사물 인터넷 환경에서 비정형 데이터 활용을 위한 정형 데이터 베이스 구성 및 그 사용 방법
KR20240042933A (ko) 2022-09-26 2024-04-02 주식회사 엘지유플러스 자연어 처리 방법 및 장치

Also Published As

Publication number Publication date
US20160140187A1 (en) 2016-05-19
KR102094934B1 (ko) 2020-03-31
US10503828B2 (en) 2019-12-10

Similar Documents

Publication Publication Date Title
KR102094934B1 (ko) 자연어 질의 응답 시스템 및 방법
Gupta et al. A survey of text question answering techniques
KR100546743B1 (ko) 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템
US9213771B2 (en) Question answering framework
US20110078192A1 (en) Inferring lexical answer types of questions from context
KR101500617B1 (ko) 한국어 어휘 의미망을 이용한 문맥 철자오류 교정 장치 및 방법
KR20160007040A (ko) 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
JP2011118689A (ja) 検索方法及びシステム
JP2010519655A (ja) 名前照合システムの名前インデックス付け
Al-Chalabi et al. Semantic based query expansion for Arabic question answering systems
Sasikumar et al. A survey of natural language question answering system
Damiano et al. Towards a framework for closed-domain question answering in Italian
Derici et al. A closed-domain question answering framework using reliable resources to assist students
Leveling et al. On metonymy recognition for geographic information retrieval
KR20020072092A (ko) 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템
Kim et al. Design of question answering system with automated question generation
KR20030006201A (ko) 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
Singh et al. Query relational databases in Punjabi language
Wang et al. Scalable semantic querying of text
Tran et al. A model of vietnamese person named entity question answering system
Boiński et al. DBpedia and YAGO as knowledge base for natural language based question answering—the evaluation
Rodrigues et al. Rapport—a portuguese question-answering system
Estiri et al. Improvement of an abstractive summarization evaluation tool using lexical-semantic relations and weighted syntax tags in Farsi language
Sati et al. Arabic text question answering from an answer retrieval point of view: A survey
Zhao et al. THUNLP at TAC KBP 2011 in Entity Linking.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant