KR101678787B1 - 자동질의응답 방법 및 그 장치 - Google Patents

자동질의응답 방법 및 그 장치 Download PDF

Info

Publication number
KR101678787B1
KR101678787B1 KR1020150100531A KR20150100531A KR101678787B1 KR 101678787 B1 KR101678787 B1 KR 101678787B1 KR 1020150100531 A KR1020150100531 A KR 1020150100531A KR 20150100531 A KR20150100531 A KR 20150100531A KR 101678787 B1 KR101678787 B1 KR 101678787B1
Authority
KR
South Korea
Prior art keywords
query
sentence
natural language
query sentence
response
Prior art date
Application number
KR1020150100531A
Other languages
English (en)
Inventor
이근배
박선영
김병수
심효섭
한상도
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020150100531A priority Critical patent/KR101678787B1/ko
Priority to PCT/KR2016/002275 priority patent/WO2017010652A1/ko
Application granted granted Critical
Publication of KR101678787B1 publication Critical patent/KR101678787B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • G06F17/3043
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • G06F17/2705
    • G06F17/30401

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

자동질의응답 장치 및 그 방법이 개시된다. 자동질의응답 장치는, 입력된 자연어 질의 문장으로부터 형식 언어로 표현된 제1 질의 문장을 생성하고, 데이터베이스로부터 제1 질의 문장에 대한 제1 응답 문장을 추출하는 의미 파싱 모듈; 및 미리 정의된 질의 패턴 중에서 자연어 질의 문장이 해당하는 질의 패턴에 포함된 질의 템플릿을 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성하고, 데이터베이스로부터 제2 질의 문장에 대한 제2 응답을 추출하는 질의 패턴 템플릿 모듈을 포함한다. 따라서, 자연어 질의 문장의 어순 변화나 어휘의 교체와 같은 변이에도 사용자의 정보 요구를 파악하여 적합도가 높은 응답을 출력할 수 있다.

Description

자동질의응답 방법 및 그 장치{METHOD FOR AUTOMATIC QUESTION-ANSWERING AND APPARATUS THEREFOR}
본 발명은 자동질의응답 방법 및 그 장치에 관한 것으로, 더욱 상세하게는 자연어 질의 문장으로부터 정보 요구를 파악하고 해당 정보 요구에 적합한 정보를 지식베이스 기반의 데이터베이스에서 추출하는 자동질의응답 방법 및 그 장치에 관한 것이다.
최근 Freebase 또는 Dbpedia와 같은 커뮤니티 활동에 의한 대규모 지식베이스가 배포되었다. 지식베이스는 단편적인 지식의 원자적인 형태인 <개체, 관계, 개체>의 트리플로 구성되어 있다. 이러한 트리플은 사용자의 정보 요구 해결을 위한 자원으로 활용될 수 있다.
기존의 기술인 정보 검색에 기반하는 자동질의응답 방법의 정보원은 대규모 텍스트이다. 정보 요구에 대한 응답으로서 이러한 대규모 테스트로부터 검색된 문단이 제공되기 때문에, 정보 검색에 기반하는 자동질의응답 방법은 텍스트를 추가함으로써 정보 요구에 대한 해결 가능 범위를 넓힐 수 있으나, 상대적으로 그 응답의 정확도가 낮다.
이에 반해 지식베이스 기반의 자동질의응답 방법은, 고도로 구조화된 지식베이스로부터 적합한 응답이 탐색되기 때문에 정확도는 비교적 높다. 다만, 사람에 의해 직접 지식베이스 내로 내재화된 지식만이 대상이 되기 때문에, 지식베이스 기반의 자동질의응답 방법의 해결 가능 범위는 상대적으로 좁다. 이와 같은 특징 때문에 지식베이스 기반의 자동질의응답과 정보검색 기반의 자동질의응답은 상호 보완이 가능하다.
지식베이스 기반의 자동질의응답 시스템에서는 사용자의 질의에서 의도된 정보 요구에 적합한 데이터가 지식베이스 데이터베이스로부터 추출되는 것이 요구된다. 이를 위해서는 자연어 질의 문장으로부터 사용자가 의도한 정보 요구가 적절히 파악되어 이에 기반한 형식 언어 질의가 생성됨으로써 지식베이스 데이터베이스로부터 적합성이 높은 응답이 추출되는 것이 필요하다.
그런데, 지식베이스 기반의 자동질의응답 방법이 사용되는 경우에도 자연어 질의 문장의 성질로 인하여 입력된 자연어 질의 문장으로부터 사용자의 정보요구가 잘 파악되지 않는 오류가 발생하는 경우가 있을 수 있다. 이러한 오류는 자연어 질의 문장이 비교적 간단한 정보요구를 하는 경우에 발생할 수 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 자연어 질의 문장으로부터 정보 요구를 파악하고 해당 정보 요구에 적합한 정보를 지식베이스 기반의 데이터베이스에서 추출하는 자동질의응답 방법 및 그 장치를 제공하는 데 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따르면, 자동질의응답 장치에서 수행되는 자동질의응답 방법에 있어서, 자동질의응답 방법은 입력된 자연어 질의 문장을 하나 이상의 구문으로 분할하는 단계; 상기 구문 각각에 포함된 단어를 형식 언어로 변환하는 단계; 미리 정의된 상기 형식 언어에 관한 문법에 따라 형식 언어로 변환된 상기 구문을 결합함으로써 제1 질의 문장을 생성하는 단계; 및 상기 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스로부터 상기 제1 질의 문장에 대한 제1 응답 문장을 추출하는 단계를 포함하되, 복수의 샘플 질의 문장으로 구성된 데이터베이스를 기초로 미리 정의된 질의 패턴 중에서 상기 자연어 질의 문장이 해당하는 질의 패턴을 추출하는 단계; 상기 추출된 질의 패턴에 해당하는 템플릿을 상기 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성하는 단계; 및 상기 제2 질의 문장에 대한 제2 응답 문장을 추출하는 단계를 더 포함한다.
여기서, 상기 자동질의응답 방법은, 일차적으로 상기 제1 응답 문장을 표시하되, 부가적으로 상기 제2 응답 문장을 표시하는 단계를 더 포함할 수 있다.
여기서, 상기 구문으로 분할하는 단계는, 상기 자연어 질의 문장을 단어 단위로 분할하는 단계; 및 상기 단어를 결합하여 상기 구문을 생성하는 단계를 포함하되, 상기 결합 과정에서 기존 단어의 생략이 가능할 수 있다.
여기서, 상기 형식 언어는, 상기 자연어 질의 문장을 어순이나 어휘 변화에 민감하지 않은 형식화된 구조로 표현할 수 있다.
여기서, 상기 형식 언어로 변환하는 단계에서, 상기 단어를 형식 언어의 속성과 개체명으로 변환할 수 있다.
여기서, 상기 제1 질의 문장을 생성하는 단계는, 상기 형식 언어로 표현된 하나 이상의 질의 문장 후보를 생성하는 단계; 및 상기 질의 문장 후보에 포함된 형식 언어의 공기 정보로 평가되는 유사도의 합이 가장 높은 질의 문장 후보를 상기 제1 질의 문장으로 선택하는 단계를 포함할 수 있다.
여기서, 상기 제1 질의 문장으로 선택하는 단계는, 상기 질의 문장 후보를 평가하기 위하여, 자연어 질의 문장-정답 질의 문장의 쌍으로 구성된 데이터베이스를 기반으로 학습된 후보 평가 모델을 이용할 수 있다.
여기서, 상기 질의 패턴을 추출하는 단계는, 상기 자연어 질의 문장이 미리 정의된 표현형을 포함하는지 여부, 상기 자연어 질의 문장이 청크(chunk) 단위로 분석되는 경우 상기 청크가 미리 정의된 어휘를 포함하는지 여부, 상기 청크의 수 및 상기 청크의 유형 중에서 적어도 하나를 고려하여 상기 질의 패턴을 추출할 수 있다.
여기서, 상기 템플릿은, 상기 자연어 질의 문장에 대응하는 형식 언어에 관한 슬롯 정보를 추출하기 위한 슬롯 정보 템플릿; 및 상기 슬롯 정보를 이용하여 상기 자연어 질의 문장을 상기 제2 질의 문장으로 변환하기 위한 질의 템플릿을 포함할 수 있다.
본 발명의 다른 실시예에 따르면, 자동질의응답 장치는 입력된 자연어 질의 문장으로부터 형식 언어로 표현된 제1 질의 문장을 생성하고, 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스로부터 상기 제1 질의 문장에 대한 제1 응답 문장을 추출하는 의미 파싱 모듈; 및 미리 정의된 질의 패턴 중에서 상기 자연어 질의 문장이 해당하는 질의 패턴에 포함된 질의 템플릿을 상기 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성하고, 상기 데이터베이스로부터 상기 제2 질의 문장에 대한 제2 응답을 추출하는 질의 패턴 템플릿 모듈을 포함한다.
여기서, 상기 의미 파싱 모듈은, 입력된 자연어 질의 문장을 단어 단위로 분할하고, 상기 단어를 결합하여 하나 이상의 구문을 생성하되, 상기 재조합 과정에서 기존 단어를 생략 가능한 파서; 상기 구문을 형식 언어로 표현된 형식 언어 구문으로 변환하고, 미리 정의된 상기 형식 언어에 관한 문법에 기초하여 상기 형식 언어 구문을 결합함으로써 하나 이상의 질의 문장 후보를 생성하는 후보 생성 모듈; 상기 질의 문장 후보에 포함된 형식 언어의 공기 정보로 평가되는 유사도의 합이 가장 높은 질의 문장 후보를 제1 질의 문장으로 선택하는 후보 평가 모듈; 및 상기 제1 질의 문장에 대한 제1 응답 문장을 추출하는, 출력 모듈을 포함할 수 있다.
여기서, 상기 질의 패턴 템플릿 모듈은, 미리 정의된 질의 패턴 중에서 상기 자연어 질의 문장이 해당하는 질의 패턴을 추출하는 패턴 추출 모듈; 상기 질의 패턴에 포함된 템플릿을 상기 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성하는 템플릿 적용 모듈; 및 상기 제2 질의 문장에 대한 제2 응답을 추출하는 출력 모듈을 포함할 수 있다.
여기서, 상기 자동질의응답 장치는, 일차적으로 상기 제1 응답 문장을 표시하되, 부가적으로 상기 제2 응답 문장을 표시하는 표시부를 더 포함할 수 있다.
여기서, 상기 형식 언어는, 상기 자연어 질의 문장을 어순이나 어휘 변화에 민감하지 않은 형식화된 구조로 표현할 수 있다.
여기서, 상기 후보 생성 모듈은, 상기 단어를 형식 언어의 속성과 개체명으로 변환할 수 있다.
여기서, 상기 출력 모듈은, 상기 제1 질의 문장 또는 상기 제2 질의 문장을 상기 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스에 질의할 수 있는 표준인 SPARQL 규격을 준수하는 질의 문장으로 변환할 수 있다.
여기서, 상기 후보 평가 모듈은, 상기 질의 문장 후보를 평가하기 위하여, 상기 자연어 질의 문장 및 정답 문장의 쌍으로 구성된 데이터베이스를 통해 학습된 후보 평가 모델을 이용할 수 있다.
여기서, 상기 패턴 추출 모듈은, 상기 자연어 질의 문장이 미리 정의된 표현형을 포함하는지 여부, 상기 자연어 질의 문장이 청크(chunk) 단위로 분석되는 경우 상기 청크가 미리 정의된 어휘를 포함하는지 여부, 상기 청크의 수 및 상기 청크의 유형 중에서 적어도 하나를 고려하여 상기 질의 패턴을 추출할 수 있다.
여기서, 상기 템플릿은, 상기 자연어 질의 문장에 대응하는 형식 언어에 관한 슬롯 정보를 추출하기 위한 슬롯 정보 템플릿; 및 상기 슬롯 정보를 이용하여 상기 자연어 질의 문장을 상기 제2 질의 문장으로 변환하기 위한 질의 템플릿을 포함할 수 있다.
본 발명에 의하면, 자연어 질의 문장의 어순 변화나 어휘의 교체와 같은 변이에도 사용자의 정보 요구를 파악하여 적합도가 높은 응답을 출력할 수 있다.
도 1은 본 발명의 실시예에 따른 자동질의응답 장치에 관한 블록도이다.
도 2는 본 발명의 실시예에 따른 자동질의응답 방법에 관한 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 실시예에 따른 자동질의응답 장치에 관한 블록도이다.
도 1을 참조하면, 본 발명의 실시예에 따른 자동질의응답 시스템은 자동질의응답 장치(100), 데이터베이스(200), 후보 평가 모델 훈련기(310) 및 후보 평가 모델(320)을 포함한다.
여기서, 데이터베이스(200)는 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스, 복수의 샘플 질의 문장으로 구성된 데이터베이스, 자연어 질의 문장-정답 질의 문장의 쌍으로 구성된 데이터베이스와 자연어-속성 사전, 개체명 사전과 같은 사전 데이터베이스를 포함할 수 있다. 또한, 본 발명의 실시예에 관한 데이터베이스(200)는 지식베이스(knowledge base) 형태의 데이터베이스(database)를 의미한다.
본 발명의 실시예에 따른 자동질의응답 장치(100)는 의미 파싱 모듈(110) 및 질의 패턴 템플릿 모듈(120)을 포함한다.
의미 파싱 모듈(110)은 입력된 자연어 질의 문장으로부터 형식 언어로 표현된 제1 질의 문장을 생성하고, 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스로부터 제1 질의 문장에 대한 제1 응답 문장을 추출할 수 있다.
질의 패턴 템플릿 모듈(120)은 미리 정의된 질의 패턴 중에서 자연어 질의 문장이 해당하는 질의 패턴에 포함된 질의 템플릿을 자연어 문장에 적용함으로써 제2 질의 문장을 생성하고, 데이터베이스(200)로부터 제2 질의 문장에 대한 제2 응답을 추출할 수 있다.
여기서, 의미 파싱 모듈(110)에 의한 제1 응답 문장을 추출하는 과정과 질의 패턴 템플릿 모듈(120)에 의한 제2 응답 문장을 추출하는 과정은 동시에 발생하거나 순서에 관계없이 순차적으로 발생할 수 있다. 그리고, 본 발명의 실시예에 따른 자동질의응답 장치(100)는 표시부(미도시)를 이용하여 제1 응답 문장 및 제2 응답 문장을 사용자에게 동시에 표시하거나 순차적으로 표시할 수 있다.
입력되는 자연어 질의 문장에 따라 자동질의응답 장치(100)는 제1 응답 문장과 구별되는 제2 응답 문장을 표시할 수 있다. 따라서, 사용자는 자연어 질의 문장에 대한 응답으로서 제1 응답 문장을 확인할 수 있고, 제1 응답 문장이 응답으로서 적합하지 않은 경우 제2 응답 문장을 확인 및 참고할 수 있다. 따라서, 사용자 입장에서 템플릿 모듈(120)은 자연어 질의 문장에 관한 제2 응답을 추출하는 부가적인 역할을 수행할 수 있다.
의미 파싱 모듈(110)은 파서(111), 후보 생성 모듈(112) 및 후보 평가 모듈(113) 및 출력 모듈(114)을 포함할 수 있다.
의미 파싱 모듈(110)은 자연어 질의 문장으로부터 형식적인 의미 표현을 도출할 수 있다. 자연어 질의 문장에 관한 형식적인 의미 표현은 형식 언어에 의해 표현될 수 있다. 여기서, 형식 언어는 자연어 질의 문장을 어순이나 어휘 변화에 민감하지 않은 형식화된 구조로 표현할 수 있다. 따라서, 의미 파싱 모듈(110)은 형식 언어를 이용하여 자연어 질의 문장으로부터 형식 언어로 표현된 제1 질의 문장을 생성할 수 있다. 구체적으로, 의미 파싱 모듈(110)은 입력된 자연어 질의 문장으로부터 형식 언어로 표현된 제1 질의 문장을 생성하고, 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스로부터 제1 질의 문장에 대한 제1 응답을 추출할 수 있다.
파서(111)는 입력된 자연어 질의 문장을 단어 단위로 분할하고, 각각의 단어를 다시 결합하여 하나 이상의 구문을 생성할 수 있다. 이 과정에서, 파서(111)는 자연어 질의 문장에 포함된 기존 단어를 생략할 수 있다. 즉, 자연어 질의 문장을 구성하는 단어 중에서 의미에 큰 영향을 미치지 않는 단어는 생략될 수 있다. 여기서, 구문은 자연어 질의 문장을 이루는 단어의 연속열을 의미한다. 그리고 구문을 생성함에 있어서, 자연어 질의 문장 내에서 출현하는 단어의 순서가 유지되어야 한다. 예를 들어 자연어 질의 문장이 "who is the wife of abraham lincoln?"인 경우에, "who", "is", ..., "who is" 와 같은 구문이 생성될 수 있다.
후보 생성 모듈(112)은, 생성된 구문을 형식 언어로 표현된 형식 언어 구문으로 변환하고, 미리 정의된 형식 언어에 관한 문법에 기초하여 형식 언어 구문을 결합함으로써 하나 이상의 질의 문장 후보를 생성할 수 있다. 즉, 파서 모듈(111)에서 복수의 구문으로 분할된 자연어 질의 문장은 후보 생성 모듈(112)에서 개체명에 해당하는 부분과 속성에 해당하는 부분에 각각 상응하는 형식 언어인 지식베이스 어휘로 변환될 수 있다.
생성된 구문이 복수의 지식베이스 어휘로 변환이 가능한 경우, 사전 데이터베이스에 포함된 공기(co-occurrence, 共起) 정보에 의해 평가된 유사도가 더 높은 어휘가 선택될 수 있다. 여기서, 공기란 단어와 단어가 하나의 문서나 문장에서 함께 쓰이는 현상을 뜻한다. 다시 말하면, 형태, 형태소, 음, 음소 따위가 문법적으로 벗어나지 않고 동일한 문장, 구, 단어 안에서 나타나는 것을 뜻한다. 호응 관계가 있는 문법적 요소끼리 쓰이는 것을 공기 표현이라 하고 그러한 관계를 공기 관계라 한다.
각각의 구문에 대한 지식베이스 어휘로의 변환이 끝나면 형식 언어에 관한 문법인 지식베이스 어휘 간의 합성 문법에 따라 형식 의미 표현에 해당하는 하나 이상의 질의 문장 후보가 생성될 수 있다.
지식베이스 어휘 변환에 이용되는 사전 데이터베이스는 자연어-속성 사전 및 개체명 사전을 포함할 수 있다. 자연어-속성 사전은 자연어 어구와 지식베이스 속성 어휘와의 사상을 나타내는 사전 데이터베이스이다. 대량의 텍스트로부터 정보 추출 도구에 의해 정보가 추출되고, 추출된 정보와 실제 지식베이스가 정렬되어 자연어 어구와 속성 어휘의 쌍이 생성될 수 있으며, 이 때 얻어진 공기 정보가 유사도 평가에 사용된다.
개체명 사전은 지식베이스 개체명 어휘를 수집하여 구축된 사전 데이터베이스이다.
여기서, 형식 언어에 관한 문법은 결합규칙 사전으로 구현될 수 있다. 결합규칙 사전은 구문의 최소 단위 형식 의미 표현으로부터 전체 질의 문장을 대표하는 형식 의미 표현으로 합성하기 위한 소수의 유도 규칙을 포함하는 사전이다.
후보 평가 모듈(113)은, 질의 문장 후보에 포함된 형식 언어의 공기 정보로 평가되는 유사도의 합이 가장 높은 질의 문장 후보를 제1 질의 문장으로 선택할 수 있다. 즉, 후보 평가 모듈(113)은 후보 생성 모듈(112)에서 생성된 질의 문장 후보의 형식 의미 표현에 대하여 미리 앞서 공기 정보에 의하여 평가된 유사도의 합으로써 가장 유사도가 높다고 평가되는 형식 의미 표현을 갖는 질의 문장을 제1 질의 문장으로 선택할 수 있다.
또한, 후보 평가 모듈(113)은 질의 문장 후보를 평가하기 위하여, 자연어 질의 문장-정답 질의 문장의 쌍으로 구성된 데이터베이스를 통해 학습된 후보 평가 모델을 이용할 수 있다.
출력 모듈(114)은 제1 질의 문장 또는 제2 질의 문장을 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스에 질의할 수 있는 표준인 SPARQL 규격을 준수하는 질의 문장으로 변환할 수 있다.
후보 평가 모델 훈련기(310)는 후보 평가 모델(320)을 학습시킨다. 즉, 후보 평가 모델 훈련기(310)는 자연어 질의 문장-정답 질의 문장의 쌍으로 구성된 데이터베이스로부터 기계학습적 방법으로 형식적 의미 표현의 후보를 평가하기 위한 모델을 학습시키는 역할을 할 수 있다.
질의 패턴 템플릿 모듈(120)은 복수의 샘플 질의 문장으로부터, 입력된 자연어 질의 문장에 해당하는 질의 패턴을 추출하여 해당 질의 패턴에 포함된 템플릿을 자연어 질의 문장에 적용하여 데이터베이스로부터 응답을 추출하는 역할을 한다. 질의 패턴 템플릿 모듈(120)은, 패턴 추출 모듈(121), 템플릿 적용 모듈(122) 및 출력 모듈(123)을 포함할 수 있다.
패턴 추출 모듈(121)은 자연어 질의 문장으로부터 자질값을 확인하여 자질값이 일치하는 질의 패턴을 추출한다. 패턴 추출 모듈(121)은 자질값으로, 자연어 질의 문장이 미리 정의된 표현형을 포함하는지 여부, 자연어 질의 문장이 청크(chunk) 단위로 분석되는 경우 청크(chunk)가 미리 정의된 어휘를 포함하는지 여부, 청크(chunk)의 수 및 청크(chunk)의 유형 중에서 적어도 하나를 고려하여 질의 패턴을 추출할 수 있다. 여기서, 청크(chunk)는 의미적 또는 문법적으로 기능이 서로 유관한 문장 내의 단어로 구성될 수 있다. 또한, 청크(chunk)는 기능 또는 역할을 대표하는 핵심어휘를 포함하는 문장 내 단어의 연속열을 의미한다.
템플릿 적용 모듈(122)은 추출된 질의 패턴에 해당하는 템플릿을 자연어 질의 문장에 적용하여 자연어 질의 문장을 형식 언어로 표현된 제2 질의 문장으로 변환할 수 있다.
여기서 적용되는 템플릿은, 자연어 질의 문장에 대응하는 형식 언어에 관한 슬롯 정보를 추출하기 위한 슬롯 정보 템플릿 및 슬롯 정보를 이용하여 자연어 질의 문장을 제2 질의 문장으로 변환하기 위한 질의 템플릿을 포함할 수 있다.
이하 본 발명의 실시예에 따른 자동질의응답 방법에 대해 설명하기로 한다.
도 2는 본 발명의 실시예에 따른 자동질의응답 방법에 관한 흐름도이다.
도 2를 참조하면, 파서(111)는 입력된 자연어 질의 문장을 단어 단위로 분할하고, 분할된 단어를 결합하여 하나 이상의 구문을 생성할 수 있다(S211). 여기서, 파서(111)는, 재조합 과정에서 기존 단어를 생략할 수 있다.
후보 생성 모듈은(112) 구문 각각에 포함된 단어를 형식 언어로 변환하고, 미리 정의된 형식 언어에 관한 문법에 기초하여 형식 언어 구문을 결합함으로써 하나 이상의 질의 문장 후보를 생성할 수 있다(S212, S213).
또한, 후보 평가 모듈(113)은 질의 문장 후보에 포함된 형식 언어의 누적 변화 수로 평가되는 유사도의 합이 가장 높은 질의 문장 후보를 제1 질의 문장으로 선택할 수 있다.
출력 모듈(114)은 형식 언어로 표현된 복수의 질의 문장-응답 문자의 쌍으로 구성된 데이터베이스로부터 제1 질의 문장에 대한 제1 응답 문장을 추출할 수 있다(S214).
다음으로, 부가적인 절차로서 자동질의응답 장치(100)는 다음의 절차를 수행할 수 있다. 즉, 자동질의응답 장치(100)는 일차적으로 제1 응답 문장을 표시하되, 부가적으로 제2 응답 문장을 표시할 수 있다. 제2 응답 문장을 표시하는 단계는 사용자의 선택에 의할 수 있다.
패턴 추출 모듈(121)은 복수의 샘플 질의 문장으로 구성된 데이터베이스를 기초로 미리 정의된 질의 패턴 중에서 자연어 질의 문장이 해당하는 질의 패턴을 추출할 수 있다(S221). 여기서, 복수의 샘플 질의 문장으로 구성된 데이터베이스는 패턴 사전 형태로 구현될 수 있다. 패턴 사전은 미리 수동으로 구현될 수 있다. 패턴 사전 내의 하나의 엔트리는 문장 패턴 규칙, 슬롯 정보 템플릿, 질의 템플릿을 포함한다.
문장 패턴 규칙은 다시 어휘 패턴, 청크(chunk) 유형 패턴, 청크 내 패턴으로 나뉜다. 어휘 패턴은 직접적인 어휘의 존재 여부를 통해 일치하는 패턴을 판단하는 규칙이다. 청크 패턴은 자연어 질의 문장을 청킹(chunking) 한 결과 얻어진 청크(chunk)의 수 및 유형을 통해 일치하는 패턴을 판단하는 규칙이다. 청크 내 패턴은 청크 내의 요소 중 규칙에 포함된 품사를 갖는 어휘가 존재하는 지의 여부를 통해 일치하는 패턴을 판단하는 규칙이다.
다음으로 템플릿 적용 모듈(122)은 추출된 질의 패턴에 포함된 템플릿을 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성할 수 있다(S222).
다음으로 출력 모듈(123)은 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스로부터 제2 질의 문장에 대한 제2 응답 문장을 추출할 수 있다(S223).
이상과 같이 본 발명의 실시예에 따른 자동질의응답 장치(100)는 입력된 자연어 질의 문장에 대해 의미 파싱 모듈(110)을 이용하여 제1 질의 문장에 대한 제1 응답을 표시하는 한편, 부가적으로 자연어 질의 문장에 대해 질의 패턴 템플릿 모듈(120)을 이용하여 제2 질의 문장에 대한 제2 응답을 표시할 수 있다. 여기서, 의미 파싱 모듈(110)를 이용하는 방법은 여러 가지 구성 요소가 결합된 형태의 자연어 질의 문장에 적합하고, 질의 패턴 템플릿 모듈(120)을 이용하는 방법은 단순한 형태의 자연어 질의 문장에 적합하다. 따라서, 본 발명에 의하면, 자연어 질의 문장의 형태에 따라 서로 다른 방법에 의해 응답을 추출할 수 있어서, 사용용자의 정보 요구에 부합하는 응답을 출력할 수 있다.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 매체의 예에는 롬(rom), 램(ram), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 자동질의응답 장치,
110: 의미 파싱 모듈,
111: 파서,
112: 후보 생성 모듈
113: 후보 평가 모듈
114: 출력 모듈
120: 질의 패턴 템플릿 모듈,
121: 패턴 추출 모듈
122: 템플릿 적용 모듈,
123: 출력 모듈
200: 데이터 베이스,
310: 후보 평가 모델 훈련기,
320: 후보 평가 모델

Claims (19)

  1. 자동질의응답 장치에서 수행되는 자동질의응답 방법에 있어서,
    입력된 자연어 질의 문장에 포함된 복수의 단어들을 분할하는 단계;
    분할된 상기 복수의 단어들 중 각 단어의 어순이 유지되는 적어도 하나의 단어를 결합하여 복수의 구문들을 생성하는 단계;
    상기 복수의 구문들 각각에 포함된 단어를 상기 각 단어의 어순 및 의미가 유지되는 구조를 가지는 형식 언어의 속성 및 개체명으로 변환하는 단계;
    미리 정의된 상기 형식 언어에 관한 문법에 따라 형식 언어로 변환된 상기 구문을 결합함으로써 제1 질의 문장을 생성하는 단계;
    상기 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스로부터 상기 제1 질의 문장에 대한 제1 응답 문장을 추출하는 단계;
    복수의 샘플 질의 문장으로 구성된 데이터베이스를 기초로 미리 정의된 질의 패턴 중에서 상기 자연어 질의 문장이 해당하는 질의 패턴을 추출하는 단계;
    상기 추출된 질의 패턴에 해당하는 템플릿을 상기 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성하는 단계;
    상기 제2 질의 문장에 대한 제2 응답 문장을 추출하는 단계; 및
    상기 자연어 질의 문장에 대한 응답으로 상기 제1 응답 문장 및 상기 제2 응답 문장을 표시하는 단계를 포함하되,
    상기 복수의 구문들을 생성하는 단계에서 상기 복수의 단어들 중 상기 복수의 구문들 각각에 포함되지 않은 단어는 생략되는, 자동질의응답 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 청구항 1에 있어서,
    상기 제1 질의 문장을 생성하는 단계는,
    상기 형식 언어로 표현된 하나 이상의 질의 문장 후보를 생성하는 단계; 및
    상기 질의 문장 후보에 포함된 형식 언어의 공기(co-occurrence, 共起) 정보로 평가되는 유사도의 합이 가장 높은 질의 문장 후보를 상기 제1 질의 문장으로 선택하는 단계를 포함하는, 자동질의응답 방법.
  7. 청구항 6에 있어서,
    상기 제1 질의 문장으로 선택하는 단계는,
    상기 질의 문장 후보를 평가하기 위하여, 자연어 질의 문장-정답 질의 문장의 쌍으로 구성된 데이터베이스를 기반으로 학습된 후보 평가 모델을 이용하는, 자동질의응답 방법.
  8. 청구항 1에 있어서,
    상기 질의 패턴을 추출하는 단계는,
    상기 자연어 질의 문장이 미리 정의된 표현형을 포함하는지 여부, 상기 자연어 질의 문장이 청크(chunk) 단위로 분석되는 경우 상기 청크가 미리 정의된 어휘를 포함하는지 여부, 상기 청크의 수 및 상기 청크의 유형 중에서 적어도 하나를 고려하여 상기 질의 패턴을 추출하는, 자동질의응답 방법.
  9. 청구항 1에 있어서,
    상기 템플릿은,
    상기 자연어 질의 문장에 대응하는 형식 언어에 관한 슬롯 정보를 추출하기 위한 슬롯 정보 템플릿; 및
    상기 슬롯 정보를 이용하여 상기 자연어 질의 문장을 상기 제2 질의 문장으로 변환하기 위한 질의 템플릿을 포함하는, 자동질의응답 방법.
  10. 자동질의응답 장치에 있어서,
    입력된 자연어 질의 문장에 포함된 복수의 단어들을 분할하고, 분할된 상기 복수의 단어들 중 각 단어의 어순이 유지되는 적어도 하나의 단어를 결합하여 복수의 구문들을 생성하는 파서를 포함하고, 상기 복수의 구문들 각각에 포함된 단어를 상기 단어의 어순 및 의미가 유지되는 구조를 가지는 형식 언어의 속성 및 개체명으로 변환하고 미리 정의된 상기 형식 언어에 관한 문법에 따라 형식 언어로 변환된 상기 구문을 결합함으로써 제1 질의 문장을 생성하고, 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스로부터 상기 제1 질의 문장에 대한 제1 응답 문장을 추출하는 의미 파싱 모듈;
    미리 정의된 질의 패턴 중에서 상기 자연어 질의 문장이 해당하는 질의 패턴에 포함된 질의 템플릿을 상기 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성하고, 상기 데이터베이스로부터 상기 제2 질의 문장에 대한 제2 응답 문장을 추출하는 질의 패턴 템플릿 모듈;
    상기 자연어 질의 문장에 대한 응답으로 상기 제1 응답 문장 및 상기 제2 응답 문장을 표시하는 표시부를 포함하되,
    상기 파서는 상기 복수의 구문들을 생성하는 과정에서 상기 복수의 단어들 중 상기 복수의 구문들 각각에 포함되지 않은 단어를 생략하는, 자동질의응답 장치.
  11. 청구항 10에 있어서,
    상기 의미 파싱 모듈은,
    상기 구문을 형식 언어로 표현된 형식 언어 구문으로 변환하고, 미리 정의된 상기 형식 언어에 관한 문법에 기초하여 상기 형식 언어 구문을 결합함으로써 하나 이상의 질의 문장 후보를 생성하는 후보 생성 모듈;
    상기 질의 문장 후보에 포함된 형식 언어의 공기 정보로 평가되는 유사도의 합이 가장 높은 질의 문장 후보를 제1 질의 문장으로 선택하는 후보 평가 모듈; 및
    상기 제1 질의 문장에 대한 제1 응답 문장을 추출하는, 출력 모듈을 더 포함하는, 자동질의응답 장치.
  12. 청구항 10에 있어서,
    상기 질의 패턴 템플릿 모듈은,
    미리 정의된 질의 패턴 중에서 상기 자연어 질의 문장이 해당하는 질의 패턴을 추출하는 패턴 추출 모듈;
    상기 질의 패턴에 포함된 템플릿을 상기 자연어 질의 문장에 적용함으로써 제2 질의 문장을 생성하는 템플릿 적용 모듈; 및
    상기 제2 질의 문장에 대한 제2 응답을 추출하는 출력 모듈을 포함하는, 자동질의응답 장치.
  13. 삭제
  14. 삭제
  15. 삭제
  16. 청구항 11 또는 12에 있어서,
    상기 출력 모듈은,
    상기 제1 질의 문장 또는 상기 제2 질의 문장을 상기 형식 언어로 표현된 복수의 질의 문장-응답 문장의 쌍으로 구성된 데이터베이스에 질의할 수 있는 표준인 SPARQL 규격을 준수하는 질의 문장으로 변환하는, 자동질의응답 장치.
  17. 청구항 11에 있어서,
    상기 후보 평가 모듈은,
    상기 질의 문장 후보를 평가하기 위하여, 상기 자연어 질의 문장-정답 질의 문장의 쌍으로 구성된 데이터베이스를 통해 학습된 후보 평가 모델을 이용하는, 자동질의응답 장치.
  18. 청구항 12에 있어서,
    상기 패턴 추출 모듈은,
    상기 자연어 질의 문장이 미리 정의된 표현형을 포함하는지 여부, 상기 자연어 질의 문장이 청크(chunk) 단위로 분석되는 경우 상기 청크가 미리 정의된 어휘를 포함하는지 여부, 상기 청크의 수 및 상기 청크의 유형 중에서 적어도 하나를 고려하여 상기 질의 패턴을 추출하는, 자동질의응답 장치.
  19. 청구항 12에 있어서,
    상기 템플릿은,
    상기 자연어 질의 문장에 대응하는 형식 언어에 관한 슬롯 정보를 추출하기 위한 슬롯 정보 템플릿; 및
    상기 슬롯 정보를 이용하여 상기 자연어 질의 문장을 상기 제2 질의 문장으로 변환하기 위한 질의 템플릿을 포함하는, 자동질의응답 장치.
KR1020150100531A 2015-07-15 2015-07-15 자동질의응답 방법 및 그 장치 KR101678787B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150100531A KR101678787B1 (ko) 2015-07-15 2015-07-15 자동질의응답 방법 및 그 장치
PCT/KR2016/002275 WO2017010652A1 (ko) 2015-07-15 2016-03-08 자동질의응답 방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150100531A KR101678787B1 (ko) 2015-07-15 2015-07-15 자동질의응답 방법 및 그 장치

Publications (1)

Publication Number Publication Date
KR101678787B1 true KR101678787B1 (ko) 2016-12-06

Family

ID=57576302

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150100531A KR101678787B1 (ko) 2015-07-15 2015-07-15 자동질의응답 방법 및 그 장치

Country Status (2)

Country Link
KR (1) KR101678787B1 (ko)
WO (1) WO2017010652A1 (ko)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446286A (zh) * 2017-02-16 2018-08-24 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN109460503A (zh) * 2018-09-14 2019-03-12 广州神马移动信息科技有限公司 答案输入方法、装置、存储介质及电子设备
KR20190131270A (ko) * 2018-05-16 2019-11-26 (주)아이브릭스 질의자 의도를 이해하기 위한 구문 규칙 자동생성 장치 및 방법
KR20200014047A (ko) * 2018-07-31 2020-02-10 주식회사 포티투마루 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
KR20200036086A (ko) * 2018-09-19 2020-04-07 주식회사 포티투마루 인공 지능 질의 응답 시스템, 방법 및 컴퓨터 프로그램
KR20200058263A (ko) * 2018-11-13 2020-05-27 울산과학기술원 신경망 기반 자동 슬롯 채우기 기술 및 장치
KR20200083404A (ko) * 2018-09-19 2020-07-08 주식회사 포티투마루 인공 지능 질의 응답 시스템, 방법 및 컴퓨터 프로그램
KR20200101525A (ko) * 2019-01-31 2020-08-28 주식회사 카카오 자연어 질의해석 방법 및 시스템
CN111626059A (zh) * 2020-04-30 2020-09-04 联想(北京)有限公司 一种信息处理方法及装置
KR20210055449A (ko) * 2019-11-07 2021-05-17 주식회사 솔트룩스 대화 재구성 기반의 질의 응답 시스템
CN112988986A (zh) * 2019-12-02 2021-06-18 阿里巴巴集团控股有限公司 人机交互方法、装置与设备
KR20210082727A (ko) * 2019-12-26 2021-07-06 포항공과대학교 산학협력단 자연어 단어를 데이터베이스의 컬럼 및 테이블과 연결하는 방법
KR20220071791A (ko) * 2020-11-24 2022-05-31 경희대학교 산학협력단 응답과 질의 토큰의 관계에 기초하여 상기 질의에 대한 답변을 제공하는 방법 및 전자 장치
CN114817510A (zh) * 2022-06-23 2022-07-29 清华大学 问答方法、问答数据集生成方法及装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807091B (zh) * 2019-03-01 2023-08-18 王涵 一种酒店智能问答推荐与决策支持分析方法及系统
CN110162538B (zh) * 2019-04-19 2024-03-01 平安科技(深圳)有限公司 自动生成通用查询语言cql的方法、装置和计算机设备
CN110597968A (zh) * 2019-04-28 2019-12-20 河北省讯飞人工智能研究院 一种回复选择方法及装置
CN110298030B (zh) * 2019-05-24 2022-06-17 平安科技(深圳)有限公司 语义分析模型准确度的校验方法、装置、存储介质及设备
CN110750632B (zh) * 2019-10-21 2022-09-09 闽江学院 一种改进的中文alice智能问答方法及系统
US12014284B2 (en) 2019-12-27 2024-06-18 Industrial Technology Research Institute Question-answering learning method and question-answering learning system using the same and computer program product thereof
CN113051393A (zh) * 2019-12-27 2021-06-29 财团法人工业技术研究院 问答学习方法、问答学习系统及其计算机程序产品
CN111506595B (zh) * 2020-04-20 2024-03-19 金蝶软件(中国)有限公司 一种数据查询方法、系统及相关设备
CN111897915B (zh) * 2020-07-24 2024-04-12 海信集团有限公司 问答设备和答复信息确定方法
US11704497B2 (en) 2020-09-09 2023-07-18 International Business Machines Corporation Generating and using a sentence model for answer generation
CN112989002B (zh) * 2021-03-31 2022-08-23 中国工商银行股份有限公司 一种基于知识图谱的问答处理方法、装置及设备
CN114186016A (zh) * 2021-09-30 2022-03-15 阿里巴巴达摩院(杭州)科技有限公司 人机对话方法、装置、设备及存储介质
CN114579605B (zh) * 2022-04-26 2022-08-09 阿里巴巴达摩院(杭州)科技有限公司 表格问答数据处理方法、电子设备及计算机存储介质
CN115964471B (zh) * 2023-03-16 2023-06-02 成都安哲斯生物医药科技有限公司 医疗数据近似查询方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210556A (ja) * 1994-01-21 1995-08-11 Toshiba Corp 自然言語処理装置及び自然言語処理方法
KR20050032937A (ko) * 2003-10-02 2005-04-08 한국전자통신연구원 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템
KR20100120977A (ko) * 2009-05-07 2010-11-17 포항공과대학교 산학협력단 미등록어를 포함한 환경에서 오디오 및 비디오의 음성 데이터 검색 방법 및 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020030545A (ko) * 2000-10-18 2002-04-25 남 데이비드 이 인공지능과 자연어처리 기술에 기반한 자연어 문장형질문에 대한 자동 해답 및 검색 제공 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210556A (ja) * 1994-01-21 1995-08-11 Toshiba Corp 自然言語処理装置及び自然言語処理方法
KR20050032937A (ko) * 2003-10-02 2005-04-08 한국전자통신연구원 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템
KR20100120977A (ko) * 2009-05-07 2010-11-17 포항공과대학교 산학협력단 미등록어를 포함한 환경에서 오디오 및 비디오의 음성 데이터 검색 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
□ 심효섭외 2인, "Semantic Parsing 기반 지식 베이스 질의응답 시스템의 어휘-의미 패턴 질의 템플릿을 통한 보완", 제26회 한글 및 한국어 정보처리 학술대회 논문집 2014. *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446286A (zh) * 2017-02-16 2018-08-24 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
KR102099670B1 (ko) * 2018-05-16 2020-04-10 (주)아이브릭스 질의자 의도를 이해하기 위한 구문 규칙 자동생성 장치 및 방법
KR20190131270A (ko) * 2018-05-16 2019-11-26 (주)아이브릭스 질의자 의도를 이해하기 위한 구문 규칙 자동생성 장치 및 방법
KR20200014047A (ko) * 2018-07-31 2020-02-10 주식회사 포티투마루 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
KR102090237B1 (ko) 2018-07-31 2020-03-17 주식회사 포티투마루 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
CN109460503A (zh) * 2018-09-14 2019-03-12 广州神马移动信息科技有限公司 答案输入方法、装置、存储介质及电子设备
KR20200083404A (ko) * 2018-09-19 2020-07-08 주식회사 포티투마루 인공 지능 질의 응답 시스템, 방법 및 컴퓨터 프로그램
KR20200036086A (ko) * 2018-09-19 2020-04-07 주식회사 포티투마루 인공 지능 질의 응답 시스템, 방법 및 컴퓨터 프로그램
KR102128549B1 (ko) * 2018-09-19 2020-07-08 주식회사 포티투마루 인공 지능 질의 응답 시스템, 방법 및 컴퓨터 프로그램
US11822890B2 (en) 2018-09-19 2023-11-21 42 Maru Inc. Method, system, and computer program for artificial intelligence answer
US10832004B2 (en) 2018-09-19 2020-11-10 42 Maru Inc. Method, system, and computer program for artificial intelligence answer
US11373047B2 (en) 2018-09-19 2022-06-28 42 Maru Inc. Method, system, and computer program for artificial intelligence answer
KR102261199B1 (ko) * 2018-09-19 2021-06-07 주식회사 포티투마루 인공 지능 질의 응답 시스템, 방법 및 컴퓨터 프로그램
KR20200058263A (ko) * 2018-11-13 2020-05-27 울산과학기술원 신경망 기반 자동 슬롯 채우기 기술 및 장치
KR102346244B1 (ko) 2018-11-13 2022-01-04 울산과학기술원 신경망 기반 자동 슬롯 채우기 기술 및 장치
KR20200101525A (ko) * 2019-01-31 2020-08-28 주식회사 카카오 자연어 질의해석 방법 및 시스템
KR102150908B1 (ko) * 2019-01-31 2020-09-03 주식회사 카카오 자연어 질의해석 방법 및 시스템
KR102280792B1 (ko) * 2019-11-07 2021-07-22 주식회사 솔트룩스 대화 재구성 기반의 질의 응답 시스템
KR20210055449A (ko) * 2019-11-07 2021-05-17 주식회사 솔트룩스 대화 재구성 기반의 질의 응답 시스템
CN112988986A (zh) * 2019-12-02 2021-06-18 阿里巴巴集团控股有限公司 人机交互方法、装置与设备
CN112988986B (zh) * 2019-12-02 2024-05-31 阿里巴巴集团控股有限公司 人机交互方法、装置与设备
KR20210082727A (ko) * 2019-12-26 2021-07-06 포항공과대학교 산학협력단 자연어 단어를 데이터베이스의 컬럼 및 테이블과 연결하는 방법
KR102345568B1 (ko) 2019-12-26 2021-12-31 포항공과대학교 산학협력단 자연어 단어를 데이터베이스의 컬럼 및 테이블과 연결하는 방법
CN111626059A (zh) * 2020-04-30 2020-09-04 联想(北京)有限公司 一种信息处理方法及装置
KR20220071791A (ko) * 2020-11-24 2022-05-31 경희대학교 산학협력단 응답과 질의 토큰의 관계에 기초하여 상기 질의에 대한 답변을 제공하는 방법 및 전자 장치
KR102464121B1 (ko) 2020-11-24 2022-11-04 경희대학교 산학협력단 응답과 질의 토큰의 관계에 기초하여 상기 질의에 대한 답변을 제공하는 방법 및 전자 장치
CN114817510A (zh) * 2022-06-23 2022-07-29 清华大学 问答方法、问答数据集生成方法及装置

Also Published As

Publication number Publication date
WO2017010652A1 (ko) 2017-01-19

Similar Documents

Publication Publication Date Title
KR101678787B1 (ko) 자동질의응답 방법 및 그 장치
CN111104789B (zh) 文本评分方法、装置和系统
US9342499B2 (en) Round-trip translation for automated grammatical error correction
US8185377B2 (en) Diagnostic evaluation of machine translators
US9575955B2 (en) Method of detecting grammatical error, error detecting apparatus for the method, and computer-readable recording medium storing the method
Bolívar et al. Academic and professional discourse
CN103688254B (zh) 用于自动评估写作的基于示例的错误检测系统、方法及错误检测设备
KR20150017507A (ko) 한국어 어휘 의미망을 이용한 문맥 철자오류 교정 장치 및 방법
KR20140026703A (ko) 문법의 오류 검출 방법 및 이를 위한 장치
Shaalan et al. Analysis and feedback of erroneous Arabic verbs
Josan et al. A Punjabi to Hindi machine transliteration system
Okinina et al. Ctap for italian: Integrating components for the analysis of italian into a multilingual linguistic complexity analysis tool
Duran et al. Some issues on the normalization of a corpus of products reviews in Portuguese
Upadhyay et al. Transish: translator from Sanskrit to English-a rule based machine translation
WO2015012679A2 (en) A system and method for interpreting logical connectives in natural language query
CN115017902A (zh) 基于深度学习的藏语短语结构识别模型的构建方法及装置
Wolk et al. Unsupervised tool for quantification of progress in L2 English phraseological
Jain et al. Codeswitched sentence creation using dependency parsing
CN113822053A (zh) 一种语法错误检测方法、装置、电子设备及存储介质
Nolan et al. UniArab: RRG Arabic-to-English machine translation
Alkhazi et al. BAAC: Bangor Arabic Annotated Corpus
JP3919720B2 (ja) 換言装置及びコンピュータプログラム
Ehsan et al. Statistical Machine Translation as a Grammar Checker for Persian Language
Declerck et al. How to semantically relate dialectal Dictionaries in the Linked Data Framework
Gavhal et al. Sentence Compression Using Natural Language Processing

Legal Events

Date Code Title Description
GRNT Written decision to grant