KR101661198B1 - 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 - Google Patents

단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 Download PDF

Info

Publication number
KR101661198B1
KR101661198B1 KR1020140086954A KR20140086954A KR101661198B1 KR 101661198 B1 KR101661198 B1 KR 101661198B1 KR 1020140086954 A KR1020140086954 A KR 1020140086954A KR 20140086954 A KR20140086954 A KR 20140086954A KR 101661198 B1 KR101661198 B1 KR 101661198B1
Authority
KR
South Korea
Prior art keywords
information
search
entity
query
language
Prior art date
Application number
KR1020140086954A
Other languages
English (en)
Other versions
KR20160007040A (ko
Inventor
장재혁
김기영
김명석
최지혜
이원진
이현아
이용훈
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020140086954A priority Critical patent/KR101661198B1/ko
Priority to JP2015138524A priority patent/JP6014725B2/ja
Priority to US14/796,074 priority patent/US10157201B2/en
Publication of KR20160007040A publication Critical patent/KR20160007040A/ko
Application granted granted Critical
Publication of KR101661198B1 publication Critical patent/KR101661198B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Abstract

본 발명은 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법에 관한 것으로, 자연어 질의어의 의미분석을 통해 상기 자연어 질의어에 포함된 하나 이상의 질의 엔티티에 기초하여 다수 레벨로 이루어진 트리구조 메시업검색언어를 생성하는 메시업검색언어 생성 단계; 상기 메시업검색언어의 속성 정보를 토대로 레벨별 메시업검색언어를 구성하는 질의 엔티티를 통해 상기 메시업검색언어의 각 레벨이 연관(linking)되어 있는지 여부를 판단하는 속성 분석 단계; 상기 판단 결과에 따라, 지식 데이터베이스로부터 상기 메시업검색언어의 각 레벨별 질의 엔티티에 대응되는 데이터를 검색하고, 상기 검색 결과 도출한 데이터로부터 상기 자연어 질의어에 대응되는 주요정보 및 하나 이상의 엔티티 정보를 도출하는 검색 단계; 및 상기 주요정보 및 상기 하나 이상의 엔티티 정보를 포함하는 검색결과화면을 레이아웃하는 정보 제공 단계를 포함한다.

Description

단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 {Method and system for searching by using natural language query}
본 발명은 자연어 질의에 대한 정보 추출 및 제공 방법 등에 관한 것으로, 구체적으로는 단문/복문 구조의 의미 태깅된 자연어 질의에 대해 사용자 의도에 부합되는 검색결과 및 질의 엔티티와 관련있는 연관정보를 효율적으로 제공하는 방법 및 시스템에 관한 것이다.
온톨로지(Ontology)는 실세계 객체 간의 의미적인 관계를 정의함으로써 컴퓨터가 객체 간의 복잡한 관계로부터 추론되는 정보에 접근하기 위한 정보에 대한 의미적인 명세를 제공하는 것으로서, 인공지능, 정보 검색, 유비쿼터스, 전자상거래 등 다양한 분양에서 응용될 수 있다.
특히, 상기 온톨로지는 웹상의 다양한 정보를 대상 간의 의미적인 관계로 표현함으로써, 정보 검색 분야에서 기존의 키워드 기반 검색으로 찾을 수 없었던 논리적인 질의 결과를 얻을 수 있다. 예를 들어, 온톨로지를 이용할 경우, "인구가 7천만 이상이고, 바다와 인접한 나라의 수도는 어디인가?"와 같은 질의에 대한 결과를 얻을 수 있다.
이러한 온톨로지 정보 검색은 키워드 기반 검색에 비해 세 가지 측면에서 유용성을 가진다. 첫째, 키워드 기반 검색의 결과는 입력 키워드가 포함된 문서만을 검색 결과로 제공하지만, 온톨로지 정보 검색은 사용자가 찾고자하는 특정 대상과 이에 대한 속성 정보를 직접적으로 제공할 수 있다. 둘째, 키워드 기반 검색은 입력 키워드 간의 관계가 반영된 검색 결과를 보장할 수 없지만, 온톨로지 정보 검색은 찾고자 하는 대상을 특징지을 수 있는 다른 대상들과의 관계로부터 정보를 찾을 수 있다. 셋째, 키워드 기반 검색은 이미 존재하는 정보만을 검색할 수 있지만, 온톨로지 정보 검색은 대상 간의 관계로부터 새로운 관계를 찾음으로써 기존에 존재하지 않았던 새로운 정보를 추론할 수 있다.
그런데, 이러한 온톨로지 정보 검색은 사용자가 원하는 질의 대상을 바로 찾음으로써 사용자의 편의성에서 큰 도움이 되나, 일반 사용자에게 익숙하지 않은 온톨로지 질의 언어를 사용해야 하기 때문에, 일반 사용자 입장에서 접근이 어렵다는 문제점이 있다. 결국, 일반 사용자가 온톨로지로 구축된 정보에 접근하기 위해서는 온톨로지의 구조나 온톨로지 질의 언어를 익혀야 하므로 온톨로지의 효용성이 떨어진다.
한편, 자연어는 온톨로지 질의 언어로 표현되는 논리적인 의미를 표현하기에 충분하고, 일반 사용자에게 익숙하다. 따라서, 자연어 질의로 온톨로지 정보에 접근할 수 있다면, 일반 사용자의 접근을 쉽게 하여 온톨로지 정보 검색의 효용성을 높일 수 있다.
온톨로지 정보를 자연어 질의로 접근하기 위해서는 자연어 질의를 온톨로지 질의 언어로 변환하는 기술이 요구되며, 이를 위해서는 먼저, 자연어 처리 기술을 활용하여 자연어 질의에 대한 구조 및 의미를 분석하고, 분석된 자연어 질의 정보로부터 자연어 표현에 대응하는 온톨로지의 객체 및 관계를 찾고 온톨로지 질의 언어의 문법 구조에 맞게 자연어 질의를 온톨로지 질의 언어로 변환하여야 한다.
그런데 이 방법은, 자연어 질의에 대한 구조 분석 및 의미 분석 등의 오류로 인해 접근할 수 없는 온톨로지 질의 언어가 발생하는 문제점이 있다. 더 구체적으로 설명하면, 일반적인 자연어 처리 기술이 검색 대상 온톨로지에 접근할 수 있는 자연어 표현을 처리하는데 필요한 모든 언어 자원을 갖추었다는 보장이 없고, 사소한 문법적인 오류로 잘못된 분석 결과를 가져 올 수 있기 때문에 접근할 수 없는 온톨로지 질의어가 발생할 수 있다.
결국, 기존의 검색방법에 따르면, 사용자는 오류가 나는 질의에 대해 여러 번의 시행착오를 거치면서 시스템이 처리할 수 있는 질의 유형을 익혀야 하는데, 이렇게 되면, 온톨로지 기반의 정보 검색을 처음 이용하는 사용자는 자연어 처리 기술이 수용할 수 있는 질의 형태와 온톨로지에 구축된 정보의 구체적인 내용을 모르기 때문에 어떤 질의가 유용한지 알 수 없게 된다.
또한, 서비스 제공자 입장에서, 구축된 온톨로지 정보를 모두 제공할 수 없다는 것을 보유하고 있는 정보의 유용성을 충분히 보이지 못하는 것을 의미한다.
그런데 대부분의 사용자는 서비스 제공자가 준비한 온톨로지에 대한 정보나 질의 입력 방법을 꼼꼼하게 숙지하기보다는 키워드 기반 정보 검색을 하듯이 직관적으로 사용하기를 원하며, 새로운 시스템에 적응하는데 투자하는 시간과 노력에 비례하여, 그 시스템에 대한 활용도나 만족도는 줄어들게 된다.
따라서, 정보 검색의 효용성 및 정확성을 높이기 위한 자연어이해 기술(Natural Language Understanding: NLU)에 대한 연구가 계속되고 있다. 자연어 기술은 '사용자 질문'을 대상으로 사용자의 질문 의도를 파악하려는 것으로, 음성으로 발화하거나 텍스트로 입력한 질문이 입력이 되고, 자연어 기술기법에서 질문 의도를 파악하여 추출한 리스트가 해당 질문에 대한 출력이 되는 것을 의미한다.
이와 관련된 선행문헌으로 특허 등록번호 10-0980579호가 있지만, 상기 선행문헌은 기존의 키워드 기반 질의에 비하여 복잡한 질의가 가능하도록 하는 반면 질의에 포함된 사용자의 질의 의도를 정확하게 파악하고 그에 부합하는 검색 결과를 제공하는 것이 어렵다는 문제점이 있다.
한국 등록특허 제10-0980579호(2010.09.06. 공고)
의미 태깅 기반의 자연어 질의는 기존의 키워드 기반 질의에 비하여 복잡한 질의가 가능하도록 하는 반면 질의에 포함된 사용자의 질의 의도를 정확하게 파악하고 그에 부합되는 검색 결과를 제공하는 것이 어렵다.
본 발명의 목적은 상술한 문제점을 해결하기 위하여 안출된 것으로, 의미 태깅된 단문/복문 구조의 자연어 질의를 분석하여 계층적 트리 구조로 상위 엔티티에서 하위 엔티티로 단계적으로 데이터를 검색함에 따라 사용자 의도에 부합되는 정보를 단계적으로 제공하는 방법 및 시스템을 제안하는 것이다.
또한, 본 발명의 다른 목적은 복문 구조의 자연어 질의를 구성하는 엔티티를 기반으로 검색한 엔티티 정보를 추출하여 사용자의 질의에 대한 검색결과와 함께 효율적으로 제공할 수 있는 레이아웃 방법을 제안하는 것이다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상술한 문제를 해결하기 위한 본 발명의 일 양태 일 실시예에 따른 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법은, 자연어 질의어의 의미분석을 통해 상기 자연어 질의어에 포함된 하나 이상의 질의 엔티티에 기초하여 다수 레벨로 이루어진 트리구조 메시업검색언어를 생성하는 메시업검색언어 생성 단계; 상기 메시업검색언어의 속성 정보를 토대로 레벨별 메시업검색언어를 구성하는 질의 엔티티를 통해 상기 메시업검색언어의 각 레벨이 연관(linking)되어 있는지 여부를 판단하는 속성 분석 단계; 상기 판단 결과에 따라, 지식 데이터베이스로부터 상기 메시업검색언어의 각 레벨별 질의 엔티티에 대응되는 데이터를 검색하고, 상기 검색 결과 도출한 데이터로부터 상기 자연어 질의어에 대응되는 주요정보 및 하나 이상의 엔티티 정보를 도출하는 검색 단계; 및 상기 주요정보 및 상기 하나 이상의 엔티티 정보를 포함하는 검색결과화면을 레이아웃하는 정보 제공 단계를 포함한다.
본 발명의 실시예에 따른 상기 메시업검색언어 생성 단계는, 상기 자연어 질의어의 의미분석을 통해 상기 자연어 질의어가 단문구조인지 또는 복문구조인지 여부를 판단하는 단계; 상기 자연어 질의어가 복문구조인 경우, 복문구조의 질의어로부터 둘 이상의 질의 문구를 도출하는 단계; 및 상기 도출한 둘 이상의 질의 문구를 토대로 상기 트리구조 메시업검색언어를 생성하는 단계를 포함할 수 있다.
본 발명의 실시예에 따른 상기 속성 분석 단계는, 상기 메시업검색언어의 속성 및 도메인 정보를 분석하는 단계; 상기 분석 결과에 따라 상기 메시업검색언어에 대응하는 검색환경정보를 선택하는 단계; 및 상기 선택한 검색환경정보를 이용하여 상기 메시업검색언어를 정규화하는 단계를 포함할 수 있다. 또한, 상기 속성 분석 단계는, 상기 정규화된 메시업검색언어를 상기 선택한 검색환경정보를 이용하여 상기 대상검색언어로 변환하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따른 상기 데이터 검색 단계는, 상기 판단 결과에 따라 상기 메시업검색언어의 각 레벨이 연관(linking)되어 있는 경우, 상기 지식 데이터베이스로부터 상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터를 검색 및 도출하는 단계; 및 상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터에 기초하여 상기 지식 데이터베이스로부터 연속하는 하위 레벨 엔티티에 대응하는 데이터를 검색 및 도출하는 단계를 포함하며, 상기 데이터 검색 단계는 상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 검색 및 도출하기까지 순차적으로 반복될 수 있다.
이때, 본 발명의 실시예에 따른 상기 데이터 검색 단계는,상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 상기 주요정보로 도출하고, 나머지 도출된 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출하는 단계를 더 포함할 수 있다. 그리고, 본 발명의 실시예에 따른 상기 정보 제공 단계는, 상기 검색결과화면의 상단부에 상기 메시업검색언어의 최상위 레벨 엔티티 정보를 출력하고, 상기 메시업검색언어의 최상위 레벨 엔티티 정보의 하단부에 연속하는 하위 레벨 엔티티 정보를 출력하며, 상기 메시업검색언어의 최하위 레벨 엔티티 정보를 상기 주요정보로 출력하는 방식을 이용할 수 있다.
한편, 본 발명의 실시예에 따른 상기 정보 제공 단계는,상기 주요정보 및 상기 하나 이상의 엔티티정보를 하나 이상의 속성 정보, 이미지 정보 및 영상 정보 중 적어도 하나를 포함하는 축약된 정보 형태로 가공하는 단계를 포함할 수 있다.
나아가, 본 발명의 실시예에 따른 상기 정보 제공 단계는, 상기 검색결과화면상의 다수의 엔티티 정보 중 어느 하나에 대한 사용자 선택신호 입력시, 상기 사용자 선택신호에 대응하는 엔티티에 관한 정보를 엔티티 상세정보로 가공하는 단계; 및 상기 검색결과화면을 상기 주요정보 및 상기 하나 이상의 엔티티정보가 출력되는 축약정보영역 및 상기 엔티티 상세정보가 출력되는 상세정보영역으로 구분하여 레이아웃 변경하는 단계를 더 포함할 수 있다.
본 발명의 다른 실시예에 따른 상기 데이터 검색 단계는, 상기 판단 결과에 따라 상기 메시업검색언어의 각 레벨이 연관되지 않은 경우, 상기 지식 데이터베이스로부터 상기 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 검색 및 도출하는 단계; 및 상기 도출한 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 대상으로 상기 자연어 질의어의 의미분석 결과에 따른 논리적 연산을 적용하여 최종 결과 데이터를 도출하는 단계를 더 포함할 수 있다.
이때, 본 발명의 실시예에 따른 상기 데이터 검색 단계는, 상기 최종 결과 데이터를 상기 주요정보로 도출하고, 상기 도출한 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출하는 단계를 더 포함할 수 있다.
그리고, 본 발명의 실시예에 따른 상기 정보 제공 단계는, 상기 검색결과화면을 상기 주요정보 및 주요정보 관련정보가 출력되는 주요정보 영역 및 상기 하나 이상의 엔티티정보를 출력하는 엔티티 영역으로 구분하여 레이아웃할 수 있다.
한편, 본 발명의 실시예에 따른 상기 정보 제공 단계는, 상기 주요정보가 단일 속성의 정보인 경우, 상기 주요정보를 자연어 기반의 응답 형태로 가공하여 제공하는 단계를 더 포함할 수 있다.
상술한 과제를 해결하기 위한 본 발명의 다른 양태 일 실시예에 따른 자연어 질의어 기반의 검색 시스템에 있어서, 사용자 디바이스를 통해 입력된 자연어 질의어의 의미분석을 통해 상기 자연어 질의어에 포함된 하나 이상의 질의 엔티티에 기초하여 다수 레벨로 이루어진 트리구조 메시업검색언어로 변환하는 자연어처리엔진; 및 상기 메시업검색언어의 속성 정보를 토대로 상기 메시업검색언어의 각 레벨이 연관(linking)되어 있는지 여부를 판단하여 레벨별 메시업검색언어를 구성하는 질의 엔티티에 대응되는 데이터를 검색하는 검색엔진을 포함하며, 상기 검색엔진은, 상기 레벨별 메시업검색언어를 구성하는 질의 엔티티에 대응되는 데이터로부터 상기 자연어 질의어에 대응되는 주요정보 및 하나 이상의 엔티티 정보를 가공하여 동일 검색결과화면상에 레이아웃할 수 있다.
본 발명의 실시예에 따른 상기 자연어처리 엔진은, 상기 자연어 질의어의 의미분석을 통해 상기 자연어 질의어가 단문구조인지 또는 복문구조인지 여부를 판단하고, 상기 자연어 질의어가 복문구조인 경우, 복문구조의 질의어로부터 둘 이상의 질의 문구를 도출하는 의미분석모듈; 및 상기 도출한 둘 이상의 질의 문구를 토대로 상기 트리구조 메시업검색언어를 생성하는 메시업검색언어 변환 모듈을 포함할 수 있다.
본 발명의 실시예에 따른 상기 검색 엔진은, 상기 메시업검색언어의 속성 정보를 분석하여 상기 메시업검색언어에 대응하는 검색환경정보를 선택하고, 상기 선택한 검색환경정보를 이용하여 상기 메시업검색언어를 정규화하는 메시업검색언어 정규화 모듈; 상기 검색환경정보에 따라 상기 정규화된 메시업검색언어를 상기 대상검색 언어로 변환하는 대상검색언어 변환 모듈; 상기 검색환경정보에 따라 상기 지식 데이터베이스로부터 상기 대상검색언어에 대한 물리적 데이터를 검색 및 도출하여 결과 데이터를 생성하는 데이터 도출 모듈; 및 상기 검색환경정보에 따라 상기 데이터 도출 모듈에서 생성한 결과 데이터를 가공하고, 상기 가공된 데이터를 포함하는 검색결과화면을 생성하는 데이터 가공 모듈을 포함할 수 있다.
이때, 본 발명의 일 실시예에 따른 상기 데이터 도출 모듈은, 상기 메시업검색언어 정규화 모듈에서의 속성 분석 결과에 따라 메시업검색언어의 각 레벨이 연관(linking)되어 있는 경우, 상기 지식 데이터베이스로부터 상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터를 도출하고, 상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터에 기초하여 상기 지식 데이터베이스로부터 연속하는 하위 레벨 엔티티에 대응하는 데이터를 도출하며, 상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 도출하기까지 순차적으로 데이터 도출을 수행할 수 있다.
또한, 상기 데이터 도출 모듈은, 상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 상기 주요정보로 도출하고, 나머지 도출된 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출하는 단계를 더 포함할 수 있다.
그리고, 본 발명의 실시예에 따른 상기 데이터 가공 모듈은, 상기 검색결과화면의 상단부에 상기 메시업검색언어의 최상위 레벨 엔티티 정보를 출력하고, 상기 메시업검색언어의 최상위 레벨 엔티티 정보의 하단부에 연속하는 하위 레벨 엔티티 정보를 출력하며, 상기 메시업검색언어의 최하위 레벨 엔티티 정보를 상기 주요정보로 출력하는 방식을 이용할 수 있다.
바람직하게는, 상기 데이터 가공 모듈은, 상기 주요정보 및 상기 하나 이상의 엔티티정보를 하나 이상의 속성 정보, 이미지 정보 및 영상 정보 중 적어도 하나를 포함하는 축약된 정보 형태로 가공할 수 있다.
본 발명의 실시예에 따른 상기 데이터 가공 모듈은, 상기 검색결과화면상의 다수의 엔티티 정보 중 어느 하나에 대한 사용자 선택신호 입력시, 상기 사용자 선택신호에 대응하는 엔티티에 관한 정보를 엔티티 상세정보로 가공하고, 상기 검색결과화면을 상기 주요정보 및 상기 하나 이상의 엔티티정보가 출력되는 축약정보영역 및 상기 엔티티 상세정보가 출력되는 상세정보영역으로 구분하여 레이아웃 변경할 수 있다.
본 발명의 다른 실시예에 따른 상기 데이터 도출 모듈은, 상기 판단 결과에 따라 상기 메시업검색언어의 각 레벨이 연관되지 않은 경우, 상기 지식 데이터베이스로부터 상기 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 검색 및 도출하고, 상기 도출한 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 대상으로 상기 자연어 질의어의 의미분석 결과에 따른 논리적 연산을 적용하여 최종 결과 데이터를 도출할 수 있다.
이때, 본 발명의 실시예에 따른 상기 데이터 도출 모듈은, 상기 최종 결과 데이터를 상기 주요정보로 도출하고, 상기 도출한 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출할 수 있다.
그리고, 본 발명의 실시예에 따른 상기 데이터 가공 모듈은, 상기 검색결과화면을 상기 주요정보 및 주요정보 관련정보가 출력되는 주요정보 영역 및 상기 하나 이상의 엔티티정보를 출력하는 엔티티 영역으로 구분하여 레이아웃할 수 있다.
한편, 본 발명의 실시예에 따른 상기 데이터 가공 모듈은, 상기 주요정보가 단일 속성의 정보인 경우, 상기 주요정보를 자연어 기반의 응답 형태로 가공하여 제공할 수 있다.
상기 실시형태들은 본 발명의 바람직한 실시예들 중 일부에 불과하며, 본원 발명의 기술적 특징들이 반영된 다양한 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 본 발명의 상세한 설명을 기반으로 도출되고 이해될 수 있다.
본 발명의 실시예에 따르면, 의미 태깅된 복문 구조의 자연어 질의를 분석하여 계층적 트리 구조로 상위 엔티티에서 하위 엔티티로 단계적으로 데이터를 검색함에 따라 사용자 의도에 부합되는 정보의 정확도를 향상시킬 수 있다.
또한, 본 발명의 실시예에 따르면, 복문 구조의 자연어 질의에 포함된 하나 이상의 엔티티와 연관있는 엔티티 정보를 추출하여 사용자 질의에 대한 검색결과와 함께 제공함에 따라 정보 제공의 다양성, 사용자 편의성 및 검색 서비스의 효율성을 향상시킬 수 있다.
본 발명에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부도면은 본 발명에 대한 실시예를 제공하고, 상세한 설명과 함께 본 발명의 기술적 사상을 설명한다.
도 1은 본 발명의 실시예에 따른 자연어 질의 기반의 검색 시스템의 일 예를 나타내는 도면이다.
도 2은 본 발명의 실시예에 따라 자연어 질의어로부터 변환한 트리구조 메시업검색언어의 일 예를 나타내는 도면이다.
도 3은 본 발명의 실시예에 따른 검색엔진이 자연어처리 엔진으로부터 수신한 메시업검색언어에 기초하여 정보 제공하기까지의 과정의 일 예를 나타내는 도면이다.
도 4는 본 발명의 실시예에 따른 검색엔진에서 트리구조 메시업검색언어 속성에 따라 데이터를 검색하여 주요정보 및 엔티티 정보를 도출하는 과정의 일 예를 나타내는 도면이다.
도 5는 본 발명의 실시예에 따른 검색엔진이 도출한 정보를 레이아웃하는 방식의 일 예를 나타내는 도면이다.
도 6은 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 일 예를 나타내는 도면이다.
도 7은 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 다른 예를 나타내는 도면이다.
도 8은 본 발명의 실시예에 따른 검색엔진이 도출한 정보를 레이아웃하는 방식의 다른 예를 나타내는 도면이다.
도 9는 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 또 다른 예를 나타내는 도면이다.
도 10은 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 또 다른 예를 나타내는 도면이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이하 본 발명에 대한 상세한 설명 부분에서 설명하고자 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
이하, 본 발명에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 발명의 예시적인 실시형태를 설명하고자 하는 것이며, 본 발명이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다. 이하의 상세한 설명은 본 발명의 완전한 이해를 제공하기 위해서 구체적 세부사항을 포함한다. 그러나, 당업자는 본 발명이 이러한 구체적 세부사항 없이도 실시될 수 있음을 안다.
본 발명은 자연어 질의에 대한 정보 추출 및 제공 방법 등에 관한 것으로, 구체적으로는 의미 태깅된 자연어 질의에 대해 사용자 의도에 부합되는 검색결과 및 질의 대상와 관련있는 연관정보를 효율적으로 제공하는 방법 및 시스템에 관한 것이다.
도 1은 본 발명의 실시예에 따른 자연어 질의 기반의 검색 시스템의 일 예를 나타내는 도면이다.
도 1을 참조하면, 본 발명의 실시예에 따른 검색 시스템(100)은 사용자 디바이스(110)를 통해 입력된 사용자 질의어를 분석하기 위한 자연어이해 기술(Natural Language Understanding: NLU) 기반의 자연어처리엔진(120), 검색엔진(130) 및 지식 데이터베이스(140)로 구성된다.
자연어처리엔진(120)은 사용자 디바이스(110)를 통해 입력된 의미 태깅된 자연어 기반의 복잡한 질의어를 분석하여 의미 분석을 통해 메시업검색언어(Naver Contents Repository-mashup Query Language: NQL)로 변환하고, 검색엔진(130)은 자연어처리엔진(120)에서 생성된 NQL에 기초하여 기 구축된 지식 데이터베이스로부터 질의요청된 정보를 도출하여 사용자 디바이스(110)로 제공한다.
바람직하게는, 검색엔진(130)은 NQL을 통해 최종적으로 도출할 수 있는 사용자 질의에 부합되는 검색결과 및 질의 엔티티에 대응되는 엔티티 정보를 도출하여 제공할 수 있다. 본 명세서에서, 질의 엔티티란 지식 데이터베이스를 통해 검색결과를 도출할 수 있는 "검색 대상"을 의미하는 것으로, 하나의 사용자 질의에는 하나 이상의 질의 엔티티가 포함될 수 있다.
이하, 본 발명의 실시예에 따른 검색 시스템의 각 구성에 대하여 간략하게 설명하도록 한다.
자연어처리엔진(120)은 사용자 질의의 의미분석을 수행하는 의미분석모듈(121) 및 의분분석 결과에 따라 자연어 기반의 사용자 질의어를 추론 가능한 NQL로 변환하는 NQL변환모듈(122)을 포함한다.
의미분석모듈(121)은 사용자 질의어가 단문 구조인지 또는 복문 구조인지 여부를 분석하고, 질의어를 구성하는 다수의 형태소간의 관계 분석을 통해 사용자 질의 의도 및 질의어에 포함된 세부 질의 문구를 도출한다.
예를 들어, "A 가수그룹(소녀시대)의 멤버가 출연한 영화는?"이란 사용자 질의에 대한 분석 결과, "A 가수그룹"과 "멤버"간의 연관성, "멤버"와 "출연영화"간의 연관성, "영화"와 "정보"간의 연관성을 도출할 수 있다. 이에 기초하여, 해당 질의로부터 "A 가수그룹의 멤버", "각 멤버가 출연한 영화" 및 "해당 영화의 기본정보"와 같이 상위개념에서 하위개념으로 이루어진 계층형 질의 문구를 구성할 수 있다.
다른 예로, "여자배우 B와 나이가 같은 여자배우는?"이란 사용자 질의에 대하여 의미 분석 결과 "여자배우 B의 나이(N)는?"와 "나이 N인 여자배우는?" 와 같은 동일 레벨의 질의 문구를 도출할 수 있다.
NQL변환모듈(122)은 의미분석모듈(121)에서 수행한 분석 결과에 기초하여 사용자 질의에 포함된 하나 이상의 질의문구를 추론할 수 있도록 트리구조의 NQL을 생성한다. 즉, NQL 변환모듈(122)은 자연어 기반의 사용자 질의어를 검색용 언어인 NQL로 변환하는 모듈이다.
본 명세서에서 NQL이란 질의어를 분석하여 서비스단 속성을 지정하는 검색 언어로서, 자연어로 표현된 사용자의 질의에 의미 태깅하여 지식 데이터베이스에 질의하기 위하여 고안된 언어로 정의할 수 있다. NQL은 외부적으로는 논리적 속성을 나타내고 내부적으로는 지식 데이터베이스의 물리적 속성을 이용하여 검색 결과를 생성하는 2중 구조로 이루어진다.
즉, NQL은 지식 데이터베이스의 물리적 구조를 따르지 않고 독자적인 논리적 구조를 구축하여, 설정을 통해 논리적 구조와 물리적 구조간의 관계를 정의하여 질의 유형별, 서비스 유형별로 적합한 데이터 제공이 가능하도록 하기 위한 언어이다. 예를 들어, 사용자 질의어에 "몇살인가요"란 품사가 포함되면, 이를 토대로 변환된 NQL은 "나이"로 속성을 지정할 수 있다.
NQL변환모듈(122)에서 생성하는 트리구조의 NQL은 도 2에 예시된 바와 같다. 이에 대해서는 이하 도 2를 참조하여 후술하도록 한다.
다음으로, 검색엔진(130)은 자연어처리엔진(120)에서 생성된 자연어 질의 기반의 트리 구조 NQL에 기초하여 지식 데이터베이스(140)로부터 정보 검색을 수행한다. 구체적으로는, 트리 구조의 NQL을 통해 최종적으로 도출할 수 있는 사용자 질의에 부합되는 주요정보 및 각 질의 문구 또는 질의 엔티티에 대응되는 엔티티 정보를 도출하여 제공할 수 있다.
본 명세서에서, "주요정보"란 사용자 질의가 요청하는 사항에 대한 검색 결과로서, 복문 구조 질의에 대하여 각 레벨별로 도출한 하나 이상의 물리적 데이터에 기초하여 질의 의도에 따라 논리적으로 연산하여 도출한 정보로 정의할 수 있다. 또한, "엔티티 정보"란 사용자 질의를 구성하는 엔티티 또는 레벨별로 도출한 데이터로 정의할 수 있다. 즉, 엔티티 정보는 최종적으로 주요정보를 도출하기 위하여 중간 단계에서 이용한 정보이거나 또는 주요정보를 도출하는데 이용한 물리적 데이터와 연관된 정보일 수 있다.
하기 표 1은 본 발명에 따른 사용자 질의에 대한 검색 결과로 제공되는 주요정보 및 엔티티 정보의 일 예를 나타내는 것이다.
사용자 질의 주요정보 엔티티 정보
타이타닉 여자주인공은 누구인가요? 타이타닉 여자 주연배우는 케이트 윈슬렛입니다. 타이타닉 영화정보(개봉일, 영화장르, 줄거리, 등장인물 등)
박완서가 쓴 소설은? 박완서가 저자인 책 검색결과 목록 박완서 인물정보(사진, 생년월일, 직업, 최근 작품활동 등)
미니피크 크기는? 미니돼지의 무게는 약 60kg입니다 미니돼지 동물정보(사진, 학명, 소속과, 몸 빛깔, 분포지역 등)
스페인의 언어는? 스페인의 언어는 에스파냐어입니다. 스페인 국가정보(수도, 언어, 화폐, GDP 등)
소녀시대 멤버의 출연영화는? 가수그룹 소녀시대의 멤버별 출연영화 정보 제공 소녀시대 멤버별 인물정보(사진, 생년월일, 활동정보 등)
이와 같은 주요정보 및 엔티티 정보 제공을 위해, 검색엔진(130)은 자연어처리 엔진(120)으로부터 전송되는 NQL의 속성을 분석하여 정규화하는 NQL 정규화 모듈(131), 정규화된 NQL을 지식 데이터베이스 검색을 위한 대상 검색 언어(Object Query Language: OQL)로 변환하는 OQL 변환 모듈(132), 지식 데이터베이스(140)에 기초하여 OQL에 대응하는 데이터를 검색하고 도출하기 위한 데이터 도출 모듈(133) 및 도출한 검색 데이터를 복문 구조의 사용자 질의에 부합되도록 가공하여 검색결과화면을 레이아웃하는 데이터 가공 모듈(134)을 포함한다.
본 명세서에서 OQL이란 지식 데이터베이스 검색에 최적화된 언어로 정의할 수 있으며, OQL은 지식 데이터베이스가 사용하는 물리적 구조를 사용한다. 예를 들어, 상기 실시예에서 사용자 질의어인 "몇살인가요"로부터 변환된 속성언어 NQL "나이"에 대하여 "현재년도 값과 출생년도 값을 이용하여 나이를 계산하기 위한 검색 언어"로 표현되는 OQL로 변환할 수 있다.
지식 데이터베이스(140)은 NQL 속성에 따라 선택할 수 있는 다양한 검색환경정보(NQL_config)를 저장하는 NQL config DB(141), NQL에서 OQL로의 변환에 필요한 속성정보 및 규칙정보를 저장하는 OQL DB(142), 지식정보 DB(143) 및 데이터 가공 규칙 DB(144)를 포함한다.
검색엔진(130)의 각 구성을 살펴보면, NQL 정규화 모듈(131)은 트리구조 NQL 속성 분석을 통해 NQL config DB(141)로부터 질의 의도에 부합되는 NQL config를 도출하고, 이를 적용하여 자연어처리엔진(120)으로부터 수신한 NQL을 정규화된 NQL(NQL_normalization)로 변환한다.
본 명세서에서, NQL_config란 검색모드(mode), 검색도메인(domain) 및 검색프로퍼티(property) 등을 고려하여 질의 의도에 부합되는 검색사항, 검색조건 및 검색데이터 가공 방식 중 적어도 하나를 정의하는 검색환경정보로 정의할 수 있다. 이때, 검색모드는 사용자 질의 유형을 의미하는 것으로 정답형, 비교형, 관계형, 그래프형 등을 예로 들 수 있고, 검색도메인은 질의 대상 또는 속성이 속한 의미상의 범주를 의미하는 것으로 "인물, 영화, 방송, 출판물, 웹툰, 미술작품, 식물, 동물, 문화재, 와인, 게임" 등을 예로 들 수 있고, 검색프로퍼티는 질의 대상간의 관계 또는 대상을 서술하는 단위를 의미하는 것이다.
따라서, NQL 정규화 모듈(131)은 트리구조의 NQL에 대하여 검색모드, 검색도메인 및 검색프로퍼티 중 적어도 하나와 관련된 속성 분석을 통해 NQL config DB(141)로부터 질의 의도에 부합되는 NQL config를 선택하고, 이를 바탕으로 NQL_normalization로 변환할 수 있다.
이때, NQL 정규화 모듈(511)은 NQL config에 따라 사용자 질의 의도에 근접하기 위한 추가 데이터 도출을 위한 단서 정보를 포함시켜 NQL_normalization을 구성할 수 있다.
OQL 변환 모듈(132)은 NQL 정규화 모듈(131)에서 변화된 NQL_normalization에 대하여 OQL DB(142)에 기초하여 OQL로 변환한다. 이때, OQL 변환모듈(132)은 NQL_config를 바탕으로 NQL의 논리적 도메인 및 속성에 기초하여 지식정보 DB(143)의 물리적 속성값으로 원하는 데이터를 도출할 수 있는 OQL로 변환할 수 있다.
데이터 도출 모듈(133)은 OQL 변환모듈(132)에서 변환된 OQL을 토대로 지식정보 DB(143)를 검색하여 물리적 데이터를 도출하고, 물리적 데이터를 이용하여 NQL config에 따른 주요정보 및 엔티티 정보를 도출한다. 주요정보는 OQL 기반의 물리적 구조 결과를 논리적 구조로 변환하고, 논리적 구조에 따른 최종적으로 도출된 결과 데이터라 볼 수 있고, 엔티티 정보는 트리구조의 계층적 NQL에서 각 단계별로 도출된 물리적 데이터이거나 또는 질의 엔티티와 연관있는 물리적 데이터라 볼 수 있다.
데이터 가공 모듈(134)은 데이터 도출 모듈(133)에서 도출한 주요정보 및 엔티티 정보를 NQL config에 따라 가공하고, 이를 포함한 검색결과화면을 레이아웃한다. 이때, NQL config DB(141)와 연동하는 데이터 가공 규칙 DB(144)로부터 NQL config에 부합되는 데이터 가공 규칙을 가져오고, 이를 토대로 데이터를 가공할 수 있다. 예를 들어, NQL config_domain에 따라 정의된 기본노출 속성, 이미지 제공 방식, 데이터 정렬 방식, 링크 생성 방식 등에 기초하여 데이터 가공 및 검색결과화면을 레이아웃을 구성할 수 있다.
또한, 데이터 가공 모듈(134)은 동일한 주요정보 및 엔티티 정보라도 검색결과화면상에 출력되는 레이아웃 방식을 다양하게 설정할 수 있다.
예를 들어, 사용자 질의 유형에 따라 주요정보 또는 엔티티 정보는 단일 객체에 관한 정보이거나 또는 동일 레벨의 둘 이상의 객체에 관한 정보일 수 있다. 데이터 가공 모듈(134)은 주요정보 또는 엔티티 정보의 검색 결과에 기초하여 싱글형 레이아웃 또는 다수 검색 결과가 나열되는 리스트형 레이아웃을 구성할 수 있고, 단일 검색 결과가 "숫자" 또는 "명칭"과 같은 단답형의 정보인 경우 주요정보는 해당 검색 정보를 포함하는 일종의 문장 형태로 가공할 수 있다.
나아가, 데이터 가공 모듈(134)은 사용자가 주요정보 또는 엔티티정보에 대한 상세정보를 요청하는 경우, 검색결과화면상에 주요정보 및 엔티티정보의 축약정보를 제공하면서 동시에 사용자가 선택한 특정 엔티티정보에 대한 상세정보를 노출하도록 검색결과화면을 가공할 수 있다.
도 2은 본 발명의 실시예에 따라 자연어 질의어로부터 변환한 트리구조 NQL의 일 예를 나타내는 도면이다.
도 2를 참조하면, 사용자 질의어는 "소녀시대 멤버가 출연한 영화는?"이고, 자연어처리 엔진은 질의어를 의미분석하여 "소녀시대(가수그룹명), 멤버(속성), 영화(속성)"와 같은 엔티티를 추출하고, 각 엔티티간의 연관성을 분석하여 "소녀시대 멤버>멤버가 출연한 영화>영화정보"와 같은 상위개념에서 하위개념으로의 질의 문구를 구성하고, 이를 바탕으로 도 2에 도시된 바와 같은 계층적 트리구조의 NQL(200)로 나타낼 수 있다. 예시된 트리구조에서 1 레벨(210)은 "소녀시대 멤버"를 NQL 변환한 것으로, "object/name":소녀시대"(211)와 그에 대한 속성정보로 "person/member"(212)로 변환할 수 있다. 2 레벨(220)은 "멤버가 출연한 영화"를 NQL 변환한 것으로, "person/member"(212)에 대한 속성정보인 "person/movie_performed"(221) 및 "movie/person(member)"(222)로 변환할 수 있다. 3 레벨(230)은 "movie/person(member)"(222)에 대한 속성정보로 해당 영화에 대한 상세정보를 의미하는 "movie_member performed"(231)와 같이 구성할 수 있다.
도 2에 예시된 트리구조 NQL은 자연어처리엔진에서 생성된 것으로, 검색엔진은 이와 같은 트리구조 NQL을 이용하여 사용자 질의에 대한 주요정보 및 엔티티 정보를 도출한다.
도 3은 본 발명의 실시예에 따른 검색엔진이 자연어처리 엔진으로부터 수신한 NQL에 기초하여 정보 제공하기까지의 과정의 일 예를 나타내는 도면이다.
도 3을 참조하면, 본 발명의 실시예에 따른 검색엔진은 자연어처리 엔진으로부터 전송되는 NQL에 대하여 NQL에 포함된 트리구조 및 NQL 도메인을 분석한다(S301).
분석 결과에 따라, 검색엔진은 NQL config DB로부터 사용자 질의 의도에 부합되는 NQL config를 도출하여 이를 기반으로 자연어처리엔진으로부터 수신한 NQL을 NQL_normalization으로 정규화하는 작업을 수행한다(S302).
NQL config는 상기 표 1을 참조하여 상술한 바와 같이, 질의어의 속성을 기반으로 질의 모드, 질의 도메인, 질의 프로퍼티 등의 특성에 따라 정의되는 검색환경정보로, 사용자 질의 의도에 따라 적용되는 NQL config는 달라질 수 있다. 이때, 해당 NQL에 적용하는 NQL config 특성에 따라 사용자 질의 의도에 최적화된 주요정보 및 질의 엔티티별 엔티티 정보 속성이 달라지고, 정보제공방식 또한 다양하게 변동될 수 있다.
나아가 NQL 정규화 과정에서 주요정보 및 엔티티 정보 제공을 위한 추가 데이터 검색 사항을 더 포함시켜 NQL_normalization을 구성할 수 있다. 예를 들어, 특정 인물에 대한 정보(예, 출연영화)가 질의 속성인 경우, 해당 영화에 대한 정보 및 해당 영화에 출연했던 다른 인물들에 대한 정보도 질의 엔티티에 연관된 엔티티 정보로 함께 제공할 수 있도록 추가 데이터 검색 사항을 설정하여 NQL_normalization을 구성할 수 있다.
NQL 정규화가 이루어지면, 검색엔진은 전 단계(S302)에서 적용한 NQL config에 따라 NQL_normalization을 지식 데이터베이스에 질의하기 위한 검색 언어인 OQL로 변환한다(S303).
그리고, 변환된 OQL을 이용하여 지식 데이터베이스를 검색하고 대응되는 물리적 데이터인 OQL 데이터를 도출하는데, 데이터 도출 과정에서도 NQL config_mode에 따라 질의 유형에 따른 속성별 검색값 최대 개수, 검색용 속성 사용 개수, 결과용 속성 사용 개수 등을 달리할 수 있다(S304).
다음으로, 전 단계(S304)에서 도출한 OQL 데이터들을 NQL config에 따라 기 설정된 데이터 가공 방식으로 NQL 결과 데이터로 변환한다(S305).
NQL 결과 데이터가 도출됨에 따라, 검색엔진은 NQL config에 부합되는 데이터 가공 규칙을 적용하여 사용자 의도를 반영한 검색 결과 제공 방식으로 검색결과화면을 레이아웃을 구성하여 사용자에게 제공한다(S306).
일 실시예로, 질의 유형이 단일 검색 결과를 요청하는 경우 주요정보는 검색에 따라 도출된 주요정보를 단일 검색결과로 가공할 수 있다. 예컨대, 검색 질의가 "C영화 관객수"인 경우, 검색결과로 제공되는 주요정보는 S305에서 도출되는 "C영화 관객수=N"이라는 데이터로부터 "C영화 관객수는 N명입니다."와 같이 문장 형태의 단일 검색 결과를 가공되고, 이를 포함한 싱글형 레이아웃을 구성할 수 있다.
다른 실시예로, 질의 유형이 둘 이상의 검색 결과를 요청하는 경우 주요정보는 둘 이상의 검색 결과를 포함하는 복수 검색결과를 나열하는 형태로 가공할 수 있다. 예컨대, 검색 질의가 "D 소설가의 책"인 경우, 검색결과로 제공되는 주요정보는 S305에서 도출한 "D 소설가가 저자인 하나 이상의 책"이라는 데이터로부터 가각의 책에 관한 정보를 가공하고, 가공된 하나 이상의 주요정보가 목록 형태로 나열되는 리스트형 레이아웃을 구성할 수 있다.
도 4는 본 발명의 실시예에 따른 검색엔진에서 트리구조 NQL 속성에 따라 데이터를 검색하여 주요정보 및 엔티티 정보를 도출하는 과정의 일 예를 나타내는 도면이다.
본 발명의 실시예에 따른 검색엔진은 트리구조 NQL의 속성을 분석하여 NQL의 레벨 구조에서 각각의 레벨이 질의 엔티티에 의해 링킹되어 있는지 여부를 판단한다(S401). 트리구조 NQL은 상술한 것처럼 복문구조의 사용자 질의에 대한 의미분석을 통해 하나의 질의에 포함된 다수의 질의 문구를 도출하고, 각 질의 문구를 하나의 레벨로 설정하여 NQL로 변환한 형태이다.
상기 판단결과, 트리구조 NQL의 각 레벨이 엔티티에 의해 링킹(linking)되어 있는 경우, 상위 엔티티에서 하위 엔티티로의 데이터 검색을 수행한다(S402, S403).
예를 들어, "A 가수그룹(소녀시대)의 멤버가 출연한 영화는?"이란 사용자 질의에 대한 분석결과 "A 가수그룹의 멤버", "각 멤버가 출연한 영화" 및 "해당 영화의 기본정보"와 같은 3개의 질의 문구를 도출할 수 있다. 그리고, 각각의 질의 문구는 "A 가수그룹", A 가수그룹의 "멤버", A 가수그룹의 멤버가 출연한 "영화"라는 엔티티를 포함하며, 각각의 엔티티는 상위 엔티티에서 하위 엔티티로 링킹될 수 있다.
반면, 단계 S401에서의 판단결과, 트리구조 NQL의 각 레벨이 엔티티에 의해 링킹되지 않은 경우, 논리적 연산에 따라 각 레벨에 대한 데이터 검색을 수행한다(S402, S404).
예를 들어, "여자배우 B와 나이가 같은 여자배우는?"이란 사용자 질의에 대하여 의미 분석 결과 "여자배우 B의 나이(N)는?"와 "나이 N인 여자배우는?" 와 같은 질의 문구를 도출할 수 있다. 이때, "여자배우 B"에 해당하는 엔티티에 대하여 "나이(N)"은 별도의 엔티티가 아닌 "여자배우 B"라는 엔티티에 대한 속성 값이므로, "여자배우 B의 나이(N)"와 "나이 N인 여자배우"은 링킹되어 있는 상위-하위 레벨이라 볼 수 없다. 이러한 경우, 논리적 연산에 따라, "여자배우 B의 나이(N)"에 대응되는 데이터를 도출하고, "나이(N)"를 속성 값으로 갖는 "인물" 정보를 역으로 검색하고, 검색된 "인물" 데이터 중에서 "직업-배우" 및 "성별-여성" 속성을 만족하는 데이터를 선별하는 방식으로 데이터 검색을 수행한다.
검색엔진은 상술한 검색 과정(S402 내지 S404)를 통해 최종적으로 도출된 검색 데이터를 주요정보로 도출하고, 데이터 검색 과정에서 질의 엔티티에 대응하여 도출된 검색 데이터를 엔티티 정보로 도출할 수 있다(S405).
예를 들어, "A 가수그룹(소녀시대)의 멤버가 출연한 영화는?"이란 사용자 질의에 대하여 주요정보는 각 멤버가 출연한 영화 정보가 되고, 엔티티 정보는 A 가수그룹에 관한 정보, 각 멤버에 관한 인물정보 등이 될 수 있다. 다른 예로, "여자배우 B와 나이가 같은 여자배우는?"이란 사용자 질의에 대하여 주요정보는 나이 N인 여자배우들에 대한 정보가 되고, 엔티티 정보는 여자배우 B에 대한 정보, 나이 N인 여자배우 각각의 대한 인물정보가 될 수 있다.
도 5는 본 발명의 실시예에 따른 검색엔진이 도출한 정보를 레이아웃하는 방식의 일 예를 나타내는 도면으로, 구체적으로는 단문구조의 질의에 대한 검색 결과를 제공하는 경우를 나타낸다.
도 5를 참조하면, 검색엔진은 사용자 질의에 대한 검색 결과로 도출한 주요정보(511) 및 엔티티 정보(521)를 동시에 제공한다. 이때, 주요정보(511) 및 엔티티 정보(521)가 노출되는 영역을 주요정보 영역(510) 및 엔티티 영역(520)으로 구분하여, 주요정보 영역(510) 내 주요정보(511) 및 주요정보와 관련된 정보(512)가 노출되고, 엔티티 영역(520) 내 엔티티 정보(521) 및 엔티티와 관련된 정보(522)가 노출되도록 레이아웃할 수 있다.
또한, 주요정보(511)가 노출되는 형태는 사용자 질의에 따른 검색 결과 주요정보가 단일 객체에 대한 정보인 경우 싱글형으로 레이아웃하고, 주요정보가 둘 이상의 객체에 대한 정보인 경우 리스트형으로 레이아웃할 수 있다. 나아가, 엔티티 정보 역시 둘 이상의 객체에 관한 정보인 경우 리스트형으로 구성할 수 있다.
주요정보(511), 주요정보와 관련된 정보(512), 엔티티 정보(521) 및 엔티티와 관련된 정보(522)는 각각 축약된 정보로서, 사용자 선택에 따라 주요정보(511), 주요정보와 관련된 정보(512), 엔티티 정보(521) 및 엔티티와 관련된 정보(522) 각각에 대한 상세정보가 별도의 추가적으로 제공되도록 구성할 수 있다.
도 6은 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 일 예를 나타내는 도면으로, 구체적으로는 단문구조의 질의에 대한 싱글형 검색결과화면의 일 예를 나타낸다.
도 6을 참조하면, 검색결과화면(600)은 사용자 질의(601)에 대한 최종 검색 결과가 노출되는 주요정보 영역(610) 및 질의 엔티티와 관련된 정보가 제공되는 엔티티 영역(620)으로 구분될 수 있다. 예를 들어, 도 6에 예시된 것처럼 검색결과화면(600)의 좌측은 주요정보 영역(610)으로 구성하고, 검색결과화면(600)의 우측은 엔티티 영역(620)으로 구성할 수 있다.
주요정보 영역(610)에는 사용자 질의를 통해 최종적으로 도출한 주요정보(611) 및 사용자 질의를 키워드로 검색하여 도출한 관련정보(612)가 노출되고, 엔티티 영역(620)에는 엔티티 정보(621) 및 엔티티와 연관관계에 있는 관련정보(622)가 노출된다.
이때, 사용자 질의 유형이 "숫자"와 같이 단일 검색 결과이면서 텍스트 형태의 검색 결과를 요청하는 경우, 검색엔진은 NQL config에 따라 도출한 데이터를 포함하는 문장 형태로 주요정보를 가공할 수 있다.
도 7은 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 다른 예를 나타내는 도면으로, 구체적으로는 단문구조의 질의에 대한 리스트형 검색결과화면의 일 예를 나타낸다.
도 7을 참조하면, 마찬가지로 검색결과화면(700)을 사용자 질의(701)에 대한 최종 검색 결과가 노출되는 주요정보 영역(710) 및 질의 엔티티와 관련된 정보가 제공되는 엔티티 영역(720)으로 구분하며, 일 예로, 도 7에 예시된 것처럼 검색결과화면(700)의 좌측은 주요정보 영역(710)으로 구성하고, 검색결과화면(700)의 우측은 엔티티 영역(720)으로 구성할 수 있다.
이때, 사용자 질의에 대한 검색 결과 주요정보로 도출되는 정보가 둘 이상의 객체에 대한 데이터인 경우, 주요정보 영역(710)에는 사용자 질의를 통해 최종적으로 도출한 둘 이상의 주요정보(711, 712, 713)를 리스트 형태로 노출하도록 구성할 수 있다. 각각의 주요정보(711, 712, 713)는 해당 객체에 대한 상세정보를 축약한 형태로 노출될 수 있다.
마찬가지로, 주요정보 영역(710)에는 도 7에 도시되지는 않았으나, 주요정보와 연관있는 관련정보가 추가적으로 노출될 수 있다.
엔티티 영역(720)에는 사용자 질의에 포함된 엔티티에 기초하여 검색한 엔티티 정보(721) 및 엔티티와 연관있는 관련정보(722)가 노출된다.
도 5 내지 도 7을 참조하여 상술한 본 발명의 일 실시예에 따른 검색 결과 레이아웃 방식은 단문구조의 사용자 질의 속성에 따라 최종적으로 도출된 주요정보와 함께 엔티티 정보를 동일 검색 화면을 통해 제공함으로써 사용자 편의성을 도모할 수 있다.
도 8은 본 발명의 실시예에 따른 검색엔진이 도출한 정보를 레이아웃하는 방식의 다른 예를 나타내는 도면으로, 구체적으로는 복문구조의 질의에 대한 검색 결과를 제공하는 경우를 나타낸다.
검색엔진은 복문 구조의 사용자 질의로부터 생성된 트리구조 NQL 속성에 따라 사용자 질의에 대한 검색 결과로 도출한 주요정보 및 엔티티 정보를 계층형 구조로 제공한다.
도 8의 (a)를 참조하면, 트리구조 NQL이 질의를 구성하는 다수의 엔티티가 서로 링킹되는 다수 레벨로 이루어진 계층형 구조인 경우, 상위 엔티티에서 하위 엔티티로 링크를 따라 도출한 데이터의 노출 위치를 계층적으로 레이아웃할 수 있다. 즉, 도 8의 (a)에 예시된 바와 같이, 제1 레벨 엔티티(상위 엔티티)에 대응하는 정보(801)를 최상위단에서 출력하고, 제1 레벨 엔티티(상위 엔티티)에 대응하는 정보(801) 하단에 제2 레벨 엔티티(중간 엔티티)에 대응하는 정보(802)를 출력하고, 제2 레벨 엔티티(중간 엔티티)에 대응하는 정보(802) 하단에 제n 레벨 엔티티에 대응하는 정보(803)를 출력하는 방식으로 계층적 구조로 레이아웃함으로써, 복문구조의 질의어를 해석하는 과정에 따라 검출되는 데이터를 계층적으로 제공할 수 있다. 이때, 각 레벨의 링크를 따라 최종적으로 도출되는 제n 레벨 엔ㅌ정보티티 정보(803)가 주요정보(803)가 되고, 그 외의 정보(801, 802)는 엔티티 정보가 된다.
또한, 마찬가지로 사용자 질의가 단일 객체에 대한 정보 요청인 경우 주요정보는 싱글형으로 레이아웃하고, 사용자 질의가 둘 이상의 객체에 대한 정보 요청인 경우 주요정보를 리스트형으로요 레이아웃할 수 있다. 나아가, 엔티티 정보도 둘 이상인 경우에는 엔티티 정보를 제공하는 방식도 리스트형으로 구성할 수 있다.
한편, 주요정보(803) 및 엔티티 정보(801, 802)는 관련된 상세정보가 축약된 형태로 제공되어지는 바, 사용자 선택에 따라 각각의 엔티티에 대응하는 상세정보가 추가적으로 제공될 수 있다.
도 8의 (b)를 참조하면, 도 8의 (a)와 동일한 검색결과화면에서 사용자가 추력된 엔티티 정보(801 내지 803) 중 어느 하나를 선택하는 경우, 검색엔진은 선택된 엔티티에 대응하는 상세정보(804)를 검색결과화면의 일정영역에 출력되도록 검색화면 레이아웃을 변경할 수 있다. 즉, 검색결과화면을 계층형 엔티티 축약정보가 제공되는 축약정보영역(810) 및 사용자 선택에 따른 특정 엔티티의 상세정보가 제공되는 상세정보영역(820)으로 구분하여 재가공할 수 있다.
도 9는 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 또 다른 예를 나타내는 도면으로, 구체적으로는 복문구조의 질의에 대한 리스트형 검색결과화면의 일 예를 나타낸다.
도 9를 참조하면, 검색결과화면(900)은 복문 구조의 사용자 질의(901)로부터 도출한 다수 레벨의 링킹된 엔티티에 관한 정보를 제공하는데, 상위 엔티티 정보(902)로부터 하위 엔티티 정보(903)를 계층적으로 출력한다. 이때, 계층형 구조상에서 최하위 레벨에 해당하는 엔티티 정보(903)가 사용자 질의에서 요청하는 최종 검색 결과로서 주요정보(903)에 해당된다.
도 9에 예시된 엔티티 정보(902) 및 주요정보(903)는 검색 결와 둘 이상의 객체에 관한 정보를 포함하고 있으므로, 각각 리스트형으로 레이아웃되었다.
도 10은 본 발명의 실시예에 따른 검색 시스템에서 사용자 질의에 대한 검색결과화면의 또 다른 예를 나타내는 도면이다.
구체적으로, 도 10은 복문구조의 질의에 대한 리스트형 검색결과화면의 다른 예를 나타내는 것으로, 상기 도 9에 예시된 검색결과화면에서 사용자 선택에 따른 엔티티 상세정보가 포함된 검색결과화면의 일 예를 나타낸다.
도 10을 참조하면, 검색결과화면(1000)은 도 9와 동일한 사용자 질의(1001)에 대해 엔티티 상세설명 요청에 따라 엔티티 축약정보가 제공되는 축약정보영역(1010) 및 엔티티 상세정보가 제공되는 상세정보영역(1020)으로 구분될 수 있다. 축약정보영역(1010)은 상기 도 9에서 상술한 바와 같이 검색 과정에서 도출되는 상위 엔티티 정보(1011)에서 하위 엔티티 정보(1012)로 단계적으로 각 레벨의 엔티티가 제공되는 계층 구조를 이용한다.
상세정보영역(1020)은 다수 레벨의 다수 엔티티 정보들 중 사용자가 선택한 특정 엔티티에 대한 상세정보(1021)가 노출된다. 특정 엔티티에 대한 상세정보(1021)는 NQL config에 따라 엔티티 속성, 도메인 및 프로퍼티 중 적어도 하나에 기초하여 도출된 정보일 수 있다.
따라서, 도 9 및 도 10을 참조하면, 검색엔진으 사용자가 입력한 사용자 질의를 토대로 계층 구조의 엔티티 정보를 기반으로 한 주요정보 및 레벨별 엔티티정보를 단계적으로 레이아웃하여 검색결과화면을 제공하고, 사용자가 검색결과화면에 노출된 특정 엔티티에 대한 상세정보를 요청하는 경우에는 검색결과화면상에 정보가 출력되는 공간을 재배치하여, 축약정보 및 상세정보가 동시에 제공될 수 있도록 검색결과화면의 레이아웃을 변경할 수 있다.
이와 같이. 도 8 내지 도 10을 참조하여 상술한 본 발명의 다른 실시예에 따른 검색 결과 레이아웃 방식은 복문구조의 사용자 질의 속성에 따라 엔티티별 축약정보가 엔티티 레벨에 따라 단계적으로 출력되고, 사용자가 엔티티 상세정보를 요청하는 경우 계층 구조의 엔티티 축약정보 및 특정 엔티티 상세정보를 동일 검색 화면을 통해 제공함으로써 사용자 편의성을 도모할 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서 본 발명에 기재된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상이 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의해서 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (25)

  1. 자연어 질의어의 의미분석을 통해 상기 자연어 질의어에 포함된 하나 이상의 질의 엔티티에 기초하여 다수 레벨로 이루어진 트리구조 메시업검색언어를 생성하는 메시업검색언어 생성 단계;
    상기 메시업검색언어의 속성 정보를 토대로 레벨별 메시업검색언어를 구성하는 질의 엔티티를 통해 상기 메시업검색언어의 각 레벨이 연관(linking)되어 있는지 여부를 판단하는 속성 분석 단계;
    상기 판단 결과에 따라, 지식 데이터베이스로부터 상기 메시업검색언어의 각 레벨별 질의 엔티티에 대응되는 데이터를 검색하고, 상기 검색 결과 도출한 데이터로부터 상기 자연어 질의어에 대응되는 주요정보 및 하나 이상의 엔티티 정보를 도출하는 검색 단계; 및
    상기 주요정보 및 상기 하나 이상의 엔티티 정보를 포함하는 검색결과화면을 레이아웃하는 정보 제공 단계를 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  2. 제1항에 있어서,
    상기 메시업검색언어 생성 단계는,
    상기 자연어 질의어의 의미분석을 통해 상기 자연어 질의어가 단문구조인지 또는 복문구조인지 여부를 판단하는 단계;
    상기 자연어 질의어가 복문구조인 경우, 복문구조의 질의어로부터 둘 이상의 질의 문구를 도출하는 단계; 및
    상기 도출한 둘 이상의 질의 문구를 토대로 상기 트리구조 메시업검색언어를 생성하는 단계를 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  3. 제1항에 있어서,
    상기 속성 분석 단계는,
    상기 메시업검색언어의 속성 및 도메인 정보를 분석하는 단계;
    상기 분석 결과에 따라 상기 메시업검색언어에 대응하는 검색환경정보를 선택하는 단계; 및
    상기 선택한 검색환경정보를 이용하여 상기 메시업검색언어를 정규화하는 단계를 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  4. 제3항에 있어서,
    상기 속성 분석 단계는,
    상기 정규화된 메시업검색언어를 상기 선택한 검색환경정보를 이용하여 대상검색언어로 변환하는 단계를 더 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  5. 제1항에 있어서,
    상기 데이터 검색 단계는,
    상기 판단 결과에 따라 상기 메시업검색언어의 각 레벨이 연관(linking)되어 있는 경우,
    상기 지식 데이터베이스로부터 상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터를 검색 및 도출하는 단계; 및
    상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터에 기초하여 상기 지식 데이터베이스로부터 연속하는 하위 레벨 엔티티에 대응하는 데이터를 검색 및 도출하는 단계를 포함하며,
    상기 데이터 검색 단계는 상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 검색 및 도출하기까지 순차적으로 반복되는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  6. 제5항에 있어서,
    상기 데이터 검색 단계는,
    상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 상기 주요정보로 도출하고, 나머지 도출된 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출하는 단계를 더 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  7. 제6항에 있어서,
    상기 정보 제공 단계는,
    상기 검색결과화면의 상단부에 상기 메시업검색언어의 최상위 레벨 엔티티 정보를 출력하고, 상기 메시업검색언어의 최상위 레벨 엔티티 정보의 하단부에 연속하는 하위 레벨 엔티티 정보를 출력하며, 상기 메시업검색언어의 최하위 레벨 엔티티 정보를 상기 주요정보로 출력하는 방식을 이용하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  8. 제1항 또는 제7항에 있어서,
    상기 정보 제공 단계는,
    상기 주요정보 및 상기 하나 이상의 엔티티정보를 하나 이상의 속성 정보, 이미지 정보 및 영상 정보 중 적어도 하나를 포함하는 축약된 정보 형태로 가공하는 단계를 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  9. 제8항에 있어서,
    상기 검색결과화면상의 다수의 엔티티 정보 중 어느 하나에 대한 사용자 선택신호 입력시, 상기 사용자 선택신호에 대응하는 엔티티에 관한 정보를 엔티티 상세정보로 가공하는 단계; 및
    상기 검색결과화면을 상기 주요정보 및 상기 하나 이상의 엔티티정보가 출력되는 축약정보영역 및 상기 엔티티 상세정보가 출력되는 상세정보영역으로 구분하여 레이아웃 변경하는 단계를 더 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  10. 제1항에 있어서,
    상기 데이터 검색 단계는,
    상기 판단 결과에 따라 상기 메시업검색언어의 각 레벨이 연관되지 않은 경우,
    상기 지식 데이터베이스로부터 상기 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 검색 및 도출하는 단계; 및
    상기 도출한 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 대상으로 상기 자연어 질의어의 의미분석 결과에 따른 논리적 연산을 적용하여 최종 결과 데이터를 도출하는 단계를 더 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  11. 제10항에 있어서,
    상기 데이터 검색 단계는,
    상기 최종 결과 데이터를 상기 주요정보로 도출하고, 상기 도출한 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출하는 단계를 더 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  12. 제11항에 있어서,
    상기 정보 제공 단계는,
    상기 검색결과화면을 상기 주요정보 및 주요정보 관련정보가 출력되는 주요정보 영역 및 상기 하나 이상의 엔티티정보를 출력하는 엔티티 영역으로 구분하여 레이아웃하는 단계를 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  13. 제1항에 있어서,
    상기 정보 제공 단계는,
    상기 주요정보가 단일 속성의 정보인 경우, 상기 주요정보를 자연어 기반의 응답 형태로 가공하여 제공하는 단계를 더 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법.
  14. 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템에 있어서,
    사용자 디바이스를 통해 입력된 자연어 질의어의 의미분석을 통해 상기 자연어 질의어에 포함된 하나 이상의 질의 엔티티에 기초하여 다수 레벨로 이루어진 트리구조 메시업검색언어로 변환하는 자연어처리엔진; 및
    상기 메시업검색언어의 속성 정보를 토대로 상기 메시업검색언어의 각 레벨이 연관(linking)되어 있는지 여부를 판단하여 레벨별 메시업검색언어를 구성하는 질의 엔티티에 대응되는 데이터를 검색하는 검색엔진을 포함하며,
    상기 검색엔진은,
    상기 레벨별 메시업검색언어를 구성하는 질의 엔티티에 대응되는 데이터로부터 상기 자연어 질의어에 대응되는 주요정보 및 하나 이상의 엔티티 정보를 가공하여 동일 검색결과화면상에 레이아웃하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  15. 제14항에 있어서,
    상기 자연어처리 엔진은,
    상기 자연어 질의어의 의미분석을 통해 상기 자연어 질의어가 단문구조인지 또는 복문구조인지 여부를 판단하고, 상기 자연어 질의어가 복문구조인 경우, 복문구조의 질의어로부터 둘 이상의 질의 문구를 도출하는 의미분석모듈; 및
    상기 도출한 둘 이상의 질의 문구를 토대로 상기 트리구조 메시업검색언어를 생성하는 메시업검색언어 변환 모듈을 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  16. 제14항에 있어서,
    상기 검색 엔진은,
    상기 메시업검색언어의 속성 정보를 분석하여 상기 메시업검색언어에 대응하는 검색환경정보를 선택하고, 상기 선택한 검색환경정보를 이용하여 상기 메시업검색언어를 정규화하는 메시업검색언어 정규화 모듈;
    상기 검색환경정보에 따라 상기 정규화된 메시업검색언어를 대상검색 언어로 변환하는 대상검색언어 변환 모듈;
    상기 검색환경정보에 따라 지식 데이터베이스로부터 상기 대상검색언어에 대한 물리적 데이터를 검색 및 도출하여 결과 데이터를 생성하는 데이터 도출 모듈; 및
    상기 검색환경정보에 따라 상기 데이터 도출 모듈에서 생성한 결과 데이터를 가공하고, 상기 가공된 데이터를 포함하는 검색결과화면을 생성하는 데이터 가공 모듈을 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  17. 제16항에 있어서,
    상기 데이터 도출 모듈은,
    상기 메시업검색언어 정규화 모듈에서의 속성 분석 결과에 따라 메시업검색언어의 각 레벨이 연관(linking)되어 있는 경우,
    지식 데이터베이스로부터 상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터를 도출하고, 상기 메시업검색언어의 최상위 레벨 엔티티에 대응하는 데이터에 기초하여 상기 지식 데이터베이스로부터 연속하는 하위 레벨 엔티티에 대응하는 데이터를 도출하며, 상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 도출하기까지 순차적으로 데이터 도출을 수행하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  18. 제17항에 있어서,
    상기 데이터 도출 모듈은,
    상기 메시업검색언어의 최하위 레벨 엔티티에 대응하는 데이터를 상기 주요정보로 도출하고, 나머지 도출된 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출하는 단계를 더 포함하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  19. 제18항에 있어서,
    상기 데이터 가공 모듈은,
    상기 검색결과화면의 상단부에 상기 메시업검색언어의 최상위 레벨 엔티티 정보를 출력하고, 상기 메시업검색언어의 최상위 레벨 엔티티 정보의 하단부에 연속하는 하위 레벨 엔티티 정보를 출력하며, 상기 메시업검색언어의 최하위 레벨 엔티티 정보를 상기 주요정보로 출력하는 방식을 이용하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  20. 제16항 또는 제19항에 있어서,
    상기 데이터 가공 모듈은,
    상기 주요정보 및 상기 하나 이상의 엔티티정보를 하나 이상의 속성 정보, 이미지 정보 및 영상 정보 중 적어도 하나를 포함하는 축약된 정보 형태로 가공하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  21. 제20항에 있어서,
    상기 데이터 가공 모듈은,
    상기 검색결과화면상의 다수의 엔티티 정보 중 어느 하나에 대한 사용자 선택신호 입력시,
    상기 사용자 선택신호에 대응하는 엔티티에 관한 정보를 엔티티 상세정보로 가공하고, 상기 검색결과화면을 상기 주요정보 및 상기 하나 이상의 엔티티정보가 출력되는 축약정보영역 및 상기 엔티티 상세정보가 출력되는 상세정보영역으로 구분하여 레이아웃 변경하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  22. 제16항에 있어서,
    상기 데이터 도출 모듈은,
    상기 메시업검색언어 정규화 모듈에서의 속성 분석 결과에 따라 상기 메시업검색언어의 각 레벨이 연관되지 않은 경우,
    지식 데이터베이스로부터 상기 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 검색 및 도출하고, 상기 도출한 메시업검색언어의 레벨별 엔티티에 대응하는 데이터를 대상으로 상기 자연어 질의어의 의미분석 결과에 따른 논리적 연산을 적용하여 최종 결과 데이터를 도출하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  23. 제22항에 있어서,
    상기 데이터 도출 모듈은,
    상기 최종 결과 데이터를 상기 주요정보로 도출하고, 상기 도출한 레벨별 엔티티에 대응하는 데이터를 하나 이상의 엔티티정보로 도출하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  24. 제23항에 있어서,
    상기 데이터 가공 모듈은,
    상기 검색결과화면을 상기 주요정보 및 주요정보 관련정보가 출력되는 주요정보 영역 및 상기 하나 이상의 엔티티정보를 출력하는 엔티티 영역으로 구분하여 레이아웃하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
  25. 제16항에 있어서,
    상기 데이터 가공 모듈은,
    상기 주요정보가 단일 속성의 정보인 경우, 상기 주요정보를 자연어 기반의 응답 형태로 가공하여 제공하는, 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 시스템.
KR1020140086954A 2014-07-10 2014-07-10 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 KR101661198B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020140086954A KR101661198B1 (ko) 2014-07-10 2014-07-10 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
JP2015138524A JP6014725B2 (ja) 2014-07-10 2015-07-10 単文/複文構造の自然言語クエリに対する検索および情報提供方法並びにシステム
US14/796,074 US10157201B2 (en) 2014-07-10 2015-07-10 Method and system for searching for and providing information about natural language query having simple or complex sentence structure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140086954A KR101661198B1 (ko) 2014-07-10 2014-07-10 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20160007040A KR20160007040A (ko) 2016-01-20
KR101661198B1 true KR101661198B1 (ko) 2016-10-04

Family

ID=55067741

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140086954A KR101661198B1 (ko) 2014-07-10 2014-07-10 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템

Country Status (3)

Country Link
US (1) US10157201B2 (ko)
JP (1) JP6014725B2 (ko)
KR (1) KR101661198B1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10762434B2 (en) * 2015-01-05 2020-09-01 Amdocs Development Limited Method and software for obtaining answers to complex questions based on information retrieved from big data systems
US10872094B2 (en) * 2016-11-29 2020-12-22 Sap Se Hierarchical computations in relational database management systems
RU2646380C1 (ru) * 2016-12-22 2018-03-02 Общество с ограниченной ответственностью "Аби Продакшн" Использование верифицированных пользователем данных для обучения моделей уверенности
KR102204491B1 (ko) * 2017-04-14 2021-02-04 얄리 주식회사 온톨로지 대화 관계망을 이용한 연속 대화 방법 및 시스템
JP6839360B2 (ja) 2017-05-15 2021-03-10 富士通株式会社 表示プログラム、表示方法および表示装置
US11023461B2 (en) * 2018-01-19 2021-06-01 Servicenow, Inc. Query translation
US11010566B2 (en) * 2018-05-22 2021-05-18 International Business Machines Corporation Inferring confidence and need for natural language processing of input data
US11036726B2 (en) 2018-09-04 2021-06-15 International Business Machines Corporation Generating nested database queries from natural language queries
CN109710742B (zh) * 2018-12-27 2021-01-01 清华大学 一种个股公告自然语言查询处理的方法、系统及设备
US11256870B2 (en) * 2019-09-25 2022-02-22 Rovi Guides, Inc. Systems and methods for inserting dialogue into a query response
CN111159381B (zh) * 2019-12-31 2023-05-26 中国银行股份有限公司 数据搜索方法及装置
US11263195B2 (en) 2020-05-11 2022-03-01 Servicenow, Inc. Text-based search of tree-structured tables
US11403286B2 (en) * 2020-07-28 2022-08-02 Sap Se Bridge from natural language processing engine to database engine
US11526509B2 (en) * 2020-12-31 2022-12-13 International Business Machines Corporation Increasing pertinence of search results within a complex knowledge base
CN114090627B (zh) * 2022-01-19 2022-05-31 支付宝(杭州)信息技术有限公司 一种数据查询方法及装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
JPH11250073A (ja) * 1998-02-26 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> 複数データベース意味的階層検索方法及び装置及び複数データベース意味的階層検索プログラムを格納した記憶媒体
US6453312B1 (en) * 1998-10-14 2002-09-17 Unisys Corporation System and method for developing a selectably-expandable concept-based search
US6510434B1 (en) * 1999-12-29 2003-01-21 Bellsouth Intellectual Property Corporation System and method for retrieving information from a database using an index of XML tags and metafiles
JP2003330959A (ja) * 2002-05-13 2003-11-21 Just Syst Corp カタログ検索システム
US8155951B2 (en) * 2003-06-12 2012-04-10 Patrick William Jamieson Process for constructing a semantic knowledge base using a document corpus
JP2005208825A (ja) * 2004-01-21 2005-08-04 Toshiba Corp データ検索システム、データ検索方法及びプログラム
JP4654745B2 (ja) * 2005-04-13 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US8195683B2 (en) * 2006-02-28 2012-06-05 Ebay Inc. Expansion of database search queries
JP2008021270A (ja) * 2006-07-14 2008-01-31 Univ Of Tokyo データ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システムおよび方法
US20080249764A1 (en) * 2007-03-01 2008-10-09 Microsoft Corporation Smart Sentiment Classifier for Product Reviews
US20090326925A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Projecting syntactic information using a bottom-up pattern matching algorithm
US8370129B2 (en) * 2009-01-07 2013-02-05 Guangsheng Zhang System and methods for quantitative assessment of information in natural language contents
KR20110070725A (ko) * 2009-12-18 2011-06-24 한국전자통신연구원 자동 매쉬업 서비스 장치 및 방법
KR100980579B1 (ko) 2010-02-03 2010-09-06 경북대학교 산학협력단 온톨로지에 대한 자연어 질의 검색 방법 및 시스템
KR20110133909A (ko) * 2010-06-07 2011-12-14 박동민 모든 자연어 표현의 각각의 의미마다 별도의 용어를 동적으로 생성하는 방법 및 이를 기반으로 하는 사전 관리기,문서작성기, 용어 주석기, 검색 시스템 및 문서정보체계 구축장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
채수연, 자연어 질의 의미 해석을 위한 구조적 온톨로지 쿼리 생성 방법론에 관한 연구, 연세대학교 석사학위 논문, 2012.06.

Also Published As

Publication number Publication date
US10157201B2 (en) 2018-12-18
US20160012105A1 (en) 2016-01-14
KR20160007040A (ko) 2016-01-20
JP6014725B2 (ja) 2016-10-25
JP2016018566A (ja) 2016-02-01

Similar Documents

Publication Publication Date Title
KR101661198B1 (ko) 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
US9280535B2 (en) Natural language querying with cascaded conditional random fields
US10503828B2 (en) System and method for answering natural language question
US7533089B2 (en) Hybrid approach for query recommendation in conversation systems
US10289717B2 (en) Semantic search apparatus and method using mobile terminal
KR101339103B1 (ko) 의미적 자질을 이용한 문서 분류 시스템 및 그 방법
US20160041986A1 (en) Smart Search Engine
Habernal et al. SWSNL: semantic web search using natural language
US20150331850A1 (en) System for semantic interpretation
CN109804364A (zh) 知识图谱构建系统及方法
US9965726B1 (en) Adding to a knowledge base using an ontological analysis of unstructured text
CN103229162A (zh) 使用候选答案逻辑综合提供问题答案
CN105447080B (zh) 一种社区问答搜索中的查询补全方法
WO2007143899A1 (fr) Système et procédé pour l&#39;extraction intelligente et le traitement d&#39;informations
JP2011529600A (ja) 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置
CN102622453A (zh) 基于本体的食品安全事件语义检索系统
US10678820B2 (en) System and method for computerized semantic indexing and searching
US20220405484A1 (en) Methods for Reinforcement Document Transformer for Multimodal Conversations and Devices Thereof
US20180276210A1 (en) Dynamic summary generator
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
KR102150908B1 (ko) 자연어 질의해석 방법 및 시스템
Spitz et al. EVELIN: Exploration of event and entity links in implicit networks
WO2012091541A1 (en) A semantic web constructor system and a method thereof
KR102256007B1 (ko) 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법
CN109977294B (zh) 信息/查询处理装置、查询处理/文本查询方法、存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 4