KR101593214B1 - Method and system for searching by using natural language query - Google Patents

Method and system for searching by using natural language query Download PDF

Info

Publication number
KR101593214B1
KR101593214B1 KR1020140086898A KR20140086898A KR101593214B1 KR 101593214 B1 KR101593214 B1 KR 101593214B1 KR 1020140086898 A KR1020140086898 A KR 1020140086898A KR 20140086898 A KR20140086898 A KR 20140086898A KR 101593214 B1 KR101593214 B1 KR 101593214B1
Authority
KR
South Korea
Prior art keywords
language
search
data
physical
mesh
Prior art date
Application number
KR1020140086898A
Other languages
Korean (ko)
Other versions
KR20160007017A (en
Inventor
장재혁
김기영
김명석
허정수
김정훈
서승원
김형준
천지현
이현아
이용훈
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020140086898A priority Critical patent/KR101593214B1/en
Publication of KR20160007017A publication Critical patent/KR20160007017A/en
Application granted granted Critical
Publication of KR101593214B1 publication Critical patent/KR101593214B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 논리적 물리적 2중 구조의 자연어 질의 검색 방법에 관한 것으로, 자연어 질의어에 대하여 상기 자연어 질의어를 구성하는 형태소간의 의미관계를 분석하여 소정의 검색 언어 변환 규칙 기반의 메시업검색언어로 변환하는 메시업검색언어 변환 단계; 상기 메시업검색언어의 속성 구조가 물리적 데이터를 이용하여 논리적 연산을 통해 결과 데이터를 요구하는 논리적/물리적 2중 구조인 경우, 상기 메시업검색언어를 기 설정된 데이터 검색 규칙 정보를 포함하는 2중 구조의 대상검색언어로 변환하는 대상검색언어 변환 단계; 및 상기 2중 구조의 대상검색언어에 포함된 상기 데이터 검색 규칙 정보에 기초하여 소정의 지식 데이터베이스에서 데이터 검색을 수행하는 검색 단계를 포함한다.The present invention relates to a method for searching a natural language query of a logical and physical binary structure, wherein a semantic relation between morphemes constituting the natural language query is analyzed with respect to a natural language query, Up search language translation step; If the attribute structure of the mesh-up search language is a logical / physical duplex structure requiring result data through a logical operation using physical data, the mesh-up search language may be a dual structure including a predetermined data search rule information A target search language conversion step of converting a target search language into a target search language; And a retrieval step of performing data retrieval in a predetermined knowledge database based on the data retrieval rule information included in the target retrieval language of the double structure.

Figure R1020140086898
Figure R1020140086898

Description

논리적 물리적 2중 구조를 이용한 자연어 질의 검색 방법 및 시스템 {Method and system for searching by using natural language query}TECHNICAL FIELD [0001] The present invention relates to a method and system for searching natural language queries using a logical physical double structure,

본 발명은 자연어 질의 검색 방법에 관한 것으로, 구체적으로는 의미태깅된 자연어질의의 다양한 검색 요구에 능동적으로 대응가능한 검색언어를 제안하고, 검색언어의 논리적/물리적 구조 2중 구조를 통해 유연한 정보를 제공하는 자연어 질의 검색 방법 및 시스템에 관한 것이다.More specifically, the present invention proposes a search language capable of actively responding to various search requests of semantic-tagged natural language queries and provides flexible information through a logical / physical structure double structure of search languages And more particularly, to a method and system for searching natural language queries.

온톨로지(Ontology)는 실세계 객체 간의 의미적인 관계를 정의함으로써 컴퓨터가 객체 간의 복잡한 관계로부터 추론되는 정보에 접근하기 위한 정보에 대한 의미적인 명세를 제공하는 것으로서, 인공지능, 정보 검색, 유비쿼터스, 전자상거래 등 다양한 분양에서 응용될 수 있다.Ontology defines a semantic relationship between real-world objects and provides semantic specification of information for the computer to access information derived from complex relationships between objects. It is used for artificial intelligence, information retrieval, ubiquitous, e-commerce, etc. It can be applied in various prefectures.

특히, 상기 온톨로지는 웹상의 다양한 정보를 대상 간의 의미적인 관계로 표현함으로써, 정보 검색 분야에서 기존의 키워드 기반 검색으로 찾을 수 없었던 논리적인 질의 결과를 얻을 수 있다. 예를 들어, 온톨로지를 이용할 경우, "인구가 7천만 이상이고, 바다와 인접한 나라의 수도는 어디인가?"와 같은 질의에 대한 결과를 얻을 수 있다.In particular, the ontology expresses a variety of information on the web in a semantic relationship between objects, thereby obtaining a logical query result that can not be found in an existing keyword-based search in the information search field. For example, when using an ontology, you can get the results of a query such as "Where is the population of more than 70 million, and where is the capital of the neighboring country?"

이러한 온톨로지 정보 검색은 키워드 기반 검색에 비해 세 가지 측면에서 유용성을 가진다. 첫째, 키워드 기반 검색의 결과는 입력 키워드가 포함된 문서만을 검색 결과로 제공하지만, 온톨로지 정보 검색은 사용자가 찾고자하는 특정 대상과 이에 대한 속성 정보를 직접적으로 제공할 수 있다. 둘째, 키워드 기반 검색은 입력 키워드 간의 관계가 반영된 검색 결과를 보장할 수 없지만, 온톨로지 정보 검색은 찾고자 하는 대상을 특징지을 수 있는 다른 대상들과의 관계로부터 정보를 찾을 수 있다. 셋째, 키워드 기반 검색은 이미 존재하는 정보만을 검색할 수 있지만, 온톨로지 정보 검색은 대상 간의 관계로부터 새로운 관계를 찾음으로써 기존에 존재하지 않았던 새로운 정보를 추론할 수 있다.Such ontology information retrieval is more useful in three aspects than keyword based retrieval. First, the keyword-based search results provide only the documents containing the input keywords as search results. However, the ontology information search can directly provide the specific information that the user wants to search and attribute information thereof. Second, keyword based search can not guarantee the search result reflecting the relation between input keywords. However, the ontology information search can find information from the relation with other objects that can characterize the search target. Third, keyword - based search can search only existing information, but searching ontology information can deduce new information that did not exist in the past by searching for a new relation from the relationship between objects.

그런데, 이러한 온톨로지 정보 검색은 사용자가 원하는 질의 대상을 바로 찾음으로써 사용자의 편의성에서 큰 도움이 되나, 일반 사용자에게 익숙하지 않은 온톨로지 질의 언어를 사용해야 하기 때문에, 일반 사용자 입장에서 접근이 어렵다는 문제점이 있다. 결국, 일반 사용자가 온톨로지로 구축된 정보에 접근하기 위해서는 온톨로지의 구조나 온톨로지 질의 언어를 익혀야 하므로 온톨로지의 효용성이 떨어진다.However, this ontology information retrieval is a great help in user's convenience by directly searching for a query object desired by the user, but it is difficult to access the ontology query language because it is not familiar to the general user. As a result, the ontology becomes ineffective because the user has to learn the structure of the ontology and the language of the ontology to access the information constructed by the ontology.

한편, 자연어는 온톨로지 질의 언어로 표현되는 논리적인 의미를 표현하기에 충분하고, 일반 사용자에게 익숙하다. 따라서, 자연어 질의로 온톨로지 정보에 접근할 수 있다면, 일반 사용자의 접근을 쉽게 하여 온톨로지 정보 검색의 효용성을 높일 수 있다.On the other hand, natural language is enough to express the logical meaning expressed in ontology query language, and is familiar to the general user. Therefore, if the ontology information can be accessed by the natural language query, it is possible to improve the efficiency of the ontology information search by making the access of the general user easy.

온톨로지 정보를 자연어 질의로 접근하기 위해서는 자연어 질의를 온톨로지 질의 언어로 변환하는 기술이 요구되며, 이를 위해서는 먼저, 자연어 처리 기술을 활용하여 자연어 질의에 대한 구조 및 의미를 분석하고, 분석된 자연어 질의 정보로부터 자연어 표현에 대응하는 온톨로지의 객체 및 관계를 찾고 온톨로지 질의 언어의 문법 구조에 맞게 자연어 질의를 온톨로지 질의 언어로 변환하여야 한다.In order to access ontology information by natural language query, it is required to convert natural language query into ontology query language. To do this, first, structure and meaning of natural language query are analyzed by using natural language processing technology, We need to find the object and relation of the ontology corresponding to the natural language expression and convert the natural language query into the ontology query language according to the grammar structure of the ontology query language.

그런데 이 방법은, 자연어 질의에 대한 구조 분석 및 의미 분석 등의 오류로 인해 접근할 수 없는 온톨로지 질의 언어가 발생하는 문제점이 있다. 더 구체적으로 설명하면, 일반적인 자연어 처리 기술이 검색 대상 온톨로지에 접근할 수 있는 자연어 표현을 처리하는데 필요한 모든 언어 자원을 갖추었다는 보장이 없고, 사소한 문법적인 오류로 잘못된 분석 결과를 가져 올 수 있기 때문에 접근할 수 없는 온톨로지 질의어가 발생할 수 있다.However, this method has a problem that an ontology query language which can not be accessed due to errors such as structural analysis and semantic analysis on a natural language query occurs. More specifically, there is no guarantee that general natural language processing techniques have all the language resources needed to process natural language expressions that can access the ontology to be searched, and it can lead to false analysis results due to minor grammatical errors. An ontology query term that can not be generated may occur.

결국, 기존의 검색방법에 따르면, 사용자는 오류가 나는 질의에 대해 여러 번의 시행착오를 거치면서 시스템이 처리할 수 있는 질의 유형을 익혀야 하는데, 이렇게 되면, 온톨로지 기반의 정보 검색을 처음 이용하는 사용자는 자연어 처리 기술이 수용할 수 있는 질의 형태와 온톨로지에 구축된 정보의 구체적인 내용을 모르기 때문에 어떤 질의가 유용한지 알 수 없게 된다.As a result, according to the existing retrieval method, the user has to learn the types of queries that the system can process while experiencing many trial and error about an error query. As a result, the user who uses the ontology- It does not know what query is useful because it does not know the type of query that the processing technology can accept and the specific content of the information constructed in the ontology.

또한, 서비스 제공자 입장에서, 구축된 온톨로지 정보를 모두 제공할 수 없다는 것을 보유하고 있는 정보의 유용성을 충분히 보이지 못하는 것을 의미한다.Also, from the service provider 's point of view, it means that it can not provide all of the constructed ontology information.

그런데 대부분의 사용자는 서비스 제공자가 준비한 온톨로지에 대한 정보나 질의 입력 방법을 꼼꼼하게 숙지하기보다는 키워드 기반 정보 검색을 하듯이 직관적으로 사용하기를 원하며, 새로운 시스템에 적응하는데 투자하는 시간과 노력에 비례하여, 그 시스템에 대한 활용도나 만족도는 줄어들게 된다.However, most users want to intuitively use the information on the ontology prepared by the service provider rather than knowing the information about the query and the method of inputting the query. As a result, , The utilization and satisfaction of the system is reduced.

따라서, 정보 검색의 효용성 및 정확성을 높이기 위한 자연어이해 기술(Natural Language Understanding: NLU)에 대한 연구가 계속되고 있다. 자연어 기술은 '사용자 질문'을 대상으로 사용자의 질문 의도를 파악하려는 것으로, 음성으로 발화하거나 텍스트로 입력한 질문이 입력이 되고, 자연어 기술기법에서 질문 의도를 파악하여 추출한 리스트가 해당 질문에 대한 출력이 되는 것을 의미한다.Therefore, research on Natural Language Understanding (NLU) is continuing to improve the utility and accuracy of information retrieval. Natural language technology is intended to grasp the user's intention of the user on the 'user question'. It is the input of the question which is uttered by voice or inputted as text, and the extracted list by understanding the intention of the question in the natural language technique, .

의미 태깅된 자연어를 이용하게 되면 복잡 다양하면서 사용자의 의도를 좀더 명확하게 드러낼 수 있는 질의가 가능하다. 다만, 자연어 기반의 질의어는 질의어에 포함된 사용자 의도를 정확하게 파악하는 기술뿐만 아니라 사용자의 다양한 니즈를 모두 반영할 수 있는 데이터 구조의 지식 데이터베이스가 구축되어야 한다는 어려움이 있다.Meaning Using the tagged natural language, it is possible to inquire that the complexity is varied and the user's intention can be revealed more clearly. However, there is a difficulty in building a knowledge database of a data structure that can reflect not only a technique for accurately grasping user intention contained in a query word but also various needs of a user, based on a natural language query.

본 발명의 목적은 상술한 문제점을 해결하기 위하여 안출된 것으로, 논리적 물리적 2중 구조의 복잡한 자연어 질의어에 대하여 질의어를 구성하는 형태소 분석을 통해 검색 도메인 및 속성 구조를 정의하고, 상기 정의된 바에 따라 지식 데이터베이스의 물리적 구조에 대응되는 검색 언어로 변환하는 검색 방법 및 시스템을 제안하는 것이다. An object of the present invention is to solve the above-mentioned problems, and it is an object of the present invention to define a search domain and an attribute structure by morpheme analysis constituting a query word for a complex natural language query having a logical and physical double structure, To a search language corresponding to the physical structure of the database.

또한, 본 발명의 목적은 기존의 지식 데이터베이스에 저장되어 있는 물리적 데이터를 이용하여 사용자 의도에 부합되는 검색 결과를 제공함에 따라, 검색 시스템의 데이터베이스용량 및 검색 엔진의 부하를 최소화하는 것이다. It is another object of the present invention to minimize the database capacity of a search system and the load of a search engine by providing search results matching user intent using physical data stored in an existing knowledge database.

본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.It is to be understood that both the foregoing general description and the following detailed description are exemplary and explanatory and are not restrictive of the invention, unless further departing from the spirit and scope of the invention as defined by the appended claims. It will be possible.

상술한 문제를 해결하기 위한 본 발명의 일 양태 일 실시예에 따른 자연의 질의 검색 방법은, 자연어 질의어에 대하여 상기 자연어 질의어를 구성하는 형태소간의 의미관계 분석을 통해 상기 질의어를 메시업검색언어로 변환하는 메시업검색언어 변환 단계; 상기 메시업검색언어의 속성 구조가 물리적 데이터를 이용하여 논리적 연산을 통해 결과 데이터를 요구하는 논리적/물리적 2중 구조인 경우, 상기 메시업검색언어를 기 설정된 데이터 검색 규칙 정보를 포함하는 2중 구조의 대상검색언어로 변환하는 대상검색언어 변환 단계; 및 상기 2중 구조의 대상검색언어에 포함된 상기 데이터 검색 규칙 정보에 기초하여 소정의 지식 데이터베이스에서 데이터 검색을 수행하는 검색 단계를 포함한다.According to an aspect of the present invention, there is provided a method of searching for a natural query according to an embodiment of the present invention, comprising: converting a query term into a mesh-up search language through analysis of semantic relations between morphemes constituting the natural- A mesh-up search language conversion step; If the attribute structure of the mesh-up search language is a logical / physical duplex structure requiring result data through a logical operation using physical data, the mesh-up search language may be a dual structure including a predetermined data search rule information A target search language conversion step of converting a target search language into a target search language; And a retrieval step of performing data retrieval in a predetermined knowledge database based on the data retrieval rule information included in the target retrieval language of the double structure.

본 발명의 실시예에 따른 상기 데이터 검색 규칙정보는, 논리적/물리적 2중 구조인 메시업검색언어에 대한 결과 데이터를 도출하기 위해 필요한 하나 이상의 물리적 데이터의 속성 정보 및 상기 하나 이상의 물리적 데이터를 이용한 연산 규칙 정보를 포함할 수 있다.The data retrieval rule information according to an exemplary embodiment of the present invention includes attribute information of one or more physical data required to derive result data for a mesh-up retrieval language which is a logical / physical double structure, And may include rule information.

본 발명의 실시예에 따른 상기 검색 단계는, 상기 대상검색언어에 포함된 상기 데이터 검색 규칙정보에 기초하여 지식 데이터베이스로부터 하나 이상의 물리적 데이터를 도출하는 단계; 및 상기 도출한 하나 이상의 물리적 데이터를 이용하여 상기 연산 규칙 정보에 따른 결과 데이터를 도출하는 단계를 포함할 수 있다.
The retrieving step according to an embodiment of the present invention includes: deriving one or more physical data from a knowledge database based on the data retrieval rule information included in the target retrieval language; And deriving result data according to the calculation rule information using the derived one or more physical data.

상술한 과제를 해결하기 위한 본 발명의 다른 양태 일 실시예에 따른 자연어 질의어 질의 검색 시스템은, 사용자 디바이스를 통해 입력된 자연어 질의어를 구성하는 형태소간의 의미관계 분석을 통해 상기 자연어 질의어를 메시업검색언어로 변환하는 자연어 처리 엔진; 상기 자연어 처리 엔진에서 생성된 메시업검색언어를 데이터베이스 검색 언어인 대상검색언어로 변환하고, 상기 대상검색언어에 기초하여 검색 및 결과 데이터를 제공하는 검색 엔진; 및 지식정보 및 언어 변환 정보를 저장하는 지식 데이터베이스를 포함하되, 상기 검색 엔진은, 상기 메시업검색언어의 속성 구조가 물리적 데이터를 이용하여 논리적 연산을 통해 결과 데이터를 요구하는 논리적/물리적 2중 구조인 경우, 상기 메시업검색언어를 기 설정된 데이터 검색 규칙 정보를 포함하는 2중 구조의 대상검색언어로 변환하고, 상기 데이터 검색 규칙 정보에 기초하여 검색을 수행한다.According to another aspect of the present invention, there is provided a natural language query query system for analyzing a natural language query through a semantic relation analysis between morphemes constituting a natural language query input through a user device, A natural language processing engine for converting the natural language; A search engine for converting the mesh-up search language generated by the natural language processing engine into a target search language, which is a database search language, and providing search and result data based on the target search language; And a knowledge database for storing knowledge information and language conversion information, wherein the search engine is a logical / physical dual structure in which the attribute structure of the mesh-up search language requests result data through logical operation using physical data , It converts the mesh-up search language into a target search language of a double structure including predetermined data search rule information, and performs search based on the data search rule information.

본 발명의 실시예에 따른 상기 검색 엔진은, 상기 자연어 처리 엔진에서 생성된 메시업검색언어의 도메인 및 속성 구조를 분석하여 속성 구조에 기반한 대상검색언어로 변환하는 대상검색언어 변환 모듈; 및 상기 대상검색언어 변환 모듈에서 생성된 대상검색언어에 기초하여 상기 지식 데이터베이스로부터 물리적 데이터를 검색 및 도출하여 결과 데이터를 생성하는 데이터 도출 모듈을 포함할 수 있다.The search engine according to an embodiment of the present invention includes a target search language conversion module for analyzing a domain and an attribute structure of a mesh-up search language generated by the natural language processing engine and converting the domain and the attribute structure into a target search language based on an attribute structure; And a data derivation module for retrieving and deriving physical data from the knowledge database based on the target search language generated by the target search language conversion module and generating result data.

본 발명의 실시예에 따른 상기 대상검색언어 변환 모듈은, 상기 메시업검색언어의 속성 구조가 논리적/물리적 2중 구조인 경우, 상기 메시업검색언어를 기 설정된 데이터 검색 규칙 정보를 포함하는 2중 구조의 대상검색언어로 변환할 수 있다.In the case where the attribute structure of the mesh search language is a logical / physical duplex structure, the target search language conversion module according to an embodiment of the present invention may further include: You can convert to the target search language of the structure.

이때, 상기 데이터 도출 모듈은, 상기 대상검색언어 변환 모듈에서 변환한 상기 2중 구조의 대상검색언어에 포함된 상기 데이터 검색 규칙정보에 기초하여 지식 데이터베이스로부터 하나 이상의 물리적 데이터를 도출하고, 상기 도출한 하나 이상의 물리적 데이터를 이용하여 상기 연산 규칙 정보에 따른 결과 데이터를 도출할 수 있다.At this time, the data derivation module derives one or more physical data from a knowledge database based on the data retrieval rule information included in the target retrieval language of the double structure converted by the target retrieval language conversion module, It is possible to derive result data according to the calculation rule information using one or more physical data.

상기 실시형태들은 본 발명의 바람직한 실시예들 중 일부에 불과하며, 본원 발명의 기술적 특징들이 반영된 다양한 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 본 발명의 상세한 설명을 기반으로 도출되고 이해될 수 있다.
It is to be understood that both the foregoing general description and the following detailed description of the present invention are exemplary and explanatory and are intended to provide further explanation of the present invention by those skilled in the art. And can be understood and understood.

본 발명의 실시예에 따르면, 유연한 구조의 질의어 처리 방법을 제안함에 따라 자연어 질의어 특성을 바탕으로 높은 품질의 검색 결과를 제공할 수 있다.According to an embodiment of the present invention, a flexible query structure processing method is proposed, and a high quality search result can be provided based on natural language query characteristics.

또한, 본 발명의 실시예에 따르면, 기존의 지식 데이터베이스에 저장되어 있는 물리적 데이터를 이용하여 사용자 의도에 부합되는 검색 결과를 제공함으로써 검색 시스템의 데이터베이스용량 및 검색 엔진의 부하를 최소화하는 것이다. According to an embodiment of the present invention, a database capacity of a search system and a load of a search engine are minimized by providing search results matching user intent using physical data stored in an existing knowledge database.

본 발명에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부도면은 본 발명에 대한 실시예를 제공하고, 상세한 설명과 함께 본 발명의 기술적 사상을 설명한다.
도 1은 본 발명의 실시예에 따른 논리적/물리적 2중 구조 기반의 검색 시스템의 일 예를 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 사용자 질의어를 토대로 생성된 NQL의 일 예를 나타내는 도면이다.
도 3은 본 발명의 실시예에 따른 검색 엔진에서 메시업검색언어를 토대로 검색 결과를 제공하는 과정의 일 예를 나타내는 도면이다.
BRIEF DESCRIPTION OF THE DRAWINGS The accompanying drawings, which are included to provide a further understanding of the invention and are incorporated in and constitute a part of the specification, illustrate embodiments of the invention and, together with the description, serve to explain the principles of the invention.
1 is a diagram illustrating an example of a logical / physical dual structure based search system according to an embodiment of the present invention.
2 is a diagram illustrating an example of an NQL generated based on a user query according to an embodiment of the present invention.
3 is a diagram illustrating an example of a process of providing a search result based on a mesh-up search language in a search engine according to an embodiment of the present invention.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이하 본 발명에 대한 상세한 설명 부분에서 설명하고자 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.BRIEF DESCRIPTION OF THE DRAWINGS The present invention is capable of various modifications and various embodiments, and particular embodiments are illustrated in the drawings and described in the following description of the invention. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

이하, 본 발명에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 발명의 예시적인 실시형태를 설명하고자 하는 것이며, 본 발명이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다. 이하의 상세한 설명은 본 발명의 완전한 이해를 제공하기 위해서 구체적 세부사항을 포함한다. 그러나, 당업자는 본 발명이 이러한 구체적 세부사항 없이도 실시될 수 있음을 안다. Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the accompanying drawings. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The following detailed description, together with the accompanying drawings, is intended to illustrate exemplary embodiments of the invention and is not intended to represent the only embodiments in which the invention may be practiced. The following detailed description includes specific details in order to provide a thorough understanding of the present invention. However, those skilled in the art will appreciate that the present invention may be practiced without these specific details.

본 발명은 의미 태깅된 자연어질의의 다양한 검색 요구에 능동적으로 대응가능한 검색언어를 제안하고, 검색언어의 논리적/물리적 구조 2중 구조를 통해 유연한 정보를 제공하는 자연어 질의 검색 방법 및 시스템에 관한 것이다. The present invention proposes a search language capable of actively responding to various search requests of semantic-tagged natural language queries, and to a natural language query searching method and system for providing flexible information through a logical / physical structure binary structure of a search language.

도 1은 본 발명의 실시예에 따른 자연어 질의 기반의 검색 시스템의 일 예를 나타내는 도면이다.1 is a diagram illustrating an example of a natural language query-based retrieval system according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 실시예에 따른 검색 시스템(100)은 사용자 디바이스(110)를 통해 입력된 사용자 질의어를 분석하기 위한 자연어이해 기술(Natural Language Understanding: NLU) 기반의 자연어처리엔진(120), 검색엔진(130) 및 지식 데이터베이스(140)로 구성된다. Referring to FIG. 1, a search system 100 according to an embodiment of the present invention includes a natural language processing engine (NLU) based on a Natural Language Understanding (NLU) for analyzing a user query input through a user device 110 120, a search engine 130, and a knowledge database 140.

자연어처리엔진(120)은 사용자 디바이스(110)를 통해 입력된 의미 태깅된 자연어 기반의 복잡한 질의어를 분석하여 의미 분석을 통해 메시업검색언어(Naver Contents Repository-mashup Query Language: NQL)로 변환하고, 검색엔진(130)은 자연어처리엔진(120)에서 생성된 NQL에 기초하여 기 구축된 지식 데이터베이스로부터 질의 요청된 정보를 도출하여 사용자 디바이스(110)로 제공한다.The natural language processing engine 120 analyzes a complex query term based on the semantically tagged natural language inputted through the user device 110 and converts it into a Naver Contents Repository-mashup Query Language (NQL) through semantic analysis, The search engine 130 derives the query-requested information from the pre-built knowledge database based on the NQL generated by the natural language processing engine 120 and provides it to the user device 110.

이하, 본 발명의 실시예에 따른 검색 시스템의 각 구성에 대하여 간략하게 설명하도록 한다.Hereinafter, each configuration of the search system according to the embodiment of the present invention will be briefly described.

자연어처리엔진(120)은 사용자 질의의 의미분석을 수행하는 의미분석모듈(121) 및 의미분석 결과에 따라 자연어 기반의 사용자 질의어를 추론 가능한 NQL로 변환하는 NQL변환모듈(122)을 포함한다.The natural language processing engine 120 includes a semantic analysis module 121 for performing semantic analysis of a user query and an NQL conversion module 122 for converting a natural language-based user query into an inferable NQL according to a semantic analysis result.

의미분석모듈(121)은 사용자 질의어를 분석하여 형태소 단위로 분류하고, 형태소간의 의미관계를 파악하여 사용자 질의어의 논리적/물리적 2중 구조를 분석한다. The semantic analysis module 121 analyzes the user query word, classifies it into morpheme units, and analyzes the logical / physical double structure of the user query word by grasping the semantic relation between morphemes.

예를 들어, 의미분석모듈(121)은 사용자 질의어가 "특정인물 A의 현재나이는?"인 경우, 해당 질의어는 "특정인물 A의 생년월일은?"이란 물리적 데이터를 요청하는 질의 문구와 "현재년도는?"이라는 물리적 데이터를 요청하는 질의 문구에 대한 결과를 통해 최종 결과를 도출하는 2중 구조로 이루어진 것을 분석할 수 있다. 즉, 질의어의 형태소간의 의미관계 분석을 통해 "현재나이"는 "생년월일", "현재년도"와 같은 물리적 데이터를 내부적으로 포함하는 논리적/물리적 2중 구조로 파악할 수 있다.For example, if the user query term is "current age of a specific person A ?, ", the corresponding query term is a query phrase for requesting physical data" And the result of the query that requests the physical data of "Year?" Can be analyzed. In other words, through analyzing the semantic relationship between the morphemes of the query words, the "current age" can be understood as a logical / physical dual structure including the physical data such as "date of birth" and "current year" internally.

NQL변환모듈(122)은 연어 기반의 사용자 질의어를 검색용 언어인 NQL로 변환하는 모듈로서, 의미분석모듈(121)에서 수행한 분석 결과에 기초하여 사용자 질의에 포함된 하나 이상의 질의문구를 추론할 수 있도록 트리 구조의 NQL을 생성한다.The NQL conversion module 122 is a module for converting a user query term based on a salmon into a search language NQL and can infer one or more query phrases included in the user query based on the analysis result performed by the semantic analysis module 121 NQL of the tree structure is created.

본 명세서에서 NQL이란 질의어를 분석하여 서비스단 속성을 지정하는 검색 언어로서, 자연어로 표현된 사용자의 질의에 의미 태깅하여 지식 데이터베이스에 질의하기 위하여 고안된 언어로 정의할 수 있다. NQL은 외부적으로는 논리적 속성을 나타내고 내부적으로는 지식 데이터베이스의 물리적 속성을 이용하여 검색 결과를 생성하는 2중 구조로 이루어진다. 즉, NQL은 지식 데이터베이스의 물리적 구조를 따르지 않고 독자적인 논리적 구조를 구축하여, 설정을 통해 논리적 구조와 물리적 구조간의 관계를 정의하여 질의 유형별, 서비스 유형별로 적합한 데이터 제공이 가능하도록 하기 위한 언어이다. 예를 들어, 사용자 질의어에 "몇살인가요"란 품사가 포함되면, 이를 토대로 변환된 NQL은 "나이"로 속성을 지정할 수 있다. In this specification, NQL is a search language for specifying a service unit attribute by analyzing a query word, and can be defined as a language designed to query a knowledge database by meaning tagging a user query expressed in a natural language. NQL consists of a dual structure that externally represents logical attributes and internally generates search results using the physical attributes of the knowledge database. In other words, NQL is a language for building a unique logical structure that does not conform to the physical structure of the knowledge database, and defines the relationship between the logical structure and the physical structure through the setting so that appropriate data can be provided for each type of query and service type. For example, if the user query includes the phrase "how old are you?", The converted NQL can be specified as "age".

NQL변환모듈(122)에서 생성하는 트리 구조의 NQL은 도 2에 예시된 바와 같다. 이에 대해서는 이하 도 2를 참조하여 후술하도록 한다.The NQL of the tree structure generated by the NQL conversion module 122 is as illustrated in FIG. This will be described later with reference to Fig.

다음으로, 검색엔진(130)은 자연어처리엔진(120)에서 생성된 자연어 질의 기반의 NQL에 기초하여 지식 데이터베이스(140)로부터 정보 검색을 수행하며, 메시업 기술을 기반으로 한다. Next, the search engine 130 performs information search from the knowledge database 140 based on the natural language based NQL generated by the natural language processing engine 120, and is based on the mesh-up technology.

구체적으로, 검색엔진(130)은 자연어처리 엔진(120)으로부터 전송되는 NQL을 대상 검색 언어(Object Query Language: OQL)로 변환하기 위한 OQL 변환모듈(131), 지식 데이터베이스(140)에 기초하여 OQL에 대응하는 데이터를 검색 및 도출하기 위한 데이터 도출 모듈(132) 및 도출한 검색 데이터를 사용자 의도에 부합되도록 가공하여 제공하는 데이터 가공 모듈(133)을 포함한다.Specifically, the search engine 130 includes an OQL conversion module 131 for converting the NQL sent from the natural language processing engine 120 into a target query language (OQL), a knowledge database 140, A data derivation module 132 for retrieving and deriving data corresponding to the retrieved data, and a data processing module 133 for processing and providing the retrieved retrieved data in accordance with the user's intention.

본 명세서에서 OQL이란 지식 데이터베이스 검색에 최적화된 언어로 정의할 수 있으며, OQL은 지식 데이터베이스가 사용하는 물리적 구조를 사용한다. 예를 들어, 상기 실시예에서 사용자 질의어인 "몇살인가요"로부터 변환된 속성언어 NQL "나이"에 대하여 "현재년도 값과 출생년도 값을 이용하여 나이를 계산하기 위한 검색 언어"로 표현되는 OQL로 변환할 수 있다. In this specification, OQL can be defined as a language optimized for searching a knowledge database, and OQL uses a physical structure used by a knowledge database. For example, in the above embodiment, an OQL expressed as " a search language for calculating an age using a current year value and a birth year value " for a property language NQL "age " . ≪ / RTI >

지식 데이터베이스(140)은 OQL 변환에 필요한 속성정보 및 규칙정보를 저장하는 OQL DB(141), 지식정보 DB(142) 및 데이터 가공 규칙 DB(143)를 포함한다. 이때, OQL DB(141)는 OQL 변환시 NQL의 논리적/물리적 2중 구조를 표현할 수 있도록 NQL의 논리적/물리적 2중 구조를 풀기 위해 필요한 속성 정의 규칙을 저장하는 것이 바람직하다. The knowledge database 140 includes an OQL DB 141, a knowledge information DB 142, and a data processing rule DB 143 for storing attribute information and rule information required for OQL conversion. At this time, it is preferable that the OQL DB 141 stores the property definition rules necessary for solving the logical / physical dual structure of NQL so as to express the logical / physical dual structure of NQL at the time of OQL conversion.

OQL 변환모듈(131)은 자연어 처리 엔진으로부터 제공된 NQL을 OQL DB(141)에 기초하여 OQL로 변환하는데, NQL의 논리적 도메인 및 속성에 기초하여 지식 데이터베이스의 물리적 속성값으로 원하는 데이터를 도출할 수 있는 OQL로 변환한다. The OQL conversion module 131 converts the NQL provided from the natural language processing engine into the OQL based on the OQL DB 141. The OQL conversion module 131 can derive desired data as physical attribute values of the knowledge database based on the logical domain and the attributes of the NQL OQL.

일 실시예로, 질의대상인 특정 인물에 대한 NQL 속성이 "생년월일", "데뷔년도"와 같이 물리적인 구조에 따른 경우, OQL 변환모듈(131)은 "생년월일", "데뷔년도"에 대한 물리적 구조 기반의 OQL로 변환할 수 있다. In one embodiment, when the NQL attribute for a specific person to be queried is in accordance with a physical structure such as "date of birth", "year of debut", the OQL transformation module 131 determines the physical structure Based OQL.

반면, 질의대상인 특정 인물에 대한 NQL 속성이 "현재나이", "데뷔나이", "사망나이"와 같이 두 가지 이상의 정보를 토대로 결과값을 도출해야 하는 논리적 구조에 따른 경우, 해당 NQL이 나타내는 속성을 OQL DB(141)에 기 저장된 속성 정의 규칙에 기초하여 논리적/물리적 구조 기반의 OQL로 변환할 수 있다. On the other hand, if the NQL attribute for a specific person to be queried is based on a logical structure that must derive a result based on two or more pieces of information such as "current age", "de age age", " Can be converted into an OQL based on a logical / physical structure based on an attribute definition rule pre-stored in the OQL DB 141. [

예를 들어, 해당 인물의 "현재나이"가 질의요청된 경우, NQL은 "나이"를 지정하고, 논리적/물리적 구조에 따른 OQL은 해당 인물의 "출생년도" 및 "현재년도"라는 물리적 데이터를 이용하여 "현재나이"를 연산하기 위한 언어로 표현되도록 변환할 수 있다. 다른 예로, NQL "데뷔나이"의 경우, 해당 인물의 "생년월일" 및 "데뷔년도"라는 물리적 데이터를 이용하여 "데뷔나이"를 연산하는 언어로 OQL을 변환할 수 있다. For example, if the "current age" of the person is requested, NQL specifies "age" and OQL according to the logical / physical structure specifies the physical data "birth year" and "current year" Quot; current age "can be converted to be expressed in a language for calculating the" current age " As another example, in the case of NQL "DeveNaiNai ", the OQL can be converted into a language that computes the" DeVeNiNa "using the physical data of the person" date of birth "

이에 따라, 데이터 도출 모듈(132)은 OQL 변환모듈(131)에서 변환된 OQL을 토대로 지식정보 DB(142)를 검색하여 물리적 데이터를 도출한다. 또한, 데이터 도출 모듈(132)은 도출한 하나 이상의 물리적 데이터를 이용하여 논리적 구조에 부합되는 데이터를 도출할 수 있다. Accordingly, the data derivation module 132 searches the knowledge information DB 142 based on the converted OQL from the OQL transformation module 131 to derive physical data. In addition, the data derivation module 132 may derive data consistent with the logical structure using the derived one or more physical data.

상술한 실시예에 따라, OQL이 특정 인물의 "출생년도" 및 "현재년도"라는 물리적 데이터를 토대로 "현재나이"를 도출하기 위한 언어로 정의된 경우, 데이터 도출 모듈(132)은 지식정보 DB(142)로부터 해당 인물의 "출생년도" 및 "현재년도"라는 물리적 데이터를 도출하고, 도출된 "출생년도" 및 "현재년도" 데이터로부터 "현재나이" 데이터를 산출하여 요청된 데이터를 도출할 수 있다. 즉, 지식정보 DB(142)에 해당 인물의 "현재나이" 또는 "데뷔년도"에 대한 물리적 데이터가 별도로 저장되어 있지 않더라도 요청된 질문에 결과값을 도출하기 위해 필요한 기존 데이터를 이용하여 질의 결과를 제공할 수 있다.According to the embodiment described above, when the OQL is defined as a language for deriving the "current age" based on the physical data of the "birth year" and the "current year" of a specific person, From the "birth year" and the "current year" data derived from the physical data of the person "birth year" and "current year" from the data file 142 and derives the requested data . That is, even if physical data for the "current age" or "debut year" of the person is not separately stored in the knowledge information DB 142, the query result is obtained using the existing data necessary for deriving the result value to the requested question .

데이터 가공 모듈(133)은 데이터 가공 규칙 DB(143)에 기초하여 데이터 도출 모듈(132)에서 도출한 OQL 데이터를 NQL 결과로 가공한다. 바람직하게는, 데이터 가공 모듈(133)은 기 설정된 NQL config 규칙에 따라 질의유형, 다계층의 질의 구조, 질의 속성별 설정에 기반하여 사용자에게 제공되는 데이터 형태를 가공할 수 있다.The data processing module 133 processes the OQL data derived from the data derivation module 132 based on the data processing rule DB 143 into an NQL result. Preferably, the data processing module 133 may process the data type provided to the user based on the query type, the multi-level query structure, and the setting according to the query attribute according to the predetermined NQL config rule.

이에 따라, 본 발명의 실시예에 따른 검색 엔진(130)은 사용자의 질문 시점이나 질문 형태에 따라 제공되는 데이터가 변경되는 논리적/물리적 2중 구조의 데이터들에 대하여 지식정보 DB(142)에 기 저장된 물리적 데이터를 이용하여 도출함으로써, 지식정보 DB(142)의 기 저장된 데이터 활용 및 별도의 신규데이터를 주기적으로 업데이트하는 부하를 최소화할 수 있다.Accordingly, the search engine 130 according to the embodiment of the present invention searches the knowledge DB 142 for data of a logical / physical dual structure in which data provided according to a question or a question type of a user is changed By using the stored physical data, it is possible to minimize the load of periodically updating the data stored in the knowledge information DB 142 and the new data.

도 2는 본 발명의 실시예에 따른 사용자 질의어를 토대로 생성된 메시업검색언어 의 일 예를 나타내는 도면이다.2 is a diagram illustrating an example of a mesh-up search language generated based on a user query according to an embodiment of the present invention.

도 2를 참조하면, 사용자 질의어는 "소녀시대 멤버가 출연한 영화는?"이고, 자연어처리 엔진은 질의어를 형태소별 정규화하여 "소녀시대(가수그룹명), 멤버(속성), 영화(속성)"으로 프레임 추출하고, "소녀시대←멤버←영화"와 같은 형태소간의 의미관계를 분석하여, 도 2에 도시된 바와 같은 계층적 구조의 NQL로 나타낼 수 있다. Referring to FIG. 2, the user query language is "What is the movie in which the member of the Girls Generation appeared? &Quot;, and the natural language processing engine normalizes the query word by the morpheme, &Quot;, and the semantic relation between morphemes such as "Girls' Generation < - > Member < Movie" is analyzed and can be expressed as NQL of a hierarchical structure as shown in FIG.

예시된 계층적 구조는 "object/name":소녀시대"(201)와 그에 대한 속성정보로 "person/member"(202) 및 "person/movie_performed"(203)로 구성할 수 있다. 즉, 도 2에 도시된 NQL의 속성은 OPP(Object/Property/Property) 형태의 계층적 구조라 볼 수 있다. The illustrated hierarchical structure can consist of "person / member" 202 and "person / movie_performed" 203 as "object / name": Girls' Generation "201 and attribute information therefor. The attribute of NQL shown in Fig. 2 can be regarded as a hierarchical structure of OPP (Object / Property / Property) type.

본 발명의 실시예에 따른 메쉬업 기술은 질의어의 의미분석에 따라 질의어를 구성하는 형태소의 속성별로 OP(Object/Property), COP(Condition/Object/Property), OPP(Object/Property/Property), OOP(Object/Object/Property), OO(Object/Object), CCO(Condition/Condition/Object), CCOP(Condition/Condition/Object/Property) 등과 같은 다양한 관계형으로 나타낼 수 있다. According to an embodiment of the present invention, the mesh-up technique includes an OP (Object / Property), a COP (Condition / Object / Property), and an OPP (Object / Property / Property) for each attribute of a morpheme constituting a query word, Such as OOP (Object / Object / Property), OO (Object / Object), CCO (Condition / Condition / Object) and CCOP (Condition / Condition / Object / Property).

도 3은 본 발명의 실시예에 따른 검색 엔진에서 메시업검색언어를 토대로 검색 결과를 제공하는 과정의 일 예를 나타내는 도면이다.3 is a diagram illustrating an example of a process of providing a search result based on a mesh-up search language in a search engine according to an embodiment of the present invention.

도 3을 참조하면, 본 발명의 실시예에 따른 검색 엔진은 자연어처리엔진으로부터 사용자 질의어에 기반한 NQL이 입력되면(S301), NQL의 속성 및 도메인에 대한 분석을 수행한다(S302).Referring to FIG. 3, when a search engine according to an embodiment of the present invention receives an NQL based on a user query term from a natural language processing engine (S301), it performs an analysis on an attribute and a domain of the NQL (S302).

분석 과정(S302)에서 NQL의 속성 구조가 물리적 데이터를 요하는 단일 구조인지 또는 내부적으로는 물리적 데이터를 요하나 외부적으로 논리적 결과를 요구하는 논리적/물리적 2중 구조인지 여부를 판단한다.In the analysis process (S302), it is determined whether the attribute structure of the NQL is a single structure requiring physical data, or whether it is a logical / physical dual structure that requires physical data internally or externally requires a logical result.

NQL 속성 분석 결과, 해당 NQL이 논리적/물리적 2중 구조인 경우 논리적 데이터를 도출하기 위해 필요한 하나 이상의 물리적 데이터를 정의하는 OQL로 변환한다(S303, S304).As a result of the NQL attribute analysis, if the corresponding NQL is a logical / physical double structure, the OQL is converted into an OQL defining one or more physical data required to derive the logical data (S303, S304).

상술한 실시예에 따르면, NQL 속성 구조가 "생년월일", "데뷔년도"와 같이 물리적 단일 구조인 경우, "생년월일", "데뷔년도"를 지칭하는 OQL로 변환할 수 있다. 또는, NQL 속성 구조가 "현재나이"와 같은 논리적/물리적 2중 구조인 경우, "현재나이"를 연산하기 위해 필요한 "생년월일" 및 "현재연도"라는 물리적 데이터를 이용하여 "데뷔나이"를 연산하는 것으로 정의하는 OQL로 변환할 수 있다. According to the above-described embodiment, when the NQL property structure is a physical unity structure such as "date of birth "," date of debut ", it can be converted into OQL designating "date of birth" Alternatively, when the NQL property structure is a logical / physical double structure such as "current age ", the" debian age "is computed using the physical data" date of birth " You can convert to OQL, which is defined as doing.

다른 실시예로는, NQL 속성 구조가 특정 인물의 "출연작품"이라는 하나 이상의 도메인별(예, 영화, 방송, 공연 등) 데이터를 요구하는 2중 구조인 경우, NQL "출연작품"에 대하여 "출연영화", "출연방송", "출연공연" 등의 다수의 물리적 데이터를 이용하여 결과값을 도출하도록 정의하는 OQL로 변환할 수 있다. In another embodiment, if the NQL attribute structure is a dual structure requiring data for one or more domains (e.g., movies, broadcasts, performances, etc.) called " Quot ;, " feature film ", "feature film ", " feature broadcast "," performance performance ", and the like.

나아가, NQL 속성 구조가 특정 인물이 "주연배우"로 출연한 작품을 요구하는 2중 구조인 경우, NQL "주연배우"에 대하여 출연영화", "출연방송", "출연공연" 등의 다수의 물리적 데이터를 이용하여 도출한 결과값인 "출연작품" 데이터 중에서 해당 인물의 배역이 "주연"으로 설정된 작품만을 선택적으로 도출하도록 정의하는 OQL로 변환할 수 있다. 이때, 생성되는 OQL 역시 상위개념에서 하위개념으로 상하 관계의 검색하기 위한 계층적 구조로 구성할 수 있다.Furthermore, when the NQL property structure is a dual structure requiring a work in which a specific character appears as a "main actor", a plurality of NQL "major actors", "feature films", " The OQL that is defined to selectively derive only the works whose title is set as the "master" in the "starring work" data obtained by using the physical data. In this case, And a hierarchical structure for searching for a hierarchical relationship as a sub-concept.

이와 같이, NQL의 논리적/물리적 2중 구조 속성에 따라 변환된 OQL에 대하여 지식 데이터베이스로부터 필요한 하나 이상의 물리적 데이터를 검색 및 도출하고, 도출한 하나 이상의 물리적 데이터를 이용하여 NQL에 대한 결과 데이터를 도출한다(S305).As described above, one or more physical data required from the knowledge database is retrieved and derived for the converted OQL according to the logical / physical dual structure attribute of NQL, and the resulting data for NQL is derived using one or more derived physical data (S305).

반면, 상기 NQL 속성 분석 단계(S302)에서 NQL 속성 구조가 물리적 데이터를 요청하는 단일 구조인 경우, NQL이 지칭하는 물리적 데이터에 대한 OQL로 변환한다(S303, S306). On the other hand, if the NQL attribute structure is a single structure for requesting physical data in the NQL attribute analysis step S302, the OQL for the physical data referred to by the NQL is converted (S303, S306).

그리고, 단일 구조의 NQL에서 변환된 OQL에 기초하여 지식 데이터베이스로부터 물리적 데이터를 도출한다(S307).Then, the physical data is derived from the knowledge database based on the OQL converted from the NQL of the single structure (S307).

최종적으로, 검색 엔진은 단일 구조 또는 논리적/물리적 2중 구조에 기반하여 도출한 데이터를 토대로 사용자 질의어 유형에 부합되도록 데이터를 가공하여 제공한다(S308).Finally, the search engine processes the data based on the data derived based on the single structure or the logical / physical double structure to match the user query type and provides the data (S308).

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서 본 발명에 기재된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상이 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의해서 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다. The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments of the present invention are not intended to limit the scope of the present invention but to limit the scope of the present invention. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents thereof should be construed as being included in the scope of the present invention.

Claims (13)

자연어 질의어 질의 검색 시스템에 의한 논리적 물리적 2중 구조의 자연어 질의 검색 방법에 있어서,
자연어 질의어에 대하여 상기 자연어 질의어를 구성하는 형태소간의 의미관계를 분석하여 소정의 검색 언어 변환 규칙 기반의 메시업검색언어로 변환하는 메시업검색언어 변환 단계;
상기 메시업검색언어의 속성 구조가 물리적 데이터를 이용하여 논리적 연산을 통해 결과 데이터를 요구하는 논리적/물리적 2중 구조인 경우, 상기 메시업검색언어를 기 설정된 데이터 검색 규칙 정보를 포함하는 2중 구조의 대상검색언어로 변환하는 대상검색언어 변환 단계; 및
상기 2중 구조의 대상검색언어에 포함된 상기 데이터 검색 규칙 정보에 기초하여 소정의 지식 데이터베이스에서 데이터 검색을 수행하는 검색 단계를 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 방법.
1. A method for searching natural language queries of a logical and physical structure by a natural language query language query system,
A mesh-up search language conversion step of analyzing a semantic relationship between morphemes constituting the natural language query word with respect to a natural language query word and converting the semantic relation into a mesh-up search language based on a predetermined search language conversion rule;
If the attribute structure of the mesh-up search language is a logical / physical duplex structure requiring result data through a logical operation using physical data, the mesh-up search language may be a dual structure including a predetermined data search rule information A target search language conversion step of converting a target search language into a target search language; And
And retrieving data from a predetermined knowledge database based on the data retrieval rule information included in the target retrieval language of the double structure.
제1항에 있어서,
상기 대상검색언어 변환 단계는,
상기 메시업검색언어의 도메인 및 속성 구조를 분석하는 단계; 및
상기 분석의 결과에 따라 상기 메시업검색언어를 상기 논리적/물리적 2중 구조인지 여부를 판단하는 단계를 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 방법.
The method according to claim 1,
Wherein the target search language conversion step comprises:
Analyzing a domain and an attribute structure of the mesh-up search language; And
And determining whether the mesh-up search language is the logical / physical duplex structure according to a result of the analysis.
제1항 또는 제2항에 있어서,
상기 데이터 검색 규칙정보는,
논리적/물리적 2중 구조인 메시업검색언어에 대한 결과 데이터를 도출하기 위해 필요한 하나 이상의 물리적 데이터의 속성 정보 및 상기 하나 이상의 물리적 데이터를 이용한 연산 규칙 정보를 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 방법.
3. The method according to claim 1 or 2,
The data retrieval rule information includes:
A logical / physical double structure natural language query including at least one attribute information of at least one physical data required to derive result data for a mesh-up retrieval language, which is a logical / physical double structure, and arithmetic rule information using the at least one physical data How to search.
제3항에 있어서,
상기 검색 단계는,
상기 대상검색언어에 포함된 상기 데이터 검색 규칙정보에 기초하여 지식 데이터베이스로부터 하나 이상의 물리적 데이터를 도출하는 단계; 및
상기 도출한 하나 이상의 물리적 데이터를 이용하여 상기 연산 규칙 정보에 따른 결과 데이터를 도출하는 단계를 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 방법.
The method of claim 3,
The retrieving step comprises:
Deriving one or more physical data from a knowledge database based on the data retrieval rule information contained in the target retrieval language; And
And deriving result data according to the calculation rule information using the derived one or more physical data.
제1항에 있어서,
상기 대상검색언어 변환 단계는,
상기 메시업검색언어의 도메인 및 속성 구조를 분석하는 단계를 더 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 방법.
The method according to claim 1,
Wherein the target search language conversion step comprises:
Further comprising analyzing a domain and an attribute structure of the mesh-up search language.
제1항 또는 제5항에 있어서,
상기 대상검색언어 변환 단계는,
상기 메시업검색언어의 속성 구조가 물리적 데이터를 요구하는 단일 구조인 경우, 상기 메시업검색언어에 대응하는 단일 구조의 대상검색언어로 변환하는 단계를 더 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 방법.
6. The method according to claim 1 or 5,
Wherein the target search language conversion step comprises:
Further comprising the step of, when the attribute structure of the mesh-up search language is a single structure requiring physical data, converting the object structure into a target search language of a single structure corresponding to the mesh-up search language. How to search.
제6항에 있어서,
상기 검색 단계는,
상기 지식 데이터베이스로부터 상기 단일 구조의 대상검색언어에 대응하는 물리적 데이터를 검색 및 도출하는 단계를 더 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 방법.
The method according to claim 6,
The retrieving step comprises:
And retrieving and deriving physical data corresponding to the target search language of the single structure from the knowledge database.
자연어 질의어 질의 검색 시스템에 있어서,
사용자 디바이스를 통해 입력된 자연어 질의어를 구성하는 형태소간의 의미관계를 분석하여 상기 자연어 질의어를 메시업검색언어로 변환하는 자연어 처리 엔진; 및
상기 자연어 처리 엔진에서 생성된 메시업검색언어를 데이터베이스 검색 언어인 대상검색언어로 변환하고, 상기 대상검색언어에 기초하여 검색 및 결과 데이터를 제공하는 검색 엔진; 및
지식정보 및 언어 변환 정보를 저장하는 지식 데이터베이스를 포함하되,
상기 검색 엔진은,
상기 메시업검색언어의 속성 구조가 물리적 데이터를 이용하여 논리적 연산을 통해 결과 데이터를 요구하는 논리적/물리적 2중 구조인 경우, 상기 메시업검색언어를 기 설정된 데이터 검색 규칙 정보를 포함하는 2중 구조의 대상검색언어로 변환하고, 상기 데이터 검색 규칙 정보에 기초하여 검색을 수행하는, 논리적 물리적 2중 구조의 자연어 질의 검색 시스템.
A natural language query query system comprising:
A natural language processing engine for analyzing a semantic relation between morphemes constituting a natural language query input through a user device and converting the natural language query into a mesh-up search language; And
A search engine for converting the mesh-up search language generated by the natural language processing engine into a target search language that is a database search language and providing search and result data based on the target search language; And
A knowledge database for storing knowledge information and language conversion information,
The search engine comprises:
If the attribute structure of the mesh-up search language is a logical / physical duplex structure requiring result data through a logical operation using physical data, the mesh-up search language may be a dual structure including a predetermined data search rule information And a search is performed based on the data retrieval rule information.
제8항에 있어서,
상기 데이터 검색 규칙정보는,
논리적/물리적 2중 구조인 메시업검색언어에 대한 결과 데이터를 도출하기 위해 필요한 하나 이상의 물리적 데이터의 속성 정보 및 상기 하나 이상의 물리적 데이터를 이용한 연산 규칙 정보를 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 시스템.
9. The method of claim 8,
The data retrieval rule information includes:
A logical / physical double structure natural language query including at least one attribute information of at least one physical data required to derive result data for a mesh-up retrieval language, which is a logical / physical double structure, and arithmetic rule information using the at least one physical data Search system.
제8항 또는 제9항에 있어서,
상기 검색 엔진은,
상기 자연어 처리 엔진에서 생성된 메시업검색언어의 도메인 및 속성 구조를 분석하여 속성 구조에 기반한 대상검색언어로 변환하는 대상검색언어 변환 모듈; 및
상기 대상검색언어 변환 모듈에서 생성된 대상검색언어에 기초하여 상기 지식 데이터베이스로부터 물리적 데이터를 검색 및 도출하여 결과 데이터를 생성하는 데이터 도출 모듈을 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 시스템.
10. The method according to claim 8 or 9,
The search engine comprises:
A target search language conversion module for analyzing a domain and an attribute structure of a mesh-up search language generated by the natural language processing engine and converting the domain and the attribute structure into a target search language based on an attribute structure; And
And a data derivation module for retrieving and deriving physical data from the knowledge database based on a target search language generated by the target search language conversion module and generating result data.
제10항에 있어서,
상기 대상검색언어 변환 모듈은,
상기 메시업검색언어의 속성 구조가 논리적/물리적 2중 구조인 경우, 상기 메시업검색언어를 기 설정된 데이터 검색 규칙 정보를 포함하는 2중 구조의 대상검색언어로 변환하는, 논리적 물리적 2중 구조의 자연어 질의 검색 시스템.
11. The method of claim 10,
Wherein the target search language conversion module comprises:
If the attribute structure of the mesh-up search language is a logical / physical duplex structure, converting the mesh-up search language into a target search language of a double structure including predetermined data search rule information; Natural language query retrieval system.
제10항에 있어서,
상기 데이터 도출 모듈은,
상기 대상검색언어 변환 모듈에서 변환한 상기 2중 구조의 대상검색언어에 포함된 상기 데이터 검색 규칙정보에 기초하여 지식 데이터베이스로부터 하나 이상의 물리적 데이터를 도출하고, 상기 도출한 하나 이상의 물리적 데이터를 이용하여 상기 연산 규칙 정보에 따른 결과 데이터를 도출하는, 논리적 물리적 2중 구조의 자연어 질의 검색 시스템.
11. The method of claim 10,
Wherein the data derivation module comprises:
Deriving one or more physical data from a knowledge database based on the data retrieval rule information included in the target retrieval language of the double structure converted by the target retrieval language conversion module, A natural language query system of a logical physical and binary structure deriving result data according to calculation rule information.
제8항에 있어서,
상기 검색 엔진은,
상기 자연어 질의어를 구성하는 다수의 형태소를 분석하여 각 형태소간의의미관계를 분석하는 의미분석모듈; 및
상기 의미분석모듈의 분석 결과에 기초하여 상기 메시업검색언어를 생성하는 메시업검색언어 변환 모듈을 포함하는, 논리적 물리적 2중 구조의 자연어 질의 검색 시스템.
9. The method of claim 8,
The search engine comprises:
A semantic analysis module for analyzing a plurality of morphemes constituting the natural language query and analyzing semantic relations between the morphemes; And
And a mesh-up search language conversion module for generating the mesh-up search language based on the analysis result of the semantic analysis module.
KR1020140086898A 2014-07-10 2014-07-10 Method and system for searching by using natural language query KR101593214B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140086898A KR101593214B1 (en) 2014-07-10 2014-07-10 Method and system for searching by using natural language query

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140086898A KR101593214B1 (en) 2014-07-10 2014-07-10 Method and system for searching by using natural language query

Publications (2)

Publication Number Publication Date
KR20160007017A KR20160007017A (en) 2016-01-20
KR101593214B1 true KR101593214B1 (en) 2016-02-18

Family

ID=55307759

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140086898A KR101593214B1 (en) 2014-07-10 2014-07-10 Method and system for searching by using natural language query

Country Status (1)

Country Link
KR (1) KR101593214B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328780A (en) * 2020-11-13 2021-02-05 北京明略软件系统有限公司 Natural language conversion processing method and device, electronic equipment and storage medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100505970B1 (en) * 2003-11-28 2005-08-30 한국전자통신연구원 System and method for knowledge modeling using ontology
KR101107760B1 (en) * 2009-08-24 2012-01-20 송도규 System and Method for Intelligent Searching and Question-Answering
KR20110070725A (en) * 2009-12-18 2011-06-24 한국전자통신연구원 Automatic mash-up apparatus and method
KR102062069B1 (en) * 2012-11-12 2020-01-03 한국전자통신연구원 Apparatus for mash-up service generation based on voice command and method thereof

Also Published As

Publication number Publication date
KR20160007017A (en) 2016-01-20

Similar Documents

Publication Publication Date Title
KR101661198B1 (en) Method and system for searching by using natural language query
US9448995B2 (en) Method and device for performing natural language searches
US11080295B2 (en) Collecting, organizing, and searching knowledge about a dataset
US9280535B2 (en) Natural language querying with cascaded conditional random fields
CN111417940B (en) Method, system and medium for generating answers to questions
US7685118B2 (en) Method using ontology and user query processing to solve inventor problems and user problems
KR101040119B1 (en) Apparatus and Method for Search of Contents
US10585924B2 (en) Processing natural-language documents and queries
WO2015135455A1 (en) Natural language question answering method and apparatus
US20150278198A1 (en) Method of clustering search results
JP2009087347A (en) Information search system
KR20100075454A (en) Identification of semantic relationships within reported speech
US10678820B2 (en) System and method for computerized semantic indexing and searching
Freitas et al. Treo: combining entity-search, spreading activation and semantic relatedness for querying linked data
US20120317125A1 (en) Method and apparatus for identifier retrieval
KR101654717B1 (en) Method for producing structured query based on knowledge database and apparatus for the same
Wang et al. Knowledge graph construction and applications for web search and beyond
Karpagam et al. A framework for intelligent question answering system using semantic context-specific document clustering and Wordnet
Gao et al. Semantic mapping from natural language questions to OWL queries
US10515076B1 (en) Generating query answers from a user's history
KR101602342B1 (en) Method and system for providing information conforming to the intention of natural language query
KR101593214B1 (en) Method and system for searching by using natural language query
Shiang et al. Spoken question answering using tree-structured conditional random fields and two-layer random walk
KR102411778B1 (en) Server, method and computer program for infering comparative advantage of multiple knowledge
RU2013132622A (en) SYSTEM AND SEMANTIC SEARCH METHOD

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 5