KR101683138B1 - Apparatus for searching information, and control method thereof - Google Patents

Apparatus for searching information, and control method thereof Download PDF

Info

Publication number
KR101683138B1
KR101683138B1 KR1020160073703A KR20160073703A KR101683138B1 KR 101683138 B1 KR101683138 B1 KR 101683138B1 KR 1020160073703 A KR1020160073703 A KR 1020160073703A KR 20160073703 A KR20160073703 A KR 20160073703A KR 101683138 B1 KR101683138 B1 KR 101683138B1
Authority
KR
South Korea
Prior art keywords
keyword
list
specific
theme
information
Prior art date
Application number
KR1020160073703A
Other languages
Korean (ko)
Inventor
마진
전인호
이종숙
조금원
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020160073703A priority Critical patent/KR101683138B1/en
Application granted granted Critical
Publication of KR101683138B1 publication Critical patent/KR101683138B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F17/30533
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F17/30672
    • G06F17/30699

Abstract

The present invention provides a device for searching for information, and an operation method thereof. The present invention performs a collaboration search using using an input keyword-oriented keyword concept network, an expert concept network which an expert group recommends, and a theme concept network, thereby effectively searching for information desired by a user.

Description

정보검색장치 및 그 동작 방법{APPARATUS FOR SEARCHING INFORMATION, AND CONTROL METHOD THEREOF}[0001] APPARATUS FOR SEARCHING INFORMATION AND CONTROL METHOD THEREOF [0002]

본 발명은 객체와 개념 사이의 협업관계를 구축하는 개념 망(Concept Lattice)을 이용하여 키워드 기반의 정보검색에 있어서 효율성을 향상시키기 위한 방안에 관한 것이다.The present invention relates to a method for improving efficiency in keyword-based information retrieval using a concept lattice for establishing a collaborative relationship between an object and a concept.

종래의 검색기법 중 하나인 키워드 검색은 키워드를 포함한 정보들을 색인하기 때문에 색인할 양이 많다. 그리고 키워드 검색에서는 사용자의 질의어와 일치하는 인덱스를 가진 문서를 검색하기 때문에 인덱스 정보가 부족한 경우 검색의 결과가 너무 많거나 의미가 없는 경우가 발생한다.Keyword search, which is one of the conventional search techniques, indexes information including keywords, so there is a lot of indexing. In the keyword search, since the document having the index matching the user's query is searched, the search result is too much or meaningless when the index information is insufficient.

이러한 문제를 해결하기 위해 각종 검색 서비스에서는 의미 정보들을 잘 구축해놓은 시소러스, 언어자원, 지식베이스 등의 유의어, 동의어, 관련어 정보 등을 활용하여 연관 검색 결과를 얻을 수 있도록 의미 기반서비스를 하고 있다.In order to solve these problems, various search services are provided with semantic-based services in which related search results can be obtained by using thesaurus, language resources, knowledge base, and the like, which have well constructed semantic information, using synonyms and related information.

일반적인 검색 사이트에서는 사용자가 요구하는 적합한 용어를 찾기 위해 정규화 된 단어들을 바탕으로 벡터 공간 모델이나 확률 모델을 이용하여 색인하거나 빈도수에 따라 색인화를 하게 된다.In general search sites, the indexes are indexed or indexed according to frequency, using vector space models or probabilistic models based on normalized words to find appropriate terms that the user needs.

하지만 이러한 검색 방법은 트리구조의 색인에만 의존하고 있어 다른 정보와의 연관 관계에 대한 검색이 어렵다.However, this retrieval method depends only on the index of the tree structure, so it is difficult to search for the relationship with other information.

여기서, 색인(indexing)은 어떤 문서를 다른 문서들로부터 구별할 수 있는 단어 또는 단어 구를 추출하여 정보 검색에 활용한 것으로 현재 대다수의 검색엔진이 사용하고 있는 기술이다.Here, indexing is a technique that most of the search engines currently use is a method of extracting a word or a word phrase that can distinguish a document from other documents and using the information to search for information.

그러나, 이러한, 색인의 경우도 사용자가 검색을 위해 선택한 검색어에 따라 의미 없는 검색 결과가 나올 수도 있으며 또한, 사용자가 원하는 적절한 결과를 얻기 위해 일반적으로 수 차례의 피드백 과정이 필요하다는 한계점이 존재한다.However, even in the case of the index, there is a limit that the user may have a meaningless search result according to the search term selected for the search, and also, in order to obtain an appropriate result desired by the user, a general feedback process is required.

본 발명은 상기한 사정을 감안하여 창출된 것으로서, 본 발명에서 도달하고자 하는 목적은, 객체와 개념 사이의 협업관계를 구축하는 개념 망(Concept Lattice)을 이용하여 키워드 기반의 정보검색에 있어서 효율성을 향상시키는 데 있다.The object of the present invention is to provide a concept lattice for establishing a collaborative relationship between an object and a concept, thereby improving efficiency in keyword-based information retrieval. .

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 정보검색장치는, 사용자로부터 입력된 특정 키워드를 포함하는 데이터 소스로부터 상기 특정 키워드와 유사 개념 관계가 존재하는 관련키워드를 추출하여, 상기 관련키워드와 상기 특정 키워드 간에 유사 개념 관계를 나타내는 키워드 개념 망을 생성하는 생성부; 상기 특정 키워드와 관련하여 키워드 간 유사 개념 관계가 기 정의된 전문가 개념 망 내 키워드 리스트와 상기 키워드 개념 망 내 상기 관련키워드 리스트를 비교하여, 상기 전문가 개념 망 내에 상기 관련키워드와 일치되는 동일키워드가 존재하는지 여부를 확인하는 확인부; 및 상기 동일키워드가 존재하는 것으로 확인되는 경우 상기 관련키워드 리스트 이외에 상기 동일키워드 리스트를 상기 사용자에게 추가로 추천하여, 상기 관련키워드 리스트로부터 상기 동일키워드가 식별될 수 있도록 하는 추천부를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided an information search apparatus for extracting a related keyword having a similar conceptual relationship with a specific keyword from a data source including a specific keyword input from a user, A generating unit generating a keyword concept network representing a similar conceptual relationship between the specific keyword and the specific keyword; Comparing the keyword list in the expert concept network in which the similar conceptual relationship between keywords is predefined with respect to the specific keyword, and the related keyword list in the keyword concept network, and if the same keyword matching the related keyword exists in the expert concept network A confirmation unit for confirming whether or not it is the case; And a recommendation unit for recommending the same keyword list to the user other than the related keyword list when the same keyword is found to be able to identify the same keyword from the related keyword list. do.

보다 구체적으로, 상기 관련키워드는, 상기 데이터 소스로부터 상기 특정 키워드와 함께 검색되는 다수의 키워드 각각에 대한 상기 데이터 소스 내에서의 검색 빈도인 개별검색빈도, 및 상기 다수의 키워드 각각의 상기 개별검색빈도를 합산한 전체검색빈도 중 적어도 하나를 기초로 추출되는 것을 특징으로 한다.More specifically, the related keyword may include an individual search frequency that is a search frequency in the data source for each of a plurality of keywords that are retrieved from the data source together with the specific keyword, and the individual search frequency of each of the plurality of keywords The search frequency is extracted based on at least one of the total search frequencies.

보다 구체적으로, 상기 생성부는, 상기 다수의 키워드 중 상기 개별검색빈도가 임계치 이상이거나, 또는 상기 전체검색빈도에 대한 상기 개별검색빈도의 비율이 임계치 이상인 키워드를 상기 특정 키워드와 유사 개념 관계가 존재하는 상기 관련키워드로 추출하는 것을 특징으로 한다.More specifically, the generation unit may generate a keyword in which the individual search frequency among the plurality of keywords is equal to or greater than a threshold, or a keyword in which a ratio of the individual search frequencies to the total search frequency is equal to or greater than a threshold, And extracts the keyword with the related keyword.

보다 구체적으로, 상기 추천부는, 상기 특정 키워드와 관련된 다수의 상품정보가 테마 별로 기 정의된 테마 개념 망 내 테마 리스트를 상기 사용자에게 더 추천하는 것을 특징으로 한다.More specifically, the recommendation unit may further recommend the theme list in the theme concept network in which a plurality of product information related to the specific keyword is predefined for each theme.

보다 구체적으로, 상기 정보검색장치는, 상기 테마 리스트로부터 특정 테마가 선택되며, 상기 관련키워드 리스트로부터 특정 관련키워드가 선택되는 경우, 상기 특정 테마로 정의된 상품 중 상기 특정 관련키워드가 매핑된 상품 리스트를 검색하여 제공하는 제공부를 더 포함하는 것을 특징으로 한다.More specifically, when the specific theme is selected from the theme list and the specific related keyword is selected from the related keyword list, the information search apparatus searches the list of the products to which the specific related keyword is mapped And a providing unit for searching for and providing the search result.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 정보검색장치의 동작 방법은, 사용자로부터 입력된 특정 키워드를 포함하는 데이터 소스로부터 상기 특정 키워드와 유사 개념 관계가 존재하는 관련키워드를 추출하여, 상기 관련키워드와 상기 특정 키워드 간에 유사 개념 관계를 나타내는 키워드 개념 망을 생성하는 생성단계; 상기 특정 키워드와 관련하여 키워드 간 유사 개념 관계가 기 정의된 전문가 개념 망 내 키워드 리스트와 상기 키워드 개념 망 내 상기 관련키워드 리스트를 비교하여, 상기 전문가 개념 망 내에 상기 관련키워드와 일치되는 동일키워드가 존재하는지 여부를 확인하는 확인단계; 및 상기 동일키워드가 존재하는 것으로 확인되는 경우 상기 관련키워드 리스트 이외에 상기 동일키워드 리스트를 상기 사용자에게 추가로 추천하여, 상기 관련키워드 리스트로부터 상기 동일키워드가 식별될 수 있도록 하는 추천단계를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method of operating an information search apparatus, the method including extracting a related keyword having a similar conceptual relationship with a specific keyword from a data source including a specific keyword input from a user, A generating step of generating a keyword concept network representing a similar conceptual relationship between the related keyword and the specific keyword; Comparing the keyword list in the expert concept network in which the similar conceptual relationship between keywords is predefined with respect to the specific keyword, and the related keyword list in the keyword concept network, and if the same keyword matching the related keyword exists in the expert concept network A confirmation step to determine whether or not it is; And a recommending step of recommending the same keyword list to the user other than the related keyword list when the same keyword is found to be able to identify the same keyword from the related keyword list .

보다 구체적으로, 상기 관련키워드는, 상기 데이터 소스로부터 상기 특정 키워드와 함께 검색되는 다수의 키워드 각각에 대한 상기 데이터 소스 내에서의 검색 빈도인 개별검색빈도, 및 상기 다수의 키워드 각각의 상기 개별검색빈도를 합산한 전체검색빈도 중 적어도 하나를 기초로 추출되는 것을 특징으로 한다.More specifically, the related keyword may include an individual search frequency that is a search frequency in the data source for each of a plurality of keywords that are retrieved from the data source together with the specific keyword, and the individual search frequency of each of the plurality of keywords The search frequency is extracted based on at least one of the total search frequencies.

보다 구체적으로, 상기 생성단계는, 상기 다수의 키워드 중 상기 개별검색빈도가 임계치 이상이거나, 또는 상기 전체검색빈도에 대한 상기 개별검색빈도의 비율이 임계치 이상인 키워드를 상기 특정 키워드와 유사 개념 관계가 존재하는 상기 관련키워드로 추출하는 것을 특징으로 한다.More specifically, in the generating step, a keyword having the individual search frequency of the plurality of keywords that is equal to or greater than a threshold, or the ratio of the individual search frequencies to the total search frequency is equal to or greater than a threshold, And the extracted keyword is extracted.

보다 구체적으로, 상기 추천단계는, 상기 특정 키워드와 관련된 다수의 상품정보가 테마 별로 기 정의된 테마 개념 망 내 테마 리스트를 상기 사용자에게 더 추천하는 것을 특징으로 한다.More specifically, in the recommendation step, the theme list in the theme concept network, in which a plurality of items of goods information related to the specific keyword are predefined for each theme, is further recommended to the user.

보다 구체적으로, 상기 방법은, 상기 테마 리스트로부터 특정 테마가 선택되며, 상기 관련키워드 리스트로부터 특정 관련키워드가 선택되는 경우, 상기 특정 테마로 정의된 상품 중 상기 특정 관련키워드가 매핑된 상품 리스트를 검색하여 제공하는 제공단계를 더 포함하는 것을 특징으로 한다.More specifically, the method may further comprise: when a specific theme is selected from the theme list, and when a specific related keyword is selected from the related keyword list, searching for a product list in which the specific related keyword is mapped, And a providing step of providing the information.

이에, 본 발명의 정보검색장치 및 그 동작 방법에서는, 입력 키워드 중심의 키워드 개념 망과 전문가 그룹이 추천한 전문가 개념 망 그리고 테마 개념 망을 이용한 협업 검색을 수행함으로써, 사용자가 원하는 정보의 검색을 효율적으로 지원할 수 있다.Therefore, in the information search apparatus and the operation method of the present invention, the keyword concept network focused on the input keyword, the expert concept network recommended by the expert group, and the collaboration search using the theme concept network are performed, .

도 1은 본 발명의 일 실시예에 따른 정보 검색 환경을 도시한 예시도.
도 2는 본 발명의 일 실시예에 따른 정보검색장치의 구성을 설명하기 위한 블록도.
도 3은 본 발명의 일 실시예에 따른 개념 망 간의 관계 표현과 관련된 예시도.
도 4는 본 발명의 일 실시예에 따른 전문가 개념 망을 상세하게 나타내고 있는 예시도.
도 5는 본 발명의 일 실시예에 따른 상품 리스트 검색과 관련하여 개념 망과 상품 간의 관계를 나타내고 있는 예시도.
도 6은 본 발명의 일 실시예에 따른 정보검색장치에서의 동작 흐름을 설명하기 위한 순서도.
1 is an exemplary diagram illustrating an information retrieval environment according to an embodiment of the present invention;
2 is a block diagram illustrating a configuration of an information search apparatus according to an embodiment of the present invention;
3 is an exemplary diagram related to a representation of a relationship between conceptual networks according to an embodiment of the present invention;
FIG. 4 is an exemplary diagram showing in detail an expert concept network according to an embodiment of the present invention; FIG.
5 is a diagram illustrating a relationship between a conceptual network and a product in relation to a product list search according to an embodiment of the present invention;
FIG. 6 is a flowchart illustrating an operation flow in an information search apparatus according to an embodiment of the present invention; FIG.

이하, 첨부된 도면을 참조하여 본 발명이 일 실시예에 대하여 설명하기로 한다.Hereinafter, an embodiment of the present invention will be described with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 정보 검색 환경을 도시하고 있다.1 illustrates an information retrieval environment according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 정보 검색 환경은, 정보 검색을 위한 키워드 입력이 이루어지는 사용자단말(100), 사용자단말(100)로부터 수신되는 키워드와 관련된 정보 검색이 처리되는 정보검색장치(200), 및 데이터 소스가 저장된 레거시 시스템(300)을 포함하는 구성을 가질 수 있다.1, an information search environment according to an embodiment of the present invention includes a user terminal 100 in which a keyword is input for information search, an information search related to a keyword received from the user terminal 100, An information retrieval apparatus 200, and a legacy system 300 in which a data source is stored.

사용자단말(100)은 사용자로부터 입력된 키워드를 정보검색장치(200)에 전달하고, 정보검색장치(200)로부터 키워드에 기반한 정보 검색 결과를 수신하는 장치를 일컫는 것으로서, 예컨대, PC, 스마트 폰, 태블릿 PC, 및 PDA 등이 해당될 수 있으며, 이에 제한되는 것이 정보검색장치(200)에 유/무선 통신을 통해 접속할 수 있는 장치는 모두 포함될 수 있다.The user terminal 100 refers to a device that transmits a keyword input from a user to the information search device 200 and receives an information search result based on the keyword from the information search device 200. For example, A tablet PC, a PDA, and the like, and any device that can be connected to the information search apparatus 200 through wire / wireless communication may be included.

정보검색장치(200)는 사용자로부터 입력된 키워드를 기반으로 정보 검색이 처리되는 장치를 일컫는 것으로서, 예컨대, 웹 서버가 이에 해당될 수 있다.The information retrieval apparatus 200 refers to a device for which information retrieval is processed based on a keyword input from a user, for example, a web server may correspond to the information retrieval apparatus.

레거시 시스템(300)은 정보 검색 대상이 되는 데이터 소스를 저장하고 있는 데이터 분산 저장 환경을 일컫는 것으로서, 예컨대, 웹을 통해 접근할 수 있는 다양한 문헌 정보를 데이터 소스로서 저장 및 관리하게 된다.The legacy system 300 refers to a data distribution storage environment storing a data source to be an information search target. For example, the legacy system 300 stores and manages various document information that can be accessed through the web as a data source.

한편, 이상의 본 발명의 일 실시예에 따른 정보 검색 환경에서는, 예컨대, 레거시 시스템마다 카테고리 분류 기준이 다르고 검색 방식의 차이가 있기 때문에 기반지식이 없는 사용자가 원하는 검색의 결과를 얻기가 어렵다는 점, 키워드 검색의 경우 사용자 질의어와 일치하는 색인을 가지는 문서를 검색하기 때문에 색인 정보가 부족한 경우, 검색 결과가 부정확하다는 점, 및 트리구조의 색인에만 의존하는 경우 다른 정보와의 연관관계에 대한 검색이 어렵다 점 등의 기존 검색 기술이 안고 있는 한계점을 극복하기 위해 개념 망을 이용하여 검색 및 추천이 이루어지는 통합된 정보추출 모델을 제안하게 된다.Meanwhile, in the information search environment according to an embodiment of the present invention, for example, since a category classification standard is different for each legacy system and there are differences in search methods, it is difficult for a user who does not have a base knowledge to obtain a desired search result, In the case of the search, it is difficult to search for a document having an index matching the user query word, so that it is difficult to search for a relationship between the information and the other information if the index information is insufficient, the search result is inaccurate, We propose an integrated information extraction model that searches and recommends using the conceptual network to overcome the limitations of existing search technology.

참고로, 개념 기반의 정보검색은 초기 검색어에서 개념 확장을 수행한 후 확장된 검색어를 확보하게 되며, 이와 관련하여 도출되는 개념 망은 사용자가 입력한 검색어와 유사한 개념들을 미리 제시해 사용자가 필요에 따라 새로운 검색어를 선택하거나 추가, 삭제 하도록 함으로써, 검색의 효과를 향상시킬 수 있어 정보검색의 프리프로세서 역할을 할 수 있다.In this paper, we propose a conceptual information retrieval system based on conceptual information retrieval. The concept retrieval system retrieves conceptual information from an initial retrieval term and obtains an expanded retrieval term. By selecting, adding or deleting a new search word, the search effect can be improved, and it can serve as a preprocessor for information search.

여기서, 개념 망은 주어진 문서에서 제시된 개념을 추출하고 그 추출된 개념들 사이의 연관성을 추출하여 관계성이 높은 개념 사이에서 네트워크를 구성하게 된다.Here, the concept network extracts the concept presented in a given document and extracts the association between the extracted concepts, thereby constructing a network between the highly related concepts.

이러한 개념망은 FCA(Formal Concept Analysis)로 표현할 수 있는 데, FCA는 특정 도메인에 존재하는 객체들과 속성들 사이의 관계로부터 개념을 추출하여 개념들 사이의 관계를 망(lattice) 구조로 계층화 시킨다.This conceptual network can be expressed as FCA (Formal Concept Analysis). FCA layered the relationship between concepts into a lattice structure by extracting concepts from the relationship between objects and properties existing in a specific domain .

개념은 객체와 속성 사이의 관계를 반영하며 하나의 개념은 객체집합과 그 객체집합의 원소들과 관계가 있는 속성집합의 쌍으로 이루어지게 되는 데, 이로써 개념망은 개념들 사이에 존재하는 상-하위(superconcept-subconcept) 개념 관계를 망구조로 표현한 계층적 개념 클러스터링이며, 객체들과 속성들 사이의 모든 관계를 표현한 의미망(semantic net)으로 볼 수 있다.The concept reflects the relationship between the object and the property, and one concept consists of a set of objects and a pair of attribute sets related to the elements of the object set, (superconcept-subconcept) is a hierarchical conceptual clustering of concept relations expressed in a network structure. It can be seen as a semantic net that expresses all relations between objects and properties.

결국, 본 발명의 일 실시예에 따른 정보 검색 환경에서는 객체와 개념 사이의 협업관계를 구축하는 개념 망(Concept Lattice)을 이용하여 키워드 기반의 정보검색의 효율성을 높일 수 있는 방안을 제안하고자 하며, 이하에서는 이를 위한 정보검색장치(200)의 구성에 대해 보다 구체적으로 설명하기로 한다.As a result, in the information search environment according to an embodiment of the present invention, a method for improving the efficiency of keyword-based information retrieval using a concept lattice for establishing a collaboration relationship between objects and concepts is proposed. Hereinafter, the configuration of the information search apparatus 200 will be described in more detail.

한편, 설명의 편의를 위해 정보검색장치(200)가 레거시 시스템(300)에 저장된 데이터 소스에 접근하는 방식은 분산된 정보의 효율적 데이터 접근 및 통합을 위해 예컨대, XMDR(eXtended Mata-Data Registry) 기술을 이용하게 됨을 전제하기로 한다.For convenience of explanation, the way in which the information retrieval apparatus 200 accesses the data sources stored in the legacy system 300 may be implemented by using an eXtended Mata-Data Registry (XMDR) technology for efficiently accessing and integrating distributed information As shown in FIG.

참고로, XMDR 기술은 분산 환경의 데이터에 접근할 수 있는 표준항목을 만들고, 이 표준 항목을 바탕으로 생성되는 질의를 기초로 로컬 시스템에 접근하여 데이터 소스를 추출하는 기술을 일컫는다.For reference, XMDR technology refers to a technique for creating a standard item for accessing data in a distributed environment and extracting a data source by accessing a local system based on a query generated based on the standard item.

도 2에는 본 발명의 일 실시예에 따른 정보검색장치(200)의 구성을 나타내는 블록도가 도시되고 있다.2 is a block diagram showing a configuration of an information search apparatus 200 according to an embodiment of the present invention.

도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 정보검색장치(200)는 사용자로부터 입력된 특정 키워드를 기초로 키워드 개념 망을 생성하는 생성부(210), 키워드 개념 망과 기 정의된 전문가 개념 망 간의 비교를 통해 키워드 간 일치 여부 확인하는 확인부(220), 키워드 간 일치 여부에 대한 확인 결과를 기초로 사용자로부터 입력된 특정 키워드와 유사 개념 관계가 존재하는 관련키워드 리스트와, 기 정의된 테마 개념 망 내 테마 리스트를 추천하는 추천부(230), 및 관련키워드 리스트 및 테마 리스트 상의 사용자 선택과 관련된 상품 리스트를 검색하여 제공하는 제공부(240)를 포함하는 구성을 가질 수 있다.As shown in FIG. 2, the information search apparatus 200 according to an embodiment of the present invention includes a generation unit 210 that generates a keyword concept network based on a specific keyword input from a user, A related keyword list having a similar conceptual relationship with a specific keyword input from the user based on the result of the check on the coincidence between the keywords, A recommendation unit 230 for recommending a theme list in a defined theme concept network, and a provider 240 for searching and providing a list of related keywords and a product list related to user selection on the theme list.

이상의 생성부(210), 확인부(220), 추천부(230), 및 제공부(240)를 포함하는 정보검색장치(200)의 전체 구성 내지는 적어도 일부의 구성은 소프트웨어 모듈 또는 하드웨어 모듈 형태로 구현되거나, 내지는 소프트웨어 모듈과 하드웨어 모듈이 조합된 형태로도 구현될 수 있다.The entire configuration or at least a part of the configuration of the information retrieving apparatus 200 including the generating unit 210, the confirming unit 220, the recommending unit 230, and the providing unit 240 may be implemented as a software module or a hardware module Or software modules and hardware modules may be implemented in a combined form.

여기서, 소프트웨어 모듈이란, 예컨대, 정보검색장치(200) 내에서 연산을 수행하는 프로세서에 의해 실행되는 명령어로 이해될 수 있으며, 이러한 명령어는 정보검색장치(200) 내 메모리에 탑재된 형태를 가질 수 있을 것이다.Here, the software module may be understood as, for example, a command executed by a processor that performs an operation in the information search apparatus 200, and the command may have a form stored in a memory in the information search apparatus 200 There will be.

결국, 본 발명의 일 실시예에 따른 정보검색장치(200)는 위 구성을 통해 입력 키워드 중심의 키워드 개념 망과 전문가 그룹이 추천한 전문가 개념 망 그리고 테마 개념 망을 이용한 협업 검색을 수행함으로써, 사용자가 원하는 정보의 검색을 지원하게 되는 데, 이하에서는 이를 구현하기 위한 정보검색장치(200) 내 각 구성에 대해 구체적으로 설명하기로 한다.As a result, the information retrieving apparatus 200 according to an embodiment of the present invention performs the collaborative search using the keyword concept network centered on input keywords, the expert concept network recommended by the expert group, and the theme concept network, In the following description, each component in the information search apparatus 200 for realizing the desired information will be described in detail.

생성부(210)는 키워드 개념 망을 생성하는 기능을 수행한다.The generation unit 210 performs a function of generating a keyword concept network.

보다 구체적으로, 생성부(210)는 사용자단말(100)로부터 사용자로부터 입력된 특정 키워드가 수신되는 경우, 입력된 특정 키워드를 포함하는 레거시 시스템(300) 상의 데이터 소스로부터 상기 특정 키워드와 유사 개념 관계가 존재하는 관련키워드를 추출하여, 추출된 관련키워드와 입력된 특정 키워드 간의 유사 개념 관계를 나타내는 키워드 개념 망을 생성하게 된다.More specifically, when a specific keyword input from the user is received from the user terminal 100, the generating unit 210 generates a similar conceptual relationship (e.g., a similarity relationship) with the specific keyword from a data source on the legacy system 300, And generates a keyword concept network representing a similar conceptual relationship between the extracted related keyword and the input specific keyword.

이때, 관련키워드는 예컨대, 데이터 소스로부터 입력된 특정 키워드와 함께 검색되는 다수의 키워드 각각에 대한 데이터 소스 내에서의 검색 빈도인 개별검색빈도와 상기 다수의 키워드 각각의 개별검색빈도를 합산한 전체검색빈도를 고려하여 추출될 수 있다.In this case, the related keyword may be, for example, a total search obtained by adding an individual search frequency, which is a search frequency in a data source, to each of a plurality of keywords searched with a specific keyword input from a data source, Can be extracted considering the frequency.

예를 들어, 생성부(210)는 다수의 키워드 중 개별검색빈도가 임계치(예: 3회) 이상이거나, 또는 전체검색빈도에 대한 개별검색빈도의 비율이 임계치 이상인 키워드를 입력된 특정 키워드와 유사 개념 관계가 존재하는 관련키워드로서 추출할 수 있다.For example, the generation unit 210 may classify a keyword having an individual search frequency of a plurality of keywords equal to or greater than a threshold value (for example, three times) or an individual search frequency for a total search frequency equal to or greater than a threshold, It can be extracted as a related keyword in which the concept relation exists.

여기서, 이처럼 생성되는 키워드 개념 망은 본 발명의 일 실시예에 따른 개념 망 간의 관계 표현을 나타내고 있는 도 3의 (B)와 같은 형태로 생성될 수 있다.Here, the keyword concept network generated in this way can be generated in the form of (B) of FIG. 3, which represents a relationship expression between concept networks according to an embodiment of the present invention.

도 3 (B)는'도쿄여행'이란 키워드가 사용자로부터 입력됨에 따라, '후지산', '츠키지시장', '록본기', '도쿄공항', '신주쿠', '도쿄타워', 및 '디즈니랜드'가 관련키워드로 추출된 경우의 키워드 개념 망을 나타낸다.3 (B) is a diagram showing the relationship between the 'Tokyo Trip' and the 'Disneyland', as shown in FIG. 3 (b) 'Is extracted as a related keyword.

확인부(220)는 기 정의된 전문가 개념 망과 키워드 개념 망 간의 비교를 통해 키워드 간 일치 여부 확인하는 기능을 수행한다.The verification unit 220 performs a function of verifying whether there is a match between the keywords through comparison between the predefined expert concept network and the keyword concept network.

보다 구체적으로, 확인부(220)는 키워드 개념 망이 생성되는 경우, 입력된 키워드와 관련하여 키워드 간 유사 개념 관계를 기 정의하고 있는 전문가 개념 망 내 키워드 리스트와, 키워드 개념 망 내 관련키워드 리스트를 서로 비교하여, 전문가 개념 망 내에 관련키워드와 일치되는 동일키워드가 존재하는지 여부를 확인한다.More specifically, when the keyword concept network is generated, the verification unit 220 generates a keyword list in the expert concept network that defines similar conceptual relationships between keywords in relation to the input keywords, and a related keyword list in the keyword concept network Then, it is checked whether there is the same keyword matching the related keyword in the expert concept network.

여기서, 전문가 개념 망은 본 발명의 일 실시예에 따른 개념 망 간의 관계 표현을 나타내고 있는 도 3의 (A)와 같은 형태로 기 정의될 수 있다.Here, the expert concept network can be predefined in the form of (A) of FIG. 3, which represents the relationship representation between concept networks according to an embodiment of the present invention.

도 3 (A)는 사용자로부터 입력된 키워드가 '도쿄여행'인 경우에 이와 관련하여 일본의 도시명(사각형)과 관광명소(타원형)가 카테고리로 분류되어 정의된 전문가 개념 망을 나타낸다.3 (A) shows an expert concept network in which a city name (square) and a sightseeing spot (oval) of Japan are classified and categorized into categories when the keyword inputted from the user is 'Tokyo travel'.

이러한, 전문가 개념 망은 전문가(예: 여행정보 사이트)들의 분류체계를 따를 수 있으며, 각 카테고리에 키워드로 입력된 용어는 레거시 시스템(300)에서 사용되는 용어들에 대한 표준으로 각 시스템에서 공유되고 사용자에게 제시되는 용어들의 집합에 해당할 수 있다.The expert concept network can follow the classification system of experts (e.g., travel information sites), and terms entered as keywords in each category are shared by each system as a standard for terms used in the legacy system 300 It may correspond to a set of terms presented to the user.

본 발명의 일 실시예에 따른 전문가 개념 망은 시스템과 사용자들이 공유할 수 있는 용어들을 제시함으로써 통합-관리될 수 있고, 이러한 표준은 예컨대, 여행정보 테마 분류와 같은 분류 기준으로 적용시켜 표준을 따라 정의된 용어들을 확장 가능하게 한다.The expert concept network according to an embodiment of the present invention can be integrated and managed by presenting terms that can be shared between the system and users, and the standard can be applied to classification standards such as, for example, Enables defined terms to be extensible.

결국, 확인부(220)는 도 3 (A)의 전문가 개념 망과, 도 3 (B)의 키워드 개념 망을 서로 비교하는 경우, 키워드 개념 망 내 관련키워드인 '신주쿠', '도쿄타워', '디즈니랜드'가 동일키워드임을 확인할 수 있게 되며, 이때 전문가 개념 망 내에서'신주쿠', '도쿄타워', '디즈니랜드'의 상위 카테고리인 '도쿄'를 키워드 개념 망 내 신규 카테고리로서 생성할 수 있다.In other words, when the expert concept network of FIG. 3A and the keyword concept network of FIG. 3B are compared with each other, the verification unit 220 determines that the related keywords in the keyword concept network are 'Shinjuku', 'Tokyo Tower' 'Disneyland' is the same keyword. In this case, 'Shinjuku', 'Tokyo Tower' and 'Tokyo' which is the top category of 'Disneyland' can be created as a new category in the keyword concept network. have.

참고로, 설명의 이해를 돕기 위해 도 4에는 본 발명의 일 실시예에 따른 전문가 개념 망을 상세하게 나타내고 있다.For reference, FIG. 4 shows in detail an expert concept network according to an embodiment of the present invention in order to facilitate understanding of the description.

도 4에 도시된 바와 같이, 전문가 개념 망은 여행 정보 사이트의 해외여행정보에서 일본에 대한 정보를 나타낸 것으로 일본의 지역정보와 도시정보 그리고 각 도시의 관광명소를 개념 망으로 나타냈으며 사용자 검색에 따른 키워드 개념망의 키워드 값과 전문가 개념망의 키워드 값의 일치를 확인함으로써 사용자에게 효과적으로 정보를 제공할 수 있다.As shown in FIG. 4, the expert concept network represents information on Japan from overseas travel information of a travel information site, and shows local information and city information of Japan and tourist spots of each city as concept networks. It is possible to effectively provide information to the user by confirming the matching between the keyword value of the keyword concept network and the keyword value of the expert concept network.

그리고 이러한 전문가 개념 망에서 표현되는 개념 관계는 동등관계(Equal), 상속관계(Is-a), 부분관계(Part-of), 대체관계(Substitution)으로 표현하고 각 관계는 다음과 같이 정의될 수 있다.And the concept relations expressed in such an expert concept network are represented as Equal, Is-a, Part-of, and Substitution, and each relationship can be defined as follows have.

· 동등관계(Equal): 표현은 다르지만 의미상 동등한 의미를 가지는 관계를 표현 하는 것으로 InSO의 정의에 따른다('일본'과 'Japan'은 동등 관계이다).· Equal: Expression is a representation of a relationship that has semantically equivalent meanings, but is based on the definition of InSO ('Japan' and 'Japan' are equivalent).

· 상속관계(Is-a): 분류 계층상 상속된 하위 개념과 관계를 표현한다(전문가 개념 망에서 '일본'은 '해외여행'에 속하는 상속관계이다).· Inheritance (Is-a): Represents the inherited sub-concepts and relationships on the classification hierarchy. (In Japan, 'Japan' is an inheritance belonging to 'overseas travel').

· 부분관계(Part-of): 관계상 하위개념이 상위개념의 일부가 되는 관계를 표현한다(전문가 개념 망에서 시(City)는 일본에 포함되는 관계이다). · Part-of: Represents a relationship in which a subordinate concept becomes part of a higher-level concept in relation (City in an expert conceptual network is a relationship included in Japan).

· 대체관계(Substitution): 대체되어 사용될 수 있는 관계를 표현한 것으로, InSO의 정의에 따른다. 이러한 대체관계와 예컨대, 일본의 ‘교토 여행’을 검색할 때 교토(Kyoto)의 인접지역인 오사카를 InSO에서 대체관계로 설정하였다. 만약 키워드 개념 망에 교토에 대한 여행 정보가 없어서 검색을 할 수 없는 상태이고, 오사카(Osaka) 대한 여행정보만 찾을 수 있다면 오사카는 교토의 대체관계로서 오사카의 여행정보를 나타낼 수 있다.Substitution: An expression of a relationship that can be used as an alternative, and is defined by the definition of InSO. For example, when searching for the alternative "Kyoto Trip" in Japan, Osaka, a neighboring area of Kyoto, was set as a substitute relationship at InSO. If the keyword concept network does not have travel information for Kyoto and can not be searched, and if only the travel information for Osaka can be found, Osaka can represent Osaka's travel information as an alternative to Kyoto.

추천부(230)는 관련키워드 리스트와 기 정의된 테마 개념 망 내 테마 리스를 추천하는 기능을 수행한다.The recommendation unit 230 performs a function of recommending a theme keyword in a related keyword list and a theme theme in a predefined theme concept network.

보다 구체적으로, 추천부(230)는 키워드 개념 망과 전문가 개념 망 간에 동일키워드가 존재하는 것으로 확인되는 경우, 관련키워드 리스트 이외에 동일키워드 리스트를 사용자에게 추가로 추천함으로써, 사용자로 하여금 관련키워드 리스트로부터 전문가 의견을 반영하고 있는 동일키워드를 식별할 수 있도록 한다.More specifically, when it is determined that the same keyword exists between the keyword concept network and the expert concept network, the recommendation unit 230 further recommends the same keyword list to the user in addition to the related keyword list, Identify the same keywords that reflect expert opinion.

이때, 추천부(230)는 입력된 특정 키워드와 관련된 다수의 상품정보가 테마 별로 기 정의된 테마 개념 망 내 테마 리스트를 사용자에게 추가 추천함으로써 테마 리스트 상의 특정 테마를 선택할 수 있도록 한다.At this time, the recommendation unit 230 allows the user to select a specific theme on the theme list by additionally recommending the theme list in the theme concept network defined for each theme to a user.

여기서, 테마 개념 망은 본 발명의 일 실시예에 따른 개념 망 간의 관계 표현을 나타내고 있는 도 3의 (C)와 같은 형태로 기 정의될 수 있다.Here, the theme concept network may be predefined as shown in (C) of FIG. 3, which represents a relationship expression between concept networks according to an embodiment of the present invention.

도 3 (C)는 사용자로부터 입력된 키워드가 '도쿄여행'인 경우와 관련하여, '일본'과 관련된 여행 테마를 '허니문', '자유여행', '골프여행', '크루즈', '배낭여행' 및 '온천'으로 분류하여 정의하고 있는 테마 개념 망을 나타낸다.FIG. 3C is a diagram showing the travel theme related to 'Japan' as 'honeymoon', 'free travel', 'golf trip', 'cruise', 'backpack' Travel "and" hot spring ".

이러한, 테마 개념 망은 예컨대, 크게 여행 사이트에 저장되어 있는 대분류-중분류-소분류로 나뉠 수 있으며, 이러한 분류 체계는 여행 사이트들의 분류 체계에 따라 다양하게 설계될 수 있다.The theme concept network can be classified into, for example, a major category, a middle category, and a small category stored in a travel site, and the classification scheme can be variously designed according to the classification system of travel sites.

이처럼, 사용자에게 관련키워드 리스트 이외에 전문가 의견을 반영하고 있는 동일키워드 리스트를 함께 제공하는 것은, 사용자에게 관련키워드에 대한 기반 지식이 없더라도, 전문가 의견을 참고하여 자신의 검색 의도에 맞는 관련키워드를 적합하게 선택할 수 있도록 하기 위함이며, 또한 테마 리스트를 추가로 제공하는 사용자에게 제공하는 것은, 사용자가 원하는 여행 테마에 맞는 적합한 검색 결과를 제공하기 위함이다.In this way, providing the user with the same keyword list that reflects the expert opinion other than the related keyword list allows the user to refer to the expert opinion and to associate the relevant keyword matching his / her search intention The present invention also provides a theme list to a user who provides a theme list to provide a search result suitable for a travel theme desired by the user.

제공부(240)는 사용자 선택과 관련된 상품 리스트를 검색하여 제공하는 기능을 수행한다.The providing unit 240 performs a function of searching for and providing a product list related to user selection.

보다 구체적으로, 제공부(240)는 추천된 테마 리스트로부터 특정 테마가 선택되며, 마찬가지로 관련키워드 리스트로부터 특정 관련키워드가 선택되는 경우, 선택된 특정 테마로 정의된(분류된) 상품 중 상기 특정 관련키워드가 매핑된 상품 리스트를 검색하여 제공하게 된다.More specifically, the providing unit 240 selects a specific theme from the list of recommended themes, and similarly, when a specific related keyword is selected from the related keyword list, among the products defined (classified) by the selected specific theme, A list of mapped goods is retrieved and provided.

참고로, 도 5에는 상품 리스트 검색과 관련하여 개념 망과 상품 간의 관계를 나타내고 있다.For reference, FIG. 5 shows the relationship between the concept network and the product in relation to the product list search.

도 5는 본 발명의 일 실시예에 따른 전문가 개념 망(Expert Concept Net), 키워드 개념 망(Keyword Concept Net), 테마 개념 망(Theme Concept Net)을 포함하는 3가지 개념 망과 상품 간의 관계와 속성을 나타낸 것으로, 각 속성명은 'isCityof', 'hasProduct', 'hasTheme', 및 'hasKeyword'로 표현될 수 있다.FIG. 5 is a graph showing relationships between three conceptual networks and products including an Expert Concept Net, a Keyword Concept Net, and a Theme Concept Net according to an embodiment of the present invention, , And each attribute name can be expressed as 'isCityof', 'hasProduct', 'hasTheme', and 'hasKeyword'.

여기서, 'isCityof'는 사용자 입력 키워드를 기반으로 생성되는 키워드 개념 망과 전문가 개념 망을 비교하여 사용자가 입력한 키워드의 관광명소 or 도시명이 전문가 개념 망에 존재하는지를 살펴보는 속성이다.Here, 'isCityof' is an attribute that compares the keyword concept network generated based on the user input keyword with the expert concept network and determines whether the tourist spot or the city name of the keyword entered by the user exists in the expert concept network.

또한'hasProduct'는 사용자 입력 키워드가 갖는 상품을 확인하는 속성이고, 'hasTheme'는 어떤 상품이 테마 분류기준에 따라 무슨 테마로 분류되어 있는지를 살펴볼 수 있는 속성이다.Also, 'hasProduct' is an attribute that confirms a product possessed by a user input keyword, and 'hasTheme' is an attribute that allows a user to check what kind of a product is classified according to the theme classification standard.

그리고 'hasKeyword'는 각각의 상품에 사용자 검색 키워드들이 포함되어 있는지를 확인하는 속성으로 'hasProduct'와 한 쌍을 이루는 속성이다.And 'hasKeyword' is an attribute to check whether each product includes user search keywords and is a pair with 'hasProduct'.

이상에서 설명한 바와 같이, 본 발명의 일 실시예에 따른 정보검색장치(200)의 구성에 따르면, 키워드 유사성과 시소러스를 해결하기 위한 전문가 개념 망을 지식베이스로 구축하고, 사용자 검색을 기반으로 생성되는 키워드 개념 망과 전문가 개념, 그리고 테마 개념 망을 결합하여, 사용자에게 그에 따른 검색 결과를 제공함으로써, 기반지식이 없는 사용자로 하여금 관련키워드를 통해 사용자의 검색 목적을 달성할 수 있도록 지원할 수 있다.As described above, according to the configuration of the information search apparatus 200 according to an embodiment of the present invention, an expert concept network for solving keyword similarity and thesaurus is constructed as a knowledge base, By combining keyword concept network, expert concept, and theme concept network, users can be provided with search results according to the search results, thereby enabling a user having no base knowledge to achieve a user's search purpose through a related keyword.

이상, 본 발명의 일 실시예에 따른 정보검색장치(200)의 구성에 대한 설명을 마치고, 이하에서는 정보검색장치(200)에서의 동작 흐름과 관련된 순서도를 도시하고 있는 도 6을 참조하여 정보검색장치(200)에서의 동작 흐름에 대한 설명을 이어 가기로 한다.6, which shows a flowchart related to the operation flow in the information search apparatus 200, the information search apparatus 200 according to an embodiment of the present invention is described below, The description of the operation flow in the apparatus 200 will be continued.

먼저, 생성부(210)는 단계 'S110'에 따라서 사용자단말(100)로부터 사용자로부터 입력된 특정 키워드가 수신되는 경우, 단계 'S120'에 따라, 입력된 특정 키워드를 포함하는 레거시 시스템(300) 상의 데이터 소스로부터 상기 특정 키워드와 유사 개념 관계가 존재하는 관련키워드를 추출하고, 단계 'S130'에 따라 추출된 관련키워드와 입력된 특정 키워드 간의 유사 개념 관계를 나타내는 키워드 개념 망을 생성한다.First, when the specific keyword input from the user is received from the user terminal 100 in accordance with step S110, the generating unit 210 generates the legacy system 300 including the input specific keyword according to step S120. Extracts a related keyword having a similar conceptual relationship with the specific keyword from the data source on the basis of the extracted keyword, and generates a keyword concept network representing a similar conceptual relationship between the extracted related keyword and the input specific keyword according to step 'S130'.

이때, 생성부(210)는 예컨대, 다수의 키워드 중 개별검색빈도가 임계치(예: 3회) 이상이거나, 또는 전체검색빈도에 대한 개별검색빈도의 비율이 임계치 이상인 키워드를 입력된 특정 키워드와 유사 개념 관계가 존재하는 관련키워드로서 추출할 수 있다.For example, the generating unit 210 may generate a keyword having a frequency of individual retrieval frequencies of a plurality of keywords equal to or greater than a threshold value (for example, three times) or a ratio of individual retrieval frequencies to the total retrieval frequency equal to or greater than a threshold value, It can be extracted as a related keyword in which the concept relation exists.

그리고 나서, 확인부(220)는 키워드 개념 망이 생성되는 경우, 단계 'S140'에 따라 입력된 키워드와 관련하여 키워드 간 유사 개념 관계를 기 정의하고 있는 전문가 개념 망 내 키워드 리스트와, 키워드 개념 망 내 관련키워드 리스트를 서로 비교하여, 전문가 개념 망 내에 관련키워드와 일치되는 동일키워드가 존재하는지 여부를 확인한다.Then, when the keyword concept network is generated, the verification unit 220 generates a keyword list in the expert concept network that defines the similar conceptual relationship between the keywords with respect to the keyword input in accordance with the step 'S140' The related keyword list is compared with each other to check whether or not the same keyword matching the related keyword exists in the expert concept network.

참고로, 확인부(220)는 도 3 (A)의 전문가 개념 망과, 도 3 (B)의 키워드 개념 망을 서로 비교하는 경우, 키워드 개념 망 내 관련키워드인 '신주쿠', '도쿄타워', '디즈니랜드'가 동일키워드임을 확인할 수 있게 되며, 이때 전문가 개념 망 내에서'신주쿠', '도쿄타워', '디즈니랜드'의 상위 카테고리인 '도쿄'를 키워드 개념 망 내 신규 카테고리로서 생성할 수 있다.3 (A) and the keyword concept network of FIG. 3 (B), the verification unit 220 determines whether or not the keywords related to the keyword concept network are 'Shinjuku', 'Tokyo Tower' And 'Disneyland' are the same keywords. In this case, 'Shinjuku', 'Tokyo Tower', and 'Tokyo', which is the upper category of 'Disneyland', are created as new categories in the keyword concept network .

이어서, 추천부(230)는 키워드 개념 망과 전문가 개념 망 간에 동일키워드가 존재하는 것으로 확인되는 경우, 단계 'S150'에 따라 관련키워드 리스트 이외에 동일키워드 리스트를 사용자에게 추가로 추천함으로써, 사용자로 하여금 관련키워드 리스트로부터 전문가 의견을 반영하고 있는 동일키워드를 식별할 수 있도록 한다.If it is confirmed that the same keyword exists between the keyword concept network and the expert concept network, the recommendation unit 230 further recommends the same keyword list to the user in addition to the related keyword list according to step 'S150' It is possible to identify the same keyword that reflects the expert opinion from the related keyword list.

이때, 추천부(230)는 입력된 특정 키워드와 관련된 다수의 상품정보가 테마 별로 기 정의된 테마 개념 망 내 테마 리스트를 사용자에게 추가 추천함으로써 테마 리스트 상의 특정 테마를 선택할 수 있도록 한다.At this time, the recommendation unit 230 allows the user to select a specific theme on the theme list by additionally recommending the theme list in the theme concept network defined for each theme to a user.

이처럼, 사용자에게 관련키워드 리스트 이외에 전문가 의견을 반영하고 있는 동일키워드 리스트를 함께 제공하는 것은, 사용자에게 관련키워드에 대한 기반 지식이 없더라도, 전문가 의견을 참고하여 자신의 검색 의도에 맞는 관련키워드를 적합하게 선택할 수 있도록 하기 위함이며, 또한 테마 리스트를 추가로 제공하는 사용자에게 제공하는 것은, 사용자가 원하는 여행 테마에 맞는 적합한 검색 결과를 제공하기 위함이다.In this way, providing the user with the same keyword list that reflects the expert opinion other than the related keyword list allows the user to refer to the expert opinion and to associate the relevant keyword matching his / her search intention The present invention also provides a theme list to a user who provides a theme list to provide a search result suitable for a travel theme desired by the user.

이후, 제공부(240)는 단계 'S160' 에 따라서 추천된 테마 리스트로부터 특정 테마가 선택되며, 마찬가지로 관련키워드 리스트로부터 특정 관련키워드가 선택된 것이 확인되는 경우, 단계 'S170'에 따라 선택된 특정 테마로 정의된(분류된) 상품 중 선택된 특정 관련키워드가 매핑된 상품 리스트를 검색하여 제공한다.Subsequently, the providing unit 240 selects a specific theme from the recommended theme list according to step S160, and similarly, when it is confirmed that a specific related keyword is selected from the related keyword list, And searches for and provides a list of products that are mapped with the selected specific related keywords among the defined (classified) products.

이상에서 설명한 바와 같이, 본 발명의 일 실시예에 따른 정보검색장치(200)에서의 동작 흐름에 따르면, 키워드 유사성과 시소러스를 해결하기 위한 전문가 개념 망을 지식베이스로 구축하고, 사용자 검색을 기반으로 생성되는 키워드 개념 망과 전문가 개념, 그리고 테마 개념 망을 결합하여, 사용자에게 그에 따른 검색 결과를 제공함으로써, 기반지식이 없는 사용자로 하여금 관련키워드를 통해 사용자의 검색 목적을 달성할 수 있도록 지원할 수 있다.As described above, according to the operation flow in the information search apparatus 200 according to an embodiment of the present invention, an expert concept network for solving keyword similarity and thesaurus is constructed as a knowledge base, and based on user search By combining the generated keyword concept network, expert concept, and theme concept network, users can be provided with search results according to the search result, thereby enabling a user having no base knowledge to achieve a user's search purpose through related keywords .

한편, 여기에 제시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Meanwhile, the steps of a method or algorithm described in connection with the embodiments disclosed herein may be embodied directly in hardware, or may be embodied in a computer readable medium, in the form of a program instruction, which may be carried out through various computer means. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions recorded on the medium may be those specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

지금까지 본 발명을 바람직한 실시 예를 참조하여 상세히 설명하였지만, 본 발명이 상기한 실시 예에 한정되는 것은 아니며, 이하의 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 또는 수정이 가능한 범위까지 본 발명의 기술적 사상이 미친다 할 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims.

본 발명에 따른 정보검색장치 및 그 동작 방법에 따르면, 입력 키워드 중심의 키워드 개념 망과 전문가 그룹이 추천한 전문가 개념 망 그리고 테마 개념 망을 이용한 협업 검색을 수행함으로써, 사용자가 원하는 정보의 검색을 효율적으로 지원할 수 있다는 점에서, 기존 기술의 한계를 뛰어 넘음에 따라 관련 기술에 대한 이용만이 아닌 적용되는 장치의 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있는 발명이다.According to the information search apparatus and the operation method thereof according to the present invention, the keyword concept network focused on the input keyword, the expert concept network recommended by the expert group, and the collaboration search using the theme concept network enable the user to search for desired information efficiently , It is possible to apply not only the related technology but also the possibility of commercialization or operation of the applied device as it exceeds the limit of the existing technology, It is an invention.

100: 사용자단말
200: 정보검색장치
210: 생성부 220: 확인부
230: 추천부 240: 제공부
300: 레거시 시스템
100: user terminal
200: Information retrieval device
210: Generation unit 220:
230: Recommendation part 240:
300: Legacy system

Claims (10)

사용자로부터 입력된 특정 키워드를 포함하는 데이터 소스로부터 상기 특정 키워드와 유사 개념 관계가 존재하는 관련키워드를 추출하여, 상기 관련키워드와 상기 특정 키워드 간에 유사 개념 관계를 나타내는 키워드 개념 망을 생성하는 생성부;
상기 특정 키워드와 관련하여 키워드 간 유사 개념 관계가 기 정의된 전문가 개념 망 내 키워드 리스트와 상기 키워드 개념 망 내 상기 추출된 관련키워드로 구성된 관련키워드 리스트를 비교하여, 상기 전문가 개념 망 내에 상기 관련키워드와 일치되는 동일키워드가 존재하는지 여부를 확인하는 확인부; 및
상기 동일키워드가 존재하는 것으로 확인되는 경우 상기 관련키워드 리스트 이외에 상기 동일키워드 리스트를 상기 사용자에게 추가로 추천하여, 상기 관련키워드 리스트로부터 상기 동일키워드가 식별될 수 있도록 하고, 상기 특정 키워드와 관련된 다수의 상품정보가 테마 별로 기 정의된 테마 개념 망 내 테마 리스트를 상기 사용자에게 더 추천하는 추천부를 포함하는 것을 특징으로 하는 정보검색장치.
A generating unit for extracting a related keyword having a similar conceptual relationship with the specific keyword from a data source including a specific keyword input from a user and generating a keyword concept network representing a similar conceptual relationship between the related keyword and the specific keyword;
Comparing the keyword list in the expert concept network in which the similar conceptual relationship between keywords is predefined with respect to the specific keyword and the related keyword list composed of the extracted related keywords in the keyword concept network, A confirmation unit for confirming whether or not the same keyword to be matched exists; And
If the same keyword is found to exist, recommending the same keyword list to the user in addition to the related keyword list so that the same keyword can be identified from the related keyword list, And the recommendation unit further recommends the theme list in the theme concept network defined by the product information to the user.
제 1 항에 있어서,
상기 관련키워드는,
상기 데이터 소스로부터 상기 특정 키워드와 함께 검색되는 다수의 키워드 각각에 대한 상기 데이터 소스 내에서의 검색 빈도인 개별검색빈도, 및 상기 다수의 키워드 각각의 상기 개별검색빈도를 합산한 전체검색빈도 중 적어도 하나를 기초로 추출되는 것을 특징으로 하는 정보검색장치.
The method according to claim 1,
The related keyword may include:
At least one of an individual search frequency that is a search frequency in the data source for each of a plurality of keywords that are searched with the specific keyword from the data source, and a total search frequency that is a sum of the individual search frequencies of each of the plurality of keywords Is extracted on the basis of the extracted information.
제 2 항에 있어서,
상기 생성부는,
상기 다수의 키워드 중 상기 개별검색빈도가 임계치 이상이거나, 또는 상기 전체검색빈도에 대한 상기 개별검색빈도의 비율이 임계치 이상인 키워드를 상기 특정 키워드와 유사 개념 관계가 존재하는 상기 관련키워드로 추출하는 것을 특징으로 하는 정보검색장치.
3. The method of claim 2,
Wherein the generation unit comprises:
Extracting a keyword having a similar conceptual relationship with the specific keyword, the keyword having the individual search frequency higher than the threshold value or the ratio of the individual search frequency with respect to the entire search frequency being equal to or higher than the threshold value, .
삭제delete 제 1 항에 있어서,
상기 정보검색장치는,
상기 테마 리스트로부터 특정 테마가 선택되며, 상기 관련키워드 리스트로부터 특정 관련키워드가 선택되는 경우, 상기 특정 테마로 정의된 상품 중 상기 특정 관련키워드가 매핑된 상품 리스트를 검색하여 제공하는 제공부를 더 포함하는 것을 특징으로 하는 정보검색장치.
The method according to claim 1,
The information searching apparatus comprises:
Further comprising a providing unit for searching for a specific theme from the theme list and selecting a specific related keyword from the related keyword list to search for and provide a product list in which the specific related keyword is mapped The information retrieval apparatus comprising:
사용자로부터 입력된 특정 키워드를 포함하는 데이터 소스로부터 상기 특정 키워드와 유사 개념 관계가 존재하는 관련키워드를 추출하여, 상기 관련키워드와 상기 특정 키워드 간에 유사 개념 관계를 나타내는 키워드 개념 망을 생성하는 생성단계;
상기 특정 키워드와 관련하여 키워드 간 유사 개념 관계가 기 정의된 전문가 개념 망 내 키워드 리스트와 상기 키워드 개념 망 내 상기 추출된 관련키워드로 구성된 관련키워드 리스트를 비교하여, 상기 전문가 개념 망 내에 상기 관련키워드와 일치되는 동일키워드가 존재하는지 여부를 확인하는 확인단계; 및
상기 동일키워드가 존재하는 것으로 확인되는 경우 상기 관련키워드 리스트 이외에 상기 동일키워드 리스트를 상기 사용자에게 추가로 추천하여, 상기 관련키워드 리스트로부터 상기 동일키워드가 식별될 수 있도록 하고, 상기 특정 키워드와 관련된 다수의 상품정보가 테마 별로 기 정의된 테마 개념 망 내 테마 리스트를 상기 사용자에게 더 추천하는 추천단계를 포함하는 것을 특징으로 하는 정보검색장치의 동작 방법.
A generating step of extracting a related keyword having a similar conceptual relationship with the specific keyword from a data source including a specific keyword input from a user and generating a keyword concept network indicating a similar conceptual relationship between the related keyword and the specific keyword;
Comparing the keyword list in the expert concept network in which the similar conceptual relationship between keywords is predefined with respect to the specific keyword and the related keyword list composed of the extracted related keywords in the keyword concept network, A confirming step of confirming whether or not the same keyword to be matched exists; And
If the same keyword is found to exist, recommending the same keyword list to the user in addition to the related keyword list so that the same keyword can be identified from the related keyword list, Wherein the recommendation step further includes a recommendation step of recommending the theme list in the theme concept network defined by the product information to the user, to the user.
제 6 항에 있어서,
상기 관련키워드는,
상기 데이터 소스로부터 상기 특정 키워드와 함께 검색되는 다수의 키워드 각각에 대한 상기 데이터 소스 내에서의 검색 빈도인 개별검색빈도, 및 상기 다수의 키워드 각각의 상기 개별검색빈도를 합산한 전체검색빈도 중 적어도 하나를 기초로 추출되는 것을 특징으로 하는 정보검색장치의 동작 방법.
The method according to claim 6,
The related keyword may include:
At least one of an individual search frequency that is a search frequency in the data source for each of a plurality of keywords that are searched with the specific keyword from the data source, and a total search frequency that is a sum of the individual search frequencies of each of the plurality of keywords Is extracted based on the extracted information.
제 7 항에 있어서,
상기 생성단계는,
상기 다수의 키워드 중 상기 개별검색빈도가 임계치 이상이거나, 또는 상기 전체검색빈도에 대한 상기 개별검색빈도의 비율이 임계치 이상인 키워드를 상기 특정 키워드와 유사 개념 관계가 존재하는 상기 관련키워드로 추출하는 것을 특징으로 하는 정보검색장치의 동작 방법.
8. The method of claim 7,
Wherein the generating comprises:
Extracting a keyword having a similar conceptual relationship with the specific keyword, the keyword having the individual search frequency higher than the threshold value or the ratio of the individual search frequency with respect to the entire search frequency being equal to or higher than the threshold value, Of the information retrieval apparatus.
삭제delete 제 6 항에 있어서,
상기 방법은,
상기 테마 리스트로부터 특정 테마가 선택되며, 상기 관련키워드 리스트로부터 특정 관련키워드가 선택되는 경우, 상기 특정 테마로 정의된 상품 중 상기 특정 관련키워드가 매핑된 상품 리스트를 검색하여 제공하는 제공단계를 더 포함하는 것을 특징으로 하는 정보검색장치의 동작 방법.
The method according to claim 6,
The method comprises:
And a providing step of searching for and providing a list of products to which the specific related keyword is mapped, when a specific theme is selected from the theme list and a specific related keyword is selected from the related keyword list The information search method comprising the steps of:
KR1020160073703A 2016-06-14 2016-06-14 Apparatus for searching information, and control method thereof KR101683138B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160073703A KR101683138B1 (en) 2016-06-14 2016-06-14 Apparatus for searching information, and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160073703A KR101683138B1 (en) 2016-06-14 2016-06-14 Apparatus for searching information, and control method thereof

Publications (1)

Publication Number Publication Date
KR101683138B1 true KR101683138B1 (en) 2016-12-06

Family

ID=57576224

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160073703A KR101683138B1 (en) 2016-06-14 2016-06-14 Apparatus for searching information, and control method thereof

Country Status (1)

Country Link
KR (1) KR101683138B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101896177B1 (en) * 2017-03-08 2018-09-06 김동훈 An Image Searching System Providing Multiplex Result
KR20200123565A (en) * 2019-04-22 2020-10-30 한국전자통신연구원 Apparatus and method for managing data based on data managing structure
KR102448633B1 (en) * 2022-05-02 2022-09-28 김태평 A method of recommending products based on a user's search terms
CN117392826A (en) * 2023-12-11 2024-01-12 吉林大学 Network information early warning method and system based on big data

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002203012A (en) * 2000-12-28 2002-07-19 Yamaha Motor Co Ltd Planning equipment, system and equipment for planning travel
KR20070109207A (en) * 2006-05-10 2007-11-15 (주)윕스 Presenting system of keyword using associative model and method thereof
KR20110050823A (en) * 2009-11-09 2011-05-17 최진근 Apparatus and method for establishing search database for knowledge node coupling structure

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002203012A (en) * 2000-12-28 2002-07-19 Yamaha Motor Co Ltd Planning equipment, system and equipment for planning travel
KR20070109207A (en) * 2006-05-10 2007-11-15 (주)윕스 Presenting system of keyword using associative model and method thereof
KR20110050823A (en) * 2009-11-09 2011-05-17 최진근 Apparatus and method for establishing search database for knowledge node coupling structure

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101896177B1 (en) * 2017-03-08 2018-09-06 김동훈 An Image Searching System Providing Multiplex Result
KR20200123565A (en) * 2019-04-22 2020-10-30 한국전자통신연구원 Apparatus and method for managing data based on data managing structure
KR102309249B1 (en) * 2019-04-22 2021-10-07 한국전자통신연구원 Apparatus and method for managing data based on data managing structure
KR102448633B1 (en) * 2022-05-02 2022-09-28 김태평 A method of recommending products based on a user's search terms
CN117392826A (en) * 2023-12-11 2024-01-12 吉林大学 Network information early warning method and system based on big data
CN117392826B (en) * 2023-12-11 2024-02-13 吉林大学 Network information early warning method and system based on big data

Similar Documents

Publication Publication Date Title
US10289717B2 (en) Semantic search apparatus and method using mobile terminal
RU2501078C2 (en) Ranking search results using edit distance and document information
KR101793222B1 (en) Updating a search index used to facilitate application searches
US7984035B2 (en) Context-based document search
US8037068B2 (en) Searching through content which is accessible through web-based forms
Gilson et al. From web data to visualization via ontology mapping
US20130262449A1 (en) System and method for search refinement using knowledge model
US9646260B1 (en) Using existing relationships in a knowledge base to identify types of knowledge for addition to the knowledge base
US10606853B2 (en) Systems and methods for intelligent prospect identification using online resources and neural network processing to classify organizations based on published materials
US8812508B2 (en) Systems and methods for extracting phases from text
KR101683138B1 (en) Apparatus for searching information, and control method thereof
JP2014533868A (en) Image search
CN103620604A (en) Exposing search history by category
US20150154306A1 (en) Method for searching related entities through entity co-occurrence
US20110208715A1 (en) Automatically mining intents of a group of queries
KR20160124079A (en) Systems and methods for in-memory database search
KR100835290B1 (en) System and method for classifying document
KR100954842B1 (en) Method and System of classifying web page using category tag information and Recording medium using by the same
CN115563313A (en) Knowledge graph-based document book semantic retrieval system
US20120130999A1 (en) Method and Apparatus for Searching Electronic Documents
Shi et al. Textually relevant spatial skylines
US9552415B2 (en) Category classification processing device and method
Sun et al. A hybrid approach for article recommendation in research social networks
An et al. A heuristic approach on metadata recommendation for search engine optimization
KR101273646B1 (en) Method and system for indexing and searching in multi-modality data

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant