KR20100039968A - Ontology based semantic search system and method for authority heading of various languages via automatic language translation - Google Patents

Ontology based semantic search system and method for authority heading of various languages via automatic language translation Download PDF

Info

Publication number
KR20100039968A
KR20100039968A KR1020080098973A KR20080098973A KR20100039968A KR 20100039968 A KR20100039968 A KR 20100039968A KR 1020080098973 A KR1020080098973 A KR 1020080098973A KR 20080098973 A KR20080098973 A KR 20080098973A KR 20100039968 A KR20100039968 A KR 20100039968A
Authority
KR
South Korea
Prior art keywords
search
authority
language
heading
translated
Prior art date
Application number
KR1020080098973A
Other languages
Korean (ko)
Other versions
KR101037091B1 (en
Inventor
박상기
신창호
이승범
황영식
Original Assignee
주식회사 아이네크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아이네크 filed Critical 주식회사 아이네크
Priority to KR1020080098973A priority Critical patent/KR101037091B1/en
Publication of KR20100039968A publication Critical patent/KR20100039968A/en
Application granted granted Critical
Publication of KR101037091B1 publication Critical patent/KR101037091B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

PURPOSE: An ontology based semantic search system for authority headings of various languages for automatic language translation and a method thereof are provided to perform semantic search in a resource database constructed by ontology based on topic map structure. CONSTITUTION: Multiple authority heading extractors(151,161,171) decide whether there is an authority heading corresponding to a keyword of a corresponding language. An authority heading extraction units extract the authority heading. About the keyword translated into the language and the authority heading, multiple search units(153,163,173) perform search in a database based on the language among multiple resource databases(154,164,174). By collecting search results of respective languages, a search result providing unit(180) provides summary information according to a pre-designated display order.

Description

자동 언어 번역을 통한 다국어의 전거 표목에 대한 온톨로지 기반 의미 검색 시스템 및 방법{Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation}Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation}

본 발명은 온톨로지 기반 의미 검색 시스템 및 방법에 관한 것으로서, 특히, 입력된 검색어에 대하여 자동으로 다국어로 번역하여 언어에 구애받지 않고 다양한 언어에 대한 풍부한 검색 결과가 실현될 수 있도록 하고, 번역된 각국의 언어에 대한 전거 표목을 추출하여 검색에 활용함으로써 정확한 온톨로지의 접근을 제공하여 보다 정확한 의미 검색을 수행할 수 있는 온톨로지 기반 의미 검색 시스템 및 방법에 관한 것이다.The present invention relates to an ontology-based semantic search system and method, and more particularly, to automatically input into a multi-language input search word so that a rich search result for various languages can be realized regardless of language, The present invention relates to an ontology-based semantic retrieval system and method that can perform accurate retrieval by providing accurate ontology access by extracting authority headings for language.

오늘날 각종 정보의 홍수 속에서 사용자가 찾고자 하는 정보를 신속하고 정확하게 검색할 수 있는 시스템이 많은 분야에서 요구되고 있다. 예를 들어, 도서관의 도서 검색 시스템, 웹(web) 사이트의 정보 검색 시스템, LAN으로 연결된 소규모 네트워크나 개인용 PC의 저장 장치에 관리되는 리소스들에 대한 검색 시스템 등 검색에 유용한 시스템이 관리되는 많은 정보, 예를 들어, 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 텍스트 데이터 등 다양한 형태의 정보를 보다 빠 르고 지능화된 방법으로 검색하기 위한 많은 방법들이 개발되고 있다.In today's flood of information, a system that can quickly and accurately search for information that a user wants to find is required in many fields. For example, a lot of information managed by a system that is useful for searching, such as a book search system in a library, an information search system on a web site, a search system for resources managed on a small network connected to a LAN or a storage device of a personal PC. For example, many methods for retrieving various types of information, such as document files, image files, video files, database information, and text data, in a faster and more intelligent manner, have been developed.

일반적으로 종래에는 한 나라의 언어로 검색을 수행하며, 검색의 수행에 있어서 형태소 분석을 통한 키워드 추출 방식이나 형태소 사전의 한계를 극복하기 위해 색인 구조를 통한 n-gram방식 등으로 접근한다. 이와 같은 종래의 검색 방식들은 검색 대상 자료로부터 검색어에 해당하는 문자열을 추출하고 추출된 문자열에 대한 검색어와의 일치도 비교를 통하여 검색 결과를 제공할 뿐이다. 그러나, 이러한 검색 방식들은 검색어와 관련있는 다양한 국가의 언어로된 자료를 제공하지 못하고, 검색 접근 방식에 있어서 단순 형태 분석에 의존하므로 검색 결과로서 검색어에 부적합한 많은 자료가 포함되는 경향이 있다. In general, a search is performed in a language of a country, and in the search, an approach of a keyword extraction through morphological analysis or an n-gram method through an index structure is used to overcome limitations of a morphological dictionary. Such conventional search methods only provide a search result by extracting a string corresponding to a search word from a search target data and comparing the matched word with the search word. However, these search methods do not provide data in various national languages related to the search terms, and rely on simple form analysis in the search approach, and thus tend to include a large amount of data that is inappropriate for search terms as a search result.

이를 극복하고자 검색어에 대한 비슷한 단어를 시소러스(thesaurus) 사전으로부터 추출하여 일치도 비교 시에 상관 정도에 참조하도록 이용함으로써 종래의 검색 방식을 보완하기도 한다. 하지만, 시소러스를 참조하여 검색한다 할지라도, 다양하지 않은 언어에 대한 검색 결과를 제공할 뿐이며, 입력된 검색어만에 대하여 검색이 기동되고 수행되므로 사용자의 의도에 맞는 만족할 만한 결과나 다양하고 정확한 결과를 기대하기에는 한계가 있다. 이러한 한계에 대한 대안으로 시소러스 사전이 제공하지 못하는 전거(authority) 표목을 관리하고 온톨로지에 기반한 의미 검색 방식을 제안하고자 한다. In order to overcome this problem, the conventional search method may be supplemented by extracting a similar word for a search word from a thesaurus dictionary and referring to the degree of correlation when comparing the match. However, even if you search by referring to the thesaurus, it will only provide search results for various languages, and the search will be started and performed only for the entered search terms, so that you can obtain satisfactory or various and accurate results according to the user's intention. There is a limit to expectation. As an alternative to this limitation, we will manage authority headings that the thesaurus does not provide and propose an ontology-based semantic search method.

본 발명은 상술한 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 풍부 하고 정확한 검색결과를 제공하기 위하여, 토픽맵 구조에 기초한 온톨로지로 구축된 리소스 데이터베이스에 대하여 의미 검색을 수행할 수 있는 온톨로지 기반 의미 검색 시스템 및 방법을 제공하는 데 있다. SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and an object of the present invention is to provide an ontology-based meaning that can perform a semantic search on a resource database constructed with an ontology based on a topic map structure in order to provide rich and accurate search results. To provide a search system and method.

또한, 본 발명의 다른 목적은, 의미 검색의 실현을 위하여, 어떠한 언어로 검색어가 입력되더라도 자동으로 다국어로 번역하여 각국의 언어로 검색을 기동하되, 이때, 보다 사용자 의도에 맞는 정확한 검색을 위하여 번역된 각국의 언어에 대한 전거 표목을 추출하여 각 전거 표목별로 검색을 기동하고 취합하여 각 전거 표목에 대하여 일치도 또는 빈도수가 높은 해당 검색 결과를 제공할 수 있는 온톨로지 기반 의미 검색 시스템 및 방법을 제공하는 데 있다. In addition, another object of the present invention, in order to realize a meaning search, even if a search word is input in any language is automatically translated into a multi-language to start the search in the language of each country, at this time, to translate more accurate for the user's intention To provide an ontology-based semantic search system and method that extracts authority headings for each language of each country, launches and aggregates the search for each authority heading, and provides the corresponding search results with high accuracy or frequency for each authority heading. have.

그리고, 본 발명의 또 다른 목적은, 검색어의 다수 조합으로 검색 조건을 주어 검색할 수 있는 검색 화면의 표시창에서 각 검색어에 가중치를 줌으로써 검색 결과의 표시 순위를 정할 수 있으며, 검색 결과 화면에서는 보기 단계별로 정보의 심도(depth)를 구분하여 제공할 수 있는 온톨로지 기반 의미 검색 시스템 및 방법을 제공하는 데 있다. In addition, another object of the present invention, the display order of the search results can be determined by giving a weight to each search term in the display window of the search screen that can be searched given a plurality of combinations of search terms, in the search results screen The present invention provides an ontology-based semantic retrieval system and method that can provide information by dividing depth of information.

먼저, 본 발명의 특징을 요약하면, 상기의 목적을 달성하기 위한 본 발명의 일면에 따른, 온톨로지 기반 의미 검색 시스템은, 입력된 검색어에 대하여 복수의 국가들의 각 나라 언어로 번역된 복수의 검색어들을 생성하는 다국어 번역기; 각각이 상기 번역된 복수의 검색어들 중 각 나라 언어로된 검색어를 인식하여 수신하기 위한 복수의 언어 인식부들; 각각이 각 나라 언어로된 복수의 단어들에 대하여 단 어 형태별로 전거 표목을 저장하고 관리하는 복수의 전거 표목 데이터베이스들; 각각이 각 나라 언어에 따라 토픽맵 구조에 기초하여 온톨로지로 구축된 리소스들을 저장하고 관리하는 복수의 리소스 데이터베이스들; 각각이 상기 복수의 언어 인식부들로부터의 각 나라 언어로된 검색어에 대하여 상기 복수의 전거 표목 데이터베이스들 중 각 나라 언어에 기초한 데이터베이스를 참조하여 상기 각 나라 언어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출하는 복수의 전거 표목 추출부들; 각각이 해당 언어로 번역된 검색어와 상기 복수의 전거 표목 추출부들로부터의 각 나라 언어로된 전거 표목에 대하여 상기 복수의 리소스 데이터베이스들 중 각 나라 언어에 기초한 데이터베이스에서 검색을 수행하는 복수의 검색부들; 및 상기 복수의 검색부들이 검색을 수행하여 추출한 각 언어별 검색 결과들을 취합하여 미리 정한 표시 순서에 따라 요약 정보를 제공하는 검색 결과 제공부를 포함한다.First, to summarize the features of the present invention, the ontology-based semantic retrieval system according to an aspect of the present invention for achieving the above object, a plurality of search terms translated in each country language of a plurality of countries with respect to the input search word Multilingual translator to generate; A plurality of language recognition units for recognizing and receiving a search word in each language of each of the translated plurality of search words; A plurality of authority heading databases for storing and managing authority headings for each word type for a plurality of words in each country language; A plurality of resource databases, each storing and managing resources constructed ontologies based on a topic map structure according to each country language; With respect to a search word in each country language from the plurality of language recognition units, whether there is an authority head corresponding to the search word in each country language by referring to a database based on the language of each country among the plurality of authority heading databases. A plurality of authority head extractors configured to determine and extract the authority head; A plurality of search units that perform a search in a database based on each country language of the plurality of resource databases for a search word translated into a corresponding language and authority heads in each country language from the plurality of authority head extractors; And a search result providing unit which collects search results for each language extracted by performing a search and provides summary information in a predetermined display order.

상기 복수의 검색부들은 각각, 상기 해당 언어로 번역된 검색어와 해당 언어로된 복수의 전거 표목들에 대하여, 해당 언어의 문자 배열 순서에 기초하여 검색 순위를 정하여 상기 검색 순위에 따라 하나씩 검색을 수행하고, 검색 수행 시 각 검색어 또는 전거 표목을 포함하는 리소스들 중 상기 각 검색어 또는 전거 표목의 빈도수가 적어도 한번 이상 있는 PSI들을 추출한다.Each of the plurality of search units performs a search one by one according to the search rank by determining a search rank based on a sequence of characters of the corresponding language for a search word translated in the corresponding language and a plurality of authority headings in the corresponding language. When the search is performed, PSIs having a frequency of at least one search term or authority head are extracted from resources including each search term or authority head.

상기 복수의 전거 표목 데이터베이스들은 각각, 인명, 지명, 다른 고유명사, 보통명사, 형용사/부사, 또는 동사를 포함하는 단어 형태에 따라 해당 전거 표목을 데이터베이스화한 것을 특징으로 한다.The plurality of authority heading databases are characterized in that the authority headings are databased according to word forms including personal names, place names, other proper nouns, common nouns, adjectives / adverbs, or verbs.

상기 온톨로지 기반 의미 검색 시스템은, 화면에 다수 검색어의 논리 조합(AND 또는 OR를 포함)을 입력하도록 검색어 입력창을 제공하는 사용자 인터페이스를 더 포함하고, 상기 다국어 번역기는 상기 다수 검색어 모두에 대하여 번역을 수행하여 각 검색어에 대한 각 나라 언어로 번역된 복수의 검색어들을 생성하며, 상기 복수의 검색부들은 각각 해당 언어로 번역된 복수 검색어들과 상기 복수의 전거 표목 추출부들로부터의 상기 다수 검색어들에 대응되는 각 전거 표목에 대하여 상기 복수의 리소스 데이터베이스들 중 각 나라 언어에 기초한 데이터베이스에서 검색을 수행할 수 있다.The ontology-based semantic search system further includes a user interface for providing a search term input window to input a logical combination (including AND or OR) of a plurality of search terms on a screen, and the multilingual translator performs translation for all of the plurality of search terms. And generate a plurality of search words translated in each country language for each search word, wherein the plurality of search parts correspond to the plurality of search words translated in a corresponding language and the plurality of search words from the plurality of authority head extractors, respectively. For each authorized heading, a search may be performed in a database based on the language of each of the plurality of resource databases.

상기 복수의 검색부들은 각각, 상기 해당 언어로 번역된 복수 검색어들과 상기 복수 검색어들 각각에 대응되는 해당 언어로된 복수의 전거 표목들에 대하여, 해당 언어의 문자 배열 순서에 기초하여 검색 순위를 정하여 상기 검색 순위에 따라 하나씩 검색을 수행하고, 검색 수행 시 상기 논리 조합으로 입력된 다수 검색어에 대하여 각 검색어 또는 전거 표목을 포함하는 리소스들 중 상기 논리 조합을 만족시키면서 상기 각 검색어 또는 전거 표목의 빈도수가 적어도 한번 이상 있는 PSI들을 추출할 수 있다.The plurality of search units respectively search the plurality of search terms translated in the corresponding language and a plurality of authority headings in the corresponding language corresponding to each of the plurality of search terms, based on the order of character arrangement of the corresponding language. A frequency of each of the search terms or authority headings while satisfying the logical combinations among resources including each search term or authority headings for a plurality of search terms inputted to the logical combinations when performing the search. PSI may be extracted at least once.

상기 사용자 인터페이스는 상기 다수 검색어에 대한 가중치 설정창을 제공하고, 상기 검색 결과 제공부는 상기 가중치 설정창에 설정된 가중치 순서에 따라 검색 결과를 화면에 표시하도록 상기 사용자 인터페이스를 제어할 수 있다.The user interface may provide a weight setting window for the plurality of search terms, and the search result providing unit may control the user interface to display search results on the screen according to the weight order set in the weight setting window.

상기 사용자 인터페이스는 검색 결과 화면에 보기 단계 설정창을 제공하고, 상기 검색 결과 제공부는 상기 보기 단계 설정창에 설정된 보기 단계별로 검색 결 과에 대한 심도를 구분하여 표시하도록 상기 사용자 인터페이스를 제어할 수 있다.The user interface may provide a viewing step setting window on a search result screen, and the search result providing unit may control the user interface to classify and display the depth of the search result according to the viewing step set in the viewing step setting window.

상기 복수의 리소스 데이터베이스들은, 도서관의 도서 검색 시스템, 웹 사이트의 정보 검색 시스템, LAN으로 연결된 소규모 네트워크 또는 개인용 PC에서 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 또는 텍스트 데이터에 대한 분산된 대용량의 정보가 토픽을 중심으로 한 의미론적 연관 관계의 맵으로 연결되어 온톨로지로 구축된 자료들을 저장한 저장 수단과 연동하여 리소스들을 제공할 수 있다.The plurality of resource databases are distributed large capacity for document files, image files, video files, database information, or text data in a small network or personal PC connected to a library book retrieval system, website information retrieval system, LAN Information can be linked to a map of semantic relationships around topics to provide resources in conjunction with storage means that store ontologies.

그리고, 본 발명의 다른 일면에 따른, 온톨로지 기반 의미 검색 방법은, 각 나라 언어로된 복수의 단어들에 대하여 단어 형태별로 전거 표목을 데이터베이스화하는 단계; 각 나라 언어에 따라 토픽맵 구조에 기초하여 리소스들을 온톨로지로 구축하여 데이터베이스화하는 단계; 입력된 검색어에 대하여 복수의 국가들의 각 나라 언어로 번역된 복수의 검색어들을 생성하는 단계; 상기 번역된 복수의 검색어들 중 각 나라 언어로된 검색어를 인식하여 수신하는 단계; 각 나라 언어로된 검색어에 대하여 상기 데이터베이스화된 전거 표목을 참조하여 상기 각 나라 언어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출하는 단계; 해당 언어로 번역된 검색어와 각 나라 언어로된 전거 표목에 대하여 상기 데이터베이스화된 리소스들에서 검색을 수행하는 단계; 및 상기 검색을 수행하여 추출한 각 언어별 검색 결과들을 취합하여 미리 정한 표시 순서에 따라 요약 정보를 제공하는 단계를 포함한다.The ontology-based semantic retrieval method according to another aspect of the present invention comprises the steps of: database a authority heading for each word type for a plurality of words in each language; Constructing and databasening resources as ontology based on a topic map structure according to each language; Generating a plurality of search words translated in each country language of the plurality of countries with respect to the input search word; Recognizing and receiving a search word in each language among the translated plurality of search words; Determining whether there is an authority heading corresponding to the search term in each country language by extracting the authority heading with reference to the database of authority headings for the search term in each country language; Performing a search on the database resources for a search term translated in a corresponding language and authority headings in each language; And collecting search results for each language extracted by performing the search and providing summary information in a predetermined display order.

본 발명에 따른 온톨로지 기반 의미 검색 시스템 및 방법에 따르면, 토픽맵 구조에 기초한 온톨로지로 구축된 리소스 데이터베이스에 대하여 의미 검색을 수행함으로써, 풍부하고 정확한 검색결과를 제공할 수 있다.According to the ontology-based semantic search system and method according to the present invention, a rich and accurate search result can be provided by performing a semantic search on a resource database constructed with an ontology based on a topic map structure.

또한, 본 발명에 따른 온톨로지 기반 의미 검색 시스템 및 방법에 따르면, 어떠한 언어로 검색어가 입력되더라도 자동으로 다국어로 번역하여 각국의 언어로 검색을 기동하되, 보다 사용자 의도에 맞는 정확한 검색을 위하여 번역된 각국의 언어에 대한 전거 표목을 추출하여 각 전거 표목별로 검색을 기동하고 취합하여 각 전거 표목에 대하여 일치도 또는 빈도수가 높은 해당 검색 결과를 제공함으로써, 의미 검색을 실현할 수 있다.In addition, according to the ontology-based semantic search system and method according to the present invention, even if a search word in any language is automatically translated into a multi-language to start the search in the language of each country, the translated country for more accurate search for the user's intention The semantic search can be realized by extracting authority headings for the language, starting and collecting the search for each authority heading, and providing the corresponding search results with high agreement or frequency for each authority heading.

그리고, 본 발명에 따른 온톨로지 기반 의미 검색 시스템 및 방법에 따르면, 검색어의 다수 조합으로 검색 조건을 주어 검색할 수 있는 검색 화면의 표시창에서 각 검색어에 가중치를 줌으로써 검색 결과의 표시 순위를 정할 수 있으며, 검색 결과 화면에서는 보기 단계별로 정보의 심도를 구분하여 제공할 수 있다.In addition, according to the ontology-based semantic search system and method according to the present invention, the display rank of the search results can be determined by giving a weight to each search word in a display window of a search screen that can be searched by giving a search condition in multiple combinations of search terms. In the search result screen, the depth of information may be classified and provided for each viewing step.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. In order to fully understand the present invention, the operational advantages of the present invention, and the objects achieved by the practice of the present invention, reference should be made to the accompanying drawings which illustrate preferred embodiments of the present invention and the contents described in the accompanying drawings.

이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일실시예에 따른 온톨로지 기반 의미 검색 시스템(100)을 설명하기 위한 도면이다. 도 1을 참조하면, 본 발명의 일실시예에 따른 온톨로지 기반 의미 검색 시스템(100)은, 다국어 번역기(110), 복수의 언어 인식부들(120, 130, 140), 복수의 검색 엔진들(150, 160, 170), 복수의 전거 표목 데이터베이스들(152, 162, 172), 복수의 리소스 데이터베이스들(154, 164, 174) 및 검색 결과 제공부(180)를 포함하고, 복수의 검색 엔진들(150, 160, 170)은 각각 구비된 복수의 전거 표목 추출부들(151, 161, 171) 중 해당 언어에 대한 전거 표목을 추출하는 전거 표목 추출부(151/161/171) 및 구비된 복수의 PSI 검색부들(153, 163, 173) 중 해당 언어에 대하여 검색을 수행하는PSI 검색부(153/163/173)를 포함한다. 여기서, 복수의 언어 인식부들(120, 130, 140), 복수의 검색 엔진들(150, 160, 170), 복수의 전거 표목 데이터베이스들(152, 162, 172), 및 복수의 리소스 데이터베이스들(154, 164, 174)은 한국어, 영어, 일어에 대한 의미 검색을 수행하기 위하여 각각 3세트로 구성된 것으로 도시하였으나, 이에 한정되지 않으며, 더 많은 언어에 대한 유사한 처리를 위하여 유사한 각 세트의 구성 요소가 더 구비될 수 있다. 이와 같은 온톨로지 기반 의미 검색 시스템(100)의 전반적인 구성 요소들은 컴퓨터에서 인식될 수 있는 소프트웨어, 하드웨어, 또는 이들의 결합에 의하여 실현될 수 있다. 1 is a diagram illustrating an ontology-based semantic search system 100 according to an embodiment of the present invention. Referring to FIG. 1, the ontology-based semantic retrieval system 100 according to an embodiment of the present invention may include a multilingual translator 110, a plurality of language recognition units 120, 130, and 140, and a plurality of search engines 150. , 160, 170, a plurality of authority heading databases 152, 162, 172, a plurality of resource databases 154, 164, 174, and a search result provider 180, and a plurality of search engines ( 150, 160, and 170 are authorized head extracting units 151/161/171 for extracting authority heads for a corresponding language among the plurality of authorized head extracting units 151, 161, and 171, respectively, and a plurality of provided PSIs. The PSI search unit 153/163/173 performs a search for a corresponding language among the search units 153, 163, and 173. Here, a plurality of language recognizers 120, 130, 140, a plurality of search engines 150, 160, 170, a plurality of authority heading databases 152, 162, 172, and a plurality of resource databases 154 , 164, and 174 are shown as being composed of three sets each to perform a semantic search for Korean, English, and Japanese, but the present invention is not limited thereto, and similar sets of components may be added for similar processing for more languages. It may be provided. The overall components of the ontology-based semantic retrieval system 100 may be realized by software, hardware, or a combination thereof that can be recognized by a computer.

온톨로지 기반 의미 검색 시스템(100)의 동작 설명을 위하여 도 2의 개념도를 참조하여 설명한다.The operation of the ontology-based semantic search system 100 will be described with reference to the conceptual diagram of FIG. 2.

다국어 번역기(110)는 입력된 검색어에 대하여 복수의 국가들의 각 나라 언어로 번역된 복수의 검색어들을 생성한다. 사용자 인터페이스의 동작에 따라 개인 용 PC(Personal Computer)와 같은 컴퓨터 화면에는 검색어 입력창이 제공될 수 있으며, 사용자는 화면에 제공된 검색어 입력창에 검색어를 입력할 수 있다(S210). 이에 따라 검색 엔진들(150, 160, 170)이 각 국의 언어별로 전거 검색을 시작하기 전에, 다국어 번역기(110)는 입력된 검색어를 한국어, 영어, 일어, 중국어, 스페인어,..등 미리 구축된 시스템 환경에 따라 각 나라 언어로 번역하고, 번역으로 생성한 복수의 검색어들을 출력한다(S220). 여기서, 다국어 번역기(110)는 사용자가 입력한 검색어와 같은 언어로 번역하는 구성을 포함할 수 있고, 이에 따라 사용자가 입력한 검색어와 실질적으로 같은 단어나 구 등도 다른 언어로 번역된 검색어들과 함께 번역된 검색어로서 출력될 수 있다. 이때 번역의 수행을 위하여 각 나라별 사전에 대한 데이터베이스를 이용할 수 있다. The multi-language translator 110 generates a plurality of search words translated in each country language of the plurality of countries with respect to the input search word. According to the operation of the user interface, a search term input window may be provided on a computer screen such as a personal computer, and the user may input a search term in a search term input window provided on the screen (S210). Accordingly, before the search engines 150, 160, and 170 start authority search for each language, the multilingual translator 110 constructs the inputted search word into Korean, English, Japanese, Chinese, Spanish, .. According to the system environment has been translated into each language, and outputs a plurality of search terms generated by the translation (S220). Here, the multilingual translator 110 may include a configuration for translating to the same language as the search word input by the user. Accordingly, a word or phrase that is substantially the same as the search term input by the user is also included with the search terms translated into another language. It may be output as a translated search term. At this time, a database of dictionaries for each country may be used to perform the translation.

복수의 언어 인식부들(120, 130, 140)은 각각이 다국어 번역기(110)에서 번역된 복수의 검색어들 중 해당 언어로된 검색어를 인식하여 수신할 수 있다(S230). 예를 들어, 한국어 인식부(120)는 다국어 번역기(110)에서 번역된 복수의 검색어들 중 한국어로된 검색어를 인식하여 받아들일 수 있다. 또한, 영어 인식부(120)는 다국어 번역기(110)에서 번역된 복수의 검색어들 중 영어로된 검색어를, 그리고, 일어 인식부(120)는 다국어 번역기(110)에서 번역된 복수의 검색어들 중 일어로된 검색어를 인식하여 받아들일 수 있다.The plurality of language recognition units 120, 130, and 140 may each recognize and receive a search word in a corresponding language among the plurality of search words translated by the multilingual translator 110 (S230). For example, the Korean recognizer 120 may recognize and accept a Korean search word among a plurality of search words translated by the multilingual translator 110. Also, the English recognizer 120 may search for an English search term among the plurality of search words translated by the multilingual translator 110, and the Japanese recognizer 120 may search for among the plurality of search words translated by the multilingual translator 110. Recognize and accept Japanese search terms.

복수의 전거 표목 추출부들(151, 161, 171)은 각각이 복수의 언어 인식부들(120/130/140)로부터의 해당 언어로된 검색어에 대하여 복수의 전거 표목 데이터베이스들(152/162/172) 중 해당 언어에 기초한 데이터베이스를 참조하여 각 나라 언어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출할 수 있다(S240). 예를 들어, 한국어 전거 표목 추출부(151)는 한국어 인식부(120)로부터의 한국어로된 검색어에 대하여 한국어 전거 표목 데이터베이스(152)를 참조하여 해당 한국어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출할 수 있다. 영어 전거 표목 추출부(161)는 영어 인식부(130)로부터의 영어로된 검색어에 대하여 영어 전거 표목 데이터베이스(162)를 참조하여 해당 영어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출하며, 그리고, 일어 전거 표목 추출부(171)는 일어 인식부(140)로부터의 일어로된 검색어에 대하여 일어 전거 표목 데이터베이스(172)를 참조하여 해당 일어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출할 수 있다. The plurality of authority head extracting units 151, 161, and 171 may include a plurality of authority head databases (152/162/172), respectively, for a search word in a corresponding language from the plurality of language recognition units 120/130/140. By referring to the database based on the language, it is possible to determine whether there is an authority heading corresponding to a search word in each language and extract the authority heading (S240). For example, the Korean authority heading extractor 151 refers to the Korean authority heading database 152 for a search word in Korean from the Korean recognition unit 120, and whether there is an authority head corresponding to the corresponding search word in Korean. Can be determined and the authorized heading can be extracted. The English authority head extractor 161 refers to the English authority heading database 162 with respect to English words from the English recognition unit 130 and determines whether there is an authority head corresponding to the corresponding English search word. Extracting the authority heading, and the Japanese authority heading extraction unit 171 refers to the Japanese authority heading database 172 with respect to the Japanese search word from the Japanese recognition unit 140, and the authority corresponding to the corresponding Japanese search word. The presence of a heading can be determined and the authority heading can be extracted.

복수의 전거 표목 데이터베이스들(152, 162, 172) 각각은 해당 언어로된 복수의 단어들에 대하여 단어 형태별로 전거 표목(authority heading)을 저장하고 관리한다. 예를 들어, 도 3과 같이, 한국어로 번역된 검색어 '다빈치'에 대하여 '다빈치'와 동일한 사람으로 지칭될 수 있는 '레오나르도'가 전거 표목으로 관리될 수 있다. 마찬가지로, 다국어 번역기(110)에서 각국의 언어로 번역된 검색어들 'Da Vinci', 'ダヴィンチ', '?芬奇' 에 대하여는 각국에서 동일한 사람으로 지칭될 수 있는 'Leonardo', 'レオナルド', '雷?那多' 가 각각의 해당 데이터베이스에서 전거 표목으로 관리될 수 있다. Each of the authority heading databases 152, 162, and 172 stores and manages authority heading for each word type for a plurality of words in a corresponding language. For example, as illustrated in FIG. 3, 'Lonardo', which may be referred to as the same person as 'DaVinci', may be managed as an authority heading for the searched word “DaVinci” translated into Korean. Similarly, in terms of the words 'Da Vinci', 'ダ ヴ ィ ン チ', '? 번역' translated in the languages of the multilingual translator 110, 'Leonardo', 'レ オ ナ ル ド', '雷? 那 多' can be managed as an authority heading in each corresponding database.

이외에도, 한국어에 대하여 다른 전거 표목의 예를 들면, '이광수'는 '춘원' 과 매칭되고, 'KBS'는 '한국방송공사'와 매칭될 수 있다. 이와 같은 전거 표목은 시소러스 사전과는 구별되는 것으로서, 인명(예를 들어, 김홍도:단원), 지명(예를 들어, 서울:한양), 다른 고유명사(예를 들어, 양쯔강:양자강), 보통명사(예를 들어, 국어:한글), 형용사/부사(예를 들어, 멋있다:훌륭하다), 또는 동사(예를 들어, 걷다: 구보하다)를 포함하는 각각의 단어 형태에 따라 해당 전거 표목이 데이터베이스화되어 관리될 수 있고, 본 발명에서는 각각의 전거 표목이 새로운 검색어가 되어 각 표목별로 검색이 기동되어 검색결과가 추출되도록 하고자 하였다. 시소러스 사전을 참조하여 검색하는 기존 방식에서는 각각의 시소러스 단어에 대하여 별도의 검색을 기동하지 않으며 검색 대상 리소스와의 일치도 비교 시에 상관 정도의 판단에 활용하고 있을 뿐이다. In addition, as an example of other authority headings for Korean, 'Lee Kwang-soo' can be matched with 'Chunwon' and 'KBS' can be matched with 'Korea Broadcasting Corporation'. These headings are distinct from thesaurus and include names (eg, Kim Hong-do: unit), names (eg, Seoul: Hanyang), other proper nouns (eg, Yangtze: Yangzigang), common nouns. Depending on each word type, including for example Korean (Korean), adjectives / adverbs (for example, cool: excellent), or verbs (for example, walk: save) In the present invention, each authority heading is a new search word, and a search is started for each heading to extract a search result. The existing method of searching by referring to thesaurus dictionary does not start a separate search for each thesaurus word, but only utilizes it in determining the degree of correlation when comparing the match with the resource to be searched.

한편, 복수의 PSI 검색부들(153, 163, 173) 각각은, 해당 언어로 번역된 검색어와 복수의 전거 표목 추출부들(151, 161, 171)로부터의 해당 언어로된 전거 표목에 대하여 복수의 리소스 데이터베이스들(154, 164, 174) 중 해당 언어에 기초한 데이터베이스에서 검색을 수행한다(S250). 예를 들어, 한국어 PSI 검색부(153)는, 한국어로 번역된 검색어와 한국어 전거 표목 추출부(151)로부터의 한국어로된 전거 표목에 대하여 한국어 리소스 데이터베이스(154)에서 검색을 수행한다. 또한, 영어 PSI 검색부(164)는 영어로 번역된 검색어와 영어 전거 표목 추출부(161)로부터의 영어로된 전거 표목에 대하여 영어 리소스 데이터베이스(164)에서 검색을 수행하고, 그리고, 일어 PSI 검색부(174)는 일어로 번역된 검색어와 일어 전거 표목 추출부(171)로부터의 일어로된 전거 표목에 대하여 일어 리소스 데이터베이스(174)에서 검색을 수행한다. Meanwhile, each of the plurality of PSI search units 153, 163, and 173 includes a plurality of resources for a search word translated in a corresponding language and authority heads in a corresponding language from the plurality of authority head extracting units 151, 161, and 171. A search is performed in a database based on the corresponding language among the databases 154, 164, and 174 (S250). For example, the Korean PSI search unit 153 performs a search in the Korean resource database 154 for a search word translated into Korean and an authority heading in Korean from the Korean authority heading extraction unit 151. In addition, the English PSI search unit 164 performs a search in the English resource database 164 for a search word translated in English and an authorized authority heading in English from the English authority head extracting unit 161, and the Japanese PSI search. The unit 174 performs a search in the Japanese resource database 174 for the Japanese translation of the search word and the Japanese authority head from the Japanese authority head extracting unit 171.

복수의 리소스 데이터베이스들(154, 164, 174) 각각은 해당 언어에 따라 토픽맵 구조에 기초하여 온톨로지로 구축된 리소스들(resource)을 저장하고 관리한다. 복수의 리소스 데이터베이스들(154, 164, 174)은 도서관의 도서 검색 시스템, 웹(web) 사이트의 정보 검색 시스템, LAN(Local Area Network)으로 연결된 소규모 네트워크 또는 개인용 PC(Personal Computer)에서 자료들을 저장한 저장 장치와 연동하여 다양한 리수스들을 제공할 수 있다. 특히, 이러한 저장 장치에는 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 또는 텍스트 데이터에 대한 분산된 대용량의 정보가 저장되어 관리될 수 있고, 이러한 정보는 의미 검색을 통하여 보다 사용자에게 정확하고 풍부한 정보 제공을 위하여 토픽을 중심으로 한 의미론적 연관 관계의 맵(map)(토픽맵)으로 연결되어 온톨로지로 구축된 정보일 수 있다.Each of the plurality of resource databases 154, 164, and 174 stores and manages resources constructed ontologies based on a topic map structure according to a corresponding language. Multiple resource databases 154, 164, 174 store data in a library's book retrieval system, a web site information retrieval system, a small network connected to a local area network (LAN), or a personal computer (PC). Various resources can be provided in conjunction with one storage device. In particular, such a storage device may store and manage a large amount of distributed information about a document file, an image file, a video file, database information, or text data, and the information is more accurate and rich to the user through semantic search. For the purpose of providing, it may be information constructed by ontology connected to a map (topic map) of semantic relations centered on a topic.

이와 같은 토픽맵 온톨로지를 위한 토픽맵 요소들에는 토픽(topic) 타입, 어소시에이션(association:연관 관계) 타입, 어소시에이션 롤(role:역할) 타입, 어커런스(occurrence: 자원 또는 리소스) 타입, PSI(Published Subject Identifier : 공적 주제 지시자) 입력 요소 및 커넥션(connection) 라인(연결선) 등이 포함될 수 있다.Topic map elements for a topic map ontology include a topic type, an association type, an association role type, an occurrence type, an occurrence type, and a published subject. Identifier: public subject indicator) may include input elements and connection lines (connection lines).

토픽맵 온톨로지에서 토픽 타입은 원형으로 표현될 수 있으며, 원형 안에 토픽 타입의 이름이 입력될 수 있다. 토픽은 도 4내지 도 6과 같이, 'composer(작곡가)', 'opera(오페라)', 'musician(음악가)' 등 토픽을 범주화 하는 추상적 개념이 며, 사람, 엔티티, 의미 등 'thing' 이나 서브젝트(subject)로 될 수 있는 어떤 주제의 단어나 구로도 가능하다. In the topic map ontology, the topic type may be represented in a circle, and the name of the topic type may be entered in the circle. Topics are abstract concepts that categorize topics such as 'composer', 'opera', and 'musician', as shown in FIGS. It can be any word or phrase on any subject that can be a subject.

어소시에이션 타입은, 마름모 또는 다이아몬드 형태로 표현되며, 그 안에 어소시에이션 타입의 이름이 입력될 수 있다. 도 4및 도 5와 같이, 어소시에이션 타입은 그 모서리에 토픽 타입들이 커넥션 라인에 의하여 연결되도록 하여 토픽 타입들간의 상호 연관 관계를 명시한다. 연관 관계는 토픽 타입 간의 상하 관계뿐만 아니라 다양한 의미적 관계성을 나타낸다. The association type is represented in the form of a rhombus or diamond, and the name of the association type may be entered therein. As with Figs. 4 and 5, the association type specifies the correlation between the topic types by causing the topic types to be connected by connection lines at the corners. Association relationships represent various semantic relationships as well as vertical relationships between topic types.

어소시에이션 타입에서 토픽 타입으로의 연결 시에 삼각형 모양의 어소시에이션 롤 타입이 설정되는 데, 어소시에이션 타입이 작용하는 역할을 나타내기 위하여 삼각형 안에 해당 롤 타입의 이름과 괄호 안에 레이블(lable) 내용이 삽입되어 정확한 의미 전달에 도움을 준다. 도 4및 도 5와 같이, 커넥션 라인의 화살표는 토픽 간의 의미 전달의 방향을 뜻한다. 예를 들어, 도 4 및 도 5에서, 'composer'와 'opera' 간에는 'composed by'의 연관 관계가 있고, 'composer'는 작곡된(composed by) 'work(작품)', 즉, 'opera'를 포함하는 관계이며, 'opera'는 작곡하는(composed) 'composer'를 포함하는 관계를 나타낸다. When connecting the association type to the topic type, the triangular association roll type is set.In order to show the role of the association type, the name of the roll type in the triangle and the label content in the parentheses are inserted. Help to convey meaning As shown in Figs. 4 and 5, the arrow of the connection line indicates the direction of meaning transfer between topics. For example, in FIGS. 4 and 5, there is an association of 'composed by' between 'composer' and 'opera', and 'composer' is composed by 'work', that is, 'opera' ', And' opera 'refers to the relationship including the' composer '(composed).

어커런스 타입은 육각형 모양으로 표현되며, 그 안에 어커런스 타입의 이름이 입력될 수 있다. 어커런스는 토픽과 관련된 내부 자원 또는 외부 리소스로서, 어커런스 자원의 형식은 'string', 'number', 'date', 'URI(Uniform Resource Identifier)', 'URL(Uniform Resource Locator)' 등의 데이터 타입을 포함할 수 있다. 예를 들어, 어커런스 데이터 타입은URI로 토픽맵 외부에 있는 리소스의 위치를 가리킬 수도 있고, 토픽이 참조할 수 있는 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 내 정보, 텍스트 데이터 등 다양한 형태를 가질 수 있다. 이때, 한 토픽에 대한 모든 어커런스는 토픽에 의해 표현되는 모든 속성을 공유하게 된다. 도 6와 같이, 토픽 타입에 포함되는 어커런스 타입들은 커넥션 라인 중 점선으로 연결될 수 있다.The occurrence type is represented by a hexagon, and the name of the occurrence type can be entered therein. An occurrence is an internal or external resource associated with the topic, and the occurrence resource has a data type such as 'string', 'number', 'date', 'Uniform Resource Identifier' (URI), or 'Uniform Resource Locator' (URL). It may include. For example, the occurrence data type can be a URI that points to the location of a resource outside the topic map, and can take various forms, such as document files, image files, video files, information in a database, or text data that a topic can reference. have. At this time, all occurrences for a topic share all attributes represented by the topic. As shown in FIG. 6, occurrence types included in a topic type may be connected by a dotted line among the connection lines.

위와 같은 토픽맵 온톨로지 상의 토픽 타입, 어소시에이션 타입, 어소시에이션 롤 타입, 및 어커런스 타입 각각에는 PSI(Published Subject Identifier: 공적 주제 지시자)가 기술될 수 있는데, PSI 입력 요소는 실선으로 표현되며, 그 실선 끝 지점에는 'URI'나 'URL' 등으로 공적 주제 지시자를 정의하여 주제를 공유할 수 있도록 한다. 검색 엔진에서는 PSI 정보로부터 토픽의 유일 값을 해석 할 수 있다. Each of the topic type, association type, association role type, and occurrence type on the topic map ontology can be described with a published subject identifier (PSI). The PSI input element is represented by a solid line, and the solid end point For example, public topic indicators can be defined as 'URI' or 'URL' to share the topic. Search engines can interpret the unique value of a topic from PSI information.

이와 같이 개인 컴퓨터에 관리되는 정보나 인터넷 등 네트워크 상에서 공유되는 정보 등 사용자가 접근할 수 있는 각종 정보는 RDF, RDFS, OWL 등의 기반으로도 온톨로지가 구축될 수도 있으며, 이에 따라 의미가 부여된 리소스들의 검색이나 네비게이션(navigation)이 자유롭고 용이하며 효율적인 정보 검색이 가능하도록 한다. As such, the ontology may be built on the basis of RDF, RDFS, OWL, etc. for various types of information accessible to the user, such as information managed on a personal computer or information shared on a network such as the Internet. Their search or navigation is free, easy and efficient.

리소스 데이터베이스들(154, 164, 174)은 이와 같이 토픽맵 온톨로지로 구축된 리소스들을 관리하며, 이러한 리소스 기반 하에 복수의 PSI 검색부들(153, 163, 173) 각각은, 해당 언어로 번역된 검색어와 해당 언어로된 복수의 전거 표목들에 대하여, 각각의 검색을 기동하여 의미 검색을 수행하게 된다. The resource databases 154, 164, and 174 manage resources constructed using the topic map ontology. Each of the plurality of PSI search units 153, 163, and 173 is based on a search word translated into a corresponding language. For a plurality of authority headings in the language, each search is started to perform a semantic search.

PSI 검색부들(153, 163, 173)은 해당 언어의 문자 배열 순서에 기초하여 검 색 순위를 정하여 해당 검색 순위에 따라 하나씩 검색을 수행할 수 있으며, 검색 수행 시 각 검색어 또는 전거 표목을 포함하는 리소스들 중 해당 각 검색어 또는 전거 표목의 빈도수가 적어도 한번 이상 있는 PSI들을 추출할 수 있다. The PSI search units 153, 163, and 173 may search based on the order of character arrangement of the language and perform one search according to the search rank. Among these, PSI having at least one frequency of each search word or authorized heading may be extracted.

예를 들어, 한국어 PSI 검색부(153)는 해당 언어로 번역된 검색어와 해당 언어로된 복수의 전거 표목들이, 도 3과 같이, '다빈치', '레오나르도'인 경우에, 국어의 문자 배열 순서(가나다.. 순서 또는 아야어여..순서)에 따라 '다빈치'에 대하여 먼저 검색을 수행하여 해당 단어의 빈도수가 있는 리소스에 대한 PSI를 추출하고, 다음에, 같은 방법으로 '레오나르도'에 대하여 검색을 수행하여 해당 단어의 빈도수가 있는 리소스에 대한 PSI를 추출할 수 있다. 리소스들에 관련 단어가 없는 경우에는 유사 단어가 나오는 리소스를 검색하거나 관련 단어가 존재하는 리소스가 너무 많은 경우에는 검색 결과의 수를 제한 하는 것도 가능하다. 마찬가지로, 영어 PSI 검색부(163) 및 일어 PSI 검색부(173)는 해당 언어의 문자 배열 순서에 따라 번역된 검색어와 해당 전거 표목들에 대하여 위와 유사한 방법으로 검색을 수행할 수 있다. For example, the Korean PSI search unit 153 may be a sequence of characters arranged in Korean when a search word translated in a corresponding language and a plurality of authority headings in a corresponding language are “Da Vinci” or “Leonardo” as shown in FIG. 3. Search for 'DaVinci' first, according to (Ganada. Or order), then extract the PSI for the resource with the frequency of the word, and then search for 'Leonardo' in the same way. PSI can be extracted for a resource having a frequency of the corresponding word. If there are no related words in the resources, it is possible to search for a resource with similar words or limit the number of search results if there are too many resources with related words. Similarly, the English PSI searcher 163 and the Japanese PSI searcher 173 may perform a search on the translated search word and the corresponding authority headings in a similar manner as above.

검색 결과 제공부(180)는 위와 같이 복수의 PSI 검색부들(153, 163, 173)이 검색을 수행하여 추출한 각 언어별 검색 결과들을 취합하여(S260) 미리 정한 표시 순서에 따라 요약 정보를 제공할 수 있다(S270). 도 7과 같이, 검색 결과 제공부(180)는 미리 정한 언어 순서, 예를 들어, 한국어, 영어, 일어, 중국어 순서로 해당 언어에 대한 검색 결과들을 문자 배열 순서에 따라 제목과 해당 요약을 제공할 수 있다. 각 언어에 대하여는 검색어 또는 해당 번역어에 대한 검색 결과를 상 위에 제공하고 그 밑으로 해당 전거 표목에 대한 검색결과를 제공할 수 있다. The search result providing unit 180 collects the search results for each language extracted by the plurality of PSI search units 153, 163, and 173 as described above (S260) to provide summary information according to a predetermined display order. It may be (S270). As shown in FIG. 7, the search result providing unit 180 may provide a title and a corresponding summary of search results for a corresponding language in a predetermined language order, for example, Korean, English, Japanese, and Chinese order according to a character arrangement order. Can be. For each language, the search results for the search word or the corresponding translation can be provided above and the search results for the authority heading below.

또한, 본 발명에서는 소정의 사용자 인터페이스를 통하여 도 8또는 도 9와 같이, 화면에 다수 검색어의 논리 조합(AND 또는 OR를 포함)을 입력하도록 검색어 입력창을 제공하는 것이 가능하다. 도 8 또는 도 9에는 2개의 검색어를 입력하는 일례를 도시하였으나, 더 많은 검색어의 논리 조합이 가능하며 사용자는 검색어 입력창에 다수의 검색어들을 입력하여 더욱 더 정확한 정보 검색 결과를 얻기 위하여 검색을 시도할 수 있다. In addition, according to the present invention, it is possible to provide a search word input window to input a logical combination (including AND or OR) of a plurality of search words on a screen as shown in FIG. 8 or 9 through a predetermined user interface. 8 or 9 illustrates an example of inputting two search terms, more logical combinations of search terms are possible, and the user attempts to search for more accurate information search results by inputting a plurality of search terms in the search term input window. can do.

이와 같은 논리 조합 방식의 다수 검색어가 입력되는 경우에, 다국어 번역기(110)는 입력된 다수 검색어 모두에 대하여 번역을 수행하여 각 검색어에 대한 각 나라 언어로 번역된 복수의 검색어들을 생성할 수 있다. 이에 따라, 복수의 PSI 검색부들(153, 163, 173)은 각각 해당 언어로 번역된 복수 검색어들과 복수의 전거 표목 추출부들(151, 161, 171)로부터의 상기 다수 검색어들에 대응되는 각 전거 표목에 대하여 복수의 리소스 데이터베이스들(154, 164, 174) 중 해당 언어에 기초한 데이터베이스에서 검색을 수행할 수 있다. When a plurality of search terms of the logical combination method are input, the multilingual translator 110 may perform a translation on all of the input plurality of search terms to generate a plurality of search words translated in each language for each search term. Accordingly, the plurality of PSI search units 153, 163, and 173 may be authorized for each of the plurality of search words translated in a corresponding language and the plurality of search terms from the plurality of authority head extracting units 151, 161, and 171, respectively. The heading may be searched in a database based on a corresponding language among the plurality of resource databases 154, 164, and 174.

이때, 복수의 PSI 검색부들(153, 163, 173)은 각각, 논리 조합 방식의 다수 검색어에 대하여 해당 언어로 번역된 복수 검색어들과 상기 번역된 복수 검색어들 각각에 대응되는 해당 언어로된 복수의 전거 표목들에 대하여, 위에서도 기술한 바와 같이 해당 언어의 문자 배열 순서에 기초하여 검색 순위를 정하여 해당 검색 순위에 따라 하나씩 검색을 수행해 나간다. 다만, 해당 번역된 복수 검색어들과 해당 전거 표목들에 대한 각각의 검색 수행으로 추출한 각각의 리소스에 대하여, 해당 논리 조합(AND 또는 OR 등)을 만족시키면서, 해당 번역된 복수 검색어들과 해당 전거 표목들의 빈도수가 적어도 한번 이상 있는 PSI들을 추출할 수 있다.In this case, each of the plurality of PSI search units 153, 163, and 173 may include a plurality of search words translated into a corresponding language for a plurality of search terms in a logical combination method and a plurality of search words in a corresponding language corresponding to each of the translated plurality of search words. As described above, the authority headings are searched based on the order of character arrangement of the language, and searched one by one according to the corresponding search rank. However, for each resource extracted by performing the respective search on the corresponding translated multiple search terms and corresponding authority headings, while satisfying the corresponding logical combination (such as AND or OR), the corresponding translated multiple search terms and corresponding authority headings PSIs having frequencies of at least one can be extracted.

예를 들어, 도 8 또는 도 9와 같이 '시크릿'과 '다빈치코드'를 논리합(OR)으로 하여 검색을 하는 경우에, 한국어 PSI 검색부(153)는 검색어 '시크릿'과 그에 대한 전거표목 'A'(구축된 전거 표목이 A라고 가정함), '다빈치코드'와 그에 대한 전거표목'B'(구축된 전거 표목이 B라고 가정함) 각각에 대하여 해당 검색 순위에 따라 하나씩 검색을 수행할 수 있다. 이때, 한국어 PSI 검색부(153)는 '다빈치코드', '시크릿', 전거표목 'A', 전거표목'B' 등이 논리합으로 적어도 한번 이상 빈도수가 있는 리소스의 PSI들을 추출할 수 있다.For example, when searching with 'secret' and 'da vinci code' as OR, as shown in FIG. 8 or 9, the Korean PSI search unit 153 searches for the term 'secret' and its authority heading ' For each of "A" (assuming the authorized authority title is A) and "Davinci code" and its authorized "'B" (assuming that the authorized authority title is B), perform one search according to its search rank. Can be. In this case, the Korean PSI search unit 153 may extract PSIs of resources having a frequency of at least one or more, such that 'Da Vinci code', 'Secret', authority head 'A', authority head 'B', and the like.

도 8 또는 도 9와 같이, 상기 사용자 인터페이스는 위와 같이 논리 조합으로 입력되는 방식의 다수 검색어에 대하여 그 옆에 해당 가중치 설정창을 제공할 수도 있다. 가중치는 도 8과 같이 표시창의 바(bar) 형태의 설정 마크를 마우스로 드래그 앤 드롭(drag & drop)할 수 있도록 하거나, 도 9와 같이 숫자로 해당 퍼센트 또는 순위를 입력하여 설정될 수 있다. As illustrated in FIG. 8 or 9, the user interface may provide a corresponding weight setting window next to a plurality of search terms inputted in a logical combination as described above. The weight may be set by dragging and dropping a bar-shaped setting mark of a display window with a mouse as shown in FIG. 8, or by inputting a corresponding percentage or rank with a number as shown in FIG. 9.

이와 같이 가중치가 설정되는 경우에는, 검색 결과 제공부(180)는 위와 같은 가중치 설정창에 설정된 가중치 순서에 따라 검색 결과를 화면에 표시하도록 사용자 인터페이스를 제어할 수 있다. 예를 들어, 도 8 의 예에서, '시크릿'의 가중치가 '다빈치 코드'의 가중치보다 높은 경우에, 도 10과 같이 '시크릿'에 대한 검색 결과가 먼저 화면에 제공될 수 있다. 또는, 도 9의 예에서, '시크릿'의 가중치가 '다빈치 코드'의 가중치보다 낮은 경우에, 도 11과 같이'다빈치 코드'에 대한 검색 결과가 먼저 화면에 제공될 수 있다. 도 10 또는 도 11에 도시되지 않았지만, '시크릿' 또는 '다빈치 코드'에 대한 외국의 리소스가 있는 경우에, 각 언어별로 검색 결과가 제공될 수 있으며, 해당 전거 표목들이 있는 경우에 각 언어에 대한 해당 검색 결과들도 제공될 수 있다. When the weight is set in this way, the search result providing unit 180 may control the user interface to display the search results on the screen according to the weight order set in the weight setting window. For example, in the example of FIG. 8, when the weight of 'secret' is higher than the weight of 'davinci code', a search result for 'secret' may be first displayed on the screen as shown in FIG. 10. Alternatively, in the example of FIG. 9, when the weight of 'secret' is lower than the weight of 'davinci code', a search result for 'davinci code' may be first displayed on the screen as shown in FIG. 11. Although not shown in FIG. 10 or 11, when there is a foreign resource for 'secret' or 'davinci code', search results may be provided for each language, and if there are authorized authority headings for each language Corresponding search results may also be provided.

또한, 사용자 인터페이스는 도 12, 도 13, 도 14와 같이, 검색 결과 화면에 보기 단계 설정창을 제공할 수 있고, 검색 결과 제공부는 보기 단계 설정창에 설정된 보기 단계별로 검색 결과에 대한 심도(depth)를 구분하여 표시하도록 상기 사용자 인터페이스를 제어할 수도 있다. 예를 들어, 도서관 이용자 시스템에서 도서관에 소장하고 있는 자료의 정보를 제공하는 데 있어서, 도 12와 같이, 보기 1단계에서는, 검색 결과에 해당 서적의 제목, 저자명, 출판사, 출판년도 정도의 간단 요약 정보를 제공할 수 있다. 또는, 보기 2단계에서는, 보기 1단계의 내용을 포함하고, 그보다 상세한 정보인 도서관의 색인 정보나 현재 상태(대출중, 처리중 등) 등의 추가적인 요약 정보를 더 제공할 수 있다. 보기 3단계에서는, 보기 2단계의 내용을 포함하고, 그보다 상세한 정보인 관련 서적이나 자료들에 대한 제목, 저자명, 출판사, 출판년도 등의 추가적인 요약 정보를 더 제공할 수 있다.In addition, the user interface may provide a viewing step setting window on the search result screen as shown in FIGS. 12, 13, and 14, and the search result providing unit may set the depth of the search result in the viewing step set in the viewing step setting window. The user interface may be controlled to display separately. For example, in providing the information of the materials stored in the library in the library user system, as shown in FIG. 12, in the first step, the summary of the title, author name, publisher, and publication year of the book is included in the search result. Information can be provided. Alternatively, in the second stage, additional summary information such as the index information of the library and the current state (rental, processing, etc.), which includes the contents of the first stage, may be provided. In Example 3, additional summary information, including the content of Example 2, and more detailed information, such as the title, author name, publisher, and year of publication, may be provided.

지금까지 기술한 바와 같이, 본 발명에 따른 온톨로지 기반 의미 검색 방식에서는, 먼저, 각 나라 언어로된 복수의 단어들에 대하여 단어 형태별로 전거 표목을 데이터베이스화하고, 각 나라 언어에 따라 토픽맵 구조에 기초하여 리소스들을 온톨로지로 구축하여 데이터베이스화한다. 이와 같이 구축된 데이터베이스는 본 발명에 따른 의미 검색의 기초가 된다. As described so far, in the ontology-based semantic retrieval method according to the present invention, first, the authority headings are databased for each word type for a plurality of words in each country language, and the topic map structure according to each country language is used. On the basis of this, resources are built ontologies and databased. The database constructed as such is the basis of the semantic search according to the present invention.

검색어가 입력되면, 해당 검색어에 대하여 복수의 국가들의 각 나라 언어로 번역된 복수의 검색어들을 생성할 수 있고, 해당 번역된 복수의 검색어들 중 각 나라 언어로된 검색어를 인식하여 수신함으로써, 각 나라 언어로된 검색어에 대하여 상기 데이터베이스화된 전거 표목을 참조하여 각 나라 언어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출하게 된다. 전거 표목이 추출되면, 해당 언어로 번역된 검색어와 각 나라 언어로된 전거 표목에 대하여 상기 데이터베이스화된 리소스들에서 검색을 수행하여, 각 언어별 검색 결과들을 취합하여 미리 정한 표시 순서에 따라 요약 정보를 제공할 수 있게 된다. When a search word is input, a plurality of search words translated in each country language of a plurality of countries may be generated for the search word, and each country is recognized and received by recognizing a search word in each country language among the plurality of translated search words. It is determined whether there is an authority heading corresponding to the search word in each language by extracting the authority heading with reference to the authority heading databased for the language search word. Once the authority heading is extracted, a search is performed on the database resources for the searched word translated into the corresponding language and the authority heading in each language, and the search results for each language are collected and summarized according to a predetermined display order. Can be provided.

이상에서와 같이 도면과 명세서에서 최적 실시예가 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다. As described above, optimal embodiments have been disclosed in the drawings and the specification. Although specific terms have been used herein, they are used only for the purpose of describing the present invention and are not intended to limit the scope of the invention as defined in the claims or the claims. Therefore, those skilled in the art will understand that various modifications and equivalent other embodiments are possible from this. Therefore, the true technical protection scope of the present invention will be defined by the technical spirit of the appended claims.

도 1은 본 발명의 일실시예에 따른 온톨로지 기반 의미 검색 시스템을 설명하기 위한 도면이다.1 is a view for explaining an ontology-based semantic search system according to an embodiment of the present invention.

도 2는 도 1의 온톨로지 기반 의미 검색 시스템의 동작 설명을 위한 개념도이다.FIG. 2 is a conceptual diagram for describing an operation of the ontology-based semantic retrieval system of FIG. 1.

도 3은 전거 표목의 일례이다.3 is an example of authority headings.

도 4는 토픽 타입, 어소시에이션 타입, 어소시에이션 롤 타입, PSI 요소 등 토픽맵 구조의 일부를 나타내는 일례이다.4 is an example showing a part of a topic map structure such as a topic type, an association type, an association roll type, and a PSI element.

도 5는 토픽 타입, 어소시에이션 타입, 어소시에이션 롤 타입, PSI 요소 등 토픽맵 구조의 일부를 나타내는 다른 예이다.5 is another example showing a part of a topic map structure such as a topic type, an association type, an association roll type, and a PSI element.

도 6은 토픽 타입, 어커런스 타입, PSI 요소 등 토픽맵 구조의 일부를 나타내는 또 다른 예이다.6 is another example illustrating a part of a topic map structure such as a topic type, an occurrence type, a PSI element, and the like.

도 7은 본 발명의 일실시예에 따른 검색 결과의 일례이다.7 is an example of a search result according to an embodiment of the present invention.

도 8은 검색 조건에 가중치를 주기 위한 검색어 입력창의 일례이다.8 is an example of a search word input window for weighting a search condition.

도 9는 검색 조건에 가중치를 주기 위한 검색어 입력창의 다른예이다.9 is another example of a search word input window for weighting a search condition.

도 10은 검색어 '시크릿'에 가중치를 높게 준 경우의 검색 결과의 일례이다.10 is an example of a search result when a weight is given to the search word 'secret'.

도 11은 검색어 '다빈치코드'에 가중치를 높게 준 경우의 검색 결과의 일례이다.11 illustrates an example of a search result when a weight is given to the search term 'DaVinci code'.

도 12는 검색 결과의 보기 1단계에 대한 일례이다.12 is an example of example 1 of a search result.

도 13은 검색 결과의 보기 2단계에 대한 일례이다.FIG. 13 is an example of a step 2 example of search results. FIG.

도 14는 검색 결과의 보기 3단계에 대한 일례이다.14 is an example of three viewing examples of search results.

Claims (9)

입력된 검색어에 대하여 복수의 국가들의 각 나라 언어로 번역된 복수의 검색어들을 생성하는 다국어 번역기;A multilingual translator configured to generate a plurality of search terms translated in each country language of the plurality of countries with respect to the input search word; 각각이 상기 번역된 복수의 검색어들 중 해당 언어로된 검색어를 인식하여 수신하기 위한 복수의 언어 인식부들;A plurality of language recognition units for recognizing and receiving a search word in a corresponding language among the translated plurality of search words; 각각이 해당 언어로된 복수의 단어들에 대하여 단어 형태별로 전거 표목을 저장하고 관리하는 복수의 전거 표목 데이터베이스들;A plurality of authority heading databases for storing and managing authority headings for each word type for a plurality of words in a corresponding language; 각각이 해당 언어에 따라 토픽맵 구조에 기초하여 온톨로지로 구축된 리소스들을 저장하고 관리하는 복수의 리소스 데이터베이스들;A plurality of resource databases each storing and managing resources constructed ontologies based on a topic map structure according to a corresponding language; 각각이 상기 복수의 언어 인식부들로부터의 해당 언어로된 검색어에 대하여 상기 복수의 전거 표목 데이터베이스들 중 해당 언어에 기초한 데이터베이스를 참조하여 해당 언어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출하는 복수의 전거 표목 추출부들; For each of the search terms in the corresponding language from the plurality of language recognition units, it is determined whether there is an authority head corresponding to the search term in the corresponding language by referring to a database based on the corresponding language among the plurality of authority title databases. A plurality of authority head extraction units for extracting authority heads; 각각이 해당 언어로 번역된 검색어와 상기 복수의 전거 표목 추출부들로부터의 해당 언어로된 전거 표목에 대하여 상기 복수의 리소스 데이터베이스들 중 해당 언어에 기초한 데이터베이스에서 검색을 수행하는 복수의 검색부들; 및 A plurality of search units which perform a search in a database based on a corresponding language among the plurality of resource databases with respect to a search word translated into a corresponding language and authority heads in a corresponding language from the plurality of authority head extracting units; And 상기 복수의 검색부들이 검색을 수행하여 추출한 각 언어별 검색 결과들을 취합하여 미리 정한 표시 순서에 따라 요약 정보를 제공하는 검색 결과 제공부A search result providing unit for collecting the search results for each language extracted by the plurality of search units and providing summary information according to a predetermined display order; 를 포함하는 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.Ontology-based semantic retrieval system comprising a. 제1항에 있어서, 상기 복수의 검색부들은 각각,The method of claim 1, wherein each of the plurality of search units, 해당 언어로 번역된 검색어와 해당 언어로된 복수의 전거 표목들에 대하여, 해당 언어의 문자 배열 순서에 기초하여 검색 순위를 정하여 상기 검색 순위에 따라 하나씩 검색을 수행하고,For a search word translated in a corresponding language and a plurality of authority headings in the corresponding language, a search rank is determined based on the character arrangement order of the corresponding language, and the search is performed one by one according to the search rank. 검색 수행 시 각 검색어 또는 전거 표목을 포함하는 리소스들 중 상기 각 검색어 또는 전거 표목의 빈도수가 적어도 한번 이상 있는 PSI들을 추출하는 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.An ontology-based semantic search system for extracting PSIs having at least one frequency of each search term or authority head, from among resources including each search term or authority head, when performing a search. 제1항에 있어서, 상기 복수의 전거 표목 데이터베이스들은 각각,The method of claim 1, wherein the plurality of authority heading databases, respectively, 인명, 지명, 다른 고유명사, 보통명사, 형용사/부사, 또는 동사를 포함하는 단어 형태에 따라 해당 전거 표목을 데이터베이스화한 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.An ontology-based semantic retrieval system comprising a database of authorized headings according to word forms including names of persons, names, other proper nouns, common nouns, adjectives / adverbs, or verbs. 제1항에 있어서, The method of claim 1, 화면에 다수 검색어의 논리 조합(AND 또는 OR를 포함)을 입력하도록 검색어 입력창을 제공하는 사용자 인터페이스를 더 포함하고, It further includes a user interface for providing a search term input window to enter a logical combination (including AND or OR) of multiple search terms on the screen, 상기 다국어 번역기는 상기 다수 검색어 모두에 대하여 번역을 수행하여 각 검색어에 대한 각 나라 언어로 번역된 복수의 검색어들을 생성하며,The multilingual translator translates all of the plurality of search terms to generate a plurality of search words translated in each language for each search term. 상기 복수의 검색부들은 각각 해당 언어로 번역된 복수 검색어들과 상기 복 수의 전거 표목 추출부들로부터의 상기 다수 검색어들에 대응되는 각 전거 표목에 대하여 상기 복수의 리소스 데이터베이스들 중 해당 언어에 기초한 데이터베이스에서 검색을 수행하는 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.The plurality of search units may be a database based on a corresponding language among the plurality of resource databases for each authority head corresponding to each of the plurality of search terms translated in a corresponding language and the plurality of search terms from the plurality of authority head extractors. An ontology-based semantic search system, characterized in that to perform a search. 제4항에 있어서, 상기 복수의 검색부들은 각각,The method of claim 4, wherein each of the plurality of search units, 상기 해당 언어로 번역된 복수 검색어들과 상기 복수 검색어들 각각에 대응되는 해당 언어로된 복수의 전거 표목들에 대하여, 해당 언어의 문자 배열 순서에 기초하여 검색 순위를 정하여 상기 검색 순위에 따라 하나씩 검색을 수행하고,A plurality of search words translated in the corresponding language and a plurality of authority headings in the corresponding language corresponding to each of the plurality of search terms are searched one by one according to the search rank by determining a search rank based on a character arrangement order of the corresponding language. And then 검색 수행 시 상기 논리 조합으로 입력된 다수 검색어에 대하여 각 검색어 또는 전거 표목을 포함하는 리소스들 중 상기 논리 조합을 만족시키면서 상기 각 검색어 또는 전거 표목의 빈도수가 적어도 한번 이상 있는 PSI들을 추출하는 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.Extracting PSIs having at least one frequency of each of the search terms or authorized headings while satisfying the logical combinations among resources including each search term or authorized headings for a plurality of search terms inputted through the logical combinations when performing a search An ontology-based semantic search system. 제4항에 있어서, The method of claim 4, wherein 상기 사용자 인터페이스는 상기 다수 검색어에 대한 가중치 설정창을 제공하고, The user interface provides a weight setting window for the plurality of search terms, 상기 검색 결과 제공부는 상기 가중치 설정창에 설정된 가중치 순서에 따라 검색 결과를 화면에 표시하도록 상기 사용자 인터페이스를 제어하는 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.And the search result providing unit controls the user interface to display the search results on the screen according to the weight order set in the weight setting window. 제6항에 있어서, The method of claim 6, 상기 사용자 인터페이스는 검색 결과 화면에 보기 단계 설정창을 제공하고,The user interface provides a viewing step setting window on a search result screen. 상기 검색 결과 제공부는 상기 보기 단계 설정창에 설정된 보기 단계별로 검색 결과에 대한 심도를 구분하여 표시하도록 상기 사용자 인터페이스를 제어하는 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.And the search result providing unit controls the user interface to classify and display the depth of the search result according to the viewing step set in the viewing step setting window. 제1항에 있어서, 상기 복수의 리소스 데이터베이스들은,The method of claim 1, wherein the plurality of resource databases, 도서관의 도서 검색 시스템, 웹 사이트의 정보 검색 시스템, LAN으로 연결된 소규모 네트워크 또는 개인용 PC에서 문서 파일, 이미지 파일, 비디오 파일, 데이터베이스 정보, 또는 텍스트 데이터에 대한 분산된 대용량의 정보가 토픽을 중심으로 한 의미론적 연관 관계의 맵으로 연결되어 온톨로지로 구축된 자료들을 저장한 저장 수단과 연동하여 리소스들을 제공하는 것을 특징으로 하는 온톨로지 기반 의미 검색 시스템.A large volume of distributed information about document files, image files, video files, database information, or text data on small networked or personal PCs connected to a library, book retrieval systems in libraries, Web site information retrieval systems, and personal computers. An ontology-based semantic retrieval system characterized by providing resources in association with a storage means storing data constructed by ontology connected to a map of semantic relations. 각 나라 언어로된 복수의 단어들에 대하여 단어 형태별로 전거 표목을 데이터베이스화하는 단계;Database the authority headings for each word type for a plurality of words in each language; 각 나라 언어에 따라 토픽맵 구조에 기초하여 리소스들을 온톨로지로 구축하여 데이터베이스화하는 단계;Constructing and databasening resources as ontology based on a topic map structure according to each language; 입력된 검색어에 대하여 복수의 국가들의 각 나라 언어로 번역된 복수의 검색어들을 생성하는 단계;Generating a plurality of search words translated in each country language of the plurality of countries with respect to the input search word; 상기 번역된 복수의 검색어들 중 각 나라 언어로된 검색어를 인식하여 수신하는 단계;Recognizing and receiving a search word in each language among the translated plurality of search words; 각 나라 언어로된 검색어에 대하여 상기 데이터베이스화된 전거 표목을 참조하여 상기 각 나라 언어로된 검색어에 상응하는 전거 표목이 있는지 여부를 판단하고 해당 전거 표목을 추출하는 단계; Determining whether there is an authority heading corresponding to the search term in each country language by extracting the authority heading with reference to the database of authority headings for the search term in each country language; 해당 언어로 번역된 검색어와 각 나라 언어로된 전거 표목에 대하여 상기 데이터베이스화된 리소스들에서 검색을 수행하는 단계; 및Performing a search on the database resources for a search term translated in a corresponding language and authority headings in each language; And 상기 검색을 수행하여 추출한 각 언어별 검색 결과들을 취합하여 미리 정한 표시 순서에 따라 요약 정보를 제공하는 단계Collecting search results for each language extracted by performing the search and providing summary information according to a predetermined display order; 를 포함하는 것을 특징으로 하는 온톨로지 기반 의미 검색 방법.Ontology-based semantic search method comprising a.
KR1020080098973A 2008-10-09 2008-10-09 Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation KR101037091B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080098973A KR101037091B1 (en) 2008-10-09 2008-10-09 Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080098973A KR101037091B1 (en) 2008-10-09 2008-10-09 Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation

Publications (2)

Publication Number Publication Date
KR20100039968A true KR20100039968A (en) 2010-04-19
KR101037091B1 KR101037091B1 (en) 2011-05-26

Family

ID=42216196

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080098973A KR101037091B1 (en) 2008-10-09 2008-10-09 Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation

Country Status (1)

Country Link
KR (1) KR101037091B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101231578B1 (en) * 2011-01-25 2013-02-18 인제대학교 산학협력단 Method for query translation to resolve vocabulary-gap in ontology querying
KR20190032129A (en) * 2017-09-19 2019-03-27 (주)리브릿지 Apparatus and method for providing transaction of an intellectual property service
KR20220149617A (en) * 2020-04-24 2022-11-08 로브록스 코포레이션 Language detection of user input text for online gaming

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040017008A (en) * 2002-08-20 2004-02-26 주식회사 케이랩 System and method for offering information using a search engine
KR100756421B1 (en) * 2004-12-29 2007-09-07 한국과학기술정보연구원 Overseas scientific electronic plain text collecting/index/extraction system and method thereof
KR100819846B1 (en) * 2005-04-08 2008-04-07 김동암 Method For Providing Query Language Chain Made from Informations For Internet Search
KR20080090223A (en) * 2007-04-04 2008-10-08 한국방송공사 Apparatus and method for retrieving multimedia data and record media recorded program for realizing the same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101231578B1 (en) * 2011-01-25 2013-02-18 인제대학교 산학협력단 Method for query translation to resolve vocabulary-gap in ontology querying
KR20190032129A (en) * 2017-09-19 2019-03-27 (주)리브릿지 Apparatus and method for providing transaction of an intellectual property service
KR20220149617A (en) * 2020-04-24 2022-11-08 로브록스 코포레이션 Language detection of user input text for online gaming

Also Published As

Publication number Publication date
KR101037091B1 (en) 2011-05-26

Similar Documents

Publication Publication Date Title
EP2181405B1 (en) Automatic expanded language search
US7788262B1 (en) Method and system for creating context based summary
KR101040119B1 (en) Apparatus and Method for Search of Contents
US20090254540A1 (en) Method and apparatus for automated tag generation for digital content
US10552467B2 (en) System and method for language sensitive contextual searching
US20070219986A1 (en) Method and apparatus for extracting terms based on a displayed text
EP1716511A1 (en) Intelligent search and retrieval system and method
WO2005124599A2 (en) Content search in complex language, such as japanese
Lytvyn et al. Identifying textual content based on thematic analysis of similar texts in big data
US10621252B2 (en) Method for searching in a database
CN115186050B (en) Method, system and related equipment for recommending selected questions based on natural language processing
Hinze et al. Improving access to large-scale digital libraries throughsemantic-enhanced search and disambiguation
Armentano et al. NLP-based faceted search: Experience in the development of a science and technology search engine
KR101037091B1 (en) Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation
Fauzi et al. Image understanding and the web: a state-of-the-art review
Vickers Ontology-based free-form query processing for the semantic web
Torres-Parejo et al. A theoretical model for the automatic generation of tag clouds
JP4034503B2 (en) Document search system and document search method
Francesconi et al. Opening the legal literature Portal to multilingual access
Shidha et al. Chem Text Mining-An Outline
Cunningham et al. Building heritage document collections for Pacific Island nations using semantic-enriched search
Yilmaz et al. Snippet Generation Using Local Alignment for Information Retrieval (LAIR)
Karanikolas Search Culture
Demartini et al. An architecture for finding entities on the web
Briscoe et al. Intelligent information access from scientific papers

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140415

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150519

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160519

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170519

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180521

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190520

Year of fee payment: 9