KR100956413B1 - Method and system for language-cross search - Google Patents

Method and system for language-cross search Download PDF

Info

Publication number
KR100956413B1
KR100956413B1 KR1020080047204A KR20080047204A KR100956413B1 KR 100956413 B1 KR100956413 B1 KR 100956413B1 KR 1020080047204 A KR1020080047204 A KR 1020080047204A KR 20080047204 A KR20080047204 A KR 20080047204A KR 100956413 B1 KR100956413 B1 KR 100956413B1
Authority
KR
South Korea
Prior art keywords
search
language
information
dictionary
converted
Prior art date
Application number
KR1020080047204A
Other languages
Korean (ko)
Other versions
KR20090121089A (en
Inventor
정의섭
김태중
장태종
유영복
정명동
박영서
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020080047204A priority Critical patent/KR100956413B1/en
Publication of KR20090121089A publication Critical patent/KR20090121089A/en
Application granted granted Critical
Publication of KR100956413B1 publication Critical patent/KR100956413B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Abstract

본 발명은 언어 교차 검색 시스템에 관한 것으로서, 제안된 언어 교차 검색 시스템은 다양한 언어로 구성된 데이터베이스들로부터 사전 파일들을 수집하고, 상기 사전 파일들을 기준 언어로 변환하여 기준 언어로 변환된 사전 파일들을 획득하는 사전 파일 수집부와, 입력된 검색어가 기준 언어인지 판단하고, 상기 검색어가 기준 언어가 아닌 경우 상기 검색어를 기준 언어로 변환하는 검색어 변환부와, 기준 언어의 검색어를 사용하여 기준 언어로 변환된 사전 파일들로부터 상기 검색어에 해당하는 검색 정보를 수집하는 검색부와, 상기 수집된 검색 정보를 미리 설정된 언어로 변환하여 출력하는 검색어 변환부를 포함한다. 그러므로 본 발명에서 제안된 언어 교차 검색 시스템을 사용하면 다양한 언어로 구성된 검색어를 사용하여 정보를 검색하거나 다양한 언어로 검색된 검색 정보를 사용자에게 제공하는 것이 가능하다는 효과를 갖는다.The present invention relates to a language cross-search system, wherein the proposed language cross-search system collects dictionary files from databases composed of various languages, converts the dictionary files into a reference language, and obtains dictionary files converted into a reference language. A dictionary file collection unit, a search word converter that determines whether the input search word is a reference language, and converts the search word to the reference language when the search term is not the reference language, and a dictionary converted to the reference language using the search word of the reference language And a search unit for collecting search information corresponding to the search word from files, and a search word converter for converting the collected search information into a preset language and outputting the search information. Therefore, using the language cross-search system proposed in the present invention has the effect that it is possible to search for information using search terms composed of various languages or to provide the user with search information searched in various languages.

검색어, 검색 정보, 사전 파일, 언어 Search terms, search information, dictionary files, languages

Description

언어 교차 검색 방법 및 시스템{METHOD AND SYSTEM FOR LANGUAGE-CROSS SEARCH}Language cross-search method and system {METHOD AND SYSTEM FOR LANGUAGE-CROSS SEARCH}

본 발명은 검색 시스템에 관한 것으로서 특히, 언어 교차 검색 방법 및 시스템에 관한 것이다.TECHNICAL FIELD The present invention relates to search systems, and more particularly, to a method and system for cross language search.

일반적인 정보 검색 시스템(information retrieval system)은 사용자에게 필요하다고 예측되는 정보나 데이터를 축적한 데이터베이스로(database)부터 사용자 요구에 적합한 정보를 신속하게 찾아내어 사용자에게 제공하는 시스템을 의미한다. 이때 상기 정보 검색 시스템에 포함된 데이터베이스에는 정보(information)나 데이터(data)들이 미리 수집, 가공, 처리되어 찾기 쉬운 형태로 저장된다.A general information retrieval system refers to a system that quickly finds information suitable for a user's needs from a database storing information or data that is expected to be needed by a user, and provides the user. In this case, information or data are collected, processed, and processed in advance in a database included in the information retrieval system and stored in an easy-to-find form.

하지만, 상기 데이터베이스에 저장된 데이터의 양은 방대하며, 실제 사용자의 검색이 요구되는 시점에 상기 데이터베이스를 검색하여 검색어에 상응하는 검색어를 출력하는 것은 불가능하다. 그러므로 일반적인 정보 검색 시스템은 데이터베이스에서 추출된 사전 파일을 사용하여 정보 검색을 수행한다. 현재 정보 검색 시스템은 상기 정보 검색 시스템을 사용하는 사용자로부터 검색이 요구되면, 상기 사전 파일을 사용하여 정보 검색을 수행한다.However, the amount of data stored in the database is enormous, and it is impossible to search the database and output a search word corresponding to a search word when a search of an actual user is required. Therefore, a general information retrieval system performs information retrieval using a dictionary file extracted from a database. The current information retrieval system performs information retrieval using the dictionary file when a retrieval is requested from a user who uses the information retrieval system.

이러한 정보 검색 시스템의 데이터베이스나 사전 파일을 살펴보면, 각 정보 검색 시스템들은 상기 정보 검색 시스템이 사용되는 각 국가나 각 언어권에 맞추어 제한된 언어들로 구성된다.Looking at a database or dictionary file of such an information retrieval system, each information retrieval system is composed of languages restricted for each country or each language region in which the information retrieval system is used.

따라서, 정보 검색 시스템을 사용하여 정보 검색을 수행하게 되는 경우에는 상기 정보 검색 시스템에서 사용되는 제한된 언어만을 사용하여 정보 검색을 요청하거나 제한된 언어로 구성된 검색 결과를 획득할 수밖에 없었다.Therefore, when performing information retrieval using the information retrieval system, only the limited language used in the information retrieval system can be used to request information retrieval or to obtain a search result configured in a limited language.

그러므로, 상기 정보 검색 시스템은 상기 정보 검색 시스템 사용자로부터 상기 정보 검색 시스템에서 제공되지 못하는 언어로 구성된 검색어를 사용하면, 상기 정보 검색 시스템을 사용한 검색 기능을 수행할 수 없다는 문제점이 있었다.Therefore, the information retrieval system has a problem that a search function using the information retrieval system cannot be performed by using the search word composed of a language which is not provided by the information retrieval system from the information retrieval system user.

또한, 상기 정보 검색 시스템은 상기 정보 검색 시스템을 사용하는 사용자로부터 제한된 입력 장치, 일예로 제한된 언어의 입력만이 가능한 키보드를 사용하는 경우 다른 언어로 구성된 검색어의 검색이 불가능하다는 문제점이 있었다.In addition, the information retrieval system has a problem that it is impossible to search a search word in another language when using a limited input device, for example, a keyboard capable of only inputting a restricted language from a user who uses the information retrieval system.

또한, 상기 정보 검색 시스템은 사용자가 확인이 불가능한 언어를 사용한 데이터베이스나 사전 파일을 사용하면, 사용자에게 상기 정보 검색 시스템은 적합한 정보를 제공할 수 없다는 문제점이 있었다.In addition, the information retrieval system has a problem that the information retrieval system cannot provide suitable information to the user when using a database or dictionary file using a language that the user cannot check.

따라서 정보 검색 시스템을 사용하는 사용자에게 다양한 언어를 사용한 검색 기능을 제공해야할 필요성이 있었다.Therefore, there is a need to provide a search function using various languages to a user who uses an information retrieval system.

따라서 본 발명의 목적은 언어 교차 검색 방법 및 시스템을 제공함에 있다.Accordingly, an object of the present invention is to provide a method and system for cross language searching.

본 발명의 다른 목적은 다양한 언어로 구성된 언어 교차 검색 방법 및 시스템을 제공함에 있다.Another object of the present invention is to provide a method and system for cross language searching in various languages.

본 발명의 또 다른 목적은 다양한 언어로 구성된 검색어를 사용하는 언어 교차 검색 방법 및 시스템을 제공함에 있다.Still another object of the present invention is to provide a method and system for cross-language search using a search word composed of various languages.

본 발명의 또 다른 목적은 다양한 언어로 검색된 검색 정보를 제공하는 언어 교차 검색 방법 및 시스템을 제공함에 있다.Another object of the present invention is to provide a cross-language search method and system for providing search information searched in various languages.

상기한 목적들을 달성하기 위한 본 발명의 방법은 언어 교차 검색 방법에 있어서, 다양한 언어로 구성된 데이터베이스들로부터 사전 파일들을 수집하는 단계와, 상기 사전 파일들을 기준 언어로 변환하여 기준 언어로 변환된 사전 파일들을 획득하는 단계와, 입력된 검색어가 기준 언어인지 판단하는 단계와, 상기 검색어가 기준 언어가 아닌 경우 상기 검색어를 기준 언어로 변환하는 단계와, 기준 언어의 검색어를 사용하여 기준 언어로 변환된 사전 파일들로부터 상기 검색어에 해당하는 검색 정보를 수집하는 단계와, 상기 수집된 검색 정보를 미리 설정된 언어로 변환하여 출력하는 단계를 포함한다.The method of the present invention for achieving the above object is a method for cross-language search, the method comprising the steps of collecting dictionary files from databases composed of various languages, the dictionary file converted into a reference language by converting the dictionary files into a reference language Obtaining the information, determining whether the input search word is a reference language, converting the search word to the reference language if the search term is not the reference language, and converting the search term into the reference language using the search word of the reference language. Collecting search information corresponding to the search word from files, and converting the collected search information into a preset language and outputting the search information.

상기한 목적들을 달성하기 위한 본 발명의 시스템은 언어 교차 검색 시스템에 있어서, 다양한 언어로 구성된 데이터베이스들로부터 사전 파일들을 수집하고, 상기 사전 파일들을 기준 언어로 변환하여 기준 언어로 변환된 사전 파일들을 획득하는 사전 파일 수집부와, 입력된 검색어가 기준 언어인지 판단하고, 상기 검색어가 기준 언어가 아닌 경우 상기 검색어를 기준 언어로 변환하는 검색어 변환부와, 기준 언어의 검색어를 사용하여 기준 언어로 변환된 사전 파일들로부터 상기 검색어에 해당하는 검색 정보를 수집하는 검색부와, 상기 수집된 검색 정보를 미리 설정된 언어로 변환하여 출력하는 검색어 변환부를 포함한다.The system of the present invention for achieving the above objects, in a cross-language search system, collecting dictionary files from databases composed of various languages, converting the dictionary files into a reference language to obtain dictionary files converted into a reference language A dictionary file collection unit configured to determine whether the input search word is a reference language, and if the search term is not the reference language, a search term converter configured to convert the search word to the reference language, and converts the search term into a reference language using the search term of the reference language. And a search unit for collecting search information corresponding to the search word from dictionary files, and a search word converter for converting the collected search information into a preset language and outputting the search information.

본 발명은 다양한 언어로 구성된 교차 검색 방법 및 시스템을 제안한다. 따라서 본 발명에서 제안된 언어 교차 검색 방법 및 시스템을 사용하면, 다양한 언어로 구성된 검색어를 사용하여 정보를 검색하는 것이 가능하다는 이점을 갖는다. 또한, 다양한 언어로 검색된 검색 정보를 사용자에게 제공하는 것이 가능하다는 이점을 갖는다.The present invention proposes a cross search method and system composed of various languages. Therefore, using the language cross-search method and system proposed in the present invention, it is possible to search for information using a search word composed of various languages. It also has the advantage that it is possible to provide the user with search information searched in various languages.

이하, 본 발명에 따른 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기의 설명에서는 본 발명에 따른 동작을 이해하는데 필요한 부분만이 설명되며 그 이외 부분의 설명은 본 발명의 요지를 흩트리지 않도록 생략될 것이라는 것을 유의하여야 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. It should be noted that in the following description, only parts necessary for understanding the operation according to the present invention will be described, and descriptions of other parts will be omitted so as not to distract from the gist of the present invention.

본 발명은 다양한 언어를 사용하는 언어 교차 지원 시스템 및 방법을 제공한다. 특히, 본 발명은 다양한 언어를 사용하는 정보 검색 시스템(information retrieval system) 간에 연동하여 정보 검색을 하는 언어 교차 지원 시스템을 제안한다. 상기 언어 교차 지원 시스템은 상기 정보 검색 시스템의 내부 또는 외부에 위치할 수 있다.The present invention provides a language cross support system and method using various languages. In particular, the present invention proposes a language cross support system that performs information retrieval by interworking between information retrieval systems using various languages. The language cross support system may be located inside or outside the information retrieval system.

상기 정보 검색 시스템은 사용자가 필요로 하는 정보를 수집하여 검색하기 쉬운 형태로 조직화하여 데이터베이스에 구성하였다가 정보에 대한 요구가 발생하였을 때 적합한 정보를 검색하여 제공하는 시스템이다.The information retrieval system is a system that collects the information required by the user and organizes it in a form that is easy to search and configures in a database, and then retrieves and provides appropriate information when a request for information occurs.

여기서, 검색어(keyword)는 상기 정보 검색 시스템으로부터 사용자가 필요로 하는 정보를 수집하기 위해 입력된 입력어를 의미하고, 검색 정보는 상기 검색어를 상기 정보 검색 시스템에 입력하여 검색된 검색 결과에 해당하는 정보를 의미한다.Here, a keyword refers to an input word input for collecting information required by a user from the information retrieval system, and search information refers to information corresponding to a search result searched by inputting the search term to the information retrieval system. Means.

상기 정보 검색 시스템은 검색어가 입력되면, 상기 검색어에 상응하는 검색 결과를 출력하기 위해서 데이터베이스로부터 추출된 사전 파일(dictionary file)을 사용한다. 상기 사전 파일은 검색어로부터 검색 처리 시간 단축을 위해 데이터베이스로부터 추출한 검색에 사용되는 용어와 기호 중 적어도 하나의 색인 파일을 의미 한다. 또한, 상기 사전 파일은 복수개의 용어 또는 복수개의 기호를 포함한 색인 파일일 수 있으며, 상기 사전 파일은 데이터베이스를 구성하는 구성 요소들 중 하나이다.When a search word is input, the information retrieval system uses a dictionary file extracted from a database to output a search result corresponding to the search word. The dictionary file refers to at least one index file of terms and symbols used in a search extracted from a database for shortening a search processing time from a search word. In addition, the dictionary file may be an index file including a plurality of terms or a plurality of symbols, and the dictionary file is one of the components constituting the database.

도 1은 본 발명의 실시예에 따른 언어 교차 검색 시스템 구조를 도시한 도면이다.1 is a diagram illustrating a structure of a language cross search system according to an exemplary embodiment of the present invention.

도 1을 참조하면, 상기 언어 교차 검색 시스템은 검색어 변환부(keyword converter)(110), 검색부(searcher)(120), 검색 정보 변환부(search information converter)(130), 사전 파일 데이터베이스(dictionary file database)(140), 사전 파일 수집부(dictionary file collector)(150), 다언어 데이터베이스(multilingual database)(160)를 포함한다.Referring to FIG. 1, the language cross-search system includes a keyword converter 110, a searcher 120, a search information converter 130, and a dictionary file database. a file database 140, a dictionary file collector 150, and a multilingual database 160.

우선, 상기 사전 파일 수집부(150)가 기준 언어로 변환된 사전 파일을 상기 사전 파일 데이터베이스(140)에 제공하는 동작을 하기에서 살펴보기로 한다.First, an operation of providing the dictionary file converted into a reference language to the dictionary file database 140 by the dictionary file collecting unit 150 will be described below.

상기 사전 파일 수집부(150)는 상기 언어 교차 검색 시스템에 설정된 기준 언어를 포함한 다양한 다른 언어들로 구성된 다언어 데이터베이스(160)로부터 기준 언어로 변환된 사전 파일을 수집한다.The dictionary file collection unit 150 collects a dictionary file converted into a reference language from the multilingual database 160 composed of various other languages including the reference language set in the language cross-search system.

상기 다언어 데이터베이스(160)는 다양한 언어들 각각으로 구성된 데이터베이스(database)들(161, 163, 165) 또는 다양한 언어들 각각으로 구성된 사전 파일들(167, 169)을 포함한다. 상기 데이터베이스는 정보(information)나 데이터(data)들이 미리 수집, 가공, 처리되어 저장되어 있다. 각 사전 파일은 검색어로부터 검색 처리 시간 단축을 위해 데이터베이스로부터 추출한 검색에 사용되는 용어 또는 기호들의 색인파일이다. 상기 다언어 데이터베이스(160)는 설명의 편의를 위하여 도시한 것으로 상기 데이터베이스들(161, 163, 165) 또는 상기 사전 파일들(167, 169)이 저장된 별도의 다언어 데이터베이스(160)와 같은 형태로 구현될 수도 있고, 다양한 언어 각각을 사용하는 정보 검색 시스템들로부터 제공된 데이터베이스 또는 사전 파일들의 집합일 수 있다. 만약, 상기 다언어 데이터베이스(140)는 별도로 구현된 경우 각 데이터베이스들 또는 사전 파일들의 정보가 업데이트되면, 상기 다언어 데이터베이스(140)는 각 정보 검색 시스템 또는 별도의 다언어 데이터베이스 업데이트 장치로부터 업데이트된다.The multilingual database 160 includes databases 161, 163 and 165 in each of the various languages or dictionary files 167 and 169 in each of the various languages. The database stores information or data collected, processed, and processed in advance. Each dictionary file is an index file of terms or symbols used in a search extracted from a database to shorten a search processing time from a search word. The multilingual database 160 is shown for convenience of description and has the same form as a separate multilingual database 160 in which the databases 161, 163, and 165 or the dictionary files 167 and 169 are stored. It may be implemented, or may be a collection of database or dictionary files provided from information retrieval systems using each of the various languages. If the multilingual database 140 is implemented separately, when the information of each database or dictionary files is updated, the multilingual database 140 is updated from each information retrieval system or a separate multilingual database updater.

상기 사전 파일 수집부(150)는 상기 다언어 데이터베이스(160) 내부에 포함된 데이터베이스들(161, 163, 165)로부터 사전 파일들을 추출하고, 추출된 사전 파일들을 기준 언어의 사전 파일들로 변환하여 수집한다. 또한, 상기 사전 파일 수집부는 상기 다언어 데이터베이스(160) 내부에 포함된 사전 파일들(167, 169)을 기준 언어의 사전 파일들로 변환하여 수집한다.The dictionary file collecting unit 150 extracts dictionary files from the databases 161, 163, and 165 included in the multilingual database 160, and converts the extracted dictionary files into dictionary files of a reference language. Collect. In addition, the dictionary file collector converts and collects dictionary files 167 and 169 included in the multilingual database 160 into dictionary files of a reference language.

상기 사전 파일 수집부(150)는 상기 기준 언어로 변환하여 수집된 사전 파일들을 상기 사전 파일 데이터베이스(140)에 제공한다. 또한, 상기 사전 파일 수집부(150)는 상기 다언어 데이터베이스(160)에 포함된 데이터베이스들 또는 사전 파일, 상기 업데이트에 상응하게 기준 언어로 변환된 사전 파일을 상기 사전 파일 데이터베이스(140)에 제공한다.The dictionary file collection unit 150 provides dictionary files collected by converting the dictionary files into the reference language 140. In addition, the dictionary file collection unit 150 provides the dictionary file database 140 with the databases or dictionary files included in the multilingual database 160 and the dictionary file converted into a reference language corresponding to the update. .

다음으로 검색어 입력에 상응한 교차 언어 검색 시스템 동작을 살펴보기로 한다.Next, the operation of the cross-language search system corresponding to the search term input will be described.

상기 검색어 변환부(110)는 검색어를 입력받고, 입력된 검색어가 미리 설정된 기준 언어인지 판단한다. 상기 검색어 변환부(110)는 상기 검색어가 미리 설정된 기준 언어가 아닌 경우 상기 검색어를 기준 언어로 변환한다.The search term converting unit 110 receives a search term and determines whether the input search term is a preset reference language. The search term converting unit 110 converts the search term into a reference language when the search term is not a preset reference language.

상기 검색부(120)는 기준 언어로 변환된 검색어를 사용하여 검색 정보를 수집한다. 상기 검색부(120)는 다수개의 사전 파일들(141, 143, 145, 147)이 저장된 사전 파일 데이터베이스(140)와 연동하여 동작한다. 상기 사전 파일 데이터베이스(140)는 상술한 바와 같이 기준 언어로 변환된 사전 파일들(141, 143, 145, 147)을 포함한다.The search unit 120 collects search information using a search word converted into a reference language. The search unit 120 operates in conjunction with the dictionary file database 140 in which a plurality of dictionary files 141, 143, 145, and 147 are stored. The dictionary file database 140 includes dictionary files 141, 143, 145, and 147 converted into a reference language as described above.

상기 검색부(120)는 상기 검색어에 상응한 검색 정보를 상기 사전 파일 데이터베이스(140) 내부의 사전 파일들을 검색하여 상기 검색어에 상응한 검색 정보를 수집한다. 또한, 상기 검색부(120)는 복수개의 사전 파일들(141, 143, 145, 147)로부터 추출된 검색 정보들 중에서 중복된 검색 정보를 삭제하거나 별도로 처리하여 사용할 수 있다.The search unit 120 searches for dictionary files in the dictionary file database 140 to search information corresponding to the search word and collects search information corresponding to the search word. In addition, the search unit 120 may delete or separately process duplicate search information among search information extracted from the plurality of dictionary files 141, 143, 145, and 147.

여기서 상기 사전 파일 데이터베이스(140)는 설명의 편의를 위하여 도시한 것으로 기준 언어로 변환된 사전 파일들이 저장된 사전 파일 데이터베이스(140) 형태로 구현될 수도 있고, 각 정보 검색 시스템 또는 사전 파일 수집부(150)로부터 제공된 사전 파일들의 집합일 수도 있다.Here, the dictionary file database 140 is shown for convenience of description and may be implemented in the form of a dictionary file database 140 in which dictionary files converted to a reference language are stored. Each information retrieval system or dictionary file collecting unit 150 may be implemented. It may be a collection of dictionary files provided from.

상기 검색부(120)에서 검색된 검색 정보는 상기 검색어에 상응하여 검색된 정보, 상기 검색된 정보의 존재 여부 정보, 상기 검색된 정보의 개수 정보 중 적어도 하나의 정보를 포함한다.The search information searched by the search unit 120 may include at least one of information searched corresponding to the search word, presence or absence information of the searched information, and information on the number of the searched information.

상기 검색어 변환부(130)는 상기 검색 정보를 상기 검색어 변환부(130)에 미리 설정된 언어로 변환하여 출력한다. 상기 미리 설정된 언어는 기준 언어가 될 수도 있으며, 상기 기준 언어 이외의 특정 언어가 설정될 수 있다. 또한 상기 미리 설정된 언어는 상기 검색어와 동일한 언어로 설정될 수도 있다.The search word converter 130 converts the search information into a language preset in the search word converter 130 and outputs the converted information. The preset language may be a reference language or a specific language other than the reference language may be set. The preset language may be set to the same language as the search word.

상기 검색어 변환부(130)는 검색 결과를 청각 또는 시각의 형태로 변환하여 출력할 수도 있다.The search word converter 130 may convert the search result into an audio or visual form and output the converted search result.

다음으로 상기 언어 교차 검색 시스템의 동작을 예를 들어 설명하기로 한다.Next, the operation of the cross-language search system will be described by way of example.

상기 언어 교차 검색 시스템에 설정된 기준 언어는 '영어(English language)'라 가정하기로 한다. 상기 '영어' 이외의 다른 언어가 기준 언어로 설정될 수 있음은 물론이다.It is assumed that the reference language set in the language cross-search system is 'English language'. Of course, a language other than 'English' may be set as the reference language.

상기 A 데이터베이스(161)는 '한국어(Korean language)'로 구성된 데이터베이스이고, 상기 B 데이터베이스(163)는 '불어(French language)'로 구성된 데이터베이스이고, 상기 C 데이터베이스(165)는 '독어(German language)'로 구성된 데이터베이스이고, 상기 E 사전 파일(167)은 '일어(Japanese language)'로 구성된 사전 파일이고, 상기 F 사전 파일(169)은 '중어(Chinese language)'로 구성된 사전 파일이라 가정한다.The A database 161 is a database composed of 'Korean language', the B database 163 is a database composed of 'French language', and the C database 165 is a 'German language' It is assumed that the E dictionary file 167 is a dictionary file composed of 'Japanese language', and the F dictionary file 169 is a dictionary file composed of 'Chinese language'. .

상기 사전 파일 수집부(150)는 상기 A 데이터베이스(161), B 데이터베이스(163), C 데이터베이스(165) 각각으로부터 사전 파일들을 추출하고, 상기 추출된 사전 파일들을 상기 기준 언어인 '영어'로 변환한다. 또한, 상기 사전 파일 수집부(150)는 상기 E 사전 파일(167)과 F 사전 파일(169) 각각을 상기 기준 언어인 ' 영어'로 변환한다.The dictionary file collecting unit 150 extracts dictionary files from each of the A database 161, the B database 163, and the C database 165, and converts the extracted dictionary files into the reference language 'English'. do. In addition, the dictionary file collecting unit 150 converts each of the E dictionary file 167 and the F dictionary file 169 into the reference language 'English'.

그리하여, 상기 사전 파일 수집부(150)는 영어로 변환된 사전 파일들을 상기 사전 파일 데이터베이스(147)에 제공한다.Thus, the dictionary file collecting unit 150 provides the dictionary files converted into English to the dictionary file database 147.

상기 사전 파일 데이터베이스(140)는 복수개의 사전 파일들을 포함하며, 상기 사전 파일 데이터베이스(140)에 포함된 사전 파일들은 기준 언어로 변환된 사전 파일들을 포함한다.The dictionary file database 140 includes a plurality of dictionary files, and the dictionary files included in the dictionary file database 140 include dictionary files converted into a reference language.

한편, 상기 검색어 변환부(110)에 입력된 검색어가 '한국어(Korean language)'이면 상기 검색어 변환부(110)는 상기 검색어를 기준 언어인 '영어'로 변환한다.Meanwhile, if the search word input to the search term converter 110 is 'Korean language', the search term converter 110 converts the search term to 'English' which is a reference language.

상기 검색부(120)는 '영어'로 변환된 검색어를 사용하여 상기 사전 파일 데이터베이스(140) 내부에 포함된 사전 파일들로부터 검색을 수행하여 상기 검색어에 상응한 검색 정보를 수집한다.The search unit 120 performs a search from dictionary files included in the dictionary file database 140 using a search word converted to 'English' and collects search information corresponding to the search word.

상기 검색 정보 변환부(130)는 상기 검색된 검색 정보를 상기 검색 정보 변환부(130)에 미리 설정된 언어에 상응하게 변환하여 출력한다. 만약, 상기 검색 정보 변환부(130)에 미리 설정된 언어가 기준 언어인 '영어'인 경우에는 상기 검색 정보를 출력하고, 상기 미리 설정된 언어가 '한국어'인 경우에는 상기 검색 정보를 '한국어'로 변환하여 출력한다. 또한, 상기 검색 정보 변환부(130)에는 상기 '영어'와 '한국어'뿐만 아니라 '불어', '독어', '일어', '중어' 등과 같은 다양한 언어들 각각이 설정될 수 있다.The search information converting unit 130 converts the searched search information corresponding to a language preset in the search information converting unit 130 and outputs the converted search information. If the preset language in the search information converter 130 is 'English' as the reference language, the search information is output. If the preset language is 'Korean', the search information is set as 'Korean'. Convert it and print it out. In addition, the search information converter 130 may set various languages such as 'French', 'German', 'Japanese', 'Chinese' as well as the 'English' and 'Korean'.

도 2는 본 발명의 실시예에 따른 언어 교차 검색 시스템의 언어 교차 검색 동작을 도시한 순서도이다.2 is a flowchart illustrating a language cross search operation of a language cross search system according to an exemplary embodiment of the present invention.

도 2를 참조하면, 211단계에서 언어 교차 검색 시스템은 다언어로 구성된 데이터베이스들로부터 사전 파일들을 수집하고 213단계로 진행한다.Referring to FIG. 2, in step 211, the language cross-search system collects dictionary files from multilingual databases and proceeds to step 213.

상기 213단계에서 언어 교차 검색 시스템은 수집한 사전 파일들이 기준 언어로 구성된 사전 파일들인지 확인한다.In step 213, the language cross-search system checks whether the collected dictionary files are dictionary files composed of a reference language.

상기 확인결과 상기 사전 파일들이 기준 언어가 아닌 경우에는 215단계로 진행한다.If the dictionary files are not the reference language as a result of the check, step 215 is performed.

상기 215단계에서 상기 언어 교차 검색 시스템은 수집한 사전 파일들을 기준 언어로 변환하고 217단계로 진행한다.In step 215, the language cross-search system converts the collected dictionary files into a reference language and proceeds to step 217.

상기 확인결과 상기 사전 파일들이 기준 언어인 경우에는 217단계로 진행한다.If the dictionary file is the reference language as a result of the check, step 217 is performed.

217단계에서 상기 언어 교차 검색 시스템은 검색어를 입력받고 219단계로 진행한다.In step 217, the language cross-search system receives a search word and proceeds to step 219.

상기 219단계에서 상기 언어 교차 검색 시스템은 입력된 검색어의 언어를 확인하고, 상기 검색어가 기준 언어인지 확인한다.In step 219, the language cross-search system checks the language of the input search word and checks whether the search word is a reference language.

상기 확인결과 상기 검색어가 기준 언어가 아닌 경우에는 221단계로 진행한다.If the search result is not the reference language, the process proceeds to step 221.

상기 221단계에서 상기 언어 교차 검색 시스템은 입력된 검색어의 언어를 기준 언어로 변환하고 223단계로 진행한다.In step 221, the language cross-search system converts the language of the input search word into a reference language and proceeds to step 223.

상기 확인결과 상기 검색어가 기준 언어인 경우에는 223단계로 진행한다.If the search result is the reference language, the process proceeds to step 223.

상기 223단계에서 상기 언어 교차 검색 시스템은 기준 언어의 사전 파일들로부터 검색 정보를 수집하고 225단계로 진행한다. 여기서 상기 언어 교차 검색 시스템은 상기 언어 교차 검색 시스템 내부의 사전 파일 데이터베이스의 사전 파일들로부터 검색 정보를 수집한다. 상기 사전 파일 데이터베이스에 저장된 사전 파일들은 기준 언어로 변환된 사전 파일들이다.In step 223, the language cross-search system collects search information from dictionary files of a reference language and proceeds to step 225. Here, the cross-language search system collects search information from the dictionary files of the dictionary file database inside the cross-language search system. The dictionary files stored in the dictionary file database are dictionary files converted to a reference language.

상기 225단계에서 상기 언어 교차 검색 시스템은 수집된 검색 정보를 미리 설정된 언어로 변환해야하는지를 판단한다.In step 225, the language cross-search system determines whether to convert the collected search information into a preset language.

상기 판단결과 검색된 검색 정보를 미리 설정된 언어로 변환해야하는 경우 227단계로 진행한다.If it is necessary to convert the searched information to the preset language as a result of the determination, the process proceeds to step 227.

상기 227단계에서 상기 언어 교차 검색 시스템은 검색된 검색 정보를 미리 설정된 언어에 상응하게 변환하고 229단계로 진행한다.In step 227, the language cross-search system converts the search information corresponding to the preset language into step 229.

상기 판단결과 검색된 검색 정보를 미리 설정된 언어로 변환하지 않는 경우에는 229단계로 진행한다.If the search result does not convert the search information into a preset language, the flow proceeds to step 229.

상기 229단계에서 상기 언어 교차 검색 시스템은 검색된 검색 정보를 출력한다. 상기 언어 교차 검색 시스템은 상기 검색된 검색 정보를 청각 또는 시각의 형태로 변환하여 출력할 수 있다. 여기서 검색된 검색 정보는 관련 파일과의 연결을 위한 인터넷 프로토콜(IP: Internet Protocol) 주소 정보를 포함할 수 있다. 또한 상기 언어 교차 검색 시스템은 검색된 결과 정보가 중복된 경우 삭제하거나 별도로 처리하여 사용할 수 있다.In operation 229, the language cross-search system outputs searched search information. The cross-language search system may convert the searched search information into an audio or visual form and output the converted search information. The search information searched here may include Internet Protocol (IP) address information for connection with a related file. In addition, the language cross-search system may be deleted or separately processed if the search result information is duplicated.

상기 언어 교차 검색 시스템을 사용하면, 서로 다른 언어를 사용하는 정보 검색 시스템들 간에도 교차된 검색 기능을 제공하는 것이 가능하다. 또한, 상기 언어 교차 검색 시스템은 복수개가 연동하여 상호 간에 다언어로 구성된 데이터베이스, 사전 파일, 검색 정보를 제공하거나 기준 언어로 변환된 사전 파일을 공유할 수도 있다.Using the language cross retrieval system, it is possible to provide a cross retrieval function between information retrieval systems using different languages. In addition, the language cross-search system may provide a database, a dictionary file, search information composed of multiple languages, or share a dictionary file converted into a reference language.

한편 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.Meanwhile, in the detailed description of the present invention, specific embodiments have been described, but various modifications are possible without departing from the scope of the present invention. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be defined not only by the scope of the following claims, but also by the equivalents of the claims.

도 1은 본 발명의 실시예에 따른 언어 교차 검색 시스템 구조를 도시한 도면,1 is a diagram illustrating a structure of a language cross search system according to an embodiment of the present invention;

도 2는 본 발명의 실시예에 따른 언어 교차 검색 시스템의 언어 교차 검색 동작을 도시한 순서도.2 is a flowchart illustrating a language cross search operation of a language cross search system according to an exemplary embodiment of the present invention.

Claims (17)

언어 교차 검색 방법에 있어서,In the language cross-search method, 다양한 언어로 구성된 데이터베이스들로부터 사전 파일들을 수집하는 단계와,Collecting dictionary files from databases in various languages, 상기 사전 파일들을 기준 언어로 변환하여 기준 언어로 변환된 사전 파일들을 획득하는 단계와,Converting the dictionary files into a reference language to obtain dictionary files converted into a reference language; 입력된 검색어가 기준 언어인지 판단하는 단계와,Determining whether the search term entered is a reference language, 상기 검색어가 기준 언어가 아닌 경우 상기 검색어를 기준 언어로 변환하는 단계와,Converting the search term into a reference language if the search term is not a reference language; 기준 언어의 검색어를 사용하여 기준 언어로 변환된 사전 파일들로부터 상기 검색어에 해당하는 검색 정보를 수집하는 단계와,Collecting search information corresponding to the search term from dictionary files converted into the reference language using a search term of the reference language; 상기 수집된 검색 정보를 미리 설정된 출력용 언어로 변환하여 출력하는 단계를 포함하는 언어 교차 검색 방법.And converting the collected search information into a preset language for output and outputting the converted language. 제 1 항에 있어서,The method of claim 1, 상기 사전 파일은 검색어로부터 검색 처리 시간 단축을 위해 데이터베이스로부터 추출한 검색에 사용되는 용어와 기호 중 적어도 하나의 색인 파일임을 특징으로 하는 언어 교차 검색 방법.And the dictionary file is an index file of at least one of terms and symbols used for a search extracted from a database for shortening a search processing time from a search word. 제 1 항에 있어서,The method of claim 1, 상기 검색 정보는 상기 검색어에 상응하여 검색된 정보, 상기 검색된 정보의 존재 여부 정보 중 적어도 하나의 정보를 포함함을 특징으로 하는 언어 교차 검색 방법.The search information includes at least one of information searched corresponding to the search word and information on the existence of the searched information. 제 1 항에 있어서,The method of claim 1, 상기 검색 정보는 상기 검색어에 상응하여 검색된 정보의 개수 정보를 포함함을 특징으로 하는 언어 교차 검색 방법. And the search information includes information on the number of information searched corresponding to the search word. 제 1 항에 있어서,The method of claim 1, 상기 검색 정보는 상기 검색된 정보에 상응한 인터넷 프로토콜 주소를 포함함을 특징으로 하는 언어 교차 검색 방법.And the search information includes an internet protocol address corresponding to the searched information. 제 1 항에 있어서,The method of claim 1, 상기 미리 설정된 언어는 기준 언어와 입력된 검색어에 상응하는 언어 중 하나임을 특징으로 하는 언어 교차 검색 방법.And the preset language is one of a reference language and a language corresponding to the input search word. 제 1 항에 있어서,The method of claim 1, 상기 수집된 검색 정보를 미리 설정된 언어로 변환하여 출력하는 단계는;Converting the collected search information into a preset language and outputting the converted language; 미리 설정된 언어로 변환된 검색 정보를 청각과 시각의 형태 중 적어도 하나 의 형태로 출력하는 단계를 포함하는 언어 교차 검색 방법.And outputting the search information converted into a preset language in at least one of the form of hearing and sight. 제 1 항에 있어서,The method of claim 1, 상기 수집된 검색 정보를 미리 설정된 언어로 변환하여 출력하는 단계는;Converting the collected search information into a preset language and outputting the converted language; 미리 설정된 언어로 변환된 검색 정보 중에서 중복된 정보를 삭제하는 단계를 포함하는 언어 교차 검색 방법.And deleting the duplicated information among the searched information converted into the preset language. 언어 교차 검색 시스템에 있어서,In a language cross-search system, 다양한 언어로 구성된 데이터베이스들로부터 사전 파일들을 수집하고, 상기 사전 파일들을 기준 언어로 변환하여 기준 언어로 변환된 사전 파일들을 획득하는 사전 파일 수집부와,A dictionary file collection unit which collects dictionary files from databases configured in various languages, converts the dictionary files into a reference language, and obtains dictionary files converted into the reference language; 입력된 검색어가 기준 언어인지 판단하고, 상기 검색어가 기준 언어가 아닌 경우 상기 검색어를 기준 언어로 변환하는 검색어 변환부와,A search term converter which determines whether the input search term is a reference language, and converts the search term into a reference language if the search term is not a reference language; 기준 언어의 검색어를 사용하여 기준 언어로 변환된 사전 파일들로부터 상기 검색어에 해당하는 검색 정보를 수집하는 검색부와,A search unit which collects search information corresponding to the search term from dictionary files converted into the reference language using a search term of the reference language, 상기 수집된 검색 정보를 미리 설정된 출력용 언어로 변환하여 출력하는 검색어 변환부를 포함하는 언어 교차 검색 시스템.And a search word converting unit converting the collected search information into a preset output language and outputting the converted search information. 제 9 항에 있어서,The method of claim 9, 상기 사전 파일은 검색어로부터 검색 처리 시간 단축을 위해 데이터베이스로 부터 추출한 검색에 사용되는 용어와 기호 중 적어도 하나의 색인 파일임을 특징으로 하는 언어 교차 검색 시스템.The dictionary file is a cross-language search system, characterized in that at least one index file of terms and symbols used in the search extracted from the database to reduce the search processing time from the search word. 제 9 항에 있어서,The method of claim 9, 상기 검색 정보는 상기 검색어에 상응하여 검색된 정보, 상기 검색된 정보의 존재 여부 정보 중 적어도 하나의 정보를 포함함을 특징으로 하는 언어 교차 검색 시스템.The search information includes at least one of information searched corresponding to the search word and information on the existence of the searched information. 제 9 항에 있어서,The method of claim 9, 상기 검색 정보는 상기 검색어에 상응하여 검색된 정보의 개수 정보를 포함함을 특징으로 하는 언어 교차 검색 시스템. The search information includes information on the number of information searched corresponding to the search word. 제 9 항에 있어서,The method of claim 9, 상기 검색 정보는 상기 검색된 정보에 상응한 인터넷 프로토콜 주소를 포함함을 특징으로 하는 언어 교차 검색 시스템.And the search information includes an internet protocol address corresponding to the searched information. 제 9 항에 있어서,The method of claim 9, 상기 미리 설정된 언어는 기준 언어와 입력된 검색어에 상응하는 언어 중 하나임을 특징으로 하는 언어 교차 검색 시스템.And the preset language is one of a reference language and a language corresponding to the input search word. 제 9 항에 있어서,The method of claim 9, 상기 검색 정보 변환부는 미리 설정된 언어로 변환된 검색 정보를 청각과 시각의 형태 중 적어도 하나의 형태로 출력함을 특징으로 하는 언어 교차 검색 시스템.And the search information converting unit outputs search information converted into a preset language in at least one of audio and visual forms. 제 9 항에 있어서,The method of claim 9, 상기 검색 정보 변환부는 미리 설정된 언어로 변환된 검색 정보 중에서 중복된 정보를 삭제함을 특징으로 하는 언어 교차 검색 시스템.And the search information converting unit deletes duplicated information among the search information converted into a preset language. 제 10 항에 있어서,The method of claim 10, 상기 언어 교차 검색 시스템은 상기 사전 파일을 저장한 사전 파일 데이터베이스를 더 포함하는 언어 교차 검색 시스템.The language cross-search system further comprises a dictionary file database storing the dictionary file.
KR1020080047204A 2008-05-21 2008-05-21 Method and system for language-cross search KR100956413B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080047204A KR100956413B1 (en) 2008-05-21 2008-05-21 Method and system for language-cross search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080047204A KR100956413B1 (en) 2008-05-21 2008-05-21 Method and system for language-cross search

Publications (2)

Publication Number Publication Date
KR20090121089A KR20090121089A (en) 2009-11-25
KR100956413B1 true KR100956413B1 (en) 2010-05-06

Family

ID=41604238

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080047204A KR100956413B1 (en) 2008-05-21 2008-05-21 Method and system for language-cross search

Country Status (1)

Country Link
KR (1) KR100956413B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160009916A (en) 2014-07-17 2016-01-27 동아대학교 산학협력단 Query Translator and Method for Cross-language Information Retrieval using Liguistic Resources from Wikipedia and Parallel Corpus

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR980004126A (en) * 1997-12-16 1998-03-30 양승택 Query Language Conversion Apparatus and Method for Searching Multilingual Web Documents
JPH10232883A (en) 1996-10-23 1998-09-02 I T I:Kk Document retrieval system coping with many languages
KR20000073477A (en) * 1999-05-11 2000-12-05 정선종 Method and device of korean-to-english query translation using mutual information
WO2007051109A2 (en) 2005-10-24 2007-05-03 Invention Machine Corporation System and method for cross-language knowledge searching

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232883A (en) 1996-10-23 1998-09-02 I T I:Kk Document retrieval system coping with many languages
KR980004126A (en) * 1997-12-16 1998-03-30 양승택 Query Language Conversion Apparatus and Method for Searching Multilingual Web Documents
KR20000073477A (en) * 1999-05-11 2000-12-05 정선종 Method and device of korean-to-english query translation using mutual information
WO2007051109A2 (en) 2005-10-24 2007-05-03 Invention Machine Corporation System and method for cross-language knowledge searching

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160009916A (en) 2014-07-17 2016-01-27 동아대학교 산학협력단 Query Translator and Method for Cross-language Information Retrieval using Liguistic Resources from Wikipedia and Parallel Corpus

Also Published As

Publication number Publication date
KR20090121089A (en) 2009-11-25

Similar Documents

Publication Publication Date Title
JP2016522524A (en) Method and apparatus for detecting synonymous expressions and searching related contents
JP2006523344A (en) System and method for interactive search query refinement
JP2009266244A (en) System and method of creating and using compact linguistic data
JP2001043236A (en) Synonym extracting method, document retrieving method and device to be used for the same
US8782049B2 (en) Keyword presenting device
KR100396826B1 (en) Term-based cluster management system and method for query processing in information retrieval
KR101654717B1 (en) Method for producing structured query based on knowledge database and apparatus for the same
US7593844B1 (en) Document translation systems and methods employing translation memories
US11301441B2 (en) Information processing system and information processing method
JP2003150623A (en) Language crossing type patent document retrieval method
CN111324705A (en) System and method for adaptively adjusting related search terms
Paul et al. An affix removal stemmer for natural language text in nepali
KR100956413B1 (en) Method and system for language-cross search
JP6433045B2 (en) Keyword extraction apparatus and program
US10572592B2 (en) Method, device, and computer program for providing a definition or a translation of a word belonging to a sentence as a function of neighbouring words and of databases
KR100659370B1 (en) Method for constructing a document database and method for searching information by matching thesaurus
KR101037091B1 (en) Ontology Based Semantic Search System and Method for Authority Heading of Various Languages via Automatic Language Translation
KR20010097802A (en) System for multi-language search and auto-translation of searched information/sorting, and multi-language searching method using the system
JP2008026963A (en) Retrieval processor and program
CN113868375A (en) Data query method, device, equipment and storage medium based on structured query language
US20040054677A1 (en) Method for processing text in a computer and a computer
JP4253483B2 (en) Different notation dictionary creation device, different notation dictionary creation method, and program for causing computer to execute the method
KR20010008117A (en) Method, system and computer-readable media for displaying automatically words in the sentence adapted to user's word power
JPH10207896A (en) Method and device for retrieval term extension and method and device for information retrieval
Pimpalshende et al. Pre-processing phase of Hindi language text summarization System

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130410

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140408

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150427

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee