KR101223987B1 - System and method for providing a related term using the dynamic ontology - Google Patents

System and method for providing a related term using the dynamic ontology Download PDF

Info

Publication number
KR101223987B1
KR101223987B1 KR1020100085013A KR20100085013A KR101223987B1 KR 101223987 B1 KR101223987 B1 KR 101223987B1 KR 1020100085013 A KR1020100085013 A KR 1020100085013A KR 20100085013 A KR20100085013 A KR 20100085013A KR 101223987 B1 KR101223987 B1 KR 101223987B1
Authority
KR
South Korea
Prior art keywords
legal
term
dictionary
terms
search
Prior art date
Application number
KR1020100085013A
Other languages
Korean (ko)
Other versions
KR20120021007A (en
Inventor
조동관
Original Assignee
대한민국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국 filed Critical 대한민국
Priority to KR1020100085013A priority Critical patent/KR101223987B1/en
Publication of KR20120021007A publication Critical patent/KR20120021007A/en
Application granted granted Critical
Publication of KR101223987B1 publication Critical patent/KR101223987B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

본 발명은 검색어를 입력받으면, 입력된 검색어를 국내 또는 해외 법률, 판례, 논문 등 관련 문서에서 검색하고, 검색된 결과로부터 명사 이외의 단어를 제외시켜 명사만을 일반용어로 빈도수와 함께 추출하고, 또한 검색된 결과로부터 법률용어사전에 근거해 법률용어를 빈도수와 함께 추출하며, 그 빈도수가 상위에 해당되는 일반용어들과 법률용어들에 대해 제외어 사전을 근거로 상기 제외어 사전에 등록된 용어를 제외하여 일정 개수의 일반용어 및 법률용어를 동적 온톨로지로 생성하고, 생성된 동적 온톨로지에서 빈도수가 하위에 해당되는 일정 개수의 일반용어와 빈도수가 상위에 해당되는 일정 개수의 법률용어을 관련어로 제공하도록 된, 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템에 관한 것이다.
본 발명에 따른 동적 온톨로지를 이용한 관련어 제공 방법은, 모국어 사전과 법률용어사전 및 제외어 사전을 적용하는 시스템의 동적 온톨로지를 이용한 관련어 제공 방법으로서, (a) 사용자로부터 검색어를 입력받는 단계; (b) 상기 검색어를 국내 및 해외의 관련 문서에서 검색하는 단계; (c) 상기 검색된 결과로부터 상기 모국어 사전에 근거해 명사 이외의 단어를 제외하여 명사만을 일반용어로 빈도수와 함께 수집하는 단계; (c') 상기 검색된 결과로부터 상기 법률용어사전에 근거해 법률용어들을 빈도수와 함께 수집하는 단계; (d) 상기 제외어 사전에 등록된 용어를 제외하고 상기 빈도수가 미리 설정된 상위 순위 기준에 해당되는 일정 개수의 일반용어들 및 상기 빈도수가 미리 설정된 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 각각 수집해 동적 온톨로지로 생성하는 단계; 및 (e) 상기 동적 온톨로지에서 빈도수가 미리 설정된 하위 순위 기준에 해당되는 일정 개수의 일반용어들과, 빈도수가 미리 설정된 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 관련어로 제공하는 단계를 포함한다.
According to the present invention, when a search word is input, the search term is searched in related documents such as domestic or foreign law, precedent, or thesis. Based on the legal term dictionary from the result, the legal term is extracted along with the frequency, and the term registered in the negative dictionary based on the negative dictionary for general terms and legal terms whose frequency is higher Dynamic Ontology generates a certain number of general terms and legal terms as dynamic ontology, and provides a certain number of general terms whose frequency is lower and a certain number of legal terms whose frequency is higher in the generated dynamic ontology as related. The present invention relates to a method and a system for providing a related word using an ontology.
A method for providing a related word using a dynamic ontology according to the present invention includes a method for providing a related word using a dynamic ontology of a system for applying a native language dictionary, a legal terminology dictionary, and a negative dictionary, comprising: (a) receiving a search word from a user; (b) searching for the search term in related documents in Korea and abroad; (c) collecting only nouns in common terminology with frequency, except for words other than nouns, based on the native language dictionary from the searched results; (c ') collecting legal terms with frequency based on the legal term dictionary from the searched results; (d) except for the terms registered in the negative dictionary, a predetermined number of general terms whose frequency corresponds to a preset higher ranking criterion and a predetermined number of legal terms that correspond to the predetermined higher ranking criteria, respectively Collecting and generating a dynamic ontology; And (e) providing a predetermined number of general terms corresponding to a lower rank criterion having a predetermined frequency in the dynamic ontology, and a predetermined number of legal terms corresponding to a predetermined high rank criterion as a related word. .

Description

동적 온톨로지를 이용한 관련어 제공 방법 및 시스템{System and method for providing a related term using the dynamic ontology}System and method for providing a related term using the dynamic ontology}

본 발명은 동적 온톨로지(dynamic ontology)를 이용하여 관련어를 제공하는 방법 및 시스템에 관한 것으로서, 더욱 자세하게는 검색어를 입력받으면, 입력된 검색어를 국내 또는 해외 법률, 판례, 논문 등 관련 문서에서 검색하고, 검색된 결과로부터 명사 이외의 단어를 제외시켜 명사만을 일반용어로 빈도수와 함께 추출하고, 또한 검색된 결과로부터 법률용어사전에 근거해 법률용어를 빈도수와 함께 추출하며, 그 빈도수가 상위에 해당되는 일반용어들과 법률용어들에 대해 제외어 사전을 적용하여 일정 개수의 일반용어 및 법률용어를 동적 온톨로지로 생성하고, 생성된 동적 온톨로지에서 빈도수가 하위에 해당되는 일정 개수의 일반용어와 빈도수가 상위에 해당되는 일정 개수의 법률용어를 관련어로 제공하도록 된 것이다.
The present invention relates to a method and system for providing a related word using dynamic ontology. More specifically, when a search word is input, the search word is searched in related documents such as domestic or foreign law, precedent, and thesis. By extracting words other than nouns from the searched results, only nouns are extracted as common terms with frequency, and also, based on the legal terminology dictionary, legal terms are extracted with frequency and general terms whose frequency is higher. Negative dictionary and legal terms are applied to generate a certain number of general terms and legal terms as dynamic ontology, and the generated dynamic ontology has a certain number of general terms and frequencies that are lower than It is to provide a certain number of legal terms as related.

일반적으로 인터넷을 이용하는 사용자는 자신의 컴퓨터를 사용하여 인터넷 상에 존재하는 많은 웹사이트를 통해 원하는 정보를 획득할 수 있다. 그러기 위해 사용자는 원하는 정보를 제공할 수 있는 웹사이트의 주소를 알아야 하지만, 현실적으로 수많은 주소를 알고 있기는 불가능하다. 그러므로 색인어만을 입력하는 등의 단순한 작업에 의해, 원하는 웹사이트(또는 웹문서)를 찾을 수 있게 하기 위한 많은 검색엔진이 제공되고 있다. In general, a user using the Internet can use his computer to obtain desired information through many websites existing on the Internet. To do this, the user must know the address of a website that can provide the desired information, but in reality it is impossible to know a large number of addresses. Therefore, many search engines have been provided to enable a user to find a desired website (or web document) by a simple operation such as inputting only an index word.

이러한 검색엔진은 그 형식에 따라 디렉토리 검색엔진, 로봇 검색엔진 및 메타 검색엔진으로 분류될 수 있다. 디렉토리 검색엔진은 수작업으로 문서를 수집, 가공하여 데이터베이스를 구축하고 사용자의 질의에 응답하여 수집된 자료를 공급하는 방식이다. 로봇 검색엔진은 소프트웨어인 검색 로봇이 웹문서를 수집, 가공하는 방식으로서 거의 모든 검색엔진이 이 형식에 속한다. 메타 검색엔진은 자신의 검색엔진 모듈을 가지고 있지 않은 상태에서, 존재하고 있는 여러 검색엔진을 이용하여 검색된 자료를 제공하는 방식이다.Such search engines may be classified into directory search engines, robot search engines, and meta search engines according to their types. Directory search engines collect and process documents manually to build a database and supply collected data in response to user queries. Robot search engines are software search robots that collect and process web documents. Almost all search engines belong to this format. The meta search engine does not have its own search engine module, and provides searched data by using existing search engines.

일반적인 경우에, 사용자가 검색어를 입력한 후 검색명령을 입력하게 되면 다수의 웹사이트(또는 웹문서)들의 주소가 사용자에게 제공된다. 때에 따라서는 주소와 더불어 간략 내용까지도 제공되는데 사용자는 그 내용을 보고 해당 사이트에 접속을 시도하게 된다. 또한, 사용자는 흡족할 만한 정보를 얻을 때까지 검색된 사이트를 이동해가며 접속을 시도하게 된다. 사용자는 이러한 과정에서 원하는 정보를 얻기까지 많은 시간을 낭비할 수도 있다.In general, when a user enters a search command after entering a search word, addresses of a plurality of websites (or web documents) are provided to the user. Sometimes a short description is provided along with the address, and the user sees the content and tries to access the site. In addition, the user attempts to connect to the searched site until the user obtains satisfactory information. The user may waste a lot of time in this process to get the desired information.

한편, 동일한 검색어를 입력하는 경우에 있어서도 사용자의 직업적 특성, 요망하는 전문성 또는 취향에 따라 본래 찾고자 하는 정보의 내용이 개인별로 상이할 수 있다. 가령 "주택" 이라는 색인어를 예로 들면, 사용자가 건축가인 경우, 주택매매 희망자인 경우, 경제인인 경우 또는 부동산 중개업자인 경우 그 각자가 요구하는 정보의 내용은 상이할 것이다. On the other hand, even in the case of inputting the same search word, the content of the information to be originally searched may differ for each person according to the user's professional characteristics, desired expertise or taste. For example, using the index "home", if the user is an architect, a prospective buyer, a businesswomen, or a real estate agent, the content of the information required by each person will be different.

그러나 동일한 검색어가 입력되면, 위와 같은 사용자의 특징 및 개성에 관계없이 거의 동일한 검색자료가 제공되고 있어, 이 역시 검색 당사자에 있어서는 원하는 정보를 얻기까지 많은 시간이 소요되는 비효율적인 문제점이 있다.
However, if the same search word is input, almost the same search data is provided regardless of the user's characteristics and personality as described above, and this also has an inefficient problem in that it takes a long time to obtain desired information.

전술한 문제점을 해결하기 위한 본 발명은, 검색어를 입력받으면, 입력된 검색어를 국내 또는 해외 법률, 판례, 논문 등 관련 문서에서 검색하고, 검색된 결과로부터 명사 이외의 단어를 제외시켜 명사만을 일반용어로 빈도수와 함께 추출하고, 또한 검색된 결과로부터 법률용어사전에 근거해 법률용어를 빈도수와 함께 추출하며, 그 빈도수가 상위에 해당되는 일반용어들과 법률용어들에 대해 제외어 사전을 적용하여 일정 개수의 일반용어 및 법률용어를 동적 온톨로지로 생성하고, 생성된 동적 온톨로지에서 빈도수가 하위에 해당되는 일정 개수의 일반용어와 빈도수가 상위에 해당되는 일정 개수의 법률용어을 관련어로 제공하도록 된, 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템을 제공함에 그 목적이 있다.
According to the present invention for solving the above-mentioned problems, when a search word is input, the search term is searched in related documents such as domestic or foreign law, precedent, or thesis, and only the nouns are used as general terms by excluding words other than nouns from the search results. Extract the terminology together with the frequency based on the legal terminology from the searched results, and apply a negative dictionary to general terms and legal terms whose frequency is higher. The dynamic ontology is used to generate general terms and legal terms as dynamic ontology, and to provide a certain number of general terms whose frequency is lower than the common terms and legal terms with high frequency as related words in the generated dynamic ontology. It is an object to provide a method and system for providing related words.

전술한 목적을 달성하기 위한 본 발명의 일 측면에 따르면, 모국어 사전과 법률용어사전 및 제외어 사전을 적용하는 시스템의 동적 온톨로지를 이용한 관련어 제공 방법으로서, (a) 사용자로부터 검색어를 입력받는 단계; (b) 상기 검색어를 국내 및 해외의 관련 문서에서 검색하는 단계; (c) 상기 검색된 결과로부터 상기 모국어 사전에 근거해 명사 이외의 단어를 제외하여 명사만을 일반용어로 빈도수와 함께 수집하는 단계; (c') 상기 검색된 결과로부터 상기 법률용어사전에 근거해 법률용어들을 빈도수와 함께 수집하는 단계; (d) 상기 제외어 사전에 등록된 용어를 제외하고 상기 빈도수가 미리 설정된 일반용어 상위 순위 기준에 해당되는 일정 개수의 일반용어들 및 상기 빈도수가 미리 설정된 법률용어 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 각각 수집해 동적 온톨로지로 생성하는 단계; 및 (e) 상기 동적 온톨로지에서 빈도수가 미리 설정된 일반용어 하위 순위 기준에 해당되는 일정 개수의 일반용어들과, 빈도수가 미리 설정된 법률용어 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 관련어로 제공하는 단계를 포함하는 동적 온톨로지를 이용한 관련어 제공 방법이 제공될 수 있다.According to an aspect of the present invention for achieving the above object, a method for providing a related word using a dynamic ontology of the system for applying the native language dictionary, the legal dictionary and the negative dictionary, comprising: (a) receiving a search word from a user; (b) searching for the search term in related documents in Korea and abroad; (c) collecting only nouns in common terminology with frequency, except for words other than nouns, based on the native language dictionary from the searched results; (c ') collecting legal terms with frequency based on the legal term dictionary from the searched results; (d) Except for the terms registered in the negative dictionary, a certain number of general terms in which the frequency corresponds to a preset general term high priority criterion and a predetermined number of regular terms in which the frequency corresponds to a preset high term legal criterion Collecting each legal term and generating a dynamic ontology; And (e) providing a predetermined number of general terms corresponding to a general term lower rank criterion having a predetermined frequency in the dynamic ontology, and providing a predetermined number of legal terms corresponding to a higher priority criterion set in frequency as a related word. A related word provision method using a dynamic ontology including a step may be provided.

또한, 상기 (b) 단계에서, 상기 관련 문서는 법률이나 법령, 판례, 학술 논문, 관련 법제, 해외 입법례, 언론 기사문, 민원상담 문서, 웹 문서 등을 포함할 수 있다.In addition, in the step (b), the related document may include a law or statutes, precedents, academic papers, related legislation, foreign legislation, media articles, civil consultation documents, web documents, and the like.

또한, 상기 (b) 단계는, 상기 검색어를 상기 국내의 관련 문서에서 검색함과 더불어, 상기 검색어를 다국어 번역기를 통해 각 국의 언어로 번역한 번역 검색어를 상기 해외의 관련 문서에서 검색할 수 있다.In addition, in the step (b), the search term may be searched in the related document of the domestic, and the search term in which the search term is translated into the language of each country through a multilingual translator may be searched in the related document of the foreign country. .

그리고, 상기 (c) 단계는, 국어사전 및 각 국의 모국어 사전을 근거로 명사 이외의 단어를 제외하여 명사 및 복합명사만을 상기 일반용어로 수집하고, 상기 (c') 단계는 국내 법률용어사전 및 각국의 법률용어사전에서 한국어 법률용어 및 외국어 법률용어를 수집하고 제외어 사전을 근거로 상기 제외어 사전에 등록된 용어를 제외할 수 있다.
In addition, the step (c) collects only nouns and compound nouns in the general term, except for words other than nouns, based on a Korean dictionary and a native language dictionary of each country, and the step (c ') is a domestic legal terminology dictionary. Korean legal terms and foreign language legal terms can be collected from the legal terminology dictionary of each country and the terms registered in the negative dictionary based on the negative dictionary can be excluded.

한편, 전술한 목적을 달성하기 위한 본 발명의 다른 측면에 따르면, 사용자로부터 검색어를 입력받기 위한 입력부; 상기 검색어를 한국어 또는 외국어로 분별하는 언어 분별기; 상기 검색어를 각 국의 언어로 번역하여 번역 검색어로 제공하는 다국어 번역기; 상기 검색어를 국내 관련 문서에서 검색하고, 상기 번역 검색어를 해외 관련 문서에서 검색하는 검색부; 상기 검색부의 검색 결과로부터 국어사전 및 각 국의 모국어 사전 중 명사 이외의 단어를 제외하여 명사만을 일반용어로 빈도수와 함께 수집하고, 상기 검색 부의 검색 결과로부터 법률용어사전에 근거해 법률용어들을 빈도수와 함께 수집하는 용어 수집부; 상기 용어 수집부에 의해 수집된 일반용어들 및 법률용어들에서, 제외어 사전에 등록된 용어를 제외하여 상기 빈도수가 미리 설정된 상위 순위 기준에 해당되는 일정 개수의 일반용어들과, 상기 빈도수가 미리 설정된 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 각각 수집해 동적 온톨로지로 생성하는 온톨로지 생성부; 및 상기 온톨로지 생성부에 의해 생성된 동적 온톨로지로부터 빈도수가 미리 설정된 하위 순위 기준에 해당되는 일정 개수의 일반용어들 및 빈도수가 미리 설정된 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 관련어로 제공하는 관련어 제공부를 포함하는 동적 온톨로지를 이용한 관련어 제공 시스템이 제공될 수 있다.On the other hand, according to another aspect of the present invention for achieving the above object, an input unit for receiving a search word from a user; A language classifier for classifying the search word into Korean or a foreign language; A multilingual translator that translates the search term into a language of each country and provides the translated search term; A search unit for searching the search term in a domestic related document and searching the translated search term in an overseas related document; From the search result of the search unit, only the nouns are collected with the common term except the words other than the nouns in the Korean dictionary and the native language dictionary of each country, and the frequency of the legal terms based on the legal term dictionary from the search result of the search unit A term collecting unit to collect together; In the general terms and legal terms collected by the term collection unit, a predetermined number of general terms corresponding to the higher rank criteria, the frequency of which is preset, except for the terms registered in the negative dictionary, and the frequency in advance An ontology generation unit for collecting a predetermined number of legal terms corresponding to the set upper rank criteria and generating the dynamic ontology; And a related term for providing a predetermined number of general terms corresponding to a predetermined lower ranking criterion and a predetermined number of legal terms corresponding to a predetermined higher ranking criterion as a related word from the dynamic ontology generated by the ontology generator. A related language providing system using a dynamic ontology including a providing unit may be provided.

여기서, 상기 관련 문서는 법률이나 법령, 판례, 학술 논문, 관련 법제, 해외 입법례, 언론 기사문, 민원상담 문서, 웹 문서 등을 포함할 수 있다.Here, the related document may include a law or a statute, a precedent, an academic paper, a related legal system, an overseas legislative case, a media article, a civil consultation document, a web document, and the like.

그리고, 상기 용어 수집부는, 국어사전 및 각 국의 모국어 사전 중 명사 이외의 단어를 적용하여 명사 및 복합명사만을 상기 일반용어로 수집하고, 국내 법률용어사전 및 각국의 법률용어사전에서 한국어 법률용어 및 외국어 법률용어를 적용하여 상기 법률용어를 수집하고 제외어 사전을 근거로 상기 제외어 사전에 등록된 용어를 제외할 수 있다.
The term collection unit collects only nouns and compound nouns in the general term by applying words other than nouns in the Korean dictionary and the native language dictionary of each country, and the Korean legal terminology and the Korean legal terminology dictionary and the legal terminology dictionary of each country. Foreign language legal terms may be applied to collect the legal terms and exclude terms registered in the negative dictionary based on the negative dictionary.

본 발명의 실시예들은, 사용자가 원하는 정보를 얻기 위해 검색어를 입력하면, 그 검색어와 관련이 있는 관련어들을 제시해 줌에 따라 사용자는 제시된 관련어들 중에 원하는 정보와 가장 밀접한 관련이 있는 관련어를 선택하여 그에 따른 원하는 정보를 빠른 시간 내에 획득할 수 있게 된다.According to the embodiments of the present invention, when a user inputs a search word to obtain desired information, the user presents a related word related to the search word, and thus, the user selects a related word that is most closely related to the desired information among the suggested related words. The desired information can be obtained quickly.

또한, 원하는 정보를 얻기 위한 검색어와 관련성이 있는 관련어들을 통해 원하는 정보 이외에도 그와 관련된 부가적인 정보도 추가로 획득할 수 있게 된다.
Further, in addition to the desired information, additional information related to the search word may be additionally obtained through related words related to the search word for obtaining the desired information.

도 1은 본 발명의 실시예에 따른 동적 온톨로지를 이용한 관련어 제공 시스템의 기능 블럭을 나타낸 구성도이다.
도 2는 본 발명의 실시예에 따른 동적 온톨로지를 이용한 관련어 제공 방법을 설명하기 위한 동작 흐름도이다.
도 3은 본 발명의 실시예에 따라 사용자로부터 입력받은 검색어와 관련성이 있는 관련어를 빈도수에 따라 미리 설정된 일반용어 하위 순위 기준에 해당하는 4개의 일반용어들과 미리 설정된 법률용어 상위 순위 기준에 해당하는 6 개의 법률용어들을 제공해 주는 예를 나타낸 도면이다.
1 is a block diagram showing a functional block of a related language providing system using a dynamic ontology according to an embodiment of the present invention.
2 is a flowchart illustrating a related word providing method using dynamic ontology according to an embodiment of the present invention.
FIG. 3 illustrates four general terms corresponding to a general term lower priority criterion and a preset legal term higher priority criterion according to a frequency of a related word related to a search word input from a user according to an embodiment of the present invention. The figure shows an example that provides six legal terms.

본 발명의 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings, wherein like reference numerals refer to the like elements throughout. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

먼저, 본 발명의 실시예에서 사용되는 용어의 개념을 정의하고 설명한다. First, the concept of terms used in the embodiments of the present invention will be defined and explained.

본 발명의 실시예는 컴퓨터 단말기를 비롯해 개인이 휴대하는 이동 단말기나 통신망에 연결된 모든 통신 단말기 등에 적용할 수 있는 바, 이 모든 기능을 대변할 수 있는 개념으로 컴퓨터 정보 처리라는 용어로 설명한다.Embodiments of the present invention can be applied to a computer terminal, a mobile terminal carried by an individual, or any communication terminal connected to a communication network. The term “computer information processing” is used to represent all of these functions.

컴퓨터 정보 처리에서 사용되는 "관련어"나 "핵심어"는 사회과학 또는 인문과학에서 사용하는 "주제어"에 비하여 상대적으로 포괄적이기 때문에 그대로 사용하지 않고 다음과 같이 정의하여 사용할 수 있다. The term "related word" or "key word" used in computer information processing is relatively comprehensive as compared to "main control" used in social sciences or the humanities, and thus can be defined and used as follows.

본 발명의 실시예에서, "주제어"(Theme Word)는 논문, 소설 등에서 저자가 나타내고자 하는 가장 중심이 되는 문제나 사상을 압축적으로 표현한 명사형 단어나 문구로서, 본 발명에서는 검색의 대상이 되는 관련 문서에서 가장 중심이 되는 문제나 사상을 압축적으로 표현한 명사형 단어나 문구를 의미한다.In the embodiment of the present invention, "Theme Word" is a noun-type word or phrase that compressively expresses the central problem or idea that the author wants to express in a paper or a novel. A noun word or phrase that condensedly expresses the problem or idea that is central to the document.

또한, 핵심어(Keyword)는 논문, 책자 등의 자료에서 특정한 내용을 쉽게 찾기 위해 중요한 내용을 요약한 단어나 문구로서, 본 발명에서는 검색의 대상이 되는 관련 문서에서 중요한 내용을 요약한 단어나 문구를 의미한다.Also, a key word is a word or phrase summarizing important contents in order to easily find a specific content in a material such as a paper or a book. In the present invention, a word or phrase summarizing important contents in a related document to be searched is used. it means.

또한, 관련어(Related Term in Thesaurus)는 시소러스에서 정보 검색을 위하여 서로 관련이 있는 핵심어를 나타낸 단어나 문구로서, 본 발명에서는 사용자로부터 입력받은 검색어와 서로 관련이 있는 핵심어를 나타낸 단어나 문구를 의미한다.
또한, 상위 및 하위에 해당한다는 의미는 미리 설정된 상위 순위 기준 또는 미리 설정된 하위 순위 기준에 따라 순차적으로 나열하고, 각각 미리 설정된 순위 안에 포함되는 것을 의미한다. 이때, 각 상위 순위 기준 및 하위 순위 기준은 일반용어와 법률용어에 따라 별도로 설정할 수 있다.
또한, 부적절한 용어는 제외어 사전에 등록된 용어들을 의미한다.
In addition, the related term (The Term in Thesaurus) is a word or phrase indicating key words that are related to each other for information retrieval in the thesaurus. In the present invention, the term refers to a word or phrase indicating key words that are related to a search word input from a user. .
In addition, the meaning of the upper and lower order means that they are sequentially listed according to a predetermined upper rank criteria or a predetermined lower rank criteria, each included in the preset ranking. In this case, each of the upper rank criteria and lower rank criteria may be separately set according to general terms and legal terms.
In addition, an inappropriate term means terms registered in a negative dictionary.

도 1은 본 발명의 실시예에 따른 동적 온톨로지를 이용한 관련어 제공 시스템의 기능 블럭을 나타낸 구성도이다.1 is a block diagram showing a functional block of a related language providing system using a dynamic ontology according to an embodiment of the present invention.

도 1을 참조하면, 본 발명에 따른 관련어 제공 시스템(100)은 입력부(110), 언어 분별기(120), 다국어 번역기(130), 검색부(140), 용어 수집부(150), 온톨로지 생성부(160), 관련어 제공부(170) 및 검색정보 데이터베이스(180) 등을 포함한다.Referring to FIG. 1, the related language providing system 100 according to the present invention includes an input unit 110, a language classifier 120, a multilingual translator 130, a search unit 140, a term collection unit 150, and an ontology generation. The unit 160, the related word providing unit 170, and the search information database 180 may be included.

입력부(110)는 사용자로부터 검색어를 입력받는다.The input unit 110 receives a search word from a user.

언어 분별기(120)는 검색어를 한국어 또는 외국어로 분별한다.The language classifier 120 classifies a search word into Korean or a foreign language.

다국어 번역기(130)는 검색어를 각 국의 언어로 번역하여 번역 검색어로 제공한다. 예를 들면, 검색어가 '법'인 경우에 다국어 번역기(130)는 번역 검색어 'law'로 제공할 수 있다.The multilingual translator 130 translates a search word into a language of each country and provides the translated search word. For example, when the search term is 'law', the multilingual translator 130 may provide the translation search term 'law'.

검색부(140)는 검색어를 국내 관련 문서에서 검색하고, 번역 검색어를 해외 관련 문서에서 검색한다. The search unit 140 searches for a search term in a domestic related document and searches for a translation search term in a foreign related document.

여기서, 관련 문서는 법률이나 법령, 판례, 학술 논문, 관련 법제, 해외 입법례, 언론 기사문, 민원상담 문서, 웹 문서 등을 포함할 수 있다.Here, the related document may include a law or a statute, a precedent, an academic paper, a related legal system, an overseas legislation, a press article, a civil complaint document, a web document, and the like.

용어 수집부(150)는 검색부(140)의 검색 결과로부터 국어사전 및 각 국의 모국어 사전 중 명사 이외의 단어를 제외하여 명사만을 일반용어로 그 빈도수와 함께 수집한다.The term collecting unit 150 collects only the nouns in general terms together with their frequency, excluding words other than nouns from the Korean dictionary and the native language dictionary of each country, from the search result of the search unit 140.

또한, 용어 수집부(150)는, 검색부(140)의 검색 결과로부터 법률용어사전에 근거해 법률용어들을 빈도수와 함께 수집한다.In addition, the term collecting unit 150 collects legal terms with a frequency based on a legal term dictionary from the search result of the searching unit 140.

이때, 용어 수집부(150)는 국어사전 및 각 국의 모국어 사전 중 명사 이외의 단어를 제외하여 명사 및 복합명사만을 일반용어로 수집하고, 국내 법률용어사전 및 각국의 법률용어사전에서 해당 한국어 법률용어 및 외국어 법률용어를 법률용어로 수집할 수 있다.In this case, the term collection unit 150 collects only nouns and compound nouns in general terms except words other than nouns in the Korean dictionary and the native language dictionary of each country. Terms and foreign language legal terms can be collected as legal terms.

온톨로지 생성부(160)는 용어 수집부(150)에 의해 수집된 일반용어들 및 법률용어들에서, 빈도수가 상위에 해당되는 일정 개수, 즉 50 개의 일반용어들과, 빈도수가 상위에 해당되는 일정 개수, 즉 30 개의 법률용어들을 각각 수집하고, 제외어 사전을 적용하여 상기 제외어 사전에 등록된 용어를 제외한 용어들을 동적 온톨로지(Dynamic Ontology)로 생성한다. 본 발명의 실시예에서는 전술한 과정을 통해 빈도수가 상위에 해당되는 일정 개수의 일반용어들과, 빈도수가 상위에 해당되는 일정 개수의 법률용어들에 대하여 제외어 사전을 적용하여 상기 제외어 사전에 등록된 용어를 제외한 용어들을 수집한 데이터를 '동적 온톨로지(Dynamic Ontology)'라 정의한다.Ontology generation unit 160 is a general number and the common terms collected by the term collection unit 150, a certain number of frequencies that the upper frequency, that is, 50 general terms, and a frequency corresponding to the upper A number, that is, 30 legal terms are collected, and the negative dictionary is applied to generate the terms except for the terms registered in the negative dictionary as dynamic ontology. According to an embodiment of the present invention, a negative dictionary is applied to a predetermined number of general terms having a high frequency and a predetermined number of legal terms having a high frequency through the above-described process. Data collected from terms other than registered terms is defined as 'dynamic ontology'.

관련어 제공부(170)는 온톨로지 생성부(160)에 의해 생성된 동적 온톨로지로부터 빈도수가 하위에 해당되는 일정 개수, 즉 4 개의 일반용어들 및 빈도수가 상위에 해당되는 일정 개수, 즉 6 개의 법률용어들을 관련어로 제공한다.The relational word providing unit 170 may have a predetermined number of frequencies corresponding to a lower frequency, that is, four general terms and a predetermined number of frequencies corresponding to a higher frequency, that is, six legal terms from the dynamic ontology generated by the ontology generator 160. Provide them as relevant.

검색정보 데이터베이스(180)는 검색을 위한 자료로써, 법률, 법령, 판례, 학술 논문, 관련 법제, 언론 기사문, 민원상담 문서 등을 제공하는 데이터베이스를 포함하며, 예를 들면, 법률 정보를 제공하는 데이터베이스, 판례 정보를 제공하는 데이터베이스, 논문 정보를 제공하는 데이터베이스 등 각각의 독립된 데이터베이스 형태로 제공할 수 있다.The search information database 180 is a data for search, and includes a database that provides laws, laws, precedents, academic papers, related legislation, media articles, and civil counseling documents. For example, a database providing legal information. It can be provided in the form of a separate database such as a database providing case information and a database providing article information.

또한, 검색정보 데이터베이스(180)는 본 발명의 실시예에 따른 결과로서 얻게 되는 관련어들을 그 검색어에 대응되게 저장하는 데이터베이스도 포함할 수 있다.In addition, the search information database 180 may also include a database storing corresponding words obtained as a result according to an embodiment of the present invention corresponding to the search word.

그리고, 검색정보 데이터베이스(180)는 도 1에 도시된 바와 같이 하나의 데이터베이스 형태로 표시하였으나, 국내 및 해외에 있는 법률, 법령, 판례, 학술 논문, 관련 법제, 언론 기사문, 민원상담 문서 등을 제공하는 데이터베이스를 포함하고 있다.
In addition, the search information database 180 is displayed in a single database form as shown in FIG. 1, but provides laws, statutes, precedents, academic papers, related laws, media articles, and civil counseling documents in Korea and overseas. It contains a database.

도 2는 본 발명의 실시예에 따른 동적 온톨로지를 이용한 관련어 제공 방법을 설명하기 위한 동작 흐름도이다.2 is a flowchart illustrating a related word providing method using dynamic ontology according to an embodiment of the present invention.

도 2를 참조하면, 본 발명에 따른 관련어 제공 시스템(100)은, 먼저 사용자로부터 입력부(110)를 통해 검색어, 예컨대, '손해배상'이라는 검색어를 입력받는다(S202).Referring to FIG. 2, the related word providing system 100 according to the present invention first receives a search word, for example, a 'compensation for damage' from the user through the input unit 110 (S202).

이어, 관련어 제공 시스템(100)은 입력받은 검색어에 대해 언어 분별기(120)를 통해 외국어인지 한국어인지를 분별한다(S204).Subsequently, the related-language providing system 100 discriminates whether the foreign language or the Korean language is received through the language classifier 120 with respect to the input search word (S204).

이어, 관련어 제공 시스템(100)은 검색어에 대해 다국어 번역기(130)를 통해 각 국의 언어로 번역한다(S206). 여기서, 다국어 번역기(130)는 예를 들면, 구글 사이트의 번역기나 온토러스(ontorus)의 번역기 등을 들 수 있다.Subsequently, the related language providing system 100 translates the search word into a language of each country through the multilingual translator 130 (S206). Here, the multilingual translator 130 may be, for example, a translator of a Google site or a translator of an ontorus.

이어, 관련어 제공 시스템(100)은 한국어 검색어를 국내 관련 문서로부터 검색하거나(S208a), 번역된 검색어를 해외 관련 문서로부터 검색한다(S208b).Subsequently, the related-language providing system 100 searches for a Korean search word from a domestic related document (S208a), or searches for a translated search word from a foreign related document (S208b).

여기서, 관련 문서는 법률이나 법령, 판례, 학술 논문, 관련 법제, 해외 입법례, 언론 기사문, 민원상담 문서, 웹 문서 등을 포함할 수 있다.Here, the related document may include a law or a statute, a precedent, an academic paper, a related legal system, an overseas legislation, a press article, a civil complaint document, a web document, and the like.

이때, 관련어 제공 시스템(100)은 검색부(140)를 통해 검색어를 검색할 때, 국내의 법률, 판례, 논문 등에 관한 검색정보 데이터베이스(160)로부터 검색어를 검색하거나, 검색어를 다국어 번역기(130)를 통해 각 국의 언어로 번역한 번역 검색어를 통신망에 연결되어 있는 다른 외부(또는 해외) 법률이나 판례, 논문 등을 제공하는 데이터베이스 서버 등에 전달하여 해당 국가의 데이터베이스 서버 등으로부터 검색 결과를 수집할 수 있다.In this case, when the related word providing system 100 searches a search word through the search unit 140, the search word is searched from the search information database 160 regarding domestic laws, precedents, articles, or the like, or the search term is searched by the multilingual translator 130. You can collect the search results from the database server of the corresponding country by sending the translated search word translated into the language of each country to a database server that provides other external (or overseas) laws, precedents, or thesis connected to the communication network. have.

이어, 관련어 제공 시스템(100)은 국내 법률, 판례, 논문 중에서 검색어를 포함한 검색 결과를 얻거나(S210a), 해외 법률, 판례, 논문 중에서 검색어를 포함한 검색 결과를 얻는다(S210b).Subsequently, the related word providing system 100 obtains a search result including a search word among domestic laws, precedents, and articles (S210a), or obtains a search result including a search word among foreign laws, precedents and articles (S210b).

이어, 관련어 제공 시스템(100)은 국어 사전에 근거하여 국어 사전 중 명사 이외의 단어를 제외하여 명사(복합명사)만을 일반용어로 추출한다(S212a).Subsequently, the related language providing system 100 extracts only nouns (composite nouns) as general terms except words other than nouns in the Korean dictionary based on the Korean dictionary (S212a).

또한, 관련어 제공 시스템(100)은 각국 모국어 사전에 근거하여 각국 모국어 사전 중 명사 이외의 단어를 제외하여 명사(복합명사)만을 일반용어로 추출한다(S212b).In addition, the related-language providing system 100 extracts only nouns (composite nouns) as general terms, except for words other than nouns, from the native-language dictionaries based on the native-language dictionaries of each country (S212b).

이어, 관련어 제공 시스템(100)은 국어 사전에 근거해 추출한 일반용어들과각국 모국어 사전에 근거해 추출한 일반용어들을 용어 수집부(150)를 통해 그 빈도수와 함께 수집한다(S214a).Subsequently, the related language providing system 100 collects general terms extracted based on the Korean dictionary and general terms extracted based on the native language dictionary of each country together with the frequency through the term collection unit 150 (S214a).

한편, 관련어 제공 시스템(100)은 국내 법률, 판례, 논문 중에서 얻은 검색어를 포함한 검색 결과로부터 법률용어사전에 근거해 법률용어사전에 일치된 검색을 통해 한국어 법률용어를 추출한다(S212c).Meanwhile, the related term providing system 100 extracts Korean legal terminology through a search matched in a legal terminology dictionary, based on a legal terminology dictionary, from a search result including a search word obtained from domestic law, precedents, and thesis (S212c).

또한, 관련어 제공 시스템(100)은 해외 법률, 판례, 논문 중에서 얻은 검색어를 포함한 검색 결과로부터 각국 법률용어사전에 근거해 각국 법률용어사전과 일치된 검색을 통해 외국어 법률용어를 추출한다(S212d).In addition, the related-language providing system 100 extracts a foreign language terminology from a search result including a search word obtained from overseas law, precedents, and thesis through a search matched with a legal terminology dictionary of each country (S212d).

이어, 관련어 제공 시스템(100)은 국내 법률용어사전에 근거해 추출한 한국어 법률용어들과, 각국 법률용어사전에 근거해 추출한 외국어 법률용어들을 용어 수집부(150)를 통해 그 빈도수와 함께 수집한다(S214b).Subsequently, the related term providing system 100 collects the Korean legal terms extracted based on the domestic legal terminology dictionary and the foreign language legal terms extracted based on the legal terminology dictionary of each country together with the frequency through the term collecting unit 150 ( S214b).

이어, 관련어 제공 시스템(100)은 용어 수집부(150)에 의해 수집된 일반용어들 및 법률용어들에서, 제외어 사전을 적용하여 상기 제외어 사전에 등록된 용어를 제외한 후 이에 근거해 빈도수가 상위에 해당되는 일정 개수, 예컨대 50 개의 일반용어들 및 상위 30 개의 법률용어들을 각각 수집하고(S216)(각각 미리 설정된 일반용어 상위 순위 기준이 50이고 미리 설정된 법률용어 상위 순위 기준이 30인 경우), 온톨로지 생성부(160)를 통해 동적 온톨로지로 생성한다(S218).Subsequently, the related word providing system 100 excludes the terms registered in the negative dictionary by applying a negative dictionary from general terms and legal terms collected by the term collecting unit 150, and then, based on the related term, the frequency A certain number corresponding to the upper level, for example, 50 general terms and the top 30 legal terms are collected (S216), respectively (when each of the predetermined general term high rank criteria is 50 and the preset legal term high rank criterion is 30). In operation S218, the ontology generator 160 generates the dynamic ontology.

이어, 관련어 제공 시스템(100)은 관련어 제공부(170)를 통해 동적 온톨로지에서 빈도수가 하위에 해당되는 일정 개수, 예를 들면 4 개의 일반용어들과, 빈도수가 상위에 해당되는 일정 개수, 예를 들면, 6 개의 법률용어들을 도 3의 (가)에 도시된 바와 같이 관련어로 제공한다(S220).Subsequently, the related word providing system 100 uses the related word providing unit 170 in a certain number of frequencies corresponding to a lower frequency in the dynamic ontology, for example, four general terms and a predetermined number corresponding to the upper frequency. For example, six legal terms are provided as related words as shown in FIG. 3A (S220).

여기서, 도 3은 본 발명의 실시예에 따라 사용자로부터 입력받은 검색어와 관련성이 있는 관련어를 빈도수에 따라 하위 4개의 일반용어들과 상위 6 개의 법률용어들을 제공해 주는 예를 나타낸 도면이다. 도 3에 도시된 바와 같이, 검색어 "손해배상"과 관련성이 있는 관련어로서, 그 사용 빈도수에 따라 "주의의무", "과실상계", "손해배상청구권", "손해배상액", "교통사고", "소멸시효", "자동차손해배상보장법", "일실이익", "인과관계", "채무불이행" 등 10 개 관련어를 제공하고 있다.3 is a view showing an example of providing the lower four general terms and the upper six legal terms according to the frequency of a related word related to a search word input from a user according to an embodiment of the present invention. As shown in FIG. 3, the related word related to the term "compensation for damages", "duty of attention", "compensation for fault", "claim for damages", "compensation for damages", "traffic accident" depending on the frequency of use thereof It provides ten related terms such as "Extinctive Prescription", "Automobile Compensation Guarantee Act", "Loss Loss", "Cause", and "Debt default".

전술한 바와 같이 본 발명에 의하면, 검색어를 입력받으면, 입력된 검색어를 국내 또는 해외 법률, 판례, 논문 등 관련 문서에서 검색하고, 검색된 결과로부터 명사 이외의 단어를 제외시켜 명사만을 일반용어로 빈도수와 함께 추출하고, 또한 검색된 결과로부터 법률용어사전에 근거해 법률용어를 빈도수와 함께 추출하며, 그 빈도수가 상위에 해당되는 일반용어들과 법률용어들에 대해 제외어 사전을 적용하여 일정 개수의 일반용어 및 법률용어를 동적 온톨로지로 생성하고, 생성된 동적 온톨로지에서 빈도수가 하위에 해당되는 일정 개수의 일반용어와 빈도수가 상위에 해당되는 일정 개수의 법률용어를 관련어로 제공하도록 된, 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템을 실현할 수 있다.As described above, according to the present invention, when a search word is input, the search term is searched in related documents such as domestic or foreign laws, precedents, and thesis, and only words are searched in general terms by excluding words other than nouns from the search results. Extract the terminology together with the frequency based on the legal terminology dictionary from the searched results, and apply a negative dictionary to the general terms and legal terms with the highest frequency And a related term using a dynamic ontology, which generates a legal term as a dynamic ontology, and provides a predetermined number of general terms whose frequency is lower and a certain number of legal terms whose frequency is higher in the generated dynamic ontology as related words. The provision method and system can be realized.

본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고 다른 구체적인 형태로 실시될 수 있으므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
As those skilled in the art to which the present invention pertains may implement the present invention in other specific forms without changing the technical spirit or essential features, the embodiments described above should be understood as illustrative and not restrictive in all respects. Should be. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

본 발명에 따른 검색어를 이용한 관련어 제공 시스템은 검색어를 입력받아 그에 대한 검색 결과를 제공하는 웹 검색 사이트, 검색 서버 등에 적용할 수 있고, 시맨틱 웹 검색이나 시소러스 검색 서비스를 제공하는 서비스나 시스템 등에도 적용할 수 있다.The related word providing system using a search word according to the present invention can be applied to a web search site or a search server that receives a search word and provides a search result thereof, and also applies to a service or a system that provides a semantic web search or a thesaurus search service. can do.

또한, 본 발명에 따른 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템은 사용자가 이동하면서 검색어를 입력하여 그에 관련된 검색 결과를 얻고자 하는 기능이 탑재된 휴대폰이나 PDA, 스마트폰 등에도 적용할 수 있다.In addition, the method and system for providing a related word using the dynamic ontology according to the present invention can be applied to a mobile phone, a PDA, a smart phone, or the like equipped with a function of inputting a search word while the user moves to obtain a search result related thereto.

그리고, 본 발명에 따른 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템은 사용자가 인터넷과 같은 네트워크에 연결된 컴퓨터 장치를 통해 검색어를 입력하여 자체 데이터베이스 내 또는 외부 자료에서 그에 대한 결과를 얻고자 하는 클라이언트 단말기에도 적용할 수 있다.
In addition, the method and system for providing a related word using dynamic ontology according to the present invention can be applied to a client terminal in which a user inputs a search word through a computer device connected to a network such as the Internet and obtains a result thereof from an internal or external database. can do.

100 : 관련어 제공 시스템 110 : 입력부
120 : 언어 분별기 130 : 다국어 번역기
140 : 검색부 150 : 용어 수집부
160 : 온톨로지 생성부 170 : 관련어 제공부
180 : 검색정보 데이터베이스
100: related word providing system 110: input unit
120: language classifier 130: multilingual translator
140: search unit 150: term collection unit
160: ontology generation unit 170: related words providing unit
180: search information database

Claims (7)

모국어 사전과 법률용어사전 및 제외어 사전을 적용하는 시스템의 동적 온톨로지를 이용한 관련어 제공 방법으로서,
(a) 사용자로부터 검색어를 입력받는 단계;
(b) 상기 검색어를 국내 및 해외의 관련 문서에서 검색하는 단계;
(c) 상기 검색된 결과로부터 상기 모국어 사전에 근거해 명사 이외의 단어를 제외하여 명사만을 일반용어로 빈도수와 함께 수집하는 단계;
(c') 상기 검색된 결과로부터 상기 법률용어사전에 근거해 법률용어들을 빈도수와 함께 수집하는 단계;
(d) 상기 제외어 사전에 등록된 용어를 제외하고 상기 빈도수가 미리 설정된 일반용어 상위 순위 기준에 해당되는 일정 개수의 일반용어들 및 상기 빈도수가 미리 설정된 법률용어 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 각각 수집해 동적 온톨로지로 생성하는 단계; 및
(e) 상기 동적 온톨로지에서 빈도수가 미리 설정된 일반용어 하위 순위 기준에 해당되는 일정 개수의 일반용어들과, 빈도수가 미리 설정된 법률용어 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 관련어로 제공하는 단계;
를 포함하는 동적 온톨로지를 이용한 관련어 제공 방법.
As a method of providing related words using dynamic ontology of a system that applies a native language dictionary, a legal terminology dictionary and a negative dictionary,
(a) receiving a search word from a user;
(b) searching for the search term in related documents in Korea and abroad;
(c) collecting only nouns in common terminology with frequency, except for words other than nouns, based on the native language dictionary from the searched results;
(c ') collecting legal terms with frequency based on the legal term dictionary from the searched results;
(d) Except for the terms registered in the negative dictionary, a certain number of general terms in which the frequency corresponds to a preset general term high priority criterion and a predetermined number of regular terms in which the frequency corresponds to a preset high term legal criterion Collecting each legal term and generating a dynamic ontology; And
(e) providing a predetermined number of general terms corresponding to a general term lower rank criterion with a predetermined frequency in the dynamic ontology and a predetermined number of legal terms corresponding to a higher rank criterion with a preset frequency as related words ;
Related language providing method using a dynamic ontology comprising a.
제 1 항에 있어서,
상기 (b) 단계에서, 상기 관련 문서는 법률이나 법령, 판례, 학술 논문, 관련 법제, 해외 입법례, 언론 기사문, 민원상담 문서, 웹 문서 등을 포함하는 것을 특징으로 하는 동적 온톨로지를 이용한 관련어 제공 방법.
The method of claim 1,
In the step (b), the related document provides a related word using a dynamic ontology, characterized in that it includes a law or statutes, precedents, academic papers, related legislation, overseas legislation, media articles, civil counseling documents, web documents, etc. .
제 1 항에 있어서,
상기 (b) 단계는, 상기 검색어를 상기 국내의 관련 문서에서 검색함과 더불어, 상기 검색어를 다국어 번역기를 통해 각 국의 언어로 번역한 번역 검색어를 상기 해외의 관련 문서에서 검색하는 것을 특징으로 하는 동적 온톨로지를 이용한 관련어 제공 방법.
The method of claim 1,
In the step (b), the search term is searched in the related document of the domestic, and the search term in which the search word is translated in the language of each country through a multilingual translator is searched in the related document of the foreign country. Method for providing related words using dynamic ontology.
제 1 항에 있어서,
상기 (c) 단계는, 국어사전 및 각 국의 모국어 사전을 근거로 명사 이외의 단어를 제외하여 명사 및 복합명사만을 상기 일반용어로 수집하고, 상기 (c') 단계는 국내 법률용어사전 및 각국의 법률용어사전에서 한국어 법률용어 및 외국어 법률용어를 수집하고 제외어 사전을 근거로 상기 제외어 사전에 등록된 용어를 제외하는 것을 특징으로 하는 동적 온톨로지를 이용한 관련어 제공 방법.
The method of claim 1,
In the step (c), only nouns and compound nouns are collected in the general term, except for words other than nouns, based on the Korean dictionary and the native language dictionary of each country. A method for providing related terms using a dynamic ontology, characterized by collecting Korean legal terms and foreign language legal terms from the legal terminology dictionary and excluding the terms registered in the negative dictionary based on the negative dictionary.
사용자로부터 검색어를 입력받기 위한 입력부;
상기 검색어를 한국어 또는 외국어로 분별하는 언어 분별기;
상기 검색어를 각 국의 언어로 번역하여 번역 검색어로 제공하는 다국어 번역기;
상기 검색어를 국내 관련 문서에서 검색하고, 상기 번역 검색어를 해외 관련 문서에서 검색하는 검색부;
상기 검색부의 검색 결과로부터 국어사전 및 각 국의 모국어 사전 중 명사 이외의 단어를 제외하여 명사만을 일반용어로 빈도수와 함께 수집하고, 상기 검색 부의 검색 결과로부터 법률용어사전에 근거해 법률용어들을 빈도수와 함께 수집하는 용어 수집부;
상기 용어 수집부에 의해 수집된 일반용어들 및 법률용어들에서, 제외어 사전에 등록된 용어를 제외하여 상기 빈도수가 미리 설정된 일반용어 상위 순위 기준에 해당되는 일정 개수의 일반용어들과, 상기 빈도수가 미리 설정된 법률용어 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 각각 수집해 동적 온톨로지로 생성하는 온톨로지 생성부; 및
상기 온톨로지 생성부에 의해 생성된 동적 온톨로지로부터 빈도수가 미리 설정된 일반용어 하위 순위 기준에 해당되는 일정 개수의 일반용어들 및 빈도수가 미리 설정된 법률용어 상위 순위 기준에 해당되는 일정 개수의 법률용어들을 관련어로 제공하는 관련어 제공부;
를 포함하는 동적 온톨로지를 이용한 관련어 제공 시스템.
An input unit for receiving a search word from a user;
A language classifier for classifying the search word into Korean or a foreign language;
A multilingual translator that translates the search term into a language of each country and provides the translated search term;
A search unit for searching the search term in a domestic related document and searching the translated search term in an overseas related document;
From the search result of the search unit, only the nouns are collected with the common term except the words other than the nouns in the Korean dictionary and the native language dictionary of each country, and the frequency of the legal terms is calculated based on the legal term dictionary from the search result of the search unit. A term collecting unit to collect together;
In the general terms and legal terms collected by the term collection unit, a predetermined number of general terms corresponding to the general term higher ranking criteria except for the terms registered in the negative dictionary and the frequency An ontology generation unit configured to collect a predetermined number of legal terms corresponding to a predetermined legal term upper rank criterion and generate the dynamic ontology; And
From the dynamic ontology generated by the ontology generating unit, a certain number of general terms corresponding to a predetermined general term lower priority criterion and a predetermined number of legal terms corresponding to a higher legal criterion preset frequency are related. A related word providing unit to provide;
Related language providing system using a dynamic ontology comprising a.
제 5 항에 있어서,
상기 관련 문서는 법률이나 법령, 판례, 학술 논문, 관련 법제, 해외 입법례, 언론 기사문, 민원상담 문서, 웹 문서 등을 포함하는 것을 특징으로 하는 동적 온톨로지를 이용한 관련어 제공 시스템.
The method of claim 5, wherein
The related document is a related language providing system using a dynamic ontology, characterized in that it includes a law or statutes, precedents, academic papers, related legislation, foreign legislative cases, media articles, civil consultation documents, web documents, and the like.
제 5 항에 있어서,
상기 용어 수집부는, 국어사전 및 각 국의 모국어 사전에 근거해 명사 이외의 단어를 제외하여 명사 및 복합명사만을 상기 일반용어로 수집하고, 국내 법률용어사전 및 각국의 법률용어사전에서 한국어 법률용어 및 외국어 법률용어를 적용하여 상기 법률용어를 수집하고 제외어 사전을 근거로 상기 제외어 사전에 등록된 용어를 제외하는 것을 특징으로 하는 동적 온톨로지를 이용한 관련어 제공 시스템.
The method of claim 5, wherein
The term collection unit collects only nouns and compound nouns in the general term, except words other than nouns, based on the Korean dictionary and the native language dictionary of each country, and the Korean legal terminology and the legal terminology dictionary of each country. A related language providing system using a dynamic ontology, characterized in that the legal terminology is applied by applying a foreign language legal term and the term registered in the negative dictionary is excluded based on the negative dictionary.
KR1020100085013A 2010-08-31 2010-08-31 System and method for providing a related term using the dynamic ontology KR101223987B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100085013A KR101223987B1 (en) 2010-08-31 2010-08-31 System and method for providing a related term using the dynamic ontology

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100085013A KR101223987B1 (en) 2010-08-31 2010-08-31 System and method for providing a related term using the dynamic ontology

Publications (2)

Publication Number Publication Date
KR20120021007A KR20120021007A (en) 2012-03-08
KR101223987B1 true KR101223987B1 (en) 2013-01-24

Family

ID=46129491

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100085013A KR101223987B1 (en) 2010-08-31 2010-08-31 System and method for providing a related term using the dynamic ontology

Country Status (1)

Country Link
KR (1) KR101223987B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230174141A (en) 2022-06-20 2023-12-27 주식회사 하이빅데이터미디어 Database-based technical terminology translation and learning methods and systems for overseas papers in specific fields

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101441529B1 (en) * 2013-02-26 2014-09-18 한국과학기술정보연구원 method of providing adaptive ontology information, apparatus for providing adaptive ontology information, and storage medium for storing a program providing adaptive ontology information
KR101707941B1 (en) * 2015-12-09 2017-02-27 펄슨정보기술 주식회사 Method, device and computer readable recording medium for searching precedent using automatic coversion between general term and legal term

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100396826B1 (en) 2000-05-31 2003-09-02 주식회사 지식정보 Term-based cluster management system and method for query processing in information retrieval
KR100818357B1 (en) 2006-05-10 2008-04-02 (주)윕스 Presenting System of Keyword Using Associative Model and Method Thereof
KR20090117110A (en) * 2008-05-08 2009-11-12 주식회사 케이티 Apparatus for generating ontology based on association and method thereof
KR20110025893A (en) * 2008-02-22 2011-03-14 리드 홀스 테크놀로지스 인코포레이티드 Automated ontology generation system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100396826B1 (en) 2000-05-31 2003-09-02 주식회사 지식정보 Term-based cluster management system and method for query processing in information retrieval
KR100818357B1 (en) 2006-05-10 2008-04-02 (주)윕스 Presenting System of Keyword Using Associative Model and Method Thereof
KR20110025893A (en) * 2008-02-22 2011-03-14 리드 홀스 테크놀로지스 인코포레이티드 Automated ontology generation system and method
KR20090117110A (en) * 2008-05-08 2009-11-12 주식회사 케이티 Apparatus for generating ontology based on association and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230174141A (en) 2022-06-20 2023-12-27 주식회사 하이빅데이터미디어 Database-based technical terminology translation and learning methods and systems for overseas papers in specific fields

Also Published As

Publication number Publication date
KR20120021007A (en) 2012-03-08

Similar Documents

Publication Publication Date Title
CA2702651C (en) System and method for searching for documents
US20150088846A1 (en) Suggesting keywords for search engine optimization
CN102200975A (en) Vertical search engine system and method using semantic analysis
US20110208715A1 (en) Automatically mining intents of a group of queries
CN102567441B (en) The situation providing relevant to user conversation is pointed out
CN101639857A (en) Method, device and system for establishing knowledge questioning and answering sharing platform
CN103430172A (en) Search apparatus, search method, and program
CN110232126B (en) Hot spot mining method, server and computer readable storage medium
CN103116635A (en) Field-oriented method and system for collecting invisible web resources
US8700624B1 (en) Collaborative search apps platform for web search
Roy et al. An overview of semantic search engines
KR101223987B1 (en) System and method for providing a related term using the dynamic ontology
TWI682286B (en) System for document searching using results of text analysis and natural language input
US20150039581A1 (en) Semantic Search System Interface and Method
US20140358969A1 (en) Method for searching in a database
CN107315735B (en) Method and equipment for note arrangement
KR101446154B1 (en) System and method for searching semantic contents using user query expansion
WO2012091541A1 (en) A semantic web constructor system and a method thereof
US20120023119A1 (en) Data searching system
Khan et al. How They Tweet? An Insightful Analysis of Twitter Handles of Saudi Arabia
KR101347123B1 (en) Apparatus and Method for Searching Information, Computer Readable Recording Medium
Liu et al. An improved full-text retrieval for elementary education resource database system
KR101223984B1 (en) Multi-layered information service system and method through a law information site
KR101382365B1 (en) Information map service system and method using a site of law information
KR101776806B1 (en) Method for context based keyword search and system for the same

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant