KR101083804B1 - Ontology Based Method And System For Searching Similar Civil Petition - Google Patents
Ontology Based Method And System For Searching Similar Civil Petition Download PDFInfo
- Publication number
- KR101083804B1 KR101083804B1 KR1020090074875A KR20090074875A KR101083804B1 KR 101083804 B1 KR101083804 B1 KR 101083804B1 KR 1020090074875 A KR1020090074875 A KR 1020090074875A KR 20090074875 A KR20090074875 A KR 20090074875A KR 101083804 B1 KR101083804 B1 KR 101083804B1
- Authority
- KR
- South Korea
- Prior art keywords
- complaint
- instance
- similar
- existing
- new
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 신규민원에 대한 검색데이터를 입력받아 검색데이터로부터 주제어를 추출하는 단계; 신규민원이 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 단계; 주제어와 용어를 비교하여 신규민원과 기존민원의 유사성을 판단하는 유사판단규칙을 이용해 기존에 제기되었던 기존민원과 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들 가운데 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 단계; 및 신규민원과 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 단계;를 포함하는 온톨로지에 기반한 유사민원검색방법 및 이를 구현한 시스템에 관한 것이다.The present invention comprises the steps of extracting the main word from the search data received the search data for the new complaint; Generating a query instance expressing the new complaint in the form of a triple by an ontology; Among the complaint instances expressing the inclusion relationship of existing complaints and existing complaints in triple form by ontology using the similar judgment rule that compares the main words and terms. Retrieving a complaint instance for an existing complaint similar to a new complaint; And generating a result instance expressing a similar relationship between the new complaint and the existing complaint of the retrieved complaint instance. The present invention relates to a method for retrieving similar complaints based on ontology and a system implementing the same.
본 발명에 의할 경우 신규 민원이 입력되면 신규 민원과 유사한 기존 민원 및 그와 관련된 부가데이터들이 자동으로 검색되므로 신규 민원에 대한 신속하고 용이한 처리가 가능해지는 장점이 있다.According to the present invention, when a new complaint is input, an existing complaint similar to the new complaint and additional data related thereto are automatically searched, thereby enabling a quick and easy process for the new complaint.
민원, 온톨로지, 검색 Complaint, ontology, search
Description
본 발명은 신규민원과 유사한 기존 민원을 검색하는 방법 및 시스템에 관한 것으로, 구체적으로는 신규민원의 주제어를 추출하여 신규민원과 주제어에 대해 온톨로지에 의한 트리플 형태로 표현되는 질의인스턴스를 생성하고 기존 민원과 그 민원이 포함하는 용어에 대한 민원인스턴스와 질의인스턴스가 유사판단규칙을 만족하는지를 판단하여 신규민원과 유사한 기존민원을 검색하는 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for retrieving an existing complaint similar to a new complaint, and specifically, extracts the main word of the new complaint and generates a query instance expressed in triple form by the ontology for the new complaint and the subject. The present invention relates to a method and system for retrieving an existing complaint similar to a new complaint by determining whether the complaint instance and the query instance satisfy the similar judgment rule.
민원이라 함은 한 지역의 주민이 그 지역의 행정기관에 대하여 원하는 바를 요구하는 일을 말한다. 이러한 민원에 대한 사무는 허가, 인가, 면허, 등록 등의 신청이나 이의 신청, 진정, 건의, 질의 따위에 관한 사무이다. 종래의 민원사무에서는 이러한 민원을 처리하기 위해 민원 접수자가 민원명이나 민원 내용을 읽어본 후 이를 분류해 민원 담당자에게 전달한 후 민원 담당자가 다시 민원의 민원명이나 민원 내용을 읽어보고 이를 처리해야 했다.Complaint means a request for a resident of a region to make a request to an administrative body of that region. The affairs of such complaints are those concerning applications for permits, authorizations, licenses, registrations, etc., or appeals, complaints, recommendations, and inquiries. In the conventional civil affairs, in order to deal with such complaints, the complaint recipient reads the name of the complaint or the content of the complaint, classifies it, passes it to the person in charge of the complaint, and the person in charge of the complaint has to read the complaint name or the content of the complaint again and process it.
그런데 이러한 민원의 용이한 처리를 위해 민원 담당자는 새로운 민원과 유 사한 종래의 유사한 민원을 민원 담당자가 민원의 내용을 모두 읽어본 후 스스로 새로운 민원의 키워드나 주제어를 선택한 후 이를 민원 검색 프로그램의 검색어 입력창에 입력하고 그에 따라 열거되는 여러 민원들의 내용을 모두 읽어본 후 유사한 민원을 선택해야 했으나 이는 매우 번거롭고 시간과 노력이 이중으로 소요되는 문제점이 있었다.However, for the easy handling of these complaints, the civil service officer reads all the contents of the civil complaints, similar to the new civil complaints, and then selects a new keyword or the subject of the complaint and inputs the search term of the civil search program. After reading the contents of the various complaints entered into the window and reading them, the similar complaints had to be selected, but this was very cumbersome and required a double time and effort.
또한 민원인은 자신의 민원에 대한 처리 기간이나 수수료, 처리흐름, 관련 법규 등 자신의 민원과 연관된 부가 정보들을 정확하게 알기 어려웠고 민원인이 전문가가 아닌 경우에는 자신의 민원에 대한 처리 결과를 예상하기 어려웠다. 따라서 민원인은 자신의 민원에 대한 부가 정보나 처리 결과를 예상하기 위해 자신의 민원의 키워드 또는 주제어라고 판단되는 단어나 핵심 문장 등을 민원 검색 프로그램의 검색어 입력창에 입력한 후 역시 그 결과로 검색되는 여러 민원들의 내용을 모두 읽어본 후 유사 민원을 선택해야 했으나 이는 일반 민원인에게는 용이하지 않다는 문제점이 있었다.In addition, it was difficult for the complainant to know the additional information related to his complaint, such as the processing period, fees, processing flows, and related laws of the complaint, and it was difficult to predict the outcome of the complaint if the complainant was not an expert. Therefore, in order to anticipate additional information or processing results of a complaint, the complainant inputs a word or key sentence that is considered to be a keyword or a subject of the complaint in the search term input box of the complaint search program and is also searched for as a result. After reading the contents of various complaints, it was necessary to select similar complaints, but this was not easy for ordinary complaints.
또한 기존의 단순한 키워드 매칭에 의한 검색 방식에 의할 경우 검색어 입력창에 입력한 검색어가 반드시 포함된 민원들만이 검색되어 검색어를 잘못 선택한 경우에는 유사 민원이 존재하는 경우에도 그 유사 민원이 검색되기 어려웠으며 유사 민원이 검색된다 해도 그 민원의 내용만이 검색되어 처리기간이나 처리흐름, 담당자, 관련 법규 등을 알기 어려운 문제점이 있었다In addition, in the case of the existing simple keyword matching method, only those complaints that include the search term entered in the search box input are searched. Even though similar complaints were searched, only the contents of the complaints were searched, so it was difficult to know the processing period, the processing flow, the person in charge, the related laws, etc.
상기한 문제를 해결하기 위해 본 발명은 온톨로지에 기반하되 유사판단규칙에 따라 신규민원과 유사한 기존 민원을 검색하는 방법 및 시스템을 제공하는 것을 목적으로 한다.In order to solve the above problems, an object of the present invention is to provide a method and system for searching for existing complaints similar to new complaints based on the ontology based on the similar decision rule.
상기한 기술적 과제를 달성하기 위한 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색시스템은 신규민원에 대한 검색데이터를 입력받아 상기 검색데이터로부터 주제어를 추출하는 추출부; 상기 신규민원이 상기 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 생성부; 기존에 제기되었던 기존민원과 상기 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들을 저장하고 있는 인스턴스저장부; 및 상기 주제어와 상기 용어를 비교하여 상기 신규민원과 상기 기존민원의 유사성을 판단하는 유사판단규칙을 이용해 상기 검색데이터와 유사한 기존민원에 대한 민원인스턴스를 검색하여 상기 검색데이터와 상기 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 검색부;를 포함한다.An ontology-based similar complaint search system according to an embodiment of the present invention for achieving the above technical problem is an extraction unit for receiving the search data for the new complaints to extract the main word from the search data; A generation unit for generating a query instance expressing that the new complaint includes the main word in a triple form by an ontology; An instance storage unit for storing the existing civil complaints and the civil complaint instances expressing the inclusion relationship of the terms included in the existing civil complaints in triple form by the ontology; And searching for an instance of an existing complaint similar to the search data by using a similar decision rule that compares the main term and the term to determine the similarity between the new complaint and the existing complaint. It includes; search unit for generating a result instance representing the similarity of the complaint.
상기한 기술적 과제를 달성하기 위한 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색방법은 신규민원에 대한 검색데이터를 입력받아 상기 검색데이터로부터 주제어를 추출하는 단계; 상기 신규민원이 상기 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 단계; 상기 주제어 와 상기 용어를 비교하여 상기 신규민원과 상기 기존민원의 유사성을 판단하는 유사판단규칙을 이용해 기존에 제기되었던 기존민원과 상기 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들 가운데 상기 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 단계; 및 상기 신규민원과 상기 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 단계;를 포함한다.Ontology-based similar complaint search method according to an embodiment of the present invention for achieving the above technical problem is the step of extracting the main word from the search data received the search data for the new complaint; Generating a query instance expressing that the new complaint includes the main word in a triple form by ontology; Expressing the inclusion relationship between the existing complaints and terms included in the existing complaints in triple form by the ontology by using the similar judgment rule to compare the main term and the terms to determine the similarity between the new complaints and the existing complaints Retrieving a complaint instance for an existing complaint similar to the new complaint among the complaint instances; And generating a result instance representing a similar relationship between the new complaint and an existing complaint of the retrieved complaint instance.
또한, 이하에서는 상기 기재된 온톨로지에 기반한 유사민원검색방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.In addition, the following provides a computer-readable recording medium having recorded thereon a program for executing a similar complaint search method based on the ontology described above.
본 발명에 의할 경우 제기하고자 하는 신규 민원과 유사한 기존 민원이 자동으로 검색되므로 민원 사무의 처리 단계가 간소화되어 민원 사무의 처리가 보다 신속 및 용이해지고 민원인은 민원에 대한 전문 지식이 없이도 자신의 민원과 유사한 민원 및 그 처리 결과가 자동으로 검색된다는 장점이 있다.According to the present invention, existing complaints similar to the new complaints to be filed are automatically searched, thereby simplifying the processing process of the civil affairs, making the process of civil affairs quicker and easier, and the civil affairs of the civil affairs without the professional knowledge of the civil affairs. Similarly, the complaints and their processing results are automatically retrieved.
또한 온톨로지 기술에 근거하여 유사 민원이 검색되므로 유사민원을 검색하고자 하는 사람은 반드시 정확한 키워드를 입력하지 않아도 온톨로지에 의한 추론방식에 의해 입력한 검색어데이터와 관련이 있는 유사민원이 검색된다는 장점이 있다.In addition, since similar complaints are searched based on the ontology technology, a person seeking to search for similar complaints has an advantage that similar complaints related to the search term data input by the ontology inference method are searched without necessarily inputting an exact keyword.
본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발 명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.Embodiments of the present invention are provided to more fully explain the present invention to those skilled in the art, the following examples can be modified in many different forms, the scope of the invention It is not limited to the following example. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the inventive concept to those skilled in the art.
본 명세서에서 사용된 용어는 특정 실시예를 설명하기 위하여 사용되며, 본 발명을 제한하기 위한 것이 아니다. 본 명세서에서 사용된 바와 같이, 단수 형태는 문맥상 다른 경우를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있으며, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함한다. 또한, 본 명세서에서 사용되는 경우 "포함한다(comprise)" 및/또는 "포함하는(comprising)"은 언급한 단계, 동작, 구성요소 및/또는 이들의 그룹들의 존재 또는 부가를 배제하는 것이 아니다.The terminology used herein is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. As used herein, the singular forms "a", "an" and "the" are intended to include the plural forms as well, unless the context clearly indicates otherwise. The term "and / or" includes any and all combinations of one or more of the listed items. It includes. Also, as used herein, “comprise” and / or “comprising” does not exclude the presence or addition of the steps, operations, components, and / or groups thereof mentioned.
본 명세서에서 제1, 제2 등의 용어가 다양한 단계, 동작 및/또는 구성요소를 설명하기 위하여 사용되지만, 이들 단계, 동작 및/또는 구성요소는 이들 용어에 의해 한정되어서는 안됨은 자명하다. 이들 용어는 하나의 단계, 동작 또는 구성요소를 다른 단계, 동작 또는 구성요소와 구별하기 위하여만 사용된다. 따라서, 이하 상술할 제1단계, 동작 또는 구성요소는 본 발명의 가르침으로부터 벗어나지 않고서도 제2단계, 동작 또는 구성요소를 지칭할 수 있다.Although terms such as first and second are used herein to describe various steps, operations and / or components, it is obvious that these steps, operations and / or components should not be limited by these terms. These terms are only used to distinguish one step, operation or component from another step, operation or component. Accordingly, the first step, operation or component described below may refer to the second step, operation or component without departing from the teachings of the present invention.
본 발명의 실시예들을 설명하기에 앞서 이하에서 사용할 용어들과 개념을 간략히 설명한다.Prior to describing the embodiments of the present invention, terms and concepts to be used below are briefly described.
시맨틱 웹(semantic web)은 현재의 인터넷과 같은 분산 환경에서 리소스(웹 문서, 각종 파일, 서비스 등)에 대한 정보와 자원 사이의 관계-의미 정보(semanteme)를 기계, 즉 컴퓨터가 처리할 수 있는 온톨로지(ontology) 형태로 표현하고, 이를 자동화된 기계가 처리하도록 하는 프레임워크이자 기술이다. 여기서, 온톨로지란 사람들이 사물에 대해 생각하는 바를 추상화하고 공유한 모델로서, 정형화되고 개념의 유형이나 사용상의 제약 조건들이 명시적으로 정의된 기술을 말한다. 컴퓨터 과학 분야에서 온톨로지는 특정한 영역을 표현하는 데이터 모델로서 특정한 영역(domain)에 속하는 개념과 개념 사이의 관계를 기술하는 정형(formal) 어휘의 집합으로 정의된다. 특히, 온톨로지는 시맨틱 웹을 구현할 수 있는 도구로써, 지식 개념을 의미적으로 연결할 수 있는 도구로 사용되며, 컴퓨터에서 사람이 갖고 있는 사물에 대한 개념을 일종의 데이터베이스의 형태로 가공하여 처리할 수 있도록 해 준다.The semantic web is a machine, or computer, that can process information about resources (web documents, various files, services, etc.) and the relationships between them in a distributed environment such as the Internet. It is a framework and technology that expresses it in the form of ontology and allows an automated machine to process it. Here, ontology is a model that abstracts and shares what people think about things, and is a technology that has been formalized and explicitly defined types of concepts or usage constraints. In the field of computer science, ontology is a data model that represents a specific domain and is defined as a set of formal vocabularies describing the concepts and relationships between them. In particular, ontology is a tool that can implement the semantic web. It is used as a tool that can semantically connect knowledge concepts, and it enables the computer to process and process the concept of things in the form of a database. give.
시맨틱 웹은 XML(Extensible Markup Language)에 기반한 시맨틱 마크업 언어로써 표현될 수 있다. 이러한 시맨틱 웹에서는 주체(subject), 술어(predicate), 객체(object)의 트리플(triple) 형태로 개념을 표현하며, 다시 각각의 주체, 술어, 객체는 XML의 URI(Uniform Resource Identifier)로 표현될 수 있다. 현재 시맨틱 웹 온톨로지를 기술하는 표준 언어로 W3C에서 제안한 RDF, RDF-Schema, OWL, SW RL 그리고 ISO에서 제안한 TopicMaps 등이 있다.The semantic web can be expressed as a semantic markup language based on XML (Extensible Markup Language). In the semantic web, the concept is expressed in triple form of subject, predicate, and object, and each subject, predicate, and object are represented as a Uniform Resource Identifier (URI) of XML. Can be. Currently, standard languages describing semantic web ontology include RDF, RDF-Schema, OWL, SW RL, and ISO proposed TopicMaps.
이하, 첨부한 도면들을 참조하여, 본 발명의 실시예를 보다 상세하게 설명하고자 한다. 설명의 편이와 명확성을 위하여 도면 상의 동일한 구성요소에 대해서는 동일한 참조부호가 사용되었으며 설명과 관계없는 부분이나 동일한 구성요소에 대 한 중복된 설명은 생략되었다.Hereinafter, with reference to the accompanying drawings, it will be described in detail an embodiment of the present invention. The same reference numerals are used for the same elements in the drawings for ease of explanation and clarity, and duplicate descriptions of portions that are not related to the description or the same elements are omitted.
도 1은 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색시스템의 구성을 도시한 구성도이다. 도 1에서 유사민원검색시스템(1)은 서비스제공 인터페이스(2)와 데이터를 교환하며, 유사민원검색시스템(1)은 추출부(10), 생성부(20), 검색부(30), 결과처리부(40), 인스턴스저장부(50), 추론부(60) 및 추론규칙저장부(70)를 포함한다.1 is a block diagram showing the configuration of a similar complaint search system based on the ontology according to an embodiment of the present invention. In FIG. 1, the similar
서비스제공 인터페이스(2)는 외부와 유사민원 검색시스템(1) 간의 데이터 교환을 담당하는 인터페이스이다. 서비스제공 인터페이스(2)는 외부의 검색 서비스 프로그램 등으로부터 기존민원 가운데 신규민원과 유사한 기존민원의 검색 및/또는 이와 관련된 부가데이터의 제공을 요청받으면 신규민원을 유사민원검색시스템(1)으로 전달한다. The
이를 위해 서비스제공 인터페이스(2)는 신규민원에 대한 검색데이터를 유사민원검색시스템(1)으로 전달한다. 또한 서비스제공 인터페이스(2)는 유사민원시스템(1)으로부터 신규민원과 유사한 것으로 판단된 기존민원 및/또는 이와 관련된 부가데이터 등을 전달받아 이를 외부의 검색 서비스 프로그램 등으로 제공한다.To this end, the
신규민원은 본 발명의 사용자가 제기하고자 하는 새로운 민원을 말하고 기존은 기존에 작성 및 제기되어 처리된 민원으로 유사민원검색시스템(1)의 인스턴스저장부(50)에 관련된 온톨로지에 의한 트리플 형태로 표현되는 인스턴스가 이미 생성되어 저장되어 있는 것을 말한다.The new complaint refers to a new complaint that the user of the present invention intends to raise, and the existing complaint is a previously created and filed complaint that is expressed in triple form by an ontology related to the
추출부(10)는 신규민원에 대한 검색데이터를 입력받아 검색데이터로부터 신 규민원의 주제어를 추출한다. 검색데이터는 본 발명의 이전에 제기되었던 민원들 가운데 신규민원과 유사한 기존민원을 검색하고자 본 발명의 사용자가 신규민원에 대한 것으로 검색어 입력창 등에 입력한 데이터를 말한다. The
검색데이터는 민원의 명칭이나 민원의 대상에 대한 용어나 용어들이 될 수도 있고, 신규민원에 대한 자연어로 된 문장일 수도 있다. 또한 검색데이터는 신규민원 내용 전체가 될 수도 있다.The search data can be the name or terminology of the complaint, the subject of the complaint, or a sentence in natural language for the new complaint. Search data can also be the entire content of a new complaint.
추출부(10)가 추출할 수 있는 주제어는 그 주제어가 될 수 있는 후보 단어들이 정해져 있어 추출부(10)는 그 후보들과 일치하는 단어가 검색데이터에 포함되어 있는지를 검색하여 추출한다. 추출부(10)는 하나의 검색데이터에 대해 이러한 주제어를 하나 또는 복수개 추출할 수 있으며 이러한 주제어 추출에는 형태소 분석 등의 방법이 이용될 수 있다. As the main word that can be extracted by the
예를 들어 후보 단어 가운데 하나가 "부유먼지"인 경우 추출부(10)는 검색데이터에 "부유먼지"라는 단어가 포함되어 있는지를 검색하고 검색데이터에 "부유먼지"가 포함되어 있는 경우에는 "부유먼지"를 주제어로 추출할 것이다.For example, when one of the candidate words is "floating dust", the
또한 추출부(10)는 매칭(matching) 등의 방식을 통해 검색데이터에 포함되어 있는 비정규 단어들을 정규화하여 주제어로 변환해 추출할 수도 있다. 예를 들어 주제어의 후보 단어가 "부유먼지"인데 검색데이터에 "떠다니는 먼지", "부유 먼지" 또는 "대기 먼지" 등이 포함되어 있는 경우 추출부(10)는 이러한 검색데이터에 포함된 단어들을 "부유먼지"와 매칭(matching)시켜 "부유먼지"를 주제어로 추출할 수 있다.Also, the
생성부(20)는 추출부(10)가 주제어를 추출한 경우 질의인스턴스를 생성한다. 질의인스턴스는 신규민원이 추출부(10)가 추출한 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 인스턴스를 말한다.The
예를 들어 민원의 클래스가 d로 표현되고 그 주제어의 클래스가 w이며, 각각의 인스턴스는 그 뒤에 숫자가 병기되는 것이라 가정한다. 이 경우 신규민원이 d1이고 추출부(10)가 추출한 주제어가 w1이라면, 생성부(20)가 생성한 질의인스턴스는 HasWord(d1, w1)와 같이 표현될 수 있다. 이는 d1이라는 민원의 주제어가 w1임을 나타낸다. 여기서 주체는 d1, 객체는 w1이며 술어는 HasWord가 될 것이다. For example, suppose the class of a complaint is represented by d, its main class is w, and each instance is followed by a number. In this case, if the new complaint is d1 and the main word extracted by the
이를 앞서의 "부유먼지"의 예에 적용시켜 보면 d1이라는 신규민원의 주제어가 "부유먼지"인 경우 생성부(20)는 HasWord(d1, 부유먼지)라는 질의인스턴스를 생성할 것이다. 생성부(20)는 이렇게 생성된 질의인스턴스를 인스턴스저장부(50)에 저장할 수 있다.Applying this to the example of "floating dust", if the subject of the new complaint named d1 is "floating dust," the
검색부(30)는 유사판단규칙을 이용해 신규민원과 유사한 기존민원에 대한 민원인스턴스가 인스턴스저장부(50)에 저장되어 있는지 검색한다. 그리고 검색부(30)는 신규민원과 유사한 기존민원에 대한 민원인스턴스가 검색되면 결과인스턴스를 생성한다.The
민원인스턴스는 행정 기관에 대한 기존민원과 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현한 인스턴스이며 그 기본적인 형식은 질의인스턴스와 같다. 예를 들어 기존 민원이 d2이고, d2가 w1이라는 용어를 포함하는 경우 민원인스턴스는 HasWord(d2, w1)일 것이다. 이러한 민원인스턴스들은 인스턴스저장부(50)에 미리 저장되어 있다. 이러한 민원인스턴스에 포함되는 용어는 기존민원을 대표하는 것으로 선택되는 것이 바람직하다.Complaint instance is an instance expressing the relationship between the existing complaints about the administrative agency and terms contained in the existing complaints in triple form by ontology, and its basic form is the same as the query instance. For example, if the existing complaint is d2 and d2 contains the term w1, the complaint instance would be HasWord (d2, w1). These complaint instances are previously stored in the
결과인스턴스는 신규민원과 검색된 민원인스턴스의 기존민원의 유사관계를 온톨로지에 의한 트리플 형태로 표현하는 인스턴스를 말한다. 예를 들어 d1이라는 신규민원과 d2라는 기존민원이 유사하다고 판단되는 경우 결과인스턴스는 SimPet(d1, d2)와 같이 표현될 수 있다.The result instance is an instance expressing the similar relationship between the new complaint and the existing complaint of the retrieved complaint instance in a triple form by the ontology. For example, if it is determined that a new complaint called d1 and an existing complaint called d2 are similar, the resulting instance may be expressed as SimPet (d1, d2).
유사판단규칙은 질의인스턴스에 포함된 주제어와 민원인스턴스에 포함된 용어를 비교하여 신규민원과 기존민원의 유사성을 판단하는 규칙을 말한다. 이러한 유사판단규칙은 주제어와 용어 사이의 관계에 기반한 1차 논리식(first-order logic)으로 표현될 수 있다. 이러한 유사판단규칙은 하나 이상의 규칙을 포함한다.The similarity judgment rule refers to a rule that determines the similarity between a new complaint and an existing complaint by comparing the terms included in the query instance with the terms included in the complaint instance. Such a similar decision rule may be expressed as first-order logic based on the relationship between the main word and the term. Such judging rules include one or more rules.
유사판단규칙은 주제어와 동일한 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다. 이러한 규칙은 다음과 같은 1차 논리식으로 표현된다. The rule of similarity may include a rule that an existing complaint that contains the same terms as the subject is similar to a new complaint. This rule is expressed by the following first logical expression:
HasWord(d1, w) ^ HasWord(d2, w) => SimPet(d1, d2)HasWord (d1, w) ^ HasWord (d2, w) => SimPet (d1, d2)
이는 신규민원 d1의 주제어가 w이고 기존민원 d2에 포함된 용어가 w이어서 주제어와 용어가 동일하면 신규민원 d1과 기존민원 d2는 유사하다는 것을 말한다. 예를 들어 질의인스턴스가 HasWord(민원1, 부유먼지)이고 HasWord(민원2, 부유먼지)라는 민원인스턴스가 검색된 경우 검색부(30)는 SimPet(민원1, 민원2)라는 결과인스턴스를 생성한다. 그리고 검색부(30)는 생성된 결과인스턴스를 인스턴스저장부(50)에 저장할 수 있다.This means that if the main word of the new complaint d1 is w and the term contained in the existing complaint d2 is w and the terms and terms are the same, the new complaint d1 and the existing complaint d2 are similar. For example, if the query instance is HasWord (
유사판단규칙은 주제어와 상하관계 또는 유사관계에 있는 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다. 이를 위해 인스턴스저장부(50)는 용어인스턴스를 포함하고 있다.The similarity determination rule may include the rule that existing complaints that contain terms that are subject to or similar to the subject are similar to the new complaints. For this purpose, the
용어인스턴스는 주제어와 용어의 상하관계 또는 유사관계에 있음을 온톨로지에 의한 트리플 형태로 표현하는 인스턴스이다. 이러한 용어인스턴스와 관련하여 대기-환경 용어들 간의 관계를 정의한 용어 온톨로지의 예는 도 2에 도시되어 있다.The term instance is an instance that expresses the relationship between the main word and the term in a triple form by the ontology. An example of a term ontology that defines the relationship between atmospheric-environmental terms with respect to this term instance is shown in FIG. 2.
주제어 w1이 용어 w2의 하위어인 경우 용어인스턴스는 SubClassOf(w1, w2)와 같이 표현될 것이다. 또한 용어 w2가 주제어 w1의 하위어인 경우 용어인스턴스는 SubClassOf(w2, w1)과 같이 표현될 것이다. 주제어 w1이 용어 w2와 유사어인 경우 용어인스턴스는 EquivalentClassOf(w1, w2)와 같이 표현될 것이다. 이러한 주제어 w1와 용어 w2는 도 2의 용어 온톨로지에 나타난 단어들 중 하나이다.If the subject w1 is a subword of the term w2, the term instance will be expressed as SubClassOf (w1, w2). In addition, when the term w2 is a subword of the main word w1, the term instance will be expressed as SubClassOf (w2, w1). If the subject w1 is similar to the term w2, the term instance will be expressed as EquivalentClassOf (w1, w2). This subject w1 and the term w2 are one of the words shown in the term ontology of FIG.
구체적인 예로 도 2에서 처리장치는 환경시설의 하위어이므로 이에 관한 용어인스턴스는 SubClassOf(처리장치, 환경시설)일 것이다. As a specific example, in FIG. 2, since the processing apparatus is a lower word of the environmental facility, the term instance related to this may be SubClassOf (processing device, environmental facility).
또한 도 2에는 도시되지 않았으나 앞서 설명한 예와 관련하여, 부유먼지는 먼지의 하위어이므로 이 경우 용어인스턴스는 SubClassOf(부유먼지, 먼지)일 것이다. 또한 비산먼지는 부유먼지의 하위어이므로 용어인스턴스는 SubClassOf(비산먼지, 부유먼지)일 것이다. 또 다른 예로 경유차는 자동차의 하위어이므로 용어인스턴스는 SubClassOf(경유차, 자동차)일 것이다.In addition, although not shown in FIG. 2, in relation to the above-described example, since the floating dust is a lower word of dust, the term instance will be SubClassOf (floating dust, dust) in this case. In addition, since scattering dust is a sub word of floating dust, the term instance may be SubClassOf (floating dust, floating dust). In another example, a diesel vehicle is a subordinate of a car, so the term instance would be SubClassOf.
주제어와 상하관계에 있는 용어를 포함하는 기존민원은 신규민원과 유사하다 는 규칙은 다음과 같은 1차 논리식들로 표현된다.The rule that existing complaints, including terms that are related to the subject, are similar to the new complaints, is expressed by the following first logical expressions.
HasWord(d1, w1) ^ HasWord(d2, w2) ^ SubClassOf(w1, w2) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ SubClassOf (w1, w2) => SimPet (d1, d2)
HasWord(d1, w1) ^ HasWord(d2, w2) ^ SubClassOf(w2, w1) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ SubClassOf (w2, w1) => SimPet (d1, d2)
주제어 w1과 유사관계에 있는 용어 w2를 포함하는 기존민원 d2는 신규민원 d1과 유사하다는 규칙은 다음과 같은 1차 논리식으로 표현된다.The rule that the existing complaint d2, which includes the term w2, which is similar to the subject w1, is similar to the new complaint d1, is expressed by the following first logical expression.
HasWord(d1, w1) ^ HasWord(d2, w2) ^ EquivalentClassOf(w1, w2) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ EquivalentClassOf (w1, w2) => SimPet (d1, d2)
앞서의 구체적인 예들을 이러한 1차 논리식들에 적용한 예들은 아래와 같다.Examples of applying the above specific examples to these first order logical expressions are as follows.
HasWord(민원1, 처리장치) ^ HasWord(민원2, 환경시설) ^ SubClassOf(처리장치, 환경시설) => SimPet(민원1, 민원2)HasWord (
HasWord(민원1, 비산먼지) ^ HasWord(민원2, 부유먼지) ^ SubClassOf(비산먼지, 부유먼지) => SimPet(민원1, 민원2)HasWord (
HasWord(민원1, 자동차) ^ HasWord(민원2, 경유차) ^ SubClassOf(경유차, 자동차) => SimPet(민원1, 민원2)HasWord (
HasWord(민원1, 부유먼지) ^ HasWord(민원2, 미세먼지) ^ EquivalentClassOf(부유먼지, 미세먼지) => SimPet(민원1, 민원2)HasWord (
이러한 경우 검색부(30)는 인스턴스저장부(50)에 저장되어 있는 용어인스턴스와 유사판단규칙을 이용해 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색한 후 검색 결과에 따라 결과인스턴스를 생성한다.In this case, the
본 발명의 유사민원검색시스템에는 마르코프 로직 네트워크(Markov Logic Network;MLN)가 적용될 수 있다. 마르코프 로직 네트워크는 워싱턴 대학(University of Washington)의 페드로 도밍고스(Pedro Domingos)와 메튜 리차드슨(Matthew Richardson)이 논문을 통해 제안하였다.The Markov Logic Network (MLN) may be applied to the similar complaint search system of the present invention. The Markov Logic Network was proposed by Pedro Domingos and Matthew Richardson of the University of Washington in a paper.
마르코프 로직 네트워크에서 단어(term)는 객체(object)를 가리키는 것으로 이러한 단어는 상수(constant), 변수(variable) 또는 함수(function) 등일 수 있다. 그리고 마르코프 로직 네트워크에서의 서술어(predicate)는 객체들 간의 관계를 표현한다. In the Markov logic network, a term refers to an object, which may be a constant, variable, or function. And predicates in the Markov logic network represent relationships between objects.
마르코프 로직 네트워크 ML,C에서 L은 집합 {(Fi, wi)}이고 C는 상수들의 유한개의 집합 C={c1,c2, ... , cn}을 말한다. L에서 Fi는 1차 논리식을 말한다. wi는 실수로 나타나는 1차 논리식의 가중치를 말한다. 그리고 마르코프 로직 네트워크 ML,C의 그래프에서 각 노드는 상수 C 중 하나가 L의 1차 논리식 Fi에 대입된 것으로 참일 때는 1, 거짓일 때는 0의 값을 갖는다. In the Markov logic network M L, C , L is a set {(F i , w i )} and C is a finite set of constants C = {c 1 , c 2 , ..., c n }. In L, F i is the first-order logical expression. w i is the weight of the first-order logical expression. And each node in the graph of Markov logic network, M L, is when the C 1, false when true that one of the constant C is substituted into the first logical expression F i of the L has a value of zero.
마르코프 로직 네트워크 자체는 본 발명의 대상이 아니며 이미 공지의 기술이므로 마르코프 로직 네트워크 자체에 대한 보다 상세한 설명은 생략하며, 이하에서는 마르코프 로직 네트워크를 어떻게 본 발명의 온톨로지 모델에 적용할 것인지에 대해 설명하도록 한다.Since the Markov logic network itself is not a subject of the present invention and is already known, a more detailed description of the Markov logic network itself will be omitted and the following will explain how to apply the Markov logic network to the ontology model of the present invention.
본 발명의 온톨로지 모델을 마르코프 로직 네트워크로 표현하는 데에는 여러 가지 방법이 있을 수 있다. 그 중 하나는 온톨로지를 구성하는 하나의 클래스가 마르코프 로직 네트워크의 서술어(predicate)에 해당하고, 온톨로지에서의 술어(predicate)는 클래스에 속하는 인스턴스들 사이에 성립하는 또 다른 마르코프 로직 네트워크의 서술어(predicate)로 보는 것이다. 이러한 경우 각각의 신규민원과 기존민원은 온톨로지의 술어와 인스턴스를 대상으로 어떠한 인스턴스가 참인지를 나타내는 명제 집합에 해당된다.There may be several ways to represent the ontology model of the present invention in a Markov logic network. One of them is that one class constituting the ontology corresponds to the predicate of the Markov logic network, and the predicate in the ontology predicates another Markov logic network predicate between instances belonging to the class. To see). In this case, each new and existing complaint is a set of statements that indicate which instances are true for the predicates and instances of the ontology.
두 번째 방법은 하나의 민원을 명제 집합이 아닌 단어(term)의 집합으로 보는 것이다. 즉, 온톨로지의 각 클래스나 인스턴스는 각각 단어(term)에 대응된다. 그리고 온톨로지에서의 술어(predicate)는 마르코프 로직 네트워크의 단어(term) 사이에 성립하는 서술어(predicate)가 된다.The second way is to view a complaint as a set of terms rather than a set of propositions. In other words, each class or instance of the ontology corresponds to a term. And the predicates in the ontology become predicates between the words of the Markov logic network.
두 번째 방법에 의할 경우 앞에서 설명한 유사판단규칙들의 1차 논리식들은 마르코프 로직 네트워크의 1차 논리식에 대응되며, 이들은 마르코프 로직 네트워크를 그래프로 표현할 때 온톨로지의 인스턴스들이 상수로 대입되는 경우 하나의 노드를 이루게 된다.According to the second method, the first-order logics of the similar decision rules described above correspond to the first-order logics of the Markov logic network, and they represent one node when instances of ontology are assigned as constants when graphing the Markov logic network. Is achieved.
이에 따라 유사판단규칙은 마르코프 로직 네트워크에 따른 가중치가 적용된 복수의 규칙을 포함할 수 있다. 예를 들어 1차 논리식으로 표현 가능한 복수의 규칙들은 다음과 같은 것들일 수 있다. 이하에서 d1은 신규민원, d2는 기존민원, w1은 주제어, w2는 용어를 가리킨다.Accordingly, the similar decision rule may include a plurality of rules to which weights according to the Markov logic network are applied. For example, the plurality of rules that can be expressed as a first order logical expression may be as follows. In the following, d1 denotes a new complaint, d2 denotes an existing complaint, w1 denotes a main term, and w2 denotes a term.
HasWord(d1, w) ^ HasWord(d2, w) => SimPet(d1, d2)HasWord (d1, w) ^ HasWord (d2, w) => SimPet (d1, d2)
HasWord(d1, w1) ^ HasWord(d2, w2) ^ (w1 != w2) => !SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ (w1! = W2) =>! SimPet (d1, d2)
HasWord(d1, w1) ^ HasWord(d2, w2) ^ SubClassOf(w1, w2) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ SubClassOf (w1, w2) => SimPet (d1, d2)
HasWord(d1, w) ^ !HasWord(d2, w) => !SimPet(d1, d2)HasWord (d1, w) ^! HasWord (d2, w) =>! SimPet (d1, d2)
위 4개의 1차 논리식들 가운데 두 번째는 신규민원 d1의 주제어가 w1이고 기존민원 d2의 용어가 w2이고 w1과 w2가 상이하면 d1과 d2는 유사민원이 아니라는 것이다. 그리고 네 번째는 신규민원 d1의 주제어가 w이고 이 주제어 w가 기존민원 d2에 포함되어 있지 않으면 d1과 d2는 유사민원이 아니라는 것이다.The second of the four first-order logics is that if the subject of the new complaint d1 is w1, the term of the existing complaint d2 is w2, and w1 and w2 are different, then d1 and d2 are not similar complaints. And fourth, if the main word of new complaint d1 is w and this topic w is not included in existing complaint d2, then d1 and d2 are not similar complaints.
만일 마르코프 로직 네트워크에 따른 가중치가 각 식에 적용되지 않은 채로 위 복수의 규칙들이 신규민원과 기존민원의 유사 판단에 적용된다면 복수의 규칙들을 모두 만족시키는 경우에만 d1과 d2가 유사하다고 판단될 것이며, 하나라도 만족하지 않는 경우에는 유사하다고 판단되지 않을 것이다.If the above rules are applied to the similarity judgment of the new and existing complaints without the weighting according to the Markov Logic Network applied to each equation, d1 and d2 will be judged to be similar only if all of the rules are satisfied. If none are satisfied, they will not be considered similar.
예를 들어 신규민원 d1과 기존민원 d2가 유사민원이라고 가정한다. 그리고 질의인스턴스는 HasWord(d1, 경유차)이고, 민원인스턴스는 HasWord(d2, 자동차)라고 가정한다.For example, suppose the new complaint d1 and the existing complaint d2 are similar complaints. It is assumed that the query instance is HasWord (d1, car) and the complaint instance is HasWord (d2, car).
이 경우 앞에서의 4개의 규칙들 가운데 세 번째 규칙은 참이지만, 나머지 세 개의 규칙들은 거짓이 된다. 그리고 마르코프 로직 네트워크에서의 가중치가 각 규칙에 적용되지 않았다면 위 4개의 규칙을 동시에 적용할 경우 거짓인 규칙들이 존재하므로 d1과 d2가 유사민원이 아니라는 잘못된 판단을 내릴 것이다.In this case, the third of the previous four rules is true, but the other three are false. And if the weights in the Markov logic network were not applied to each rule, applying the above four rules at the same time would falsely assume that there are false rules and that d1 and d2 are not similar complaints.
하지만 마르코프 로직 네트워크의 가중치를 각 규칙에 적용한다는 경우에는 복수의 규칙을 모두 만족하지 않는 경우라도 검색부(30)는 신규민원과 기존민원이 유사민원이라는 판단을 내릴 수 있다. 이러한 가중치는 규칙별로 부여되며, 그 규칙이 얼마나 참에 가까운지를 나타낸다. However, in the case where the weight of the Markov logic network is applied to each rule, even if all of the plurality of rules are not satisfied, the
이 경우 검색부(30)는 민원인스턴스와 질의인스턴스를 복수의 규칙들에 적용하여 가중치들을 연산하고 그 연산의 결과가 미리 설정된 기준을 만족시키는 경우에 민원인스턴스의 기존민원이 신규민원과 유사하다고 판단할 수 있다.In this case, the
검색부(30)가 수행하는 연산은 민원인스턴스와 질의인스턴스를 적용했을 경우에 그 값이 참인 규칙들의 가중치만을 합산하는 것이거나 합산하여 평균을 구하는 것일 수 있다. 이 경우 미리 설정된 기준은 가중치의 합이나 평균값이 미리 정해진 상수 이상인 것인지를 판단하는 것일 수 있다. The operation performed by the
예를 들어 가중치의 합이 2.5이고 미리 설정된 기준은 가중치의 합이 2를 넘는 것인지를 판단하는 것일 때 가중치의 합이 미리 설정된 기준을 만족하므로 검색부(30)는 기준민원과 신규민원이 유사하다고 판단할 것이다.For example, when the sum of weights is 2.5 and the preset criterion is for determining whether the sum of weights is greater than 2, the
또 다른 예로 민원인스턴스와 질의인스턴스가 적용되어 그 값이 참인 규칙들의 가중치의 평균값이 1이고 미리 설정된 기준은 그 평균값이 1.5 이상인 것인지를 판단하는 것일 때 평균값이 미리 설정된 기준을 만족하지 못하므로 검색부(30)는 기준민원과 신규민원이 유사하지 않다고 판단할 것이다.As another example, when a civil instance and a query instance are applied to determine whether an average value of weights of rules whose value is true is 1 and the preset criterion is that the average value is 1.5 or more, the search unit does not satisfy the preset criterion. (30) would determine that the standard complaint and the new complaint are not similar.
또한 이러한 연산은 그 값이 참인 규칙들의 가중치는 더하고 그 값이 거짓인 규칙들의 가중치는 빼는 것일 수도 있다. 이 경우 미리 설정된 기준은 이러한 연산의 값이 미리 정해진 상수 이상인 것인지를 판단하는 것일 수 있다.Such an operation may also be to add weights of rules whose value is true and subtract weights of rules whose value is false. In this case, the preset criterion may be to determine whether the value of the operation is greater than or equal to a predetermined constant.
예를 들어 민원인스턴스와 질의인스턴스가 복수의 규칙들에 적용되는 경우 그 값이 참인 것들의 가중치의 합이 5이고 거짓인 것들의 가중치의 합이 4인 경우 연산의 값은 5에서 4를 뺀 1일 것이다. 그리고 미리 설정된 기준은 연산의 값이 0 이상인지를 판단하는 것인 경우 검색부(30)는 이러한 기준민원과 신규민원이 유사하다고 판단할 것이다. 이러한 연산의 방식 및 미리 설정된 기준은 본 발명의 사용자 또는 설계자에 의해 자유롭게 선택될 수 있다.For example, if a civil instance and a query instance are applied to multiple rules, the sum of the weights of the true ones is 5 and the sum of the weights of the false ones is 4, the value of the operation is 5
마르코프 로직 네트워크에서 이러한 가중치들은 복수의 민원인스턴스들 및 민원인스턴스들에 포함된 기존민원들 간의 유사관계에 기반하여 학습(Learning)되어 결정될 수 있다. In the Markov logic network, such weights may be learned and determined based on a plurality of complaint instances and similarities between existing complaints included in the complaint instances.
이러한 학습은 몬테-카를로 최우추정법(Monte-Carlo maximum likelihood estimation)이나 limited-memory Broyden-Fletcher-Goldfarb-Shanno (BFGS) 알고리즘 등 적절한 지역탐색(local search) 기반의 알고리즘을 적용하여 이루어질 수 있다. 이러한 마르코프 로직 네트워크에서의 학습을 위해 사용되는 방식은 본 발명의 사용자 또는 설계자에 선택에 의해 자유롭게 결정될 수 있다.This learning can be achieved by applying appropriate local search-based algorithms, such as Monte-Carlo maximum likelihood estimation or limited-memory Broyden-Fletcher-Goldfarb-Shanno (BFGS) algorithms. The manner used for learning in such Markov logic networks can be freely determined by the choice of the user or designer of the present invention.
결과처리부(40)는 결과인스턴스를 이용하여 신규민원과 유사한 것으로 판단된 유사민원을 출력하여 이를 서비스제공인터페이스(2)로 전달할 수 있다. 또한 결과처리부(40)는 결과인스턴스 및 부가인스턴스를 이용하여 부가데이터를 출력하여 이를 서비스제공 인터페이스(2)로 전달할 수 있다.The
부가인스턴스는 기존민원과 연관된 부가데이터와 기존민원의 관계를 온톨로지에 의한 트리플 형태로 표현한 인스턴스이다. 부가인스턴스는 또한 기존민원에 포함된 용어와 부가데이터와의 관계를 표현한 인스턴스일 수도 있다. 이러한 부가 인스턴스는 인스턴스저장부(50)에 저장되어 있다. 이러한 부가인스턴스와 관련하여 대기-환경에 관한 부가데이터와 민원과의 관계를 정의한 부가데이터 온톨로지의 예는 도 3에 도시되어 있다.A supplementary instance is an instance that expresses the relationship between supplementary data related to an existing complaint and an existing complaint in a triple form by ontology. Additional instances may also be instances expressing the relationship between the terms included in an existing complaint and additional data. These additional instances are stored in the
부가데이터는 기존민원과 연관된 것으로 기존 민원의 관련 기관, 관련 업무, 관련 법률, 관련 지역, 관련민원종류, 기존민원인 및/또는 기존담당자 등일 수 있다. 도 3과 관련하여, 신규민원과 유사하다고 판단된 기존민원이 민원2인 경우 이러한 부가인스턴스의 예는 다음과 같은 것일 수 있다.The supplementary data is related to the existing complaint and may be related to the existing complaint, the relevant affairs, the relevant law, the area concerned, the type of complaint concerned, the existing complaint and / or the person in charge. 3, an example of such an additional instance may be as follows when the existing complaint, which is determined to be similar to the new complaint, is
관련기관(민원2, 환경부)Related Institutions (
관련기관(민원2, 서울미세경보센터)Related Institutions (
관련업무(민원2, 비산먼지 발생사업장 사전신고 및 행정처분)Related Work (
관련법규(민원2, 대기환경보전법 시행규칙)Related Laws (
관련민원종류(민원2, 비산먼지발생사업신고)Related complaint types (
이는 민원2의 관련기관은 환경부와 서울미세경보센터이고 관련업무는 비산먼지 발생사업장 사전신고 및 행정처분이며 관련법규는 대기환경보전법 시행규칙이고 관련 민원 종류는 비산먼지발생사업신고임을 나타낸다. This means that the related organizations of
위 예에서의 부가인스턴스들이 인스턴스저장부(50)에 저장되어 있는 경우 결과처리부(40)는 민원2와 환경부와 서울미세경보센터의 홈페이지 주소, 비산먼지 발생사업장 사전신고 및 행정처분이나 대기환경보전법 시행규칙의 내용 및 비산먼지발생사업신고의 민원 서식 등의 부가데이터를 출력하여 서비스제공 인터페이스(2)에 전달한다.If the additional instances in the above example are stored in the
인스턴스저장부(50)는 각종 형태의 정보 및/또는 데이터를 저장할 수 있는 기억장치 또는 데이터베이스의 일부 또는 전부로 민원인스턴스, 용어인스턴스 및 관련인스턴스를 저장한다.The
추론부(60)는 미리 정의된 추론규칙에 따라 기존민원에 포함된 용어들 간의 관계를 추론하여 용어인스턴스를 생성하고 기존민원과 부가데이터 간의 관계를 추론하여 부가인스턴스를 생성하여 용어인스턴스 및/또는 부가인스턴스를 인스턴스저장부(50)에 저장한다. 추론규칙은 용어간의 관계에 관한 것이거나 기존민원 또는 용어와 부가데이터와의 관계를 정의해 놓은 것으로 추론규칙저장부(70)에 미리 저장되어 있는 것이 바람직하다.The
예를 들어 용어에 대한 추론규칙이 "부유먼지는 먼지의 하위어이다."인 경우 추론부(60)는 SubClassOf(부유먼지, 먼지)라는 용어인스턴스를 생성하여 인스턴스저장부(50)에 저장한다. 또한 용어와 부가데이터의 관계에 대한 추론규칙이 "먼지의 관련기관은 환경부이다."인 경우 추론부(60)는 관련기관(먼지, 환경부)라는 부가인스턴스를 생성하여 인스턴스저장부(50)에 저장한다.For example, if the inference rule for the term is "floating dust is a sub-word of dust." The
이러한 추론규칙은 본 발명의 사용자 또는 설계자의 선택에 따라 결정되거나 수정, 변경되어 추론규칙저장부(70)에 저장될 수 있으며, 그러한 경우에 추론부(60)는 기존의 용어인스턴스와 부가인스턴스 가운데 추론규칙에 부합하는 용어인스턴스와 부가인스턴스를 생성하거나 기존의 용어인스턴스 및 부가인스턴스 중 추론규칙에 부합하지 않은 것을 삭제하거나 수정 또는 변경할 수 있다.Such inference rules may be determined, modified, or changed according to a user's or designer's selection of the present invention and stored in the inference rule storage unit 70. In such a case, the
도 4는 본 발명의 일 실시예에 따른 온톨로지에 기반한 유사민원검색방법의 흐름을 나타낸 흐름도이다. 이하에서는 위 내용과 중복되는 것은 필요에 따라 중복 설명을 생략하도록 한다.4 is a flowchart illustrating a method of searching for similar complaints based on ontology according to an embodiment of the present invention. In the following, duplicate descriptions will be omitted as necessary.
추출부(10)는 신규민원에 대한 검색데이터를 입력받아 검색데이터로부터 주제어를 추출한다(S41). 생성부(20)는 신규민원이 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성한다(S42).The
검색부(30)는 유사판단규칙을 이용해 질의인스턴스의 신규민원과 민원인스턴스의 기존민원이 유사한지를 판단하여 신규민원과 유사한 기존민원에 대한 민원인스턴스가 인스턴스저장부(50)에 존재하는지 검색한다(S43). The
민원인스턴스는 기존에 제기되었던 기존민원과 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 인스턴스로 미리 인스턴스저장부(50)에 저장되어 있는 것이 바람직하다.Complaint instance is an instance expressing the relationship between the existing complaint and the term included in the existing complaint in a triple form by the ontology is preferably stored in the
유사판단규칙은 질의인스턴스에 포함된 주제어와 민원인스턴스에 포함된 용어를 비교하여 신규민원과 기존민원의 유사성을 판단하는 규칙을 말한다. 이러한 유사판단규칙은 주제어와 용어 사이의 관계에 기반한 1차 논리식(first-order logic)으로 표현될 수 있다.The similarity judgment rule refers to a rule that determines the similarity between a new complaint and an existing complaint by comparing the terms included in the query instance with the terms included in the complaint instance. Such a similar decision rule may be expressed as first-order logic based on the relationship between the main word and the term.
유사판단규칙은 주제어와 동일한 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다. 또한 유사한판규칙은 주제어와 상하관계 및/또는 유사관계에 있는 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다.The rule of similarity may include a rule that an existing complaint that contains the same terms as the subject is similar to a new complaint. Similar rules may also include a rule that existing complaints that contain terms that are superficial and / or similar to the subject are similar to the new complaints.
검색부(30)는 용어인스턴스를 더 이용해 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색한다. 이 경우 용어인스턴스는 주제어 및 용어의 상하관계 및/또는 유사관계에 관한 온톨로지에 의한 트리플형태로 표현되는 인스턴스이다.The
본 발명의 검색에는 마르코프 로직 네트워크가 적용될 수 있다. 이 경우 유사판단규칙은 마르코프 로직 네트워크에 따른 가중치가 적용된 복수의 규칙을 포함한다. 그리고 검색부(30)는 민원인스턴스와 질의인스턴스를 위 복수의 규칙들에 적용하여 가중치들을 연산한다. 그리고 검색부(30)는 그 연산의 결과가 미리 설정된 기준을 만족시키는 경우에 민원인스턴스의 기존민원이 신규민원과 유사하다고 판단한다.The Markov logic network may be applied to the search of the present invention. In this case, the similar decision rule includes a plurality of rules to which the weight is applied according to the Markov logic network. The
신규민원과 유사하다고 판단되는 기존민원에 대한 민원인스턴스가 검색된 경우 검색부(30)는 결과인스턴스를 생성한다(S44). 결과인스턴스는 신규민원과 기존민원의 유사관계를 온톨로지에 의한 트리플 형태로 표현한 인스턴스이다.If a civil instance is found for an existing civil complaint that is determined to be similar to the new civil complaint, the
이 경우 결과처리부(40)는 부가인스턴스와 결과인스턴스를 이용하여 신규민원과 유사한 기존민원 및/또는 기존민원과 연관된 부가데이터를 출력하여 서비스제공 인터페이스(2)로 전달한다(S45). 부가인스턴스는 기존민원 및 기존민원과 연관된 부가데이터의 관계를 표현하는 인스턴스를 말한다.In this case, the
만일 검색부(30)의 검색 결과 질의인스턴스의 신규민원과 유사한 기존민원에 대한 민원인스턴스가 인스턴스저장부(50)에 존재하지 않는 경우 결과처리부(40)는 그 부존재를 알리는 결과메세지를 출력하여 서비스제공 인터페이스(2)에 전달한다(S46).If the search result of the
본 발명의 상기 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽 을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The method of the present invention can also be embodied in computer readable code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, which are also implemented in the form of a carrier wave (for example, transmission over the Internet). It also includes. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
이상에서 실시예를 통해 설명한 본 발명의 기술적 범위는 상기 기재된 실시예에 한정되는 것은 아니고 본 발명의 사상 및 범위를 벗어나지 않는 범위에서 다양하게 수정 및 변형될 수 있음은 본 발명이 속한 기술 분야에서 통상의 지식을 가진 자에게 명백하다. 따라서 그러한 변형예 또는 수정예들은 본 발명의 특허청구범위에 기재된 발명의 범위에 속한다 해야 할 것이다.The technical scope of the present invention described above through the embodiments is not limited to the above-described embodiments, and various modifications and changes may be made without departing from the spirit and scope of the present invention. It is evident to those who have knowledge. Therefore, such modifications or variations will have to be belong to the scope of the invention described in the claims of the present invention.
도 1은 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색시스템의 구성을 도시한 구성도이다.1 is a block diagram showing the configuration of a similar complaint search system based on the ontology according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 따른 용어들 간의 관계를 정의한 용어 온톨로지를 도시한 구성도이다.2 is a diagram illustrating a term ontology defining a relationship between terms according to an exemplary embodiment of the present invention.
도 3은 본 발명의 일실시예에 따른 민원과 부가데이터의 관계를 정의한 부가데이터 온톨로지의 구성도이다.3 is a block diagram of an additional data ontology defining a relationship between a complaint and additional data according to an embodiment of the present invention.
도 4는 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색방법의 흐름을 나타낸 흐름도이다.4 is a flowchart illustrating a method of searching for similar complaints based on the ontology according to an embodiment of the present invention.
Claims (11)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090074875A KR101083804B1 (en) | 2009-08-13 | 2009-08-13 | Ontology Based Method And System For Searching Similar Civil Petition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090074875A KR101083804B1 (en) | 2009-08-13 | 2009-08-13 | Ontology Based Method And System For Searching Similar Civil Petition |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110017286A KR20110017286A (en) | 2011-02-21 |
KR101083804B1 true KR101083804B1 (en) | 2011-11-18 |
Family
ID=43775386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090074875A KR101083804B1 (en) | 2009-08-13 | 2009-08-13 | Ontology Based Method And System For Searching Similar Civil Petition |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101083804B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080109212A1 (en) * | 2006-11-07 | 2008-05-08 | Cycorp, Inc. | Semantics-based method and apparatus for document analysis |
KR100864564B1 (en) * | 2007-01-11 | 2008-10-20 | 한국문화콘텐츠진흥원 | System for Writing a Cultural Heritage Based on Scenario |
-
2009
- 2009-08-13 KR KR1020090074875A patent/KR101083804B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080109212A1 (en) * | 2006-11-07 | 2008-05-08 | Cycorp, Inc. | Semantics-based method and apparatus for document analysis |
KR100864564B1 (en) * | 2007-01-11 | 2008-10-20 | 한국문화콘텐츠진흥원 | System for Writing a Cultural Heritage Based on Scenario |
Also Published As
Publication number | Publication date |
---|---|
KR20110017286A (en) | 2011-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180095962A1 (en) | Translation of natural language questions and requests to a structured query format | |
US10754886B2 (en) | Using multiple natural language classifier to associate a generic query with a structured question type | |
Sleeman et al. | Computing foaf co-reference relations with rules and machine learning | |
Ramli et al. | Building an event ontology for historical domain to support semantic document retrieval | |
Amato et al. | An application of semantic techniques for forensic analysis | |
Palmirani et al. | Hybrid refining approach of pronto ontology | |
Fawei et al. | Using legal ontologies with rules for legal textual entailment | |
Arbaaeen et al. | Natural language processing based question answering techniques: A survey | |
Lisi et al. | A FOIL-like method for learning under incompleteness and vagueness | |
Palmirani et al. | PrOnto ontology refinement through open knowledge extraction | |
Modoni et al. | The knowledge reuse in an industrial scenario: A case study | |
Farshidi et al. | An adaptable indexing pipeline for enriching meta information of datasets from heterogeneous repositories | |
Santosh et al. | PROO ontology development for learning feature specific sentiment relationship rules on reviews categorisation: a semantic data mining approach | |
Reynaud et al. | Redescription mining for learning definitions and disjointness axioms in linked open data | |
KR101083804B1 (en) | Ontology Based Method And System For Searching Similar Civil Petition | |
Santhiya et al. | Automated crime tweets classification and geo-location prediction using big data framework | |
Cotfas et al. | Analysing customers’ opinions towards product characteristics using social media | |
Rogushina et al. | Use of ontologies for metadata records analysis in big data | |
Mentzingen et al. | Automation of legal precedents retrieval: findings from a rapid literature review | |
Botega et al. | Quantify: an information fusion model based on syntactic and semantic analysis and quality assessments to enhance situation awareness | |
Alkhatib et al. | Towards ontology-based training-less multi-label text classification | |
Lomotey et al. | Terms analytics service for CouchDB: a document-based NoSQL | |
Tovar et al. | Patterns used to identify relations in corpus using formal concept analysis | |
Dang et al. | A Practical Approach to Leverage Knowledge Graphs for Legal Query | |
Saengthongpattana et al. | Ontology-Based Classifiers for Wikipedia Article Quality Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20141106 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151105 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20181031 Year of fee payment: 8 |