KR101083804B1 - Ontology Based Method And System For Searching Similar Civil Petition - Google Patents

Ontology Based Method And System For Searching Similar Civil Petition Download PDF

Info

Publication number
KR101083804B1
KR101083804B1 KR1020090074875A KR20090074875A KR101083804B1 KR 101083804 B1 KR101083804 B1 KR 101083804B1 KR 1020090074875 A KR1020090074875 A KR 1020090074875A KR 20090074875 A KR20090074875 A KR 20090074875A KR 101083804 B1 KR101083804 B1 KR 101083804B1
Authority
KR
South Korea
Prior art keywords
complaint
instance
similar
existing
new
Prior art date
Application number
KR1020090074875A
Other languages
Korean (ko)
Other versions
KR20110017286A (en
Inventor
안철희
김건오
이경일
Original Assignee
주식회사 솔트룩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 솔트룩스 filed Critical 주식회사 솔트룩스
Priority to KR1020090074875A priority Critical patent/KR101083804B1/en
Publication of KR20110017286A publication Critical patent/KR20110017286A/en
Application granted granted Critical
Publication of KR101083804B1 publication Critical patent/KR101083804B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 신규민원에 대한 검색데이터를 입력받아 검색데이터로부터 주제어를 추출하는 단계; 신규민원이 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 단계; 주제어와 용어를 비교하여 신규민원과 기존민원의 유사성을 판단하는 유사판단규칙을 이용해 기존에 제기되었던 기존민원과 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들 가운데 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 단계; 및 신규민원과 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 단계;를 포함하는 온톨로지에 기반한 유사민원검색방법 및 이를 구현한 시스템에 관한 것이다.The present invention comprises the steps of extracting the main word from the search data received the search data for the new complaint; Generating a query instance expressing the new complaint in the form of a triple by an ontology; Among the complaint instances expressing the inclusion relationship of existing complaints and existing complaints in triple form by ontology using the similar judgment rule that compares the main words and terms. Retrieving a complaint instance for an existing complaint similar to a new complaint; And generating a result instance expressing a similar relationship between the new complaint and the existing complaint of the retrieved complaint instance. The present invention relates to a method for retrieving similar complaints based on ontology and a system implementing the same.

본 발명에 의할 경우 신규 민원이 입력되면 신규 민원과 유사한 기존 민원 및 그와 관련된 부가데이터들이 자동으로 검색되므로 신규 민원에 대한 신속하고 용이한 처리가 가능해지는 장점이 있다.According to the present invention, when a new complaint is input, an existing complaint similar to the new complaint and additional data related thereto are automatically searched, thereby enabling a quick and easy process for the new complaint.

민원, 온톨로지, 검색 Complaint, ontology, search

Description

온톨로지에 기반한 유사민원 검색 방법 및 시스템{Ontology Based Method And System For Searching Similar Civil Petition}Ontology Based Method And System For Searching Similar Civil Petition}

본 발명은 신규민원과 유사한 기존 민원을 검색하는 방법 및 시스템에 관한 것으로, 구체적으로는 신규민원의 주제어를 추출하여 신규민원과 주제어에 대해 온톨로지에 의한 트리플 형태로 표현되는 질의인스턴스를 생성하고 기존 민원과 그 민원이 포함하는 용어에 대한 민원인스턴스와 질의인스턴스가 유사판단규칙을 만족하는지를 판단하여 신규민원과 유사한 기존민원을 검색하는 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for retrieving an existing complaint similar to a new complaint, and specifically, extracts the main word of the new complaint and generates a query instance expressed in triple form by the ontology for the new complaint and the subject. The present invention relates to a method and system for retrieving an existing complaint similar to a new complaint by determining whether the complaint instance and the query instance satisfy the similar judgment rule.

민원이라 함은 한 지역의 주민이 그 지역의 행정기관에 대하여 원하는 바를 요구하는 일을 말한다. 이러한 민원에 대한 사무는 허가, 인가, 면허, 등록 등의 신청이나 이의 신청, 진정, 건의, 질의 따위에 관한 사무이다. 종래의 민원사무에서는 이러한 민원을 처리하기 위해 민원 접수자가 민원명이나 민원 내용을 읽어본 후 이를 분류해 민원 담당자에게 전달한 후 민원 담당자가 다시 민원의 민원명이나 민원 내용을 읽어보고 이를 처리해야 했다.Complaint means a request for a resident of a region to make a request to an administrative body of that region. The affairs of such complaints are those concerning applications for permits, authorizations, licenses, registrations, etc., or appeals, complaints, recommendations, and inquiries. In the conventional civil affairs, in order to deal with such complaints, the complaint recipient reads the name of the complaint or the content of the complaint, classifies it, passes it to the person in charge of the complaint, and the person in charge of the complaint has to read the complaint name or the content of the complaint again and process it.

그런데 이러한 민원의 용이한 처리를 위해 민원 담당자는 새로운 민원과 유 사한 종래의 유사한 민원을 민원 담당자가 민원의 내용을 모두 읽어본 후 스스로 새로운 민원의 키워드나 주제어를 선택한 후 이를 민원 검색 프로그램의 검색어 입력창에 입력하고 그에 따라 열거되는 여러 민원들의 내용을 모두 읽어본 후 유사한 민원을 선택해야 했으나 이는 매우 번거롭고 시간과 노력이 이중으로 소요되는 문제점이 있었다.However, for the easy handling of these complaints, the civil service officer reads all the contents of the civil complaints, similar to the new civil complaints, and then selects a new keyword or the subject of the complaint and inputs the search term of the civil search program. After reading the contents of the various complaints entered into the window and reading them, the similar complaints had to be selected, but this was very cumbersome and required a double time and effort.

또한 민원인은 자신의 민원에 대한 처리 기간이나 수수료, 처리흐름, 관련 법규 등 자신의 민원과 연관된 부가 정보들을 정확하게 알기 어려웠고 민원인이 전문가가 아닌 경우에는 자신의 민원에 대한 처리 결과를 예상하기 어려웠다. 따라서 민원인은 자신의 민원에 대한 부가 정보나 처리 결과를 예상하기 위해 자신의 민원의 키워드 또는 주제어라고 판단되는 단어나 핵심 문장 등을 민원 검색 프로그램의 검색어 입력창에 입력한 후 역시 그 결과로 검색되는 여러 민원들의 내용을 모두 읽어본 후 유사 민원을 선택해야 했으나 이는 일반 민원인에게는 용이하지 않다는 문제점이 있었다.In addition, it was difficult for the complainant to know the additional information related to his complaint, such as the processing period, fees, processing flows, and related laws of the complaint, and it was difficult to predict the outcome of the complaint if the complainant was not an expert. Therefore, in order to anticipate additional information or processing results of a complaint, the complainant inputs a word or key sentence that is considered to be a keyword or a subject of the complaint in the search term input box of the complaint search program and is also searched for as a result. After reading the contents of various complaints, it was necessary to select similar complaints, but this was not easy for ordinary complaints.

또한 기존의 단순한 키워드 매칭에 의한 검색 방식에 의할 경우 검색어 입력창에 입력한 검색어가 반드시 포함된 민원들만이 검색되어 검색어를 잘못 선택한 경우에는 유사 민원이 존재하는 경우에도 그 유사 민원이 검색되기 어려웠으며 유사 민원이 검색된다 해도 그 민원의 내용만이 검색되어 처리기간이나 처리흐름, 담당자, 관련 법규 등을 알기 어려운 문제점이 있었다In addition, in the case of the existing simple keyword matching method, only those complaints that include the search term entered in the search box input are searched. Even though similar complaints were searched, only the contents of the complaints were searched, so it was difficult to know the processing period, the processing flow, the person in charge, the related laws, etc.

상기한 문제를 해결하기 위해 본 발명은 온톨로지에 기반하되 유사판단규칙에 따라 신규민원과 유사한 기존 민원을 검색하는 방법 및 시스템을 제공하는 것을 목적으로 한다.In order to solve the above problems, an object of the present invention is to provide a method and system for searching for existing complaints similar to new complaints based on the ontology based on the similar decision rule.

상기한 기술적 과제를 달성하기 위한 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색시스템은 신규민원에 대한 검색데이터를 입력받아 상기 검색데이터로부터 주제어를 추출하는 추출부; 상기 신규민원이 상기 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 생성부; 기존에 제기되었던 기존민원과 상기 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들을 저장하고 있는 인스턴스저장부; 및 상기 주제어와 상기 용어를 비교하여 상기 신규민원과 상기 기존민원의 유사성을 판단하는 유사판단규칙을 이용해 상기 검색데이터와 유사한 기존민원에 대한 민원인스턴스를 검색하여 상기 검색데이터와 상기 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 검색부;를 포함한다.An ontology-based similar complaint search system according to an embodiment of the present invention for achieving the above technical problem is an extraction unit for receiving the search data for the new complaints to extract the main word from the search data; A generation unit for generating a query instance expressing that the new complaint includes the main word in a triple form by an ontology; An instance storage unit for storing the existing civil complaints and the civil complaint instances expressing the inclusion relationship of the terms included in the existing civil complaints in triple form by the ontology; And searching for an instance of an existing complaint similar to the search data by using a similar decision rule that compares the main term and the term to determine the similarity between the new complaint and the existing complaint. It includes; search unit for generating a result instance representing the similarity of the complaint.

상기한 기술적 과제를 달성하기 위한 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색방법은 신규민원에 대한 검색데이터를 입력받아 상기 검색데이터로부터 주제어를 추출하는 단계; 상기 신규민원이 상기 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 단계; 상기 주제어 와 상기 용어를 비교하여 상기 신규민원과 상기 기존민원의 유사성을 판단하는 유사판단규칙을 이용해 기존에 제기되었던 기존민원과 상기 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들 가운데 상기 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 단계; 및 상기 신규민원과 상기 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 단계;를 포함한다.Ontology-based similar complaint search method according to an embodiment of the present invention for achieving the above technical problem is the step of extracting the main word from the search data received the search data for the new complaint; Generating a query instance expressing that the new complaint includes the main word in a triple form by ontology; Expressing the inclusion relationship between the existing complaints and terms included in the existing complaints in triple form by the ontology by using the similar judgment rule to compare the main term and the terms to determine the similarity between the new complaints and the existing complaints Retrieving a complaint instance for an existing complaint similar to the new complaint among the complaint instances; And generating a result instance representing a similar relationship between the new complaint and an existing complaint of the retrieved complaint instance.

또한, 이하에서는 상기 기재된 온톨로지에 기반한 유사민원검색방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.In addition, the following provides a computer-readable recording medium having recorded thereon a program for executing a similar complaint search method based on the ontology described above.

본 발명에 의할 경우 제기하고자 하는 신규 민원과 유사한 기존 민원이 자동으로 검색되므로 민원 사무의 처리 단계가 간소화되어 민원 사무의 처리가 보다 신속 및 용이해지고 민원인은 민원에 대한 전문 지식이 없이도 자신의 민원과 유사한 민원 및 그 처리 결과가 자동으로 검색된다는 장점이 있다.According to the present invention, existing complaints similar to the new complaints to be filed are automatically searched, thereby simplifying the processing process of the civil affairs, making the process of civil affairs quicker and easier, and the civil affairs of the civil affairs without the professional knowledge of the civil affairs. Similarly, the complaints and their processing results are automatically retrieved.

또한 온톨로지 기술에 근거하여 유사 민원이 검색되므로 유사민원을 검색하고자 하는 사람은 반드시 정확한 키워드를 입력하지 않아도 온톨로지에 의한 추론방식에 의해 입력한 검색어데이터와 관련이 있는 유사민원이 검색된다는 장점이 있다.In addition, since similar complaints are searched based on the ontology technology, a person seeking to search for similar complaints has an advantage that similar complaints related to the search term data input by the ontology inference method are searched without necessarily inputting an exact keyword.

본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발 명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.Embodiments of the present invention are provided to more fully explain the present invention to those skilled in the art, the following examples can be modified in many different forms, the scope of the invention It is not limited to the following example. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the inventive concept to those skilled in the art.

본 명세서에서 사용된 용어는 특정 실시예를 설명하기 위하여 사용되며, 본 발명을 제한하기 위한 것이 아니다. 본 명세서에서 사용된 바와 같이, 단수 형태는 문맥상 다른 경우를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있으며, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함한다. 또한, 본 명세서에서 사용되는 경우 "포함한다(comprise)" 및/또는 "포함하는(comprising)"은 언급한 단계, 동작, 구성요소 및/또는 이들의 그룹들의 존재 또는 부가를 배제하는 것이 아니다.The terminology used herein is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. As used herein, the singular forms "a", "an" and "the" are intended to include the plural forms as well, unless the context clearly indicates otherwise. The term "and / or" includes any and all combinations of one or more of the listed items. It includes. Also, as used herein, “comprise” and / or “comprising” does not exclude the presence or addition of the steps, operations, components, and / or groups thereof mentioned.

본 명세서에서 제1, 제2 등의 용어가 다양한 단계, 동작 및/또는 구성요소를 설명하기 위하여 사용되지만, 이들 단계, 동작 및/또는 구성요소는 이들 용어에 의해 한정되어서는 안됨은 자명하다. 이들 용어는 하나의 단계, 동작 또는 구성요소를 다른 단계, 동작 또는 구성요소와 구별하기 위하여만 사용된다. 따라서, 이하 상술할 제1단계, 동작 또는 구성요소는 본 발명의 가르침으로부터 벗어나지 않고서도 제2단계, 동작 또는 구성요소를 지칭할 수 있다.Although terms such as first and second are used herein to describe various steps, operations and / or components, it is obvious that these steps, operations and / or components should not be limited by these terms. These terms are only used to distinguish one step, operation or component from another step, operation or component. Accordingly, the first step, operation or component described below may refer to the second step, operation or component without departing from the teachings of the present invention.

본 발명의 실시예들을 설명하기에 앞서 이하에서 사용할 용어들과 개념을 간략히 설명한다.Prior to describing the embodiments of the present invention, terms and concepts to be used below are briefly described.

시맨틱 웹(semantic web)은 현재의 인터넷과 같은 분산 환경에서 리소스(웹 문서, 각종 파일, 서비스 등)에 대한 정보와 자원 사이의 관계-의미 정보(semanteme)를 기계, 즉 컴퓨터가 처리할 수 있는 온톨로지(ontology) 형태로 표현하고, 이를 자동화된 기계가 처리하도록 하는 프레임워크이자 기술이다. 여기서, 온톨로지란 사람들이 사물에 대해 생각하는 바를 추상화하고 공유한 모델로서, 정형화되고 개념의 유형이나 사용상의 제약 조건들이 명시적으로 정의된 기술을 말한다. 컴퓨터 과학 분야에서 온톨로지는 특정한 영역을 표현하는 데이터 모델로서 특정한 영역(domain)에 속하는 개념과 개념 사이의 관계를 기술하는 정형(formal) 어휘의 집합으로 정의된다. 특히, 온톨로지는 시맨틱 웹을 구현할 수 있는 도구로써, 지식 개념을 의미적으로 연결할 수 있는 도구로 사용되며, 컴퓨터에서 사람이 갖고 있는 사물에 대한 개념을 일종의 데이터베이스의 형태로 가공하여 처리할 수 있도록 해 준다.The semantic web is a machine, or computer, that can process information about resources (web documents, various files, services, etc.) and the relationships between them in a distributed environment such as the Internet. It is a framework and technology that expresses it in the form of ontology and allows an automated machine to process it. Here, ontology is a model that abstracts and shares what people think about things, and is a technology that has been formalized and explicitly defined types of concepts or usage constraints. In the field of computer science, ontology is a data model that represents a specific domain and is defined as a set of formal vocabularies describing the concepts and relationships between them. In particular, ontology is a tool that can implement the semantic web. It is used as a tool that can semantically connect knowledge concepts, and it enables the computer to process and process the concept of things in the form of a database. give.

시맨틱 웹은 XML(Extensible Markup Language)에 기반한 시맨틱 마크업 언어로써 표현될 수 있다. 이러한 시맨틱 웹에서는 주체(subject), 술어(predicate), 객체(object)의 트리플(triple) 형태로 개념을 표현하며, 다시 각각의 주체, 술어, 객체는 XML의 URI(Uniform Resource Identifier)로 표현될 수 있다. 현재 시맨틱 웹 온톨로지를 기술하는 표준 언어로 W3C에서 제안한 RDF, RDF-Schema, OWL, SW RL 그리고 ISO에서 제안한 TopicMaps 등이 있다.The semantic web can be expressed as a semantic markup language based on XML (Extensible Markup Language). In the semantic web, the concept is expressed in triple form of subject, predicate, and object, and each subject, predicate, and object are represented as a Uniform Resource Identifier (URI) of XML. Can be. Currently, standard languages describing semantic web ontology include RDF, RDF-Schema, OWL, SW RL, and ISO proposed TopicMaps.

이하, 첨부한 도면들을 참조하여, 본 발명의 실시예를 보다 상세하게 설명하고자 한다. 설명의 편이와 명확성을 위하여 도면 상의 동일한 구성요소에 대해서는 동일한 참조부호가 사용되었으며 설명과 관계없는 부분이나 동일한 구성요소에 대 한 중복된 설명은 생략되었다.Hereinafter, with reference to the accompanying drawings, it will be described in detail an embodiment of the present invention. The same reference numerals are used for the same elements in the drawings for ease of explanation and clarity, and duplicate descriptions of portions that are not related to the description or the same elements are omitted.

도 1은 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색시스템의 구성을 도시한 구성도이다. 도 1에서 유사민원검색시스템(1)은 서비스제공 인터페이스(2)와 데이터를 교환하며, 유사민원검색시스템(1)은 추출부(10), 생성부(20), 검색부(30), 결과처리부(40), 인스턴스저장부(50), 추론부(60) 및 추론규칙저장부(70)를 포함한다.1 is a block diagram showing the configuration of a similar complaint search system based on the ontology according to an embodiment of the present invention. In FIG. 1, the similar complaint search system 1 exchanges data with the service providing interface 2, and the similar complaint search system 1 includes an extraction unit 10, a generation unit 20, a search unit 30, and a result. It includes a processor 40, an instance storage unit 50, the inference unit 60 and the inference rule storage unit 70.

서비스제공 인터페이스(2)는 외부와 유사민원 검색시스템(1) 간의 데이터 교환을 담당하는 인터페이스이다. 서비스제공 인터페이스(2)는 외부의 검색 서비스 프로그램 등으로부터 기존민원 가운데 신규민원과 유사한 기존민원의 검색 및/또는 이와 관련된 부가데이터의 제공을 요청받으면 신규민원을 유사민원검색시스템(1)으로 전달한다. The service providing interface 2 is an interface in charge of exchanging data between the outside and the similar complaint search system 1. The service providing interface 2 forwards the new complaint to the similar complaint search system 1 when an external search service program or the like is requested to search for an existing complaint similar to the new complaint and / or to provide additional data related thereto. .

이를 위해 서비스제공 인터페이스(2)는 신규민원에 대한 검색데이터를 유사민원검색시스템(1)으로 전달한다. 또한 서비스제공 인터페이스(2)는 유사민원시스템(1)으로부터 신규민원과 유사한 것으로 판단된 기존민원 및/또는 이와 관련된 부가데이터 등을 전달받아 이를 외부의 검색 서비스 프로그램 등으로 제공한다.To this end, the service providing interface 2 transmits the search data for the new complaint to the similar complaint search system 1. In addition, the service providing interface 2 receives an existing complaint and / or additional data related thereto that are determined to be similar to the new complaint from the similar complaint system 1 and provides the same to an external search service program.

신규민원은 본 발명의 사용자가 제기하고자 하는 새로운 민원을 말하고 기존은 기존에 작성 및 제기되어 처리된 민원으로 유사민원검색시스템(1)의 인스턴스저장부(50)에 관련된 온톨로지에 의한 트리플 형태로 표현되는 인스턴스가 이미 생성되어 저장되어 있는 것을 말한다.The new complaint refers to a new complaint that the user of the present invention intends to raise, and the existing complaint is a previously created and filed complaint that is expressed in triple form by an ontology related to the instance storage unit 50 of the similar complaint search system 1. The instance to be created is already created and stored.

추출부(10)는 신규민원에 대한 검색데이터를 입력받아 검색데이터로부터 신 규민원의 주제어를 추출한다. 검색데이터는 본 발명의 이전에 제기되었던 민원들 가운데 신규민원과 유사한 기존민원을 검색하고자 본 발명의 사용자가 신규민원에 대한 것으로 검색어 입력창 등에 입력한 데이터를 말한다. The extractor 10 receives the search data for the new complaint and extracts the main word of the new complaint from the search data. The search data refers to data entered by a user of the present invention about a new complaint, such as a search term input window, to search for an existing complaint similar to a new complaint among previously filed complaints.

검색데이터는 민원의 명칭이나 민원의 대상에 대한 용어나 용어들이 될 수도 있고, 신규민원에 대한 자연어로 된 문장일 수도 있다. 또한 검색데이터는 신규민원 내용 전체가 될 수도 있다.The search data can be the name or terminology of the complaint, the subject of the complaint, or a sentence in natural language for the new complaint. Search data can also be the entire content of a new complaint.

추출부(10)가 추출할 수 있는 주제어는 그 주제어가 될 수 있는 후보 단어들이 정해져 있어 추출부(10)는 그 후보들과 일치하는 단어가 검색데이터에 포함되어 있는지를 검색하여 추출한다. 추출부(10)는 하나의 검색데이터에 대해 이러한 주제어를 하나 또는 복수개 추출할 수 있으며 이러한 주제어 추출에는 형태소 분석 등의 방법이 이용될 수 있다. As the main word that can be extracted by the extractor 10, candidate words that can be the main word are determined, and the extractor 10 searches for and extracts whether a word matching the candidates is included in the search data. The extractor 10 may extract one or a plurality of such subject words with respect to one search data, and a method such as morpheme analysis may be used to extract the subject words.

예를 들어 후보 단어 가운데 하나가 "부유먼지"인 경우 추출부(10)는 검색데이터에 "부유먼지"라는 단어가 포함되어 있는지를 검색하고 검색데이터에 "부유먼지"가 포함되어 있는 경우에는 "부유먼지"를 주제어로 추출할 것이다.For example, when one of the candidate words is "floating dust", the extraction unit 10 searches whether the search data includes the word "floating dust", and when the search data includes "floating dust", " "Floating dust" will be extracted.

또한 추출부(10)는 매칭(matching) 등의 방식을 통해 검색데이터에 포함되어 있는 비정규 단어들을 정규화하여 주제어로 변환해 추출할 수도 있다. 예를 들어 주제어의 후보 단어가 "부유먼지"인데 검색데이터에 "떠다니는 먼지", "부유 먼지" 또는 "대기 먼지" 등이 포함되어 있는 경우 추출부(10)는 이러한 검색데이터에 포함된 단어들을 "부유먼지"와 매칭(matching)시켜 "부유먼지"를 주제어로 추출할 수 있다.Also, the extractor 10 may normalize the irregular words included in the search data through a matching method and convert the extracted normalized words into subject words. For example, if the candidate word of the subject is "floating dust" and the search data includes "floating dust", "floating dust", or "air dust", the extraction unit 10 includes the words included in the search data. The "floating dust" can be extracted as the main word by matching them with "floating dust".

생성부(20)는 추출부(10)가 주제어를 추출한 경우 질의인스턴스를 생성한다. 질의인스턴스는 신규민원이 추출부(10)가 추출한 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 인스턴스를 말한다.The generation unit 20 generates a query instance when the extraction unit 10 extracts the main word. The query instance refers to an instance expressing in a triple form by the ontology that the new complaint includes the main word extracted by the extractor 10.

예를 들어 민원의 클래스가 d로 표현되고 그 주제어의 클래스가 w이며, 각각의 인스턴스는 그 뒤에 숫자가 병기되는 것이라 가정한다. 이 경우 신규민원이 d1이고 추출부(10)가 추출한 주제어가 w1이라면, 생성부(20)가 생성한 질의인스턴스는 HasWord(d1, w1)와 같이 표현될 수 있다. 이는 d1이라는 민원의 주제어가 w1임을 나타낸다. 여기서 주체는 d1, 객체는 w1이며 술어는 HasWord가 될 것이다. For example, suppose the class of a complaint is represented by d, its main class is w, and each instance is followed by a number. In this case, if the new complaint is d1 and the main word extracted by the extractor 10 is w1, the query instance generated by the generator 20 may be expressed as HasWord (d1, w1). This indicates that the subject of the complaint called d1 is w1. Here the subject will be d1, the object will be w1 and the predicate will be HasWord.

이를 앞서의 "부유먼지"의 예에 적용시켜 보면 d1이라는 신규민원의 주제어가 "부유먼지"인 경우 생성부(20)는 HasWord(d1, 부유먼지)라는 질의인스턴스를 생성할 것이다. 생성부(20)는 이렇게 생성된 질의인스턴스를 인스턴스저장부(50)에 저장할 수 있다.Applying this to the example of "floating dust", if the subject of the new complaint named d1 is "floating dust," the generation unit 20 will generate a query instance called HasWord (d1, floating dust). The generation unit 20 may store the generated query instance in the instance storage unit 50.

검색부(30)는 유사판단규칙을 이용해 신규민원과 유사한 기존민원에 대한 민원인스턴스가 인스턴스저장부(50)에 저장되어 있는지 검색한다. 그리고 검색부(30)는 신규민원과 유사한 기존민원에 대한 민원인스턴스가 검색되면 결과인스턴스를 생성한다.The search unit 30 searches whether the instance of the civil complaint similar to the new complaint is stored in the instance storage unit 50 using the similar decision rule. In addition, the search unit 30 generates a result instance when a complaint instance for an existing complaint similar to the new complaint is searched.

민원인스턴스는 행정 기관에 대한 기존민원과 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현한 인스턴스이며 그 기본적인 형식은 질의인스턴스와 같다. 예를 들어 기존 민원이 d2이고, d2가 w1이라는 용어를 포함하는 경우 민원인스턴스는 HasWord(d2, w1)일 것이다. 이러한 민원인스턴스들은 인스턴스저장부(50)에 미리 저장되어 있다. 이러한 민원인스턴스에 포함되는 용어는 기존민원을 대표하는 것으로 선택되는 것이 바람직하다.Complaint instance is an instance expressing the relationship between the existing complaints about the administrative agency and terms contained in the existing complaints in triple form by ontology, and its basic form is the same as the query instance. For example, if the existing complaint is d2 and d2 contains the term w1, the complaint instance would be HasWord (d2, w1). These complaint instances are previously stored in the instance storage unit 50. The terms included in these complaint instances are preferably selected to represent existing complaints.

결과인스턴스는 신규민원과 검색된 민원인스턴스의 기존민원의 유사관계를 온톨로지에 의한 트리플 형태로 표현하는 인스턴스를 말한다. 예를 들어 d1이라는 신규민원과 d2라는 기존민원이 유사하다고 판단되는 경우 결과인스턴스는 SimPet(d1, d2)와 같이 표현될 수 있다.The result instance is an instance expressing the similar relationship between the new complaint and the existing complaint of the retrieved complaint instance in a triple form by the ontology. For example, if it is determined that a new complaint called d1 and an existing complaint called d2 are similar, the resulting instance may be expressed as SimPet (d1, d2).

유사판단규칙은 질의인스턴스에 포함된 주제어와 민원인스턴스에 포함된 용어를 비교하여 신규민원과 기존민원의 유사성을 판단하는 규칙을 말한다. 이러한 유사판단규칙은 주제어와 용어 사이의 관계에 기반한 1차 논리식(first-order logic)으로 표현될 수 있다. 이러한 유사판단규칙은 하나 이상의 규칙을 포함한다.The similarity judgment rule refers to a rule that determines the similarity between a new complaint and an existing complaint by comparing the terms included in the query instance with the terms included in the complaint instance. Such a similar decision rule may be expressed as first-order logic based on the relationship between the main word and the term. Such judging rules include one or more rules.

유사판단규칙은 주제어와 동일한 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다. 이러한 규칙은 다음과 같은 1차 논리식으로 표현된다. The rule of similarity may include a rule that an existing complaint that contains the same terms as the subject is similar to a new complaint. This rule is expressed by the following first logical expression:

HasWord(d1, w) ^ HasWord(d2, w) => SimPet(d1, d2)HasWord (d1, w) ^ HasWord (d2, w) => SimPet (d1, d2)

이는 신규민원 d1의 주제어가 w이고 기존민원 d2에 포함된 용어가 w이어서 주제어와 용어가 동일하면 신규민원 d1과 기존민원 d2는 유사하다는 것을 말한다. 예를 들어 질의인스턴스가 HasWord(민원1, 부유먼지)이고 HasWord(민원2, 부유먼지)라는 민원인스턴스가 검색된 경우 검색부(30)는 SimPet(민원1, 민원2)라는 결과인스턴스를 생성한다. 그리고 검색부(30)는 생성된 결과인스턴스를 인스턴스저장부(50)에 저장할 수 있다.This means that if the main word of the new complaint d1 is w and the term contained in the existing complaint d2 is w and the terms and terms are the same, the new complaint d1 and the existing complaint d2 are similar. For example, if the query instance is HasWord (Complaint 1, Floating Dust) and a Complaint instance called HasWord (Complaint 2, Floating Dust) is searched, the search unit 30 generates a result instance called SimPet (Complaint 1, Complaint 2). The search unit 30 may store the generated result instance in the instance storage unit 50.

유사판단규칙은 주제어와 상하관계 또는 유사관계에 있는 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다. 이를 위해 인스턴스저장부(50)는 용어인스턴스를 포함하고 있다.The similarity determination rule may include the rule that existing complaints that contain terms that are subject to or similar to the subject are similar to the new complaints. For this purpose, the instance storage unit 50 includes the term instance.

용어인스턴스는 주제어와 용어의 상하관계 또는 유사관계에 있음을 온톨로지에 의한 트리플 형태로 표현하는 인스턴스이다. 이러한 용어인스턴스와 관련하여 대기-환경 용어들 간의 관계를 정의한 용어 온톨로지의 예는 도 2에 도시되어 있다.The term instance is an instance that expresses the relationship between the main word and the term in a triple form by the ontology. An example of a term ontology that defines the relationship between atmospheric-environmental terms with respect to this term instance is shown in FIG. 2.

주제어 w1이 용어 w2의 하위어인 경우 용어인스턴스는 SubClassOf(w1, w2)와 같이 표현될 것이다. 또한 용어 w2가 주제어 w1의 하위어인 경우 용어인스턴스는 SubClassOf(w2, w1)과 같이 표현될 것이다. 주제어 w1이 용어 w2와 유사어인 경우 용어인스턴스는 EquivalentClassOf(w1, w2)와 같이 표현될 것이다. 이러한 주제어 w1와 용어 w2는 도 2의 용어 온톨로지에 나타난 단어들 중 하나이다.If the subject w1 is a subword of the term w2, the term instance will be expressed as SubClassOf (w1, w2). In addition, when the term w2 is a subword of the main word w1, the term instance will be expressed as SubClassOf (w2, w1). If the subject w1 is similar to the term w2, the term instance will be expressed as EquivalentClassOf (w1, w2). This subject w1 and the term w2 are one of the words shown in the term ontology of FIG.

구체적인 예로 도 2에서 처리장치는 환경시설의 하위어이므로 이에 관한 용어인스턴스는 SubClassOf(처리장치, 환경시설)일 것이다. As a specific example, in FIG. 2, since the processing apparatus is a lower word of the environmental facility, the term instance related to this may be SubClassOf (processing device, environmental facility).

또한 도 2에는 도시되지 않았으나 앞서 설명한 예와 관련하여, 부유먼지는 먼지의 하위어이므로 이 경우 용어인스턴스는 SubClassOf(부유먼지, 먼지)일 것이다. 또한 비산먼지는 부유먼지의 하위어이므로 용어인스턴스는 SubClassOf(비산먼지, 부유먼지)일 것이다. 또 다른 예로 경유차는 자동차의 하위어이므로 용어인스턴스는 SubClassOf(경유차, 자동차)일 것이다.In addition, although not shown in FIG. 2, in relation to the above-described example, since the floating dust is a lower word of dust, the term instance will be SubClassOf (floating dust, dust) in this case. In addition, since scattering dust is a sub word of floating dust, the term instance may be SubClassOf (floating dust, floating dust). In another example, a diesel vehicle is a subordinate of a car, so the term instance would be SubClassOf.

주제어와 상하관계에 있는 용어를 포함하는 기존민원은 신규민원과 유사하다 는 규칙은 다음과 같은 1차 논리식들로 표현된다.The rule that existing complaints, including terms that are related to the subject, are similar to the new complaints, is expressed by the following first logical expressions.

HasWord(d1, w1) ^ HasWord(d2, w2) ^ SubClassOf(w1, w2) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ SubClassOf (w1, w2) => SimPet (d1, d2)

HasWord(d1, w1) ^ HasWord(d2, w2) ^ SubClassOf(w2, w1) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ SubClassOf (w2, w1) => SimPet (d1, d2)

주제어 w1과 유사관계에 있는 용어 w2를 포함하는 기존민원 d2는 신규민원 d1과 유사하다는 규칙은 다음과 같은 1차 논리식으로 표현된다.The rule that the existing complaint d2, which includes the term w2, which is similar to the subject w1, is similar to the new complaint d1, is expressed by the following first logical expression.

HasWord(d1, w1) ^ HasWord(d2, w2) ^ EquivalentClassOf(w1, w2) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ EquivalentClassOf (w1, w2) => SimPet (d1, d2)

앞서의 구체적인 예들을 이러한 1차 논리식들에 적용한 예들은 아래와 같다.Examples of applying the above specific examples to these first order logical expressions are as follows.

HasWord(민원1, 처리장치) ^ HasWord(민원2, 환경시설) ^ SubClassOf(처리장치, 환경시설) => SimPet(민원1, 민원2)HasWord (Complaint 1, Complaint) ^ HasWord (Complaint 2, Completion) ^ SubClassOf (Processing Device, Completion) => SimPet

HasWord(민원1, 비산먼지) ^ HasWord(민원2, 부유먼지) ^ SubClassOf(비산먼지, 부유먼지) => SimPet(민원1, 민원2)HasWord (Complaint 1, Shattering Dust) ^ HasWord (Crime 2, Floating Dust) ^ SubClassOf (Scattered Dust, Floating Dust) => SimPet

HasWord(민원1, 자동차) ^ HasWord(민원2, 경유차) ^ SubClassOf(경유차, 자동차) => SimPet(민원1, 민원2)HasWord (Complaint 1, Car) ^ HasWord (Complaint 2, Light Car) ^ SubClassOf (Light Vehicle, Car) => SimPet (Complaint 1, Complaint 2)

HasWord(민원1, 부유먼지) ^ HasWord(민원2, 미세먼지) ^ EquivalentClassOf(부유먼지, 미세먼지) => SimPet(민원1, 민원2)HasWord (Complaint 1, floating dust) ^ HasWord (Complaint 2, fine dust) ^ EquivalentClassOf (Floating dust, fine dust) => SimPet (Complaint 1, Complaint 2)

이러한 경우 검색부(30)는 인스턴스저장부(50)에 저장되어 있는 용어인스턴스와 유사판단규칙을 이용해 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색한 후 검색 결과에 따라 결과인스턴스를 생성한다.In this case, the search unit 30 searches for an instance of an existing complaint similar to the new complaint using the term instance and the similar decision rule stored in the instance storage unit 50, and then generates a result instance according to the search result.

본 발명의 유사민원검색시스템에는 마르코프 로직 네트워크(Markov Logic Network;MLN)가 적용될 수 있다. 마르코프 로직 네트워크는 워싱턴 대학(University of Washington)의 페드로 도밍고스(Pedro Domingos)와 메튜 리차드슨(Matthew Richardson)이 논문을 통해 제안하였다.The Markov Logic Network (MLN) may be applied to the similar complaint search system of the present invention. The Markov Logic Network was proposed by Pedro Domingos and Matthew Richardson of the University of Washington in a paper.

마르코프 로직 네트워크에서 단어(term)는 객체(object)를 가리키는 것으로 이러한 단어는 상수(constant), 변수(variable) 또는 함수(function) 등일 수 있다. 그리고 마르코프 로직 네트워크에서의 서술어(predicate)는 객체들 간의 관계를 표현한다. In the Markov logic network, a term refers to an object, which may be a constant, variable, or function. And predicates in the Markov logic network represent relationships between objects.

마르코프 로직 네트워크 ML,C에서 L은 집합 {(Fi, wi)}이고 C는 상수들의 유한개의 집합 C={c1,c2, ... , cn}을 말한다. L에서 Fi는 1차 논리식을 말한다. wi는 실수로 나타나는 1차 논리식의 가중치를 말한다. 그리고 마르코프 로직 네트워크 ML,C의 그래프에서 각 노드는 상수 C 중 하나가 L의 1차 논리식 Fi에 대입된 것으로 참일 때는 1, 거짓일 때는 0의 값을 갖는다. In the Markov logic network M L, C , L is a set {(F i , w i )} and C is a finite set of constants C = {c 1 , c 2 , ..., c n }. In L, F i is the first-order logical expression. w i is the weight of the first-order logical expression. And each node in the graph of Markov logic network, M L, is when the C 1, false when true that one of the constant C is substituted into the first logical expression F i of the L has a value of zero.

마르코프 로직 네트워크 자체는 본 발명의 대상이 아니며 이미 공지의 기술이므로 마르코프 로직 네트워크 자체에 대한 보다 상세한 설명은 생략하며, 이하에서는 마르코프 로직 네트워크를 어떻게 본 발명의 온톨로지 모델에 적용할 것인지에 대해 설명하도록 한다.Since the Markov logic network itself is not a subject of the present invention and is already known, a more detailed description of the Markov logic network itself will be omitted and the following will explain how to apply the Markov logic network to the ontology model of the present invention.

본 발명의 온톨로지 모델을 마르코프 로직 네트워크로 표현하는 데에는 여러 가지 방법이 있을 수 있다. 그 중 하나는 온톨로지를 구성하는 하나의 클래스가 마르코프 로직 네트워크의 서술어(predicate)에 해당하고, 온톨로지에서의 술어(predicate)는 클래스에 속하는 인스턴스들 사이에 성립하는 또 다른 마르코프 로직 네트워크의 서술어(predicate)로 보는 것이다. 이러한 경우 각각의 신규민원과 기존민원은 온톨로지의 술어와 인스턴스를 대상으로 어떠한 인스턴스가 참인지를 나타내는 명제 집합에 해당된다.There may be several ways to represent the ontology model of the present invention in a Markov logic network. One of them is that one class constituting the ontology corresponds to the predicate of the Markov logic network, and the predicate in the ontology predicates another Markov logic network predicate between instances belonging to the class. To see). In this case, each new and existing complaint is a set of statements that indicate which instances are true for the predicates and instances of the ontology.

두 번째 방법은 하나의 민원을 명제 집합이 아닌 단어(term)의 집합으로 보는 것이다. 즉, 온톨로지의 각 클래스나 인스턴스는 각각 단어(term)에 대응된다. 그리고 온톨로지에서의 술어(predicate)는 마르코프 로직 네트워크의 단어(term) 사이에 성립하는 서술어(predicate)가 된다.The second way is to view a complaint as a set of terms rather than a set of propositions. In other words, each class or instance of the ontology corresponds to a term. And the predicates in the ontology become predicates between the words of the Markov logic network.

두 번째 방법에 의할 경우 앞에서 설명한 유사판단규칙들의 1차 논리식들은 마르코프 로직 네트워크의 1차 논리식에 대응되며, 이들은 마르코프 로직 네트워크를 그래프로 표현할 때 온톨로지의 인스턴스들이 상수로 대입되는 경우 하나의 노드를 이루게 된다.According to the second method, the first-order logics of the similar decision rules described above correspond to the first-order logics of the Markov logic network, and they represent one node when instances of ontology are assigned as constants when graphing the Markov logic network. Is achieved.

이에 따라 유사판단규칙은 마르코프 로직 네트워크에 따른 가중치가 적용된 복수의 규칙을 포함할 수 있다. 예를 들어 1차 논리식으로 표현 가능한 복수의 규칙들은 다음과 같은 것들일 수 있다. 이하에서 d1은 신규민원, d2는 기존민원, w1은 주제어, w2는 용어를 가리킨다.Accordingly, the similar decision rule may include a plurality of rules to which weights according to the Markov logic network are applied. For example, the plurality of rules that can be expressed as a first order logical expression may be as follows. In the following, d1 denotes a new complaint, d2 denotes an existing complaint, w1 denotes a main term, and w2 denotes a term.

HasWord(d1, w) ^ HasWord(d2, w) => SimPet(d1, d2)HasWord (d1, w) ^ HasWord (d2, w) => SimPet (d1, d2)

HasWord(d1, w1) ^ HasWord(d2, w2) ^ (w1 != w2) => !SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ (w1! = W2) =>! SimPet (d1, d2)

HasWord(d1, w1) ^ HasWord(d2, w2) ^ SubClassOf(w1, w2) => SimPet(d1, d2)HasWord (d1, w1) ^ HasWord (d2, w2) ^ SubClassOf (w1, w2) => SimPet (d1, d2)

HasWord(d1, w) ^ !HasWord(d2, w) => !SimPet(d1, d2)HasWord (d1, w) ^! HasWord (d2, w) =>! SimPet (d1, d2)

위 4개의 1차 논리식들 가운데 두 번째는 신규민원 d1의 주제어가 w1이고 기존민원 d2의 용어가 w2이고 w1과 w2가 상이하면 d1과 d2는 유사민원이 아니라는 것이다. 그리고 네 번째는 신규민원 d1의 주제어가 w이고 이 주제어 w가 기존민원 d2에 포함되어 있지 않으면 d1과 d2는 유사민원이 아니라는 것이다.The second of the four first-order logics is that if the subject of the new complaint d1 is w1, the term of the existing complaint d2 is w2, and w1 and w2 are different, then d1 and d2 are not similar complaints. And fourth, if the main word of new complaint d1 is w and this topic w is not included in existing complaint d2, then d1 and d2 are not similar complaints.

만일 마르코프 로직 네트워크에 따른 가중치가 각 식에 적용되지 않은 채로 위 복수의 규칙들이 신규민원과 기존민원의 유사 판단에 적용된다면 복수의 규칙들을 모두 만족시키는 경우에만 d1과 d2가 유사하다고 판단될 것이며, 하나라도 만족하지 않는 경우에는 유사하다고 판단되지 않을 것이다.If the above rules are applied to the similarity judgment of the new and existing complaints without the weighting according to the Markov Logic Network applied to each equation, d1 and d2 will be judged to be similar only if all of the rules are satisfied. If none are satisfied, they will not be considered similar.

예를 들어 신규민원 d1과 기존민원 d2가 유사민원이라고 가정한다. 그리고 질의인스턴스는 HasWord(d1, 경유차)이고, 민원인스턴스는 HasWord(d2, 자동차)라고 가정한다.For example, suppose the new complaint d1 and the existing complaint d2 are similar complaints. It is assumed that the query instance is HasWord (d1, car) and the complaint instance is HasWord (d2, car).

이 경우 앞에서의 4개의 규칙들 가운데 세 번째 규칙은 참이지만, 나머지 세 개의 규칙들은 거짓이 된다. 그리고 마르코프 로직 네트워크에서의 가중치가 각 규칙에 적용되지 않았다면 위 4개의 규칙을 동시에 적용할 경우 거짓인 규칙들이 존재하므로 d1과 d2가 유사민원이 아니라는 잘못된 판단을 내릴 것이다.In this case, the third of the previous four rules is true, but the other three are false. And if the weights in the Markov logic network were not applied to each rule, applying the above four rules at the same time would falsely assume that there are false rules and that d1 and d2 are not similar complaints.

하지만 마르코프 로직 네트워크의 가중치를 각 규칙에 적용한다는 경우에는 복수의 규칙을 모두 만족하지 않는 경우라도 검색부(30)는 신규민원과 기존민원이 유사민원이라는 판단을 내릴 수 있다. 이러한 가중치는 규칙별로 부여되며, 그 규칙이 얼마나 참에 가까운지를 나타낸다. However, in the case where the weight of the Markov logic network is applied to each rule, even if all of the plurality of rules are not satisfied, the search unit 30 may determine that the new complaint and the existing complaint are similar complaints. These weights are given for each rule and indicate how close the rule is to the truth.

이 경우 검색부(30)는 민원인스턴스와 질의인스턴스를 복수의 규칙들에 적용하여 가중치들을 연산하고 그 연산의 결과가 미리 설정된 기준을 만족시키는 경우에 민원인스턴스의 기존민원이 신규민원과 유사하다고 판단할 수 있다.In this case, the search unit 30 calculates the weights by applying the civil instance and the query instance to a plurality of rules, and determines that the existing civil complaint of the civil instance is similar to the new civil complaint when the result of the operation satisfies the preset criteria. can do.

검색부(30)가 수행하는 연산은 민원인스턴스와 질의인스턴스를 적용했을 경우에 그 값이 참인 규칙들의 가중치만을 합산하는 것이거나 합산하여 평균을 구하는 것일 수 있다. 이 경우 미리 설정된 기준은 가중치의 합이나 평균값이 미리 정해진 상수 이상인 것인지를 판단하는 것일 수 있다. The operation performed by the search unit 30 may add up only the weights of the rules whose values are true when the civil instance and the query instance are applied, or may calculate the average by adding the weights. In this case, the preset criterion may be to determine whether the sum or average value of the weights is greater than or equal to a predetermined constant.

예를 들어 가중치의 합이 2.5이고 미리 설정된 기준은 가중치의 합이 2를 넘는 것인지를 판단하는 것일 때 가중치의 합이 미리 설정된 기준을 만족하므로 검색부(30)는 기준민원과 신규민원이 유사하다고 판단할 것이다.For example, when the sum of weights is 2.5 and the preset criterion is for determining whether the sum of weights is greater than 2, the search unit 30 is similar to the standard complaint and the new complaint because the sum of the weights satisfies the preset criteria. Will judge.

또 다른 예로 민원인스턴스와 질의인스턴스가 적용되어 그 값이 참인 규칙들의 가중치의 평균값이 1이고 미리 설정된 기준은 그 평균값이 1.5 이상인 것인지를 판단하는 것일 때 평균값이 미리 설정된 기준을 만족하지 못하므로 검색부(30)는 기준민원과 신규민원이 유사하지 않다고 판단할 것이다.As another example, when a civil instance and a query instance are applied to determine whether an average value of weights of rules whose value is true is 1 and the preset criterion is that the average value is 1.5 or more, the search unit does not satisfy the preset criterion. (30) would determine that the standard complaint and the new complaint are not similar.

또한 이러한 연산은 그 값이 참인 규칙들의 가중치는 더하고 그 값이 거짓인 규칙들의 가중치는 빼는 것일 수도 있다. 이 경우 미리 설정된 기준은 이러한 연산의 값이 미리 정해진 상수 이상인 것인지를 판단하는 것일 수 있다.Such an operation may also be to add weights of rules whose value is true and subtract weights of rules whose value is false. In this case, the preset criterion may be to determine whether the value of the operation is greater than or equal to a predetermined constant.

예를 들어 민원인스턴스와 질의인스턴스가 복수의 규칙들에 적용되는 경우 그 값이 참인 것들의 가중치의 합이 5이고 거짓인 것들의 가중치의 합이 4인 경우 연산의 값은 5에서 4를 뺀 1일 것이다. 그리고 미리 설정된 기준은 연산의 값이 0 이상인지를 판단하는 것인 경우 검색부(30)는 이러한 기준민원과 신규민원이 유사하다고 판단할 것이다. 이러한 연산의 방식 및 미리 설정된 기준은 본 발명의 사용자 또는 설계자에 의해 자유롭게 선택될 수 있다.For example, if a civil instance and a query instance are applied to multiple rules, the sum of the weights of the true ones is 5 and the sum of the weights of the false ones is 4, the value of the operation is 5 minus 1 would. If the preset criterion is for determining whether the value of the operation is greater than or equal to zero, the search unit 30 may determine that the reference complaint is similar to the new complaint. The manner of operation and the preset criteria can be freely selected by the user or designer of the present invention.

마르코프 로직 네트워크에서 이러한 가중치들은 복수의 민원인스턴스들 및 민원인스턴스들에 포함된 기존민원들 간의 유사관계에 기반하여 학습(Learning)되어 결정될 수 있다. In the Markov logic network, such weights may be learned and determined based on a plurality of complaint instances and similarities between existing complaints included in the complaint instances.

이러한 학습은 몬테-카를로 최우추정법(Monte-Carlo maximum likelihood estimation)이나 limited-memory Broyden-Fletcher-Goldfarb-Shanno (BFGS) 알고리즘 등 적절한 지역탐색(local search) 기반의 알고리즘을 적용하여 이루어질 수 있다. 이러한 마르코프 로직 네트워크에서의 학습을 위해 사용되는 방식은 본 발명의 사용자 또는 설계자에 선택에 의해 자유롭게 결정될 수 있다.This learning can be achieved by applying appropriate local search-based algorithms, such as Monte-Carlo maximum likelihood estimation or limited-memory Broyden-Fletcher-Goldfarb-Shanno (BFGS) algorithms. The manner used for learning in such Markov logic networks can be freely determined by the choice of the user or designer of the present invention.

결과처리부(40)는 결과인스턴스를 이용하여 신규민원과 유사한 것으로 판단된 유사민원을 출력하여 이를 서비스제공인터페이스(2)로 전달할 수 있다. 또한 결과처리부(40)는 결과인스턴스 및 부가인스턴스를 이용하여 부가데이터를 출력하여 이를 서비스제공 인터페이스(2)로 전달할 수 있다.The result processor 40 may output a similar complaint determined to be similar to the new complaint using the result instance and transfer it to the service providing interface 2. In addition, the result processing unit 40 may output the additional data using the result instance and the additional instance and transfer it to the service providing interface 2.

부가인스턴스는 기존민원과 연관된 부가데이터와 기존민원의 관계를 온톨로지에 의한 트리플 형태로 표현한 인스턴스이다. 부가인스턴스는 또한 기존민원에 포함된 용어와 부가데이터와의 관계를 표현한 인스턴스일 수도 있다. 이러한 부가 인스턴스는 인스턴스저장부(50)에 저장되어 있다. 이러한 부가인스턴스와 관련하여 대기-환경에 관한 부가데이터와 민원과의 관계를 정의한 부가데이터 온톨로지의 예는 도 3에 도시되어 있다.A supplementary instance is an instance that expresses the relationship between supplementary data related to an existing complaint and an existing complaint in a triple form by ontology. Additional instances may also be instances expressing the relationship between the terms included in an existing complaint and additional data. These additional instances are stored in the instance storage unit 50. An example of additional data ontology that defines the relationship between the additional data on the air-environment and the complaint in relation to this additional instance is shown in FIG. 3.

부가데이터는 기존민원과 연관된 것으로 기존 민원의 관련 기관, 관련 업무, 관련 법률, 관련 지역, 관련민원종류, 기존민원인 및/또는 기존담당자 등일 수 있다. 도 3과 관련하여, 신규민원과 유사하다고 판단된 기존민원이 민원2인 경우 이러한 부가인스턴스의 예는 다음과 같은 것일 수 있다.The supplementary data is related to the existing complaint and may be related to the existing complaint, the relevant affairs, the relevant law, the area concerned, the type of complaint concerned, the existing complaint and / or the person in charge. 3, an example of such an additional instance may be as follows when the existing complaint, which is determined to be similar to the new complaint, is Civil Complaint 2.

관련기관(민원2, 환경부)Related Institutions (Complaint 2, Ministry of Environment)

관련기관(민원2, 서울미세경보센터)Related Institutions (Citizenship 2, Seoul Micro Alarm Center)

관련업무(민원2, 비산먼지 발생사업장 사전신고 및 행정처분)Related Work (Complaint 2, Prior Notification and Administrative Disposal for Business Sites that Generate Dust)

관련법규(민원2, 대기환경보전법 시행규칙)Related Laws (Citizenship 2, Enforcement Rules of the Air Quality Preservation Act)

관련민원종류(민원2, 비산먼지발생사업신고)Related complaint types (Complaint 2, Fugitive Dust Reporting Business Report)

이는 민원2의 관련기관은 환경부와 서울미세경보센터이고 관련업무는 비산먼지 발생사업장 사전신고 및 행정처분이며 관련법규는 대기환경보전법 시행규칙이고 관련 민원 종류는 비산먼지발생사업신고임을 나타낸다. This means that the related organizations of Civil Complaint 2 are the Ministry of Environment and the Seoul Fine Warning Center, the related work is pre-reporting and administrative disposition of scattering dust generating workplaces, the related laws are the enforcement regulations of the Air Environment Conservation Act, and the related types of complaints are reporting scattering dust generating business.

위 예에서의 부가인스턴스들이 인스턴스저장부(50)에 저장되어 있는 경우 결과처리부(40)는 민원2와 환경부와 서울미세경보센터의 홈페이지 주소, 비산먼지 발생사업장 사전신고 및 행정처분이나 대기환경보전법 시행규칙의 내용 및 비산먼지발생사업신고의 민원 서식 등의 부가데이터를 출력하여 서비스제공 인터페이스(2)에 전달한다.If the additional instances in the above example are stored in the instance storage unit 50, the result processing unit 40 is the homepage address of Civil Complaint 2 and the Ministry of Environment and the Seoul Fine Warning Center, preliminary report of scattering dust generation workplace, and the Administrative Disposal or Atmospheric Environment Conservation Act. The additional data such as the contents of the enforcement regulations and the complaint form of the scattering dust generating business report are output and transmitted to the service providing interface (2).

인스턴스저장부(50)는 각종 형태의 정보 및/또는 데이터를 저장할 수 있는 기억장치 또는 데이터베이스의 일부 또는 전부로 민원인스턴스, 용어인스턴스 및 관련인스턴스를 저장한다.The instance storage unit 50 stores a complaint instance, a term instance and a related instance as part or all of a storage device or a database capable of storing various types of information and / or data.

추론부(60)는 미리 정의된 추론규칙에 따라 기존민원에 포함된 용어들 간의 관계를 추론하여 용어인스턴스를 생성하고 기존민원과 부가데이터 간의 관계를 추론하여 부가인스턴스를 생성하여 용어인스턴스 및/또는 부가인스턴스를 인스턴스저장부(50)에 저장한다. 추론규칙은 용어간의 관계에 관한 것이거나 기존민원 또는 용어와 부가데이터와의 관계를 정의해 놓은 것으로 추론규칙저장부(70)에 미리 저장되어 있는 것이 바람직하다.The inference unit 60 generates a term instance by inferring a relationship between terms included in an existing complaint according to a pre-defined inference rule, and creates an additional instance by inferring a relationship between the existing complaint and additional data to generate a term instance and / or The additional instance is stored in the instance storage unit 50. The inference rule relates to the relationship between terms or defines existing relationships or relationships between terms and additional data, and is preferably stored in the inference rule storage unit 70 in advance.

예를 들어 용어에 대한 추론규칙이 "부유먼지는 먼지의 하위어이다."인 경우 추론부(60)는 SubClassOf(부유먼지, 먼지)라는 용어인스턴스를 생성하여 인스턴스저장부(50)에 저장한다. 또한 용어와 부가데이터의 관계에 대한 추론규칙이 "먼지의 관련기관은 환경부이다."인 경우 추론부(60)는 관련기관(먼지, 환경부)라는 부가인스턴스를 생성하여 인스턴스저장부(50)에 저장한다.For example, if the inference rule for the term is "floating dust is a sub-word of dust." The inference unit 60 generates the term SubClassOf (floating dust, dust) and stores it in the instance storage unit 50. . In addition, when the reasoning rule for the relation between the term and the additional data is "the dust related organization is the environment department", the inference unit 60 creates an additional instance called the related organization (dust, environment department) and stores it in the instance storage unit 50. Save it.

이러한 추론규칙은 본 발명의 사용자 또는 설계자의 선택에 따라 결정되거나 수정, 변경되어 추론규칙저장부(70)에 저장될 수 있으며, 그러한 경우에 추론부(60)는 기존의 용어인스턴스와 부가인스턴스 가운데 추론규칙에 부합하는 용어인스턴스와 부가인스턴스를 생성하거나 기존의 용어인스턴스 및 부가인스턴스 중 추론규칙에 부합하지 않은 것을 삭제하거나 수정 또는 변경할 수 있다.Such inference rules may be determined, modified, or changed according to a user's or designer's selection of the present invention and stored in the inference rule storage unit 70. In such a case, the inference unit 60 may be one of the existing terms and additional instances. It is possible to create term instances and supplementary instances that meet the inference rules, or delete, modify, or change existing term instances and supplementary instances that do not conform to the inference rules.

도 4는 본 발명의 일 실시예에 따른 온톨로지에 기반한 유사민원검색방법의 흐름을 나타낸 흐름도이다. 이하에서는 위 내용과 중복되는 것은 필요에 따라 중복 설명을 생략하도록 한다.4 is a flowchart illustrating a method of searching for similar complaints based on ontology according to an embodiment of the present invention. In the following, duplicate descriptions will be omitted as necessary.

추출부(10)는 신규민원에 대한 검색데이터를 입력받아 검색데이터로부터 주제어를 추출한다(S41). 생성부(20)는 신규민원이 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성한다(S42).The extraction unit 10 receives the search data for the new complaint and extracts the main word from the search data (S41). The generation unit 20 generates a query instance expressing the new complaint including the main word in a triple form by the ontology (S42).

검색부(30)는 유사판단규칙을 이용해 질의인스턴스의 신규민원과 민원인스턴스의 기존민원이 유사한지를 판단하여 신규민원과 유사한 기존민원에 대한 민원인스턴스가 인스턴스저장부(50)에 존재하는지 검색한다(S43). The search unit 30 determines whether the new complaint of the query instance and the existing complaint of the complaint instance are similar by using a similar decision rule and searches whether the complaint instance for the existing complaint similar to the new complaint exists in the instance storage unit 50 ( S43).

민원인스턴스는 기존에 제기되었던 기존민원과 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 인스턴스로 미리 인스턴스저장부(50)에 저장되어 있는 것이 바람직하다.Complaint instance is an instance expressing the relationship between the existing complaint and the term included in the existing complaint in a triple form by the ontology is preferably stored in the instance storage unit 50 in advance.

유사판단규칙은 질의인스턴스에 포함된 주제어와 민원인스턴스에 포함된 용어를 비교하여 신규민원과 기존민원의 유사성을 판단하는 규칙을 말한다. 이러한 유사판단규칙은 주제어와 용어 사이의 관계에 기반한 1차 논리식(first-order logic)으로 표현될 수 있다.The similarity judgment rule refers to a rule that determines the similarity between a new complaint and an existing complaint by comparing the terms included in the query instance with the terms included in the complaint instance. Such a similar decision rule may be expressed as first-order logic based on the relationship between the main word and the term.

유사판단규칙은 주제어와 동일한 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다. 또한 유사한판규칙은 주제어와 상하관계 및/또는 유사관계에 있는 용어를 포함하는 기존민원은 신규민원과 유사하다는 규칙을 포함할 수 있다.The rule of similarity may include a rule that an existing complaint that contains the same terms as the subject is similar to a new complaint. Similar rules may also include a rule that existing complaints that contain terms that are superficial and / or similar to the subject are similar to the new complaints.

검색부(30)는 용어인스턴스를 더 이용해 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색한다. 이 경우 용어인스턴스는 주제어 및 용어의 상하관계 및/또는 유사관계에 관한 온톨로지에 의한 트리플형태로 표현되는 인스턴스이다.The search unit 30 further searches the complaint instance for the existing complaint similar to the new complaint using the term instance. In this case, the term instance is an instance expressed in the triple form by the ontology related to the hierarchical and / or similar relationship between the main word and the term.

본 발명의 검색에는 마르코프 로직 네트워크가 적용될 수 있다. 이 경우 유사판단규칙은 마르코프 로직 네트워크에 따른 가중치가 적용된 복수의 규칙을 포함한다. 그리고 검색부(30)는 민원인스턴스와 질의인스턴스를 위 복수의 규칙들에 적용하여 가중치들을 연산한다. 그리고 검색부(30)는 그 연산의 결과가 미리 설정된 기준을 만족시키는 경우에 민원인스턴스의 기존민원이 신규민원과 유사하다고 판단한다.The Markov logic network may be applied to the search of the present invention. In this case, the similar decision rule includes a plurality of rules to which the weight is applied according to the Markov logic network. The search unit 30 calculates weights by applying the complaint instance and the query instance to the plurality of rules. If the result of the operation satisfies the preset criteria, the search unit 30 determines that the existing complaint of the civil instance is similar to the new complaint.

신규민원과 유사하다고 판단되는 기존민원에 대한 민원인스턴스가 검색된 경우 검색부(30)는 결과인스턴스를 생성한다(S44). 결과인스턴스는 신규민원과 기존민원의 유사관계를 온톨로지에 의한 트리플 형태로 표현한 인스턴스이다.If a civil instance is found for an existing civil complaint that is determined to be similar to the new civil complaint, the search unit 30 generates a result instance (S44). The resulting instance is an instance that expresses the similarity between new and existing complaints in triple form by ontology.

이 경우 결과처리부(40)는 부가인스턴스와 결과인스턴스를 이용하여 신규민원과 유사한 기존민원 및/또는 기존민원과 연관된 부가데이터를 출력하여 서비스제공 인터페이스(2)로 전달한다(S45). 부가인스턴스는 기존민원 및 기존민원과 연관된 부가데이터의 관계를 표현하는 인스턴스를 말한다.In this case, the result processor 40 outputs the existing complaint similar to the new complaint and / or additional data associated with the existing complaint using the additional instance and the result instance, and transmits the additional data to the service providing interface 2 (S45). An additional instance is an instance that expresses a relationship between an existing complaint and an additional data associated with the existing complaint.

만일 검색부(30)의 검색 결과 질의인스턴스의 신규민원과 유사한 기존민원에 대한 민원인스턴스가 인스턴스저장부(50)에 존재하지 않는 경우 결과처리부(40)는 그 부존재를 알리는 결과메세지를 출력하여 서비스제공 인터페이스(2)에 전달한다(S46).If the search result of the search unit 30 does not exist in the instance storage unit 50 for an existing complaint similar to the new complaint of the query instance, the result processing unit 40 outputs a result message indicating the absence of the service. The transfer is sent to the providing interface 2 (S46).

본 발명의 상기 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽 을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The method of the present invention can also be embodied in computer readable code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, which are also implemented in the form of a carrier wave (for example, transmission over the Internet). It also includes. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.

이상에서 실시예를 통해 설명한 본 발명의 기술적 범위는 상기 기재된 실시예에 한정되는 것은 아니고 본 발명의 사상 및 범위를 벗어나지 않는 범위에서 다양하게 수정 및 변형될 수 있음은 본 발명이 속한 기술 분야에서 통상의 지식을 가진 자에게 명백하다. 따라서 그러한 변형예 또는 수정예들은 본 발명의 특허청구범위에 기재된 발명의 범위에 속한다 해야 할 것이다.The technical scope of the present invention described above through the embodiments is not limited to the above-described embodiments, and various modifications and changes may be made without departing from the spirit and scope of the present invention. It is evident to those who have knowledge. Therefore, such modifications or variations will have to be belong to the scope of the invention described in the claims of the present invention.

도 1은 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색시스템의 구성을 도시한 구성도이다.1 is a block diagram showing the configuration of a similar complaint search system based on the ontology according to an embodiment of the present invention.

도 2는 본 발명의 일실시예에 따른 용어들 간의 관계를 정의한 용어 온톨로지를 도시한 구성도이다.2 is a diagram illustrating a term ontology defining a relationship between terms according to an exemplary embodiment of the present invention.

도 3은 본 발명의 일실시예에 따른 민원과 부가데이터의 관계를 정의한 부가데이터 온톨로지의 구성도이다.3 is a block diagram of an additional data ontology defining a relationship between a complaint and additional data according to an embodiment of the present invention.

도 4는 본 발명의 일실시예에 따른 온톨로지에 기반한 유사민원검색방법의 흐름을 나타낸 흐름도이다.4 is a flowchart illustrating a method of searching for similar complaints based on the ontology according to an embodiment of the present invention.

Claims (11)

신규민원에 대한 검색데이터를 입력받아 상기 검색데이터로부터 주제어를 추출하는 추출부;An extraction unit configured to receive search data for a new complaint and extract a main word from the search data; 상기 신규민원이 상기 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 생성부;A generation unit for generating a query instance expressing that the new complaint includes the main word in a triple form by an ontology; 기존에 제기되었던 기존민원과 상기 기존민원이 포함하는 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들을 저장하고 있는 인스턴스저장부; 및An instance storage unit for storing the existing civil complaints and the civil complaint instances expressing the inclusion relationship of the terms included in the existing civil complaints in triple form by the ontology; And 상기 주제어와 상기 용어를 비교하여 상기 신규민원과 상기 기존민원의 유사성을 판단하는 유사판단규칙을 이용해 상기 검색데이터와 유사한 기존민원에 대한 민원인스턴스를 검색하여 상기 검색데이터와 상기 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 검색부;를 포함하되,Search for complaint instances for existing complaints that are similar to the search data by using similarity determination rules to compare the main term and the term to determine the similarity between the new complaints and the existing complaints. Includes; Search unit for generating a result instance representing the similarity of the; 상기 인스턴스저장부는, 상기 기존민원 및 상기 기존민원과 연관된 부가데이터의 관계를 표현하는 부가인스턴스를 더 포함하고,The instance storage unit further includes an additional instance representing a relationship between the existing complaint and the additional data associated with the existing complaint. 상기 결과인스턴스 및 상기 부가인스턴스를 이용하여 상기 신규민원과 유사한 기존민원과 연관된 부가데이터를 출력하는 결과처리부;를 더 포함하는 온톨로지에 기반한 유사민원검색시스템.And a result processing unit for outputting additional data associated with the existing civil complaint similar to the new civil complaint using the result instance and the additional instance. 제1항에 있어서, 상기 유사판단규칙은 상기 주제어와 동일한 용어를 포함하는 기존민원은 상기 신규민원과 유사하다는 규칙을 포함하는 온톨로지에 기반한 유사민원검색시스템.The ontology-based similar complaint search system according to claim 1, wherein the similar decision rule includes a rule that an existing complaint including the same term as the main word is similar to the new complaint. 제1항에 있어서, 상기 인스턴스저장부는 상기 주제어 및 상기 용어의 상하관 계에 관한 용어인스턴스를 더 포함하고,The method of claim 1, wherein the instance storage unit further comprises a term instance related to the vertical relationship between the main word and the term, 상기 유사판단규칙은 상기 주제어와 상하관계에 있는 용어를 포함하는 기존민원은 상기 신규민원과 유사하다는 규칙을 포함하고The rule of similarity includes a rule that an existing complaint including terms that are related to the subject is similar to the new complaint. 상기 검색부는 상기 용어인스턴스를 이용해 상기 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 온톨로지에 기반한 유사민원검색시스템.The search unit is a similar complaint search system based on the ontology to search for a complaint instance for the existing complaint similar to the new complaint using the term instance. 제1항에 있어서, 상기 유사판단규칙은 마르코프 로직 네트워크에 따른 가중치가 적용된 복수의 규칙을 포함하고The method of claim 1, wherein the similar decision rule includes a plurality of rules to which weights according to the Markov logic network are applied. 상기 검색부는 상기 민원인스턴스와 상기 질의인스턴스를 상기 복수의 규칙들에 적용하여 가중치들을 연산하고 상기 연산의 결과가 미리 설정된 기준을 만족시키는 경우에 상기 민원인스턴스의 기존민원이 상기 신규민원과 유사하다고 판단하는 온톨로지에 기반한 유사민원검색시스템.The search unit calculates weights by applying the complaint instance and the query instance to the plurality of rules, and determines that the existing complaint of the complaint instance is similar to the new complaint when the result of the operation satisfies a preset criterion. Similar complaint search system based on ontology. 삭제delete 신규민원에 대한 검색데이터를 입력받아 상기 검색데이터로부터 주제어를 추출하는 단계;Receiving a search data for a new complaint and extracting a main word from the search data; 상기 신규민원이 상기 주제어를 포함함을 온톨로지에 의한 트리플 형태로 표현하는 질의인스턴스를 생성하는 단계;Generating a query instance expressing that the new complaint includes the main word in a triple form by ontology; 상기 주제어와 기존에 제기되었던 기존민원이 포함하는 용어를 비교하여 상기 신규민원과 상기 기존민원의 유사성을 판단하는 유사판단규칙을 이용해, 상기 기존민원과 상기 용어의 포함관계를 온톨로지에 의한 트리플 형태로 표현하는 민원인스턴스들 가운데 상기 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 단계;The inclusion of the term and the term in a triple form by ontology using a similar decision rule that compares the subject word and the term included in the existing complaint, and determines the similarity between the new complaint and the existing complaint. Retrieving a complaint instance for an existing complaint similar to the new complaint among the expressing complaint instances; 상기 신규민원과 상기 검색된 민원인스턴스의 기존민원의 유사관계를 표현하는 결과인스턴스를 생성하는 단계; 및Generating a result instance representing a similar relationship between the new complaint and an existing complaint of the retrieved complaint instance; And 상기 기존민원 및 상기 기존민원과 연관된 부가데이터의 관계를 표현하는 부가인스턴스와 상기 결과인스턴스를 이용하여 상기 신규민원과 유사한 기존민원과 연관된 부가데이터를 출력하는 단계;를 포함하는 온톨로지에 기반한 유사민원검색방법.Outputting additional data associated with the existing complaint similar to the new complaint using the additional instance expressing the relationship between the existing complaint and the additional data associated with the existing complaint, and the resultant instance. Way. 제6항에 있어서, 상기 유사판단규칙은 상기 주제어와 동일한 용어를 포함하는 기존민원은 상기 신규민원과 유사하다는 규칙을 포함하는 온톨로지에 기반한 유사민원검색방법.The method of claim 6, wherein the similarity determination rule includes a rule that an existing complaint including the same term as the main word is similar to the new complaint. 제6항에 있어서, 상기 유사판단규칙은 상기 주제어와 상하관계에 있는 용어를 포함하는 기존민원은 상기 신규민원과 유사하다는 규칙을 포함하고The method of claim 6, wherein the rule of similarity includes a rule that an existing complaint including a term that is related to the subject is similar to the new complaint. 상기 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 단계는, 상기 주제어 및 상기 용어의 상하관계에 관한 용어인스턴스를 이용해 상기 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 온톨로지에 기반한 유사민원검색방법.Retrieving a civil complaint instance for an existing civil complaint similar to the new civil complaint may include searching for a civil complaint instance for an existing civil complaint similar to the new civil complaint using a term instance related to the subject and the relationship between the term and the term. Search method. 제6항에 있어서, 상기 유사판단규칙은 마르코프 로직 네트워크에 따른 가중치가 적용된 복수의 규칙을 포함하고7. The method of claim 6, wherein the similar decision rule includes a plurality of rules to which weights according to the Markov logic network are applied. 상기 신규민원과 유사한 기존민원에 대한 민원인스턴스를 검색하는 단계는, 상기 민원인스턴스와 상기 질의인스턴스를 상기 복수의 규칙들에 적용하여 가중치들을 연산하고 상기 연산의 결과가 미리 설정된 기준을 만족시키는 경우에 상기 민원인스턴스의 기존민원이 상기 신규민원과 유사하다고 판단하는 온톨로지에 기반한 유사민원검색방법.Retrieving a civil complaint instance for an existing civil complaint similar to the new civil complaint may be performed by applying the civil complaint instance and the query instance to the plurality of rules to calculate weights and satisfying a predetermined criterion. An ontology-based similar complaint search method that determines that the existing complaint of the complaint instance is similar to the new complaint. 삭제delete 제6항 내지 제9항 중 어느 한 항에 기재된 유사민원검색방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for realizing the method for searching similarity claim according to any one of claims 6 to 9.
KR1020090074875A 2009-08-13 2009-08-13 Ontology Based Method And System For Searching Similar Civil Petition KR101083804B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090074875A KR101083804B1 (en) 2009-08-13 2009-08-13 Ontology Based Method And System For Searching Similar Civil Petition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090074875A KR101083804B1 (en) 2009-08-13 2009-08-13 Ontology Based Method And System For Searching Similar Civil Petition

Publications (2)

Publication Number Publication Date
KR20110017286A KR20110017286A (en) 2011-02-21
KR101083804B1 true KR101083804B1 (en) 2011-11-18

Family

ID=43775386

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090074875A KR101083804B1 (en) 2009-08-13 2009-08-13 Ontology Based Method And System For Searching Similar Civil Petition

Country Status (1)

Country Link
KR (1) KR101083804B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080109212A1 (en) * 2006-11-07 2008-05-08 Cycorp, Inc. Semantics-based method and apparatus for document analysis
KR100864564B1 (en) * 2007-01-11 2008-10-20 한국문화콘텐츠진흥원 System for Writing a Cultural Heritage Based on Scenario

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080109212A1 (en) * 2006-11-07 2008-05-08 Cycorp, Inc. Semantics-based method and apparatus for document analysis
KR100864564B1 (en) * 2007-01-11 2008-10-20 한국문화콘텐츠진흥원 System for Writing a Cultural Heritage Based on Scenario

Also Published As

Publication number Publication date
KR20110017286A (en) 2011-02-21

Similar Documents

Publication Publication Date Title
US20180095962A1 (en) Translation of natural language questions and requests to a structured query format
US10754886B2 (en) Using multiple natural language classifier to associate a generic query with a structured question type
Sleeman et al. Computing foaf co-reference relations with rules and machine learning
Ramli et al. Building an event ontology for historical domain to support semantic document retrieval
Amato et al. An application of semantic techniques for forensic analysis
Palmirani et al. Hybrid refining approach of pronto ontology
Fawei et al. Using legal ontologies with rules for legal textual entailment
Arbaaeen et al. Natural language processing based question answering techniques: A survey
Lisi et al. A FOIL-like method for learning under incompleteness and vagueness
Palmirani et al. PrOnto ontology refinement through open knowledge extraction
Modoni et al. The knowledge reuse in an industrial scenario: A case study
Farshidi et al. An adaptable indexing pipeline for enriching meta information of datasets from heterogeneous repositories
Santosh et al. PROO ontology development for learning feature specific sentiment relationship rules on reviews categorisation: a semantic data mining approach
Reynaud et al. Redescription mining for learning definitions and disjointness axioms in linked open data
KR101083804B1 (en) Ontology Based Method And System For Searching Similar Civil Petition
Santhiya et al. Automated crime tweets classification and geo-location prediction using big data framework
Cotfas et al. Analysing customers’ opinions towards product characteristics using social media
Rogushina et al. Use of ontologies for metadata records analysis in big data
Mentzingen et al. Automation of legal precedents retrieval: findings from a rapid literature review
Botega et al. Quantify: an information fusion model based on syntactic and semantic analysis and quality assessments to enhance situation awareness
Alkhatib et al. Towards ontology-based training-less multi-label text classification
Lomotey et al. Terms analytics service for CouchDB: a document-based NoSQL
Tovar et al. Patterns used to identify relations in corpus using formal concept analysis
Dang et al. A Practical Approach to Leverage Knowledge Graphs for Legal Query
Saengthongpattana et al. Ontology-Based Classifiers for Wikipedia Article Quality Classification

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141106

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151105

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181031

Year of fee payment: 8