WO2011162446A1 - 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법 - Google Patents

온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법 Download PDF

Info

Publication number
WO2011162446A1
WO2011162446A1 PCT/KR2010/006430 KR2010006430W WO2011162446A1 WO 2011162446 A1 WO2011162446 A1 WO 2011162446A1 KR 2010006430 W KR2010006430 W KR 2010006430W WO 2011162446 A1 WO2011162446 A1 WO 2011162446A1
Authority
WO
WIPO (PCT)
Prior art keywords
mining
term
entity name
entity
mining rule
Prior art date
Application number
PCT/KR2010/006430
Other languages
English (en)
French (fr)
Inventor
정한민
김평
이승우
이미경
서동민
성원경
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Publication of WO2011162446A1 publication Critical patent/WO2011162446A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Definitions

  • the present invention searches for a mining rule associated with a relationship name of an ontology schema from a mining rule database when more than one entity name corresponding to a term associated with a concept of an ontology schema is found in an entity name dictionary, and selects an entity name of a term using a mining rule.
  • the present invention relates to an entity name determination module and a method of a term using an entity name dictionary and a mining rule combined with an ontology schema.
  • Ontology means a working model of entities and interactions within a specific domain.
  • ontology conceptualizes and specifies knowledge in a specific domain and can be defined as a network or graph having a relationship between concepts used in the domain.
  • Ontology is constructed by defining concepts and attributes and establishing the relationship between concepts and concepts by obtaining knowledge about the components of ontology that is to be constructed in ontology from related documents of specific field, namely concept, property of concept, connection relation between concepts.
  • RDF resource description framework
  • RDF consists of the concept of resource, property, and statement, and all things in the input document are represented as resources, and they can represent properties such as the characteristics of each resource or the relationship of other resources. .
  • An RDF network can be constructed by detecting an entity name from text and converting it to a corresponding RDF triple using a mining rule.
  • the entity name means a word or a set of words that can be classified such as a person, an organization, or the like, a song name, a broadcast name, or a place name, and a mining rule can be obtained from a mining pattern and the same.
  • Object name detection and mining rules can be applied in various ways.
  • the object name can be detected using a dictionary of object names that pre-stores the relationship between terms and object names, or a mining rules database that pre-stores mining patterns and RDF triple relationships. Mining rules can be applied to build an RDF network.
  • the present invention provides a module and method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema that selects an entity name of a term associated with a concept of an ontology schema using an entity name dictionary and a mining rule database.
  • the present invention relates to a recording medium readable by an electronic device recording the same.
  • an entity name dictionary in which an entity name of a term associated with an ontology schema and associated with a class is defined, a mining pattern and resource description framework associated with an ontology schema and associated with a property : Resource Description Framework)
  • Object name dictionary and mining rule database where mining rule database with triple mining rule is defined, mining pattern generator that recognizes terms from text and converts them into mining patterns.
  • Mining rules to search for object names and mining rules in the object name dictionary and mining rules database, and if more than one object name corresponding to a recognized term is found, Entity name selection section to select Entity name of term Provides an entity name determination module of terms using an entity name dictionary and a mining rule combined with an ontology schema including a.
  • an entity name dictionary in which an entity name of a term associated with an ontology schema and associated with a class is defined, and a mining pattern and resource description framework (RDF) associated with an ontology schema and associated with a property : Resource Description Framework) Mining the corresponding mining rules and object names by using the dictionary name, mining rules database, input mining pattern, and the terms included in the mining pattern.
  • Object name and mining rule search unit respectively searched from rule database and object name dictionary, and object name selector to select object name of term associated with concept by using mining rule if more than one object name corresponding to term is found.
  • Dictionary and My Name Dictionary combined with ontology schema Provides a module for determining the entity name of a term using ning rules.
  • the entity name determination module of a term using an entity name dictionary and mining rule combined with an ontology schema may further include a validation interface that displays one or more of the selected entity name of the term, a representative term of the term, or an RDF triple of the mining rule. have.
  • the entity name dictionary may store and store authority data consisting of an entity name corresponding to a concept of an ontology schema, a term classified as an entity name, an identifier of a term, a representative term, and an identifier of a representative term in one format. .
  • the entity name selection unit may select a matching entity name by comparing two or more entity names corresponding to the recognized terms with a concept constituting the RDF triple of the searched mining rule.
  • an entity name dictionary defined with an ontology schema and a term associated with a class is defined, a mining pattern and resource description framework associated with an ontology schema and associated with a property.
  • Resource Description Framework A term using dictionary and mining rules combined with an ontology schema that retrieves the object name or identifier of a recognized term from a text document entered using a mining rules database with triple mining rules defined.
  • a method of determining an entity name of a method comprising: recognizing a term from text and converting the term into a mining pattern, retrieving a corresponding entity name and a mining rule from an entity name dictionary and a mining rule database using the recognized term and the mining pattern; Two or more object names found and one found Use the Mining Rules to provide a person the object determines the object of the term people with pre-mining rules and methods combined with ontology schema comprising selecting the object name that corresponds to the term.
  • an entity name dictionary defined with an ontology schema and a term associated with a class is defined, a mining pattern and resource description framework associated with an ontology schema and associated with a property.
  • Resource Description Framework A term using dictionary and mining rules combined with an ontology schema that retrieves the object name or identifier of a recognized term from a text document entered using a mining rules database with triple mining rules defined.
  • a method for determining an entity name of a device comprising: searching a mining rule database and the entity name dictionary for a corresponding mining rule and an entity name using an input mining pattern and a term included in the mining pattern, and searching for two or more entities Term using people and one mining rule found
  • a method of determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema may be included.
  • the entity name dictionary may store and store authority data consisting of an entity name corresponding to a concept of an ontology schema, a term classified as an entity name, an identifier of a term, a representative term, and an identifier of a representative term in one format. .
  • the retrieval of the corresponding entity name and mining rule from the entity name dictionary and the mining rules database using terms and mining patterns can be performed by retrieving all entity names if there are multiple entity names matching the terms recognized in the entity name dictionary. You can search.
  • a program for performing a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema is provided and provides a recording medium readable by an electronic device.
  • FIG. 1 is a block diagram illustrating an embodiment of an entity name determination module of terms using an entity name dictionary and a mining rule combined with an ontology schema according to an aspect of the present invention.
  • Figure 2 is a block diagram showing another embodiment of the entity name determination module of the term using the entity name dictionary and mining rules combined with the ontology schema in accordance with an aspect of the present invention.
  • FIG. 3 is a flow diagram illustrating one embodiment of a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema in accordance with another aspect of the present invention.
  • FIG. 4 is a flow diagram illustrating another embodiment of a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema according to another aspect of the present invention.
  • FIG. 5 is a flowchart illustrating a process of selecting an entity name suitable for a term from among a plurality of entity names in a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema according to another aspect of the present invention.
  • FIG. 6 is a conceptual diagram illustrating a connection relationship between an entity name dictionary and a mining rule database combined with an ontology schema according to an aspect of the present invention.
  • FIG. 1 is a block diagram illustrating an embodiment of an entity name determination module of terms using an entity name dictionary and a mining rule combined with an ontology schema according to an aspect of the present invention.
  • the entity name determination module 100 of the term using the entity name dictionary and mining rules combined with the ontology schema is the entity name dictionary and mining rule database 110 ), The mining pattern generation unit 120, the entity name and mining rule search unit 130, the entity name selection unit 140, or the verification interface 150.
  • the entity name dictionary and mining rule database 110 may store the entity name dictionary and the mining rule database as one or one database.
  • the entity name dictionary is a database in which the entity names of terms associated with the ontology schema and associated with the class are defined and stored.
  • the mining rules database is the mining pattern and resource description framework (RDF) associated with the ontology schema and associated with the property name. : Resource Description Framework) A database that defines and stores mining rules consisting of triples.
  • the entity name dictionary 610 and the mining rule database 630 associated with the ontology schema 620 are associated with the concept name of the ontology schema 620 and the entity name of the entity name dictionary 610 and the ontology schema 620. ) And the relation name set as the key value of the mining rules database are linked.
  • the concept of ontology schema, religion, people, events, etc. may be defined as the entity name that is the key value of the entity name dictionary, the specific instant may be defined in terms of the entity name dictionary.
  • relation names which are key values of the mining rule database, and may be connected to mining patterns and RDF triples corresponding to the relation names.
  • entity name dictionary and mining rule database may be formed in association with the concept or relationship name of the ontology schema.
  • the entity name dictionary may store authority data composed of entity names corresponding to the concept of ontology schema, terms classified from entity names, term identifiers, representative terms and identifiers of representative terms, in one format. Linked to the entity name of the term
  • the mining rule database may store a mining rule composed of a mining pattern and a resource description framework (RDF) triple.
  • RDF resource description framework
  • the mining rule is defined by including the relationship name of the ontology schema, one mining pattern that corresponds to the relationship name, and one or more RDF triples that correspond to the mining pattern. You can connect and save in one format.
  • the mining pattern generator 120 may recognize a term from text and convert the term into a mining pattern.
  • the mining pattern generation unit 120 recognizes a term using morphological analysis, parsing, and semantic analysis from a text document in association with the entity name dictionary, and expresses the recognized term as an entity name corresponding to the term stored in the entity name dictionary. Can be.
  • the mining pattern generator 120 may search for and extract all object names when a plurality of different object names corresponding to the same term exist when the recognized term is represented as an object name corresponding to a term stored in the object name dictionary. Can be.
  • the mining pattern generator 120 may convert the displayed text document including each individual name into a mining pattern.
  • the entity name and mining rule search unit 130 may search the entity name dictionary and the mining rule database for the corresponding entity name and mining rule, respectively, using the recognized term and mining pattern.
  • the entity name selection unit 140 may select an appropriate entity name of a term associated with a concept using a mining rule when two or more entity names retrieved from the entity name and the mining rule search unit 130 are included.
  • Ontology Schema and Object Name Dictionary and ontology schema and mining rule database are linked using different components (concept and object name, relationship name and relationship name), so mining rules can be used to resolve the ambiguity of object name. have.
  • the validation interface 150 can display one or more of the selected entity name of the term, the representative term of the term, or the RDF triple of the mining rule, and the user can determine via the validation interface whether the selected entity name is the proper entity name of the term.
  • Apple recognizes the terms “Apple” and “Computer” from a text document that says “Apple refers to a computer as its product,” and retrieves the individual names from the entity name dictionary, the entity name of the term “Apple” [Object] "or” company ", and the entity name of the term” computer "may be searched for” [thing] ".
  • the text document When the text document is converted to a mining pattern, it can be converted to '[?] Jcs [thing] jco% self% product'.
  • a mining pattern matching the mining pattern is retrieved from the mining rules database, the mining rule '[ Company1] jcs [object] jco% self% product '->' [company1] -product- [object1] 'can be searched.
  • the individual name of 'Apple' can be selected as '[company]' and can resolve the ambiguity of the individual name.
  • FIG. 1 is a block diagram showing an embodiment of an entity name determination module of terms using an entity name dictionary and a mining rule combined with an ontology schema according to an aspect of the present invention
  • FIG. 2 is an ontology according to an aspect of the present invention
  • 6 is a block diagram illustrating another embodiment of an entity name determination module of terms using an entity name dictionary and a mining rule combined with a schema
  • FIG. 6 is an entity name dictionary and mining rule database combined with an ontology schema according to an aspect of the present invention. Is a schematic diagram illustrating a conceptual diagram for explaining a connection relationship between s.
  • the entity name determination module 100 of the term using the entity name dictionary and mining rules combined with the ontology schema is the entity name dictionary and mining rule database 110 ), The mining pattern generation unit 120, the entity name and mining rule search unit 130, the entity name selection unit 140, or the verification interface 150.
  • the entity name dictionary and mining rule database 110 may store the entity name dictionary and the mining rule database as one or one database.
  • the entity name dictionary is a database in which the entity names of terms associated with the ontology schema and associated with the class are defined and stored.
  • the mining rules database is the mining pattern and resource description framework (RDF) associated with the ontology schema and associated with the property name. : Resource Description Framework) A database that defines and stores mining rules consisting of triples.
  • the entity name dictionary 610 and the mining rule database 630 associated with the ontology schema 620 include the concept of the ontology schema 620 and the entity of the entity name dictionary 610.
  • the names are associated with each other, and the relationship name (Property) of the ontology schema 620 and the relationship name set as a key value of the mining rule database are associated with each other.
  • the concept of ontology schema, religion, people, events, etc. may be defined as the entity name that is the key value of the entity name dictionary, the specific instant may be defined in terms of the entity name dictionary.
  • relation names which are key values of the mining rule database, and may be connected to mining patterns and RDF triples corresponding to the relation names.
  • entity name dictionary and mining rule database may be formed in association with the concept or relationship name of the ontology schema.
  • the entity name dictionary may store authority data composed of entity names corresponding to the concept of ontology schema, terms classified from entity names, term identifiers, representative terms and identifiers of representative terms, in one format. Linked to the entity name of the term
  • the mining rule database may store a mining rule composed of a mining pattern and a resource description framework (RDF) triple.
  • RDF resource description framework
  • the mining rule is defined by including the relationship name of the ontology schema, one mining pattern that corresponds to the relationship name, and one or more RDF triples that correspond to the mining pattern.
  • the mining rule database defines the relationship name, mining pattern, and RDF triple of the ontology schema. You can connect and save in one format.
  • the mining pattern generator 120 may recognize a term from text and convert the term into a mining pattern.
  • the mining pattern generation unit 120 recognizes a term using morphological analysis, parsing, and semantic analysis from a text document in association with the entity name dictionary, and expresses the recognized term as an entity name corresponding to the term stored in the entity name dictionary. Can be.
  • the mining pattern generator 120 may search for and extract all object names when a plurality of different object names corresponding to the same term exist when the recognized term is represented as an object name corresponding to a term stored in the object name dictionary. Can be.
  • the mining pattern generator 120 may convert the displayed text document including each individual name into a mining pattern.
  • the entity name and mining rule search unit 130 may search the entity name dictionary and the mining rule database for the corresponding entity name and mining rule, respectively, using the recognized term and mining pattern.
  • the entity name selection unit 140 may select an appropriate entity name of a term associated with a concept using a mining rule when two or more entity names retrieved from the entity name and the mining rule search unit 130 are included.
  • Ontology Schema and Object Name Dictionary and ontology schema and mining rule database are linked using different components (concept and object name, relationship name and relationship name), so mining rules can be used to resolve the ambiguity of object name. have.
  • the validation interface 150 can display one or more of the selected entity name of the term, the representative term of the term, or the RDF triple of the mining rule, and the user can determine via the validation interface whether the selected entity name is the proper entity name of the term.
  • Apple recognizes the terms “Apple” and “Computer” from a text document that says “Apple refers to a computer as its product,” and retrieves the individual names from the entity name dictionary, the entity name of the term “Apple” [Object] "or” company ", and the entity name of the term” computer "may be searched for” [thing] ".
  • the text document When the text document is converted to a mining pattern, it can be converted to '[?] Jcs [thing] jco% self% product'.
  • a mining pattern matching the mining pattern is retrieved from the mining rules database, the mining rule '[ Company1] jcs [object] jco% self% product '->' [company1] -product- [object1] 'can be searched.
  • the individual name of 'Apple' can be selected as '[company]' and can resolve the ambiguity of the individual name.
  • the entity name determination module 200 of the term using the entity name dictionary and mining rules combined with the ontology schema is the entity name dictionary and mining rule database 210 ), An entity name and mining rule search unit 220, an entity name selection unit 230, or a verification interface 240.
  • the entity name determination module 200 of the term using the entity name dictionary and the mining rule combined with the ontology schema according to the second embodiment has a configuration in which a mining pattern generation unit is omitted in the configuration of the first embodiment.
  • the direct input to the entity name determination module 200 of the term using the entity name dictionary and mining rules combined with the means means a module for determining the entity name of the term.
  • the entity name and mining rule search unit 220, the entity name selection unit 230, and the verification interface 240 of the entity name determination module 200 of the term using the entity name dictionary and mining rules combined with the ontology schema may include a first interface.
  • the functions of the entity name and mining rule search unit 130, the entity name selection unit 140, and the verification interface 150 of the embodiment are the same.
  • the entity name and mining rule search unit 130 of the first embodiment receives the term and the mining pattern recognized by the mining pattern generator 120 and searches for the entity name and the mining rule using the mining pattern.
  • the entity name and mining rule search unit 220 directly receives a mining pattern, and searches for the entity name and the mining rule using terms and mining patterns included in the mining pattern.
  • FIG. 3 is a flowchart illustrating an embodiment of a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema according to another aspect of the present invention
  • FIG. 4 is an ontology schema according to another aspect of the present invention.
  • Is a flowchart illustrating another embodiment of a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with FIG. 5, and a term using an entity name dictionary and mining rule combined with an ontology schema according to another aspect of the present invention.
  • Fig. 1 is a diagram schematically illustrating a flow chart for explaining a process of selecting an entity name suitable for a term among a plurality of entity names in the method for determining an entity name.
  • the entity name determination method of the term using the entity name dictionary and the mining rule combined with the ontology schema recognizes the term from the text (310), converts it into a mining pattern (S320), and the term
  • the mining pattern may be searched in an entity name dictionary and a mining rule database (S330), and an entity name suitable for a term may be selected among a plurality of entity names using a mining rule (S340).
  • the text document When the text document is converted into a mining pattern, the text document may be converted to '% ideal_type of [person 1] jcs [?] Jco% self'.
  • the mining pattern matching the mining pattern is searched from the mining rules database, the mining rule ' [Person1] jcs [person2] jco% self% ideal_type '->' [person1] -ideal- [person2] 'can be searched.
  • the entity name of Johnny Weir can be selected as a [person] and can resolve the ambiguity of the entity name.
  • a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema is performed by directly receiving a mining pattern and using a term included in the mining pattern and the mining pattern.
  • An entity name and a mining rule may be searched for from an entity name dictionary and a mining rule database (S410), and an entity name suitable for a term may be selected among a plurality of entity names using the searched mining rule.
  • one or more of a term, a selected entity name of the term, a representative term, and an identifier of the representative term may be displayed on the verification interface to confirm whether the entity name of the term is appropriate for the user.
  • a program for performing a method for determining an entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema may be recorded and recorded on a recording medium readable by the electronic device.
  • the method for determining the entity name of a term using an entity name dictionary and a mining rule combined with an ontology schema may be written by a computer program, and codes and code segments constituting the program may be easily inferred by a computer programmer in the art. .
  • a method of determining an object name of a term using an object name dictionary and a mining rule combined with an ontology schema is stored in a computer readable medium, which is read and executed by a computer, so that the proper object of the term is determined. Name can be determined.
  • the present invention can be applied to an apparatus for determining an appropriate entity name of a term by using the entity name determination module of a term using an entity name dictionary and a mining rule combined with an ontology schema.

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법에 관한 것으로, 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 상기 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스가 저장되는 개체명 사전 및 마이닝 규칙 데이터베이스, 텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환하는 마이닝 패턴 생성부, 상기 인식된 용어와 상기 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 상기 개체명 사전과 상기 마이닝 규칙 데이터베이스에서 각각 검색하는 개체명 및 마이닝 규칙 검색부, 및 상기 인식된 용어에 대응되는 개체명이 두 개 이상 검색된 경우 상기 마이닝 규칙을 이용하여 개념과 연결된 용어의 개체명을 선택하는 개체명 선택부를 포함한다.

Description

온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법
본 발명은 온톨로지 스키마의 개념과 연결된 용어에 대응되는 개체명이 개체명 사전에서 두 개 이상 검색된 경우 온톨로지 스키마의 관계명과 연결된 마이닝 규칙을 마이닝 규칙 데이터베이스로부터 검색하고 마이닝 규칙을 이용하여 용어의 개체명을 선택하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법에 관한 것이다.
최근 시멘틱 웹(Semantic Web)의 연구와 관련하여 온톨로지(Ontology)를 이용한 데이터 모델이 주목받고 있다. 온톨로지는 특정한 영역 내에 있는 실체 및 상호 작용의 작업 모델을 의미한다.
즉, 온톨로지는 특정한 도메인(Domain) 내의 지식을 개념화하고 이를 명세화한 것으로 그 도메인 내에 사용되는 개념들의 관계성을 가진 네트워크 또는 그래프로 정의할 수 있다.
온톨로지는 특정 분야의 관련된 문서로부터 온톨로지에 구축할 온톨로지의 구성 요소 즉, 개념, 개념의 속성, 개념 간 연결 관계 등에 관한 지식을 얻어 개념과 속성을 정의하고 개념과 개념의 관계를 설정하여 구축된다.
또한, 웹 자원에 대한 의미성을 부여하기 위하여 자원과 속성, 속성값 등의 3차원 구조인 리소스 기술 프레임워크(RDF: Resource Description Framework)로 나타낼 수 있다.
RDF는 리소스(Resource), 특성(Property), 서술문(Statement)의 개념으로 구성되고, 입력된 문서의 모든 사물은 리소스로 표현되고, 각 리소스의 특성이나 다른 리소스의 관계 등의 특성을 나타낼 수 있다.
텍스트로부터 개체명을 검출하고 마이닝 규칙(Mining Rule)을 이용하여 대응되는 RDF 트리플로 변환하여 RDF 네트워크를 구축할 수 있다.
여기서, 개체명은 사람(Person), 기관(Organization) 등의 이름, 곡명, 방송명 또는 지명과 같이 분류될 수 있는 단어 또는 일련의 단어들의 집합을 의미하고, 마이닝 규칙은 마이닝 패턴과 그로부터 획득할 수 있는 RDF 트리플로 구성된 규칙을 의미한다.
개체명 검출 및 마이닝 규칙 적용은 여러 가지 방법을 사용할 수 있으며, 용어와 개체명의 관계를 미리 저장한 개체명 사전 또는 마이닝 패턴과 RDF 트리플 관계를 미리 저장한 마이닝 규칙 데이터베이스를 이용하여 개체명을 검출하고 마이닝 규칙을 적용하여 RDF 네트워크를 구축할 수 있다.
개체명 사전 또는 마이닝 규칙 데이터베이스를 이용하여 개체명을 검출하거나 마이닝 규칙을 적용하기 위해서는 개체명 사전 또는 마이닝 규칙 데이터베이스에 저장된 데이터의 업데이트와 애매성 해소가 요구된다.
본 발명은 개체명 사전 및 마이닝 규칙 데이터베이스를 이용하여 온톨로지 스키마의 개념(Class)과 연결된 용어의 개체명을 선택하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법, 이를 기록한 전자 장치에서 판독 가능한 기록매체에 관한 것이다.
본 발명의 한 측면에 따르면, 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스가 저장되는 개체명 사전 및 마이닝 규칙 데이터베이스, 텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환하는 마이닝 패턴 생성부, 인식된 용어와 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 개체명 사전과 마이닝 규칙 데이터베이스에서 각각 검색하는 개체명 및 마이닝 규칙 검색부, 및 인식된 용어에 대응되는 개체명이 두 개 이상 검색된 경우 마이닝 규칙을 이용하여 개념과 연결된 용어의 개체명을 선택하는 개체명 선택부를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈을 제공한다.
본 발명의 다른 특면에 따르면, 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스가 저장되는 개체명 사전 및 마이닝 규칙 데이터베이스, 입력된 마이닝 패턴과 마이닝 패턴에 포함되는 용어를 이용하여 대응되는 마이닝 규칙과 개체명을 마이닝 규칙 데이터베이스와 개체명 사전에서 각각 검색하는 개체명 및 마이닝 규칙 검색부, 및 용어에 대응되는 개체명이 두 개 이상 검색된 경우 마이닝 규칙을 이용하여 개념과 연결된 용어의 개체명을 선택하는 개체명 선택부를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈을 제공한다.
온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈은, 용어의 선택된 개체명, 용어의 대표 용어 또는 마이닝 규칙의 RDF 트리플 중 하나 이상을 표시하는 검증 인터페이스를 더 포함할 수 있다.
개체명 사전은, 온톨로지 스키마의 개념(Class)에 해당되는 개체명, 개체명으로 분류되는 용어, 용어의 식별자, 대표 용어와 대표 용어의 식별자로 구성된 전거 데이터를 하나의 포맷으로 연결하여 저장할 수 있다.
개체명 선택부는, 검색된 하나의 마이닝 규칙의 RDF 트리플을 구성하는 개념과 인식된 용어에 대응되는 두 개 이상의 개체명을 비교하여 일치하는 개체명을 선택할 수 있다.
본 발명의 또 다른 측면에 따르면, 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스를 이용하여 입력된 텍스트 문서로부터 인식된 용어의 개체명 또는 식별자를 검색하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법에 있어서, 텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환하는 단계, 인식된 용어와 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 개체명 사전과 마이닝 규칙 데이터베이스로부터 검색하는 단계, 및 검색된 두 개 이상의 개체명들과 검색된 하나의 마이닝 규칙을 이용하여 용어에 대응되는 개체명을 선택하는 단계를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법을 제공한다.
본 발명의 또 다른 측면에 따르면, 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스를 이용하여 입력된 텍스트 문서로부터 인식된 용어의 개체명 또는 식별자를 검색하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법에 있어서, 입력된 마이닝 패턴과 마이닝 패턴에 포함되는 용어를 이용하여 대응되는 마이닝 규칙과 개체명을 상기 마이닝 규칙 데이터베이스와 상기 개체명 사전에서 검색하는 단계, 및 검색된 두 개 이상의 개체명들과 검색된 하나의 마이닝 규칙을 이용하여 용어에 대응되는 개체명을 선택하는 단계를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법을 제공한다.
검색된 두 개 이상의 개체명들과 검색된 하나의 마이닝 규칙을 이용하여 용어에 대응되는 개체명을 선택하는 단계는, 검색된 두 개 이상의 개체명과 마이닝 규칙의 RDF 트리플로부터 개념을 추출하는 단계, 및 추출된 개념과 대응되는 개체명을 용어의 개체명으로 선택하는 단계를 포함할 수 있다.
개체명 사전은, 온톨로지 스키마의 개념(Class)에 해당되는 개체명, 개체명으로 분류되는 용어, 용어의 식별자, 대표 용어와 대표 용어의 식별자로 구성된 전거 데이터를 하나의 포맷으로 연결하여 저장할 수 있다.
용어와 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 개체명 사전과 마이닝 규칙 데이터베이스로부터 검색하는 단계는, 개체명 사전에서 인식된 용어와 일치하는 다수의 개체명이 존재하는 경우 다수의 개체명을 모두 검색할 수 있다.
본 발명의 또 다른 측면에 따르면, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법을 수행하는 프로그램이 기록되고 전자 장치에서 판독 가능한 기록 매체를 제공한다.
본 발명에 따르면, 온톨로지 스키마의 개념(Class)과 연계된 개체명 사전 및 온톨로지 스키마의 관계명(Property)과 연계된 마이닝 규칙 데이터베이스를 이용하여 언어 자원을 통일적으로 관리할 수 있는 효과가 있다.
또한, 온톨로지 스키마, 개체명 사전 및 마이닝 규칙 데이터베이스의 연관 관계를 이용하여 용어에 대응되는 개체명이 개체명 사전으로부터 다수 검색되는 경우 용어의 적합한 개체명을 결정하여 애매성을 해소할 수 있는 효과가 있다.
도 1은 본 발명의 일 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈의 일 실시예를 나타내는 구성도.
도 2는 본 발명의 일 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈의 다른 실시예를 나타내는 구성도.
도 3은 본 발명의 다른 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법의 일 실시예를 나타내는 흐름도.
도 4는 본 발명의 다른 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법의 다른 실시예를 나타내는 흐름도.
도 5는 본 발명의 다른 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법의 다수의 개체명 중 용어에 적합한 개체명을 선택하는 과정을 설명하는 흐름도.
도 6은 본 발명의 일 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙 데이터베이스의 연결관계를 설명하기 위한 개념도.
도 1은 본 발명의 일 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈의 일 실시예를 나타내는 구성도이다.
본 발명의 제1 실시예에 따르면, 도 1에 도시한 바와 같이, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈(100)은 개체명 사전 및 마이닝 규칙 데이터베이스(110), 마이닝 패턴 생성부(120), 개체명 및 마이닝 규칙 검색부(130), 개체명 선택부(140) 또는 검증 인터페이스(150)를 포함한다.
개체명 사전 및 마이닝 규칙 데이터베이스(110)는 개체명 사전과 마이닝 규칙 데이터베이스를 각각 또는 하나의 데이터베이스로 저장할 수 있다.
개체명 사전은 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의되어 저장된 데이터베이스이고, 마이닝 규칙 데이터베이스는 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의되어 저장된 데이터베이스이다.
온톨로지 스키마(620)와 연계된 개체명 사전(610) 및 마이닝 규칙 데이터베이스(630)는 온톨로지 스키마(620)의 개념(Class)과 개체명 사전(610)의 개체명이 서로 연계되고, 온톨로지 스키마(620)의 관계명(Property)과 마이닝 규칙 데이터베이스의 키 값으로 설정된 관계명이 서로 연계되어 있다.
예를 들어, 온톨로지 스키마의 개념인 종교, 사람, 종목 등은 개체명 사전의 키 값인 개체명으로 정의되고, 구체적인 인스턴트는 개체명 사전의 용어로 정의될 수 있다.
또한, 온톨로지 스키마의 관계명인 직업, 신앙, 분야 등은 마이닝 규칙 데이터베이스의 키 값인 관계명으로 정의되고, 각각의 관계명에 대응되는 마이닝 패턴, RDF 트리플과 연결될 수 있다.
따라서, 개체명 사전 및 마이닝 규칙 데이터베이스는 온톨로지 스키마의 개념 또는 관계명과 연계되어 형성될 수 있다.
개체명 사전은 온톨로지 스키마의 개념에 해당되는 개체명, 개체명으로부터 분류되는 용어, 용어의 식별자, 대표 용어와 대표 용어의 식별자로 구성되는 전거 데이터를 하나의 포맷으로 연결하여 저장할 수 있다. 용어의 개체명으로 연결되고
마이닝 규칙 데이터베이스는 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙을 저장할 수 있다.
마이닝 규칙은 온톨로지 스키마의 관계명, 관계명에 대응되는 하나의 마이닝 패턴, 마이닝 패턴과 대응되는 하나 이상의 RDF 트리플을 포함하여 정의되며, 마이닝 규칙 데이터베이스는 온톨로지 스키마의 관계명, 마이닝 패턴, RDF 트리플을 하나의 포맷으로 연결하여 저장할 수 있다.
마이닝 패턴 생성부(120)는 텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환할 수 있다.
마이닝 패턴 생성부(120)는 개체명 사전과 연동하여 텍스트 문서로부터 형태소 분석, 구문 분석, 의미 분석을 사용하여 용어를 인식하고, 인식된 용어를 개체명 사전에 저장된 용어에 대응되는 개체명으로 나타낼 수 있다.
마이닝 패턴 생성부(120)는 인식된 용어를 개체명 사전에 저장된 용어에 대응되는 개체명으로 나타낼 때, 동일한 용어에 대응되는 서로 다른 개체명이 다수개 존재하는 경우, 모든 개체명을 검색하여 추출할 수 있다.
또한, 마이닝 패턴 생성부(120)는 모든 개체명 각각을 포함하여 표시된 텍스트 문서를 마이닝 패턴으로 변환할 수 있다.
개체명 및 마이닝 규칙 검색부(130)는 인식된 용어와 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 개체명 사전과 마이닝 규칙 데이터베이스에서 각각 검색할 수 있다.
개체명 선택부(140)는 개체명 및 마이닝 규칙 검색부(130)로부터 검색된 개체명이 두 개 이상 포함된 경우, 마이닝 규칙을 이용하여 개념과 연결된 용어의 적합한 개체명을 선택할 수 있다.
온톨로지 스키마와 개체명 사전 및 온톨로지 스키마와 마이닝 규칙 데이터베이스는 각각 서로 다른 구성 요소(개념과 개체명, 관계명과 관계명)를 이용하여 연계되어 있으므로, 마이닝 규칙을 이용하여 개체명의 애매성을 해소할 수 있다.
검증 인터페이스(150)는 용어의 선택된 개체명, 용어의 대표 용어 또는 마이닝 규칙의 RDF 트리플 중 하나 이상을 표시할 수 있고, 사용자는 검증 인터페이스를 통해 선택된 개체명이 용어의 적합한 개체명인지 결정할 수 있다.
예를 들어, "애플은 컴퓨터를 자사의 생산품이라고 했다"는 텍스트 문서로부터 '애플', '컴퓨터'라는 용어를 인식하고 개체명 사전으로부터 각각의 개체명을 검색하면 용어 '애플'의 개체명은 '[사물]' 또는 '[회사]'로 검색되고 용어 '컴퓨터'의 개체명은 '[사물]'로 검색될 수 있다.
이와 같이, 용어 '애플'의 개체명을 검색한 결과 개체명이 두 개 이상 검색된 경우, 두 개 이상 검색된 개체명 중 적합한 개체명을 결정할 필요가 있다.
상기 텍스트 문서를 마이닝 패턴으로 변환하면, '[?] jcs [사물] jco %self의 %product'로 변환될 수 있고, 마이닝 규칙 데이터베이스로부터 마이닝 패턴과 일치하는 마이닝 패턴을 검색하면, 마이닝 규칙 '[회사1] jcs [사물] jco %self의 %product' -> '[회사1]-생산품-[사물1]'가 검색될 수 있다.
따라서, '애플'의 개체명은 '[회사]'로 선택될 수 있고 개체명의 애매성을 해소할 수 있다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명의 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
이제 본 발명의 실시예에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법, 이를 기록한 전자 장치에 의해 판독 가능한 기록매체에 대하여 도면을 참조하여 상세하게 설명하고, 도면 부호에 관계없이 동일하거나 대응하는 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은 본 발명의 일 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈의 일 실시예를 나타내는 구성도이고, 도 2는 본 발명의 일 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈의 다른 실시예를 나타내는 구성도이고, 도 6은 본 발명의 일 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙 데이터베이스의 연결관계를 설명하기 위한 개념도를 개략적으로 나타낸 도면이다.
본 발명의 제1 실시예에 따르면, 도 1에 도시한 바와 같이, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈(100)은 개체명 사전 및 마이닝 규칙 데이터베이스(110), 마이닝 패턴 생성부(120), 개체명 및 마이닝 규칙 검색부(130), 개체명 선택부(140) 또는 검증 인터페이스(150)를 포함한다.
개체명 사전 및 마이닝 규칙 데이터베이스(110)는 개체명 사전과 마이닝 규칙 데이터베이스를 각각 또는 하나의 데이터베이스로 저장할 수 있다.
개체명 사전은 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의되어 저장된 데이터베이스이고, 마이닝 규칙 데이터베이스는 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의되어 저장된 데이터베이스이다.
온톨로지 스키마(620)와 연계된 개체명 사전(610) 및 마이닝 규칙 데이터베이스(630)는, 도 6에 도시한 바와 같이, 온톨로지 스키마(620)의 개념(Class)과 개체명 사전(610)의 개체명이 서로 연계되고, 온톨로지 스키마(620)의 관계명(Property)과 마이닝 규칙 데이터베이스의 키 값으로 설정된 관계명이 서로 연계되어 있다.
예를 들어, 온톨로지 스키마의 개념인 종교, 사람, 종목 등은 개체명 사전의 키 값인 개체명으로 정의되고, 구체적인 인스턴트는 개체명 사전의 용어로 정의될 수 있다.
또한, 온톨로지 스키마의 관계명인 직업, 신앙, 분야 등은 마이닝 규칙 데이터베이스의 키 값인 관계명으로 정의되고, 각각의 관계명에 대응되는 마이닝 패턴, RDF 트리플과 연결될 수 있다.
따라서, 개체명 사전 및 마이닝 규칙 데이터베이스는 온톨로지 스키마의 개념 또는 관계명과 연계되어 형성될 수 있다.
개체명 사전은 온톨로지 스키마의 개념에 해당되는 개체명, 개체명으로부터 분류되는 용어, 용어의 식별자, 대표 용어와 대표 용어의 식별자로 구성되는 전거 데이터를 하나의 포맷으로 연결하여 저장할 수 있다. 용어의 개체명으로 연결되고
마이닝 규칙 데이터베이스는 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙을 저장할 수 있다.
마이닝 규칙은 온톨로지 스키마의 관계명, 관계명에 대응되는 하나의 마이닝 패턴, 마이닝 패턴과 대응되는 하나 이상의 RDF 트리플을 포함하여 정의되며, 마이닝 규칙 데이터베이스는 온톨로지 스키마의 관계명, 마이닝 패턴, RDF 트리플을 하나의 포맷으로 연결하여 저장할 수 있다.
마이닝 패턴 생성부(120)는 텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환할 수 있다.
마이닝 패턴 생성부(120)는 개체명 사전과 연동하여 텍스트 문서로부터 형태소 분석, 구문 분석, 의미 분석을 사용하여 용어를 인식하고, 인식된 용어를 개체명 사전에 저장된 용어에 대응되는 개체명으로 나타낼 수 있다.
마이닝 패턴 생성부(120)는 인식된 용어를 개체명 사전에 저장된 용어에 대응되는 개체명으로 나타낼 때, 동일한 용어에 대응되는 서로 다른 개체명이 다수개 존재하는 경우, 모든 개체명을 검색하여 추출할 수 있다.
또한, 마이닝 패턴 생성부(120)는 모든 개체명 각각을 포함하여 표시된 텍스트 문서를 마이닝 패턴으로 변환할 수 있다.
개체명 및 마이닝 규칙 검색부(130)는 인식된 용어와 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 개체명 사전과 마이닝 규칙 데이터베이스에서 각각 검색할 수 있다.
개체명 선택부(140)는 개체명 및 마이닝 규칙 검색부(130)로부터 검색된 개체명이 두 개 이상 포함된 경우, 마이닝 규칙을 이용하여 개념과 연결된 용어의 적합한 개체명을 선택할 수 있다.
온톨로지 스키마와 개체명 사전 및 온톨로지 스키마와 마이닝 규칙 데이터베이스는 각각 서로 다른 구성 요소(개념과 개체명, 관계명과 관계명)를 이용하여 연계되어 있으므로, 마이닝 규칙을 이용하여 개체명의 애매성을 해소할 수 있다.
검증 인터페이스(150)는 용어의 선택된 개체명, 용어의 대표 용어 또는 마이닝 규칙의 RDF 트리플 중 하나 이상을 표시할 수 있고, 사용자는 검증 인터페이스를 통해 선택된 개체명이 용어의 적합한 개체명인지 결정할 수 있다.
예를 들어, "애플은 컴퓨터를 자사의 생산품이라고 했다"는 텍스트 문서로부터 '애플', '컴퓨터'라는 용어를 인식하고 개체명 사전으로부터 각각의 개체명을 검색하면 용어 '애플'의 개체명은 '[사물]' 또는 '[회사]'로 검색되고 용어 '컴퓨터'의 개체명은 '[사물]'로 검색될 수 있다.
이와 같이, 용어 '애플'의 개체명을 검색한 결과 개체명이 두 개 이상 검색된 경우, 두 개 이상 검색된 개체명 중 적합한 개체명을 결정할 필요가 있다.
상기 텍스트 문서를 마이닝 패턴으로 변환하면, '[?] jcs [사물] jco %self의 %product'로 변환될 수 있고, 마이닝 규칙 데이터베이스로부터 마이닝 패턴과 일치하는 마이닝 패턴을 검색하면, 마이닝 규칙 '[회사1] jcs [사물] jco %self의 %product' -> '[회사1]-생산품-[사물1]'가 검색될 수 있다.
따라서, '애플'의 개체명은 '[회사]'로 선택될 수 있고 개체명의 애매성을 해소할 수 있다.
본 발명의 제2 실시예에 따르면, 도 2에 도시한 바와 같이, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈(200)은 개체명 사전 및 마이닝 규칙 데이터베이스(210), 개체명 및 마이닝 규칙 검색부(220), 개체명 선택부(230) 또는 검증 인터페이스(240)를 포함할 수 있다.
제2 실시예에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈(200)은 제1 실시예의 구성 중 마이닝 패턴 생성부가 생략된 구성으로, 마이닝 패턴이 우온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈(200)에 직접 입력된 경우 용어의 개체명을 결정하는 모듈을 의미한다.
온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈(200)의 개체명 및 마이닝 규칙 검색부(220), 개체명 선택부(230) 및 검증 인터페이스(240)는 제1 실시예의 개체명 및 마이닝 규칙 검색부(130), 개체명 선택부(140) 및 검증 인터페이스(150)의 기능과 동일하다.
다만, 제1 실시예의 개체명 및 마이닝 규칙 검색부(130)는 마이닝 패턴 생성부(120)에서 인식된 용어와 변환된 마이닝 패턴을 입력받고 이를 이용하여 개체명 및 마이닝 규칙을 검색하는 반면, 제2 실시예의 개체명 및 마이닝 규칙 검색부(220)는 마이닝 패턴을 직접 입력받고 마이닝 패턴에 포함되는 용어와 마이닝 패턴을 이용하여 개체명 및 마이닝 규칙을 검색하는 차이가 있다.
도 3은 본 발명의 다른 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법의 일 실시예를 나타내는 흐름도이고, 도 4는 본 발명의 다른 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법의 다른 실시예를 나타내는 흐름도이고, 도 5는 본 발명의 다른 측면에 따른 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법의 다수의 개체명 중 용어에 적합한 개체명을 선택하는 과정을 설명하는 흐름도를 개략적으로 도시한 도면이다.
본 발명의 제1 실시예에 따르면, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법은 텍스트로부터 용어를 인식하여(310), 마이닝 패턴으로 변환하고(S320), 용어와 마이닝 패턴을 개체명 사전, 마이닝 규칙 데이터베이스에서 검색하여(S330), 마이닝 규칙을 이용하여 다수의 개체명 중 용어에 적합한 개체명을 선택할 수 있다(S340).
용어와 마이닝 패턴을 개체명 사전, 마이닝 규칙 데이터베이스에서 검색(S330) 결과, 동일한 용어에 대하여 다수의 개체명이 검색되는 경우, 온톨로지 스키마와 연계된 마이닝 규칙을 이용하여 텍스트 문서로부터 인식된 용어의 적합한 개체명을 결정할 수 있다.
예를 들어, "김연아가 조니위어를 자기의 이상형이라도 했다는 얘기가 있다."는 텍스트 문서로부터 '김연아', '조니위어'라는 용어를 인식하고 개체명 사전으로부터 각각의 개체명을 검색하면 용어 '김연아'의 개체명은 '[사람]'으로 검색되는 반면, 용어 '조니위어'의 개체명은 검색되지 않거나 '조니위어'에 대응되는 개체명이 '[사람]' 또는 '[사물]'로 검색될 수 있다.
이와 같이, 용어 '조니위어'의 개체명을 검색한 결과 개체명이 두 개 이상 검색되거나 검색되지 않는 경우, 개체명을 결정할 필요가 있다.
상기 텍스트 문서를 마이닝 패턴으로 변환하면, '[사람1] jcs [?] jco %self의 %ideal_type'로 변환될 수 있고, 마이닝 규칙 데이터베이스로부터 마이닝 패턴과 일치하는 마이닝 패턴을 검색하면, 마이닝 규칙 '[사람1] jcs [사람2] jco %self의 %ideal_type' -> '[사람1]-이상형-[사람2]'가 검색될 수 있다.
따라서, '조니위어'의 개체명은 '[사람]'으로 선택될 수 있고 개체명의 애매성을 해소할 수 있다.
본 발명의 제2 실시예에 따르면, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법은 마이닝 패턴을 직접 입력받고 입력된 마이닝 패턴과 마이닝 패턴에 포함된 용어를 이용하여 개체명 사전 및 마이닝 규칙 데이터베이스로부터 개체명 및 마이닝 규칙을 검색하고(S410), 검색된 마이닝 규칙을 이용하여 다수의 개체명 중 용어에 적합한 개체명을 선택할 수 있다.
또한, 용어, 용어의 선택된 개체명, 대표 용어, 대표 용어의 식별자 중 하나 이상을 검증 인터페이스에 표시하여 사용자에게 용어의 개체명이 적합한지 여부를 확인할 수 있다.
본 발명의 또 다른 측면에 따르면, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법을 수행하는 프로그램이 기록되고 전자 장치에서 판독 가능한 기록 매체에 기록될 수 있다.
온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법은 컴퓨터 프로그램으로 작성 가능하며, 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다.
또한, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법은 컴퓨터가 읽을 수 있는 정보저장매체(Computer Readable Mesdium)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 용어의 적합한 개체명이 결정될 수 있다.
본 발명은 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용하여 용어의 개체명 결정모듈 등에 사용되어 용어의 적합한 개체명을 결정하는 장치 등에 적용될 수 있다.

Claims (11)

  1. 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 상기 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스가 저장되는 개체명 사전 및 마이닝 규칙 데이터베이스;
    텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환하는 마이닝 패턴 생성부;
    상기 인식된 용어와 상기 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 상기 개체명 사전과 상기 마이닝 규칙 데이터베이스에서 각각 검색하는 개체명 및 마이닝 규칙 검색부; 및
    상기 인식된 용어에 대응되는 개체명이 두 개 이상 검색된 경우 상기 마이닝 규칙을 이용하여 개념과 연결된 용어의 개체명을 선택하는 개체명 선택부;를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈.
  2. 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 상기 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스가 저장되는 개체명 사전 및 마이닝 규칙 데이터베이스;
    입력된 마이닝 패턴과 상기 마이닝 패턴에 포함되는 용어를 이용하여 대응되는 마이닝 규칙과 개체명을 상기 마이닝 규칙 데이터베이스와 상기 개체명 사전에서 각각 검색하는 개체명 및 마이닝 규칙 검색부; 및
    상기 용어에 대응되는 개체명이 두 개 이상 검색된 경우 상기 마이닝 규칙을 이용하여 개념과 연결된 용어의 개체명을 선택하는 개체명 선택부;를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈.
  3. 제1항 또는 제2항에 있어서,
    상기 용어의 선택된 개체명, 상기 용어의 대표 용어 또는 상기 마이닝 규칙의 RDF 트리플 중 하나 이상을 표시하는 검증 인터페이스;를 더 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈.
  4. 제1항 또는 제2항에 있어서,
    상기 개체명 사전은, 상기 온톨로지 스키마의 개념(Class)에 해당되는 개체명, 상기 개체명으로 분류되는 용어, 상기 용어의 식별자, 대표 용어와 상기 대표 용어의 식별자로 구성된 전거 데이터를 하나의 포맷으로 연결하여 저장하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈.
  5. 제1항 또는 제2항에 있어서,
    상기 개체명 선택부는, 상기 검색된 하나의 마이닝 규칙의 RDF 트리플을 구성하는 개념과 상기 인식된 용어에 대응되는 두 개 이상의 개체명을 비교하여 일치하는 개체명을 선택하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈.
  6. 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 상기 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스를 이용하여 입력된 텍스트 문서로부터 인식된 용어의 개체명 또는 식별자를 검색하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법에 있어서,
    텍스트로부터 용어를 인식하여 마이닝 패턴으로 변환하는 단계;
    상기 인식된 용어와 상기 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 상기 개체명 사전과 상기 마이닝 규칙 데이터베이스로부터 검색하는 단계; 및
    상기 검색된 두 개 이상의 개체명들과 상기 검색된 하나의 마이닝 규칙을 이용하여 상기 용어에 대응되는 개체명을 선택하는 단계;를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법.
  7. 온톨로지 스키마와 결합되고 개념(Class)과 연결된 용어의 개체명이 정의된 개체명 사전, 상기 온톨로지 스키마와 결합되고 관계명(Property)과 연결된 마이닝 패턴과 리소스 기술 프레임워크(RDF: Resource Description Framework) 트리플로 구성된 마이닝 규칙이 정의된 마이닝 규칙 데이터베이스를 이용하여 입력된 텍스트 문서로부터 인식된 용어의 개체명 또는 식별자를 검색하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법에 있어서,
    입력된 마이닝 패턴과 상기 마이닝 패턴에 포함되는 용어를 이용하여 대응되는 마이닝 규칙과 개체명을 상기 마이닝 규칙 데이터베이스와 상기 개체명 사전에서 검색하는 단계; 및
    상기 검색된 두 개 이상의 개체명들과 상기 검색된 하나의 마이닝 규칙을 이용하여 상기 용어에 대응되는 개체명을 선택하는 단계;를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법.
  8. 제6항 또는 제7항에 있어서,
    상기 검색된 두 개 이상의 개체명들과 상기 검색된 하나의 마이닝 규칙을 이용하여 상기 용어에 대응되는 개체명을 선택하는 단계는,
    상기 검색된 두 개 이상의 개체명과 상기 마이닝 규칙의 RDF 트리플로부터 개념을 추출하는 단계; 및
    상기 추출된 개념과 대응되는 개체명을 상기 용어의 개체명으로 선택하는 단계;를 포함하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법.
  9. 제6항 또는 제7항에 있어서,
    상기 개체명 사전은, 상기 온톨로지 스키마의 개념(Class)에 해당되는 개체명, 상기 개체명으로 분류되는 용어, 상기 용어의 식별자, 대표 용어와 상기 대표 용어의 식별자로 구성된 전거 데이터를 하나의 포맷으로 연결하여 저장하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법.
  10. 제6항 또는 제7항에 있어서,
    상기 용어와 상기 마이닝 패턴을 이용하여 대응되는 개체명과 마이닝 규칙을 상기 개체명 사전과 상기 마이닝 규칙 데이터베이스로부터 검색하는 단계는,
    상기 개체명 사전에서 인식된 용어와 일치하는 다수의 개체명이 존재하는 경우 상기 다수의 개체명을 모두 검색하는 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법.
  11. 제6항 내지 제110항 중 어느 한 항에 있어서, 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정 방법을 수행하는 프로그램이 기록되고 전자 장치에서 판독 가능한 기록 매체.
PCT/KR2010/006430 2010-06-25 2010-09-17 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법 WO2011162446A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2010-0060279 2010-06-25
KR1020100060279A KR100995861B1 (ko) 2010-06-25 2010-06-25 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법

Publications (1)

Publication Number Publication Date
WO2011162446A1 true WO2011162446A1 (ko) 2011-12-29

Family

ID=43409979

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/006430 WO2011162446A1 (ko) 2010-06-25 2010-09-17 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법

Country Status (4)

Country Link
US (2) US8161061B2 (ko)
EP (1) EP2400438A1 (ko)
KR (1) KR100995861B1 (ko)
WO (1) WO2011162446A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8880440B2 (en) 2012-03-09 2014-11-04 Sap Ag Automatic combination and mapping of text-mining services
WO2013154947A1 (en) 2012-04-09 2013-10-17 Vivek Ventures, LLC Clustered information processing and searching with structured-unstructured database bridge
KR101441529B1 (ko) 2013-02-26 2014-09-18 한국과학기술정보연구원 어댑티브 온톨로지 정보 제공 방법, 어댑티브 온톨로지 정보 제공 장치, 어댑티브 온톨로지 정보를 제공하는 프로그램을 저장하는 저장매체
US9047347B2 (en) 2013-06-10 2015-06-02 Sap Se System and method of merging text analysis results
KR102361631B1 (ko) * 2013-12-04 2022-02-14 주식회사 케이티 유전정보 기반 사물정보 또는 환경정보 제공 서비스 방법 및 시스템
US11080295B2 (en) * 2014-11-11 2021-08-03 Adobe Inc. Collecting, organizing, and searching knowledge about a dataset
CN106844413B (zh) * 2016-11-11 2020-12-08 南京柯基数据科技有限公司 实体关系抽取的方法及装置
US10846644B2 (en) 2017-09-15 2020-11-24 International Business Machines Corporation Cognitive process learning
US11488029B2 (en) 2017-09-15 2022-11-01 International Business Machines Corporation Cognitive process code generation
US10628777B2 (en) 2017-09-15 2020-04-21 International Business Machines Corporation Cognitive process enactment

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080019439A (ko) * 2006-08-28 2008-03-04 한국과학기술정보연구원 Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법
KR20080049452A (ko) * 2006-11-30 2008-06-04 주식회사 케이티프리텔 시멘틱 웹을 이용한 목적지 검색 서비스 제공 방법 및시스템
KR20090112157A (ko) * 2008-04-23 2009-10-28 재단법인서울대학교산학협력재단 시맨틱 웹 자원의 랭킹처리방법
KR20100062841A (ko) * 2008-12-01 2010-06-10 한국과학기술원 상황 정보 관리 시스템 및 방법과 상황 정보 생성 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6654731B1 (en) 1999-03-01 2003-11-25 Oracle Corporation Automated integration of terminological information into a knowledge base
US20040148170A1 (en) * 2003-01-23 2004-07-29 Alejandro Acero Statistical classifiers for spoken language understanding and command/control scenarios
US8401991B2 (en) * 2008-08-08 2013-03-19 Oracle International Corporation Database-based inference engine for RDFS/OWL constructs
US8041733B2 (en) * 2008-10-14 2011-10-18 Yahoo! Inc. System for automatically categorizing queries

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080019439A (ko) * 2006-08-28 2008-03-04 한국과학기술정보연구원 Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법
KR20080049452A (ko) * 2006-11-30 2008-06-04 주식회사 케이티프리텔 시멘틱 웹을 이용한 목적지 검색 서비스 제공 방법 및시스템
KR20090112157A (ko) * 2008-04-23 2009-10-28 재단법인서울대학교산학협력재단 시맨틱 웹 자원의 랭킹처리방법
KR20100062841A (ko) * 2008-12-01 2010-06-10 한국과학기술원 상황 정보 관리 시스템 및 방법과 상황 정보 생성 방법

Also Published As

Publication number Publication date
US8271513B1 (en) 2012-09-18
EP2400438A1 (en) 2011-12-28
KR100995861B1 (ko) 2010-11-23
US8161061B2 (en) 2012-04-17
US20110320491A1 (en) 2011-12-29

Similar Documents

Publication Publication Date Title
WO2011162446A1 (ko) 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법
WO2011162444A1 (ko) 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 개체명 사전 또는 마이닝 규칙 데이터베이스 갱신 장치 및 방법
WO2011136425A1 (ko) 개체명 사전 및 마이닝 규칙이 결합된 온톨로지 스키마를 이용한 리소스 기술 프레임워크 네트워크 구축 장치 및 방법
WO2012070840A2 (ko) 컨센서스 검색 장치 및 방법
WO2011129481A1 (ko) Rdf 탐색기반 질의응답 서비스 시스템 및 방법
WO2021049706A1 (ko) 앙상블 질의 응답을 위한 시스템 및 방법
WO2010123168A1 (ko) 데이터베이스 관리 방법 및 시스템
WO2014030834A1 (ko) 문법의 오류 검출 방법, 이를 위한 오류검출장치 및 이 방법이 기록된 컴퓨터로 판독 가능한 기록매체
WO2019093675A1 (ko) 빅데이터 분석을 위한 데이터 병합 장치 및 방법
WO2015129983A1 (ko) 분산 퍼지 연관 규칙 마이닝에 기반한 영화 추천 장치 및 방법
WO2021107444A1 (ko) 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
WO2017164510A2 (ko) 음성 데이터 기반 멀티미디어 콘텐츠 태깅 방법 및 이를 이용한 시스템
WO2012046906A1 (ko) 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
WO2012005414A1 (ko) 참고 문헌 적합성 판정 시스템 및 방법
WO2012046904A1 (ko) 다중 자원 기반 검색정보 제공 장치 및 방법
WO2012144683A1 (ko) 유망 기술 라이프 사이클을 이용한 유망 단계 판단 장치 및 방법
WO2012144685A1 (ko) 기술 추이 시각화 장치 및 방법
WO2013008978A1 (ko) 개체 식별 결과 검색 시스템 및 방법
WO2020149541A1 (ko) 특정 주제에 관한 질문-답변 데이터 셋 자동 생성 방법 및 장치
WO2018143490A1 (ko) 웹 콘텐츠를 이용한 사용자 감성 예측 시스템 및 그 방법
WO2012144684A1 (ko) 기술의 발전 속도 예측 장치 및 방법
WO2014069754A1 (ko) 관심분야 기반 컨텐츠 제공 시스템 및 방법
WO2012030049A2 (ko) 동적 임계값이 적용된 유사문서 분류화 장치 및 방법
WO2012060526A1 (ko) 질의에 따른 연관정보 제공 장치 및 방법
WO2015133774A1 (ko) 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10853729

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10853729

Country of ref document: EP

Kind code of ref document: A1