WO2011136426A1 - Method and system for constructing a named entity dictionary by extracting named entities from context and for registering rules - Google Patents

Method and system for constructing a named entity dictionary by extracting named entities from context and for registering rules Download PDF

Info

Publication number
WO2011136426A1
WO2011136426A1 PCT/KR2010/003079 KR2010003079W WO2011136426A1 WO 2011136426 A1 WO2011136426 A1 WO 2011136426A1 KR 2010003079 W KR2010003079 W KR 2010003079W WO 2011136426 A1 WO2011136426 A1 WO 2011136426A1
Authority
WO
WIPO (PCT)
Prior art keywords
entity name
terms
term
context
entity
Prior art date
Application number
PCT/KR2010/003079
Other languages
French (fr)
Korean (ko)
Inventor
정한민
김평
이승우
이미경
서동민
성원경
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Publication of WO2011136426A1 publication Critical patent/WO2011136426A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Definitions

  • the present invention relates to an entity name dictionary construction and rule registration method and system using entity name extraction from a context, and more particularly, an entity name in a specific classification registered in a pre-established named entity dictionary in a text document. When included, it extracts the context before or after the entity name (in the form of a string or Lexico-Semantic-Pattern), and searches for other terms (including terminology) within the extracted context. By sorting in order, it is possible to easily expand the entity name dictionary by supporting the names of the objects belonging to the classification, and register the contexts excluding other terms from the other contexts using the other terms as rules.
  • the present invention relates to an entity name dictionary construction and rule registration method and system using entity name extraction from a context.
  • a named entity is a noun or numeric expression that has a unique meaning in the document.
  • the semantic categories of individual names can be broadly divided into names, names, name expressions such as institution names, time expressions such as dates and times, and numerical expressions such as amounts or percentages.
  • This rule-based method manually constructs rules for entity name recognition and recognizes entity names using various dictionaries such as proper noun dictionaries, word dictionaries that lead to entity name recognition, and word dictionaries that emerge from the context of entity names. Way.
  • this method relies heavily on human intuition, and requires a lot of time and money because rules and dictionaries must be changed when applied to a new domain.
  • the statistics-based method automatically learns the knowledge necessary for recognizing individual names from the training data.
  • the statistics-based method learns rules for recognizing individual names using information obtained from spelling, parts of speech, and morphemes.
  • this method requires a large amount of tagged text for learning, difficult to reflect various characteristics such as omission or abbreviation, and re-learning when learning data increases.
  • the hybrid method combines rule-based and statistics-based methods to obtain better results. It combines various knowledge such as rules, vocabulary, and dictionaries into statistical-based models. However, this method can be said to have both rule-based and statistics-based problems.
  • a new term can be added to an existing entity name or a new term can be added to an existing entity name to expand the existing entity name, and accordingly a new rule.
  • An object of the present invention for solving the above-described problems is that, when an object name in a specific classification registered in a previously established object name dictionary is included in a text document, the context before or after the object name (string or LSP format context) ) And other terms (including terminology) within the extracted context, sorted in order of frequency or alphabet, and make it easier to find the names of the objects in the classification, so that the dictionary of object names can be expanded and constructed.
  • the present invention provides a method and system for constructing a dictionary of entity names and extracting rules using entity name extraction from a context, in which contexts excluding other terms from other contexts using the other terms can be registered as rules.
  • An entity name dictionary construction method for solving the above-mentioned problems is an entity name dictionary construction method of a system having an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered. (a) searching whether a term having an entity name registered in the entity name dictionary exists in the text document; (b) if the term exists, extracting the context containing the term from the text document; (c) re-searching from the text document a context in which the term is excluded from the context in which the term is included; (d) separating, sorting and displaying other terms that exist at the term position in the context in which the term is re-researched excluded; (e) adding the other terms to the entity name, or adding and setting a second entity name of the other terms; And (f) registering the entity name or the second entity name in the entity name dictionary.
  • step (e) may select one or more of the other terms from a user and set the entity name.
  • the second entity name may be input from a user and set.
  • the rule registration method using the entity name extraction for solving the above-described problem, the entity name of the system having an entity name dictionary in which at least one entity name and one or more terms corresponding to the entity name are registered
  • a rule registration method using extraction comprising: (a) searching whether a term having one entity name registered in the entity name dictionary exists in a text document; (b) if the term exists, extracting a context containing the term from the text document; (c) re-searching from the text document a context in which the term is excluded from the context containing the term; (d) separating, sorting and displaying other terms that exist at the term position in the context in which the term is re-searched excluded; (e) extracting from the text document a context containing other terms that exist at the term location in the context in which the term is re-researched excluded; (f) receiving the other terms from the user, adding the entity name, and then registering other contexts in which the other terms are excluded as rules; And (a) searching whether a term having
  • step (f) registers the contexts selected by the user among the other contexts as a positive rule.
  • step (f) registers the contexts not selected by the user among the other contexts as a negative rule.
  • the contexts in which the second entity name is set by receiving the input from the user among the other contexts are registered as a positive rule of the second entity name.
  • the entity name dictionary construction system for solving the above-described problem, dictionary database for storing the entity name dictionary in which at least one entity name and one or more terms corresponding to the entity name is registered;
  • a display unit for displaying the one or more entity names or the one or more terms and the entity name dictionary on a screen;
  • a context extraction unit for extracting a context including the term from the text document when a term having the entity name registered in the entity name dictionary exists in the text document;
  • a context search unit for searching a context in which the term is excluded from the text including the term from the text document;
  • a term separator to separate other terms existing at the term position in a context in which the term found is excluded;
  • An entity name setting unit for adding the other terms to the entity name or adding and setting a second entity name of the other terms; And separating and sorting other terms existing at the term position in the context in which the term searched through the context search unit is excluded and sorting through the term separation unit to display on the display unit, and in the context in which the term is excluded Extracts
  • the entity name setting unit may select one or more of the other terms from a user and additionally set the entity name.
  • the entity name setting unit receives and adds the second entity name from a user and sets the entity.
  • the controller may be configured to add the entity name by selecting the other terms from the user and register other contexts in which the other terms are excluded as rules.
  • the controller receives the other terms from the user, adds and sets the second entity name, and then registers other contexts in which the other terms are excluded as rules.
  • the controller registers the contexts selected by the user among the other contexts as a positive rule.
  • control unit registers contexts not selected by the user among the other contexts as a negative rule.
  • the control unit registers contexts in which the second entity name is set by receiving a user input from among the other contexts as a positive rule of the second entity name.
  • a rule for recognizing an entity name and a new entity name can be extracted and generated from a text document, and new terms added to the existing entity name or new terms not existing in the existing entity name can be generated.
  • FIG. 1 is a block diagram schematically showing the configuration of an RDF searcher group query and answer service system according to an embodiment of the present invention.
  • FIG. 2 is a flowchart illustrating an RDF searcher class query response service method according to an embodiment of the present invention.
  • FIG. 3 is a diagram illustrating an example of a process of forming an RDF network according to an embodiment of the present invention.
  • FIG. 4 is a diagram illustrating an example of an RDF searcher class question and answer service according to an embodiment of the present invention.
  • FIG. 5 is a diagram illustrating another example of an RDF searcher class question and answer service according to an embodiment of the present invention.
  • FIG. 1 is a block diagram showing a schematic configuration of a system for establishing an individual name according to an embodiment of the present invention.
  • the entity name dictionary construction system 100 includes a dictionary database 110, a display unit 120, a context search unit 130, a term separation unit 140, and an entity name setting unit ( 150 and the controller 160.
  • the dictionary database 110 stores an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered.
  • the display unit 120 displays one or more entity names or one or more terms and entity name dictionaries on the screen.
  • the context search unit 130 extracts the context including the term from the text document or excludes the term from the context in which the term is included. retrieves the context from a text document.
  • the term separator 140 separates other terms that exist at the term position in the context in which the term which is re-searched is excluded.
  • the entity name setting unit 150 adds other separated terms to an existing entity name or adds and sets a second entity name of other terms.
  • the entity name setting unit 150 may select one or more of the above-described other terms from the user and set the entity name in addition to the entity name.
  • entity name setting unit 150 may add and set a second entity name of the above-described other terms from a user.
  • the controller 160 separates and sorts the other terms existing at the term position in the context where the terms are excluded, re-searched through the context search unit 130, on the display unit 120. And extracting a context from a text document including other terms existing at the term position in the context in which the rescanned term is excluded, and the entity name or other terms to which other terms are added through the entity name setting unit 150.
  • the branch controls to register the second entity name in the entity name dictionary.
  • controller 160 selects other terms from the user, sets the entity name, and then registers other contexts in which the other terms are excluded as rules.
  • controller 160 receives other terms from the user, adds and sets a second entity name, and then registers other contexts in which the other terms are excluded as rules.
  • controller 160 registers contexts selected by the user among other contexts as a positive rule.
  • controller 160 registers contexts that are not selected by the user among other contexts as a negative rule.
  • controller 160 registers contexts in which the second entity name is set as a positive rule of the second entity name while being input from the user among other contexts.
  • FIG. 2 is a flowchart illustrating a method for constructing an entity name dictionary according to an embodiment of the present invention.
  • the entity name dictionary construction system 100 includes an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered as shown in FIG. 3.
  • it is searched for a term having an object name (eg, a group) registered in the object name dictionary in the text document, for example, 'girl's age' as shown in FIG. 4A. (S210).
  • FIG. 3 is a diagram illustrating an example of an entity name dictionary stored in a dictionary database according to an embodiment of the present invention
  • FIG. 4 is a term of an entity name in an entity name dictionary in a text document according to an embodiment of the present invention.
  • 2 is a diagram illustrating an example of extracting a context that includes a.
  • the entity name dictionary building system 100 generates a context including the term 'girl's age' from the text document as shown in (b) of FIG. 4. Extract (S220).
  • the entity name dictionary construction system 100 has a context of "another member of the girls 'generation" consisting of' Girls 'Generation' and its subsequent context 'Other Members of' as shown in Fig. 4B in the text document. To extract it.
  • the entity name dictionary building system 100 re-searches from the text document the context in which the term 'girl's age' is excluded from the context including the term 'girl's age', that is, the context of 'another member of' (S230). ).
  • the entity name building system 100 may obtain one or more other contexts, as shown in FIG. 5, from the text document, including the context 'another member of.' 5 is a diagram illustrating a result of searching for other contexts including the context in which the term of the entity name is excluded according to an embodiment of the present invention.
  • the entity name dictionary construction system 100 separates and arranges other terms existing at the term 'girl generation' in a context in which the term 'girl generation' is excluded again and displays them as shown in FIG. 6.
  • S240 is a diagram illustrating an example of separating and sorting other terms existing at a term position in a context in which a term of an individual name is excluded according to an embodiment of the present invention and displaying the order in frequency order.
  • the entity name dictionary building system 100 adds other terms displayed on the screen as shown in FIG. 6 to the entity name (@group) as shown in FIG. 7, or adds a second entity name that other terms have.
  • And set (S250). 7 is a diagram illustrating an example in which other terms searched from a text document are added to an entity name or set by adding a second entity name according to an embodiment of the present invention.
  • the entity name dictionary construction system 100 may set an entity name by selecting one or more of other terms from a user, as shown in FIG. 6.
  • entity name dictionary construction system 100 may receive and set a second entity name such as “@programming_element” from the user as illustrated in FIG. 7.
  • the entity name dictionary construction system 100 registers the entity name or the second entity name in the entity name dictionary (S260).
  • the entity name dictionary construction system 100 registers the terms selected by the user and the corresponding entity names as positive entity names as shown in FIG. 6, and the terms not selected by the user and the entity accordingly. You can register the name as a negative entity name.
  • FIG. 8 is a flowchart illustrating a rule registration method using entity name extraction according to another embodiment of the present invention.
  • the entity name dictionary construction system 100 may include a dictionary of entity names in which one or more entity names and one or more terms corresponding to the entity names are registered as shown in FIG. 3.
  • a dictionary of entity names in which one or more entity names and one or more terms corresponding to the entity names are registered as shown in FIG. 3.
  • the entity name dictionary construction system 100 extracts the context including the term from the text document as shown in (b) of FIG. 4 (S820).
  • the entity name dictionary building system 100 re-searches the context in which the term (girl's age) is excluded from the context including the term, for example, the context of 'another member of' from the text document (S830).
  • the entity name building system 100 may obtain one or more other contexts, including, for example, the context 'another member of' from a text document as shown in FIG.
  • the entity name dictionary building system 100 separates and sorts other terms existing at the corresponding term position in the context where the term is excluded again and displayed on the screen as shown in FIG. 6 (S840).
  • the entity name dictionary building system 100 extracts the context including the other terms existing at the term position in the context from which the term is re-searched from the text document (S850).
  • the entity name dictionary construction system 100 receives other terms from the user, adds and sets the entity name, and registers other contexts in which the other terms are excluded as rules (S860).
  • the entity name dictionary construction system 100 registers other contexts separated from the context of the term selected by the user as a rule, as shown in FIG. 9, with other terms arranged as shown in FIG. 6. It is.
  • the entity name dictionary building system 100 registers contexts selected by the user among other contexts as a positive rule, and registers contexts not selected by the user among other contexts as a negative rule. do.
  • the entity name dictionary construction system 100 may classify the positive context for the entity name '@group' into a string form or LSP (Lexico Semantic Pattern) format and register it as a positive rule.
  • LSP Longico Semantic Pattern
  • the entity name dictionary construction system 100 classifies a negative context for the entity name '@group' into a string format or a LSP (Lexico Semantic Pattern) format to register as a negative rule.
  • Can be. 9 is a diagram illustrating an example of registering other contexts in which a term is excluded as a rule according to another exemplary embodiment of the present invention.
  • the entity name dictionary construction system 100 receives other terms from the user, sets the second entity name, and then registers other contexts in which the other terms are excluded as rules (S870).
  • the entity name dictionary construction system 100 receives the contexts in which the second entity name is set from the user among other contexts and sets the second entity name, as shown in FIG. 9 for the positive rule of @programming_element in the form of a string. It can be registered as a positive rule) or as a negative rule of a second entity name (Negative rule for @programming_element in LSP format).
  • the front context or the rear context (string or LSP format context) of the entity name is extracted.
  • the other terms including terminology
  • the present invention can be applied to a system or service for extracting a term from a text document and setting an entity name.
  • the present invention can be applied to a system or service for providing a semantic web service or a search service.
  • the present invention can be applied to systems and services that extend the entity name dictionary by extracting terms from text documents, setting entity names, and registering them in the entity name dictionary.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

The present invention relates to a method and system for constructing a named entity dictionary by extracting named entities from a context and for registering rules. According to said method and system, when a named entity, which is registered in a pre-constructed named entity dictionary and classified into a particular category, is included in a text document, the context (character string or LSP-type context) before or after the named entity is extracted and other terms (including technical terms) are arranged in the order of frequency or in alphabetical order within the extracted context. As a result, named entities belonging to the category are easily found so that the named entity dictionary can be extended; and, from other contexts using the other terms, contexts excluding the other terms can be regularly registered. According to the present invention, the method for constructing the named entity, for a system provided with the named entity dictionary in which one or more named entities and one or more terms corresponding thereto are registered, comprises: (a) a step for conducting a search to detect whether a term having a named entity registered in the named entity dictionary exists in a text document; (b) a step for extracting a context including the term from the text document when the term exists; (c) a step for searching the text document again for a context obtained by excluding the term from the context which includes the term; (d) a step for separating other terms existing in the position of the term which was excluded from the context, and arranging and displaying the other terms; (e) a step for adding the other terms to the named entities, or adding and configuring second named entities for the other terms; and (f) a step for registering the named entities or the second named entities in the named entity dictionary.

Description

문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템Method and system for dictionary establishment of entity name and rule registration using entity name extraction from context
본 발명은 문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템에 관한 것으로서, 더욱 자세하게는 기 구축된 개체명 사전(Named entity dictionary)에 등록된 특정 분류 내 개체명이 텍스트 문서에 포함되어 있을 때, 해당 개체명의 앞 문맥이나 뒷 문맥(문자열 또는 LSP(Lexico-Semantic-Pattern) 형식의 문맥)을 추출하고, 추출된 문맥 내에서 또 다른 용어(전문용어 포함)들을 빈도 순이나 가나다 순 등으로 정렬하여, 해당 분류에 속하는 개체명들을 찾기 쉽게 지원함으로써 개체명 사전을 확장하여 구축할 수 있도록 하고, 상기 다른 용어를 이용하는 다른 문맥들에서 다른 용어를 제외시킨 문맥들을 규칙으로 등록할 수 있도록 된, 문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템에 관한 것이다.The present invention relates to an entity name dictionary construction and rule registration method and system using entity name extraction from a context, and more particularly, an entity name in a specific classification registered in a pre-established named entity dictionary in a text document. When included, it extracts the context before or after the entity name (in the form of a string or Lexico-Semantic-Pattern), and searches for other terms (including terminology) within the extracted context. By sorting in order, it is possible to easily expand the entity name dictionary by supporting the names of the objects belonging to the classification, and register the contexts excluding other terms from the other contexts using the other terms as rules. The present invention relates to an entity name dictionary construction and rule registration method and system using entity name extraction from a context.
일반적으로 개체명(Named entity)이란 문서에서 나타나는 고유한 의미를 가지는 명사나 숫자 표현을 말한다. 개체명의 의미 범주는 크게 인명, 지명, 기관명과 같은 이름 표현, 날짜나 시간과 같은 시간 표현, 금액이나 퍼센트와 같은 수치 표현으로 구분할 수 있다.In general, a named entity is a noun or numeric expression that has a unique meaning in the document. The semantic categories of individual names can be broadly divided into names, names, name expressions such as institution names, time expressions such as dates and times, and numerical expressions such as amounts or percentages.
정보의 양이 기하급수적으로 급증하면서 문서에서 자동으로 핵심어를 찾아내는 것은 정보추출이나 정보검색과 같은 자연어처리 응용에서 매우 중요한 작업이다. 이러한 핵심어의 대부분은 개체명으로, 개체명은 인명, 지명, 기관명과 같은 고유명사나 날짜, 시간, 화폐 등의 수치 표현으로 구분할 수 있다.As the amount of information increases exponentially, automatically finding key words in documents is an important task in natural language processing applications such as information extraction and information retrieval. Most of these key words are individual names, and individual names can be divided into proper names such as personal names, place names, and institution names, or numerical expressions such as date, time, and currency.
즉, 수치 표현은 비교적 단순한 문법에 의해 효과적으로 인식될 수 있지만 고유명사는 새로운 고유명사가 계속적으로 만들어지고 그 형태가 가변적이기 때문에 사전에 등록되지 않은 개체명을 인식하는 것은 쉬운 일이 아니다. 또한, 동일한 개체명이 문맥에 따라 다른 범주로 사용될 수 있다는 문제점이 있다.In other words, numerical expressions can be effectively recognized by a relatively simple grammar, but it is not easy to recognize individual names that are not registered in advance because proper nouns are continuously created and their form is variable. In addition, there is a problem that the same entity name can be used in different categories depending on the context.
이러한 문제점을 해결하기 위한 기존 연구들은 크게 규칙 기반의 개체명 인식(Rule-based approach), 통계 기반의 개체명 인식(Statistics-based approach), 그리고 두 가지 방법을 통합하여 접근하는 하이브리드 방식의 개체명 인식(Hybrid approach)으로 나누어 볼 수 있다.Existing studies to solve these problems are largely rule-based entity name recognition, statistical-based entity name recognition, statistical-based approach, and hybrid entity name approach integrating two methods. It can be divided into a hybrid approach.
이러한 규칙 기반의 방법은 개체명 인식을 위한 규칙을 수동으로 구축하고, 고유명사 사전, 개체명 인식의 단서가 되는 단어사전, 개체명의 문맥으로 나오는 단어 사전 등 다양한 사전을 이용하여 개체명을 인식하는 방법이다. 그러나, 이 방법은 사람의 직관에 크게 의존하며, 새로운 도메인에 적용될 때 규칙과 사전이 변경되어야 하므로 많은 시간과 비용이 요구되는 문제점이 있다.This rule-based method manually constructs rules for entity name recognition and recognizes entity names using various dictionaries such as proper noun dictionaries, word dictionaries that lead to entity name recognition, and word dictionaries that emerge from the context of entity names. Way. However, this method relies heavily on human intuition, and requires a lot of time and money because rules and dictionaries must be changed when applied to a new domain.
또한, 통계 기반의 방법은 학습 데이터로부터 개체명 인식에 필요한 지식을 자동적으로 학습하는 방법으로, 주로 철자, 품사, 형태소로부터 얻어낸 정보를 이용하여 개체명 인식을 위한 규칙을 학습한다. 하지만, 이 방법은 학습을 위해 대용량의 개체명 태깅 말뭉치(Labled text)가 필요하고 생략이나 축약 등의 다양한 어위 특성을 반영하기 어려우며, 학습 데이터가 증가할 때 재학습이 필요하게 되는 문제점이 있다.In addition, the statistics-based method automatically learns the knowledge necessary for recognizing individual names from the training data. The statistics-based method learns rules for recognizing individual names using information obtained from spelling, parts of speech, and morphemes. However, this method requires a large amount of tagged text for learning, difficult to reflect various characteristics such as omission or abbreviation, and re-learning when learning data increases.
그리고, 하이브리드 방법은 규칙 기반의 방법과 통계 기반의 방법을 통합하여 보다 나은 결과를 얻기 위한 것으로 통계 기반의 모델에 규칙이나 어휘, 사전 등의 다양한 지식을 결합하는 방식이다. 그러나 이 방법은 규칙 기반과 통계 기반의 문제점을 모두 가지고 있다고 볼 수 있다.The hybrid method combines rule-based and statistics-based methods to obtain better results. It combines various knowledge such as rules, vocabulary, and dictionaries into statistical-based models. However, this method can be said to have both rule-based and statistics-based problems.
따라서, 개체명의 인식을 위해 새로운 용어의 등장에 따라 기존의 개체명에 새로운 용어를 추가하거나, 기존의 개체명에 새로운 용어를 추가하여 기존의 개체명을 확장시킬 수 있는 기술과, 그에 따라 새로운 규칙 등을 자동으로 등록할 수 있는 기술 등이 요구되고 있다.Therefore, in order to recognize the name of the entity, a new term can be added to an existing entity name or a new term can be added to an existing entity name to expand the existing entity name, and accordingly a new rule. There is a demand for a technique that can automatically register the back.
전술한 문제점을 해결하기 위한 본 발명의 목적은, 기 구축된 개체명 사전에 등록된 특정 분류 내 개체명이 텍스트 문서에 포함되어 있을 때, 해당 개체명의 앞 문맥이나 뒷 문맥(문자열 또는 LSP 형식의 문맥)을 추출하고, 추출된 문맥 내에서 또 다른 용어(전문용어 포함)들을 빈도 순이나 가나다 순 등으로 정렬하여, 해당 분류에 속하는 개체명들을 찾기 쉽게 지원함으로써 개체명 사전을 확장하여 구축할 수 있도록 하고, 상기 다른 용어를 이용하는 다른 문맥들에서 다른 용어를 제외시킨 문맥들을 규칙으로 등록할 수 있도록 된, 문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템을 제공함에 있다.SUMMARY OF THE INVENTION An object of the present invention for solving the above-described problems is that, when an object name in a specific classification registered in a previously established object name dictionary is included in a text document, the context before or after the object name (string or LSP format context) ) And other terms (including terminology) within the extracted context, sorted in order of frequency or alphabet, and make it easier to find the names of the objects in the classification, so that the dictionary of object names can be expanded and constructed. In addition, the present invention provides a method and system for constructing a dictionary of entity names and extracting rules using entity name extraction from a context, in which contexts excluding other terms from other contexts using the other terms can be registered as rules.
전술한 문제점을 해결하기 위한 본 발명에 따른 개체명 사전 구축 방법은, 하나 이상의 개체명과 상기 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 구비한 시스템의 개체명 사전 구축 방법으로서, (a) 상기 개체명 사전에 등록된 개체명을 가지는 용어가 텍스트 문서에 존재하는지의 여부를 검색하는 단계; (b) 상기 용어가 존재하는 경우, 상기 용어가 포함된 문맥을 상기 텍스트 문서로부터 추출하는 단계; (c) 상기 용어가 포함된 문맥에서 상기 용어가 제외된 문맥을 상기 텍스트 문서로부터 재검색하는 단계; (d) 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어를 분리하고 정렬하여 표시하는 단계; (e) 상기 다른 용어들을 상기 개체명에 추가하거나, 상기 다른 용어들이 가지는 제2 개체명을 추가하고 설정하는 단계; 및 (f) 상기 개체명 또는 상기 제2 개체명을 상기 개체명 사전에 등록하는 단계를 포함한다.An entity name dictionary construction method according to the present invention for solving the above-mentioned problems is an entity name dictionary construction method of a system having an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered. (a) searching whether a term having an entity name registered in the entity name dictionary exists in the text document; (b) if the term exists, extracting the context containing the term from the text document; (c) re-searching from the text document a context in which the term is excluded from the context in which the term is included; (d) separating, sorting and displaying other terms that exist at the term position in the context in which the term is re-researched excluded; (e) adding the other terms to the entity name, or adding and setting a second entity name of the other terms; And (f) registering the entity name or the second entity name in the entity name dictionary.
또한, 상기 (e) 단계는 상기 다른 용어들 중 하나 또는 하나 이상을 사용자로부터 선택받아 상기 개체명을 설정할 수 있다.In addition, step (e) may select one or more of the other terms from a user and set the entity name.
그리고, 상기 (e) 단계는 상기 제2 개체명을 사용자로부터 입력받아 설정할 수 있다.In the step (e), the second entity name may be input from a user and set.
한편, 전술한 문제점을 해결하기 위한 본 발명에 따른 개체명 추출을 이용한 규칙 등록 방법은, 하나 이상의 개체명과 상기 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 구비한 시스템의 개체명 추출을 이용한 규칙 등록 방법으로서, (a) 상기 개체명 사전에 등록된 하나의 개체명을 가지는 용어가 텍스트 문서에 존재하는지의 여부를 검색하는 단계; (b) 상기 용어가 존재하는 경우, 상기 용어를 포함한 문맥을 상기 텍스트 문서로부터 추출하는 단계; (c) 상기 용어를 포함한 문맥에서 상기 용어가 제외된 문맥을 상기 텍스트 문서로부터 재검색하는 단계; (d) 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 분리하고 정렬하여 표시하는 단계; (e) 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 포함한 문맥을 상기 텍스트 문서로부터 추출하는 단계; (f) 상기 다른 용어들을 사용자로부터 선택받아 상기 개체명을 추가한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록하는 단계; 및 (g) 상기 다른 용어들을 사용자로부터 입력받아 제2 개체명을 추가하고 설정한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록하는 단계를 포함한다.On the other hand, the rule registration method using the entity name extraction according to the present invention for solving the above-described problem, the entity name of the system having an entity name dictionary in which at least one entity name and one or more terms corresponding to the entity name are registered A rule registration method using extraction, comprising: (a) searching whether a term having one entity name registered in the entity name dictionary exists in a text document; (b) if the term exists, extracting a context containing the term from the text document; (c) re-searching from the text document a context in which the term is excluded from the context containing the term; (d) separating, sorting and displaying other terms that exist at the term position in the context in which the term is re-searched excluded; (e) extracting from the text document a context containing other terms that exist at the term location in the context in which the term is re-researched excluded; (f) receiving the other terms from the user, adding the entity name, and then registering other contexts in which the other terms are excluded as rules; And (g) receiving the other terms from the user, adding and setting a second entity name, and then registering other contexts in which the other terms are excluded as rules.
또한, 상기 (f) 단계는 상기 또 다른 문맥들 중 사용자로부터 선택받은 문맥들을 긍정적(Positive) 규칙으로 등록한다.In addition, step (f) registers the contexts selected by the user among the other contexts as a positive rule.
또한, 상기 (f) 단계는 상기 또 다른 문맥들 중 사용자로부터 선택받지 못한 문맥들을 부정적(Negative) 규칙으로 등록한다.In addition, the step (f) registers the contexts not selected by the user among the other contexts as a negative rule.
그리고, 상기 (g) 단계는, 상기 또 다른 문맥들 중 사용자로부터 입력받아 상기 제2 개체명을 설정한 문맥들을 상기 제2 개체명의 긍정적(Positive) 규칙으로 등록한다.In the step (g), the contexts in which the second entity name is set by receiving the input from the user among the other contexts are registered as a positive rule of the second entity name.
한편, 전술한 문제점을 해결하기 위한 본 발명에 따른 개체명 사전 구축 시스템은, 하나 이상의 개체명과 상기 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 저장하고 있는 사전 데이터베이스; 상기 하나 이상의 개체명 또는 상기 하나 이상의 용어들 및 상기 개체명 사전을 화면 상에 디스플레이하기 위한 표시부; 상기 개체명 사전에 등록된 개체명을 가지는 용어가 텍스트 문서에 존재하는 경우, 상기 용어가 포함된 문맥을 상기 텍스트 문서로부터 추출하는 문맥 추출부; 상기 용어가 포함된 문맥에서 상기 용어가 제외된 문맥을 상기 텍스트 문서로부터 검색하는 문맥 검색부; 검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어를 분리하는 용어 분리부; 상기 다른 용어들을 상기 개체명에 추가하거나, 상기 다른 용어들이 가지는 제2 개체명을 추가하고 설정하는 개체명 설정부; 및 상기 문맥 검색부를 통해 검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 상기 용어 분리부를 통해 분리하고 정렬하여 상기 표시부 상에 표시하도록 제어하고, 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 포함한 문맥을 상기 텍스트 문서로부터 추출하며, 상기 개체명 설정부를 통해 상기 다른 용어들이 추가된 상기 개체명 또는 상기 다른 용어들이 가지는 상기 제2 개체명을 상기 개체명 사전에 등록하도록 제어하는 제어부를 포함한다.On the other hand, the entity name dictionary construction system according to the present invention for solving the above-described problem, dictionary database for storing the entity name dictionary in which at least one entity name and one or more terms corresponding to the entity name is registered; A display unit for displaying the one or more entity names or the one or more terms and the entity name dictionary on a screen; A context extraction unit for extracting a context including the term from the text document when a term having the entity name registered in the entity name dictionary exists in the text document; A context search unit for searching a context in which the term is excluded from the text including the term from the text document; A term separator to separate other terms existing at the term position in a context in which the term found is excluded; An entity name setting unit for adding the other terms to the entity name or adding and setting a second entity name of the other terms; And separating and sorting other terms existing at the term position in the context in which the term searched through the context search unit is excluded and sorting through the term separation unit to display on the display unit, and in the context in which the term is excluded Extracts a context including other terms existing at a location from the text document and registers the entity name to which the other terms are added or the second entity name of the other terms in the entity name dictionary through the entity name setting unit It includes a control unit for controlling to.
또한, 상기 개체명 설정부는 상기 다른 용어들 중 하나 또는 하나 이상을 사용자로부터 선택받아 상기 개체명을 추가 설정한다.The entity name setting unit may select one or more of the other terms from a user and additionally set the entity name.
또한, 상기 개체명 설정부는 상기 제2 개체명을 사용자로부터 입력받아 추가하고 설정한다.In addition, the entity name setting unit receives and adds the second entity name from a user and sets the entity.
또한, 상기 제어부는, 상기 다른 용어들을 사용자로부터 선택받아 개체명을 추가하여 설정한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록한다.The controller may be configured to add the entity name by selecting the other terms from the user and register other contexts in which the other terms are excluded as rules.
또한, 상기 제어부는, 상기 다른 용어들을 사용자로부터 입력받아 상기 제2 개체명을 추가하고 설정한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록한다.In addition, the controller receives the other terms from the user, adds and sets the second entity name, and then registers other contexts in which the other terms are excluded as rules.
또한, 상기 제어부는 상기 또 다른 문맥들 중 사용자로부터 선택받은 문맥들을 긍정적(Positive) 규칙으로 등록한다.In addition, the controller registers the contexts selected by the user among the other contexts as a positive rule.
또한, 상기 제어부는 상기 또 다른 문맥들 중 사용자로부터 선택받지 못한 문맥들을 부정적(Negative) 규칙으로 등록한다.In addition, the control unit registers contexts not selected by the user among the other contexts as a negative rule.
그리고, 상기 제어부는, 상기 또 다른 문맥들 중 사용자로부터 입력받아 상기 제2 개체명을 설정한 문맥들을 상기 제2 개체명의 긍정적(Positive) 규칙으로 등록한다.The control unit registers contexts in which the second entity name is set by receiving a user input from among the other contexts as a positive rule of the second entity name.
본 발명에 의하면, 개체명 인식을 위한 규칙과 새로운 개체명 등을 텍스트 문서로부터 추출하여 생성할 수 있고, 기존의 개체명에 새로운 용어들을 추가하거나 기존의 개체명에 존재하지 않은 새로운 용어들이 가지는 새로운 개체명을 추가하여 개체명 사전을 확장할 수 있다.According to the present invention, a rule for recognizing an entity name and a new entity name can be extracted and generated from a text document, and new terms added to the existing entity name or new terms not existing in the existing entity name can be generated. You can extend the entity name dictionary by adding entity names.
따라서, 기존의 개체명에 새로운 용어들이 추가되거나, 새로운 용어들을 가지는 새로운 개체명 및 새로 등록한 규칙들을 이용해 대용량 텍스트 문서에서 개체명 인식을 용이하게 할 수 있고, 확장된 개체명 사전을 이용한 검색 등도 정확하게 처리할 수 있다.Therefore, new terms can be added to existing entity names, new entity names with new terms, and newly registered rules can be used to facilitate entity name recognition in large text documents. Can be processed.
도 1은 본 발명의 실시예에 따른 RDF 탐색기반 질의응답 서비스 시스템의 구성을 개략적으로 나타낸 구성도이다.1 is a block diagram schematically showing the configuration of an RDF searcher group query and answer service system according to an embodiment of the present invention.
도 2는 본 발명의 실시예에 따른 RDF 탐색기반 질의응답 서비스 방법을 설명하기 위한 동작 흐름도이다.2 is a flowchart illustrating an RDF searcher class query response service method according to an embodiment of the present invention.
도 3은 본 발명의 실시예에 따른 RDF 네트워크를 조성하는 과정의 한 예를 나타낸 도면이다.3 is a diagram illustrating an example of a process of forming an RDF network according to an embodiment of the present invention.
도 4는 본 발명의 실시예에 따른 RDF 탐색기반 질의응답 서비스의 한 예를 나타낸 도면이다.4 is a diagram illustrating an example of an RDF searcher class question and answer service according to an embodiment of the present invention.
도 5는 본 발명의 실시예에 따른 RDF 탐색기반 질의응답 서비스의 다른 예를 나타낸 도면이다.5 is a diagram illustrating another example of an RDF searcher class question and answer service according to an embodiment of the present invention.
본 발명의 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다.Details of the object and technical configuration of the present invention and the resulting effects thereof will be more clearly understood by the following detailed description based on the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 실시예에 따른 개체명 사전 구축 시스템의 개략적인 구성을 나타낸 구성도이다.1 is a block diagram showing a schematic configuration of a system for establishing an individual name according to an embodiment of the present invention.
도 1을 참조하면, 본 발명에 따른 개체명 사전 구축 시스템(100)은, 사전 데이터베이스(110), 표시부(120), 문맥 검색부(130), 용어 분리부(140), 개체명 설정부(150) 및 제어부(160)를 포함한다.Referring to FIG. 1, the entity name dictionary construction system 100 according to the present invention includes a dictionary database 110, a display unit 120, a context search unit 130, a term separation unit 140, and an entity name setting unit ( 150 and the controller 160.
사전 데이터베이스(110)는 하나 이상의 개체명과 이 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 저장하고 있다.The dictionary database 110 stores an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered.
표시부(120)는 하나 이상의 개체명 또는 하나 이상의 용어들 및 개체명 사전을 화면 상에 디스플레이한다.The display unit 120 displays one or more entity names or one or more terms and entity name dictionaries on the screen.
문맥 검색부(130)는 개체명 사전에 등록된 개체명을 가지는 용어가 텍스트 문서에 존재하는 경우, 그 용어가 포함된 문맥을 텍스트 문서로부터 추출하거나, 그 용어가 포함된 문맥에서 그 용어가 제외된 문맥을 텍스트 문서로부터 재검색한다.When the term having the entity name registered in the entity name dictionary exists in the text document, the context search unit 130 extracts the context including the term from the text document or excludes the term from the context in which the term is included. Retrieves the context from a text document.
용어 분리부(140)는 재검색된 그 용어가 제외된 문맥에서 그 용어 위치에 존재하는 다른 용어들을 분리한다.The term separator 140 separates other terms that exist at the term position in the context in which the term which is re-searched is excluded.
개체명 설정부(150)는 분리된 다른 용어들을 기존의 개체명에 추가하거나, 다른 용어들이 가지는 제2 개체명을 추가하여 설정한다.The entity name setting unit 150 adds other separated terms to an existing entity name or adds and sets a second entity name of other terms.
또한, 개체명 설정부(150)는 전술한 다른 용어들 중 하나 또는 하나 이상을 사용자로부터 선택받아 개체명에 추가하여 설정할 수 있다.In addition, the entity name setting unit 150 may select one or more of the above-described other terms from the user and set the entity name in addition to the entity name.
그리고, 개체명 설정부(150)는 전술한 다른 용어들이 가지는 제2 개체명을 사용자로부터 입력받아 추가하고 설정할 수 있다.In addition, the entity name setting unit 150 may add and set a second entity name of the above-described other terms from a user.
제어부(160)는 문맥 검색부(130)를 통해 재검색된, 용어가 제외된 문맥에서 그 용어 위치에 존재하는 다른 용어를 용어 분리부(140)를 통해 분리하고 정렬하여 표시부(120) 상에 표시하도록 제어하고, 재검색된 상기 용어가 제외된 문맥에서 용어 위치에 존재하는 다른 용어들을 포함한 문맥을 텍스트 문서로부터 추출하며, 개체명 설정부(150)를 통해 다른 용어들이 추가된 개체명 또는 다른 용어들이 가지는 제2 개체명을 개체명 사전에 등록하도록 제어한다.The controller 160 separates and sorts the other terms existing at the term position in the context where the terms are excluded, re-searched through the context search unit 130, on the display unit 120. And extracting a context from a text document including other terms existing at the term position in the context in which the rescanned term is excluded, and the entity name or other terms to which other terms are added through the entity name setting unit 150. The branch controls to register the second entity name in the entity name dictionary.
또한, 제어부(160)는 다른 용어들을 사용자로부터 선택받아 개체명을 설정한 후 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록한다.In addition, the controller 160 selects other terms from the user, sets the entity name, and then registers other contexts in which the other terms are excluded as rules.
또한, 제어부(160)는 다른 용어들을 사용자로부터 입력받아 제2 개체명을 추가하고 설정한 후 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록한다.In addition, the controller 160 receives other terms from the user, adds and sets a second entity name, and then registers other contexts in which the other terms are excluded as rules.
또한, 제어부(160)는 또 다른 문맥들 중 사용자로부터 선택받은 문맥들을 긍정적(Positive) 규칙으로 등록한다.In addition, the controller 160 registers contexts selected by the user among other contexts as a positive rule.
또한, 제어부(160)는 또 다른 문맥들 중 사용자로부터 선택받지 못한 문맥들을 부정적(Negative) 규칙으로 등록한다.In addition, the controller 160 registers contexts that are not selected by the user among other contexts as a negative rule.
그리고, 제어부(160)는 또 다른 문맥들 중 사용자로부터 입력받아 제2 개체명을 설정한 문맥들을 제2 개체명의 긍정적(Positive) 규칙으로 등록한다.In addition, the controller 160 registers contexts in which the second entity name is set as a positive rule of the second entity name while being input from the user among other contexts.
도 2는 본 발명의 실시예에 따른 개체명 사전 구축 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a method for constructing an entity name dictionary according to an embodiment of the present invention.
도 2를 참조하면, 본 발명에 따른 개체명 사전 구축 시스템(100)은, 도 3에 도시된 바와 같이 하나 이상의 개체명과 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 사전 데이터베이스(110)에 저장하고 있는 상태에서, 텍스트 문서에 개체명 사전에 등록된 개체명(예, group)을 가지는 용어, 예컨대 도 4의 (가)와 같이 '소녀시대'가 존재하는지의 여부를 검색한다(S210).Referring to FIG. 2, the entity name dictionary construction system 100 according to the present invention includes an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered as shown in FIG. 3. In the state stored in 110), it is searched for a term having an object name (eg, a group) registered in the object name dictionary in the text document, for example, 'girl's age' as shown in FIG. 4A. (S210).
여기서, 도 3은 본 발명의 실시예에 따라 사전 데이터베이스에 저장되어 있는 개체명 사전의 일 예를 나타낸 도면이고, 도 4는 본 발명의 실시예에 따라 텍스트 문서에서 개체명 사전에 있는 개체명의 용어가 포함된 문맥을 추출한 예를 나타낸 도면이다.3 is a diagram illustrating an example of an entity name dictionary stored in a dictionary database according to an embodiment of the present invention, and FIG. 4 is a term of an entity name in an entity name dictionary in a text document according to an embodiment of the present invention. 2 is a diagram illustrating an example of extracting a context that includes a.
이어, 개체명 사전 구축 시스템(100)은 '소녀시대'라는 용어가 텍스트 문서에 존재하는 경우, 도 4의 (나)에 도시된 바와 같이 '소녀시대'라는 용어가 포함된 문맥을 텍스트 문서로부터 추출한다(S220).Subsequently, when the term 'girl's age' exists in the text document, the entity name dictionary building system 100 generates a context including the term 'girl's age' from the text document as shown in (b) of FIG. 4. Extract (S220).
즉, 개체명 사전 구축 시스템(100)은 텍스트 문서에서 도 4의 (나)에 도시된 바와 같이 '소녀시대'와 그 뒷 문맥 '~의 다른 멤버'로 이루어진 "소녀시대의 다른 멤버"라는 문맥을 추출하는 것이다.That is, the entity name dictionary construction system 100 has a context of "another member of the girls 'generation" consisting of' Girls 'Generation' and its subsequent context 'Other Members of' as shown in Fig. 4B in the text document. To extract it.
이어, 개체명 사전 구축 시스템(100)은 '소녀시대'라는 용어가 포함된 문맥에서 '소녀시대'라는 용어가 제외된 문맥, 즉 '~의 다른 멤버'라는 문맥을 텍스트 문서로부터 재검색한다(S230).Subsequently, the entity name dictionary building system 100 re-searches from the text document the context in which the term 'girl's age' is excluded from the context including the term 'girl's age', that is, the context of 'another member of' (S230). ).
따라서, 개체명 사전 구축 시스템(100)은 텍스트 문서로부터 '~의 다른 멤버'라는 문맥을 포함하는 하나 이상의 다른 문맥들을 도 5에 도시된 바와 같이 얻을 수 있다. 여기서, 도 5는 본 발명의 실시예에 따라 개체명의 용어가 제외된 문맥을 포함하는 다른 문맥들을 검색한 결과를 나타낸 도면이다.Thus, the entity name building system 100 may obtain one or more other contexts, as shown in FIG. 5, from the text document, including the context 'another member of.' 5 is a diagram illustrating a result of searching for other contexts including the context in which the term of the entity name is excluded according to an embodiment of the present invention.
이어, 개체명 사전 구축 시스템(100)은 재검색된 '소녀시대'라는 용어가 제외된 문맥에서 '소녀시대'라는 용어 위치에 존재하는 다른 용어를 분리하고 정렬하여 도 6에 도시된 바와 같이 표시한다(S240). 여기서, 도 6은 본 발명의 실시예에 따라 개체명의 용어가 제외된 문맥에서 용어 위치에 존재하는 다른 용어를 분리하고 정렬하여 빈도순으로 표시한 예를 나타낸 도면이다.Subsequently, the entity name dictionary construction system 100 separates and arranges other terms existing at the term 'girl generation' in a context in which the term 'girl generation' is excluded again and displays them as shown in FIG. 6. (S240). 6 is a diagram illustrating an example of separating and sorting other terms existing at a term position in a context in which a term of an individual name is excluded according to an embodiment of the present invention and displaying the order in frequency order.
이어, 개체명 사전 구축 시스템(100)은 도 6과 같이 화면 상에 표시한 다른 용어들을 도 7에 도시된 바와 같이 개체명(@group)에 추가하거나, 다른 용어들이 가지는 제2 개체명을 추가하고 설정한다(S250). 여기서, 도 7은 본 발명의 실시예에 따라 텍스트 문서로부터 검색한 다른 용어들을 개체명에 추가하거나 제2 개체명을 추가하여 설정하는 예를 나타낸 도면이다.Subsequently, the entity name dictionary building system 100 adds other terms displayed on the screen as shown in FIG. 6 to the entity name (@group) as shown in FIG. 7, or adds a second entity name that other terms have. And set (S250). 7 is a diagram illustrating an example in which other terms searched from a text document are added to an entity name or set by adding a second entity name according to an embodiment of the present invention.
이때, 개체명 사전 구축 시스템(100)은 도 6에 도시된 바와 같이 다른 용어들 중 하나 또는 하나 이상을 사용자로부터 선택받아 개체명을 설정할 수 있다. In this case, the entity name dictionary construction system 100 may set an entity name by selecting one or more of other terms from a user, as shown in FIG. 6.
또한, 개체명 사전 구축 시스템(100)은 도 7에 도시된 바와 같이 “@programming_element”와 같은 제2 개체명을 사용자로부터 입력받아 설정할 수 있다.In addition, the entity name dictionary construction system 100 may receive and set a second entity name such as “@programming_element” from the user as illustrated in FIG. 7.
이어, 개체명 사전 구축 시스템(100)은 개체명 또는 제2 개체명을 개체명 사전에 등록한다(S260).Subsequently, the entity name dictionary construction system 100 registers the entity name or the second entity name in the entity name dictionary (S260).
이때, 개체명 사전 구축 시스템(100)은 도 6에 도시된 바와 같이 사용자로부터 선택받은 용어들과 그에 따른 개체명을 긍정적(Positive) 개체명으로 등록하고, 사용자로부터 선택받지 못한 용어와 그에 따른 개체명을 부정적(Negative) 개체명으로 등록할 수 있다.At this time, the entity name dictionary construction system 100 registers the terms selected by the user and the corresponding entity names as positive entity names as shown in FIG. 6, and the terms not selected by the user and the entity accordingly. You can register the name as a negative entity name.
도 8은 본 발명의 다른 실시예에 따른 개체명 추출을 이용한 규칙 등록 방법을 설명하기 위한 흐름도이다.8 is a flowchart illustrating a rule registration method using entity name extraction according to another embodiment of the present invention.
도 8을 참조하면, 본 발명에 따른 개체명 사전 구축 시스템(100)은, 도 3에 도시된 바와 같이 하나 이상의 개체명과 이 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 사전 데이터베이스(110)에 저장하고 있는 상태에서, 도 4의 (가)에 도시된 바와 같이 개체명 사전에 등록된 하나의 개체명을 가지는 용어가 텍스트 문서에 존재하는지를 확인하여 그 존재 여부를 검색한다(S810).Referring to FIG. 8, the entity name dictionary construction system 100 according to the present invention may include a dictionary of entity names in which one or more entity names and one or more terms corresponding to the entity names are registered as shown in FIG. 3. In the state of being stored at 110, as shown in (a) of FIG. 4, it is checked whether a term having one entity name registered in the entity name dictionary exists in the text document and search for the existence (S810). ).
이어, 개체명 사전 구축 시스템(100)은 개체명의 용어가 존재하는 경우, 도 4의 (나)에 도시된 바와 같이 해당 용어를 포함한 문맥을 텍스트 문서로부터 추출한다(S820).Subsequently, when the entity name term exists, the entity name dictionary construction system 100 extracts the context including the term from the text document as shown in (b) of FIG. 4 (S820).
이어, 개체명 사전 구축 시스템(100)은 해당 용어를 포함한 문맥에서 해당 용어(소녀시대)가 제외된 문맥, 예를 들면, '~의 다른 멤버'라는 문맥을 텍스트 문서로부터 재검색한다(S830).Subsequently, the entity name dictionary building system 100 re-searches the context in which the term (girl's age) is excluded from the context including the term, for example, the context of 'another member of' from the text document (S830).
따라서, 개체명 사전 구축 시스템(100)은 도 5에 도시된 바와 같이 텍스트 문서로부터 예를 들면, '~의 다른 멤버'라는 문맥을 포함하는 하나 이상의 다른 문맥들을 얻을 수 있다. Thus, the entity name building system 100 may obtain one or more other contexts, including, for example, the context 'another member of' from a text document as shown in FIG.
이어, 개체명 사전 구축 시스템(100)은 재검색된, 용어가 제외된 문맥에서 해당 용어 위치에 존재하는 다른 용어들을 분리하고 정렬하여 도 6에 도시된 바와 같이 화면 상에 표시한다(S840).Subsequently, the entity name dictionary building system 100 separates and sorts other terms existing at the corresponding term position in the context where the term is excluded again and displayed on the screen as shown in FIG. 6 (S840).
이어, 개체명 사전 구축 시스템(100)은 재검색된, 용어가 제외된 문맥에서 용어 위치에 존재하는 다른 용어들을 포함한 문맥을 텍스트 문서로부터 추출한다(S850).Subsequently, the entity name dictionary building system 100 extracts the context including the other terms existing at the term position in the context from which the term is re-searched from the text document (S850).
이어, 개체명 사전 구축 시스템(100)은 다른 용어들을 사용자로부터 선택받아 개체명을 추가하고 설정한 후 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록한다(S860).Subsequently, the entity name dictionary construction system 100 receives other terms from the user, adds and sets the entity name, and registers other contexts in which the other terms are excluded as rules (S860).
즉, 개체명 사전 구축 시스템(100)은 도 6에 도시된 바와 같이 다른 용어들을 정렬한 상태에서, 도 9에 도시된 바와 같이 사용자로부터 선택받은 용어의 문맥에서 분리된 또 다른 문맥들을 규칙으로 등록하는 것이다.That is, the entity name dictionary construction system 100 registers other contexts separated from the context of the term selected by the user as a rule, as shown in FIG. 9, with other terms arranged as shown in FIG. 6. It is.
이때, 개체명 사전 구축 시스템(100)은 또 다른 문맥들 중 사용자로부터 선택받은 문맥들을 긍정적(Positive) 규칙으로 등록하고, 또 다른 문맥들 중 사용자로부터 선택받지 못한 문맥들을 부정적(Negative) 규칙으로 등록한다. 또한, 개체명 사전 구축 시스템(100)은 도 9에 도시된 바와 같이 개체명 '@group'에 대한 긍정적 문맥을 문자열 형식 또는 LSP(Lexico Semantic Pattern) 형식으로 분류하여 긍정적 규칙으로 등록할 수 있다. 그리고, 개체명 사전 구축 시스템(100)은 도 9에 도시된 바와 같이 개체명 '@group'에 대한 부정적(Negative) 문맥도 문자열 형식 또는 LSP(Lexico Semantic Pattern) 형식으로 분류하여 부정적 규칙으로 등록할 수 있다. 여기서, 도 9는 본 발명의 다른 실시예에 따라 용어가 제외된 다른 문맥들을 규칙으로 등록하는 예를 나타낸 도면이다.At this time, the entity name dictionary building system 100 registers contexts selected by the user among other contexts as a positive rule, and registers contexts not selected by the user among other contexts as a negative rule. do. In addition, the entity name dictionary construction system 100 may classify the positive context for the entity name '@group' into a string form or LSP (Lexico Semantic Pattern) format and register it as a positive rule. In addition, as shown in FIG. 9, the entity name dictionary construction system 100 classifies a negative context for the entity name '@group' into a string format or a LSP (Lexico Semantic Pattern) format to register as a negative rule. Can be. 9 is a diagram illustrating an example of registering other contexts in which a term is excluded as a rule according to another exemplary embodiment of the present invention.
이어, 개체명 사전 구축 시스템(100)은 다른 용어들을 사용자로부터 입력받아 제2 개체명을 설정한 후 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록한다(S870).Subsequently, the entity name dictionary construction system 100 receives other terms from the user, sets the second entity name, and then registers other contexts in which the other terms are excluded as rules (S870).
이때, 개체명 사전 구축 시스템(100)은 또 다른 문맥들 중 사용자로부터 입력받아 제2 개체명을 설정한 문맥들을 도 9에 도시된 바와 같이 제2 개체명의 긍정적 규칙(문자열 형식의 @programming_element를 위한 Positive 규칙) 또는 제2 개체명의 부정적 규칙(LSP 형식의 @programming_element를 위한 Negative 규칙)으로 등록할 수 있다. At this time, the entity name dictionary construction system 100 receives the contexts in which the second entity name is set from the user among other contexts and sets the second entity name, as shown in FIG. 9 for the positive rule of @programming_element in the form of a string. It can be registered as a positive rule) or as a negative rule of a second entity name (Negative rule for @programming_element in LSP format).
전술한 바와 같이 본 발명에 의하면, 기 구축된 개체명 사전에 등록된 특정 분류 내 개체명이 텍스트 문서에 포함되어 있을 때, 해당 개체명의 앞 문맥이나 뒷 문맥(문자열 또는 LSP 형식의 문맥)을 추출하고, 추출된 문맥 내에서 또 다른 용어(전문용어 포함)들을 빈도 순이나 가나다 순 등으로 정렬하여, 해당 분류에 속하는 개체명들을 찾기 쉽게 지원함으로써 개체명 사전을 확장하여 구축할 수 있도록 하고, 상기 다른 용어를 이용하는 다른 문맥들에서 다른 용어를 제외시킨 문맥들을 규칙으로 등록할 수 있도록 된, 문맥으로부터의 개체명 추출을 이용한 개체명 사전 구축과 규칙 등록 방법 및 시스템을 실현할 수 있다.As described above, according to the present invention, when an entity name in a specific classification registered in a previously established entity name dictionary is included in a text document, the front context or the rear context (string or LSP format context) of the entity name is extracted. By sorting the other terms (including terminology) in the order of frequency or alphabetical order within the extracted context, it is possible to easily expand the entity name dictionary by supporting the entity names belonging to the classification. It is possible to realize the entity name dictionary construction and rule registration method and system using the entity name extraction from the context, which enables the registration of the contexts excluding other terms from the other contexts using the term.
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있으므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As those skilled in the art to which the present invention pertains may implement the present invention in other specific forms without changing the technical spirit or essential features, the embodiments described above should be understood as illustrative and not restrictive in all respects. Should be. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.
본 발명은 텍스트 문서로부터 용어를 추출하여 개체명을 설정하는 시스템이나 서비스 등에 적용할 수 있다.The present invention can be applied to a system or service for extracting a term from a text document and setting an entity name.
또한, 본 발명은 시맨틱 웹 서비스나 검색 서비스를 제공하는 시스템이나 서비스 등에 적용할 수 있다.In addition, the present invention can be applied to a system or service for providing a semantic web service or a search service.
그리고, 본 발명은 텍스트 문서로부터 용어를 추출해 개체명을 설정한 후 개체명 사전에 등록함으로써, 개체명 사전을 확장하는 시스템 및 서비스에 적용할 수 있다.The present invention can be applied to systems and services that extend the entity name dictionary by extracting terms from text documents, setting entity names, and registering them in the entity name dictionary.

Claims (15)

  1. 하나 이상의 개체명과 상기 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 구비한 시스템의 개체명 사전 구축 방법으로서,A method of constructing an entity name dictionary in a system having an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered,
    (a) 상기 개체명 사전에 등록된 개체명을 가지는 용어가 텍스트 문서에 존재하는지의 여부를 검색하는 단계;(a) searching whether a term having an entity name registered in the entity name dictionary exists in the text document;
    (b) 상기 용어가 존재하는 경우, 상기 용어가 포함된 문맥을 상기 텍스트 문서로부터 추출하는 단계;(b) if the term exists, extracting the context containing the term from the text document;
    (c) 상기 용어가 포함된 문맥에서 상기 용어가 제외된 문맥을 상기 텍스트 문서로부터 재검색하는 단계;(c) re-searching from the text document a context in which the term is excluded from the context in which the term is included;
    (d) 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어를 분리하고 정렬하여 표시하는 단계; (d) separating, sorting and displaying other terms that exist at the term position in the context in which the term is re-researched excluded;
    (e) 상기 다른 용어들을 상기 개체명에 추가하거나, 상기 다른 용어들이 가지는 제2 개체명을 추가하고 설정하는 단계; 및(e) adding the other terms to the entity name, or adding and setting a second entity name of the other terms; And
    (f) 상기 개체명 또는 상기 제2 개체명을 상기 개체명 사전에 등록하는 단계;(f) registering the entity name or the second entity name in the entity name dictionary;
    를 포함하는 개체명 사전 구축 방법.Object name dictionary building method comprising a.
  2. 제 1 항에 있어서,The method of claim 1,
    상기 (e) 단계는 상기 다른 용어들 중 하나 또는 하나 이상을 사용자로부터 선택받아 상기 개체명을 설정하는 것을 특징으로 하는 개체명 사전 구축 방법.In the step (e), one or more of the other terms are selected by a user and set the entity name.
  3. 제 1 항에 있어서,The method of claim 1,
    상기 (e) 단계는 상기 제2 개체명을 사용자로부터 입력받아 설정하는 것을 특징으로 하는 개체명 사전 구축 방법.In the step (e), the entity name dictionary construction method, characterized in that for receiving and setting the second entity name from the user.
  4. 하나 이상의 개체명과 상기 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 구비한 시스템의 개체명 추출을 이용한 규칙 등록 방법으로서,A rule registration method using the entity name extraction of a system having an entity name dictionary in which one or more entity names and one or more terms corresponding to the entity names are registered,
    (a) 상기 개체명 사전에 등록된 하나의 개체명을 가지는 용어가 텍스트 문서에 존재하는지의 여부를 검색하는 단계;(a) searching whether a term having one entity name registered in the entity name dictionary exists in the text document;
    (b) 상기 용어가 존재하는 경우, 상기 용어를 포함한 문맥을 상기 텍스트 문서로부터 추출하는 단계;(b) if the term exists, extracting a context containing the term from the text document;
    (c) 상기 용어를 포함한 문맥에서 상기 용어가 제외된 문맥을 상기 텍스트 문서로부터 재검색하는 단계;(c) re-searching from the text document a context in which the term is excluded from the context containing the term;
    (d) 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 분리하고 정렬하여 표시하는 단계;(d) separating, sorting and displaying other terms that exist at the term position in the context in which the term is re-searched excluded;
    (e) 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 포함한 문맥을 상기 텍스트 문서로부터 추출하는 단계;(e) extracting from the text document a context containing other terms that exist at the term location in the context in which the term is re-researched excluded;
    (f) 상기 다른 용어들을 사용자로부터 선택받아 상기 개체명을 추가한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록하는 단계; 및(f) receiving the other terms from the user, adding the entity name, and then registering other contexts in which the other terms are excluded as rules; And
    (g) 상기 다른 용어들을 사용자로부터 입력받아 제2 개체명을 추가하고 설정한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록하는 단계;(g) receiving the other terms from the user, adding and setting a second entity name, and then registering other contexts in which the other terms are excluded as rules;
    를 포함하는 개체명 추출을 이용한 규칙 등록 방법.Rule registration method using the entity name extraction comprising a.
  5. 제 4 항에 있어서,The method of claim 4, wherein
    상기 (f) 단계는 상기 또 다른 문맥들 중 사용자로부터 선택받은 문맥들을 긍정적(Positive) 규칙으로 등록하는 것을 특징으로 하는 개체명 추출을 이용한 규칙 등록 방법.Step (f) is a rule registration method using the entity name extraction, characterized in that for registering the context selected by the user of the other contexts (Positive rule).
  6. 제 4 항에 있어서,The method of claim 4, wherein
    상기 (f) 단계는 상기 또 다른 문맥들 중 사용자로부터 선택받지 못한 문맥들을 부정적(Negative) 규칙으로 등록하는 것을 특징으로 하는 개체명 추출을 이용한 규칙 등록 방법.The step (f) is a rule registration method using the entity name extraction, characterized in that for registering the context (Negative) rules that are not selected from the user among the other contexts.
  7. 제 5 항에 있어서,The method of claim 5,
    상기 (g) 단계는, 상기 또 다른 문맥들 중 사용자로부터 입력받아 상기 제2 개체명을 설정한 문맥들을 상기 제2 개체명의 긍정적(Positive) 규칙으로 등록하는 것을 특징으로 하는 개체명 추출을 이용한 규칙 등록 방법.In the step (g), the rules using the entity name extraction may be registered as a positive rule of the second entity name by receiving the inputs from the user and setting the second entity name. How to register.
  8. 하나 이상의 개체명과 상기 개체명에 대응된 하나 이상의 용어들이 등록되어 있는 개체명 사전을 저장하고 있는 사전 데이터베이스;A dictionary database that stores one or more entity names and an entity name dictionary in which one or more terms corresponding to the entity names are registered;
    상기 하나 이상의 개체명 또는 상기 하나 이상의 용어들 및 상기 개체명 사전을 화면 상에 디스플레이하기 위한 표시부;A display unit for displaying the one or more entity names or the one or more terms and the entity name dictionary on a screen;
    상기 개체명 사전에 등록된 개체명을 가지는 용어가 텍스트 문서에 존재하는 경우, 상기 용어가 포함된 문맥을 상기 텍스트 문서로부터 추출하는 문맥 추출부;A context extraction unit for extracting a context including the term from the text document when a term having the entity name registered in the entity name dictionary exists in the text document;
    상기 용어가 포함된 문맥에서 상기 용어가 제외된 문맥을 상기 텍스트 문서로부터 재검색하는 문맥 검색부;A context search unit for re-searching the context in which the term is excluded from the text including the term from the text document;
    재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어를 분리하는 용어 분리부;A term separator to separate other terms existing at the term position in a context in which the term which is re-searched is excluded;
    상기 다른 용어들을 상기 개체명에 추가하거나, 상기 다른 용어들이 가지는 제2 개체명을 추가하고 설정하는 개체명 설정부; 및An entity name setting unit for adding the other terms to the entity name or adding and setting a second entity name of the other terms; And
    상기 문맥 검색부를 통해 재검색된 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 상기 용어 분리부를 통해 분리하고 정렬하여 상기 표시부 상에 표시하도록 제어하고, 상기 용어가 제외된 문맥에서 상기 용어 위치에 존재하는 다른 용어들을 포함한 문맥을 상기 텍스트 문서로부터 추출하며, 상기 개체명 설정부를 통해 상기 다른 용어들이 추가된 상기 개체명 또는 상기 다른 용어들이 가지는 상기 제2 개체명을 상기 개체명 사전에 등록하도록 제어하는 제어부;Controls to separate and sort other terms existing at the term position in the context in which the term re-researched through the context search unit is displayed on the display unit by separating and sorting through the term separation unit, and in the context in which the term is excluded Extracts a context including other terms existing at a location from the text document and registers the entity name to which the other terms are added or the second entity name of the other terms in the entity name dictionary through the entity name setting unit A control unit for controlling the control unit to perform the control;
    를 포함하는 개체명 사전 구축 시스템.An entity name dictionary building system comprising a.
  9. 제 8 항에 있어서,The method of claim 8,
    상기 개체명 설정부는 상기 다른 용어들 중 하나 또는 하나 이상을 사용자로부터 선택받아 상기 개체명을 설정하는 것을 특징으로 하는 개체명 사전 구축 시스템.And the entity name setting unit selects one or more of the other terms from a user and sets the entity name.
  10. 제 8 항에 있어서,The method of claim 8,
    상기 개체명 설정부는 상기 제2 개체명을 사용자로부터 입력받아 추가하고 설정하는 것을 특징으로 하는 개체명 사전 구축 시스템.And the entity name setting unit receives and adds and sets the second entity name from a user.
  11. 제 8 항에 있어서,The method of claim 8,
    상기 제어부는, 상기 다른 용어들을 사용자로부터 선택받아 상기 개체명을 추가 설정한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록하는 것을 특징으로 하는 개체명 사전 구축 시스템.And the controller is further configured to receive the other terms from the user and additionally set the entity name, and register other contexts in which the other terms are excluded as rules.
  12. 제 8 항에 있어서,The method of claim 8,
    상기 제어부는, 상기 다른 용어들을 사용자로부터 입력받아 제2 개체명을 추가하고 설정한 후 상기 다른 용어가 제외된 또 다른 문맥들을 규칙으로 등록하는 것을 특징으로 하는 개체명 사전 구축 시스템.And the controller receives the other terms from a user, adds and sets a second entity name, and registers another context in which the other terms are excluded as a rule.
  13. 제 11 항에 있어서,The method of claim 11,
    상기 제어부는 상기 또 다른 문맥들 중 사용자로부터 선택받은 문맥들을 긍정적(Positive) 규칙으로 등록하는 것을 특징으로 하는 개체명 사전 구축 시스템.And the controller registers the contexts selected by the user among the other contexts as a positive rule.
  14. 제 11 항에 있어서,The method of claim 11,
    상기 제어부는 상기 또 다른 문맥들 중 사용자로부터 선택받지 못한 문맥들을 부정적(Negative) 규칙으로 등록하는 것을 특징으로 하는 개체명 사전 구축 시스템.And the control unit registers contexts that are not selected by the user among the other contexts as a negative rule.
  15. 제 12 항에 있어서,The method of claim 12,
    상기 제어부는, 상기 또 다른 문맥들 중 사용자로부터 입력받아 상기 제2 개체명을 설정한 문맥들을 상기 제2 개체명의 긍정적(Positive) 규칙으로 등록하는 것을 특징으로 하는 개체명 사전 구축 시스템.And the control unit registers contexts in which the second entity name is set by receiving a user from among the other contexts as a positive rule of the second entity name.
PCT/KR2010/003079 2010-04-28 2010-05-17 Method and system for constructing a named entity dictionary by extracting named entities from context and for registering rules WO2011136426A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2010-0039254 2010-04-28
KR20100039254 2010-04-28

Publications (1)

Publication Number Publication Date
WO2011136426A1 true WO2011136426A1 (en) 2011-11-03

Family

ID=44861699

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/003079 WO2011136426A1 (en) 2010-04-28 2010-05-17 Method and system for constructing a named entity dictionary by extracting named entities from context and for registering rules

Country Status (1)

Country Link
WO (1) WO2011136426A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108604236A (en) * 2015-10-30 2018-09-28 康维达无线有限责任公司 The RESTFUL of semantic Internet of Things is operated

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011466A (en) * 1996-06-27 1998-01-16 Toshiba Corp Document preparing device and dictionary information acquisition method
JP2005309706A (en) * 2004-04-21 2005-11-04 Fuji Xerox Co Ltd Information processing system and method, and computer program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011466A (en) * 1996-06-27 1998-01-16 Toshiba Corp Document preparing device and dictionary information acquisition method
JP2005309706A (en) * 2004-04-21 2005-11-04 Fuji Xerox Co Ltd Information processing system and method, and computer program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LEE, KYUNG HEE ET AL.: "Study on named Entity Recognition in Korean Text", JOURNAL OF THE INSTITUTE OF LANGUAGE ENGINEERING, 31 October 2000 (2000-10-31), pages 294 - 296 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108604236A (en) * 2015-10-30 2018-09-28 康维达无线有限责任公司 The RESTFUL of semantic Internet of Things is operated

Similar Documents

Publication Publication Date Title
WO2018016673A1 (en) Device and method for automatically extracting alternative word, and recording medium for performing same
WO2013172534A1 (en) System and method for managing dialogues
WO2014025135A1 (en) Method for detecting grammatical errors, error detecting apparatus for same, and computer-readable recording medium having the method recorded thereon
WO2011162446A1 (en) Module and method for deciding named entity of term using named entity dictionary combined with ontology schema and mining rule
WO2021049706A1 (en) System and method for ensemble question answering
WO2020085663A1 (en) Artificial intelligence-based automatic logo generation system, and logo generation service method using same
WO2020111314A1 (en) Conceptual graph-based query-response apparatus and method
WO2014030834A1 (en) Method for detecting grammatical errors, error detection device for same, and computer-readable recording medium having method recorded thereon
WO2013062302A1 (en) Example-based error detection system for automatic evaluation of writing, method for same, and error detection apparatus for same
WO2018088664A1 (en) Device for automatically detecting morpheme part of speech tagging corpus error by using rough sets, and method therefor
WO2020111395A1 (en) Device and method for term clustering of unstructured text data for big data analysis
WO2014115952A1 (en) Voice dialog system using humorous speech and method thereof
WO2014142422A1 (en) Method for processing dialogue based on processing instructing expression and apparatus therefor
WO2018147543A1 (en) Concept graph based query-response system and context search method using same
WO2021107445A1 (en) Method for providing newly-coined word information service based on knowledge graph and country-specific transliteration conversion, and apparatus therefor
WO2014148664A1 (en) Multi-language search system, multi-language search method, and image search system, based on meaning of word
WO2011136426A1 (en) Method and system for constructing a named entity dictionary by extracting named entities from context and for registering rules
WO2017138752A1 (en) Apparatus and method for displaying color of intonation
WO2018143490A1 (en) System for predicting mood of user by using web content, and method therefor
CN110008314B (en) Intention analysis method and device
WO2022177372A1 (en) System for providing tutoring service by using artificial intelligence and method therefor
WO2019112223A1 (en) Electronic document retrieval method and server therefor
WO2016068514A1 (en) Respective-product industrial structure analysis method and analysis device utilizing natural language processing
WO2022114447A1 (en) Method for providing similar clinical trial data and server executing same
WO2010093101A1 (en) Method and system for transforming blog post to ontology-based information

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10850793

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10850793

Country of ref document: EP

Kind code of ref document: A1