KR102106250B1 - An apparatus for rule-based user inference reasoning for conversation awareness - Google Patents

An apparatus for rule-based user inference reasoning for conversation awareness Download PDF

Info

Publication number
KR102106250B1
KR102106250B1 KR1020200022823A KR20200022823A KR102106250B1 KR 102106250 B1 KR102106250 B1 KR 102106250B1 KR 1020200022823 A KR1020200022823 A KR 1020200022823A KR 20200022823 A KR20200022823 A KR 20200022823A KR 102106250 B1 KR102106250 B1 KR 102106250B1
Authority
KR
South Korea
Prior art keywords
intention
keyword
keyword set
cluster
information
Prior art date
Application number
KR1020200022823A
Other languages
Korean (ko)
Other versions
KR20200023620A (en
Inventor
강진범
주동원
박보영
이형로
Original Assignee
주식회사 자이냅스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 자이냅스 filed Critical 주식회사 자이냅스
Priority to KR1020200022823A priority Critical patent/KR102106250B1/en
Publication of KR20200023620A publication Critical patent/KR20200023620A/en
Application granted granted Critical
Publication of KR102106250B1 publication Critical patent/KR102106250B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 대화 인지를 위한 규칙기반 사용자 의도 추론 장치를 제공한다. 본 발명의 장치는, 대화 인지를 위한 규칙을 생성하고, 상기 규칙을 기반으로 사용자의 의도를 추론하는 장치에 있어서, 사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 집합인 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출하는 전처리부와, 집합 간의 포함 관계에 기초하여, 서로 간의 포함 관계가 성립되지 않는 적어도 하나의 키워드 집합을 모아놓은 군집인 복수의 의도군집 중에서 상기 입력키워드정보에 대응되는 의도군집의 존재 여부를 판단하는 판단부와, 상기 판단 결과에 따라, 상기 입력키워드정보를 이용하여 상기 복수의 의도군집을 포함하는 KB(knowledge base)를 갱신하는 갱신부와, 상기 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 중에서 상기 입력키워드정보에 포함된 키워드집합을 포함하는 키워드집합을 결정하는 결정부를 포함한다.The present invention provides a rule-based user intention inference device for conversation recognition. The apparatus of the present invention is a device for generating a rule for recognizing a conversation and inferring a user's intention based on the rule, which is a set of at least one keyword from conversation data including information about a user's conversation The pre-processing unit for extracting input keyword information including information about a keyword set, and a plurality of intention clusters, which are clusters that collect at least one keyword set in which an inclusion relationship between each other is not established based on the inclusion relationship between the sets. A determination unit for determining whether an intention cluster corresponding to the input keyword information exists, and an update unit for updating a knowledge base (KB) including the plurality of intention clusters using the input keyword information according to the determination result. , Included in the input keyword information among at least one keyword set included in each of the plurality of intention clusters It includes determining portion for determining a set of keywords that include the keyword set.

Description

대화 인지를 위한 규칙기반의 사용자 의도 추론 장치{AN APPARATUS FOR RULE-BASED USER INFERENCE REASONING FOR CONVERSATION AWARENESS}A rule-based user intention reasoning device for conversation recognition {AN APPARATUS FOR RULE-BASED USER INFERENCE REASONING FOR CONVERSATION AWARENESS}

본 발명은 사용자의 대화 인지를 위한 규칙기반 의도 추론장치에 관한 것으로, 보다 상세하게는, 사용자의 명령 또는 질의를 올바르게 인지하기 위하여 규칙을 자동으로 생성하고, 그 규칙을 기반으로 명령 또는 질의에 대한 사용자의 의도를 추론하는 장치에 관한 것이다.The present invention relates to a rule-based inference inference device for recognizing a user's conversation. More specifically, a rule is automatically generated to correctly recognize a user's command or query, and the command or query is based on the rule. It relates to a device for inferring the user's intentions.

일반적 규칙 시스템에서는 규칙을 생성하기 위해 데이터 분석가가 구분력 좋은 주요 단어를 분석하고 선택하여 규칙을 생성한다. 즉, 규칙 자동 생성이 아닌 데이터와 관련된 특정 지식에 대한 키워드를 전문가가 직접 추출해내야만 규칙을 만들 수 있었다. 또한, 사용자의 대화 문장에서 주요 키워드를 추출하여 규칙을 생성하고 의도를 분석하는 방식으로 이 과정에서 생성된 규칙들의 관계를 정의하지 못했다. In the general rule system, in order to create a rule, a data analyst analyzes and selects key words with good discrimination to generate a rule. In other words, it was not possible to create rules only by extracting keywords for specific knowledge related to data rather than automatically generating rules. In addition, the relationship between the rules created in this process could not be defined by extracting key keywords from the user's dialogue sentences and generating rules and analyzing intentions.

그 결과, 단순 키워드 출현 여부 판단으로만 규칙을 활용하고 있다는 문제점이 있었고 규칙들 간의 모순 탐지 및 해결하기 어렵기 때문에 추론을 하기도 어려웠다. 또한, 질의어의 의도를 추론할 때 규칙들 간의 관계 정의 없이 저장된 규칙들을 이용하기 때문에, 다양한 어휘를 수용하기 어려운 문제점이 있었다.As a result, there was a problem that the rule was used only to determine whether a simple keyword appeared, and it was difficult to infer because it was difficult to detect and resolve contradictions between rules. In addition, there is a problem in that it is difficult to accommodate a variety of vocabularies because the stored rules are used without inferring the relationship between rules when inferring the intention of the query.

따라서, 기존의 규칙 시스템의 규칙 생성 방법의 단점을 보완할 수 있는 자동적 규칙 생성 방법, 그 규칙 기반의 의도 추론 방법 및 그 장치에 관한 필요성이 대두되고 있다.Accordingly, there is a need for an automatic rule generation method capable of compensating for the disadvantages of the rule generation method of the existing rule system, a method for inferring intention based on the rule, and an apparatus.

관련 선행기술로는 한국등록특허 제10-1187425호(발명의 명칭: 대화형 서비스 제공 시스템 및 방법, 등록일자: 2012년 9월 25일)가 있다.Related prior art is Korean Registered Patent No. 10-1187425 (Invention name: interactive service providing system and method, registration date: September 25, 2012).

본 발명은 사용자의 대화 의도를 파악하여, 사용자의 대화에 포함된 키워드의 집합을 그 키워드의 집합 간의 포함 관계에 따라 체계적으로 구성함으로써, 대화 인지를 위한 규칙을 자동으로 생성하고, 그 생성된 규칙을 이용하여 사용자의 의도를 추론하는 장치를 제공하고자 한다.The present invention grasps a user's conversation intention, and systematically constructs a set of keywords included in the user's conversation according to an inclusion relationship between the set of keywords, thereby automatically generating rules for conversation recognition, and the generated rules It is intended to provide a device for inferring a user's intention using.

본 발명이 해결하고자 하는 과제는 이상에서 언급한 과제(들)로 제한되지 않으며, 언급되지 않은 또 다른 과제(들)은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The problem to be solved by the present invention is not limited to the problem (s) mentioned above, and another problem (s) not mentioned will be clearly understood by those skilled in the art from the following description.

상기 목적을 달성하기 위한 의도 추론 장치는, 대화 인지를 위한 규칙을 생성하고, 상기 규칙을 기반으로 사용자의 의도를 추론하는 장치에 있어서, 사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 집합인 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출하는 전처리부와, 집합 간의 포함 관계에 기초하여, 서로 간의 포함 관계가 성립되지 않는 적어도 하나의 키워드 집합을 모아놓은 군집인 복수의 의도군집 중에서 상기 입력키워드정보에 대응되는 의도군집의 존재 여부를 판단하는 판단부와, 상기 판단 결과에 따라, 상기 입력키워드정보를 이용하여 상기 복수의 의도군집을 포함하는 KB(knowledge base)를 갱신하는 갱신부와, 상기 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 중에서 상기 입력키워드정보에 포함된 키워드집합을 포함하는 키워드집합을 결정하는 결정부를 포함하고, 상기 결정부는, 상기 복수의 의도군집 간에 적어도 하나의 키워드집합의 포함 관계에 따른 순서의 역순에 기반하여, 상기 키워드집합을 결정하고, 상기 결정부는 가장 많은 키워드를 포함하는 의도군집에서 가장 적은 키워드를 포함하는 의도군집의 순서로 키워드집합을 결정하는 것을 포함한다.Intention inference device for achieving the above object, the apparatus for generating a rule for recognizing a conversation, and inferring the user's intention based on the rule, at least one from the conversation data including information about the user's conversation A pre-processing unit for extracting input keyword information including information about a keyword set, which is a set of keywords, and a plurality of clusters that collect at least one keyword set in which an inclusion relationship between each other is not established based on the inclusion relationship between the sets A determination unit for determining whether an intention cluster corresponding to the input keyword information exists among the intention clusters, and a KB (knowledge base) including the plurality of intention clusters using the input keyword information according to the determination result. An update unit for updating, and at least one keyword set included in each of the plurality of intention clusters. And a determining unit for determining a keyword set including a keyword set included in the input keyword information, wherein the determining unit is based on a reverse order of the order according to an inclusion relationship of at least one keyword set between the plurality of intention clusters. The keyword set is determined, and the determining unit includes determining the keyword set in the order of the intention group including the smallest keyword in the intention group containing the most keywords.

바람직하게는, 상기 판단부는 상기 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서에 기반하여, 상기 의도군집의 존재 여부를 판단할 수 있다.Preferably, the determination unit may determine whether the intention cluster exists based on an order according to an inclusion relationship of at least one keyword set between the plurality of intention clusters.

바람직하게는, 상기 판단부는 상기 복수의 의도군집 중에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 상기 입력키워드정보에 포함된 키워드집합 간의 포함 관계가 성립하지 않는 하나의 의도군집을 상기 입력키워드정보에 대응되는 것으로 판단할 수 있다.Preferably, among the plurality of intention clusters, the determination unit may input one intention cluster in which an inclusion relationship between each of at least one keyword set included in the intention cluster and the keyword set included in the input keyword information does not hold. It can be determined to correspond to information.

바람직하게는, 상기 판단부는 상기 복수의 의도군집 각각에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 상기 입력키워드정보에 포함된 키워드집합의 의도가 소정의 기준에 따라 동일한지 판단하고, 상기 판단 결과 동일하면, 상기 의도가 동일한 2개의 키워드집합 간의 포함 관계에 기초하여, 선택적으로 의도군집에 포함된 키워드집합을 상기 입력키워드정보에 포함된 키워드집합으로 대체할 수 있다.Preferably, the determination unit determines whether the intention of each of the plurality of intention clusters, each of at least one keyword set included in the intention cluster and the keyword set included in the input keyword information is the same according to a predetermined criterion, and If the result of the determination is the same, the keyword set included in the intention cluster may be selectively replaced with the keyword set included in the input keyword information, based on the inclusion relationship between two keyword sets having the same intention.

바람직하게는, 상기 갱신부는 상기 복수의 의도군집 중 상기 입력키워드정보에 대응되는 의도군집의 존재하면, 상기 입력키워드정보에 포함된 키워드집합을 상기 입력키워드정보에 대응되는 의도군집에 추가하고, 상기 복수의 의도군집 중 상기 입력키워드정보에 대응되는 의도군집의 존재하지 않으면, 상기 입력키워드정보에 포함된 키워드집합을 포함하는 새로운 의도군집을 상기 KB에 추가할 수 있다.Preferably, if there is an intention cluster corresponding to the input keyword information among the plurality of intention clusters, the update unit adds the keyword set included in the input keyword information to the intention cluster corresponding to the input keyword information, and the If there is no intention cluster corresponding to the input keyword information among the plurality of intention clusters, a new intention cluster including the keyword set included in the input keyword information may be added to the KB.

본 발명의 목적을 달성하기 위한 추론 방법은, 대화 인지를 위한 규칙을 생성하고, 그 규칙을 기반으로 사용자 의도를 추론하는 방법으로서, 적어도 하나의 키워드집합으로 구성된 복수의 의도군집을 포함하는 KB(knowledge base)를 이용하여 사용자의 의도를 추론하는 방법에 있어서, 사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 집합인 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출하는 단계; 집합 간의 포함 관계에 기초하여, 적어도 하나의 키워드집합으로 구성된 복수의 의도군집 중에서 상기 입력키워드정보에 대응되는 의도군집의 존재 여부를 판단하는 단계; 상기 판단 결과에 따라, 상기 입력키워드정보를 이용하여 상기 복수의 의도군집을 포함하는 KB(knowledge base)를 갱신하는 단계; 및 상기 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 중에서 상기 입력키워드정보에 포함된 키워드집합을 포함하는 키워드집합을 결정하는 단계를 포함하고, 상기 키워드집합을 결정하는 단계는 상기 복수의 의도군집 간에 적어도 하나의 키워드집합의 포함 관계에 따른 순서의 역순에 기반하여, 상기 키워드집합을 결정한다.The reasoning method for achieving the object of the present invention is a method for generating a rule for dialogue recognition and inferring a user's intention based on the rule, KB (which includes a plurality of intention clusters composed of at least one keyword set) In the method of inferring a user's intention using a knowledge base), extracting input keyword information including information about a keyword set, which is a set of at least one keyword, from conversation data including information about a user's conversation step; Determining whether an intention cluster corresponding to the input keyword information is present among a plurality of intention clusters composed of at least one keyword set based on an inclusion relationship between sets; Updating a knowledge base (KB) including the plurality of intention clusters using the input keyword information according to the determination result; And determining a keyword set including a keyword set included in the input keyword information among at least one keyword set included in each of the plurality of intention groups, and determining the keyword set includes: The keyword set is determined based on a reverse order of the order according to the inclusion relationship of at least one keyword set between clusters.

바람직하게는, 상기 의도군집의 존재 여부를 판단하는 단계는 상기 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서에 기반하여, 상기 의도군집의 존재 여부를 판단할 수 있다.Preferably, the determining whether the intention cluster is present may determine whether the intention cluster is present based on an order according to an inclusion relationship of at least one keyword set between the plurality of intention clusters.

바람직하게는, 상기 의도군집의 존재 여부를 판단하는 단계는 상기 복수의 의도군집 중에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 상기 입력키워드정보에 포함된 키워드집합 간의 포함 관계가 성립하지 않는 하나의 의도군집을 상기 입력키워드정보에 대응되는 것으로 판단할 수 있다.Preferably, the determining of the existence of the intention cluster does not establish an inclusion relationship between each of the at least one keyword set included in the intention cluster and the keyword set included in the input keyword information in the plurality of intention clusters. It can be determined that one intention cluster corresponds to the input keyword information.

바람직하게는, 상기 의도군집의 존재 여부를 판단하는 단계는 상기 복수의 의도군집 각각에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 상기 입력키워드정보에 포함된 키워드집합의 의도가 소정의 기준에 따라 동일한지 판단하는 단계; 및 상기 판단 결과 동일하면, 상기 의도가 동일한 2개의 키워드집합 간의 포함 관계에 기초하여, 선택적으로 의도군집에 포함된 키워드집합을 상기 입력키워드정보에 포함된 키워드집합으로 대체하는 단계를 포함할 수 있다.Preferably, the step of determining whether or not the intention cluster exists may include determining, in each of the plurality of intention clusters, that the intention of each of the at least one keyword set included in the intention cluster and the keyword set included in the input keyword information is a predetermined criterion. Determining whether the same according to; And if the result of the determination is the same, replacing the keyword set included in the intention group with the keyword set included in the input keyword information, based on the inclusion relationship between two keyword sets having the same intention. .

바람직하게는, 상기 KB를 갱신하는 단계는 상기 복수의 의도군집 중 상기 입력키워드정보에 대응되는 의도군집의 존재하면, 상기 입력키워드정보에 포함된 키워드집합을 상기 입력키워드정보에 대응되는 의도군집에 추가하는 단계; 및 상기 복수의 의도군집 중 상기 입력키워드정보에 대응되는 의도군집의 존재하지 않으면, 상기 입력키워드정보에 포함된 키워드집합을 포함하는 새로운 의도군집을 상기 KB에 추가하는 단계를 포함할 수 있다.Preferably, in the step of updating the KB, if there is an intention cluster corresponding to the input keyword information among the plurality of intention clusters, the keyword set included in the input keyword information is assigned to the intention cluster corresponding to the input keyword information. Adding; And if the intention cluster corresponding to the input keyword information does not exist among the plurality of intention clusters, adding a new intention cluster including the keyword set included in the input keyword information to the KB.

본 발명의 일 실시예에 따른 대화 인지를 위한 규칙 생성 방법은 사용자의 대화 의도를 파악하여, 사용자의 대화에 포함된 키워드의 집합을 그 키워드의 집합 간의 포함 관계에 따른 순서로 체계적으로 구성함으로써, 사용자의 대화 의도를 군집 단위로 분리하여 규칙을 자동으로 생성할 수 있는 효과가 있다.The rule generation method for conversation recognition according to an embodiment of the present invention is to grasp a user's conversation intention, and systematically configure a set of keywords included in the user's conversation in an order according to an inclusion relationship between the set of keywords, It has the effect of automatically generating rules by separating the user's intention of conversation into cluster units.

또한, 본 발명의 일 실시예에 따른 규칙 기반의 의도 추론 방법은 사용자의 대화에 관하여, 사용자의 대화 의도에 따라 군집단위로 분리된 규칙을 역순으로 적용하여 그 의도를 추론함으로써, 완전성(completeness) 및 건전성(soundness)을 확보할 수 있는 효과가 있다. In addition, in the rule-based intention inference method according to an embodiment of the present invention, by applying rules separated in cluster units in the reverse order according to the user's conversation intention, the intention is inferred, thereby completing the completeness And it has the effect of ensuring soundness (soundness).

도 1은 본 발명의 일 실시예에 따른 대화 인지를 위한 규칙 생성 방법의 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 대화 인지를 위한 규칙 생성 장치의 블록도이다.
도 3은 본 발명의 일 실시예에 따른 규칙 기반의 의도 추론 방법의 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 규칙 기반의 의도 추론 장치의 블록도이다.
도 5는 본 발명의 일 실시예에 따른 규칙 생성 방법의 의사코드(pseudo code)이다.
도 6은 본 발명의 일 실시예에 따른 의도 추론 방법의 의사코드(pseudo code)이다.
도 7은 본 발명의 일 실시예에 따른 의도군집의 구성을 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따른 의도군집을 이용한 사용자 의도 추론 과정을 설명하기 위한 도면이다.
1 is a flowchart of a rule generation method for conversation recognition according to an embodiment of the present invention.
2 is a block diagram of a rule generation device for conversation recognition according to an embodiment of the present invention.
3 is a flowchart of a rule-based intention inference method according to an embodiment of the present invention.
4 is a block diagram of a rule-based intention inference device according to an embodiment of the present invention.
5 is a pseudo code of a rule generation method according to an embodiment of the present invention.
6 is a pseudo code of an intention inference method according to an embodiment of the present invention.
7 is a view for explaining the configuration of the intention cluster according to an embodiment of the present invention.
8 is a view for explaining a user intention inference process using an intention cluster according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.The present invention can be applied to various changes and may have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. In describing each drawing, similar reference numerals are used for similar components.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Terms such as first, second, A, and B can be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from other components. For example, the first component may be referred to as a second component without departing from the scope of the present invention, and similarly, the second component may be referred to as a first component. The term and / or includes a combination of a plurality of related described items or any one of a plurality of related described items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.When an element is said to be "connected" or "connected" to another component, it is understood that other components may be directly connected to or connected to the other component, but other components may exist in the middle. It should be. On the other hand, when a component is said to be "directly connected" or "directly connected" to another component, it should be understood that no other component exists in the middle.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in this application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "include" or "have" are intended to indicate the presence of features, numbers, steps, actions, components, parts or combinations thereof described herein, one or more other features. It should be understood that the existence or addition possibilities of fields or numbers, steps, operations, components, parts or combinations thereof are not excluded in advance.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by a person skilled in the art to which the present invention pertains. Terms such as those defined in a commonly used dictionary should be interpreted as having meanings consistent with meanings in the context of related technologies, and should not be interpreted as ideal or excessively formal meanings unless explicitly defined in the present application. Does not.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 발명은 글을 통해 이루어지는 대화(예, 채팅 서비스, 메신저 서비스 등)뿐만 아니라 말을 통해 이루어지는 대화(예, 음성인식 인공지능(AI) 스피커, 무인전화 서비스)에 적용될 수 있으나, 이에 제한되는 것은 아니며 다른 형태로 이루어지는 대화에도 적용될 수 있음은 통상의 기술자에게 자명할 것이다. 또한, 본 발명의 대화는 한국어뿐만 아니라 모든 종류의 외국어로 된 대화일 수 있다.The present invention can be applied not only to conversations made through text (eg, chat service, messenger service, etc.), but also conversations made through words (eg, speech recognition artificial intelligence (AI) speaker, unmanned phone service), but is not limited thereto. It will be apparent to those skilled in the art that it is not applicable to other forms of conversation. In addition, the conversation of the present invention may be a conversation in all kinds of foreign languages as well as Korean.

도 1은 본 발명의 일 실시예에 따른 대화 인지를 위한 규칙 생성 방법의 흐름도이다.1 is a flowchart of a rule generation method for conversation recognition according to an embodiment of the present invention.

단계 S110에서는, 규칙 생성 장치가 사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 집합인 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출한다.In step S110, the rule generation device extracts input keyword information including information about a keyword set, which is a set composed of at least one keyword, from conversation data including information about a user's conversation.

예컨대, 규칙 생성 장치는 규칙 생성의 전처리 과정으로서 품사 분석(POS tagging)을 통해, 대화데이터에 포함된 단어 중에서 키워드로서 큰 역할을 담당하지 않는 감탄사, 문장부호, 조사, 부사 등의 불필요한 특정 품사를 제거하여 키워드집합을 추출할 수 있다. 또한, 한국어가 아닌 외국어로 수행되는 대화인 경우에, 규칙 생성 장치가 해당 외국어의 특성에 맞도록 품사 분석 등의 분석을 수행하여, 키워드집합을 추출할 수 있음은 물론이다.For example, the rule generation device, through pre-processing of the tag generation as a pre-processing process of rule generation, selects unnecessary unnecessary parts of speech, such as exclamation marks, sentence codes, investigations, adverbs, etc., which do not play a large role as keywords among words included in the conversation data. Keyword sets can be extracted by removing them. In addition, in the case of a conversation conducted in a foreign language other than Korean, it is needless to say that the rule generation device may perform keyword analysis such as part-of-speech analysis to match the characteristics of the foreign language.

단계 S120에서는, 규칙 생성 장치가 집합 간의 포함 관계에 기초하여, 적어도 하나의 키워드집합으로 구성된 복수의 의도군집 중에서 상기 입력키워드정보에 대응되는 의도군집의 존재 여부를 판단한다.In step S120, the rule generating apparatus determines whether an intention cluster corresponding to the input keyword information is present among a plurality of intention clusters composed of at least one keyword set based on the inclusion relationship between sets.

여기서, 의도군집은 서로 간에 포함 관계가 성립하지 않는 적어도 하나의 키워드집합을 모아놓은 군집일 수 있다. Here, the intention cluster may be a cluster in which at least one keyword set in which an inclusion relationship is not established between each other.

예컨대, {'노원구', '후보', '가르쳐줘'}의 키워드집합 A와 {'양천구', '구청장', '후보', '가르쳐줘'}의 키워드집합 B를 가정할 수 있다. 이때, 키워드집합 A와 B는 A⊃B의 포함 관계가 성립하지 않으면서, 동시에 A⊂B의 포함 관계가 성립하지 않기 때문에, 서로 간에 포함 관계가 성립하지 않아 하나의 의도군집에 포함될 수 있다.For example, it may be assumed that the keyword set A of {'Nowon-gu', 'candidate', and 'teach'} and the keyword set B of {'Yangcheon-gu', 'gu-gujang', 'candidate', 'teach'}. At this time, the keyword sets A and B may not be included in the inclusion relationship of A⊃B, and since the inclusion relationship of A⊂B is not established at the same time, the inclusion relationship between each other may not be established and thus may be included in one intention cluster.

반면에, {'노원구', '후보', '가르쳐줘'}의 키워드집합 C와 {'노원구', '구청장', '후보', '가르쳐줘'}의 키워드집합 D의 경우에는, C⊂D의 포함 관계가 성립하기 때문에, 키워드집합 C와 D는 하나의 의도군집에 포함될 수 없다.On the other hand, the keyword set C of {'Nowon-gu,' candidate ',' teach '} and the keyword set D of {' Nowon-gu ',' Gu-gujang ',' candidate ',' teach '}, C⊂ Since the inclusion relationship of D is established, the keyword sets C and D cannot be included in one intention cluster.

이때, 규칙 생성 장치는 그 입력키워드정보에 포함된 키워드집합에 대하여, 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 모두와 포함 관계를 판단할 수 있다. 그리고, 규칙 생성 장치는 그 포함 관계에 관한 판단 결과를 이용하여 복수의 의도군집 중에서 입력키워드정보에 대응되는 의도군집이 존재하는지 판단할 수 있다.At this time, the rule generation device may determine, with respect to the keyword set included in the input keyword information, all of the at least one keyword set included in each of the plurality of intention clusters and the inclusion relationship. Then, the rule generation device may determine whether an intention cluster corresponding to the input keyword information is present among the plurality of intention clusters using the determination result regarding the inclusion relationship.

이때, 판단 결과로는 i) 복수의 의도군집 중 입력키워드정보에 대응되는 의도군집의 존재한다는 결과, ii) 복수의 의도군집 중 입력키워드정보에 대응되는 의도군집의 존재하지 않는다는 결과 등이 있을 수 있다.At this time, the determination result may include i) a result of the intention cluster corresponding to the input keyword information among the plurality of intention clusters, and ii) a result of the absence of the intention cluster corresponding to the input keyword information among the plurality of intention clusters, and the like. have.

또 다른 실시예에서는, 규칙 생성 장치가 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서에 기반하여, 의도군집의 존재 여부를 판단할 수 있다.In another embodiment, the rule generation apparatus may determine whether an intention cluster exists based on an order according to an inclusion relationship of at least one keyword set between a plurality of intention clusters.

예컨대, 규칙 생성 장치는 복수의 의도군집 중에서 가장 작은 수의 원소를 포함하는 키워드집합을 포함하는 의도군집에서부터 판단을 시작할 수 있다. 즉, 도 7을 참조하면, 규칙 생성 장치는 2개의 원소만을 포함하는 키워드집합인 {'후보', '가르쳐줘'}을 포함하는 의도군집#1에서부터 판단을 시작할 수 있다.For example, the rule generation device may start a determination from an intention cluster including a keyword set including the smallest number of elements among a plurality of intention clusters. That is, referring to FIG. 7, the rule generation device may start determination from the intention cluster # 1 including {'candidate', 'teach'} which is a keyword set including only two elements.

그리고, 규칙 생성 장치는 의도군집#1의 {'후보', '가르쳐줘'} 키워드집합을 부분집합으로 하는 키워드집합인 {'양천구', '구청장', '후보', '가르쳐줘'}, {'노원구', '후보', '가르쳐줘'}, {'원주', '시장', '후보', '가르쳐줘'}를 포함하는 의도군집#2에 대하여 판단할 수 있다. 그리고, 규칙 생성 장치는 의도군집#2의 {'노원구', '후보', '가르쳐줘'} 키워드집합을 부분집합으로 하는 키워드집합인 {'노원구', '시장', '후보', '가르쳐줘'}를 포함하는 의도군집#3에 대하여 판단할 수 있다.In addition, the rule generation device is a keyword set {'Yangcheon-gu', 'Gu-gujangjang', 'candidate', 'Teach'}, which is a sub-set of {'candidate', 'teach'} of intention cluster # 1, It is possible to judge the intention cluster # 2 including {'Nowon-gu', 'candidate', 'teach'}, {'wonju', 'market', 'candidate', and 'teach'}. In addition, the rule generating device is a keyword set {'Nowon-gu', 'Market', 'candidate', 'Teach', which is a sub-set of the {'Nowon-gu', 'candidate', and 'Teach'} of the intention cluster # 2. You can judge for intention cluster # 3 including 'give me'}.

이때, 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서는 의도군집#1에 포함된 어떤 하나의 키워드집합이 의도군집#2에 포함된 어떤 하나의 키워드집합에 포함되는 관계가 존재하고, 의도군집#2에 포함된 어떤 하나의 키워드집합이 의도군집#3에 포함된 어떤 하나의 키워드집합에 포함되는 관계가 존재할 때, 의도군집#1, 의도군집#2, 의도군집#3의 순서를 의미할 수 있다.At this time, the order according to the inclusion relationship of at least one keyword set between a plurality of intention clusters exists in a relationship in which any one keyword set included in intention cluster # 1 is included in any one keyword set included in intention cluster # 2 When there is a relationship in which any one keyword set included in intention cluster # 2 is included in any one keyword set included in intent cluster # 3, intention cluster # 1, intent cluster # 2, intent cluster # 3 Can mean order.

이처럼, 규칙 생성 장치가 가장 작은 수의 원소를 포함하는 키워드집합을 포함하는 의도군집에서부터 시작하여, 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서에 따라 의도 군집의 존재 여부를 판단함으로써, 보다 일반적인 내용에 관한 키워드집합을 포함하는 의도군집에서부터 보다 구체적인 내용에 관한 키워드집합을 포함하는 의도군집의 순서로 의도군집의 존재 여부를 판단해 나갈 수 있다. 즉, 규칙 생성 장치가 키워드의 개수가 비교적 적은 키워드집합으로 구성된 의도군집에서 키워드의 개수가 비교적 많은 키워드집합으로 구성된 의도군집의 순서로 대응되는 의도군집의 존재 여부를 판단할 수 있다.As described above, the rule generating apparatus determines whether an intention cluster exists in an order according to an inclusion relationship of at least one keyword set among a plurality of intention clusters, starting with an intention cluster including a keyword set including the smallest number of elements. By doing so, it is possible to determine whether the intention cluster exists from the intention cluster containing the keyword set for more general content to the intention cluster including the keyword set for more specific content. That is, the rule generation device may determine whether there is a corresponding intention cluster in the order of the intention cluster consisting of the keyword set having a relatively large number of keywords in the intention cluster consisting of the keyword set having a relatively small number of keywords.

그 결과, 규칙 생성 장치는 그 입력키워드정보에 포함된 키워드집합에 대하여, 가장 일반적인 내용을 포함하는 의도군집을 대응되는 의도군집으로 판단할 수 있게 된다. 즉, 규칙 생성 장치가 복수의 의도군집을 보다 일반적인 내용에 관한 키워드집합을 포함하는 의도군집에서 보다 구체적인 내용에 관한 키워드집합을 포함하는 의도군집의 순서로 체계적으로 유지할 수 있게 된다.As a result, the rule generation device can determine the intention cluster including the most general content as the corresponding intention cluster with respect to the keyword set included in the input keyword information. That is, the rule generating apparatus can systematically maintain a plurality of intention clusters in the order of intention clusters containing keyword sets for more specific content, from intention clusters containing keyword sets for more general contents.

또 다른 실시예에서는, 규칙 생성 장치가 복수의 의도군집 중에서 적어도 하나의 키워드집합 각각과 입력키워드정보에 포함된 키워드집합 간의 포함 관계가 성립하지 않는 의도군집을 그 입력키워드정보에 대응되는 것으로 판단할 수 있다.In another embodiment, the rule generation device determines that the intention cluster in which an inclusion relationship between each of at least one keyword set among the plurality of intention clusters and the keyword set included in the input keyword information does not hold corresponds to the input keyword information. You can.

예컨대, 도 7을 참조하면, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'강남구', '후보', '가르쳐줘'}에 대하여, 의도군집#1, 의도군집#2, 각각에 포함된 적어도 하나의 키워드집합과의 포함 관계를 판단할 수 있다.For example, referring to FIG. 7, the rule generating device includes the keyword set {'Gangnam-gu', 'candidate', and 'teach'} included in the input keyword information in the intent cluster # 1 and the intent cluster # 2, respectively. It is possible to determine an inclusion relationship with at least one keyword set.

보다 구체적으로, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'강남구', '후보', '가르쳐줘'}는 의도군집#1의 키워드집합 {'후보', '가르쳐줘'}와 포함 관계가 성립하고, 의도군집#2의 키워드집합 {'양천구', '구청장', '후보', '가르쳐줘'}, {'노원구', '후보', '가르쳐줘'}, {'원주', '시장', '후보', '가르쳐줘'}과 포함 관계가 성립하지 않는 것을 판단할 수 있다. 이때, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'강남구', '후보', '가르쳐줘'}는 의도군집#2에 대응되는 것으로 판단할 수 있다.More specifically, the rule generation device includes the keyword set {'gangnam-gu', 'candidate', and 'teach'} included in the input keyword information with the keyword set {'candidate', 'teach'} of the intention cluster # 1 Establishment of relationship, keyword set of intention cluster # 2 {'Yangcheon-gu', 'Gu Officer', 'candidate', 'Teach me'}, {'Nowon-gu', 'candidate', 'Teach me'}, {'Wonju' , 'Market', 'candidate', 'teach'} and the inclusion relationship can be judged not to be established. At this time, the rule generation device may determine that the keyword set {'Gangnam-gu', 'candidate', and 'Teach'} included in the input keyword information corresponds to the intention cluster # 2.

또 다른 실시예에서는, 규칙 생성 장치가 복수의 의도군집 각각에 포함된 키워드집합에 해당하는 일반-세부 규칙(general-specific rule)을 입력키워드정보에 포함된 키워드집합에 기초하여 갱신할 수 있다.In another embodiment, the rule generation device may update the general-specific rule corresponding to the keyword set included in each of the plurality of intention clusters based on the keyword set included in the input keyword information.

첫번째로, 규칙 생성 장치는 복수의 의도군집 각각에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 입력키워드정보에 포함된 키워드집합의 의도가 소정의 기준에 따라 동일한지 판단할 수 있다.First, the rule generation apparatus may determine whether, in each of the plurality of intention clusters, the intention of each of the at least one keyword set included in the intention cluster and the keyword set included in the input keyword information is the same according to a predetermined criterion.

예컨대, 규칙 생성 장치는, 의도군집에 포함된 키워드집합이 {'양천구', '후보', '좀', '가르쳐줘'}이고, 입력키워드정보에 포함된 키워드집합이 {'양천구', '후보', '가르쳐줘'}라고 가정할 때, 그 2개의 키워드집합의 의도는 모두 “양천구의 후보를 가르쳐달라”는 것으로 동일하다고 판단할 수 있다. 이는, 규칙 생성 장치가 '좀'이라는 키워드에 대하여, 의미있는 사용자의 의도를 포함하고 있지 않다고 판단할 수 있기 때문이다.For example, in the rule generation device, the keyword set included in the intention cluster is {'Yangcheon-gu', 'candidate', 'some', 'Teach'}, and the keyword set included in the input keyword information is {'Yangcheon-gu', ' Assuming that it is a candidate 'and' Teach me '}, the intention of the two keyword sets can be judged to be the same as "Teach Yang Candidate". This is because the rule generation device can determine that the keyword 'some' does not contain a meaningful user's intention.

이때, 규칙 생성 장치는 개념적 포함관계(subsumption)의 추론(reasoning)과 같이 집합적 해석을 통해 의도를 파악할 수 있다. 개념적 포함관계란, 기술형 논리(description logic)의 온톨로지(ontology)의 분류체계(taxonomy)에서 개념의 상하 관계를 의미할 수 있다. 예컨대, 남자 개념: 사람 개념의 하위개념논리추론엔진의 태블러(Tableau) 알고리즘은 수학적 해석을 위해 개념의 정의를 인스턴스의 집합으로 하고 있으며, 개념적 관계 상하관계가 인스턴스의 집합 포함관계에서도 보장될 수 있다.At this time, the rule generation device can grasp the intention through collective analysis such as conceptual reasoning. The conceptual inclusion relationship may mean a vertical relationship of concepts in a taxonomy of ontology of description logic. For example, the man concept: The concept of the human concept sub-concept logic inference engine's Tableau algorithm uses a definition of a concept as a set of instances for mathematical interpretation, and conceptual relationships can be guaranteed even in a set containing relationship of instances. have.

두번째로, 규칙 생성 장치는 그 판단 결과가 동일하면, 그 의도가 동일한 2개의 키워드집합 간의 포함 관계에 기초하여, 선택적으로 의도군집에 포함된 키워드집합을 상기 입력키워드정보에 포함된 키워드집합으로 대체할 수 있다.Second, when the determination result is the same, the rule generation device selectively replaces the keyword set included in the intention cluster with the keyword set included in the input keyword information, based on the inclusion relationship between two keyword sets having the same intention. can do.

예컨대, 규칙 생성 장치는, 의도군집에 포함된 키워드집합 {'양천구', '후보', '좀', '가르쳐줘'}와 입력키워드정보에 포함된 키워드집합 {'양천구', '후보', '가르쳐줘'}을 의도가 동일한 2개의 키워드집합으로 판단할 수 있다. 그리고, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합이 의도군집에 포함된 키워드집합의 부분집합이면, 의도군집에 포함된 키워드집합을 상기 입력키워드정보에 포함된 키워드집합으로 대체할 수 있다.For example, the rule generating device includes keyword sets {'Yangcheon-gu', 'candidate', 'some', 'Teach'} included in the intention cluster, and keyword sets {'Yangcheon-gu', 'candidate' included in the input keyword information, 'Teach'} can be judged as a set of two keywords with the same intention. In addition, if the keyword set included in the input keyword information is a subset of the keyword set included in the intention cluster, the rule generation device may replace the keyword set included in the intention cluster with the keyword set included in the input keyword information.

보다 구체적으로, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'양천구', '후보', '가르쳐줘'}이 의도군집에 포함된 키워드집합 {'양천구', '후보', '좀', '가르쳐줘'}의 부분집합이므로, 의도군집에 포함된 키워드집합을 상기 입력키워드정보에 포함된 키워드집합으로 대체할 수 있다.More specifically, in the rule generation device, the keyword set {'Yangcheon-gu', 'candidate', and 'Teach me' included in the input keyword information is included in the intention cluster {'Yangcheon-gu', 'candidate', 'some' , Since it is a subset of 'Teach'}, the keyword set included in the intention cluster can be replaced with the keyword set included in the input keyword information.

그 결과, 규칙 생성 장치는 동일한 의도를 갖는 키워드집합 중에서, 가장 간결하고 명확한 키워드집합에 대응되는 일반-세부 규칙을 확보할 수 있다. 이는, 도 5를 참조하면, 6~8번째 줄에 관련된 내용을 나타내는 의사코드가 나타나 있다.As a result, the rule generating device can secure the general-detail rule corresponding to the most concise and clear keyword set among keyword sets having the same intention. 5, pseudo codes indicating contents related to lines 6 to 8 are shown.

마지막으로 단계 S130에서는, 규칙 생성 장치가 그 판단 결과에 따라, 입력키워드정보를 이용하여 복수의 의도군집을 포함하는 KB(knowledge base)를 갱신한다.Finally, in step S130, the rule generation device updates the knowledge base (KB) including a plurality of intention clusters using input keyword information according to the determination result.

즉, 규칙 생성 장치는 앞선 단계 S120의 판단 결과에 따라서, 복수의 의도군집을 포함하는 KB를 갱신할 수 있다. That is, the rule generation device may update the KB including a plurality of intention clusters according to the determination result of step S120.

다른 실시예에서는, 규칙 생성 장치가 복수의 의도군집 중 입력키워드정보에 대응되는 의도군집의 존재 여부에 따라, 상이한 방법으로 KB를 갱신할 수 있다.In another embodiment, the rule generation device may update the KB in different ways depending on whether there is an intention cluster corresponding to input keyword information among a plurality of intention clusters.

우선, 규칙 생성 장치는 복수의 의도군집 중 입력키워드정보에 대응되는 의도군집의 존재하면, 입력키워드정보에 포함된 키워드집합을 그 대응되는 의도군집에 추가할 수 있다.First, if the intention cluster corresponding to the input keyword information among the plurality of intention clusters exists, the rule generating apparatus may add a keyword set included in the input keyword information to the corresponding intention cluster.

*즉, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합과 복수의 의도군집 중 어떤 하나의 의도군집에 포함된 적어도 하나의 키워드집합 전부 간의 포함 관계가 성립하지 않는 경우, 그 입력키워드정보에 포함된 키워드집합을 그 어떤 하나의 의도군집에 추가할 수 있다.* That is, the rule generating device is included in the input keyword information when the inclusion relationship between the keyword set included in the input keyword information and at least one keyword set included in any one of the plurality of intention clusters is not established. You can add a keyword set to any one group of intent.

예컨대, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'강남구', '후보', '가르쳐줘'}는 의도군집#1의 키워드집합 {'후보', '가르쳐줘'}와 포함 관계가 성립하고, 의도군집#2의 키워드집합 {'양천구', '구청장', '후보', '가르쳐줘'}, {'노원구', '후보', '가르쳐줘'}, {'원주', '시장', '후보', '가르쳐줘'}와 포함 관계가 성립하지 않는 것을 판단할 수 있다. 이때, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'강남구', '후보', '가르쳐줘'}를 의도군집#2에 대응되는 것으로 판단하여, 의도군집#2에 추가할 수 있다.For example, the rule generation device includes the keyword set {'Gangnam-gu', 'candidate', and 'teach'} included in the input keyword information and the keyword set {'candidate', 'teach'} of the intention cluster # 1 Established, keyword set of intention cluster # 2 {'Yangcheon-gu', 'Gucheonjang', 'candidate', 'Teach me'}, {'Nowon-gu', 'candidate', 'Teach me'}, {'Wonju', ' It can be judged that the inclusion relationship does not hold with the 'market', 'candidate', and 'teach'}. At this time, the rule generation device may determine that the keyword set {'Gangnam-gu', 'candidate', and 'teach'} included in the input keyword information corresponds to the intention cluster # 2, and add it to the intention cluster # 2.

다음으로, 규칙 생성 장치는 복수의 의도군집 중 입력키워드정보에 대응되는 의도군집의 존재하지 않으면, 입력키워드정보에 포함된 키워드집합을 포함하는 새로운 의도군집을 복수의 의도군집을 포함하는 KB에 추가할 수 있다.Next, the rule generating device adds a new intention cluster including the keyword set included in the input keyword information to the KB including the plurality of intention clusters if there is no intention cluster corresponding to the input keyword information among the plurality of intention clusters. can do.

즉, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합과 복수의 의도군집 각각에 포함된 키워드집합 중 하나 간에 포함 관계가 성립하는 경우, 새로운 의도군집을 생성하고 그 입력키워드정보에 포함된 키워드집합을 그 새로운 의도군집에 추가할 수 있다. 또한, 규칙 생성 장치는 그 새로운 의도군집을 KB에 추가할 수 있다. 이때, KB에 포함된 의도군집의 개수가 +1만큼 증가할 수 있다.That is, when the inclusion relationship is established between the keyword set included in the input keyword information and one of the keyword sets included in each of the plurality of intention clusters, the rule generation device generates a new intention cluster and generates the keyword set included in the input keyword information. It can be added to the new intent cluster. In addition, the rule generation device can add the new intention cluster to the KB. At this time, the number of intention clusters included in the KB may increase by +1.

예컨대, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'유아', '물놀이', '상품', '추천해줘'}는 의도군집#1의 키워드집합 {'상품', '추천해줘'}와 포함 관계가 성립하고, 의도군집#2의 키워드집합 {'물놀이', '상품', '추천해줘'}, {'휴가', '상품', '추천해줘'}와도 포함 관계가 성립한다. 이때, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합 {'유아', '물놀이', '상품', '추천해줘'}이 의도군집#1 및 #2와 모두 포함 관계가 성립하므로, 새로운 의도군집을 생성하여 그 새로운 의도군집에 입력키워드정보에 포함된 키워드집합 {'유아', '물놀이', '상품', '추천해줘'}을 추가할 수 있다.For example, in the rule generation device, the keyword set included in the input keyword information {'infant', 'water play', 'product', 'recommend'} is the keyword set of the intention cluster # 1 {'product', 'recommend'} The inclusion relationship is established and the inclusion group # 2 keyword set {'water play', 'product', 'recommend'}, {'vacation', 'product', 'recommend'} also includes. At this time, in the rule generation device, the keyword set {'infant', 'water play', 'product', and 'recommend'} included in the input keyword information includes both intention clusters # 1 and # 2, so new intentions are established. By creating a cluster, a keyword set {'infant', 'water play', 'product', 'recommend'} included in the input keyword information may be added to the new intention cluster.

한편, 규칙 생성 장치는 입력키워드정보에 포함된 키워드집합과 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 간에 어떤 포함 관계도 성립하지 않는 경우에, 입력키워드정보에 포함된 키워드집합을 이용하여 새로운 KB를 생성할 수 있다.On the other hand, when the rule generating device does not establish any inclusion relationship between the keyword set included in the input keyword information and the at least one keyword set included in each of the plurality of intention clusters, the rule generating device uses a new keyword set included in the input keyword information. You can create KB.

예컨대, 규칙 생성 장치는 선거에 입후보한 후보에 대한 정보를 문의하는 내용에 관련된 KB#1이 존재한다고 가정하면, 입력키워드정보가 상품 추천을 요청하는 내용일 때, 입력키워드정보에 포함된 키워드집합과 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 간에 어떤 포함 관계도 성립하지 않을 것이므로, 새로운 KB#2를 생성할 수 있다. 이때, 입력키워드정보에 포함된 키워드집합을 포함하는 의도군집이 새롭게 생성되어 KB#2에 추가될 수 있음은 물론이다.For example, assuming that KB # 1 related to the content of inquiring information about candidates running for the election exists, the rule generating device, when the input keyword information is content requesting product recommendation, and the keyword set included in the input keyword information Since no inclusion relationship will be established between at least one keyword set included in each of the plurality of intention clusters, a new KB # 2 can be generated. In this case, of course, a group of intentions including a keyword set included in the input keyword information may be newly generated and added to KB # 2.

또 다른 실시예에서는, 규칙 생성 장치가 입력키워드정보에 포함된 키워드집합을 이용하여, 다음과 같은 방법으로 복수의 의도군집을 포함하는 KB를 갱신할 수 있다.In another embodiment, the rule generation device may update the KB including a plurality of intention clusters in the following manner using the keyword set included in the input keyword information.

여기서, 규칙 생성 장치는 의도군집에 대응되는 의도와 입력키워드정보에 대응되는 의도가 일치하지 않는 경우를, 모순(contradiction)이 발생한 것으로 볼 수 있다. 또한, 복수의 의도군집 각각은 키워드집합의 포함 관계에 따른 순서로 구성되어 있다고 가정할 수 있다.Here, in the case where the intention corresponding to the intention cluster and the intention corresponding to the input keyword information do not coincide with the rule generation device, it can be considered that a contradiction has occurred. Also, it can be assumed that each of the plurality of intention clusters is configured in the order according to the inclusion relationship of the keyword set.

예컨대, 규칙 생성 장치는 의도군집 R0에서 Ri까지 총 i+1개의 의도군집이 키워드집합의 포함 관계에 따른 순서로 구성되었을 때, j번째 의도군집 Rj(단 j < i)에 포함된 키워드집합 중 하나인 rj이 입력키워드정보에 포함된 키워드집합 ttokens의 부분집합(즉, rj ⊂ ttokens)인 경우를 가정할 수 있다. 이때, 규칙 생성 장치는 j+1번째 의도군집 Rj+1에 포함된 적어도 하나의 키워드집합 rj+1 각각과 ttokens의 포함 관계를 판단할 수 있다. 마찬가지로, 규칙 생성 장치는 순차적으로 Rj+2, Rj+3 등에 대하여 ttokens과의 포함 관계를 판단할 수 있으며, 이는 모든 의도군집에 대하여 포함 관계를 판단하는 과정이 완료되거나 포함 관계가 존재하지 않는 의도군집이 발견될 때까지 계속될 수 있다. 이 내용은, 도 5를 참조하면, 11~12번째 줄에 나타나 있다.For example, the rule generation device is included in the j-th intention cluster R j (however, j <i) when the total i + 1 intention clusters from the intention cluster R 0 to R i are configured in the order according to the inclusion relationship of the keyword set. It may be assumed that r j, which is one of the keyword sets, is a subset (ie, r j s t tokens ) of the keyword set t tokens included in the input keyword information. In this case, the rule generation device may determine the inclusion relationship of each of at least one keyword set r j + 1 included in the j + 1th intention group R j + 1 and t tokens . Similarly, the rule generation device may sequentially determine the inclusion relationship with t tokens for R j + 2 , R j + 3, etc., which completes the process of determining the inclusion relationship for all intention clusters or the inclusion relationship exists. It can continue until an unintended group of intentions is found. This content is shown in lines 11-12, referring to FIG. 5.

이때, 규칙 생성 장치는, 만일 j+1번째 의도군집에 포함된 키워드집합 중 하나인 rj+1이 ttokens을 부분집합으로 하면(즉, ttokens ⊂ rj+1), ttokens이 포함된 새로운 의도군집을 j+1번째 의도군집으로 하고, 기존의 j+1번째 의도군집인 Rj+1를 j+2번째 의도군집 Rj+2로 할 수 있다. 이 내용은, 도 5를 참조하면, 13~14번째 줄에 나타나 있다.At this time, the rule generation device, if r j + 1 , which is one of the keyword sets included in the j + 1th intention cluster, is a subset of t tokens (ie, t tokens ⊂ r j + 1 ), t tokens are included. The new intention cluster can be set as the j + 1th intention cluster, and the existing j + 1th intention cluster R j + 1 can be set as the j + 2th intention cluster R j + 2 . This content is shown in lines 13-14 with reference to FIG. 5.

이와 같이, 본 발명의 일 실시예에 따른 대화 인지를 위한 규칙 생성 방법은 사용자의 대화 의도를 파악하여, 사용자의 대화에 포함된 키워드의 집합을 그 키워드의 집합 간의 포함 관계에 따른 순서로 체계적으로 구성함으로써, 사용자의 대화 의도를 군집 단위로 분리하여 규칙을 자동으로 생성할 수 있는 효과가 있다.As described above, the rule generation method for conversation recognition according to an embodiment of the present invention grasps a user's conversation intention and systematically sets a set of keywords included in the user's conversation in the order according to the inclusion relationship between the set of keywords By configuring, there is an effect that can automatically generate rules by separating the user's intention of conversation into cluster units.

도 2는 본 발명의 일 실시예에 따른 대화 인지를 위한 규칙 생성 장치의 블록도이다.2 is a block diagram of a rule generation device for conversation recognition according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 일 실시예에 따른 대화 인지를 위한 규칙 생성 장치(200)는 전처리부(210), 판단부(220) 및 갱신부(230)를 포함한다.Referring to FIG. 2, the rule generation apparatus 200 for conversation recognition according to an embodiment of the present invention includes a pre-processing unit 210, a determination unit 220, and an update unit 230.

이때, 규칙 생성 장치(310)는 PC, 노트북, 서버컴퓨터, 스마트폰, 태블릿 및 음성인식 인공지능(AI) 스피커 등에 탑재되어 사용자의 대화 인지를 위한 규칙 생성을 위해 사용될 수 있다.At this time, the rule generating device 310 is mounted on a PC, a laptop, a server computer, a smartphone, a tablet, and a voice recognition artificial intelligence (AI) speaker, and may be used to generate rules for recognition of a user's conversation.

전처리부(210)는 사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 집합인 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출한다.The pre-processing unit 210 extracts input keyword information including information about a keyword set, which is a set consisting of at least one keyword, from conversation data including information about a user's conversation.

판단부(220)는 집합 간의 포함 관계에 기초하여, 적어도 하나의 키워드집합으로 구성된 복수의 의도군집 중에서 입력키워드정보에 대응되는 의도군집의 존재 여부를 판단한다.The determination unit 220 determines whether an intention cluster corresponding to input keyword information is present among a plurality of intention clusters composed of at least one keyword set, based on an inclusion relationship between sets.

다른 실시예에서는, 판단부(220)는 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서에 기반하여, 의도군집의 존재 여부를 판단할 수 있다.In another embodiment, the determination unit 220 may determine whether an intention cluster exists based on an order according to an inclusion relationship of at least one keyword set between a plurality of intention clusters.

또 다른 실시예에서는, 판단부(220)는 복수의 의도군집 중에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 입력키워드정보에 포함된 키워드집합 간의 포함 관계가 성립하지 않는 하나의 의도군집을 입력키워드정보에 대응되는 것으로 판단할 수 있다.In another embodiment, the determination unit 220 may include, among a plurality of intention clusters, one intention cluster in which an inclusion relationship between each of the at least one keyword set included in the intention cluster and the keyword set included in the input keyword information is not established. It can be determined to correspond to the input keyword information.

또 다른 실시예에서는, 판단부(220)는 복수의 의도군집 각각에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 입력키워드정보에 포함된 키워드집합의 의도가 소정의 기준에 따라 동일한지 판단하고, 그 판단 결과 동일하면, 의도가 동일한 2개의 키워드집합 간의 포함 관계에 기초하여, 선택적으로 의도군집에 포함된 키워드집합을 입력키워드정보에 포함된 키워드집합으로 대체할 수 있다.In another embodiment, the determination unit 220 determines whether each of the plurality of intention clusters has the same intention of at least one keyword set included in the intention cluster and the keyword set included in the input keyword information according to a predetermined criterion. And, if the result of the determination is the same, based on the inclusion relationship between two keyword sets having the same intention, the keyword set included in the intention group can be selectively replaced with the keyword set included in the input keyword information.

갱신부(230)는 그 판단 결과에 따라, 입력키워드정보를 이용하여 복수의 의도군집을 포함하는 KB(knowledge base)를 갱신한다.The updating unit 230 updates the knowledge base (KB) including a plurality of intention clusters using input keyword information according to the determination result.

다른 실시예에서는, 갱신부(230)는 복수의 의도군집 중 입력키워드정보에 대응되는 의도군집의 존재하면, 입력키워드정보에 포함된 키워드집합을 입력키워드정보에 대응되는 의도군집에 추가하고, 복수의 의도군집 중 입력키워드정보에 대응되는 의도군집의 존재하지 않으면, 입력키워드정보에 포함된 키워드집합을 포함하는 새로운 의도군집을 KB에 추가할 수 있다.In another embodiment, if the intention cluster corresponding to the input keyword information among the plurality of intention clusters exists, the update unit 230 adds the keyword set included in the input keyword information to the intention cluster corresponding to the input keyword information, and the plurality If there is no intention cluster corresponding to the input keyword information among the intention clusters of, a new intention cluster including the keyword set included in the input keyword information may be added to the KB.

도 3은 본 발명의 일 실시예에 따른 규칙 기반의 의도 추론 방법의 흐름도이다.3 is a flowchart of a rule-based intention inference method according to an embodiment of the present invention.

이때, 의도 추론 장치는 적어도 하나의 키워드집합으로 구성된 복수의 의도군집을 포함하는 KB를 이용하여 규칙 기반의 의도 추론을 수행할 수 있다.In this case, the intention inference device may perform rule-based intention inference using a KB including a plurality of intention clusters composed of at least one keyword set.

단계 S310에서는, 의도 추론 장치가 사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출한다.In step S310, the intention inference device extracts input keyword information including information about a keyword set composed of at least one keyword from conversation data including information about a user's conversation.

예컨대, 의도 추론 장치는 의도 추론의 전처리 과정으로서 품사 분석(POS tagging)을 통해, 대화데이터에 포함된 단어 중에서 키워드로서 큰 역할을 담당하지 않는 감탄사, 문장부호, 조사, 부사 등의 불필요한 특정 품사를 제거하여 키워드집합을 추출할 수 있다. 또한, 한국어가 아닌 외국어로 수행되는 대화인 경우에, 의도 추론 장치가 해당 외국어의 특성에 맞도록 품사 분석 등의 분석을 수행하여, 키워드집합을 추출할 수 있음은 물론이다.For example, the intentional reasoning device is a preprocessing process of intentional reasoning, and performs unnecessary part-of-speech such as exclamation, punctuation, investigation, adverb, etc., which do not play a large role as keywords among words included in conversation data through POS tagging. Keyword sets can be extracted by removing them. In addition, in the case of a conversation conducted in a foreign language other than Korean, it is needless to say that the keyword inference can be extracted by performing an analysis such as part-of-speech analysis to match the characteristics of the foreign language.

마지막으로 단계 S320에서는, 의도 추론 장치가 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 중에서 입력키워드정보에 포함된 키워드집합을 부분집합으로 갖는 키워드집합을 결정한다.Finally, in step S320, the intention inference device determines a keyword set having a keyword set included in input keyword information as a subset of at least one keyword set included in each of the plurality of intention clusters.

이때, 의도 추론 장치는 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서의 역순에 기반하여, 키워드집합을 결정할 수 있다.In this case, the intention inference device may determine the keyword set based on the reverse order of the order according to the inclusion relationship of at least one keyword set between the plurality of intention clusters.

한편, 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서의 역순은 의도군집#1에 포함된 어떤 하나의 키워드집합이 의도군집#2에 포함된 어떤 하나의 키워드집합에 포함되는 관계가 존재하고, 의도군집#2에 포함된 어떤 하나의 키워드집합이 의도군집#3에 포함된 어떤 하나의 키워드집합에 포함되는 관계가 존재할 때, 의도군집#3, 의도군집#2, 의도군집#1의 순서를 의미할 수 있다.On the other hand, the reverse order of the order according to the inclusion relationship of at least one keyword set between a plurality of intention clusters is a relationship in which any one keyword set included in intention cluster # 1 is included in any one keyword set included in intention cluster # 2 Exists, and when there is a relationship in which any one keyword set included in intention cluster # 2 is included in any one keyword set included in intent cluster # 3, intent cluster # 3, intent cluster # 2, intent cluster # It can mean the order of 1.

즉, 의도 추론 장치는 복수의 의도군집은 키워드집합의 포함 관계에 따른 순서의 역순에 따라서 가장 많은 키워드를 포함하는 의도군집에서부터 시작하여 가장 적은 키워드를 포함하는 의도군집까지의 순서로, 입력키워드정보에 대응되는 키워드집합과 의도군집에 포함된 적어도 하나의 키워드집합 각각과의 포함 관계를 판단하여, 그 입력키워드정보에 포함된 키워드집합을 부분집합으로 갖는 키워드집합을 결정할 수 있다. 그리고, 그 결정된 키워드집합으로부터 사용자의 의도를 추론할 수 있다.That is, the intention inference device, the plurality of intention clusters, starting from the intention cluster containing the most keywords according to the reverse order of the order according to the inclusion relationship of the keyword set, in order from the intention cluster containing the fewest keywords, input keyword information A keyword set having a keyword set included in the input keyword information may be determined by determining an inclusion relationship between each keyword set corresponding to and at least one keyword set included in the intention group. And, the user's intention can be deduced from the determined keyword set.

다시 말하면, 의도 추론 장치는 입력키워드정보에 포함된 키워드집합의 의도를 보다 정확하게 추론하고 다양한 어휘를 수용하기 위해서, KB에 포함된 복수의 의도군집 중에서 가장 세부적인(specific) 규칙을 포함하는 의도군집에서부터 가장 일반적인(general) 규칙을 포함하는 의도군집의 순서로 추론을 진행할 수 있다.In other words, the intention inference device, in order to more accurately infer the intention of the keyword set included in the input keyword information and accommodate various vocabularies, the intention cluster including the most specific rule among the plurality of intention clusters included in the KB From the inference can proceed in the order of the intent clusters containing the most general rules.

예컨대, 도 5을 참조하면, 의도 추론 장치는 키워드집합의 포함 관계에 따른 순서의 역순(5번째 줄의 reverse_sort 함수 사용)으로, 그 입력키워드정보에 포함된 키워드집합을 부분집합으로 갖는 키워드집합을 결정(6번째 줄)하여, 그 의도를 추론할 수 있다.For example, referring to FIG. 5, the intention inference device may perform a keyword set having a keyword set included in the input keyword information as a subset, in the reverse order (using the reverse_sort function of the fifth line) according to the inclusion relationship of the keyword set. By making a decision (line 6), you can deduce the intention.

보다 구체적으로, 도 8을 참조하면, 의도 추론 장치는 입력키워드정보에 포함된 키워드집합인 {'원주', '후보', '가르쳐줘'}에 대하여 의도군집 #3에서부터, 의도군집 #2, 의도군집 #1의 순서로, 키워드집합의 포함 관계에 따른 순서의 역순으로 동일한 의도를 가지는 의도군집에 관한 추론을 수행할 수 있다. 그리고, 그 결과, 의도 추론 장치는 의도군집#2에 포함된 키워드집합인 {'원주', '시장', '후보', '가르쳐줘'}가 입력키워드정보에 포함된 키워드집합인 {'원주', '후보', '가르쳐줘'}를 부분집합으로 갖고 있으므로, 사용자의 의도에 대응되는 키워드집합으로 결정할 수 있다.More specifically, referring to FIG. 8, the intention inference device starts from intention cluster # 3, intention cluster # 2, for keyword sets {'circumference', 'candidate', and 'teach'} included in the input keyword information. In the order of intention cluster # 1, inference of the intention cluster having the same intention may be performed in the reverse order of the order according to the inclusion relationship of the keyword set. And, as a result, the intention inference device includes the keyword set {'circumference', 'market', 'candidate', and 'teach'}, which is the keyword set included in the intention cluster # 2, which is the keyword set {'circumference' included in the input keyword information. ',' Candidate ',' teach '} as a subset, it can be determined as a keyword set corresponding to the user's intention.

이와 같이, 본 발명의 일 실시예에 따른 규칙 기반의 의도 추론 방법은 사용자의 대화에 관하여, 사용자의 대화 의도에 따라 군집단위로 분리된 규칙을 역순으로 적용하여 그 의도를 추론함으로써, 추론의 완전성 및 건전성을 확보할 수 있는 효과가 있다.As described above, in the rule-based intention inference method according to an embodiment of the present invention, the intention of the rule is inferred by applying rules separated in cluster units in reverse order according to the intention of the user's dialogue, thereby completing the reasoning And it is possible to secure soundness.

도 4는 본 발명의 일 실시예에 따른 규칙 기반의 의도 추론 장치의 블록도이다.4 is a block diagram of a rule-based intention inference device according to an embodiment of the present invention.

도 4를 참조하면 본 발명의 일 실시예에 따른 규칙 기반의 의도 추론 장치(400)는 전처리부(210) 및 결정부(410)를 포함한다.Referring to FIG. 4, the rule-based intention inference apparatus 400 according to an embodiment of the present invention includes a pre-processing unit 210 and a determination unit 410.

이때, 의도 추론 장치(400)는 PC, 노트북, 서버컴퓨터, 스마트폰, 태블릿 및 음성인식 인공지능(AI) 스피커 등에 탑재되어 사용자의 대화 의도를 추론하기 위하여 사용될 수 있다.At this time, the intention inference device 400 is mounted on a PC, a laptop, a server computer, a smart phone, a tablet, and a voice recognition artificial intelligence (AI) speaker, and may be used to infer a user's conversation intention.

전처리부(210)는 사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출한다.The pre-processing unit 210 extracts input keyword information including information about a keyword set composed of at least one keyword from conversation data including information about a user's conversation.

결정부(410)는 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 중에서 입력키워드정보에 포함된 키워드집합을 부분집합으로 갖는 키워드집합을 결정한다.The determining unit 410 determines a keyword set having a keyword set included in input keyword information as a subset of at least one keyword set included in each of the plurality of intention clusters.

이때, 결정부(510)는 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서의 역순에 기반하여, 상기 키워드집합을 결정할 수 있다.In this case, the determination unit 510 may determine the keyword set based on the reverse order of the order according to the inclusion relationship of at least one keyword set between a plurality of intention clusters.

한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.Meanwhile, the above-described embodiments of the present invention can be written in a program executable on a computer, and can be implemented on a general-purpose digital computer that operates the program using a computer-readable recording medium.

상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)를 포함한다.The computer-readable recording medium includes a magnetic storage medium (eg, ROM, floppy disk, hard disk, etc.), an optical reading medium (eg, CD-ROM, DVD, etc.).

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.So far, the present invention has been focused on the preferred embodiments. Those skilled in the art to which the present invention pertains will understand that the present invention can be implemented in a modified form without departing from the essential characteristics of the present invention. Therefore, the disclosed embodiments should be considered in terms of explanation, not limitation. The scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the equivalent range should be interpreted as being included in the present invention.

Claims (5)

대화 인지를 위한 규칙을 생성하고, 상기 규칙을 기반으로 사용자의 의도를 추론하는 장치에 있어서,
사용자의 대화에 관한 정보를 포함하는 대화데이터로부터 적어도 하나의 키워드로 구성된 집합인 키워드집합에 관한 정보를 포함하는 입력키워드정보를 추출하는 전처리부;
집합 간의 포함 관계에 기초하여, 서로 간의 포함 관계가 성립되지 않는 적어도 하나의 키워드 집합을 모아놓은 군집인 복수의 의도군집 중에서 상기 입력키워드정보에 대응되는 의도군집의 존재 여부를 판단하는 판단부;
상기 판단 결과에 따라, 상기 입력키워드정보를 이용하여 상기 복수의 의도군집을 포함하는 KB(knowledge base)를 갱신하는 갱신부;
상기 복수의 의도군집 각각에 포함된 적어도 하나의 키워드집합 중에서 상기 입력키워드정보에 포함된 키워드집합을 포함하는 키워드집합을 결정하는 결정부를 포함하고,
상기 결정부는,
상기 복수의 의도군집 간에 적어도 하나의 키워드집합의 포함 관계에 따른 순서의 역순에 기반하여, 상기 키워드집합을 결정하고,
상기 결정부는 가장 많은 키워드를 포함하는 의도군집에서 가장 적은 키워드를 포함하는 의도군집의 순서로 키워드집합을 결정하는 것을 특징으로 하는
대화 인지를 위한 규칙기반의 사용자 의도 추론 장치.
In the apparatus for generating a rule for conversation recognition, and inferring the user's intention based on the rule,
A pre-processing unit for extracting input keyword information including information about a keyword set which is a set of at least one keyword from conversation data including information about a user's conversation;
A determination unit for determining whether there is an intention cluster corresponding to the input keyword information among a plurality of intention clusters, which is a cluster in which at least one keyword set in which an inclusion relation between each other is not established based on the inclusion relation between the sets;
An updating unit updating a knowledge base (KB) including the plurality of intention clusters using the input keyword information according to the determination result;
And a determining unit for determining a keyword set including a keyword set included in the input keyword information among at least one keyword set included in each of the plurality of intention clusters,
The determining unit,
Determining the keyword set based on a reverse order of the order according to the inclusion relationship of at least one keyword set between the plurality of intention groups,
The determining unit determines a keyword set in the order of intention clusters containing the least keywords from intention clusters containing the most keywords.
A rule-based user intention inference device for dialogue recognition.
제1항에 있어서,
상기 판단부는
상기 복수의 의도군집 간의 적어도 하나의 키워드집합의 포함 관계에 따른 순서에 기반하여, 상기 의도군집의 존재 여부를 판단하는 것을 특징으로 하는 대화 인지를 위한 규칙기반의 사용자 의도 추론 장치.
According to claim 1,
The determination unit
A rule-based user intention inference device for dialogue recognition, characterized in that determining whether or not the intention cluster exists based on an order according to an inclusion relationship of at least one keyword set between the plurality of intention clusters.
제2항에 있어서,
상기 판단부는
상기 복수의 의도군집 중에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 상기 입력키워드정보에 포함된 키워드집합 간의 포함 관계가 성립하지 않는 하나의 의도군집을 상기 입력키워드정보에 대응되는 것으로 판단하는 것을 특징으로 하는 대화 인지를 위한 규칙기반의 사용자 의도 추론 장치.
According to claim 2,
The determination unit
Among the plurality of intention clusters, it is determined that one intention cluster in which an inclusion relationship between each of at least one keyword set included in the intention cluster and the keyword set included in the input keyword information does not hold corresponds to the input keyword information Rule-based user inference inference device for dialogue recognition, characterized in that.
제1항에 있어서,
상기 판단부는
상기 복수의 의도군집 각각에서, 의도군집에 포함된 적어도 하나의 키워드집합 각각과 상기 입력키워드정보에 포함된 키워드집합의 의도가 소정의 기준에 따라 동일한지 판단하고,
상기 판단 결과 동일하면, 상기 의도가 동일한 2개의 키워드집합 간의 포함 관계에 기초하여, 선택적으로 의도군집에 포함된 키워드집합을 상기 입력키워드정보에 포함된 키워드집합으로 대체하는 것을 특징으로 하는 대화 인지를 위한 규칙기반의 사용자 의도 추론 장치.
According to claim 1,
The determination unit
In each of the plurality of intention clusters, it is determined whether the intention of each of the at least one keyword set included in the intention cluster and the keyword set included in the input keyword information is the same according to a predetermined criterion,
If the result of the determination is the same, the dialogue recognition is characterized by replacing the keyword set included in the intention group with the keyword set included in the input keyword information, based on the inclusion relationship between the two keyword sets having the same intention. Rule-based user intention inference device.
제1항에 있어서,
상기 갱신부는
상기 복수의 의도군집 중 상기 입력키워드정보에 대응되는 의도군집의 존재하면, 상기 입력키워드정보에 포함된 키워드집합을 상기 입력키워드정보에 대응되는 의도군집에 추가하고,
상기 복수의 의도군집 중 상기 입력키워드정보에 대응되는 의도군집의 존재하지 않으면, 상기 입력키워드정보에 포함된 키워드집합을 포함하는 새로운 의도군집을 상기 KB에 추가하는 것을 특징으로 하는 대화 인지를 위한 규칙기반의 사용자 의도 추론 장치.
According to claim 1,
The update unit
If there is an intention cluster corresponding to the input keyword information among the plurality of intention clusters, the keyword set included in the input keyword information is added to the intention cluster corresponding to the input keyword information,
If there is no intention cluster corresponding to the input keyword information among the plurality of intention clusters, a rule for dialogue recognition characterized in that a new intention cluster including a keyword set included in the input keyword information is added to the KB. Based user intent inference device.
KR1020200022823A 2020-02-25 2020-02-25 An apparatus for rule-based user inference reasoning for conversation awareness KR102106250B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200022823A KR102106250B1 (en) 2020-02-25 2020-02-25 An apparatus for rule-based user inference reasoning for conversation awareness

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200022823A KR102106250B1 (en) 2020-02-25 2020-02-25 An apparatus for rule-based user inference reasoning for conversation awareness

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020180086115A Division KR102113773B1 (en) 2018-07-24 2018-07-24 Method and apparatus for generating rules for conversation recognition and reasoning based on the rules

Publications (2)

Publication Number Publication Date
KR20200023620A KR20200023620A (en) 2020-03-05
KR102106250B1 true KR102106250B1 (en) 2020-05-06

Family

ID=69803952

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200022823A KR102106250B1 (en) 2020-02-25 2020-02-25 An apparatus for rule-based user inference reasoning for conversation awareness

Country Status (1)

Country Link
KR (1) KR102106250B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102464121B1 (en) 2020-11-24 2022-11-04 경희대학교 산학협력단 Apparatus for providing query answering based on relation between query and response and method there of

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR100896702B1 (en) * 2007-08-16 2009-05-14 한국과학기술원 Apparatus for providing Aspect-based Documents Clustering that raises Reliability and Method therefor
KR100980578B1 (en) * 2008-03-31 2010-09-06 엔에이치엔비즈니스플랫폼 주식회사 System and method for offering search result using registering extended keyword
KR101086996B1 (en) * 2008-10-30 2011-11-29 주식회사 케이티 Apparatus for generating ontology and method thereof
KR102050431B1 (en) * 2012-12-14 2019-12-02 한국전자통신연구원 Driving apparatus of agent system based on natural language processing
KR101638535B1 (en) * 2014-12-02 2016-07-11 세종대학교 산학협력단 Method of detecting issue patten associated with user search word, server performing the same and storage medium storing the same
KR102473155B1 (en) * 2016-01-18 2022-11-30 주식회사 케이티 Method for providing interactive information service and apparatus therefor

Also Published As

Publication number Publication date
KR20200023620A (en) 2020-03-05

Similar Documents

Publication Publication Date Title
Arora et al. Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis
Ferrari et al. Natural language requirements processing: a 4D vision
US20180203847A1 (en) Tone optimization for digital content
US20180309874A1 (en) System and method for a cognitive system plug-in answering subject matter expert questions
Kumar et al. A review on chatbot design and implementation techniques
Han et al. Influence tuning: Demoting spurious correlations via instance attribution and instance-driven updates
Ezen-Can et al. Unsupervised classification of student dialogue acts with query-likelihood clustering
US20240028835A1 (en) Processing natural language arguments and propositions
WO2016087982A1 (en) Persona-based profiles in question answering system
KR102113773B1 (en) Method and apparatus for generating rules for conversation recognition and reasoning based on the rules
CN114065760B (en) Legal text class case retrieval method and system based on pre-training language model
KR102106250B1 (en) An apparatus for rule-based user inference reasoning for conversation awareness
Azad et al. Picking pearl from seabed: Extracting artefacts from noisy issue triaging collaborative conversations for hybrid cloud services
US20230350929A1 (en) Method and system for generating intent responses through virtual agents
US20230081891A1 (en) System and method of managing knowledge for knowledge graphs
Aljanaideh et al. Contextualized Embeddings for Enriching Linguistic Analyses on Politeness
CN114398905A (en) Crowd-sourcing-oriented problem and solution automatic extraction method, corresponding storage medium and electronic device
CN114911922A (en) Emotion analysis method, emotion analysis device and storage medium
KR20200023618A (en) An apparatus for generating rules for conversation recognition
KR20200023619A (en) A method for intention reasoning based on the ruless for conversation recognition
KR20200023621A (en) An method for rule-based user inference reasoning for conversation awareness
KR20200023342A (en) An apparatus for intention reasoning based on the ruless for conversation recognition
Chandra et al. An Enhanced Deep Learning Model for Duplicate Question Detection on Quora Question pairs using Siamese LSTM
Le et al. CRYPTEXT: Database and Interactive Toolkit of Human-Written Text Perturbations in the Wild
Masumura et al. Large-context conversational representation learning: Self-supervised learning for conversational documents

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right