KR20070102267A

KR20070102267A - 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법

Info

Publication number: KR20070102267A
Application number: KR1020060034187A
Authority: KR
Inventors: 이청재; 정상근; 이근배
Original assignee: 학교법인 포항공과대학교; 포항공과대학교 산학협력단
Priority date: 2006-04-14
Filing date: 2006-04-14
Publication date: 2007-10-18
Also published as: KR100772660B1

Abstract

본 발명은 사람과 인공 에이전트 간의 대화 관리 장치 및 그를 만들기 위한 대화 예제 데이터베이스 구축을 통한 대화 모델링기법을 이용한 대화 관리 방법을 제시한다. 대화 예제 기반의 대화 모델은 도메인 확장성을 높이고 구축하기 쉬운 대화 관리 장치를 만드는데 목적이 있다. 대화 관리 장치는 음성 및 텍스트를 입력받는 입력부, 입력된 문자열 신호에서 의미 프레임을 추출하는 언어 이해부, 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부, 사용자 발화의 도메인을 결정하는 도메인 결정부, 대화 코퍼스(corpus)로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부, 및 대화 예제를 이용하여 장치 발화를 생성하는 응답생성부 등을 구비한다.

음성 대화 장치, 대화 관리 기법, 대화예제 기반의 대화 모델, 대화예제 데이터베이스, 발화 유사성

Description

대화 관리 장치 및 그를 위한 대화 예제 기반의 대화 모델링기법을 통한 대화 관리 방법{Dialog management system, and method of managing dialog using example-based dialog modeling technique}

도 1은 본 발명에 따른 대화 관리 장치의 전반적인 구조를 나타낸 블록도.

도 2는 본 발명에 적용되는 대화예제 기반의 대화 모델링을 위한 세부 구성을 나타낸 블록도.

도 3은 본 발명에 적용되는 대화 코퍼스(dialog corpus)로부터 대화 예제 데이터베이스를 자동 구축하는 구조를 나타낸 블록도.

본 발명은 음성 또는 문자 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 관한 것으로, 보다 상세하게는 대화 코퍼스로부터 추출된 대화 예제를 이용하여 장치 응답을 예측하여 발화할 수 있도록 하는 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 관한 것이다.

음성 또는 문자 대화 관리 장치는 로봇이나 웹 소프트웨어 등 다양한 에이전트에 사용이 되며 사용자와 대화를 통해 필요한 콘텐츠에 접속을 하여 정보를 얻는 장치를 이야기한다. 이러한 기술은 유비쿼터스 시대의 도래로 단말기, 자동차, 인터넷, 로봇 등에 이용 범위가 확장되고 있으며 차세대 지능형 인터페이스로 중요성이 증대되고 있다.

이러한 대화 관리 장치에 대한 종래 기술을 살펴보면, 선행특허인 대한민국 특허공개번호 제10-2004-0050928호(2004. 6. 18)를 들 수 있다. 상기 특허에는 에이전트와 사용자 간의 대화 관리 장치를 개발하기 위한 방법으로 사용자의 음성 정보, 표정 정보 및 시간 지연 정보와 같은 멀티 모달 정보를 이용하여 사용자와 에이전트 간의 대화 순서를 관리하기 위한 방법 및 장치를 제공하고 있다. 그러나, 이 경우에 장치 응답문을 선택하기 위한 대화모델 데이터베이스는 화행에 기반하여 대화가 진행될 수 있는 상황을 미리 표현하여 저장해 둔 것이다. 그러나 이것은 패턴과 규칙을 기반으로 하고 있어 학습을 하기 힘들고 대상 도메인이 한정되어 있으므로 도메인 확장이 용이하지 못한 문제점이 있다.

따라서 본 발명자는 상기한 종래 기술의 제반 문제점을 해결하기 위하여 대화 예제 기반의 대화 모델 방법론을 제안한다.

본 발명이 이루고자 하는 기술적 과제는 상용화를 위한 대화 관리 장치, 및 그를 위한 대화예제 기반의 대화 모델링기법을 통한 대화 관리 방법으로 간단하면서도 도메인에 무관하게 적용할 수 있으며 장치 응답성의 정확성을 높인 기술이다.

상기 기술적 과제를 달성하기 위한 본 발명에 따른 사람과 인공 에이전트 간의 대화 관리 장치는 음성 및 텍스트를 입력받는 입력부; 입력된 문자열 신호에서 의미 프레임을 추출하는 언어 이해부; 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부; 사용자 발화의 도메인을 결정하는 도메인 결정부; 대화 코퍼스(corpus)로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부; 및 대화 예제를 이용하여 장치 발화를 생성하는 응답생성부를 포함한다.

바람직하기로는 상기 입력부로부터 받은 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값을 계산하여 키워드 정보를 추출하는 키워드추출부를 더 포함하고, 이때 상기 에이전트 결정부는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 한다.

바람직하기로는 상기 에이전트 결정부와 상기 도메인 결정부에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가를 더 포함하여, 상기 대화예제 선택부가 상기 대화 예제 데이터 베이스를 이용하여 대화 예제를 선택하도록 함을 특징으로 한다.

본 발명의 다른 형태에 의하면, 사람과 인공 에이전트 간의 대화 관리 방법에 있어서, (a) 사용자 발화를 입력받아 채팅과 목적 지향 대화를 동시에 처리할 수 있도록 하기 위하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정하고, 그런 다음 다양한 도메인을 처리하기 위해 현재 입력된 발화의 도메인을 결정하는 에이전트/도메인 결정 단계; (b) 대화 코퍼스로부터 대화 예제 데이터베이스를 구축하는 단계; (c) 상기 대화 예제 데이터베이스의 대화 예제를 바탕으로 대화 모델링을 하는 단계; 및 (d) 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되는 발화의 유사성을 측정하여, 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 단계를 포함하는 대화 관리 방법을 제공한다.

바람직하기로는 상기 (a) 에이전트/도메인 결정 단계는 (a1) 사용자의 발화가 채팅인지 목적 지향 대화인지 판별하기 위해 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 이용하는 단계; (a2) 용어빈도수*역원고빈도수(TF*IDF) 모델(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 이용한 결과와 다양한 언어 자질과 의미 자질을 동시에 이용한 확률모델을 기반으로 대화 도메인을 결정하는 단계; 및 (a3) 사용자의 발화의 화행 정보, 행위 정보 등을 계층적으로 분석을 하여 목적 지향 대화와 채팅을 동시에 처리를 할 수 있도록 하는 단계를 포함한다.

바람직하기로는 상기 (b) 대화 예제 데이터베이스 구축단계는 (b1) 대화 코퍼스로부터 화행 정보, 행위 정보, 대화 이력 정보를 이용하여 색인 테이블을 생성하는 단계; (b2) 대화 코퍼스로부터 대화 예제를 자동으로 추출하기 위해 대화 코퍼스를 XML 형태의 구조화된 코퍼스로 만드는 단계; 및 (b3) 추출된 대화 예제를 (b1)의 색인 정보로 데이터베이스에 자동으로 추가하여 대화예제 데이터베이스를 구축하는 단계를 포함한다.

바람직하기로는 상기 (c) 대화 모델링 단계는 (c1) 상기 대화 모델링을 위한 방법으로 현재 대화 상황과 가장 비슷한 대화 예제를 대화 예제 데이터베이스에서 찾아서 장치 발화를 결정하는 단계; (c2) 상기 대화 예제 데이터베이스 검색을 위해 대화 이력 정보와 언어 이해부에서 추출된 화행 정보, 행위 정보, 발화한 구성성분 정보를 이용하는 단계; (c3) 상기 대화 예제 데이터베이스로부터 검색된 결과 중에서 가장 적합한 대화 예제를 선택하기 위해 발화 유사성을 계산하여 결정하는 단계; (c4) 대화 예제가 없는 경우에 도메인에 맞게 미리 정의된 조건-작용 규칙을 이용하여 장치 발화를 결정하는 단계; 및 (c5) 도메인 데이터베이스에서 검색된 결과가 없는 경우에는 검색 조건을 완화하여 다시 도메인 데이터베이스를 검색하여 사용자가 원하는 정보가 없는 경우에는 비슷한 대안 정보를 제공하는 단계를 포함한다.

바람직하기로는 상기 (d) 단계에서의 발화의 유사성을 대화 이력 정보의 유사성과 두 발화의 의미-언어 유사성을 고려하여 측정하는 방법에서, (d1) 대화 이력 정보는 현재 대화 상태까지 채워진 구성 성분 정도에 대한 이진 벡터로 코사인 계수(Cosine Measure)를 이용하여 유사성을 측정하고, (d2) 의미-언어 유사성은 사용자 발화의 형태소 분석된 결과에 현재 발화에서 추출된 구성성분의 이름을 치환하여 발화간의 편집 거리(Edit Distance) 등의 두 문장 간의 유사성을 이용하여 측정한다.

바람직하기로는 상기 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고 에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 단계를 더 포함하고, 이때 상기 에이전트/도메인 결정단계는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 한다.

바람직하기로는 상기 에이전트/도메인 결정단계에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가 단계를 더 포함함을 특징으로 한다.

상술한 바와 같이, 본 발명의 사람과 인공 에이전트 간의 대화 관리 장치 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법은 대화 코퍼스로부터 대화 예제 데이터베이스를 자동 구축하고 사용자의 발화에서 추출된 대화 정보와 현재까지 대화 이력 정보를 이용하여 현재 대화 상황에 가장 유사한 대화 예제를 찾아서 그때의 장치 발화를 현재 도메인에 맞게 생성을 하도록 하는 것이다. 이러한 기술들은 대화 코퍼스를 바탕으로 학습을 할 수 있으며 도메인에 상관없이 적용할 수 있는 장점이 있어 대화 관리 장치를 개발하기 위한 유용하고 편리한 방법으로 사용될 수 있다.

이어서, 첨부된 도면을 참조하여 본 발명의 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 대하여 설명을 한다.

도 1은 본 발명에 따른 음성 및 문자 대화 관리 장치의 전반적인 구성을 나타내는 블록도이다. 도 1에서 보면 음성입력(111)이나 키보드입력(112)에서 사용자 의 음성 또는 문자의 발화 입력이 이루어지면 입력부(113)에서는 음성 인식이나 형태소 분석 등의 기본적인 자연어 처리 과정을 거치게 된다.

입력부(113)는 대화관리부(114)에 문자열 정보와 형태소 분석 결과 등을 입력한다. 그러면, 대화관리부(114)의 언어이해부(115)는 입력부(113)로부터 받은 문자열 정보와 형태소 분석 결과 등을 이용하여 대화 관리를 위하여 필요한 의미 정보를 분석하고, 이와 동시에, 키워드추출부(116)에서는 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값을 계산하여 키워드 정보를 추출한다. 여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.

본 발명에 의한 대화관리장치는 채팅과 목적 지향의 대화를 동시에 처리할 수 있도록 하기 위해 에이전트 결정부(117)를 이용하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정한다. 그런 다음, 다양한 도메인을 처리하기 위해 도메인 결정부(118)에서 현재 입력된 발화의 도메인을 결정하게 된다. 이러한 에이전트와 도메인의 결정은 코퍼스로부터 추출된 키워드 자질과 언어 분석, 의미 분석 자질 등을 이용하여 학습된 확률모델에 기반을 한다.

에이전트 결정부(117)와 도메인 결정부(118)에서 분류된 결과에 따라 대화 전문가(119)에게 현재까지 분석된 결과를 넘겨서 대화를 제어하도록 한다. 대화 전문가(119)는 현재 상황에 적절한 장치 발화를 선택하기 위해 대화예제 데이터베이 스(DB)(121)를 이용한다. 대화예제 DB(121)는 현재 대화 상황을 바탕으로 색인을 한다 (도 3 참조). 여기서, 대화 상황이란 현재 화행 정보와 행위 정보로 이루어진 사용자의 의도와 사용자가 제공한 의미 프레임의 구성 성분 정보, 그리고 대화 이력을 바탕으로 한다. 여기서 대화 이력은 현재까지 채워진 의미 프레임의 구성성분 유무를 이용한다. 이때, 대화예제선택부(120)에서는 검색된 대화 예제들 중에서 현재 대화 상황과 가장 비슷한 대화 예제를 선택하게 된다.

응답생성부(122)는 각 대화 전문가에 해당하는 적절한 장치 응답의 템플릿을 바탕으로 장치 발화를 텍스트로 만들고 음성합성기(123)에서 텍스트를 음성으로 합성을 하여 음성출력(124)을 사용자에게 들려주게 된다.

도 2는 대화예제 기반의 대화 모델링의 세부적인 구성도이다. 도메인 결정부(118)에서 결정된 도메인에 따라 대화 전문가(211)에서는 지식 데이터베이스(DB) 검색부(212)를 이용하여 도메인 지식 DB(213)로부터 사용자가 필요로 하는 정보를 검색하여 가져온다. 그리고 대화예제선택부(214)에서는 현재 대화 상황 정보(216)를 바탕으로 대화예제 DB(215)로부터 가장 적절한 대화예제를 선택하게 된다. 대화 상황 정보(216)는 형태소 분석 정보, 발화 의미 분석 정보 및 대화 입력 정보 등으로 구성된다. 이때, 검색된 대화예제 집합에서 가장 적절한 대화 예제를 선택하기 위해 대화예제선택부(214)에서는 발화 유사성을 이용한다. 발화 유사성은 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되며 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 방법이다.

응답생성부(217)는 상기 대화예제선택부(214)에서 선택된 대화 예제를 바탕 으로 장치 발화 템플릿을 이용하여 장치 발화를 생성할 때, 대화 예제를 찾을 수 없는 경우에는 대화 상황 기반 규칙(218)을 이용하여 장치 발화(219)를 생성하게 된다.

도 3은 대화예제 코퍼스(311)로부터 대화예제 데이터베이스(315)를 자동으로 구축하는 방법에 대한 블록도이다. 대화예제 자동추출기(312)에서는 대화예제 코퍼스(311)로부터 각각의 대화예제를 자동으로 추출하여 저장을 한다. 이때, 대화예제 코퍼스(311)는 파싱을 하기 쉽도록 XML 형태로 되어 있다. 그리고 색인테이블 생성부(313)에서는 파싱된 결과를 가지고 화행 정보, 행위 정보, 구성성분 정보, 대화 이력 정보를 이용하여 색인테이블을 만든다. 이것은 대화예제 데이터베이스(315)를 사용자 발화의 의미 정보와 대화 이력 정보를 이용하여 색인하여 구축하는 방법이다. 색인테이블을 만든 후에 대화예제 데이터베이스 생성기(314)에서는 현재 대화 패턴에 해당하는 색인 정보들을 찾아서 장치 행위 정보를 포함한 레코드를 데이터베이스에 저장하여 대화예제 데이터베이스(315)를 자동으로 구축하게 된다.

상술한 바와 같이 본 발명에 의하면, 음성대화장치 및 그를 구축하는데 있어서 대화 모델을 위한 방법으로 대화 예제 데이터베이스를 이용하는 것은 대화 코퍼스로부터 자동으로 대화 모델을 학습하여 대화 규칙을 만드는 비용을 절감하고 도메인에 무관하게 적용할 수 있으므로 확장성을 높일 수 있다. 또한, 채팅과 목적 지향 대화를 동시에 처리할 수 있는 확률 방법론을 제시함으로써 사용자의 대화를 다양하고 자연스럽게 처리를 할 수 있다.

본 발명에 속하는 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허 청구 범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims

사람과 인공 에이전트 간의 대화 관리 장치에 있어서,

음성 또는 텍스트의 사용자 발화를 입력받는 입력부;

상기 입력부로부터 입력된 문자열 신호에서 문자열 정보와 형태소 분석 결과를 이용하여 상기 사용자 발화의 의미 프레임을 추출하는 언어 이해부;

대화 코퍼스(corpus)로부터 추출된 키워드 자질과 언어 분석, 의미 분석 자질을 이용하여 학습된 확률모델에 기반하여, 상기 사용자 발화의 의미 프레임을 분석하여 상기 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부;

사용자 발화의 도메인을 결정하는 도메인 결정부;

대화 코퍼스로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부; 및

대화 예제를 이용하여 장치 발화를 생성하는 응답생성부를 포함하는 대화 관리 장치.
제1항에 있어서, 상기 입력부로부터 받은 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미 하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 키워드추출부를 더 포함하고, 이때 상기 에이전트 결정부는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 하는 대화 관리 장치.
제1항 또는 제2항에 있어서, 상기 에이전트 결정부와 상기 도메인 결정부에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가를 더 포함하여, 상기 대화예제 선택부가 상기 대화 예제 데이터 베이스를 이용하여 대화 예제를 선택하도록 함을 특징으로 하는 대화 관리 장치.
사람과 인공 에이전트 간의 대화 관리 방법에 있어서,

(a) 사용자 발화를 입력받아 채팅과 목적 지향 대화를 동시에 처리할 수 있도록 하기 위하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정하고, 그런 다음 다양한 도메인을 처리하기 위해 현재 입력된 발화의 도메인을 결정하는 에이전트/도메인 결정 단계;

(b) 대화 코퍼스로부터 대화 예제 데이터베이스를 구축하는 단계;

(c) 상기 대화 예제 데이터베이스의 대화 예제를 바탕으로 대화 모델링을 하는 단계; 및

(d) 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되는 발화의 유사성 을 측정하여, 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 단계를 포함하는 대화 관리 방법.
제4항에 있어서, 상기 (a) 에이전트/도메인 결정 단계는

(a1) 사용자의 발화가 채팅인지 목적 지향 대화인지 판별하기 위해 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 이용하는 단계;

(a2) TF*IDF 모델을 이용한 결과와 다양한 언어 자질과 의미 자질을 동시에 이용한 확률모델을 기반으로 대화 도메인을 결정하는 단계; 및

(a3) 사용자의 발화의 화행 정보, 행위 정보 등을 계층적으로 분석을 하여 목적 지향 대화와 채팅을 동시에 처리를 할 수 있도록 하는 단계를 포함하는 대화 관리 방법.
제4항에 있어서, 상기 (b) 대화 예제 데이터베이스 구축단계는

(b1) 대화 코퍼스로부터 화행 정보, 행위 정보, 대화 이력 정보를 이용하여 색인 테이블을 생성하는 단계;

(b2) 대화 코퍼스로부터 대화 예제를 자동으로 추출하기 위해 대화 코퍼스를 XML 형태의 구조화된 코퍼스로 만드는 단계; 및

(b3) 추출된 대화 예제를 (b1)의 색인 정보로 데이터베이스에 자동으로 추가하여 대화예제 데이터베이스를 구축하는 단계를 포함하는 대화 관리 방법.
제4항에 있어서, 상기 (c) 대화 모델링 단계는

(c1) 상기 대화 모델링을 위한 방법으로 현재 대화 상황과 가장 비슷한 대화 예제를 대화 예제 데이터베이스에서 찾아서 장치 발화를 결정하는 단계;

(c2) 상기 대화 예제 데이터베이스 검색을 위해 대화 이력 정보와 언어 이해부에서 추출된 화행 정보, 행위 정보, 발화한 구성성분 정보를 이용하는 단계;

(c3) 상기 대화 예제 데이터베이스로부터 검색된 결과 중에서 가장 적합한 대화 예제를 선택하기 위해 발화 유사성을 계산하여 결정하는 단계;

(c4) 대화 예제가 없는 경우에 도메인에 맞게 미리 정의된 조건-작용 규칙을 이용하여 장치 발화를 결정하는 단계; 및

(c5) 도메인 데이터베이스에서 검색된 결과가 없는 경우에는 검색 조건을 완화하여 다시 도메인 데이터베이스를 검색하여 사용자가 원하는 정보가 없는 경우에는 비슷한 대안 정보를 제공하는 단계를 포함하는 대화 관리 방법.
제4항에 있어서, 상기 (d) 단계에서의 발화의 유사성을 대화 이력 정보의 유사성과 두 발화의 의미-언어 유사성을 고려하여 측정하는 방법에서,

(d1) 대화 이력 정보는 현재 대화 상태까지 채워진 구성 성분 정도에 대한 이진 벡터로 코사인 계수(Cosine Measure)를 이용하여 유사성을 측정하고,

(d2) 의미-언어 유사성은 사용자 발화의 형태소 분석된 결과에 현재 발화에서 추출된 구성성분의 이름을 치환하여 발화간의 편집 거리(Edit Distance) 등의 두 문장 간의 유사성을 이용하여 측정하는 대화 관리 방법.
제4항 내지 제8항 중의 어느 한 항에 있어서, 상기 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 단계를 더 포함하고, 이때 상기 에이전트/도메인 결정단계는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 하는 대화 관리 방법.
제4항 내지 제8항 중의 어느 한 항에 있어서, 상기 에이전트/도메인 결정단계에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가 단계를 더 포함함을 특징으로 하는 대화 관리 방법.