KR20070102267A - 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 - Google Patents

대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 Download PDF

Info

Publication number
KR20070102267A
KR20070102267A KR1020060034187A KR20060034187A KR20070102267A KR 20070102267 A KR20070102267 A KR 20070102267A KR 1020060034187 A KR1020060034187 A KR 1020060034187A KR 20060034187 A KR20060034187 A KR 20060034187A KR 20070102267 A KR20070102267 A KR 20070102267A
Authority
KR
South Korea
Prior art keywords
conversation
information
domain
speech
user
Prior art date
Application number
KR1020060034187A
Other languages
English (en)
Other versions
KR100772660B1 (ko
Inventor
이청재
정상근
이근배
Original Assignee
학교법인 포항공과대학교
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 학교법인 포항공과대학교, 포항공과대학교 산학협력단 filed Critical 학교법인 포항공과대학교
Priority to KR1020060034187A priority Critical patent/KR100772660B1/ko
Publication of KR20070102267A publication Critical patent/KR20070102267A/ko
Application granted granted Critical
Publication of KR100772660B1 publication Critical patent/KR100772660B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 사람과 인공 에이전트 간의 대화 관리 장치 및 그를 만들기 위한 대화 예제 데이터베이스 구축을 통한 대화 모델링기법을 이용한 대화 관리 방법을 제시한다. 대화 예제 기반의 대화 모델은 도메인 확장성을 높이고 구축하기 쉬운 대화 관리 장치를 만드는데 목적이 있다. 대화 관리 장치는 음성 및 텍스트를 입력받는 입력부, 입력된 문자열 신호에서 의미 프레임을 추출하는 언어 이해부, 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부, 사용자 발화의 도메인을 결정하는 도메인 결정부, 대화 코퍼스(corpus)로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부, 및 대화 예제를 이용하여 장치 발화를 생성하는 응답생성부 등을 구비한다.
음성 대화 장치, 대화 관리 기법, 대화예제 기반의 대화 모델, 대화예제 데이터베이스, 발화 유사성

Description

대화 관리 장치 및 그를 위한 대화 예제 기반의 대화 모델링기법을 통한 대화 관리 방법{Dialog management system, and method of managing dialog using example-based dialog modeling technique}
도 1은 본 발명에 따른 대화 관리 장치의 전반적인 구조를 나타낸 블록도.
도 2는 본 발명에 적용되는 대화예제 기반의 대화 모델링을 위한 세부 구성을 나타낸 블록도.
도 3은 본 발명에 적용되는 대화 코퍼스(dialog corpus)로부터 대화 예제 데이터베이스를 자동 구축하는 구조를 나타낸 블록도.
본 발명은 음성 또는 문자 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 관한 것으로, 보다 상세하게는 대화 코퍼스로부터 추출된 대화 예제를 이용하여 장치 응답을 예측하여 발화할 수 있도록 하는 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 관한 것이다.
음성 또는 문자 대화 관리 장치는 로봇이나 웹 소프트웨어 등 다양한 에이전트에 사용이 되며 사용자와 대화를 통해 필요한 콘텐츠에 접속을 하여 정보를 얻는 장치를 이야기한다. 이러한 기술은 유비쿼터스 시대의 도래로 단말기, 자동차, 인터넷, 로봇 등에 이용 범위가 확장되고 있으며 차세대 지능형 인터페이스로 중요성이 증대되고 있다.
이러한 대화 관리 장치에 대한 종래 기술을 살펴보면, 선행특허인 대한민국 특허공개번호 제10-2004-0050928호(2004. 6. 18)를 들 수 있다. 상기 특허에는 에이전트와 사용자 간의 대화 관리 장치를 개발하기 위한 방법으로 사용자의 음성 정보, 표정 정보 및 시간 지연 정보와 같은 멀티 모달 정보를 이용하여 사용자와 에이전트 간의 대화 순서를 관리하기 위한 방법 및 장치를 제공하고 있다. 그러나, 이 경우에 장치 응답문을 선택하기 위한 대화모델 데이터베이스는 화행에 기반하여 대화가 진행될 수 있는 상황을 미리 표현하여 저장해 둔 것이다. 그러나 이것은 패턴과 규칙을 기반으로 하고 있어 학습을 하기 힘들고 대상 도메인이 한정되어 있으므로 도메인 확장이 용이하지 못한 문제점이 있다.
따라서 본 발명자는 상기한 종래 기술의 제반 문제점을 해결하기 위하여 대화 예제 기반의 대화 모델 방법론을 제안한다.
본 발명이 이루고자 하는 기술적 과제는 상용화를 위한 대화 관리 장치, 및 그를 위한 대화예제 기반의 대화 모델링기법을 통한 대화 관리 방법으로 간단하면서도 도메인에 무관하게 적용할 수 있으며 장치 응답성의 정확성을 높인 기술이다.
상기 기술적 과제를 달성하기 위한 본 발명에 따른 사람과 인공 에이전트 간의 대화 관리 장치는 음성 및 텍스트를 입력받는 입력부; 입력된 문자열 신호에서 의미 프레임을 추출하는 언어 이해부; 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부; 사용자 발화의 도메인을 결정하는 도메인 결정부; 대화 코퍼스(corpus)로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부; 및 대화 예제를 이용하여 장치 발화를 생성하는 응답생성부를 포함한다.
바람직하기로는 상기 입력부로부터 받은 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값을 계산하여 키워드 정보를 추출하는 키워드추출부를 더 포함하고, 이때 상기 에이전트 결정부는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 한다.
바람직하기로는 상기 에이전트 결정부와 상기 도메인 결정부에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가를 더 포함하여, 상기 대화예제 선택부가 상기 대화 예제 데이터 베이스를 이용하여 대화 예제를 선택하도록 함을 특징으로 한다.
본 발명의 다른 형태에 의하면, 사람과 인공 에이전트 간의 대화 관리 방법에 있어서, (a) 사용자 발화를 입력받아 채팅과 목적 지향 대화를 동시에 처리할 수 있도록 하기 위하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정하고, 그런 다음 다양한 도메인을 처리하기 위해 현재 입력된 발화의 도메인을 결정하는 에이전트/도메인 결정 단계; (b) 대화 코퍼스로부터 대화 예제 데이터베이스를 구축하는 단계; (c) 상기 대화 예제 데이터베이스의 대화 예제를 바탕으로 대화 모델링을 하는 단계; 및 (d) 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되는 발화의 유사성을 측정하여, 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 단계를 포함하는 대화 관리 방법을 제공한다.
바람직하기로는 상기 (a) 에이전트/도메인 결정 단계는 (a1) 사용자의 발화가 채팅인지 목적 지향 대화인지 판별하기 위해 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 이용하는 단계; (a2) 용어빈도수*역원고빈도수(TF*IDF) 모델(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 이용한 결과와 다양한 언어 자질과 의미 자질을 동시에 이용한 확률모델을 기반으로 대화 도메인을 결정하는 단계; 및 (a3) 사용자의 발화의 화행 정보, 행위 정보 등을 계층적으로 분석을 하여 목적 지향 대화와 채팅을 동시에 처리를 할 수 있도록 하는 단계를 포함한다.
바람직하기로는 상기 (b) 대화 예제 데이터베이스 구축단계는 (b1) 대화 코퍼스로부터 화행 정보, 행위 정보, 대화 이력 정보를 이용하여 색인 테이블을 생성하는 단계; (b2) 대화 코퍼스로부터 대화 예제를 자동으로 추출하기 위해 대화 코퍼스를 XML 형태의 구조화된 코퍼스로 만드는 단계; 및 (b3) 추출된 대화 예제를 (b1)의 색인 정보로 데이터베이스에 자동으로 추가하여 대화예제 데이터베이스를 구축하는 단계를 포함한다.
바람직하기로는 상기 (c) 대화 모델링 단계는 (c1) 상기 대화 모델링을 위한 방법으로 현재 대화 상황과 가장 비슷한 대화 예제를 대화 예제 데이터베이스에서 찾아서 장치 발화를 결정하는 단계; (c2) 상기 대화 예제 데이터베이스 검색을 위해 대화 이력 정보와 언어 이해부에서 추출된 화행 정보, 행위 정보, 발화한 구성성분 정보를 이용하는 단계; (c3) 상기 대화 예제 데이터베이스로부터 검색된 결과 중에서 가장 적합한 대화 예제를 선택하기 위해 발화 유사성을 계산하여 결정하는 단계; (c4) 대화 예제가 없는 경우에 도메인에 맞게 미리 정의된 조건-작용 규칙을 이용하여 장치 발화를 결정하는 단계; 및 (c5) 도메인 데이터베이스에서 검색된 결과가 없는 경우에는 검색 조건을 완화하여 다시 도메인 데이터베이스를 검색하여 사용자가 원하는 정보가 없는 경우에는 비슷한 대안 정보를 제공하는 단계를 포함한다.
바람직하기로는 상기 (d) 단계에서의 발화의 유사성을 대화 이력 정보의 유사성과 두 발화의 의미-언어 유사성을 고려하여 측정하는 방법에서, (d1) 대화 이력 정보는 현재 대화 상태까지 채워진 구성 성분 정도에 대한 이진 벡터로 코사인 계수(Cosine Measure)를 이용하여 유사성을 측정하고, (d2) 의미-언어 유사성은 사용자 발화의 형태소 분석된 결과에 현재 발화에서 추출된 구성성분의 이름을 치환하여 발화간의 편집 거리(Edit Distance) 등의 두 문장 간의 유사성을 이용하여 측정한다.
바람직하기로는 상기 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고 에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 단계를 더 포함하고, 이때 상기 에이전트/도메인 결정단계는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 한다.
바람직하기로는 상기 에이전트/도메인 결정단계에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가 단계를 더 포함함을 특징으로 한다.
상술한 바와 같이, 본 발명의 사람과 인공 에이전트 간의 대화 관리 장치 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법은 대화 코퍼스로부터 대화 예제 데이터베이스를 자동 구축하고 사용자의 발화에서 추출된 대화 정보와 현재까지 대화 이력 정보를 이용하여 현재 대화 상황에 가장 유사한 대화 예제를 찾아서 그때의 장치 발화를 현재 도메인에 맞게 생성을 하도록 하는 것이다. 이러한 기술들은 대화 코퍼스를 바탕으로 학습을 할 수 있으며 도메인에 상관없이 적용할 수 있는 장점이 있어 대화 관리 장치를 개발하기 위한 유용하고 편리한 방법으로 사용될 수 있다.
이어서, 첨부된 도면을 참조하여 본 발명의 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 대하여 설명을 한다.
도 1은 본 발명에 따른 음성 및 문자 대화 관리 장치의 전반적인 구성을 나타내는 블록도이다. 도 1에서 보면 음성입력(111)이나 키보드입력(112)에서 사용자 의 음성 또는 문자의 발화 입력이 이루어지면 입력부(113)에서는 음성 인식이나 형태소 분석 등의 기본적인 자연어 처리 과정을 거치게 된다.
입력부(113)는 대화관리부(114)에 문자열 정보와 형태소 분석 결과 등을 입력한다. 그러면, 대화관리부(114)의 언어이해부(115)는 입력부(113)로부터 받은 문자열 정보와 형태소 분석 결과 등을 이용하여 대화 관리를 위하여 필요한 의미 정보를 분석하고, 이와 동시에, 키워드추출부(116)에서는 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값을 계산하여 키워드 정보를 추출한다. 여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.
본 발명에 의한 대화관리장치는 채팅과 목적 지향의 대화를 동시에 처리할 수 있도록 하기 위해 에이전트 결정부(117)를 이용하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정한다. 그런 다음, 다양한 도메인을 처리하기 위해 도메인 결정부(118)에서 현재 입력된 발화의 도메인을 결정하게 된다. 이러한 에이전트와 도메인의 결정은 코퍼스로부터 추출된 키워드 자질과 언어 분석, 의미 분석 자질 등을 이용하여 학습된 확률모델에 기반을 한다.
에이전트 결정부(117)와 도메인 결정부(118)에서 분류된 결과에 따라 대화 전문가(119)에게 현재까지 분석된 결과를 넘겨서 대화를 제어하도록 한다. 대화 전문가(119)는 현재 상황에 적절한 장치 발화를 선택하기 위해 대화예제 데이터베이 스(DB)(121)를 이용한다. 대화예제 DB(121)는 현재 대화 상황을 바탕으로 색인을 한다 (도 3 참조). 여기서, 대화 상황이란 현재 화행 정보와 행위 정보로 이루어진 사용자의 의도와 사용자가 제공한 의미 프레임의 구성 성분 정보, 그리고 대화 이력을 바탕으로 한다. 여기서 대화 이력은 현재까지 채워진 의미 프레임의 구성성분 유무를 이용한다. 이때, 대화예제선택부(120)에서는 검색된 대화 예제들 중에서 현재 대화 상황과 가장 비슷한 대화 예제를 선택하게 된다.
응답생성부(122)는 각 대화 전문가에 해당하는 적절한 장치 응답의 템플릿을 바탕으로 장치 발화를 텍스트로 만들고 음성합성기(123)에서 텍스트를 음성으로 합성을 하여 음성출력(124)을 사용자에게 들려주게 된다.
도 2는 대화예제 기반의 대화 모델링의 세부적인 구성도이다. 도메인 결정부(118)에서 결정된 도메인에 따라 대화 전문가(211)에서는 지식 데이터베이스(DB) 검색부(212)를 이용하여 도메인 지식 DB(213)로부터 사용자가 필요로 하는 정보를 검색하여 가져온다. 그리고 대화예제선택부(214)에서는 현재 대화 상황 정보(216)를 바탕으로 대화예제 DB(215)로부터 가장 적절한 대화예제를 선택하게 된다. 대화 상황 정보(216)는 형태소 분석 정보, 발화 의미 분석 정보 및 대화 입력 정보 등으로 구성된다. 이때, 검색된 대화예제 집합에서 가장 적절한 대화 예제를 선택하기 위해 대화예제선택부(214)에서는 발화 유사성을 이용한다. 발화 유사성은 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되며 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 방법이다.
응답생성부(217)는 상기 대화예제선택부(214)에서 선택된 대화 예제를 바탕 으로 장치 발화 템플릿을 이용하여 장치 발화를 생성할 때, 대화 예제를 찾을 수 없는 경우에는 대화 상황 기반 규칙(218)을 이용하여 장치 발화(219)를 생성하게 된다.
도 3은 대화예제 코퍼스(311)로부터 대화예제 데이터베이스(315)를 자동으로 구축하는 방법에 대한 블록도이다. 대화예제 자동추출기(312)에서는 대화예제 코퍼스(311)로부터 각각의 대화예제를 자동으로 추출하여 저장을 한다. 이때, 대화예제 코퍼스(311)는 파싱을 하기 쉽도록 XML 형태로 되어 있다. 그리고 색인테이블 생성부(313)에서는 파싱된 결과를 가지고 화행 정보, 행위 정보, 구성성분 정보, 대화 이력 정보를 이용하여 색인테이블을 만든다. 이것은 대화예제 데이터베이스(315)를 사용자 발화의 의미 정보와 대화 이력 정보를 이용하여 색인하여 구축하는 방법이다. 색인테이블을 만든 후에 대화예제 데이터베이스 생성기(314)에서는 현재 대화 패턴에 해당하는 색인 정보들을 찾아서 장치 행위 정보를 포함한 레코드를 데이터베이스에 저장하여 대화예제 데이터베이스(315)를 자동으로 구축하게 된다.
상술한 바와 같이 본 발명에 의하면, 음성대화장치 및 그를 구축하는데 있어서 대화 모델을 위한 방법으로 대화 예제 데이터베이스를 이용하는 것은 대화 코퍼스로부터 자동으로 대화 모델을 학습하여 대화 규칙을 만드는 비용을 절감하고 도메인에 무관하게 적용할 수 있으므로 확장성을 높일 수 있다. 또한, 채팅과 목적 지향 대화를 동시에 처리할 수 있는 확률 방법론을 제시함으로써 사용자의 대화를 다양하고 자연스럽게 처리를 할 수 있다.
본 발명에 속하는 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허 청구 범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (10)

  1. 사람과 인공 에이전트 간의 대화 관리 장치에 있어서,
    음성 또는 텍스트의 사용자 발화를 입력받는 입력부;
    상기 입력부로부터 입력된 문자열 신호에서 문자열 정보와 형태소 분석 결과를 이용하여 상기 사용자 발화의 의미 프레임을 추출하는 언어 이해부;
    대화 코퍼스(corpus)로부터 추출된 키워드 자질과 언어 분석, 의미 분석 자질을 이용하여 학습된 확률모델에 기반하여, 상기 사용자 발화의 의미 프레임을 분석하여 상기 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부;
    사용자 발화의 도메인을 결정하는 도메인 결정부;
    대화 코퍼스로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부; 및
    대화 예제를 이용하여 장치 발화를 생성하는 응답생성부를 포함하는 대화 관리 장치.
  2. 제1항에 있어서, 상기 입력부로부터 받은 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미 하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 키워드추출부를 더 포함하고, 이때 상기 에이전트 결정부는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 하는 대화 관리 장치.
  3. 제1항 또는 제2항에 있어서, 상기 에이전트 결정부와 상기 도메인 결정부에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가를 더 포함하여, 상기 대화예제 선택부가 상기 대화 예제 데이터 베이스를 이용하여 대화 예제를 선택하도록 함을 특징으로 하는 대화 관리 장치.
  4. 사람과 인공 에이전트 간의 대화 관리 방법에 있어서,
    (a) 사용자 발화를 입력받아 채팅과 목적 지향 대화를 동시에 처리할 수 있도록 하기 위하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정하고, 그런 다음 다양한 도메인을 처리하기 위해 현재 입력된 발화의 도메인을 결정하는 에이전트/도메인 결정 단계;
    (b) 대화 코퍼스로부터 대화 예제 데이터베이스를 구축하는 단계;
    (c) 상기 대화 예제 데이터베이스의 대화 예제를 바탕으로 대화 모델링을 하는 단계; 및
    (d) 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되는 발화의 유사성 을 측정하여, 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 단계를 포함하는 대화 관리 방법.
  5. 제4항에 있어서, 상기 (a) 에이전트/도메인 결정 단계는
    (a1) 사용자의 발화가 채팅인지 목적 지향 대화인지 판별하기 위해 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 이용하는 단계;
    (a2) TF*IDF 모델을 이용한 결과와 다양한 언어 자질과 의미 자질을 동시에 이용한 확률모델을 기반으로 대화 도메인을 결정하는 단계; 및
    (a3) 사용자의 발화의 화행 정보, 행위 정보 등을 계층적으로 분석을 하여 목적 지향 대화와 채팅을 동시에 처리를 할 수 있도록 하는 단계를 포함하는 대화 관리 방법.
  6. 제4항에 있어서, 상기 (b) 대화 예제 데이터베이스 구축단계는
    (b1) 대화 코퍼스로부터 화행 정보, 행위 정보, 대화 이력 정보를 이용하여 색인 테이블을 생성하는 단계;
    (b2) 대화 코퍼스로부터 대화 예제를 자동으로 추출하기 위해 대화 코퍼스를 XML 형태의 구조화된 코퍼스로 만드는 단계; 및
    (b3) 추출된 대화 예제를 (b1)의 색인 정보로 데이터베이스에 자동으로 추가하여 대화예제 데이터베이스를 구축하는 단계를 포함하는 대화 관리 방법.
  7. 제4항에 있어서, 상기 (c) 대화 모델링 단계는
    (c1) 상기 대화 모델링을 위한 방법으로 현재 대화 상황과 가장 비슷한 대화 예제를 대화 예제 데이터베이스에서 찾아서 장치 발화를 결정하는 단계;
    (c2) 상기 대화 예제 데이터베이스 검색을 위해 대화 이력 정보와 언어 이해부에서 추출된 화행 정보, 행위 정보, 발화한 구성성분 정보를 이용하는 단계;
    (c3) 상기 대화 예제 데이터베이스로부터 검색된 결과 중에서 가장 적합한 대화 예제를 선택하기 위해 발화 유사성을 계산하여 결정하는 단계;
    (c4) 대화 예제가 없는 경우에 도메인에 맞게 미리 정의된 조건-작용 규칙을 이용하여 장치 발화를 결정하는 단계; 및
    (c5) 도메인 데이터베이스에서 검색된 결과가 없는 경우에는 검색 조건을 완화하여 다시 도메인 데이터베이스를 검색하여 사용자가 원하는 정보가 없는 경우에는 비슷한 대안 정보를 제공하는 단계를 포함하는 대화 관리 방법.
  8. 제4항에 있어서, 상기 (d) 단계에서의 발화의 유사성을 대화 이력 정보의 유사성과 두 발화의 의미-언어 유사성을 고려하여 측정하는 방법에서,
    (d1) 대화 이력 정보는 현재 대화 상태까지 채워진 구성 성분 정도에 대한 이진 벡터로 코사인 계수(Cosine Measure)를 이용하여 유사성을 측정하고,
    (d2) 의미-언어 유사성은 사용자 발화의 형태소 분석된 결과에 현재 발화에서 추출된 구성성분의 이름을 치환하여 발화간의 편집 거리(Edit Distance) 등의 두 문장 간의 유사성을 이용하여 측정하는 대화 관리 방법.
  9. 제4항 내지 제8항 중의 어느 한 항에 있어서, 상기 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 단계를 더 포함하고, 이때 상기 에이전트/도메인 결정단계는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 하는 대화 관리 방법.
  10. 제4항 내지 제8항 중의 어느 한 항에 있어서, 상기 에이전트/도메인 결정단계에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가 단계를 더 포함함을 특징으로 하는 대화 관리 방법.
KR1020060034187A 2006-04-14 2006-04-14 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 KR100772660B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060034187A KR100772660B1 (ko) 2006-04-14 2006-04-14 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060034187A KR100772660B1 (ko) 2006-04-14 2006-04-14 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법

Publications (2)

Publication Number Publication Date
KR20070102267A true KR20070102267A (ko) 2007-10-18
KR100772660B1 KR100772660B1 (ko) 2007-11-01

Family

ID=38817307

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060034187A KR100772660B1 (ko) 2006-04-14 2006-04-14 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법

Country Status (1)

Country Link
KR (1) KR100772660B1 (ko)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101117427B1 (ko) * 2009-02-26 2012-03-13 고려대학교 산학협력단 형태소 합성 장치 및 방법
US8370130B2 (en) 2009-09-01 2013-02-05 Electronics And Telecommunications Research Institute Speech understanding system using an example-based semantic representation pattern
WO2014088377A1 (ko) * 2012-12-07 2014-06-12 삼성전자 주식회사 음성 인식 장치 및 그 제어 방법
KR20140074229A (ko) * 2012-12-07 2014-06-17 삼성전자주식회사 음성 인식 장치 및 그 제어 방법
KR20140098525A (ko) * 2013-01-31 2014-08-08 삼성전자주식회사 음성 인식 장치 및 응답 정보 제공 방법
KR101480711B1 (ko) * 2008-09-29 2015-01-09 에스케이플래닛 주식회사 주제 탐지 장치와 주제 탐지 방법, 저장 매체, 정보 제공 시스템, 서비스 서버 및 방법
KR20150075191A (ko) * 2013-12-24 2015-07-03 서강대학교산학협력단 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템
KR20160064576A (ko) * 2014-11-28 2016-06-08 한화테크윈 주식회사 영상 검색 방법 및 장치
CN105845137A (zh) * 2016-03-18 2016-08-10 中国科学院声学研究所 一种语音对话管理系统
KR20180075050A (ko) * 2016-12-26 2018-07-04 현대자동차주식회사 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법
CN108664336A (zh) * 2017-04-01 2018-10-16 北京搜狗科技发展有限公司 推荐方法和装置、用于推荐的装置
KR20190059201A (ko) * 2017-11-22 2019-05-30 서강대학교산학협력단 대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템
WO2019143170A1 (ko) * 2018-01-18 2019-07-25 주식회사 머니브레인 소정의 목표를 갖는 대화 이해 ai 서비스 시스템을 위한 대화 템플릿의 생성 방법 및 컴퓨터 판독가능 기록 매체
KR20190143583A (ko) * 2018-06-21 2019-12-31 주식회사 머니브레인 대화 이해 ai 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계층적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능 기록 매체
CN111897943A (zh) * 2020-08-17 2020-11-06 腾讯科技(深圳)有限公司 会话记录搜索方法、装置、电子设备及存储介质
WO2022071790A1 (en) * 2020-09-30 2022-04-07 Mimos Berhad System and method for text processing
CN114333774A (zh) * 2021-12-15 2022-04-12 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备及存储介质
WO2022139047A1 (ko) * 2020-12-22 2022-06-30 한국과학기술원 대화문에서의 프레임 자동 분석 방법 및 장치
US11449785B2 (en) 2016-02-24 2022-09-20 Line Corporation Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence
KR20230043558A (ko) * 2021-09-24 2023-03-31 한국전자통신연구원 외국어 말하기 학습을 위한 대화 장치 및 그 방법
CN117972075A (zh) * 2024-03-28 2024-05-03 华南理工大学 心智与语言智能体协同的情感对话生成方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101178310B1 (ko) * 2011-02-24 2012-08-29 포항공과대학교 산학협력단 대화 관리 방법 및 이를 실행하는 시스템
KR101410601B1 (ko) * 2013-01-25 2014-06-20 포항공과대학교 산학협력단 유머 발화를 이용하는 음성 대화 시스템 및 그 방법
KR102193559B1 (ko) 2014-02-18 2020-12-22 삼성전자주식회사 대화형 서버 및 이의 제어 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040055417A (ko) * 2002-12-21 2004-06-26 한국전자통신연구원 대화체 연속음성인식 장치 및 방법
KR100522625B1 (ko) * 2003-05-02 2005-10-20 에스케이 텔레콤주식회사 대화형 인터페이스 통신시스템의 서비스 제공방법
KR100590553B1 (ko) * 2004-05-21 2006-06-19 삼성전자주식회사 대화체 운율구조 생성방법 및 장치와 이를 적용한음성합성시스템
US7925506B2 (en) 2004-10-05 2011-04-12 Inago Corporation Speech recognition accuracy via concept to keyword mapping

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101480711B1 (ko) * 2008-09-29 2015-01-09 에스케이플래닛 주식회사 주제 탐지 장치와 주제 탐지 방법, 저장 매체, 정보 제공 시스템, 서비스 서버 및 방법
KR101117427B1 (ko) * 2009-02-26 2012-03-13 고려대학교 산학협력단 형태소 합성 장치 및 방법
US8370130B2 (en) 2009-09-01 2013-02-05 Electronics And Telecommunications Research Institute Speech understanding system using an example-based semantic representation pattern
US9953645B2 (en) 2012-12-07 2018-04-24 Samsung Electronics Co., Ltd. Voice recognition device and method of controlling same
KR20140074229A (ko) * 2012-12-07 2014-06-17 삼성전자주식회사 음성 인식 장치 및 그 제어 방법
WO2014088377A1 (ko) * 2012-12-07 2014-06-12 삼성전자 주식회사 음성 인식 장치 및 그 제어 방법
KR20140098525A (ko) * 2013-01-31 2014-08-08 삼성전자주식회사 음성 인식 장치 및 응답 정보 제공 방법
KR20150075191A (ko) * 2013-12-24 2015-07-03 서강대학교산학협력단 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템
KR20160064576A (ko) * 2014-11-28 2016-06-08 한화테크윈 주식회사 영상 검색 방법 및 장치
US11449785B2 (en) 2016-02-24 2022-09-20 Line Corporation Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence
CN105845137A (zh) * 2016-03-18 2016-08-10 中国科学院声学研究所 一种语音对话管理系统
CN105845137B (zh) * 2016-03-18 2019-08-23 中国科学院声学研究所 一种语音对话管理系统
KR20180075050A (ko) * 2016-12-26 2018-07-04 현대자동차주식회사 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법
CN108664336A (zh) * 2017-04-01 2018-10-16 北京搜狗科技发展有限公司 推荐方法和装置、用于推荐的装置
KR20190059201A (ko) * 2017-11-22 2019-05-30 서강대학교산학협력단 대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템
WO2019143170A1 (ko) * 2018-01-18 2019-07-25 주식회사 머니브레인 소정의 목표를 갖는 대화 이해 ai 서비스 시스템을 위한 대화 템플릿의 생성 방법 및 컴퓨터 판독가능 기록 매체
KR20190143583A (ko) * 2018-06-21 2019-12-31 주식회사 머니브레인 대화 이해 ai 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계층적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능 기록 매체
CN111897943A (zh) * 2020-08-17 2020-11-06 腾讯科技(深圳)有限公司 会话记录搜索方法、装置、电子设备及存储介质
WO2022071790A1 (en) * 2020-09-30 2022-04-07 Mimos Berhad System and method for text processing
WO2022139047A1 (ko) * 2020-12-22 2022-06-30 한국과학기술원 대화문에서의 프레임 자동 분석 방법 및 장치
KR20230043558A (ko) * 2021-09-24 2023-03-31 한국전자통신연구원 외국어 말하기 학습을 위한 대화 장치 및 그 방법
CN114333774A (zh) * 2021-12-15 2022-04-12 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备及存储介质
CN114333774B (zh) * 2021-12-15 2024-02-23 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备及存储介质
CN117972075A (zh) * 2024-03-28 2024-05-03 华南理工大学 心智与语言智能体协同的情感对话生成方法

Also Published As

Publication number Publication date
KR100772660B1 (ko) 2007-11-01

Similar Documents

Publication Publication Date Title
KR100772660B1 (ko) 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법
Liu et al. Unsupervised paraphrasing by simulated annealing
KR102388042B1 (ko) 대화 시스템 및 그것을 위한 컴퓨터 프로그램
EP1349145B1 (en) System and method for providing information using spoken dialogue interface
KR101309042B1 (ko) 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법
KR20190133931A (ko) 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
JP2005084681A (ja) 意味的言語モデル化および信頼性測定のための方法およびシステム
Pichl et al. Alquist: The alexa prize socialbot
KR20210130024A (ko) 대화 시스템 및 그 제어 방법
JP2017125921A (ja) 発話選択装置、方法、及びプログラム
KR102358485B1 (ko) 도메인 자동 분류 대화 시스템
JP2009198614A (ja) 対話装置及びプログラム
WO2020199590A1 (zh) 情绪检测分析方法及相关装置
Dyriv et al. The user's psychological state identification based on Big Data analysis for person's electronic diary
Zhang et al. Coarse-to-fine knowledge selection for document grounded dialogs
KR20180022156A (ko) 대화 관리 장치 및 방법
KR102076250B1 (ko) 인공지능 장치의 자연어 처리를 검증하는 장치 및 방법
CN116978367A (zh) 语音识别方法、装置、电子设备和存储介质
JPH07191687A (ja) 自然言語処理装置及びその方法
Harvey et al. Associating colours with emotions detected in social media tweets
Lhioui et al. Towards a Hybrid Approach to Semantic Analysis of Spontaneous Arabic Speech.
Ning et al. Domain Knowledge Enhanced Error Correction Service for Intelligent Speech Interaction
Dissanayake et al. Enhancing conversational ai model performance and explainability for sinhala-english bilingual speakers
Lendvai et al. Multi-feature error detection in spoken dialogue systems

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121011

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130930

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140930

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee