KR20070102267A - 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 - Google Patents
대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 Download PDFInfo
- Publication number
- KR20070102267A KR20070102267A KR1020060034187A KR20060034187A KR20070102267A KR 20070102267 A KR20070102267 A KR 20070102267A KR 1020060034187 A KR1020060034187 A KR 1020060034187A KR 20060034187 A KR20060034187 A KR 20060034187A KR 20070102267 A KR20070102267 A KR 20070102267A
- Authority
- KR
- South Korea
- Prior art keywords
- conversation
- information
- domain
- speech
- user
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 230000004044 response Effects 0.000 claims abstract description 9
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000003058 natural language processing Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims 1
- 230000002040 relaxant effect Effects 0.000 claims 1
- 238000007726 management method Methods 0.000 description 17
- 230000006399 behavior Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 사람과 인공 에이전트 간의 대화 관리 장치 및 그를 만들기 위한 대화 예제 데이터베이스 구축을 통한 대화 모델링기법을 이용한 대화 관리 방법을 제시한다. 대화 예제 기반의 대화 모델은 도메인 확장성을 높이고 구축하기 쉬운 대화 관리 장치를 만드는데 목적이 있다. 대화 관리 장치는 음성 및 텍스트를 입력받는 입력부, 입력된 문자열 신호에서 의미 프레임을 추출하는 언어 이해부, 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부, 사용자 발화의 도메인을 결정하는 도메인 결정부, 대화 코퍼스(corpus)로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부, 및 대화 예제를 이용하여 장치 발화를 생성하는 응답생성부 등을 구비한다.
음성 대화 장치, 대화 관리 기법, 대화예제 기반의 대화 모델, 대화예제 데이터베이스, 발화 유사성
Description
도 1은 본 발명에 따른 대화 관리 장치의 전반적인 구조를 나타낸 블록도.
도 2는 본 발명에 적용되는 대화예제 기반의 대화 모델링을 위한 세부 구성을 나타낸 블록도.
도 3은 본 발명에 적용되는 대화 코퍼스(dialog corpus)로부터 대화 예제 데이터베이스를 자동 구축하는 구조를 나타낸 블록도.
본 발명은 음성 또는 문자 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 관한 것으로, 보다 상세하게는 대화 코퍼스로부터 추출된 대화 예제를 이용하여 장치 응답을 예측하여 발화할 수 있도록 하는 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 관한 것이다.
음성 또는 문자 대화 관리 장치는 로봇이나 웹 소프트웨어 등 다양한 에이전트에 사용이 되며 사용자와 대화를 통해 필요한 콘텐츠에 접속을 하여 정보를 얻는 장치를 이야기한다. 이러한 기술은 유비쿼터스 시대의 도래로 단말기, 자동차, 인터넷, 로봇 등에 이용 범위가 확장되고 있으며 차세대 지능형 인터페이스로 중요성이 증대되고 있다.
이러한 대화 관리 장치에 대한 종래 기술을 살펴보면, 선행특허인 대한민국 특허공개번호 제10-2004-0050928호(2004. 6. 18)를 들 수 있다. 상기 특허에는 에이전트와 사용자 간의 대화 관리 장치를 개발하기 위한 방법으로 사용자의 음성 정보, 표정 정보 및 시간 지연 정보와 같은 멀티 모달 정보를 이용하여 사용자와 에이전트 간의 대화 순서를 관리하기 위한 방법 및 장치를 제공하고 있다. 그러나, 이 경우에 장치 응답문을 선택하기 위한 대화모델 데이터베이스는 화행에 기반하여 대화가 진행될 수 있는 상황을 미리 표현하여 저장해 둔 것이다. 그러나 이것은 패턴과 규칙을 기반으로 하고 있어 학습을 하기 힘들고 대상 도메인이 한정되어 있으므로 도메인 확장이 용이하지 못한 문제점이 있다.
따라서 본 발명자는 상기한 종래 기술의 제반 문제점을 해결하기 위하여 대화 예제 기반의 대화 모델 방법론을 제안한다.
본 발명이 이루고자 하는 기술적 과제는 상용화를 위한 대화 관리 장치, 및 그를 위한 대화예제 기반의 대화 모델링기법을 통한 대화 관리 방법으로 간단하면서도 도메인에 무관하게 적용할 수 있으며 장치 응답성의 정확성을 높인 기술이다.
상기 기술적 과제를 달성하기 위한 본 발명에 따른 사람과 인공 에이전트 간의 대화 관리 장치는 음성 및 텍스트를 입력받는 입력부; 입력된 문자열 신호에서 의미 프레임을 추출하는 언어 이해부; 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부; 사용자 발화의 도메인을 결정하는 도메인 결정부; 대화 코퍼스(corpus)로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부; 및 대화 예제를 이용하여 장치 발화를 생성하는 응답생성부를 포함한다.
바람직하기로는 상기 입력부로부터 받은 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값을 계산하여 키워드 정보를 추출하는 키워드추출부를 더 포함하고, 이때 상기 에이전트 결정부는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 한다.
바람직하기로는 상기 에이전트 결정부와 상기 도메인 결정부에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가를 더 포함하여, 상기 대화예제 선택부가 상기 대화 예제 데이터 베이스를 이용하여 대화 예제를 선택하도록 함을 특징으로 한다.
본 발명의 다른 형태에 의하면, 사람과 인공 에이전트 간의 대화 관리 방법에 있어서, (a) 사용자 발화를 입력받아 채팅과 목적 지향 대화를 동시에 처리할 수 있도록 하기 위하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정하고, 그런 다음 다양한 도메인을 처리하기 위해 현재 입력된 발화의 도메인을 결정하는 에이전트/도메인 결정 단계; (b) 대화 코퍼스로부터 대화 예제 데이터베이스를 구축하는 단계; (c) 상기 대화 예제 데이터베이스의 대화 예제를 바탕으로 대화 모델링을 하는 단계; 및 (d) 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되는 발화의 유사성을 측정하여, 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 단계를 포함하는 대화 관리 방법을 제공한다.
바람직하기로는 상기 (a) 에이전트/도메인 결정 단계는 (a1) 사용자의 발화가 채팅인지 목적 지향 대화인지 판별하기 위해 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 이용하는 단계; (a2) 용어빈도수*역원고빈도수(TF*IDF) 모델(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 이용한 결과와 다양한 언어 자질과 의미 자질을 동시에 이용한 확률모델을 기반으로 대화 도메인을 결정하는 단계; 및 (a3) 사용자의 발화의 화행 정보, 행위 정보 등을 계층적으로 분석을 하여 목적 지향 대화와 채팅을 동시에 처리를 할 수 있도록 하는 단계를 포함한다.
바람직하기로는 상기 (b) 대화 예제 데이터베이스 구축단계는 (b1) 대화 코퍼스로부터 화행 정보, 행위 정보, 대화 이력 정보를 이용하여 색인 테이블을 생성하는 단계; (b2) 대화 코퍼스로부터 대화 예제를 자동으로 추출하기 위해 대화 코퍼스를 XML 형태의 구조화된 코퍼스로 만드는 단계; 및 (b3) 추출된 대화 예제를 (b1)의 색인 정보로 데이터베이스에 자동으로 추가하여 대화예제 데이터베이스를 구축하는 단계를 포함한다.
바람직하기로는 상기 (c) 대화 모델링 단계는 (c1) 상기 대화 모델링을 위한 방법으로 현재 대화 상황과 가장 비슷한 대화 예제를 대화 예제 데이터베이스에서 찾아서 장치 발화를 결정하는 단계; (c2) 상기 대화 예제 데이터베이스 검색을 위해 대화 이력 정보와 언어 이해부에서 추출된 화행 정보, 행위 정보, 발화한 구성성분 정보를 이용하는 단계; (c3) 상기 대화 예제 데이터베이스로부터 검색된 결과 중에서 가장 적합한 대화 예제를 선택하기 위해 발화 유사성을 계산하여 결정하는 단계; (c4) 대화 예제가 없는 경우에 도메인에 맞게 미리 정의된 조건-작용 규칙을 이용하여 장치 발화를 결정하는 단계; 및 (c5) 도메인 데이터베이스에서 검색된 결과가 없는 경우에는 검색 조건을 완화하여 다시 도메인 데이터베이스를 검색하여 사용자가 원하는 정보가 없는 경우에는 비슷한 대안 정보를 제공하는 단계를 포함한다.
바람직하기로는 상기 (d) 단계에서의 발화의 유사성을 대화 이력 정보의 유사성과 두 발화의 의미-언어 유사성을 고려하여 측정하는 방법에서, (d1) 대화 이력 정보는 현재 대화 상태까지 채워진 구성 성분 정도에 대한 이진 벡터로 코사인 계수(Cosine Measure)를 이용하여 유사성을 측정하고, (d2) 의미-언어 유사성은 사용자 발화의 형태소 분석된 결과에 현재 발화에서 추출된 구성성분의 이름을 치환하여 발화간의 편집 거리(Edit Distance) 등의 두 문장 간의 유사성을 이용하여 측정한다.
바람직하기로는 상기 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고 에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 단계를 더 포함하고, 이때 상기 에이전트/도메인 결정단계는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 한다.
바람직하기로는 상기 에이전트/도메인 결정단계에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가 단계를 더 포함함을 특징으로 한다.
상술한 바와 같이, 본 발명의 사람과 인공 에이전트 간의 대화 관리 장치 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법은 대화 코퍼스로부터 대화 예제 데이터베이스를 자동 구축하고 사용자의 발화에서 추출된 대화 정보와 현재까지 대화 이력 정보를 이용하여 현재 대화 상황에 가장 유사한 대화 예제를 찾아서 그때의 장치 발화를 현재 도메인에 맞게 생성을 하도록 하는 것이다. 이러한 기술들은 대화 코퍼스를 바탕으로 학습을 할 수 있으며 도메인에 상관없이 적용할 수 있는 장점이 있어 대화 관리 장치를 개발하기 위한 유용하고 편리한 방법으로 사용될 수 있다.
이어서, 첨부된 도면을 참조하여 본 발명의 대화 관리 장치, 및 그를 위한 대화 모델링기법을 통한 대화 관리 방법에 대하여 설명을 한다.
도 1은 본 발명에 따른 음성 및 문자 대화 관리 장치의 전반적인 구성을 나타내는 블록도이다. 도 1에서 보면 음성입력(111)이나 키보드입력(112)에서 사용자 의 음성 또는 문자의 발화 입력이 이루어지면 입력부(113)에서는 음성 인식이나 형태소 분석 등의 기본적인 자연어 처리 과정을 거치게 된다.
입력부(113)는 대화관리부(114)에 문자열 정보와 형태소 분석 결과 등을 입력한다. 그러면, 대화관리부(114)의 언어이해부(115)는 입력부(113)로부터 받은 문자열 정보와 형태소 분석 결과 등을 이용하여 대화 관리를 위하여 필요한 의미 정보를 분석하고, 이와 동시에, 키워드추출부(116)에서는 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값을 계산하여 키워드 정보를 추출한다. 여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.
본 발명에 의한 대화관리장치는 채팅과 목적 지향의 대화를 동시에 처리할 수 있도록 하기 위해 에이전트 결정부(117)를 이용하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정한다. 그런 다음, 다양한 도메인을 처리하기 위해 도메인 결정부(118)에서 현재 입력된 발화의 도메인을 결정하게 된다. 이러한 에이전트와 도메인의 결정은 코퍼스로부터 추출된 키워드 자질과 언어 분석, 의미 분석 자질 등을 이용하여 학습된 확률모델에 기반을 한다.
에이전트 결정부(117)와 도메인 결정부(118)에서 분류된 결과에 따라 대화 전문가(119)에게 현재까지 분석된 결과를 넘겨서 대화를 제어하도록 한다. 대화 전문가(119)는 현재 상황에 적절한 장치 발화를 선택하기 위해 대화예제 데이터베이 스(DB)(121)를 이용한다. 대화예제 DB(121)는 현재 대화 상황을 바탕으로 색인을 한다 (도 3 참조). 여기서, 대화 상황이란 현재 화행 정보와 행위 정보로 이루어진 사용자의 의도와 사용자가 제공한 의미 프레임의 구성 성분 정보, 그리고 대화 이력을 바탕으로 한다. 여기서 대화 이력은 현재까지 채워진 의미 프레임의 구성성분 유무를 이용한다. 이때, 대화예제선택부(120)에서는 검색된 대화 예제들 중에서 현재 대화 상황과 가장 비슷한 대화 예제를 선택하게 된다.
응답생성부(122)는 각 대화 전문가에 해당하는 적절한 장치 응답의 템플릿을 바탕으로 장치 발화를 텍스트로 만들고 음성합성기(123)에서 텍스트를 음성으로 합성을 하여 음성출력(124)을 사용자에게 들려주게 된다.
도 2는 대화예제 기반의 대화 모델링의 세부적인 구성도이다. 도메인 결정부(118)에서 결정된 도메인에 따라 대화 전문가(211)에서는 지식 데이터베이스(DB) 검색부(212)를 이용하여 도메인 지식 DB(213)로부터 사용자가 필요로 하는 정보를 검색하여 가져온다. 그리고 대화예제선택부(214)에서는 현재 대화 상황 정보(216)를 바탕으로 대화예제 DB(215)로부터 가장 적절한 대화예제를 선택하게 된다. 대화 상황 정보(216)는 형태소 분석 정보, 발화 의미 분석 정보 및 대화 입력 정보 등으로 구성된다. 이때, 검색된 대화예제 집합에서 가장 적절한 대화 예제를 선택하기 위해 대화예제선택부(214)에서는 발화 유사성을 이용한다. 발화 유사성은 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되며 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 방법이다.
응답생성부(217)는 상기 대화예제선택부(214)에서 선택된 대화 예제를 바탕 으로 장치 발화 템플릿을 이용하여 장치 발화를 생성할 때, 대화 예제를 찾을 수 없는 경우에는 대화 상황 기반 규칙(218)을 이용하여 장치 발화(219)를 생성하게 된다.
도 3은 대화예제 코퍼스(311)로부터 대화예제 데이터베이스(315)를 자동으로 구축하는 방법에 대한 블록도이다. 대화예제 자동추출기(312)에서는 대화예제 코퍼스(311)로부터 각각의 대화예제를 자동으로 추출하여 저장을 한다. 이때, 대화예제 코퍼스(311)는 파싱을 하기 쉽도록 XML 형태로 되어 있다. 그리고 색인테이블 생성부(313)에서는 파싱된 결과를 가지고 화행 정보, 행위 정보, 구성성분 정보, 대화 이력 정보를 이용하여 색인테이블을 만든다. 이것은 대화예제 데이터베이스(315)를 사용자 발화의 의미 정보와 대화 이력 정보를 이용하여 색인하여 구축하는 방법이다. 색인테이블을 만든 후에 대화예제 데이터베이스 생성기(314)에서는 현재 대화 패턴에 해당하는 색인 정보들을 찾아서 장치 행위 정보를 포함한 레코드를 데이터베이스에 저장하여 대화예제 데이터베이스(315)를 자동으로 구축하게 된다.
상술한 바와 같이 본 발명에 의하면, 음성대화장치 및 그를 구축하는데 있어서 대화 모델을 위한 방법으로 대화 예제 데이터베이스를 이용하는 것은 대화 코퍼스로부터 자동으로 대화 모델을 학습하여 대화 규칙을 만드는 비용을 절감하고 도메인에 무관하게 적용할 수 있으므로 확장성을 높일 수 있다. 또한, 채팅과 목적 지향 대화를 동시에 처리할 수 있는 확률 방법론을 제시함으로써 사용자의 대화를 다양하고 자연스럽게 처리를 할 수 있다.
본 발명에 속하는 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허 청구 범위의 기술적 사상에 의해 정해져야 할 것이다.
Claims (10)
- 사람과 인공 에이전트 간의 대화 관리 장치에 있어서,음성 또는 텍스트의 사용자 발화를 입력받는 입력부;상기 입력부로부터 입력된 문자열 신호에서 문자열 정보와 형태소 분석 결과를 이용하여 상기 사용자 발화의 의미 프레임을 추출하는 언어 이해부;대화 코퍼스(corpus)로부터 추출된 키워드 자질과 언어 분석, 의미 분석 자질을 이용하여 학습된 확률모델에 기반하여, 상기 사용자 발화의 의미 프레임을 분석하여 상기 사용자의 발화가 단순한 채팅인지 목적 지향 대화인지를 결정하는 에이전트 결정부;사용자 발화의 도메인을 결정하는 도메인 결정부;대화 코퍼스로부터 대화 예제 데이터 베이스를 구축하고 언어 이해를 거친 의미 프레임 정보와 대화 이력을 가지고 대화 예제를 검색하여 가장 적합한 대화 예제를 선택하는 대화예제 선택부; 및대화 예제를 이용하여 장치 발화를 생성하는 응답생성부를 포함하는 대화 관리 장치.
- 제1항에 있어서, 상기 입력부로부터 받은 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미 하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 키워드추출부를 더 포함하고, 이때 상기 에이전트 결정부는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 하는 대화 관리 장치.
- 제1항 또는 제2항에 있어서, 상기 에이전트 결정부와 상기 도메인 결정부에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가를 더 포함하여, 상기 대화예제 선택부가 상기 대화 예제 데이터 베이스를 이용하여 대화 예제를 선택하도록 함을 특징으로 하는 대화 관리 장치.
- 사람과 인공 에이전트 간의 대화 관리 방법에 있어서,(a) 사용자 발화를 입력받아 채팅과 목적 지향 대화를 동시에 처리할 수 있도록 하기 위하여 현재 사용자의 발화가 특정한 목적이 없는 단순한 채팅인지 혹은 특정 목적을 가지고 있는 대화인지를 판단하여 에이전트를 결정하고, 그런 다음 다양한 도메인을 처리하기 위해 현재 입력된 발화의 도메인을 결정하는 에이전트/도메인 결정 단계;(b) 대화 코퍼스로부터 대화 예제 데이터베이스를 구축하는 단계;(c) 상기 대화 예제 데이터베이스의 대화 예제를 바탕으로 대화 모델링을 하는 단계; 및(d) 대화 이력 정보 유사성과 의미-언어 유사성으로 정의되는 발화의 유사성 을 측정하여, 현재 대화 상황과 현재 사용자의 발화에 가장 가까운 대화 예제를 선택하는 단계를 포함하는 대화 관리 방법.
- 제4항에 있어서, 상기 (a) 에이전트/도메인 결정 단계는(a1) 사용자의 발화가 채팅인지 목적 지향 대화인지 판별하기 위해 자연언어처리를 이용한 언어 자질과 언어 이해를 통한 의미 자질을 이용하는 단계;(a2) TF*IDF 모델을 이용한 결과와 다양한 언어 자질과 의미 자질을 동시에 이용한 확률모델을 기반으로 대화 도메인을 결정하는 단계; 및(a3) 사용자의 발화의 화행 정보, 행위 정보 등을 계층적으로 분석을 하여 목적 지향 대화와 채팅을 동시에 처리를 할 수 있도록 하는 단계를 포함하는 대화 관리 방법.
- 제4항에 있어서, 상기 (b) 대화 예제 데이터베이스 구축단계는(b1) 대화 코퍼스로부터 화행 정보, 행위 정보, 대화 이력 정보를 이용하여 색인 테이블을 생성하는 단계;(b2) 대화 코퍼스로부터 대화 예제를 자동으로 추출하기 위해 대화 코퍼스를 XML 형태의 구조화된 코퍼스로 만드는 단계; 및(b3) 추출된 대화 예제를 (b1)의 색인 정보로 데이터베이스에 자동으로 추가하여 대화예제 데이터베이스를 구축하는 단계를 포함하는 대화 관리 방법.
- 제4항에 있어서, 상기 (c) 대화 모델링 단계는(c1) 상기 대화 모델링을 위한 방법으로 현재 대화 상황과 가장 비슷한 대화 예제를 대화 예제 데이터베이스에서 찾아서 장치 발화를 결정하는 단계;(c2) 상기 대화 예제 데이터베이스 검색을 위해 대화 이력 정보와 언어 이해부에서 추출된 화행 정보, 행위 정보, 발화한 구성성분 정보를 이용하는 단계;(c3) 상기 대화 예제 데이터베이스로부터 검색된 결과 중에서 가장 적합한 대화 예제를 선택하기 위해 발화 유사성을 계산하여 결정하는 단계;(c4) 대화 예제가 없는 경우에 도메인에 맞게 미리 정의된 조건-작용 규칙을 이용하여 장치 발화를 결정하는 단계; 및(c5) 도메인 데이터베이스에서 검색된 결과가 없는 경우에는 검색 조건을 완화하여 다시 도메인 데이터베이스를 검색하여 사용자가 원하는 정보가 없는 경우에는 비슷한 대안 정보를 제공하는 단계를 포함하는 대화 관리 방법.
- 제4항에 있어서, 상기 (d) 단계에서의 발화의 유사성을 대화 이력 정보의 유사성과 두 발화의 의미-언어 유사성을 고려하여 측정하는 방법에서,(d1) 대화 이력 정보는 현재 대화 상태까지 채워진 구성 성분 정도에 대한 이진 벡터로 코사인 계수(Cosine Measure)를 이용하여 유사성을 측정하고,(d2) 의미-언어 유사성은 사용자 발화의 형태소 분석된 결과에 현재 발화에서 추출된 구성성분의 이름을 치환하여 발화간의 편집 거리(Edit Distance) 등의 두 문장 간의 유사성을 이용하여 측정하는 대화 관리 방법.
- 제4항 내지 제8항 중의 어느 한 항에 있어서, 상기 사용자의 발화로부터 키워드를 추출하고 그것에 대한 각 도메인 별의 TF*IDF값(여기서, TF는 용어빈도수(term frequency)를 의미하고, IDF는 역원고빈도수(inverse document frequency)를 의미하여, TF*IDF는 전체 원고에서 용어가 출몰하는 빈도수를 의미한다.)을 계산하여 키워드 정보를 추출하는 단계를 더 포함하고, 이때 상기 에이전트/도메인 결정단계는 상기 사용자 발화의 의미 프레임과 상기 키워드 정보를 분석하여 에이전트를 결정하는 것을 특징으로 하는 대화 관리 방법.
- 제4항 내지 제8항 중의 어느 한 항에 있어서, 상기 에이전트/도메인 결정단계에서 분류된 결과에 따라 현재까지 분석된 결과를 토대로 대화를 제어하는 대화 전문가 단계를 더 포함함을 특징으로 하는 대화 관리 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060034187A KR100772660B1 (ko) | 2006-04-14 | 2006-04-14 | 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060034187A KR100772660B1 (ko) | 2006-04-14 | 2006-04-14 | 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070102267A true KR20070102267A (ko) | 2007-10-18 |
KR100772660B1 KR100772660B1 (ko) | 2007-11-01 |
Family
ID=38817307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060034187A KR100772660B1 (ko) | 2006-04-14 | 2006-04-14 | 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100772660B1 (ko) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101117427B1 (ko) * | 2009-02-26 | 2012-03-13 | 고려대학교 산학협력단 | 형태소 합성 장치 및 방법 |
US8370130B2 (en) | 2009-09-01 | 2013-02-05 | Electronics And Telecommunications Research Institute | Speech understanding system using an example-based semantic representation pattern |
WO2014088377A1 (ko) * | 2012-12-07 | 2014-06-12 | 삼성전자 주식회사 | 음성 인식 장치 및 그 제어 방법 |
KR20140074229A (ko) * | 2012-12-07 | 2014-06-17 | 삼성전자주식회사 | 음성 인식 장치 및 그 제어 방법 |
KR20140098525A (ko) * | 2013-01-31 | 2014-08-08 | 삼성전자주식회사 | 음성 인식 장치 및 응답 정보 제공 방법 |
KR101480711B1 (ko) * | 2008-09-29 | 2015-01-09 | 에스케이플래닛 주식회사 | 주제 탐지 장치와 주제 탐지 방법, 저장 매체, 정보 제공 시스템, 서비스 서버 및 방법 |
KR20150075191A (ko) * | 2013-12-24 | 2015-07-03 | 서강대학교산학협력단 | 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 |
KR20160064576A (ko) * | 2014-11-28 | 2016-06-08 | 한화테크윈 주식회사 | 영상 검색 방법 및 장치 |
CN105845137A (zh) * | 2016-03-18 | 2016-08-10 | 中国科学院声学研究所 | 一种语音对话管理系统 |
KR20180075050A (ko) * | 2016-12-26 | 2018-07-04 | 현대자동차주식회사 | 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법 |
CN108664336A (zh) * | 2017-04-01 | 2018-10-16 | 北京搜狗科技发展有限公司 | 推荐方法和装置、用于推荐的装置 |
KR20190059201A (ko) * | 2017-11-22 | 2019-05-30 | 서강대학교산학협력단 | 대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템 |
WO2019143170A1 (ko) * | 2018-01-18 | 2019-07-25 | 주식회사 머니브레인 | 소정의 목표를 갖는 대화 이해 ai 서비스 시스템을 위한 대화 템플릿의 생성 방법 및 컴퓨터 판독가능 기록 매체 |
KR20190143583A (ko) * | 2018-06-21 | 2019-12-31 | 주식회사 머니브레인 | 대화 이해 ai 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계층적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능 기록 매체 |
CN111897943A (zh) * | 2020-08-17 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 会话记录搜索方法、装置、电子设备及存储介质 |
WO2022071790A1 (en) * | 2020-09-30 | 2022-04-07 | Mimos Berhad | System and method for text processing |
CN114333774A (zh) * | 2021-12-15 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
WO2022139047A1 (ko) * | 2020-12-22 | 2022-06-30 | 한국과학기술원 | 대화문에서의 프레임 자동 분석 방법 및 장치 |
US11449785B2 (en) | 2016-02-24 | 2022-09-20 | Line Corporation | Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence |
KR20230043558A (ko) * | 2021-09-24 | 2023-03-31 | 한국전자통신연구원 | 외국어 말하기 학습을 위한 대화 장치 및 그 방법 |
CN117972075A (zh) * | 2024-03-28 | 2024-05-03 | 华南理工大学 | 心智与语言智能体协同的情感对话生成方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101178310B1 (ko) * | 2011-02-24 | 2012-08-29 | 포항공과대학교 산학협력단 | 대화 관리 방법 및 이를 실행하는 시스템 |
KR101410601B1 (ko) * | 2013-01-25 | 2014-06-20 | 포항공과대학교 산학협력단 | 유머 발화를 이용하는 음성 대화 시스템 및 그 방법 |
KR102193559B1 (ko) | 2014-02-18 | 2020-12-22 | 삼성전자주식회사 | 대화형 서버 및 이의 제어 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040055417A (ko) * | 2002-12-21 | 2004-06-26 | 한국전자통신연구원 | 대화체 연속음성인식 장치 및 방법 |
KR100522625B1 (ko) * | 2003-05-02 | 2005-10-20 | 에스케이 텔레콤주식회사 | 대화형 인터페이스 통신시스템의 서비스 제공방법 |
KR100590553B1 (ko) * | 2004-05-21 | 2006-06-19 | 삼성전자주식회사 | 대화체 운율구조 생성방법 및 장치와 이를 적용한음성합성시스템 |
US7925506B2 (en) | 2004-10-05 | 2011-04-12 | Inago Corporation | Speech recognition accuracy via concept to keyword mapping |
-
2006
- 2006-04-14 KR KR1020060034187A patent/KR100772660B1/ko not_active IP Right Cessation
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101480711B1 (ko) * | 2008-09-29 | 2015-01-09 | 에스케이플래닛 주식회사 | 주제 탐지 장치와 주제 탐지 방법, 저장 매체, 정보 제공 시스템, 서비스 서버 및 방법 |
KR101117427B1 (ko) * | 2009-02-26 | 2012-03-13 | 고려대학교 산학협력단 | 형태소 합성 장치 및 방법 |
US8370130B2 (en) | 2009-09-01 | 2013-02-05 | Electronics And Telecommunications Research Institute | Speech understanding system using an example-based semantic representation pattern |
US9953645B2 (en) | 2012-12-07 | 2018-04-24 | Samsung Electronics Co., Ltd. | Voice recognition device and method of controlling same |
KR20140074229A (ko) * | 2012-12-07 | 2014-06-17 | 삼성전자주식회사 | 음성 인식 장치 및 그 제어 방법 |
WO2014088377A1 (ko) * | 2012-12-07 | 2014-06-12 | 삼성전자 주식회사 | 음성 인식 장치 및 그 제어 방법 |
KR20140098525A (ko) * | 2013-01-31 | 2014-08-08 | 삼성전자주식회사 | 음성 인식 장치 및 응답 정보 제공 방법 |
KR20150075191A (ko) * | 2013-12-24 | 2015-07-03 | 서강대학교산학협력단 | 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 |
KR20160064576A (ko) * | 2014-11-28 | 2016-06-08 | 한화테크윈 주식회사 | 영상 검색 방법 및 장치 |
US11449785B2 (en) | 2016-02-24 | 2022-09-20 | Line Corporation | Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence |
CN105845137A (zh) * | 2016-03-18 | 2016-08-10 | 中国科学院声学研究所 | 一种语音对话管理系统 |
CN105845137B (zh) * | 2016-03-18 | 2019-08-23 | 中国科学院声学研究所 | 一种语音对话管理系统 |
KR20180075050A (ko) * | 2016-12-26 | 2018-07-04 | 현대자동차주식회사 | 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법 |
CN108664336A (zh) * | 2017-04-01 | 2018-10-16 | 北京搜狗科技发展有限公司 | 推荐方法和装置、用于推荐的装置 |
KR20190059201A (ko) * | 2017-11-22 | 2019-05-30 | 서강대학교산학협력단 | 대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템 |
WO2019143170A1 (ko) * | 2018-01-18 | 2019-07-25 | 주식회사 머니브레인 | 소정의 목표를 갖는 대화 이해 ai 서비스 시스템을 위한 대화 템플릿의 생성 방법 및 컴퓨터 판독가능 기록 매체 |
KR20190143583A (ko) * | 2018-06-21 | 2019-12-31 | 주식회사 머니브레인 | 대화 이해 ai 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계층적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능 기록 매체 |
CN111897943A (zh) * | 2020-08-17 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 会话记录搜索方法、装置、电子设备及存储介质 |
WO2022071790A1 (en) * | 2020-09-30 | 2022-04-07 | Mimos Berhad | System and method for text processing |
WO2022139047A1 (ko) * | 2020-12-22 | 2022-06-30 | 한국과학기술원 | 대화문에서의 프레임 자동 분석 방법 및 장치 |
KR20230043558A (ko) * | 2021-09-24 | 2023-03-31 | 한국전자통신연구원 | 외국어 말하기 학습을 위한 대화 장치 및 그 방법 |
CN114333774A (zh) * | 2021-12-15 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN114333774B (zh) * | 2021-12-15 | 2024-02-23 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN117972075A (zh) * | 2024-03-28 | 2024-05-03 | 华南理工大学 | 心智与语言智能体协同的情感对话生成方法 |
Also Published As
Publication number | Publication date |
---|---|
KR100772660B1 (ko) | 2007-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100772660B1 (ko) | 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법 | |
Liu et al. | Unsupervised paraphrasing by simulated annealing | |
KR102388042B1 (ko) | 대화 시스템 및 그것을 위한 컴퓨터 프로그램 | |
EP1349145B1 (en) | System and method for providing information using spoken dialogue interface | |
KR101309042B1 (ko) | 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법 | |
KR20190133931A (ko) | 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법 | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
JP2005084681A (ja) | 意味的言語モデル化および信頼性測定のための方法およびシステム | |
Pichl et al. | Alquist: The alexa prize socialbot | |
KR20210130024A (ko) | 대화 시스템 및 그 제어 방법 | |
JP2017125921A (ja) | 発話選択装置、方法、及びプログラム | |
KR102358485B1 (ko) | 도메인 자동 분류 대화 시스템 | |
JP2009198614A (ja) | 対話装置及びプログラム | |
WO2020199590A1 (zh) | 情绪检测分析方法及相关装置 | |
Dyriv et al. | The user's psychological state identification based on Big Data analysis for person's electronic diary | |
Zhang et al. | Coarse-to-fine knowledge selection for document grounded dialogs | |
KR20180022156A (ko) | 대화 관리 장치 및 방법 | |
KR102076250B1 (ko) | 인공지능 장치의 자연어 처리를 검증하는 장치 및 방법 | |
CN116978367A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
JPH07191687A (ja) | 自然言語処理装置及びその方法 | |
Harvey et al. | Associating colours with emotions detected in social media tweets | |
Lhioui et al. | Towards a Hybrid Approach to Semantic Analysis of Spontaneous Arabic Speech. | |
Ning et al. | Domain Knowledge Enhanced Error Correction Service for Intelligent Speech Interaction | |
Dissanayake et al. | Enhancing conversational ai model performance and explainability for sinhala-english bilingual speakers | |
Lendvai et al. | Multi-feature error detection in spoken dialogue systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121011 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130930 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140930 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |