KR100400220B1 - 대화 모델을 이용한 자동 통역 장치 및 방법 - Google Patents
대화 모델을 이용한 자동 통역 장치 및 방법 Download PDFInfo
- Publication number
- KR100400220B1 KR100400220B1 KR10-2001-0016012A KR20010016012A KR100400220B1 KR 100400220 B1 KR100400220 B1 KR 100400220B1 KR 20010016012 A KR20010016012 A KR 20010016012A KR 100400220 B1 KR100400220 B1 KR 100400220B1
- Authority
- KR
- South Korea
- Prior art keywords
- dialogue
- sentence
- language
- sentences
- acts
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 대화 모델을 이용한 자동 통역 장치 및 방법을 개시한다. 본 발명에 의한 자동 통역 장치는, 제1 언어 음성을 입력하고, 이전 언어 분석을 통해 얻은 적어도 하나의 예측 후보자 문장을 참조한 음성 인식 과정을 거쳐 제1 언어 문장을 생성하는 음성 인식부, 제1 언어 문장의 문형 패턴을 인식하고, 이전 문장들의 화행들 및 화행들간의 관계로 대화를 표현한 미리 준비된 대화 모델을 이용하여 문형 패턴으로부터 현재 문장의 화행을 결정하는 언어 분석부, 화행별로 그 관련 제1 언어 문장과 제2 언어 문장의 쌍들을 저장한 번역 예문 데이터베이스를 참조하여 언어 분석부에서 결정된 화행에 대해 제1 언어 문장을 제2 언어 문장으로 번역하는 언어 번역부 및 제2 언어 문장을 음성 합성하여 출력하는 음성 합성부를 포함한다.
Description
본 발명은 자동 번역에 관한 것으로, 특히 대화 모델을 이용한 자동 통역 방법 및 그 장치에 관한 것이다.
전자 통역 장치는 서로 다른 언어를 사용하는 사람들이 의사 소통을 할 수 있도록 하기 위한 장치이다. 특히, 대화용 전자 번역 장치는 한 언어로 된 음성을 입력하여 다른 언어로 된 음성으로 번역하여 출력한다.
전자 번역 장치의 한 예로서, 히타치세이사쿠쇼의 전자 번역 장치(국내출원번호 95-28604, 출원일자 1995. 9. 10)가 있다. 이 전자 번역 장치는 사용자와 그 상대방이 준비된 예문 중에서 선택할 수 있도록 한다. 예문의 데이터는 예문에 대한 번역문을 포함하는 복수의 예문의 집합을 포함하는 데이터 구조로 메모리에 저장되어 있다. 각 예문의 집합중의 각각의 예문들은 다른 예문의 집합에 링크되어 있다.
도 1은 종래 기술의 번역 예문 데이터베이스의 구축 예를 나타낸다.
도 1을 참조하면, 한 예문의 집합(100)이 있고, 집합내 각각의 예문들은 다른 예문의 집합(110,120,...)에 링크되어 있다. 즉, 각 문장마다 가능한 다음 문장에 대한 링크를 유지하고 있다. 이러한 전자 번역 장치는 모든 번역 문장에 대해 링크를 유지해야 하므로 비효율적고, 번역 예문 데이터베이스가 클 경우 링크 정보를 구축하기 어렵고 확장하기 힘들다는 단점이 있다. 또한, 대화가 내포되는 경우 대화의 히스토리를 저장하는 장치가 없어 부-대화(sub-dialogue)의 처리가 용이하지 않다. 또한, 다음 가능한 문장, 즉 후보 문장에 대한 가중치 정보가 없어 인식 성능이 좋지 않을 수 있다.
본 발명이 이루고자 하는 기술적 과제는, 대화 모델을 이용하여 언어를 분석하고, 언어 분석 결과로 다음 문장의 후보자를 예측하고, 대화 모델에 근거한 번역 예문 데이터베이스를 참조하여 문장을 번역함으로써, 음성의 인식률을 높이고, 번역 성능을 향상시키는, 대화 모델을 이용한 자동 통역 장치 및 그 방법을 제공하는데 있다.
도 1은 종래 기술의 번역 예문 데이터베이스의 구축 예를 나타낸다.
도 2a는 본 발명에 의한 자동 통역 장치의 바람직한 실시예에 따른 블럭도이다.
도 2b는 본 발명에 의한 자동 통역 방법을 설명하기 위한 플로우챠트이다.
도 3은 문형 패턴과 화행의 관계 예를 나타낸다.
도 4는 본 발명에 의한 대화 모델의 구성 예를 나타낸다.
도 5는 본 발명에 의한 번역 예문 데이터베이스의 구축 예를 나타낸다.
상기 과제를 이루기 위하여, 본 발명에 의한 자동 통역 장치는,
제1 언어 음성을 입력하고, 이전 언어 분석을 통해 얻은 적어도 하나의 예측 후보자 문장을 참조한 음성 인식 과정을 거쳐 제1 언어 문장을 생성하는 음성 인식부, 제1 언어 문장의 문형 패턴을 인식하고, 이전 문장들의 화행들 및 화행들간의 관계로 대화를 표현한 미리 준비된 대화 모델을 이용하여 문형 패턴으로부터 현재 문장의 화행을 결정하는 언어 분석부, 화행별로 그 관련 제1 언어 문장과 제2 언어 문장의 쌍들을 저장한 번역 예문 데이터베이스를 참조하여 언어 분석부에서 결정된 화행에 대해 제1 언어 문장을 제2 언어 문장으로 번역하는 언어 번역부 및 제2 언어 문장을 음성 합성하여 출력하는 음성 합성부를 포함한다.
또한, 상기 과제를 이루기 위하여, 본 발명에 의한 자동 통역 방법은,
(a) 제1 언어 음성을 입력하고, 적어도 하나의 예측 후보자 문장을 참조한 음성 인식 과정을 거쳐 제1 언어 문장을 생성하는 단계, (b) 제1 언어 문장의 문형 패턴을 인식하는 단계, (c) 이전 문장들의 화행들 및 화행들간의 관계로 대화를 표현한 미리 준비된 대화 모델을 이용하여, (b) 단계에서 인식된 문형 패턴으로부터 현재 문장의 화행을 결정하고, 이로부터 (a) 단계에서 이용될 예측 후보자 문장을 생성하는 단계, (d) 화행별로 그 관련 제1 언어 문장과 제2 언어 문장의 쌍들을 저장한 번역 예문 데이터베이스를 참조하여, (c) 단계에서 결정된 화행에 대해 제1 언어 문장을 제2 언어 문장으로 번역하는 단계 및 (e) 제2 언어 문장을 음성 합성하여 출력하는 단계를 포함한다.
이하, 본 발명을 첨부한 도면을 참조하여 상세히 설명한다.
현재 휴대용 자동 통역 장치는 일반적으로 사용자가 미리 준비된 예문중에서 통역하고자 하는 문장을 음성으로 말하거나, 키패드를 통해 선택하면, 번역된 문장을 문자 또는 음성으로 출력한다.
본 발명에 의한 자동 통역 장치는 이러한 휴대용 자동 통역 장치뿐만 아니라, 제1 언어에서 제2 언어로의 통역을 수행하는 다양한 장치에 적용된다. 특히, 본 발명의 특징은 대화의 상황을 고려하여 다음 문장을 예측함으로써 사용자가 효율적으로 통역하고자 하는 문장을 찾도록 하는데 있다. 예컨대, 키패드를 이용할 경우, 대화의 상황에 맞는 가능성있는 후보자 문장(들)만을 화면에 제시한다. 또한, 음성을 이용할 경우, 대화의 상황에 맞는 후보자(들)만을 대상으로 음성을 인식한다.
본 발명에 의한 자동 통역 장치는 크게 대화 모델을 이용한 언어 분석과, 언어 분석 결과로 피드백된 예측 후보자 문장을 이용한 음성 인식을 특징으로 한다.
도 2a는 본 발명에 의한 자동 통역 장치의 바람직한 실시예에 따른 블럭도로서, 음성 인식부(100), 언어 분석부(110), 언어 번역부(120), 음성 합성부(130), 대화 모델 DB(140) 및 번역 예문 DB(150)를 구비한다.
여기서, 음성 인식부(100)는 사용자가 통역하고자 하는 문장을 음성으로 입력할 경우에(IN1) 필요하고, 음성 합성부(130)는 번역된 문장을 사용자에게 음성으로 출력할 경우에(OUT1) 필요하다. 본 발명에 의한 자동 통역 장치는 물론, 통역하고자 하는 문장을 문자 입력수단 예컨대, 키패드 등을 통해 입력할 경우에(IN2) 음성 인식부(100)를 거치지않고 언어 분석을 하며, 언어 번역 결과를 문자로 출력할 수 있다(OUT2).
도 2b는 본 발명에 의한 자동 통역 방법을 설명하기 위한 플로우챠트이다. 도 2a 및 도 2b를 참조하여 자동 통역 장치의 구성 및 그 동작을 설명한다.
먼저, 음성 인식부(100)는 사용자로부터 제1 언어 음성을 입력하고, 또한 언어 분석부(110), 정확하게는 화행 분석부(114)로부터 피드백된 예측 후보자 문장(들)을 입력한다. 단, 예측 후보자 문장이 없을 경우에 번역 예문 DB(150)에 저장된 모든 문장을 후보자로 한다. 음성 인식부(100)는 예측 후보자 문장을 참조한 음성 인식 과정을 거쳐 제1 언어 음성을 제1 언어 문장으로 변환한다(제200단계).
다음에, 언어 분석부(110)에서, 문형 패턴 인식부(112)는 변환된 제1 언어 문장의 문형 패턴을 인식한다(제210단계).
문형 패턴(sentence pattern)은 특정 화행이 실현될 때 사용되는 제1 언어의 문장 유형을 의미한다. 화행(speech act)은 대화를 구성하는 각각의 문장을 하나의 행위의 관점에서 분류한 것이다. 즉, 화자의 의도를 반영한다. 예컨대, "**은 얼마입니까?"라는 문장은 상대방에게 '가격'을 묻는 '정보-요구' 행위로 볼 수 있으며, 상대방은 이에 대한 응답으로 가격을 알려 주는 '정보-제공' 행위를 함으로서 대화가 이루어진다. 이때, 가격을 묻는 행위는 "**은 얼마입니까?", "**은 얼마나 되죠?" 등등의 문형 패턴을 통해 실현되는 것이다.
도 3은 문형 패턴과 화행의 관계 예를 나타낸다.
도 3을 참조하면, 문형 패턴은 동사 격틀에 기반하고 있다. 동사 격틀은 동사와 그 동사가 제약하는 문장의 조사, 명사 등의 관계 형태를 의미한다. 예컨대, '타다'라는 동사는 "**에서 **을 타다"와 같은 용례로 사용된다. 여기서, '타다' 동사의 격틀에서, 조사 '에서' 앞에는 장소를 의미하는 명사만이 올 수 있으며, 조사 '을' 앞에는 탈것을 의미하는 명사만이 올 수 있다. 이와 같이 교체 가능한 명사 분류와 동사 격틀을 기반으로 하여 문형 패턴을 정의한다. 특히, 본 발명에서 언급하는 문형 패턴은 명사에 대한 의미적 제약을 가진 동사 위주의 문장 유형을 의미한다.
그러나, 문형 패턴과 화행이 일대일 대응이 되는 것은 아니다. 하나의 문형 패턴은 대화 상황에 따라 각기 다른 화행을 의미할 수 있으며, 화행 또한 다양한 문형 패턴을 통해 실현될 수 있다. 예컨대, "날씨가 춥습니다"는 날씨를 물어보는 질문에 대한 응답 행위일 수도 있고, 다른 상황에서는 "날씨가 추우니 창문을 닫아 달라"는 요구 행위일 수도 있다. 따라서, 정확한 화행은 대화의 상황을 고려해서 분석해야 한다.
다시 도 2a 및 도 2b를 참조하면, 화행 분석부(114)는 문형 패턴 인식부(112)를 통해 인식된 제1 언어 문장의 문형 패턴을 입력하고, 이전 문장들의 화행들 및 미리 준비된 대화 모델을 이용하여 현재 문장(또는 발화)의 화행을 결정한다(제220단계).
여기서, 미리 준비된 대화 모델 즉, 화행들간의 관계로 대화를 표현한 대화 모델은 대화 모델 DB(140)에 저장되어 있다. 이전 문장들의 화행들은 메모리(160)에 저장되며, 메모리는 바람직한 일예로서 가장 최근의 이전 문장들부터 참조할 수 있는 스택 구조를 갖는다. 전술한 바와 같이, 하나의 문형 패턴은 상황에 따라 다른 화행을 의미할 수도 있다. 이러한 경우에, 이전 대화의 내용이 중요한 단서가 된다.
도 4는 본 발명에 의한 대화 모델의 구성 예를 나타낸다.
도 4를 참조하면, 대화 모델은 화행에 기반하여 대화가 진행될 수 있는 상황을 미리 표현한 것이다. 예컨대, 상대방에게 정보-요구(REQUEST-INFORMATION)를 한 경우, 상대방은 요청된 정보를 제공(GIVE-INFORMATION)하거나, 정보-요구 질문이 불명확할 경우 질문에 대해 확인을 요구(REQUEST-CONFIRM)하거나, 질문에 답하는데 필요한 부가적인 정보를 요구(REQUEST-INFORMATION)할 수도 있다.
대화 모델은 실질적으로 N-Gram 형태로 저장되며, 코퍼스로부터 추출한 확률값을 가지고 있다. N-Gram 형태의 대화 모델은 이전 문장들의 화행들 N-1개와 현재 문장의 화행, 확률의 쌍들로 이루어진다. 여기서, 확률은 N-1개의 화행들이 나온 다음에 현재 문장의 화행이 나올 확률을 나타낸다. 확률값은 예컨대, 수동으로 화행을 마킹해 놓은 대량의 코퍼스(대화 문장들을 수집해놓은 문서)로부터 해당 N-Gram의 발생 빈도를 카운트함으로써 구해진다.
도 4의 (b)는 화행을 간단히, bi-gram 형태로 저장하고, 그 확률을 표시한 예를 나타낸다. 예컨대, (request-information, give-information, 0.753)은 현재 진행중인 대화에 대한 이전 문장의 화행이 request-information일때, 다음 문장이 give-information인 화행을 가질 확률이 0.753이라는 것이다. 이러한 확률값은 코퍼스로부터 자동 학습되는 것으로, 후보자 화행이 여러개일 경우 하나의 후보자를 결정하는데 또는 후보자들간의 우선순위를 결정하는데 사용된다. 따라서, 대화 모델은 통계적 대화 모델이라 볼 수 있으며, 후보자에 대한 가중치를 부여한다.
다시, 도 2a 및 도 2b를 참조하면, 언어 번역부(120)는 언어 분석부(110)를 통해 현재 문장의 화행이 결정되면, 번역 예문 DB(150)를 참조하여, 제1 언어 문장을 제2 언어 문장으로 번역한다(제230단계). 끝으로, 음성 합성부(130)는 결정된 제2 언어 문장을 입력하여 제2 언어 음성으로 합성하여 출력한다(제240단계).
도 5는 본 발명에 의한 번역 예문 DB(150)의 구축 예를 나타낸다.
도 5를 참조하면, 번역 예문 DB(150)는 화행별로 문장들의 집합을 저장하고 있다. 즉, 화행과 그 관련 문형 패턴에 근거한 제1 언어 문장 및 제2 언어 문장의 쌍들을 저장하고 있다. 언어 번역부(120)는 언어 분석부(110)로부터 제1 언어 문장의 화행 및 부가적으로 문형 패턴을 입력하여 번역 예문 DB(150)에서 해당 화행의 문장들의 집합을 검색하고, 현재 문장의 문형 패턴을 갖는 제1 언어 문장에 대응하는 제2 언어 문장을 얻는다.
번역 예문 DB(150)는 문장간의 링크 정보를 대화 모델을 이용하여 유지 관리한다. 즉, 본 발명은 대화 모델을 이용하여 효율적으로 번역 예문 DB(150)를 구성하고 있다. 종래의 기술에서 모든 문장이 링크를 사용하여 다음에 예측되는 문장에 대한 정보를 유지하는 반면, 본 발명의 번역 예문 DB(150)는 일반화된 대화 모델(도 4를 참조)을 이용하여 문장간의 링크 정보를 유지한다. 도 5에서, 표시된 링크는 단지 이해를 돕기위해 나타낸 것이며, 이 링크 정보는 도 4의 대화 모델을통해 유지된다.
한편, 언어 분석부(110)는 현재 문장의 화행이 결정되면, 언어 번역부(120)로 전달함과 동시에, 다음에 예측되는 후보자 문장(들)을 음성 인식부(100)로 피드백한다(제230단계). 예측 후보자 문장은 대화 모델 DB(140)에서 현재 문장의 화행을 이전 문장의 화행으로 가지는 N-Gram을 탐색함으로써 얻어진다. 구체적으로는, 대화 모델 DB(140)에서 예측 후보자 화행을 얻고, 예측 후보자 화행과 번역 예문 DB(150)를 이용하여 예측 후보자 문장(들)을 얻는다.
예컨대, 도 4와 같이 이전 문장 하나만을 참조하는 bi-gram의 경우, 현재 문장의 화행이 request-action이라면, (request-action, ?, ?) 형태를 갖는 bi-gram을 탐색하여 다음 문장의 화행으로 accept-action, reject, request-action의 3가지가 가능함을 알 수 있다. 이는 bi-gram을 예로 든 것이며, 실제로 이보다 많다. 이렇게 다음 문장의 예측 후보자 화행(들)이 결정되면, 해당 화행에 해당하는 문장들을 번역 예문 데이터베이스(150)로부터 얻는다.
음성 인식부(100)는 전술한 예측 후보자 문장(들)을 이용함으로써 사용자가 통역하고자 하는 문장 즉, 인식 대상으로 하는 제1 언어 문장의 탐색 공간을 줄이게 된다. 이에 따라, 음성 인식부(100)의 인식 정확률을 높이게 된다.
지금까지 입출력이 음성일 경우에 본 발명에 의한 자동 통역 장치 및 방법을 설명하였다. 입출력이 문자일 경우에도 마찬가지로 본 발명에서 특징으로 하는 대화 모델을 이용한 언어 분석 및 대화 모델에 근거한 번역 예문 데이터베이스를 참조한 언어 번역이 적용된다. 사용자가 예컨대, 키패드를 통해 통역하고자 하는 문장을 입력할 경우에, 먼저, 예측 후보자 문장(들)을 제시하고, 예측 후보자 문장을 참조하여 사용자가 제1 언어 문장을 입력하도록 한다.
이상에서 설명한 바와 같이, 본 발명은 첫째, 대화 모델에 기반하여 다음 문장의 후보자를 예측하므로, 음성 인식 단계에서 인식 후보자를 제한하고, 인식 복잡도를 감소시키는 효과가 있다. 또한, 통계적 대화 모델을 이용하여 후보자에 대한 가중치를 부여하므로 보다 정확한 다음 문장의 후보자를 예측한다.
둘째, 화자의 의도 또는 대화의 상황을 반영하는 화행에 기반하여 제1 언어를 제2 언어로 정확하고 효율적으로 번역함으로써 번역 성능을 향상시키며, 번역 예문 DB를 구성하는데 있어 문장간의 링크 정보를 대화 모델을 이용하여 효율적으로 유지 관리한다.
Claims (16)
- 제1 언어 음성을 입력하고, 이전 언어 분석을 통해 얻은 적어도 하나의 예측 후보자 문장을 참조한 음성 인식 과정을 거쳐 제1 언어 문장을 생성하는 음성 인식부;상기 제1 언어 문장의 문형 패턴을 인식하고, 이전 문장들의 화행들 및 화행들간의 관계로 대화를 표현한 미리 준비된 대화 모델을 이용하여, 상기 문형 패턴으로부터 현재 문장의 화행을 결정하는 언어 분석부;화행별로 그 관련 제1 언어 문장과 제2 언어 문장의 쌍들을 저장한 번역 예문 데이터베이스를 참조하여, 상기 언어 분석부에서 결정된 화행에 대해 제1 언어 문장을 제2 언어 문장으로 번역하는 언어 번역부; 및상기 제2 언어 문장을 음성 합성하여 출력하는 음성 합성부를 포함하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 장치.
- 제1항에 있어서, 상기 자동 통역 장치는,상기 이전 문장들의 화행들을 스택 구조로 저장하고 있는 메모리; 및상기 대화 모델을 적어도 N-1개의 이전 문장들의 화행들, 현재 문장의 화행 및 확률의 쌍들로 이루어진 엔-그램(N-Gram) 형태로 저장하고 있는 대화 모델 데이터베이스를 더 포함하며,상기 확률은 상기 N-1개의 이전 문장들의 화행들 다음에 상기 현재 문장의 화행이 나올 확률인 것을 특징으로 하는 자동 통역 장치.
- 제1항에 있어서, 상기 번역 예문 데이터베이스는저장된 문장들간의 링크 정보를 상기 대화 모델을 이용하여 유지하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 장치.
- 제1항 내지 제3항중 어느 한항에 있어서, 상기 언어 분석부는,상기 제1 언어 문장의 문형 패턴을 동사 격틀에 기반하여 인식하는 문형 패턴 인식부; 및상기 이전 문장들의 화행들 및 상기 대화 모델을 이용하여, 상기 문형 패턴으로부터 현재 문장의 화행을 결정하고, 결정된 화행으로부터 상기 음성 인식부에서 이용될 상기 적어도 하나의 예측 후보자 문장을 생성하는 화행 분석부를 포함하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 장치.
- 제4항에 있어서, 상기 화행 분석부는,상기 결정된 화행과 상기 대화 모델을 이용하여 다음 문장의 예측 후보자 화행을 얻고, 상기 예측 후보자 화행과 상기 번역 예문 데이터베이스를 이용하여 상기 적어도 하나의 예측 후보자 문장을 얻는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 장치.
- 이전 언어 분석을 통해 얻은 적어도 하나의 예측 후보자 문장을 제시하고, 상기 예측 후보자 문장을 참조하여 입력된 제1 언어 문장의 문형 패턴을 인식하고, 이전 문장들의 화행들 및 화행들간의 관계로 대화를 표현한 미리 준비된 대화 모델을 이용하여, 상기 문형 패턴으로부터 현재 문장의 화행을 결정하는 언어 분석부; 및화행별로 그 관련 제1 언어 문장과 제2 언어 문장의 쌍들을 저장한 번역 예문 데이터베이스를 참조하여, 상기 언어 분석부에서 결정된 화행에 대해 제1 언어 문장을 제2 언어 문장으로 번역하는 언어 번역부를 포함하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 장치.
- 제6항에 있어서, 상기 자동 통역 장치는,상기 이전 문장들의 화행들을 스택 구조로 저장하고 있는 메모리; 및상기 대화 모델을 적어도 N-1개의 이전 문장들의 화행들, 현재 문장의 화행 및 확률의 쌍들로 이루어진 엔-그램(N-Gram) 형태로 저장하고 있는 대화 모델 데이터베이스를 더 포함하며,상기 확률은 상기 N-1개의 이전 문장들의 화행들 다음에 상기 현재 문장의 화행이 나올 확률인 것을 특징으로 하는 자동 통역 장치.
- 제6항에 있어서, 상기 번역 예문 데이터베이스는저장된 문장들간의 링크 정보를 상기 대화 모델을 이용하여 유지하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 장치.
- (a) 제1 언어 음성을 입력하고, 적어도 하나의 예측 후보자 문장을 참조한 음성 인식 과정을 거쳐 제1 언어 문장을 생성하는 단계;(b) 상기 제1 언어 문장의 문형 패턴을 인식하는 단계;(c) 이전 문장들의 화행들 및 화행들간의 관계로 대화를 표현한 미리 준비된 대화 모델을 이용하여, 상기 (b) 단계에서 인식된 문형 패턴으로부터 현재 문장의 화행을 결정하고, 이로부터 상기 (a) 단계에서 이용될 상기 예측 후보자 문장을 생성하는 단계;(d) 화행별로 그 관련 제1 언어 문장과 제2 언어 문장의 쌍들을 저장한 번역 예문 데이터베이스를 참조하여, 상기 (c) 단계에서 결정된 화행에 대해 제1 언어 문장을 제2 언어 문장으로 번역하는 단계; 및(e) 상기 제2 언어 문장을 음성 합성하여 출력하는 단계를 포함하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
- 제9항에 있어서, 상기 (c) 단계에서,상기 이전 문장들의 화행들은 스택 구조로 저장되어 있고,상기 대화 모델을 적어도 N-1개의 이전 문장들의 화행들, 현재 문장의 화행 및 확률의 쌍들로 이루어진 엔-그램(N-Gram) 형태로 저장하고 있는 대화 모델 데이터베이스를 더 포함하며,상기 확률은 상기 N-1개의 이전 문장들의 화행들 다음에 상기 현재 문장의 화행이 나올 확률인 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
- 제9항에 있어서, 상기 번역 예문 데이터베이스는저장된 문장들간의 링크 정보를 상기 대화 모델을 이용하여 유지하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
- 제9항에 있어서, 상기 (b) 단계는,상기 제1 언어 문장의 문형 패턴을 동사 격틀에 기반하여 인식하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
- 제9항 내지 제11항중 어느 한항에 있어서, 상기 (c) 단계는,상기 결정된 화행과 상기 대화 모델을 이용하여 다음 문장의 예측 후보자 화행을 얻고, 상기 예측 후보자 화행과 상기 번역 예문 데이터베이스를 이용하여 상기 적어도 하나의 예측 후보자 문장을 얻는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
- (a) 적어도 하나의 예측 후보자 문장을 제시하고, 상기 예측 후보자 문장을 참조하여 입력된 제1 언어 문장의 문형 패턴을 인식하는 단계;(b) 이전 문장들의 화행들 및 화행들간의 관계로 대화를 표현한 미리 준비된 대화 모델을 이용하여, 상기 문형 패턴으로부터 현재 문장의 화행을 결정하고, 이로부터 상기 (a) 단계에서 이용될 상기 예측 후보자 문장을 생성하는 단계; 및(c) 화행별로 그 관련 제1 언어 문장과 제2 언어 문장의 쌍들을 저장한 번역 예문 데이터베이스를 참조하여, 상기 (b) 단계에서 결정된 화행에 대해 제1 언어 문장을 제2 언어 문장으로 번역하는 단계를 포함하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
- 제14항에 있어서, 상기 (b) 단계에서,상기 이전 문장들의 화행들은 스택 구조로 저장되어 있고,상기 대화 모델을 적어도 N-1개의 이전 문장들의 화행들, 현재 문장의 화행 및 확률의 쌍들로 이루어진 엔-그램(N-Gram) 형태로 저장하고 있는 대화 모델 데이터베이스를 더 포함하며,상기 확률은 상기 N-1개의 이전 문장들의 화행들 다음에 상기 현재 문장의 화행이 나올 확률인 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
- 제14항에 있어서, 상기 번역 예문 데이터베이스는저장된 문장들간의 링크 정보를 상기 대화 모델을 이용하여 유지하는 것을 특징으로 하는 대화 모델을 이용한 자동 통역 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2001-0016012A KR100400220B1 (ko) | 2001-03-27 | 2001-03-27 | 대화 모델을 이용한 자동 통역 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2001-0016012A KR100400220B1 (ko) | 2001-03-27 | 2001-03-27 | 대화 모델을 이용한 자동 통역 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020076044A KR20020076044A (ko) | 2002-10-09 |
KR100400220B1 true KR100400220B1 (ko) | 2003-10-01 |
Family
ID=27698890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2001-0016012A KR100400220B1 (ko) | 2001-03-27 | 2001-03-27 | 대화 모델을 이용한 자동 통역 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100400220B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100859532B1 (ko) * | 2006-11-06 | 2008-09-24 | 한국전자통신연구원 | 대응 문형 패턴 기반 자동통역 방법 및 장치 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8433576B2 (en) | 2007-01-19 | 2013-04-30 | Microsoft Corporation | Automatic reading tutoring with parallel polarized language modeling |
US8306822B2 (en) | 2007-09-11 | 2012-11-06 | Microsoft Corporation | Automatic reading tutoring using dynamically built language model |
KR101134467B1 (ko) * | 2009-07-27 | 2012-04-13 | 한국전자통신연구원 | 의미 표현 처리 장치 및 그 방법 |
KR101240532B1 (ko) * | 2011-02-18 | 2013-03-11 | 윤현식 | 단어조합을 이용한 양방향 통역방법 |
KR101694286B1 (ko) | 2012-05-02 | 2017-01-09 | 한국전자통신연구원 | 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법 |
US10366173B2 (en) | 2016-09-09 | 2019-07-30 | Electronics And Telecommunications Research Institute | Device and method of simultaneous interpretation based on real-time extraction of interpretation unit |
KR102557092B1 (ko) | 2022-11-11 | 2023-07-19 | 주식회사 디엠티랩스 | 투명 디스플레이를 이용한 자동 통번역 및 대화 보조 시스템 |
-
2001
- 2001-03-27 KR KR10-2001-0016012A patent/KR100400220B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100859532B1 (ko) * | 2006-11-06 | 2008-09-24 | 한국전자통신연구원 | 대응 문형 패턴 기반 자동통역 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20020076044A (ko) | 2002-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6374224B1 (en) | Method and apparatus for style control in natural language generation | |
US6937983B2 (en) | Method and system for semantic speech recognition | |
JP3962763B2 (ja) | 対話支援装置 | |
Rudnicky et al. | Survey of current speech technology | |
EP1089193A2 (en) | Translating apparatus and method, and recording medium used therewith | |
US20080133245A1 (en) | Methods for speech-to-speech translation | |
US7127402B2 (en) | Method and apparatus for converting utterance representations into actions in a conversational system | |
KR20170033722A (ko) | 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치 | |
JP2005084681A (ja) | 意味的言語モデル化および信頼性測定のための方法およびシステム | |
US11907665B2 (en) | Method and system for processing user inputs using natural language processing | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
JP2020135135A (ja) | 対話コンテンツ作成支援方法およびシステム | |
JP2000200273A (ja) | 発話意図認識装置 | |
KR102358485B1 (ko) | 도메인 자동 분류 대화 시스템 | |
Nöth et al. | On the use of prosody in automatic dialogue understanding | |
KR102204395B1 (ko) | 개체명 인식을 이용한 음성인식 띄어쓰기 보정 방법 및 시스템 | |
KR100400220B1 (ko) | 대화 모델을 이용한 자동 통역 장치 및 방법 | |
KR101097186B1 (ko) | 대화체 앞뒤 문장정보를 이용한 다국어 음성합성 시스템 및 방법 | |
KR20230116145A (ko) | 질문 분석을 수행하는 상담 시스템 | |
JP5243325B2 (ja) | 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム | |
López-Cózar et al. | Combining language models in the input interface of a spoken dialogue system | |
CN111506701B (zh) | 一种智能查询方法及相关装置 | |
US8635071B2 (en) | Apparatus, medium, and method for generating record sentence for corpus and apparatus, medium, and method for building corpus using the same | |
CN117094329B (zh) | 一种用于解决语音歧义的语音翻译方法及装置 | |
US20220215834A1 (en) | System and method for speech to text conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110830 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20120830 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |