KR100382827B1 - 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법 - Google Patents

텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법 Download PDF

Info

Publication number
KR100382827B1
KR100382827B1 KR10-2000-0084729A KR20000084729A KR100382827B1 KR 100382827 B1 KR100382827 B1 KR 100382827B1 KR 20000084729 A KR20000084729 A KR 20000084729A KR 100382827 B1 KR100382827 B1 KR 100382827B1
Authority
KR
South Korea
Prior art keywords
voice
speech
text
phrase
sentence
Prior art date
Application number
KR10-2000-0084729A
Other languages
English (en)
Other versions
KR20020055305A (ko
Inventor
최준용
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR10-2000-0084729A priority Critical patent/KR100382827B1/ko
Publication of KR20020055305A publication Critical patent/KR20020055305A/ko
Application granted granted Critical
Publication of KR100382827B1 publication Critical patent/KR100382827B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 텍스트투스피치(Text To Speech)를 이용한 음성 자동 생성 장치 및 방법에 관한 것으로, 특히 음성 처리 부가 시스템에서 사용자에게 음성 인식 기능이나 자동 안내 기능 등의 자주 변경되는 내용을 안내 음성으로 재생하여 들려줄때 텍스트투스피치 음성을 자동 생성하도록 한 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법에 관한 것이다.
종래의 음성 처리 부가 시스템에서 음성 인식 기능이나 자동 안내 기능 등의 자주 변경되는 내용을 아나운서의 음성으로 녹음할 경우, 해당 아나운서의 음성을 시스템에 적용하는데 시간이 오래 걸리고, 변경된 내용을 텍스트투스피치로 모두 합성할 경우, 실제 아나운서의 음성 보다 음질이 떨어지는 문제점이 있었다.
본 발명은 음성 처리 부가 시스템에서 음성 인식 기능이나 자동 안내 기능 등의 자주 변경되는 내용을 안내 음성으로 재생하여 들려줄 경우, 목록화한 단어 및 어구를 녹음하여, 변경할 내용 중에서 녹음되어 있지 않은 단어 및 어구를 텍스트투스피치를 이용하여 안내 음성을 자동으로 생성함으로써 텍스트투스피치부 합성음의 사용을 최소화하여, 음질의 하락을 방지하는 효과가 있다.

Description

텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법{System and Method of Creating Automatic Voice Using Text to Speech}
본 발명은 음성 처리 부가 시스템에서 텍스트투스피치(Text To Speech)를 이용한 음성 자동 생성 장치 및 방법에 관한 것으로, 특히 음성 처리 부가 시스템에서 사용자에게 음성 인식 기능이나 자동 안내 기능 등의 자주 변경되는 내용을 안내 음성으로 재생하여 들려줄때 텍스트투스피치 음성을 자동 생성하도록 한 음성 처리 부가 시스템에서 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법에 관한 것이다.
일반적으로, 음성 처리 부가 시스템(1)은 전화망을 통하여 사용자에게 정보를 주기 위하여 아나운서의 녹음을 저장하는 음성 저장부(2)와, 변경된 안내 문장을 다시 녹음하여 음성 처리 부가 시스템(1)의 음성 저장부(2)로 전송하는 음성 입/출력부(3)와, 해당 음성 저장부(2)에 녹음된 음성을 재생하는 음성 재생부(4)와를 포함하여 이루어져 있다.
그리고, 해당 음성 저장부(2), 음성 입/출력부(3), 음성 재생부(4)와 더불어 입력된 문장을 텍스트투스피치 알고리즘에 의해 음성을 합성할 수 있는 텍스트투스피치부(5)을 더 포함하여 이루어져 있다.
상기한 바와 같은 음성 처리 부가 시스템(1)에서 음성 생성 방법은 도2의 순서도를 참조하여 설명하면 다음과 같다.
먼저, 사용자에게 정보를 주기 위하여 일반 안내 음성 및 정보 처리 음성을 아나운서의 음성으로 녹음한 후(단계 S21), 해당 녹음된 음성을 음성 저장부(2)에 저장한다(단계 S22). 해당 저장된 음성을 재생하여 사용자에게 음성 재생 서비스를 제공한다(단계 S23). 이들 저장된 음성들이 내용상 변경이 발생되면(단계 S24), 녹음 음성을 업데이트(Update)해야 하는데, 다음의 세 가지 형태로 처리된다.
첫 번째는 변경된 문장을 아나운서가 녹음을 한 후, 음성 입/출력부(3)를 통해 음성 저장부(2)에 저장하여 다음 사용자가 서비스를 요청할 경우, 안내 음성 및 정보 처리 음성을 음성 재생부(4)를 통해 들려주게 된다(단계 S25).
두 번째는 운용자가 텍스트투스피치부(5)에 변경된 문장 전체를 입력하여 합성음을 만든 후, 음성 입/출력부(3)를 통해 음성 저장부(2)에 저장하여 사용자가 서비스를 요청할 경우, 안내 음성 및 정보 처리 음성을 음성 재생부(4)를 통해 들려주게 된다(단계 S26).
세 번째는 운용자가 변경할 내용의 문장을 추출한 후(단계 S27), 텍스트투스피치부(5)에 변경될 문장만 입력하여 합성음을 만들어 내서 음성 입/출력부(3)를 통해 음성 저장부(2)에 저장하여 사용자가 서비스를 요청할 경우, 안내 음성 및 정보 처리 음성을 음성 재생부(4)를 통해 들려주게 된다(단계 S28).
상기한 바와 같이, 첫 번째 방법은 아나운서가 발성하고 녹음함으로 시스템에 적용시키는데 처리 시간이 오래 걸리고, 두 번째 방법은 변경된 내용을 텍스트투스피치로 모두 합성을 하면 음질이 실제 아나운서 음성 보다 떨어져 사용자가 청취하기에 부적절한 문제점이 있었다.
그리고, 세 번째 방법은 운용자가 직접 변경된 내용을 직접 분류하므로 처리 시간이 지연되어 수작업으로 인한 운용자의 불편이 가중되는 문제점이 있었다.
본 발명은 전술한 바와 같은 제반적인 문제점을 해결하기 위한 것으로, 그 목적은 음성 처리 부가 시스템에서 음성 인식 기능이나 자동 안내 기능 등의 자주 변경되는 내용을 안내 음성으로 재생하여 들려줄 경우, 목록화한 단어 및 어구를 녹음하여, 변경할 내용 중에서 녹음되어 있지 않은 단어 및 어구를 텍스트투스피치를 이용하여 안내 음성을 자동으로 생성함으로써 텍스트투스피치부 합성음의 사용을 최소화하여, 음질의 하락을 방지하는데 있다.
도1은 일반적인 음성 처리 부가 시스템의 구성 요소를 나타낸 도.
도2는 일반적인 음성 처리 부가 시스템에서 음성 자동 생성 방법을 구현한 순서도.
도3은 본 발명의 실시예에 따른 음성 처리 부가 시스템에서 텍스트투스피치를 이용한 음성 자동 생성 장치를 나타낸 도.
도4는 본 발명의 실시예에 따른 음성 처리 부가 시스템에서 텍스트투스피치를 이용한 음성 자동 생성 방법을 나타낸 도.
*도면의 주요 부분에 대한 부호의 설명*
10 : 음성 처리 부가 시스템 50 : 텍스트투스피치부
20 : 음성 저장부 51 : 단어 유사성 검색 엔진
30 : 음성 입/출력부 52 : 텍스트투스피치 엔진
40 : 음성 재생부 53 : 랜(LAN) 정합부
상기한 바와 같은 목적을 달성하기 위한 본 발명의 텍스트투스피치를 이용한 음성 자동 생성 장치는, 텍스트투스피치를 이용한 음성 자동 생성 장치에 있어서, 내용 변경을 위한 문장을 수신하고, 녹음 음성과 합성 음성을 음성 처리 부가`시스템으로 전송하는 랜 정합부와; 입력된 단어 및 문구를 음성으로 합성하여 해당 합성 음성을 상기 랜 정합부를 통해 출력하는 텍스트투스피치 엔진과; 상기 랜 정합부를 통해 내용 변경을 위한 문장을 입력받으면 녹음 저장된 음성의 단어 및 어구 목록과 상기 입력된 문장의 문자 및 어구에 대한 유사성을 검사하여, 상기 입력된 문장 중에 포함된 유사한 문자 및 어구에 대한 음성으로서는 상기 녹음 저장된 음성을 상기 랜 정합부를 통해 출력하고, 상기 입력된 문장 중에 포함된 유사하지 않은 단어 및 문구는 상기 텍스트투스피치 엔진에 출력하는 단어 유사성 검색 엔진을 포함하는 것을 특징으로 한다.
한편, 상기한 바와 같은 목적을 달성하기 위한 본 발명의 텍스트투스피치를 이용한 음성 자동 생성 방법은, 녹음 저장된 음성의 단어 및 어구를 목록화하는 과정과; 상기 녹음 저장된 음성을 이용하여 사용자에게 음성 재생 서비스를 제공하는 중에 내용 변경을 위한 문장을 입력받는 과정과; 상기 내용 변경을 위한 문장에 포함된 단어 및 어구와 상기 녹음 저장된 음성의 단어 및 어구 목록을 비교하는 과정과; 상기 비교 결과, 상기 내용 변경을 위한 문장 중에 동일한 단어 및 어구가 존재하면, 해당 동일한 단어 및 어구에 대한 음성으로서 상기 녹음 저장된 음성을 이용하여 음성을 생성하는 과정과; 상기 비교 결과, 상기 내용 변경을 위한 문장 중에 동일하지 않은 단어 및 어구가 존재하면, 해당 동일하지 않은 단어 및 어구에 대한 음성으로서 합성 음성을 이용하여 음성을 생성하는 과정을 포함하는 것을 특징으로 한다.
이하, 본 발명의 실시예를 첨부한 도면을 참조하여 상세하게 설명하면 다음과 같다.
본 발명의 실시예에 따른 음성 처리 부가 시스템에서 텍스트투스피치를 이용한 음성 자동 생성 장치는 도3에 나타낸 바와 같이, 전화망을 통하여 사용자에게 정보를 주기 위하여 아나운서의 녹음을 저장하는 음성 저장부(20)와, 변경된 안내 문장을 다시 녹음하여 시스템의 음성 저장부로 전송하는 입/출력부(30)와, 해당 음성 저장부(20)에 녹음된 음성을 재생하는 음성 재생부(40)와, 텍스트투스피치부(50)를 포함하여 이루어져 있다.
여기서, 해당 텍스트투스피치부(50)는 입력된 문장의 단어 유사성을 검사하는 단어 유사성 검색 엔진(51)과, 입력된 문장을 음성으로 변환하는 텍스트투스피치 엔진(52)과, 변경된 문장 및 메시지를 받고 생성된 음성을 시스템으로 전송하는 랜(LAN) 정합부(53)를 포함하여 이루어져 있다.
상기한 바와 같은 음성 처리 부가 시스템을 바탕으로 한 본 발명의 실시예에 따른 음성 처리 부가 시스템에서 텍스트투스피치를 이용한 음성 자동 생성 방법은 도4의 순서도를 참조하여 설명하면 다음과 같다.
먼저, 안내 방송 및 정보 처리 음성을 녹음할 경우, 단어 및 어구를 추출하여 목록화한 후,(단계 S41), 아나운서의 음성으로 해당 목록화 된 단어 및 어구를 녹음한다(단계 S42). 이때, 녹음될 단어 및 어구들은 다양한 조사와 결합된 형태로 만들어야 한다.
이후, 시스템의 음성 입/출력부(30)를 통해 해당 녹음된 단어 및 어구를 음성 저장부(20)에 저장한 후(단계 S43), 사용자가 음성 재생 서비스를 요청할 경우, 안내 음성 및 정보 처리 음성을 음성 재생부(40)를 통해 들려주게 된다(단계 S44).
그런데, 사용자에게 제공될 내용에 변경 사항 발생하면(단계 S45), 해당 내용을 파일 형태로 텍스트투스피치부(50)에 입력한 후(단계 S46), 해당 입력된 전체 문장은 텍스트투스피치부(50)의 구성 요소 중 단어 유사성 검색 엔진(51)으로 입력이한다(단계 S47). 해당 단어 유사성 검색 엔진(51)은 처음에 아나운서의 음성으로 녹음된 단어 및 어구의 목록과 현재 변경될 문장의 단어 및 어구를 유형 비교하여(단계 S48), 비교 결과 동일한 단어가 존재하는지를 판단한다(단계 S49). 해당 비교 결과, 동일한 단어가 존재하지 않을 경우, 텍스트투스피치 엔진(52)으로 단어 및 어구를 입력하여 음성을 생성한다(단계 S50). 그러나, 해당 비교 결과, 동일한 단어가 존재할 경우, 목록화 된 단어 및 어구에 해당하는 기녹음된 음성을 사용하여 음성을 생성한다(단계 S51). 이렇게 단어 유사성 검색 엔진(51)을 사용하여 변경될 문장의 모든 단어를 음성으로 바꾼 후, 통합하여 최종 결과를 음성으로 만들어 낸다. 이렇게 만들어진 음성은 랜(LAN) 정합부(53)를 통해 시스템의 지정된 위치로 전송하여 사용자의 요구 시, 재생하게 된다(단계 S52).
이상으로 본 발명의 바람직한 실시예에 대해 상세히 기술되었지만, 본 발명이 속하는 기술 분야에 있어서 통상의 지식을 가진 사람이라면, 본 발명을 여러 가지로 변형 또는 변경하여 실시할 수 있음을 알 수 있을 것이다. 따라서, 본 발명의 실시예들의 변경은 본 발명의 기술적 범위를 벗어날 수 없을 것이다.
이상에서 설명한 바와 같이 본 발명은 음성 처리 부가 시스템에서 음성 인식 기능이나 자동 안내 기능 등의 자주 변경되는 내용을 안내 음성으로 재생하여 들려줄 경우, 목록화한 단어 및 어구를 녹음하여, 변경할 내용 중에서 녹음되어 있지 않은 단어 및 어구를 텍스트투스피치를 이용하여 안내 음성을 자동으로 생성함으로써 텍스트투스피치부 합성음의 사용을 최소화하여, 음질의 하락을 방지하는 효과가 있다.

Claims (5)

  1. 텍스트투스피치를 이용한 음성 자동 생성 장치에 있어서,
    내용 변경을 위한 문장을 수신하고, 녹음 음성과 합성 음성을 음성 처리 부가`시스템으로 전송하는 랜 정합부와;
    입력된 단어 및 문구를 음성으로 합성하여 해당 합성 음성을 상기 랜 정합부를 통해 출력하는 텍스트투스피치 엔진과;
    상기 랜 정합부를 통해 내용 변경을 위한 문장을 입력받으면 녹음 저장된 음성의 단어 및 어구 목록과 상기 입력된 문장의 문자 및 어구에 대한 유사성을 검사하여, 상기 입력된 문장 중에 포함된 유사한 문자 및 어구에 대한 음성으로서는 상기 녹음 저장된 음성을 상기 랜 정합부를 통해 출력하고, 상기 입력된 문장 중에 포함된 유사하지 않은 단어 및 문구는 상기 텍스트투스피치 엔진에 출력하는 단어 유사성 검색 엔진을 포함하는 것을 특징으로 하는 텍스트투스피치를 이용한 음성 자동 생성 장치.
  2. 삭제
  3. 텍스트투스피치를 이용한 음성 자동 생성 방법에 있어서,
    녹음 저장된 음성의 단어 및 어구를 목록화하는 과정과;
    상기 녹음 저장된 음성을 이용하여 사용자에게 음성 재생 서비스를 제공하는 중에 내용 변경을 위한 문장을 입력받는 과정과;
    상기 내용 변경을 위한 문장에 포함된 단어 및 어구와 상기 녹음 저장된 음성의 단어 및 어구 목록을 비교하는 과정과;
    상기 비교 결과, 상기 내용 변경을 위한 문장 중에 동일한 단어 및 어구가 존재하면, 해당 동일한 단어 및 어구에 대한 음성으로서 상기 녹음 저장된 음성을 이용하여 음성을 생성하는 과정과;
    상기 비교 결과, 상기 내용 변경을 위한 문장 중에 동일하지 않은 단어 및 어구가 존재하면, 해당 동일하지 않은 단어 및 어구에 대한 음성으로서 합성 음성을 이용하여 음성을 생성하는 과정을 포함하는 것을 특징으로 하는 텍스트투스피치를 이용한 음성 자동 생성 방법.
  4. 삭제
  5. 삭제
KR10-2000-0084729A 2000-12-28 2000-12-28 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법 KR100382827B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2000-0084729A KR100382827B1 (ko) 2000-12-28 2000-12-28 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2000-0084729A KR100382827B1 (ko) 2000-12-28 2000-12-28 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20020055305A KR20020055305A (ko) 2002-07-08
KR100382827B1 true KR100382827B1 (ko) 2003-05-09

Family

ID=27688058

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-0084729A KR100382827B1 (ko) 2000-12-28 2000-12-28 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법

Country Status (1)

Country Link
KR (1) KR100382827B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07199991A (ja) * 1994-01-07 1995-08-04 Sanyo Electric Works Ltd 音声合成用データ作成装置
JPH0887297A (ja) * 1994-09-20 1996-04-02 Fujitsu Ltd 音声合成システム
JP2000003189A (ja) * 1998-06-17 2000-01-07 Omron Corp 音声データ編集装置及び音声データベース
US6148285A (en) * 1998-10-30 2000-11-14 Nortel Networks Corporation Allophonic text-to-speech generator
US6163769A (en) * 1997-10-02 2000-12-19 Microsoft Corporation Text-to-speech using clustered context-dependent phoneme-based units

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07199991A (ja) * 1994-01-07 1995-08-04 Sanyo Electric Works Ltd 音声合成用データ作成装置
JPH0887297A (ja) * 1994-09-20 1996-04-02 Fujitsu Ltd 音声合成システム
US6163769A (en) * 1997-10-02 2000-12-19 Microsoft Corporation Text-to-speech using clustered context-dependent phoneme-based units
JP2000003189A (ja) * 1998-06-17 2000-01-07 Omron Corp 音声データ編集装置及び音声データベース
US6148285A (en) * 1998-10-30 2000-11-14 Nortel Networks Corporation Allophonic text-to-speech generator

Also Published As

Publication number Publication date
KR20020055305A (ko) 2002-07-08

Similar Documents

Publication Publication Date Title
US7490039B1 (en) Text to speech system and method having interactive spelling capabilities
KR100329894B1 (ko) 메시지 시스템, 메시지 정정 방법 및 프로그램 저장 디바이스
US5949854A (en) Voice response service apparatus
US20030074196A1 (en) Text-to-speech conversion system
US6148285A (en) Allophonic text-to-speech generator
US20090228271A1 (en) Method and System for Preventing Speech Comprehension by Interactive Voice Response Systems
US8019605B2 (en) Reducing recording time when constructing a concatenative TTS voice using a reduced script and pre-recorded speech assets
JPH08212228A (ja) 要約文作成装置および要約音声作成装置
JPH09325796A (ja) 文書朗読装置
KR102072627B1 (ko) 음성 합성 장치 및 상기 음성 합성 장치에서의 음성 합성 방법
JP2005070430A (ja) 音声出力装置および方法
JP2019056791A (ja) 音声認識装置、音声認識方法およびプログラム
JP3936351B2 (ja) 音声応答サービス装置
KR100382827B1 (ko) 텍스트투스피치를 이용한 음성 자동 생성 장치 및 방법
JPH10173769A (ja) 音声メッセージ検索装置
JPH08335096A (ja) テキスト音声合成装置
JPH0419799A (ja) 音声合成装置
JP3060276B2 (ja) 音声合成装置
JPH10274999A (ja) 文書読み上げ装置
JP2509523B2 (ja) 車輌用音声出力装置
KR20050041749A (ko) 방송 음성 데이터를 이용한 영역 및 화자 의존 음성 합성장치, 음성 합성용 데이터베이스 구축방법 및 음성 합성서비스 시스템
KR100474282B1 (ko) 자동 음성 안내시스템의 안내음성 생성방법 및 장치
KR20180103273A (ko) 음성 합성 장치 및 음성 합성 방법
JPH10133678A (ja) 音声再生装置
JP2000231396A (ja) セリフデータ作成装置、セリフ再生装置、音声分析合成装置及び音声情報転送装置

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130319

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20140317

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20150313

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee