KR960024888A - 다이폰 단위를 이용한 엘에스피 (lsp) 방식의 음성 합성 방법 - Google Patents

다이폰 단위를 이용한 엘에스피 (lsp) 방식의 음성 합성 방법 Download PDF

Info

Publication number
KR960024888A
KR960024888A KR1019940036104A KR19940036104A KR960024888A KR 960024888 A KR960024888 A KR 960024888A KR 1019940036104 A KR1019940036104 A KR 1019940036104A KR 19940036104 A KR19940036104 A KR 19940036104A KR 960024888 A KR960024888 A KR 960024888A
Authority
KR
South Korea
Prior art keywords
speech synthesis
synthesis method
speech
parameters
lsp
Prior art date
Application number
KR1019940036104A
Other languages
English (en)
Other versions
KR0134707B1 (ko
Inventor
이승훈
강동규
한민수
Original Assignee
양승택
재단법인 한국전자통신연구소
조백제
한국전기통신공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 양승택, 재단법인 한국전자통신연구소, 조백제, 한국전기통신공사 filed Critical 양승택
Priority to KR1019940036104A priority Critical patent/KR0134707B1/ko
Publication of KR960024888A publication Critical patent/KR960024888A/ko
Application granted granted Critical
Publication of KR0134707B1 publication Critical patent/KR0134707B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 한국어 문자를 음성으로 합성하는 방법에 대한 것으로서, 음성을 다이폰 단위로 세분하여 합성 데이타베이스로부터 파라미터를 가져와서 LSP합성방식으로 음성으로 변환하는 방법이다. 본 발명에 사용한 특징으로는 다이폰 단위로의분류와 결합을 효율적으로 세분화하였으며 합성 데이타베이스를 구성하는 경우 각각의 다이폰에 대해서 특수한 경계표시를 하였다. 각각의 경계표시는 다이폰의 유형에 따라서 서로 다른 의미를 가지며 합성단위들을 결합하는 경우 길이의 조절과 결합이 용이하도록 구성하였다. 또한 음성합성기술의 관건은 합성음의 품질이므로 LSP 합성필터의 음원으로 수정된LF 모델과 리지쥬얼(residual)신호를 사용하여 자연성과 명료성을 높이고자 하였다.
본 발명은 현재 늘어가는 정보 통신 서비스와 연결될 경우 합성기술을 이용한 정보검색의 급증으로 새로운 정보제공 기술의 증진을 가져오는 효과를 가진다.

Description

다이폰 단위를 이용한 엘에스피(LSP) 방식의 음성 합성 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

Claims (6)

  1. 완성형으로 표현이 가능한 한국어 문자를 입력받아 전달하는 문자 입력수단(1)과, 상기 문자 입력수단(1)으로 부터 입력된 문자를 전달받아 음성 합성 알고리즘을 수행하는 중앙처리 수단(2)과, 합성 알고리즘에 사용되는 다이폰 단위로 구성된 파라미터를 저장하고 있으며, 상기 중앙처리 수단(2)으로 필요한 파라미터들을 전송하는 합성 데이타베이스(3)와, 상기 중앙처리수단(2)에서 합성이 끝난 디지탈 데이타를 아날로그로 변환하여 외부로 합성음을 출력하는 디지탈/아날로그 변환기(4)를 포함한 장치에 적용되는 음성합성 방법에 있어서, 문자 입력수단(1)을 통해 입력되는 완성형 문자를 변환테이블을 이용하여 3바이트의 내부 코드로 변환하는 한글처리 과정후 알파벳, 숫자 및 제한된 약어처리과정을 수행하는 제 1단계와, 경계분석 및 숨쉬기 처리과정을 통해 운율제어정보를 생성하고, 발음 규칙처리 과정을 통해 한국어의 음운규칙을 적용하여 소리나는 형태의 발음기호열을 생성하는 제 2단계와, 상기 제 2단계에서 생성한 기호열을 이용하여 우선 음소의 길이조절을 수행하는 제3단계와, 상기 제 3단계의 수행결과에 따라 3바이트(byte) 형태로 구성된 각각의 음절을 합성 데이타베이스에 정의된 다이폰 유형으로 변환(160)하는 제 4단계와, 생성된 다이폰들의 인덱스를 이용하여 합성데이타베이스로 부터 파라미터를 가지고 온 후, 인접단위 사이에서 LSP 파라미터의 선형보간 및 에너지 가중치를 이용한 에너지 조절을 수행하는 제 5단계와, 문장의 구조, 의미, 감정등에 대한 정보를 표현하는 기본주파수를 경계분석정보를 이용하여 결정하는 운율제어를 수행하는 제 6단계와, 상기 제 6단계를 거쳐 생성된 합성 파라미터를 이용하여 음성을 합성하는 제7단계를 포함하는 것을 특징으로 하는 음성합성 방법.
  2. 제 1항에 있어서, 상기 제 3단계에서의 길이조절은 입력받은 각각의 발음기호열에 대해서 단어, 구, 절,문장의 경계분석정보와 실험적으로 정한 음소의 최소지속시간과 고유지속시간을 기준으로하여 음절, 음소 순서로 결정하도록 한 것을 특징으로 하는 음성 합성 방법.
  3. 제 1항에 있어서, 상기 제 6단계에서의 운율제어는, P(t)= Pb-(Pb-Pa)*((Tb-t)/(Tb-Ta))**2, Ta〈=tTb, P(t)= Pc, Tb〈=tTc, P(t)=Pb-(Pb-Pd)*((t-Tc)/(Td-Tc))**2, Tc〈=t〈Td이고, Pa, Pb, Pc, Pd는 상수인 이차함수 P(t)를 사용하여 구현한 것을 특징으로 하는 음성 합성 방법.
  4. 제 1항에 있어서, 상기 제 7단계에서의 음성합성은 12차 올 폴(all-poll) LSP필터와 디지탈로 표현된 합성음을 아날로그로 변환하는 D/A 변환기(4)를 이용하여 합성하도록 한 것을 특징으로 하는 음성 합성 방법.
  5. 제 1항에 있어서, 상기 제 5단계에서 합성데이타 베이스로 부터의 파라미터는 피치, 에너지 가중치, LSP파라미터, 리지쥬얼(residual)신호로 구성한 것을 특징으로 하는 음성 합성 방법.
  6. 제 4항에 있어서, 상기 제 7단계에서의 음성합성은 음원으로 수정된 LF모델과 리지쥬얼(residual)신호를사용하여 수행하는 것을 특징으로 하는 음성 합성 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940036104A 1994-12-22 1994-12-22 다이폰 단위를 이용한 엘에스피(lsp)방식의 음성 합성 방법 KR0134707B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940036104A KR0134707B1 (ko) 1994-12-22 1994-12-22 다이폰 단위를 이용한 엘에스피(lsp)방식의 음성 합성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940036104A KR0134707B1 (ko) 1994-12-22 1994-12-22 다이폰 단위를 이용한 엘에스피(lsp)방식의 음성 합성 방법

Publications (2)

Publication Number Publication Date
KR960024888A true KR960024888A (ko) 1996-07-20
KR0134707B1 KR0134707B1 (ko) 1998-05-15

Family

ID=19402986

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940036104A KR0134707B1 (ko) 1994-12-22 1994-12-22 다이폰 단위를 이용한 엘에스피(lsp)방식의 음성 합성 방법

Country Status (1)

Country Link
KR (1) KR0134707B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100429180B1 (ko) * 1998-08-08 2004-06-16 엘지전자 주식회사 음성 패킷의 파라미터 특성을 이용한 오류 검사 방법
US6782106B1 (en) 1999-11-12 2004-08-24 Samsung Electronics Co., Ltd. Apparatus and method for transmitting sound
KR100694767B1 (ko) * 2006-02-25 2007-03-13 안성훈 외부 경고음 인식 장치를 갖는 이어셋 및 이어셋의 외부경고음 인식 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100429180B1 (ko) * 1998-08-08 2004-06-16 엘지전자 주식회사 음성 패킷의 파라미터 특성을 이용한 오류 검사 방법
US6782106B1 (en) 1999-11-12 2004-08-24 Samsung Electronics Co., Ltd. Apparatus and method for transmitting sound
KR100694767B1 (ko) * 2006-02-25 2007-03-13 안성훈 외부 경고음 인식 장치를 갖는 이어셋 및 이어셋의 외부경고음 인식 방법

Also Published As

Publication number Publication date
KR0134707B1 (ko) 1998-05-15

Similar Documents

Publication Publication Date Title
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
JP3408477B2 (ja) フィルタパラメータとソース領域において独立にクロスフェードを行う半音節結合型のフォルマントベースのスピーチシンセサイザ
US7035794B2 (en) Compressing and using a concatenative speech database in text-to-speech systems
O'Malley Text-to-speech conversion technology
Mache et al. Review on text-to-speech synthesizer
WO2006104988B1 (en) Hybrid speech synthesizer, method and use
Kayte et al. Di-phone-Based Concatenative Speech Synthesis Systems for Marathi Language
Indumathi et al. Survey on speech synthesis
Breen Speech synthesis models: a review
US7280969B2 (en) Method and apparatus for producing natural sounding pitch contours in a speech synthesizer
KR100373329B1 (ko) 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법
Kayte et al. A Corpus-Based Concatenative Speech Synthesis System for Marathi
JPH0887297A (ja) 音声合成システム
KR960024888A (ko) 다이폰 단위를 이용한 엘에스피 (lsp) 방식의 음성 합성 방법
JPH01284898A (ja) 音声合成方法
KR20000063774A (ko) 음성합성을 이용하여 문자를 음성으로 변환하는 방법 및 그 단말기
JPS5972494A (ja) 規則合成方式
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP2910587B2 (ja) 音声合成装置
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
JPH02236600A (ja) 合成音声情緒付与回路
Chowdhury Concatenative Text-to-speech synthesis: A study on standard colloquial bengali
Ferencz et al. ROMVOX Experiments Regarding Unrestricted Text to Speech Synthesis for the Romanian Language

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080103

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee