KR970017171A - 음성합성방법 - Google Patents

음성합성방법 Download PDF

Info

Publication number
KR970017171A
KR970017171A KR1019950030543A KR19950030543A KR970017171A KR 970017171 A KR970017171 A KR 970017171A KR 1019950030543 A KR1019950030543 A KR 1019950030543A KR 19950030543 A KR19950030543 A KR 19950030543A KR 970017171 A KR970017171 A KR 970017171A
Authority
KR
South Korea
Prior art keywords
short
waveform group
syllable
period waveform
synthesis
Prior art date
Application number
KR1019950030543A
Other languages
English (en)
Other versions
KR100202539B1 (ko
Inventor
김상수
Original Assignee
구자홍
Lg 전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, Lg 전자 주식회사 filed Critical 구자홍
Priority to KR1019950030543A priority Critical patent/KR100202539B1/ko
Publication of KR970017171A publication Critical patent/KR970017171A/ko
Application granted granted Critical
Publication of KR100202539B1 publication Critical patent/KR100202539B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L2013/021Overlap-add techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 음성합성방법에 관한 것으로, 종래에는 다이폰이나 반음절의 합성 단위가 안정 구간에서 이루어져야 하는데, 실제로 안정 구간은 거의 발견되지 않음에 따라 반음절간의 결합은 포만트의 차이로 인해 단위간의 자연스런 연결이 이루어지지 않는 문제, 특히 파형코딩방식의 합성에서는 이러한 차이로 인하여 음질의 왜곡을 가져오는 등의 문제점이 있다. 따라서, 직결한 데이타 량과 음질이 원음에서 크게 벗어나지 않을 정도의 단위 선택을 행한다응, 실제로 존재하는 음소를 구한 후 그 구해진 소음 데이타 중 무성음은 PCM의 형태로, 유성음은 저주파 부분의 위상을 제로로하는 단주기 파형군을 구하고 그 단주기 파형군을 운율 정보에 따라 오버랩-애드를 통해 합성을 만들어 냄으로써 음질이 상승되고, 자연스런 합성음을 만들어 내도록 한다.

Description

음성합성방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 본 발명의 음성합성방법에 대한 과정을 보여주는 흐름도,
제3도는 제2도에서, 단주기 파형생성 과정을 보여주는 흐름도.

Claims (2)

  1. 입력되는 텍스트(text)를 한글 문장으로 바꾸는 전처리 과정을 수행하는 제1단계와, 상기 제1단계에서 한글로 변형된 문장의 음운 변동을 처리하고 음절 단위열을 만든 후, 운율정보를 생성하는 제2단계와, 상기 제2단계에서 생성된 음절 단위 열로부터 해당음절의 단주기 파형군을 불러 오는 제3단계와, 상기 제3단계에서 불러온 단주기 파형군을 운율 정보에 따라 오버랩-애드(overlap-add)하여 합성하는 제4단계로 이루어진 것을 특징으로 하는 음성합성방법.
  2. 제1항에 있어서, 단주기 파형군 형성은 음절 단위의 음성 데이타 입력시 그 음성 데이타에 헤밍(hamming)창을 곱하여 숏-타임 시그널을 얻는 단계와, 상기 단계의 숏-타임 시그널에 대하여 FFT(Fast Fourier Transform) 변환을 거쳐 PSE(Power Spectrum Envelop)을 구하는 단계와, 상기 단계에서 구한 PSE를 고주파 부분에만 위상을 넣어 역 FFT 변환을 행하여 한주기의 파형을 생성하는 단계로 이루어진 것을 특징으로 하는 음성합성방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950030543A 1995-09-18 1995-09-18 음성합성방법 KR100202539B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950030543A KR100202539B1 (ko) 1995-09-18 1995-09-18 음성합성방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950030543A KR100202539B1 (ko) 1995-09-18 1995-09-18 음성합성방법

Publications (2)

Publication Number Publication Date
KR970017171A true KR970017171A (ko) 1997-04-30
KR100202539B1 KR100202539B1 (ko) 1999-06-15

Family

ID=19427141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950030543A KR100202539B1 (ko) 1995-09-18 1995-09-18 음성합성방법

Country Status (1)

Country Link
KR (1) KR100202539B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100859532B1 (ko) 2006-11-06 2008-09-24 한국전자통신연구원 대응 문형 패턴 기반 자동통역 방법 및 장치

Also Published As

Publication number Publication date
KR100202539B1 (ko) 1999-06-15

Similar Documents

Publication Publication Date Title
US4624012A (en) Method and apparatus for converting voice characteristics of synthesized speech
Verhelst Overlap-add methods for time-scaling of speech
Macon et al. Speech concatenation and synthesis using an overlap-add sinusoidal model
Macon et al. Concatenation-based midi-to-singing voice synthesis
US20040102975A1 (en) Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect
US7280969B2 (en) Method and apparatus for producing natural sounding pitch contours in a speech synthesizer
JPH02201500A (ja) 音声合成装置
Rama et al. Thirukkural: a text-to-speech synthesis system
KR970017171A (ko) 음성합성방법
CN100508025C (zh) 合成语音的方法和设备及分析语音的方法和设备
EP1543497A1 (en) Method of synthesis for a steady sound signal
Arfib et al. Driving pitch-shifting and time-scaling algorithms with adaptive and gestural techniques
Banga et al. Shape-invariant pitch-synchronous text-to-speech conversion
JP3081300B2 (ja) 残差駆動型音声合成装置
Hande A review on speech synthesis an artificial voice production
Frantz et al. The application of a synthesis-by-rule system to singing
JPH0258640B2 (ko)
Datta et al. Introduction to ESOLA
Jung et al. On a pitch alteration technique of speech using the asymmetry weighted window
KR960024888A (ko) 다이폰 단위를 이용한 엘에스피 (lsp) 방식의 음성 합성 방법
JPS58129500A (ja) 歌声合成装置
CN114974271A (zh) 一种基于声道滤波和声门激励的语音重构方法
Butler et al. Articulatory constraints on vocal tract area functions and their acoustic implications
Ferencz et al. ROMVOX Experiments Regarding Unrestricted Text to Speech Synthesis for the Romanian Language
May et al. Speech synthesis using allophones

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee