KR950004094A - 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법 - Google Patents
음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법 Download PDFInfo
- Publication number
- KR950004094A KR950004094A KR1019930015013A KR930015013A KR950004094A KR 950004094 A KR950004094 A KR 950004094A KR 1019930015013 A KR1019930015013 A KR 1019930015013A KR 930015013 A KR930015013 A KR 930015013A KR 950004094 A KR950004094 A KR 950004094A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- section
- speech synthesis
- synthesis unit
- stable
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 23
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000001308 synthesis method Methods 0.000 title claims abstract 3
- 239000000463 material Substances 0.000 claims abstract description 5
- 239000011295 pitch Substances 0.000 claims 2
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
Abstract
문장 음성 합성에 있어서, 음성 합성 단위를 구축하는 방법은 재료 음성을 프레임으로 분할하여 특징계수들을 산출하는 과정과 상기 재료 음성을 합성 단위의 음성으로 분할하는 과정과 상기 특징계수들을 근거하여 상기 합성 단위 음성이 지속되는 기간을 안정구간 및 변화구간들로 분할하는 과정과 상기 안정구간에서 그에 해당하는 특징계수들에 근거하여 적어도 하나 이상의 특징점을 추출하는 과정 및 상기 합성 단위 음성을 기록하는 것으로서, 변화구간인 경우에는 그의 파형 데이타를 기록하고, 안정구간인 경우에는 추출된 각 특징점에서의 특징계수들과 그의 지속 시간을 기록하며, 동시에 변화구간 및 안정구간임을 구별하는 플래그를 함께 기록하게 되는 과정을 포함한다. 이와 같이 구성된 음성 합성 단위를 이용하는 문장 음성 합성방법은 안정구간인 경우에는 LPC 합성에 의하여 음성신호를 합성하고 변화구간인 경우에는 파형데이타에 대응하는 음성신호를 출력하게 된다. 그리하여 적은 메모리로 음성 합성 단위 데이타 베이스를 구축하면서도 합성 음질을 향상시킬 수 있는 잇점을 갖는다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 일반적인 합성 시스템의 블럭도, 제2도는 본 발명의 따른 음성 합성 단위를 구성하는 방법을 나타낸 순서도, 제3도는 제2도에 도시된 재료 음성 입력 과정을 상세히 나타낸 순서도, 제4도는 제2도에 도시된 특징계수 산출 과정을 상세히 나타낸 순서도.
Claims (6)
- 문장 음성 합성에 있어서, 재료 음성을 프레임으로 분할하여 특징계수들을 산출하는 과정; 상기 재료 음성을 합성 단위의 음성으로 분할하는 과정; 상기 특징계수들을 근거하여 상기 합성 단위 음성이 지속되는 기간을 안정구간 및 변화구간들로 분할하는 과정; 상기 안정구간에서 그에 해당되는 특징계수들에 근거하여 적어도 하나 이상의 특징점에 추출하는 과정;상기 합성 단위 음성을 기록하는 것으로서, 변화구간인 경우에는 그의 파형 데이타를 기록하고, 안정구간인 경우에는 추출된 각 특징점에서의 특징계수들과 그의 지속기간을 기록하며, 동시에 변화구간 및 안정구간임을 구별하는 플래그를 함께 기록하게 되는 과정을 구비하는 것을 특징으로 하는 음성 합성 단위를 구성하는 방법.
- 제1항에 있어서, 상기 특징계수를 추출하는 과정은 선형 예측 필터를 이용하여 로그 면적비(log area ratio), 피치(pitch) 및 에너지를 추출하는 것을 특징으로 하는 음성 합성 단위를 구성하는 방법.
- 제2항에 있어서, 상기 안정구간 및 변화구간들로 분할하는 과정은 에너지가 소정값 이하이고 피치가 검출되지 않는 구간또는 상기 로그 면적비의 단위 시간당 변화량이 소정값 이상인 경우를 변화구간으로 결정하고, 그렇지 않은 구간을 안정구간으로 결정하는 것을 특징으로 하는 음성 합성 단위를 구성하는 방법.
- 문장 음성 합성에 있어서, 문장으로부터 음조 데이터를 추출하는 과정; 문장을 발음표기로 변환시키는 과정; 상기 발음표기를 합성 단위 표기로 변환시키는 과정; 상기 합성 단위 표기에 대응되는 음성 합성 단위 데이타들을 메모리로부터 독출하는 것으로, 음성 합성 단위 데이타는 안정구간인지 변화구간인지를 나타내는 플래그와 함께 안정구간인 경우에는 파형 데이타를 포함하고 변화구간인 경우에는 특징계수들 및 지속 시간을 포함하게 되는 과정; 독출된 음성 합성 단위 데이타들 및 상기 음조 데이타에 근거하여 음성 신호를 합성하여 출력하는 것으로, 변화구간인 경우에는 파형 데이타에 따른음성 신호를 출력하고, 안정구간인 경우에는 상기 특징계수들에 의하여 제어되는 선형 예측 필터를 통하여 해당 지속시간동안 음성 신호를 출력하게 되는 음성 합성 과정을 구비하는 것을 특징으로 하는 문장 음성 합성 방법.
- 제4항에 있어서, 상기 음성 합성 과정에 앞서 메모리로부터 독출된 음성 합성 단위 데이타를 보간하는 과정을 더 구비하는 것을 특징으로 하는 문장 음성 합성 방법
- 제5항에 있어서, 상기 보간과정은 안정구간인지 변화구간인지를 판별하는 과정; 안정구간인 경우 합성 단위의 경계인지 아닌지를 판별하여, 합성 단위의 경계인 부분에서 중간값을 결정한 후 선형보간하는 과정을 구비하는 것을 특징으로 하는 문장 음성 합성 방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019930015013A KR970003092B1 (ko) | 1993-07-31 | 1993-07-31 | 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019930015013A KR970003092B1 (ko) | 1993-07-31 | 1993-07-31 | 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR950004094A true KR950004094A (ko) | 1995-02-17 |
KR970003092B1 KR970003092B1 (ko) | 1997-03-14 |
Family
ID=19360698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019930015013A KR970003092B1 (ko) | 1993-07-31 | 1993-07-31 | 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR970003092B1 (ko) |
-
1993
- 1993-07-31 KR KR1019930015013A patent/KR970003092B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR970003092B1 (ko) | 1997-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4912768A (en) | Speech encoding process combining written and spoken message codes | |
US4709390A (en) | Speech message code modifying arrangement | |
KR100615480B1 (ko) | 음성 대역 확장 장치 및 음성 대역 확장 방법 | |
EP0714089A2 (en) | Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulse excitation signals | |
EP0764937A2 (en) | Method for speech detection in a high-noise environment | |
JPH03501896A (ja) | 波形の加算重畳による音声合成のための処理装置 | |
CN1190236A (zh) | 语音合成系统及其减少冗余的波形数据库 | |
KR950035132A (ko) | 인간의 음성을 나타내는 신호를 합상하는 방법 | |
JPS63285598A (ja) | 音素接続形パラメ−タ規則合成方式 | |
KR960042521A (ko) | 음성 합성 장치 및 낭독 시간 연산 장치 | |
US5321794A (en) | Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method | |
US6219636B1 (en) | Audio pitch coding method, apparatus, and program storage device calculating voicing and pitch of subframes of a frame | |
JP5360489B2 (ja) | 音素符号変換装置および音声合成装置 | |
KR950004094A (ko) | 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법 | |
GB2314747A (en) | Pitch extraction in a speech processing unit | |
US5729657A (en) | Time compression/expansion of phonemes based on the information carrying elements of the phonemes | |
Arroabarren et al. | Glottal spectrum based inverse filtering. | |
JP5560769B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP2536169B2 (ja) | 規則型音声合成装置 | |
KR920008259B1 (ko) | 포만트의 선형전이구간 분할에 의한 한국어 합성방법 | |
JP3088204B2 (ja) | コード励振線形予測符号化装置及び復号化装置 | |
KR100624440B1 (ko) | 음소별 코드북 매핑에 의한 음색변환방법 | |
JP3059751B2 (ja) | 残差駆動型音声合成装置 | |
JPS6162100A (ja) | マルチパルス型符号化復号化装置 | |
Strube et al. | Synthesis of unrestricted German speech from interpolated log-area-ratio coded transitions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20050823 Year of fee payment: 9 |
|
LAPS | Lapse due to unpaid annual fee |