JP2580123B2 - Speech synthesizer - Google Patents

Speech synthesizer

Info

Publication number
JP2580123B2
JP2580123B2 JP61089359A JP8935986A JP2580123B2 JP 2580123 B2 JP2580123 B2 JP 2580123B2 JP 61089359 A JP61089359 A JP 61089359A JP 8935986 A JP8935986 A JP 8935986A JP 2580123 B2 JP2580123 B2 JP 2580123B2
Authority
JP
Japan
Prior art keywords
sound source
waveform
residual waveform
residual
driving sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61089359A
Other languages
Japanese (ja)
Other versions
JPS62245299A (en
Inventor
昭一 佐々部
博雄 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61089359A priority Critical patent/JP2580123B2/en
Publication of JPS62245299A publication Critical patent/JPS62245299A/en
Application granted granted Critical
Publication of JP2580123B2 publication Critical patent/JP2580123B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、音声合成装置,より詳細には、残差駆動に
よる音声合成装置に関する。
Description: TECHNICAL FIELD The present invention relates to a speech synthesis device, and more particularly, to a speech synthesis device using residual driving.

従来技術 従来、スペクトル包絡パラメータ(LPC,PARCOR,LSPな
ど)と音源信号を合成フィルタに入力して合成音声を得
る音声合成方法において、その駆動音源として、有音声
部ではインパルス列、切出した1ピッチ周期残差波形、
平均または代表残差波形など、無音声部では残差波形、
白色雑音(M系列等)などを用いてきた。而して、上記
従来技術は、残差信号を利用することによって音質改善
の効果は見られるが、しかし、残差信号の利用を部分的
あるいは選択的に行なうため、十分な明瞭度、音質を得
られない場合が生じる欠点があった。
2. Description of the Related Art Conventionally, in a speech synthesis method of obtaining a synthesized speech by inputting a spectrum envelope parameter (LPC, PARCOR, LSP, etc.) and a sound source signal to a synthesis filter, as a driving sound source, an impulse train in a voiced portion, a cut out one pitch Periodic residual waveform,
For non-speech parts such as average or representative residual waveforms,
White noise (such as M-sequence) has been used. Although the above-described prior art has an effect of improving sound quality by using the residual signal, however, since the use of the residual signal is performed partially or selectively, sufficient clarity and sound quality are obtained. There was a drawback that sometimes it could not be obtained.

目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、逆フイルタリングにより得られる残差信号か
ら駆動音源信号を生成することにより、従来技術に比し
て高品質の合成音声を得ることを目的としてなされたも
のである。
Object The present invention has been made in view of the above circumstances, and in particular, by generating a driving sound source signal from a residual signal obtained by inverse filtering, it is possible to generate high-quality synthesized speech as compared with the related art. It was made for the purpose of obtaining.

構成 本発明は、上記目的を達成するために、音声波形から
抽出されたスペクトル包絡パラメータと逆フィルタリン
グ処理により抽出された残差波形を用いて音声波形を合
成する音声合成装置において、音声波形から抽出された
スペクトル包絡パラメータを記憶するスペクトル包絡パ
ラメータ記憶部と、前記パラメータから得られた残差波
形及び該残差波形を変形処理した残差波形を記憶する残
差波形記憶部と、逆フィルタリングにより得られた残差
波形を直接駆動音源として直接使用するか、変形処理し
て使用するかを指定する制御データを発生する駆動音源
生成制御部と、該駆動音源生成制御部からの制御データ
に従って、前記残差波形記憶部より読み出された残差波
形データから駆動音源データを作成する駆動音源生成部
と、該駆動音源生成部により作成された駆動音源データ
と、前記スペクトル包絡パラメータ記憶部からのパラメ
ータとを合成する合成フィルタとを有し、破裂性の無声
音部では逆フィルタリングにより得られた残差波形を直
接駆動音源として用い、その他の無声音部では抽出した
残差波形を変形処理した波形を駆動音源として用いるこ
とを特徴としたものである。以下、本発明の実施例に基
づいて説明する。
In order to achieve the above object, the present invention provides a speech synthesizer for synthesizing a speech waveform using a spectrum envelope parameter extracted from a speech waveform and a residual waveform extracted by inverse filtering processing. A spectrum envelope parameter storage unit for storing the obtained spectrum envelope parameter, a residual waveform storage unit for storing a residual waveform obtained from the parameter and a residual waveform obtained by deforming the residual waveform, and a residual waveform storage unit obtained by inverse filtering. Directly using the obtained residual waveform as a direct drive sound source, or a drive sound source generation control unit that generates control data to specify whether to use the transformed sound source, according to control data from the drive sound source generation control unit, A driving sound source generating unit that generates driving sound source data from the residual waveform data read from the residual waveform storage unit; And a synthesis filter for synthesizing the driving sound source data created by the generation unit and the parameters from the spectrum envelope parameter storage unit. In the bursty unvoiced sound part, the residual waveform obtained by inverse filtering is directly used as the driving sound source. In other unvoiced sound portions, a waveform obtained by deforming the extracted residual waveform is used as a driving sound source. Hereinafter, a description will be given based on examples of the present invention.

第1図は、本発明の一実施例を説明するためのブロッ
ク線図で、図中、1はスペクトル包絡パラメータ記憶
部,2は残差波形記憶部,3は駆動音源生成制御部,4は駆動
音源生成部,5は合成フィルタ部,6はD/A変換部,7は出力
端子で、本発明においては、駆動音源波形としてスペク
トル包絡パラメータを抽出する際に生じる残差波形を直
接あるいは変形処理して用いている。
FIG. 1 is a block diagram for explaining an embodiment of the present invention, in which 1 is a spectrum envelope parameter storage unit, 2 is a residual waveform storage unit, 3 is a driving sound source generation control unit, and 4 is A driving sound source generating unit, 5 is a synthesis filter unit, 6 is a D / A converting unit, and 7 is an output terminal.In the present invention, a residual waveform generated when a spectral envelope parameter is extracted as a driving sound source waveform is directly or modified. Used after processing.

駆動音源波形として音声音部ではスペクトル包絡パラ
メータ(LPC,LSPなど)を用いて原音声波形を逆フィル
タリングして得られる予測残差波形の位相特性のみを同
位相に変形した残差波形の1ピッチ周期分を用いて、繰
り返し接続し、振幅を定めるなどの整形をして使用すれ
ばよい。無音声部では前記予測残差波形を直接用いれば
よい。また、無音声部において、破裂部には直接残差波
形を駆動音源とし、摩擦部に残差波形から抽出した複数
の単時間の代表残差をランダムに接続して駆動音源とす
るように制御してもよい。
One pitch of the residual waveform obtained by inverse-filtering the original residual waveform using the spectral envelope parameters (LPC, LSP, etc.) as the driving sound source waveform and transforming only the phase characteristic of the predicted residual waveform to the same phase What is necessary is just to connect repeatedly by using the period, to perform shaping such as determining the amplitude, and use it. In the non-voice portion, the predicted residual waveform may be directly used. In the silent part, control is performed so that the residual waveform is directly used as the driving sound source for the rupture part, and multiple single-time representative residuals extracted from the residual waveform are randomly connected to the friction part as the driving sound source. May be.

第1図において、音声波形から抽出されたスペクトル
包絡パラメータと該パラメータを用いて原音声波形を逆
フィルタリングして得られた残差波形及び該残差波形を
変形処理した残差波形などが各々スペクトル包絡パラメ
ータ記憶部1及び残差波形記憶部2に記憶されている。
駆動音源生成部4では前記残差波形記憶部2より読み出
された残差波形データを制御部3よりの制御データ(ピ
ッチ,振幅,予測残差波形か変形処理した残差波形かを
指示など)に従って選択,接続,整形して駆動音源デー
タが作成され、スペクトル包絡パラメータデータと共に
声道モデル回路である合成フィルタ部5に送られ、該合
成フィルター部5の出力はD/A変換部6を通してアナロ
グ信号に変換され、出力端子部7に合成音声信号が出力
される。
In FIG. 1, a spectrum envelope parameter extracted from an audio waveform, a residual waveform obtained by inverse filtering the original audio waveform using the parameter, a residual waveform obtained by deforming the residual waveform, and the like are each a spectrum. It is stored in the envelope parameter storage unit 1 and the residual waveform storage unit 2.
The driving sound source generation unit 4 converts the residual waveform data read from the residual waveform storage unit 2 into control data (pitch, amplitude, prediction residual waveform or a modified residual waveform, etc.) from the control unit 3. ) Is selected, connected, and shaped to generate driving sound source data, which is sent together with the spectral envelope parameter data to the synthesis filter unit 5 which is a vocal tract model circuit, and the output of the synthesis filter unit 5 is passed through the D / A conversion unit 6. The signal is converted into an analog signal, and a synthesized voice signal is output to the output terminal unit 7.

効果 以上の説明から明らかなように、本発明によると、自
然音声波形からスペクトル包絡パラメータを抽出する際
に生じる残差波形を直接あるいは変形処理して用いるこ
とによって合成音声の音質,明瞭度を向上させることが
できる。
Advantages As is apparent from the above description, according to the present invention, the sound quality and intelligibility of synthesized speech are improved by using the residual waveform generated when extracting the spectral envelope parameter from the natural speech waveform, directly or by using a modified process. Can be done.

【図面の簡単な説明】[Brief description of the drawings]

第1図は、本発明による音声合成装置の実施に使用され
るシステムの一例を説明するためのブロック線図であ
る。 1……スペクトル包絡パラメータ記憶部,2……残差波形
記憶部,3……駆動音源生成制御部,4……駆動音源生成
部,5……合成フィルター,6……D/A変換部,7……出力端
子。
FIG. 1 is a block diagram for explaining an example of a system used for implementing a speech synthesizer according to the present invention. 1 ... Spectral envelope parameter storage unit, 2 ... Residual waveform storage unit, 3 ... Drive sound source generation control unit, 4 ... Drive sound source generation unit, 5 ... Synthesis filter, 6 ... D / A conversion unit, 7 Output terminal.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】音声波形から抽出されたスペクトル包絡パ
ラメータと逆フィルタリング処理により抽出された残差
波形を用いて音声波形を合成する音声合成装置におい
て、音声波形から抽出されたスペクトル包絡パラメータ
を記憶するスペクトル包絡パラメータ記憶部と、前記パ
ラメータから得られた残差波形及び該残差波形を変形処
理した残差波形を記憶する残差波形記憶部と、逆フィル
タリングにより得られた残差波形を直接駆動音源として
直接使用するか、変形処理して使用するかを指定する制
御データを発生する駆動音源生成制御部と、該駆動音源
生成制御部からの制御データに従って、前記残差波形記
憶部より読み出された残差波形データから駆動音源デー
タを作成する駆動音源生成部と、該駆動音源生成部によ
り作成された駆動音源データと、前記スペクトル包絡パ
ラメータ記憶部からのパラメータとを合成する合成フィ
ルタとを有し、破裂性の無声音部では逆フィルタリング
により得られた残差波形を直接駆動音源として用い、そ
の他の無声音部では抽出した残差波形を変形処理した波
形を駆動音源として用いることを特徴とする音声合成装
置。
1. A speech synthesizer for synthesizing a speech waveform using a spectrum envelope parameter extracted from a speech waveform and a residual waveform extracted by inverse filtering, stores a spectrum envelope parameter extracted from the speech waveform. A spectrum envelope parameter storage unit, a residual waveform storage unit for storing a residual waveform obtained from the parameter and a residual waveform obtained by subjecting the residual waveform to a deformation process, and directly driving a residual waveform obtained by inverse filtering A driving sound source generation control unit for generating control data for specifying whether to use directly as a sound source or to use the sound source after transformation processing, and read out from the residual waveform storage unit according to control data from the driving sound source generation control unit. A driving sound source generating unit that generates driving sound source data from the generated residual waveform data, and a driving sound generated by the driving sound source generating unit. Data, and a synthesis filter for synthesizing the parameters from the spectrum envelope parameter storage unit.In the bursty unvoiced part, the residual waveform obtained by the inverse filtering is directly used as a driving sound source, and in other unvoiced parts, A speech synthesizer characterized by using a waveform obtained by transforming an extracted residual waveform as a driving sound source.
JP61089359A 1986-04-18 1986-04-18 Speech synthesizer Expired - Fee Related JP2580123B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61089359A JP2580123B2 (en) 1986-04-18 1986-04-18 Speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61089359A JP2580123B2 (en) 1986-04-18 1986-04-18 Speech synthesizer

Publications (2)

Publication Number Publication Date
JPS62245299A JPS62245299A (en) 1987-10-26
JP2580123B2 true JP2580123B2 (en) 1997-02-12

Family

ID=13968512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61089359A Expired - Fee Related JP2580123B2 (en) 1986-04-18 1986-04-18 Speech synthesizer

Country Status (1)

Country Link
JP (1) JP2580123B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS595917A (en) * 1982-07-01 1984-01-12 Oval Eng Co Ltd Flowmeter
JPS5961891A (en) * 1982-10-01 1984-04-09 松下電器産業株式会社 Encoding of residual signal

Also Published As

Publication number Publication date
JPS62245299A (en) 1987-10-26

Similar Documents

Publication Publication Date Title
JP3294604B2 (en) Processor for speech synthesis by adding and superimposing waveforms
JPH06110498A (en) Speech-element coding in speech synthesis system, pitch adjusting method thereof and voiced-sound synthesis device
JPS62261238A (en) Methode of encoding voice signal
US5381514A (en) Speech synthesizer and method for synthesizing speech for superposing and adding a waveform onto a waveform obtained by delaying a previously obtained waveform
JP2564641B2 (en) Speech synthesizer
JP2580123B2 (en) Speech synthesizer
JPH07200554A (en) Sentence read-aloud device
JP3394281B2 (en) Speech synthesis method and rule synthesizer
JP2866086B2 (en) Residual driven speech synthesis method
JPS62102294A (en) Voice coding system
JPH0876799A (en) Wide band voice signal restoration method
JPS61259300A (en) Voice synthesization system
JP3967571B2 (en) Sound source waveform generation device, speech synthesizer, sound source waveform generation method and program
JP2001100777A (en) Method and device for voice synthesis
JPS5880699A (en) Voice synthesizing system
JPS5965895A (en) Voice synthesization
JPS58168097A (en) Voice synthesizer
JP2674280B2 (en) Speech synthesizer
JPH09258796A (en) Voice synthesizing method
JPS61128299A (en) Voice analysis/analytic synthesization system
Yazu et al. The speech synthesis system for an unlimited Japanese vocabulary
JP2942260B2 (en) Speech synthesizer
JPH0318900A (en) Voice synthesizing device
JPS63262699A (en) Voice analyzer/synthesizer
JPH1185196A (en) Speech encoding/decoding system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees