JPS5853359B2 - speech synthesizer - Google Patents

speech synthesizer

Info

Publication number
JPS5853359B2
JPS5853359B2 JP55064974A JP6497480A JPS5853359B2 JP S5853359 B2 JPS5853359 B2 JP S5853359B2 JP 55064974 A JP55064974 A JP 55064974A JP 6497480 A JP6497480 A JP 6497480A JP S5853359 B2 JPS5853359 B2 JP S5853359B2
Authority
JP
Japan
Prior art keywords
pitch
bits
data
input terminal
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55064974A
Other languages
Japanese (ja)
Other versions
JPS56161598A (en
Inventor
憲正 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP55064974A priority Critical patent/JPS5853359B2/en
Publication of JPS56161598A publication Critical patent/JPS56161598A/en
Publication of JPS5853359B2 publication Critical patent/JPS5853359B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 この発明はディジタル音声合成装置、特にその周波数パ
ラメータ復号方式に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a digital speech synthesizer, and particularly to a frequency parameter decoding method thereof.

ディジタル音声合成装置は原音声を特徴づける音源情報
、スペクトル包絡情報を分析抽出し低ビットでディジタ
ル符号化されたパラメータを復号し原音を復元するもの
である。
A digital speech synthesizer analyzes and extracts sound source information and spectral envelope information that characterize the original speech, decodes parameters digitally encoded with low bits, and restores the original speech.

従来この種の装置として第1図に示すものがあった。A conventional device of this type is shown in FIG.

図において1はピッチデータ(周波数の逆数)変換RO
M、2は有声音パルス発生器、3は無声音パルス発生器
、4は切換スイッチ、5は乗算器、6は振巾変換ROM
、7は格子型ディジタルフィルタ、8はディジタルフィ
ルタ係数変換ROM、9はDA変換器、10はスピーカ
ーである。
In the figure, 1 is pitch data (reciprocal of frequency) conversion RO
M, 2 is a voiced pulse generator, 3 is an unvoiced pulse generator, 4 is a changeover switch, 5 is a multiplier, 6 is an amplitude conversion ROM
, 7 is a lattice type digital filter, 8 is a digital filter coefficient conversion ROM, 9 is a DA converter, and 10 is a speaker.

11は有声音ピッチ制御入力が印加される端子、12は
有声音、無声音を切換え制御する信号の入力端子、13
は音源振巾制御入力端子、14はディジタルフィルタ係
数入力端子である。
11 is a terminal to which a voiced sound pitch control input is applied; 12 is an input terminal for a signal that controls switching between voiced and unvoiced sounds; 13
14 is a sound source amplitude control input terminal, and 14 is a digital filter coefficient input terminal.

次に動作について説明する。Next, the operation will be explained.

音声パラメータのうち、有声音の符号化されたピッチ制
御パラメータがピッチ制御入力端子11に与えられる。
Among the voice parameters, encoded pitch control parameters of voiced sounds are applied to the pitch control input terminal 11 .

ピッチ変換ROM1によって復号されたピッチデータに
対応した周期をもつ有声音パルスガ、パルス発生器2か
ら切換スイッチ4を通して送出され、また音源振巾制御
入力端子13より入力された符号化データが振巾変換R
OM6によって復号され、その振巾データーによって乗
算器5で振巾が制御される。
A voiced sound pulse having a period corresponding to the pitch data decoded by the pitch conversion ROM 1 is sent from the pulse generator 2 through the changeover switch 4, and encoded data input from the sound source amplitude control input terminal 13 is amplitude converted. R
The signal is decoded by the OM 6, and the amplitude is controlled by the multiplier 5 based on the amplitude data.

一方無声音パルス発生器3からの無声音源は切換スイッ
チ4を通して乗算器5に送られる。
On the other hand, the unvoiced sound source from the unvoiced sound pulse generator 3 is sent to the multiplier 5 through the changeover switch 4.

乗算器5で振巾制御された音源信号は格子型ディジタル
フィルタ7に供給される。
The sound source signal whose amplitude has been controlled by the multiplier 5 is supplied to a lattice type digital filter 7.

ディジタルフィルタの係数は、ディジタルフィルタ係数
入力端子14より符号化されて入力され、変換ROM8
によって復号されたデータによって制御される。
The coefficients of the digital filter are encoded and inputted from the digital filter coefficient input terminal 14, and are input to the conversion ROM 8.
controlled by the data decoded by

ディジタルフィルタ7の出力をDA変換器9を通し、ス
ピーカ10によって音声を発生するようになっている。
The output of the digital filter 7 is passed through a DA converter 9, and a speaker 10 generates audio.

ところで音源情報のうちピッチパラメータは一般に音声
の標本化周期の整数倍で与えられ、標本化周波数を10
KHzとすると通常の女性は、20〜70ピツチ(14
0〜500H2)、男性では40〜140ピツチ(70
〜250H2)であり、男女を含むピッチデータを量子
化するには7ビツト程度必要である。
By the way, the pitch parameter of the sound source information is generally given as an integral multiple of the audio sampling period, and the sampling frequency is set to 10
If KHz is used, a normal woman would have 20 to 70 pitches (14
0-500H2), 40-140 pitches (70
~250H2), and approximately 7 bits are required to quantize pitch data including men and women.

周波数が低いところの量子化ステップを大きくとるよう
な非線形量子化を行っても、音質劣化を防ぐには6ビツ
ト程度必要であり、その時の変換ROM容量は2’=6
4ワードを要していた。
Even if non-linear quantization is performed that takes a large quantization step at low frequencies, about 6 bits are required to prevent sound quality deterioration, and the conversion ROM capacity at that time is 2' = 6.
It required 4 words.

■ワードを10ビツトとするシステムであれば640ビ
ツトと多くのROM容量を要する欠点があり、またピッ
チパラメータの情報量は、フレーム周期10MSでは6
00ビット/秒、20M5の場合でも300ビット/秒
を要する欠点があった。
■A system in which words are 10 bits has the drawback of requiring a large ROM capacity of 640 bits, and the amount of information for pitch parameters is 640 bits with a frame period of 10 MS.
Even in the case of 00 bits/sec and 20M5, there was a drawback that 300 bits/sec was required.

この発明は上記のような従来の欠点を除去するためにな
されたもので、周波数帯域を指定する情報により、ピッ
チパラメータ変換ROMのデータを定数倍する手段をも
うけることによりピッチ周期変換ROM容量を小さくし
かつ情報量を少くすることができる音声合成装置を提供
するものである。
This invention was made in order to eliminate the above-mentioned drawbacks of the conventional technology, and it is possible to reduce the pitch period conversion ROM capacity by providing a means for multiplying the data in the pitch parameter conversion ROM by a constant based on information specifying the frequency band. Moreover, it is an object of the present invention to provide a speech synthesis device that can reduce the amount of information.

以下この発明の一実施例を図について説明する。An embodiment of the present invention will be described below with reference to the drawings.

第2図において、15ピツチデータを2倍する回路、1
6は周波数帯域を指定する信号の入力端子である。
In Figure 2, a circuit that doubles 15 pitch data, 1
6 is an input terminal for a signal specifying a frequency band.

符号1〜14をつけた部分は、第1図と同じであり説明
を省略する。
The parts numbered 1 to 14 are the same as in FIG. 1, and their explanation will be omitted.

音声パラメータのうち、有声音のピッチ制御パラメータ
がピッチ制御入力端子11に入力される。
Among the voice parameters, pitch control parameters for voiced sounds are input to the pitch control input terminal 11 .

ピッチ変換ROMIによって復号されたピッチデータが
それを2倍することができる回路15におくられ、周波
数帯域情報を指定する入力端子16の情報により2倍又
は1倍されたデータが有声音パルス発生器2におくられ
ピッチデータに対応した有声音パルスを発生する。
The pitch data decoded by the pitch conversion ROMI is sent to a circuit 15 that can double it, and the data multiplied by 2 or 1 depending on the information at the input terminal 16 specifying frequency band information is sent to the voiced pulse generator. 2 to generate voiced sound pulses corresponding to the pitch data.

例えばピッチ変換ROMに女性に対応するピッチデータ
を内蔵するとする。
For example, assume that the pitch conversion ROM contains pitch data corresponding to women.

女性のピッチ範囲は20〜70あれば充分であるから6
ビツトで量子化すればよく、周波数の低いところの量子
化ステップを大きくとっても音質劣化は少いから5ビッ
ト程度で充分である。
A pitch range of 20 to 70 is sufficient for women, so 6
It is sufficient to quantize in bits, and even if the quantization step is increased at low frequencies, there is little deterioration in sound quality, so about 5 bits is sufficient.

男性のピッチ範囲は女性のそれの2倍程度あれば充分で
あり、これは周波数帯域を指定する入力端子16によっ
てピッチデータを2倍する回路15によって得られる。
It is sufficient for the male pitch range to be about twice that of the female, and this is obtained by the circuit 15 which doubles the pitch data using the input terminal 16 that specifies the frequency band.

2倍する回路はシフト演算等によって簡単に実現できる
A doubling circuit can be easily realized by a shift operation or the like.

この例ではピッチ変換ROM容量25=32ワードでよ
く、ピッチパラメータの情報量はフレーム周期10M5
では500ビット/秒、20M5では250ビット/秒
と従来に較べて減少させることができる。
In this example, the pitch conversion ROM capacity is 25 = 32 words, and the amount of information of the pitch parameter is a frame period of 10M5.
This can be reduced to 500 bits/sec for 20M5 and 250 bits/sec for 20M5, compared to the conventional technology.

なお上記実施例ではピッチデータを定数倍する手段とし
てシフト演算による2倍回路を使用したが、1/2回路
であってもよく、又任意の係数を乗する乗算器であって
も良い。
In the above embodiment, a doubling circuit based on a shift operation is used as means for multiplying pitch data by a constant, but a 1/2 circuit or a multiplier for multiplying by an arbitrary coefficient may also be used.

以上のようにこの発明によれば音声合成装置に周波数帯
域を指定する情報によりピッチパラメータ変換ROMの
データを定数倍する手段をもうけたのでピッチ変換RO
M容量を減らすことができ、また情報量を減らすことが
できる効果がある。
As described above, according to the present invention, there is provided a means for multiplying the data in the pitch parameter conversion ROM by a constant based on the information specifying the frequency band in the speech synthesizer.
This has the effect of reducing the M capacity and the amount of information.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来の音声合成装置を示すブロック図、第2図
はこの発明の一実施例による音声合成装置を示すブロッ
ク図である。 1はピッチパラメータ変換ROM、15は定数倍する回
路、16は周波数帯域を指定する入力端子である。
FIG. 1 is a block diagram showing a conventional speech synthesis device, and FIG. 2 is a block diagram showing a speech synthesis device according to an embodiment of the present invention. 1 is a pitch parameter conversion ROM, 15 is a constant multiplication circuit, and 16 is an input terminal for specifying a frequency band.

Claims (1)

【特許請求の範囲】[Claims] 1 音声の特徴パラメータを符号化して伝送し、変換R
OMによって復号したパラメータを用いるディジタル音
声合成装置において、周波数帯域を指定する情報により
ピッチパラメータ変換ROMのデータを定数倍する手段
をもうけたことを特徴とする音声合成装置。
1. Encode and transmit the voice feature parameters and convert R
1. A digital speech synthesis device using parameters decoded by an OM, characterized in that the device includes means for multiplying data in a pitch parameter conversion ROM by a constant based on information specifying a frequency band.
JP55064974A 1980-05-15 1980-05-15 speech synthesizer Expired JPS5853359B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55064974A JPS5853359B2 (en) 1980-05-15 1980-05-15 speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55064974A JPS5853359B2 (en) 1980-05-15 1980-05-15 speech synthesizer

Publications (2)

Publication Number Publication Date
JPS56161598A JPS56161598A (en) 1981-12-11
JPS5853359B2 true JPS5853359B2 (en) 1983-11-29

Family

ID=13273520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55064974A Expired JPS5853359B2 (en) 1980-05-15 1980-05-15 speech synthesizer

Country Status (1)

Country Link
JP (1) JPS5853359B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3586671T2 (en) * 1984-07-04 1993-03-25 Toshiba Kawasaki Kk METHOD AND DEVICE FOR ANALYZING AND SYNTHESISING HUMAN LANGUAGE.

Also Published As

Publication number Publication date
JPS56161598A (en) 1981-12-11

Similar Documents

Publication Publication Date Title
US5701346A (en) Method of coding a plurality of audio signals
US5966689A (en) Adaptive filter and filtering method for low bit rate coding
JPS62234435A (en) Voice coding system
JPS60206336A (en) Digital voice coder having base band remining coding
US3715512A (en) Adaptive predictive speech signal coding system
JPS63142399A (en) Voice analysis/synthesization method and apparatus
US7483830B2 (en) Speech decoder and a method for decoding speech
Makhoul et al. Time-scale modification in medium to low rate speech coding
US4586193A (en) Formant-based speech synthesizer
JP2806308B2 (en) Audio decoding device
US4459674A (en) Voice input/output apparatus
US5794180A (en) Signal quantizer wherein average level replaces subframe steady-state levels
US5687281A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
JPS5853359B2 (en) speech synthesizer
CA2037326A1 (en) Communication apparatus for speech signal
JP2747956B2 (en) Voice decoding device
JPH04249300A (en) Method and device for voice encoding and decoding
JP3010663B2 (en) Noise shaping circuit
JPS62159198A (en) Voice synthesization system
JPS5848920B2 (en) Speech synthesizer sound source creation device
JP2973966B2 (en) Voice communication device
JPS59226398A (en) Digital voice synthesizer
JPH03144600A (en) Voice decoder
JPS60260100A (en) Voice synthesizer
JPH10232699A (en) Lpc vocoder