JP3302075B2 - Synthetic parameter conversion method and apparatus - Google Patents

Synthetic parameter conversion method and apparatus

Info

Publication number
JP3302075B2
JP3302075B2 JP03579893A JP3579893A JP3302075B2 JP 3302075 B2 JP3302075 B2 JP 3302075B2 JP 03579893 A JP03579893 A JP 03579893A JP 3579893 A JP3579893 A JP 3579893A JP 3302075 B2 JP3302075 B2 JP 3302075B2
Authority
JP
Japan
Prior art keywords
frequency
data
power spectrum
cepstrum
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03579893A
Other languages
Japanese (ja)
Other versions
JPH06250692A (en
Inventor
芳則 志賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03579893A priority Critical patent/JP3302075B2/en
Publication of JPH06250692A publication Critical patent/JPH06250692A/en
Application granted granted Critical
Publication of JP3302075B2 publication Critical patent/JP3302075B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To use parameters as they are by conducting a simple transformation of cepstrum.parameters even though the smapling frequency is different during a voice synthesis. CONSTITUTION:F1 [Hz] synthesis cepstrum.parameters, which are transformation object to F2 [Hz] synthesis cepstrum.parameters, are transformed into a logarithmic power.spectrum by conducting a discrete Fourier transform for every frame by a Fourier transformation processing section 1. The logarithmic power.spectrum is inputted to a spectrum data number changing section 2. If F1>F2, the data corresponding to a high frequency side that is higher than F2/2 [Hz] of the spectrum are discarded. If F1<F2, the data with small constant values are added to the high frequency side which is higher than F1/2 [Hz] of the spectrum. The power.spectrum, to which a data number is added or reduced, is discrete Fourier inverse transformed in a Fourier inverse transformation processing section 3 and F2 [Hz] synthesis cepstrum.parameters are obtained.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、ケプストラムを音韻パ
ラメータとする音声合成方式に係り、特に音声信号のサ
ンプリング・分析時と異なるサンプリング周波数で音声
を合成するのに好適なケプストラム・パラメータの変換
方法および装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech synthesizing method using a cepstrum as a phoneme parameter, and more particularly to a method for converting cepstrum parameters suitable for synthesizing speech at a sampling frequency different from that at the time of sampling and analyzing a speech signal. And equipment.

【0002】[0002]

【従来の技術】音声のケプストラムは、周知のように、
人の発声した音声をアナログ/ディジタル(A/D)変
換してディジタル化した後、そのディジタル音声データ
に対してハミング窓等の短時間窓を一定周期でずらしな
がらかけ、各窓内の音声データをフーリエ変換して得ら
れるスペクトルを対数化し、更にフーリエ逆変換するこ
とにより得られる。
2. Description of the Related Art Voice cepstrum, as is well known,
The voice uttered by a person is converted from analog to digital (A / D) and digitized, and a short-time window such as a hamming window is applied to the digital voice data while being shifted at a fixed period, and the voice data in each window is applied. Is obtained by performing logarithmization on a spectrum obtained by performing Fourier transform of, and then performing inverse Fourier transform.

【0003】得られたケプストラムのうち、高次のケプ
ストラムは音声パワー・スペクトルのピッチ成分を、ま
た、低次のケプストラムは音声パワー・スペクトルの包
絡成分を、それぞれ保存している。ケプストラムは、こ
のような性質を利用して、以下に述べる音声の分析合成
や音声の規則合成などに広く使われている。
[0003] Among the obtained cepstrum, the higher-order cepstrum stores the pitch component of the voice power spectrum, and the lower-order cepstrum stores the envelope component of the voice power spectrum. Cepstrum is widely used for analyzing and synthesizing speech and synthesizing rules of speech described below by utilizing such properties.

【0004】まず、音声の分析合成では、アナウンサー
などが発声した音声を上記した方法でケプストラム分析
し、得られたケプストラム・パラメータの各フレーム低
次成分を各フレームの有声・無声情報およびピッチ周波
数と共に保存する。そして、合成時には、これらの情報
をLMA(対数振幅近似)フィルタ等で構成した合成器
に入力し、合成された音声をD/A変換して音声出力す
る。
[0004] First, in the speech analysis and synthesis, the speech uttered by an announcer or the like is cepstrum-analyzed by the above-described method, and the low-order components of each frame of the obtained cepstrum parameters are determined together with the voiced / unvoiced information and pitch frequency of each frame. save. Then, at the time of synthesis, the information is input to a synthesizer configured with an LMA (logarithmic amplitude approximation) filter or the like, and the synthesized voice is D / A converted and output as a voice.

【0005】次に、音声の規則合成では、予め、アナウ
ンサーなどの発声した音声を上記した方法でケプストラ
ム分析し、規則合成の基本単位、例えばCV(子音+母
音連鎖)単位に相当するケプストラム分析フレームか
ら、音声の包絡情報を保持している低次のケプストラム
を取り出し、音声素片として記憶装置に格納しておく。
そして、音声を合成するときには、合成したい音韻系列
に従って上記CV単位の音声素片を補間接続し、これを
音韻パラメータとして、他方で生成したピッチ情報より
なる韻律パラメータと共に、LMAフィルタ等で構成さ
れる合成器に入力し、合成された音声をD/A変換して
音声出力する。
Next, in the rule synthesis of speech, cepstrum analysis is performed in advance on a voice uttered by an announcer or the like by the above-described method, and a cepstrum analysis frame corresponding to a basic unit of rule synthesis, for example, a CV (consonant + vowel chain) unit. Then, a low-order cepstrum holding the envelope information of the voice is extracted and stored in the storage device as a voice unit.
Then, when synthesizing speech, the speech units in CV units are interpolated and connected according to the phoneme sequence to be synthesized, and this is used as a phoneme parameter, and is configured by an LMA filter or the like together with a prosody parameter consisting of pitch information generated on the other side. It is input to the synthesizer, and the synthesized voice is D / A converted and output as voice.

【0006】[0006]

【発明が解決しようとする課題】このように、従来よ
り、ケプストラムを利用した音声の分析合成や音声の規
則合成の技術が知られていた。
As described above, techniques for analyzing and synthesizing speech using cepstrum and rules for synthesizing speech have been known.

【0007】しかし従来は、例えば合成器処理系の処理
速度が遅く、合成器出力の合成音声信号のサンプリング
周波数を低くして、単位時間の演算回数を減らしたいと
きなどのように、ケプストラム・パラメータ作成時のA
/D変換のサンプリング周波数と音声合成時のD/A変
換のサンプリング周波数が異なってくる場合、最初にA
/D変換して分析したケプストラム・パラメータはその
まま使うことができないという不都合があった。例え
ば、分析合成の場合には、次の2つの方法のいずれかを
行って、ケプストラム・パラメータからなる音声データ
を作り直さなければならなかった。 (1)音声を所望のサンプリング周波数でA/D変換し
直し、ケプストラム分析もやり直す。
However, conventionally, for example, when the processing speed of the synthesizer processing system is slow and the sampling frequency of the synthesized speech signal output from the synthesizer is lowered to reduce the number of operations per unit time, cepstrum parameter A at the time of creation
If the sampling frequency of the D / A conversion differs from the sampling frequency of the D / A conversion during speech synthesis,
The cepstrum parameter analyzed by the / D conversion cannot be used as it is. For example, in the case of analysis and synthesis, one of the following two methods has to be performed to regenerate audio data composed of cepstrum parameters. (1) The voice is A / D converted again at a desired sampling frequency, and the cepstrum analysis is performed again.

【0008】(2)既にA/D変換された離散信号デー
タに対して適当なサンプルの間引きを行った後、折り返
し歪みを起こさないように低域ろ過フィルタに通し、ケ
プストラム分析をし直す。
(2) After appropriate sampling of the A / D-converted discrete signal data, the signal is passed through a low-pass filter so that aliasing does not occur, and cepstrum analysis is performed again.

【0009】上記(1),(2)のいずれの方法も、最
初に作成済みのケプストラム・パラメータを用いること
ができないので、音声のA/D変換や間引き処理、ケプ
ストラム・パラメータ分析のやり直しなどを行わなけれ
ばならず、効率が悪い。
In any of the above methods (1) and (2), since the cepstrum parameters that have been created first cannot be used, A / D conversion and decimation processing of speech, re-execution of cepstrum parameter analysis, and the like are performed. Must be done, inefficient.

【0010】また、規則合成の場合を例にとると、上記
分析合成における(1)或いは(2)の手間に加えて、
音声素片の切り出し(必要な音声部分に相当するケプス
トラムフレームの低次ケプストラムの取り出し)をやり
直さなければならず、更に面倒である。
Also, taking the case of rule synthesis as an example, in addition to the labor of (1) or (2) in the above-mentioned analysis synthesis,
It is necessary to redo a speech unit (extraction of a low-order cepstrum of a cepstrum frame corresponding to a necessary speech portion), which is even more troublesome.

【0011】そこで本発明は、音声合成時のサンプリン
グ周波数が異なっても、ケプストラム・パラメータの簡
単な変換だけで、そのまま利用できる合成パラメータ変
換方法および装置を提供することにある。
It is an object of the present invention to provide a method and apparatus for synthesizing parameters which can be used as they are even by simple conversion of cepstrum parameters, even if the sampling frequency during speech synthesis is different.

【0012】[0012]

【課題を解決するための手段】本発明は上記課題を解決
するために、第1の周波数でサンプリングした音声信号
データの分析により得られた第1のケプストラム・パラ
メータを、各フレーム毎に離散フーリエ変換によりパワ
ー・スペクトルに変換し、このパワー・スペクトルの最
高周波数側からデータを切り捨てるか或いは最高周波数
側にデータを付け足すことによってデータ数が増減され
たパワー・スペクトルを離散フーリエ逆変換して第1の
周波数とは異なる第2の周波数で音声合成するための第
2のケプストラム・パラメータを得ることを特徴とする
ものである。
According to the present invention, a first cepstrum parameter obtained by analyzing voice signal data sampled at a first frequency is discrete-Fourier-by-frame for each frame. The power spectrum is converted into a power spectrum by the conversion, and the power spectrum whose number of data is increased or decreased by discarding data from the highest frequency side of the power spectrum or adding data to the highest frequency side is inversely transformed by a discrete Fourier transform. And obtaining a second cepstrum parameter for speech synthesis at a second frequency different from the second frequency.

【0013】[0013]

【作用】上記の構成においては、第1の周波数でA/D
変換してケプストラム分析して得られた音声の第1のケ
プストラム・パラメータから、第2の周波数で音声合成
するための第2のケプストラム・パラメータを得たい場
合、まず第1のケプストラム・パラメータを各フレーム
毎に離散フーリエ変換によりパワー・スペクトルに変換
した後、そのパワー・スペクトルの最高周波数側からデ
ータを切り捨てるか(第1の周波数>第2の周波数の場
合)或いは最高周波数側に低周波数部分より小さな値の
データを付け足して(第1の周波数<第2の周波数の場
合)、パワー・スペクトルのデータ数を増減させること
により、周波数領域を縮小或いは拡大した新たなパワー
・スペクトルを得ることができ、この新たなパワー・ス
ペクトルを離散フーリエ逆変換することにより、第2の
周波数(サンプリング周波数)で分析したものと同等の
第2のケプストラム・パラメータを得ることができる。
In the above configuration, A / D conversion is performed at the first frequency.
When it is desired to obtain second cepstrum parameters for speech synthesis at a second frequency from first cepstrum parameters of speech obtained by conversion and cepstrum analysis, first the first cepstrum parameters must be After converting into a power spectrum by the discrete Fourier transform for each frame, data may be discarded from the highest frequency side of the power spectrum (in the case of first frequency> second frequency) or from the lower frequency part to the highest frequency side. By adding data of a small value (when the first frequency <the second frequency) and increasing or decreasing the number of data of the power spectrum, a new power spectrum in which the frequency domain is reduced or expanded can be obtained. , By performing an inverse discrete Fourier transform of this new power spectrum, the second frequency (sampler It is possible to obtain the second cepstral parameters comparable to those analyzed in grayed frequency).

【0014】このように、一度A/D変換したケプスト
ラムを分析して得られたケプストラム・パラメータか
ら、異なったサンプリング周波数でA/D変換して分析
したケプストラム・パラメータと同等のケプストラム・
パラメータを得ることができるので、再サンプリングや
間引き、低域ろ過フィルタ処理、再分析等を行う必要が
なく、最初に作った音声素片から変換できるために無駄
がなく極めて効率的である。
As described above, the cepstrum parameters obtained by analyzing the cepstrum once A / D converted once are converted into cepstrum parameters equivalent to the cepstrum parameters analyzed by A / D conversion at different sampling frequencies.
Since the parameters can be obtained, there is no need to perform resampling, thinning, low-pass filtering, reanalysis, and the like, and the speech can be converted from the first speech unit, so that there is no waste and the efficiency is extremely high.

【0015】[0015]

【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は同実施例における合成パラメータ(ケプ
ストラム・パラメータ)変換装置の構成を示すブロック
図ある。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a synthesizing parameter (cepstrum parameter) converter according to the embodiment.

【0016】図1に示す装置は、第1のサンプリング周
波数F1[Hz] でA/D変換した音声信号データを分析し
て得られたケプストラム・パラメータ(F1[Hz] 合成用
ケプストラム・パラメータ)を、第2のサンプリング周
波数F2[Hz] の音声合成用のケプストラム・パラメータ
(F2[Hz] 合成用ケプストラム・パラメータ)に変換す
る(合成音サンプリング周波数変換の)ためのもので、
フーリエ変換処理部1、スペクトルデータ数変更部2、
およびフーリエ逆変換処理部3から構成される。フーリ
エ変換処理部1は、F1[Hz] 合成用ケプストラム・パラ
メータを、各フレーム毎に離散フーリエ変換により、パ
ワー・スペクトルに変換する。
The apparatus shown in FIG. 1 converts a cepstrum parameter (F1 [Hz] synthesis cepstrum parameter) obtained by analyzing audio signal data A / D converted at a first sampling frequency F1 [Hz]. , For converting to a cepstrum parameter for speech synthesis (F2 [Hz] cepstrum parameter for synthesis) at a second sampling frequency F2 [Hz] (for converting a synthesized sound sampling frequency),
Fourier transform processing unit 1, spectrum data number changing unit 2,
And an inverse Fourier transform processing unit 3. The Fourier transform processing unit 1 transforms the cepstrum parameter for F1 [Hz] synthesis into a power spectrum by discrete Fourier transform for each frame.

【0017】スペクトルデータ数変更部2は、フーリエ
変換処理部1から変換出力されるパワー・スペクトルを
対象として、F1 とF2 の大小関係に応じ、最高周波数
側からデータを切り捨てるか(F1 >F2 の場合)、或
いは最高周波数側にデータを付け足す(F1 <F2 の場
合)データ数変更処理を行う。
The number-of-spectral-data changing unit 2 determines whether to cut off data from the highest frequency side (F1> F2) for the power spectrum converted and output from the Fourier transform processing unit 1 according to the magnitude relationship between F1 and F2. ) Or add data to the highest frequency side (if F1 <F2) and perform a data number change process.

【0018】フーリエ逆変換処理部3は、スペクトルデ
ータ数変更部2によりデータ数が増減されたパワー・ス
ペクトルを離散フーリエ逆変換してF2[Hz] 合成用ケプ
ストラム・パラメータを生成する。
The inverse Fourier transform processing unit 3 performs an inverse discrete Fourier transform of the power spectrum whose number of data has been increased / decreased by the spectrum data number changing unit 2 to generate a cepstrum parameter for F 2 [Hz] synthesis.

【0019】次に、図1のように構成された合成パラメ
ータ変換装置の動作を、F1[Hz] 合成用のケプストラム
・パラメータがm次(但し、m<256)のケプストラ
ム・パラメータC0 〜Cm であるものとして、同パラメ
ータをF2[Hz] 合成用のケプストラム・パラメータに変
換する場合を例に、図2のフローチャートを参照して説
明する。
Next, the operation of the synthesizing parameter conversion device configured as shown in FIG. 1 will be described. The cepstrum parameters for F1 [Hz] synthesis are the m-th order (where m <256) cepstrum parameters C 0 -C. An example in which the parameter is converted to a cepstrum parameter for F2 [Hz] synthesis assuming m is described with reference to the flowchart in FIG.

【0020】図1の装置の(うち、スペクトルデータ数
変更部2の)動作は、F1 とF2 の大小関係により異な
る。そこで、まずF1 >F2 の場合の動作を、図3の動
作説明図を併用して説明する。
The operation of the apparatus shown in FIG. 1 (of which the number of spectrum data changing unit 2 is different) differs depending on the magnitude relationship between F1 and F2. Therefore, the operation when F1> F2 will be described first with reference to the operation explanatory diagram of FIG.

【0021】まず、フーリエ変換処理部1は、サンプリ
ング周波数F1[Hz] でA/D変換した音声信号データを
分析して得られたm次ケプストラム・パラメータC0
mを、
First, the Fourier transform processing unit 1 analyzes m-th order cepstrum parameters C 0 -C obtained by analyzing the audio signal data A / D converted at the sampling frequency F 1 [Hz].
C m ,

【0022】[0022]

【数1】 (Equation 1)

【0023】というように配列Xにセットする(ステッ
プS1)。そしてフーリエ変換処理部1は、この配列X
に対して、256点の離散フーリエ変換を行い、対数パ
ワー・スペクトルを得る(ステップS2)。この際、周
知の高速フーリエ変換(FET)のアルゴリズムが利用
される。
Thus, the array X is set (step S1). Then, the Fourier transform processing unit 1 calculates the array X
Is subjected to a discrete Fourier transform of 256 points to obtain a logarithmic power spectrum (step S2). At this time, a well-known fast Fourier transform (FET) algorithm is used.

【0024】さて、フーリエ変換処理部1が上記の配列
Xに対してフーリエ変換を行うと、例えば図3(a)に
示すm次ケプストラム・パラメータから、同図(b)に
示すように、0[Hz]からナイキスト周波数にあたるF1
/2[Hz]の範囲の対数パワー・スペクトルが高周波側で
折り返された形で得られる。フーリエ変換処理部1によ
り対数パワー・スペクトルが得られると、スペクトルデ
ータ数変更部2が起動される。
When the Fourier transform processing unit 1 performs a Fourier transform on the array X, for example, from the m-th order cepstrum parameter shown in FIG. 3 (a), as shown in FIG. F1 from [Hz] to Nyquist frequency
A logarithmic power spectrum in the range of / 2 [Hz] is obtained in a folded form on the high frequency side. When the logarithmic power spectrum is obtained by the Fourier transform processing unit 1, the spectrum data number changing unit 2 is activated.

【0025】スペクトルデータ数変更部2は、まずF1
とF2 の大小を判別し(ステップS3)、この例のよう
にF1 >F2 の場合には、上記の対数パワー・スペクト
ル、即ち図3(b)に示すように折り返された形の対数
パワー・スペクトルに対して、以下のような処理を行
う。
The number-of-spectral-data changing unit 2 firstly selects F1
And F2 is determined (step S3). If F1> F2 as in this example, the logarithmic power spectrum, that is, the logarithmic power spectrum folded back as shown in FIG. The following processing is performed on the spectrum.

【0026】スペクトルデータ数変更部2は、図3
(b)に示す上記折り返された対数パワー・スペクトル
のうち、F2 /2[Hz]より高周波側に相当するデータ
(図中斜線が施された中央部のデータ)を切り捨て、同
図(c)に示すようにデータ点数を256×F2 /F1
ポイントに減らす(ステップS4)。このデータ点数が
減らされた図3(c)に示すスペクトルデータは、0[H
z]からF2 /2[Hz]の周波数範囲の対数パワー・スペク
トルを高周波側で折り返した形になっている。これは、
サンプリング周波数F2 でA/D変換し、256×F2
/F1 ポイントの窓をかけ離散フーリエ変換して得られ
る対数パワー・スペクトルと殆ど同じである。
FIG.
In the folded logarithmic power spectrum shown in (b), the data corresponding to the higher frequency side than F2 / 2 [Hz] (the data in the hatched portion in the figure) is discarded, and FIG. The number of data points is 256 × F2 / F1 as shown in FIG.
It is reduced to points (step S4). The spectrum data shown in FIG. 3C with the reduced number of data points is 0 [H
The logarithmic power spectrum in the frequency range from z] to F2 / 2 [Hz] is folded on the high frequency side. this is,
A / D conversion at the sampling frequency F2, 256 × F2
This is almost the same as the logarithmic power spectrum obtained by performing a discrete Fourier transform by windowing the / F1 point.

【0027】このように、F1 >F2 の場合には、フー
リエ変換処理部1により得られた図3(b)に示す対数
パワー・スペクトルのF2 /2[Hz]より高周波側に相当
するデータがスペクトルデータ数変更部2によって間引
かれて、そのデータ点数が同図(c)に示すように25
6×F2 /F1 ポイントに減らされる。フーリエ変換処
理部1によりデータ点数が減らされた新たな対数パワー
・スペクトルが得られると、フーリエ逆変換処理部3が
起動される。
As described above, when F1> F2, data corresponding to a higher frequency side than F2 / 2 [Hz] of the logarithmic power spectrum obtained by the Fourier transform processing unit 1 shown in FIG. The data points are thinned out by the spectrum data number changing unit 2 and the number of data points is reduced to 25 as shown in FIG.
It is reduced to 6 x F2 / F1 points. When a new logarithmic power spectrum whose number of data points is reduced by the Fourier transform processing unit 1 is obtained, the Fourier inverse transform processing unit 3 is activated.

【0028】フーリエ逆変換処理部3は、このデータ点
数が256×F2 /F1 ポイントに減らされた図3
(c)に示す対数パワー・スペクトルを、離散フーリエ
逆変換する(ステップS6)。これにより、サンプリン
グ周波数F2[Hz] でサンプリングし分析したものと同等
の図3(d)に示すような新たなケプストラム・パラメ
ータ、即ちF2[Hz] 合成用ケプストラム・パラメータが
得られる。次に、F1 <F2 の場合の動作を、図4の動
作説明図を併用して説明する。
The inverse Fourier transform processing unit 3 determines that the number of data points is reduced to 256 × F2 / F1 points in FIG.
The inverse Fourier transform of the logarithmic power spectrum shown in (c) is performed (step S6). As a result, a new cepstrum parameter as shown in FIG. 3D equivalent to that obtained by sampling at the sampling frequency F2 [Hz], that is, a cepstrum parameter for F2 [Hz] synthesis is obtained. Next, the operation when F1 <F2 will be described with reference to the operation explanatory diagram of FIG.

【0029】このF1<F2 の場合の動作が、前記した
F1 >F2 の場合の動作と異なるのは、スペクトルデー
タ数変更部2によりデータ点数が増やされる点であり、
他のフーリエ変換処理部1の動作(ステップS1,S
2)とフーリエ逆変換処理部3の動作(ステップS6)
はF1 >F2 の場合と同様である。このため、F1 合成
用ケプストラム・パラメータが、図4(a)に示すよう
に、図3(a)のケプストラム・パラメータと同一であ
るならば、フーリエ変換処理部1により得られる対数パ
ワー・スペクトルも、図4(b)に示すように、図3
(b)のパワー・スペクトルと同一となる。
The operation in the case of F1 <F2 is different from the operation in the case of F1> F2 in that the number of data points is increased by the spectrum data number changing unit 2.
Operation of Other Fourier Transform Processing Unit 1 (Steps S1, S1
2) and the operation of the inverse Fourier transform processing unit 3 (step S6)
Is the same as in the case of F1> F2. For this reason, if the cepstrum parameter for F1 synthesis is the same as the cepstrum parameter in FIG. 3A as shown in FIG. 4A, the logarithmic power spectrum obtained by the Fourier transform processing unit 1 is also obtained. As shown in FIG.
This is the same as the power spectrum of (b).

【0030】スペクトルデータ数変更部2は、フーリエ
変換処理部1により図4(b)に示す対数パワー・スペ
クトルが得られると、即ち0[Hz]からF1 /2[Hz]の範
囲の対数パワー・スペクトルが高周波側で折り返された
形の対数パワー・スペクトルが得られると、F1 とF2
の大小を判別する(ステップS3)。
When the Fourier transform processing unit 1 obtains the logarithmic power spectrum shown in FIG. 4B, the spectrum data number changing unit 2 changes the logarithmic power in the range from 0 [Hz] to F1 / 2 [Hz]. When a logarithmic power spectrum with a spectrum folded on the high frequency side is obtained, F1 and F2
Is determined (step S3).

【0031】この例のようにF1 <F2 の場合には、ス
ペクトルデータ数変更部2は、図4(b)に示すように
折り返された形の対数パワー・スペクトルのF1 /2[H
z]より高周波側に、例えば対数パワーとしては低周波数
部分に比べて小さな一定値のデータを追加し、同図
(c)に示すようにデータ点数を256×F2 /F1 ポ
イントに増やす(ステップS5)。このデータ点数が増
やされた図4(c)に示すスペクトルデータは、0[Hz]
からF2 /2[Hz]の周波数範囲の対数パワー・スペクト
ルを高周波側で折り返した形になっている。これは、周
波数F1[Hz] の急峻な低域ろ過フィルタを通した音声を
サンプリング周波数F2 でA/D変換し、256×F2
/F1 ポイントの窓をかけ離散フーリエ変換して得られ
る対数パワー・スペクトルと同等のものである。
In the case of F1 <F2 as in this example, the spectrum data number changing section 2 sets the F1 / 2 [H of the folded logarithmic power spectrum as shown in FIG. 4B.
z], on the higher frequency side, for example, add data of a constant value smaller than that of the low frequency part as log power, and increase the number of data points to 256 × F2 / F1 points as shown in FIG. ). The spectrum data shown in FIG. 4C in which the number of data points is increased is 0 [Hz].
The logarithmic power spectrum in the frequency range from F2 to F2 [Hz] is folded on the high frequency side. The A / D conversion is performed on the sound that has passed through a steep low-pass filter having a frequency of F1 [Hz] at a sampling frequency of F2, and 256 × F2
This is equivalent to a logarithmic power spectrum obtained by performing a discrete Fourier transform with a window of / F1 point.

【0032】このように、F1 <F2 の場合には、フー
リエ変換処理部1により得られた図4(b)に示す対数
パワー・スペクトルのF1 /2[Hz]より高周波側に、低
周波数部分に比べて小さな値のデータがスペクトルデー
タ数変更部2によって付け足されて、そのデータ点数が
同図(c)に示すように256×F2 /F1 ポイントに
増やされる。
As described above, when F 1 <F 2, the low-frequency portion is shifted to a higher frequency side than F 1/2 [Hz] of the logarithmic power spectrum obtained by the Fourier transform processing section 1 and shown in FIG. Is added by the spectrum data number changing unit 2, and the number of data points is increased to 256 × F2 / F1 points as shown in FIG.

【0033】そこで、このデータ点数が増やされた図4
(c)に示す対数パワー・スペクトルを、フーリエ逆変
換処理部3で離散フーリエ逆変換することにより、サン
プリング周波数F2[Hz] でサンプリングし分析したもの
と同等の図4(d)に示すようなF2[Hz] 合成用ケプス
トラム・パラメータを得ることができる。以上の合成パ
ラメータ(ケプストラム・パラメータ)変換を、分析合
成に応用する場合について、図5(a),(b)を参照
して説明する。図5(a),(b)は音声合成装置のブ
ロック構成を示す。
Therefore, FIG. 4 in which the number of data points is increased
The logarithmic power spectrum shown in (c) is subjected to discrete Fourier inverse transform by the inverse Fourier transform processing unit 3, thereby obtaining a sample at the sampling frequency F2 [Hz] and analyzing it as shown in FIG. F2 [Hz] Cepstrum parameters for synthesis can be obtained. A case where the above-described synthesis parameter (cepstrum parameter) conversion is applied to analysis and synthesis will be described with reference to FIGS. 5 (a) and 5 (b). FIGS. 5A and 5B show a block configuration of the speech synthesizer.

【0034】まず図5(a)の音声合成装置は、記憶部
11と、音源生成部12と、音声合成演算部13と、1
2kHzのD/A変換部14と、ローパスフィルタ15
とから構成される周知の構成を有している。
First, the speech synthesizer shown in FIG. 5A includes a storage unit 11, a sound source generation unit 12, a speech synthesis operation unit 13,
2 kHz D / A converter 14 and low-pass filter 15
And a well-known configuration composed of

【0035】この音声合成装置の記憶部11では、文や
単語を読み上げた音声を12kHzでサンプリングし、
分析して得られる例えば20次(m=20)ケプストラ
ム・パラメータ(12kHz合成用ケプストラム・パラ
メータ)がケプストラム・パラメータ記憶部111に、
合成すべき有声・無声情報が有声・無声情報記憶部11
2に、ピッチ情報がピッチ情報記憶部113に、それぞ
れ保持される。そして、有声・無声情報記憶部112の
内容とピッチ情報記憶部113の内容から音源生成部1
2にて音源データを生成し、この音源データとケプスト
ラム・パラメータ記憶部111の内容から、LMAフィ
ルタを構成した音声合成演算部(LMAフィルタ演算
部)13にて音声信号データを生成する。この音声信号
データに対して、D/A変換部14で12kHzのD/
A変換を行い、ローパスフィルタ15を通す。このよう
にして、12kHzのサンプリングの音声が合成され
る。
In the storage unit 11 of the speech synthesizer, a speech read out from a sentence or word is sampled at 12 kHz,
For example, a 20th-order (m = 20) cepstrum parameter (12 kHz synthesis cepstrum parameter) obtained by analysis is stored in the cepstrum parameter storage unit 111.
The voiced / unvoiced information to be synthesized is a voiced / unvoiced information storage unit 11
2 is stored in the pitch information storage unit 113. Then, based on the contents of the voiced / unvoiced information storage unit 112 and the contents of the pitch information storage unit 113, the sound source generation unit 1
2, sound source data is generated, and from the sound source data and the contents of the cepstrum / parameter storage unit 111, voice signal data is generated by a voice synthesis calculation unit (LMA filter calculation unit) 13 configuring an LMA filter. The D / A converter 14 converts this audio signal data into a 12 kHz D / A signal.
A conversion is performed and the signal is passed through a low-pass filter 15. In this way, a 12-kHz sampling voice is synthesized.

【0036】一方、図5(b)の音声合成装置も、図5
(a)の音声合成装置と同様の構成を有しており、記憶
部21と、音源生成部22と、音声合成演算部23と、
D/A変換部24と、ローパスフィルタ25とから構成
されている。但し、この図5(b)の音声合成装置は、
音声合成演算部(LMAフィルタ演算部)23の演算速
度が遅いため、12kHzの音声信号を合成しようとす
ると演算時間が極めて長く実用化に向かないことから、
単位時間の演算回数が半分で済む6KHzの音声信号を
合成するようになっている。このため、図5(a)のD
/A変換部14と異なり、6kHzのD/A変換を行う
D/A変換部24を用いている。
On the other hand, the speech synthesizer shown in FIG.
It has a configuration similar to that of the voice synthesizer of FIG. 1A, and includes a storage unit 21, a sound source generation unit 22, a voice synthesis operation unit 23,
It comprises a D / A converter 24 and a low-pass filter 25. However, the speech synthesizer of FIG.
Since the operation speed of the speech synthesis operation unit (LMA filter operation unit) 23 is slow, the operation time is extremely long when attempting to synthesize a 12 kHz audio signal.
A 6 KHz audio signal that requires only half the number of calculations per unit time is synthesized. For this reason, D in FIG.
Unlike the / A converter 14, a D / A converter 24 that performs 6 kHz D / A conversion is used.

【0037】さて、このような図5(b)の音声合成装
置にて、図5(a)に示す記憶部11に入っている音声
と同様の内容を合成したい場合には、図1に示す合成パ
ラメータ変換装置を用いればよい。即ち、図2のフロー
チャート(アルゴリズム)中のF1 ,F2 を、 F1 =12[kHz] F2 = 6[kHz]
When it is desired to synthesize the same content as the voice stored in the storage unit 11 shown in FIG. 5A by such a voice synthesizer as shown in FIG. A synthesis parameter conversion device may be used. That is, F1 and F2 in the flow chart (algorithm) of FIG. 2 are calculated as follows: F1 = 12 [kHz] F2 = 6 [kHz]

【0038】として、合成パラメータ変換装置により、
12KHzサンプリングの音声データから分析したケプ
ストラム・パラメータを、サンプリング周波数6KHz
でサンプリングし分析したものと同等のケプストラム・
パラメータに変換し、これを図5(b)の音声合成装置
のケプストラム・パラメータ記憶部211に保持して用
いればよい。以上、本発明の一実施例についた説明した
が、本発明は前記実施例に限定されるものではない。例
えば、フーリエ変換に関し、前記実施例では256点の
フーリエ変換を用いたが、データ点数、フーリエ変換の
アルゴリズムについては何ら限定されない。
As described above, by the synthesis parameter conversion device,
The cepstrum parameter analyzed from the voice data of the sampling of 12 kHz is converted to the sampling frequency of 6 kHz.
Cepstrum equivalent to that sampled and analyzed in
The parameters may be converted and stored in the cepstrum / parameter storage unit 211 of the speech synthesizer in FIG. As mentioned above, although one Example of this invention was described, this invention is not limited to said Example. For example, regarding the Fourier transform, the Fourier transform of 256 points is used in the above embodiment, but the number of data points and the algorithm of the Fourier transform are not limited at all.

【0039】また、前記実施例では、F1 <F2 のと
き、スペクトルデータ数変更部2により、図4(c)に
示したように、最も高周波側(スペクトルデータ中心
部)に、対数パワーとしては低周波数部分に比べて小さ
な一定値のデータを付加することで、データ点数を増や
す場合について説明したが、合成音に悪影響を及ぼさな
い範囲で、例えば図6のように、付加するスペクトル部
分に傾斜を与えたり(図6(a)の場合)、ピークを加
えたりしてもよい(図6(b)の場合)。
In the above embodiment, when F1 <F2, as shown in FIG. 4C, the spectrum data number changing unit 2 changes the logarithmic power to the highest frequency side (the center of the spectrum data). A case has been described where the number of data points is increased by adding data of a fixed value that is smaller than that of the low frequency portion. However, as shown in FIG. 6, for example, as shown in FIG. (In the case of FIG. 6A) or a peak may be added (in the case of FIG. 6B).

【0040】また、図5に示した応用例は、音声の分析
合成の例であるが、ケプストラム・パラメータを音声素
片として用いる音声の規則合成方式で、音声素片の変換
に用いることも可能である。要するに本発明はその要旨
を逸脱しない範囲で種々変形して実施することができ
る。
Although the application example shown in FIG. 5 is an example of speech analysis and synthesis, it is a speech synthesis method using cepstrum parameters as speech segments, and can be used for speech segment conversion. It is. In short, the present invention can be variously modified and implemented without departing from the gist thereof.

【0041】[0041]

【発明の効果】以上説明したように本発明によれば、音
声信号データの分析により得られたケプストラム・パラ
メータを、各フレーム毎に離散フーリエ変換によりパワ
ー・スペクトルに変換し、このパワー・スペクトルの最
高周波数側からデータを切り捨てるか或いは最高周波数
側にデータを付け足すことによってデータ数が増減され
たパワー・スペクトルを離散フーリエ逆変換する構成と
したので、異なった周波数でサンプリングして分析した
ケプストラム・パラメータと同等のケプストラム・パラ
メータを得ることができる。
As described above, according to the present invention, the cepstrum parameter obtained by analyzing the audio signal data is converted into a power spectrum by a discrete Fourier transform for each frame. Since the power spectrum whose number of data has been increased or decreased by truncating the data from the highest frequency side or adding data to the highest frequency side is inversely transformed by discrete Fourier transform, cepstrum parameters sampled and analyzed at different frequencies The cepstrum parameter equivalent to can be obtained.

【0042】したがって本発明によれば、例えば合成器
処理系の固有の処理速度のために、単位時間の演算回数
を減らす必要があり、合成音声信号のサンプリング周波
数を低くしたい場合でも、一度A/D変換してケプスト
ラム分析し、必要なフレームを切り出したケプストラム
・パラメータから、異なった周波数(目的の周波数)で
サンプリングして分析したケプストラム・パラメータと
同等のケプストラム・パラメータを簡単に得ることがで
き、サンプリングのやり直しや間引き、低域ろ過フィル
タ処理、分析・素片の切り出しのやり直し等を行う労力
が省け、初めに作ったケプストラム・パラメータから変
換できるので無駄がない。
Therefore, according to the present invention, it is necessary to reduce the number of operations per unit time due to, for example, the inherent processing speed of the synthesizer processing system. From the cepstrum parameters obtained by D-conversion and cepstrum analysis, necessary frames are cut out, cepstrum parameters equivalent to cepstrum parameters sampled and analyzed at different frequencies (target frequencies) can be easily obtained. Efforts such as re-sampling and thinning, low-pass filtering, analysis / slicing-out, and the like are eliminated, and there is no waste since conversion can be performed from the initially created cepstrum parameters.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例に係る合成パラメータ(ケプ
ストラム・パラメータ)変換装置の構成を示すブロック
図。
FIG. 1 is a block diagram showing a configuration of a synthesis parameter (cepstrum parameter) conversion device according to an embodiment of the present invention.

【図2】図1の装置による合成音サンプリング周波数変
換のための合成パラメータ(ケプストラム・パラメー
タ)変換処理の手順を示すフローチャート。
FIG. 2 is a flowchart showing a procedure of a synthesis parameter (cepstrum parameter) conversion process for converting a synthesized sound sampling frequency by the apparatus of FIG. 1;

【図3】F1[Hz] 合成用ケプストラム・パラメータから
それより周波数の低いF2[Hz]合成用ケプストラム・パ
ラメータを得る場合の動作を説明するための図。
FIG. 3 is a diagram for explaining an operation when obtaining an F2 [Hz] synthesis cepstrum parameter having a lower frequency than the F1 [Hz] synthesis cepstrum parameter;

【図4】F1[Hz] 合成用ケプストラム・パラメータから
それより周波数の高いF2[Hz]合成用ケプストラム・パ
ラメータを得る場合の動作を説明するための図。
FIG. 4 is a diagram for explaining an operation in a case where an F2 [Hz] synthesis cepstrum parameter having a higher frequency than the F1 [Hz] synthesis cepstrum parameter is obtained;

【図5】分析合成への応用例を示す図であり、同図
(a)はサンプリング周波数12kHzの音声を合成す
る音声合成装置のブロック構成図、同図(b)はサンプ
リング周波数6kHzの音声を合成する音声合成装置の
ブロック構成図。
5A and 5B are diagrams showing an example of application to analysis and synthesis. FIG. 5A is a block diagram of a speech synthesizer that synthesizes speech having a sampling frequency of 12 kHz, and FIG. FIG. 2 is a block diagram of a speech synthesizer for synthesizing.

【図6】図4(c)に示すデータ付加方式の変形例を示
す図。
FIG. 6 is a diagram showing a modification of the data addition method shown in FIG. 4 (c).

【符号の説明】[Explanation of symbols]

1…フーリエ変換処理部、2…スペクトルデータ数変更
部、3…フーリエ逆変換処理部、13,23…音声合成
演算部、14…12kHzD/A変換部、24…6kH
zD/A変換部、111…12kHz合成用ケプストラ
ム・パラメータ記憶部、211…6kHz合成用ケプス
トラム・パラメータ記憶部。
DESCRIPTION OF SYMBOLS 1 ... Fourier-transform processing part, 2 ... Spectrum data number change part, 3 ... Fourier inverse transformation processing part, 13,23 ... Speech synthesis operation part, 14 ... 12kHz D / A conversion part, 24 ... 6kHz
zD / A converter, 111 ... 12 kHz synthesis cepstrum parameter storage, 211 ... 6 kHz synthesis cepstrum parameter storage.

Claims (8)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 第1の周波数でサンプリングした音声信
号データの分析により得られる第1のケプストラム・パ
ラメータを、各フレーム毎に離散フーリエ変換によりパ
ワー・スペクトルに変換し、このパワー・スペクトルの
最高周波数側からデータを切り捨てることによってデー
タ数が減らされたパワー・スペクトルを離散フーリエ逆
変換して前記第1の周波数より低い第2の周波数で音声
合成するための第2のケプストラム・パラメータを得る
ことを特徴とする合成パラメータ変換方法。
A first cepstrum parameter obtained by analyzing voice signal data sampled at a first frequency is converted into a power spectrum by a discrete Fourier transform for each frame, and the highest frequency of the power spectrum is obtained. A discrete cosine inverse transform of the power spectrum reduced in data number by truncating the data from the side to obtain a second cepstrum parameter for speech synthesis at a second frequency lower than the first frequency. Characteristic synthesis parameter conversion method.
【請求項2】 第1の周波数でサンプリングした音声信
号データの分析により得られる第1のケプストラム・パ
ラメータを、各フレーム毎に離散フーリエ変換によりパ
ワー・スペクトルに変換し、このパワー・スペクトルの
最高周波数側にデータを付け足すことによってデータ数
が増やされたパワー・スペクトルを離散フーリエ逆変換
して前記第1の周波数より高い第2の周波数で音声合成
するための第2のケプストラム・パラメータを得ること
を特徴とする合成パラメータ変換方法。
2. A first cepstrum parameter obtained by analyzing audio signal data sampled at a first frequency is converted into a power spectrum by a discrete Fourier transform for each frame, and the highest frequency of the power spectrum is obtained. A discrete cosine inverse transform of the power spectrum whose data number has been increased by adding data to the second side to obtain a second cepstrum parameter for speech synthesis at a second frequency higher than the first frequency. Characteristic synthesis parameter conversion method.
【請求項3】 第1の周波数でサンプリングした音声信
号データの分析により得られる第1のケプストラム・パ
ラメータを前記第1の周波数とは異なる第2の周波数で
音声合成するためのケプストラム・パラメータに変換す
る合成パラメータ変換方法であって、 前記第1のケプストラム・パラメータを、各フレーム毎
に離散フーリエ変換によりパワー・スペクトルに変換
し、前記第1の周波数が前記第2の周波数より高いなら
ば、このパワー・スペクトルの最高周波数側からデータ
を切り捨てることにより、前記第1の周波数が前記第2
の周波数より低いならば、このパワー・スペクトルの最
高周波数側にデータを付け足すことにより、データ数が
増減された新たなパワー・スペクトルを得て、この新た
なパワー・スペクトルを離散フーリエ逆変換することに
より前記第2のケプストラム・パラメータを得ることを
特徴とする合成パラメータ変換方法。
3. Converting a first cepstrum parameter obtained by analyzing voice signal data sampled at a first frequency into a cepstrum parameter for voice synthesis at a second frequency different from the first frequency. Converting the first cepstrum parameter into a power spectrum by discrete Fourier transform for each frame, and if the first frequency is higher than the second frequency, By truncating the data from the highest frequency side of the power spectrum, the first frequency is
If the frequency is lower than the frequency, the data is added to the highest frequency side of the power spectrum to obtain a new power spectrum with the number of data increased / decreased, and the discrete power Fourier transform of the new power spectrum is performed. Obtaining the second cepstrum parameter according to:
【請求項4】 前記パワー・スペクトルの最高周波数側
に付け足されるデータのパワー値が、同パワー・スペク
トルの低周波数部分のパワー値に比べて小さいことを特
徴とする請求項2または請求項3に記載の合成パラメー
タ変換方法。
4. The power spectrum according to claim 2, wherein a power value of data added to a highest frequency side of the power spectrum is smaller than a power value of a low frequency part of the power spectrum. The described synthesis parameter conversion method.
【請求項5】 第1の周波数でサンプリングした音声信
号データの分析により得られる第1のケプストラム・パ
ラメータを、各フレーム毎に離散フーリエ変換によりパ
ワー・スペクトルに変換するフーリエ変換処理手段と、 このフーリエ変換処理手段により変換された前記パワー
・スペクトルの最高周波数側からデータを切り捨てるこ
とによって、前記パワー・スペクトルのデータ数を減ら
すスペクトルデータ数変更手段と、 このスペクトルデータ数変更手段によってデータ数が減
らされた前記パワー・スペクトルを離散フーリエ逆変換
して前記第1の周波数より低い第2の周波数で音声合成
するための第2のケプストラム・パラメータを得るフー
リエ逆変換処理手段とを具備することを特徴とする合成
パラメータ変換装置。
5. Fourier transform processing means for transforming a first cepstrum parameter obtained by analyzing audio signal data sampled at a first frequency into a power spectrum by discrete Fourier transform for each frame; Spectrum data number changing means for reducing the data number of the power spectrum by truncating the data from the highest frequency side of the power spectrum converted by the conversion processing means, and reducing the data number by the spectrum data number changing means. Inverse Fourier transform processing means for performing a discrete Fourier inverse transform of the power spectrum to obtain a second cepstrum parameter for voice synthesis at a second frequency lower than the first frequency. Synthesis parameter converter.
【請求項6】 第1の周波数でサンプリングした音声信
号データの分析により得られる第1のケプストラム・パ
ラメータを、各フレーム毎に離散フーリエ変換によりパ
ワー・スペクトルに変換するフーリエ変換処理手段と、 このフーリエ変換処理手段により変換された前記パワー
・スペクトルの最高周波数側にデータを付け足すことに
よって、前記パワー・スペクトルのデータ数を増やすス
ペクトルデータ数変更手段と、 このスペクトルデータ数変更手段によってデータ数が増
やされた前記パワー・スペクトルを離散フーリエ逆変換
して前記第1の周波数より高い第2の周波数で音声合成
するための第2のケプストラム・パラメータを得るフー
リエ逆変換処理手段とを具備することを特徴とする合成
パラメータ変換装置。
6. Fourier transform processing means for transforming a first cepstrum parameter obtained by analyzing audio signal data sampled at a first frequency into a power spectrum by discrete Fourier transform for each frame; A spectrum data number changing means for increasing the number of data of the power spectrum by adding data to the highest frequency side of the power spectrum converted by the conversion processing means, and the number of data is increased by the spectrum data number changing means. Inverse Fourier transform processing means for performing a discrete Fourier inverse transform of the power spectrum to obtain a second cepstrum parameter for voice synthesis at a second frequency higher than the first frequency. Synthesis parameter converter.
【請求項7】 第1の周波数でサンプリングした音声信
号データの分析により得られる第1のケプストラム・パ
ラメータを前記第1の周波数とは異なる第2の周波数で
音声合成するためのケプストラム・パラメータに変換す
る合成パラメータ変換装置であって、 前記第1のケプストラム・パラメータを、各フレーム毎
に離散フーリエ変換によりパワー・スペクトルに変換す
るフーリエ変換処理手段と、 前記第1の周波数が前記第2の周波数より高いならば、
前記フーリエ変換処理手段により変換された前記パワー
・スペクトルの最高周波数側にデータを付け足すことに
より、前記第1の周波数が前記第2の周波数より低いな
らば、前記パワー・スペクトルの最高周波数側にデータ
を付け足すことにより、前記パワー・スペクトルのデー
タ数を増減するスペクトルデータ数変更手段と、 このスペクトルデータ数変更手段によってデータ数が増
減された前記パワー・スペクトルを離散フーリエ逆変換
して前記第2のケプストラム・パラメータを得るフーリ
エ逆変換処理手段とを具備することを特徴とする合成パ
ラメータ変換装置。
7. Converting a first cepstrum parameter obtained by analyzing voice signal data sampled at a first frequency into a cepstrum parameter for voice synthesis at a second frequency different from the first frequency. A Fourier transform processing means for transforming the first cepstrum parameter into a power spectrum by a discrete Fourier transform for each frame, wherein the first frequency is higher than the second frequency. If expensive
By adding data to the highest frequency side of the power spectrum converted by the Fourier transform processing means, if the first frequency is lower than the second frequency, data is added to the highest frequency side of the power spectrum. A spectrum data number changing means for increasing or decreasing the number of data of the power spectrum, and performing a discrete Fourier inverse transform on the power spectrum having an increased or decreased number of data by the spectrum data number changing means, An inverse Fourier transform processing means for obtaining cepstrum parameters.
【請求項8】 前記スペクトルデータ数変更手段により
前記パワー・スペクトルの最高周波数側に付け足される
データのパワー値が、同パワー・スペクトルの低周波数
部分のパワー値に比べて小さいことを特徴とする請求項
6または請求項7に記載の合成パラメータ変換装置。
8. A power value of data added to a highest frequency side of the power spectrum by the spectrum data number changing means is smaller than a power value of a low frequency portion of the power spectrum. The synthesis parameter conversion device according to claim 6 or 7.
JP03579893A 1993-02-24 1993-02-24 Synthetic parameter conversion method and apparatus Expired - Fee Related JP3302075B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03579893A JP3302075B2 (en) 1993-02-24 1993-02-24 Synthetic parameter conversion method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03579893A JP3302075B2 (en) 1993-02-24 1993-02-24 Synthetic parameter conversion method and apparatus

Publications (2)

Publication Number Publication Date
JPH06250692A JPH06250692A (en) 1994-09-09
JP3302075B2 true JP3302075B2 (en) 2002-07-15

Family

ID=12451941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03579893A Expired - Fee Related JP3302075B2 (en) 1993-02-24 1993-02-24 Synthetic parameter conversion method and apparatus

Country Status (1)

Country Link
JP (1) JP3302075B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009244705A (en) * 2008-03-31 2009-10-22 Brother Ind Ltd Pitch shift system and program

Also Published As

Publication number Publication date
JPH06250692A (en) 1994-09-09

Similar Documents

Publication Publication Date Title
JP2763322B2 (en) Audio processing method
US7630883B2 (en) Apparatus and method for creating pitch wave signals and apparatus and method compressing, expanding and synthesizing speech signals using these pitch wave signals
JP3266819B2 (en) Periodic signal conversion method, sound conversion method, and signal analysis method
JP3294604B2 (en) Processor for speech synthesis by adding and superimposing waveforms
US7792672B2 (en) Method and system for the quick conversion of a voice signal
EP1422693B1 (en) Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program
US20030130848A1 (en) Method and system for real time audio synthesis
JP4516157B2 (en) Speech analysis device, speech analysis / synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program
JPH1091189A (en) Vocalization speed transformation device
JP3302075B2 (en) Synthetic parameter conversion method and apparatus
JPH11219198A (en) Phase detection device and method and speech encoding device and method
JPH08305396A (en) Device and method for expanding voice band
JPH05307395A (en) Voice synthesizer
US10354671B1 (en) System and method for the analysis and synthesis of periodic and non-periodic components of speech signals
JP6213217B2 (en) Speech synthesis apparatus and computer program for speech synthesis
JPH07261798A (en) Voice analyzing and synthesizing device
JP3223564B2 (en) Pitch extraction method
JP2956936B2 (en) Speech rate control circuit of speech synthesizer
JPH06202695A (en) Speech signal processor
JPH07210192A (en) Method and device for controlling output data
JP3592617B2 (en) Speech synthesis method, apparatus and program recording medium
JPH05265486A (en) Speech analyzing and synthesizing method
JP5679451B2 (en) Speech processing apparatus and program thereof
JP2003173198A (en) Voice dictionary preparation apparatus, voice synthesizing apparatus, voice dictionary preparation method, voice synthesizing apparatus, and program
Krithiga et al. Improved Tamil Text to Speech Synthesis

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080426

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090426

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees