JPH07129194A - 音声合成方法及び音声合成装置 - Google Patents

音声合成方法及び音声合成装置

Info

Publication number
JPH07129194A
JPH07129194A JP5272250A JP27225093A JPH07129194A JP H07129194 A JPH07129194 A JP H07129194A JP 5272250 A JP5272250 A JP 5272250A JP 27225093 A JP27225093 A JP 27225093A JP H07129194 A JPH07129194 A JP H07129194A
Authority
JP
Japan
Prior art keywords
voice
storage means
synthesis
cepstrum
synthesizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5272250A
Other languages
English (en)
Inventor
Yoshinori Shiga
芳則 志賀
Tsuneo Nitta
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5272250A priority Critical patent/JPH07129194A/ja
Publication of JPH07129194A publication Critical patent/JPH07129194A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【目的】音声合成装置や音声合成ソフトウェアが動いて
いるコンピュータに回路や装置をなんら付加する必要が
なく、また音声合成のリアルタイム性も損なわずに、出
力される音声合成の音質を簡単に変化させることができ
るようにする。 【構成】ケプストラム加算値決定部18は、音質入力部
11から渡される音質を示す値に応じた負の定数a、0
または正の定数bを合成パラメータ加工部19に渡す。
合成パラメータ加工部19は、音声合成のために合成パ
ラメータ記憶部12からケプストラムの時系列を読み出
すと、そのうちの全ての1次のケプストラム係数C1 に
対して、C1 =C1 +x(xはa,0,bのうちのいず
れか)の演算を行い、その演算結果を新たなC1 とし
て、そのC1 を含む全てのケプストラムの時系列を音声
合成器14に渡す。音声合成器14は、このケプストラ
ム時系列とピッチパターン記憶部13から読み出したピ
ッチパターンから音声を合成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、合成音の音質を変える
のに適した音声合成方法及び音声合成装置に関する。
【0002】
【従来の技術】音声のケプストラムは次のようにして得
られる。まず、離散音声信号に一定周期・一定時間幅の
窓をかけ、各窓内の離散信号データにフーリエ変換を施
すことにより、音声のパワースペクトルの時系列を得
る。
【0003】次に、このパワースペクトルのパワーを対
数化し、さらに、この対数化したパワースペクトルをフ
ーリエ逆変換すれば、ケプストラムの時系列を得ること
ができる。
【0004】音声のケプストラムは、「低次のケプスト
ラムは音声の音韻情報であるスペクトル包絡を保持し、
高次のケプストラムは音声のピッチ情報を保持する」と
いう特徴を持っており、このような特徴を利用して、音
声の合成はなされる。
【0005】この音声合成の代表的な方法として、例え
ば音声の分析合成と音声の規則合成が知られている。音
声の分析合成は次のようにして行われる。
【0006】まず、音声合成したい音声を記録し、これ
を上記のケプストラム分析を行ってケプストラム時系列
を得る。得られたケプストラムのうち、ピッチ情報を保
持する高次ケプストラムから音声の有声/無声区間と、
有声区間のときにはそのピッチ周波数を推定し、これら
有声無声区間の情報(以下、U/V情報と称する)とピ
ッチ周波数の時系列を低次ケプストラムと共にメモリに
記憶させる。合成時には、ケプストラム係数を直接フィ
ルタ係数として音声を合成することができる対数振幅近
似(LMA)フィルタを用い、上記のメモリから読み出
されるU/V情報及びピッチ周波数時系列からフィルタ
音源を生成し、同じくメモリから読み出される低次ケプ
ストラムをLMAフィルタのフィルタ係数とすること
で、元の音声が合成される。
【0007】また、音声の規則合成は次のようにして行
われる。まず、音声の規則合成では、音韻情報をもつ低
次ケプストラム時系列を音韻または音素毎に音声素片と
して予め実音声より抽出してメモリに保持している。合
成時に合成したい音声の音韻系列に合わせてこれら音声
素片を接続する。一方で、合成すべき文のイントネーシ
ョンや単語のアクセントなどに従って音声のピッチ周波
数の時系列、即ちピッチパターンを生成する。そして、
上記した分析合成のときと同じくして、ピッチパターン
よりフィルタ音源を生成し、音声素片の接続により得ら
れたケプストラム時系列をLMAフィルタのフィルタ係
数として音声を合成する。
【0008】
【発明が解決しようとする課題】上記のような方式を用
いた音声合成装置、或いはオーディオ出力機能の付いた
ワークステーションやパーソナルコンピュータ上で動く
音声合成ソフトウェアを利用していると、装置利用者が
快適に合成音声が聴取できるように合成音声の音質を変
えたい、或いは音量を小さくして合成音声を聴くような
場合に、人間の聴覚のラウドネスに合わせて音声の低周
波領域等を強調させて聞き取り易くしたいとか、出力ス
ピーカを音響特性の異なるスピーカに取り替えたとき、
聞き取り難くなったのでスピーカに合わせて合成音声を
イコライズしたいというような要求が生まれてくる。
【0009】このような要求に対して従来は、音声合成
装置或いはコンピュータ(情報処理機器)の出力部とス
ピーカの間にイコライザ回路或いはイコライザ装置を取
り付けて対処していた。しかしながら、回路や装置の付
加にコストがかかることになる。
【0010】上記のイコライザ回路或いは装置を音声合
成装置やコンピュータの外に用意した場合、音声合成装
置やコンピュータへの入力に応じて合成音声の音質を変
えたいときには、音声合成装置或いはコンピュータから
音質コントロール信号をイコライザ装置に渡してやらな
ければならず、制御も非常に複雑になり必要なコストも
増える上、利用者によってはその接続に混乱をきたす可
能性もある。
【0011】ところで、専用の音声合成装置で音声合成
機能を実現する場合は、装置内部にイコライザ回路を組
み込むことにより、装置内で音質を制御することも可能
である。しかし、この方法でも、イコライザ回路とその
制御手段の付加によるコストアップは免れない。また、
音声合成ソフトウェアによりコンピュータ上で音声合成
機能を実現する場合には、ソフトウェアでディジタルフ
ィルタを構成して音質を制御することも可能である。し
かし、この方法では演算処理時間が増大し、リアルタイ
ムの音声合成が難しくなる。
【0012】本発明は、以上の問題を解決すべくなされ
たもので、その目的は、音声合成装置や音声合成ソフト
ウェアが動いているコンピュータ(情報処理機器)に回
路や装置をなんら付加する必要がなく、また音声合成の
リアルタイム性も損なわずに、出力される音声合成の音
質を簡単に変化させることのできる音声合成方法及び音
声合成装置を提供することにある。
【0013】本発明の他の目的は、装置利用者の指定す
る音質の合成音が生成できる音声合成方法及び音声合成
装置を提供することにある。本発明の更に他の目的は、
聴覚のラウドネスに合わせて音声の必要な周波数領域を
強調させて聞き取り易くすることができる音声合成方法
及び音声合成装置を提供することにある。本発明の更に
他の目的は、出力スピーカの音響特性に合わせて合成音
声をイコライザすることができる音声合成方法及び音声
合成装置を提供することにある。
【0014】
【課題を解決するための手段及び作用】本発明は、音声
のケプストラム係数を合成パラメータ記憶手段に記憶し
ておき、音声合成に際しては、合成パラメータ記憶手段
から音声合成に用いるケプストラム係数を読み出して、
当該ケプストラム係数をもとに音声を合成するものにお
いて、合成パラメータ記憶手段から読み出したケプスト
ラム係数のうちの零次以外の次数の少なくとも1つの係
数を所定の演算によって変更した後に、当該ケプストラ
ム係数を音声信号波形に変換して音声を合成することを
特徴とするものである。
【0015】このような構成においては、零次以外の次
数のケプストラム係数のうちの少なくとも1つを加減乗
除等の演算によって変更するだけで、本来の音声スペク
トルに対して例えば高周波数側或いは低周波数側を強調
するといったことが可能となるため、特別な回路や装置
を必要とせずに合成音声の音質を簡単に変化させること
ができる。
【0016】また本発明は、音質指定手段により音質が
指定可能な構成とし、上記合成パラメータ記憶手段から
読み出したケプストラム係数のうちの零次以外の次数の
少なくとも1つの係数を、音質指定手段から与えられる
音質情報により決定される変更方法に従って変更するよ
うにしたことをも特徴とする。
【0017】このような構成においては、利用者が音質
指定手段を用いて音質指定操作を行うだけで、零次以外
の次数のケプストラム係数のうちの少なくとも1つが変
更されるため、利用者が希望する音質の音声を簡単に合
成することが可能となる。
【0018】また本発明は、音量設定手段の指定に応じ
て合成音声の振幅が可変可能なものにおいて、上記合成
パラメータ記憶手段から読み出したケプストラム係数の
うちの零次以外の次数の少なくとも1つの係数を、音量
設定手段から与えられる音量情報により決定される変更
方法に従って変更するようにしたことをも特徴とする。
【0019】このような構成においては、利用者の指定
した音量に応じてケプストラム係数が変更されるため、
音量を小さくして合成音声を聴くような場合に聴覚のラ
ウドネスに合わせて音声の低周波領域等を強調させて聞
き取り易くすることが簡単に実現できる。
【0020】また本発明は、合成された音声を、複数の
(スピーカなどの)合成音声出力手段のうち出力先選択
手段により選択される唯一の合成音声出力手段から出力
させるものにおいて、合成パラメータ記憶手段から読み
出したケプストラム係数のうちの零次以外の次数の少な
くとも1つの係数を、出力先選択手段により選択される
出力先を示す情報により決定される変更方法に従って変
更するようにしたことをも特徴とする。
【0021】このような構成においては、合成音声の出
力先に応じてケプストラム係数が変更されるため、出力
スピーカの音響特性に合わせて合成音声をイコライザす
るというようなことが簡単にできる。
【0022】また本発明は、音声を合成するのに、合成
パラメータ記憶手段内のケプストラム係数の時系列の他
に有声無声情報記憶手段内の有声無声情報を用いるもの
において、合成パラメータ記憶手段から読み出したケプ
ストラム係数のうちの零次以外の次数の少なくとも1つ
の係数を、有声無声情報記憶手段から読み出される有声
無声情報により決定される変更方法に従って変更するよ
うにしたことをも特徴とする。
【0023】このような構成においては、音声の無声区
間において対象となるケプストラム係数を変更して例え
ば高域強調することにより、摩擦音、破裂音等を明瞭に
することが簡単に実現できる。また、音声の有声区間に
おいてケプストラム係数を変更することにより、簡単に
音質を変えることができる。
【0024】また本発明は、音声を合成するのに、合成
パラメータ記憶手段内のケプストラム係数の時系列の他
に有声無声情報記憶手段内の有声無声情報及びピッチ記
憶手段内のピッチ周波数の時系列を用いるものにおい
て、合成パラメータ記憶手段から読み出したケプストラ
ム係数のうちの零次以外の次数の少なくとも1つの係数
を、有声無声情報記憶手段から読み出される有声無声情
報及びピッチ記憶手段から読み出されるピッチ周波数の
値により決定される変更方法に従って変更するようにし
たことをも特徴とする。
【0025】このような構成においては、有声/無声区
間の区別の他に、ピッチ周波数の値をもとに、対象とな
るケプストラム係数が変更されるため、例えば音声の有
声区間において、ピッチ周波数の値に応じて当該ケプス
トラム係数を変更することにより、合成音を人の音声に
より近づけることが可能となる。
【0026】また本発明は、音声の母音区間または子音
区間を示す区間情報を母音/子音情報記憶手段に記憶し
ておき、合成パラメータ記憶手段から読み出したケプス
トラム係数のうちの零次以外の次数の少なくとも1つの
係数を、母音/子音情報記憶手段に記憶された母音/子
音情報により決定される変更方法に従って変更するよう
にしたことをも特徴とする。
【0027】このような構成においては、例えば母音区
間においてケプストラム係数を変更することにより、簡
単に音質を変えることができる。また本発明は、合成パ
ラメータ記憶手段から読み出したケプストラム係数のう
ちの零次以外の次数の少なくとも1つの係数を、母音/
子音情報記憶手段に記憶された母音/子音情報及びピッ
チ記憶手段から読み出されたピッチ周波数の値により決
定される変更方法に従って変更するようにしたことをも
特徴とする。
【0028】このような構成においては、母音/子音区
間の区別の他に、ピッチ周波数の値をもとに、対象とな
るケプストラム係数が変更されるため、例えば音声の母
音区間において、ピッチ周波数の値に応じて当該ケプス
トラム係数を変更することにより、合成音を人の音声に
より近づけることが可能となる。
【0029】以上のように、本発明によれば、音声合成
装置や音声合成ソフトウェアが動いているコンピュータ
に、トーン・コントロールやイコライジングのための回
路や装置を付加することなく、合成音声の音質を変化さ
せることが可能となるので、音質調整機能の付加による
コストは殆どかからない。また、そのための余計な配線
等の必要もないため、装置利用者に余計な負担をかける
こともない。
【0030】また、音質の制御にソフトウェア上でディ
ジタルフィルタを構成する場合には、演算処理時間の増
大が問題になっていたが、本発明では、音質制御に必要
な演算量が少なく、演算処理時間の増大は極めて小さい
ので、音声合成のリアルタイム性が損なわれない。
【0031】本発明の利用により、装置利用者の好みに
合わせて合成音声の音質を複数用意したり、音量を小さ
くして合成音声を聴くような場合に聴覚のラウドネスに
合わせて音声の低周波領域等を強調させて聞き取り易く
したり、出力スピーカの音響特性に合わせて合成音声を
イコライザするというようなことが簡単にできる。
【0032】
【実施例】以下、本発明の実施例につき図面を参照して
説明する。 [第1の実施例]図1は、本発明の第1の実施例を示す
音声の分析合成法を適用した音声合成装置のブロック構
成図である。
【0033】図1に示す音声合成装置は、音質入力部1
1、合成パラメータ記憶部12、ピッチパターン記憶部
13、音声合成器14、D/Aコンバータ15、増幅器
16、スピーカ17、ケプストラム加算値決定部18及
び合成パラメータ加工部19から構成される。
【0034】音質入力部11は、利用者操作により音質
を例えば段階的に指定するためのスイッチを有してお
り、スイッチの切り替えに応じて数値を出力するように
なっている。この例では、音質入力部11は、スイッチ
により3段階の切り替えが可能な構成となっており、当
該スイッチの切り替えにより(0,1,2)のうちのい
ずれかの値を出力するものとする。
【0035】なお、利用者操作により連続的に音質を指
定するための例えば可変抵抗器を音質入力部11に設
け、当該抵抗器の抵抗値に応じて数値を出力するもので
あっても構わない。
【0036】合成パラメータ記憶部12は、[従来の技
術]の項にて説明した分析法で実音声を分析して得られ
る音声のケプストラムの低次部分の時系列を蓄積してお
くためのものである。
【0037】ピッチパターン記憶部13は、従来から知
られている自己相関法やケプストラム法などにより上記
実音声から抽出したピッチパターンを蓄積しておくため
のものである。
【0038】音声合成器14は、音声合成を司るもの
で、ピッチパターン記憶部13よりピッチパターンを読
み出して有声区間ではピッチ周期のパルスを、無声区間
ではホワイトノイズを発生する音源と、入力されるケプ
ストラムを直接フィルタ係数とする対数振幅近似フィル
タ(LMAフィルタ)から構成される。
【0039】D/Aコンバータ15は、音声合成器14
により生成されたディジタル音声信号をアナログの音声
信号に変換するのに用いられる。増幅器16は、D/A
コンバータ15により変換されたアナログ音声信号を増
幅するのに用いられる。
【0040】スピーカ17は、増幅器16により増幅さ
れた音声信号を音声に変換して出力するのに用いられ
る。ケプストラム加算値決定部18は、本発明に最も関
係する部分の1つであり、音質入力部11から受け取る
音質の数値、即ち(0,1,2)のうちのいずれか1つ
に従って、(a,0,b)の3つの定数(但しa<0<
b)のうちの1つを出力するようになっている。
【0041】合成パラメータ加工部19もまた、本発明
に最も関係する部分の1つであり、合成パラメータ記憶
部12から音声のケプストラムを読み出し、零次以外の
次数のケプストラム係数C1 ,C2 ,C3 …のうち、少
なくとも1つのケプストラム係数を変更(加工)するよ
うになっている。この例では、合成パラメータ加工部1
9は、1次のケプストラム係数C1 を次の演算により変
更するように構成されているものとする。
【0042】 C1 =C1 +x ……(1) ここで、xはケプストラム加算値決定部8から受け取る
ものであり、(a,0,b)のうちのいずれかの値であ
る。
【0043】次に、第1の実施例の動作を説明する。ま
ず、音質入力部11のスイッチの切り替えにより或る音
質を示す数値0が当該音質入力部11からケプストラム
加算値決定部18に渡されたものとする。
【0044】するとケプストラム加算値決定部18は、
数値0に対応する定数aを合成パラメータ加工部19に
渡す。合成パラメータ加工部19は、音声合成のために
合成パラメータ記憶部12からケプストラムの時系列を
読み出すと、そのうちの全ての1次のケプストラム係数
C1 に対して、上記(1)式の演算を施す。この演算で
は、(1)式中のxとして、ケプストラム加算値決定部
18から渡された定数a(a<0)が用いられる。
【0045】即ち合成パラメータ加工部19は、C1 と
負の数aとの加算を行い、その加算結果を新たな(変更
後の)C1 とする。合成パラメータ加工部19は、この
新たなC1 を含む全てのケプストラムの時系列を音声合
成器14に渡す。
【0046】音声合成器14は、合成パラメータ加工部
19から渡されたケプストラム時系列とピッチパターン
記憶部13から読み出したピッチパターンから音声を合
成する。
【0047】音声合成器14で合成された音声は、離散
音声信号である。この離散音声信号はD/Aコンバータ
15にてアナログ音声信号に変換され、増幅器16で増
幅された後に、スピーカ17にて音声として空気中に放
射される。
【0048】この例における上記定数aは負(a<0)
あるから、(1)式により、C1 は実音声を分析したも
のよりも小さくなる。ところで、ケプストラムはスペク
トルに対して、 Sk =ΣCm cos{(2π/N)km} ……(2) Sk :対数スペクトルパワー Cm :m次のケプストラム係数 N :スペクトルの離散サンプル点数 で表される。なお、ΣCm cos{(2π/N)km}
はCm cos{(2π/N)km}のk=0からk=N
−1までの総和を表したものである。また、理解を助け
るために図で表したものが図2である。
【0049】このように、対数パワースペクトルは、異
なる周期のコサインカーブの和で表すことができ、コサ
インカーブそれぞれの振幅がケプストラム係数Cm に相
当する。したがって、上記(1)式により、本来の音声
のC1 に負の値を加算するということは、丁度図3に示
されるように、同図(a)の本来の音声のスペクトルに
対して、同図(b)の傾きを与えることになり、このケ
プストラムによって合成される音声は、同図(c)に示
されるように本来のスペクトルの高周波数側が強調され
るものとなる。
【0050】次に、図1の音質入力部11におけるスイ
ッチの切り替えにより数値2がケプストラム加算値決定
部18に渡された場合について説明する。ケプストラム
加算値決定部18は、音質入力部11から数値2を受け
取ると、その数値2に対応する定数bを合成パラメータ
加工部19に渡す。これにより合成パラメータ加工部1
9は、1次のケプストラム係数C1 に対して、ケプスト
ラム加算値決定部18から渡された定数bを上記(1)
式のxに代入することで、当該(1)式の演算を施す。
【0051】ここで、定数bは正(0<b)であるか
ら、今度は図3(d)のように低周波数側の強調がなさ
れるようにケプストラムが変更される。次に、図1の音
質入力部11におけるスイッチの切り替えにより数値1
がケプストラム加算値決定部18に渡された場合につい
て説明する。
【0052】この場合、ケプストラム加算値決定部18
から合成パラメータ加工部19に定数0が渡されて、当
該合成パラメータ加工部19において、x=0として上
記(1)式の演算がなされるため、そのままの音声が合
成されることは明らかである。
【0053】このようにして、本実施例では、音質入力
部1のスイッチ切り替えにより3段階のトーンコントロ
ールが合成音声に対して実現される。 [第2の実施例]次に、本発明の第2の実施例を説明す
る。
【0054】図4は、本発明の第2の実施例を示す音声
の分析合成法を適用した音声合成装置のブロック構成図
である。なお、図1と同一部分には同一符号を付して説
明を省略する。
【0055】図4に示す音声合成装置は、合成パラメー
タ記憶部12、ピッチパターン記憶部13、音声合成器
14、D/Aコンバータ15、増幅器16及びスピーカ
17の他、音量入力部111、増幅率制御部112、ケ
プストラム加算値決定部181及び合成パラメータ加工
部191から構成される。
【0056】音量入力部111は、図1中の音質入力部
11に相当するもので、利用者操作により音量を例えば
連続的に指定するためのの可変抵抗器を有している。増
幅率制御部112は、音量入力部111の可変抵抗器の
抵抗値(の示す音量値)に応じて増幅器16の増幅率を
制御するものである。
【0057】ケプストラム加算値決定部181は、本発
明に最も関係する部分の1つであり、音量入力部111
の可変抵抗値の抵抗値レベルが音量が徐々に小さくなる
ように制御される方向に従って、例えば0から15まで
16段階の整数値を出力する。
【0058】合成パラメータ加工部191もまた、本発
明に最も関係する部分の1つであり、合成パラメータ記
憶部12から音声のケプストラムを読み出し、零次以外
の次数のケプストラム係数C1 ,C2 ,C3 …のうち、
少なくとも1つのケプストラム係数を変更(加工)する
ようになっている。この例では、合成パラメータ加工部
191は、1次のケプストラム係数C1 を次の演算によ
り変更するように構成されているものとする。
【0059】 C1 =C1 +(r×x) ……(3) ここで、xはケプストラム加算値決定部181から渡さ
れる数値で、0≦x≦15の範囲の整数であり、rは正
の定数である。
【0060】ところで、人間の聴覚が感じる音の大きさ
(ラウドネス)は周波数によって異なり、例えば、1k
Hzの音と100Hzの音を同じ音量で聴いた後、両方
の音の音量を物理的に同じレベル[dB]だけ下げる
と、聴覚には1kHzの音よりも100Hzの音の方が
小さくなったように聞こえる。すなわち、小さな音量で
音を聴くときには、100Hzの音を1kHzの音より
も大きな音量にしなければ人間の耳には同じ大きさには
聞こえないのである。このような、人間の聴覚に感じら
れる同じ音の大きさをラウドネスという。このような理
由で、よくオーディオ機器などには、小音量で聴取する
ときのためにラウドネススイッチが設けられ、このスイ
ッチをONにすることで、小音量時にも人間の聴覚に周
波数全域に渡ってバランスよく聞こえるようにフィルタ
をかけている。
【0061】図4の構成の音声合成装置では、このよう
な点を考慮して、簡単に、音量を小さくするに従って低
域強調を行ない、小音量時の低周波数部を補うことを可
能としている。
【0062】まず、合成パラメータ加工部191におけ
るケプストラム係数C1 の変更のための演算では、上記
(3)式から明らかなように、本来のC1 の値に0以上
の整数値を加算した値を新たなC1 とすることになる。
このため合成パラメータ加工部191においては、図3
(d)に示されるように、本来の音声のスペクトルを低
域強調したものに対応したケプストラムが得られる。そ
して(3)式のxが大きくなればなるほど、この低域強
調の度合いが大きくなることがわかる。
【0063】ここで、音量入力部111により小さな音
量が設定されたとする。すると増幅率制御部112は、
音量入力部111の可変抵抗器の抵抗値レベルに応じて
増幅器16を制御して、スピーカ17より放射される音
声の音量を小さくする。
【0064】一方、ケプストラム加算値決定部181
は、音量入力部111の可変抵抗器の抵抗値レベルに従
って0〜15までの整数値のうちの1つを合成パラメー
タ加工部191に渡す。
【0065】合成パラメータ加工部191は、音声合成
のために合成パラメータ記憶部12からケプストラムの
時系列を読み出すと、そのうちの全ての1次ケプストラ
ム係数C1 に対して上記(3)式の演算を施す。この演
算では、(3)式中のxとして、ケプストラム加算値決
定部181から渡された数値(0〜15の範囲の整数
値)が用いられる。
【0066】合成パラメータ加工部191は、(3)式
に従う演算の結果を新たなC1 として他の全てのケプス
トラムと共に音声合成器14に渡す。音声合成器14
は、合成パラメータ加工部191から渡されたケプスト
ラム時系列とピッチパターン記憶部13から読み出した
ピッチパターンから音声を合成する。
【0067】音声合成器14で合成された離散音声信号
は、D/Aコンバータ15によりアナログ信号に変換さ
れ、更に増幅器16により増幅率制御部112の指定す
る増幅率(即ち音量入力部111の可変抵抗器の抵抗値
レベルに応じた増幅率)で増幅された後、スピーカ17
にて音声として空気中に放射される。
【0068】以上の結果、本実施例においては、上記
(3)式中の正の定数rを適当な値にとるならば、音量
入力部111で小さな音量を設定した場合には、それに
応じて合成パラメータ加工部191で低周波数領域のス
ペクトルを持ち上げるようケプストラム係数を操作され
るので、このケプストラムから作られた合成音声は、聴
覚が小音量時に聞こえ難くなる低周波数成分を補うこと
ができる。
【0069】ここで適当なrの値は次のようにして決定
される。例えば対数スペクトルパワーの単位を[dB]
とし、音量最小時に、最高周波数(サンプリング周波数
fSの1/2)と比べて最低周波数が20[dB]強調
されるようにしたいものとする。このためには、C1 の
加算値r×xが10になるようにすれば良い。本実施例
では、音量最小時のxの値は前記したように15であ
る。この場合、r×x=10となるためのrの値は、1
0/15、即ち約0,667となる。
【0070】なお、合成パラメータ加工部191におい
て、1次のケプストラム係数C1 だけでなく、零次以外
の他のケプストラム係数も変化させることにより、小音
量時に最も聞こえ難くなる音声の低周波数領域を最も強
調させ、次に聞こえ難くなる音声の高周波数領域を少し
強調させることにより、小音量時における音声を一層聞
こえ易くすることができる。 [第3の実施例]次に、本発明の第3の実施例を説明す
る。
【0071】図5は、本発明の第3の実施例を示す音声
の規則合成法を適用した音声合成装置のブロック構成図
である。図5に示す音声合成装置は、音声記号列蓄積部
20、韻律パラメータ生成部21、音声素片記憶部2
2、音韻パラメータ生成部23、音声合成器24、D/
Aコンバータ25、増幅器26、スピーカ27、ケプス
トラム加算値決定部28及び音韻パラメータ加工部29
から構成される。
【0072】音声記号列蓄積部20は、語や文のアクセ
ント情報と音韻記号列を蓄積しておくためのものであ
る。韻律パラメータ生成部21は、音声記号列蓄積部2
0からアクセント情報を読み出し、読み出したアクセン
ト情報を用いてピッチ周波数の時系列であるピッチパタ
ーンを生成するものである。この生成されたピッチパタ
ーンは、例えば韻律パラメータ生成部21が持つピッチ
パターン記憶部(図示せず)に格納される。
【0073】音声素片記憶部22は、音韻毎に実音声を
一定分析窓幅・一定周期の時間窓をかけ、窓内でケプス
トラム分析し、得られた音韻毎のケプストラム係数時系
列の例えば0次から19次のケプストラム係数時系列
と、音声素片内各フレームの有声無声情報(以下U/V
情報という。また以下、上記0次から19次のケプスト
ラム係数時系列と合わせて音声素片と呼ぶ)を格納して
おくためのものである。
【0074】音韻パラメータ生成部23は、音声記号列
蓄積部20から音韻記号列を読み出し、読み出した音韻
記号列に従って、音声素片を音声素片記憶部22より読
み出し平滑接続するものである。
【0075】音声合成器24は、音声合成を司るもの
で、音声素片の平滑接続により生成されたパラメータ時
系列を音韻パラメータ生成部23から受け取り、そのU
/V情報が有声を示すときには、韻律パラメータ生成部
21で生成されてピッチパターン記憶部(図示せず)に
格納されたピッチパターンに基づいてピッチ周波数のパ
ルスを、無声を示すときにはホワイトノイズを発生する
音源と、音韻パラメータ生成部23から受け取ったパラ
メータ時系列に含まれるケプストラムを直接フィルタ係
数とする対数振幅近似フィルタ(LMAフィルタ)から
構成される。
【0076】D/Aコンバータ25は、音声合成器24
により生成されたディジタル音声信号をアナログの音声
信号に変換するのに用いられる。増幅器26は、D/A
コンバータ25により変換されたアナログ音声信号を増
幅するのに用いられる。
【0077】スピーカ27は、増幅器26により増幅さ
れた音声信号を音声に変換して出力するのに用いられ
る。ケプストラム加算値決定部28は、本発明に最も関
係する部分の1つであり、音声素片の平滑接続により生
成されたパラメータ時系列のU/V情報を音韻パラメー
タ生成部23から受け取り、U/V情報が有声を示すと
きには、韻律パラメータ生成部21で生成されたピッチ
レベルに応じてピッチが高くなると大きな値を、低くな
ると小さな値を出力するようになっている。ここではピ
ッチ周波数40Hzから320Hzの間に、対数軸上等
間隔で511個のしきい値を設けて0から511の整数
値xを出力するものとする。また、同U/V情報が無声
を示すときには、x=0を出力するものとする。
【0078】音韻パラメータ加工部29もまた、本発明
に最も関係する部分の1つであり、音韻パラメータ生成
部23からケプストラムパラメータを受け取り、零次以
外の次数のケプストラム係数C1 ,C2 ,C3 …のう
ち、少なくとも1つのケプストラム係数を変更(加工)
するようになっている。この例では、音韻パラメータ加
工部29は、1次のケプストラム係数C1 を次の演算に
より変更するように構成されているものとする。
【0079】 C1 =C1 −(r×x) ……(4) ここで、xはケプストラム加算値決定部28から渡され
る数値で、0≦x≦511の範囲の整数であり、rは正
の定数である。
【0080】さて、音韻パラメータ加工部29における
ケプストラム係数C1 の変更のための演算では、上記
(4)式から明らかなように、本来のC1 の値から0以
上の整数値を減算した値を新たなC1 とすることにな
る。このため音韻パラメータ加工部29においては、前
記第1及び第2の実施例のときと同じ論理で、図3
(c)に示されるように、本来の音声のスペクトルを高
域強調したようなスペクトルに対応するケプストラムが
得られる。しかも、音声のピッチが高ければ高いほど、
ケプストラム加算値決定部28から渡される数値、即ち
上記(4)式中のxの値が大きくなるので、この高域強
調の度合いが大きくなる。
【0081】一般に、音声のスペクトルは同じ音韻でも
ピッチにより変化することが知られている。なかでも、
ピッチ周波数の上昇に伴ない、第4、第5フォルマント
等の高い周波数側のフォルマントのパワーが、第1、第
2フォルマント等に比べて大きくなる傾向があることが
知られている。本実施例でも、ピッチ周波数が高くなれ
ば、上記の如く高周波数領域の強調が行われ、高周波数
側のフォルマントが強調されることになる。実音声のピ
ッチ周波数と音韻のスペクトルの関係から、ピッチ周波
数とケプストラム加算値決定部28が出力する数値との
関係を非線形にしたり、音韻パラメータ加工部29にお
いても1次のケプストラム係数C1 だけでなく、零次以
外の他のケプストラム係数も変化させるようにして近似
度を上げれば更に精密な近似が可能となり、より人の実
音声に近い音声を合成することができる。
【0082】なお、ピッチ周波数に無関係に、単に有声
区間だけケプストラム係数を変更するだけでも、音声素
片記憶部22内の音声素片を変えることなく、音質を簡
単に変えることができる。また、無声区間だけケプスト
ラム係数を変更して高周波数側を強調することにより、
利用者がはっきりと聞き取れる摩擦音や破裂音を合成す
ることもできる。 [第4の実施例]次に、本発明の第4の実施例を説明す
る。
【0083】図6は、本発明の第4の実施例を示す音声
の規則合成法を適用した音声合成装置のブロック構成図
である。なお、図5と同一部分には同一符号を付して説
明を省略する。
【0084】この図6に示す音声合成装置の構成は、図
5に示した音声合成装置とほぼ同様であり、その違い
は、図5中の音声素片記憶部22、パラメータ生成部2
3及びケプストラム加算値決定部28に代えて、それぞ
れ音声素片記憶部221、音韻パラメータ生成部231
及びケプストラム加算値決定部281を用いている点に
ある。
【0085】音声素片記憶部221には、ケプストラム
係数時系列の他に、音声素片内各フレームに対してその
フレームが母音部なのか子音部なのかを表すV/C(Vow
el/Consonant) 情報が保持されている。このV/C情報
は、音韻パラメータ生成部231において音声素片の平
滑接続時にも接続後各フレームに保存される。
【0086】さて、前記第3の実施例では、音声の無声
区間で無条件に前記(4)式中のxを0としていたが、
本実施例ではこれとは異なる。即ち本実施例では、ケプ
ストラム加算値決定部281が、音韻パラメータ生成部
231より各フレームのV/C情報を受け取り、このV
/C情報をもとに母音区間以外はx=0を、母音区間で
は前記第3の実施例(におけるケプストラム加算値決定
部28)と同じくピッチ周波数に応じた512段階の数
値xを、音韻パラメータ加工部29に出力する。したが
って本実施例では、同じ音声素片を用いながら、母音区
間のみにおいてピッチ周波数により音声の高域と低域の
バランスを変化させることが可能となる。
【0087】また、ピッチ周波数に無関係に、母音区間
においてケプストラム係数を変更するだけでも、音声素
片記憶部22内の音声素片を変えることなく、音質を簡
単に変えることができる。 [第5の実施例]次に、本発明の第5の実施例を説明す
る。
【0088】図7は、本発明の第5の実施例を示す音声
の分析合成法を適用した音声合成装置のブロック構成図
である。なお、図1と同一部分には同一符号を付して説
明を省略する。
【0089】この図7に示す音声合成装置の構成は、図
1に示した音声合成装置とほぼ同様であり、その違い
は、図1中のスピーカ17に代えて、周波数特性の異な
る2つのスピーカ17-1,17-2を用い、合成音声の出
力先の切り替え制御を行う出力切り替え制御部31と、
この出力切り替え制御部31の制御によりスピーカ17
-1または17-2を選択する出力切り替え部32とを備え
る他、ケプストラム加算値決定部18及び合成パラメー
タ加工部19に代えて、スピーカ特性補正用ケプストラ
ム蓄積部182及び合成パラメータ加工部192を備え
ている点にある。
【0090】スピーカ特性補正用ケプストラム蓄積部1
82は、本発明に最も関係する部分の1つであり、スピ
ーカ17-1,17-2の周波数特性の補正用対数スペクト
ルを逆フーリエ変換したスピーカ特性補正用ケプストラ
ムを蓄積しておくためのものである。
【0091】合成パラメータ加工部192もまた、本発
明に最も関係する部分の1つであり、出力切り替え制御
部31の出力先切り替え制御内容に応じてスピーカ特性
補正用ケプストラム蓄積部182から該当するスピーカ
特性補正用ケプストラムを読み取り、合成パラメータ記
憶部12から読み出した合成パラメータのケプストラム
係数を次式により変更するように構成されている。
【0092】 Cn =Cn +rmn ……(5) Cn :n次のケプストラム係数 rmn:m番目のスピーカの特性補正用ケプストラムのn
次係数 さて、図7の構成においては、出力切り替え制御部31
で出力先となるスピーカ17-m(mは1または2)を指
定すると、当該出力切り替え制御部31は出力切り替え
部32のスイッチを制御して、増幅器16の出力を指定
のスピーカ17-mに切り替え接続する。同時に出力切り
替え制御部31は、合成パラメータ加工部192に対し
て、いずれのスピーカ17-mを選択したかという情報を
渡す。ここでは、スピーカ17-1(m=1)が選択され
たとする。
【0093】この場合、合成パラメータ加工部192
は、スピーカ17-1の周波数特性を補正するケプストラ
ムをスピーカ特性補正用ケプストラム蓄積部182から
読み出す。更に合成パラメータ加工部192は、合成パ
ラメータ記憶部12に記憶されている合成パラメータを
読み出し、スピーカ特性補正用ケプストラム蓄積部18
2から読み出したスピーカ17-1の周波数特性を補正す
るケプストラムrmn(=r1n)を、上記(5)式に従っ
て加算する。これにより、スピーカ17-1に最も適した
イコライズがなされる。
【0094】
【発明の効果】以上説明したようにように本発明によれ
ば、音声合成装置や音声合成ソフトウェアが動いている
コンピュータに、トーン・コントロールやイコライジン
グのための回路や装置を付加することなく、合成音声の
音質を変化させることができるので、音質調整機能の付
加によるコストはほとんどかからない。また、そのため
の余計な配線等の必要もないため、装置利用者に余計な
負担をかけることもない。
【0095】また、音質の制御にソフトウェアでディジ
タルフィルタを構成する場合には、従来は演算処理時間
の増大が問題になったが、本発明においては、音質制御
に必要な演算量が少なく、演算処理時間の増大は極めて
小さいので、音声合成のリアルタイム性が損なわれな
い。
【0096】本発明の利用により、装置利用者の好みに
合わせて合成音声の音質を複数用意したり、音量を小さ
くして合成音声を聴くような場合に聴覚のラウンドネス
に合わせて音声の低周波領域等を強調させて聞き取り易
くしたり、出力スピーカの音響特性に合わせて合成音声
をイコライザするというようなことが簡単にできる。
【図面の簡単な説明】
【図1】本発明の第1の実施例を示す音声合成装置のブ
ロック構成図。
【図2】スペクトルとケプストラムの概念図。
【図3】1次のケプストラム係数の増減によるスペクト
ルの変化を示す図。
【図4】本発明の第2の実施例を示す音声合成装置のブ
ロック構成図。
【図5】本発明の第3の実施例を示す音声合成装置のブ
ロック構成図。
【図6】本発明の第4の実施例を示す音声合成装置のブ
ロック構成図。
【図7】本発明の第5の実施例を示す音声合成装置のブ
ロック構成図。
【符号の説明】
11…音質入力部(音質指定手段)、12…合成パラメ
ータ記憶部、13…ピッチパターン記憶部(ピッチ記憶
手段)、14,24…音声合成器(LMAフィルタ)、
15,25…D/Aコンバータ、16,26…増幅器、
17,17-1,17-2,27…スピーカ(合成音声出力
手段)、18,28,181,281…ケプストラム加
算値決定部、19,191,192…合成パラメータ加
工部、20…音声記号列蓄積部、21…韻律パラメータ
生成部(ピッチ記憶手段)、22…音声素片記憶部(有
声無声情報記憶手段)、23,231…音韻パラメータ
生成部、31…出力切り替え制御部、32…出力切り替
え部(出力先選択手段)、112…増幅率制御部、18
2…スピーカ特性補正用ケプストラム蓄積部、221…
音声素片記憶部(母音/子音情報記憶手段)。

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】音声のケプストラム係数を合成パラメータ
    記憶手段に記憶しておき、音声合成に際しては、前記合
    成パラメータ記憶手段から音声合成に用いるケプストラ
    ム係数を読み出して、当該ケプストラム係数をもとに音
    声を合成する音声合成方法において、 前記合成パラメータ記憶手段から読み出したケプストラ
    ム係数のうちの零次以外の次数の少なくとも1つの係数
    を所定の演算によって変更した後に、当該ケプストラム
    係数を音声信号波形に変換して音声を合成することを特
    徴とする音声合成方法。
  2. 【請求項2】音声のケプストラム係数を合成パラメータ
    記憶手段に記憶しておき、音声合成に際しては、前記合
    成パラメータ記憶手段から音声合成に用いるケプストラ
    ム係数を読み出して、当該ケプストラム係数をもとに音
    声を合成する音声合成方法において、 前記合成パラメータ記憶手段から読み出したケプストラ
    ム係数のうちの零次以外の次数の少なくとも1つの係数
    を、音質を指定する音質指定手段から与えられる音質情
    報により決定される変更方法に従って変更した後に、当
    該ケプストラム係数を音声信号波形に変換して音声を合
    成することを特徴とする音声合成方法。
  3. 【請求項3】音声のケプストラム係数を合成パラメータ
    記憶手段に記憶しておき、音声合成に際しては、前記合
    成パラメータ記憶手段から音声合成に用いるケプストラ
    ム係数を読み出して、当該ケプストラム係数をもとに音
    声を合成し、この合成された音声の振幅を合成音声の音
    量を指定する音量設定手段から与えられる音量情報に応
    じて変化させる音声合成方法において、 前記合成パラメータ記憶手段から読み出したケプストラ
    ム係数のうちの零次以外の次数の少なくとも1つの係数
    を、前記音量設定手段から与えられる音量情報により決
    定される変更方法に従って変更した後に、当該ケプスト
    ラム係数を音声信号波形に変換して音声を合成すること
    を特徴とする音声合成方法。
  4. 【請求項4】音声のケプストラム係数を合成パラメータ
    記憶手段に記憶しておき、音声合成に際しては、前記合
    成パラメータ記憶手段から音声合成に用いるケプストラ
    ム係数を読み出して、当該ケプストラム係数をもとに音
    声を合成し、この合成された音声を、複数の合成音声出
    力手段のうち音声出力先を決定する出力先選択手段によ
    り選択される唯一の合成音声出力手段から出力させる音
    声合成方法において、 前記合成パラメータ記憶手段から読み出したケプストラ
    ム係数のうちの零次以外の次数の少なくとも1つの係数
    を、前記出力先選択手段により選択される出力先を示す
    情報により決定される変更方法に従って変更した後に、
    当該ケプストラム係数を音声信号波形に変換して音声を
    合成することを特徴とする音声合成方法。
  5. 【請求項5】音声のケプストラム係数の時系列を合成パ
    ラメータ記憶手段に、音声の有声無声情報を有声無声情
    報記憶手段に、それぞれ記憶しておき、音声合成に際し
    ては、前記合成パラメータ記憶手段から音声合成に用い
    るケプストラム係数の時系列を、前記有声無声情報記憶
    手段から音声合成に用いる有声無声情報を、それぞれ読
    み出して、当該ケプストラム係数の時系列及び有声無声
    情報をもとに音声を合成する音声合成方法において、 前記合成パラメータ記憶手段から読み出したケプストラ
    ム係数のうちの零次以外の次数の少なくとも1つの係数
    を、前記有声無声情報記憶手段から読み出した有声無声
    情報により決定される変更方法に従って変更した後に、
    当該ケプストラム係数の時系列及び有声無声情報から音
    声信号波形を生成して音声を合成することを特徴とする
    音声合成方法。
  6. 【請求項6】音声のケプストラム係数の時系列を合成パ
    ラメータ記憶手段に、音声の有声無声情報を有声無声情
    報記憶手段に、そして音声のピッチ周波数の時系列をピ
    ッチ記憶手段に、それぞれ記憶しておき、音声合成に際
    しては、前記合成パラメータ記憶手段から音声合成に用
    いるケプストラム係数の時系列を、前記有声無声情報記
    憶手段から音声合成に用いる有声無声情報を、そして前
    記ピッチ記憶手段から音声合成に用いるピッチ周波数の
    時系列を、それぞれ読み出して、当該ケプストラム係数
    の時系列、有声無声情報及びピッチ周波数の時系列をも
    とに音声を合成する音声合成方法において、 前記合成パラメータ記憶手段から読み出したケプストラ
    ム係数のうちの零次以外の次数の少なくとも1つの係数
    を、前記有声無声情報記憶手段から読み出した有声無声
    情報及び前記ピッチ記憶手段から読み出したピッチ周波
    数の値により決定される変更方法に従って変更した後
    に、当該ケプストラム係数の時系列、有声無声情報及び
    ピッチ周波数の時系列から音声信号波形を生成して音声
    を合成することを特徴とする音声合成方法。
  7. 【請求項7】音声のケプストラム係数の時系列を合成パ
    ラメータ記憶手段に記憶しておき、音声合成に際して
    は、前記合成パラメータ記憶手段から音声合成に用いる
    ケプストラム係数の時系列を読み出して、当該ケプスト
    ラム係数の時系列をもとに音声を合成する音声合成方法
    において、 音声の母音区間または子音区間を示す区間情報を母音/
    子音情報記憶手段に記憶しておき、前記合成パラメータ
    記憶手段から読み出したケプストラム係数のうちの零次
    以外の次数の少なくとも1つの係数を、前記母音/子音
    情報記憶手段に記憶された母音/子音情報により決定さ
    れる変更方法に従って変更した後に、当該ケプストラム
    係数の時系列から音声信号波形を生成して音声を合成す
    ることを特徴とする音声合成方法。
  8. 【請求項8】音声のケプストラム係数の時系列を合成パ
    ラメータ記憶手段に、音声のピッチ周波数の時系列をピ
    ッチ記憶手段に、それぞれ記憶しておき、音声合成に際
    しては、前記合成パラメータ記憶手段から音声合成に用
    いるケプストラム係数の時系列を、前記ピッチ記憶手段
    から音声合成に用いるピッチ周波数の時系列を、それぞ
    れ読み出して、当該ケプストラム係数の時系列及びピッ
    チ周波数の時系列をもとに音声を合成する音声合成方法
    において、 音声の母音区間または子音区間を示す区間情報を母音/
    子音情報記憶手段に記憶しておき、前記合成パラメータ
    記憶手段から読み出したケプストラム係数のうちの零次
    以外の次数の少なくとも1つの係数を、前記母音/子音
    情報記憶手段に記憶された母音/子音情報及び前記ピッ
    チ記憶手段から読み出したピッチ周波数の値により決定
    される変更方法に従って変更した後に、当該ケプストラ
    ム係数の時系列及びピッチ周波数の時系列から音声信号
    波形を生成して音声を合成することを特徴とする音声合
    成方法。
  9. 【請求項9】音声のケプストラム係数が記憶される合成
    パラメータ記憶手段と、この合成パラメータ記憶手段か
    ら読み出されたケプストラム係数をもとに音声を合成す
    る音声合成手段とを備えた音声合成装置において、 前記合成パラメータ記憶手段から読み出されたケプスト
    ラム係数を入力し、そのうちの零次以外の次数の少なく
    とも1つの係数を所定の演算によって変更した後に、当
    該ケプストラム係数を前記音声合成手段に与える合成パ
    ラメータ加工手段を具備することを特徴とする音声合成
    装置。
  10. 【請求項10】音声のケプストラム係数が記憶される合
    成パラメータ記憶手段と、この合成パラメータ記憶手段
    から読み出されたケプストラム係数をもとに音声を合成
    する音声合成手段とを備えた音声合成装置において、 音質を指定する音質指定手段と、 前記合成パラメータ記憶手段から読み出されたケプスト
    ラム係数を入力し、そのうちの零次以外の次数の少なく
    とも1つの係数を、前記音質指定手段の指定する音質を
    示す情報により決定される変更方法に従って変更した後
    に、当該ケプストラム係数を前記音声合成手段に与える
    合成パラメータ加工手段を具備することを特徴とする音
    声合成装置。
  11. 【請求項11】音声のケプストラム係数が記憶される合
    成パラメータ記憶手段と、この合成パラメータ記憶手段
    から読み出されたケプストラム係数をもとに音声を合成
    する音声合成手段と、合成音声の音量を指定する音量設
    定手段と、この音量設定手段により指定された音量を示
    す情報に応じて合成音声の振幅を変化させる合成音声増
    幅手段とを備えた音声合成装置において、 前記合成パラメータ記憶手段から読み出されたケプスト
    ラム係数を入力し、そのうちの零次以外の次数の少なく
    とも1つの係数を、前記音量指定手段の指定する音量を
    示す情報により決定される変更方法に従って変更した後
    に、当該ケプストラム係数を前記音声合成手段に与える
    合成パラメータ加工手段を具備することを特徴とする音
    声合成装置。
  12. 【請求項12】音声のケプストラム係数の時系列が記憶
    される合成パラメータ記憶手段と、この合成パラメータ
    記憶手段から読み出されたケプストラム係数の時系列を
    もとに音声を合成する音声合成手段と、合成音声の出力
    に用いられる複数の合成音声出力手段と、この複数の合
    成音声出力手段の1つを音声出力先として選択する出力
    先選択手段とを備えた合成音声装置において、 前記合成パラメータ記憶手段から読み出されたケプスト
    ラム係数を入力し、そのうちの零次以外の次数の少なく
    とも1つの係数を、前記出力先選択手段により選択され
    る出力先を示す情報により決定される変更方法に従って
    変更した後に、当該ケプストラム係数を前記音声合成手
    段に与える合成パラメータ加工手段を具備することを特
    徴とする音声合成装置。
  13. 【請求項13】音声のケプストラム係数の時系列が記憶
    される合成パラメータ記憶手段と、音声の有声無声情報
    が記憶される有声無声情報記憶手段と、前記合成パラメ
    ータ記憶手段から読み出されたケプストラム係数の時系
    列及び前記有声無声情報記憶手段から読み出された有声
    無声情報をもとに音声を合成する音声合成手段とを備え
    た音声合成装置において、 前記合成パラメータ記憶手段から読み出されたケプスト
    ラム係数を入力し、そのうちの零次以外の次数の少なく
    とも1つの係数を、前記有声無声情報記憶手段から読み
    出された有声無声情報により決定される変更方法に従っ
    て変更した後に、当該ケプストラム係数を前記音声合成
    手段に与える合成パラメータ加工手段を具備することを
    特徴とする音声合成装置。
  14. 【請求項14】音声のケプストラム係数の時系列が記憶
    される合成パラメータ記憶手段と、音声の有声無声情報
    が記憶される有声無声情報記憶手段と、音声のピッチ周
    波数の時系列が記憶されるピッチ記憶手段と、前記合成
    パラメータ記憶手段から読み出されたケプストラム係数
    の時系列、前記有声無声情報記憶手段から読み出された
    有声無声情報及び前記ピッチ記憶手段から読み出された
    ピッチ周波数の時系列をもとに音声を合成する音声合成
    手段とを備えた音声合成装置において、 前記合成パラメータ記憶手段から読み出された前記ケプ
    ストラム係数を入力し、そのうちの零次以外の次数の少
    なくとも1つの係数を、前記有声無声情報記憶手段から
    読み出された有声無声情報及び前記ピッチ記憶手段から
    読み出されたピッチ周波数により決定される変更方法に
    従って変更した後に、当該ケプストラム係数を前記音声
    合成手段に与える合成パラメータ加工手段を具備するこ
    とを特徴とする音声合成装置。
  15. 【請求項15】音声のケプストラム係数が記憶される合
    成パラメータ記憶手段と、この合成パラメータ記憶手段
    から読み出されたケプストラム係数の時系列をもとに音
    声を合成する音声合成手段とを備えた音声合成装置にお
    いて、 音声の母音区間または子音区間を示す区間情報が記憶さ
    れる母音/子音情報記憶手段と、 前記合成パラメータ記憶手段から読み出された前記ケプ
    ストラム係数を入力し、そのうちの零次以外の次数の少
    なくとも1つの係数を、前記母音/子音情報記憶手段に
    記憶された母音/子音情報により決定される変更方法に
    従って変更した後に、当該ケプストラム係数を前記音声
    合成手段に与える合成パラメータ加工手段を具備するこ
    とを特徴とする音声合成装置。
  16. 【請求項16】音声のケプストラム係数の時系列が記憶
    される合成パラメータ記憶手段と、音声のピッチ周波数
    の時系列が記憶されるピッチ記憶手段と、前記合成パラ
    メータ記憶手段から読み出されたケプストラム係数の時
    系列及び前記ピッチ記憶手段から読み出されたピッチ周
    波数の時系列をもとに音声を合成する音声合成手段とを
    備えた音声合成装置において、 音声の母音区間または子音区間を示す区間情報が記憶さ
    れる母音/子音情報記憶手段と、 前記合成パラメータ記憶手段から読み出された前記ケプ
    ストラム係数を入力し、そのうちの零次以外の次数の少
    なくとも1つの係数を、前記母音/子音情報記憶手段に
    記憶された母音/子音情報及び前記ピッチ記憶手段から
    読み出されたピッチ周波数により決定される変更方法に
    従って変更した後に、当該ケプストラム係数を前記音声
    合成手段に与える合成パラメータ加工手段を具備するこ
    とを特徴とする音声合成装置。
JP5272250A 1993-10-29 1993-10-29 音声合成方法及び音声合成装置 Pending JPH07129194A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5272250A JPH07129194A (ja) 1993-10-29 1993-10-29 音声合成方法及び音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5272250A JPH07129194A (ja) 1993-10-29 1993-10-29 音声合成方法及び音声合成装置

Publications (1)

Publication Number Publication Date
JPH07129194A true JPH07129194A (ja) 1995-05-19

Family

ID=17511232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5272250A Pending JPH07129194A (ja) 1993-10-29 1993-10-29 音声合成方法及び音声合成装置

Country Status (1)

Country Link
JP (1) JPH07129194A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008020840A (ja) * 2006-07-14 2008-01-31 Sharp Corp 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム
CN109952609A (zh) * 2016-11-07 2019-06-28 雅马哈株式会社 声音合成方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008020840A (ja) * 2006-07-14 2008-01-31 Sharp Corp 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム
CN109952609A (zh) * 2016-11-07 2019-06-28 雅马哈株式会社 声音合成方法
CN109952609B (zh) * 2016-11-07 2023-08-15 雅马哈株式会社 声音合成方法

Similar Documents

Publication Publication Date Title
Verfaille et al. Adaptive digital audio effects (A-DAFx): A new class of sound transformations
Saitou et al. Speech-to-singing synthesis: Converting speaking voices to singing voices by controlling acoustic features unique to singing voices
US5864794A (en) Signal encoding and decoding system using auditory parameters and bark spectrum
JP5255663B2 (ja) 特定ラウドネスに基づく聴覚イベント検出を使用する音声ゲイン制御
JP4945586B2 (ja) 信号帯域拡張装置
US8898055B2 (en) Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech
JP3653826B2 (ja) 音声復号化方法及び装置
US8271292B2 (en) Signal bandwidth expanding apparatus
US8229738B2 (en) Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method
US8996378B2 (en) Voice synthesis apparatus
US8311842B2 (en) Method and apparatus for expanding bandwidth of voice signal
EP1252621A1 (en) System and method for modifying speech signals
JP2012159540A (ja) 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体
JP6821970B2 (ja) 音声合成装置および音声合成方法
JP6533959B2 (ja) 音声信号処理装置および音声信号処理方法
JP3430985B2 (ja) 合成音生成装置
JPH07129194A (ja) 音声合成方法及び音声合成装置
JP3197975B2 (ja) ピッチ制御方法及び装置
JPH086596A (ja) 音声強調装置
JPH08110796A (ja) 音声強調方法および装置
JP3102553B2 (ja) 音声信号処理装置
KR20110025434A (ko) 노래의 감성 향상 방법 및 장치
JP2615856B2 (ja) 音声合成方法とその装置
JP2003271200A (ja) 音声合成方法および音声合成装置
JP2000242287A (ja) 発声補助装置およびプログラム記録媒体