JP4624552B2

JP4624552B2 - 狭帯域言語信号からの広帯域言語合成

Info

Publication number: JP4624552B2
Application number: JP2000538347A
Authority: JP
Inventors: ブリーン、アンドリュー・ポール
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 1998-03-25
Filing date: 1999-03-17
Publication date: 2011-02-02
Anticipated expiration: 2019-03-17
Also published as: WO1999049454A1; US6691083B1; EP1064648A1; DE69901606D1; DE69901606T2; EP0945852A1; JP2002508526A; EP1064648B1

Description

【０００１】
発明の属する技術分野
本発明は、言語合成（話し言葉の合成）、とくに帯域制限された言語信号、例えば公衆交換電話ネットワークを経由して伝送される言語信号からの広帯域言語の合成に関する。
【０００２】
従来の技術
本発明は、声帯管(vocal tract)の性質のために、帯域制限されたためにもとの広帯域言語信号から失われているそのもとの広帯域言語信号の一部と、帯域制限されたその信号との間に相関関係があるという判断に基いている。この相関が原因で、帯域制限された言語信号の帯域幅内からの言語を使用して、失われているもとの広帯域言語信号を予測することができる。無声音よりも有声音の方がよりよい相関関係にある。
【０００３】
電話帯域幅言語信号から広帯域言語信号を構築する既知のシステムはトレーニングプロセスを使用して、狭帯域入力信号から失われている信号の推定を生成できる変換（形式変換）を定めている。一般的に、狭帯域信号の表示と要求される広帯域信号の表示との間の相関関係を規定するトレーニング段階中にルックアップ表が構成される。ルックアップ表は、実際の狭帯域スペクトルから推定される広帯域スペクトルへ変換を行うのに使用することができる。狭帯域言語信号から広帯域言語信号を生成するために、受取られた狭帯域言語が解析され、ルックアップ表内の最も近い表示が識別される。対応する広帯域信号表示を使用して、要求される広帯域信号を合成する。広帯域信号の全体を合成するか、またはもとの狭帯域信号を、狭帯域信号の帯域幅外で合成信号へ加えてもよい。
【０００４】
アベおよびヨシダによる日本国特許出願第6-118995号明細書（‘Method for reconstructing a wideband speech signal’）では、線形予測コーディング（ＬＰＣ）解析を使用して、このようなルックアップ表を構成し、広帯域トレーニング言語のスペクトルを特徴付ける。ＬＰＣ係数は広帯域トレーニング信号から抽出される。これらの広帯域のＬＰＣ係数は広帯域コードワードからクラスタ化される。広帯域トレーニング信号は帯域フィルタで処理されて、帯域幅制限された信号を供給し、そのスペクトルもＬＰＣ解析を使用して特徴付けられる。こうして得られた狭帯域のＬＰＣ係数は対応する広帯域コードワードは対応する広帯域コードワードと対にされて、各広帯域コードワードごとに対応する狭帯域係数の組を平均化して、狭帯域コードワードを形成する。したがって狭帯域信号および広帯域信号の両方を1組のＬＰＣ係数によって表わされる。ＬＰＣ係数からの広帯域信号の合成は、従来の技術を使用して行われる。別のシステム（アベおよびヨシダによる日本国特許出願第7-56559号明細書（‘Method for reconstructing a wideband speech signal））では広帯域信号は言語波形によって表わされ、広帯域信号の合成は言語波形の連結によって達成される。
【０００５】
発明が解決しようとする課題
本発明にしたがって、帯域制限された言語信号から言語を合成する装置であって：
帯域制限された信号からスペクトル信号を抽出する手段と；
前記スペクトル信号を受取り、所定の周波数範囲をサーチして、前記スペクトル信号内の1以上のピークの周波数に対応する1組の1以上のピーク周波数出力値を供給するようにされているピークピッキング手段(peak-picking means)と；
複数のコードブックエントリを含み、各コードブックエントリが、1組の1以上のコードブック周波数値および1組の1以上の対応する合成パラメータとから成るコードブック手段と；
前記ピーク周波数値の組を受取るようにされていて、かつコードブック手段にアクセスして、前記ピーク周波数値の組に近いコードブック周波数値の組に対応する要求された合成パラメータの組を抽出するようにされているルックアップ表と；
要求された合成パラメータの組を受取り、前記要求された合成パラメータの組を使用して言語を生成するようにされている言語合成手段とを含む装置を提供する。
【０００６】
コードブック合成パラメータの組が、合成された言語のスペクトル内のピーク振幅に関係する合成パラメータを含み、ピーク周波数が所定の周波数範囲外であってもよい。
【０００７】
コードブック合成パラメータの組が、合成された言語のスペクトル内のピーク周波数に関係する合成パラメータを含み、ピーク周波数が所定の周波数範囲外であってもよい。
【０００８】
好ましい実施形態において、ピークピッキング手段が前記スペクトル信号内に1以上のピークを認識することができ、このような場合に複数のピーク周波数出力値を含む組を用意し、コードブック周波数値の組のいくつかが複数のコードブック周波数値を含む。
【０００９】
本発明の可能な実施形態では、コードブック合成パラメータの組が、
３つの合成パラメータを含み、各パラメータが合成された言語のスペクトルにおいて高周波数ピークの振幅に関係し、高周波数ピークの周波数が所定の周波数範囲の上方帯域制限よりも高い周波数である。
【００１０】
本発明の別の実施形態において、コードブック合成パラメータの組が、
合成された言語のスペクトル内に、所定の周波数範囲の下方帯域制限よりも低い周波数である低周波数ピークの周波数に関係する合成パラメータと；
低周波数ピークの振幅に関係する合成パラメータとを含む。
【００１１】
さらに加えて、ピッチ抽出手段は、帯域制限された言語信号を受取るように接続でき、スペクトル信号が有声音の言語を表わして、受取られた帯域制限された言語信号のピッチに対応するピッチ周波数値を与える場合に；
コードブック周波数値の組のいくつかがピッチに関係する周波数値を含み；
スペクトル信号が有声音の言語を表わす場合に、ルックアップ手段が、さらに前記ピッチ周波数値にも近いコードブック周波数値の組に対応している要求された合成パラメータの組を抽出するようにされている。
【００１２】
本発明によって対応する手段も用意されている。
【００１３】
本発明において、ピークピッカー２を使用して、ホルマント周波数の推定を与える。声帯管(vocal tract)の性質が原因となって、声帯および鼻腔の形状に起因する拘束条件と筋肉の物理的な限界に起因する拘束条件とは、有声音では、ホルマントの周波数が声帯管の形状に関して良好な表示を与えることを条件としている。したがって有声音では、既知の狭帯域言語信号におけるホルマントは、狭帯域言語信号の帯域幅外の何れのホルマントについての位置の良好な表示である。
【００１４】
ここで本発明の例を添付の図面を参照して例示的に記載することにする。
【００１５】
発明の実施の形態
図１を参照すると、ディジタル狭帯域言語はスペクトル信号抽出器１によって、例えばディジタル電話ネットワーク、またはディジタル対アナログコンバータから受取られる。本明細書に記載した本発明の実施形態は、電話帯域幅言語信号から広帯域言語を合成するように設計されているので、受取られた言語の帯域幅は３００Ｈｚないし３．４ＫＨｚ内である。スペクトル信号は、それぞれが多数の隣合う連続するディジタルサンプルを表わしており、ディジタル狭帯域言語から導き出される。例えば言語サンプルは毎秒８０００サンプルのレートで受取ることができ、スペクトル信号は２５６の隣合う連続する言語サンプルのフレームを表わすことができ、したがって３２ｍｓである。スペクトル信号は1組のスペクトル値を含み、各スペクトル値は特定の周波数値に対応する。各フレームは、例えばハミングウインドウを使用してウインドウ処理され（すなわち、サンプルは所定の重付け定数によって逓倍される）、フレームのエッジによって生成された寄生の人為構造(spurious artefacts)を低減することが好ましい。好ましい実施形態では、フレームは、例えば５０％だけ重なり合って、１６ｍｓごとに1フレームを用意する。本明細書に記載した本発明の実施形態では、スペクトル信号は各フレームに対して実行される高速フーリエ変換（ＦＦＴ）によって得られ、したがって周波数値の範囲ごとに信号値を与え、この信号は各値の対数を計算する前に整流される（すなわち、各値の大きさが使用される）。したがって生成されたスペクトル信号は狭帯域信号のスペクトルの対数を表わす。スペクトル信号抽出器１は適切にプログラムされたディジタル信号プロセッサ（ＤＳＰ）によって生成することができる。
【００１６】
各スペクトル信号は、今度は、ピークピッカー２によって解析され、ピークピッカー２はスペクトル信号内で１以上のピークをサーチし、識別されたピークの周波数値を出力として与える。サーチされるピーク数は、とりわけ受取られた帯域幅言語信号の帯域幅に依存する。識別されるピーク数はサーチされるピーク数以下であってもよいことが認識されるであろう。本明細書に記載した実施形態ではスペクトル信号内の３つのピークの周波数（Ｆ１、Ｆ２、およびＦ３）がサーチされる。これらの３つのピークは、言語信号内の最初の３つのホルマントに対応することが意図されている。ピークは、このピークに近い周波数値のスペクトル値よりも高いスペクトル値をもつ周波数値として規定してもよい。ウインドウの大きさは、スペクトル値が比較される周波数値の数を与えるように定めてもよい。例えば、ウインドウの大きさが３つある場合に、周波数値のスペクトル値が次に小さい周波数値のスペクトル値よりも大きく、次に大きい周波数値のスペクトル値よりも大きいときに、これがピークであると定められる。ウインドウの大きさが５つある場合は、周波数値のスペクトル値は２つの次に小さい周波数値のスペクトル値よりも大きく、２つの次に大きい周波数値のスペクトル値よりも大きいとき、これがピークであると定められる。他のウインドウの大きさを使用することができる。スペクトル信号内にピークがあると予測される周波数範囲であって、各周波数範囲内で最高のスペクトル値をもつ周波数が識別されるように周波数範囲を定めることができる。これらの範囲外のピークは無視してもよい。ピークピッカーは適切にプログラムされたマイクロプロセッサチップを使用して、またはＤＳＰチップを使用する場合はスペクトル信号抽出器を構成するのに使用されるのと同じＤＳＰを使ったＤＳＰチップによって構成してもよい。
【００１７】
コードブックアクセス機構３は、狭帯域言語のフレームから導き出されるスペクトル信号内に1以上の周波数値の組を受取る。コードブックメモリ４は、標準のランダムアクセス（ＲＡＭ）チップを使用して構成することができ、コードブックメモリ４は各組が１以上の周波数値を含み、各組が1以上の合成器パラメータを含む組に対応する組を複数もっている。ユークリッド距離のような測定値を使用して、1組のコードブック測定値が受取られた組に近いことを判断する。合成器パラメータの対応する組が抽出され、言語合成器５へ送られる。本明細書に記載した実施形態において、使用される合成パラメータには、本明細書中でＡ４、Ａ５、およびＡ６と呼ばれる３つの振幅パラメータがあり、これらのパリティはそれぞれ周波数４３５０Ｈｚ、５４００Ｈｚ、および７０００Ｈｚに中心を置く３つの高周波数ホルマントの振幅を定め、さらに本明細書ではＦＮおよびＡＮと呼ばれる、周波数および振幅のパラメータの対もあり、これらのパラメータは３００Ｈｚよりも幾らか低い周波数をもつ合成ホルマントの周波数および振幅を定める。このような低周波数ホルマントは普通、鼻腔の共振によって言語内に存在する。
【００１８】
本明細書に記載された実施形態において使用された合成パラメータは、知覚上重要な言語信号の属性の知識に基づいて選択された。例えば、人間の耳は第４、第５、および第６のホルマントの精密な周波数を知覚しないが、これらのホルマントの振幅は知覚上重要であることが証明された。したがって本発明のこの実施形態において、これらのホルマントの周波数は固定され、振幅パラメータＡ４、Ａ５、およびＡ６が狭帯域スペクトル成分に基いて選択される。
【００１９】
合成器（シンセサイザ）５は、言語波形の要求されるピッチを表わすピッチ周波数パラメータＦ０を要求する。有声音言語（例えば、母音）の中で、言語信号は、発話者の音声のピッチに依存する低周波数信号によって変調され、所定の発話者の特徴を相当に表わす。無声音の言語（例えば“ｓｈ”）の中では、このような変調はない。
【００２０】
ピッチ周波数パラメータＦ０は、ピッチ抽出器（ピッチ検出器とも予測器とも言う）17によって生成される。ピッチ周波数パラメータＦ０は、スペクトル信号抽出器１から受取られるスペクトルの対数に対して逆ＦＦＴを実行することによって生成することができる。その代わりに、スペクトルが実数であるとき、スペクトル信号に対して離散的余弦変換（ＤＣＴ）を実行するのに十分である。何れの技術でも、各々がクフレンシイ（周波数対応値：quefrency）に対応するケプストラム値の組を含むケプストラム信号(cepstral signal)を生成する。発話のピッチはケプストラム信号のピークとして現れ、既に記載したアルゴリズムのようなピークピッキングアルゴリズムを使用して検出できる。ケプストラム値が負のときは、信号のピークを検出するには、ケプストラム値の大きさを使用するか、またはケプストラム値を平方する。所定の閾値を越える大きさをもつケプストラム値をもたないとき、信号は無声音であると考えられ、ピッチ周波数パラメータＦ０を示す信号に加えて、ピッチ検出器17は、ケプストラム信号が対応する言語のフレームが有声音か無声音かを示す二値信号を供給することができる。ケプストラム内でこのようなピークをサーチするとき、正規のピッチをもつ言語の周波数範囲に対応するクフレンシイ範囲内のケプストラム値を検討することのみが必要である。
【００２１】
合成器５の動作は、図３を参照して後で記載される。
【００２２】
図２を簡単に参照して、受取られた狭帯域言語信号から広帯域言語を合成する装置の第２の実施形態を示す。コードブック周波数値の組は周波数値Ｆ１、Ｆ２、Ｆ３と、さらにピッチ周波数値Ｆ０とを含む。
【００２３】
ピッチ周波数パラメータＦ０はピッチ抽出器17によって生成される。ピッチ周波数が非常に異なる言語の発話、例えば男性と女性の発話は、帯域制限された言語のホルマントと帯域幅の制限されていないホルマントとの間の異なる相互関係を示すことができるので、コードブック周波数値の組内にピッチ周波数パラメータを含むことが効果的である。さらに有声音の発話は、帯域制限されたスペクトルと広帯域スペクトルとの間の異なる関係を、無声音の発話によって示される関係に示す。
【００２４】
図３には図１に示した装置によって与えられるような合成パラメータの組を使用して広帯域言語を合成するシンセサイザが示されており、ここで図３を参照して図１の合成器５の動作を記載することにする。図３のシンセサイザ５は、並行ホルマント合成の周知の原理に基づいているが、この場合は帯域制限されていない信号周波数のみが合成される。このような合成器の動作原理は、言語が実質的に分離可能な励起関数によってドライブされる時間で変化するフィルタ９の出力であると考えられる言語生成のモデルに基づいている。励起関数は一般的に、２つの励起源、無声音の励起発生器10、および有声音の励起発生器11を使用して与えられる。無声音の励起発生器10はホワイトノイズにかなり類似した信号を供給し、有声音の励起発生器11はピッチ周波数パラメータＦ０によって制御され、励起発生器によって供給される波形の周波数を判断する。ピッチ周波数発生器Ｆ０は、図１のピッチ抽出器17によって狭帯域言語信号から抽出される。時間で変化するフィルタ９は並列共振器12、13、14、15のネットワークによって与えられる。
【００２５】
一般化されたホルマント言語合成器では、励起発生器を全ての合成器に接続することができ、励起の度合いは‘音声制御(voicing control)’パラメータによって制御される。しかしながら従来のホルマント合成器において、このようなパラメータは普通二値数であり、各音声制御パラメータはその相手に対して別の値に設定される。本明細書に記載した実施形態において、有声音の励起発生器11は、ピッチ抽出器17によって狭帯域幅言語から生成されるピッチ周波数パラメータＦ０によって制御される。有声音の励起発生器は共振器15に接続され、この中心周波数はコードブック合成パラメータＦＮを使用して制御される。励起信号の振幅はコードブック合成パラメータＡＮによって制御され、ＡＮは逓倍器43において励起信号によって逓倍される。この実施形態ではＦＮに中心を置く共振器の帯域幅は、５／６ＦＮから１／６ＦＮであると定められる。例えばＦＮが２５０Ｈｚであるとき、６ｄＢ低くなり、上方の遮断周波数はそれぞれ約２０８Ｈｚおよび２９２Ｈｚで発生する。無声音の励起発生器10は共振器12、13、および14に接続され、共振器12、13、および14を使用して、それぞれ４３５０Ｈｚ，５４００Ｈｚ、および７０００Ｈｚに中心を置く３つの高周波数ホルマントをシミュレートする。共振器12は３８７０ないし４８２０Ｈｚの帯域幅をもち、励起信号の振幅は、逓倍器40において励起信号によって逓倍されるコードブック合成パラメータＡ４によって制御される。共振器13は、４８２０Ｈｚないし６０２０Ｈｚの帯域幅をもち、励起信号の振幅は、逓倍器４１において励起信号によって逓倍されるコードブック合成パラメータＡ５によって制御される。共振器14は６０２０Ｈｚないし７９４０Ｈｚの帯域幅をもち、励起信号の振幅は逓倍器42において励起信号によって逓倍されるコードブック合成パラメータＡ６によって制御される。
【００２６】
狭帯域幅信号が有声音でないとき、ピッチ周波数パラメータＦ０はピッチ予測器17によって狭帯域信号から発生されず、有声音の励起発生器11によって共振器15へ供給されない。しかしながら共振器12、13、14は狭帯域信号が有声音であっても、無声音であっても、無声音の励起発生器10によってドライブされる。共振器12、13、14、15からの信号と、受取られた狭帯域言語信号とは加算器18において加算され、合成された広帯域言語信号を用意する。
【００２７】
図４に示した別の実施形態では、無声音の励起発生器10はスイッチ16を介して共振器15に接続され、スイッチ16はピッチ抽出器17から受取られる有声音／無声音の二値信号によって制御される。共振器15へ与えられる励起はこの第２の二値信号の値に依存する。励起は有声音の狭い帯域言語の場合は有声音の励起発生器11によって、無声音の狭帯域言語の場合は無声音の励起発生器10によって共振器15へ供給される。
【００２８】
図５に示した装置を使用して、全広帯域幅言語信号を合成し、ピークピッカーは変調されて、変調された合成器５’を追加の信号周波数値Ｆ１、Ｆ２、およびＦ３へ追加の信号振幅値Ａ１、Ａ２、およびＡ３と一緒に供給できることが認識されるであろう。周波数信号値を使用して、予備の共振器30、31、および32を制御し、振幅値を使用して、逓倍器33、34、および35を介して有声音励起信号の振幅を制御する。
【００２９】
その代わりに、コードブックアクセス機構３によって信号周波数値に近いと考えられるコードブック周波数値Ｆ１、Ｆ２、およびＦ３を合成器５’に供給してもよい。しかしながら、振幅値Ａ１、Ａ２、およびＡ３は依然として変調されたピークピッカーによって供給されなければならない。
【００３０】
図６は、本発明で使用するのに適したコードブックを生成する装置を示す。ディジタル広帯域言語信号は多数のフィルタ20、21、22、23、24によって受取られ、帯域制限された信号を供給する。本明細書に記載された実施形態において、低域フィルタ20は０ないし３００Ｈｚの低周波数スペクトル信号を供給し；帯域フィルタ21はシンセサイザに与えられることになる信号に類似した、この場合は３００Ｈｚないし３．４ＫＨｚの狭帯域信号を供給し；帯域フィルタ22、23、および24は3つの高周波数スペクトル信号の１つを、３つの高周波数ホルマント、この実施形態ではそれぞれ３８７０Ｈｚないし４８２０Ｈｚ、４８２０Ｈｚないし６０２０Ｈｚ、および６０２０Ｈｚないし７９４０Ｈｚに使用される各周波数帯域に供給する。各帯域制限されたスペクトル信号は、スペクトル信号抽出器１によって使用されるプロセスに類似のプロセスを使用して対応するスペクトル信号抽出器50、51、52、53、または54によって解析される。ピークピッカー２’が取付けられて、狭帯域信号を受取り、本明細書においてＦ1、Ｆ2、およびＦ3として知られている3つのコードブック周波数値が、図１を参照して前もって記載されたピークピッキングアルゴリズムを使用して判断される。ピークピッカー25は、低周波数スペクトル信号を受取るように接続される。ピークピッカー25は、ピークピッカー２’によって使用されるアルゴリズムに類似したアルゴリズムを使用して低周波数スペクトル信号内で最も大きい、それぞれＦＮおよびＡＮとして知られているピーク周波数および振幅を判断する。３つのエネルギー判断部26、27、28を使用して、それぞれフィルタ22、23、および24によって与えられる３つの高周波数スペクトル信号の平均振幅を測定する。本明細書においてＡ４、Ａ５、およびＡ６として知られている３つの平均振幅値を使用して、３つの高周波数ホルマントの振幅の推定を与える。したがって図６の装置を使用して、広帯域言語の各例に対して、３つのコードブック周波数値Ｆ１、Ｆ２、およびＦ３が与えられ、５つの合成パラメータＦＮ、ＡＮ、Ａ４、Ａ５、およびＡ６が与えられる。もちろん、コードブックエントリをクラスタ化して、パラメータの例を表わすより小さいコードブックを用意する。クラスタ化は、図１のシンセサイザにおけるコードブックサーチ速度を相当に速める。
【００３１】
図２を参照して既に記載したように、本発明の別の実施形態において、コードブック周波数値の組はピッチ周波数値Ｆ０を含み、Ｆ０は広帯域言語の発話のピッチを表わし、スペクトル信号抽出器１’から信号を受取るピッチ抽出器17’を使用して発生され、なおピッチ抽出器17’およびスペクトル信号抽出器１’は、図１のピッチ抽出器17およびスペクトル信号抽出器１と類似のやり方で動作することができる。
【図面の簡単な説明】
【図１】ホルマント周波数に関して狭帯域信号を特徴付ける、受取られた狭い帯域言語信号から広帯域言語を合成する装置の模式的なブロック図。
【図２】受取られた狭帯域言語信号から広帯域言語を合成する装置の別の実施形態を示す図。
【図３】本発明を使用して広帯域言語を合成するのに適した装置を示す図。
【図４】本発明を使用して広帯域言語を合成するのに適した装置の別の例を示す図。
【図５】本発明を使用して広帯域言語を合成するのに適した別の装置を示す図。
【図６】本発明の１つの実施形態において使用するルックアップ表を生成する装置を示す図。

Claims

帯域制限された言語信号から言語を合成する装置であって：
帯域制限された信号からスペクトル信号を抽出する手段と；
前記スペクトル信号を受取り、前記スペクトル信号内の１以上のピークの周波数に対応する1組の１以上のピーク周波数出力値を供給するために、所定の周波数範囲をサーチするように構成されているピークピッキング手段と；
複数のコードブックエントリを含み、各コードブックエントリが、1組の１以上のコードブック周波数値および1組の１以上の対応する合成パラメータとから成るコードブック手段と；
前記ピーク周波数値の組を受取るように構成されていて、かつコードブック手段にアクセスして、前記ピーク周波数値の組に近いコードブック周波数値の組に対応する要求された合成パラメータの組を抽出するように構成されているルックアップ手段と；
要求された合成パラメータの組を受取り、前記要求された合成パラメータの組を使用して言語を生成するように構成されている言語合成手段とを含む装置。
コードブック合成パラメータの組が、合成された言語のスペクトル内のピーク振幅に関係する合成パラメータを含み、ピーク周波数が所定の周波数範囲外である請求項１記載の装置。
コードブック合成パラメータの組が、合成された言語のスペクトル内のピーク周波数に関係する合成パラメータを含み、ピーク周波数が所定の周波数範囲外である請求項１または２記載の装置。
ピークピッキング手段が前記スペクトル信号内に２以上のピークを認識することができ、このような場合に複数のピーク周波数出力値を含む組を供給し、コードブック周波数値の組のいくつかが複数のコードブック周波数値を含む請求項１ないし３の何れか1項記載の装置。
コードブック合成パラメータの組が、
３つの合成パラメータを含み、各パラメータが合成された言語のスペクトル内で高周波数ピークの振幅に関係し、高周波数ピークの周波数が所定の周波数範囲の上方帯域制限よりも高い周波数である請求項１ないし４の何れか1項記載の装置。
コードブック合成パラメータの組が、
合成された言語のスペクトル内に、所定の周波数範囲の下方帯域制限よりも低い周波数である低周波数ピークの周波数に関係する合成パラメータと；
低周波数ピークの振幅に関係する合成パラメータとを含む請求項１ないし５の何れか1項記載の装置。
帯域制限された言語信号を受取るように接続されたピッチ抽出手段であって、スペクトル信号が有声音の言語を表わして、受取られた帯域制限された言語信号のピッチに対応するピッチ周波数値を与える場合に；
コードブック周波数値の組のいくつかはピッチに関係する周波数値を含み；
スペクトル信号が有声音の言語を表わす場合に、ルックアップ手段が前記ピッチ周波数値にも近いコードブック周波数値の組に対応している要求された合成パラメータの組を抽出するように構成されているピッチ抽出手段をさらに含む請求項１ないし６の何れか1項記載の装置。
帯域制限された言語信号から言語を合成する方法であって、
帯域制限された信号からスペクトル信号を抽出するステップと；
前記スペクトル信号内の１以上のピークの周波数に対応する1組の１以上のピーク周波数出力値を供給するために、スペクトル信号の所定の周波数範囲をサーチするステップと；
各コードブックエントリが1組の１以上のコードブック周波数値および1組の１以上の対応する合成パラメータとを含んでいる、複数のコードブックエントリを含むコードブックにアクセスするステップと；
前記ピーク周波数値の組に近いコードブック周波数値の組に対応する要求された合成パラメータの組を判断するステップと；
前記要求された合成パラメータの組を使用して言語を合成するステップとを含む方法。
コードブック合成パラメータの組が、合成された言語のスペクトル内のピーク振幅に関係する合成パラメータを含み、ピーク周波数が所定の周波数範囲外である請求項８記載の方法。
コードブック合成パラメータの組が、合成された言語のスペクトル内のピーク周波数に関係する合成パラメータを含み、ピーク周波数が所定の周波数範囲外である請求項８または９記載の装置。
前記スペクトル信号内の２以上のピークが認識された場合に、ピーク周波数の出力値の組が複数のピーク周波数出力値を含み、コードブック周波数値の組の幾つかが複数のコードブック周波数値を含む請求項８ないし１０のいずれか1項記載の方法。
コードブック合成パラメータの組が、
３つの合成パラメータを含み、各パラメータが合成された言語のスペクトル内に、所定の周波数範囲の上方帯域制限よりも高い周波数である高周波数ピークの振幅に関係する請求項８ないし１１の何れか1項記載の方法。
コードブック合成パラメータの組が、
合成された言語のスペクトル内に、所定の周波数範囲の下方帯域制限よりも低い周波数である低周波数ピークの周波数に関係する合成パラメータと；
低周波数ピークの振幅に関係する合成パラメータとを含む請求項８ないし１２の何れか1項記載の方法。
コードブック周波数値の組のいくつかが、ピッチに関係する周波数値を含み；
スペクトル信号が有声音の言語を表わすとき、スペクトル信号のピッチに対応するピッチ周波数値を使用して、前記ピッチ周波数値にも近いコードブック周波数値の組に対応している要求された合成パラメータの組を判断する請求項８ないし１３のいずれか1項記載の方法。