明 細 書 音声符号化装置、 音声復号装置、 音声符号化 Z復号を実現するプログラ ムの記録された記録媒体並びに移動体通信装置 技術分野
本発明は、 音声信号をコ一ド化して伝送する移動通信システム等にお ける C E L P ( Code Exc ited Linear Predic ion )型音声符号化装置及び に C E L P型音声復号装置、 並びに移動体通信装置に関する。 背景技術
C E L P型音声符号化装置は、 音声をある一定のフレーム長に区切り、 各フレーム毎に音声の線形予測を行い、 フレーム毎の線形予測による予 測残差 (励起信号) を既知の波形からなる適応符号ベク トルと雑音符号 べク トルを用いて符号化するものである。 適応符号べク トルと雑音符号 ベク トルは、 図 3 4に示すように、 それそれ適応符号帳 1及び雑音符号 帳 2に格納された適応符号べク トルと雑音符号べク トルをそのまま使用 する場合と、 図 3 5に示すように、 適応符号帳 1からの適応符号べク ト ルと、 雑音符号帳 2からの雑音符号べク トルを適応符号帳 1のピッチ同 期 Lに同期させた雑音符号べク トルを用いる場合とがある。 図 3 5は特 開平 5— 1 9 7 9 5号公報及び特開平 5— 1 9 7 9 6号公報に開示され ている C E L P型音声符号化装置における雑音音源べク トル生成部の構 成である。 図 3 5において、 適応符号帳 1から適応符号べク トルが選択 されるとともに、 ピッチ周期 Lが出力され、 雑音符号帳 2から選択され た雑音符号べク トルが、 周期化器 3により ピッチ周期 Lを用いて周期化 される。 周期化は、 雑音符号べク トルを先頭からピッチ周期分切り出し、
それをサブフレーム長に達するまで複数回繰り返して接続することによ つて行われる。
しかしながら、 上記従来の雑音符号べク トルをピッチ周期化する C E L P型音声符号化装置では、 適応符号ぺク トル成分を取り除いた後に残 留するピッチ周期成分を、 雑音符号べク トルをピッチ周期で周期化する ことによって取り除いているため、 1 ピッチ波形内に存在する位相情報、 すなわちどこにピッチパルスのビークが存在するかという情報を積極的 に用いることがなく、 音声品質の向上を図る上で限界があった。
本発明は、 このような従来の問題を解決するものであり、 音声品質を 一段と向上させることのできる音声符号化装置を提供することを目的と する。 発明の開示
上記目的を達成するために、 本発明は、 適応符号ベク トルのピッチピ —ク位置に対応する雑音符号べク トルの振幅を強調することによって、 1 ピッチ波形内に存在する位相情報を利用して、 音質向上を図るように したものである。
本発明はまた、 適応符号べク トルのピッチビーク近傍のみに限定した 雑音符号べク トルを用いることにより、 雑音符号べク トルに割り当てら れるビッ ト数が少ない場合でも、 音質劣化を少なくするようにしたもの である。
本発明はまた、 適応符号べク トルのピッチビークの位置とピッチ周期 を用いてパルス位置の探索範囲を限定することにより、 パルスの位置を 表すビッ ト数が少ない場合でも、 音質劣化を少なく しながら探索範囲を 狭めるようにしたものである。
本発明はまた、 適応符号べク トルのピッチビークの位置とピッチ周期
を用いてパルス位置の探索範囲を限定する際に、 特に 1〜 2 ピッチ波形 のパルス位置探索精度を細かく とることによって、 ピッチ周期が短い音 声の有声部の音質向上を図るようにしたものである。
本発明はまた、 ピッチ周期の値によってパルス音源のパルス本数を変 化させることにより、 音質向上を図るようにしたものである。
本発明はまた、 適応符号べク トルのピッチピーク位置付近とそれ以外 の部分のパルス振幅を予め決定してからパルス音源探索を行うことによ つて、 音質向上を図るようにしたものである。
本発明はまた、 ピッチゲインを多段量子化して初段の量子化情報を適 応符号帳探索直後に行うことによって、 ピッチゲインの初段量子化情報 を雑音符号帳切り替えの為のモード情報として利用できるようにして符 号化効率の向上を図るようにしたものである。
本発明はまた、 量子化ピッチ周期情報又は直前のサブフレームあるい は現サブフレームにおける量子化ピッチゲイ ン情報をもちいて、 パルス 音源の探索位置を切り替える制御を行うことにより、 音声品質の向上を 図るようにしたものである。
本発明はまた、 サブフレーム間における位相の連続性をバックワード で判定し、 位相が連続していると判定されたサブフレームについてのみ 位相適応処理を適用することにより、 伝送する情報量を増やさずに位相 適応処理の切り替えを行い、 音声品質の向上を図るようにしたものであ る。 なお、 位相適応処理を行わない場合に固定符号帳を使用すれば、 伝 送路誤りの伝播を防ぐ効果を得ることも可能となる。
本発明はまた、 適応符号べク トルにおけるピッチピーク位置近傍への 信号パワーの集中度によって、 位相適応処理を適用するかしないかを決 定することとにより、 伝送する情報量を増やさずに位相適応処理の切り 替えを行い、 音声品質の向上を図るようにしたものである。 なお、 位相
適応処理を行わない場合に固定符号帳を使用すれば、 伝送路誤りの伝播 を防ぐ効果を得ることも可能となる。
本発明はまた、 ビツチピーク位置からの相対位置で音源パルス探索を 行う C E L P型音声符号化装置において、 サブフレームの先頭側から順 番にパルス位置のイ ンデックスを付けるようにすることによって、 ある フレームにおいて発生した伝送路誤りの影響が後続の伝送路誤りのない フレームに伝播することを防ぐようにしたものである。
本発明はまた、 ビツチピーク位置からの相対位置で音源パルス探索を 行う C E L P型音声符号化装置において、 サブフレームの先頭側から順 番にパルス位置のイ ンデックスを付けるとともに、 同じインデヅクの異 なるパルスにおいてもサブフ レームの先頭側から順番にパルス番号を付 けるようにすることによって、 あるフレームにおいて発生した伝送路誤 りの影響が後続の伝送路誤りのないフレームに伝播することを防ぐよう にしたものである。
本発明はまた、 ピッチピーク位置からの相対位置で音源パルス探索を 行う C E L P型音声符号化装置において、 パルス探索位置の全てを相対 位置で表すのではなく、 ビツチピーク近傍の一部のみを相対位置で表現 し、 残りの部分は予め定められた固定位置にすることにより、 あるフ レ ームにおいて発生した伝送路誤りの影響が後続の伝送路誤りのないフ レ ームに伝播することを防ぐようにしたものである。
本発明はまた、 ピッチビーク位置を求める際に、 対象となる信号全体 に対してビヅチピーク位置の探索を行うのではなく、 切り出したビヅチ 周期長の信号の中でピッチビーク位置の探索を行う手段を備えることに より、 より正確に先頭のピッチビーク位置を抽出できるようにしたもの である。
本発明はまた、 サブフレーム間でピッチ周期が連続している部分、 即
ち有声定常部と思われる部分において、 直前のサブフ レームにおけるピ ツチピーク位置と直前のサブフレームにおけるビッチ周期と現在のサブ フレームにおけるピッチ周期を用いて現在のサブフレームにおけるビッ チビ一ク位置を予測し、 予測されたビッチビ一ク位置に基づいて現在の サブフレームにおけるピツチピーク位置の存在範囲を限定することによ り、 有声定常部における位相の不連続が生じないようにピッチビーク位 置を抽出できるようにしたものである。
本発明はまた、 サブフ レーム長が 1 0 m s程度以上を有し、 かつ雑音 符号帳倩報に割り当てられる情報量がサブフ レーム当たり 1 5 ビッ ト程 度のように比較的少なく、 雑音符号帳としてパルス音源を適用する場合 において、 パルス数を少なく して各パルスの位置情報を十分にとるモー ドと各パルスの位置情報を粗くする代わりにパルス数を増やしたモード とをそれそれ少なく とも 1モード以上 (合計 2モード以上) 備える構成 とすることによ り、 音声信号の有声立ち上がり部分の品質向上を図り、 またパルス数を増やすことによって各パルスの位置情報が粗くなること による音声品質の劣化を抑えることを可能としたものである。
請求項 1に記載の発明は、 適応符号べク トルのピッチビーク位置に対 応する雑音符号べク トルの振幅を強調する音源生成部を備えた C E L P 型音声符号化装置であり、 1 ピッチ波形内に存在する位相情報を利用し て、 音質向上を図ることができる。
請求項 2に記載の発明は、 請求項 1記載の音声符号化装置において、 音声生成部が、 適応符号べク トルのピッチ周期と同期した振幅強調窓を 雑音符号べク トルに乗ずることによって、 適応符号べク トルのビッチビ ークの位置に対応する雑音符号べク トルの振幅を強調するものであり、 雑音音源べク トルの振幅をビツチ周期に同期して強調することによって、 音質向上を図ることができる。
請求項 3に記載の発明は、 請求項 2記載の音声符号化装置において、 音声生成部が、 適応符号べク トルのピッチビーク位置を中心とする三角 窓を振幅強調窓として使用するものであり、 振幅強調窓長の制御を容易 に行うことができる。
請求項 4に記載の発明は、 C E L P型音声符号化装置において、 適応 符号べク トルのピッチピーク近傍のみに限定した雑音符号べク トルを用 いる音源生成部を備えた音声符号化装置であり、 適応符号べク トルのピ ツチビーク近傍のみに限定した雑音符号べク トルを用いることにより、 雑音符号べク トルに割り当てられるビッ ト数が少ない場合でも、 音質劣 化を少なくでき、 ピッチパルス近傍に残差パワーが集中するような有声 部で音質向上を図ることができる。
請求項 5に記載の発明は、 パルス音源を雑音符号帳に用いる C E L P 型音声符号化装置において、 パルス位置の探索範囲を適応符号べク トル のピッチ周期及びピッチビーク位置によって決定する音源生成部を備え た音声符号化装置であり、 パルス位置に割り当てられるビッ ト数が少な い場合でも、 音質劣化を少なくできる。
請求項 6に記載の発明は、 請求項 5記載の音声符号化装置において、 音源生成部が、 適応符号ベク トルのピッチビーク位置近傍は密に、 それ 以外の部分は疎になるようにパルス位置の探索範囲を決定するものであ り、 パルスが立てられる確率が高くなる部分を細かく探索するので、 音 声向上を図ることができる。
請求項 7記載の発明は、 ピツチ周期によってパルス位置の探索範囲を 切り替える請求項 5又は請求項 6記載の音声符号化装置であり、 ピッチ 周期に基づいてパルス位置の探索範囲を伸縮するので、 ビッチ周期が短 い場合に 1〜 2 ピッチの波形をより細かく表現することができ、 音声品 質の向上を図ることができる。
請求項 8記載の発明は、 適応符号べク トルに複数のピッチピークが存 在する場合に、 少なく とも 2つのピッチビークの位置が探索範囲に含ま れるようにパルス位置の探索範囲を限定する請求項 7記載の音声符号化 装置であり、 検出された先頭のビツチビークの位置が誤っていた場合の 影響を緩和することができ、 また、 先頭のピッチビーク付近の波形と 2 番目のピッチビーク付近の波形の形状変化にも対応することができるの で、 音声品質の向上を図ることができる。
請求項 9記載の発明は、 C E L P型音声符号化装置において、 音声の 分析結果によって雑音符号帳を切り替える音源生成部を備えた音声符号 化装置であり、 入力音声の特徴に応じて雑音符号帳を切り替えることが できるので、 音声品質の向上を図ることができる。
請求項 1 0記載の発明は、 C E L P型音声符号化装置において、 雑音 符号帳探索を行う以前に抽出された伝送パラメ一夕を用いて雑音符号帳 を切り替える音源生成部を備えた音声符号化装置であり、 すでに伝送す ることが決定されている情報を用いて雑音符号帳を切り替えるので、 情 報量を増加させることなく雑音符号帳の切り替えが行うことができる。 請求項 1 1記載の発明は、 音声信号の分析結果によってパルス本数を 切り替える構成の請求項 5から 8のいずれか 1つに記載の音声符号化装 置であり、 入力音声の特徴に応じてパルス本数を切り替えるため、 音声 品質の向上を図ることができる。
請求項 1 2記載の発明は、 雑音符号帳探索を行う以前に抽出されてい る情報を用いてパルス本数を切り替える構成を有する、 請求項 5から 8 又は 1 1のいずれか 1つに記載の音声符号化装置であり、 すでに伝送す ることが決定している情報を用いてパルス本数を切り替えるため、 伝送 する情報量を増加させることなくパルス本数の切り替えを行うことがで きる。
請求項 1 3記載の発明は、 ピッチ周期によってパルス本数を切り替え る音源生成部を備えた請求項 5から 8又は 1 1、 1 2のいずれか 1つに 記載の音声符号化装置であり、 ピッチ周期を用いてパルス数を切り替え るため、 伝送情報を増加させることなくパルス本数を切り替えることが できる。 また、 ピッチ周期によって最適なパルス本数が異なるため、 音 声品質の向上を図ることができる。
請求項 1 4記載の発明は、 連続するサブフレーム間でピッチ周期の変 動が小さい場合とそうでない場合でパルス本数を切り替える請求項 1 3 記載の記載の音声符号化装置であり、 音声信号の有声部の立ち上がり部 分と定常部分で使用するパルスの本数を切り替えることになるので、 音 声品質の向上を図ることができる。
請求項 1 5記載の発明は、 雑音音源としてパルス音源を用いる雑音符 号べク トル生成部において、 パルス位置探索に先立ってパルス振幅を決 定する請求項 5から 8、 1 1から 1 4のいずれか 1つに記載の音声符号 化装置であり、 パルス音源に振幅のバリエーションを持たせるため、 音 声品質の向上が図れる。 また、 パルス探索前に振幅を決定するため、 そ の振幅に対して最適なパルス位置を決定することができる。
請求項 1 6記載の発明は、 雑音音源としてパルス音源を用いる雑音符 号べク トル生成部において、 適応符号べク トルのピッチピーク近傍とそ れ以外の部分でパルス振幅を変える請求項 1 5記載の音声符号化装置で あり、 音源信号のピッチビーク近傍とそれ以外の部分の振幅を変化させ るので、 音源信号のピッチ構造の形状を効率的に表現でき、 音声品質の 向上及びパルス振幅情報の量子化の効率化を図ることができる。
請求項 1 7記載の発明は、 統計的にあるいは学習によって、 使用する パルス音源のパルス数をピッチ周期に基づいて決定する請求項 1 3記載 の音声符号化装置であり、 各ピッチ周期に対する最適パルス本数を統計
的あるいはその他の学習方法によって決定するため、 音声品質の向上を 図ることができる。
請求項 1 8記載の発明は、 C E L P型音声符号化装置において、 ピッ チゲイ ンを多段量子化する音源生成部を備え、 初段においては適応符号 帳探索直後に求められる値を量子化ターゲッ トとし、 2段目以降におい ては音源探索を全 て終えた後に閉ループ探索で决定されたピッチゲイ ンと初段で量子化された値の差分を量子化夕ーゲッ トとする音声符号化 装置であり、 適応符号帳と固定符号帳 (雑音符号帳) の和で駆動音源べ ク トルを生成する C E L P型音声符号化装置においては、 固定符号帳 (雑音符号帳) 探索前に得られる情報を量子化して伝送するため、 独立 したモード情報を付加せずに固定符号帳 (雑音符号帳) の切り替え等を 行うことが可能となり、 効率的に音声情報を符号化することが可能とな る。
請求項 1 9記載の発明は、 請求項 1 8記載の音声符号化装置において 適応符号帳探索直後に求められたビツチゲイ ンの量子化値を用いて固定 符号帳を切り替える構成を有する、 請求項 9から 1 2、 1 5から 1 7の いずれか 1つに記載の音声符号化装置であり、 固定符号帳探索前に求め られるピッチゲインと固定符号帳探索後に求められるビツチゲインの値 が大きく異ならないことを利用して、 モード情報を付加することなく固 定符号帳のモード切り替えを可能とし、 音声品質の向上を図ることがで ぎる。
請求項 2 0記載の発明は、 ピッチ周期のサブフレーム間変化に基づい て固定符号帳を切り替える請求項 9から 1 2、 1 5から 1 9のいずれか 1つに記載の音声符号化装置であり、 ピッチ周期のサブフレーム間の連 続性等を利用することによって、 有声 ·有声定常部であるか否かの判定 を行い、 有声 · 有声定常部に有効な音源とそれ以外の部分 (無声 · 立ち
上がり部等) に有効な音源との切り替えを行うことによって、 音声品質 の向上を図ることができる。
請求項 2 1記載の発明は、 直前のサブフレームで量子化されたピッチ ゲインを用いて固定符号帳を切り替える請求項 9から 1 2、 1 5から 1 7のいずれか 1つに記載の音声符号化装置であり、 ピッチゲインのサブ フレーム間の連続性等を利用することによって、 有声 · 有声定常部であ るか否かの判定を行い、 有声 ·有声定常部に有効な音源とそれ以外の部 分 (無声 · 立ち上がり部等) に有効な音源との切り替えを行うことによ つて、 音声品質の向上を図ることができる。
請求項 2 2記載の発明は、 ピッチ周期のサブフレーム間変化及び量子 化ピッチゲイ ンに基づいて固定符号帳を切り替える請求項 9から 1 2、 1 5から 1 7のいずれか 1つに記載の音声符号化装置であり、 伝送パラ メータであるピッチ周期及びピッチゲインの情報を用いて、 有声 ·有声 定常部であるか否かの判定を行い、 有声 · 有声定常部に有効な音源とそ れ以外の部分 (無声 · 立ち上がり部等) に有効な音源との切り替えを行 うことによって、 音声品質の向上を図ることができる。
請求項 2 3記載の発明は、 固定符号帳にパルス音源符号帳を用いる請 求項 1 9から 2 2のいずれか 1つに記載の音声符号化装置であり、 雑音 符号帳にパルス音源を用いるので、 雑音符号帳に要するメモリ量や雑音 符号帳探索時の演算量を少なくすることができ、 さらに有声部の立ち上 がりの表現性を向上することができる。
請求項 2 4記載の発明は、 所定の時間長を有するサブフレーム毎に音 声符号化処理を行う C E L P型音声符号化装置において、 現在のサブフ レームにおける位相と直前のサブフレームにおける位相とが連続してい るかどうかを判定し、 連続していると判定された場合と連続していない と判定された場合とで用いる音源を切り替える音声符号化装置であり、
有声 (定常) 部とそれ以外の部分を切り分けた音源構成が実現でき、 音 質向上を図ることができる。
請求項 2 5記載の発明は、 直前のサブフレームにおけるピッチピーク 位置と、 直前のサブフレームにおけるピッチ周期と、 現在のサブフレー ムにおけるビヅチ周期を用いて現在のサブフレームにおけるビヅチピー ク位置を予測し、 この予測によって得られた現在のサブフレームにおけ るビツチビーク位置が、 現在のサブフレームにおけるデ一夕のみから求 められたピッチビーク位置に近いかどうかによつて、 直前のサブフレー ムにおける位相と現在のサブフレームにおける位相とが連続しているか どうかを判定し、 その判定結果によって音源の符号化処理方法を切り替 える請求項 2 4記載の C E L P型音声符号化装置であり、 既に伝送され た又は伝送されることになっている情報を用いて判定結果を得るので、 判定結果を新たな伝送情報を用いて伝送する必要がない。
請求項 2 6記載の発明は、 直前のサブフレームにおける位相と現在の サブフ レームにおける位相とが連続していると判定された場合には、 位 相適応処理を雑音符号帳に対して行い、 直前のサブフレームにおける位 相と現在のサブフ レームにおける位相とが連続していないと判定された 場合には、 位相適応処理を雑音符号帳に対して行わない請求項 2 4又は 2 5記載の音声符号化装置であり、 効果的な位相適応処理を行うことが できる。 なお、 サブフレーム間の位相の連続性はバックワードで判定さ れるため、 位相適応処理を適用するかしないかの切り替え情報を新たに 伝送する必要もない。 さらに、 位相適応処理を適用しない場合は固定符 号帳を使用することにより、 伝送路誤りの影響の伝播を抑える効果を得 ることも可能である。
請求項 2 7記載の発明は、 所定の時間長を有するサブフ レーム毎に音 声符号化処理を行う C E L P型音声符号化装置において、 現在のサブフ
レームにおける適応符号ベク トルのピッチビーク付近における信号パヮ 一の集中度を基準として、 音源信号の符号化処理方法を切り替える音声 符号化装置であり、 音源構成 (音源信号の符号化処理方法) の切り替え のために新たな伝送情報を必要とせずに、 適応的に音源構成の切り替え を行うことができる。
請求項 2 8記載の発明は、 現在のサブフレームにおける適応符号べク トルのピッチビーク付近における信号パワーの 1 ピッチ周期長の信号全 体に占める割合が所定の値以上である場合には、 位相適応処理を雑音符 号帳に対して行い、 所定の値未満である場合には、 位相適応処理を雑音 符号帳に対して行わない請求項 2 7記載の音声符号化装置であり、 適応 符号べク トルのパルス性の強さによって適応的に位相適応処理を制御す る (切り替える) ことができ、 音声品質の向上を図ることができる。 ま た、 位相適応処理の制御 (切り替え) のための新たな伝送情報も不要で ある。 さらに、 位相適応処理を行わない場合に固定符号帳を用いれば、 伝送路誤りの影響の伝播を抑える効果を得ることも可能である。
請求項 2 9記載の発明は、 位相適応処理として、 ピッチビーク近傍は 密にパルス位置探索を行い、 ビツチビーク近傍以外の部分は疎にパルス 位置探索を行う、 パルス音源を雑音音源に適用した請求項 2 6又は 2 8 記載の音声符号化装置であり、 雑音符号帳にパルス音源を用いるので、 雑音符号帳に要するメモリ量や雑音符号帳探索時の演算量を少なくする ことができ、 さらに有声部の立ち上がりの表現性を向上することができ る。
請求項 3 0記載の発明は、 パルスの位置を表すイ ンデックスを、 サブ フレームの先頭側から順番に並ぶように付ける請求項 5から 8、 1 1か ら 1 7、 2 3、 2 9のいずれか 1つに記載の音声符号化装置であり、 パ ルスの位置を表すィンデックスを、 ィンデックスの番号が若いほどサブ
フレームの先頭付近にあるように、 サブフ レームの先頭から付けること によって、 ビツチビーク位置が誤った場合に生じるパルス位置のずれを 小さくすることが可能となり、 伝送路誤りの影響の伝播を和らげること ができる。
請求項 3 1記載の発明は、 同じィンデックス番号である場合、 サブフ レームの先頭側から順番にパルスの番号を付け、 さらにピッチビーク位 置近傍は密に、 ピッチピーク近傍以外の部分は疎になるように、 各パル スの探索位置が決定されている請求項 3 0記載の音声符号化装置であり、 同じイ ンデックス番号の場合、 パルスの番号が若いほどサブフレームの 先頭側になるように、 各パルスの番号が決められので、 パルスのインデ ックスに加えてパルスの番号のつけかたも定義され、 ピッチピーク位置 が誤った場合に生じるパルス位置のずれをさらに小さくすることが可能 となり、 伝送路誤りの影響の伝播をさらに減らすことができる。
請求項 3 2記載の発明は、 パルス探索位置の一部をピッチピーク位置 によって決定し、 その他のパルス探索位置はピッチピーク位置に関係な く予め定められた固定位置である請求項 5から 8、 1 1から 1 7、 2 3、 2 9のいずれか 1つに記載の音声符号化装置であり、 ピッチピーク位置 が誤った場合においても、 音源パルスの位置を誤る確率が減るので、 伝 送路誤りの影響の伝播を抑えることができる。
請求項 3 3記載の発明は、 所定の時間長を有する音声あるいは音源信 号のピッチビーク位置を求める際に、 当該信号からピッチ周期長のみを 切り出し、 切り出した信号内においてビツチピーク位置を决定するビッ チピーク位置算出手段を有する請求項 1から 8、 1 1から 1 7、 1 9か ら 2 3、 2 5から 3 2のいずれか 1つに記載の音声符号化装置であり、 1 ビツチ波形の中からピッチビークを選択するため、 単純に振幅値 (絶 対値) が最大になる点を探索すれば良く、 サブフレームに 1 ピッチ周期
を超える波形が含まれていても正確にビツチビーク位置を求めることが できる。
請求項 3 4記載の発明は、 当該信号からピッチ周期長のみを切り出す 場合に、 まず 1周期長を切り出さずに当該信号全体を用いてピッチビー ク位置を決定し、 この決定されたピッチピーク位置を切り出し開始点と して 1 ピッチ周期長を切り出し、 切り出した信号内においてピッチピー ク位置を決定する請求項 3 3記載の音声符号化装置であり、 当該信号全 体を用いてピッチピーク位置を決定した場合に発生する、 1 ピッチ波形 内のセカン ドビークをピッチビーク位置としてしまう現象を回避するこ とが可能となる。 すなわち、 ピッチ周期とサブフ レーム長が同期してい ないことに起因するピッチピーク位置の抽出誤りを回避することが可能 となる。
請求項 3 5記載の発明は、 所定の時間長を有するサブフレーム毎に音 声符号化処理を行う C E L P型音声符号化装置において、 現在のサブフ レームにおけるピッチビーク位置を算出する際、 直前のサブフレームに おけるピッチ周期と現在のサブフレームにおけるピツチ周期との差が予 め定められた範囲内である場合は、 直前のサブフレームにおけるピッチ ビーク位置と、 直前のサブフレームにおけるピッチ周期と、 現在のサブ フレームにおけるピッチ周期を用いて現在のサブフ レームにおけるピッ チビーク位置を予測し、 この予測によって得られた現在のサブフレーム におけるビヅチビーク位置を用いて現在のサブフレームにおけるピヅチ ビーク位置の存在範囲を予め限定し、 その範囲内でピッチビーク位置探 索を行う請求項 1から 8、 1 1から 1 7、 1 9から 2 3、 2 5から 3 2 のいずれか 1つに記載の音声符号化装置であり、 直前のサブフレームの ピッチビーク位置を考慮して現在のサブフ レームのピッチピーク位置を 決定するため、 現在のサブフレームのみからピッチビーク位置を求める
と 1 ピッチピーク波形内のセカン ドビーク位置を誤検出してしまうよう な場合に、 誤検出を回避する手法となる。
請求項 3 6記載の発明は、 所定の時間長を有するサブフレーム毎に音 声符号化処理を行う C E L P型音声符号化装置において、 雑音符号帳と してパルス音源を用い、 雑音符号帳のモードを少なく とも 2モード以上 有し、 音源パルスの本数はモードを切り替えることによって変化させる ことができ、 少なく とも 1つは各パルスの位置情報が十分に取ってある パルス本数の少ないモードであり、 その他は各パルスの位置情報が不足 するがパルス数の多いモードであり、 モードの切り替え情報を伝送して モードの切り替えを行う音声符号化装置であり、 位置情報が十分な少な い音源パルス数のモードを備えることによって、 音声信号の有声立ち上 がり部の品質向上を図り、 また位置情報が不十分である音源パルス数の 多いモードを有効利用することができる。
請求項 3 7記載の発明は、 ピッチ周期が短い場合には、 ピッチ周期に 対応して音源パルスの探索範囲を狭い範囲内に限定することによって、 音源パルスの位置情報を減らして音源パルスの本数を増やす請求項 3 6 記載の音声符号化装置であり、 短いビツチ周期のビツチ周期性を有する 音源信号に対しては、 1 ピッチ周期当たりにおける音源パルスの位置情 報を十分に保ったまま音源パルスの本数を増やすことができ、 音声品質 の向上を図ることができる。
請求項 3 8記載の発明は、 各パルスの位置情報が不足するがパルス数 の多いモードにおいては、 ピツチビーク位置近傍は音源パルスの探索位 置を密に、 それ以外の部分においては音源パルスの探索位置を疎になる ように、 パルス位置の探索範囲を決定する請求項 3 6又は 3 7記載の音 声符号化装置であり、 音源パルスが立てられる確率の高い部分に音源パ ルスの位置情報を集中させるため、 音源パルスの位置情報が不十分であ
る音源パルス数の多いモードの利用効率を高めることができる。
請求項 3 9記載の発明は、 請求項 3 6から 3 8のいずれか 1つに記載 の C E L P型音声符号化装置において、 パルス数が少なく位置情報が十 分である音源モードにおいて、 位置情報の一部を雑音性の音源コードべ ク トルを表すィ ンデックスに割り当てるようにした音声符号化装置であ り、 新たなモ一 ドを設けることなく無声子音部や雑音的な入力信号にも 対応することができる。
請求項 4 0に記載の発明は、 請求項 1から 3 9のいずれか 1つに記載 の音声符号化装置の機能を実行させるためのプログラムを記録したコ ン ピュー夕読み取り可能な記録媒体であり、 このような記録媒体をコンビ ユー夕で読み取ることにより音声符号化装置の機能を実現することがで きる。
請求項 4 1から 7 9記載の発明は請求項 1から 3 9の音声符号化装置 をほぼ同一内容の方法の発明として捉らえたものであり、 それそれ同様 の効果を奏する。
請求項 8 0に記載の発明は、 請求項 4 1から 7 9のいずれか 1つに記 載の音声符号化方法を実行させるためのプログラムを記録したコンビュ 一夕読み取り可能な記録媒体であり、 このような記録媒体をコンビュー 夕で読み取ることにより音声符号化装置の機能を実現することができる c 請求項 8 1から 1 1 9記載の発明は請求項 1から 3 9で規定された内 容とほぼ同一構成の音源生成部を有する音声復号装置として本発明を捉 らぇたものであり、 それそれ同様の効果を奏する。
請求項 1 2 0に記載の発明は、 請求項 8 1から 1 1 9のいずれか 1つ に記載の音声復号装置の機能を実行させるためのプログラムを記録した コンビュ一夕読み取り可能な記録媒体であり、 このような記録媒体をコ ンピュー夕で読み取ることにより音声符号化装置の機能を実現すること
ができる。
請求項 1 2 1から 1 5 9記載の発明は請求項 4 1から 7 9で規定され た内容とほぼ同一構成の音源生成方法を有する音声復号方法として本発 明を捉らえたものであり、 それそれ同様の効果を奏する。
請求項 1 6 0に記載の発明は、 請求項 1 2 1から 1 5 9のいずれか 1 つに記載の音声復号方法を実行させるためのプログラムを記録したコン ビュー夕読み取り可能な記録媒体であり、 このような記録媒体をコンピ ユー夕で読み取ることにより音声符号化装置の機能を実現することがで さ 。
請求項 1 6 1 に記載の移動体通信装置は請求項 1から 4 1のいずれか 1つに記載の音声符号化装置を構成要素として有するもので、 同様の効 果を奏する。 図面の簡単な説明
図 1は本発明の第 1実施例における C E L P音声符号化装置の音源生 成部の構成を示すプロック図、
図 2は本発明の第 1実施例における振幅強調窓の形状と適応符号べク トル及びピツチパルス位置の関係を表す模式図、
図 3は本発明の第 1実施例の変形例における C E L P音声符号化装置 の音源生成部の構成を示すプロック図、
図 4は本発明の第 2実施例における C E L P音声符号化装置の音源生 成部の構成を示すブロック図、
図 5は、 本発明の第 3実施例における C E L P音声符号化装置の音源 生成部の構成を示すプロック図
図 6 ( a ) 、 6 ( b ) は本発明の第 3実施例におけるパルス位置近傍 限定べク トルの配置の様子の前半を示す模式図、
図 7 (a) 、 7 (b) は本発明の第 3実施例におけるパルス位置近傍 限定べク トルの配置の様子の後半を示す模式図、
図 8は本発明の第 4実施例における C E L P音声符号化装置の音源生 成部の構成を示すプロック図、
図 9 (a) 、 9 (b) は本発明の第 4実施例におけるパルス音源探索 範囲を示す模式図の一部、
図 1 0は本発明の第 4実施例におけるパルス音源探索範囲を示す模式 図の残りの部分、
図 1 1 (a) は本発明の第 5実施例における探索位置算出器の構成を 示すブロック図、
図 1 1 (b) 及び図 1 1 (c) はそれそれパルス探索位置パターンの 例を示す模式図、
図 1 2は本発明の第 6実施例における C E L P型音声符号化装置の音 源生成部の構成を示すブロック図 、
図 1 3 (a) 〜 1 3 (d) は本発明の第 6実施例における探索位置 出器で算出されるパルス探索位置の一例を示す模式図、
図 14は本発明の第 7実施例における C E L P型音声符号化装置の音 源生成部の構成を示すプロック図、
図 1 5は本発明の第 8実施例における C E L P型音声符号化装置の音 源生成部の構成を示すプロック図、
図 1 6 (a) 、 1 6 ( b) は本発明の第 8実施例に用いられる固定探 索位置パターンの一例を示す一覧図、
図 1 7は本発明の第 9実施例における C E L P型音声符号化装置の音 源生成部の 構成を示すブロック図、
図 1 8は本発明の第 1 0実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロック図、
図 1 9は本発明の第 1 0実施例のピッチビーク位置予測器における予 測原理を表す模式図、
図 2 0は本発明の第 1 1実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロック図、
図 2 1は本発明の第 1 2実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロック図、
図 2 2は本発明の第 1 2実施例における探索位置算出器が出力するあ る音源パルスの探索位置パターンと、 ィンデックス更新手段を備えない 場合の各位置に対応するィンデックスと、 ィンデックス更新手段を備え た場合の各位置に対応するィンデックスをそれそれ示す模式図
図 2 3は本発明の第 1 3実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロック図、
図 2 4 ( a ) は本発明の第 1 3実施例における探索位置算出器が出力 する音源パルス探索位置のパターン及び各位置に対応する相対位置と絶 対位置の対応を示す模式図、
図 2 4 ( b ) は本発明の第 1 3実施例におけるパルス番号及びィンデ ックスの更新手段を備えない場合に、 各音源パルスに割り当てられるパ ルス番号及びィ ンデックスを示す模式図、
図 2 4 ( c ) は本発明の第 1 3実施例におけるパルス番号及びィンデ ックスの更新手段を備えた場合に、 各音源パルスに割り当てられるパル ス番号及びィンデックスを示す模式図、
図 2 5は本発明の第 1 4実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロ、ソク図、
図 2 6 ( a ) は本発明の第 1 4実施例で用いられる固定探索位置パ夕 ーンの一例を表す模式図、
図 2 6 ( b ) 、 2 6 ( c ) は本発明の第 1 4実施例で用いられる探索
位置算出器で生成される音源パルス探索位置のパターンの一例をそれそ れ示す模式図、
図 2 6 ( d ) は本発明の第 1 4実施例のパルス位置探索器において用 いられる音源パルス探索位置のパターンの一例を示す模式図、
図 2 7は本発明の第 1 5実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロック図、
図 2 8 ( a ) 、 2 8 ( b ) はビヅチビ一ク算出器においてピッチビー クとセカン ドビークを誤る適応符号べク トル波形の一例をそれそれ示す 模式図、
図 2 8 ( c ) はピッチビーク位置補正器においてピッチビーク位置を 探索する範囲を図示した適応符号べク トル波形の一例を示す模式図、 図 2 9は本発明の第 1 6実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロック図、
図 3 0は本発明の第 1 7実施例における C E L P型音声符号化装置の 音源生成部の構成を示すプロック図、
図 3 1は本発明の C E L P型音声符号化装置の好ましい実施例の全体 構成を従来の音源生成部と共に示すプロック図、
図 3 2は本発明の C E L P型音声復号装置の好ましい実施例の全体構 成を従来の音源生成部と共に示すプロック図、
図 3 3は本発明の C E L P型音声符号化装置を用いた移動体通信装置 の好ましい実施例のプロ ック図、
図 3 4は従来の一般的な C E L P音声符号化装置の音源生成部の構成 を示すブロック図、
図 3 5は従来の雑音音源のビツチ周期化部を有する C E L P音声符号 化装置の音源生成部の構成を示すプロック図である。
発明を実施するための最良の形態
以下、 本発明を実施するための最良の形態について音声符号化装置の 音源生成部のいくつかの実施例により図 1から図 1 0を用いて説明する c なお、 後述するように、 これらの音源生成部は本発明の音声復号装置に も同様の構成として用いられるものである。 く第 1実施例 >
図 1は本発明の第 1実施例を示し、 適応符号べク トルのピッチビーク 位置に対応する雑音符号べク トルの振幅を強調する音声符号化装置の音 源生成部を示す。 図 1において、 1 1は適応符号ベク トルをピッチビー ク位置検出器 1 2に出力する適応符号帳 (ァダブティブ · コード · ブッ ク) 、 1 2は適応符号帳 1 1から出力された適応符号べク トルを入力と して、 ピッチビーク位置を振幅強調窓生成器 1 3に出力するピッチビー ク位置算出器、 1 3はピッチピーク位置算出器 1 2から出力されたビッ チビーク位置を入力として、 振幅強調窓を振幅強調窓掛け器 1 6に出力 する振幅強調窓生成器、 1 4は雑音符号ベク トルを格納し、 周期化器 1 5へ出力する雑音符号帳 (ノイズ · コード · ブック) 、 1 5は雑音符号 帳 1 4から出力された雑音符号べク トルとピッチ周期 Lを入力として、 雑音符号べク トルをピッチ周期化して振幅強調窓掛け器 1 6に出力する 周期化器、 1 6は振幅強調窓生成器 1 3から出力された振幅強調窓と周 期化器 1 5から出力された雑音符号べク トルを入力とし、 雑音符号べク トルに振幅強調窓を乗じて、 最終的な雑音符号べク トルを出力する振幅 強調窓掛け器である。
以上のように構成された C E L P型音声符号化装置の音源生成部の動 作について図 1 を用いて説明する。 ピッチビーク位置算出器 1 2は、 入 力された適応符号べク トルを用いて適応符号べク トル内に存在するビッ
チパルスの位置を決定する。 ピッチパルスの位置は、 ピッチ周期で並べ たィンパルス列と適応符号べク トルとの正規化相互相関を最大化するこ とによって行うことができる。 また、 ピッチ周期で並べたイ ンパルス列 を合成フィル夕に通したものと、 適応符号べク トルを合成フィル夕に通 したもとの誤差を最小化することによつても可能である。
振幅強調窓生成器 1 3は、 ピッチピーク位置算出器 1 2によって決定 されたビツチパルス位置に基づいて振幅強調窓を生成する。 振幅強調窓 としては、 種々なものを用いることが可能であるが、 例えば、 ピッチパ ルス位置を中心とする三角窓が窓長の制御が容易な点において有利であ る。
図 2は振幅強調窓生成器 1 3から出力される振幅強調窓の形状と適応 符号べク トルの形状の対応を示す。 図中破線の位置がピッチピーク位置 算出器 1 2によって決定されたピツチパルス位置である。
周期化器 1 5は、 雑音符号帳 1 4から出力された雑音符号べク トルを ピッチ周期化する。 ピッチ周期化は、 雑音符号ベク トルをピッチ周期で 周期化するもので、 雑音符号帳の格納べク トルを先頭からピッチ周期 L の分だけ切り出し、 それをサブフレーム長に達するまで複数回繰り返し て接続することによって行われる。 ただし、 ピッチ周期化が行われるの は、 ピッチ周期がサブフレーム長以下の場合のみである。
振幅強調窓掛け器 1 6は、 周期化器 1 5から出力された雑音符号べク トルに振幅強調窓生成器 1 3から出力された振幅強調窓を乗ずる。
このように、 上記第 1実施例によれば、 1 ピッチ波形内に存在する位 相情報を利用して、 音質向上を図ることができる。
なお、 図 1では、 雑音符号ベク トルの周期化を行う C E L P型音声符 号化装置の音源部分について説明したが、 図 1 1に示すような雑音符号 帳に格納された雑音符号べク トルをそのまま使用する一般的な C E L P
型音声符号化装置の音源部分に対しても実施は可能であり、 その例を図
3に示す。 図 3において、 2 1は適応符号帳、 2 2はビーチピーク位置 算出器、 2 3は振幅強調窓生成器、 2 4は雑音符号帳、 2 5は振幅強調 窓掛け器であり、 雑音音源をピッチ同期に同期させないことだけが図 1 の音源生成部と異なる。
<第 2実施例 >
図 4は本発明の第 2実施例を示し、 音声信号の有声部の立ち上がり部 分に対してパルス列音源と雑音音源を組み合わせた音源を適用する構成 を有する C E L P型音声符号化装置に対して、 パルス列音源のパルス位 置に対応する雑音符号べク トルの振幅を強調する音声符号化装置の音源 生成部を示している。 図 4において、 3 1は振幅強調窓生成器 3 2及び 加算器 3 3に出力されて、 ピッチパルスの位置に置かれたピッチ周期 L の間隔で並べられたィンパルス列からなるパルス列音源、 3 2はパルス 列のパルス位置に対応する位置の雑音符号べク トル振幅を強調するため の振幅強調窓を生成して、 乗算器 3 5に出力する振幅強調窓生成器、 3 3はパルス列音源と乗算器 3 5から出力された振幅強調窓掛け後の雑音 符号べク トルを加算して、 励振べク トルとして出力する加算器、 3 4は 雑音符号ベク トルで表現され、 乗算器 3 5へ出力される雑音音源、 3 5 は雑音音源 3 4から出力された雑音音源べク トルに対して振幅強調窓生 成器 3 2から出力された振幅強調窓を乗ずる乗算器である。
以上のように構成された音源生成部について、 図 4を用いてその動作 を説明する。 パルス列音源 3 1は、 ピッチ周期 Lと初期位相 Pによって パルスの位置と間隔が決定されているパルス列であり、 ピッチ周期 L及 び初期位相 Pは音源生成部の外部で別途計算される。 なお、 パルス列音 源は、 インパルスを並べたものでも良いが、 サンプリ ング点とサンプリ
ング点の間に存在するのィ ンパルスを表現できる方が性能がよい。 同様 に初期位相 (最初のパルスの位置) も、 サンプリ ング点とサンプリ ング 点の間を表現できる分数精度で表す方が性能が良くなるが、 この情報に 割り当てることが可能なビッ ト数が十分でない場合は、 整数精度でも良 い性能が得られ、 位置決定のための探索も容易である。
振幅強調窓生成器 3 2は、 パルス列音源べク トルのパルスの位置に対 応する位置の雑音音源べク トルの振幅を強調するための窓であり、 第 1 実施例で説明した振幅強調窓と同様のものである。 パルスの位置を中心 とする三角窓などを用いることができる。
加算器 3 3は、 パルス列音源べク トル 3 1 と振幅強調窓が乗算器 3 5 によって乗ぜられた雑音音源べク トル 3 4 とを加算して、 励振音源べク トルとして出力する。
なお、 図 4には示されていないが、 加算器 3 3に入力される前にパル ス列音源べク トル及び雑音音源べク トルのそれそれに適切な利得を乗ず る構成にすると、 より表現性の高い音源生成部となる。 ただし、 その場 合、 利得情報を別途伝送する必要が生ずる。 また、 パルス列音源ぺク ト ルと雑音音源べク トルの利得を固定する場合は、 パルス列音源べク トル が雑音音源べク トルに埋もれてしまわないように、 パルス列音源べク ト ルのパワーと雑音音源べク トルのパワーが等しくなるように調整するな どの利得調整は必要である。
このように、 上記第 2実施例によれば、 雑音音源ベク トルの振幅をビ ツチ周期に同期して強調することによって、 音質向上を図ることができ る o <第 3実施例 >
図 5は本発明の第 3実施例を示し、 C E L P型音声符号化装置におい
て、 適応符号べク トルのピッチピーク近傍のみに限定した雑音符号べク トルを用いた音声符号化装置の音源生成部を示す。
図 5において、 4 1は適応符号ベク トルを出力する適応符号帳、 4 2 は適応符号帳 4 1から出力された適応符号べク トルとピッチ周期 Lを入 力として、 ピッチビークの位置 (位相情報) を雑音符号ベク トル生成器 4 4に出力する位相探索器、 4 3はピッチピークの近傍のみにべク トル 長を限定した雑音符号べク トルを格納し、 ピッチパルス位置近傍の雑音 符号べク トルを雑音符号べク トル生成器 4 4に出力するピッチパルス位 置近傍限定型雑音符号帳、 4 4はピッチパルス位置近傍限定型雑音符号 帳 4 3から出力された雑音符号べク トルと位相探索器 4 2から出力され た位相情報とピッチ周期 Lを入力として、 雑音符号べク トルを周期化器 4 5に出力する雑音符号べク トル生成器、 4 5は雑音符号べク トル生成 器 4 4から出力された雑音符号べク トルとピッチ周期 Lを入力として、 最終的な雑音符号べク トルを出力する周期化器である。
以上のように構成された音声符号化装置の音源生成部について、 図 5 を用いてその動作を説明する。 位相探索器 4 2は、 適応符号帳 4 1から 出力された適応符号べク トルを用いて、 適応符号べク トル内に存在する ピッチパルスの位置 (位相) を決定する。 ピッチパルスの位置は、 ピッ チ周期で並べたィンパルス列と適応符号べク トルとの正規化相互相関を 最大化することによって行うことができる。 また、 ピッチ周期で並べた ィンパルス列を合成フィル夕に通したものと、 適応符号べク トルを合成 フィル夕に通したもとの誤差を最小化することによって、 より精度良く 求めることも可能である。
ピッチパルス位置近傍限定型雑音符号帳 4 3は、 適応符号べク トルの ピッチビーク近傍に適用するための雑音符号べク トルを格納しており、 ベク トル長は、 ピッチ周期やフレーム (サブフレーム) 長によらず固定
長である。 ピッチビーク近傍の範囲としては、 ピッチビークを中心とし て前後等しい長さとしてもよいが、 ピツチピークの後の範囲を前よりも 長く取る方が、 音質劣化が少ない。 例えば、 近傍の範囲を 5 ms e cと した場合、 ピッチピークの前後を 2. 5 m s e cずつ取るよりも、 ピッ チビ一クの前を 0. 6 2 5 ms e c、 ピッチビークの後ろを 4. 3 7 5 m s e cの様にした方が良い。 また、 べク トル長としては、 サブフレー ム長が 1 0 ms e cの場合で、 5 ms e c程度であればべク トル長を 1 0 ms e c以上にした場合とほぼ同等の音質を実現できる。
雑音符号べク トル生成器 44は、 ピッチパルス位置限定型雑音符号帳 4 3から出力された雑音符号ベク トルを、 位相探索器 4 2によって決定 されたピヅチパルスの位置に配置する。
図 6 ( a) 、 6 ( b) 及び図 7 ( a) 、 7 ( b ) はビヅチパルス位置 限定型雑音符号帳 4 3から出力された雑音符号べク トルを、 雑音符号べ ク トル生成器 44によってピッチパルス位置に対応する位置に配置する 方法を図解したものである。 基本的には、 図 6 ( a) に示すように、 ピ ツチパルス位置の近傍にビツチパルス位置限定雑音符号べク トルを配置 する。 図 6 ( a) 、 6 (b) において、 ピッチ周期化範囲と示されてい る部分 (斜線部) は、 周期化部 4 5においてピッチ周期化する場合に対 象となる部分である。 図 6 ( a) のような場合、 雑音符号べク トル生成 器 44においてピッチ周期化を行う必要はないが、 図 6 (b) に示すよ うな場合には、 ピッチパルスの位置がサブフレーム境界の近くにあるた め、 ピッチパルス位置限定型雑音符号帳 4 3から出力された雑音符号べ ク トルの前半部 (サブフレーム境界より前の部分) を周期化部 4 5にお いて周期化することができないので (周期化部 4 5においては、 サブフ レーム境界からピッチ周期長だけ切り出したべク トルをピッチ周期で繰 り返し並べる。 ) 、 雑音符号べク トル生成器 44において予めピッチ周
期化するように動作させる。 また、 サブフレーム境界の直前にピッチパ ルス位置がある場合、 サブフレームの先頭からピッチ周期だけ切り出し て周期化すると、 ピッチパルス位置近傍限定べク トルの後半部分が適切 にピッチ周期化されないため、 図 7 ( a ) に示すように、 雑音ベク トル 生成器 4 4は時間軸の負の方向にもピッチ周期化するように動作する。 ただし、 ビツチパルス位置がサブフレーム先頭からビツチ周期長の間に 存在しない場合はこの周期化は必要ない。 このようにピツチ周期化部 4 5に先立ってビッチ周期化を行なっておく ことにより、 ピッチ位置近傍 限定べク トルの全ての部分を有効に用いたピッチ周期化がビツチ周期化 部 4 5で行われるようにしている。 なお、 ピッチ周期がピッチパルス位 置近傍に限定したべク トル長より短い場合は、 限定べク トルの中からビ ツチ周期長だけ切り出してピッチ周期化を行う。 この場合、 切り出し方 はいろいろ考えられるが、 ピッチパルス位置が切り出したべク トルに含 まれるように切り出す。 例えば、 ビツチパルス位置から 4分の 1 ピッチ 周期前の点から 1 ピッチ周期分を切り出すというように、 ピッチパルス 位置とピッチ周期を用いて切り出し開始点を決定する。
図 7 ( b ) はピッチ周期が限定べク トル長より短い場合の、 雑音符号 ベク トルの切り出し方法の一例を示す。 この場合、 ピッチパルス位置近 傍限定雑音符号べク トルの先頭からビツチ周期長を切り出すようにして いる。 このようにすると切り出し開始点を毎回算出する必要がなくなる c すなわち、 上記したようにピッチパルス位置から 4分の 1 ピッチ周期前 の点から 1 ピッチ周期分を切り出す場合、 ピッチ周期が変数であるため、 4分の 1 ピッチ周期を毎回計算する必要があるが、 ピッチパルス位置近 傍限定雑音符号べク トルの先頭位置は固定値であるため、 この計算が不 要となる。 ただし、 ピッチパルス位置近傍限定雑音符号ベク トルの先頭 からピッチ周期長だけ切り出したべク トルに、 ピッチパルス位置に対応
する部分が含まれない場合は、 ピツチパルス位置に対応する部分が含ま れるように切り出しを開始する位置をずらす必要がある。
周期化器 4 5は、 雑音符号べク トル生成器 4 4から出力された雑音符 号ベク トルをピッチ周期化する。 ピッチ周期化は、 雑音符号ベク トルを ピッチ周期で周期化するもので、 雑音符号ベク トルを先頭からピッチ周 期 Lの分だけ切り出し、 それをサブフ レーム長に達するまで複数回繰り 返して接続することによって行われる。 ただし、 ピッチ周期化が行われ るのは、 ピッチ周期がサブフ レーム長以下の場合のみである。 なお、 分 数精度のビツチ周期の場合は、 分数精度の点を補間によって算出して得 られるべク トルを接続する。
このように、 上記第 3実施例によれば、 適応符号ベク トルのピッチピ —ク近傍のみに限定した雑音符号べク トルを用いることにより、 雑音符 号べク トルに割り当てられるビッ ト数が少ない場合でも、 音質劣化を少 なくでき、 ビツチパルス近傍に残差パワーが集中するような有声部で音 質向上を図ることができる。 く第 4実施例 >
図 8は本発明の第 4実施例を示し、 パルス位置の探索範囲を適応符号 べク トルのビッチ周期及びビツチビーク位置によって決定する音声符号 化装置の音源生成部を示す。 図 8において、 5 1は過去の励振音源べク トルを保存し、 選択された適応符号べク トルをピッチビーク位置算出器 5 2及びピッチゲイン乗算器 5 5に出力する適応符号帳、 5 2は適応符 号帳 5 1から出力された適応符号べク トルとピッチ周期 Lを入力として ピッチビーク位置を算出し、 探索範囲算出器 5 3に出力するピッチピー ク位置算出器、 5 3はピッチビーク位置算出器 5 2から出力されたピッ チビーク位置とピッチ周期 Lを入力としてパルス音源を探索する範囲を
算出し、 パルス音源探索器 5 4へ出力する探索範囲算出器、 5 4は探索 範囲算出器 5 3から出力された探索範囲と、 ピッチ周期 Lを入力として パルス音源を探索し、 パルス音源べク トルをパルス音源ゲイ ン乗算器 5 6に出力するパルス音源探索器、 5 5は適応符号帳から出力された適応 符号ベク トルにピッチゲインを乗じて加算器 5 7に出力する乗算器、 5 6はパルス音源探索器から出力されたパルス音源べク トルにパルス音源 ゲイ ンを乗じて加算器 5 7に出力する乗算器、 5 7は乗算器 5 5からの 出力と乗算器 5 6からの出力を入力とし、 加算して、 励振音源べク トル として出力する加算器である。
以上のように構成された、 音源生成部の動作について、 図 8を用いて 説明する。 図 8において、 適応符号帳 5 1は、 音源生成部の外部で予め 算出されるビツチ周期 Lだけ過去にさかのぼった点から、 適応符号べク トルをサブフレーム長だけ切り出して、 適応符号べク トルとして出力す る。 ピッチ周期 Lがサブフレーム長に満たない場合は、 切り出したビッ チ周期 Lのベク トルを、 サブフレーム長に達するまで繰り返して接続し たものを適応符号べク トルとして出力する。
ピッチビーク位置算出器 5 2は、 適応符号帳 5 1から出力された適応 符号べク トルを用いて適応符号べク トル内に存在するピッチパルスの位 置を決定する。 ピッチパルスの位置は、 ピッチ周期で並べたインパルス 列と適応符号べク トルとの正規化相互相関を最大化することによって行 うことができる。 また、 ビヅチ周期で並べたインパルス列を合成フィル 夕に通したものと、 適応符号べク トルを合成フィル夕に通したもとの誤 差を最小化することによって、 より精度良く求めることも可能である。 探索範囲算出器 5 3は、 入力されたピッチピーク位置及びピッチ周期 Lを用いて、 パルス音源を探索する範囲を算出する。 すなわち、 ピッチ ビークの位置情報から 1 ピッチ波形の中でも聴覚的に重要な範囲を算出
し、 その範囲を探索範囲として決定する。 探索範囲算出器 5 3によって 決定される具体的な探索範囲を図 9及び図 1 0に示す。 図 9 ( a ) にお いては、 ピッチピーク位置から 5サンプル前の位置から始めて 3 2サン プルの範囲を探索範囲として決定する場合を示している。 有声部におい ては、 予めピッチ周期で並べたインパルス列をパルス音源.として用いる ようにすれば、 2番目のパルスの探索範囲の同じ位置にパルスを立てら れ、 効率的に音源を表現できる。 図 9 ( b ) は、 ピッチ周期が図 9 ( a ) の時よりも長くなった場合に決定される探索範囲の一例を示している。 ピッチ周期が長い場合、 図 9 ( a ) のようにピッチパルス近傍を集中的 に探索するようにすると、 1 ピッチ波形に対する相対的な探索範囲が狭 くなり、 表現できる周波数帯域が狭まるなどして、 特定の帯域の周波数 成分の表現性が悪くなる場合がある。 このような場合は、 図 9 ( b ) に 示すように、 ピッチ周期に応じて探索範囲を広げる代わりに、 全てのサ ンプル点を探索せずに 1つおきあるいは 2つおきのサンプル点を探索す る部分を設けることで、 探索する位置の数を増やさずに、 特定の帯域の 周波数成分の表現性が悪くなることを回避することができる。
また、 図 1 0にはピッチパルス位置近傍は密に、 それ以外の部分は疎 に、 パルス位置探索範囲を限定する方法を示している。 この限定方法は、 パルスが立てられる確率が高い位置がビッチパルス近傍に集中する統計 的結果に基づいている。 パルス位置探索範囲を限定しない場合、 有声部 においてはビツチパルス近傍にパルスが立てられる確率がその他の部分 に立てられる確率に比べて高くなる。 ただし、 その他の部分にパルスが 立てられる確率が無視できるほど小さくなるわけではない。 図 1 0に示 すパルス位置探索範囲限定方法は、 図 9 ( b ) に示す方法において、 パ ルスが立てられる確率分布に基づいて探索範囲限定を行う一例と言える。 なお、 図 9 ( a ) において、 ピッチ周期が短く、 最初のパルスの探索範
囲が 2番目のパルスの探索範囲と重なるような場合は、 2番目のパルス の探索範囲に重ならないように、 最初のパルスの探索範囲を狭める代わ りにパルス数を増やすという方法と、 2番目のパルスの探索範囲に重な つた探索範囲に決定する方法 (図 9 ( a ) と同じ探索範囲決定方法) と がある。
パルス位置探索器 5 4は、 探索範囲算出器 5 3で決定された探索範囲 (位置) にパルス音源を立てて、 合成音声が入力音声と最も近くなる位 置を出力する。 特に、 サブフレーム長が複数のピッチパルスを含むよう な長さでかつ有声定常部においては、 ピッチ周期間隔で並べたインパル ス列をパルス音源としてィ ンパルス列の 1本目のパルス位置を探索範囲 の中から決定するのが効率的である。 パルスの立て方としては種々考え られ、 定数本例えば 4本のパルスを探索範囲、 例えば 3 2箇所の位置の どこかに立てる場合、 3 2箇所を 4つに分けて 1本のパルスを割り当て られた 8箇所の中の 1箇所に決定するように全ての組み合わせ ( 8 x 8 X 8 X 8通り) を探索する方法や、 3 2箇所の中から 4箇所を選びだす 組み合わせ全てについて探索する方法などがある。 なお、 振幅 1のイ ン パルスの組み合わせの他に、 複数本例えば 2本のパルスを組み合わせた パルス対の組み合わせや、 振幅の異なるィ ンパルスの組み合わせによる パルスの立て方も可能である。
乗算器 5 5及び 5 6で乗ずる利得は、 適応符号帳 5 1から出力された 適応符号べク トルとパルス位置探索器 5 4から出力されたパルス音源べ ク トルとを用いて音声合成を行って、 入力音声との誤差が最小となるよ うにそれそれのベク トルに対して決定された値である。 ここで、 適応符 号べク トルに乗ずる利得をピッチゲイン、 パルス音源ベク トルに乗ずる 利得をパルス音源ゲインとすると、 乗算器 5 5は、 適応符号ベク トルに ピッチゲインを乗じて、 加算器 5 7に出力する。 乗算器 5 6は、 パルス
音源べク トルにパルス音源ゲインを乗じて、 加算器 5 7に出力する。 加算器 5 7は、 乗算器 5 5から出力された最適利得乗算後の適応符号 べク トルと、 乗算器 5 6から出力された最適利得乗算後のパルス音源べ ク トルとを加算して、 励振音源ベク トルとして出力する。
このように、 上記第 4実施例によれば、 パルスに割り当てられるビッ ト数が少ない場合でも、 音質劣化を少なくできる。
<第 5実施例 >
図 1 1 ( a ) は本発明の第 5実施例を示し、 パルス位置の探索位置を適 応符号べク トルのピッチ周期及びピッチビーク位置によって決定する音 源生成部のパルス探索位置决定部を示し、 図 8における探索範囲算出器 5 3をさらに細かく示したものである。 図 1 1 ( a ) において、 6 1は、 ピッチ周期 Lを入力として、 パルス探索位置決定器 6 2にパルス探索位 置パターンを出力する、 パルス探索位置パターン選択器であり、 6 2は、 パルス探索位置パターン選択器 6 1からパルス探索位置パターンを、 ビ ツチビーク位置算出器 5 2からピッチビーク位置を、 それそれ入力し、 探索範囲 (パルス探索位置) をパルス位置探索器 5 4に出力する、 パル ス探索位置決定器である。
以上のように構成された、 音源生成部の探索範囲算出器 5 3の動作に ついて、 図 1 1 ( a ) 、 1 1 ( b ) 、 1 1 ( c ) を用いて説明する。 パ ルス探索位置パターン選択器 6 1は、 複数種類のパルス探索位置パター ンをあらかじめ持っており (このパルス探索位置パターンは、 パルス探 索を行うサンブル点の位置の集合から成り、 ピッチビーク位置を 0とす る相対位置でサンプル点を表現している) 、 ピッチ分析によって得られ たピッチ周期 Lを用いて、 どのパルス探索位置パターンを使用するかを 決定し、 パルス探索位置パターンをパルス探索位置決定器 6 2に出力す
る。
図 1 1 (b) 、 1 1 ( c) は、 パルス探索位置パターン選択器 6 1が、 予め持っているパルス探索位置パターンの一例を示したものである。 図 中の目盛りはサンプル点の位置を示しており、 矢印がつけられたサンプ ル点がパルス探索位置である (矢印が付いていない部分は探索しない) c 目盛りの数値は適応符号べク トルから求められるピッチビーク位置を 0 とした相対位置を表す数値である。 また、 図 1 1 (b) 、 1 1 ( c ) で は、 1サブフレーム 80サンプルの場合を示している。 図 1 1 (b) で はピッチ周期 Lが長い (たとえば 45サンブル以上) の場合の探索位置 パターンを示しており、 図 1 1 ( c) ではピッチ周期 Lが短い (たとえ ば 44サンプル未満) の場合の探索位置パターンを示している。 ピッチ 周期 Lが短い場合はサブフレーム全体の探索をしないこととなるが、 ピ ツチ周期化処理を行うことによって、 サブフレーム全体にパルスを立て ることが可能となる。 ビツチ周期化は、 下記式 ( 1 ) を用いることによ つて容易に行うことができる (ITU- T STUDY GROUP 15 - CONTRIBUTION 1 52, "G.729-C0DING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTUR E ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP )", COM 15-1 52- E July 1995) 。
c o d e ( i ) = c o d e ( i ) + 5 x c o d e ( i - L )
. . . ( 1 ) 式 ( 1 ) において、 c o d e () はパルス音源べク トルを表し、 iはサ ンブル番号 (図 1 1の例では、 0 ~ 79 ) を表す。 また、 ^は周期化の 強さを示す利得値で、 周期性が強い場合は大きく周期性が弱い場合は小 さくする (一般的には 0〜 1. 0の値を用いる) 。 図 1 1 ( c) では (—4) 〜48サンプルの範囲 ( 53サンプルの範囲) でパルス探索を 行うこととなる。 このため、 ピッチ周期 が 53 (又は 54 ) 未満の場
合に図 1 1 ( c ) の探索範囲パターンを用いることも可能である。 しか し、 ピッチ周期 Lが 4 5サンプル程度未満の場合にすることによって、 2つのピッチビーク位置を探索範囲内に含むことができ、 1周期目のビ ツチパルス波形と 2周期目のピッチパルス波形が変化する場合や、 求め られたピッチビーク位置が実際のピッチビーク位置よりも 1周期前の位 置として誤検出された場合に対応することができる。
パルス探索位置決定器 6 2は、 パルス探索位置パターン選択器から出 力されたパルス探索位置パターンを用いて現サブフレームにおけるパル ス探索位置を決定し、 パルス位置探索器 5 4に出力する。 パルス探索位 置パターン選択器 6 2から出力されるパルス探索位置パターンは、 ビッ チビーク位置を 0 とする相対位置で表現されているため、 そのままでは パルス探索に用いることができない。 このため、 サブフレームの先頭を 0とする絶対位置に変換してパルス位置探索器 5 4に出力する。 <第 6実施例 >
図 1 2は本発明の第 6実施例を示し、 パルス位置の探索位置を適応符 号べク トルのビツチ周期及びピッチビーク位置によって決定するととも に、 パルス音源に使用するパルス数を切り替える構成を有する音声符号 化装置の音源生成部を示す。 図 1 2において、 7 1は、 適応符号べク ト ルをピッチビーク位置算出器 7 2 と乗算器 7 6に出力する、 適応符号帳、 7 2は、 ピッチ分析あるいは適応符号帳探索によって外部で求められた ピッチ周期 Lと適応符号帳から出力された適応符号べク トルを入力とし、 ピッチビーク位置を探索位置算出器 7 4に出力する、 ピッチビーク位置 算出器、 Ί 3はピッチ分析あるいは適応符号帳探索によって外部で求め られたピッチ周期 Lを入力として、 パルス数を探索位置算出器 7 4に出 力するパルス数決定器、 7 4はビツチ分析あるいは適応符号帳探索によ
つて外部で求められたピッチ周期 Lとパルス数決定器 7 3から出力され たパルス数とビツチビーク位置算出器 7 2から出力されたピッチピーク 位置を入力とし、 パルスの探索位置をパルス位置探索器 7 5に出力する 探索位置算出器、 7 5はピッチ分析あるいは適応符号帳探索によって外 部で求められたピッチ周期 Lと探索位置算出器 7 4から出力されたパル ス探索位置を入力とし、 パルス音源に用いるパルスを立てる位置の組み 合わせを決定してその組み合わせによって生成されるパルス音源べク ト ルを乗算器 7 7に出力するパルス位置探索器、 7 6は、 適応符号帳から 出力された適応符号べク トルを入力とし、 適応符号べク トル利得を乗じ て加算器 7 8に出力する乗算器、 7 7は、 パルス位置探索器から出力さ れたパルス音源べク トルを入力とし、 パルス音源べク トル利得を乗じて 加算器 7 8に出力する乗算器、 7 8は乗算器 7 6及び 7 7から出力され たべク トルを入力とし、 べク トル加算をおこなって音源べク トルとして 出力する加算器である。
以上のように構成された C E L P型音声符号化装置の音源生成部の動 作について、 図 1 2を参照しながら説明する。 適応符号帳 7 1から出力 された適応符号べク トルは乗算器 7 6に出力され、 適応符号べク トル利 得が乗算されて加算器 7 8に出力される。 ピッチビーク位置算出器 7 2 は適応符号べク トルからピッチビークを検出し、 その位置を探索位置算 出器 7 4に出力する。 ピッチビーク位置の検出 (算出) は、 ピッチ周期 Lで並べたィンパルス列べク トルと適応符号べク トルの内積を最大化す ることによって行うことができる。 また、 ピッチ周期 Lで並べたイ ンパ ルス列べク トルに合成フィル夕のィ ンパルス応答を畳み込んだべク トル と適応符号べク トルに合成フィル夕のイ ンパルス応答を畳み込んだべク トルの内積を最大化することによって、 より精度良く ピッチビーク位置 の検出を行うことも可能である。
パルス数決定器 7 3はピッチ周期 Lの値に基づいて、 パルス音源に使 用するパルスの本数を決定して、 探索位置算出器 7 4に出力する。 パル ス数とピツチ周期の関係は予め学習的あるいは統計的に定められており、 たとえばピッチ周期が 4 5サンプル以下の場合は 5本、 4 5サンプルを 超えて 8 0サンプル未満の場合は 4本、 8 0サンプル以上の場合は 3本、 というようにビツチ周期の値の範囲によってそれそれのパルス本数が定 められている。 ビツチ周期が短い場合はビツチ周期化処理を用いること によってパルス探索範囲を 1〜 2 ピッチ周期に限定できるので、 位置情 報を減らす代わりにパルス数を増やすことができる。 また、 波形的にも ピッチ周期が短い女声とピッチ周期の長い男声では、 波形の特徴が異な り、 それそれに適したパルス数が存在する。
一般的には、 男声の方がパルス性が強いためパルス数よりもパルス位 置が重要となる傾向があり、 女声ではパルス性が弱い為パルス数を増や してパワーの集中を避けた方が良くなる傾向がある。 これらのことから、 ピッチ周期が長い場合はパルス数を少なく、 ピッチ周期が短い場合はあ る程度パルス数を多くすることが有効となる。 さらに、 連続するサブフ レーム間のパルス本数の変化ゃビツチ周期 Lの変化などを考慮に入れて パルス数を決定すると、 連続するサブフレーム間の不連続性緩和や有声 部の立ち上がり部の品質向上を図ることができる。 具体的には、 連続す るサブフレームで、 ピッチ周期 Lから決定されたパルス数が 5本から 3 本に減少したときは、 パルス数の減少にヒステリシスを持たせて、 5本 から急に 3本に減らすのではなく 4本にすることによってサブフレーム 間でパルス数が大きく変化することを避けるようにする、 あるいは、 連 続するサブフレーム間でビツチ周期 Lが大きく異なる場合は、 有声部の 立ち上がりである可能性が大きいので、 パルス数を減らしてパルス位置 の精度を向上させた方が音声品質が向上するため、 前サブフ レームのビ
ツチ周期 Lと現サブフレームのビツチ周期 Lが大きく異なる場合は現サ ブフレームのピッチ周期 Lの値に関わらずパルス数を 3本とする、 等と いう手法によってパルス数の决定を行うとより音声品質の向上を図るこ とが可能である。 なお、 これらの手法を用いる場合には、 ピッチ分析に おける倍ピッチ誤りや半ピッチ誤り等の影響を受けやすくなるので、 こ れらの影響を緩和するパルス数決定法 (たとえば、 半ピッチや倍ピッチ の可能性を考慮に入れてビツチ周期の連続性を判定するなど) を取り入 れたり、 ピッチ分析の精度をでき得る限り上げると、 より効果的である。 探索位置算出器 7 4は、 ピッチピーク位置とパルス本数をもとにして、 パルス探索を行う位置を決定する。 パルスの探索位置はピッチピーク付 近は密に、 それ以外の部分は疎になるように配分される (全てのサンプ ル点を探索するだけの十分なビッ ト配分がないときに有効である) 。 す なわち、 ビツチビーク位置近傍は全てのサンプル点がパルス位置探索の 対象となるが、 ビツチビーク位置から離れた部分は 2サンプル每ゃ 3サ ンプル毎というようにパルス位置探索の間隔を広く する (たとえば、 図 1 1 ( b ) 、 1 1 ( c ) のように探索位置を決定する) 。 また、 ノヽ'ル ス数が多いときは 1本あたりのパルスに配分されるビッ ト数は少なくな るた め、 疎になる部分の間隔がパルス数が少ない場合より広くなる (パ ルス位置の精度が荒くなる) 。 なお、 ピッチ周期が短い場合は、 第 5実 施例に示したように、 サブフレーム内の最初のピヅチピークから 1 ビヅ チ周期強の範囲のみに探索範囲を限定すると、 より音声品質を向上する ことが可能である。
パルス位置探索器 7 5は、 探索位置算出器 7 4で決定された探索位置 に基づいてパルスを立てる位置の最適な組み合わせを決定する。 パルス 探索の方法は 「 ITU- T STUDY GROUP 15 - CONTRIBUTION 152, " G.729-C0 DING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC- C
ODE-EXCITED LINEAR-PREDICTION (CS-ACELP)", COM 15-152-E July 199 5 」 に示されているように、 たとえばパルス数が 4本の場合は式 (2) を最大化するように i 0から i 3の組み合わせを決定する。
(DNxDN) /RR
DN = d n ( i O) +dn ( i l ) +dn ( i 2) + dn ( i 3)
R R = r r ( i 0, i 0 ) +
r r ( i l , i l) + 2 x r r ( i O, i l ) + r r ( i 2 , i 2 ) + 2 x (r r ( i 0 , i 2 ) +
r r ( i 1, i 2 ) ) + r r ( i 3 , i 3) + 2 x (r r ( i O, i 3) +
r r ( i 1 , i 3 ) + r r ( i 2 , i 3 ) )
. . . (2) ここで、 dn ( i ) ( i = 0〜79 : サブフレーム長 80サンブルの場 合) はパルス音源成分の夕ーゲッ 卜ベク トル X ' ( i ) を合成フィル夕 のインパルス応答でバックワードフィル夕リングしたもので、 r r ( i, i ) は、 式 ( 3) のようにインパルス応答の自己相関行列である。 また、 i 0、 i l、 i 2、 i 3が取り得る位置の範囲は探索位置算出器 74で 求められたものである。 具体的にはパルス数が 4本の場合、 図 13 (a) 〜1 3 (d) のようになる (図中矢印をつけた部分が取り得る位置、 な お、 目盛りの数値はピッチビーク位置を 0とした相対値である) 。 dn(j) = ^ Λ'(Ι)Λ(Ι—"),"- 0,1 ,..., 79
rr(i,j) = 79 h{n - i)h{n - j), i - 0,1"."79, j - i,i + 1 79 . . . (3) パルス位置探索器 75によって、 最適パルス位置の組み合わせた決定
されると、 その組み合わせによって生成されるパルス音源べク トルが乗 算器 7 7に出力され、 パルス符号ベク トル利得が乗算され、 加算器 7 8 に出力される。
加算器 7 8は適応符号べク トル成分とパルス音源べク トル成分の加算 を行い、 励振音源ベク トルとして出力する。
<第 7実施例 >
図 1 4は、 本発明の第 7の発明の実施例を示し、 パルス探索前にパルス の振幅を決定する構成を有する、 C E L P型音声符号化装置の音源生成 部を示している。 図 1 4において、 8 1は過去の励振音源信号のバヅ フ ァから構成され、 適応符号べク トルをピッチビーク位置算出器 8 2 と乗 算器 8 8に出力する適応符号帳、 8 2はピッチ分析あるいは適応符号帳 探索によって外部で求められたピッチ周期 Lと適応符号帳 8 1から出力 された適応符号べク トルを入力とし、 ピッチピーク位置を探索位置算出 器 8 4 とパルス振幅算出器 8 7に出力するピッチビーク位置算出器、 8 3はピッチ分析あるいは適応符号帳探索によって外部で求められたビッ チ周期 Lを入力として、 パルス数を探索位置算出器 8 4に出力するパル ス数决定器、 8 4はピッチ分析あるいは適応符号帳探索によって外部で 求められたピッチ周期 Lとパルス数決定器 8 3から出力されたパルス数 とビツチビーク位置算出器 8 2から出力されたピッチビーク位置を入力 とし、 パルスの探索位置をパルス位置探索器 8 5に出力する探索位置算 出器、 8 5はピッチ分析あるいは適応符号帳探索によって外部で求めら れたビツチ周期 Lと探索位置算出器 8 4から出力されたパルス探索位置 とパルス振幅算出器 8 7から出力されたパルス振幅を入力とし、 パルス 音源に用いるパルスを立てる位置の組み合わせを決定してその組み合わ せによって生成されるパルス音源べク トルを乗算器 8 9に出力するパル
ス位置探索器、 8 6は外部の L P C分析及び L P C量子化器によって決 定された線形予測フ ィル夕によって得られる予測残差信号から、 乗算器
8 8から出力された (利得乗算後の) 適応符号べク トルを減算し、 差分 信号をパルス振幅算出器 8 7に出力する加算器、 8 7は加算器 8 6から 出力された差分信号を入力とし、 パルス振幅情報をパルス位置探索器 8 5に出力するパルス振幅算出器、 8 8は適応符号帳 8 1から出力された 適応符号べク トルを入力として適応符号べク トル利得を乗算し、 加算器
9 0及び 8 6に出力する乗算器、 8 9は、 パルス位置探索器 8 5から出 力されたパルス音源べク トルを入力としてパルス音源べク トル利得を乗 算し、 加算器 9 0に出力する乗算器、 9 0は乗算器 8 8及び 8 9から出 力されたべク トルの加算をおこない、 励振音源べク トルとして出力する 加算器である。
以上のように構成された C E L P型音声符号化装置の音源生成部につ いて、 図 1 4を用いてその動作を説明する。 適応符号帳 8 1から出力さ れた適応符号ベク トルは乗算器 8 8に出力され、 適応符号ベク トル利得 が乗算されて加算器 9 0及び 8 6に出力される。
ピヅチピーク位置算出器 8 2は適応符号べク トルからビッチビ一クを 検出し、 その位置を探索位置算出器 8 4及びパルス振幅算出器 8 7に出 力する。 ピッチビーク位置の検出 (算出) は、 ピッチ周期 Lで並べたィ ンパルス列べク トルと適応符号べク トルの内積を最大化することによつ て行うことができる。 また、 ピッチ周期 Lで並べたインパルス列べク ト ルに合成フィル夕のイ ンパルス応答を畳み込んだべク トルと適応符号べ ク トルに合成フィル夕のィ ンパルス応答を畳み込んだべク トルの内積を 最大化することによって、 より精度良く ピッチビーク位置の検出を行う ことも可能である。
パルス数決定器 8 3は、 ピッチ周期 Lの値に基づいて、 パルス音源に
使用するパルスの本数を決定して、 探索位置算出器 8 4に出力する。 パ ルス数とビツチ周期の関係は予め学習的あるいは統計的に定められてお り、 たとえばピッチ周期が 4 5サンブル以下の場合は 5本、 4 5サンプ ルを超えて 8 0サンプル未満の場合は 4本、 8 0サンプル以上の場合は 3本、 というようにピッチ周期の値の範囲によってそれそれのパルス本 数が定められている。 さらに、 連続するサブフ レーム間のパルス本数の 変化ゃビツチ周期 Lの変化などを考慮に入れてパルス数を決定すると、 連続するサブフ レーム間の不連続性緩和や有声部の立ち上がり部の品質 向上を図ることができる。 具体的には、 連続するサブフレームで、 ビッ チ周期 Lから決定されたパルス数が 5本から 3本に減少したときは、 パ ルス数の減少にヒステリシスを持たせて、 5本から急に 3本に減らすの ではなく 4本にすることによってサブフレーム間でパルス数が大きく変 化することを避けるようにする、 あるいは、 連続するサブフ レーム間で ピッチ周期 Lが大きく異なる場合は、 有声部の立ち上がりである可能性 が大きいので、 パルス数を減らしてパルス位置の精度を向 tさせた方が 音声品質が向上するため、 前サブフ レームのピッチ周期 Lと現サブフ レ ームのピッチ周期 Lが大きく異なる場合は現サブフレームのピッチ周期 Lの値に関わらずパルス数を 3本とする、 等という手法によってパルス 数の決定を行う とより音声品質の向上を図ることが可能である。 なお、 これらの手法を用いる場合には、 ピッチ分析における倍ピッチ誤りや半 ピッチ誤り等の影響を受けやすくなるので、 これらの影響を緩和するパ ルス数決定法 (たとえば、 半ピッチや倍ピッチの可能性を考慮に入れて ピッチ周期の連続性を判定するなど) を取り入れたり、 ピッチ分析の精 度をでき得る限り上げると、 より効果的である。
探索位置算出器 8 4は、 ピッチビーク位置とパルス本数をもとにして、 パルス探索を行う位置を決定する。 パルスの探索位置はピツチビーク付
近は密に、 それ以外の部分は疎になるように配分される (全てのサンプ ル点を探索するだけの十分なビッ ト配分がないときに有効である) 。 す なわち、 ピッチビーク位置近傍は全てのサンプル点がパルス位置探索の 対象となるが、 ビツチビーク位置から離れた部分は 2サンプル毎や 3サ ンプル毎というようにパルス位置探索の間隔を広くする (たとえば、 図 1 1 ( b ) 、 1 1 ( c ) のように探索位置を決定する) 。 また、 パルス 数が多いときは 1本あたりのパルスに配分されるビッ ト数は少なくなる ため、 疎になる部分の間隔がパルス数が少ない場合より広くなる (パル ス位置の精度が荒くなる) 。 なお、 ピッチ周期が短い場合は実施の形態 5に示したように、 サブフレーム内の最初のピッチビークから 1 ピッチ 周期強の範囲のみに探索範囲を限定すると、 より音声品質を向上するこ とが可能である。
パルス位置探索器 8 5は、 探索位置算出器 84で決定された探索位置 と後述のパルス振幅算出器 8 7で決定されたパルス振幅情報に基づいて パルスを立てる位置の最適な組み合わせを決定する。 パルス探索の方法 は 「 ITU-T STUDY GROUP 15 ― CONTRIBUTION 152,"G.729-CODING OF SPE ECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION (CS-ACELP)", COM 15-152-E July 1995」 に示され ているように、 たとえばパルス数が 4本の場合は、 式 ( 4 ) を最大化す るように i 0から i 3の組み合わせを決定する。
D N X D N/R R
D N = aOx d n ( i 0 ) +al d n ( i 1 ) + a2 x d n ( i 2 ) +a3 x d n ( i 3 )
RR = aO aOx r r ( i O , i 0 ) +
al al r r ( i l , i 1 ) + 2 a0 al r r ( i O , i 1 ) + a2 x a2 x r r ( i 2 , i 2 ) + 2 x ( aO x a2 x r r ( i 0, i 2 ) +
al x a2 x r r ( i l, i 2 ) ) +
a3 x a3 x r r ( i 3 , i 3 ) + 2 x (aOx a3x r r ( i O, i 3 ) + al xa3x r r ( i l , i 3 ) +
a2 xa3x r r ( i 2 , i 3 ) )
. . . (4) ここで、 dn ( i ) ( i = 0〜79 : サブフレーム長 80サンブルの場 合) はパルス音源成分のタ一ゲヅ トべク トルに合成フィル夕のインパル ス応答を畳み込んだもので、 r r ( i , i ) は式 ( 3) のようにイ ンパ ルス応答の自己相関行列である。 また、 i O、 i l、 i 2、 i 3が取り 得る位置の範囲は探索位置算出器 84で求められたものである。 具体的 にはパルス数が 4本の場合、 図 1 3 (a) 〜 13 ( d ) のようになる (図中矢印をつけた部分が取りうる位置、 なお、 目盛りの数値はピッチ ビーク位置を 0とした相対値である) 。 また、 a0、 al、 a2、 a3はパルス 振幅算出器 87で求められたパルス振幅である。
パルス位置探索器 85によって、 最適パルス位置の組み合わせた決定 されると、 その組み合わせによって生成されるパルス音源べク トルが乗 算器 8 9に出力され、 パルス符号ベク トル利得が乗算され、 加算器 90 に出力される。
加算器 86は、 外部で行われる L P C分析によって得られる線形予測 残差信号 (予測残差べク トル) から適応符号べク トル成分 (適応符号べ ク トルに適応符号ベク トル利得を乗算したもの) を減算し、 差分信号を パルス振幅算出器 87に出力する。 なお、 C E L P型音声符号化装置の 音源部においては、 一般的には適応符号べク トル利得と雑音符号べク 卜 ル (本発明ではパルス音源べク トルに相当) 利得は、 適応符号帳探索と 雑音符号帳探索 (本発明ではパルス位置探索に相当) の双方が終わった 後に決定されるため、 適応部号べク トルに適応符号べク トル利得を乗算
したベク トルを、 パルス位置探索以前に得ることはできない。 このため
、 加算器 8 6で減算に使用する適応符号べク トル成分は、 適応符号帳探 索時に式 ( 5 ) から求められる適応符号ベク トル利得 (最終的な最適適 応符号べク トル利得ではない) を適応符号べク トルに乗算したものであ る 一 ∑ _ ^nieO ") ")
8P
∑ (") ")
. . . ( 5 ) ここで、 X ( n ) はいわゆるターゲッ トベク トルで、 ここでは聴覚重み づけした入力信号から現サブフレームの L P C合成フィル夕の零入力応 答を除去したものである。 また、 y ( n ) は合成音声信号のうち、 適応 符号べク トルによって生成される成分で、 ここでは適応符号べク トルに、 現サブフレームの L P C合成フィル夕と聴覚重みづけフィル夕を縦続接 続したフィル夕のインパルス応答を、 畳み込んだものである。
パルス振幅算出器 8 7は、 ピッチビーク位置算出器 8 2によって求め られたピッチビーク位置を用いて、 加算器 8 6から出力された差分信号 をピツチビーク位置近傍とそれ以外の部分に分割し、 それそれの部分の パワーの平均値又はそれぞれの部分に含まれる各サンプル点における信 号振幅の絶対値の平均値を求め、 それそれの振幅をピッチビーク位置近 傍のパルス振幅及びそれ以外の部分のパルス振幅としてパルス位置探索 器 8 5に出力する。 パルス位置探索器 8 5では、 ピッチパルス近傍のパ ルスとそれ以外の部分のパルスとで異なる振幅を用いて式 ( 4 ) の評価 を行い、 パルス位置探索を行う。 パルス位置探索で決定されたパルス位 置とその位置のパルスに割り当てられたパルス振幅によって表現される、 パルス音源べク トルがパルス位置探索器 8 5から出力される。
加算器 9 0は適応符号べク トル成分とパルス音源べク トル成分の加算 を行い、 励振音源ベク トルとして出力する。 ぐ第 8実施例 >
図 1 5は、 本発明の第 8の発明の実施例を示し、 ピッチ周期の連続性 の判定結果に基づいてパルス探索に用いる探索位置を切り替える構成を 有する、 C E L P型音声符号化装置の音源生成部を示している。 図 1 5 において、 9 1は適応符号べク トルをピッチビーク位置算出器 9 2 と乗 算器 9 9に出力する適応符号帳、 9 2は適応符号帳 9 1から出力された 適応符号ベク トルとピッチ周期 Lを入力として、 適応符号ベク トル内の ビツチビーク位置を探索位置算出器 9 4に出力するピッチビーク位置算 出器、 9 3はピッチ周期 Lを入力として、 パルス音源のパルス数を探索 位置算出器 9 4に出力するパルス数決定器、 9 4は、 ピッチ周期 Lとピ ツチビーク位置算出器 9 2から出力されたピッチピーク位置とパルス数 決定器 9 3から出力されたパルス数を入力として、 パルスの探索位置を スィ ッチ 9 8を介してパルス位置探索器 9 7に出力する探索位置算出器、 9 5は、 現サブフレームのピッチ周期 Lを入力とし、 1サブフレーム分 遅延させて判定器 9 6に出力 する遅延器、 9 6は現サブフ レームのビ ツチ周期 Lと遅延器 9 5から出力された前サブフレームのピッチ周期を 入力として、 ピッチ周期の連続性の判定結果をスィ ッチ 9 8に出力する 判定器、 9 7はスィ ツチ 9 8を介して探索位置算出器 9 4から入力され るパルスの探索位置又はスィ ツチ 9 8を介して入力される固定探索位置 と、 スィ ッチ 9 8を介して入力されるピッチ周期 Lをそれそれ入力とし、 入力された探索位置とビツチ周期 Lを用いてパルス位置の探索を行い、 パルス音源ベク トルを乗算器 1 0 0に出力するパルス位置探索器、 9 8 は判定器 9 6から入力される判定結果に基づいて切り替わる連動する 2
系統のスィ ッチで、 一方の系統のスィ ッチは、 パルスの探索位置を探索 位置算出器 9 によって算出された探索位置と ^め定められている固定 探索位置との切り替えに用いられ、 もう一方の系統のスィ ッチは、 ピッ チ周期 Lをパルス位置探索器 9 7に入力するかしないかの O N Z O F F に用いられる。 9 9は適応符号帳 9 1から出力された適応符号ベク トル を入力とし、 適応符号べク トル利得を乗じて加算器 1 0 1に出力する乗 算器、 1 0 0はパルス位置探索器 9 7から出力されたパルス音源べク ト ルを入力とし、 パルス音源べク トル利得を乗じて加算器 1 0 1に出力す る乗算器、 1 0 1は乗算器 9 9及び 1 0 0から入力されたべク トルの加 算を行い、 励振音源ベク トルとして出力する加算器である。
以上の様に構成された、 C E L P型音声符号化装置の音源生成部につ いて、 図 1 5を用いてその動作を説明する。 適応符号帳 9 1は、 過去の 励振音源のバッファによ り構成され、 外部のピッチ分析又は適応符号帳 探索手段によって求められたピッチ周期又はピッチラグに基づいて励振 音源のバッファから該当する部分を取り出し、 適応符号べク トルとして ピッチビーク位置算出器 9 2及び乗算器 9 9に出力する。 適応符号帳 9 1から乗算器 9 9に出力された適応符号べク トルは、 適応符号べク トル 利得が乗算されて加算器 1 0 1に出力される。
ピッチビーク位置算出器 9 2は、 適応符号べク トルからピッチビーク を検出し、 その位置を探索位置算出器 9 4に出力する。 ピッチビーク位 置の検出 (算出) は、 ピッチ周期 Lで並べたィ ンパルス列べク トルと適 応符号べク トルの内積を最大化することによって行うことができる。 ま た、 ビツチ周期 Lで並べたィンパルス列べク トルに合成フィル夕のィ ン パルス応答を畳み込んだべク トルと適応符号べク トルに合成フィル夕の ィンパルス応答を畳み込んだべク トルの内積を最大化することによって、 より精度良く ピッチビーク位置の検出を行うことも可能である。
パルス数決定器 9 3はピッチ周期 Lの値に基づいて、 パルス音源に使 用するパルスの本数を決定して、 探索位置算出器 9 4に出力する。 パル ス数とビツチ周期の関係は予め学習的あるいは統計的に定められており、 たとえばピッチ周期が 4 5サンブル以下の場合は 5本、 4 5サンプルを 超えて 8 0サンプル未満の場合は 4本、 8 0サンプル以上の場合は 3本、 というようにビツチ周期の値の範囲によってそれそれのパルス本数が定 められている。
探索位置算出器 9 4は、 ピッチピーク位.置とパルス本数をもとにして、 パルス探索を行う位置を決定する。 パルスの探索位置はピッチピーク付 近は密に、 それ以外の部分は疎になるように配分される (全てのサンプ ル点を探索するだけの十分なビッ ト配分がないときに有効である) 。 す なわち、 ビツチビーク位置近傍は全てのサンプル点がパルス位置探索の 対象となるが、 ビツチピーク位置から離れた部分は 2サンプル毎や 3サ ンプル毎というようにパルス位置探索の間隔を広くする (たとえば、 図 1 1 ( b ) 、 ( c ) のように探索位置を決定する) 。 また、 パルス数が 多いときは 1本あたりのパルスに配分されるビッ ト数は少なくなるため、 疎になる部分の間隔がパルス数が少ない場合より広くなる (パルス位置 の精度が荒くなる) 。 なお、 ピッチ周期が短い場合は実施の形態 5に示 したように、 サブフレーム内の最初のビツチビークから 1 ピッチ周期強 の範囲のみに探索範囲を限定すると、 より音声品質を向上することが可 能 < め 。
パルス位置探索器 9 7は、 探索位置算出器 9 4で決定された探索位置 又は予め決められている固定探索位置とピッチ周期 Lに基づいてパルス を立てる位置の最適な組み合わせを決定する。 パルス探索の方法は 「 I TU-T STUDY GR0UP15 - CONTRI BUTION 152 , "G . 729-COD ING OF SPEECH AT 8 KB IT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXC ITED L INEA
-PRED ICT ION ( CS-ACELP )" , COM 15-152-E July 1995 j に示されている ように、 たとえばパルス数が 4本の場合は式 ( 2 ) を最大化するように i 0から i 3の組み合わせを決定する。
スィ ッチ 9 8の切り替えは、 判定器 9 6の判定結果に基づいて行われ る。 判定器 9 6は、 現サブフレームのピッチ周期 Lと遅延器 9 5から入 力された直前のサブフレームにおけるビッチ周期を用いて、 ビツチ周期 が連続しているか否かを判定する。 具体的には、 現サブフレームのビッ チ周期の値と直前のサブフレームのビツチ周期の値の差が予め定められ たあるいは計算により求められた閾値以下の場合に、 ピツチ周期が連続 していると判定する。 ピッチ周期が連続であると判定された場合、 現サ ブフレームは有声 ' 有声定常部であるとみなし、 スィ ッチ 9 8は探索位 置算出器 9 4 とパルス位置探索器 9 7を接続し、 ピッチ周期 Lをパルス 位置探索器 9 7に入力する (スィ ッチ 9 8の一方の系統は探索位置算出 器 9 4に切り替えられ、 もう一方の系統は O N状態となってピッチ周期 Lをパルス位置探索器 9 7に入力する) 。 ピッチ周期が連続でない (現 サブフ レームのビツチ周期と直前のサブフ レームのピッチ周期の差が閾 値を超えてい) と判定された場合、 現サブフレームは有声 · 有声定常部 でない (無声部 ' 有声立ち上がり部である) とみなし、 スイ ッチ 9 8は 予め定められている固定探索位置をパルス探索器 9 7に入力し、 ピッチ 周期 Lはパルス位置探索器に入力しない (スィ ッチ 9 8の一方の系統は 固定探索位置に切り替えられ、 もう一方の系統は 0 F F状態となってビ ツチ周期 Lはパルス位置探索器 9 7に入力されない) 。
パルス位置探索器 9 7によって、 最適パルス位置の組み合わせた決定 されると、 その組み合わせによって生成されるパルス音源べク トルが乗 算器 1 0 0に出力され、 パルス符号ベク トル利得が乗算され、 加算器 1 0 1に出力される。
加算器 1 0 1は適応符号べク トル成分とパルス音源べク トル成分の加 算を行い、 励振音源べク トルとして出力する。
なお、 図 1 6に示した表は図 1 5の固定探索位置の内容の一例を示し ている。 図 1 6 ( b ) は、 図 1 3に示した探索位置と同様に 1 パルスあ たり 8個所の位置を割り当てた場合に、 サブフ レーム全体に均等に探索 位置が散らばるように探索位置を固定したものである (ピッチピーク近 傍を密に、 その他の部分を疎に、 というのではなく、 全体的に均等な密 度にしている) 。 また、 図 1 6 ( a ) は、 4パルスのうち 2パルスに割 り当てる探索位置を 4個所ずつに減らす代わりに、 探索位置の種類を 4 種類にして、 サブフ レーム内の全てのサンプル点がどれかの探索位置グ ループに含まれる様にしたものである (パルス位置を表現する為のビッ ト数は図 1 6 ( a ) も 1 6 ( b ) も図 1 3も全て同じ) 。 このようにす ると、 図 1 6 ( b ) のように、 全く探索されない位置がなくなるため、 同一のビッ 卜数でも一般的に図 1 6 ( a ) の方が性能が良くなる。
なお、 本実施例では、 パルス数決定器 9 3を有するパルス数可変型の 音声符号化装置の音源生成部を示したが、 パルス数決定器 9 3を持たな いパルス数固定型のものにおいても、 ビツチ周期の連続性を用いたパル ス探索位置切り替えは有効である。 また、 本実施例では、 ピッチ周期の 連続性を直前のサブフレームと現在のサブフレームのピッチ周期のみか ら判定しているが、 さらに過去のサブフレームのピッチ周期を利用する ことによって判定確度を向上させることも可能である
<第 9実施例 >
図 1 7は、 本発明の第 9の発明の実施例を示し、 ピッチゲイン (適応符 号ベク トル利得) の量子化が 2段量子化構成になっており、 初段の夕一 ゲッ トが適応符号帳探索直後に算出されるピッチゲインであり、 この初
段の量子化ピッチゲイ ンに基づいてパルス探索に用いる探索位置を切り 替える構成を有する、 C E L P型音声符号化装置の音源生成部を示して いる。 図 1 7において、 1 1 1は、 適応符号べク トルをピッチビーク位 置算出器 1 1 2 とピッチゲイ ン算出器 1 1 6 と乗算器 1 2 3に出力する 適応符号帳、 1 1 2は、 適応符号帳 1 1 1から出力された適応符号べク トルとピッチ周期 Lを入力として、 適応符号べク トル内のピッチピーク 位置を探索位置算出器 1 1 4に出力するピツチビーク位置算出器、 1 1 3はピッチ周期 Lを入力として、 パルス音源のパルス数を探索位置算出 器 1 1 4に出力するパルス数決定器、 1 1 4はビヅチ周期 Lとピッチピ —ク位置算出器 1 1 2から出力されたピッチビーク位置とパルス数決定 器 1 1 3から出力されたパルス数を入力として、 パルスの探索位置をス イ ッチ 1 1 5を介してパルス位置探索器 1 1 9に出力する探索位置算出 器、 1 1 5は判定器 1 1 8から入力される判定結果に基づいて切り替わ る連動する 2系統のスィ ツチで、 一方の系統のスィ ツチはパルスの探索 位置を探索位置算出器 1 1 4によって算出された探索位置と了'め定めら れている固定探索位置との切り替えに用いられ、 もう一方の系統のスィ ツチは、 ピッチ周期 Lをパルス位置探索器 1 1 9に入力するかしないか の O N / O F Fに用いられる。 1 1 6は適応符号帳 1 1 1から出力され た適応符号べク トルと現フ レームの夕ーゲッ トべク トルとイ ンパルス応 答を入力とし、 ピッチゲイ ンを量子化器 1 1 7に出力するピッチゲイ ン 算出器、 1 1 7はピッチゲイ ン算出器 1 1 6から出力されるピッチゲイ ンを量子化して、 判定器 1 1 8と加算器 1 2 0及び 1 2 2に出力する量 子化器、 1 1 8は量子化器 1 1 7から出力された初段量子化ピッチゲイ ンを入力として、 ピッチ周期性の判定結果をスィ ツチ 1 1 5に出力する 判定器、 1 1 9はスイ ッチ 1 1 5を介して探索位置算出器 1 1 4から入 力されるパルスの探索位置又はスィ ツチ 1 1 5を介して入力される固定
探索位置と、 スィ ッチ 1 1 5を介して入力されるピッチ周期 Lをそれそ れ入力とし、 入力された探索位置とピッチ周期 Lを用いてパルス位置の 探索を行い、 パルス音源べク トルを乗算器 1 2 4に出力するパルス位置 探索器、 1 2 0は量子化器 1 1 7から出力された初段量子化ピッチゲイ ンと差分量子化器 1 2 1から出力された差分量子化ピッチゲインとを人 力として、 加算結果を最適量子化ピッチゲイ ン (適応符号ベク トル利得) として乗算器 1 2 3に出力する加算器、 1 2 1は加算器 1 2 2から出力 された差分値を入力とし、 その量子化値を加算器 1 2 0に出力する差分 量子化器、 1 2 2は適応符号べク トルとパルス音源ぺク トルが決定され た後に外部で算出される最適ピッチゲイン (適応符号ベク トル利得) と 量子化器 1 1 7から出力された初段量子化ピッチゲイ ン (適応符号べク トル利得) とを入力とし、 これらの差分を差分量子化器 1 2 1に出力す る加算器、 1 2 3は適応符号帳 1 1 1から出力された適応符号べク トル を入力とし、 加算器 1 2 0から出力された量子化ピツチゲイン (適応符 号ベク トル利得) を乗じて加算器 1 2 5に出力する乗算器、 1 2 4はパ ルス位置探索器 1 1 9から出力されたパルス音源べク トルを入力とし、 パルス音源べク トル利得を乗じて加算器 1 2 5に出力する乗算器、 1 2 5は乗算器 1 2 3及び 1 2 4から入力されたべク トルの加算を行い、 励 振音源べク トルとして出力する加算器である。
以上のように構成された音声符号化装置の音源生成部について、 図 1 7を用いてその動作を説明する。 適応符号帳 1 1 1は、 過去の励振音源 のバッファにより構成され、 外部のピッチ分析又は適応符号帳探索手段 によって求められたビッチ周期又はピツチラグに基づいて励振音源のバ ッファから該当する部分を取り出し、 適応符号べク トルとしてピッチピ ーク位置算出器 1 1 2及びピッチゲイ ン算出器 1 1 6及び乗算器 1 2 3 に出力する。 適応符号帳 1 1 1から乗算器 1 2 3に出力された適応符号
ベク トルは、 加算器 1 2 0から出力される量子化ピッチゲイ ン (適応符 号べク トル利得) が乗算されて加算器 1 2 5に出力される。
ピッチビーク位置算出器 1 1 2は、 適応符号べク トルからピッチピー クを検出し、 その位置を探索位置算出器 1 1 4に出力する。 ピッチピ一 ク位置の検出 (算出) は、 ピッチ周期 Lで並べたイ ンパルス列ベク トル と適応符号べク トルの内積を最大化することによって行うことができる。 また、 ピツチ周期 Lで並べたィンパルス列べク トルに合成フィル夕のィ ンパルス応答を畳み込んだべク トルと適応符号べク トルに合成フィル夕 のィ ンパルス応答を畳み込んだべク 卜ルの内積を最大化することによつ て、 より精度良く ピッチビーク位置の検出を行うことも可能である。 パルス数決定器 1 1 3はピッチ周期 Lの値に基づいて、 パルス音源に 使用するパルスの本数を決定して、 探索位置算出器 1 1 4に出力する。 パルス数とビツチ周期の関係は予め学習的あるいは統計的に定められて おり、 たとえばピッチ周期が 4 5サンブル以下の場合は 5本、 4 5サン プルを超えて 8 0サンプル未満の場合は 4本、 8 0サンブル以上の場合 は 3本、 というようにピッチ周期の値の範囲によってそれそれのパルス 本数が定められている。
探索位置算出器 1 1 4は、 ピッチビーク位置とパルス本数をもとにし て、 パルス探索を行う位置を決定する。 パルスの探索位置はピッチビー ク付近は密に、 それ以外の部分は疎になるように配分される (全てのサ ンプル点を探索するだけの十分なビッ ト配分がないときに有効である) すなわち、 ビツチピーク位置近傍は全てのサンブル点がパルス位置探索 の対象となるが、 ピッチビーク位置から離れた部分は 2サンプル毎や 3 サンプル毎というようにパルス位置探索の間隔を広 くする (たとえば、 図 1 1 ( b ) 、 1 1 ( c ) のように探索位置を決定する) 。 また、 パル ス数が多いときは 1本あたりのパルスに配分されるビッ ト数は少なくな
るため、 疎になる部分の間隔がパルス数が少ない場合より広くなる (パ ルス位置の精度が荒くなる) 。 なお、 ピッチ周期が短い場合は、 実施の 形態 5に示したように、 サブフレーム内の最初のピッチビークから 1 ピ ツチ周期強の範囲のみに探索範囲を限定すると、 より音声品質を向上す ることが可能である。
パルス位置探索器 1 1 9は、 探索位置算出器 1 1 4で決定された探索 位置又は予め決められている固定探索位置とピツチ周期 Lに基づいてパ ルスを立てる位置の最適な組み合わせを決定する。 パルス探索の方法は 「 ITU-T STUDY GR0UP15 ― CONTRIBUT ION 152, " G.729-C0D ING OF SPEEC H AT 8 KB IT/S USING CONJUGATE-STRUCTURE ALGEBRAI C-CODE-EXC ITED L INEAR-PRED I CT ION (CS-ACELP )", COM 15- 152- E July 1995 j に示されて いるように、 たとえばパルス数が 4本の場合は、 式 ( 2 ) を最大化する ように i 0から i 3の組み合わせを決定する。
スィ ツチ 1 1 5の切り替えは、 判定器 1 1 8の判定結果に基づいて行 われる。 判定器 1 1 8は、 量子化器 1 1 7から出力された初段量子化ビ ヅチゲインを用いて、 現サブフレームがビヅチ周期性の強いサブフレー ムか否かを判定する。 具体的には、 初段量子化ピッチゲインが予め定め られたあるいは計算により求められた範囲内にある場合に、 ピッチ周期 性が強いと判定する。 ピッチ周期性が強いと判定された場合、 現サブフ レームは有声 · 有声定常部であるとみなし、 スィ ッチ 1 1 5は探索位置 算出器 1 1 4とパルス位置探索器 1 1 9を接続し、 ビツチ周期 Lをパル ス位置探索器に入力する (スィ ッチ 1 1 5の一方の系統は探索位置算出 器 1 1 4に切り替えられ、 もう一方の系統は O N状態となってピッチ周 期 Lをパルス位置探索器 1 1 9に入力する) 。 ピッチ周期が連続でない (現サブフレームのピッチ周期と直前のサブフレームのピッチ周期の差 が閾値を超えてい) と判定された場合、 現サブフレームは有声 ·有声定
常部でない (無声部 · 有声立ち上がり部である) とみなし、 スィ ッチ 1 1 5は予め定められている固定探索位置をパルス探索器 1 1 9に入力し、 ピッチ周期 Lはパルス位置探索器に入力しない (スイ ッチ 1 1 5の一方 の系統は固定探索位置に切り替えられ、 もう一方の系統は 0 F F状態と なってピッチ周期 Lはパルス位置探索器 1 1 9に入力されない) 。
パルス位置探索器 1 1 9によって、 最適パルス位置の組み合わせた決 定されると、 その組み合わせによって生成されるパルス音源べク トルが 乗算器 1 2 4に出力され、 パルス符号べク トル利得が乗算され、 加算器 1 2 5に出力される。
ピヅチゲイン算出器 1 1 6は、 現サブフレームの量子化 L P C合成フ ィル夕と聴覚重みづけフィル夕を縦続接続したフィル夕のィ ンパルス応 答と夕一ゲッ トべク トルと適応符号帳から出力された適応符号べク トル とを用いて、 式 ( 5 ) によってピッチゲイ ン (適応符号べク トル利得) を算出する。 算出されたピッチゲイ ンは量子化器 1 1 7で量子化され、 ピッチ周期性の強さを判定する判定器 1 1 8 と加算器 1 2 0及び 1 2 2 に出力される。 加算器 1 2 2では、 音源符号帳探索 (適応符号帳探索と 雑音符号帳探索 (本実施例ではパルス位置探索) ) が全て終了した後に 算出される最適量子化ピッチゲイ ンと、 量子化器 1 1 7から出力される (初段) 量子化ピッチゲインとの差分を計算し、 差分量子化器 1 2 1に 出力する。 差分量子化器 1 2 1で量子化された差分値は、 加算器 1 2 0 によって、 量子化器 1 1 7から出力される初段量子化ビツチゲインと加 算されて、 最適量子化ビツチゲイ ンとして乗算器 1 2 3に出力される。 乗算器 1 2 3は、 適応符号帳 1 1 1から出力された適応符号べク トル に最適量子化ビツチゲイ ンを乗じて、 加算器 1 2 5に出力する。
加算器 1 2 5は、 適応符号べク トル成分とパルス音源べク トル成分の 加算を行い、 励振音源ベク トルとして出力する。
なお、 本実施例では、 判定器 1 1 8の入力として、 現サブフレームの 初段量子化ビツチゲインを用いたが、 一般的なゲイン量子化を用いた場 合 (本実施例に示したような多段量子化を用いない場合) には、 直前の サブフレームの量子化ピッチゲイン (適応符号ベク トル利得) を判定器 1 1 8の入力とすることも可能である。 また、 本実施例では、 パルス数 決定器を有するパルス数可変型の音声符号化装置の音源生成部を示した が、 パルス数決定器を持たないパルス数固定型のものにおいても、 ピッ チゲインの値を用いて周期性の強さを判定してパルス探索位置切り替え を行うことは有効である。
<第 1 0実施例 >
図 1 8は本発明の第 1 0実施例を示し、 連続するサブフレーム間の音 源信号波形の位相の連続性を利用して、 バックヮー ドで雑音符号帳に対 する位相適応処理の切り替えを行う音声符号化装置の音源生成部を示す 図 1 8において、 1 8 0 1は適応符号ベク トルをピッチビーク位置算出. 器 1 8 0 2 と乗算器 1 8 1 0に出力する適応符号帳、 1 8 0 2は適応符 号帳 1 8 0 1から出力された適応符号べク トルとピッチ周期 Lとを入力 として、 適応符号べク トル内のビツチビーク位置を遅延器 1 8 0 3 と判 定器 1 8 0 6 と探索位置算出器 1 8 0 7 とに出力するピッチビーク位置 算出器、 1 8 0 3はビヅチピーク位置算出器 1 8 0 2から出力されたピ ヅチビーク位置を入力として、 1サブフレーム分遅延させてピッチピー ク位置予測器 1 8 0 5に出力する遅延器、 1 8 0 4はピッチ周期 Lを入 力として、 1サブフレーム分遅延させてピツチピーク位置予測器 1 8 0 5に出力する遅延器、 1 8 0 5は遅延器 1 8 0 3から出力された直前の サブフレームにおけるピッチピーク位置と遅延器 1 8 0 4から出力され た直前のサブフ レームにおけるピツチ周期と現在のサブフレームにおけ
るピッチ周期 Lとを入力として、 予測ピッチピーク位置を判定器 1 8 0 6に出力するピッチビーク位置予測器、 1 8 0 6はピッチピーク位置算 出器 1 8 0 2から出力されたビヅチビ一ク位置とピッチビーク位置予測 器 1 8 0 5から出力された予測ピッチピーク位置とを入力として、 直前 のサブフレームと現在のサブフレームで位相の連続性があるかどうかを 判定し、 判定結果をスィ ツチ 1 8 0 8に出力する判定器、 1 8 0 7はビ ツチビーク位置算出器 1 8 0 2から出力されたピッチピーク位置とビッ チ周期 Lとを入力として、 音源パルスの探索位置をスィ ツチ 1 8 0 8を 介してパルス位置探索器 1 8 0 9に出力する探索位置算出器、 1 8 0 8 は判定器 1 8 0 6から出力された判定結果に基づいて切り替わるスィ ヅ チで、 探索位置算出器から出力された探索位置と予め定められている固 定探索位置との切り替えに用いられる。 1 8 0 9はスィ ッチ 1 8 0 8を 介して探索位置算出器 1 8 0 7から入力される音源パルスの探索位置又 はスィ ッチ 1 8 0 8を介して入力される固定探索位置と、 ピッチ周期 L をそれそれ入力とし、 入力された音源パルス探索位置とピッチ周期 Lを 用いて音源パルスの位置を探索し、 パルス音源べク トルを乗算器 1 8 1 2に出力するパルス位置探索器、 1 8 1 0は適応符号帳 1 8 0 1から出 力された適応符号べク トルを入力として量子化適応符号べク トル利得を 乗じて加算器 1 8 1 1に出力する乗算器、 1 8 1 2はパルス位置探索器 1 8 0 9から出力されるパルス音源べク トルを入力として量子化パルス 音源べク トル利得を乗じて加算器 1 8 1 1に出力する乗算器、 1 8 1 1 は乗算器 1 8 1 0および 1 8 1 2から出力されたべク トルをそれそれ入 力とし、 入力されたべク トルの加算を行い、 励振音源べク トルとして出 力する加算器である。
以上のように構成された音声符号化装置の音源生成部について、 図 1 8を用いてその動作を説明する。 適応符号帳 1 8 0 1は、 過去の励振音
源のバッファにより構成され、 外部のピッチ分析又は適応符号帳探索手 段によって求められたピツチ周期又はピッチラグに基づいて励振音源の バッファから該当する部分を取り出し、 適応符号べク トルとしてピッチ ビーク位置算出器 1 8 0 2及び乗算器 1 8 1 0に出力する。 適応符号帳 1 8 0 1から乗算器 1 8 1 0に出力された適応符号べク トルは、 外部の ゲイン量子化器によって量子化された量子化適応符号べク トル利得が乗 算されて加算器 1 8 1 1 に出力される。
ピッチビーク位置算出器 1 8 0 2は、 適応符号べク トルカゝらビッチビ —クを検出し、 その位置を遅延器 1 8 0 3 と判定器 1 8 0 6 と探索位置 算出器 1 8 0 7のそれそれに出力する。 ビツチピーク位置の検出 (算出) は、 ビツチ周期 Lで並べたィンパルス列べク トルと適応符号べク トルの 正規化相互相関関数を最大化することによって行うことができる。 また、 ビヅチ周期 Lで並べたィ ンパルス列べク トルに合成フィル夕のインパル ス応答を畳み込んだべク トルと、 適応符号べク トルに合成フィルタのィ ンパルス応答を畳み込んだべク トルとの正規化相互相関関数を最大化す ることによって、 より精度良く ピツチビーク位置の検出を行うことも可 能である。 さらに、 検出されたピッチビーク位置を含む 1 ピッチ周期波 形の中から振幅値最大となる位置をピッチビークとする後処理を加えれ ば、 1 ピッチ周期波形内のセカン ドピークを誤検出することを回避する ことも可能である。
遅延器 1 8 0 3は、 ピッチビーク位置算出器 1 8 0 2で算出されたビ ツチピーク位置を 1サブフレーム分だけ遅延させてビヅチビ一ク位置予 測器 1 8 0 5に出力する。 即ち、 ピッチピーク位置予測器 1 8 0 5には 直前のサブフレームにおけるピヅチピーク位置が遅延器 1 8 0 3から入 力される。 遅延器 1 8 0 4は、 ピッチ周期 Lを 1サブフレーム分だけ遅 延させてピッチビーク位置算出器 1 8 0 5に出力する。 即ち、 ピッチビ
—ク位置予測器 1 8 0 5には直前のサブフ レームにおけるピッチ周期が 遅延器 1 8 04から入力される。
ピッチピーク位置予測器 1 80 5は、 遅延器 1 8 0 3から入力される 直前のサブフレームにおけるビヅチピーク位置と、 遅延器 1 8 04から 入力される直前のサブフ レームにおけるピッチ周期と、 現在のサブフ レ ームにおけるピツチ周期 Lを入力として、 現在のサブフレームにおける ビツチピーク位置を予測し、 予測ビッチピーク位置を判定器 1 80 6に 出力する。 予測ピッチビ一ク位置は ( 6 ) 式によって求められる (図 1 9参照) 。
Φ ( N) = Φ ( N - 1 ) + n X T ( N - 1 ) + T (N) - L ,
n二 I NT ( ( L - Φ (N - 1 ) ) /T (N- 1 )
)
. . . ( 6 ) 上式において、 Φ ( k ) は第 k番目のサブフレームにおける最初のビ ツチビーク位置をそのサブフレームの先頭を 0として表したものであり、 T (k) は第 k番目のサブフレームにおける音源 (音声) 信号のピッチ 周期であり、 Lはサブフレーム長である。 また、 nは第 k番目のサブフ レームにおける最初のピッチビーク位置 (Φ ( k ) ) から第 k番目のサ ブフレームの最後のまでの間にいくつのピツチ周期長が含まれるか (小 数点以下切り捨て) を示す整数値である ( k= 0 , 1, 2, ···) 。
判定器 1 80 6は、 ピッチビーク位置算出器 1 8 0 2から出力された ピッチビーク位置とピッチビーク位置予測器 1 8 0 5から出力された予 測ピッチビーク位置とを入力とし、 ピッチビーク位置が予測ピッチビー ク位置と大きくかけ離れていない場合は位相が連続していると判定し、 ピッチビーク位置が予測ピッチビーク位置と大きく異なる場合は位相が 連続していないと判定する。 そして、 判定結果をスィ ツチ 1 8 08に出
力する。 なお、 ピッチビーク位置を予測ピッチピーク位置と比較する際、 ビヅチビ一ク位置又は予測ピッチビーク位置がサブフ レーム境界付近に 存在する場合は、 1 ピッチ周期後の位置がピッチピーク位置である可能 性も考慮して、 ピッチビーク位置と予測ピッチビーク位置の比較を行つ て位相の連続性の判定を行う。
探索位置算出器 1 8 0 7は、 ビツチビーク位置を基準として音源パル スの探索位置を決定し、 探索位置をスィ ツチ 1 8 0 8を介してパルス位 置探索器 1 8 0 9に出力する。 探索位置の決定法としては、 例えば第 6 実施例や第 8実施例に示したようにピッチビーク近傍は密にそれ以外の 部分は疎に探索位置が分布するように決定される。 なお、 第 6実施例や 第 8実施例に示したようにピッチ周期情報を用いて音源パルス数を変化 させたり、 音源パルスの探索範囲を限定したりすることを適用すること も有効である。
スィ ッチ 1 8 0 8は、 判定器 1 8 0 6の判定結果に基づいて位相適応 型の音源パルス探索を行うか、 固定位置による音源パルス探索 (又は一 般の雑音符号帳探索) を行うかを切り替えるものである。 即ち、 判定器 1 8 0 6の判定結果が、 「位相の連続性あり」 の場合は探索位置算出器 1 8 0 7 とパルス位置探索器 1 8 0 9を接続して、 探索位置算出器 1 8 0 7によって算出された音源パルス探索位置をパルス位置探索器 1 8 0 9に入力させる (つまり、 位相適応型の音源パルス探索を行わせる) 。 反対に、 判定器 1 8 0 6の判定結果が、 「位相の連続性なし」 の場合は 固定探索位置をパルス位置探索器 1 8 0 9に入力させるように切り替わ る (一般の雑音符号帳探索と切り替える場合は別途雑音符号帳探索器を 備える構成とし、 パルス位置探索器 1 8 0 9 と切り替えて用いる構成に する) 。
パルス位置探索器 1 8 0 9は、 探索位置算出器 1 8 0 7で決定された
音源パルス探索位置又は予め決められている固定探索位置と、 別途人力 されるピッチ周期 Lを用いて、 音源パルスを立てる位置の最適な組み合 わせを決定する。 パルス探索の方法は 「ITU-T Recommendation G.729 : Coding of Speech at 8 kbits/s using Conjugate- Structure Algebrai c- Code- Excited Linear-Prediction ( CS-ACELP ) , March 1996 」 に示さ れているように、 例えばパルス数が 4本の場合は第 6実施例で示した式 ( 2 ) を最大化するように i 0から i 3の組み合わせを决定する。 なお、 この時の各音源パルスの極性は、 雑音符号帳成分の夕ーゲッ トべク トル、 即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィル夕の零入 力応答信号と適応符号帳成分の信号を減じた信号ベク トル、 の各位置に おける極性と等しくなるようにパルス位置探索を行う前に予め決定して いる。 また、 ピッチ周期がサブフレーム長より短い場合には第 5実施例 にも示したようにビツチ周期化フィル夕をかけることによって、 音源パ ルスをィンパルスではなく ピッチ周期のパルス列になるようにしている このようなピッチ周期化処理を行う場合は聴覚重みづけ合成フィル夕の ィンパルス応答べク トルにピッチ周期化フィル夕を予めかけておけば、 ピッチ周期化を行わない場合と同様にして式 ( 2 ) の最大化によって音 源パルスの探索を行うことができる。 このようにして決定された各音源 パルスの位置に、 決定された各音源パルスの極性にしたがってパルスを 立て、 ピッチ周期 Lを用いてピッチ周期化フィルタをかければ、 パルス 音源べク トルが生成される。 生成されたパルス音源べク トルは乗算器 1 8 1 2に出力される。 パルス位置探索器 1 8 0 9から乗算器 1 8 1 2に 出力されたパルス音源べク トルは、 外部のゲイン量子化器によって量子 化された量子化パルス音源べク トル利得が乗算されて加算器 1 8 1 1 に 出力される。
加算器 1 8 1 1は、 乗算器 1 8 1 0から出力された適応符号べク トル
成分と、 乗算器 1 8 1 2から出力されたパルス音源べク トル成分とのベ ク トル加算を行い、 励振音源べク トルとして出力する。
なお、 本発明による音声符号化装置においては、 有声定常部以外の部 分では、 固定探索位置が選択され続ける状態が生じ易いので、 伝送路誤 りの影響が伝播している場合にはリセッ トをかける効果を得ることもで きる。 (ピッチビーク位置を 0とする相対位置でパルス位置を表現する 場合は、 一度伝送路誤りが生じて符号器側と復号器側の適応符号帳の内 容が大きく異なってしまうと、 後続のフレームにおいて伝送路誤りがな くてもピッチビーク位置が符号器側と復号器側で一致しなくなり続ける 現象が発生することがあり、 誤りの影響を長く引きずることになる。 ) また、 パルスの立て方としては、 定数本例えば 4本のパルスを探索範 囲、 例えば 3 2箇所の位置のどこかに立てる場合においては、 前述のよ うに 3 2箇所を 4つに分けて 1本のパルスを割り当てられナこ 8箇所の中 の 1箇所に決定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を 探索する方法の他に、 3 2箇所の中から 4箇所を選びだす組み合わせ全 てについて探索する方法などがある。 なお、 振幅 1のインパルスの組み 合わせの他に、 複数本例えば 2本のパルスを組み合わせたパルス対の組 み合わせや、 振幅の異なるインパルスの組み合わせによるパルスの立て 方も可能である。
<第 1 1実施例 >
図 2 0は本発明の第 1 1実施例を示し、 適応符号べク トルの形状に強 いパルス性が存在するか否かで、 位相適応処理を行うか行わないかの切 り替えを行う C E L P型音声符号化装置の音源生成部を示している。 図 2 0において、 2 0 0 1は適応符号べク トルをピッチピーク位置算出器 2 0 0 2 とパルス性判定器 2 0 0 3と乗算器 2 0 0 7に出力する適応符
号帳、 2 0 0 2は適応符号帳 2 0 0 1から出力された適応符号べク トル とピッチ周期 Lとを入力として、 適応符号べク トル内のピッチビーク位 置をパルス性判定器 2 0 0 3 と探索位置算出器 2 0 0 4 とに出力するビ 、ソチビーク位置算出器、 2 0 0 3は適応符号帳 2 0 0 1から出力された 適応符号べク トルとピッチビーク位置算出器 2 0 0 2から出力されたビ ツチビーク位置と外部から入力するピツチ周期 Lを入力として、 適応符 号べク トルによいパルス性が存在するか否かを判定し、 判定結果をスィ ツチ 2 0 0 5に出力するパルス性判定器、 2 0 0 4は外部から入力する ピヅチ周期 Lとビヅチビーク位置算出器 2 0 0 2から出力されるピッチ ピーク位置を入力として、 音源パルスの探索位置をスイ ッチ 2 0 0 5を 介してパルス位置探索器 2 0 0 6に出力する探索位置算出器、 2 0 0 5 はパルス性判定器 2 0 0 3から出力された判定結果に基づいて切り替わ るスイ ッチで、 探索位置算出器 2 0 0 4から出力された探索位置と予め 定められている固定探索位置との切り替えに用いられる。 2 0 0 6はス イ ッチ 2 0 0 5を介して探索位置算出器 2 0 0 4から入力される音源パ ルスの探索位置又はスィ ツチ 2 0 0 5を介して入力される固定探索位置 と外部から入力されるピッチ周期 Lをそれそれ入力とし、 入力された音 源パルス探索位置とピツチ周期 Lを用いて音源パルスの位置を探索し、 パルス音源べク トルを乗算器 2 0 0 9に出力するパルス位置探索器、 2 0 0 7は適応符号帳 2 0 0 1から出力された適応符号べク トルを入力と して量子化適応符号べク トル利得を乗じて加算器 2 0 0 8に出力する乗 算器、 2 0 0 9はパルス位置探索器 2 0 0 6から出力されるパルス音源 べク トルを入力として量子化パルス音源べク トル利得を乗じて加算器 2 0 0 8に出力する乗算器、 2 0 0 8は乗算器 2 0 0 7及び 2 0 0 9から 出力されたベク トルをそれそれ入力とし、 入力されたベク トルの加算を 行い、 励振音源ベク トルとして出力する加算器である。
以上のように構成された音声符号化装置の音源生成部について、 図 2 0を用いてその動作を説明する。 適応符号帳 2 0 0 1は、 過去の励振音 源のバッファにより構成され、 外部のピッチ分析又は適応符号帳探索手 段によって求められたピッチ周期又はビツチラグに基づいて励振音源の バッファから該当する部分を取り出し、 適応符号べク トルとしてピッチ ビーク位置算出器 2 0 0 2及びパルス性判定器 2 0 0 3及び乗算器 2 0 0 7に出力する。 適応符号帳 2 0 0 1から乗算器 2 0 0 7に出力された 適応符号べク トルは、 外部のゲイ ン量子化器によって量子化された量子 化適応符号べク トル利得が乗算されて加算器 2 0 0 8に出力される。
ビヅチピーク位置算出器 2 0 0 2は、 適応符号べク トルからピッチピ —クを検出し、 その位置をパルス性判定器 2 0 0 3 と探索位置算出器 2 0 0 4のそれそれに出力する。 ピッチピーク位置の検出 (算出) は、 ビ ツチ周期 Lで並べたインパルス列べク トルと適応符号べク トルの正規化 相互相関関数を最大化することによって行うことができる。 また、 ビッ チ周期 Lで並べたィンパルス列べク トルに合成フィル夕のイ ンパルス応 答を畳み込んだべク トルと、 適応符号べク トルに合成フィル夕のイ ンパ ルス応答を畳み込んだべク トルとの正規化相互相関関数を最大化するこ とによって、 より精度良く ビツチピーク位置の検出を行うことも可能で ある。 さらに、 検出されたピッチビーク位置を含む 1 ピッチ周期波形の 中から振幅値最大となる位置をピツチビークとする後処理を加えれば、 1 ピッチ周期波形内のセカン ドピークを誤検出することを回避すること も可能である。
パルス性判定器 2 0 0 3は、 ピッチビーク位置算出器 2 0 0 2で算出 されたピッチビーク位置付近に適応符号べク トルの信号パワーが集中し ているかどうかを判定し、 信号パワーの集中がある場合は 「パルス性あ り」 の判定結果をスィ ツチ 2 0 0 5に出力、 信号パワーの集中が見られ
ない場合は 「パルス性なし」 の判定結果をスィ ツチ 2 0 0 5に出力する。 信号パワーが集中しているかどうかを調べる手法としては、 例えば以下 のような方法が考えられる。 まず、 ピッチピーク位置を含む 1 ピッチ周 期長の適応符号べク トルを切り出し、 切り出した信号全体のパワーを算 出しこれを P W 0とする。 次に、 ピッチビーク位置の近傍の 2分の 1か ら 3分の 1 ピッチ長の適応符号べク トルを切り出し、 この切り出した信 号パワーを算出しこれを P W 1 とする。 P W 1 / P W 0の値が所定の値 (例えば 0 . 5から 0 . 6程度) 以上である場合は、 ピッチピーク近傍 に信号パワーが集中しているので、 パルス性が高いを判定することがで きる。 また、 別の判定方法としては、 ピッチピーク位置に最初のイ ンパ ルスが立つビツチ周期間隔で並べたィンパルス列べク トルで適応符号べ ク トルを近似した場合の、 ィンパルス列べク トルと適応符号べク トルの との誤差を用いた判定方法がある。 さらに、 ピッチ周期 Lで並べたイ ン パルス列べク トルに合成フィル夕のィンパルス応答を畳み込んだべク ト ルと、 適応符号ベク トルに合成フィル夕のイ ンパルス応答を畳み込んだ べク トルとの正規化相互相関関数を最大化することによってピッチビー ク位置を求めた場合には、 ピッチ周期 Lで並べたィ ンパルス列べク トル に合成フィル夕のィ ンパルス応答を畳み込んだべク トルと、 適応符号べ ク トルに合成フィル夕のィ ンパルス応答を畳み込んだべク トルとの誤差 を用いた判定方法がある。 これらベク トル間の誤差を評価する手段とし ては、 式 ( 7 ) に示すような予測ゲインや式 ( 8 ) に示すような正規化 相互相関関数などをを利用する。 式 ( 7 ) 及び ( 8 ) において、 x( n )は 適応符号べク トル又は適応符号べク トルに合成フィル夕のイ ンパルス応 答を畳み込んだべク トル、 y(n )はィンパルス列べク トル又はィンパルス 列べク トルに合成フィル夕のイ ンパルス応答を畳み込んだべク トルであ る。 どちらの式においても値が例えば 0 . 3〜 0 . 4以上あれば、 ある
程度強いパルス性が適応符号べク トルに存在していると判定できる
Σ " )
… ( 8 ) 探索位置算出器 2 0 0 4は、 ピッチビーク位置を基準として音源パル スの探索位置を決定し、 探索位置をスィ ツチ 2 0 0 5を介してパルス位 置探索器 2 0 0 6に出力する。 探索位置の決定法としては、 例えば第 6' 実施例や第 8実施例に示したようにピッチビーク近傍は密にそれ以外の 部分は疎に探索位置が分布するように決定される。 なお、 第 6実施例や 第 8実施例に示したようにピッチ周期情報を用いて音源パルス数を変化 させたり、 音源パルスの探索範囲を限定したりすることを適用すること も有効である。
スィ ッチ 2 0 0 5は、 パルス性判定器 2 0 0 3の判定結果に基づいて 位相適応型の音源パルス探索を行うか、 固定位置による音源パルス探索 を行うかを切り替えるものである。 即ち、 パルス性判定器 2 0 0 3の判 定結果が、 「パルス性あり」 の場合は探索位置算出器 2 0 0 4 とパルス 位置探索器 2 0 0 6を接続して、 探索位置算出器 2 0 0 4によって算出 された音源パルス探索位置をパルス位置探索器 2 0 0 6に入力させる (つま り、 位相適応型の音源パルス探索を行わせる) 。 反対に、 パルス 性判定器 2 0 0 3の判定結果が、 「パルス性なし」 の場合は固定探索位 置をパルス位置探索器 2 0 0 6に入力させるように切り替わる Λ
パルス位置探索器 2 0 0 6は、 探索位置算出器 2 0 0 4で決定された 音源パルス探索位置又は予め決められている固定探索位置と、 別途入力 されるピッチ周期 Lを用いて、 音源パルスを立てる位置の最適な組み合 わせを決定する。 パルス探索の方法は 「ITU- T Recommendation G.729 : Coding of Speech at 8 kbits/s using Conjugate-Structure Algebrai c- Code- Excited Linear-Prediction ( CS-ACELP ) , March 1996 j に示さ れているように、 例えばパルス数が 4本の場合は第 6実施例で示した式 ( 2 ) を最大化するように i 0から i 3の組み合わせを決定する。 なお、 この時の各音源パルスの極性は、 雑音符号帳成分の夕ーゲッ トべク トル、 即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィル夕の零入 力応答信号と適応符号帳成分の信号を減じた信号べク トル、 の各位置に おける極性と等しくなるようにパルス位置探索を行う前に予め決定して いる。 また、 ビヅチ周期がサブフ レーム長より短い場合には実施の形態 5にも示したようにピッチ周期化フ ィル夕をかけることによって、 音源 パルスをインパルスではなく ビツチ周期のパルス列になるようにしてい る。 このようなピッチ周期化処理を行う場合は、 聴覚重みづけ合成フィ ル夕のィ ンパルス応答べク トルにピッチ周期化フィル夕を予めかけてお けば、 ピッチ周期化を行わない場合と同様にして式 ( 2 ) の最大化によ つて音源パルスの探索を行うことができる。 このようにして決定された 各音源パルスの位置に、 決定された各音源パルスの極性にしたがってパ ルスを立て、 ピッチ周期 Lを用いてピッチ周期化フィル夕をかければ、 パルス音源べク トルが生成される。 生成されたパルス音源べク トルは乗 算器 2 0 0 9に出力される。 パルス位置探索器 2 0 0 6から乗算器 2 0 0 9に出力されたパルス音源べク トルは、 外部のゲイン量子化器によつ て量子化された量子化パルス音源べク トル利得が乗算されて加算器 2 0 0 8に出力される。
加算器 2 0 0 8は、 乗算器 2 0 0 7から出力された適応符号べク トル 成分と、 乗算器 2 0 0 9から出力されたパルス音源べク トル成分とのベ ク トル加算を行い、 励振音源ベク トルとして出力する。
なお、 本発明による音声符号化装置においては、 有声定常部以外の部 分では、 固定探索位置が選択され続ける状態が生じ易いので、 伝送路誤 りの影響が伝播している場合にはリセッ トをかける効果を得ることもで きる。 (ピッチビーク位置を 0とする相対位置でパルス位置を表現する 場合は、 一度伝送路誤りが生じて符号器側と復号器側の適応符号帳の内 容が大きく異なってしまうと、 後続のフレームにおいて伝送路誤りがな くてもピッチピーク位置が符号器側と復号器側で一致しなくなり続ける 現象が発生することがあり、 誤りの影響を長く引きずることになる。 ) なお、 パルスの立て方としては、 定数本例えば 4本のパルスを探索範 囲、 例えば 3 2箇所の位置のどこかに立てる場合においては、 前述のよ うに 3 2箇所を 4つに分けて 1本のパルスを割り当てられた 8箇所の中 の 1箇所に決定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を 探索する方法の他に、 3 2箇所の中から 4箇所を選びだす組み合わせ全 てについて探索する方法などがある。 なお、 振幅 1のイ ンパルスの組み 合わせの他に、 複数本例えば 2本のパルスを組み合わせたパルス対の組 み合わせや、 振幅の異なるィ ンパルスの組み合わせによるパルスの立て 方も可能である。
<第 1 2実施例 >
図 2 1は本発明の第 1 2実施例を示し、 パルス探索位置のィンデック スを付け替えるインデックス更新手段を備え、 パルス位置の探索範囲を 適応符号べク トルのピッチ周期及びピッチピーク位置によって決定する C E L P型音声符号化装置の符号器側の音源生成部を示す。 より具体的
には、 ピッチビーク位置からの相対位置で音源パルス探索を行う C E L P型音声符号化装置において、 サブフ レームの先頭側から順番にパルス 位置のィンデックスを付けるようにすることによって、 あるフレームに おいて発生した伝送路誤りの影響が後続の伝送路誤りのないフレームに 伝播することを防ぐようにした音源生成部を示す。
図 2 1において、 2 1 0 1は過去の励振音源べク トルを保存し、 選択 された適応符号べク トルをピッチビーク位置算出器 2 1 0 2及びピッチ ゲイン乗算器 2 1 0 6に出力する適応符号帳、 2 1 0 2は適応符号帳 2 1 0 1から出力された適応符号べク トルとピッチ周期 Lを入力としてピ ツチビーク位置を算出し、 探索位置算出器 2 1 0 3に出力するピ、ソチビ —ク位置算出器、 2 1 0 3はビヅチピーク位置算出器 2 1 0 2から出力 されたピッチビーク位置とピッチ周期 Lを入力としてパルス音源を探索 する範囲を算出し、 ィンデックス更新手段 2 1 0 4へ出力する探索位置 算出器、 2 1 0 4は探索位置算出器 2 1 0 3から出力された、 各音源パ ルスの各位置のィンデックスを付け替えてパルス位置探索器 2 1 0 5に 出力するィ ンデックス更新手段、 2 1 0 5はィンデックス更新手段 2 1 0 4から出力された探索位置 (パルス位置を表すィ ンデックスが付け直 されている) と、 音源生成部の外部で別途算出されたピッチ周期 Lとを 入力としてパルス音源を探索し、 パルス音源べク トルをパルス音源ゲイ ン乗算器 2 1 0 7に出力し、 符号化出力としてパルス音源べク トルを表 すインデックスを音源生成部の外部に出力するパルス位置探索器、 2 1 0 6は適応符号帳 2 1 0 1から出力された適応符号べク トルに適応符号 べク トル利得を乗じて加算器 2 1 0 8に出力する乗算器、 2 1 0 7はパ ルス位置探索器 2 1 0 5から出力されたパルス音源べク トルにパルス音 源ベク トル利得を乗じて加算器 2 1 0 8に出力する乗算器、 2 1 0 8は 乗算器 2 1 0 6からの出力と乗算器 2 1 0 7からの出力を入力とし、 ベ
ク トル加算して励振音源べク トルとして出力する加算器である。
以上のように構成された、 音源生成部の動作について、 図 2 1及び図 2 2を用いて説明する。 図 2 1 において、 適応符号帳 2 1 0 1は、 音源 生成部の外部で予め算出されるビツチ周期 Lだけ過去に溯った点から、 適応符号ベク トルをサブフレーム長だけ切り出して、 適応符号ベク トル として出力する。 ピッチ周期 Lがサブフ レーム長に満たない場合は、 切 り出したピッチ周期 Lのべク トルを、 サブフ レーム長に達するまで繰り 返して接続したものを適応符号べク トルとして出力する。
ビツチピーク位置算出器 2 1 0 2は、 適応符号帳 2 1 0 1から出力さ れた適応符号べク トルを用いて適応符号べク トル内に存在するピッチピ ークの位置を決定する。 ピッチピークの位置は、 ピッチ周期で並べたィ ンパルス列と適応符号べク トルとの正規化相互相関を最大化することに よって行うことができる。 また、 ピッチ周期で並べたインパルス列を合 成フィル夕に通したものと、 適応符号べク トルを合成フィル夕に通した もとの誤差を最小化することによって、 より精度良く求めることも可能 である。
探索位置算出器 2 1 0 3は、 ピッチピーク位置を基準として音源パル スの探索位置を決定し、 イ ンデックス更新手段 2 1 0 4に出力する。 探 索位置の決定法としては、 例えば第 5実施例や第 6実施例に示したよう にピツチピーク近傍は密にそれ以外の部分は疎に探索位置が分布するよ うに決定される。 なお、 第 6実施例や第 8実施例に示したようにピッチ 周期情報を用いて音源パルス数を変化させたり、 音源パルスの探索範囲 を限定したりすることを適用することも有効である。 探索位置算出器 2 1 0 3によって決定される具体的な探索位置の例は図 1 0、 図 1 1 ( b ) 、 図 1 1 ( c ) 、 図 1 3に示している。 例えば図 1 0においては、 ピッ チパルス位置近傍は密に、 それ以外の部分は疎に、 パルス位置探索範囲
を限定する方法を具体的に示している。 この限定方法は、 パルスが立て られる確率が高い位置がビツチパルス近傍に集中する統計的結果に基づ いている。 パルス位置探索範囲を限定しない場合、 有声部においてはビ ツチパルス近傍にパルスが立てられる確率がその他の部分に立てられる 確率に比べて高くなる。 なお、 探索位置算出器で算出されるのは、 ビッ チビーク位置からの相対位置を用いた、 音源パルスの探索位置であり、 この時点では、 ピッチビーク位置を 0 とする相対位置の数値が小さいも のから順にイ ンデックスが付けられている (図 2 2参照。 なお図 2 2で はパルス数を 4本とした場合の図 1 3 ( a ) に対応する場合を示してい る。 ) 。
インデックス更新手段 2 1 0 4は、 ピッチピーク位置からの相対位置 が小さいものから順番にイ ンデックスが付けられている (図 2 2の相対 位置) 音源パルス探索位置を、 サブフレームの先頭を 0とする絶対位置 に変換した後に絶対位置が小さいものから順番にィ ンデックスを付け直 して (図 2 2の絶対位置) 、 パルス位置探索器 2 1 0 5へ出力する。 こ のようにすることによって、 伝送路誤りが生じるなどして符号器側と復 号器側とで算出されるピッチビーク位置が異なった場合において、 パル ス位置のずれを小さくすることができる。
パルス位置探索器 2 1 0 5は、 ィンデックス更新手段 2 1 0 4によつ て各探索位置を示すィンデックの付け直しが行われた音源パルス探索位 置と、 別途入力されるピッチ周期 Lを用いて、 音源パルスを立てる位置 の最適な組み合わせを決定する。 パルス探索の方法は 「ITU- T Recommen dation G.729 : Coding of Speech at 8 kbits/s using Conjugate - Stru cture Algebraic-Code-Excited Linear-Prediction ( CS-ACELP ) , March 1996 」 に示されているように、 例えばパルス数が 4本の場合は第 6実 施例で示した式 ( 2 ) を最大化するように i 0から i 3の組み合わせを
決定する。 なお、 この時の各音源パルスの極性は、 雑音符号帳成分の夕 —ゲッ トべク トル、 即ち聴覚重みづけされた入力音声から聴覚重みづけ 合成フィル夕の零入力応答信号と適応符号帳成分の信号を減じた信号べ ク トル、 の各位置における極性と等しくなるようにパルス位置探索を行 う前に予め決定すれば探索のための演算量を大幅に軽減でぎる。 また、 ビヅチ周期がサブフレーム長より短い場合には第 5実施例にも示したよ うにピヅチ周期化フィル夕をかけることによって、 音源パルスをインパ ルスではなく ビッチ周期のパルス列になるようにしている。 このような ピッチ周期化処理を行う場合は、 聴覚重みづけ合成フィル夕のインパル ス応答ベク トルにピッチ周期化フィル夕を予めかけておけば、 ピッチ周 期化を行わない場合と同様にして式 ( 2 ) の最大化によって音源パルス の探索を行うことができる。 このようにして決定された各音源パルスの 位置に、 決定された各音源パルスの極性にしたがってパルスを立て、 ビ ツチ周期 Lを用いてピッチ周期化フィル夕をかければ、 パルス音源べク トルが生成される。 生成されたパルス音源べク トルは乗算器 2 1 0 7に 出力される。 パルス位置探索器 2 1 0 5から乗算器 2 1 0 7に出力され たパルス音源べク トルは、 外部のゲイン量子化器によって量子化された 量子化パルス音源べク トル利得が乗算されて加算器 2 1 0 8に出力され る。 なお、 パルス位置探索器 2 1 0 5においては、 パルス音源ベク トル とともにパルス音源べク トルを表す各音源パルスの極性及びィ ンデック ス情報が別途音源生成部の外部に出力される。 この音源パルスの極性及 びィンデックス情報は符号化器や多重化器などを通って伝送路へ出力さ れるデ一夕系列に変換されて伝送路へ送り出される。
加算器 2 1 0 8は、 乗算器 2 1 0 6から出力された適応符号べク トル 成分と、 乗算器 2 1 0 7から出力されたパルス音源べク トル成分とのベ ク トル加算を行い、 励振音源べク トルとして出力する。
なお、 本実施例に基づくインデックスの割り当て方法は、 音源の位置 情報が相対的な値で表現される全ての場合に適用することが可能であり、 インデックスの割り当てかたのみの違いであるので、 性能に全く影響を 及ぼさずに伝送路誤りの伝播を抑える効果を得ることができる。
なお、 復号器側にも符号器側と同様のィ ンデックス更新手段を備える また、 パルスの立て方としては、 定数本例えば 4本のパルスを探索範囲、 例えば 3 2箇所の位置のどこかに立てる場合においては、 前述のように 3 2箇所を 4つに分けて 1本のパルスを割り当てられた 8箇所の中の 1 箇所に決定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を探索 する方法の他に、 3 2箇所の中から 4箇所を選びだす組み合わせ全てに ついて探索する方法などがある。 なお、 振幅 1のイ ンパルスの組み合わ せの他に、 複数本例えば 2本のパルスを組み合わせたパルス対の組み合 わせや、 振幅の異なるィ ンパルスの組み合わせによるパルスの立て方も 可能である。
<第 1 3実施例 >
図 2 3は本発明の第 1 3実施例を示し、 パルス探索位置のィ ンデック ス及びパルス番号の割り当てを行うパルス番号及びィ ンデックスの更新 手段を備えた、 パルス位置の探索範囲を適応符号べク トルのピッチ周期 及びビツチビーク位置によって決定する C E L P型音声符号化装置の符 号器側の音源生成部を示す。 より具体的には、 ピッチビーク位置からの 相対位置で音源パルス探索を行う C E L P型音声符号化装置において、 サブフレームの先頭側から順番にパルス位置のィ ンデックスを付けると ともに、 同じイ ンデックス番号である異なる番号のパルスに対しては、 サブフレームの先頭側から順番にパルスの番号を付ける、 即ち同じイン デックス番号の場合パルスの番号が若いほどサブフレームの先頭側にな
るように各パルスの番号を決めるようにすることによって、 あるフレー ムにおいて発生した伝送路誤りの影響が後続の伝送路誤りのないフレー ムに伝播することを防ぐようにした音源生成部を示す。
図 2 3において、 2 3 0 1は過去の励振音源べク トルを保存し、 選択 された適応符号べク トルをピッチビーク位置算出器 2 3 0 2及びピッチ ゲイ ン乗算器 2 3 0 6に出力する適応符号帳、 2 3 0 2は適応符号帳 2 3 0 1から出力された適応符号べク トルとピッチ周期 Lを入力としてビ ツチピーク位置を算出し、 探索位置算出器 2 3 0 3に出力するピッチピ ーク位置算出器、 2 3 0 3はピッチビーク位置算出器 2 3 0 2から出力 されたピッチビーク位置とピッチ周期 Lを入力としてパルス音源を探索 する範囲を算出し、 パルス番号及びィンデックスの更新手段 2 3 0 4へ 出力する探索位置算出器、 2 3 0 4は探索位置算出器 2 3 0 3から出力 された、 各音源パルスの番号と各音源パルスの各位置のィンデックスを 付け替えてパルス位置探索器 2 3 0 5に出力するパルス番号及びィンデ ックスの更新手段、 2 3 0 5はパルス番号及びインデックスの更新手段 2 3 0 4から出力された探索位置 (パルスの番号とパルス位置を表すィ ンデックスが付け直されている) と、 音源生成部の外部で別途算出され たピッチ周期 Lとを入力としてパルス音源を探索し、 パルス音源べク ト ルをパルス音源ゲイ ン乗算器 2 3 0 7に出力し、 符号化出力としてパル ス音源ベク トルを表すィンデックスを音源生成部の外部に出力するパル ス位置探索器、 2 3 0 6は適応符号帳 2 3 0 1から出力された適応符号 べク トルに適応符号べク トル利得を乗じて加算器 2 3 0 8に出力する乗 算器、 2 3 0 7はパルス位置探索器 2 3 0 5から出力されたパルス音源 べク トルにパルス音源べク トル利得を乗じて加算器 2 3 0 8に出力する 乗算器、 2 3 0 8は乗算器 2 3 0 6からの出力と乗算器 2 3 0 7からの 出力を入力とし、 べク トル加算して励振音源べク トルとして出力する加
算器である。
以上のように構成された、 音源生成部の動作について、 図 2 3及び図 2 4を用いて説明する。 図 2 3において、 適応符号帳 2 3 0 1は、 音源 生成部の外部で予め算出されるビツチ周期 Lだけ過去に溯った点から、 適応符号べク トルをサブフレーム長だけ切り出して、 適応符号べク トル として出力する。 ピッチ周期 Lがサブフレーム長に満たない場合は、 切 り出したビヅチ周期 Lのべク トルを、 サブフレーム長に達するまで繰り 返して接続したものを適応符号べク トルとして出力する。
ピヅチビーク位置算出器 2 3 0 2は、 適応符号帳 2 3 0 1から出力さ れた適応符号べク トルを用いて適応符号べク トル内に存在するピッチピ ークの位置を决定する。 ピッチビークの位置は、 ピッチ周期で並べたィ ンパルス列と適応符号べク トルとの正規化相互相関を最大化することに よって行うことができる。 また、 ピッチ周期で並べたイ ンパルス列を合 成フィル夕に通したものと、 適応符号べク トルを合成フィル夕に通した もとの誤差を最小化することによって、 より精度良く求めることも可能 である。
探索位置算出器 2 3 0 3は、 ピッチビーク位置を基準として音源パル スの探索位置を決定し、 パルス番号及びィ ンデックスの更新手段 2 3 0 4に出力する。 探索位置の決定法としては、 例えば第 6実施例や第 8実 施例に示したようにビツチビーク近傍は密にそれ以外の部分は疎に探索 位置が分布するように决定される。 なお、 第 6実施例や第 8実施例に示 したようにビッチ周期情報を用いて音源パルス数を変化させたり、 音源 パルスの探索範囲を限定したりすることを適用することも有効である。 探索位置算出器 2 3 0 3によって決定される具体的な探索位置の例は図 1 0、 図 1 1 ( b ) 、 図 1 1 ( c ) 、 図 1 3に示している。 例えば図 1 0においては、 ピッチパルス位置近傍は密に、 それ以外の部分は疎に、
パルス位置探索範囲を限定する方法を具体的に示している。 この限定方 法は、 パルスが立てられる確率が高い位置がビツチパルス近傍に集中す る統計的結果に基づいている。 パルス位置探索範囲を限定しない場合、 有声部においてはビツチパルス近傍にパルスが立てられる確率がその他 の部分に立てられる確率に比べて高くなる。 なお、 探索位置算出器で算 出されるのは、 ピッチビーク位置からの相対位置を用いた、 音源パルス の探索位置であり、 この時点では、 ピッチビーク位置を 0とする相対位 置の数値が小さいものから順にパルス番号及びインデックスがつけられ ている (図 2 4 ( b ) 参照) 。 なお図 2 4では、 パルス数を 4本とした 場合の図 1 1 ( b ) 、 図 1 3に対応する場合を示している。 図 2 4 ( a ) はパルス数を 4本とした場合に探索位置算出器 2 1 0 3によって決定さ れる音源パルス探索位置を示しており、 矢印の長短、 上向き下向は 4種 類の各音源パルス探索位置を示している。 また、 図 2 4 ( a ) の相対位 置はピツチビーク位置を 0として一 4から + 7 5の数値で各サンプル点 が表されており、 一 4より前の点はサブフ レーム境界より後ろにはみ出 す点を折り返すことにより十の数値で表現している。
パルス番号及びィンデックスの更新手段 2 3 0 4は、 ピッチビーク位 置からの相対位置が小さいものから順番にィンデックスがつけられてい る (図 2 4 ( b ) ) 音源パルス探索位置を、 サブフ レームの先頭を 0 と する絶対位置に変換した後に絶対位置が小さいものから順番にパルス番 号及びインデックスを付け直して (図 2 4 ( c ) ) 、 パルス位置探索器 2 3 0 5へ出力する。 このようにすることによって、 伝送路誤りが生じ るなどして符号器側と復号器側とで算出されるピッチビーク位置が異な つた場合において、 パルス位置のずれを小さくすることができる。
パルス位置探索器 2 3 0 5は、 パルス番号及びイ ンデックスの更新手 段 2 3 0 4によって各探索位置を示すィンデックの付け直しが行われた
音源パルス探索位置と、 別途入力されるピッチ周期 Lを用いて、 音源パ ルスを立てる位置の最適な組み合わせを決定する。 パルス探索の方法は 「 ITU-T Recommendation G.729 : Coding of Speech at 8 kbits/s usin g Conjugate-Structure Algebraic-Code-Exc ited L inear-Prediction ( CS-ACELP ) , March 1996」 に示されているように、 例えばパルス数が 4本の場合は第 6実施例で示した式 ( 2 ) を最大化するように i 0から
1 3の組み合わせを決定する。 なお、 この時の各音源パルスの極性は
、 雑音符号帳成分のターゲッ トベク トル、 即ち聴覚重みづけされた入力 音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分 の信号を減じた信号ベク トル、 の各位置における極性と等しくなるよう にパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅 に軽減できる。 また、 ピッチ周期がサブフ レーム長より短い場合には第 5実施例にも示したようにビヅチ周期化フ ィ ル夕をかけることによって、 音源パルスをィ ンパルスではなく ビッチ周期のパルス列になるようにし ている。 このようなピッチ周期化処理を行う場合は、 聴覚重みづけ合成 フィル夕のインパルス応答ベク トルにピッチ周期化フィルタを予めかけ ておけば、 ピッチ周期化を行わない場合と同様にして式 ( 2 ) の最大化 によって音源パルスの探索を行うことができる。 このようにして決定さ れた各音源パルスの位置に、 決定された各音源パルスの極性にしたがつ てパルスを立て、 ピッチ周期 Lを用いてピッチ周期化フィル夕をかけれ ば、 パルス音源ベク トルが生成される。 生成されたパルス音源ベク トル は乗算器 2 3 0 7に出力される。 パルス位置探索器 2 3 0 5から乗算器
2 3 0 7に出力されたパルス音源べク トルは、 外部のゲイン量子化器に よって量子化された量子化パルス音源べク トル利得が乗算されて加算器 2 3 0 8に出力される。 なお、 パルス位置探索器 2 3 0 5においては、 パルス音源べク トルとともにパルス音源べク トルを表す各音源パルスの
極性及びィンデックス情報が別途音源生成部の外部に出力される。 この 音源パルスの極性及びィ ンデックス情報は符号化器や多重化器などを通 つて伝送路へ出力されるデ一夕系列に変換されて伝送路へ送り出される 加算器 2 3 0 8は、 乗算器 2 3 0 6から出力された適応符号べク トル 成分と、 乗算器 2 3 0 7から出力されたパルス音源ベク トル.成分とのベ ク トル加算を行い、 励振音源べク トルとして出力する。
なお、 本実施例に基づくインデックスの割り当て方法は、 音源の位置 情報が相対的な値で表現される全ての場合に適用することが可能であり、 パルス番号とィ ンデックスの割り当てかたのみの違いであるので、 性能 に影響を及ぼさずに伝送路誤りの伝播を抑える効果を得ることができる c また、 固定探索位置のパルス音源との切り替え使用を行えば、 さらに伝 送路誤りの影響の伝播を抑えることも可能である。
なお、 復号器側も同様のパルス番号及びィンデックスの更新手段 2 3 0 4を備える。 また、 パルスの立て方としては、 定数本例えば 4本のパ ルスを探索範囲、 例えば 3 2箇所の位置のどこかに立てる場合において は、 前述のように 3 2箇所を 4つに分けて 1本のパルスを割り当てられ た 8箇所の中の 1箇所に决定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を探索する方法の他に、 3 2箇所の中から 4箇所を選びだす 組み合わせ全てについて探索する方法などがある。 なお、 振幅 1のイン パルスの組み合わせの他に、 複数本例えば 2本のパルスを組み合わせた パルス対の組み合わせや、 振幅の異なるィ ンパルスの組み合わせによる パルスの立て方も可能である。
<第 1 4実施例 >
図 2 5は本発明の第 1 4実施例を示し、 固定探索位置と位相適応型探 索位置との両者によって生成される音源パルス探索位置を用いてパルス
探索を行う C E L P型音声符号化装置の音源生成部を示す。
図 2 5において、 2 5 0 1は過去の励振音源べク トルを保存し、 選択 された適応符号べク トルをピッチビーク位置算出器 2 5 0 2及びピッチ ゲイン乗算器 2 5 0 6に出力する適応符号帳、 2 5 0 2は適応符号帳 2 5 0 1から出力された適応符号べク トルと外部から入力されるピッチ周 期 Lを入力としてピッチビーク位置を算出し、 探索位置算出器 2 5 0 3 に出力するピッチビーク位置算出器、 2 5 0 3はピッチビーク位置算出 器 2 5 0 2から出力されたピッチビーク位置と外部から入力されるビッ チ周期 Lを入力としてパルス音源を探索する位置を算出し、 加算器 2 5 0 4へ出力する探索位置算出器、 2 5 0 4は探索位置算出器 2 5 0 3か ら出力された、 ピッチピーク位置を 0 とする相対位置で表される探索位 置と固定位置で探索される探索位置とを合わせて (数値加算をするもの ではなく、 2種類の探索位置の集合の和を求める) パルス位置探索器 2 5 0 5に出力する加算器、 2 5 0 5は加算器 2 5 0 4から出力された探 索位置と、 音源生成部の外部で別途算出されたピッチ周期 Lとを入力と してパルス音源を探索し、 パルス音源べク トルをパルス音源ゲイン乗算 器 2 5 0 7に出力するパルス位置探索器、 2 5 0 6は適応符号帳 2 5 0 1から出力された適応符号べク トルに適応符号べク トル利得を乗じて加 算器 2 5 0 8に出力する乗算器、 2 5 0 7はパルス位置探索器 2 5 0 5 から出力されたパルス音源べク トルにパルス音源べク トル利得を乗じて 加算器 2 5 0 8に出力する乗算器、 2 5 0 8は乗算器 2 5 0 6からの出 力と乗算器 2 5 0 7からの出力を入力とし、 べク トル加算して励振音源 べク トルとして出力する加算器である。
以上のように構成された、 音源生成部の動作について、 図 2 5及び図 2 6を用いて説明する。 図 2 5において、 適応符号帳 2 5 0 1は、 音源 生成部の外部で予め算出されるピツチ周期 Lだけ過去に溯った点から、
適応符号べク トルをサブフレーム長だけ切り出して、 適応符号べク トル として出力する。 ピッチ周期 Lがサブフレーム長に満たない場合は、 切 り出したピッチ周期 Lのべク トルを、 サブフレーム長に達するまで繰り 返して接続したものを適応符号べク トルとして出力する。
ピッチビーク位置算出器 2 5 0 2は、 適応符号帳 2 5 0 1から出力さ れた適応符号べク トルを用いて適応符号べク トル内に存在するビッチビ ークの位置を決定する。 ピッチビークの位置は、 ピッチ周期で並べたィ ンパルス列と適応符号べク トルとの正規化相互相関を最大化することに よって行うことができる。 また、 ピッチ周期で並べたインパルス列を合 成フィル夕に通したものと、 適応符号べク トルを合成フィル夕に通した もとの誤差を最小化する (正規化相互相関関数を最大化する) ことによ つて、 より精度良く求めることも可能である。
探索位置算出器 2 5 0 3は、 ピッチピーク位置を基準として音源パル スの探索位置を決定し、 加算器 2 5 0 4に出力する。 探索位置の決定法 としては、 例えば図 2 6に示すようにピッチピーク近傍の固定探索位置 と重ならない点を出力するような決定法を用いる。 なお、 第 6実施例や 第 8実施例に示したようにピッチ周期情報を用いて音源パルス数を変化 させたり、 音源パルスの探索範囲を限定したりすることを適用する場合 も同様である。 探索位置算出器 2 5 0 3によって決定される具体的な探 索位置の例は図 2 6 ( b ) 、 2 6 ( c ) に示している。 図 2 6において は固定探索位置を奇数サンプル点に設定し (図 2 6 ( a ) ) , ピッチビ ーク近傍の偶数サンプル点に探索位置算出器 2 5 0 3が探索位置を設定 する様子 (図 2 6 ( b ) 、 2 6 ( c ) ) を示している。 図 2 6 ( b ) は ピッチピーク位置が偶数サンプル点にある (ピッチピーク位置が固定探 索位置に含まれない) 場合を、 図 2 6 ( c ) はピッチピーク位置が奇数 サンプル点にある (ピッチビーク位置が固定探索位置に含まれる) 場合
を、 それそれ示している。 図 2 6 ( b ) 、 2 6 ( c ) の比較から分かる ように、 ピッチビーク位置の場所によって若干探索位置 (ピッチビーク 位置を 0 とする相対位置) が異なる。
加算器 2 5 0 4は、 探索位置算出器 2 5 0 3から出力された音源パル ス探索位置の集合 (図 2 6 ( b ) 、 2 6 ( c ) ) と予め定められている 固定探索位置の集合 (図 2 6 ( a ) ) との和集合 (図 2 6 ( d ) ) を求 めて、 パルス位置探索器 2 5 0 5へ出力する。 このようにすることによ つてピッチビーク位置近傍は密に、 それ以外の部分は疎に、 音源パルス の探索位置を限定している。 この限定方法は、 パルスが立てられる確率 が高い位置がビツチパルス近傍に集中する統計的結果に基づいている。 パルス位置探索範囲を限定しない場合、 有声部においてはビツチパルス 近傍にパルスが立てられる確率がその他の部分に立てられる確率に比べ て高くなる。 なお、 伝送路誤り等の影響で復号器側におけるピッチピー ク位置の算出が誤った場合、 探索位置算出器 2 5 0 3で算出される音源 パルスの探索位置が符号器側と復号器側で異なってしまうが、 パルス位 置探索器 2 5 0 5に入力される音源パルス探索位置の一部は固定探索位 置になっているので、 符号器側と復号器側のパルス位置が異なってしま う確率を低くすることができ、 伝送路誤りの影響を緩和することができ る
パルス位置探索器 2 5 0 5は、 加算器 2 5 0 4から出力された音源パ ルス探索位置と、 別途入力されるピッチ周期 Lを用いて、 音源パルスを 立てる位置の最適な組み合わせを決定する。 パルス探索の方法は 「ITU - T Recommendat ion G. 729: Coding of Speech at 8 kb its/s us ing Conj ugate - Structure Algebraic -Code-Exc ited L inear-Prediction ( CS - AC ELP ) , March 1996」 に示されているように、 例えばパルス数が 4本の場 合は実施の形態 6で示した式 ( 2 ) を最大化するように i 0から i 3の
組み合わせを決定する。 なお、 この時の各音源パルスの極性は、 雑音符 号帳成分のターゲッ トべク トル、 即ち聴覚重みづけされた入力音声から 聴覚重みづけ合成フィル夕の零入力応答信号と適応符号帳成分の信号を 減じた信号べク トル、 の各位置における極性と等しくなるようにパルス 位置探索を行う前に予め決定すれば探索のための演算量を大幅に軽減で きる。 また、 ピッチ周期がサブフ レーム長より短い場合には第 5実施例 にも示したようにピッチ周期化フィル夕をかけることによって、 音源パ ルスをィンパルスではなく ピッチ周期のパルス列になるようにしている c このようなビッチ周期化処理を行う場合は、 聴覚重みづけ合成フィル夕 のィ ンパルス応答べク 卜ルにビヅチ周期化フィル夕を予めかけておけば、 ピッチ周期化を行わない場合と同様にして式 ( 2 ) の最大化によって音 源パルスの探索を行うことができる。 このようにして決定された各音源 パルスの位置に、 決定された各音源パルスの極性にしたがってパルスを 立て、 ピッチ周期 Lを用いてピッチ周期化フィル夕をかければ、 パルス 音源べク トルが生成される。 生成されたパルス音源べク トルは乗算器 2 5 0 7に出力される。 パルス位置探索器 2 5 0 5から乗算器 2 5 0 7に 出力されたパルス音源べク トルは、 外部のゲイン量子化器によって量子 化された量子化パルス音源べク トル利得が乗算されて加算器 2 5 0 8に 出力される。 なお図 2 5では省略しているが、 パルス位置探索器 2 5 0 5においては、 パルス音源ベク トルとともにパルス音源ベク トルを表す 各音源パルスの極性及びィンデックス情報が別途音源生成部の外部に出 力される。 この音源パルスの極性及びィンデックス情報は符号化器や多 重化器などを通って伝送路へ出力されるデータ系列に変換されて伝送路 へ送り出される。
加算器 2 5 0 8は、 乗算器 2 5 0 6から出力された適応符号べク トル 成分と、 乗算器 2 5 0 7から出力されたパルス音源べク トル成分とのベ
ク トル加算を行い、 励振音源ベク トルとして出力する。
なお、 固定探索位置のパルス音源との切り替え使用を行えば、 さらに 伝送路誤りの影響の伝播を抑えることも可能である。
また、 パルスの立て方としては、 定数本例えば 4本のパルスを探索範 囲、 例えば 3 2箇所の位置のどこかに立てる場合においては、 前述のよ うに 3 2箇所を 4つに分けて 1本のパルスを割り当てられた 8箇所の中 の 1箇所に决定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を 探索する方法の他に、 3 2箇所の中から 4箇所を選びだす組み合わせ全 てについて探索する方法などがある。 なお、 振幅 1のイ ンパルスの組み わせの他に、 複数本例えば 2本のパルスを組み合わせたパルス対の組 み合わせや、 振幅の異なるィンパルスの組み合わせによるパルスの立て 方も可能である。
<第 1 5実施例〉
図 2 7は本発明の第 1 5実施例を示し、 ピッチビーク位置補正器を備 えた第 5実施例記載の C E L P型音声符号化装置の音源生成部を示して いる。
図 2 7において、 2 7 0 1は過去の励振音源べク トルを保存し、 選択 された適応符号べク トルをピッチビーク位置算出器 2 7 0 2及びピッチ ピーク位置補正器 2 7 0 3及びピッチゲイ ン乗算器 2 7 0 6に出力する 適応符号帳、 2 7 0 2は適応符号帳 2 7 0 1から出力された適応符号べ ク トルと外部から入力されるピッチ周期 Lを入力としてピッチピーク位 置を算出し、 ピッチビーク位置補正器 2 7 0 3に出力するピッチピーク 位置算出器、 2 7 0 3は適応符号帳 2 7 0 1から出力される適応符号べ ク トルとピッチビーク位置算出器 2 7 0 2から出力されたピッチピーク 位置と外部から入力されるピッチ周期 Lを入力としてピッチピーク位置
を補正し、 探索位置算出器 2 7 0 4へ出力するピッチピーク位置補正器、 2 7 0 4はピッチピーク位置補正器 2 7 0 3から出力されたピッチピー ク位置と別途入力されるピッチ周期 Lとを入力として、 音源パルスの探 索位置をパルス位置探索器 2 7 0 5に出力する探索位置算出器、 2 7 0 5は探索位置算出器 2 7 0 4から出力された探索位置と、 音源生成部の 外部で別途算出されたビッチ周期 Lとを入力としてパルス音源を探索し、 パルス音源べク トルをパルス音源ゲイ ン乗算器 2 7 0 7に出力するパル ス位置探索器、 2 7 0 6は適応符号帳 2 7 0 1から出力された適応符号 べク トルに適応符号べク トル利得を乗じて加算器 2 7 0 8に出力する乗 算器、 2 7 0 7はパルス位置探索器 2 7 0 5から出力されたパルス音源 べク トルにパルス音源べク トル利得を乗じて加算器 2 7 0 8に出力する 乗算器、 2 7 0 8は乗算器 2 7 0 6からの出力と乗算器 2 7 0 7からの 出力を入力とし、 べク トル加算して励振音源べク トルとして出力する加 算器である。
以上のように構成された、 音源生成部の動作について、 図 2 7及び図 2 8を用いて説明する。 図 2 7において、 適応符号帳 2 7 0 1は、 音源 生成部の外部で予め算出されるビツチ周期 Lだけ過去に溯った点から、 適応符号べク トルをサブフレーム長だけ切り出して、 適応符^べク トル として出力する。 ピッチ周期 Lがサブフ レーム長に満たない場合は、 切 り出したピッチ周期 Lのベク トルを、 サブフ レーム長に達するまで繰り 返して接続したものを適応符号べク トルとして出力する。
ピッチビーク位置算出器 2 7 0 2は、 適応符号帳 2 7 0 1から出力さ れた適応符号べク トルを用いて適応符号べク トル内に存在するビッチビ —クの位置を決定する。 ピッチビークの位置は、 ピッチ周期で並べたィ ンパルス列と適応符号べク トルとの正規化相互相関を最大化することに よって行うことができる。 また、 ピッチ周期で並べたイ ンパルス列を合
成フ ィ ル夕に通したものと、 適応符号べク トルを合成フィル夕に通した もとの誤差を最小化する (正規化相互相関関数を最大化する) ことによ つて、 より精度良く求めることも可能である。
ピッチビーク位置補正器 2 7 0 3は、 適応符号帳 2 7 0 1から出力さ れた適応符号ベク トルから、 ピッチビーク位置算出器 2 7 0 2によって 算出されたピッチビーク位置の点を含む 1 ピッチ周期長 Lの長さをもつ ベク トルを切り出し、 この切り出した波形の中から振幅値が最大となる 点を探し出して探索位置算出器 2 7 0 4に出力する。 なお、 この処理は ピッチ周期 Lがサブフレーム長よ りも短い場合についてのみ行われる。 ピッチ周期 Lがサブフ レーム長より長い場合はピッチビーク位置算出器 2 7 0 2が出力したピッチピーク位置をそのままパルス位置探索器 2 7 0 5に出力する。 ピッチピーク位置算出器 2 7 0 2から出力されるピッ チビーク位置は、 1サブフ レーム長が 1ピッチ周期程度の長さに相当す る場合、 1ビツチ波形内の 2番目に振幅が高い場所になっている可能性が ある (図 2 8 ( a ) 、 2 8 ( b ) : ピッチビークは 1サブフレーム内 に 1個所しか存在しないが、 1 ピツチ周期波形内で 2番目に大きい振幅 値を有する点 (セカン ドビーク) が 1サブフレーム内に 2個所存在する ために、 セカン ドピークをピッチビークと誤検出してしまう) 。 このた め、 ピッチピーク位置補正器 2 7 0 3により、 ピッチピーク位置算出器 2 7 0 2から出力されたピッチピーク位置から 1ピッチ周期長以内に よ り大きい振幅値を有する点が存在しないかチェックし、 ピッチビーク ,'立 置算出器 2 7 0 2から出力されたピッチピーク位置付近の点の振幅値よ り大きい振幅値を有する点が存在する場合は、 その大きい振幅値を有す る点の方をピッチビーク位置とする。 例えば図 2 8 ( c ) においてセカ ン ドビークをピッチビーク位置算出器 2 7 0 2が出力した場合は、 この セカン ドピークから 1 ビツチ周期分の適応符号べク トル (図 2 8 ( c )
の太線部) の中で振幅が最大となる位置をピッチピークとする。
探索位置算出器 2 7 0 4は、 ピッチビーク位置補正器 2 7 0 3から出 力されたピッチピーク位置を基準として音源パルスの探索位置を决定し、 パルス位置探索器 2 7 0 5に出力する。 探索位置の決定法としては、 第 5実施例又は第 6実施例又は第 1 4実施例などのように、 ピッチビーク 位置近傍は密に、 それ以外の部分は疎に、 音源パルスの探索位置を限定 する方法がある。 この限定方法は、 パルスが立てられる確率が高い位置 がビツチパルス近傍に集中する統計的結果に基づいている。 パルス位置 探索範囲を限定しない場合、 有声部においてはビツチパルス近傍にパル スが立てられる確率がその他の部分に立てられる確率に比べて高くなる ことを利用するものである。
パルス位置探索器 2 7 0 5は、 探索位置算出器 2 7 0 4から出力され た音源パルス探索位置と、 別途入力されるピッチ周期 Lを用いて、 音源 パルスを立てる位置の最適な組み合わせを決定する。 パルス探索の方法 は r I TU-T Recommendat ion G. 729 : Coding of Speechat 8 kbits/s usi ng Con jugate- Structure Algebraic-Code-Exc i ted Linear-Predi ct ion ( CS-ACELP ) , March 1996」 に示されているように、 例えばパルス数が 4 本の場合は第 6実施例で示した式 ( 2 ) を最大化するように i 0から i 3の組み合わせを決定する。 なお、 この時の各音源パルスの極性は、 雑 音符号帳成分のターゲッ トベク トル、 すなわち聴覚重みづけされた入力 音声から聴覚重みづけ合成フィル夕の零入力応答信号と適応符号帳成分 の信号を減じた信号べク トル、 の各位置における極性と等しくなるよう にパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅 に軽減できる。 また、 ピッチ周期がサブフレーム長より短い場合には実 施の形態 5にも示したようにビッチ周期化フィル夕をかけることによつ て、 音源パルスをインパルスではなく ビツチ周期のパルス列になるよう
にしている。 このようなピッチ周期化処理を行う場合は、 聴覚重みづけ 合成フィル夕のィ ンパルス応答べク 卜ルにピツチ周期化フィル夕を予め かけておけば、 ピッチ周期化を行わない場合と同様にして式 ( 2 ) の最 大化によって音源パルスの探索を行うことができる。 このようにして決 定された各音源パルスの位置に、 決定された各音源パルスの極性に従つ てパルスを立て、 ピッチ周期 Lを用いてピッチ周期化フィル夕をかけれ ば、 パルス音源ベク トルが生成される。 生成されたパルス音源ベク トル は乗算器 2 7 0 7に出力される。 パルス位置探索器 2 7 0 5から乗算器 2 7 0 7に出力されたパルス音源べク トルは、 外部のゲイン量子化器に よって量子化された量子化パルス音源べク トル利得が乗算されて加算器 2 7 0 8に出力される。 なお図 2 7では省略しているが、 符号器のパル ス位置探索器 2 7 0 5においては、 パルス音源べク トルとともにパルス 音源べク トルを表す各音源パルスの極性及びィ ンデックス倩報が別途音 源生成部の外部に出力される。 この音源パルスの極性及びィ ンデックス 情報は符号化器や多重化器などを通って伝送路へ出力されるデ一夕系列 に変換されて伝送路へ送り出される。
加算器 2 7 0 8は、 乗算器 2 7 0 6から出力された適応符号べク トル 成分と、 乗算器 2 7 0 7から出力されたパルス音源べク トル成分とのベ ク トル加算を行い、 励振音源ベク トルとして出力する。
なお、 本実施例おいて、 第 1 2実施例又は第 1 3実施例又は第 1 4実 施例のようにィ ンデックス更新手段又はパルス番号及びィ ンデックスの 更新手段又は固定探索位置と位相適応探索位置の併用を取り入れれば、 伝送路誤りの影響を緩和することができる。 また、 固定探索位置のパル ス音源との切り替え使用を行えば、 さらに伝送路誤りの影響の伝播を抑 えることも可能である。
また、 本発明のピッチピーク位置補正器は、 第 3実施例から第 1 1実
施例までのいずれの音声符号化装置にも適用することが可能である。 なお、 パルスの立て方としては、 定数本例えば 4本のパルスを探索範 囲、 例えば 3 2箇所の位置のどこかに立てる場合においては、 前述のよ うに 3 2箇所を 4つに分けて 1本のパルスを割り当てられた 8箇所の中 の 1箇所に決定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を 探索する方法の他に、 3 2箇所の中から 4箇所を選びだす組み合わせ全 てについて探索する方法などがある。 なお、 振幅 1のイ ンパルスの組み 合わせの他に、 複数本例えば 2本のパルスを組み合わせたパルス対の組 み合わせや、 振幅の異なるィ ンパルスの組み合わせによるパルスの立て 方も可能である。
<第 1 6実施例 >
図 2 9は本発明の第 1 6実施例を示し、 連続するサブフレーム間の音 源信号波形の位相の連続性を利用して、 ピッチピーク位置の存在範囲を ピッチビーク位置算出前に予め限定する C E L P型音声符号化装置の音 源生成部を示す。 図 2 9において、 2 9 0 1は適応符号べク トルをビッ チビ一ク位置算出器 2 9 0 2 と乗算器 2 9 0 8に出力する適応符号帳、 2 9 0 2は適応符号帳 2 9 0 1から出力された適応符号べク トルと音声 生成部の外部から入力されるビツチ周期 Lとピツチピーク探索範囲限定 器 2 9 0 3から出力されるピッチビーク探索範囲を入力として、 適応符 号べク トル内のピッチビーク位置を算出して遅延器 2 9 0 4 と探索位置 算出器 2 9 0 6 とに出力するビツチビーク位置算出器、 2 9 0 3は遅延 器 2 9 0 4から出力された直前のサブフ レームにおけるピッチピーク位 置と遅延器 2 9 0 5から出力された直前のサブフ レームにおけるピッチ 周期と音源生成部の外部から入力される現在のサブフレームにおけるビ ツチ周期 Lとを入力として、 現在のサブフレームにおけるピッチビーク
位置を予測し、 予測したピッチビーク位置に基づいてビツチビーク位置 を探索する範囲を限定して、 その範囲をピッチピーク位置算出器 2 9 0 2に出力するピッチビーク探索範囲限定器、 遅延器 2 9 0 4はビッチビ —ク位置算出器から出力されたピッチビーク位置を入力として、 1サブ フレーム分遅延させてピツチピーク探索範囲限定器 2 9 0 3に出力する 遅延器、 2 9 0 5は音声生成部の外部から入力されるピッチ周期 Lを入 力として、 1サブフレーム分遅延させてピッチピーク探索範囲限定器 2 9 0 3に出力する遅延器、 2 9 0 6はピッチビーク位置算出器 2 9 0 2 から出力されたピッチピーク位置と音源生成部の外部から入力されるピ ツチ周期 Lとを入力として、 音源パルスの探索位置をパルス位置探索器 2 9 0 7に出力する探索位置算出器、 2 9 0 7は探索位置算出器 2 9 0 6から入力される音源パルスの探索位置と音源生成部の外部から入力さ れるビツチ周期 Lとを入力とし、 入力された音源パルス探索位置とビッ チ周期 Lを用いて音源パルスの位置を探索し、 パルス音源べク トルを乗 算器 2 9 0 9に出力するパルス位置探索器、 2 9 0 8は適応符号帳から 出力された適応符号べク トルを入力として量子化適応符号べク トル利得 を乗じて加算器 2 9 1 0に出力する乗算器、 2 9 0 9はパルス位置探索 器 2 9 0 7から出力されるパルス音源べク トルを入力として量子化パル ス音源べク トル利得を乗じて加算器 2 9 1 0に出力する乗算器、 2 9 1 0は乗算器 2 9 0 8及び 2 9 0 9から出力されたべク トルをそれそれ入 力とし、 入力されたベク トルの加算を行い、 励振音源ベク トルとして出 力する加算器である。
以上のように構成された音声符号化装置の音源生成部について、 図 2 9を用いてその動作を説明する。 適応符号帳 2 9 0 1は、 過去の励振音 源のバッファにより構成され、 外部のピッチ分析又は適応符号帳探索手 段によって求められたピッチ周期又はピッチラグに基づいて励振音源の
バッファから該当する部分を取り出し、 適応符号べク トルとしてピッチ ピーク位置算出器 2 9 0 2及び乗算器 2 9 0 8に出力する。 適応符号帳 2 9 0 1から乗算器 2 9 0 8に出力された適応符号べク トルは、 外部の ゲイ ン量子化器によって量子化された量子化適応符号べク トル利得が乗 算されて加算器 2 9 1 0に出力される。
ピッチビーク位置算出器 2 9 0 2は、 適応符号べク トルからピヅチビ ークを検出し、 その位置を遅延器 2 9 0 4と探索位置算出器 2 9 0 6の それそれに出力する。 ピッチビーク位置の検出 (算出) は、 ピッチ周期 Lで並べたィ ンパルス列べク トルと適応符号べク トルの正規化相互相関 関数を最大化することによって行うことができる。 また、 ピッチ周期 L で並べたィンパルス列べク トルに合成フィル夕のィ ンパルス応答を畳み 込んだべク トルと、 適応符号べク トルに合成フィル夕のィ ンパルス応答 を畳み込んだべク トルとの正規化相互相関関数を最大化することによつ て、 よ り精度良く ピッチビーク位置の検出を行うことも可能である。 さ らに、 検出されたピッチビーク位置を含む 1 ピッチ周期波形の中から振 幅値最大となる位置をビツチビークとする後処理を加えれば、 1 ピッチ 周期波形内のセカン ドピークを誤検出することを回避することも可能で める。
遅延器 2 9 0 4は、 ピッチピーク位置算出器 2 9 0 2で算出されたピ ツチピーク位置を 1サブフレーム分だけ遅延させてビツチピーク探索範 囲限定器 2 9 0 3に出力する。 即ち、 ピッチピーク探索範囲限定器 2 9 0 3には直前のサブフレームにおけるピツチビーク位置が遅延器 2 9 0 4から入力される。 遅延器 2 9 0 5は、 音源生成部の外部から入力され るピッチ周期 Lを 1サブフ レーム分だけ遅延させてピッチピーク探索範 囲限定器 2 9 0 3に出力する。 即ち、 ピッチビーク探索範囲限定器 2 9 0 3には直前のサブフレームにおけるピッチ周期が遅延器 2 9 0 5から
入力される。
ピッチビーク探索範囲限定器 2 9 0 3は、 まず始めに遅延器 2 9 0 5 から入力される直前のサブフ レームにおけるピッチ周期と現在のサブフ レームにおけるビッチ周期の比較を行い、 現在のサブフレームが有声 (定常) 部であるかどうかの判定を行う。 具体的には、 直前のサブフ レ ームにおけるピッチ周期と現在のサブフレームにおけるピッチ周期との 差が小さい場合 (例えば ± 5サンブル以内のとき) に有声 (定常) 部で あると判定する。 なお、 遅延器を増やして数サブフ レーム前までのピッ チ周期を用いて有声判定を行うこともできる。 有声 (定常) 部であると 判定されると、 ピッチビーク探索範囲限定器 2 9 0 3は、 遅延器 2 9 0 4から入力される直前のサブフ レームにおけるピッチビーク位置と、 遅 延器 2 9 0 5から入力される直前のサブフ レームにおけるピッチ周期と、 現在のサブフ レームにおけるピッチ周期 Lを入力として、 現在のサブフ レームにおけるピッチピーク位置を予測し、 その予測位置の前後 (例え ば 1 0サンプル) をピッチピーク位置の探索を行う範囲とする。 なお、 予測したピッチビーク位置がサブフレーム先頭付近にある場合は、 1 ビ ツチ周期後ろの付近も探索範囲に加え、 予測したピッチビーク位置がサ ブフレームの先頭から 1 ビツチ周期後ろの位置の付近にある場合は、 サ ブフ レーム先頭付近も探索範囲に加える。 なお、 有声 (定常) 部でない と判定された場合は、 ピッチピーク探索範囲の限定は行わずに、 サブフ レーム全体をピツチビーク探索範囲とする。 このようにしてピッチビー ク探索範囲限定器 2 9 0 3で求められたピッチビーク探索範囲は、 ビッ チピーク位置算出器 2 9 0 2に出力される。 なお、 音声符号化処理を開 始した時点 (最初のサブフ レーム) においては、 過去に入力された (直 前のサブフレームにおける) ピッチ周期 Lが存在しないため、 適当な定 数 (例えばピッチ周期の最大値や最小値あるいは 0など有り得ないビッ
チ周期) を遅延器 2 9 0 5が出力するようにしておく。 遅延器 2 9 0 4 についても同様である。 なお、 予測ピッチビーク位置は第 1 0実施例に 示される ( 6 ) 式によって求められる (図 1 9参照) 。
探索位置算出器 2 9 0 6は、 ピッチビーク位置を基準として音源パル スの探索位置を決定し、 探索位置をパルス位置探索器 2 9 0 7に出力す る。 探索位置の決定法としては、 例えば第 6実施例や第 8実施例に示し たようにビツチピーク近傍は密にそれ以外の部分は疎に探索位置が分布 するように決定される。 なお、 第 6実施例や第 8実施例に示したように ビツチ周期情報を用いて音源パルス数を変化させたり、 音源パルスの探 索範囲を限定したりすることを適用することも有効である。 また、 第 1 2実施例から第 1 4実施例のいずれかに示したように探索位置を决定す れば、 伝送路誤りの影響を緩和することも可能である。
パルス位置探索器 2 9 0 7は、 探索位置算出器 2 9 0 6で決定された 音源パルス探索位置又は予め決められている固定探索位置と、 別途入力 されるピッチ周期 Lを用いて、 音源パルスを立てる位置の最適な組み合 わせを決定する。 パルス探索の方法は 「ITU- T Recommendat ion G .729 : Cod ing or Speech at 8 kbi ts/s us ing Con jugate- Structure Algebrai c- Code-Exci ted L inear-Predict ion ( CS-ACELP ) , March 1996 」 に示さ れているように、 例えばパルス数が 4本の場合は第 6実施例で示した式 ( 2 ) を最大化するように i 0から i 3の組み合わせを決定する。 なお、 この時の各音源パルスの極性は、 雑音符号帳成分の夕一ゲッ トべク トル、 即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィル夕の零入 力応答信号と適応符号帳成分の信号を減じた信号べク トル、 の各位置に おける極性と等しくなるようにパルス位置探索を行う前に予め決定して いる。 また、 ピッチ周期がサブフ レーム長よ り短い場合には第 5実施例 にも示したようにピッチ周期化フィル夕をかけることによって、 音源パ
ルスをィンパルスではなく ピッチ周期のパルス列になるようにしている。 このようなピッチ周期化処理を行う場合は、 聴覚重みづけ合成フィル夕 のィ ンパルス応答べク トルにビッチ周期化フィル夕を予めかけておけば、 ピッチ周期化を行わない場合と同様にして式 ( 2 ) の最大化によって音 源パルスの探索を行うことができる。 このようにして決定された各音源 パルスの位置に、 決定された各音源パルスの極性にしたがってパルスを 立て、 ピッチ周期 Lを用いてピッチ周期化フィルタをかければ、 パルス 音源べク トルが生成される。 生成されたパルス音源べク トルは乗算器 2 9 0 9に出力される。 パルス位置探索器 2 9 0 7から乗算器 2 9 0 9に 出力されたパルス音源ベク トルは、 外部のゲイ ン量子化器によって!:子 化された量子化パルス音源べク トル利得が乗算されて加算器 2 9 1 0に 出力される。
加算器 2 9 1 0は、 乗算器 2 9 0 8から出力された適応符号べク トル 成分と、 乗算器 2 9 0 9から出力されたパルス音源べク トル成分とのベ ク トル加算を行い、 励振音源ベク トルとして出力する。
なお、 パルスの立て方としては、 定数本例えば 4本のパルスを探索範 囲、 例えば 3 2箇所の位置のどこかに立てる場合においては、 前述のよ うに 3 2箇所を 4つに分けて 1本のパルスを割り当てられた 8箇所の中 の 1箇所に决定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を 探索する方法の他に、 3 2箇所の中から 4箇所を選びだす組み合わせ全 てについて探索する方法などがある。 なお、 振幅 1のイ ンパルスの組み 合わせの他に、 複数本例えば 2本のパルスを組み合わせたパルス対の組 み合わせや、 振幅の異なるィンパルスの組み合わせによるパルスの立て 方も可能である。
<第 1 7実施例 >
図 3 0は本発明の第 1 7実施例を示し、 パルス本数が少なくて各パル スに割り当てられている位置情報が十分である固定探索位置を用いたパ ルス探索器と、 パルス本数が多くて各パルスに割り 当てられている位置 情報が必ずしも十分でない音源パルス探索位置を用いたパルス探索器と、 これら複数のパルス探索器から出力されたパルス音源べク トルの中から 最適なパルス音源べク トルを選択する選択器とを備えた C E L P型音声 符号化装置の音源生成部を示している。
図 3 0において、 3 0 0 1は過去の励振音源べク トルを保存し、 選択 された適応符号べク トルをピッチビーク位置算出器 3 0 0 2及びピッチ ゲイ ン乗算器 3 0 0 7に出力する適応符号帳、 3 0 0 2は適応符号帳 3 0 0 1から出力された適応符号べク トルと外部から入力されるピッチ周 期 Lを入力としてピッチピーク位置を算出し、 探索位置算出器 3 0 0 3 に出力するピッチビーク位置算出器、 3 0 0 3はピッチビーク位置算出 器 3 0 0 2から出力されたピッチビーク位置と音源生成部の外部から入 力されるピッチ周期 Lとを入力として、 音源パルスの探索位置をパルス 位置探索器 3 0 0 4に出力する探索位置算出器、 3 0 0 4は探索位置算 出器 3 0 0 3から出力された探索位置と、 音源生成部の外部で別途算出 されたピッチ周期 Lとを入力としてパルス音源を探索し、 パルス音源べ ク トル 1 を選択器 3 0 0 5に出力するパルス位置探索器、 8 0 0 5はパ ルス位置探索器 3 0 0 4から出力されるパルス音源べク トル 1 とパルス 位置探索器 3 0 0 6から出力されるパルス音源ベク トル 2 とを入力とし、 最適であるパルス音源べク トルを選択して乗算器 3 0 0 8に出力する選 択器、 3 0 0 6は予め定められた固定探索位置と音源生成部の外部から 入力されるピッチ周期 Lとを入力としてパルス音源を探索し、 パルス音 源ベク トル 2 と して選択器 3 0 0 5へ出力するパルス位置探索器、 3 0 0 7は適応符号帳 3 0 0 1から出力された適応符号べク トルに適応符号
べク トル利得を乗じて加算器 3 0 0 9に出力する乗算器、 3 0 0 8は選 択器 3 0 0 5から出力されたパルス音源べク トルにパルス音源べク トル 利得を乗じて加算器 3 0 0 9に出力する乗算器、 3 0 0 9は乗算器 3 0 0 7からの出力と乗算器 3 0 0 8からの出力を入力とし、 ベク トル加算 して励振音源ベク トルとして出力する加算器である。
以上のよう に構成された、 音源生成部の動作について、 図 3 0を用い て説明する。 図 3 0において、 適応符号帳 3 0 0 1は、 音源生成部の外 部で予め算出されるピッチ周期 Lだけ過去に溯った点から、 適応符号べ ク トルをサブフ レーム長だけ切り出して、 適応符号べク トルとして出力 する。 ピッチ周期 Lがサブフレーム長に満たない場合は、 切り出したピ ツチ周期 Lのべク トルを、 サブフ レーム長に達するまで繰り返して接続 したものを適応符号べク トルとして出力する。
ピッチビーク位置算出器 3 0 0 2は、 適応符号帳 3 0 0 1から出力さ れた適応符号べク トルを用いて適応符号べク トル内に存在するビッチビ —クの位置を決定する。 ピッチビークの位置は、 ピッチ周期で並べたィ ンパルス列と適応符号べク トルとの正規化相互相関を最大化することに よって行うことができる。 また、 ピッチ周期で並べたイ ンパルス列を合 成フ ィル夕に通したものと、 適応符号べク トルを合成フ ィルタに通した もとの誤差を最小化する (正規化相互相関関数を最大化する) ことによ つて、 より精度良く求めることも可能である。 なお、 第 1 5実施例に示 したようなピッチビーク補正器を備えるとピッチビーク位置の算出誤り を減らすことができる。
探索位置算出器 3 0 0 3は、 ピッチビーク位置算出器 3 0 0 2から出 力されたピッチピーク位置を基準として音源パルスの探索位置を決定し、 パルス位置探索器 3 0 0 4に出力する。 探索位置の決定法と しては、 第
5実施例又は第 6実施例又は第 1 4実施例などのように、 ピッチビーク
位置近傍は密に、 それ以外の部分は疎に、 音源パルスの探索位置を限定 する方法がある。 この限定方法は、 パルスが立てられる確率が高い位置 がビツチパルス近傍に集中する統計的結果に基づいている。 パルス位置 探索範囲を限定しない場合、 有声部においてはビツチパルス近傍にパル スが立てられる確率がその他の部分に立てられる確率に比べて高くなる ことを利用するものである。 なお、 第 1 2実施例から第 1 4実施例のい ずれかに示すような音源パルス探索位置の決定法を用いれば、 伝送路誤 りの影響を緩和することも可能である。
パルス位置探索器 3 0 0 4は、 探索位置算出器 3 0 0 3から出力され た音源パルス探索位置と、 別途入力されるピッチ周期 Lを用いて、 音源 パルスを立てる位置の最適な組み合わせを决定する。 パルス探索の方法 は 「I TU - T Recommendat ion G. 729 : Coding of Speechat 8 kbi ts/s usi ng Con jugate- Structure Algebraic -Code-Exci ted Linear-Predict ion ( CS-ACELP ) , March 1996」 に示されているように、 例えばパルス数が 4 本の場合は第 6実施例で示した式 ( 2 ) を最大化するように i 0から i 3の組み合わせを決定する。 なお、 この時の各音源パルスの極性は、 雑 音符号帳成分の夕一ゲッ トべク トル、 即ち聴覚重みづけされた人力音声 から聴覚重みづけ合成フィル夕の零入力応答信号と適応符号帳成分の信 号を減じた信号べク トル、 の各位置における極性と等しくなるようにパ ルス位置探索を行う前に予め决定すれば探索のための演算量を大幅に軽 減できる。 また、 ピッチ周期がサブフ レーム長より短い場合には第 5実 施例にも示したようにピッチ周期化フ ィ ル夕をかけることによって、 音 源パルスをインパルスではなく ピッチ周期のパルス列になるようにして いる。 このようなピッチ周期化処理を行う場合は、 聴覚重みづけ合成フ ィル夕のィ ンパルス応答べク トルにピッチ周期化フィル夕を予めかけて おけば、 ピッチ周期化を行わない場合と同様にして式 ( 2 ) の最大化に
よって音源パルスの探索を行うことができる。 このようにして決定され た各音源パルスの位置に、 決定された各音源パルスの極性に従ってパル スを立て、 ピッチ周期 Lを用いてピッチ周期化フィル夕をかければ、 Λ ルス音源べク トルが生成される。 生成されたパルス音源べク トルはパル ス音源ベク トル 1 として選択器 3 0 0 5に出力される。 なお、 パルス位 置探索器 3 0 0 4に用いられる音源パルス探索位置は、 音源パルス数を 多く しているので各音源パルスに割り振られる位置情報は必ずしも十分 でないものである。 すなわち、 パルス位置探索器 3 0 0 4を使用するモ ードは、 パルス数は多いが各パルスの位置を必ずしも厳密に表すことは できないモードである。 このような各パルスの位置情報が不足している 場合は、 探索位置算出器 3 0 0 3で行われるようなパルス探索位置の決 定法を用いることの効果を得ることができる。
パルス位置探索器 3 0 0 6は、 予め定められた固定探索位置と音源生 成部の外部から別途入力されるピッチ周期 Lを用いて、 音源パルスを立 てる位置の最適な組み合わせを決定する。 パルス探索の方法は 「I TU- T Recommendat ion G . 729 : Cod ing of Speech at 8 kb its/ s us ing Conjug ate - Structure A lgebrai c -Code- Exc ited L inear-Pred ic t ion ( CS-ACELP ) ; March 1996」 に示されているように、 例えばパルス数が 4本の場合は第 6実施例で示した式 ( 2 ) を最大化するように i 0から i 3の組み合わ せを決定する。 なお、 この時の各音源パルスの極性は、 雑音符号帳成分 の夕—ゲッ 卜べク トル、 即ち聴覚重みづけされた入力音声から聴覚重み づけ合成フィル夕の零入力応答信号と適応符号帳成分の信号を減じた信 号べク トル、 の各位置における極性と等しくなるようにパルス位置探索 を行う前に予め決定すれば探索のための演算量を大幅に軽減できる。 ま た、 ピッチ周期がサブフ レーム長より短い場合には第 5実施例にも示し たようにピッチ周期化フィル夕をかけることによって、 音源パルスをィ
ンパルスではなく ピッチ周期のパルス列になるようにしている。 このよ うなピッチ周期化処理を行う場合は聴覚重みづけ合成フィル夕のィンパ ルス応答べク トルにビッチ周期化フィル夕を予めかけておけば、 ピッチ 周期化を行わない場合と同様にして式 ( 2 ) の最大化によって音源パル スの探索を行うことができる。 このようにして決定された各音源パルス の位置に、 決定された各音源パルスの極性にしたがってパルスを立て、 ピッチ周期 Lを用いてピッチ周期化フィル夕をかければ、 パルス音源べ ク トルが生成される。 生成されたパルス音源ベク トルは、 パルス音源べ ク トル 2 として選択器 3 0 0 5に出力される。 ここで、 パルス位置探索 器 3 0 0 6に入力される固定探索位置は、 各音-源パルスに割り当てられ る位置情報が十分になるように (具体的にはサブフレーム内の全ての点 がこの固定探索位置のパターンに含まれるように) 音源パルスの数を絞 り込んだものでなければならない。 パルス数を減ら して、 その分パルス を立てる位置を正確に表せるようにすることによって、 有声立ち上がり 部分などにおける合成音声品質を向上することが可能となる。 また、 こ のような位置情報が十分であるモードを設けることによって、 位置情報 が不足するモ一 ドのみを使用した場合に生じる劣化を回避することも可 能となる。
なお、 図 3 0においてはパルス位置探索器は 2種類の場合を示してい るが、 3種類以上に増やして入力信号の特徴に応じた切り替えを行うこ とも可能である。 また、 パルス位置探索器 3 0 0 4に入力する音源パル ス探索位置を、 探索位置算出器 3 0 0 3から出力されたものの代わりに、 予め定められている固定探索位置とする構成であつても、 各パルスに割 り当てられる位置情報が十分である少ないパルス数のモードを備える構 成は、 有声立ち上がり部分などにおける合成音声品質を向上する効果や 位置情報が不足するモー ドのみを使用した場合に生じる合成音声品質の
劣化を回避する効果が得られる。 しかし、 探索位置算出器 3 0 0 3によ つて決定される音源パルス探索位置を用いてパルス位置探索器 3 0 0 4 がパルス位置探索を行う方が、 ビヅチピーク付近に音源パルスが立てら れやすい特徴を有する有声部分においては、 パルス数の多いモードの利 用効率を上げることができる。
選択器 3 0 0 5は、 パルス位置探索器 3 0 0 4から出力されたパルス 音源べク トル 1 とパルス位置探索器 3 0 0 6から出力されたパルス音源 べク トル 2 とを比較し、 合成音声の歪みが小さくなる方を最適パルス音 源べク トルとして乗算器 3 0 0 8に出力する。 選択器 3 0 0 5から乗算 器 3 0 0 8に出力されたパルス音源ベク トルは、 外部のゲイ ン量子化器 によって量子化された量子化パルス音源べク トル利得が乗算されて加算 器 3 0 0 9に出力される。 なお図 3 0では省略しているが、 符号器のパ ルス位置探索器 3 0 0 4及び 3 0 0 6においては、 パルス音源べク 卜ル 1、 2 とともに各パルス音源べク トルを表す各音源パルスの極性及びィ ンデックス情報が別途選択器 3 0 0 5に出力される。 さらに選択器 3 0 0 5は、 パルス音源ベク トル 1 と 2のどちらを選択したかという情報と、 選択したパルス音源べク トルを表す、 各パルスの極性及びィ ンデヅクス が音源生成部の外部に出力される。 この選択情報及び音源パルスの極性 及びィ ンデックス情報は、 符号化器や多重化器などを通って伝送路へ出 力されるデータ系列に変換されて伝送路へ送り出される。
加算器 3 0 0 9は、 乗算器 3 0 0 7から出力された適応符号べク トル 成分と、 乗算器 3 0 0 8から出力されたパルス音源べク トル成分とのベ ク トル加算を行い、 励振音源べク トルとして出力する。
なお、 本実施例において、 第 1 2実施例又は第 1 3実施例又は第 1 4 実施例のようにィ ンデックス更新手段又はパルス番号及びィ ンデックス の更新手段又は固定探索位置と位相適応探索位置の併用をパルス位置探
索器 3 0 0 4の前段に備えれば、 探索位置算出器 3 0 0 3を用いること に起因する伝送路誤りの影響を受けやすいという性質を低くすることが できる。
また、 パルスの立て方としては、 定数本例えば 4本のパルスを探索範 囲、 例えば 3 2箇所の位置のどこかに立てる場合においては、 前述のよ うに 3 2箇所を 4つに分けて 1本のパルスを割り当てられた 8箇所の中 の 1箇所に決定するように全ての組み合わせ ( 8 x 8 x 8 x 8通り) を 探索する方法の他に、 3 2箇所の中から 4箇所を選びだす組み合わせ全 てについて探索する方法などがある。 なお、 振幅 1のイ ンパルスの組み 合わせの他に、 複数本例えば 2本のパルスを組み合わせたパルス対の組 み合わせや、 振幅の異なるィ ンパルスの組み合わせによるパルスの立て 方も可能である。
なお、 パルス数が少なくパルス位置情報が十分であるモ一ドにおいて は、 パルス位置情報が不足しない範囲内において、 パルス位置情報の一 部を雑音コードベク トルを表すイ ンデックスに割り当てることにより、 有声立ち上がり部のみならず無声子音部や雑音的な入力信号に対する性 能向上を図ることも可能である。
また、 上記第 1実施例から第 1 7実施例に示した音声符号化装置及び 音声復号装置の音源生成機能は、 磁気ディスク、 光磁気ディスク、 C D や D V Dなどの光ディスク、 I Cカード、 R O M、 R A M等の記録媒体 あるいは記憶装置にプログラムとして記録することができる。 よって、 この記録媒体や記憶装置から記録データをコンピュータで読み取ること により、 音声符号化装置の機能を実現することができる。
以上本発明による音声符号化装置及び音声復号装置の音源生成部につ いて説明したが、 この音源生成部は次に示す C E L P型音声符号化装置 及び C E L P型音声復号装置に用いられることによ り、 その効果を発揮
C
rn C C
¾"
図 3 1は本発明にかかる C E L P型音声符号化装置の好ましい実施例 の全体構成を示すブロック図である。 このブロック図中、 点線で囲んだ コードブックブロックと一点鎖線で囲んだ音源べク トルブロックには、 上記各実施例の構成が用いられるものとする。 すなわち、 図 1、 図 3な どのように、 適応符号ベク トルと雑音符^ベク トルを生成する構成の実 施例は、 図 3 1のコードブックブロックとして用いられ、 一方、 図 8、 図 1 2、 図 1 4、 図 1 5、 図 1 7、 図 1 8、 図 2 0、 図 2 1、 図 2 3、 図 2 5、 図 2 7、 図 2 9、 図 3 0などのように、 励振音源べク トルを生 成する構成の実施例は図 3 1の音源べク トルブロックとして用いられる。 なお、 図 3 1では、 音源ベク トルブロックと、 その一部のコードブック プロック自体は従来の構成が示されている。
図 3 1において、 適応符号帳 3 40 1の出力デ一夕である時系列符号 はべク トル乗算器 34 0 3に入力され、 ゲイ ン符号 G Oと乗算される。 一方、 雑音符号帳 34 0 2の出力データである時系列符号はベク トル乗 算器 3 4 0 4に入力され、 ゲイ ン符号 G 1 と乗算される。 ベク トル乗算 器 34 0 3、 3 4 04の出力は相互に加算器 34 0 5で加算され、 その 結果が合成フィル夕 34 0 7を介して加算器 34 1 0の一入力に与えら れる。 入力音声信号は線形予測分析器 3 4 0 6に入力されるとともに、 加算器 3 4 1 0の +入力に与えられている。 線形予測分析器 340 6で は、 入力音声の線形予測分析が行われ、 さらに量子化され、 予測係数 L として符号化出力の一部とされるとともに、 合成フィル夕 3 4 0 7の係 数として設定される。 加算器 34 1 0の出力データは、 歪最小化器 3 4 0 9に与えられ、 合成フィル夕 3 40 7の合成波形歪が最小となるよう、 適応符号帳 34 0 1 と雑音符号帳 340 2でのべク トル切出しを制御す る信号を生成する。 すなわち、 歪最小化器 34 0 9は歪を最小にするよ うに、 適応符号帳 34 0 1 と雑音符号帳 3 4 0 2とゲイン量子化器 3 4
0 8をそれぞれ制御する制御信号を生成して、 これらの回路に送出する。 図 3 1及び後述する図 3 2におけるデ一夕を示す符号 A、 S、 G、 L は次のようなものである。
A : 歪最小化器 3 4 0 9によって最終的に選択された適応符号べク ト ルを指し示すイ ンデックス情報 (符号化装置から復号装置に転送される) S : 歪最小化器 3 4 0 9によって最終的に選択された雑音符号べク ト ルを指し示すイ ンデックス情報 (符号化装置から復号装置に転送される) G : 歪最小化器 3 4 0 9によって最終的に決定された量子化ゲインを 表す量子化情報 (符号化装置から復号装置に転送される)
L : 線形予測分析器 3 4 0 6によって量子化された線形予測係数を表 す情報 (符号化装置から復号装置に転送される)
上記各実施例では、 本発明の音声符号化装置を実現するものとして説 明しているが、 本発明では音源ベク トルの生成手法に特徴があり、 この 特徴は、 そのまま音声復号装置にも適用可能である。 したがって、 上記 各実施例は、 そのまま C E L P型音声復号装置における音源ベク トルの 生成部分に利用することができる。 この点を明らかにするために、 本発 明による C E L P型音声復号装置について以下に説明する。
図 3 2は本発明にかかる C E L P型音声復号装置の好ましい実施例の 全体構成を示すブロック図である。 このブロック図中、 点線で囲んだコ —ドブックブロックと一点鎖線で囲んだ音源ベク トルブロックには、 上 記各実施例の構成が用いられるものとする。 すなわち、 図 1、 図 3など のように、 適応符号べク トルと雑音符号べク トルを生成する構成の実施 例は、 図 3 2のコー ドブックブロックとして用いられ、 一方、 図 8、 図 1 2、 図 1 4、 図 1 5、 図 1 7、 図 1 8、 図 2 0、 図 2 1、 図 2 3、 図 2 5、 図 2 7、 図 2 9、 図 3 0などのように、 励振音源べク トルを生成 する構成の実施例は図 3 2の音源べク トルブロックとして用いられる。
なお、 図 32では、 音源ベク トルブロックと、 その一部のコードブック プロック自体は従来の構成が示されている。
図 32において、 適応符号帳 3 50 1の出力データである時系列符号 はべク トル乗算器 3 503に入力され、 ゲイ ン符号 G Oと乗算される。 一方、 雑音符号帳 3 502の出力デ一夕である時系列符号はべク トル乗 算器 35 04に入力され、 ゲイ ン符号 G 1と乗算される。 べク トル乗算 器 3503、 3 504の出力は相互に加算器 3505で加算され、 その 結果が合成フィル夕 3507を介して復号音声として出力される。 合成 フィル夕 3507のフィル夕係数は線形予測係数を復号する線形予測係 数復号器 3 506にて生成される。 ゲイ ン符号 G 1、 G 0はゲイン復号 器 3508にて生成れる。
以上説明したように、 本発明による C E L P型音声符号化装置及び/ 又は C E L P型音声復号装置は、 音声の符号化及び/又は復号時に適応 符号べク トルのピッチビーク位置に対応する雑音符号べク トルの振幅を 強調することによって、 1ピッチ波形内に存在する位相倩報を利用して、 音質向上を図ることができるので、 本発明は例えば、 デジタル信号とし て無線通信、 光無線通信を行う音声通信装置に好適に適用可能である。 図 33は本発明の CE LP型音声符号化装置 330 1を用いた移動無 線端末の概略構成を示すプロック図である。 音声符号化装置 330 1の 出力信号は変調器 330 2にて、 例えば QP S K (Quadrature Differe ntial Phase Shift Keying) によるデジタル変調が行われるとともに、 例えば CDMA (Code Division Multiple Access) 方式や、 TDMA (Time Division Multiple Access) 方式などの所定アクセス方式に適 合する信号形式に変調され、 ついで増幅器 3303にて増幅され、 アン テナ 3304から放射される。 なお、 図示しないが、 本発明の音声復号 装置も同様に移動無線端末において適用可能である。
産業上の利用可能性
本発明は、 上記実施例から明らかなように、 適応符号ベク トルのビッ チピーク位置に対応する雑音符号べク トルの振幅を強調するための振幅 強調窓を雑音符号ベク トルに乗ずるようにしたので、 1 ピッチ波形内に 存在する位相情報を利用して、 音質向上を図ることができる。
本発明はまた、 適応符号べク トルのピッチビーク近傍のみに限定した 雑音符号べク トルを用いるようにしたので、 雑音符号べク トルに割り 当 てられるビッ ト数が少ない場合でも、 音質劣化を少なくでき、 ピッチビ ーク近傍にパワーが集中する有声部の音声品質の向上を図ることができ
■Q o
本発明はまた、 適応符号べク トルのピッチビーク位置とピッチ周期に 基づいてパルス位置の探索範囲を決定するようにしたので、 1 ピッチ波 形内でピッチ周期に応じたパルス位置探索を行うことができ、 パルス位 置に割り当てられるビッ ト数が少ない場合でも、 音声品質の劣化を抑え ることができる。
本発明はまた、 パルス探索の範囲を 1 ピッチ周期強の長さに限定する ことにより、 ピッチ周期性のある音源信号を効率的に表現できる。 また、 探索範囲内に 2つのピッチビークを含む為、 1つめのピッチビークと 2 つめのピッチピークの形が異なる場合や、 1つめのピッチビークの位置 を誤って検出した場合への対応が可能である。
本発明はまた、 入力音声信号のビツチ周期に応じて適応的にパルス数 を変化させる構成を有するので、 パルス数の切り替えのために新たな情 報を必要とせずに音声品質の向上を図ることができる。
本発明はまた、 パルス位置探索の前にピッチビーク近傍とそれ以外の 部分のパルス振幅を決定するため、 1 ピッチ波形の形状を効率的に表現
することができる。
本発明はまた、 ピッチ周期の連続性を用いてパルスの探索位置を切り 替えることによって、 有声の立ち上がり部 ■ 無声部と有声定常部 · 有声 部のそれぞれに適したパルス音源探索を行うことができるので、 音声品 質の向上を図ることができる。
本発明はまた、 現サブフ レームのピッチゲイ ン (適応符号ベク トル利 得) を、 適応符号帳探索直後に求めたピッチゲイ ンを用いて初段量子化 を行い、 音源探索の最後に求められた最適ビツチゲイ ンと初段量子化ビ ツチゲイ ンの差分を 2段目で量子化することによって、 適応符号帳と固 定符号帳 (雑音符号帳) の和で駆動音源べク トルを生成する C E L P型 音声符号化装置においては、 固定符号帳 (雑音符号帳) 探索前に得られ る情報を量子化して伝送するため、 独立したモ一ド情報を付加せずに固 定符号帳 (雑音符号帳) の切り替え等を行うことが可能となり、 効率的 に音声情報を符号化することが可能となる。
本発明はまた、 過去に符号化したピッチ周期の連続性あるいは過去に 符号化したピッチゲイ ンの大きさ (あるいは連続性) に基づいて現在の サブフレームの音声信号のビツチ周期性を判定し、 パルス音源の探索位 置を切り替えるため、 ビツチ周期性が高いところと低いところの判定に 新たな情報を付加することなく、 それそれの部分に適したパルス音源探 索を行うことができるようになるので、 同一情報量下での音声品質の向 上を図ることができる。
本発明はまた、 直前のサブフレームにおけるピッチビーク位置と直前 のサブフレームにおけるピツチ周期と現在のサブフレームにおけるビヅ チ周期を用いることにより、 バックヮ一ドで現在のサブフレームにおけ るピッチビーク位置を予測でき、 この予測ピッチピーク位置を用いて位 相適応処理を行うか否かを切り替えるため、 切り替え情報の新たな伝送
なしに位相適応処理の切り替えを行うことができ、 同一情報量下での音 声品質の向上を図ることができる。 なお、 位相適応処理を行わないモー ドにおいては、 固定符号帳を使用すれば良く、 無音部等において固定符 号帳が使用され続ける様な状態が生じることにより、 位相適応型音源に 対する誤りの伝播をリセッ 卜する効果も得ることができる。
本発明はまた、 適応符号べク トルのピッチビーク近傍への信号パワー 集中度を用いて位相適応を行うか否かを切り替えるため、 切り替え情報 の新たな伝送無しに位相適応処理の切り替えを行うことができ、 同一-情 報量下での音声品質の向上を図ることができる。 なお、 位相適応処理を 行わないモー ドにおいては、 固定符号帳を使用すれば良く、 無音部等に おいて固定符号帳が使用され続ける様な状態が生じることにより、 位相 適応型音源に対する誤りの伝播を リセッ 卜する効果も得ることができる。 本発明はまた、 ピッチビーク位置を 0とする相対位置で音源パルスの 位置を表現する C E L P型音声符号化装置において、 音源パルスの各位 置を表すインデックスをサブフレーム先頭から順番に並ぶように付ける ことにより、 伝送路誤りの影響等によってピッチビーク位置を誤ってし まった場合において、 音源パルス位置のずれが非常に大きくならないよ うにすることができる。
本発明はまた、 ピツチビーク位置を 0とする相対位置で音源パルスの 位置を表現する C E L P型音声符号化装置において、 音源パルスの各位 置を表すイ ンデックスをサブフレーム先頭から順番に並ぶように付ける とともに、 同じィ ンデックス番号で表される別々のパルスに付ける番号 もサブフ レームの先頭から順番になるように定義することにより、 伝送 路誤りの影響等によってピッチビーク位置を誤ってしまった場合におい て、 音源パルス位置のずれが小さ くなるようにすることができる。
本発明はまた、 ピッチビーク位置を 0 とする相対位置で音源パルスの
位置を表現する C E L P型音声符号化装置において、 音源パルスの探索 位置の全てを相対位置で表現するのではなく、 一部分のみを相対位置で 表現して残りの探索位置は予め定められた固定位置にすることにより、 伝送路誤りの影響等によってビツチビーク位置を誤ってしまった場合に おいて、 音源パルスの位置がずれてしまう確率を減らすことにより、 伝 送路誤りの影響が長く伝播することを防ぐことができる。
本発明はまた、 1 ピッチ波形内のビーク位置をピッチピーク位置とし て探し出すため、 サブフレーム長とピッチ周期とがー致しないことに起 因するセカン ドビークをピッチピークとしてしまう誤検出を防ぐことが できる。
本発明はまた、 連続する有声定常部においては、 直前のサブフレーム におけるピッチピークの位置と直前のサブフ レームにおけるピッチ周期 と現在のサブフレームにおけるビッチ周期の情報を用いて現在のピッチ ビーク位置の存在範囲を限定し、 その範囲内でピッチビーク位置を探索 する構成とすることによ り、 現在のサブフ レームの信号のみを用いてピ ッチピーク位置を探索したときに生じる、 1 ピヅチ波形内のセカン ドビ —クをピッチピークとする誤検出を防ぐことができる。
本発明はまた、 パルス音源を雑音符 ^帳に適用した C E L P型音声符 号化装置において、 音源パルス数が少ない代わりに各音源パルスの位置 情報が十分なモードと、 各音源パルスの位置情報が粗い代わりに音源パ ルス数が多いモードとの双方を有する雑音符号帳構成としたので、 有声 立ち上がり部分の音声品質の向上と音源パルス数が多いモードの有効利 用との双方を実現できるものである。
本発明によれば、 上記構成あるいは手法により音源を生成しているの で、 C E L P型音声符号化装置のみならず、 C E L P型音声復号装置に おいても同様の効果を奏する。 また、 本発明の C E L P型音声符号化装
置並びに C E L P型音声復号装置は移動体通信装置などの音声を符号化 して伝送したり、 符号化されて伝送された音声を復号して元の音声を再 生する通信装置や、 音声記録装置などに広く応用が可能である。