JP3285185B2

JP3285185B2 - 音響信号符号化方法

Info

Publication number: JP3285185B2
Application number: JP15055095A
Authority: JP
Inventors: 仲大室; 丈太朗池戸; 健弘守谷; 一則間野; 伸二林; 章俊片岡
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1995-06-16
Filing date: 1995-06-16
Publication date: 2002-05-27
Anticipated expiration: 2017-05-27
Also published as: JPH096396A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、音声または音楽など
の音響信号のスペクトル包絡特性を表すフィルタを、音
源ベクトルで駆動して音響信号を合成することを利用し
た予測符号化により、音響信号系列を少ない情報量でデ
ィジタル符号化する高能率音響信号符号化方法に関す
る。

【０００２】

【従来の技術】ディジタル移動体通信において、電波を
効率的に利用したり、音声信号または音楽信号の蓄積サ
ービス等で記憶媒体を効率的に利用するために、高能率
音響信号符号化方法が用いられる。現在、音声信号を高
能率に符号化する方法として、原音声信号をフレームま
たはサブフレーム（以下フレームと総称する）と呼ばれ
る５〜５０ｍｓ程度の一定間隔の区間に分割し、その１
フレームの音声信号を、周波数スペクトルの包絡特性を
表す線形フィルタの特性と、その線形フィルタを駆動す
るための駆動音源信号との２つの情報に分離し、それぞ
れを符号化する手法が提案されている。この手法におい
て、駆動音源信号を符号化する方法として、音声信号の
ピッチ周期（基本周波数）に対応すると考えられる周期
成分と、それ以外の成分とに分離して符号化する方法が
知られている。この駆動音源情報の符号化法の例とし
て、符号駆動線形予測符号化（Code-Excited Linear Pr
ediction：ＣＥＬＰ）がある。この技術の詳細について
は、文献 M.R. Schroeder andB.S. Atal, "Code-Excit
ed Linear Prediction(CELP):High Quality Speech atV
ery Low Bit Rates", IEEE Proc. ICASSP-85, pp.937-9
40, 1985に記載されている。

【０００３】図６に上記従来の符号化方法の構成例を示
す。入力端子１に入力された原音声信号（入力音声信
号）は、線形予測分析部２において、入力音声信号の周
波数スペクトル包絡特性を表す線形予測パラメータが計
算される。得られた線形予測パラメータは線形予測パラ
メータ符号化部３において、符号化されて線形予測パラ
メータ復号化部４に送られる。線形予測パラメータ復号
化部４では、受け取った符号からフィルタ係数を再生
し、合成フィルタ５および歪み計算部６に送る。なお、
線形予測分析の詳細および線形予測パラメータの符号化
例については、例えば古井貞煕著“ディジタル音声処
理”（東海大学出版会）に記載されている。ここで、線
形予測分析部２、線形予測パラメータ符号化部３、線形
予測パラメータ復号化部４および合成フィルタ５は非線
形なものに置き換えてもよい。

【０００４】適応符号帳７からはそのバッファに記憶さ
れた直前の過去の駆動音源ベクトル（既に量子化された
直前の１〜数フレーム分の駆動音源ベクトル）を入力さ
れた周期符号に相当する長さで切り出し、その切り出し
たベクトルをフレームの長さになるまで繰り返すことに
よって、入力音声信号の周期成分に対応する時系列ベク
トルの候補が出力される。

【０００５】雑音符号帳８からは、音声信号の非周期成
分に対応する１フレーム分の長さの時系列符号ベクトル
（雑音符号ベクトル）の候補が出力される。これらの候
補は入力音声信号とは独立に符号化のためのビット数に
応じてあらかじめ指定された数の候補雑音符号ベクトル
が記憶されている。適応符号帳７および雑音符号帳８か
ら出力された各時系列ベクトルの候補は、乗算部９，１
０においてそれぞれ重み符号帳１１において作成された
重みが乗算され、加算部１２において加算されて駆動音
源ベクトルの候補となる。

【０００６】合成フィルタ５は、線形予測パラメータ復
号化部４の出力をフィルタの係数とする線形フィルタ
で、加算部１２の出力である駆動音源ベクトル候補を入
力として再生音声信号の候補を出力する。合成フィルタ
５の次数すなわち線形予測分析の次数は、一般に１０〜
１６次程度が用いられることが多い。なお、既に述べた
ように、合成フィルタ５は非線形なフィルタでもよい。

【０００７】歪み計算部６では、合成フィルタ５の出力
である再生音声信号の候補と、入力音声信号との歪みを
計算する。この歪みの計算は、例えば聴覚重み付けな
ど、合成フィルタ５の係数または量子化していない線形
予測係数を考慮にいれて行なうことが多い。符号帳検索
制御部１３では、各再生音声信号候補の入力音声信号に
対する歪みが最小となるような周期符号、雑音符号およ
び重み符号を選択し、そのフレームにおける駆動音源ベ
クトルを決定する。

【０００８】符号帳検索制御部１３において決定された
周期符号、雑音符号、重み符号と、線形予測パラメータ
符号化部３の出力である線形予測パラメータ符号は、符
号送出部１４に送られ、利用の形態に応じて記憶装置に
記憶されるか、または通信路を介して受信側へ送られる
ために出力される。図６中の歪み計算部６の構成例を図
７に図６と対応する部分と同一符号を付けて示す。入力
音声信号である入力時系列ベクトルｘと、合成フィルタ
５からの再生音声信号候補である合成信号ベクトルｙの
間の歪みをはかる尺度の一例として、入力時系列ベクト
ルｘを聴覚重みづけフィルタ１６に通したベクトルｘ_p
から、合成信号ベクトルｙを聴覚重みづけフィルタ１７
に通したベクトルｙ_pを引算部１８で差し引いたベクト
ルｘ_p−ｙ_pから、歪み評価尺度として、ｄ＝｜｜ｘ_p−ｙ_p｜｜² （１）を歪み評価尺度計算部１９で計算し、歪み評価尺度ｄが
最小となるような合成信号ベクトルｙを選択することに
よって、最適な周期符号、雑音符号、重み符号が選択さ
れる。聴覚重みづけフィルタ１６，１７を用いないこと
もある。このとき、すべての周期符号、雑音符号、重み
符号の組み合わせから、尺度ｄが最小になるものを選択
するのが、再生音声信号の歪みを小さくするうえで望ま
しいが、実際には演算処理量の問題から、周期符号、雑
音符号、重み符号の順に決めることも多い。重み符号
を、適応符号と雑音符号にかけるそれぞれの重みを、一
括してベクトル量子化しない場合には、周期符号、適応
符号重み、雑音符号、雑音符号重みの順に決定してもよ
い。重みを一括してベクトル量子化する場合でも、適応
符号重みを、暫定的に非量子化値（最適値）に設定して
おいて、周期符号、非量子化適応符号重み、雑音符号、
適応符号重みと雑音符号重みのベクトル量子化、の順に
決めても良い。また、各符号帳における選択を決める際
に、ただひとつの符号に決定してしまうのではなく、い
くつかの候補を残しておいて、それらの最適な組み合わ
せに決定してもよい。

【０００９】図８Ａは、図７の構成例を、等価な形で書
き直したものである。合成フィルタ５、聴覚重みづけフ
ィルタ１７は線形のフィルタであるから、図７に示すよ
うに、適応符号ベクトルと雑音符号ベクトルを、別々に
合成フィルタ２１、聴覚重みづけフィルタ２２と合成フ
ィルタ２３、聴覚重みづけフィルタ２４に通して、それ
ぞれを、入力音声時系列ベクトルｘを聴覚重みづけフィ
ルタ１６を通したｘ_pから差し引いて歪み評価尺度を計
算することができる。

【００１０】図８Ａにおける合成フィルタ２３と、聴覚
重みづけフィルタ２４を合わせて、図８Ｂに示すように
等価なＦＩＲ型フィルタ２５で実現することができる。
インパルス応答算出部２６では、フィルタ２３，２４を
合わせた特性のフィルタ２５のインパルス応答を計算
し、このインパルス応答と雑音符号ベクトルＣに重みｇ
_rをかけたベクトルｇ_rｃとの畳み込みをフィルタ２５
で行うことによって、等価な線形フィルタを実現でき
る。このとき、インパルス応答算出部２６から出力され
るインパルス応答を、ｈ₀，ｈ₁，ｈ₂，…，ｈ
_N-1（Ｎは１フレームのサンプル数）として、ｈ_iをとおき、これをインパルス応答行列と呼ぶ。適応符号ベ
クトルと適応符号重みが、先にまたは暫定的に決まって
いるものとし、適応符号ベクトルに重みをかけ、図７Ａ
において、合成フィルタ２１および聴覚重みづけフィル
タ２２を通した信号ベクトルを、引算部２８でｘ_pから
差し引いた信号、つまり入力音声信号ベクトルから周期
成分を除去した信号をｒとおく。このとき、（１）式で
示される評価尺度ｄは、ｄ＝｜｜ｒ−ｇ_rＨｃ｜｜² （３）に等しい。このとき、ｇ_rは雑音符号のあとで決定する
ため、ここでは任意の値をとりうると仮定し、ｇ_rで
（３）式を偏微分して、これをゼロとするｇ_rを計算
し、そのｇ_rを（３）式に代入すると（４）式となる。

【００１１】ｄ′＝（ｒ^tＨｃ）²／（ｃ^tＨ^tＨｃ）（４）（３）式を最小にするような雑音符号ベクトルｃを選ぶ
ことは、（４）式を最大にする雑音符号ベクトルｃを選
ぶことに等しい。

【００１２】

【発明が解決しようとする課題】ＣＥＬＰ方式におい
て、問題となるのは、低いビットレートで高い品質の再
生音声を得ようとする（圧縮率をあげようとする）と、
雑音符号帳に多くの雑音符号ベクトルを記憶するため
に、非常に多くのメモリを必要とするだけでなく、雑音
符号帳出力に重みをかけ、合成フィルタを通して歪みを
計算する一連の処理を、雑音符号帳に蓄えられる雑音符
号ベクトルの数だけ繰り返す処理に、非常に多くの演算
処理が必要となるという問題があった。

【００１３】この問題に対して、Algebraic Code-Excit
ed Linear Prediction（ＡＣＥＬＰ）という方式が提案
されている。この方式は、雑音符号帳にベクトルパター
ンを蓄えるのではなく、高さが１の正負パルスを、フレ
ーム内に数本、例えば、４０サンプルのフレームに対し
て、４本を適当な位置に立てることによって、雑音符号
ベクトルを出力するものである。この方式では雑音符号
ベクトルを記憶するためのメモリが不要で、パルスを立
てる位置のテーブルのみをメモリに記憶すればよいとい
う特徴を持つ。また、演算処理量に関しても、従来のＣ
ＥＬＰ方式に比べると、パルスが数本しかないために、
かなり少ない処理量で高い品質を実現できるというメリ
ットがある。なお、この方式は各パルスの位置と極性を
ランダムに取らせることにより雑音符号ベクトルとして
作用させるものであるが、ＡＣＥＬＰ方式の詳細は、例
えば、文献、R. Salami, C. Laflamme, and J-P. Adou
l,“8 kbit/s ACELP Coding of Speech with 10 ms Spe
ech-Frame: a Candidate for CCITT Standardization",
IEEE Proc. ICASSP-94, pp.II-97 に記載されている。

【００１４】しかしながら、ＡＣＥＬＰ方式をもってし
ても、実時間で符号化処理を実現するためには、高価な
ディジタルシグナルプロセッサ（ＤＳＰ）が必要であ
り、安価なプロセッサで実現するためには、さらに演算
量の少ない方式でなければならない。ＡＣＥＬＰ方式
は、非常に簡単なモデル化で高品質な再生音声信号を実
現するという、すぐれた方式であるけれども、モデルが
簡単なゆえに、上記文献で提案されているよりも処理量
の低減を試みると、急速に再生音声信号の品質が劣化す
るという問題が生じる。

【００１５】この発明の目的は、安価なプロセッサで許
容される範囲内の少ないメモリ量、かつ非常に少ない演
算量で、高品質な再生音声信号を得ることを可能とする
音響信号符号化方法を提供することにある。

【００１６】

【課題を解決するための手段】この発明の符号化方法で
は、雑音符号ベクトルとして、数サンプルを単位とする
パターンベクトルを、フレーム内でシフトして、フレー
ム内に数個立てることによって雑音符号ベクトルを表現
し、パターンベクトルの形状と、シフト位置を効率的に
探索することによって、少ない演算処理で、高い品質の
再生音を得る音声の符号化方法を実現する。また、パタ
ーンベクトルを記憶するためのメモリは、従来のＣＥＬ
Ｐ方式に比べて、非常に少なくてよい。一方、ＡＣＥＬ
Ｐ方式に比べると、より実際の音声の特徴にあったパタ
ーンベクトルを用意し、効率的にシフト位置を探索する
ことによって、演算量がより少なく、高品質な符号化方
法を実現する。

【００１７】

【実施例】図１にこの発明の符号化方法の実施例を適用
した符号化装置の機能的構成例を示し、図６と対応する
部分に同一符号を付けてある。この発明では雑音符号帳
８の代りに雑音符号帳３１が設けられる。雑音符号帳３
１には複数のパターン符号帳３２₁〜３２_Mが設けら
れ、これら各パターン符号帳３２₁〜３２_Mにはそれぞ
れ数サンプルからなるパターンベクトルが１乃至１０程
度記憶されている。つまり各パターンベクトルは例えば
連続するｎサンプル点からなり、そのｎサンプル点以外
のサンプル点はゼロである。符号帳３２₁〜３２_Mは保
持するパターンベクトルは共通のものとしてもよい。

【００１８】これらパターン符号帳３２₁〜３２_Mはそ
れぞれ符号帳検索制御部１３からのパターン符号３３₁
〜３３_Mにより指定されてパターンベクトルが取出され
る。これら取出されたパターンベクトルはそれぞれ乗算
部３４₁〜３４_Mで符号帳検索制御部１３からのサイン
符号３５₁〜３５_Mに応じて＋１又は−１が乗算され、
つまり極性が制御される。これら乗算部３４₁〜３４_M
の出力はシフト部３６₁〜３６_Mで符号帳検索制御部１
３からの位置符号３７₁〜３７_Mに応じてフレーム内の
位置に配置される。シフト部３６₁〜３６_Mの各出力は
加算されて１フレームの雑音符号ベクトルとして乗算部
１０へ出力される。つまり、１フレーム分のバッファに
対し各極性制御されたパターンベクトルが位置符号に応
じたサンプル点に配置され、その際重なる時は加算さ
れ、そのバッファから雑音符号ベクトルが出力される。
つまりパターン符号により決められるパターンベクトル
を位置符号によりフレーム上に配置したパターンベクト
ルを生成するチャネルをＭ個有し、そのＭチャネルより
のパターンベクトルの和により雑音符号ベクトルを生成
する。各パターンベクトルのｎサンプル点は、連続しな
いでとびとびのサンプル点でもよい。

【００１９】シフト部３６₁〜３６_Mでの配置位置は相
互に重なってもよく、例えば３サンプルパターンベクト
ルの二つがその最後のサンプルと最初のサンプルとが重
なるように配置してもよい。しかし例えば、第ｋチャネ
ルでは、ｔ＝ｎＭｊ＋（ｋ−１）ｎ；ｊ＝０，１，２，…，Ｓ（５）で示される位置に配置するようにする。Ｍはチャネル
数、ｎはパターンベクトルのサンプル数である。この場
合はあるサンプル点は、いずれか１チャネルでのみ表現
され、複数のパターンベクトルが重なることはない。す
なわち、各チャネルのシフト部から出力されるベクトル
は、チャネル相互で０以外の値を同一サンプル点にもた
ない。ここで、Ｓは、フレーム（サブフレーム）長Ｎ
と、ｎ，Ｍによって決まる値である。雑音符号として
は、各チャネルにおけるパターンベクトルのインデック
ス（パターン符号）と、シフト位置インデックス（位置
符号）と、サイン符号とが出力される。

【００２０】上記構成例によって、雑音符号帳３１を構
成するとき、場合によっては、あるチャネルで表現でき
るパターンベクトルおよびシフト位置から生成されるベ
クトルのいずれを使用しても、そのチャネルから出力さ
れるベクトルを使用しない場合よりも、歪みが増える
（歪み評価尺度（４）式が小さくなる）ことがある。そ
の場合には、当該チャネルを使用しないことを表わすコ
ード（符号）を用意し、復号側でそのコードを受け取っ
たときには、当該チャネルから出力されるベクトルを加
算しないことにすると、再生品質が劣化しない。また、
ビットレートの制限によっては、Ｍチャネル分の情報を
送信または蓄積できないことがある。その場合には、チ
ャネル数Ｍを減らすことによって、ビットレートを下げ
られるが、単純にＭを小さくするのではなく、Ｍはその
ままにして、第ｅチャネルと第ｆチャネルのいずれか歪
みの低減に効果的なチャネルを符号化フレームごとに選
択して切り替えることによって、実質的なチャネル数を
減らしてビットレートを下げる一方、再生音の品質劣化
を抑えることができる。

【００２１】以下に、ｎ＝２サンプル、Ｍ＝５チャネ
ル、Ｎ＝４０サンプル、Ｓ＝４個所、ベクトルパターン
は各チャネル４パターンとした場合について具体的に説
明する。各パターン符号帳３２₁〜３２₅には、２サン
プルからなる４種類のパターンベクトルが格納される。
この４パターンの形状は、代数的に、例えば、｛＋１，
０｝，｛０，＋１｝，｛＋１，＋１｝，｛＋１，−１｝
のように決めてもよい。この決定は例えば図１中の合成
フィルタ５の入力パルスを観察し、発生頻度の多い２サ
ンプルの組の状態から行う。より音声の特徴を表すよう
に、学習手続き、すなわち、大量の音声データを符号化
してみて、その歪みの総和が最小となるようなパターン
を代表パターンとして用いるほうが、高い品質を実現す
ることができる。この場合のパターンベクトルの例を図
２Ａに示す。パターン符号帳にはこの各二つのサンプル
点の値が組として格納される。

【００２２】この例における第１チャネルのパターンの
配置位置は４０点のうち次の４個所の何れかとなり、（０，１），（１０，１１），（２０，２１），（３
０，３１）第２チャネルのパターンの配置位置は、次の４個所の何
れかとなり、（２，３），（１２，１３），（２２，２３），（３
２，３３）第３チャネルのパターンの配置位置は、次の４個所の何
れかとなる。

【００２３】（４，５），（１４，１５），（２４，２
５），（３４，３５）第４，第５チャネルのパターンも以下同様にして決る。
つまり図２Ｂに示すように、第１チャネルのパターンベ
クトル３９₁は（２０，２１）に配置されているか、点
線で示す他の３個所の何れかを取ることができる。同様
に第２乃至第５チャネルの各パターンベクトル３９₂〜
３９₅はそれぞれ図に示している位置以外に点線で示す
各３個所の何れかを取ることができる。第１乃至第５チ
ャネルの各パターンベクトルをフレーム上に配置してベ
クトル的に加えて雑音符号ベクトル４１が得られる。図
２Ｂに示した例では各パターン符号帳３２₁〜３２₅に
互いに異なる４種類のパターンベクトルを格納した場合
である。

【００２４】この例で出力する情報は、チャネルあた
り、４種類のパターンの何れであるかを表すために２ビ
ット、４個所の配置位置の何れであるかを表すために２
ビット、パターンベクトルの正負を表すために１ビット
の計５ビットとなる。５チャネル分の全てを送出する
と、１フレーム（サブフレーム）あたり、２５ビット必
要になる。ある特定のチャネルから出力されたベクトル
を使用しないためのコードを割り当てる場合には、これ
を示すビットを別途割当てもよいが、そのチャネルにお
いてあるパターンの、ある配置位置、ある正負符号の場
合を例外として「使用しないためのコード」に割り当て
ると、ビットレートを上げずに、品質を向上させること
ができる。この場合、そのチャネルにおいて本来そのコ
ードに割り当てられていた形状を表現できなくなるが、
それによる品質の劣化分よりも、品質の向上分のほうが
大きいような形状コードを選ぶ。

【００２５】実際には、フレーム長が４０サンプルのと
きに、５チャネルをフルに使用して２５ビットを使用す
るのは、若干無駄である。その場合には、例えば、図３
Ａに示すように第３チャネルのシフト部３６₃の出力と
第５チャネルのシフト部３６ ₅の出力とをスイッチ手段
４３で切替え、第１乃至第４チャネルを使用する場合
と、第１、第２、第４、第５チャネルを使用する場合と
を符号化フレームごとによい方を選択し、その何れを選
択したかを示すビットを１つ加えることにより、４チャ
ネル分の出力符号の４×５ビットに１ビット加え、２１
ビットを符号化出力とすればよい。

【００２６】更に図３Ｂに示すように、符号帳３２₅を
省略し、第３チャネルのシフト部３６₃と第５チャネル
のシフト部３６₅とをスイッチ手段４４で切替え、使用
し、切替えのためのビットとして１ビット使用してフレ
ームあたり２１ビット出力としてもよい。また第３チャ
ネルと第４チャネルの切替えを行うと共に更に例えば第
２チャネルと第４チャネルを切り替えると、送信パター
ンとして第１，２，３チャネルあるいは第１，３，４チ
ャネル、第１，２，５チャネル、第１，４，５の何れか
となり、１７ビットでよい。このような切り替えをする
場合、隣接するチャネルどうしで切り替えてもよいが、
２チャネル以上離れたチャネルと切り替えたほうが効果
的である。また、例えば、第３チャネルと第５チャネル
を切り替え、残った４つのチャネルの中から、歪み低減
に貢献度の高い３つのチャネル分を選択して使用する方
法も効果的である。この切り替えの方法では、どのチャ
ネルを選択したかを表すのに、２ビット必要となり、合
計（サブ）フレームあたり１８ビット必要になるが、貢
献度の低いチャネルを捨てることで、１７ビットの場合
よりも高い品質を実現できる。

【００２７】次に、少ない演算量で、効果的に最適な符
号を探索する実施例を示す。演算量を問わなければ、５
チャネルの、すべてのベクトルパターン、配置位置、正
負符号の組み合わせの中から、（４）式を最大にする組
み合わせを選択すればよいが、それでは、ＡＣＥＬＰ方
式よりも逆に演算量が増えてしまう。この発明のねらい
は、ＡＣＥＬＰよりも音声データを表現しやすいモデル
化を行うことによって、演算量を削減しても、品質の劣
化を生じない方法を実現するところにある。

【００２８】以下に、図３Ｂに示した雑音符号帳３１で
フレームあたり２１ビットに符号化の場合の一探索例を
示す。ステップ１．第１予備選択として、第１、第２、第４チ
ャネルは４配置位置から、第３、第５チャネルは切り替
えのため合わせて８配置位置から、各３個所の位置を予
備選択する。その選択のための尺度は、例えばｒ^tＨの
各パターンベクトル配置位置（２サンプル）における絶
対値の和の大きい順に選択するとよい。つまりｒ^tＨは
フレームの各サンプル点と対応して、この例では４０個
の値をもっており、例えば第１チャネルの配置位置０番
目と１番目と対応してｒ^tＨの０番目と１番目の各値の
絶対値の和をとる。以下同様にすべての配置位置につい
て、前記絶対値の和をとり、これらすべての絶対値の和
の大きい順に、第１、第２、第４チャネルから各３つ、
第３、第５チャネルから３つの配置位置を選択する。こ
の絶対値の和が大きいということは、フレーム中のその
サンプル点位置に、駆動音源ベクトルのパルスが立ちそ
うであることを示している。なおｒ^tは入力音声信号と
対応した信号（図８Ａ中の引算部２８の出力）の時間軸
を反転した時系列ベクトル、つまり信号ｒのサンプル列
の時間的配列を逆としたものである。

【００２９】ステップ２．第２予備選択として、第１予
備選択で得られた各チャネルについて３つの配置位置
と、対応チャネルの４パターンベクトルとの組み合わせ
た１２個の候補の中から、４つのパターンと配置位置の
組み合わせを予備選択する。第ｋチャネルのシフト部か
ら出力されるベクトルをｃｋとすると、この第２予備選
択の選択尺度には、｜ｒ^tＨｃｋ｜／ｃｋ^tｃｋを用い
るとよい。この分子のみでもよいが、分母も含めたほう
が大きさにより正規化され、予備選択による品質の低下
を抑えることができる。なお、ｒ^tＨは第１予備選択で
計算した値をそのまま利用すればよい。また、ｃｋ^tｃ
ｋは、パターンベクトルのパワであるから、事前にメモ
リに展開しておけば、毎フレーム毎に計算する必要はな
い。Ｈｃｋはパターンベクトル候補ｃｋを合成フィルタ
２５（図８Ｂ）に通した時系列、また合成フィルタは２
５のインパルス応答とｃｋとを畳み込んだ時系列ベクト
ルである。この時系列ベクトルとｒ^tとの内積の絶対値
の代りにその内積の二乗値を用いてもよい。

【００３０】ステップ３．第２予備選択で選ばれた各チ
ャネルの４つの候補のうち、各チャネル毎の第１候補つ
まり尺度が最も大きかったものを取出し、その４つの第
１候補を大きい順に並べ、並べ替えた順に対応チャネル
をチャネル１′，２′，３′，４′とする。ステップ４．チャネル１′と２′の各４組の組み合わせ
（１６通り）の中から、（４）式を最大にする組み合わ
せを選択する。（４）式の分子の計算では、ｒ ^tＨｃｋ
は第２予備選択で用いた値をそのまま利用する。分母の
計算では、各フレームに１回、Ｈ^tＨのマトリクスを先
に計算してメモリに展開し、ｃｋのゼロでないサンプル
点が関係する項のみを計算すればよい。なお、（サブ）
フレーム長が４０サンプルのとき、Ｈ^tＨをそのままメ
モリに展開すると、４０＊４０＝１６００ワードのメモ
リが必要になるが、実際には、Ｈ^tＨは対称行列である
ため、左下または右上の三角形部分の値のみを記憶すれ
ば、８２０ワードのメモリでよい。それでもメモリ（Ｒ
ＡＭ）の容量が多すぎるときは、Ｈ^tＨを左下三角行列
にした後、例えば、２１行目から２４行目要素は、すべ
て２５行目の値で代用するなど、Ｈ^tＨの要素の一部を
とびとびで保持するなどによって、メモリ量を低減する
ことができる。実験の結果、２１行目から３５行目まで
を、５行おきに値を保持することによって、４９０ワー
ドのメモリで、ほとんど品質が劣化しないことが確認さ
れた。また、この方法では、Ｈ^tＨの計算に要する演算
時間も少なくできる。これはＨ^tＨの各要素は隣り合っ
ているものの値は比較的近い値であるが、離れている要
素間では値が可成り異なるから、このような近似が可能
となる。

【００３１】ステップ５．チャネル３′と４′の各４組
の組み合わせ（１６通り）の中から、（４）式を最大に
する組み合わせを選択する。計算手順に関しては、ステ
ップ４と同様である。（サブ）フレームあたり、１８ビ
ットまたは１７ビットにする場合は、前出のようにチャ
ネルを切り替えて使用すれば、ビットレートを下げられ
るだけでなく、演算量も２１ビットの場合にくらべて削
減できる。なお、１８ビットの場合のチャネルの選択
は、上記ステップ５で、チャネル３′か４′のいずれか
から、（４）式が大きくなるほうを選択して、他方を捨
てることで選択する。

【００３２】上述において、パターン符号帳は１つでも
よく、つまり１チャネルでもよく、つまり１、２、４、
８、又は１６程度とされる。また各パターン符号帳に格
納するパターンベクトルは１つでもよい。図１では各パ
ターン符号帳の出力パターンベクトルに対してサイン符
号３５₁〜３５_Mを乗算したが、サイン符号３５₁〜３
５_Mを省略してもよい。各チャネルの出力、つまり図１
中のシフト部３６₁〜３６_Mの出力のベクトル和を求め
るが、その際上述したようにゼロでないサンプル点が重
なってもよい。この場合探索手順は前述と同様に行えば
よいが、重なりを許すため探索位置が多くなり、それだ
け処理量が多くなる。つまり、チャネル間でパターンベ
クトルの配置位置が互いに重ならないようにすると、最
適配置位置の探索を効率的に行うことができる。

【００３３】上述の探索手順において、ステップ１の第
１予備選択を省略してもよい。しかし第１予備選択をす
ればそれだけ最適配置位置の探索の効率が向上する。合
成フィルタ２５としてはＦＩＲ型フィルタに限られるも
のでない。次にこの発明により符号化された信号に対す
る復号化装置を、図４を参照して詳細に説明する。

【００３４】入力端子５１より符号化信号は入力分離部
５２で各符号に分離され、線形予測パラメータ符号はＬ
ＰＣ係数レジスタ５３に格納され、周期符号は周期レジ
スタ５４に格納され、重み符号は重みレジスタ５５に格
納され、雑音符号、つまりパターン符号３３₁〜３
３_M、サイン符号３５₁〜３５_M、位置符号３７₁〜３
７ _Mが雑音符号レジスタ５６に格納される。ＬＰＣ係数
レジスタ５３内の線形予測パラメータ符号は線形予測パ
ラメータ復号化部５７で復号され、フィルタ係数が求め
られて合成フィルタ５８に設定される。合成フィルタ５
８の駆動信号ベクトルは分岐されて適応符号帳５９に入
力される。適応符号帳５９は周期レジスタ５４内の周期
符号に応じた長さの過去の駆動ベクトルが取出され、そ
れが１フレーム分繰返されて乗算部６１へ出力される。
重みレジスタ５５内の重み符号が復号化され、適応符号
帳用重み、雑音符号帳用重みがそれぞれ乗算部６１，６
２へ出力される。符号化装置のパターン符号帳３２₁〜
３２_Mと同一のパターン符号帳６３₁〜６３_Mが設けら
れる。例えば各パターン符号帳６３₁〜６３_Mに２サン
プルのパターンベクトルが４つそれぞれ格納されてい
る。これらパターン符号帳６３₁〜６３_Mは対応チャネ
ルのパターン符号３３₁〜３３_Mによりそれぞれパター
ンベクトルが取出される。これら取出されたパターンベ
クトルは乗算部６４₁〜６４ _Mでそれぞれサイン符号３
５₁〜３５_Mに応じて＋１又は−１が乗算される。乗算
部６４₁〜６４_Mの出力パターンベクトルはそれぞれ配
置部６５₁〜６５_Mにより位置符号３７₁〜３７_Mに応
じたフレーム上の位置と対応して１フレーム分、例えば
４０ポイント分の駆動源バッファ６６内に格納される。
駆動源バッファ６６は各フレームごとにシリアルに出力
され、雑音符号ベクトルとして乗算部６２へ供給され、
重みが乗算された後、加算部６７で乗算部６１からの重
み付けられた適応符号帳出力と加算され、駆動ベクトル
として合成フィルタ５８へ供給される。

【００３５】以上のようにして符号化信号が音声信号と
して復号化される。図３Ａに示した雑音符号ベクトルの
生成と対応する復号化方法を、その要部のみを示す図５
Ａを参照して説明する。雑音符号レジスタ５６内にパタ
ーン符号３３₃、サイン符号３５₃、位置符号３７₃又
はパターン符号３３₅、サイン符号３５₅、位置符号３
７₅が１チャネル分として格納され、そのパターン符号
によりパターン符号帳６３₃、６３₅の両方からパター
ンベクトルが取出され、それらパターンベクトルが乗算
部６４₃，６４₅で前記１チャネル分として格納されて
いるサイン符号により＋１又は−１が乗算され、更に配
置部６５₃、６５₅により位置符号に応じてバッファ６
６に配置格納される。この際にレジスタ５６中の符号帳
切替えを示す１ビットの切替符号６８により切替え手段
６９が制御され、符号化側で第３チャネルが出力された
場合は配置部６５₃の出力側がバッファ６６に接続さ
れ、第５チャネルが出力された場合は配置部６５₅の出
力側がバッファ６６に接続される。その他は図４の構成
と同様である。

【００３６】図３Ｂに示した雑音符号ベクトル生成と対
応した復号化方法の要部を図５Ｂに示す。この場合は雑
音符号レジスタ５６に、第３チャネルの符号として、パ
ターン符号３３₃とサイン符号３５₃と、位置符号３７
₃又は３７₅とその位置符号の何れかを示す選択符号７
１とが格納され、そのパターン符号３３₃によりパター
ン符号帳６３₃が読出され、その読出されたパターンベ
クトルは乗算部６４₃でサイン符号３５₃に応じて＋１
又は−１が乗算され、その乗算されたベクトルは配置部
６５₃と６５₅とへ供給される。位置符号３７₃、３７
₅の何れが入力されても配置部６５₃、６５₅の両者が
制御され、配置部６５₃、６５₅の出力側は選択符号７
１に応じて切替え手段７２が制御され、符号化側でシフ
ト部３６ ₃が選択された場合は配置部６５₃がバッファ
６６に接続され、シフト部３６₅が選択された場合は配
置部６５₅がバッファ６６に接続される。

【００３７】復号化側におけるパターン符号帳に対する
条件は符号化側と同一とすることで自づと定まる。上述
では主として音声信号の符号化、復号化にこの発明を適
用したが音楽信号の符号化、復号化にも適用できる。

【００３８】

【発明の効果】この発明を利用した場合と、ＡＣＥＬＰ
方式による場合とで、雑音符号ベクトル探索にかかる演
算時間と再生音声の品質（ＳＮ比）を比較したものを図
５Ｃに示す。演算時間は、ワークステーションで、シミ
ュレーションプログラムを実行したときに要したＣＰＵ
時間である（Ｈ^tＨの演算時間は含まない）。この結
果、ＡＣＥＬＰ方式に比べても、非常に少ない演算量
で、高い品質を実現できることが確認された。

【００３９】以上述べたように、この発明の符号化方法
によれば複数のサンプル点よりなるパターンベクトル
を、フレーム上のどの位置に配置するかにより雑音符号
ベクトルを生成するため、このパターンベクトルをくず
さず、それだけ制限され、従来のＡＣＥＬＰ方式のよう
に各１個のパルスがフレーム上すべての位置をとる場合
と比較して探索数が少なくても済む。

【００４０】特に合成フィルタの駆動音源ベクトルは、
連続する２対のパルスが多いことから、連続する２サン
プルのパターンベクトルを用いる場合は整合性がよく、
予備選択を導入しても、誤選択となるおそれが少なく、
少ない演算量で正しい符号化、つまり良品質の符号化を
行うことができる。

【図面の簡単な説明】

【図１】請求項１の発明による符号化方法を適用した符
号化装置の機能構成例を示すブロック図。

【図２】Ａはパターンベクトルの具体例を示す図、Ｂは
この発明方法における各チャネルのパターンベクトルと
その取り得るフレーム上の位置との例、その和ベクトル
である雑音符号ベクトルを示す図である。

【図３】Ａはこの発明の符号化方法を適用した雑音符号
帳３１の例を示すブロック図、Ｂは請求項３の発明の符
号化方法を適用した雑音符号帳３１の例を示すブロック
図である。

【図４】復号化装置の機能構成例を示すブロック図。

【図５】Ａは復号化装置の雑音符号ベクトル再生部の要
部を示すブロック図、Ｂは他の雑音符号ベクトル再生部
の要部を示すブロック図、Ｃはこの発明の符号化方法、
従来のＡＣＥＬＰによる雑音符号ベクトル探索処理時間
を示す図である。

【図６】従来のＣＥＬＰ方式の符号化装置を示す機能構
成図。

【図７】図６中の歪み計算部６の詳細を示すブロック
図。

【図８】Ａは図７中の駆動音源に関する部分を等価な形
で置き換えたブロック図、Ｂは図８Ａ中のフィルタ２
３，２４を１つのフィルタで実現した例を示すブロック
図である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者間野一則東京都千代田区内幸町１丁目１番６号日本電信電話株式会社内 (72)発明者林伸二東京都千代田区内幸町１丁目１番６号日本電信電話株式会社内 (72)発明者片岡章俊東京都千代田区内幸町１丁目１番６号日本電信電話株式会社内 (56)参考文献特開平５−19796（ＪＰ，Ａ) 特開平５−210399（ＪＰ，Ａ) 特開平７−20896（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/12

Claims

(57)【特許請求の範囲】

【請求項１】適応符号帳から、フレームにあるいはサ
ブフレーム（以下両者を総称してフレーム単位と記す）
単位に取り出した過去の駆動音源ベクトルを、ピッチ周
期に対応する周期により繰り返して作成した時系列ベク
トル、雑音符号帳から取り出した雑音符号ベクトルの時
系列ベクトル、あるいはこれらの両方より得られる時系
列ベクトルにより、合成フィルタを駆動して音響信号を
再生して入力音響信号ベクトルに対する歪が最小になる
ように上記適応符号帳、上記雑音符号帳の選択を行う音
響信号符号化方法において、少くとも２サンプルからなるパターンベクトルを少くと
も１つ格納したパターン符号帳から１つのパターンベク
トルを取出し、現在のフレームの先頭を基準位置とし
て、そのフレーム内で基準位置から時間方向に、事前に
決められた複数ヶ所のサンプル位置のうちのひとつの位
置までシフトして立てることによって得られるベクトル
を１チャネルとして、複数のチャネルから得られるベクトルの和ベクトルを、
上記雑音符号ベクトルとし、上記複数のチャネルの中から、２あるいは複数のチャネ
ルを選択し、その選択したチャネルのうち、１つあるいは複数のチャ
ネルのパターン情報およびシフト位置情報を出力しない
ことにより、情報を送信するチャネルを切り換える、ことを特徴とする音響信号符号化方法。
【請求項２】請求項１に記載の音響信号符号化方法に
おいて、あるチャネルにおける、パターンベクトルのシフトしう
るサンプル位置を、他のチャネルにおいてパターンベク
トルのシフトしうるサンプル位置のいずれとも重複しな
いように設定する、ことを特徴とする音響信号符号化方法。
【請求項３】請求項１に記載の音響信号符号化方法に
おいて、上記選択したチャネルのパターン情報が同じである、ことを特徴とする音響信号符号化方法。
【請求項４】請求項１に記載の音響信号符号化方法に
おいて、フレーム内の入力音響信号と対応した信号のサンプル列
の時間配列を逆とした時系列ベクトルを、上記合成フィ
ルタに通した、あるいはその合成フィルタのインパルス
応答と畳み込んだ時系列ベクトルを用いて、各チャネル
におけるシフト位置の候補をより少ない数の候補に予備
選択する、ことを特徴とする音響信号符号化方法。
【請求項５】請求項１に記載の音響信号符号化方法に
おいて、各チャネルにおいてとりうる、パターンベクトルの候補
と、シフト位置の候補のすべての組み合わせから、１チ
ャネル分の駆動ベクトル候補を生成し、フレーム内の入力音響信号と対応する信号のサンプル信
号の時間的配列を逆方向にした時系列ベクトルを、上記
合成フィルタに通した、あるいは上記合成フィルタのイ
ンパルス応答と畳み込んだ時系列ベクトルと上記生成し
た駆動ベクトル候補との内積の絶対値、または内積の二
乗値、あるいは、上記内積の絶対値を上記生成駆動ベク
トル候補のパワーで除した値によって、候補の組み合わ
せを予備選択する、ことを特徴とする音響信号符号化方法。
【請求項６】請求項４に記載の音響信号符号化方法に
おいて、各チャネルにおいてとりうる、パターンベクトルの候補
と、上記予備選択後のシフト位置の候補のすべての組み
合わせから、１チャネル分の駆動ベクトル候補を生成
し、フレーム内の入力音響信号と対応した信号のサンプル信
号の時間的配列を逆とした時系列ベクトルを、上記合成
フィルタに通した、あるいはその合成フィルタのインパ
ルス応答と畳み込んだ時系列ベクトルと上記駆動ベクト
ル候補との内積の絶対値、または内積の二乗値、あるい
は、上記内積の絶対値を上記駆動ベクトル候補のパワー
で除した値によって、候補の組み合わせを更に予備選択
する、ことを特徴とする音響信号符号化方法。
【請求項７】適応符号帳から、フレームにあるいはサ
ブフレーム（以下両者を総称してフレーム単位と記す）
単位に取り出した過去の駆動音源ベクトルを、ピッチ周
期に対応する周期により繰り返して作成した時系列ベク
トル、雑音符号帳から取り出した雑音符号ベクトルの時
系列ベクトル、あるいはこれらの両方より得られる時系
列ベクトルにより、合成フィルタを駆動して音響信号を
再生して入力音響信号ベクトルに対する歪が最小になる
ように上記適応符号帳、上記雑音符号帳の選択を行う音
響信号符号化方法において、少くとも２サンプルからなるパターンベクトルを少くと
も１つ格納したパターン符号帳から１つのパターンベク
トルを取出し、現在のフレームの先頭を基準位置とし
て、そのフレーム内で基準位置から時間方向に、事前に
決められた複数ヶ所のサンプル位置のうちのひとつの位
置までシフトして立てることによって得られるベクトル
を１チャネルとして、複数のチャネルから得られるベクトルの和ベクトルを、
上記雑音符号ベクトルとし、各チャネルにおいてとりうる、パターンベクトルの候補
と、シフト位置の候補のすべての組み合わせから、１チ
ャネル分の駆動ベクトル候補を生成し、フレーム内の入力音響信号と対応する信号のサンプル信
号の時間的配列を逆方向にした時系列ベクトルを、上記
合成フィルタに通した、あるいは上記合成フィルタのイ
ンパルス応答と畳み込んだ時系列ベクトルと上記生成し
た駆動ベクトル候補との内積の絶対値、または内積の二
乗値、あるいは、上記内積の絶対値を上記生成駆動ベク
トル候補のパワーで除した値によって、候補の組み合わ
せを予備選択し、パターンベクトルとシフト位置の組み合わせを予備選択
したときの尺度の値のうち、各チャネルにおける第一位
の候補の尺度の値を、チャネル相互で比較して、値の大
きい順に２あるいは数チャネル選択し、その選択されたチャネルから生成される駆動音源信号
を、上記合成フィルタを通して合成した波形ベクトル
の、入力音響信号ベクトルに対する歪みが最小になるよ
うに、当該チャネルにおけるパターンベクトルとシフト
位置を決定し、残りのチャネルの全部、または一部から生成される駆動
音源信号を、先に決定したチャネルによって生成される
駆動音源信号に加算し、上記合成フィルタを通して合成
した波形ベクトルの、入力音響信号ベクトルに対する歪
みが最小になるように、当該チャネルにおけるパターン
ベクトルとシフト位置を決定する、ことを特徴とする音響信号符号化方法。
【請求項８】適応符号帳から、フレームにあるいはサ
ブフレーム（以下両者を総称してフレーム単位と記す）
単位に取り出した過去の駆動音源ベクトルを、ピッチ周
期に対応する周期により繰り返して作成した時系列ベク
トル、雑音符号帳から取り出した雑音符号ベクトルの時
系列ベクトル、あるいはこれらの両方より得られる時系
列ベクトルにより、合成フィルタを駆動して音響信号を
再生して入力音響信号ベクトルに対する歪が最小になる
ように上記適応符号帳、上記雑音符号帳の選択を行う音
響の符号化方法において、少くとも２サンプルからなるパターンベクトルを少くと
も１つ格納したパターン符号帳から１つのパターンベク
トルを取出し、現在のフレームの先頭を基準位置とし
て、そのフレーム内で基準位置から時間方向に、事前に
決められた複数ヶ所のサンプル位置のうちのひとつの位
置までシフトして立てることによって得られるベクトル
を上記雑音符号ベクトルとし、生成された駆動音源信号を、上記合成フィルタを通して
合成した波形ベクトルの入力音響信号ベクトルに対する
歪みを計算する過程で、上記合成フィルタのインパルス応答を要素とする行列
と、その転置行列との積を先に計算してメモリに展開し
ておき、このメモリの記憶を用いて計算する際に、上記積行列の要素をその数行または数列おきに値を保持
して、保持しない行または列の要素の値は、保持してい
る値で近似的に置き換えて計算する、ことを特徴とする音響信号符号化方法。
【請求項９】請求項１乃至８の何れかの音響信号符号
化方法において、上記パターンベクトルは２サンプルよりなる、ことを特徴とする音響信号符号化方法。