JP3285185B2 - 音響信号符号化方法 - Google Patents
音響信号符号化方法Info
- Publication number
- JP3285185B2 JP3285185B2 JP15055095A JP15055095A JP3285185B2 JP 3285185 B2 JP3285185 B2 JP 3285185B2 JP 15055095 A JP15055095 A JP 15055095A JP 15055095 A JP15055095 A JP 15055095A JP 3285185 B2 JP3285185 B2 JP 3285185B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- pattern
- channel
- frame
- encoding method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
の音響信号のスペクトル包絡特性を表すフィルタを、音
源ベクトルで駆動して音響信号を合成することを利用し
た予測符号化により、音響信号系列を少ない情報量でデ
ィジタル符号化する高能率音響信号符号化方法に関す
る。
効率的に利用したり、音声信号または音楽信号の蓄積サ
ービス等で記憶媒体を効率的に利用するために、高能率
音響信号符号化方法が用いられる。現在、音声信号を高
能率に符号化する方法として、原音声信号をフレームま
たはサブフレーム(以下フレームと総称する)と呼ばれ
る5〜50ms程度の一定間隔の区間に分割し、その1
フレームの音声信号を、周波数スペクトルの包絡特性を
表す線形フィルタの特性と、その線形フィルタを駆動す
るための駆動音源信号との2つの情報に分離し、それぞ
れを符号化する手法が提案されている。この手法におい
て、駆動音源信号を符号化する方法として、音声信号の
ピッチ周期(基本周波数)に対応すると考えられる周期
成分と、それ以外の成分とに分離して符号化する方法が
知られている。この駆動音源情報の符号化法の例とし
て、符号駆動線形予測符号化(Code-Excited Linear Pr
ediction:CELP)がある。この技術の詳細について
は、文献 M.R. Schroeder andB.S. Atal, "Code-Excit
ed Linear Prediction(CELP):High Quality Speech atV
ery Low Bit Rates", IEEE Proc. ICASSP-85, pp.937-9
40, 1985に記載されている。
す。入力端子1に入力された原音声信号(入力音声信
号)は、線形予測分析部2において、入力音声信号の周
波数スペクトル包絡特性を表す線形予測パラメータが計
算される。得られた線形予測パラメータは線形予測パラ
メータ符号化部3において、符号化されて線形予測パラ
メータ復号化部4に送られる。線形予測パラメータ復号
化部4では、受け取った符号からフィルタ係数を再生
し、合成フィルタ5および歪み計算部6に送る。なお、
線形予測分析の詳細および線形予測パラメータの符号化
例については、例えば古井貞煕著“ディジタル音声処
理”(東海大学出版会)に記載されている。ここで、線
形予測分析部2、線形予測パラメータ符号化部3、線形
予測パラメータ復号化部4および合成フィルタ5は非線
形なものに置き換えてもよい。
れた直前の過去の駆動音源ベクトル(既に量子化された
直前の1〜数フレーム分の駆動音源ベクトル)を入力さ
れた周期符号に相当する長さで切り出し、その切り出し
たベクトルをフレームの長さになるまで繰り返すことに
よって、入力音声信号の周期成分に対応する時系列ベク
トルの候補が出力される。
分に対応する1フレーム分の長さの時系列符号ベクトル
(雑音符号ベクトル)の候補が出力される。これらの候
補は入力音声信号とは独立に符号化のためのビット数に
応じてあらかじめ指定された数の候補雑音符号ベクトル
が記憶されている。適応符号帳7および雑音符号帳8か
ら出力された各時系列ベクトルの候補は、乗算部9,1
0においてそれぞれ重み符号帳11において作成された
重みが乗算され、加算部12において加算されて駆動音
源ベクトルの候補となる。
号化部4の出力をフィルタの係数とする線形フィルタ
で、加算部12の出力である駆動音源ベクトル候補を入
力として再生音声信号の候補を出力する。合成フィルタ
5の次数すなわち線形予測分析の次数は、一般に10〜
16次程度が用いられることが多い。なお、既に述べた
ように、合成フィルタ5は非線形なフィルタでもよい。
である再生音声信号の候補と、入力音声信号との歪みを
計算する。この歪みの計算は、例えば聴覚重み付けな
ど、合成フィルタ5の係数または量子化していない線形
予測係数を考慮にいれて行なうことが多い。符号帳検索
制御部13では、各再生音声信号候補の入力音声信号に
対する歪みが最小となるような周期符号、雑音符号およ
び重み符号を選択し、そのフレームにおける駆動音源ベ
クトルを決定する。
周期符号、雑音符号、重み符号と、線形予測パラメータ
符号化部3の出力である線形予測パラメータ符号は、符
号送出部14に送られ、利用の形態に応じて記憶装置に
記憶されるか、または通信路を介して受信側へ送られる
ために出力される。図6中の歪み計算部6の構成例を図
7に図6と対応する部分と同一符号を付けて示す。入力
音声信号である入力時系列ベクトルxと、合成フィルタ
5からの再生音声信号候補である合成信号ベクトルyの
間の歪みをはかる尺度の一例として、入力時系列ベクト
ルxを聴覚重みづけフィルタ16に通したベクトルxp
から、合成信号ベクトルyを聴覚重みづけフィルタ17
に通したベクトルyp を引算部18で差し引いたベクト
ルxp −yp から、歪み評価尺度として、 d=||xp −yp ||2 (1) を歪み評価尺度計算部19で計算し、歪み評価尺度dが
最小となるような合成信号ベクトルyを選択することに
よって、最適な周期符号、雑音符号、重み符号が選択さ
れる。聴覚重みづけフィルタ16,17を用いないこと
もある。このとき、すべての周期符号、雑音符号、重み
符号の組み合わせから、尺度dが最小になるものを選択
するのが、再生音声信号の歪みを小さくするうえで望ま
しいが、実際には演算処理量の問題から、周期符号、雑
音符号、重み符号の順に決めることも多い。重み符号
を、適応符号と雑音符号にかけるそれぞれの重みを、一
括してベクトル量子化しない場合には、周期符号、適応
符号重み、雑音符号、雑音符号重みの順に決定してもよ
い。重みを一括してベクトル量子化する場合でも、適応
符号重みを、暫定的に非量子化値(最適値)に設定して
おいて、周期符号、非量子化適応符号重み、雑音符号、
適応符号重みと雑音符号重みのベクトル量子化、の順に
決めても良い。また、各符号帳における選択を決める際
に、ただひとつの符号に決定してしまうのではなく、い
くつかの候補を残しておいて、それらの最適な組み合わ
せに決定してもよい。
き直したものである。合成フィルタ5、聴覚重みづけフ
ィルタ17は線形のフィルタであるから、図7に示すよ
うに、適応符号ベクトルと雑音符号ベクトルを、別々に
合成フィルタ21、聴覚重みづけフィルタ22と合成フ
ィルタ23、聴覚重みづけフィルタ24に通して、それ
ぞれを、入力音声時系列ベクトルxを聴覚重みづけフィ
ルタ16を通したxpから差し引いて歪み評価尺度を計
算することができる。
重みづけフィルタ24を合わせて、図8Bに示すように
等価なFIR型フィルタ25で実現することができる。
インパルス応答算出部26では、フィルタ23,24を
合わせた特性のフィルタ25のインパルス応答を計算
し、このインパルス応答と雑音符号ベクトルCに重みg
r をかけたベクトルgr cとの畳み込みをフィルタ25
で行うことによって、等価な線形フィルタを実現でき
る。このとき、インパルス応答算出部26から出力され
るインパルス応答を、h0 ,h1 ,h2 ,…,h
N-1 (Nは1フレームのサンプル数)として、hi を とおき、これをインパルス応答行列と呼ぶ。適応符号ベ
クトルと適応符号重みが、先にまたは暫定的に決まって
いるものとし、適応符号ベクトルに重みをかけ、図7A
において、合成フィルタ21および聴覚重みづけフィル
タ22を通した信号ベクトルを、引算部28でxp から
差し引いた信号、つまり入力音声信号ベクトルから周期
成分を除去した信号をrとおく。このとき、(1)式で
示される評価尺度dは、 d=||r−gr Hc||2 (3) に等しい。このとき、gr は雑音符号のあとで決定する
ため、ここでは任意の値をとりうると仮定し、gr で
(3)式を偏微分して、これをゼロとするgr を計算
し、そのgr を(3)式に代入すると(4)式となる。
ことは、(4)式を最大にする雑音符号ベクトルcを選
ぶことに等しい。
て、問題となるのは、低いビットレートで高い品質の再
生音声を得ようとする(圧縮率をあげようとする)と、
雑音符号帳に多くの雑音符号ベクトルを記憶するため
に、非常に多くのメモリを必要とするだけでなく、雑音
符号帳出力に重みをかけ、合成フィルタを通して歪みを
計算する一連の処理を、雑音符号帳に蓄えられる雑音符
号ベクトルの数だけ繰り返す処理に、非常に多くの演算
処理が必要となるという問題があった。
ed Linear Prediction(ACELP)という方式が提案
されている。この方式は、雑音符号帳にベクトルパター
ンを蓄えるのではなく、高さが1の正負パルスを、フレ
ーム内に数本、例えば、40サンプルのフレームに対し
て、4本を適当な位置に立てることによって、雑音符号
ベクトルを出力するものである。この方式では雑音符号
ベクトルを記憶するためのメモリが不要で、パルスを立
てる位置のテーブルのみをメモリに記憶すればよいとい
う特徴を持つ。また、演算処理量に関しても、従来のC
ELP方式に比べると、パルスが数本しかないために、
かなり少ない処理量で高い品質を実現できるというメリ
ットがある。なお、この方式は各パルスの位置と極性を
ランダムに取らせることにより雑音符号ベクトルとして
作用させるものであるが、ACELP方式の詳細は、例
えば、文献、R. Salami, C. Laflamme, and J-P. Adou
l,“8 kbit/s ACELP Coding of Speech with 10 ms Spe
ech-Frame: a Candidate for CCITT Standardization",
IEEE Proc. ICASSP-94, pp.II-97 に記載されている。
ても、実時間で符号化処理を実現するためには、高価な
ディジタルシグナルプロセッサ(DSP)が必要であ
り、安価なプロセッサで実現するためには、さらに演算
量の少ない方式でなければならない。ACELP方式
は、非常に簡単なモデル化で高品質な再生音声信号を実
現するという、すぐれた方式であるけれども、モデルが
簡単なゆえに、上記文献で提案されているよりも処理量
の低減を試みると、急速に再生音声信号の品質が劣化す
るという問題が生じる。
容される範囲内の少ないメモリ量、かつ非常に少ない演
算量で、高品質な再生音声信号を得ることを可能とする
音響信号符号化方法を提供することにある。
は、雑音符号ベクトルとして、数サンプルを単位とする
パターンベクトルを、フレーム内でシフトして、フレー
ム内に数個立てることによって雑音符号ベクトルを表現
し、パターンベクトルの形状と、シフト位置を効率的に
探索することによって、少ない演算処理で、高い品質の
再生音を得る音声の符号化方法を実現する。また、パタ
ーンベクトルを記憶するためのメモリは、従来のCEL
P方式に比べて、非常に少なくてよい。一方、ACEL
P方式に比べると、より実際の音声の特徴にあったパタ
ーンベクトルを用意し、効率的にシフト位置を探索する
ことによって、演算量がより少なく、高品質な符号化方
法を実現する。
した符号化装置の機能的構成例を示し、図6と対応する
部分に同一符号を付けてある。この発明では雑音符号帳
8の代りに雑音符号帳31が設けられる。雑音符号帳3
1には複数のパターン符号帳321 〜32M が設けら
れ、これら各パターン符号帳321 〜32M にはそれぞ
れ数サンプルからなるパターンベクトルが1乃至10程
度記憶されている。つまり各パターンベクトルは例えば
連続するnサンプル点からなり、そのnサンプル点以外
のサンプル点はゼロである。符号帳321 〜32M は保
持するパターンベクトルは共通のものとしてもよい。
れぞれ符号帳検索制御部13からのパターン符号331
〜33M により指定されてパターンベクトルが取出され
る。これら取出されたパターンベクトルはそれぞれ乗算
部341 〜34M で符号帳検索制御部13からのサイン
符号351 〜35M に応じて+1又は−1が乗算され、
つまり極性が制御される。これら乗算部341 〜34M
の出力はシフト部361 〜36M で符号帳検索制御部1
3からの位置符号371 〜37M に応じてフレーム内の
位置に配置される。シフト部361 〜36M の各出力は
加算されて1フレームの雑音符号ベクトルとして乗算部
10へ出力される。つまり、1フレーム分のバッファに
対し各極性制御されたパターンベクトルが位置符号に応
じたサンプル点に配置され、その際重なる時は加算さ
れ、そのバッファから雑音符号ベクトルが出力される。
つまりパターン符号により決められるパターンベクトル
を位置符号によりフレーム上に配置したパターンベクト
ルを生成するチャネルをM個有し、そのMチャネルより
のパターンベクトルの和により雑音符号ベクトルを生成
する。各パターンベクトルのnサンプル点は、連続しな
いでとびとびのサンプル点でもよい。
互に重なってもよく、例えば3サンプルパターンベクト
ルの二つがその最後のサンプルと最初のサンプルとが重
なるように配置してもよい。しかし例えば、第kチャネ
ルでは、 t=nMj+(k−1)n; j=0,1,2,…,S (5) で示される位置に配置するようにする。Mはチャネル
数、nはパターンベクトルのサンプル数である。この場
合はあるサンプル点は、いずれか1チャネルでのみ表現
され、複数のパターンベクトルが重なることはない。す
なわち、各チャネルのシフト部から出力されるベクトル
は、チャネル相互で0以外の値を同一サンプル点にもた
ない。ここで、Sは、フレーム(サブフレーム)長N
と、n,Mによって決まる値である。雑音符号として
は、各チャネルにおけるパターンベクトルのインデック
ス(パターン符号)と、シフト位置インデックス(位置
符号)と、サイン符号とが出力される。
成するとき、場合によっては、あるチャネルで表現でき
るパターンベクトルおよびシフト位置から生成されるベ
クトルのいずれを使用しても、そのチャネルから出力さ
れるベクトルを使用しない場合よりも、歪みが増える
(歪み評価尺度(4)式が小さくなる)ことがある。そ
の場合には、当該チャネルを使用しないことを表わすコ
ード(符号)を用意し、復号側でそのコードを受け取っ
たときには、当該チャネルから出力されるベクトルを加
算しないことにすると、再生品質が劣化しない。また、
ビットレートの制限によっては、Mチャネル分の情報を
送信または蓄積できないことがある。その場合には、チ
ャネル数Mを減らすことによって、ビットレートを下げ
られるが、単純にMを小さくするのではなく、Mはその
ままにして、第eチャネルと第fチャネルのいずれか歪
みの低減に効果的なチャネルを符号化フレームごとに選
択して切り替えることによって、実質的なチャネル数を
減らしてビットレートを下げる一方、再生音の品質劣化
を抑えることができる。
ル、N=40サンプル、S=4個所、ベクトルパターン
は各チャネル4パターンとした場合について具体的に説
明する。各パターン符号帳321 〜325 には、2サン
プルからなる4種類のパターンベクトルが格納される。
この4パターンの形状は、代数的に、例えば、{+1,
0},{0,+1},{+1,+1},{+1,−1}
のように決めてもよい。この決定は例えば図1中の合成
フィルタ5の入力パルスを観察し、発生頻度の多い2サ
ンプルの組の状態から行う。より音声の特徴を表すよう
に、学習手続き、すなわち、大量の音声データを符号化
してみて、その歪みの総和が最小となるようなパターン
を代表パターンとして用いるほうが、高い品質を実現す
ることができる。この場合のパターンベクトルの例を図
2Aに示す。パターン符号帳にはこの各二つのサンプル
点の値が組として格納される。
配置位置は40点のうち次の4個所の何れかとなり、 (0,1),(10,11),(20,21),(3
0,31) 第2チャネルのパターンの配置位置は、次の4個所の何
れかとなり、 (2,3),(12,13),(22,23),(3
2,33) 第3チャネルのパターンの配置位置は、次の4個所の何
れかとなる。
5),(34,35) 第4,第5チャネルのパターンも以下同様にして決る。
つまり図2Bに示すように、第1チャネルのパターンベ
クトル391 は(20,21)に配置されているか、点
線で示す他の3個所の何れかを取ることができる。同様
に第2乃至第5チャネルの各パターンベクトル392 〜
395 はそれぞれ図に示している位置以外に点線で示す
各3個所の何れかを取ることができる。第1乃至第5チ
ャネルの各パターンベクトルをフレーム上に配置してベ
クトル的に加えて雑音符号ベクトル41が得られる。図
2Bに示した例では各パターン符号帳321 〜325 に
互いに異なる4種類のパターンベクトルを格納した場合
である。
り、4種類のパターンの何れであるかを表すために2ビ
ット、4個所の配置位置の何れであるかを表すために2
ビット、パターンベクトルの正負を表すために1ビット
の計5ビットとなる。5チャネル分の全てを送出する
と、1フレーム(サブフレーム)あたり、25ビット必
要になる。ある特定のチャネルから出力されたベクトル
を使用しないためのコードを割り当てる場合には、これ
を示すビットを別途割当てもよいが、そのチャネルにお
いてあるパターンの、ある配置位置、ある正負符号の場
合を例外として「使用しないためのコード」に割り当て
ると、ビットレートを上げずに、品質を向上させること
ができる。この場合、そのチャネルにおいて本来そのコ
ードに割り当てられていた形状を表現できなくなるが、
それによる品質の劣化分よりも、品質の向上分のほうが
大きいような形状コードを選ぶ。
きに、5チャネルをフルに使用して25ビットを使用す
るのは、若干無駄である。その場合には、例えば、図3
Aに示すように第3チャネルのシフト部363 の出力と
第5チャネルのシフト部36 5 の出力とをスイッチ手段
43で切替え、第1乃至第4チャネルを使用する場合
と、第1、第2、第4、第5チャネルを使用する場合と
を符号化フレームごとによい方を選択し、その何れを選
択したかを示すビットを1つ加えることにより、4チャ
ネル分の出力符号の4×5ビットに1ビット加え、21
ビットを符号化出力とすればよい。
省略し、第3チャネルのシフト部363 と第5チャネル
のシフト部365 とをスイッチ手段44で切替え、使用
し、切替えのためのビットとして1ビット使用してフレ
ームあたり21ビット出力としてもよい。また第3チャ
ネルと第4チャネルの切替えを行うと共に更に例えば第
2チャネルと第4チャネルを切り替えると、送信パター
ンとして第1,2,3チャネルあるいは第1,3,4チ
ャネル、第1,2,5チャネル、第1,4,5の何れか
となり、17ビットでよい。このような切り替えをする
場合、隣接するチャネルどうしで切り替えてもよいが、
2チャネル以上離れたチャネルと切り替えたほうが効果
的である。また、例えば、第3チャネルと第5チャネル
を切り替え、残った4つのチャネルの中から、歪み低減
に貢献度の高い3つのチャネル分を選択して使用する方
法も効果的である。この切り替えの方法では、どのチャ
ネルを選択したかを表すのに、2ビット必要となり、合
計(サブ)フレームあたり18ビット必要になるが、貢
献度の低いチャネルを捨てることで、17ビットの場合
よりも高い品質を実現できる。
号を探索する実施例を示す。演算量を問わなければ、5
チャネルの、すべてのベクトルパターン、配置位置、正
負符号の組み合わせの中から、(4)式を最大にする組
み合わせを選択すればよいが、それでは、ACELP方
式よりも逆に演算量が増えてしまう。この発明のねらい
は、ACELPよりも音声データを表現しやすいモデル
化を行うことによって、演算量を削減しても、品質の劣
化を生じない方法を実現するところにある。
フレームあたり21ビットに符号化の場合の一探索例を
示す。 ステップ1.第1予備選択として、第1、第2、第4チ
ャネルは4配置位置から、第3、第5チャネルは切り替
えのため合わせて8配置位置から、各3個所の位置を予
備選択する。その選択のための尺度は、例えばrt Hの
各パターンベクトル配置位置(2サンプル)における絶
対値の和の大きい順に選択するとよい。つまりrt Hは
フレームの各サンプル点と対応して、この例では40個
の値をもっており、例えば第1チャネルの配置位置0番
目と1番目と対応してrt Hの0番目と1番目の各値の
絶対値の和をとる。以下同様にすべての配置位置につい
て、前記絶対値の和をとり、これらすべての絶対値の和
の大きい順に、第1、第2、第4チャネルから各3つ、
第3、第5チャネルから3つの配置位置を選択する。こ
の絶対値の和が大きいということは、フレーム中のその
サンプル点位置に、駆動音源ベクトルのパルスが立ちそ
うであることを示している。なおrt は入力音声信号と
対応した信号(図8A中の引算部28の出力)の時間軸
を反転した時系列ベクトル、つまり信号rのサンプル列
の時間的配列を逆としたものである。
備選択で得られた各チャネルについて3つの配置位置
と、対応チャネルの4パターンベクトルとの組み合わせ
た12個の候補の中から、4つのパターンと配置位置の
組み合わせを予備選択する。第kチャネルのシフト部か
ら出力されるベクトルをckとすると、この第2予備選
択の選択尺度には、|rt Hck|/ckt ckを用い
るとよい。この分子のみでもよいが、分母も含めたほう
が大きさにより正規化され、予備選択による品質の低下
を抑えることができる。なお、rt Hは第1予備選択で
計算した値をそのまま利用すればよい。また、ckt c
kは、パターンベクトルのパワであるから、事前にメモ
リに展開しておけば、毎フレーム毎に計算する必要はな
い。Hckはパターンベクトル候補ckを合成フィルタ
25(図8B)に通した時系列、また合成フィルタは2
5のインパルス応答とckとを畳み込んだ時系列ベクト
ルである。この時系列ベクトルとrt との内積の絶対値
の代りにその内積の二乗値を用いてもよい。
ャネルの4つの候補のうち、各チャネル毎の第1候補つ
まり尺度が最も大きかったものを取出し、その4つの第
1候補を大きい順に並べ、並べ替えた順に対応チャネル
をチャネル1′,2′,3′,4′とする。 ステップ4.チャネル1′と2′の各4組の組み合わせ
(16通り)の中から、(4)式を最大にする組み合わ
せを選択する。(4)式の分子の計算では、r t Hck
は第2予備選択で用いた値をそのまま利用する。分母の
計算では、各フレームに1回、Ht Hのマトリクスを先
に計算してメモリに展開し、ckのゼロでないサンプル
点が関係する項のみを計算すればよい。なお、(サブ)
フレーム長が40サンプルのとき、Ht Hをそのままメ
モリに展開すると、40*40=1600ワードのメモ
リが必要になるが、実際には、Ht Hは対称行列である
ため、左下または右上の三角形部分の値のみを記憶すれ
ば、820ワードのメモリでよい。それでもメモリ(R
AM)の容量が多すぎるときは、Ht Hを左下三角行列
にした後、例えば、21行目から24行目要素は、すべ
て25行目の値で代用するなど、Ht Hの要素の一部を
とびとびで保持するなどによって、メモリ量を低減する
ことができる。実験の結果、21行目から35行目まで
を、5行おきに値を保持することによって、490ワー
ドのメモリで、ほとんど品質が劣化しないことが確認さ
れた。また、この方法では、Ht Hの計算に要する演算
時間も少なくできる。これはHt Hの各要素は隣り合っ
ているものの値は比較的近い値であるが、離れている要
素間では値が可成り異なるから、このような近似が可能
となる。
の組み合わせ(16通り)の中から、(4)式を最大に
する組み合わせを選択する。計算手順に関しては、ステ
ップ4と同様である。(サブ)フレームあたり、18ビ
ットまたは17ビットにする場合は、前出のようにチャ
ネルを切り替えて使用すれば、ビットレートを下げられ
るだけでなく、演算量も21ビットの場合にくらべて削
減できる。なお、18ビットの場合のチャネルの選択
は、上記ステップ5で、チャネル3′か4′のいずれか
から、(4)式が大きくなるほうを選択して、他方を捨
てることで選択する。
よく、つまり1チャネルでもよく、つまり1、2、4、
8、又は16程度とされる。また各パターン符号帳に格
納するパターンベクトルは1つでもよい。図1では各パ
ターン符号帳の出力パターンベクトルに対してサイン符
号351 〜35M を乗算したが、サイン符号351 〜3
5M を省略してもよい。各チャネルの出力、つまり図1
中のシフト部361 〜36M の出力のベクトル和を求め
るが、その際上述したようにゼロでないサンプル点が重
なってもよい。この場合探索手順は前述と同様に行えば
よいが、重なりを許すため探索位置が多くなり、それだ
け処理量が多くなる。つまり、チャネル間でパターンベ
クトルの配置位置が互いに重ならないようにすると、最
適配置位置の探索を効率的に行うことができる。
1予備選択を省略してもよい。しかし第1予備選択をす
ればそれだけ最適配置位置の探索の効率が向上する。合
成フィルタ25としてはFIR型フィルタに限られるも
のでない。次にこの発明により符号化された信号に対す
る復号化装置を、図4を参照して詳細に説明する。
52で各符号に分離され、線形予測パラメータ符号はL
PC係数レジスタ53に格納され、周期符号は周期レジ
スタ54に格納され、重み符号は重みレジスタ55に格
納され、雑音符号、つまりパターン符号331 〜3
3M 、サイン符号351 〜35M 、位置符号371 〜3
7 M が雑音符号レジスタ56に格納される。LPC係数
レジスタ53内の線形予測パラメータ符号は線形予測パ
ラメータ復号化部57で復号され、フィルタ係数が求め
られて合成フィルタ58に設定される。合成フィルタ5
8の駆動信号ベクトルは分岐されて適応符号帳59に入
力される。適応符号帳59は周期レジスタ54内の周期
符号に応じた長さの過去の駆動ベクトルが取出され、そ
れが1フレーム分繰返されて乗算部61へ出力される。
重みレジスタ55内の重み符号が復号化され、適応符号
帳用重み、雑音符号帳用重みがそれぞれ乗算部61,6
2へ出力される。符号化装置のパターン符号帳321 〜
32M と同一のパターン符号帳631 〜63M が設けら
れる。例えば各パターン符号帳631 〜63M に2サン
プルのパターンベクトルが4つそれぞれ格納されてい
る。これらパターン符号帳631 〜63M は対応チャネ
ルのパターン符号331 〜33M によりそれぞれパター
ンベクトルが取出される。これら取出されたパターンベ
クトルは乗算部641 〜64 M でそれぞれサイン符号3
51 〜35M に応じて+1又は−1が乗算される。乗算
部641 〜64M の出力パターンベクトルはそれぞれ配
置部651 〜65M により位置符号371 〜37M に応
じたフレーム上の位置と対応して1フレーム分、例えば
40ポイント分の駆動源バッファ66内に格納される。
駆動源バッファ66は各フレームごとにシリアルに出力
され、雑音符号ベクトルとして乗算部62へ供給され、
重みが乗算された後、加算部67で乗算部61からの重
み付けられた適応符号帳出力と加算され、駆動ベクトル
として合成フィルタ58へ供給される。
して復号化される。図3Aに示した雑音符号ベクトルの
生成と対応する復号化方法を、その要部のみを示す図5
Aを参照して説明する。雑音符号レジスタ56内にパタ
ーン符号333 、サイン符号353 、位置符号373 又
はパターン符号335 、サイン符号355 、位置符号3
75 が1チャネル分として格納され、そのパターン符号
によりパターン符号帳633 、635 の両方からパター
ンベクトルが取出され、それらパターンベクトルが乗算
部643 ,645 で前記1チャネル分として格納されて
いるサイン符号により+1又は−1が乗算され、更に配
置部653 、655 により位置符号に応じてバッファ6
6に配置格納される。この際にレジスタ56中の符号帳
切替えを示す1ビットの切替符号68により切替え手段
69が制御され、符号化側で第3チャネルが出力された
場合は配置部653 の出力側がバッファ66に接続さ
れ、第5チャネルが出力された場合は配置部655 の出
力側がバッファ66に接続される。その他は図4の構成
と同様である。
応した復号化方法の要部を図5Bに示す。この場合は雑
音符号レジスタ56に、第3チャネルの符号として、パ
ターン符号333 とサイン符号353 と、位置符号37
3 又は375 とその位置符号の何れかを示す選択符号7
1とが格納され、そのパターン符号333 によりパター
ン符号帳633 が読出され、その読出されたパターンベ
クトルは乗算部643でサイン符号353 に応じて+1
又は−1が乗算され、その乗算されたベクトルは配置部
653 と655 とへ供給される。位置符号373 、37
5 の何れが入力されても配置部653 、655 の両者が
制御され、配置部653 、655 の出力側は選択符号7
1に応じて切替え手段72が制御され、符号化側でシフ
ト部36 3 が選択された場合は配置部653 がバッファ
66に接続され、シフト部365が選択された場合は配
置部655 がバッファ66に接続される。
条件は符号化側と同一とすることで自づと定まる。上述
では主として音声信号の符号化、復号化にこの発明を適
用したが音楽信号の符号化、復号化にも適用できる。
方式による場合とで、雑音符号ベクトル探索にかかる演
算時間と再生音声の品質(SN比)を比較したものを図
5Cに示す。演算時間は、ワークステーションで、シミ
ュレーションプログラムを実行したときに要したCPU
時間である(Ht Hの演算時間は含まない)。この結
果、ACELP方式に比べても、非常に少ない演算量
で、高い品質を実現できることが確認された。
によれば複数のサンプル点よりなるパターンベクトル
を、フレーム上のどの位置に配置するかにより雑音符号
ベクトルを生成するため、このパターンベクトルをくず
さず、それだけ制限され、従来のACELP方式のよう
に各1個のパルスがフレーム上すべての位置をとる場合
と比較して探索数が少なくても済む。
連続する2対のパルスが多いことから、連続する2サン
プルのパターンベクトルを用いる場合は整合性がよく、
予備選択を導入しても、誤選択となるおそれが少なく、
少ない演算量で正しい符号化、つまり良品質の符号化を
行うことができる。
号化装置の機能構成例を示すブロック図。
この発明方法における各チャネルのパターンベクトルと
その取り得るフレーム上の位置との例、その和ベクトル
である雑音符号ベクトルを示す図である。
帳31の例を示すブロック図、Bは請求項3の発明の符
号化方法を適用した雑音符号帳31の例を示すブロック
図である。
部を示すブロック図、Bは他の雑音符号ベクトル再生部
の要部を示すブロック図、Cはこの発明の符号化方法、
従来のACELPによる雑音符号ベクトル探索処理時間
を示す図である。
成図。
図。
で置き換えたブロック図、Bは図8A中のフィルタ2
3,24を1つのフィルタで実現した例を示すブロック
図である。
Claims (9)
- 【請求項1】 適応符号帳から、フレームにあるいはサ
ブフレーム(以下両者を総称してフレーム単位と記す)
単位に取り出した過去の駆動音源ベクトルを、ピッチ周
期に対応する周期により繰り返して作成した時系列ベク
トル、雑音符号帳から取り出した雑音符号ベクトルの時
系列ベクトル、あるいはこれらの両方より得られる時系
列ベクトルにより、合成フィルタを駆動して音響信号を
再生して入力音響信号ベクトルに対する歪が最小になる
ように上記適応符号帳、上記雑音符号帳の選択を行う音
響信号符号化方法において、 少くとも2サンプルからなるパターンベクトルを少くと
も1つ格納したパターン符号帳から1つのパターンベク
トルを取出し、現在のフレームの先頭を基準位置とし
て、そのフレーム内で基準位置から時間方向に、事前に
決められた複数ヶ所のサンプル位置のうちのひとつの位
置までシフトして立てることによって得られるベクトル
を1チャネルとして、 複数のチャネルから得られるベクトルの和ベクトルを、
上記雑音符号ベクトルとし、 上記複数のチャネルの中から、2あるいは複数のチャネ
ルを選択し、 その選択したチャネルのうち、1つあるいは複数のチャ
ネルのパターン情報およびシフト位置情報を出力しない
ことにより、情報を送信するチャネルを切り換える、 ことを特徴とする音響信号符号化方法。 - 【請求項2】 請求項1に記載の音響信号符号化方法に
おいて、 あるチャネルにおける、パターンベクトルのシフトしう
るサンプル位置を、他のチャネルにおいてパターンベク
トルのシフトしうるサンプル位置のいずれとも重複しな
いように設定する、 ことを特徴とする音響信号符号化方法。 - 【請求項3】 請求項1に記載の音響信号符号化方法に
おいて、 上記選択したチャネルのパターン情報が同じである、 ことを特徴とする音響信号符号化方法。 - 【請求項4】 請求項1に記載の音響信号符号化方法に
おいて、 フレーム内の入力音響信号と対応した信号のサンプル列
の時間配列を逆とした時系列ベクトルを、上記合成フィ
ルタに通した、あるいはその合成フィルタのインパルス
応答と畳み込んだ時系列ベクトルを用いて、各チャネル
におけるシフト位置の候補をより少ない数の候補に予備
選択する、 ことを特徴とする音響信号符号化方法。 - 【請求項5】 請求項1に記載の音響信号符号化方法に
おいて、 各チャネルにおいてとりうる、パターンベクトルの候補
と、シフト位置の候補のすべての組み合わせから、1チ
ャネル分の駆動ベクトル候補を生成し、 フレーム内の入力音響信号と対応する信号のサンプル信
号の時間的配列を逆方向にした時系列ベクトルを、上記
合成フィルタに通した、あるいは上記合成フィルタのイ
ンパルス応答と畳み込んだ時系列ベクトルと上記生成し
た駆動ベクトル候補との内積の絶対値、または内積の二
乗値、あるいは、上記内積の絶対値を上記生成駆動ベク
トル候補のパワーで除した値によって、候補の組み合わ
せを予備選択する、 ことを特徴とする音響信号符号化方法。 - 【請求項6】 請求項4に記載の音響信号符号化方法に
おいて、 各チャネルにおいてとりうる、パターンベクトルの候補
と、上記予備選択後のシフト位置の候補のすべての組み
合わせから、1チャネル分の駆動ベクトル候補を生成
し、 フレーム内の入力音響信号と対応した信号のサンプル信
号の時間的配列を逆とした時系列ベクトルを、上記合成
フィルタに通した、あるいはその合成フィルタのインパ
ルス応答と畳み込んだ時系列ベクトルと上記駆動ベクト
ル候補との内積の絶対値、または内積の二乗値、あるい
は、上記内積の絶対値を上記駆動ベクトル候補のパワー
で除した値によって、候補の組み合わせを更に予備選択
する、 ことを特徴とする音響信号符号化方法。 - 【請求項7】 適応符号帳から、フレームにあるいはサ
ブフレーム(以下両者を総称してフレーム単位と記す)
単位に取り出した過去の駆動音源ベクトルを、ピッチ周
期に対応する周期により繰り返して作成した時系列ベク
トル、雑音符号帳から取り出した雑音符号ベクトルの時
系列ベクトル、あるいはこれらの両方より得られる時系
列ベクトルにより、合成フィルタを駆動して音響信号を
再生して入力音響信号ベクトルに対する歪が最小になる
ように上記適応符号帳、上記雑音符号帳の選択を行う音
響信号符号化方法において、 少くとも2サンプルからなるパターンベクトルを少くと
も1つ格納したパターン符号帳から1つのパターンベク
トルを取出し、現在のフレームの先頭を基準位置とし
て、そのフレーム内で基準位置から時間方向に、事前に
決められた複数ヶ所のサンプル位置のうちのひとつの位
置までシフトして立てることによって得られるベクトル
を1チャネルとして、 複数のチャネルから得られるベクトルの和ベクトルを、
上記雑音符号ベクトルとし、 各チャネルにおいてとりうる、パターンベクトルの候補
と、シフト位置の候補のすべての組み合わせから、1チ
ャネル分の駆動ベクトル候補を生成し、 フレーム内の入力音響信号と対応する信号のサンプル信
号の時間的配列を逆方向にした時系列ベクトルを、上記
合成フィルタに通した、あるいは上記合成フィルタのイ
ンパルス応答と畳み込んだ時系列ベクトルと上記生成し
た駆動ベクトル候補との内積の絶対値、または内積の二
乗値、あるいは、上記内積の絶対値を上記生成駆動ベク
トル候補のパワーで除した値によって、候補の組み合わ
せを予備選択し、 パターンベクトルとシフト位置の組み合わせを予備選択
したときの尺度の値のうち、各チャネルにおける第一位
の候補の尺度の値を、チャネル相互で比較して、値の大
きい順に2あるいは数チャネル選択し、 その選択されたチャネルから生成される駆動音源信号
を、上記合成フィルタを通して合成した波形ベクトル
の、入力音響信号ベクトルに対する歪みが最小になるよ
うに、当該チャネルにおけるパターンベクトルとシフト
位置を決定し、 残りのチャネルの全部、または一部から生成される駆動
音源信号を、先に決定したチャネルによって生成される
駆動音源信号に加算し、上記合成フィルタを通して合成
した波形ベクトルの、入力音響信号ベクトルに対する歪
みが最小になるように、当該チャネルにおけるパターン
ベクトルとシフト位置を決定する、 ことを特徴とする音響信号符号化方法。 - 【請求項8】 適応符号帳から、フレームにあるいはサ
ブフレーム(以下両者を総称してフレーム単位と記す)
単位に取り出した過去の駆動音源ベクトルを、ピッチ周
期に対応する周期により繰り返して作成した時系列ベク
トル、雑音符号帳から取り出した雑音符号ベクトルの時
系列ベクトル、あるいはこれらの両方より得られる時系
列ベクトルにより、合成フィルタを駆動して音響信号を
再生して入力音響信号ベクトルに対する歪が最小になる
ように上記適応符号帳、上記雑音符号帳の選択を行う音
響の符号化方法において、 少くとも2サンプルからなるパターンベクトルを少くと
も1つ格納したパターン符号帳から1つのパターンベク
トルを取出し、現在のフレームの先頭を基準位置とし
て、そのフレーム内で基準位置から時間方向に、事前に
決められた複数ヶ所のサンプル位置のうちのひとつの位
置までシフトして立てることによって得られるベクトル
を上記雑音符号ベクトルとし、 生成された駆動音源信号を、上記合成フィルタを通して
合成した波形ベクトルの入力音響信号ベクトルに対する
歪みを計算する過程で、 上記合成フィルタのインパルス応答を要素とする行列
と、その転置行列との積を先に計算してメモリに展開し
ておき、このメモリの記憶を用いて計算する際に、 上記積行列の要素をその数行または数列おきに値を保持
して、保持しない行または列の要素の値は、保持してい
る値で近似的に置き換えて計算する、 ことを特徴とする音響信号符号化方法。 - 【請求項9】 請求項1乃至8の何れかの音響信号符号
化方法において、 上記パターンベクトルは2サンプルよりなる、 ことを特徴とする音響信号符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15055095A JP3285185B2 (ja) | 1995-06-16 | 1995-06-16 | 音響信号符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15055095A JP3285185B2 (ja) | 1995-06-16 | 1995-06-16 | 音響信号符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH096396A JPH096396A (ja) | 1997-01-10 |
JP3285185B2 true JP3285185B2 (ja) | 2002-05-27 |
Family
ID=15499331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15055095A Expired - Lifetime JP3285185B2 (ja) | 1995-06-16 | 1995-06-16 | 音響信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3285185B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1071081B1 (en) | 1996-11-07 | 2002-05-08 | Matsushita Electric Industrial Co., Ltd. | Vector quantization codebook generation method |
JP4173940B2 (ja) | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
KR100580752B1 (ko) | 2004-12-23 | 2006-05-15 | 엘지이노텍 주식회사 | 질화물 반도체 발광소자 및 그 제조방법 |
WO2008108077A1 (ja) * | 2007-03-02 | 2008-09-12 | Panasonic Corporation | 符号化装置および符号化方法 |
BRPI0814129A2 (pt) * | 2007-07-27 | 2015-02-03 | Panasonic Corp | Dispositivo de codificação de áudio e método de codificação de áudio |
JP5483813B2 (ja) * | 2007-12-21 | 2014-05-07 | 株式会社Nttドコモ | マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 |
-
1995
- 1995-06-16 JP JP15055095A patent/JP3285185B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH096396A (ja) | 1997-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5819213A (en) | Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks | |
EP0476614B1 (en) | Speech coding and decoding system | |
KR100938017B1 (ko) | 벡터 양자화 장치 및 방법 | |
JP3346765B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP3094908B2 (ja) | 音声符号化装置 | |
JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
CA2430111C (en) | Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs | |
JP3224955B2 (ja) | ベクトル量子化装置およびベクトル量子化方法 | |
CA2159571C (en) | Vector quantization apparatus | |
EP0610906A1 (en) | Device for encoding speech spectrum parameters with a smallest possible number of bits | |
JP3285185B2 (ja) | 音響信号符号化方法 | |
JP2956473B2 (ja) | ベクトル量子化装置 | |
JPH0944195A (ja) | 音声符号化装置 | |
US7337110B2 (en) | Structured VSELP codebook for low complexity search | |
JP3095133B2 (ja) | 音響信号符号化方法 | |
JP3238063B2 (ja) | ベクトル量子化方法および音声符号化方法 | |
JP2626492B2 (ja) | ベクトル量子化装置 | |
JP3148778B2 (ja) | 音声の符号化方法 | |
JP3268750B2 (ja) | 音声合成方法及びシステム | |
JP3263347B2 (ja) | 音声符号化装置及び音声符号化におけるピッチ予測方法 | |
JPH0764600A (ja) | 音声のピッチ符号化装置 | |
JP2943983B1 (ja) | 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳 | |
JP3579276B2 (ja) | 音声符号化/復号化方法 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JPH113098A (ja) | 音声符号化方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090308 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090308 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100308 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110308 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110308 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120308 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130308 Year of fee payment: 11 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |