JPH09130260A - 音響信号の符号化装置及び復号化装置 - Google Patents

音響信号の符号化装置及び復号化装置

Info

Publication number
JPH09130260A
JPH09130260A JP7301909A JP30190995A JPH09130260A JP H09130260 A JPH09130260 A JP H09130260A JP 7301909 A JP7301909 A JP 7301909A JP 30190995 A JP30190995 A JP 30190995A JP H09130260 A JPH09130260 A JP H09130260A
Authority
JP
Japan
Prior art keywords
data
vector
phase component
amplitude
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7301909A
Other languages
English (en)
Other versions
JP3159012B2 (ja
Inventor
Kenji Kinetsuki
兼史 杵築
Toshihiro Maruyama
俊弘 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP30190995A priority Critical patent/JP3159012B2/ja
Publication of JPH09130260A publication Critical patent/JPH09130260A/ja
Application granted granted Critical
Publication of JP3159012B2 publication Critical patent/JP3159012B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音響信号(PCM信号)をMDCTで直交変換
し、ベクトル量子化方式でデータ伝送を行う場合に、小
サイズのコードブックで高能率な符号化を実現し、伝送
効率の向上を図る。 【解決手段】 MDCT器1で得られたMDCT係数X
(n)を振幅・位相分離器2で振幅成分a(m)と位相成分θ
(m)に分離し、帯域分割・ベクトル化器3でベクトル化し
た後、各成分データ毎に設けたコードブック5,6を用い
て各ベクトル量子化器7,8が振幅と位相に係るインデッ
クスデータIDa,IDbへ変換して伝送する。振幅と位
相の各成分に分離したため、ベクトル化の変換次元数を
統計的分布の偏りの大きい振幅成分a(m)側よりその偏
りが小さい位相成分θ(m)側が小さくなるようにし、音
響信号の特質に適合した有効なビット配分により高能率
な符号化を実現すると共にコードブック全体のデータ量
の低減化を図る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音響信号の符号化装
置及び復号化装置に係り、PCM(Pulse Code Modulati
on)方式で変調された音響信号をMDCT(Modified Dis
crete Cosine Transform)方式で直交変換すると共に振
幅成分と位相成分に分離してベクトル量子化する高能率
符号化技術と、その符号化データの復号化技術に関す
る。
【0002】
【従来の技術】従来から、音響信号の高能率符号化に関
しては、MPEG(Moving Picture Experts Group)-Aud
io等に代表されるように、時間領域のサンプル信号を周
波数領域に写像し、周波数領域でのエネルギの偏在に係
るビット割当てをサンプル毎に人間の心理聴覚特性を利
用して量子化歪を制御することによって行われている。
このような符号化方式は所謂スカラー量子化の手法に基
づくものであるが、平均1(bit/sample)を下回るような
低ビットレートでの符号化では極端に量子化歪が大きく
なる。
【0003】そこで、いくつかのサンプルをまとめて量
子化するベクトル量子化の導入が考えられる。ここに、
「ベクトル量子化」とは、従来から動画像符号化方式に適
用されてきたものであり、被写体を表現する各種のベク
トルデータのパターンをインデックスデータと対応付け
てコードブックに格納しておき、動画像データの伝送に
おいてそのインデックスデータのみを伝送するものであ
る。そして、そのベクトル量子化を音響信号に適用する
方式としては、信号波形そのものをベクトル量子化する
方式や、線形予測残差信号をベクトル量子化する方式
や、直交変換係数をベクトル量子化する方式が試されて
いる。しかし、信号波形そのものや線形予測残差信号に
ベクトル量子化を適用する方式は、変化が激しく時系列
的相関が弱いという特性を有した広帯域(オーディオ帯
域)音響信号には適していない。一方、直交変換係数を
ベクトル量子化する方式については周波数領域でのエネ
ルギの偏在性を利用でき、前記の広帯域音響信号の高能
率符号化に適している。
【0004】従って、直交変換とベクトル量子化を組み
合わせた音響信号の符号化方式については「オーディオ
信号の変換符号化への変換係数のVQの導入」(熊田他,
日本音響学会講演論文集,93/10,p.307)等の技術が開示
されている。図8はその符号化装置の構成例を示す。同
図においては、先ず、入力されるPCMデータに対して
MDCT器51でMDCT方式による直交変換がなされ、
そのMDCT係数を周波数方向に沿って4次元ベクトル
化器52で4個の係数データ毎に4次元ベクトルデータに
変換する。次に、正規化演算器53では、各ベクトルデー
タのrms(二乗平均平方根)値を求め、そのrms値を
対数量子化すると共に、その対数量子化されたrms値
に応じて各ベクトルデータに量子化ビットを割り当て、
各ベクトルデータをrms値で正規化する。一方、コー
ドブック54に対しては、音響信号の学習サンプルに前記
と同様のMDCT直交変換とMDCT係数の4次元ベク
トル化と正規化処理を施したベクトルデータに対応付け
てインデックスデータが登録されている。そこで、正規
化されたベクトルデータを検索キーとしてベクトル量子
化器55がコードブック54を検索し、対応したインデック
スデータが読出される。また、割り当てられたビット数
に余分があれば、それと4次元ベクトル化器52から得ら
れる元のDCT係数データを減算器56へ入力させること
で量子化誤差を求め、更にスカラー量子化器57でその量
子化誤差をスカラー量子化する。そして、マルチプレク
サ58で前記のrms値とインデックスデータと量子化誤
差データを多重化したビットストリームを構成して伝送
路へ出力させる。
【0005】
【発明が解決しようとする課題】ところで、上記の論文
で報告されている内容によると、図8の符号化装置での
SN比は、90〜208kbpsの範囲において従来のス
カラー量子化方式と比較して約2〜3dB程度の改善が見
られて良好な結果が得られているが、90kbpsでは一
般的なスカラー量子化方式の場合との差が小さくなって
きており、その傾向から見て更に低いビットレートへの
適用は困難になると予測される。
【0006】そして、その原因は次のように考察され
る。先ず、本質的にベクトル量子化はデータの統計的分
布の偏りを利用する手法である。上記の符号化装置で
は、コードブック54に図5に示すようなMDCT係数x
(n)を周波数方向について4個単位で分割して4次元ベ
クトルデータに変換した後にrms値で正規化したデー
タを格納させているが、MDCT係数x(n)は信号の位
相の変化によって隣合った係数の符号や大きさが大きく
変化してしまい、そのためにベクトル量子化による効率
に限界が生じている。即ち、上記の符号化装置の方式を
90kbpsより低いビットレートに適用するためには、
より統計的分布に偏りがあるような性質のベクトルを用
いる必要がある。
【0007】一方、図5のMDCT係数x(n)から振幅
成分データと位相成分データを求めるとそれぞれ図6及
び図7のようになり、特に振幅成分データの統計的分布
の偏りが大きいことが理解される。そこで、本発明は、
MDCT係数x(n)そのものをベクトル量子化するので
はなく、MDCT係数x(n)から求められる振幅成分デ
ータと位相成分データをベクトル量子化するという特殊
な手法を採用し、全体としてより高能率な符号化を可能
にする符号化装置とそれに対応した復号化装置を提供す
ることを目的として創作された。
【0008】
【課題を解決するための手段】第1の発明は、PCM方
式で変調された音響信号をMDCT方式で直交変換し、
その変換によって得られるMDCT係数を符号化する音
響信号の符号化装置において、前記MDCT係数を振幅
成分データと位相成分データに分離するデータ分離手段
と、前記データ分離手段が分離した各データをベクトル
データへ変換するベクトル化手段と、音響信号の学習サ
ンプルから得られるMDCT係数に対して前記のデータ
分離手段とベクトル化手段によるデータ処理と実質的に
同一のデータ処理を施して求められた振幅成分と位相成
分に係る各ベクトルデータに対応させて相互に異なるイ
ンデックスデータを格納せしめたコードブックと、前記
ベクトル化手段が求めた振幅成分と位相成分に係る各ベ
クトルデータを用いて前記コードブックを検索し、その
各ベクトルデータと同一乃至近似した前記コードブック
のベクトルデータに対応付けられている振幅成分と位相
成分に係るインデックスデータを読出すベクトル量子化
手段を具備し、ベクトル量子化手段が読出したインデッ
クスデータを伝送路へ出力することを特徴とした音響信
号の符号化装置に係る。
【0009】この発明では、データ分離手段によってM
DCT係数を振幅成分データと位相成分データに分離
し、分離された各データをベクトル化手段でベクトルデ
ータへ変換する。コードブックは、音響信号の学習サン
プルに対してこの発明に係るMDCT・データ分離・ベク
トル化と実質的に同一の処理を施して得られた振幅成分
と位相成分に係る各ベクトルデータに対応させて相互に
異なるインデックスデータがテーブル化されている。従
って、ベクトル量子化手段がベクトル化手段で変換され
た振幅成分と位相成分に係る各ベクトルデータを検索キ
ーとしてコードブックを参照し、対応するインデックス
データを読出して伝送するようにすれば伝送効率の大幅
な向上が図れ、また伝送路上のストレージメディアの容
量節減も図れる。
【0010】ところで、上記のように図5と図6の比較
から明らかなように、振幅成分データa(m)の分布状態
の統計的な偏りはMDCT係数x(n)のそれよりも遥か
に大きい。従って、コードブックに格納させておく振幅
成分に係るベクトルデータは、大きな変換次元数のもの
で且つ少ないデータ個数分だけ用意しておけば足りる。
一方、位相成分データθ(m)については、図7に示すよ
うにその統計的分布の偏りが小さいため、振幅成分デー
タの場合に比べて小さい変換次元数のベクトルデータを
数多く用意しておかねばならない。しかし、同一のメモ
リ容量のコードブックであっても、前記のとおり振幅成
分に係るベクトルデータのデータ量が少なくなる分を位
相成分に係るベクトルデータに割り当てることができ
る。従って、結果的にMDCT係数x(n)をそのままベ
クトル量子化してコードブックに格納する場合と比較し
て、ビット量の有効な配分が可能になり、コードブック
の小型化とサーチ時の演算量の低減を実現できる。
【0011】第2の発明は、第1の発明の符号化装置に
対応した復号化装置であって、その符号化装置が具備し
たコードブックの格納データと同一データが格納せしめ
られたコードブックと、入力された振幅成分と位相成分
に係るインデックスデータを用いて前記コードブックを
検索し、その各インデックスデータに合致した振幅成分
と位相成分に係るベクトルデータを読出すベクトル逆量
子化手段と、前記ベクトル逆量子化手段が読出した各ベ
クトルデータを合成してMDCT係数に係る振幅成分デ
ータと位相成分データを作成するベクトル合成手段と、
前記ベクトル合成手段が求めた振幅成分データと位相成
分データを合成してMDCT係数を求めるデータ合成手
段と、前記データ合成手段が求めたMDCT係数に基づ
いてPCM方式で変調された音響信号を再生する逆MD
CT手段を具備したことを特徴とする音響信号の復号化
装置に係る。
【0012】この復号化装置のコードブックが、第1の
発明のコードブックの格納データと同一のデータ内容を
有していなければならないことは当然であり、インデッ
クスデータを検索キーとして検索される点が異なるだけ
である。また、ベクトル逆量子化手段が振幅成分と位相
成分に係るベクトルデータを読出した後のベクトル合成
手段とデータ合成手段と逆MDCT手段による一連のデ
ータ処理は、第1の発明によるMDCT方式で直交変換
してデータ分離手段とベクトル化手段が実行する処理の
逆処理に相当する。従って、上記の特質を有したコード
ブックを符号化装置と復号化装置が有していることによ
り、この復号化装置は低いビットレートでもSN比の高
い音響信号の再生が可能になる。
【0013】
【発明の実施の形態】以下、本発明の「音響信号の符号
化装置及び復号化装置」の実施形態を図1から図4を用
いて詳細に説明する。先ず、図1は符号化装置の機能ブ
ロック回路図を示す。同図において、1は入力されるP
CM信号に対してMDCT方式で直交変換を施すMDC
T器、2はMDCT器1が求めたMDCT係数から振幅成
分データa(m)と位相成分データθ(m)を求めてそれらを
分離出力する振幅・位相分離器、3は振幅成分データa
(m)と位相成分データθ(m)を帯域毎に分割し、両データ
a(m),θ(m)を各帯域毎に変換次元数を異ならせてベク
トルデータav(m),θv(m)へ変換する帯域分割・ベクトル
化器、4は振幅成分に係るベクトルデータav(m)を係数
a(k)で正規化する正規化演算器、5は振幅成分用のコー
ドブック、6は位相成分用のコードブック、7は正規化さ
れた振幅成分に係るベクトルデータavn(m)を検索キー
として振幅成分用のコードブック5を検索してインデッ
クスデータIDaを読出すベクトル量子化器、8は位相成
分に係るベクトルデータθv(m)を検索キーとして位相成
分用のコードブック5を検索してインデックスデータI
Dpを読出すベクトル量子化器、9は正規化に用いた係数
a(k)とインデックスデータIDa,IDpを多重化したビ
ット列を構成して伝送路へ出力させるマルチプレクサで
ある。
【0014】次に、この符号化装置の動作を各機能ブロ
ック要素に係る更に詳細な説明を加えながら説明する。
入力されたPCM信号はMDCT器1によって1フレー
ムずつ切り出され、各フレームに対して直交変換処理が
施されて周波数軸方向についてのMDCT係数x(n)が
求められる。振幅・位相分離器2では、求められたMDC
T係数x(n)は振幅情報と位相情報を併せ持っているの
で、次の数式1及び数式2を適用して振幅成分データa
(m)と位相成分データθ(m)を演算し、振幅成分と位相成
分を分離する。
【数1】
【数2】但し、各数式において、n,mはスペクトル番
号で、n=0,2,4,6,・・・,N−1、m=0,1,2,3,
・・・,(N−1)/2であり、Nは1フレーム内のスペクト
ルの数である。
【0015】そして、求められた振幅成分データa(m)
と位相成分データθ(m)は帯域分割・ベクトル化器3へ入
力される。この帯域分割・ベクトル化器3では、先ず、音
響信号の周波数帯域を例えば0〜2.25kHzと2.2
5〜4.5kHzと4.5〜9.0kHzと9.0〜16.0
kHzの4帯域に分割し、振幅成分データa(m)と位相成
分データθ(m)をそれらの帯域毎に分割する。次に、分
割された各データa(m),θ(m)を各帯域毎に設定された
変換次元数でベクトルデータav(m),θv(m)へ変換す
る。即ち、各帯域毎にサンプリング数Sを設定し、それ
らサンプリングデータ群毎に変換次元数Sのベクトルデ
ータを作成する。
【0016】この場合、例えば、前記の帯域分割であれ
ば、0〜2.25kHzではav(m)の次元数を6、θv(m)
の次元数を2とし、2.25〜4.5kHzではav(m)の
次元数を12、θv(m)の次元数を4とし、4.5〜9.0
kHzではav(m)の次元数を24、θv(m)の次元数を6
とし、9.0〜16.0kHではav(m)の次元数を32、
θv(m)の次元数を20とするというように、周波数の低
い帯域における変換次元数を周波数の高い帯域における
変換次元数より小さくする。これは、人間の聴覚心理に
おいて周波数が高くなるほど周波数弁別能力が悪くなる
ことを考慮したものであり、音響信号であることの特質
を利用してより有効なデータ量の割付けを行うためであ
る。
【0017】また、位相成分に係るベクトルデータθv
(m)を作成するに際しては、位相成分データθ(m)の絶対
値ではなく次元内の最初の値と後続データ値の差をベク
トルデータとする。これは、図7に示したように、一般
に位相成分データθ(m)の統計的分布の偏りが小さいた
め、絶対値によるよりも差分データをベクトル化した方
がベクトルデータθv(m)のデータ量が全体として小さく
なるからである。
【0018】次に、帯域分割・ベクトル化器3は、作成し
た振幅成分に係るベクトルデータav(m)を帯域識別デー
タBと共に正規化演算器4へ転送し、また位相成分に係
るベクトルデータθv(m)と帯域識別データBをベクトル
量子化器8へ転送する。正規化演算器4では、転送された
ベクトルデータav(m)を対数化し、そのベクトルデータ
av(m)の内の最大パワー値を正規化係数a(k)として正
規化されたベクトルデータavn(m)を求め、それを帯域
識別データBと共にベクトル量子化器7へ転送する。こ
こで、対数化・正規化処理を行うのは、振幅成分に係る
ベクトルデータav(m)についてもデータ量の削減を図っ
ておくためである。
【0019】このようにして、ベクトル量子化器7には
帯域識別データBと正規化された振幅成分に係るベクト
ルデータavn(m)が、ベクトル量子化器8には帯域識別デ
ータBと位相成分に係るベクトルデータθv(m)に入力さ
れるが、各ベクトル量子化器7,8はそれぞれ入力データ
[Bとavn(m)],[Bとθv(m)]を検索キーとして対応した
コードブック5,6を検索する。
【0020】そして、この段階で各コードブック5,6の
内容を図2及び図3を用いて説明しておく。両方のコー
ドブック5,6には、音響信号の学習サンプルに対して前
記の《MDCT器1→振幅・位相分離器2→帯域分割・ベク
トル化器3→(振幅成分については正規化演算器4)》の処
理経路と実質的に同一の処理を施して得られるベクトル
データavn(m),θv(m)のデータパターンが相互に異なる
インデックスデータIDa,IDpを対応付けて記憶せし
められている。即ち、音響信号の学習サンプルを用いた
LBGアルゴリズム等の既知の方法で前記の各データa
vn(m),θv(m)の全ゆるデータパターンを登録させてあ
る。但し、本実施形態では上記のように帯域分割・ベク
トル化器3の処理段階で帯域分割すると共に、各帯域毎
にベクトルデータへの変換次元数を異ならせている。従
って、振幅成分用のコードブック5についてみれば、図
1及び図2の(B)〜(E)に示すように、コードブック5
の中を帯域別コードブック[A.C.B;1],[A.C.B;2],[A.C.
B;3],[A.C.B;4]に4分割し、それぞれに学習サンプルを
処理・正規化して得られた0〜2.25kHzと2.25〜
4.5kHzと4.5〜9.0kHzと9.0〜16.0kHz
におけるベクトルデータavn(m)のデータパターンを登
録してある。尚、図2の(B)〜(E)では理解し易くする
ために図解的パターンで示してある。そして、本実施形
態の前記実例に対応したベクトル化方式にしたがって、
各ベクトルデータのパターンの変換次元数を0〜2.2
5kHzでは6に、2.25〜4.5kHzでは12に、
4.5〜9.0kHzでは24に、9.0〜16.0kHzで
は32にとってあり、各帯域について1024個のデー
タパターンが設けてある。それらのパターンを、図2の
(A)に示されるMDCT方式での直交変換後の周波数-
振幅対数パワーのグラフに対応付けると、微小周波数帯
域Δf内におけるベクトルデータavn(m)のパターンを
示していることになり、高い周波数帯域になるほど微小
周波数帯域Δfを大きくとって変換次元数を大きくした
データパターンになっている。
【0021】また、位相成分用のコードブック6につい
ても、図1及び図3の(B)〜(E)に示すように、前記の
場合と同様にその中を帯域別コードブック[P.C.B;1],
[P.C.B;2],[P.C.B;3],[P.C.B;4]に4分割し、それぞれ
に学習サンプルをベクトル化処理して得られた0〜2.
25kHzと2.25〜4.5kHzと4.5〜9.0kHz
と9.0〜16.0kHzにおけるベクトルデータθv(m)
のデータパターンを登録してある。また、本実施形態の
ベクトル化方式に対応させて、高い周波数帯域の帯域別
コードブックに対して低い周波数帯域の帯域別コードブ
ックよりも変換次元数の大きいベクトルデータθv(m)の
データパターンを登録させるようにしていることも同様
であり、0〜2.25kHzでは2に、2.25〜4.5k
Hzでは4に、4.5〜9.0kHzでは6に、9.0〜1
6.0kHzでは20にとってある。ところで、位相成分
用のコードブック6内におけるベクトルデータθv(m)の
データパターンの変換次元数は全帯域を通じて振幅成分
用のコードブック5の場合と比較して小さくなっている
が、その代わりに各帯域別コードブック[P.C.B;1],[P.
C.B;2],[P.C.B;3],[P.C.B;4]におけるベクトルデータθ
v(m)の総数が2048個で、振幅成分用のコードブック
5の場合の2倍になっている。これは、図3の(A)に示
されるMDCT方式での直交変換後の周波数-位相値の
グラフから明らかなように、位相の統計的分布の偏りが
小さいため、より多くのパターンで対応させなければ位
相の変化態様を適切に表現できず、ベクトル量子化段階
でのエラー率が高くなるからである。
【0022】図1に戻って、各ベクトル量子化器7,8は
以上に説明した各コードブック5,6をそれぞれ検索する
が、その際には先ず帯域識別データBを用いて各帯域別
コードブック[A.C.B;1]〜[A.C.B;4]と[P.C.B;1]〜[P.C.
B;4]の何れを検索対象とするかを選択する。そして、各
ベクトル量子化器7,8は、それぞれ前記帯域に含まれて
いた振幅成分に係るベクトルデータavn(m)と位相成分
に係るベクトルデータθv(m)を検索キーとして、帯域識
別データBで選択した帯域別コードブック[A.C.B;i]と
[P.C.B;i]を検索し、各ベクトルデータavn(m)とθv(m)
と同一又は最も近似した登録データに対応付けられてい
るインデックスデータIDaとIDpを読出す。
【0023】その後、正規化演算器4が用いた正規化係
数a(k)と各ベクトル量子化器7,8で読出したインデック
スデータIDa,IDpがマルチプレクサ9へ転送され、マ
ルチプレクサ9がそれらを多重化したビット列を伝送路
へ出力する。本実施形態の符号化装置では、上記のよう
にMDCT係数X(n)を振幅成分データa(m)と位相成分
データθ(m)に分離した後の帯域分割・ベクトル化器3に
よる帯域毎のベクトル化の変換次元数の割当てや位相成
分データθ(m)の差分によるベクトル化、及び振幅成分
に係るベクトルデータav(m)の正規化等により、小さい
データサイズでのコードブック5,6を構成させることが
できる。また、そのコードブック5,6においては、振幅
成分に係るベクトルデータavn(m)の変換次元数が位相
成分に係るベクトルデータθv(m)の変換次元数より大き
くなっており、データ伝送の観点から見ると、統計的分
布の偏りが大きいために比較的粗いパターンでの変換で
足りる振幅情報側のデータ量を少なくし、逆に統計的分
布の偏りが小さく細かいパターンでの変換が必要になる
位相情報側のデータ量を多くすることができ、合理的で
高効率な符号化が実現できる。
【0024】次に、図4は上記の符号化装置に対応した
復号化装置の機能ブロック回路図を示す。同図におい
て、11は伝送路から受信した正規化係数a(k)とインデ
ックスデータIDa,IDpを個別に分離するデマルチプ
レクサ、12は振幅成分用のコードブック、13は位相成分
用のコードブック、14はインデックスデータIDaを検
索キーとして振幅成分用のコードブック12を検索して正
規化された振幅成分に係るベクトルデータavn(m)と帯
域識別データBを読出すベクトル逆量子化器、15はイン
デックスデータIDpを検索キーとして位相成分用のコ
ードブック13を検索して位相成分に係るベクトルデータ
θv(m)と帯域識別データBを読出すベクトル逆量子化
器、16は正規化係数a(k)を用いてベクトルデータavn
(m)を逆正規化する逆正規化演算器、17は逆正規化され
た振幅成分に係るベクトルデータav(m)と位相成分に係
るベクトルデータθv(m)と帯域識別データBを用いて各
ベクトルデータav(m),θv(m)を対応した帯域に配置さ
せると共に、そのベクトルデータav(m),θv(m)を合成
して振幅成分データa(m)と位相成分データθv(m)を求
める帯域合成・ベクトル合成器、18は両成分データa
(m),θ(m)を用いてMDCT係数x(n)を求める振幅・位
相合成器、19はMDCT係数x(n)に対して逆MDCT
処理を施してPCM信号を再生させるIMDCT(Inver
s MDCT)器である。
【0025】この復号化装置の各機能ブロックは、デー
タの変換や処理の流れに関してみると上記の符号化装置
の各機能ブロックに逆の関係で対応しており、それぞれ
が逆の変換や処理を実行するものであることから、ここ
ではその動作に関する詳細な説明を省略するが、復号化
装置として次のような特徴を有している。
【0026】先ず、コードブック12,13がそれぞれ符号
化装置側のコードブック5,6と同一のデータ内容を有し
ており、ベクトル逆量子化器14,15が、伝送路側からデ
マルチプレクサ11を介して受信したインデックスデータ
IDa,IDpを検索キーとして、各コードブック12,13内
でその検索キーに対応付けられたベクトルデータavn
(m),θv(m)を読出す。この場合に、伝送路側からは帯域
識別データBが伝送されてこないが、各インデックスデ
ータIDa,IDpは個々に異なるコードで与えられてい
るため、コードブック12,13の検索でヒットしたインデ
ックスデータIDa,IDpのアドレスに基づいて帯域識
別データBを検出することができる。
【0027】また、振幅・位相合成器18は、帯域合成・ベ
クトル合成器18が作成した振幅成分データa(m)と位相
成分データθ(m)を用いて、次の数式3及び数式4に示
される簡単な三角関数によりMDCT係数x(n),x(n+
1)を求める。
【数3】
【数4】但し、n,mはスペクトル番号で、n=0,2,
4,6,・・・,N−1、m=0,1,2,3,・・・,(N−1)/2
であり、Nは1フレーム内のスペクトルの数である。
【0028】そして、本実施形態の符号化装置と復号化
装置は、ベクトル量子化方式によって高い伝送効率やス
トレージメディアの容量節減を実現するという基本的効
果を有しているが、コードブック5,6,14,15に対して振
幅成分と位相成分に係る各ベクトルデータavn(m),θv
(m)を割付ける方式において変換次元数やデータ個数に
ついて工夫を施し、またベクトル化に際してデータ量を
抑制するための手段を適用したことにより、音響データ
を更に効率的且つ的確に伝送し、復号化装置の出力で高
品質な音声を再生させることが可能になる。尚、本実施
形態では符号化装置と復号化装置にそれぞれ正規化演算
器4と逆正規化演算器16を具備させて振幅成分に係るベ
クトルデータav(m)のデータ量の抑制を図っているが、
それらの機能ブロックがなくても、コードブック5,14の
サイズが少々大きくなるだけで前記の効果は得られる。
【0029】
【発明の効果】本発明の「音響信号の符号化装置及び復
号化装置」は、以上の構成を有していることにより、次
のような効果を奏する。請求項1の発明は、PCM信号
をMDCT方式で直交変換し、その変換によって得られ
るMDCT係数を符号化すると共に、ベクトル量子化方
式を適用して高能率な圧縮と伝送効率の向上を図る符号
化装置において、MDCT係数を振幅成分データと位相
成分データに分離してベクトル化した各ベクトルデータ
にインデックスデータを対応させたコードブックを設け
たことにより、位相成分データよりも振幅成分データの
統計的分布の偏りが大きいという音響信号の特性を利用
してより高能率な符号化を可能にする。請求項2の発明
は、データ分離手段でMDCT係数から振幅成分データ
と位相成分データを求める際の効率的な演算を可能にす
る。請求項3の発明は、ベクトル化手段でのデータ変換
方式として、変換次元数を高い周波数帯域で大きくし、
聴覚心理特性を考慮した伝送データ量の低減化とコード
ブックの小サイズ化を実現する。請求項4の発明は、位
相成分に係るベクトルデータのデータ量を小さく抑制
し、コードブックの小サイズ化を実現し、また同一容量
のコードブックでより多くのベクトル量子化のためのデ
ータを具備させることを可能にする。請求項5及び請求
項6の発明は、統計的分布の偏りが小さい位相成分デー
タのベクトル化変換次元数を、統計的分布の偏りが大き
い振幅成分データのベクトル化変換次元数より小さく
し、位相成分に係るベクトルデータの個数を多くして伝
送データ量の増大やコードブックの容量の増大を招くこ
となく効率的且つ合理的な符号化を可能にする。請求項
7の発明は、振幅成分に係るベクトルデータを正規化し
てコードブックの小サイズ化を実現し、また同一容量の
コードブックでより多くのベクトル量子化のためのデー
タを具備させることを可能にする。請求項8の発明は、
請求項1乃至請求項6の発明の符号化装置に対応した復
号化装置を実現する。請求項9の発明は、請求項7の発
明に係る符号化装置に対応した復号化装置を実現する。
請求項10の発明は、請求項8又は請求項9の発明の復
号化装置において、データ合成手段が振幅成分データと
位相データからMDCT係数を求める際の効率的な演算
を可能にする。
【図面の簡単な説明】
【図1】本発明の実施形態に係る音響信号の符号化装置
の機能ブロック回路図である。
【図2】振幅成分用のコードブックの登録内容に関する
説明図である。
【図3】位相成分用のコードブックの登録内容に関する
説明図である。
【図4】実施形態に係る復号化装置の機能ブロック回路
図である。
【図5】MDCT係数の変化態様の実例を示すグラフで
ある。
【図6】図5のMDCT係数に係る振幅成分データの変
化態様を示すグラフである。
【図7】図5のMDCT係数に係る位相成分データの変
化態様を示すグラフである。
【図8】ベクトル量子化方式を採用した従来の符号化装
置の機能ブロック回路図である。
【符号の説明】
1…MDCT器、2…振幅・位相分離器(データ分離手
段)、3…帯域分割・ベクトル化器(ベクトル化手段)、4…
正規化演算器(正規化手段)、5,12…振幅成分用のコード
ブック、6,13…位相成分用のコードブック、7,8…ベク
トル量子化器(ベクトル量子化手段)、9…マルチプレク
サ、11…デマルチプレクサ、14,15…ベクトル逆量子化
器(ベクトル逆量子化手段)、16…逆正規化演算器(逆正
規化手段)、17…帯域合成・ベクトル合成器(ベクトル合
成手段)、18…振幅・位相合成器(データ合成手段)、19…
IMDCT器(逆MDCT手段)。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 PCM(Pulse Code Modulation)方式で
    変調された音響信号をMDCT(Modified Discrete Cos
    ine Transform)方式で直交変換し、その変換によって得
    られるMDCT係数を符号化する音響信号の符号化装置
    において、前記MDCT係数を振幅成分データと位相成
    分データに分離するデータ分離手段と、前記データ分離
    手段が分離した各データをベクトルデータへ変換するベ
    クトル化手段と、音響信号の学習サンプルから得られる
    MDCT係数に対して前記のデータ分離手段とベクトル
    化手段によるデータ処理と実質的に同一のデータ処理を
    施して求められた振幅成分と位相成分に係る各ベクトル
    データに対応させて相互に異なるインデックスデータを
    格納せしめたコードブックと、前記ベクトル化手段が求
    めた振幅成分と位相成分に係る各ベクトルデータを用い
    て前記コードブックを検索し、その各ベクトルデータと
    同一乃至近似した前記コードブックのベクトルデータに
    対応付けられている振幅成分と位相成分に係るインデッ
    クスデータを読出すベクトル量子化手段を具備し、ベク
    トル量子化手段が読出したインデックスデータを伝送路
    へ出力することを特徴とした音響信号の符号化装置。
  2. 【請求項2】 データ分離手段が、時系列的に隣接した
    MDCT係数x(n),x(n+1)を用いて、振幅成分データ
    a(m)及び位相成分データθ(m)をそれぞれ次の数式1及
    び数式2によって求めることとした請求項1の音響信号
    の符号化装置。 【数1】 【数2】 (但し、n,mはスペクトル番号で、n=0,2,4,6,・
    ・・,N−1、m=0,1,2,3,・・・,(N−1)/2であ
    り、Nは1フレーム内のスペクトルの数である。)
  3. 【請求項3】 ベクトル化手段による振幅成分データと
    位相成分データのベクトルデータへの変換方式が、周波
    数の低い帯域における変換次元数を周波数の高い帯域に
    おける変換次元数より小さくした変換方式である請求項
    1又は請求項2の音響信号の符号化装置。
  4. 【請求項4】 ベクトル化手段が、位相成分データをベ
    クトルデータへ変換する際に、変換対象とする位相成分
    データ群の最初のデータ値と後続するデータ値の差をベ
    クトルデータとすることとした請求項1、請求項2又は
    請求項3の音響信号の符号化装置。
  5. 【請求項5】 コードブックの位相成分に係るベクトル
    データの数を振幅成分に係るベクトルデータの数より大
    きくした請求項1、請求項2、請求項3、又は請求項4
    の音響信号の符号化装置。
  6. 【請求項6】 ベクトル化手段による位相成分データの
    ベクトルデータへの変換次元数を振幅成分データのベク
    トルデータへの変換次元数より小さくし、コードブック
    の位相成分に係るベクトルデータの数を振幅成分に係る
    ベクトルデータの数より大きくした請求項1、請求項
    2、請求項3、請求項4又は請求項5の音響信号の符号
    化装置。
  7. 【請求項7】 ベクトル化手段が振幅成分データを対数
    化してベクトルデータへ変換することとし、そのベクト
    ルデータ内の最大パワー値を正規化係数として他の振幅
    成分に係るベクトルデータを正規化する正規化手段を設
    け、コードブックには、音響信号の学習サンプルから得
    られるMDCT係数に対してデータ分離手段とベクトル
    化手段と前記正規化手段によるデータ処理と実質的に同
    一のデータ処理を施して求められた振幅成分データに対
    応させて相互に異なるインデックスデータを格納せし
    め、ベクトル量子化手段が読出したインデックスデータ
    と共に前記正規化手段の正規化係数を伝送路へ出力する
    こととした請求項1、請求項2、請求項3、請求項4、
    請求項5又は請求項6の音響信号の符号化装置。
  8. 【請求項8】 請求項1、請求項2、請求項3、請求項
    4、請求項5又は請求項6の音響信号の符号化装置が伝
    送路へ出力したインデックスデータが入力される復号化
    装置であって、前記符号化装置が具備したコードブック
    の格納データと同一データが格納せしめられたコードブ
    ックと、入力された振幅成分と位相成分に係るインデッ
    クスデータを用いて前記コードブックを検索し、その各
    インデックスデータに合致した振幅成分と位相成分に係
    るベクトルデータを読出すベクトル逆量子化手段と、前
    記ベクトル逆量子化手段が読出した各ベクトルデータを
    合成してMDCT係数に係る振幅成分データと位相成分
    データを作成するベクトル合成手段と、前記ベクトル合
    成手段が求めた振幅成分データと位相成分データを合成
    してMDCT係数を求めるデータ合成手段と、前記デー
    タ合成手段が求めたMDCT係数に基づいてPCM方式
    で変調された音響信号を再生する逆MDCT手段を具備
    したことを特徴とする音響信号の復号化装置。
  9. 【請求項9】 請求項7の音響信号の符号化装置が伝送
    路へ出力したインデックスデータと正規化係数が入力さ
    れる復号化装置であって、前記符号化装置が具備したコ
    ードブックの格納データと同一データが格納せしめられ
    たコードブックと、入力された振幅成分と位相成分に係
    るインデックスデータを用いて前記コードブックを検索
    し、その各インデックスデータに合致した振幅成分と位
    相成分に係るベクトルデータを読出すベクトル逆量子化
    手段と、前記ベクトル逆量子化手段が読出した振幅成分
    に係るベクトルデータを前記正規化係数を用いて逆正規
    化する逆正規化手段と、前記逆正規化手段が逆正規化し
    たベクトルデータと前記ベクトル逆量子化手段が読出し
    た位相成分に係るベクトルデータを合成してMDCT係
    数に係る振幅成分データと位相成分データを作成するベ
    クトル合成手段と、前記ベクトル合成手段が求めた振幅
    成分データと位相成分データを合成してMDCT係数を
    求めるデータ合成手段と、前記データ合成手段が求めた
    MDCT係数に基づいてPCM方式で変調された音響信
    号を再生する逆MDCT手段を具備したことを特徴とす
    る音響信号の復号化装置。
  10. 【請求項10】 データ合成手段が、振幅成分データa
    (m)と位相成分データb(m)を用いて、MDCT係数であ
    るx(n),x(n+1)をそれぞれ次の数式3及び数式4によ
    って求めることとした請求項8又は9の音響信号の復号
    化装置。 【数3】 【数4】 (但し、n,mはスペクトル番号で、n=0,2,4,6,・
    ・・,N−1、m=0,1,2,3,・・・,(N−1)/2であ
    り、Nは1フレーム内のスペクトルの数である。)
JP30190995A 1995-10-26 1995-10-26 音響信号の符号化装置及び復号化装置 Expired - Fee Related JP3159012B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30190995A JP3159012B2 (ja) 1995-10-26 1995-10-26 音響信号の符号化装置及び復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30190995A JP3159012B2 (ja) 1995-10-26 1995-10-26 音響信号の符号化装置及び復号化装置

Publications (2)

Publication Number Publication Date
JPH09130260A true JPH09130260A (ja) 1997-05-16
JP3159012B2 JP3159012B2 (ja) 2001-04-23

Family

ID=17902578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30190995A Expired - Fee Related JP3159012B2 (ja) 1995-10-26 1995-10-26 音響信号の符号化装置及び復号化装置

Country Status (1)

Country Link
JP (1) JP3159012B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998052188A1 (fr) * 1997-05-15 1998-11-19 Matsushita Electric Industrial Co., Ltd. Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio
EP0910067A1 (en) * 1996-07-01 1999-04-21 Matsushita Electric Industrial Co., Ltd. Audio signal coding and decoding methods and audio signal coder and decoder
WO1999066497A1 (fr) * 1998-06-15 1999-12-23 Nec Corporation Codeur et decodeur de signaux musicaux/vocaux
JP2002158589A (ja) * 2000-09-11 2002-05-31 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2005128404A (ja) * 2003-10-27 2005-05-19 Casio Comput Co Ltd 音声処理装置及び音声符号化方法
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP2009003078A (ja) * 2007-06-20 2009-01-08 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0910067A1 (en) * 1996-07-01 1999-04-21 Matsushita Electric Industrial Co., Ltd. Audio signal coding and decoding methods and audio signal coder and decoder
EP0910067A4 (en) * 1996-07-01 2000-07-12 Matsushita Electric Ind Co Ltd METHODS OF ENCODING AND DECODING AUDIO SIGNALS, AND ENCODER AND DECODER OF AUDIO SIGNALS
US6826526B1 (en) 1996-07-01 2004-11-30 Matsushita Electric Industrial Co., Ltd. Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
US7243061B2 (en) 1996-07-01 2007-07-10 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having a plurality of frequency bands
WO1998052188A1 (fr) * 1997-05-15 1998-11-19 Matsushita Electric Industrial Co., Ltd. Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio
WO1999066497A1 (fr) * 1998-06-15 1999-12-23 Nec Corporation Codeur et decodeur de signaux musicaux/vocaux
US6865534B1 (en) 1998-06-15 2005-03-08 Nec Corporation Speech and music signal coder/decoder
JP2002158589A (ja) * 2000-09-11 2002-05-31 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP4508490B2 (ja) * 2000-09-11 2010-07-21 パナソニック株式会社 符号化装置および復号化装置
JP2005128404A (ja) * 2003-10-27 2005-05-19 Casio Comput Co Ltd 音声処理装置及び音声符号化方法
JP2009003078A (ja) * 2007-06-20 2009-01-08 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Also Published As

Publication number Publication date
JP3159012B2 (ja) 2001-04-23

Similar Documents

Publication Publication Date Title
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6721700B1 (en) Audio coding method and apparatus
JP3336617B2 (ja) 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体
US6934676B2 (en) Method and system for inter-channel signal redundancy removal in perceptual audio coding
JP3203657B2 (ja) 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
NZ563337A (en) Encoding an audio signal using heirarchical filtering and joint coding of tonal components and time-domain components
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
WO1995014990A1 (fr) Procede et appareil de codage/decodage d'un signal et support d'enregistrement
JPH07336232A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
WO1995001680A1 (fr) Dispositif de codage de signaux numeriques, son dispositif de decodage, et son support d'enregistrement
WO2007011157A1 (en) Virtual source location information based channel level difference quantization and dequantization method
US6141637A (en) Speech signal encoding and decoding system, speech encoding apparatus, speech decoding apparatus, speech encoding and decoding method, and storage medium storing a program for carrying out the method
WO1995021490A1 (fr) Procede et dispositif de codage de l'information et procede et dispositif de decodage de l'information
EP1498874B1 (en) Wide-band speech signal compression and decompression apparatus, and method thereof
JP3406275B2 (ja) ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体
JP3159012B2 (ja) 音響信号の符号化装置及び復号化装置
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JP3255047B2 (ja) 符号化装置および方法
JP3361790B2 (ja) オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体
JPH09135173A (ja) 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
JP3376830B2 (ja) 音響信号符号化方法および音響信号復号化方法
JP3266920B2 (ja) 音声符号化装置及び音声復号化装置並びに音声符号化復号化装置
JPH07273656A (ja) 信号処理方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees