JPH10340100A - オーディオ信号量子化装置、及びオーディオ信号逆量子化装置 - Google Patents

オーディオ信号量子化装置、及びオーディオ信号逆量子化装置

Info

Publication number
JPH10340100A
JPH10340100A JP9212213A JP21221397A JPH10340100A JP H10340100 A JPH10340100 A JP H10340100A JP 9212213 A JP9212213 A JP 9212213A JP 21221397 A JP21221397 A JP 21221397A JP H10340100 A JPH10340100 A JP H10340100A
Authority
JP
Japan
Prior art keywords
audio
code
vector
audio signal
phase information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9212213A
Other languages
English (en)
Other versions
JP3242353B2 (ja
Inventor
Mineo Tsushima
峰生 津島
Takeshi Norimatsu
武志 則松
Yoshihisa Nakato
良久 中藤
Tomokazu Ishikawa
智一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP21221397A priority Critical patent/JP3242353B2/ja
Publication of JPH10340100A publication Critical patent/JPH10340100A/ja
Application granted granted Critical
Publication of JP3242353B2 publication Critical patent/JP3242353B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 オーディオ信号をベクトル量子化の手法を用
いて符号化して情報量を削減する際に、復号時のオーデ
ィオ信号の聴覚的に品質を落とすことなく、ベクトル量
子化のコード検索における計算量削減と、コードブック
のコード数を削減する。 【解決手段】 符号化部1で符号化を行う際に、オーデ
ィオ特徴ベクトルを分割して作成されたサブベクトルと
送信側コードブック3の中の各オーディオコードとの聴
覚的な距離のうち最小距離を有するオーディオコードを
選択するにあたり、聴覚的な重要度が高いサブベクトル
の要素に相当する部分については、オーディオコード選
択部102でその位相情報を示す正負符号を無視して取
り扱って、送信側コードブック3のオーディオコードと
の比較検索を行い、得られた結果に別途、位相情報抽出
部107で抽出した上記サブベクトルの要素部分に対応
する位相情報を付加してコードインデックスとして出力
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声信号や音楽信
号などのオーディオ信号を周波数領域に変換した信号を
量子化するオーディオ信号量子化装置、及び逆量子化装
置において、少ない係数列で量子化,逆量子化するため
に効率的に量子化,逆量子化を行うものに関するもので
ある。
【0002】
【従来の技術】音響信号を効率的に符号化する様々な手
法が提案されている。音楽信号など20kHzほどの帯
域を有する信号は、特に近年、MPEGオーディオ方式
などを用いて符号化されることがあげられる。MPEG
方式に代表される方式は、時間軸のディジタルオーディ
オ信号を直交変換を用いて周波数軸に変換し、その周波
数軸上の情報を、人間の聴覚的な感度特性を考慮して、
聴覚的に重要な情報から優先的に情報量を与えていく方
式である。原ディジタル信号の情報量に対して、かなり
少ない情報量で信号を表現しようとする場合、TCWV
Q(Transform Coding for Weighted Vector Quantizat
ion )などのベクトル量子化の手法を用いた符号化方式
がある。MPEGオーディオ、およびTCWVQはそれ
ぞれISO/IEC 標準IS-11172-3およびT.Moriya,H.Suga:"A
n 8 Kbits transform coder for noisy channels,"Pro
c.ICASSP'89,pp196-199などに述べられている。
【0003】以下、図面を参照しながら従来のオーディ
オ信号量子化装置について説明を行う。図7において、
101はコードブック、102はオーディオコード選択
部である。このオーディオコード選択部102は、オー
ディオ特徴ベクトルを入力として、上記コードブック1
01が持つ各コードと前記オーディオ特徴ベクトルとの
聴覚的な距離を順次算出し、その距離が最小となるコー
ドを選出し、該選出されたコードに対応するコードイン
デックスを出力するものである。そして受信側では、送
信されてきたコードインデックスを、コード復号器で復
号し、コードブック101と同一内容の受信機側コード
ブックを用いてオーディオ特徴ベクトルに変換する。
【0004】
【発明が解決しようとする課題】従来のオーディオ信号
量子化装置は以上のように構成されており、コードブッ
クが持つ各コードとオーディオ特徴ベクトルとの聴覚的
な距離が最小となるコードに対応したコードインデック
スを出力することにより量子化を行うものであるが、コ
ードブックが有するコードが多い場合、最適なコードを
検索する際に計算量が非常に多くなり、また、コードブ
ックのもつデータ量が多い場合は、ハードウエアで構成
する際に多くの量のメモリが必要となり不経済であると
いう問題点があった。また、受信側においても、コード
インデックスに対応するだけの検索、及びメモリ量を必
要とするという問題点があった。
【0005】この発明は上記のような問題点に鑑みてな
されたもので、コード検索数を削減し、コード数の少な
いコードブックで効率的にオーディオ信号を量子化する
ことのできるオーディオ信号量子化装置、及び逆量子化
することのできるオーディオ信号逆量子化装置を提供す
ることを目的とする。
【0006】
【課題を解決するための手段】この発明の請求項1に係
るオーディオ信号量子化装置は、オーディオ信号の特徴
量であるオーディオ特徴ベクトルを入力信号とし、該オ
ーディオ特徴ベクトルのうちの所定の周波数帯域に属す
るものの位相情報を抽出する位相情報抽出部と、上記オ
ーディオ特徴ベクトルの代表値であるオーディオコード
を、上記抽出した位相情報に対応する要素部分を絶対値
化した状態のものとして複数個これを格納するコードブ
ックと、上記オーディオ特徴ベクトルと上記コードブッ
ク中の各オーディオコードとの聴覚的な距離を算出し
て、その最小距離を有するオーディオコードを選出する
とともに、該最小距離を有するオーディオコードに対す
る位相情報を上記位相情報抽出部からの出力を補助情報
として用いて付加し、該オーディオコードに対応するコ
ードインデックスをその出力信号として出力するオーデ
ィオコード選択部とを備えたものである。
【0007】また、この発明の請求項2に係るオーディ
オ信号量子化装置は、上記請求項1記載のオーディオ信
号量子化装置において、上記位相情報抽出部は、入力さ
れたオーディオ特徴ベクトルのうちの低周波帯域側のも
のより所定個数の要素の位相情報を抽出するようにした
ものである。
【0008】また、この発明の請求項3に係るオーディ
オ信号量子化装置は、上記請求項1記載のオーディオ信
号量子化装置において、人間の聴覚心理特性を考慮した
各周波数における相対的な聴覚心理量のテーブルである
聴覚心理重みベクトルテーブルを備え、上記位相情報抽
出部は、入力されたオーディオ特徴ベクトルのうち、上
記聴覚心理重みベクトルテーブルに格納されたベクトル
と一致する要素の位相情報を抽出するようにしたもので
ある。
【0009】また、この発明の請求項4に係るオーディ
オ信号量子化装置は、上記請求項1記載のオーディオ信
号量子化装置において、上記オーディオ特徴ベクトルを
平滑ベクトルを用いてベクトル要素同士の除算により平
滑化する平滑化部を備え、上記オーディオコード選択部
は、上記最小距離を有するオーディオコードを選出し、
該選出されたオーディオコードに位相情報を付加する前
に、上記平滑化部から出力される平滑化処理情報を用い
て、上記選出されたオーディオコードを、平滑化処理の
なされていないオーディオコードに変換し、該オーディ
オコードに対応するコードインデックスをその出力信号
として出力するようにしたものである。
【0010】また、この発明の請求項5に係るオーディ
オ信号量子化装置は、上記請求項1記載のオーディオ信
号量子化装置において、人間の聴覚心理特性を考慮した
各周波数における相対的な聴覚心理量のテーブルである
聴覚心理重みベクトルテーブルと、上記オーディオ特徴
ベクトルを平滑ベクトルを用いて、ベクトル要素同士の
除算により平滑化する平滑化部と、上記聴覚心理重みベ
クトルテーブルの値と上記平滑ベクトルテーブルの値と
を乗じて得られる値を聴覚的重要度の高い順に複数個選
出してこれを上記オーディオコード選択部に出力するソ
ート部とを備えたものである。
【0011】また、この発明の請求項6に係るオーディ
オ信号量子化装置は、上記請求項2ないし4のいずれか
に記載のオーディオ信号量子化装置において、上記オー
ディオ特徴ベクトルとして、上記オーディオ信号を周波
数変換した係数を要素とするベクトルを用いるようにし
たものである。
【0012】また、この発明の請求項7に係るオーディ
オ信号量子化装置は、上記請求項2ないし4のいずれか
に記載のオーディオ信号量子化装置において、上記オー
ディオ特徴ベクトルとして、上記オーディオ信号をMD
CT変換(変形離散コサイン変換)した係数を要素とす
るベクトルを用いるようにしたものである。
【0013】また、この発明の請求項8に係るオーディ
オ信号量子化装置は、上記請求項4または5に記載のオ
ーディオ信号量子化装置において、上記平滑ベクトルと
して、オーディオ信号を線形予測して線形予測係数を算
出し、該算出された前記線形予測係数から各周波数にお
ける相対的な周波数応答を算出し、該各周波数における
相対的な周波数応答を要素とするベクトルを用いるよう
にしたものである。
【0014】また、この発明の請求項9に係るオーディ
オ信号逆量子化装置は、オーディオ信号の特徴量である
オーディオ特徴ベクトルを量子化して得られたコードイ
ンデックスを入力信号とし、該コードインデックスのう
ちの所定の周波数帯域に相当する要素の位相情報を抽出
する位相情報抽出部と、上記コードインデックスに対応
するオーディオ特徴ベクトルを、上記抽出した位相情報
に対応する要素部分を絶対値化した状態のものとして複
数個これを格納するコードブックと、上記コードインデ
ックスと上記コードブック中のオーディオ特徴ベクトル
との聴覚的な距離を算出して、その最小距離を有するオ
ーディオ特徴ベクトルを選出するとともに、該最小距離
を有するオーディオ特徴ベクトルに対する位相情報を上
記位相情報抽出部からの出力を補助情報として用いて付
加し、上記入力信号であるコードインデックスに対応す
るオーディオ特徴ベクトルをその出力信号として出力す
るオーディオコード選択部とを備えたものである。
【0015】
【発明の実施の形態】
実施の形態1.以下、本発明の実施の形態1によるオー
ディオ信号量子化装置について、図面を参照しながら説
明する。図1は本発明のオーディオ信号量子化装置の概
略構成図であり、図2は実施の形態1におけるオーディ
オ信号量子化装置を構成する符号化部の詳細な構成を示
す図であり、これらの図において、1は符号化部、2は
復号化部、3はオーディオ信号の特徴量の代表値である
オーディオコードを複数有する送信側コードブック、1
02はオーディオコード選択部、107は位相情報抽出
部である。また、5はコード復号部、6は受信側コード
ブックである。
【0016】以下、動作について説明する。時間軸上の
ディジタルオーディオ信号を量子化する際、時間軸上の
データを時間周波数変換と呼ばれる直交変換を用いて周
波数軸上のデータに変換する。直交変換としてはDFF
T(離散フーリエ変換)や、MDCT(変形離散コサイ
ン変換)などがあげられる。
【0017】図3に示すように、周波数軸上のデータを
1つの音源ベクトルとみなした場合、その音源ベクトル
から、いくつかの要素を抜き出したサブベクトルを形成
し、これを図1の入力ベクトルとした場合、オーディオ
コード選択部102は、送信側コードブック3中の各コ
ードと前記入力ベクトルとの距離を算出して、その距離
が最小となるコードを選択して、その選択されたコード
の送信側コードブック3におけるコードインデックスを
復号化部2への入力とする。そして受信部である復号化
部2では、前記出力されたコードインデックスをコード
復号部5の入力として、受信側コードブック6中のコー
ドインデックスに対するコードをコード復号部5に出力
して、コード復号部5は出力ベクトルとして出力する。
【0018】上記動作において、入力ベクトルを符号化
部1に入力して、符号化部1がコードインデックスを出
力するまでのプロセスが符号化であり、このコードイン
デックスを入力として出力ベクトルを出力するまでのプ
ロセスが復号化である。多くの場合、送信側コードブッ
ク3と受信側コードブック6とは同一内容であることが
多いが、本実施の形態1では、受信側コードブック6は
従来と同様に、送信されてくるコードインデックスと同
等の数のコードを有するものとして説明を行う。上記符
号化部1の詳細な動作を図2及び図4を用いて以下に説
明する。ここでは、コード化を、20KHzを対象とす
るために10bitで行う場合を想定する。また、位相
情報抽出部107では、抽出する位相を周波数の低い方
から2番目までの要素に対して、すなわち2ビット分と
する。上記オーディオコード選択部102の入力は、オ
ーディオ特徴ベクトルであり、例えば、オーディオ信号
をMDCT変換(Modified Discrete Cosine Transfor
m) して得た係数を1つのベクトルとした時に、そのベ
クトルを分割して幾つかの要素、例えば、20程度の要
素を1つのサブベクトルとしたものである。その際、ベ
クトルはX0 〜X19とし、Xの添え字の数字が小さいサ
ブベクトルの要素ほど、低い周波数成分を有するMDC
T係数に対応するものとする。ここで低い周波数成分は
人にとって聴覚的に重要な情報であり、従って、これら
の要素についてのコード化を優先的に行うことで、再生
時に人間にとっては音質の劣化を感じさせにくい。
【0019】オーディオコード選択部102では、前記
オーディオ特徴ベクトルと、送信側コードブック3の各
々のコードとの距離を算出する。例えば、コードインデ
ックスをiとした場合に、数1式でコードインデックス
iのコードにおける距離Diが算出できる。
【0020】
【数1】
【0021】ここで上記数1式において、Nは送信側コ
ードブック3中の全コードの個数であり、Cij はコード
インデックスI におけるj番目の要素の値である。M は
本実施の形態1の場合、19以下の数、例えば、1など
である。P は距離計算におけるノルムであり、例えば、
2などである。また、abs( ) は絶対値演算を意味す
る。
【0022】位相情報抽出部107では、最小の距離Di
を与えるコードインデックスiとM個の位相情報Ph(j)
j=0 to Mを出力する。位相情報Ph(j) は数2式で示され
るように、
【0023】
【数2】
【0024】オーディオ特徴ベクトルが音声信号をMD
CT変換したベクトルのサブベクトルである場合などで
は、一般にXjの添え字j が小さいほど係数の聴覚的な重
要度が高いため、本構成により、各サブベクトルの低い
周波数成分の要素に対応する位相(正負)についてはコ
ード検索時にはこれらの情報については考慮されず、検
索後に別途付加されることになる。すなわち、図4
(a)に示されるように、サブベクトル化されたオーデ
ィオ特徴ベクトルは、低い周波数側の2bit分の要素
の正負符号を無視して、送信側コードブック3の有する
コードとパターン比較される。例えば、ここには低い周
波数側の2bit分の要素が共に正として格納された2
56個のコードが格納されており、オーディオコード選
択部102では、入力されたサブベクトルと上記送信側
コードブック3の有する256個のコードとの検索を行
う。そして得られたコードに対して、位相情報抽出部1
07で抽出された、図4(b)に示される組み合わせの
いずれかのものが、当該サブベクトルの低い周波数側の
2bit分の正負符号として付加されて、合計10bi
tのコードインデックスとして出力を行う。
【0025】このようにすることで、符号化部1から復
号化部2に送るコードインデックスは、従来と同様に1
0bit(1024個)のままで、送信側コードブック
3に格納するコードは8bit(256個)とすること
ができ、位相情報との情報量の和を、数3式の距離計算
のコードインデックスの情報量と同じにした場合に、下
記の数3式で復号された合成音声と本構成の合成音声と
比べてみると、ほぼ同等の主観評価結果を得ることがで
きる。
【0026】
【数3】
【0027】ここで本構成と数3式を用いた場合の計算
量とメモリ量の関係を表1に示す。
【0028】
【表1】
【0029】本実施例の構成の方がコードブックは4分
の1で、計算量も従来では1024通りの検索処理が必
要であったのが、256通りの検索処理と、検索結果に
対して2符号を付加するという処理を行うだけでよく、
計算量ならびにメモリを大幅に削減できることが分か
る。
【0030】このように本実施の形態1によれば、符号
化部1で符号化を行う際に、オーディオ特徴ベクトルを
分割して作成されたサブベクトルと送信側コードブック
3の中の各オーディオコードとの聴覚的な距離のうち最
小距離を有するオーディオコードを選択するにあたり、
聴覚的な重要度が高いサブベクトルの要素に相当する部
分については、オーディオコード選択部102でその位
相情報を示す正負符号を無視して取り扱って、送信側コ
ードブック3のオーディオコードとの比較検索を行い、
得られた結果に別途、位相情報抽出部107で抽出した
上記サブベクトルの要素部分に対応する位相情報を付加
してコードインデックスとして出力するようにしたの
で、体感的な音質の劣化を招くことなく、オーディオコ
ード選択部102における計算量を削減でき、また、コ
ードブック3,101に必要なコード数をも削減するこ
とができる。
【0031】実施の形態2.以下、本発明の実施の形態
2によるオーディオ信号量子化装置について、図面を参
照しながら説明する。図5(a)は本実施の形態2にお
けるオーディオ信号量子化装置の構成を示す図であり、
図3において、103は人間の聴覚心理特性を考慮した
各周波数における相対的な聴覚心理量のテーブルを格納
する聴覚心理重みベクトルテーブルである。
【0032】以下、動作について説明する。上記実施の
形態1との違いは、聴覚心理重みベクトルテーブル10
3が新たに付加された構成であることである。聴覚心理
重みベクトルとは、人間の聴覚心理モデルに基づき、周
波数に対する聴覚の感度特性として定義された聴覚感度
テーブルなどから、本実施の形態の入力であるオーディ
オ特徴ベクトルの各要素に対する同じ周波数帯の要素を
集めてベクトルとしたものである。これは例えば、図5
(b)に示されるように、周波数2.5KHz程度にピ
ークを有しており、周波数の最も低い位置にあるものが
必ずしも人の聴覚的に重要でないものであることがわか
る。
【0033】すなわち、本実施の形態では、オーディオ
特徴ベクトルをオーディオコード選択部102への入力
として、聴覚心理重みベクトルテーブル103をコード
選択時の重みとして、送信側コードブック3中の各コー
ドとオーディオ特徴ベクトルとの聴覚的な距離を算出
し、最小の距離を与えるコードに対するコードインデッ
クスを出力する。コードインデックスをiとした場合に
オーディオコード選択部102におけるコード選択時の
距離尺度Di は、例えば、
【0034】
【数4】
【0035】となる。ここで、Nは送信側コードブック
3中の全コードの個数であり、Cij はコードインデック
スiにおけるj番目の要素の値である。M は本実施例の
場合、19以下の数、例えば、1などである。P は距離
計算におけるノルムであり、例えば、2などである。Wj
は、聴覚心理重みベクトルテーブル103のj 番目の要
素である。また、abs( ) は絶対値演算を意味する。
【0036】位相情報抽出部107では、聴覚心理重み
ベクトルテーブル103から、どの周波数のオーディオ
特徴ベクトルに相当する要素の位相情報を抽出するかを
判断し、その範囲で最小のDiを与えるコードインデック
スI とM個の位相情報Ph(j)j=0 to Mを出力する。位相
情報Ph(j) は、数2式で同様に定義される。
【0037】このように本実施の形態2によれば、符号
化部1で符号化を行う際に、オーディオ特徴ベクトルを
分割して作成されたサブベクトルと送信側コードブック
3の中の各オーディオコードとの聴覚的な距離のうち最
小距離を有するオーディオコードを選択するにあたり、
聴覚的な重要度が高いサブベクトルの要素に相当する部
分については、オーディオコード選択部102でその位
相情報を示す正負符号を無視して取り扱って、送信側コ
ードブック3のオーディオコードとの比較検索を行い、
得られた結果に別途、位相情報抽出部107で抽出した
上記サブベクトルの要素部分に対応する位相情報を付加
してコードインデックスとして出力するようにしたの
で、体感的な音質の劣化を招くことなく、オーディオコ
ード選択部102における計算量を削減でき、また、コ
ードブック3,101に必要なコード数をも削減するこ
とができる。
【0038】また、上記オーディオコード選択部102
でその位相情報を示す正負符号を無視して取り扱うオー
ディオ特徴ベクトルを、人間の聴覚心理特性を考慮した
各周波数における相対的な聴覚心理量のテーブルを格納
する聴覚心理重みベクトルテーブル103を用いて重み
付けして選択することにより、上記実施の形態1のよう
に単に低域から所定個数のオーディオ特徴ベクトルを選
択するものに比べて、より体感的に音質の優れた量子化
を行うことができる。
【0039】実施の形態3.以下、本発明の実施の形態
3によるオーディオ信号量子化装置について、図面を参
照しながら説明する。図6(a)は本実施の形態3にお
けるオーディオ信号量子化装置の構成を示す図であり、
図において、104は平滑ベクトルテーブルであり、実
際には除算カーブ等のデータが格納されている。105
はオーディオ特徴ベクトルを平滑ベクトルテーブル10
4に格納された平滑ベクトルを用いて、ベクトル要素同
士の除算により平滑化を行う平滑化部である。
【0040】以下、動作について説明する。上記平滑化
部105に入力されるものは、上記実施の形態1および
実施の形態2におけるオーディオ信号量子化装置と同
様、オーディオ特徴ベクトルであり、この平滑化部10
5では平滑ベクトルテーブル104に格納された平滑ベ
クトルである除算カーブを用いて、入力されたオーディ
オ特徴ベクトルに平滑演算を行う。この平滑演算は、例
えば、入力のオーディオ特徴ベクトルをXとし、平滑ベ
クトル104をFとし、平滑化部105の出力をYとし
て、それぞれのベクトルのI 番目の要素をXi,Fi,Yiとし
た場合に、数5式で表される処理を行なう。
【0041】
【数5】
【0042】平滑ベクトルテーブル104は、一般的に
オーディオ特徴ベクトルをMDCT係数とした場合に
は、MDCT係数の分散を小さくするような値である。
図6(b)は上記平滑化の処理を模式的に示したもので
あり、サブベクトル化された要素のうちの低域側から2
つ分の要素に対して除算処理を行うことにより、周波数
毎の情報量の格差(レンジ)を縮めることができる。
【0043】そして、平滑化部105の出力は、オーデ
ィオコード選択部102の入力となり、コード選択部1
02では上述した実施の形態1と同様に、平滑化された
オーディオ特徴ベクトルは、位相情報抽出部107に
て、周波数の低い方から2番目までの要素に対して、そ
の位相情報が抽出され、一方、オーディオコード選択部
102では、送信側コードブック3に格納された256
個のコードとの検索を行う。このとき、そのまま得られ
た検索結果に対応するコードインデックス(8bit)
を出力すると正しい検索結果が得られないので、平滑ベ
クトルテーブル104より平滑化処理時の情報を受け取
り、スケーリングを調整した上で、該検索結果に対応す
るコードインデックス(8bit)の選択を行い、この
ようにして得られた結果に2ビット分の位相情報を付加
して10bitのコードインデックスI を出力する。
【0044】このときのオーディオベクトルとコードブ
ック31に格納されたコードとの距離Diは、例えば、平
滑ベクトルテーブル104の各i番目の要素をFiとし
て、数6式のように示される。
【0045】
【数6】
【0046】ここで、Nは送信側コードブック31中の
全コードの個数であり、Cij はコードインデックスiに
おけるj番目の要素の値である。M は本実施の形態の場
合、19以下の数、例えば、1などである。P は距離計
算におけるノルムであり、例えば、2などである。Wj
は、聴覚心理重みベクトルテーブル103のj 番目の要
素である。また、abs( ) は絶対値演算を意味する。位
相情報抽出部107では、最小のDiを与えるコードイン
デックスiとM個の位相情報Ph(j) j=0 to Mを出力す
る。位相情報Ph(j) は、数2式で同様に定義される。
【0047】このように本実施の形態3によれば、符号
化部1で符号化を行う際に、オーディオ特徴ベクトルを
分割して作成されたサブベクトルと送信側コードブック
31の中の各オーディオコードとの聴覚的な距離のうち
最小距離を有するオーディオコードを選択するにあた
り、聴覚的な重要度が高いサブベクトルの要素に相当す
る部分については、オーディオコード選択部102でそ
の位相情報を示す正負符号を無視して取り扱って、送信
側コードブック31のオーディオコードとの比較検索を
行い、得られた結果に別途、位相情報抽出部107で抽
出した上記サブベクトルの要素部分に対応する位相情報
を付加してコードインデックスとして出力するようにし
たので、体感的な音質の劣化を招くことなく、オーディ
オコード選択部102における計算量を削減でき、ま
た、コードブック3,101に必要なコード数をも削減
することができる。
【0048】また、入力されたオーディオ特徴ベクトル
を平滑化テーブル104,平滑化部105を用いて平滑
化するようにしたから、オーディオコード選択部102
で検索を行う際に参照される、送信側コードブック31
に記憶しておくコードブックの周波数毎の情報量を全体
的に少ないものとすることができる。
【0049】実施の形態4.以下、本発明の実施の形態
4によるオーディオ信号量子化装置について、図面を参
照しながら説明する。図7は本発明の実施の形態4にお
けるオーディオ信号量子化装置の構成を示す図であり、
図において、図4に示した実施の形態3との違いは、オ
ーディオコード選択部102でコードを選択する際に、
平滑ベクトルテーブル104に加えて、実施の形態2で
用いた聴覚心理重みベクトルテーブル103をも使用す
るようにした点である。
【0050】以下、動作について説明する。平滑化部1
05に入力されるものは、上記各実施の形態と同様、オ
ーディオ特徴ベクトルであり、この平滑化部105の出
力は、オーディオコード選択部102の入力となり、オ
ーディオコード選択部102では、送信側コードブック
31中の各コードと上記平滑化部105の出力との距離
を、平滑ベクトルテーブル104から出力される平滑処
理時の情報に基づいて、平滑処理時のスケーリングを考
慮しつつ聴覚心理重みベクトルテーブル103の聴覚心
理重みベクトルによる重み付けを加味して算出する。上
記実施の形態2,3と同様の表記を用いて、距離Diは、
例えば、数7式のように示される。
【0051】
【数7】
【0052】ここで、Nは送信側コードブック31中の
全コードの個数であり、Cij はコードインデックスiに
おけるj番目の要素の値である。M は本実施例の場合、
19以下の数、例えば、1などである。P は距離計算に
おけるノルムであり、例えば、2などである。Wjは、聴
覚心理重みベクトルテーブル103のj 番目の要素であ
る。また、abs( ) は絶対値演算を意味する。位相情報
抽出部107では、最小のDiを与えるコードインデック
スI とM個の位相情報Ph(j) j=0 to Mを出力する。位相
情報Ph(j) は、上記数2式で同様に定義される。
【0053】このように本実施の形態4によれば、符号
化部1で符号化を行う際に、オーディオ特徴ベクトルを
分割して作成されたサブベクトルと送信側コードブック
31の中の各オーディオコードとの聴覚的な距離のうち
最小距離を有するオーディオコードを選択するにあた
り、聴覚的な重要度が高いサブベクトルの要素に相当す
る部分については、オーディオコード選択部102でそ
の位相情報を示す正負符号を無視して取り扱って、送信
側コードブック31のオーディオコードとの比較検索を
行い、得られた結果に別途、位相情報抽出部107で抽
出した上記サブベクトルの要素部分に対応する位相情報
を付加してコードインデックスとして出力するようにし
たので、体感的な音質の劣化を招くことなく、オーディ
オコード選択部102における計算量を削減でき、ま
た、送信側コードブック31に必要なコード数も削減す
ることができる。
【0054】また、上記オーディオコード選択部102
でその位相情報を示す正負符号を無視して取り扱うオー
ディオ特徴ベクトルを、人間の聴覚心理特性を考慮した
各周波数における相対的な聴覚心理量のテーブルを格納
する聴覚心理重みベクトルテーブル103を用いて重み
付けして選択することにより、上記実施の形態1のよう
に単に低域から所定個数のオーディオ特徴ベクトルを選
択するものに比べて、より体感的に音質の優れた量子化
を行うことができる。
【0055】さらに、入力されたオーディオ特徴ベクト
ルを平滑化テーブル104,平滑化部105を用いて平
滑化するようにしたから、オーディオコード選択部10
2で検索を行う際に参照される、送信側コードブック3
1に記憶しておくコードブックの周波数毎の情報量を全
体的に少ないものとすることができる。
【0056】実施の形態5.以下、本発明の実施の形態
5によるオーディオ信号量子化装置について、図面を参
照しながら説明する。図8は本発明の実施の形態5にお
けるオーディオ信号量子化装置の構成を示す図であり、
図において、106はソート部であり、聴覚心理重みベ
クトルテーブル103の出力と平滑ベクトルテーブル1
04の出力とを受け、算出されたベクトルのうちのもっ
とも大きな要素を複数個選択してこれを出力する。
【0057】以下、その動作について説明する。本実施
の形態5と上記実施の形態4の構成上の違いは、ソート
部106が付加されたことと、オーディオコード選択部
102のコードインデックスを選択して出力する方法が
違う点にある。すなわち、ソート部106では、聴覚心
理重みベクトルテーブル103と平滑ベクトルテーブル
104の出力とを入力とし、例えば、ベクトルWFのj
番目の要素をWFjと定義すると、以下の数8式で示さ
れる。
【0058】
【数8】
【0059】そして、このソート部106では、ベクト
ルWFの各要素WFjの中から最も大きなR個の要素を
算出し、そのR個の要素番号をソート部106の出力と
する。オーディオコード選択部102では、上記各実施
の形態と同様、距離Diを算出する。距離Diは、例えば、
次の数9式で示される。
【0060】
【数9】
【0061】ここで、Rj はソート部106によって、
出力された要素番号であるならRjは1であり、出力され
た要素番号でないならRjは0とする。Nは送信側コード
ブック31中の全コードの個数であり、Cij はコードイ
ンデックスiにおけるj番目の要素の値である。M は本
実施例の場合、19以下の数、例えば、1などである。
P は距離計算におけるノルムであり、例えば、2などで
ある。Wjは、聴覚心理重みベクトルテーブル103のj
番目の要素である。また、abs( ) は絶対値演算を意味
する。位相情報抽出部107では、最小のDiを与えるコ
ードインデックスI とM個の位相情報Ph(j) j= 0toRを
出力する。位相情報Ph(j) は、数10式で定義される。
【0062】
【数10】
【0063】ただし、Ph(j) は、ソート部106で出力
された要素番号に対応するもののみについて計算され
る。本例では(R+1)個である。本実施の形態5の構
成を用いる場合には、図1の構成の復号化部2において
も、ソート部106を備えた構成とする必要がある。
【0064】このように本実施の形態5によれば、上記
実施の形態4において、平滑ベクトルテーブル104の
出力と聴覚心理重みベクトルテーブル103の出力とを
受け、これらの出力結果から、ベクトルのうちのもっと
も大きな要素、すなわち、重み絶対値の大きな要素を複
数個選択してこれをオーディオコード選択部102に出
力するようにしたので、人間の聴覚特性にとって意味の
大きな要素と、物理的に重要な要素とを両方加味してコ
ードインデックスを算出することができ、より品質の高
いオーディオ信号圧縮化を行うことができる。なお、本
実施の形態5では、平滑ベクトル104と聴覚心理重み
ベクトル103の両者を考慮した重みの絶対値の大きい
ものから要素を選択する個数をR個としたが、これは、
上記実施の形態1〜4で使用したMと同じ数値であって
もかまわない。
【0065】実施の形態6.以下、本発明の実施の形態
6によるオーディオ信号逆量子化装置について、図面を
参照しながら説明する。図9は本発明の実施の形態6に
おけるオーディオ信号逆量子化装置の構成を示す図であ
り、図において、21は図1の復号化部に相当するもの
であり、受信側コードブック61とコード復号部51と
から構成され、さらにコード復号化部51は、オーディ
オコード選択部102と位相情報抽出部107とから構
成されたものとなっている。
【0066】以下、その動作について説明する。本実施
の形態6では、コードインデックスを受信してデコード
する際に、上記実施の形態1〜5に示した量子化方式を
応用したものであり、すなわち、オーディオコード選択
部102では、例えば、受信した10bitのコードイ
ンデックスのうち人間の聴覚的に重要度の高い低域側か
ら2bit分の要素を除く、残り8bit分の要素につ
いて、受信側コードブック61に記憶されたコードとの
比較検索を行い、上記除外した2bit分の要素の位相
情報については、これを位相情報抽出部107を用いて
抽出し、上記検索結果に対してこれを付加することで、
オーディオ特徴ベクトルを再生する、すなわち逆量子化
を行う。
【0067】このようにすることで、上記受信側コード
ブックとしては、8bit分の要素に対応する256個
のコードを格納すればよく、受信側コードブック61に
格納するデータ量を少ないものとすることができ、ま
た、オーディオコード選択部102での演算は256回
のコード検索と、検索結果に対して2符号を付加する処
理となり、大幅に演算量を削減することができる。
【0068】なお、本実施の形態6では、実施の形態1
の構成を受信側の構成に応用したものを示したが、実施
の形態2〜5に示した構成のものを応用することも可能
であり、また、受信側に単独で用いるのではなく、上記
実施の形態1ないし5のいずれかの実施の形態と組み合
わせて用いることにより、オーディオ信号の圧縮、展開
をスムーズに行うことができるオーディオデータ送受信
システムを構築することができる。
【0069】
【発明の効果】以上のように、本発明の請求項1に係る
オーディオ信号量子化装置によれば、オーディオ信号の
特徴量であるオーディオ特徴ベクトルを入力信号とし、
該オーディオ特徴ベクトルのうちの所定の周波数帯域に
属するものの位相情報を抽出する位相情報抽出部と、上
記オーディオ特徴ベクトルの代表値であるオーディオコ
ードを、上記抽出した位相情報に対応する要素部分を絶
対値化した状態のものとして複数個これを格納するコー
ドブックと、上記オーディオ特徴ベクトルと上記コード
ブック中の各オーディオコードとの聴覚的な距離を算出
して、その最小距離を有するオーディオコードを選出す
るとともに、該最小距離を有するオーディオコードに対
する位相情報を上記位相情報抽出部からの出力を補助情
報として用いて付加し、該オーディオコードに対応する
コードインデックスをその出力信号として出力するオー
ディオコード選択部とを備えたので、体感的な音質の劣
化を招くことなく、オーディオコード選択部における計
算量を削減でき、また、コードブックに記憶すべきコー
ド数をも削減することができる効果がある。
【0070】また、本発明の請求項3に係るオーディオ
信号量子化装置によれば、上記請求項1記載のオーディ
オ信号量子化装置において、人間の聴覚心理特性を考慮
した各周波数における相対的な聴覚心理量のテーブルで
ある聴覚心理重みベクトルテーブルを備え、上記位相情
報抽出部は、入力されたオーディオ特徴ベクトルのう
ち、上記聴覚心理重みベクトルテーブルに格納されたベ
クトルと一致する要素の位相情報を抽出するようにした
ので、より体感的に音質の優れた量子化を行うことがで
きる効果がある。
【0071】また、本発明の請求項4に係るオーディオ
信号量子化装置によれば、上記請求項1記載のオーディ
オ信号量子化装置において、上記オーディオ特徴ベクト
ルを平滑ベクトルを用いてベクトル要素同士の除算によ
り平滑化する平滑化部を備え、上記オーディオコード選
択部は、上記最小距離を有するオーディオコードを選出
し、該選出されたオーディオコードに位相情報を付加す
る前に、上記平滑化部から出力される平滑化処理情報を
用いて、上記選出されたオーディオコードを、平滑化処
理のなされていないオーディオコードに変換し、該オー
ディオコードに対応するコードインデックスをその出力
信号として出力するようにしたので、オーディオコード
選択部で検索を行う際に参照される、コードブックに記
憶しておくコードブックの周波数毎の情報量を全体的に
少ないものとすることができる効果がある。
【0072】また、本発明の請求項5に係るオーディオ
信号量子化装置によれば、上記請求項1記載のオーディ
オ信号量子化装置において、人間の聴覚心理特性を考慮
した各周波数における相対的な聴覚心理量のテーブルで
ある聴覚心理重みベクトルテーブルと、上記オーディオ
特徴ベクトルを平滑ベクトルを用いて、ベクトル要素同
士の除算により平滑化する平滑化部と、上記聴覚心理重
みベクトルテーブルの値と上記平滑ベクトルテーブルの
値とを乗じて得られる値を聴覚的重要度の高い順に複数
個選出してこれを上記オーディオコード選択部に出力す
るソート部とを備えたものとしたので、人間の聴覚特性
にとって意味の大きな要素と、物理的に重要な要素とを
両方加味してコードインデックスを算出することがで
き、より品質の高いオーディオ信号圧縮化を行うことが
できる効果がある。
【0073】また、本発明の請求項9に係るオーディオ
信号逆量子化装置によれば、オーディオ信号の特徴量で
あるオーディオ特徴ベクトルを量子化して得られたコー
ドインデックスを入力信号とし、該コードインデックス
のうちの所定の周波数帯域に相当する要素の位相情報を
抽出する位相情報抽出部と、上記コードインデックスに
対応するオーディオ特徴ベクトルを、上記抽出した位相
情報に対応する要素部分を絶対値化した状態のものとし
て複数個これを格納するコードブックと、上記コードイ
ンデックスと上記コードブック中のオーディオ特徴ベク
トルとの聴覚的な距離を算出して、その最小距離を有す
るオーディオ特徴ベクトルを選出するとともに、該最小
距離を有するオーディオ特徴ベクトルに対する位相情報
を上記位相情報抽出部からの出力を補助情報として用い
て付加し、上記入力信号であるコードインデックスに対
応するオーディオ特徴ベクトルをその出力信号として出
力するオーディオコード選択部とを備えたので、受信側
で用いるコードブックに格納するデータ量を少ないもの
とすることができ、また、受信側での演算量を大幅に削
減することができるできる効果がある。
【図面の簡単な説明】
【図1】 この発明によるオーディオ信号量子化装置の
概念的な構成を示す図である。
【図2】 本発明の実施の形態1におけるオーディオ信
号量子化装置の符号化部の詳細な構成を示す図である。
【図3】 上記実施の形態1におけるオーディオ信号量
子化装置のオーディオ特徴ベクトルの構成を説明するた
めの図である。
【図4】 上記実施の形態1におけるオーディオ信号量
子化装置の符号化処理を説明するための図である。
【図5】 本発明の実施の形態2におけるオーディオ信
号量子化装置の符号化部の詳細な構成を示す図、及び聴
覚心理重みベクトルテーブルの一例を示す図である。
【図6】 本発明の実施の形態3におけるオーディオ信
号量子化装置の符号化部の詳細な構成を示す図、及び平
滑化部における処理を説明するための図である。
【図7】 本発明の実施の形態4におけるオーディオ信
号量子化装置の符号化部の詳細な構成を示す図である。
【図8】 本発明の実施の形態5におけるオーディオ信
号量子化装置の符号化部の詳細な構成を示す図である。
【図9】 本発明の実施の形態6におけるオーディオ信
号逆量子化装置の構成を示す図である。
【図10】 従来のオーディオ信号量子化装置の構成を
示す図である。
【符号の説明】
1 符号化部 2,21 復号化部 3,31 送信側コードブック 4 オーディオコード選択部 5 コード復号部 6,61 受信側コードブック 102 オーディオコード選択部 103 聴覚心理重みベクトルテーブル 104 平滑ベクトルテーブル 105 平滑化部 106 ソート部 107 位相情報抽出部
フロントページの続き (72)発明者 石川 智一 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号の特徴量であるオーディ
    オ特徴ベクトルを入力信号とし、該オーディオ特徴ベク
    トルのうちの所定の周波数帯域に属するものの位相情報
    を抽出する位相情報抽出部と、 上記オーディオ特徴ベクトルの代表値であるオーディオ
    コードを、上記抽出した位相情報に対応する要素部分を
    絶対値化した状態のものとして複数個これを格納するコ
    ードブックと、 上記オーディオ特徴ベクトルと上記コードブック中の各
    オーディオコードとの聴覚的な距離を算出して、その最
    小距離を有するオーディオコードを選出するとともに、
    該最小距離を有するオーディオコードに対する位相情報
    を上記位相情報抽出部からの出力を補助情報として用い
    て付加し、該オーディオコードに対応するコードインデ
    ックスをその出力信号として出力するオーディオコード
    選択部とを備えたことを特徴とするオーディオ信号量子
    化装置。
  2. 【請求項2】 請求項1記載のオーディオ信号量子化装
    置において、 上記位相情報抽出部は、入力されたオーディオ特徴ベク
    トルのうちの低周波帯域側のものより所定個数の要素の
    位相情報を抽出するものであることを特徴とするオーデ
    ィオ信号量子化装置。
  3. 【請求項3】 請求項1記載のオーディオ信号量子化装
    置において、 人間の聴覚心理特性を考慮した各周波数における相対的
    な聴覚心理量のテーブルである聴覚心理重みベクトルテ
    ーブルを備え、 上記位相情報抽出部は、入力されたオーディオ特徴ベク
    トルのうち、上記聴覚心理重みベクトルテーブルに格納
    されたベクトルと一致する要素の位相情報を抽出するも
    のであることを特徴とするオーディオ信号量子化装置。
  4. 【請求項4】 請求項1記載のオーディオ信号量子化装
    置において、 上記オーディオ特徴ベクトルを平滑ベクトルを用いてベ
    クトル要素同士の除算により平滑化する平滑化部を備
    え、 上記オーディオコード選択部は、上記最小距離を有する
    オーディオコードを選出し、該選出されたオーディオコ
    ードに位相情報を付加する前に、上記平滑化部から出力
    される平滑化処理情報を用いて、上記選出されたオーデ
    ィオコードを、平滑化処理のなされていないオーディオ
    コードに変換し、該オーディオコードに対応するコード
    インデックスをその出力信号として出力することを特徴
    とするオーディオ信号量子化装置。
  5. 【請求項5】 請求項1記載のオーディオ信号量子化装
    置において、 人間の聴覚心理特性を考慮した各周波数における相対的
    な聴覚心理量のテーブルである聴覚心理重みベクトルテ
    ーブルと、 上記オーディオ特徴ベクトルを平滑ベクトルを用いて、
    ベクトル要素同士の除算により平滑化する平滑化部と、 上記聴覚心理重みベクトルテーブルの値と上記平滑ベク
    トルテーブルの値とを乗じて得られる値を聴覚的重要度
    の高い順に複数個選出してこれを上記オーディオコード
    選択部に出力するソート部とを備えたことを特徴とする
    オーディオ信号量子化装置。
  6. 【請求項6】 請求項2ないし4のいずれかに記載のオ
    ーディオ信号量子化装置において、 上記オーディオ特徴ベクトルとして、上記オーディオ信
    号を周波数変換した係数を要素とするベクトルを用いる
    ことを特徴とするオーディオ信号量子化装置。
  7. 【請求項7】 請求項2ないし4のいずれかに記載のオ
    ーディオ信号量子化装置において、 上記オーディオ特徴ベクトルとして、 上記オーディオ信号をMDCT変換(変形離散コサイン
    変換)した係数を要素とするベクトルを用いることを特
    徴とするオーディオ信号量子化装置。
  8. 【請求項8】 請求項4または5に記載のオーディオ信
    号量子化装置において、 上記平滑ベクトルとして、 オーディオ信号を線形予測して線形予測係数を算出し、
    該算出された前記線形予測係数から各周波数における相
    対的な周波数応答を算出し、該各周波数における相対的
    な周波数応答を要素とするベクトルを用いることを特徴
    とするオーディオ信号量子化装置。
  9. 【請求項9】 オーディオ信号の特徴量であるオーディ
    オ特徴ベクトルを量子化して得られたコードインデック
    スを入力信号とし、該コードインデックスのうちの所定
    の周波数帯域に相当する要素の位相情報を抽出する位相
    情報抽出部と、 上記コードインデックスに対応するオーディオ特徴ベク
    トルを、上記抽出した位相情報に対応する要素部分を絶
    対値化した状態のものとして複数個これを格納するコー
    ドブックと、 上記コードインデックスと上記コードブック中のオーデ
    ィオ特徴ベクトルとの聴覚的な距離を算出して、その最
    小距離を有するオーディオ特徴ベクトルを選出するとと
    もに、該最小距離を有するオーディオ特徴ベクトルに対
    する位相情報を上記位相情報抽出部からの出力を補助情
    報として用いて付加し、上記入力信号であるコードイン
    デックスに対応するオーディオ特徴ベクトルをその出力
    信号として出力するオーディオコード選択部とを備えた
    ことを特徴とするオーディオ信号逆量子化装置。
JP21221397A 1997-04-10 1997-08-06 オーディオ信号量子化装置、オーディオ信号逆量子化装置、オーディオ信号量子化方法、及びオーディオ信号逆量子化方法 Expired - Fee Related JP3242353B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21221397A JP3242353B2 (ja) 1997-04-10 1997-08-06 オーディオ信号量子化装置、オーディオ信号逆量子化装置、オーディオ信号量子化方法、及びオーディオ信号逆量子化方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9-92406 1997-04-10
JP9240697 1997-04-10
JP21221397A JP3242353B2 (ja) 1997-04-10 1997-08-06 オーディオ信号量子化装置、オーディオ信号逆量子化装置、オーディオ信号量子化方法、及びオーディオ信号逆量子化方法

Publications (2)

Publication Number Publication Date
JPH10340100A true JPH10340100A (ja) 1998-12-22
JP3242353B2 JP3242353B2 (ja) 2001-12-25

Family

ID=26433843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21221397A Expired - Fee Related JP3242353B2 (ja) 1997-04-10 1997-08-06 オーディオ信号量子化装置、オーディオ信号逆量子化装置、オーディオ信号量子化方法、及びオーディオ信号逆量子化方法

Country Status (1)

Country Link
JP (1) JP3242353B2 (ja)

Also Published As

Publication number Publication date
JP3242353B2 (ja) 2001-12-25

Similar Documents

Publication Publication Date Title
US9390720B2 (en) Entropy encoding and decoding using direct level and run-length/level context-adaptive arithmetic coding/decoding modes
KR100283547B1 (ko) 오디오 신호 부호화 방법 및 복호화 방법, 오디오 신호 부호화장치 및 복호화 장치
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
US6064954A (en) Digital audio signal coding
US8510105B2 (en) Compression and decompression of data vectors
US20050015249A1 (en) Entropy coding by adapting coding between level and run-length/level modes
US20060235678A1 (en) Apparatus and method of encoding audio data and apparatus and method of decoding encoded audio data
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
KR20000023379A (ko) 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록매체 및 제공 매체
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US6269332B1 (en) Method of encoding a speech signal
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
EP1668462A2 (en) A fast codebook selection method in audio encoding
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
EP1121686A1 (en) Speech parameter compression
US5943644A (en) Speech compression coding with discrete cosine transformation of stochastic elements
JPH07183857A (ja) 伝送システム
JP3242353B2 (ja) オーディオ信号量子化装置、オーディオ信号逆量子化装置、オーディオ信号量子化方法、及びオーディオ信号逆量子化方法
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
WO2011087333A2 (ko) 오디오 신호 처리 방법 및 장치
JP3714786B2 (ja) 音声符号化装置
JPH0997099A (ja) 符号化・復号化装置
KR20000069159A (ko) 음성 신호 부호화 방법 및 그 장치

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees