JP2007004050A - ステレオ信号の符号化装置及び符号化プログラム - Google Patents

ステレオ信号の符号化装置及び符号化プログラム Download PDF

Info

Publication number
JP2007004050A
JP2007004050A JP2005186872A JP2005186872A JP2007004050A JP 2007004050 A JP2007004050 A JP 2007004050A JP 2005186872 A JP2005186872 A JP 2005186872A JP 2005186872 A JP2005186872 A JP 2005186872A JP 2007004050 A JP2007004050 A JP 2007004050A
Authority
JP
Japan
Prior art keywords
component
band
encoding
value
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005186872A
Other languages
English (en)
Inventor
Tomoyasu Komori
智康 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2005186872A priority Critical patent/JP2007004050A/ja
Publication of JP2007004050A publication Critical patent/JP2007004050A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 量子化ビット数の配分を効率的に行い、符号化音全体の量子化ノイズを抑えて音質劣化を防止可能な、ステレオ信号の符号化装置及び符号化プログラムを提供する。
【解決手段】 係数乗算手段2は、MSステレオ手段103から所定周波数帯域毎のDCT係数を入力し、当該DCT係数に所定の値を乗算し、乗算したDCT係数をスケールファクター決定手段3に出力する。スケールファクター決定手段3は、まず、M成分のスケールファクター値を既存の手法により決定し、その後、S成分のスケールファクター値をM成分のスケールファクター値と同じ値に決定する。このように、DCT係数を抑圧し、S成分及びM成分のスケールファクター値を同一にすることにより、量子化ビット数を減らし、チャンネル間の量子化精度を均一にすることができる。
【選択図】 図1

Description

本発明は、ステレオ信号の符号化技術に関し、特に、時間領域の入力信号を周波数領域の信号に変換し、その周波数領域の信号を所定周波数帯域の信号に分割し、さらに、各所定周波数帯域の信号に対して量子化ビット数を割当てる、ステレオ信号の符号化技術に関する。
オーディオ符号化技術の一つとして、国際標準機関であるISO/IEC JTS1/SC29/WG11により標準化されたISO/IEC13818(MPEG−2)がある(非特許文献1を参照)。このオーディオ符号化技術は、符号化されたビットストリーム(圧縮データ)の解釈とその復号処理について規定しているものであるため、符号化処理については自由に行うことができる。
図3は、ISO/IEC13818(MPEG−2)にて規定されているエンコーダ(符号化装置)の例である。この符号化装置100は、聴覚モデル手段101、フィルターバンク手段102、MSステレオ手段103、量子化手段104、ノイズレスコーディング手段105及びマルチプレクス手段106を備えている。符号化装置100は、入力音声信号を入力し、当該信号を周波数領域の信号に変換し、符号化に使用できる量子化ビット数の範囲内で、量子化ビット数を所定周波数領域毎の信号にそれぞれ割り振り、当該信号を量子化し、フレームに組み込んだ出力ビットストリームを出力する。
聴覚モデル手段101は、入力音声信号を入力し、当該入力音声信号に対する量子化雑音のマスキングパターンを計算する。つまり、入力音声信号の聴覚的なマスキングスレッシュホールドを計算する。具体的には、フィルターバンク手段102によるDCT(離散コサイン変換:Discrete Cosine Transform)の分析位置と一致するように、入力音声信号をFFT(高速フーリエ変換:Fast Fourier Transform)を用いて分析し、入力音声信号をマスキングできる最大のノイズ量(スレッシュホールド)を計算し、所定周波数帯域毎のSignal to Mask比やスレッシュホールド値を含む制御情報を出力する。また、ロング、スタート、ストップ、ショートのうちのどのブロックタイプを選択するのかの制御情報も出力する。
フィルターバンク手段102は、聴覚モデル手段101からの制御情報に基づいて、FFTまたはDCT等の変換により、時間領域の入力音声信号を周波数領域の信号に変換する。また、この周波数領域の信号の係数(周波数係数)をまとめて所定周波数帯域の係数とし、複数の所定周波数帯域(バンド)のDCT係数、すなわちステレオ信号(L成分及びR成分から成る信号)におけるL成分のDCT係数及びR成分のDCT係数を出力する。つまり、フィルターバンク手段102は、入力音声信号を複数の所定周波数帯域に分割する。
MSステレオ手段103は、フィルターバンク手段102から所定周波数帯域毎のDCT係数を入力し、聴覚モデル手段101からの制御情報に基づいて、ステレオ信号のチャンネル間の相関(L成分とR成分との間の相関)が大きいか否かを判断する。チャンネル間の相関が大きいと判断した場合は、LR信号からM(L+R)S(L−R)信号に切り替えて出力する。すなわち、LRモードからMSモードに切り替えて出力する。一方、チャンネル間の相関が大きくないと判断した場合は、LRモードで出力する。一般に、後述する量子化手段104は、使用できる量子化ビット数が不足している場合、聴覚的に許された量子化ノイズよりも大きな量子化ノイズを発生させてしまう。このMSステレオ手段103は、これを防止するため、チャンネル間の相関が大きいと判断した場合に、LR信号からMS信号に切り替えることにより、使用する量子化ビット数を減らすことを実現する。つまり、量子化手段104が適切な量子化ビット数を割当てることにより、符号化音全体の量子化ノイズを抑えて、音質が劣化しないようにする。
量子化手段104は、MSステレオ手段103から、LR信号またはMS信号における各成分の所定周波数帯域毎のDCT係数を入力し、聴覚モデル手段101からの制御情報に基づいて、DCT係数を変換するためのゲインを表現するスケールファクター値を作成し、DCT係数を量子化値に変換する。ここで、DCT係数をK、量子化値をR、スケールファクター値をS、ゲインをGとすると、K=R×Gとなる。この式により、量子化値を求める。
ノイズレスコーディング手段105は、量子化手段104からスケールファクター値、量子化値を入力し、聴覚モデル手段101からの制御情報に基づいて、ハフマン符号語等に変換し、符号化データを出力する。また、変換の際に使用した所定周波数帯域毎の量子化ビット数を量子化手段104にフィードバックする。
マルチプレクス手段106は、ノイズレスコーディング手段105から符号化データを入力し、当該符号化データをフレームに組み込み、出力ビットストリームとして出力する。
このように、符号化装置100は、入力音声信号を入力し、符号化処理を施し、出力ビットストリームを出力する。この場合、前述のようにISO/IEC13818(MPEG−2)の国際規格では、符号化処理について自由に行うことができる。例えば、MSステレオ手段103によるLRモードとMSモードと間の切替条件や、量子化手段104による量子化ビットの配分条件については、具体的に定められていない。したがって、MSステレオ手段103の切替条件を決定するための計算量が多くなったり、量子化手段104による量子化ビットの配分が不適切なため音質劣化が生じたりする問題があった。
このような問題に鑑み、入力音声信号の周波数領域全体にわたってエナジー情報及びエントロピー情報を計算し、これらの情報に基づいてLRモードとMSモードとの間を切り替え、ビット配分を行う符号化装置が開示されている(特許文献1を参照)。この符号化装置によれば、エナジー情報及びエントロピー情報を利用して量子化精度情報を決定するから、符号化のための計算量を減少し、符号化による音質を改善することができる。
"情報技術−映画及び関連オーディオ情報の共通符号化 第7部:適応オーディオ符号化(AAC)",国際規格,ISO/IEC13818−7,2003年 特開2002−268694号公報
しかしながら、前述の特許文献1の技術では、チャンネル間に量子化精度の差が存在することにより音質が劣化する点については考慮されておらず、また、量子化ビットを削減する手法についても言及されていない。さらに、音質を改善するために、MSステレオ手段を積極的に使用する手法についても言及されていない。
このため、従来の技術では、MSステレオ手段において量子化精度を決定する手法が明確でないため、チャンネル間に量子化精度の差が存在することにより、量子化ビット数を効率的に配分することができないという問題があった。
また、より低いビットレートで符号化処理を行う場合であっても、入力音声信号の原信号をそのまま符号化することにより、多くの量子化ビット数を消費するという問題があった。この結果、他の音声フレームや他の周波数帯域に割当てる量子化ビット数が減ってしまうため、符号化音全体の量子化ノイズが大きくなり、音質が劣化してしまうことになる。
さらに、小さい音を符号化する場合には高い精度が要求されないにもかかわらず、フレーム単位で量子化ビット数が足りているときは、精度高く符号化処理を行ってしまう。この結果、他の音声フレームや他の周波数帯域に割当てる量子化ビット数が減ってしまうため、符号化音全体の量子化ノイズが大きくなり、音質が劣化してしまうことになる。
本発明は、かかる問題を解決するためになされたものであり、その目的は、量子化ビット数の配分を効率的に行い、符号化音全体の量子化ノイズを抑えて音質劣化を防止可能な、ステレオ信号の符号化装置及び符号化プログラムを提供することにある。
本発明による符号化装置は、時間領域の信号を周波数領域の信号に変換し、複数の帯域に分割して該帯域毎の周波数係数を出力する手段と、L成分及びR成分から成るステレオ信号、またはM成分及びS成分から成る和差信号の切り替えを行い、前記ステレオ信号または和差信号における帯域毎の周波数係数を出力する手段と、前記帯域毎の周波数係数及び制御値に基づいて、帯域毎に量子化精度を決定し量子化を行い、オーディオ信号の符号化処理を行う手段とを備えた符号化装置において、前記M成分の制御値とS成分の制御値とが同一になるように、それぞれの制御値を決定する制御値決定手段を備え、前記帯域毎の周波数係数、及び、制御値決定手段により決定されたM成分及びS成分についての同一の制御値に基づいて、M成分及びS成分の量子化精度を同一にし、帯域毎に量子化を行うことを特徴とする。これにより、M成分及びS成分の量子化精度が均一になるから、どちらか一方の成分に過剰な量子化ビットを与えることがない。ここで、制御値には、AACやmp3の符号化の場合のスケールファクター値だけでなく、その他の符号化の場合における量子化精度を決定するための制御値を含む。
また、本発明による符号化装置は、前記和差信号における帯域毎の周波数係数に対して所定の値を乗算し、新たな周波数係数を算出する係数乗算手段を備え、該係数乗算手段により算出された新たな周波数係数、及び、前記制御値決定手段により決定されたM成分及びS成分についての同一の制御値に基づいて、M成分及びS成分の量子化精度を同一にし、帯域毎に量子化を行うことを特徴とする。また、前記係数乗算手段は、さらに、前記和差信号における帯域毎の周波数係数と帯域毎に定められたしきい値とを比較し、前記周波数係数がしきい値よりも小さい場合に、その帯域における新たな周波数係数を0とすることを特徴とする。この係数乗算手段により、和差信号が整形され、符号化に使用する量子化ビット数を減らすことができる。
また、本発明による符号化装置は、前記制御値決定手段が、さらに、係数乗算手段により計算された新たな周波数係数が0である成分について該成分の制御値を0とし、該符号化装置は零値符号化を行うことを特徴とする。また、前記係数乗算手段により計算された新たな周波数係数を、あるフレームにおけるM成分及びS成分のうちの少なくとも一つの帯域の成分について0とし、零値符号化を行うことを特徴とする。
また、本発明による符号化装置は、前記係数乗算手段が、さらに、前記符号化処理のビットレート、及び、和差信号における帯域毎の周波数係数の値を利用した評価関数を用いて、前記所定の値及びしきい値のうちの少なくとも一つを決定するように構成するのが好適である。
また、本発明による符号化プラグラムは、符号化装置を構成するコンピュータに実行させるプログラムであって、前記M成分の制御値とS成分の制御値とが同一になるように、それぞれの制御値を決定する処理と、前記帯域毎の周波数係数、及び、前記決定されたM成分及びS成分についての同一の制御値に基づいて、M成分及びS成分の量子化精度を同一にし、帯域毎に量子化を行う処理とを実行させることを特徴とする。
本発明によれば、M成分の制御値とS成分の制御値とを同一にし、チャンネル間の量子化精度を同一にするようにしたから、どちらか一方の成分に過剰に量子化ビットを与えることがなく、効率的な符号化を実現することができる。
また、本発明によれば、帯域毎の周波数係数を抑圧するようにしたから、使用する量子化ビット数を減らすことができる。したがって、減らした量子化ビット数を、符号化音全体の量子化精度を向上させるために使用することができ、音質劣化を防ぐことができる。
また、本発明によれば、任意の帯域の周波数係数を0とすることにより、零値符号化を実現することができる。したがって、使用する量子化ビット数を減らすことができ、減らした量子化ビット数を、符号化音全体の量子化精度を向上させるために使用することができ、音質劣化を防ぐことができる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
図1は、本発明の実施の形態による符号化装置のシステム構成図である。この符号化装置1は、聴覚モデル手段101、フィルターバンク手段102、MSステレオ手段103、係数乗算手段2、スケールファクター決定手段3、量子化手段104、ノイズレスコーディング手段105及びマルチプレクス手段106を備えている。この符号化装置1と図3に示した符号化装置100とを比較すると、両装置1,100は、入力音声信号を入力し、当該信号を周波数領域の信号に変換し、符号化に使用できる量子化ビット数の範囲内で、量子化ビット数を周波数領域毎の信号にそれぞれ割り振り、当該信号を量子化し、フレームに組み込んだ出力ビットストリームを出力する点で共通する。しかし、符号化装置1が、図3に示した符号化装置100の各手段に加えて、係数乗算手段2及びスケールファクター決定手段3を備えている点で相違する。尚、図3では量子化手段104がスケールファクター値を決定したが、図1の符号化装置1ではスケールファクター決定手段3がスケールファクター値を決定する。
聴覚モデル手段101、フィルターバンク手段102、MSステレオ手段103、量子化手段104、ノイズレスコーディング手段105及びマルチプレクス手段106は、図3に示した符号化装置100の各手段と同様の機能を有する。尚、これらの手段の詳細については、前述の非特許文献(ISO/IEC13818−7(MPEG−2))に記載されているので、ここでは説明を省略する。
〔係数乗算手段2〕
係数乗算手段2は、MSステレオ手段103から、所定周波数帯域毎のLR成分またはMS成分のDCT係数を入力し、当該DCT係数に所定の値を乗算し、乗算したDCT係数をスケールファクター決定手段3に出力する。
例えば、MSステレオ手段103が、MSモードに切り替わり、入力音声信号の全てをMS信号に変換した場合を想定する。係数乗算手段2は、MSステレオ手段103から、M成分のDCT係数M[I]及びS成分のDCT係数S[I]を入力する。ここで、I=0〜1023とする。この場合、通常、M[I]=(L[I]+R[I])/2,S[I]=(L[I]−R[I])/2である。尚、L[I]は、入力音声信号であるステレオ信号のうちのL成分の係数であり、R[I]はステレオ信号のうちのR成分の係数である。
係数乗算手段2は、以下の(1)及び(2)式を計算し、計算結果であるDCT係数S2[I],M2[I]を出力する。
S2[I]=k1×S[I] ・・・ (1)
M2[I]=k2×M[I] ・・・ (2)
ここで、k1,k2は、0から1までの値であり、例えば、エンコーダ側で任意の値に設定することができる。
k1=0の場合は、S成分について零値符号化を実現することができる。また、k2=0の場合は、M成分について零値符号化を実現することができる。これにより、後段の量子化手段104は、DCT係数0を入力して量子化値を0とするから、量子化ビット数を削減することができる。
尚、k1,k2は、S成分及びM成分について同じ値に設定されていてもよいし、異なる値に設定されていてもよい。また、k1,k2は、入力音声信号のフレーム毎に設定されていてもよいし、周波数帯域毎に設定されていてもよい。
また、k1,k2を可変値としてもよい。この場合、係数乗算手段2は、入力音声信号の性質に基づいてk1,k2を決定する。例えば、符号化ビットレートや音源の種類に応じて設定するようにしてもよいし、聴覚モデル手段101から帯域毎のLR成分の強さの情報を入力し、当該情報に応じて帯域毎に設定するようにしてもよい。
さらに、係数乗算手段2は、MSステレオ手段103から入力したDCT係数M[I],S[I]が、所定のしきい値aよりも小さいか否かを判断する。DCT係数がしきい値aよりも小さいと判断した場合は、そのDCT係数を0に設定し、DCT係数0を出力する。一方、DCT係数がしきい値aよりも小さくないと判断した場合は、入力したDCT係数をそのまま出力する。この場合、前述の乗算処理により0以外の結果となったDCT係数に対して、当該しきい値aの比較処理を施す。
図2は、係数乗算手段2が、S成分のDCT係数S[sb][I]を入力し、あるスケールファクターバンド(所定周波数帯域)のみのDCT係数S2[sb][I]を0に設定する場合のフロー図である。ここで、sbは、スケールファクターバンドである。尚、スケールファクターバンドsbとI(offset(sb)〜top(sb))とは、表1に示すような関係にある。表1は、48kHzの符号化ビットレートのサンプリングにおけるロングブロックの例である。
Figure 2007004050
図2に戻って、係数乗算手段2は、S成分のDCT係数S[sb][I]を入力すると、当該DCT係数S[sb][I]と予め設定されたしきい値a[sb]とを比較する(ステップS201)。ここで、しきい値a[sb]は、スケールファクターバンドsb毎に設定された値とする。DCT係数S[sb][I]がしきい値a[sb]よりも小さい場合は、出力するS2[sb][I]に0を設定する(ステップS202)。一方、DCT係数S[sb][I]がしきい値a[sb]よりも小さくない場合は、出力するS2[sb][I]に、入力したS[sb][I]を設定する(ステップS203)。このように、係数乗算手段2は、図2に示した処理をスケールファクターバンドsb毎に繰り返し、設定したDCT係数S2[sb][I]をスケールファクター決定手段3に出力する。
尚、図2はS成分についての処理フロー図であるが、M成分についても適用されることは言うまでもない。この場合、しきい値a[sb]は、S成分及びM成分について、予め異なる値が設定されていてもよいし、同じ値が設定されていてもよい。
また、図2において、しきい値a[sb]は、スケールファクターバンドsb毎に予め設定された値としたが、各符号化ビットレートにおけるスケールファクターバンド毎に設定された値としてもよい。この場合、係数乗算手段2は、しきい値a[sb]を、スケールファクターバンドsb及び符号化ビットレートにより変化する評価関数やテーブルとして保持するようにしてもよい。例えば、32kbpsのステレオ信号の場合はしきい値a[sb]=50、144kbpsのステレオ信号の場合はしきい値a[sb]=0.5とする。この場合、符号化ビットレートが低いときは、しきい値a[sb]が大きいから、図2において係数算出手段2によりDCT係数0を出力する割合が高くなる。このように、符号化ビットレートとしきい値a[sb]とを反比例の関係になるような評価関数やテーブルを用いることにより、符号化ビットレートが低いときは零値符号化を実現する割合が高くなるから、量子化ビット数を削減することができる。つまり、低いビットレートで符号化する場合に、使用可能なビット数のうち多くの量子化ビット数を消費するという従来の問題を解決することができる。
また、しきい値a[sb]は、係数乗算手段2がMSステレオ手段103から入力したDCT係数について、全てのスケールファクターバンドsbにおいて最大のDCT係数に対する相対値としてもよい。また、しきい値a[sb]は、係数乗算手段2が、聴覚モデル手段8から、マスキングパターン計算後のDCT係数を入力し、全てのスケールファクターバンドsbにおいて最大のDCT係数に対する相対値としてもよい。例えば、マスキングの程度が大きい場合にはしきい値a[sb]を大きな値に設定し、マスキングの程度の小さい場合にはしきい値a[sb]を小さな値に設定する。これにより、一層聴覚特性に鑑みた符号化制御を実現することができる。また、符号化ビットレート及び前記DCT係数を利用した評価関数やテーブルを用いることにより、しきい値a[sb]を設定するようにしてもよい。この場合、前述した符号化ビットレート及びDCT係数を利用した評価関数やテーブルを用いて、前述の所定値k1,k2を設定するようにしてもよい。
また、係数乗算手段2は、入力したM成分のDCT係数M[I]及びS成分のDCT係数S[I]に対して、各DCT係数の値を抑圧するようにしたが、M成分のDCT係数及びS成分のDCT係数のいずれか一方のDCT係数の値を抑圧するようにしてもよい。いずれか一方のDCT係数の値を抑圧した場合であっても、量子化ビット数を削減することができる。
また、係数乗算手段2は、図1に示すように、ノイズレスコーディング手段105から帯域毎の使用する量子化ビット数を入力し、当該量子化ビット数に応じて、前述の所定値k1,k2、及びしきい値a[sb]を設定し、帯域毎のDCT係数を出力するようにしてもよい。これにより、零値符号化を行うDCT係数における帯域の最大値(DCT係数を0とする帯域の最大値)を変更することができ、量子化ビット数に応じた符号化音の音質改善を実現することができる。
〔スケールファクター決定手段3〕
スケールファクター決定手段3は、係数乗算手段2から、所定周波数帯域毎のDCT係数をそれぞれ入力し、スケールファクター値を決定し、当該所定周波数帯域毎のDCT係数、及び決定したスケールファクター値を量子化手段104に出力する。
例えば、MSステレオ手段103が、MSモードに切り替わり、入力音声信号の全てをMS信号に変換した場合を想定する。スケールファクター決定手段3は、所定の手法により、M成分のスケールファクター値Scf_M[sb]を以下の式のように決定したとする。
Scf_M[sb]=c[sb] ・・・ (3)
ここで、sb=0〜48とする。尚、c[sb]の決定手法については、前述の非特許文献(ISO/IEC13818−7(MPEG−2))に記載されているので、ここでは説明を省略する。この場合、スケールファクター決定手段3は、S成分のスケールファクター値Scf_S[sb]を以下の式により決定する。
Scf_S[sb]=Scf_M[sb] ・・・ (4)
ここで、sb=0〜48とする。
すなわち、スケールファクター決定手段3は、まず、M成分のスケールファクター値を既存の手法により決定し、その後、S成分のスケールファクター値をM成分のスケールファクター値と同じ値に決定する。この場合、係数乗算手段2においてk1=0((1)式を参照)の場合には、そのスケールファクターバンドにおけるS成分のスケールファクター値を以下の式のように0に決定する。これにより、零値符号化を実現することができ、量子化ビット数を削減することができる。
Scf_S[sb]=0 ・・・ (5)
尚、前記(4)(5)式により決定されるS成分のスケールファクター値は、全てのスケールファクターバンドに対して適用するようにしてもよく、一部のスケールファクターバンドに対して適用するようにしてもよい。一部のスケールファクターバンドに対して適用する場合は、適用外のスクールファクターバンドについて、S成分のスケールファクター値は、(3)式に示したように、前述の非特許文献(ISO/IEC13818−7(MPEG−2))に記載されている所定の手法により決定される。また、スケールファクター決定手段3は、まず、S成分のスケールファクター値を決定し、その後、M成分のスケールファクター値をS成分のスケールファクター値と同じ値に設定するようにしてもよい。
また、スケールファクター決定手段3は、図1に示すように、ノイズレスコーディング手段105から帯域毎の使用する量子化ビット数を入力し、当該量子化ビット数に応じて、スケールファクター値を決定するようにしてもよい。量子化ビット数に応じて、スケールファクター値を決定することにより、量子化ビット数に応じた符号化音の音質改善を実現することができる。
以上のように、本発明の実施の形態による符号化装置1によれば、係数乗算手段2が、DCT係数の値を抑圧するようにした。これにより、使用する量子化ビット数を減らすことができる。したがって、例えば、あるスケールファクターバンドのDCT係数を抑圧することにより、その帯域のステレオ感が縮小されるが、これにより削減された量子化ビットを符号化音全体の量子化精度向上のために使用することができる。この結果、符号化音質の向上を図ることができる。
また、本発明の実施の形態による符号化装置1によれば、スケールファクター決定手段3が、M成分のスケールファクター値とS成分のスケールファクター値とを同一にするようにした。これにより、M成分とS成分との間の量子化精度を同一にすることができ、M成分及びS成分で生じていた和差算後の量子化誤差が蓄積しなくなる。つまり、デコーダにおいて、MS信号をLR信号に復号した際に、量子化誤差が両チャンネルに均等に配分されているから、量子化ノイズのレベル差による両耳のステレオ感を削減することができる。また、M成分とS成分との間の量子化精度を同一にすることができるから、一方に過剰に量子化ビットを割当てることがなく、結果として効率的に符号化を実現することができる。
また、本発明の実施の形態による符号化装置1によれば、係数乗算手段2が、所定の場合にDCT係数の値を0とするようにした。また、スケールファクター決定手段3が、所定の場合に、スケールファクター値を0とするようにした。これにより、零値符号化を実現することができ、使用する量子化ビット数を減らすことができる。したがって、例えば、あるスケールファクターバンドのDCT係数及びスケールファクター値を0とすることにより、その帯域のステレオ感が縮小されたり、帯域によっては音が消失したりすることになるが、これにより削減された量子化ビットを符号化音全体の量子化精度向上のために使用することができる。この結果、符号化音質の向上を図ることができる。
以上、実施の形態を挙げて本発明を説明したが、本発明は上記実施の形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上記実施の形態では、MPEG−2について適用があるが、mp3等についても適用することができる。
尚、上記符号化装置1は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、キーボード等の入力装置、データを表示する表示装置、及び外部の装置と通信するためのインターフェースを備えたコンピュータ装置によってそれぞれ構成されるようにしてもよい。この場合、符号化装置1に備えた聴覚モデル手段101、フィルターバンク手段102、MSステレオ手段103、係数乗算手段2、スケールファクター決定手段3、量子化手段104、ノイズレスコーディング手段105及びマルチプレクス手段106の各機能は、当該機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。また、これらのプログラムは、磁気ディスク(フロッピィーディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもできる。
本発明の実施の形態による符号化装置のシステム構成図である。 図1の係数乗算手段の処理を説明するためのフロー図である。 従来の符号化装置のシステム構成図である。
符号の説明
1,100 符号化装置
2 係数乗算手段
3 スケールファクター決定手段
101 聴覚モデル手段
102 フィルターバンク手段
103 MSステレオ手段
104 量子化手段
105 ノイズレスコーディング手段
106 マルチプレクス手段

Claims (7)

  1. 時間領域の信号を周波数領域の信号に変換し、複数の帯域に分割して該帯域毎の周波数係数を出力する手段と、L成分及びR成分から成るステレオ信号、またはM成分及びS成分から成る和差信号の切り替えを行い、前記ステレオ信号または和差信号における帯域毎の周波数係数を出力する手段と、前記帯域毎の周波数係数及び制御値に基づいて、帯域毎に量子化精度を決定し量子化を行い、オーディオ信号の符号化処理を行う手段とを備えた符号化装置において、
    前記M成分の制御値とS成分の制御値とが同一になるように、それぞれの制御値を決定する制御値決定手段を備え、
    前記帯域毎の周波数係数、及び、制御値決定手段により決定されたM成分及びS成分についての同一の制御値に基づいて、M成分及びS成分の量子化精度を同一にし、帯域毎に量子化を行うことを特徴とする符号化装置。
  2. 請求項1に記載の符号化装置において、
    前記和差信号における帯域毎の周波数係数に対して所定の値を乗算し、新たな周波数係数を算出する係数乗算手段を備え、
    該係数乗算手段により算出された新たな周波数係数、及び、前記制御値決定手段により決定されたM成分及びS成分についての同一の制御値に基づいて、M成分及びS成分の量子化精度を同一にし、量子化を行うことを特徴とする符号化装置。
  3. 請求項2に記載の符号化装置において、
    前記係数乗算手段は、さらに、前記和差信号における帯域毎の周波数係数と帯域毎に定められたしきい値とを比較し、前記周波数係数がしきい値よりも小さい場合に、その帯域における新たな周波数係数を0とすることを特徴とする符号化装置。
  4. 請求項2または3までのいずれか一項に記載の符号化装置において、
    前記制御値決定手段は、さらに、係数乗算手段により計算された新たな周波数係数が0である成分について該成分の制御値を0とし、該符号化装置は零値符号化を行うことを特徴とする符号化装置。
  5. 請求項2から4までのいずれか一項に記載の符号化装置において、
    前記係数乗算手段により計算された新たな周波数係数を、あるフレームにおけるM成分及びS成分のうちの少なくとも一つの帯域の成分について0とし、零値符号化を行うことを特徴とする符号化装置。
  6. 請求項3に記載の符号化装置において、
    前記係数乗算手段は、さらに、前記符号化処理のビットレート、及び、和差信号における帯域毎の周波数係数の値を利用した評価関数を用いて、前記所定の値及びしきい値のうちの少なくとも一つを決定することを特徴とする符号化装置。
  7. 時間領域の信号を周波数領域の信号に変換し、複数の帯域に分割して該帯域毎の周波数係数を出力する手段と、L成分及びR成分から成るステレオ信号、またはM成分及びS成分から成る和差信号の切り替えを行い、前記ステレオ信号または和差信号における帯域毎の周波数係数を出力する手段と、前記帯域毎の周波数係数及び制御値に基づいて、帯域毎に量子化精度を決定し量子化を行い、オーディオ信号の符号化処理を行う手段とを備えた符号化装置を構成するコンピュータに実行させるプログラムであって、
    前記M成分の制御値とS成分の制御値とが同一になるように、それぞれの制御値を決定する処理と、
    前記帯域毎の周波数係数、及び、前記決定されたM成分及びS成分についての同一の制御値に基づいて、M成分及びS成分の量子化精度を同一にし、帯域毎に量子化を行う処理と
    を実行させる符号化プログラム。

JP2005186872A 2005-06-27 2005-06-27 ステレオ信号の符号化装置及び符号化プログラム Pending JP2007004050A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005186872A JP2007004050A (ja) 2005-06-27 2005-06-27 ステレオ信号の符号化装置及び符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005186872A JP2007004050A (ja) 2005-06-27 2005-06-27 ステレオ信号の符号化装置及び符号化プログラム

Publications (1)

Publication Number Publication Date
JP2007004050A true JP2007004050A (ja) 2007-01-11

Family

ID=37689711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005186872A Pending JP2007004050A (ja) 2005-06-27 2005-06-27 ステレオ信号の符号化装置及び符号化プログラム

Country Status (1)

Country Link
JP (1) JP2007004050A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9049509B2 (en) 2010-02-09 2015-06-02 Kabushiki Kaisha Audio-Technica Stereo microphone
JP2016206244A (ja) * 2015-04-15 2016-12-08 富士通株式会社 符号化装置、符号化方法、及びプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0651795A (ja) * 1992-03-02 1994-02-25 American Teleph & Telegr Co <Att> 信号量子化装置及びその方法
JPH06291671A (ja) * 1991-12-03 1994-10-18 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化方法
JPH07288473A (ja) * 1994-04-15 1995-10-31 Sony Corp 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JPH10240297A (ja) * 1996-12-27 1998-09-11 Mitsubishi Electric Corp 音響信号符号化装置
JPH10294668A (ja) * 1997-04-22 1998-11-04 Matsushita Electric Ind Co Ltd オーディオ符号化データ復号化方法、オーディオ符号化データ復号化装置、及び記録媒体
JPH1188184A (ja) * 1997-02-05 1999-03-30 Nippon Telegr & Teleph Corp <Ntt> 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
JP2002244698A (ja) * 2000-12-14 2002-08-30 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP2005026940A (ja) * 2003-07-01 2005-01-27 Sharp Corp デジタルデータ符号化装置
JP2005165183A (ja) * 2003-12-05 2005-06-23 Matsushita Electric Ind Co Ltd 無線通信装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06291671A (ja) * 1991-12-03 1994-10-18 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化方法
JPH0651795A (ja) * 1992-03-02 1994-02-25 American Teleph & Telegr Co <Att> 信号量子化装置及びその方法
JPH07288473A (ja) * 1994-04-15 1995-10-31 Sony Corp 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JPH10240297A (ja) * 1996-12-27 1998-09-11 Mitsubishi Electric Corp 音響信号符号化装置
JPH1188184A (ja) * 1997-02-05 1999-03-30 Nippon Telegr & Teleph Corp <Ntt> 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
JPH10294668A (ja) * 1997-04-22 1998-11-04 Matsushita Electric Ind Co Ltd オーディオ符号化データ復号化方法、オーディオ符号化データ復号化装置、及び記録媒体
JP2002244698A (ja) * 2000-12-14 2002-08-30 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP2005026940A (ja) * 2003-07-01 2005-01-27 Sharp Corp デジタルデータ符号化装置
JP2005165183A (ja) * 2003-12-05 2005-06-23 Matsushita Electric Ind Co Ltd 無線通信装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9049509B2 (en) 2010-02-09 2015-06-02 Kabushiki Kaisha Audio-Technica Stereo microphone
JP2016206244A (ja) * 2015-04-15 2016-12-08 富士通株式会社 符号化装置、符号化方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP6407928B2 (ja) オーディオ処理システム
JP5298245B2 (ja) Sbrビットストリームパラメータダウンミックス
JP4212591B2 (ja) オーディオ符号化装置
KR100904542B1 (ko) 멀티채널 합성장치 제어 신호를 발생하기 위한 장치 및방법과 멀티채널 합성을 위한 장치 및 방법
JP5096468B2 (ja) サイド情報なしの時間的ノイズエンベロープの自由な整形
US8972270B2 (en) Method and an apparatus for processing an audio signal
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
JP6133408B2 (ja) 複数サブストリームをもつマルチチャネル・オーディオ信号の効率的なエンコードおよびデコード
JPWO2007026763A1 (ja) ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
WO2010037427A1 (en) Apparatus for binaural audio coding
KR101657916B1 (ko) 멀티채널 다운믹스/업믹스의 경우에 대한 일반화된 공간적 오디오 객체 코딩 파라미터 개념을 위한 디코더 및 방법
WO2006054583A1 (ja) オーディオ信号符号化装置および方法
AU2017208310A1 (en) Audio object separation from mixture signal using object-specific time/frequency resolutions
JP2016189012A (ja) ハーモニックオーディオ信号の帯域幅拡張
JP5201375B2 (ja) チャネル間及び一時的冗長度抑圧を用いた音声信号符号化
KR20220108069A (ko) 오디오 처리를 위한 심리음향 모델
JP5609591B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP3519859B2 (ja) 符号器及び復号器
JP6061121B2 (ja) オーディオ符号化装置、オーディオ符号化方法、およびプログラム
EP2663978A1 (en) An audio encoder/decoder apparatus
JP2023072027A (ja) 復号装置および方法、並びにプログラム
JP2007004050A (ja) ステレオ信号の符号化装置及び符号化プログラム
JP2008129250A (ja) Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
KR100891667B1 (ko) 믹스 신호의 처리 방법 및 장치
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070514

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100809

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102