JP2011118215A - 符号化装置、符号化方法、プログラムおよび電子機器 - Google Patents
符号化装置、符号化方法、プログラムおよび電子機器 Download PDFInfo
- Publication number
- JP2011118215A JP2011118215A JP2009276407A JP2009276407A JP2011118215A JP 2011118215 A JP2011118215 A JP 2011118215A JP 2009276407 A JP2009276407 A JP 2009276407A JP 2009276407 A JP2009276407 A JP 2009276407A JP 2011118215 A JP2011118215 A JP 2011118215A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- channel signal
- spectrum
- level
- sum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】インテンシティステレオ符号化方式を用いて、再生時の音質を劣化させることなく、音声信号を符号化することができる、符号化装置、符号化方法、プログラムおよび符号化装置を搭載した電子機器を提供する。
【解決手段】符号化装置(1)は、符号化すべき入力音声信号が含む、第1チャネル信号(Lm(f))と第2チャネル信号(Rm(f))とを合成する合成部(3)と、合成部の出力レベルが、少なくとも第1チャネル信号レベルとなるように、合成部の出力レベルを調整する調整部(5)とを有する。調整部は、第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、合成部の出力レベルを第1チャネル信号レベルよりも上げる。
【選択図】図1
【解決手段】符号化装置(1)は、符号化すべき入力音声信号が含む、第1チャネル信号(Lm(f))と第2チャネル信号(Rm(f))とを合成する合成部(3)と、合成部の出力レベルが、少なくとも第1チャネル信号レベルとなるように、合成部の出力レベルを調整する調整部(5)とを有する。調整部は、第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、合成部の出力レベルを第1チャネル信号レベルよりも上げる。
【選択図】図1
Description
本発明は、音声信号を符号化する符号化装置、音声信号の符号化方法、音声信号を符号化するプログラム、および、符号化装置を搭載した電子機器に関するものである。
たとえば、デジタルテレビジョン放送やインターネットでは、取り扱うデータ量を低減させるため、映像信号に付帯した音声信号は、たとえば、MPEG2/AAC(ISO/IEC 13818-7規格)やMPEG4/AAC(ISO/IEC 14496-3規格)を用いて圧縮符号化されることが多い。
なお、「MPEG」は、「Moving Picture Experts Group phase」の略称である。「AAC」は、「Advanced Audio Coding」の略称である。
なお、「MPEG」は、「Moving Picture Experts Group phase」の略称である。「AAC」は、「Advanced Audio Coding」の略称である。
以下、MPEG2/AACを圧縮符号化方式の一例に挙げ、MPEG2/AACを単に「AAC」と言う。AACは、インテンシティステレオ(強度ステレオとも言う:Intensity Stereo)符号化方式に対応している。適宜、「インテンシティステレオ」を単に「IS」とも表記する。
IS符号化によれば、2チャネルのステレオ信号において、左チャネル信号の高周波成分と右チャネル信号の高周波成分との和が左チャネルの音声信号として符号化される。右チャネル信号の高周波成分は、0に設定され、符号化されない。ここで言う、高周波成分は、たとえば、2kHz〜7kHz程度の周波数成分である。なお、両者の低周波成分(〜2kHz)は、各々符号化される。
IS符号化によれば、2チャネルのステレオ信号において、左チャネル信号の高周波成分と右チャネル信号の高周波成分との和が左チャネルの音声信号として符号化される。右チャネル信号の高周波成分は、0に設定され、符号化されない。ここで言う、高周波成分は、たとえば、2kHz〜7kHz程度の周波数成分である。なお、両者の低周波成分(〜2kHz)は、各々符号化される。
このように、IS符号化方式を用いれば、2チャネルのステレオ信号のデータ量を、モノラル信号のデータ量並に(圧縮)符号化することができる。この利点を生かすべく、IS符号化方式を用いた、種々の符号化装置が提案されている(特許文献1、2)。
ステレオ放送では、音楽を典型的な例に挙げると、左チャネルの音声と右チャネルの音声が同じであることは少なく、両者の信号強度差が頻繁に発生している。
ここで言う「信号強度差」とは、たとえば、左チャネル信号の強度と右チャネル信号の強度との差を指す。
IS符号化方式は、上述の利点を有するが、大きな信号強度差が生じた場合には、再生時の音質が著しく劣化することがある。
ここで言う「信号強度差」とは、たとえば、左チャネル信号の強度と右チャネル信号の強度との差を指す。
IS符号化方式は、上述の利点を有するが、大きな信号強度差が生じた場合には、再生時の音質が著しく劣化することがある。
そこで、再生時の音質を劣化させることなく、IS符号化方式を用いて、音声信号を符号化することが望まれている。
本発明は、再生時の音質を劣化させることなく、インテンシティステレオ符号化方式を用いて、音声信号を符号化することができる、符号化装置、符号化方法およびプログラムを提供することにある。
本発明は、再生時の音質を劣化させることなく、インテンシティステレオ符号化方式を用いて、音声信号を符号化することができる符号化装置を搭載した、電子機器を提供することにある。
本発明は、再生時の音質を劣化させることなく、インテンシティステレオ符号化方式を用いて、音声信号を符号化することができる符号化装置を搭載した、電子機器を提供することにある。
本発明の符号化装置は、符号化すべき入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する合成部と、前記合成部の出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記合成部の出力レベルを調整する調整部と、を有し、前記調整部は、前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる。
本発明の符号化方法は、符号化すべき入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する第1工程と、前記第1工程で合成した、前記第1チャネル信号と前記第2チャネル信号とを出力する第2工程と、前記第2工程における出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記第2工程における出力レベルを調整する第3工程と、を有し、前記第3工程では、前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記第2工程における出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる。
本発明のプログラムは、符号化すべき入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する第1手順と、前記第1手順で合成した、前記第1チャネル信号と前記第2チャネル信号とを出力する第2手順と、前記第2手順における出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記第2手順での出力レベルを調整する第3手順と、を有し、前記第3手順では、前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記第2手順における出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げることをコンピュータに実行させる。
本発明の電子機器は、入力音声信号を符号化する符号化装置を有し、前記符号化装置は、前記入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する合成部と、前記合成部の出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記合成部の出力レベルを調整する調整部と、前記調整部によって出力レベルが調整された前記合成部の出力レベルを、符号化すべき音声信号として前記第2データ形式で符号化する符号化部とを有し、前記調整部は、前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる。
本発明の符号化装置によれば、合成部が、第1チャネル信号と第2チャネル信号とを合成すると、調整部は、前記合成部の出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記合成部の出力レベルを調整する。
この際に、前記調整部は、前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる。
この際に、前記調整部は、前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる。
本発明によれば、再生時の音質を劣化させることなく、インテンシティステレオ符号化方式を用いて、音声信号を符号化することができる。
以下、本発明の実施形態を図面に関連付けて説明する。なお、説明は、以下の順序で行う。
1.第1実施形態(符号化装置1)
2.第2実施形態(符号化装置1と符号化装置1aとの比較例)
3.第3実施形態(符号化装置1b)
4.第4実施形態(符号化装置1を搭載した電子機器)
1.第1実施形態(符号化装置1)
2.第2実施形態(符号化装置1と符号化装置1aとの比較例)
3.第3実施形態(符号化装置1b)
4.第4実施形態(符号化装置1を搭載した電子機器)
<1.第1実施形態>
第1実施形態の構成要素と本発明の構成要素との対応関係について説明する。
演算部4は、本発明の取得部の一実施形態である。
調整部5の分割処理部51は、本発明の一実施形態である。
左チャネル信号L(t)は、本発明の第1チャネル信号の一実施形態である。右チャネル信号R(t)は、本発明の第2チャネル信号の一実施形態である。
閾値Th2は、本発明の閾値の一実施形態である。
第1実施形態の構成要素と本発明の構成要素との対応関係について説明する。
演算部4は、本発明の取得部の一実施形態である。
調整部5の分割処理部51は、本発明の一実施形態である。
左チャネル信号L(t)は、本発明の第1チャネル信号の一実施形態である。右チャネル信号R(t)は、本発明の第2チャネル信号の一実施形態である。
閾値Th2は、本発明の閾値の一実施形態である。
[符号化装置1の構成例]
符号化装置1の構成例を図1に関連づけて説明する。
図1は、本発明の第1実施形態に係る符号化装置の構成例を示すブロック図である。
符号化装置1の構成例を図1に関連づけて説明する。
図1は、本発明の第1実施形態に係る符号化装置の構成例を示すブロック図である。
図1に図示する符号化装置1は、フィルタバンク(FB)2a、2b、合成部(COMP)3、演算部(OPE)4、調整部(ADJ)5、符号化部(ENCODE)6およびビットストリーム発生部(BSGEN)7を有する。
主に、符号化装置1は、(A)周波数スペクトル変換処理、(B)合成処理、(C)演算処理、(D)調整処理、(E)符号化処理、および、(F)ビットストリーム発生処理を行って、入力音声信号をIS符号化する。
主に、符号化装置1は、(A)周波数スペクトル変換処理、(B)合成処理、(C)演算処理、(D)調整処理、(E)符号化処理、および、(F)ビットストリーム発生処理を行って、入力音声信号をIS符号化する。
符号化装置1は、CPU(中央演算処理装置)等を搭載したコンピュータの一部として構成され、上述の(A)〜(F)の処理をソフトウェア処理する。
IS符号化を行うための手順は、コンピュータに実行させるプログラムとして、コンピュータで読み出し可能な記録媒体、たとえば、ハードディスク(図26参照)に記録されている。
IS符号化を行うための手順は、コンピュータに実行させるプログラムとして、コンピュータで読み出し可能な記録媒体、たとえば、ハードディスク(図26参照)に記録されている。
入力音声信号は、たとえば、2チャネルのステレオ信号であって、左チャネル信号L(t)と右チャネル信号R(t)とを有する。適宜、「左チャネル信号L(t)」および「右チャネル信号R(t)」を単に「左信号L(t)」および「右信号R(t)」と各々表記する。
入力音声信号の一例を示す。図2(A)、(B)は、本発明の第1実施形態に係る入力音声信号の一例を示す図である。各図において、横軸は時間を示し、縦軸は音圧を示す。
図2(A)には、左信号L(t)の音圧が時間軸(t)に沿って変動する様子が例示されている。図2(B)には、右信号R(t)の音圧が時間軸に沿って変動する様子が例示されている。
なお、「音圧」とは、音の圧力変動を指し、正または負の値(単位は、たとえばPa)をとる。
図2(A)には、左信号L(t)の音圧が時間軸(t)に沿って変動する様子が例示されている。図2(B)には、右信号R(t)の音圧が時間軸に沿って変動する様子が例示されている。
なお、「音圧」とは、音の圧力変動を指し、正または負の値(単位は、たとえばPa)をとる。
先に述べたように、IS符号化によれば、左信号L(t)の高周波成分と右信号R(t)の高周波成分との和のみが、左チャネルの信号として符号化される。両者の低周波成分は、各々符号化される。
本実施形態において、「高周波帯域(高周波成分)」とは、たとえば、2kHz〜7kHzの周波数帯域(周波数成分)を指す。「低周波帯域(低周波成分)」とは、たとえば、16Hz〜2kHzの周波数帯域(周波数成分)を指す。低周波帯域と高周波帯域とを区切る閾値Thは、好適に予め設定可能であり、本実施形態では、一例として2kHzに設定されている。
[(A)フィルタバンク2a、2bの概要(周波数スペクトル変換処理)]
フィルタバンク2a、2bの概要について説明する。両者は、互いに同一の機能を有する。ここでは、フィルタバンク2aを例に挙げて説明する。
フィルタバンク2a、2bの概要について説明する。両者は、互いに同一の機能を有する。ここでは、フィルタバンク2aを例に挙げて説明する。
フィルタバンク2aは、所定時間(たとえば、図2(A)に示す時間の範囲)の左信号L(t)を、複数の周波数成分のスペクトルを持つ周波数スペクトルに変換する。この変換には、一例として、MDCT(Modified Discrete Cosine Transform:修正離散コサイン変換)が用いられる。
具体的には、フィルタバンク2aは、左信号L(t)を所定サンプル数ごとに、変換ブロックと呼ばれるブロックにブロック化する。
具体的には、フィルタバンク2aは、左信号L(t)を所定サンプル数ごとに、変換ブロックと呼ばれるブロックにブロック化する。
変換ブロック長(サンプル数)は、入力音声信号に応じて異なり、ロングブロックの場合には、2048であり、ショートブロックの場合には、256である。通常は、効率のよいMDCTを行うため、ロングブロックが選択される。カスタネットが発する音のように、入力音が急峻に変化する場合には、量子化ノイズを低減させるために、ショートブロックが選択される。
変換ブロック長の選択は、符号化装置1が有する心理聴覚分析部(不図示)によって行われる。心理聴覚分析部は、いずれの変換ブロック長でMDCTを行うかを、フィルタバンク2a、2bに指示する。
心理聴覚分析部の機能は、たとえば、演算部4が有していてもよい。この場合、演算部4は、いずれの変換ブロック長でMDCTを行うかをフィルタバンク2a、2bに指示する。
心理聴覚分析部の機能は、たとえば、演算部4が有していてもよい。この場合、演算部4は、いずれの変換ブロック長でMDCTを行うかをフィルタバンク2a、2bに指示する。
このように、入力音声信号をブロック化することにより、MDCTや量子化の際に並列処理が容易となる。本実施形態では、ブロック分割を行うが、サイクリック分割を行ってもよい。
1個の変換ブロックには、サンプル数の左信号L(t)の離散値(たとえば、音圧の値)が、時間情報と共に、MDCTすべきデータとして含まれている。
ここで言う「サンプル数」とは、MDCTを行うためにサンプリングされたときの、左信号L(t)の離散値の数を指す。右信号R(t)についても、これと同様である。
ここで言う「サンプル数」とは、MDCTを行うためにサンプリングされたときの、左信号L(t)の離散値の数を指す。右信号R(t)についても、これと同様である。
そして、フィルタバンク2aは、ブロック化された左信号L(t)を、周波数スペクトルに変換する。MDCTの後、フィルタバンク2aは、1024のスペクトル(MDCT係数)をスケールファクタバンド単位でm個のグループにグループ化し、これを左チャネル信号L(t)の周波数成分(左スペクトルLm(f))として、合成部3に出力する。
スケールファクタバンドは、たとえば、人間の聴覚の特性に合わせて、低周波帯域では狭く、高周波帯域では広くなるように、設定される。このため、一般に、周波数が高くなるほど、一つ当たりのスケールファクタバンドに含まれるスペクトル数は、多くなる。スペクトルは、このスケールファクタバンド単位で、量子化される。
フィルタバンク2bは、右信号R(t)を周波数スペクトルに変換し、これを右チャネル信号R(t)の周波数成分(右スペクトルRm(f))として、合成部3に出力する。
ここで、周波数スペクトルの一例を示す。
図3(A)は、本発明の第1実施形態に係る左チャネル信号の周波数成分(Lm(f))を例示する図である。図3(B)は、右チャネル信号の周波数成分(Rm(f))を例示する図である。
各図において、横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(Lm(f):単位はdB)を示し、これは音声信号の音圧の強度を意味している。
図3(A)は、本発明の第1実施形態に係る左チャネル信号の周波数成分(Lm(f))を例示する図である。図3(B)は、右チャネル信号の周波数成分(Rm(f))を例示する図である。
各図において、横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(Lm(f):単位はdB)を示し、これは音声信号の音圧の強度を意味している。
図3(A)、(B)には、一部のスペクトルが例示されているが、実際には、1024のスペクトルが存在する。これらのスペクトルは、音声信号が時間変化する限り、時間と共に変化する。
本実施形態では、図3(A)、(B)に図示するように、信号の周波数成分(の分布)を単に「スペクトル」とも言う。
適宜、左チャネル信号L(t)のスペクトルを単に「左スペクトルLm(f)」と言う。右チャネル信号R(t)のスペクトルを単に「右スペクトルRm(f)」と言う。
本実施形態では、図3(A)、(B)に図示するように、信号の周波数成分(の分布)を単に「スペクトル」とも言う。
適宜、左チャネル信号L(t)のスペクトルを単に「左スペクトルLm(f)」と言う。右チャネル信号R(t)のスペクトルを単に「右スペクトルRm(f)」と言う。
本実施形態では、1(本)のスペクトルの2乗値を「パワースペクトル」と言う。
「信号のパワー」とは、特に断りが無い限り、信号の周波数帯域全体のパワースペクトルの総和を指す。
図3(A)に図示する左チャネル信号Lm(t)のパワースペクトルの総和は、単位時間当たりの左チャネル信号Lm(t)のパワーに等しい。
なお、図2(A)に図示する左チャネル信号Lm(t)のパワーは、音圧の2乗値を所定時間(たとえば、図2(A)に示す時間の範囲)積分し、その積分値をその時間で除算した値である。右チャネル信号Rm(t)のパワースペクトルの総和についても、これと同様である。
「信号のパワー」とは、特に断りが無い限り、信号の周波数帯域全体のパワースペクトルの総和を指す。
図3(A)に図示する左チャネル信号Lm(t)のパワースペクトルの総和は、単位時間当たりの左チャネル信号Lm(t)のパワーに等しい。
なお、図2(A)に図示する左チャネル信号Lm(t)のパワーは、音圧の2乗値を所定時間(たとえば、図2(A)に示す時間の範囲)積分し、その積分値をその時間で除算した値である。右チャネル信号Rm(t)のパワースペクトルの総和についても、これと同様である。
図3(A)、(B)には、低周波帯域(LFB)、高周波帯域(HFB)、閾値thおよびスケールファクタバンド(SFB)も図示されている。
スケールファクタバンドは、周波数が低い方から順に、バンド番号nが割り振られている。バンド番号mは、低周波帯域では、1からmth−1をとり、高周波帯域では、mthからmをとる。変数mthは、1<mth<mの範囲の値をとる。適宜、バンド番号mのスケールファクタバンドを「SFB(m)」と表記する。
上述したように、高周波帯域のバンド幅(帯域幅)は、低周波帯域のものよりも広く設定されている。
スケールファクタバンドは、周波数が低い方から順に、バンド番号nが割り振られている。バンド番号mは、低周波帯域では、1からmth−1をとり、高周波帯域では、mthからmをとる。変数mthは、1<mth<mの範囲の値をとる。適宜、バンド番号mのスケールファクタバンドを「SFB(m)」と表記する。
上述したように、高周波帯域のバンド幅(帯域幅)は、低周波帯域のものよりも広く設定されている。
[(B)合成部3の概要(合成処理)]
合成部3の概要について説明する。合成部3は、フィルタバンク2aから左スペクトルLm(f)が入力され、フィルタバンク2bから右スペクトルRm(f)が入力されると、両者を用いて、(1)TNS(Temporal Noise Shaping)処理と、(2)判断処理と、(3)合成処理とを行う。ここでは、これらの処理の基本的な内容について説明する。
合成部3の概要について説明する。合成部3は、フィルタバンク2aから左スペクトルLm(f)が入力され、フィルタバンク2bから右スペクトルRm(f)が入力されると、両者を用いて、(1)TNS(Temporal Noise Shaping)処理と、(2)判断処理と、(3)合成処理とを行う。ここでは、これらの処理の基本的な内容について説明する。
(1)TNS処理
合成部3は、各スペクトル(これらはMDCT係数に相当する)を、線形予測係数を持つTNSフィルタに通す。これにより、たとえば、復号側が逆MDCTを行うと、その後の信号に含まれる量子化雑音は、時間領域における時間軸上の振幅の大きい所に集中する。
合成部3は、各スペクトル(これらはMDCT係数に相当する)を、線形予測係数を持つTNSフィルタに通す。これにより、たとえば、復号側が逆MDCTを行うと、その後の信号に含まれる量子化雑音は、時間領域における時間軸上の振幅の大きい所に集中する。
(2)判断処理
合成部3は、TNS処理後のスペクトルに対して、IS符号化を行うか否かを判断する。この判断は、スケールファクタバンド単位で行われる。
合成部3は、TNS処理後のスペクトルに対して、IS符号化を行うか否かを判断する。この判断は、スケールファクタバンド単位で行われる。
(3)合成処理
IS符号化を行う場合には、合成部3は、たとえば、AACの規格に従って、次の合成処理を行う。合成部3は、左スペクトルLm(f)と右スペクトルRm(f)との和スペクトルSUMm(f)=Lm(f)+Rm(f)を算出する。
上記の規格によれば、右スペクトルRm(f)は符号化されないため、次に、合成部3は、右スペクトルRm(f)を0に設定する(Rm(f)=0)。そして、合成部3は、和スペクトルSUMm(f)を調整部5に出力する。
なお、IS符号化を行わない場合には、合成部3は、左スペクトルLm(f)と右スペクトルRm(f)とを、そのまま符号化部6に出力する。
IS符号化を行う場合には、合成部3は、たとえば、AACの規格に従って、次の合成処理を行う。合成部3は、左スペクトルLm(f)と右スペクトルRm(f)との和スペクトルSUMm(f)=Lm(f)+Rm(f)を算出する。
上記の規格によれば、右スペクトルRm(f)は符号化されないため、次に、合成部3は、右スペクトルRm(f)を0に設定する(Rm(f)=0)。そして、合成部3は、和スペクトルSUMm(f)を調整部5に出力する。
なお、IS符号化を行わない場合には、合成部3は、左スペクトルLm(f)と右スペクトルRm(f)とを、そのまま符号化部6に出力する。
[(C)演算部4の概要(演算処理)]
演算部4の概要について説明する。演算部4は、フィルタバンク2aから左スペクトルLm(f)が入力され、フィルタバンク2bから右スペクトルRm(f)が入力されると、両者を用いて、パワー比算出処理を行う。
演算部4の概要について説明する。演算部4は、フィルタバンク2aから左スペクトルLm(f)が入力され、フィルタバンク2bから右スペクトルRm(f)が入力されると、両者を用いて、パワー比算出処理を行う。
演算部4は、右信号Rm(t)のパワーに対する左信号Lm(t)のパワーの比を算出する。この比を「パワー比」と言う。この際に、演算部4は、右スペクトルRm(f)の強度に対する左スペクトルLm(f)の強度の比をパワー比RAm=Lm(f)/Rm(f)として算出する。
パワー比RAmの基準値としては、たとえば、スケールファクタバンドSFB(m)における左スペクトルLm(f)のi番目のスペクトル値が用いられる。変数iは、正の整数である。
そして、演算部4は、パワー比RAmを調整部5とビットストリーム発生部7とに出力する。
パワー比RAmの基準値としては、たとえば、スケールファクタバンドSFB(m)における左スペクトルLm(f)のi番目のスペクトル値が用いられる。変数iは、正の整数である。
そして、演算部4は、パワー比RAmを調整部5とビットストリーム発生部7とに出力する。
[(D)調整部5の概要(調整処理)]
調整部5の概要について説明する。調整部5は、(1)分割処理と、(2)判断処理と、(3)調整処理とを行う。
調整部5の概要について説明する。調整部5は、(1)分割処理と、(2)判断処理と、(3)調整処理とを行う。
(1)分割処理
調整部5は、合成部3から和スペクトルSUMm(f)が入力されると、後の調整処理を効率よく行うべく、和スペクトルSUMm(f)の周波数帯域をk個に分割する。変数kは、正の整数である(図8参照)。
調整部5は、合成部3から和スペクトルSUMm(f)が入力されると、後の調整処理を効率よく行うべく、和スペクトルSUMm(f)の周波数帯域をk個に分割する。変数kは、正の整数である(図8参照)。
(2)判断処理
調整部5は、フィルタバンク2a、2bに入力された、左信号Lm(t)と右信号Rm(t)との信号強度差が大きいか否かを判断する。
ここで、「信号強度差」とは、左チャネル信号Lm(t)の強度と右チャネル信号Rm(t)の強度との差を指す。両者の強度の差を単に「信号強度差」と言う。
ところで、判断処理には、調整部5が処理可能な、左スペクトルLm(f)と右スペクトルRm(f)とが用いられる。
そのため、調整部5は、左信号Lm(t)の強度と右信号Rm(t)の強度との差の代わりに、左スペクトルLm(f)の強度と右スペクトルRm(f)の強度との差が大きいか否かを判断する。
ここで、「スペクトルの強度」とは、たとえば、パワースペクトルの総和で表わされる信号のパワーを指す。
調整部5は、フィルタバンク2a、2bに入力された、左信号Lm(t)と右信号Rm(t)との信号強度差が大きいか否かを判断する。
ここで、「信号強度差」とは、左チャネル信号Lm(t)の強度と右チャネル信号Rm(t)の強度との差を指す。両者の強度の差を単に「信号強度差」と言う。
ところで、判断処理には、調整部5が処理可能な、左スペクトルLm(f)と右スペクトルRm(f)とが用いられる。
そのため、調整部5は、左信号Lm(t)の強度と右信号Rm(t)の強度との差の代わりに、左スペクトルLm(f)の強度と右スペクトルRm(f)の強度との差が大きいか否かを判断する。
ここで、「スペクトルの強度」とは、たとえば、パワースペクトルの総和で表わされる信号のパワーを指す。
(3)調整処理
調整部5は、基本的には、合成部3の出力のパワーが、左信号Lm(t)のパワーと一致するように、合成部3の出力のパワーを調整する。
具体的には、調整部5は、合成部3の出力のパワーを調整する際に、和スペクトルSUMm(f)の強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)の強度を調整する。
このとき、調整部5は、分割処理によって分割された帯域ごとに、和スペクトルSUMm(f)の波形が右スペクトルRm(f)の波形になるように、和スペクトルSUMm(f)の波形を調整する。
調整部5は、基本的には、合成部3の出力のパワーが、左信号Lm(t)のパワーと一致するように、合成部3の出力のパワーを調整する。
具体的には、調整部5は、合成部3の出力のパワーを調整する際に、和スペクトルSUMm(f)の強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)の強度を調整する。
このとき、調整部5は、分割処理によって分割された帯域ごとに、和スペクトルSUMm(f)の波形が右スペクトルRm(f)の波形になるように、和スペクトルSUMm(f)の波形を調整する。
ただし、調整部5は、判断処理にて、信号強度差が大きいという判断結果を得た場合には、合成部3の出力のS/N比(信号対雑音比)が最大となるように、和スペクトルSUMm(f)の強度を調整する。
詳細は後述するが、そのS/N比が最大となるように、和スペクトルSUMm(f)の強度を調整することで、信号強度差が大きい場合、特に、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に小さい場合でも(Lm(t)≪Rm(t))、再生時の音質を向上させることができる。
その後、調整部5は、調整処理後の和スペクトルSUMm(f)を和スペクトルSUMm(f)aとして符号化部6に出力する。
詳細は後述するが、そのS/N比が最大となるように、和スペクトルSUMm(f)の強度を調整することで、信号強度差が大きい場合、特に、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に小さい場合でも(Lm(t)≪Rm(t))、再生時の音質を向上させることができる。
その後、調整部5は、調整処理後の和スペクトルSUMm(f)を和スペクトルSUMm(f)aとして符号化部6に出力する。
[(E)符号化部6の詳細(符号化処理)]
(1)IS符号化を行う場合
合成部3がIS符号化を行うと判断した場合、符号化部6は、調整部5から和スペクトルSUMm(f)aを入力し、これを符号化する。なお、図1には、この場合の信号の流れが図示されている。
具体的には、符号化部6は、和スペクトルSUMm(f)aを、量子化器を用いて量子化する。このとき、和スペクトルSUMm(f)aは、人間の知覚が敏感な周波数成分を細かく量子化するため、たとえば、非線形量子化される。
量子化後、符号化部6は、量子化されたスペクトルを符号化する。符号化には、たとえば、ハフマン符号化方式が用いられる。符号化部6は、量子化とハフマン符号化とを交互に繰り返し行うことにより、最終的に得た圧縮符号化データDをビットストリーム発生部7に出力する。
(1)IS符号化を行う場合
合成部3がIS符号化を行うと判断した場合、符号化部6は、調整部5から和スペクトルSUMm(f)aを入力し、これを符号化する。なお、図1には、この場合の信号の流れが図示されている。
具体的には、符号化部6は、和スペクトルSUMm(f)aを、量子化器を用いて量子化する。このとき、和スペクトルSUMm(f)aは、人間の知覚が敏感な周波数成分を細かく量子化するため、たとえば、非線形量子化される。
量子化後、符号化部6は、量子化されたスペクトルを符号化する。符号化には、たとえば、ハフマン符号化方式が用いられる。符号化部6は、量子化とハフマン符号化とを交互に繰り返し行うことにより、最終的に得た圧縮符号化データDをビットストリーム発生部7に出力する。
(2)IS符号化を行わない場合
合成部3がIS符号化を行わないと判断した場合、符号化部6は、合成部3から左スペクトルLm(f)と右スペクトルRm(f)とを入力し、両者を個別にそのまま符号化する。
合成部3がIS符号化を行わないと判断した場合、符号化部6は、合成部3から左スペクトルLm(f)と右スペクトルRm(f)とを入力し、両者を個別にそのまま符号化する。
[(F)ビットストリーム発生部7の詳細(BS発生処理)]
ビットストリーム発生部7は、符号化部6から圧縮符号化データDが入力され、演算部4からパワー比RAmが入力されると、ビットストリームを発生(生成)すべく、圧縮符号化データDに付加データを付加する。そして、ビットストリーム発生部7は、付加データが付加された圧縮符号化データDをビットストリームBSとして、たとえば、外部機器O3(図26参照)に出力する。
付加データは、復号化の際に必要なデータであって、パワー比RAmを始め、たとえば、サンプリング周波数、変換ブロック長、量子化ステップサイズを含むデータである。
ビットストリーム発生部7は、符号化部6から圧縮符号化データDが入力され、演算部4からパワー比RAmが入力されると、ビットストリームを発生(生成)すべく、圧縮符号化データDに付加データを付加する。そして、ビットストリーム発生部7は、付加データが付加された圧縮符号化データDをビットストリームBSとして、たとえば、外部機器O3(図26参照)に出力する。
付加データは、復号化の際に必要なデータであって、パワー比RAmを始め、たとえば、サンプリング周波数、変換ブロック長、量子化ステップサイズを含むデータである。
以下、フィルタバンク2a、2b、合成部3、演算部4および調整部5の構成例を詳細に説明する。
[フィルタバンク2a、2bの構成例]
フィルタバンク2a、2bの構成例について説明する。
図4は、本発明の第1実施形態に係るフィルタバンクの構成例を示すブロック図である。
図4に図示するフィルタバンク2aは、ブロック部(BLK)21aおよび領域変換部(t/f)22aを有する。フィルタバンク2bは、ブロック部21bおよび領域変換部22bを有する。
フィルタバンク2a、2bの構成例について説明する。
図4は、本発明の第1実施形態に係るフィルタバンクの構成例を示すブロック図である。
図4に図示するフィルタバンク2aは、ブロック部(BLK)21aおよび領域変換部(t/f)22aを有する。フィルタバンク2bは、ブロック部21bおよび領域変換部22bを有する。
変換ブロック部21aは、左信号L(t)を入力し、これを指示された変換ブロック長でブロック化する。
(1)変換ブロック長がロングブロックの場合
この場合には、変換ブロック部21aは、左信号L(t)を、サンプル数を2048とする変換ブロックにブロック化し、これを左信号L(t)Bとして、領域変換部22aに出力する。
この場合には、変換ブロック部21aは、左信号L(t)を、サンプル数を2048とする変換ブロックにブロック化し、これを左信号L(t)Bとして、領域変換部22aに出力する。
(2)変換ブロック長がショートブロックの場合
この場合には、変換ブロック部21aは、左信号L(t)を、サンプル数を256とする変換ブロックにブロック化し、これを左信号L(t)Bとして、領域変換部22aに出力する。
この場合には、変換ブロック部21aは、左信号L(t)を、サンプル数を256とする変換ブロックにブロック化し、これを左信号L(t)Bとして、領域変換部22aに出力する。
領域変換部22aは、変換ブロック部21aから左信号L(t)Bが入力されると、これを時間領域(t)から周波数領域(f)に変換する。
(1)変換ブロック長がロングブロックの場合
この場合には、領域変換部22aは、たとえば、「窓掛け」に用いる窓としての変換ブロックを50%ずつオーバーラップさせ、2048のサンプルを1024(本)のスペクトルに変換する。
この場合には、領域変換部22aは、たとえば、「窓掛け」に用いる窓としての変換ブロックを50%ずつオーバーラップさせ、2048のサンプルを1024(本)のスペクトルに変換する。
(2)変換ブロック長がショートブロックの場合
この場合には、領域変換部22aは、たとえば、ロングブロックの場合と同様に、変換ブロックを50%ずつオーバーラップさせ、256のサンプルを128(本)のスペクトルに変換する。
ただし、領域変換部22aは、連続して8個分のショートブロックに対してスペクトル変換を行う。これにより、サンプル数がロングブロックの場合と同様の1024となる。
この場合には、領域変換部22aは、たとえば、ロングブロックの場合と同様に、変換ブロックを50%ずつオーバーラップさせ、256のサンプルを128(本)のスペクトルに変換する。
ただし、領域変換部22aは、連続して8個分のショートブロックに対してスペクトル変換を行う。これにより、サンプル数がロングブロックの場合と同様の1024となる。
スペクトル変換後、領域変換部22aは、1024のスペクトルを、スケールファクタバンド単位でm個のグループにグループ化し、これらを左スペクトルLm(f)として、合成部3と演算部4とに出力する。
変換ブロック部21bは、変換ブロック部21aの機能と同一の機能を有する。すなわち、変換ブロック部21bは、右信号R(t)を入力し、これを指示された変換ブロック長でブロック化し、これを右信号R(t)Bとして領域変換部22bに出力する。
領域変換部22bは、領域変換部22aの機能と同一の機能を有する。すなわち、領域変換部22bは、変換ブロック部21bから右信号R(t)Bが入力されると、変換ブロック長に応じて、これを時間領域から周波数領域にスペクトル変換する。
そして、領域変換部22bは、1024のスペクトルを、スケールファクタバンド単位でm個のグループにグループ化し、これらを右スペクトルRm(f)として、合成部3と演算部4とに出力する。
そして、領域変換部22bは、1024のスペクトルを、スケールファクタバンド単位でm個のグループにグループ化し、これらを右スペクトルRm(f)として、合成部3と演算部4とに出力する。
[合成部3の構成例]
合成部3の構成例について説明する。
図5は、本発明の第1実施形態に係る合成部の構成例を示すブロック図である。
図5に図示する合成部3は、TNS処理部31、判断処理部32および合成処理部33を有する。
合成部3の構成例について説明する。
図5は、本発明の第1実施形態に係る合成部の構成例を示すブロック図である。
図5に図示する合成部3は、TNS処理部31、判断処理部32および合成処理部33を有する。
TNS処理部31は、左スペクトルLm(f)と右スペクトルRm(f)とに、TNS処理を各々施す。そして、TNS処理部31は、TNS処理を各々施した、左スペクトルLm(f)と右スペクトルRm(f)とを合成処理部33に出力する。
判断処理部32は、左スペクトルLm(f)と右スペクトルRm(f)とをIS符号化するか否かを、図3(A)、(B)に図示するスケールファクタバンド単位で判断する。
具体的には、判断処理部32は、高周波帯域のSFB(m≧mth)に対しては、この帯域(バンド)のスペクトルをIS符号化すると判断し、低周波帯域のSFB(m<mth)に対しては、この帯域のスペクトルをIS符号化しないと判断する。
具体的には、判断処理部32は、高周波帯域のSFB(m≧mth)に対しては、この帯域(バンド)のスペクトルをIS符号化すると判断し、低周波帯域のSFB(m<mth)に対しては、この帯域のスペクトルをIS符号化しないと判断する。
合成処理部33は、判断処理部32の判断処理結果に応じて、以下の合成処理を行う。なお、図5には、下記(1)の場合における信号の流れが例示されている。
(1)判断処理部32がIS符号化を行うと判断した場合
この場合、合成処理部33は、TNS処理後、左スペクトルLm(f)と右スペクトルRm(f)との和スペクトルSUMm(f)=Lm(f)+Rm(f)を算出する。次に、合成処理部33は、右スペクトルRm(f)を0にする。その後、合成処理部33は、和スペクトルSUMm(f)のみを調整部5(分割処理部51、図7参照)に出力する。
この場合、合成処理部33は、TNS処理後、左スペクトルLm(f)と右スペクトルRm(f)との和スペクトルSUMm(f)=Lm(f)+Rm(f)を算出する。次に、合成処理部33は、右スペクトルRm(f)を0にする。その後、合成処理部33は、和スペクトルSUMm(f)のみを調整部5(分割処理部51、図7参照)に出力する。
(2)判断処理部32がIS符号化を行わないと判断した場合
この場合、合成処理部33は、TNS処理後、左スペクトルLm(f)と右スペクトルRm(f)とを、そのまま符号化部6に出力する。
この場合、合成処理部33は、TNS処理後、左スペクトルLm(f)と右スペクトルRm(f)とを、そのまま符号化部6に出力する。
[演算部4の構成例]
演算部4の構成例について説明する。
図6は、本発明の第1実施形態に係る演算部の構成例を示すブロック図である。
図6に図示する演算部4は、パワー比算出処理部41およびバッファ42を有する。
演算部4の構成例について説明する。
図6は、本発明の第1実施形態に係る演算部の構成例を示すブロック図である。
図6に図示する演算部4は、パワー比算出処理部41およびバッファ42を有する。
パワー比算出処理部41は、右スペクトルRm(f)の強度に対する左スペクトルLm(f)の強度の比をパワー比RAm=Lm(f)/Rm(f)として算出し、これをバッファ42に出力する。
バッファ42は、パワー比算出処理部41からパワー比RAmが入力されると、これを一旦格納する。そして、バッファ42は、たとえば、調整部5に和スペクトルSUMm(f)が入力されたタイミングで、格納しておいたパワー比RAmを、調整部5(判断処理部52、図7参照)とビットストリーム発生部7とに出力する。
[調整部5の構成例]
調整部5の構成例について、IS符号化を行うことを前提に説明する。
図7は、本発明の第1実施形態に係る調整部の構成例を示すブロック図である。
図7に図示する調整部5は、分割処理部51、判断処理部52、メモリ53および調整処理部54を有する。
調整部5の構成例について、IS符号化を行うことを前提に説明する。
図7は、本発明の第1実施形態に係る調整部の構成例を示すブロック図である。
図7に図示する調整部5は、分割処理部51、判断処理部52、メモリ53および調整処理部54を有する。
分割処理部51を図8に関連づけて説明する。
図8は、本発明の第1実施形態に係る分割処理を説明するための図である。
横軸は、周波数(f:単位はHz)を示す。縦軸は、和スペクトルSUMm(f)=Lm(f)+Rm(f)(単位はdB)を示す。
図8は、本発明の第1実施形態に係る分割処理を説明するための図である。
横軸は、周波数(f:単位はHz)を示す。縦軸は、和スペクトルSUMm(f)=Lm(f)+Rm(f)(単位はdB)を示す。
分割処理部51は、和スペクトルSUMm(f)の周波数帯域をk個のバンドに分割する。変数kは、正の整数である。この際に、分割処理部51は、一例として、その周波数帯域をスケールファクタバンド(SFB)と同様の帯域幅でk=m個に分割する。
図8には、周波数帯域の分割の様子を示すため、SFB(n)と、kを変数とするバンドB(k)とが図示されている。
そして、分割処理部51は、k個分の和スペクトルSUMm(f)kを調整処理部54に出力する。
図8には、周波数帯域の分割の様子を示すため、SFB(n)と、kを変数とするバンドB(k)とが図示されている。
そして、分割処理部51は、k個分の和スペクトルSUMm(f)kを調整処理部54に出力する。
この分割処理により、後の調整処理を帯域単位で並列処理することができる。その結果、調整部5の処理速度が向上するだけでなく、和スペクトルSUMm(f)の調整をバンド単位で微調整することができる。この処理は、特に、複数のCPUを用いて並列演算を行う場合に好適である。
本実施形態では、和スペクトルSUMm(f)の周波数帯域が、スケールファクタバンドと同様に、k=n個に分割されるが、たとえば、2個分のSFB(1)+SFB(2)を1個の帯域とするように、その周波数帯域を分割することもできる。
本実施形態では、和スペクトルSUMm(f)の周波数帯域が、スケールファクタバンドと同様に、k=n個に分割されるが、たとえば、2個分のSFB(1)+SFB(2)を1個の帯域とするように、その周波数帯域を分割することもできる。
判断処理部52は、演算部4からパワー比RAmが入力されると、これを用いて、左スペクトルLm(f)と右スペクトルRm(f)との信号強度差が大きいか否かを判断する。
ところで、パワー比RAmがとる値には、大別して、4つの場合がある。
(ケースA)パワー比RAm=Lm(f)/Rm(f)≒1の場合
(ケースB)パワー比RAm=Lm(f)/Rm(f)≫1の場合
(ケースC)パワー比RAm=Lm(f)/Rm(f)≪1の場合
(ケースD)パワー比RAm=Lm(f)/Rm(f)≒0の場合(ただし、Lm(f)≪Rm(f))
(ケースA)パワー比RAm=Lm(f)/Rm(f)≒1の場合
(ケースB)パワー比RAm=Lm(f)/Rm(f)≫1の場合
(ケースC)パワー比RAm=Lm(f)/Rm(f)≪1の場合
(ケースD)パワー比RAm=Lm(f)/Rm(f)≒0の場合(ただし、Lm(f)≪Rm(f))
ケースA〜Dを、図9(A)〜(D)に関連づけて説明する。
図9(A)〜(D)は、本発明の第1実施形態に係るパワー比を説明するための図である。
横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。ただし、各図には、IS符号化の対象となる高周波帯域におけるスペクトルが例示されている。
図9(A)〜(D)は、本発明の第1実施形態に係るパワー比を説明するための図である。
横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。ただし、各図には、IS符号化の対象となる高周波帯域におけるスペクトルが例示されている。
(1)ケースAの場合
この場合は、図9(A)に図示するように、左スペクトルLm(f)と右スペクトルRm(f)とがほぼ等しい(Lm(f)≒Rm(f))ことを意味する。すなわち、左信号Lm(t)の強度と右信号Rm(t)の強度とがほぼ等しく、両者の波形が、非常に似ている。したがって、両者の信号強度差は小さい。
この場合は、図9(A)に図示するように、左スペクトルLm(f)と右スペクトルRm(f)とがほぼ等しい(Lm(f)≒Rm(f))ことを意味する。すなわち、左信号Lm(t)の強度と右信号Rm(t)の強度とがほぼ等しく、両者の波形が、非常に似ている。したがって、両者の信号強度差は小さい。
(2)ケースBの場合
この場合は、図9(B)に図示するように、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に大きい(Lm(f)≫Rm(f))ことを意味する。すなわち、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に大きく、両者の信号強度差は非常に大きい。
この場合は、図9(B)に図示するように、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に大きい(Lm(f)≫Rm(f))ことを意味する。すなわち、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に大きく、両者の信号強度差は非常に大きい。
(3)ケースCの場合
この場合は、図9(C)に図示するように、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に小さい(Lm(f)≪Rm(f))ことを意味する。すなわち、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に小さく、両者の信号強度差は非常に大きい。
この場合は、図9(C)に図示するように、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に小さい(Lm(f)≪Rm(f))ことを意味する。すなわち、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に小さく、両者の信号強度差は非常に大きい。
(4)ケースDの場合
この場合は、図9(D)に図示するように、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に小さく(Lm(f)≪Rm(f))、前者がほぼ0(Lm(f)≒0)であることを意味する。すなわち、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に小さい上に、前者の強度がほぼ0である。当然ながら、両者の信号強度差は非常に大きい。
この場合は、図9(D)に図示するように、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に小さく(Lm(f)≪Rm(f))、前者がほぼ0(Lm(f)≒0)であることを意味する。すなわち、左信号Lm(t)の強度が右信号Rm(t)の強度よりも非常に小さい上に、前者の強度がほぼ0である。当然ながら、両者の信号強度差は非常に大きい。
判断処理部52は、判断処理の一例として、パワー比RAmが上記ケースA〜Dのいずれに該当するかを判断することで、信号強度差が大きいか否かを判断する。
ケースA〜Dの判断基準の一例を図10に関連づけて、これをケース別に説明する。
図10は、本発明の第1実施形態に係る判断基準を例示する図である。図中の「L」、「R」は、左信号Lm(t)の強度、右信号Rm(t)の強度を各々示す。単に、パワー比RAmをRAと表記している。
図10は、本発明の第1実施形態に係る判断基準を例示する図である。図中の「L」、「R」は、左信号Lm(t)の強度、右信号Rm(t)の強度を各々示す。単に、パワー比RAmをRAと表記している。
(1)ケースA(RAm≒1)
判断処理部52は、たとえば、許容誤差α=±0.1を設け、パワー比RAmが1±αの範囲内にある場合に、パワー比RAmがケースAに該当すると判断する。
なお、許容誤差αは、たとえば、左右チャネルの音が互いにほぼ同一であることを知覚できる範囲で、好適に設定可能である。
判断処理部52は、たとえば、許容誤差α=±0.1を設け、パワー比RAmが1±αの範囲内にある場合に、パワー比RAmがケースAに該当すると判断する。
なお、許容誤差αは、たとえば、左右チャネルの音が互いにほぼ同一であることを知覚できる範囲で、好適に設定可能である。
(2)ケースB(RAm≫1)
判断処理部52は、たとえば、閾値Th1=1+0.8を設け、パワー比RAmが閾値th1以上の場合に、パワー比RAmがケースBに該当すると判断する。
なお、閾値Th1は、たとえば、左チャネルの音が非常に大きい、すなわち、右チャネルの音をほとんど知覚できないような、小さな音であることを判断可能な範囲で、好適に設定可能である。
判断処理部52は、たとえば、閾値Th1=1+0.8を設け、パワー比RAmが閾値th1以上の場合に、パワー比RAmがケースBに該当すると判断する。
なお、閾値Th1は、たとえば、左チャネルの音が非常に大きい、すなわち、右チャネルの音をほとんど知覚できないような、小さな音であることを判断可能な範囲で、好適に設定可能である。
(3)ケースC(RAm≪1)
判断処理部52は、たとえば、閾値Th2=0.2を設け、パワー比RAmが閾値th2以下の場合に、パワー比RAmがケースCに該当すると判断する。
なお、閾値Th2は、たとえば、右チャネルの音が非常に大きい、すなわち、左チャネルの音をほとんど知覚できないような、小さな音であることを判断可能な範囲で、好適に設定可能である。
判断処理部52は、たとえば、閾値Th2=0.2を設け、パワー比RAmが閾値th2以下の場合に、パワー比RAmがケースCに該当すると判断する。
なお、閾値Th2は、たとえば、右チャネルの音が非常に大きい、すなわち、左チャネルの音をほとんど知覚できないような、小さな音であることを判断可能な範囲で、好適に設定可能である。
(4)ケースD(RAm≒0、ただし、Lm(f)≪Rm(f))
判断処理部52は、たとえば、閾値Th3=0.1を設け、パワー比RAmが閾値th3以下の場合に、パワー比RAmがケースDに該当すると判断する。
なお、閾値Th3は、たとえば、左チャネルの音が0に等しいような音であることを判断可能な範囲で、好適に設定可能である。
判断処理部52は、たとえば、閾値Th3=0.1を設け、パワー比RAmが閾値th3以下の場合に、パワー比RAmがケースDに該当すると判断する。
なお、閾値Th3は、たとえば、左チャネルの音が0に等しいような音であることを判断可能な範囲で、好適に設定可能である。
図10に図示する、1+α<RAm<th1の範囲(REG1とする)は、パワー比RAmが1よりも大きいが、1よりも非常に大きい程ではない範囲を表わす。そのため、実用的には、この範囲にパワー比RAmがある場合にも、ケースBの場合に該当すると見なすことができる。
一方、Th2<RAm<1−αの範囲(REG2とする)は、パワー比RAmが1よりも小さいが、1よりも非常に小さい程ではない範囲を表わす。そのため、実用的には、この範囲にパワー比RAmがある場合も、ケースCの場合に該当すると見なすことができる。
ケースA〜D別に判断処理を説明する。
(1)ケースA(RA≒1)
判断処理部52は、パワー比RAmがケースAに該当すると判断した場合には、信号強度差が小さいと判断する。この場合、判断処理部52は、判断結果SJを調整処理部54に出力しない。
(1)ケースA(RA≒1)
判断処理部52は、パワー比RAmがケースAに該当すると判断した場合には、信号強度差が小さいと判断する。この場合、判断処理部52は、判断結果SJを調整処理部54に出力しない。
(2)ケースB(RAm≫1)
判断処理部52は、パワー比RAmがケースBに該当すると判断した場合には、信号強度差が大きいと判断するが、判断結果SJを調整処理部54に出力しない。
これは、もともと右スペクトルRm(f)が小さく、人が再生時の音質の劣化を知覚するに至らないためである。
判断処理部52は、パワー比RAmがケースBに該当すると判断した場合には、信号強度差が大きいと判断するが、判断結果SJを調整処理部54に出力しない。
これは、もともと右スペクトルRm(f)が小さく、人が再生時の音質の劣化を知覚するに至らないためである。
(3)ケースC(RAm≪1)
判断処理部52は、パワー比RAmがケースCに該当すると判断した場合には、信号強度差が大きいと判断し、その旨を示す判断結果SJを調整処理部54に出力する。
判断処理部52は、パワー比RAmがケースCに該当すると判断した場合には、信号強度差が大きいと判断し、その旨を示す判断結果SJを調整処理部54に出力する。
(4)ケースD(RAm≒0、ただし、Lm(f)≪Rm(f))
判断処理部52は、パワー比RAmがケースDに該当すると判断した場合にも、信号強度差が大きいと判断し、その旨を示す判断結果SJを調整処理部54に出力する。
判断処理部52は、パワー比RAmがケースDに該当すると判断した場合にも、信号強度差が大きいと判断し、その旨を示す判断結果SJを調整処理部54に出力する。
判断処理を換言すれば、判断処理部52は、パワー比RAmが、RAm≪1またはRAm≒0である場合に、信号強度差が大きいと判断し、判断結果SJを調整処理部54に出力する。そうでなければ、判断処理部52は、判断結果SJを調整処理部54に出力しない。
なお、上述の判断処理は、パワー比算出処理部41がパワー比RAmに付加しておいた、m個分の各パワー比に関する情報を用いて、分割処理部51によって分割された帯域ごとに行われる。
なお、上述の判断処理は、パワー比算出処理部41がパワー比RAmに付加しておいた、m個分の各パワー比に関する情報を用いて、分割処理部51によって分割された帯域ごとに行われる。
メモリ53は、最小可聴域を含むデータDATAを予め格納している。ここで、最小可聴域を図11に関連づけて説明する。
図11は、本発明の第1実施形態に係る等ラウドネス曲線を例示する図である。横軸は、周波数(f:単位はHz)を示す。縦軸は、音圧レベル(単位はdB)を示す。
ここで言う「音圧レベル(SPL:Sound Pressure Level)」は、20log(p/p0)で定義される。pは音圧であり、p0は基準音圧(たとえば、20μPa)である。
ここで言う「音圧レベル(SPL:Sound Pressure Level)」は、20log(p/p0)で定義される。pは音圧であり、p0は基準音圧(たとえば、20μPa)である。
図11に例示する等ラウドネス曲線は、1kHzの純音を基準として、これと同じ大きさに知覚される音圧レベルを周波数成分ごとに測定したものである。図中の実線で示される、0フォン(phon)の(下限)曲線は、最小可聴域を示す。最小可聴域は、高周波帯域(HFB)では、たとえば、−8dB〜10dB程度の値をとる。
最小可聴域は、人の聴覚が検知できる音の最小音圧レベルである。人は、最小可聴域よりも高い音圧レベルの音を知覚することができるが、それ以下の音圧レベルの音を知覚することは極めて困難である。
調整処理部54は、判断処理部52からの判断結果SJの入力の有無に応じて、次の調整処理を行う。
(1)判断結果SJの入力がない場合
ケースAまたはケースBのとき(図9(A)、(B)参照)、調整処理部54には、判断結果SJが入力されない。この場合の調整処理を図12に関連づけて説明する。
ケースAまたはケースBのとき(図9(A)、(B)参照)、調整処理部54には、判断結果SJが入力されない。この場合の調整処理を図12に関連づけて説明する。
図12は、本発明の第1実施形態に係る調整処理を説明するための図である。
横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。ただし、図12には、IS符号化の対象となる高周波帯域のみが、分割処理された帯域B(k)と共に例示されている。
図中の実線は、調整処理後の和スペクトルSUMm(f)aを示す。図中の破線は、調整処理前の和スペクトルSUMm(f)kを示す。
横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。ただし、図12には、IS符号化の対象となる高周波帯域のみが、分割処理された帯域B(k)と共に例示されている。
図中の実線は、調整処理後の和スペクトルSUMm(f)aを示す。図中の破線は、調整処理前の和スペクトルSUMm(f)kを示す。
調整処理部54は、調整処理前の和スペクトルSUMm(f)kの強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)kの強度を調整する。
このとき、調整処理部54は、図12に図示するように、分割処理部51が分割した帯域ごとに、和スペクトルSUMm(f)の強度を調整する。
そして、調整処理部54は、調整処理後の和スペクトルSUMm(f)aを符号化部6に出力する。
このとき、調整処理部54は、図12に図示するように、分割処理部51が分割した帯域ごとに、和スペクトルSUMm(f)の強度を調整する。
そして、調整処理部54は、調整処理後の和スペクトルSUMm(f)aを符号化部6に出力する。
調整処理前の和スペクトルSUMm(f)kは、左スペクトルLm(f)と右スペクトルRm(f)との和である。そのため、とりわけケースAにおいては、和スペクトルSUMm(f)kは、元の左スペクトルLm(f)よりも遙かに大きい。
そのため、図12に図示するように、調整処理後の和スペクトルSUMm(f)aは、調整処理前の和スペクトルSUMm(f)kよりも下がる。
なお、調整処理は、帯域B(1)から帯域B(k)まで並列に行われるが、調整処理を変数kの順に行うこともできる。
そのため、図12に図示するように、調整処理後の和スペクトルSUMm(f)aは、調整処理前の和スペクトルSUMm(f)kよりも下がる。
なお、調整処理は、帯域B(1)から帯域B(k)まで並列に行われるが、調整処理を変数kの順に行うこともできる。
(2)判断結果SJの入力がある場合
ケースCまたはケースDのとき(図9(C)、(D)参照)、調整処理部54には、判断結果SJが入力される。この場合の調整処理を図13および図14に関連づけて説明する。
ケースCまたはケースDのとき(図9(C)、(D)参照)、調整処理部54には、判断結果SJが入力される。この場合の調整処理を図13および図14に関連づけて説明する。
図13および図14は、本発明の第1実施形態に係る調整処理を説明するための図である。
各図において、横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。各図には、IS符号化の対象となる高周波帯域のみが、分割処理された帯域B(k)と共に例示されている。
各図において、破線は、調整処理前の和スペクトルSUMm(f)kを示す。太実線は、調整処理後の和スペクトルSUMm(f)aを示す。細実線は、図9(C)に図示する左スペクトルLm(f)を示す。
図13において、2点鎖線は、図12に図示する調整処理後の和スペクトルSUMm(f)aを示す。図14において、2重線は、最小可聴域を示す。
各図において、横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。各図には、IS符号化の対象となる高周波帯域のみが、分割処理された帯域B(k)と共に例示されている。
各図において、破線は、調整処理前の和スペクトルSUMm(f)kを示す。太実線は、調整処理後の和スペクトルSUMm(f)aを示す。細実線は、図9(C)に図示する左スペクトルLm(f)を示す。
図13において、2点鎖線は、図12に図示する調整処理後の和スペクトルSUMm(f)aを示す。図14において、2重線は、最小可聴域を示す。
ここで、調整処理部54が、上記(1)の場合と同様の調整処理を行うものと仮定する。
ケースCを例に挙げると(図9(C)参照)、図13に図示するように、左スペクトルLm(f)は、非常に小さい。そのため、調整すべき和スペクトルSUMm(f)k自体も(破線参照)、上記(1)の場合のもの(2点鎖線参照)と比べて小さい。
この仮定の下で、調整すべき和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度に一致させるものとする。すると、図13に図示するように、調整処理後の和スペクトルSUMm(f)a(太実線参照)は、左スペクトルLm(f)程度となる。
ケースCを例に挙げると(図9(C)参照)、図13に図示するように、左スペクトルLm(f)は、非常に小さい。そのため、調整すべき和スペクトルSUMm(f)k自体も(破線参照)、上記(1)の場合のもの(2点鎖線参照)と比べて小さい。
この仮定の下で、調整すべき和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度に一致させるものとする。すると、図13に図示するように、調整処理後の和スペクトルSUMm(f)a(太実線参照)は、左スペクトルLm(f)程度となる。
その和スペクトルSUMm(f)aが、量子化後に符号化される。詳細は第2実施形態に譲るが、その復号化時には、パワー比RAmを基に、和スペクトルSUMm(f)aから右スペクトルが求められる。
そのため、合成部3の出力のS/N比が、符号化前の左チャネル信号Lm(t)のS/N比程度でしかなく、再生時の右チャネルの音質が劣化し、ステレオの音質自体も劣化する。
そのため、合成部3の出力のS/N比が、符号化前の左チャネル信号Lm(t)のS/N比程度でしかなく、再生時の右チャネルの音質が劣化し、ステレオの音質自体も劣化する。
そこで、上記(2)の場合には、調整処理部54は、メモリ53からデータDATAを読み出し、和スペクトルSUMm(f)kのS/N比をできるだけ確保することができるように、和スペクトルSUMm(f)kの強度を調節する。
具体的には、調整処理部54は、調整処理後の和スペクトルSUMm(f)aの強度が、元の左スペクトルLm(f)の強度よりも大きくなるように、和スペクトルSUMm(f)kの強度を上げる。これは、合成部3の出力のパワーを左信号Lm(t)のパワーよりも上げることを意味する。
ただし、調整処理部54は、メモリ53から読み出した、データDATAの最小可聴域を参照し、図14の破線で図示する和スペクトルSUMm(f)kが、最小可聴域(2重線参照)を越えないように、和スペクトルSUMm(f)kの強度を上げる。
この際に、調整処理部54は、分割処理部51によって分割された帯域ごとに、和スペクトルSUMm(f)kの強度を調整する。それは、最小可聴域は、周波数成分ごとに異なる値を持つためである。
この際に、調整処理部54は、分割処理部51によって分割された帯域ごとに、和スペクトルSUMm(f)kの強度を調整する。それは、最小可聴域は、周波数成分ごとに異なる値を持つためである。
以上のように、最小可聴域を越えないように、和スペクトルSUMm(f)kを調整するのは、和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度よりも上げれば、高いS/N比の右チャネル信号を確保することができるためである。
しかしながら、パワーの小さな左チャネル信号は、本来、音圧が小さな音声信号であるから、和スペクトルSUMm(f)kの強度を上げすぎると、復号化したときの左スペクトルの強度が、本来のものよりも大きくなる。
その場合、本来聞こえないはずの左チャネルの音が聞こえてしまうという、不具合が発生する。
しかしながら、パワーの小さな左チャネル信号は、本来、音圧が小さな音声信号であるから、和スペクトルSUMm(f)kの強度を上げすぎると、復号化したときの左スペクトルの強度が、本来のものよりも大きくなる。
その場合、本来聞こえないはずの左チャネルの音が聞こえてしまうという、不具合が発生する。
そのため、調整処理部54は、和スペクトルSUMm(f)kが最小可聴域以下となる範囲内で、和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度よりも上げるようにしている。
このような調整処理を行えば、和スペクトルSUMm(f)kが、最小可聴域よりも小さくなるため、高いS/N比の右チャネル信号を確保しつつ、上述の不具合を回避することができる。
このような調整処理を行えば、和スペクトルSUMm(f)kが、最小可聴域よりも小さくなるため、高いS/N比の右チャネル信号を確保しつつ、上述の不具合を回避することができる。
更に、調整処理部54は、和スペクトルSUMm(f)の波形が右スペクトルRm(f)の波形になるように、和スペクトルSUMm(f)の波形を調整する。
詳細は後述するが、和スペクトルSUMm(f)の波形の調整を行うことにより、復号化時に、右スペクトルRm(f)の波形を、ほぼ元の波形に復元することができる。
詳細は後述するが、和スペクトルSUMm(f)の波形の調整を行うことにより、復号化時に、右スペクトルRm(f)の波形を、ほぼ元の波形に復元することができる。
[符号化装置1の動作例]
符号化装置1の動作例を図15に関連づけて、IS符号化を行うことを前提に説明する。
図15は、本発明の第1実施形態に係る符号化装置の動作例を示すフローチャートである。
符号化装置1の動作例を図15に関連づけて、IS符号化を行うことを前提に説明する。
図15は、本発明の第1実施形態に係る符号化装置の動作例を示すフローチャートである。
先ず、符号化装置1は、音声信号を入力すると、周波数スペクトル変換処理を行う(ST1)。
詳細には、フィルタバンク2a、2bは、左信号L(t)と右信号R(t)とを、各々周波数スペクトルに変換する。そして、フィルタバンク2a、2bは、スペクトル変換で得た、左スペクトルLm(f)と右スペクトルRm(f)を、合成部3と演算部4とに出力する。
詳細には、フィルタバンク2a、2bは、左信号L(t)と右信号R(t)とを、各々周波数スペクトルに変換する。そして、フィルタバンク2a、2bは、スペクトル変換で得た、左スペクトルLm(f)と右スペクトルRm(f)を、合成部3と演算部4とに出力する。
次に、符号化装置1は、合成処理(ST21)と演算処理(ST22)とを並列に行う(ST2)。
詳細には、合成部3は、フィルタバンク2aから左スペクトルLm(f)が入力され、フィルタバンク2bから右スペクトルRm(f)が入力されると、両者を用いて、TNS処理と、判断処理と、合成処理とを行う(ST21)。そして、合成部3は、和スペクトルSUMm(f)を調整部5に出力する。
詳細には、合成部3は、フィルタバンク2aから左スペクトルLm(f)が入力され、フィルタバンク2bから右スペクトルRm(f)が入力されると、両者を用いて、TNS処理と、判断処理と、合成処理とを行う(ST21)。そして、合成部3は、和スペクトルSUMm(f)を調整部5に出力する。
一方、演算部4は、フィルタバンク2aから左スペクトルLm(f)が入力され、フィルタバンク2bから右スペクトルRm(f)が入力されると、両者を用いて、パワー比算出処理を行う(ST22)。そして、演算部4は、バッファ42を介して、パワー比RAmを調整部5とビットストリーム発生部7とに出力する。
なお、合成処理と演算処理とを並列に行わずに、前者の後に後者を行うことも、その逆も可能である。
なお、合成処理と演算処理とを並列に行わずに、前者の後に後者を行うことも、その逆も可能である。
次に、符号化装置1は、調整処理を行う(ST3)。
詳細には、調整部5は、合成部3から和スペクトルSUMm(f)が入力されると、分割処理と、判断処理と、調整処理とを行う。そして、調整部5は、調整処理後の和スペクトルSUMm(f)aを符号化部6に出力する。
詳細には、調整部5は、合成部3から和スペクトルSUMm(f)が入力されると、分割処理と、判断処理と、調整処理とを行う。そして、調整部5は、調整処理後の和スペクトルSUMm(f)aを符号化部6に出力する。
次に、符号化装置1は、符号化処理を行う(ST4)。
詳細には、符号化部6は、調整部5から和スペクトルSUMm(f)aが入力されると、これを符号化する。そして、符号化部6は、符号化で得た、圧縮符号化データDをビットストリーム発生部7に出力する。
詳細には、符号化部6は、調整部5から和スペクトルSUMm(f)aが入力されると、これを符号化する。そして、符号化部6は、符号化で得た、圧縮符号化データDをビットストリーム発生部7に出力する。
最後に、符号化装置1は、ビットストリーム発生処理を行う(ST5)。
詳細には、ビットストリーム発生部7は、符号化部6から圧縮符号化データDが入力され、演算部4からパワー比RAmが入力されると、圧縮符号化データDに付加データを付加する。そして、ビットストリーム発生部7は、付加データが付加された圧縮符号化データDをビットストリームBSとして、たとえば、外部機器(たとえば、外部機器O3、図26参照)に出力する。
詳細には、ビットストリーム発生部7は、符号化部6から圧縮符号化データDが入力され、演算部4からパワー比RAmが入力されると、圧縮符号化データDに付加データを付加する。そして、ビットストリーム発生部7は、付加データが付加された圧縮符号化データDをビットストリームBSとして、たとえば、外部機器(たとえば、外部機器O3、図26参照)に出力する。
[合成部3の動作例]
合成部3の動作例を図16に関連づけて説明する。
図16は、本発明の第1実施形態に係る合成部の動作例を示すフローチャートである。
合成部3の動作例を図16に関連づけて説明する。
図16は、本発明の第1実施形態に係る合成部の動作例を示すフローチャートである。
先ず、TNS処理部31は、左スペクトルLm(f)と右スペクトルRm(f)とに、TNS処理を各々施す(ST211)。
次に、判断処理部32は、左スペクトルLm(f)と右スペクトルRm(f)とをIS符号化するか否かを、スケールファクタバンド単位で判断する(ST212)。
次に、判断処理部32は、左スペクトルLm(f)と右スペクトルRm(f)とをIS符号化するか否かを、スケールファクタバンド単位で判断する(ST212)。
判断処理部32がIS符号化を行うと判断した場合には(ST213:YES)、合成処理部33は、和スペクトルSUMm(f)を算出するため、次の処理を行う(ST214)。
詳細には、合成処理部33は、左スペクトルLm(f)と右スペクトルRm(f)との和スペクトルSUMm(f)=Lm(f)a+Rm(f)aを算出する。次に、合成処理部33は、右スペクトルRm(f)を0に設定する。そして、合成処理部33は、和スペクトルSUMm(f)のみを調整部5(分割処理部51)に出力する。
この場合、符号化部6は、和スペクトルSUMm(f)を入力し、これを符号化する。
詳細には、合成処理部33は、左スペクトルLm(f)と右スペクトルRm(f)との和スペクトルSUMm(f)=Lm(f)a+Rm(f)aを算出する。次に、合成処理部33は、右スペクトルRm(f)を0に設定する。そして、合成処理部33は、和スペクトルSUMm(f)のみを調整部5(分割処理部51)に出力する。
この場合、符号化部6は、和スペクトルSUMm(f)を入力し、これを符号化する。
一方、判断処理部32がIS符号化を行わないと判断した場合には(ST213:NO)、合成処理部33は、左スペクトルLm(f)と右スペクトルRm(f)とを、そのまま符号化部6に出力する(ST215)。
この場合、符号化部6は、左スペクトルLm(f)と右スペクトルRm(f)とを入力し、両者を個別にそのまま符号化する。
この場合、符号化部6は、左スペクトルLm(f)と右スペクトルRm(f)とを入力し、両者を個別にそのまま符号化する。
[調整部5の動作例]
調整部5の動作例を図17に関連づけて説明する。
図17は、本発明の第1実施形態に係る演算部の動作例を示すフローチャートである。
調整部5の動作例を図17に関連づけて説明する。
図17は、本発明の第1実施形態に係る演算部の動作例を示すフローチャートである。
先ず、分割処理部51は、和スペクトルSUMm(f)の周波数帯域をk個のバンドに分割し、分割処理後の和スペクトルSUMm(f)kを調整処理部54に出力する(ST31)。
次に、判断処理部52は、左信号Lm(t)と右信号Rm(t)との信号強度差が大きいか否かを判断する(ST32)。
判断処理部52は、パワー比RAmが、RAm≪1またはRAm≒0である場合には、信号強度差が大きいと判断し、判断結果SJを調整処理部54に出力する。
一方、判断処理部52は、パワー比RAmが、RAm≒1またはRAm≫1である場合には、判断結果SJを調整処理部54に出力しない。
判断処理部52は、パワー比RAmが、RAm≪1またはRAm≒0である場合には、信号強度差が大きいと判断し、判断結果SJを調整処理部54に出力する。
一方、判断処理部52は、パワー比RAmが、RAm≒1またはRAm≫1である場合には、判断結果SJを調整処理部54に出力しない。
次に、調整処理部54は、演算部4からの判断結果SJの入力の有無に応じて、次の調整処理を行う。
調整処理部54は、判断結果SJの入力がある場合には(ST33:YES)、和スペクトルSUMm(f)kが最小可聴域以下となる範囲内で、和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度よりも上げる(ST34)。
一方、調整処理部54は、判断結果SJの入力がない場合には(ST33:NO)、和スペクトルSUMm(f)kの強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)kの強度を調整する(ST35)。
調整処理部54は、判断結果SJの入力がある場合には(ST33:YES)、和スペクトルSUMm(f)kが最小可聴域以下となる範囲内で、和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度よりも上げる(ST34)。
一方、調整処理部54は、判断結果SJの入力がない場合には(ST33:NO)、和スペクトルSUMm(f)kの強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)kの強度を調整する(ST35)。
以上、符号化装置1およびその構成要素の動作例を詳細に説明した。図15〜図17に図示する各ステップ(ST)は、コンピュータに実行させるプログラムに手順として記述されている。
本実施形態では、入力音声信号として、2チャネルのステレオ信号を例に挙げたが、入力音声信号が2チャネル以上のマルチチャネルのステレオ信号、たとえば、5.1チャネルのステレオ信号であってもよい。この場合、左信号L(t)および右信号R(t)に対応する信号に対して、本実施形態を適用すればよい。
本実施形態では、信号(スペクトル)のパワーを基に、パワー比算出処理や信号強度差の大小の判断などを行ったが、信号のパワーの代わりに、信号のパワーの実効値を用いても差し支えない。
本実施形態では、信号強度差の大小の判断には、パワー比RAmが用いられるが、たとえば、左スペクトルLm(f)と右スペクトルRm(f)との差DIF=Lm(f)−Rm(f)を用いて、信号強度差の大小の判断を行うこともできる。
判断処理部52は、信号強度差が大きいと判断した場合に、その旨を示す判断結果SJを調整処理部54に出力するが、信号強度差が小さいと判断した場合にも、その旨を示す判断結果を調整処理部54に出力するようにしてもよい。この場合、調整処理部54は、信号強度差が小さいと判断した旨の判断結果を受けると、ST35の処理を実行する(図17参照)。
本実施形態では、合成処理の際に、たとえば、AACの規格に基づき、右スペクトルRm(f)が0に設定され、和スペクトルSUMm(f)が左チャネルの音声信号として符号化される。左スペクトルLm(f)を0に設定し、和スペクトルSUMm(f)を右チャネルの音声信号として符号化する場合であっても、本発明をこれに適用することができる。
たとえば、符号化装置1にMS(Middle Side)符号化の機能を更に設け、IS符号化とMS符号化を排他的に行うこともできる。
本実施形態では、符号化装置1が行う各処理は、ソフトウェア処理されるが、符号化装置1の全てあるいは一部をハードウェアで構成し、ハードウェアを用いて各処理を行ってもよい。
本実施形態では、符号化装置1が行う各処理は、ソフトウェア処理されるが、符号化装置1の全てあるいは一部をハードウェアで構成し、ハードウェアを用いて各処理を行ってもよい。
<2.第2実施形態>
第2実施形態では、図1に図示する符号化装置1と、図18に図示する符号化装置1aとを比較することにより、第1実施形態に係る符号化装置1の利点について説明する。
第2実施形態では、図1に図示する符号化装置1と、図18に図示する符号化装置1aとを比較することにより、第1実施形態に係る符号化装置1の利点について説明する。
[符号化装置1aの構成例]
図18は、本発明の第2実施形態に係る符号化装置の構成例を示すブロック図である。
図18に図示する符号化装置1aは、フィルタバンク2a、2b、合成部3、演算部4a、調整部5a、符号化部6およびビットストリーム発生部7を有する。
図18は、本発明の第2実施形態に係る符号化装置の構成例を示すブロック図である。
図18に図示する符号化装置1aは、フィルタバンク2a、2b、合成部3、演算部4a、調整部5a、符号化部6およびビットストリーム発生部7を有する。
この符号化装置1aと、図1に図示する符号化装置1との差異は、次の3点である。
第1の点は、演算部4aが、パワー比RAmをビットストリーム発生部7のみに出力することである。
第2の点は、調整部5aが、パワー比RAmを用いて信号強度差の大小を判断する判断処理を行わないことである。
第3の点は、調整部5aが、調整処理の際に、信号強度差の大小に関係なく、一律に、和スペクトルSUMm(f)kの強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)kの強度を調整することである。
第2の点は、調整部5aが、パワー比RAmを用いて信号強度差の大小を判断する判断処理を行わないことである。
第3の点は、調整部5aが、調整処理の際に、信号強度差の大小に関係なく、一律に、和スペクトルSUMm(f)kの強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)kの強度を調整することである。
上記の差異を換言すれば、パワー比RAmは、ビットストリーム発生部7にて用いられるのみであり、和スペクトルSUMm(f)kは、信号強度差の大小に関係なく、一律に調整される。
[符号化装置1(第1実施形態)と符号化装置1a(第2実施形態)との比較]
以下、符号化装置1aが入力音声信号を符号化したときに、これがどのように復号化されるかを、図19〜図22を参照しながら、ケースA〜D別に説明する。
以下、符号化装置1aが入力音声信号を符号化したときに、これがどのように復号化されるかを、図19〜図22を参照しながら、ケースA〜D別に説明する。
図19〜図22は、本発明の第2実施形態を説明するための図である。なお、図19〜図22は、ケースA〜ケースDの場合に各々対応している。
各図において、横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。各図には、IS符号化の対象となる高周波帯域のみが例示されている。
各図には、合成処理前、調整処理後、復号化後の左右チャネルの様子が、時系列の順に例示されている。
なお、各図中の「合成処理前」および「復号化後」の部分には、左チャネルに左スペクトルLm(f)が、右チャネルに右スペクトルRm(f)が各々例示されている。各図中の「調整処理後」の部分には、左チャネルに和スペクトルSUMm(f)が、右チャネルに右スペクトルRm(f)=0が各々例示されている。
各図において、横軸は、周波数(f:単位はHz)を示す。縦軸は、スペクトル値(単位はdB)を示す。各図には、IS符号化の対象となる高周波帯域のみが例示されている。
各図には、合成処理前、調整処理後、復号化後の左右チャネルの様子が、時系列の順に例示されている。
なお、各図中の「合成処理前」および「復号化後」の部分には、左チャネルに左スペクトルLm(f)が、右チャネルに右スペクトルRm(f)が各々例示されている。各図中の「調整処理後」の部分には、左チャネルに和スペクトルSUMm(f)が、右チャネルに右スペクトルRm(f)=0が各々例示されている。
(1)ケースA(RA≒1、Lm(f)≒Rm(f))
図19に図示するように、ケースAは、合成処理前における、左スペクトルLm(f)と右スペクトルRm(f)とがほぼ等しい場合である。すなわち、信号強度差が小さい場合である。
図19に図示するように、ケースAは、合成処理前における、左スペクトルLm(f)と右スペクトルRm(f)とがほぼ等しい場合である。すなわち、信号強度差が小さい場合である。
符号化装置1aの動作例を踏まえながら、ケースAについて説明する。下記の(a)〜(c)の点は、全てのケースにおいて共通である。
(a)合成処理では、和スペクトルSUMm(f)が算出され、右スペクトルRm(f)が、0に設定される。
(b)調整処理時に、調整部5aが、和スペクトルSUMm(f)の強度が左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)の強度を調整すると、これが左チャネルの音声信号として符号化される。なお、右スペクトルRm(f)は符号化されない。
(c)復号化の際には、和スペクトルSUMm(f)が、たとえば、逆MDCTされる。そして、パワー比RAmを用いることにより、和スペクトルSUMm(f)から、元の左右のスペクトルを得ることができる。ここでは、「元のスペクトル」とは、合成処理前のものを指す。
ケースAの場合、復号化後の右スペクトルRm(f)は、パワー比RAmに応じて、その強度を調整すれば、ほぼ元のものに復元される。それは、もともと両者の波形が非常に等しいためである。
なお、復号化後の左スペクトルLm(f)は、その状態で、ほぼ元の左スペクトルに復元されている。それは、元の和スペクトルSUMm(f)の強度が左スペクトルLm(f)の強度に調整され、それが左チャネルのスペクトルとして符号化されているためである。
なお、復号化後の左スペクトルLm(f)は、その状態で、ほぼ元の左スペクトルに復元されている。それは、元の和スペクトルSUMm(f)の強度が左スペクトルLm(f)の強度に調整され、それが左チャネルのスペクトルとして符号化されているためである。
このように、信号強度差が小さい場合には、左右のスペクトルを、ほぼ、元のスペクトル信号に復号化することができる。そのため、再生時の音質の劣化があったとしても、それは極めて小さい。
(2)ケースB(RAm≫1、Lm(f)≫Rm(f))
図20に図示するように、ケースBは、合成処理前における、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に大きい場合である。すなわち、信号強度差が大きい場合である。
図20に図示するように、ケースBは、合成処理前における、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に大きい場合である。すなわち、信号強度差が大きい場合である。
ケースBの場合、復号化後の右スペクトルRm(f)の波形は、元の波形と異なる。実際には、復号化後の右スペクトルRm(f)の波形は、和スペクトルSUMm(f)の波形に近いものとなる。
しかしながら、復号化後の右スペクトルRm(f)の強度は、元の強度とほぼ同一に復元されている。それは、元の右スペクトルRm(f)の強度が、左スペクトルLm(n)の強度よりも非常に小さく、左スペクトルLm(n)のS/N比が十分に確保できているためである。
このように、たとえ信号強度差が大きくても、Lm(f)≫Rm(f)の関係が成立する場合には、復号化後の右スペクトルRm(f)の強度を元の強度とほぼ同一に復元することができる。
右スペクトルRm(f)の波形は、元の波形と異なるが、その強度が小さいため、信号強度差を知覚するには至らず、再生時の音質の劣化は、ないに等しい。
右スペクトルRm(f)の波形は、元の波形と異なるが、その強度が小さいため、信号強度差を知覚するには至らず、再生時の音質の劣化は、ないに等しい。
(3)ケースC(RAm≪1、Lm(f)≪Rm(f))
図21に図示するように、ケースCは、合成処理前における、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に小さい場合である。すなわち、信号強度差が大きい場合である。
図21に図示するように、ケースCは、合成処理前における、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に小さい場合である。すなわち、信号強度差が大きい場合である。
ケースCの場合、復号化後の左スペクトルLm(f)の波形が、元の波形と異なるばかりか、復号化後の右スペクトルRm(f)の波形も、元の波形と著しく異なる。実際には、両者とも、和スペクトルSUMm(f)の波形に近いものとなる。
その理由は、次の通りである。もともと、左スペクトルLm(f)が右スペクトルRm(f)よりも非常に小さいため、和スペクトルSUMm(f)の波形は、基本的に、元の右スペクトルRm(f)の波形となる。
そして、調整処理において、和スペクトルSUMm(f)の強度が、もともと強度の小さい左スペクトルLm(f)のものに調整されるため、復号化後の左スペクトルLm(f)の波形は、和スペクトルSUMm(f)の波形に近いものとなる。
一方、復号化後の右スペクトルRm(f)は、和スペクトルSUMm(f)の強度を調節することによって得られるので、当然ながら、その波形は、和スペクトルSUMm(f)の波形に近いものとなる。
そして、調整処理において、和スペクトルSUMm(f)の強度が、もともと強度の小さい左スペクトルLm(f)のものに調整されるため、復号化後の左スペクトルLm(f)の波形は、和スペクトルSUMm(f)の波形に近いものとなる。
一方、復号化後の右スペクトルRm(f)は、和スペクトルSUMm(f)の強度を調節することによって得られるので、当然ながら、その波形は、和スペクトルSUMm(f)の波形に近いものとなる。
復号化後の左スペクトルLm(f)は、もともと非常に小さな信号を復号化したものであるから、その波形が元の波形と異なっていても、左チャネルの音質の劣化を知覚するには至らない。
しかしながら、復号化後の右スペクトルRm(f)は、左スペクトルLm(f)と比べて非常に大きな信号であるから、その波形が元の波形と異なると、当然ながら、右チャネルの音質の劣化が知覚される。信号によっては、音声に異音が混入したかのように知覚される。
しかしながら、復号化後の右スペクトルRm(f)は、左スペクトルLm(f)と比べて非常に大きな信号であるから、その波形が元の波形と異なると、当然ながら、右チャネルの音質の劣化が知覚される。信号によっては、音声に異音が混入したかのように知覚される。
(4)ケースD(RAm≒0、Lm(f)≒0、ただし、Lm(f)≪Rm(f))
図22に図示するように、ケースDは、合成処理前における、左スペクトルLm(f)がほぼ0の場合である。すなわち、信号強度差が大きい場合である。
図22に図示するように、ケースDは、合成処理前における、左スペクトルLm(f)がほぼ0の場合である。すなわち、信号強度差が大きい場合である。
ケースDの場合、復号化後の右スペクトルRm(f)は喪失し、0である。
その理由は、ケースCの場合と同様に、和スペクトルSUMm(f)の強度が、もともと0に近い左スペクトルLm(f)の強度に調整されることに起因する。これに加え、その後の量子化処理の際の丸め処理により、量子化後の左スペクトルLm(f)が0となるため、復号化後の右スペクトルRm(f)は、0となる。
このように、信号強度差が大きく、左スペクトルLm(f)がほぼ0の場合には、左右チャネルの音声が喪失する。その結果、入力音を知覚することができない。
その理由は、ケースCの場合と同様に、和スペクトルSUMm(f)の強度が、もともと0に近い左スペクトルLm(f)の強度に調整されることに起因する。これに加え、その後の量子化処理の際の丸め処理により、量子化後の左スペクトルLm(f)が0となるため、復号化後の右スペクトルRm(f)は、0となる。
このように、信号強度差が大きく、左スペクトルLm(f)がほぼ0の場合には、左右チャネルの音声が喪失する。その結果、入力音を知覚することができない。
次に、第1実施形態に係る符号化装置1が入力音声信号を符号化したときに、これがどのように復号化されるかを図23に関連づけて説明する。
図23は、本発明の第1実施形態を説明するための図である。図23には、ケースCの場合が例示されている。
図23は、本発明の第1実施形態を説明するための図である。図23には、ケースCの場合が例示されている。
図23に図示するように、もともと、左スペクトルLm(f)が、右スペクトルRm(f)よりも非常に小さい。
しかしながら、第1実施形態に係る符号化装置1は、調整部5が、演算部4が得たパワー比RAmを用いて、最小可聴域以下を越えないように、和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度よりも上げる。
そのため、復号化後の和スペクトルSUMm(f)のS/N比を十分に確保することができる。
しかしながら、第1実施形態に係る符号化装置1は、調整部5が、演算部4が得たパワー比RAmを用いて、最小可聴域以下を越えないように、和スペクトルSUMm(f)kの強度を左スペクトルLm(f)の強度よりも上げる。
そのため、復号化後の和スペクトルSUMm(f)のS/N比を十分に確保することができる。
更に、調整部5が、和スペクトルSUMm(f)の波形が右スペクトルRm(f)の波形になるように、和スペクトルSUMm(f)の波形を調整する。
そのため、パワー比を用いて、復号化後の和スペクトルSUMm(f)から右スペクトルRm(f)を得ても、その波形は、元の波形とほぼ同一であり、その強度も、元の強度とほぼ同一である。
復号化後の左スペクトルLm(f)は、合成処理前のものと比べて大きいが、最小可聴域を越えていない。
したがって、これが、再生時に、左チャネルの音として知覚されることは、ないに等しい。
そのため、パワー比を用いて、復号化後の和スペクトルSUMm(f)から右スペクトルRm(f)を得ても、その波形は、元の波形とほぼ同一であり、その強度も、元の強度とほぼ同一である。
復号化後の左スペクトルLm(f)は、合成処理前のものと比べて大きいが、最小可聴域を越えていない。
したがって、これが、再生時に、左チャネルの音として知覚されることは、ないに等しい。
以上の観点から、第1実施形態に係る符号化装置1を用いれば、IS符号化の際に、大きな信号強度差が生じた場合であっても、左右チャネルの音質を損なうことなく、鮮明なステレオ音声を聞くことができる。
<3.第3実施形態>
第3実施形態では、第1実施形態に係る符号化装置1よりも、処理速度を向上させた符号化装置1bについて、第1実施形態と異なる点を説明する。
第3実施形態では、第1実施形態に係る符号化装置1よりも、処理速度を向上させた符号化装置1bについて、第1実施形態と異なる点を説明する。
[符号化装置1bの構成例]
符号化装置1bの構成例を図24に関連づけて説明する。
図24は、本発明の第3実施形態に係る符号化装置の構成例を示すブロック図である。
符号化装置1bの構成例を図24に関連づけて説明する。
図24は、本発明の第3実施形態に係る符号化装置の構成例を示すブロック図である。
図24に図示する符号化装置1bは、フィルタバンク2a、2b、合成部3、演算部4、調整部5b、符号化部6およびビットストリーム発生部7を有する。
符号化装置1bは、基本的に、第1実施形態に係る符号化装置1と同様の構成であるが、調整部5bの構成が、第1実施形態のものと異なる。
符号化装置1bは、基本的に、第1実施形態に係る符号化装置1と同様の構成であるが、調整部5bの構成が、第1実施形態のものと異なる。
調整部5bの構成例を図25に関連づけて説明する。図25は、本発明の第3実施形態に係る調整部の構成例を示すブロック図である。
図25に図示する調整部5bは、判断処理部52、メモリ53および調整処理部54aを有する。調整部5bは、図7に図示する分割処理部51が搭載されていないため、分割処理部51によって分割された帯域ごとに調整処理を行わず、次に述べる調整処理を行う。
図25に図示する調整部5bは、判断処理部52、メモリ53および調整処理部54aを有する。調整部5bは、図7に図示する分割処理部51が搭載されていないため、分割処理部51によって分割された帯域ごとに調整処理を行わず、次に述べる調整処理を行う。
(1)判断結果SJの入力がない場合(ケースAまたはケースB)
この場合には、第1実施形態と同様に、調整処理部54aは、和スペクトルSUMm(f)kの強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)kの強度を調整する。
この場合には、第1実施形態と同様に、調整処理部54aは、和スペクトルSUMm(f)kの強度が、左スペクトルLm(f)の強度と一致するように、和スペクトルSUMm(f)kの強度を調整する。
(2)判断結果SJの入力がある場合(ケースCまたはケースD)
この場合には、調整処理部54aは、全周波数帯域の和スペクトルSUMm(f)kを、最小可聴域の低周波側の値に一致させる。
この場合には、調整処理部54aは、全周波数帯域の和スペクトルSUMm(f)kを、最小可聴域の低周波側の値に一致させる。
「最小可聴域の低周波側」とは、たとえば、2kHz〜4kHzの周波数帯域であって、IS符号化の対象となる周波数帯域の一部である。調整処理部54aは、和スペクトルSUMm(f)kを、たとえば、2kHz〜4kHzのうち、任意の周波数(たとえば、2kHz)における最小可聴値に一致させる。
本実施形態では、分割処理を行わず、分割した帯域ごとに和スペクトルSUMm(f)kの強度を調整しないため、分割処理に要する時間が不要であり、符号化装置1b自体の処理速度が、第1実施形態に係る符号化装置1の処理速度よりも向上する。無論、IS符号化の際に、大きな信号強度差が生じた場合であっても、左右チャネルの音質を損なうことなく、鮮明なステレオ音声を聞くことができる。
<4.第4実施形態>
第4実施形態では、第1実施形態に係る符号化装置1を搭載した電子機器について説明する。第4実施形態では、AV(Audio Visual)機器を電子機器の一例に挙げる。
第4実施形態では、第1実施形態に係る符号化装置1を搭載した電子機器について説明する。第4実施形態では、AV(Audio Visual)機器を電子機器の一例に挙げる。
図26は、本発明の第4実施形態に係る電子機器の構成例を示すブロック図である。
図26に図示する電子機器100は、トランスコード部110、チューナー120、ハードディスク(HDD)130、外部入力用のインターフェース(I/F)140、外部出力用のインターフェース(I/F)150、および、表示装置O4用のインターフェース(I/F)160を有する。
電子機器100には、外部機器O1、O3、表示装置O4が接続されている。
図26に図示する電子機器100は、トランスコード部110、チューナー120、ハードディスク(HDD)130、外部入力用のインターフェース(I/F)140、外部出力用のインターフェース(I/F)150、および、表示装置O4用のインターフェース(I/F)160を有する。
電子機器100には、外部機器O1、O3、表示装置O4が接続されている。
外部機器O1は、たとえば、パーソナルコンピュータ(PC)である。外部機器O1は、種々のコンテンツデータを有し、電子機器100に接続される。外部機器O1と電子機器100との接続は、有線、無線を問わない。両者のデータの授受は、インターフェース140を介して行われる。
記録媒体O2は、たとえば、読み書き可能な光ディスクであって、種々のコンテンツデータを記録する。記録媒体O2は、使用時に、電子機器100内部の光ディスクドライブ(不図示)に挿入される。
外部機器O3は、たとえば、音楽を再生するオーディオプレーヤーである。外部機器O3は、電子機器100に接続され、電子機器100から入力されたデータを出力する。外部機器O3と電子機器100との接続は、有線、無線を問わない。両者のデータの授受は、インターフェース150を介して行われる。
表示装置O4は、たとえば、液晶ディスプレイである。表示装置O4は、電子機器100に接続され、電子機器100から入力されたデータ(映像信号)を表示する。表示装置O4と電子機器100との接続は、有線、無線を問わない。両者のデータの授受は、インターフェース160を介して行われる。
電子機器100は、主に、入力コンテンツデータをトランスコードする機能、トランスコードしたデータを再生する機能、入力コンテンツデータをハードディスク130あるいは記録媒体O2に記録する機能を有する。
電子機器100は、チューナー120あるいは外部機器O1から入力されたコンテンツデータのデータ形式を、トランスコード部110を用いて、外部機器O3あるいは表示装置O4に適合したデータ形式にトランスコードする。そして、電子機器100は、トランスコード後のコンテンツデータを外部機器O3および表示装置O4に選択的に出力する。
電子機器100は、チューナー120あるいは外部機器O1から入力されたコンテンツデータのデータ形式を、トランスコード部110を用いて、外部機器O3あるいは表示装置O4に適合したデータ形式にトランスコードする。そして、電子機器100は、トランスコード後のコンテンツデータを外部機器O3および表示装置O4に選択的に出力する。
コンテンツデータは、たとえば、映画、音楽、WEB(World Wide Web)サイトのデータであって、音声信号と映像信号とが、たとえば、MPEG4/AACにより、(圧縮)符号化されている。
トランスコード部110は、符号化装置1および復号化装置111を有し、入力コンテンツデータをトランスコードする。
ここでは、トランスコード部110が音声信号を取り扱う場合について説明する。
ここでは、トランスコード部110が音声信号を取り扱う場合について説明する。
復号化装置111は、チューナー120、ハードディスク130、記録媒体O2、および、インターフェース140の内、いずれかから音声信号が入力されると、これを復号化(デコード)する。復号化装置111に入力された音声信号は、たとえば、AACによって符号化されている。そして、復号化装置111は、復号化した音声信号を符号化装置1に出力する。
なお、復号化装置111は、符号化されている映像信号を復号化した際には、これをインターフェース160を介して表示装置O4に出力する。
なお、復号化装置111は、符号化されている映像信号を復号化した際には、これをインターフェース160を介して表示装置O4に出力する。
符号化装置1は、図1に図示するものである。符号化装置1は、復号化された音声信号が復号化装置111から入力されると、これが外部機器O3のデータ形式(たとえば、MPEG2/AAC)に適合するように、入力音声信号を符号化する。
本実施形態では、トランスコードを行う電子機器100に、符号化装置1が搭載されているため、IS符号化の際に、大きな信号強度差が生じた場合であっても、再生時の音質、特に、右チャネルの音質を損なうことなく、鮮明なステレオ音声を聞くことができる。
無論、電子機器100に、第3実施形態に係る符号化装置1bを搭載しても、右チャネルの音質を損なうことなく、鮮明なステレオ音声を聞くことができる上、処理速度の向上化も図ることもできる。
無論、電子機器100に、第3実施形態に係る符号化装置1bを搭載しても、右チャネルの音質を損なうことなく、鮮明なステレオ音声を聞くことができる上、処理速度の向上化も図ることもできる。
本実施形態では、電子機器としてトランスコードを行うAV機器を例に挙げたが、たとえば、ブルーレイディスク(Blu-ray Disk;登録商標)やビデオカメラのように、ステレオ信号を扱う電子機器であれば、本発明に係る符号化装置を種々の電子機器に搭載可能である。
本発明は、上述の実施形態に限定されることなく、本発明の要旨を逸脱しない範囲において、種々の変更が可能である。
1、1a、1b…符号化装置、2a、2b…フィルタバンク、3…合成部、4、4a…演算部、5、5a、5b…調整部、6…符号化部、7…ビットストリーム発生部、21a、21b…変換ブロック部、22a、21b…領域変換部、31…TNS処理部、32…(合成部3の)判断処理部、33…合成処理部、41…パワー比算出処理部、42…バッファ、51…分割処理部、52…(調整部5の)判断処理部、53…メモリ、54…調整処理部、100…電子機器、110…トランスコード部、111…復号化装置、120…チューナー、130…ハードディスク、140、150、160…インターフェース。
Claims (9)
- 符号化すべき入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する合成部と、
前記合成部の出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記合成部の出力レベルを調整する調整部と、
を有し、
前記調整部は、
前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる
符号化装置。 - 前記調整部は、
前記第1チャネル信号レベルが前記第2チャネル信号レベルよりも小さい場合には、前記合成部の出力波形が、前記第2チャネル信号の波形となるように、前記調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる
請求項1記載の符号化装置。 - 前記第2チャネル信号レベルに対する前記第1チャネル信号レベルの比を取得する取得部を有し、
前記調整部は、
前記取得部が取得した比が、1よりも小さい値で規定された閾値以下の場合には、前記第1チャネル信号レベルが前記第2チャネル信号レベルよりも小さいと判断し、前記調整可能な範囲内で、前記合成部の出力レベルを調整する
請求項2記載の符号化装置。 - 前記合成部の出力の周波数帯域を複数に分割する分割部を有し、
前記調整部は
前記取得部が取得した比が前記閾値以下の場合には、前記調整可能な範囲内で、前記合成部の出力波形を、前記分割部が分割した周波数帯域ごとに調整する
請求項3記載の符号化装置。 - 前記調整部は、
前記第1チャネル信号レベルが第2チャネル信号レベル以上の場合には、前記合成部の出力レベルを前記第1チャネル信号レベルに調整し、
前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる
請求項1から4のいずれか一に記載の符号化装置。 - 前記調整部は、
前記第1チャネル信号レベルが前記第2チャネル信号レベルよりも小さい場合には、前記合成部の出力レベルを、前記最小可聴値に一致させる
請求項1記載の符号化装置。 - 符号化すべき入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する第1工程と、
前記第1工程で合成した、前記第1チャネル信号と前記第2チャネル信号とを出力する第2工程と、
前記第2工程における出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記第2工程における出力レベルを調整する第3工程と、
を有し、
前記第3工程では、
前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記第2工程における出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる
符号化方法。 - 符号化すべき入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する第1手順と、
前記第1手順で合成した、前記第1チャネル信号と前記第2チャネル信号とを出力する第2手順と、
前記第2手順における出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記第2手順での出力レベルを調整する第3手順と、
を有し、
前記第3手順では、
前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記第2手順における出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる
ことをコンピュータに実行させるプログラム。 - 入力音声信号を符号化する符号化装置を有し、
前記符号化装置は、
前記入力音声信号が含む、第1チャネル信号と第2チャネル信号とを合成する合成部と、
前記合成部の出力レベルが、少なくとも第1チャネル信号レベルとなるように、前記合成部の出力レベルを調整する調整部と、
前記調整部によって出力レベルが調整された前記合成部の出力レベルを、符号化すべき音声信号として前記第2データ形式で符号化する符号化部と
を有し、
前記調整部は、
前記第1チャネル信号レベルが第2チャネル信号レベルよりも小さい場合には、前記合成部の出力レベルが最小可聴値以下となる調整可能な範囲内で、前記合成部の出力レベルを前記第1チャネル信号レベルよりも上げる
電子機器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009276407A JP2011118215A (ja) | 2009-12-04 | 2009-12-04 | 符号化装置、符号化方法、プログラムおよび電子機器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009276407A JP2011118215A (ja) | 2009-12-04 | 2009-12-04 | 符号化装置、符号化方法、プログラムおよび電子機器 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011118215A true JP2011118215A (ja) | 2011-06-16 |
Family
ID=44283620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009276407A Pending JP2011118215A (ja) | 2009-12-04 | 2009-12-04 | 符号化装置、符号化方法、プログラムおよび電子機器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011118215A (ja) |
-
2009
- 2009-12-04 JP JP2009276407A patent/JP2011118215A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6531649B2 (ja) | 符号化装置および方法、復号化装置および方法、並びにプログラム | |
JP5129888B2 (ja) | トランスコード方法、トランスコーディングシステム及びセットトップボックス | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
RU2381571C2 (ru) | Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала | |
US9191581B2 (en) | Methods and apparatus for mixing compressed digital bit streams | |
JP5603339B2 (ja) | 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 | |
KR101162275B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
EP2850613B1 (en) | Efficient encoding and decoding of multi-channel audio signal with multiple substreams | |
WO2013027629A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
TW201503108A (zh) | 後設資料驅動動態範圍控制 | |
US20120078640A1 (en) | Audio encoding device, audio encoding method, and computer-readable medium storing audio-encoding computer program | |
JP2011059714A (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
US7583804B2 (en) | Music information encoding/decoding device and method | |
JP3519859B2 (ja) | 符号器及び復号器 | |
US20100121633A1 (en) | Stereo audio encoding device and stereo audio encoding method | |
US20130085762A1 (en) | Audio encoding device | |
JP4649351B2 (ja) | デジタルデータ復号化装置 | |
JP4627737B2 (ja) | デジタルデータ復号化装置 | |
JP3984468B2 (ja) | 符号化装置、復号化装置及び符号化方法 | |
JP2011118215A (ja) | 符号化装置、符号化方法、プログラムおよび電子機器 | |
JP2006047561A (ja) | オーディオ信号符号化装置およびオーディオ信号復号化装置 | |
JP2005114813A (ja) | オーディオ信号再生装置及び再生方法 | |
JP4641272B2 (ja) | デジタルデータ復号化装置 | |
JP2007178529A (ja) | 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法 | |
JP4530567B2 (ja) | デジタルオーディオ復号装置 |