JP2012032713A - 復号装置、復号方法、およびプログラム - Google Patents
復号装置、復号方法、およびプログラム Download PDFInfo
- Publication number
- JP2012032713A JP2012032713A JP2010173943A JP2010173943A JP2012032713A JP 2012032713 A JP2012032713 A JP 2012032713A JP 2010173943 A JP2010173943 A JP 2010173943A JP 2010173943 A JP2010173943 A JP 2010173943A JP 2012032713 A JP2012032713 A JP 2012032713A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- orthogonal transform
- inverse orthogonal
- narrowband
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L27/00—Modulated-carrier systems
- H04L27/26—Systems using multi-frequency codes
- H04L27/2601—Multicarrier modulation systems
- H04L27/2647—Arrangements specific to the receiver only
- H04L27/2649—Demodulators
- H04L27/26532—Demodulators using other transforms, e.g. discrete cosine transforms, Orthogonal Time Frequency and Space [OTFS] or hermetic transforms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L27/00—Modulated-carrier systems
- H04L27/26—Systems using multi-frequency codes
- H04L27/2601—Multicarrier modulation systems
- H04L27/2626—Arrangements specific to the transmitter only
- H04L27/2627—Modulators
- H04L27/2639—Modulators using other transforms, e.g. discrete cosine transforms, Orthogonal Time Frequency and Space [OTFS] or hermetic transforms
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】狭帯域信号と広帯域信号を含む周波数信号に対する逆直交変換の演算量を削減する。
【解決手段】DEMUX51は、符号化データを取得する。F/T変換器16は、逆量子化器13により得られる周波数信号のうちのLEF信号の周波数信号に対して、直接行列演算を行うことにより逆直交変換を行う。F/T変換器15は、逆量子化器13により得られる周波数信号のうちの通常の音声信号の周波数信号に対して、高速演算法を用いた逆直交変換を行う。本発明は、例えば、復号装置に適用することができる。
【選択図】図1
【解決手段】DEMUX51は、符号化データを取得する。F/T変換器16は、逆量子化器13により得られる周波数信号のうちのLEF信号の周波数信号に対して、直接行列演算を行うことにより逆直交変換を行う。F/T変換器15は、逆量子化器13により得られる周波数信号のうちの通常の音声信号の周波数信号に対して、高速演算法を用いた逆直交変換を行う。本発明は、例えば、復号装置に適用することができる。
【選択図】図1
Description
本発明は、復号装置、復号方法、およびプログラムに関し、特に、狭帯域信号と広帯域信号を含む周波数信号に対する逆直交変換の演算量を削減することができるようにした復号装置、復号方法、およびプログラムに関する。
従来、音声等の時間信号を周波数信号へ変換して量子化し、符号化して伝送する符号化装置がある。また、このような符号化装置により伝送された符号化データを、復号して逆量子化し、その結果得られる周波数信号を時間信号に変換する復号装置がある。
このような復号装置において、周波数信号の時間信号への変換(以下、周波数時間変換という)には、IFFT(Inverse Fast Fourier transform)(逆高速フーリエ変換)、IDCT(Inverse Discrete Cosine Transform)(逆離散コサイン変換)、IMDCT(Inverse Modified Discrete Cosine Transform)(逆変形離散コサイン変換)等の逆直交変換が多く用いられる。
一方、所定の復調特性のFFT(Fast Fourier Transform)と、復調特性は劣るが消費電力の小さいFFTを備え、これらを切り替えて使用することにより、消費電力を節約する無線通信装置がある(例えば、特許文献1参照)。
上述したような周波数時間変換に用いられる逆直交変換では、周波数信号を構成する各分割帯域のスペクトルを要素とする行列演算が、通常、高速アルゴリズム(高速演算法)で行われる。これにより、周波数信号が広帯域信号である場合には、直接行列演算が行われる場合に比べて、演算量を削減することができる。
しかしながら、周波数信号が狭帯域信号である場合には、所定の帯域以上の分割帯域の信号はゼロ信号となるため、冗長な演算が発生し、直接行列演算が行われる場合に比べて、演算量は増加する。
本発明は、このような状況に鑑みてなされたものであり、狭帯域信号と広帯域信号を含む周波数信号に対する逆直交変換の演算量を削減することができるようにするものである。
本発明の一側面の復号装置は、狭帯域信号と広帯域信号を含む第1の周波数信号を取得する取得手段と、前記第1の周波数信号のうちの前記狭帯域信号に対して直接行列演算を行うことにより逆直交変換を行う直接逆直交変換手段と、前記第1の周波数信号のうちの前記広帯域信号に対して高速演算法を用いた逆直交変換を行う高速逆直交変換手段とを備える復号装置である。
本発明の一側面の復号方法およびプログラムは、本発明の一側面の復号装置に対応する。
本発明の一側面においては、狭帯域信号と広帯域信号を含む第1の周波数信号が取得され、前記第1の周波数信号のうちの前記狭帯域信号に対して直接行列演算が行われることにより逆直交変換が行われ、前記第1の周波数信号のうちの前記広帯域信号に対して高速演算法を用いた逆直交変換が行われる。
本発明の一側面の復号装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
本発明の一側面によれば、狭帯域信号と広帯域信号を含む周波数信号に対する逆直交変換の演算量を削減することができる。
<第1実施の形態>
[復号装置の第1実施の形態の構成例]
図1は、本発明を適用した復号装置の第1実施の形態の構成例を示すブロック図である。
[復号装置の第1実施の形態の構成例]
図1は、本発明を適用した復号装置の第1実施の形態の構成例を示すブロック図である。
図1の復号装置10は、DEMUX11、復号化器12、逆量子化器13、スイッチ14、F/T変換器15、F/T変換器16、出力器17、およびコントローラ18により構成される。復号装置10は、図示せぬ符号化装置から送信されてくる符号化データを復号する。この符号化データは、狭帯域信号としてのサブウーファー信号などのLFE(Low Frequency Effect)信号と、広帯域信号としての通常の音声信号を、時間信号から周波数信号に変換して量子化し、符号化して多重化することにより得られたものである。
復号装置10のDEMUX11(取得手段)は、符号化データを取得し、その符号化データに対して逆多重化を行う。これにより、DEMUX11は、量子化され、符号化されたLFE信号の周波数信号、量子化され、符号化された通常の音声信号の周波数信号などを抽出し、復号化器12に供給する。また、DEMUX11は、符号化データにLFE信号の符号化結果が含まれるかどうかを示すLFEフラグを抽出し、コントローラ18と出力器17に供給する。
復号化器12は、DEMUX11から供給される、量子化され、符号化されたLFE信号の周波数信号を復号し、その結果得られる量子化されたLFE信号の周波数信号を逆量子化器13に供給する。また、復号化器12は、DEMUX11から供給される、量子化され、符号化された通常の音声信号の周波数信号を復号し、その結果得られる量子化された通常の音声信号の周波数信号を逆量子化器13に供給する。
逆量子化器13は、復号化器12から供給される量子化されたLFE信号の周波数信号を逆量子化し、その結果得られるLFE信号の周波数信号をスイッチ14に供給する。また、逆量子化器13は、復号化器12から供給される量子化された通常の音声信号の周波数信号を逆量子化し、その結果得られる通常の音声信号の周波数信号をスイッチ14に供給する。
スイッチ14(選択手段)は、コントローラ18から供給される指示に基づいて、逆量子化器13から供給される周波数信号のうちの通常の音声信号の周波数信号を選択し、F/T変換器15に供給する。また、スイッチ14は、コントローラ18から供給される指示に基づいて、逆量子化器13から供給される周波数信号のうちのLFE信号の周波数信号を選択し、F/T変換器16に供給する。
F/T変換器15(高速逆直交変換手段)は、スイッチ14から供給される通常の音声信号の周波数信号に対して高速IMDCTを行い、時間信号である通常の音声信号を得て出力器17に供給する。なお、高速IMDCTとは、IMDCTのDCT-4型において高速演算法を用いる変換である。
F/T変換器16(直接逆直交変換手段)は、スイッチ14から供給されるLFE信号の周波数信号に対して直接IMDCTを行い、時間信号であるLFE信号を得て出力器17に供給する。なお、直接IMDCTとは、IMDCTのDCT-4型において、高速演算法を用いずに、直接行列演算を行う変換である。なお、高速IMDCTと直接IMDCTの変換性能に有意な差はない。
出力器17(出力手段)は、コントローラ18の制御により、ゼロ信号を生成し、LFE信号として出力するか、または、F/T変換器16から供給されるLFE信号を出力する。また、出力器17は、F/T変換器15から供給される通常の音声信号を出力する。
コントローラ18は、復号対象に基づいて、スイッチ14にF/T変換器15またはF/T変換器16のいずれか一方の選択を指示する。また、コントローラ18は、DEMUX11から供給されるLFEフラグに基づいて、出力器17の出力を制御する。
[符号化データの構成例]
図2は、図1の復号装置10に送信されてくる符号化データの構成例を示す図である。
図2は、図1の復号装置10に送信されてくる符号化データの構成例を示す図である。
図2に示すように、符号化データには、先頭から、ヘッダ、フロントLR(F-L,R)、センター(CENTER)、LFEフラグ(LFE Flag)、LFE、リアLR(R-L,R)の順に、データが配置されている。
フロントLRは、前方左右用の2チャンネルの通常の音声信号の符号化結果であり、その2チャンネルの符号化結果が1つのオーディオブロックとして配置される。センターは、中央用の1チャンネルの通常の音声信号の符号化結果であり、その1チャンネルの符号化結果は1つのオーディオブロックとして配置される。
LFEフラグは、符号化データにLFEが含まれる場合1となり、LFEが含まれない場合0となる。LFEは、LFE信号の符号化結果であり、その符号化結果は、必要に応じてオーディオブロックとして配置される。リアLRは、後方左右用の2チャンネルの通常の音声信号の符号化結果であり、その2チャンネルの符号化結果が1つのオーディオブロックとして配置される。
なお、オーディオブロックには、そのオーディオブロックを構成する信号の種類ごとに異なるブロックIDが付加されている。即ち、フロントLR、センター、LFE、およびリアLRのオーディオブロックのそれぞれには、異なるブロックIDが付加されている。ここでは、フロントLR、センター、LFE、およびリアLRのオーディオブロックのそれぞれに、ブロックID「1」、「2」、「3」、「4」が付加されているものとする。
[高速IMDCTと直接IMDCTの演算量の説明]
図3は、図1のF/T変換器15による高速IMDCTのDCT-4型の演算量を示す図であり、図4は、図1のF/T変換器16による直接IMDCTのDCT-4型の演算量を示す図である。
図3は、図1のF/T変換器15による高速IMDCTのDCT-4型の演算量を示す図であり、図4は、図1のF/T変換器16による直接IMDCTのDCT-4型の演算量を示す図である。
まず、IMDCTのDCT-4型について説明する。
IMDCTとは、タップ数を分割数の2倍とすることによりブロックを重複しながら行う変換であり、ブロック間の歪を軽減できる変換である。そして、IMDCTのDCT-4型では、以下の式(1)に示すように、入力信号となる周波数信号に対して乗算が行われる。
なお、式(1)において、Nは、入力信号である周波数信号の帯域分割数を表し、Xnは、n番目の分割帯域のスペクトルを表す。また、CN 4はDCT-4型の変換行列を表し、ynはn番目の分割帯域のスペクトルの変換後の信号を表す。
そして、F/T変換器15による通常の音声信号に対する高速IMDCTでは、このようなDCT-4型の演算方法として、高速演算法が用いられる。この高速演算法としては、いくつか考えられているが、その1つとして、Wangのアルゴリズムがある。Wangのアルゴリズムは、DCT行列をスパース行列と呼ばれる零要素数の多い行列に分解することにより演算の高速化を実現している。Wangのアルゴリズムが用いられた場合、DCT-4型の演算量は、図3に示すようになる。
具体的には、図3に示すように、DCT-4型における乗算回数は、N(log2N+1)であり、加算回数は、N(3log2N-1)/2である。また、図示せぬ内蔵するメモリからスペクトルXnを読み出す回数である読み出し回数は、Nlog2Nであり、図示せぬ内蔵するメモリに演算途中結果を退避する回数である退避回数は、Nlog2Nである。
従って、例えばNが256(log2N=8)である場合、乗算回数は2304回になり、加算回数は2944回になり、読み出し回数および退避回数は2048回になる。
一方、LEF信号は、一般的に、0乃至120Hz程度の超低周波の信号である。従って、以下の式(2)に示すように、有効な帯域のスペクトルXnの本数、即ち有効な分割帯域数は、M(M<N)となり、残りのM-N個の分割帯域のスペクトルXnは0となる。
X=[X1,X2,・・・XM,0,・・・,0]T
・・・(2)
・・・(2)
例えば、通常の音声信号の周波数が48kHzである場合、通常の音声信号の使用可能な帯域は24kHz分であるため、帯域分割数が256であるとすると、120HzのLFE信号は、1.28本(=120×256/24000)のスペクトルとなり、MはNに比べて十分小さい値となる。
そこで、F/T変換器15によるLEF信号に対する直接IMDCTでは、DCT-4型の演算方法として高速演算法が用いられず、以下の式(3)を用いて直接行列演算が行われる。
なお、式(3)において、C11乃至CNNは、変換行列CN 4の各要素、即ち変換係数を表している。
式(3)によれば、M+1番目以降の分割帯域のスペクトルXM+1乃至XNはすべて0であるので、このスペクトルXM+1乃至XNに対する計算は行う必要がない。従って、LEF信号に対する直接IMDCTのDCT-4型の演算量は、図4に示すようになる。
具体的には、図4に示すように、DCT−4型における乗算回数、加算回数、および読み出し回数は、N×Mであり、退避回数は、Nである。
図5は、帯域分割数が256である場合の高速IMDCTにおけるDCT−4型の演算回数と、直接IMDCTにおけるDCT−4型の演算回数を示すグラフである。
なお、図5において、演算回数とは、乗算回数、加算回数、読み出し回数、および退避回数を加算した結果得られる回数である。また、図5のグラフにおいて、横軸は、DCT−4型の行列演算における有効な要素数、即ち有効なスペクトルXnの本数Mを表し、縦軸は、演算回数を表している。さらに、図5のグラフにおいて、実線は高速IMDCTにおけるDCT−4型の演算回数を表し、点線は直接IMDCTにおけるDCT−4型の演算回数を表している。
図5に示すグラフにより、Mが11以下であれば、直接IMDCTにおけるDCT−4型の演算回数は、高速IMDCTにおけるDCT−4型の演算回数を下回ることがわかる。即ち、Mが11以下であれば、周波数信号に対して高速IMDCTを行うよりも、直接IMDCTを行う方が演算量は少なくて済む。
以上のように、Mが十分小さい場合、周波数信号に対して高速IMDCTを行うよりも、直接IMDCTを行う方が演算量は少なくて済む。従って、復号装置10では、F/T変換器15が通常の音声信号に対して高速IMDCTを行い、F/T変換器16が、Mが十分小さいLEF信号に対して直接IMDCTを行う。これにより、周波数時間変換の演算量を削減し、消費電力を削減することができる。
[復号装置の処理の説明]
図6は、図1の復号装置10による復号処理を説明するフローチャートである。この復号処理は、例えば、符号化データが復号装置10に入力されたとき開始される。
図6は、図1の復号装置10による復号処理を説明するフローチャートである。この復号処理は、例えば、符号化データが復号装置10に入力されたとき開始される。
ステップS11において、コントローラ18は、符号化データのうち、処理の対象とするオーディオブロックのブロックIDである対象ブロックID iblkを0に設定する。
ステップS12において、DEMUX11は、対象ブロックID iblkが、LFEのブロックID iblk_lfeであるかどうか、即ち2であるかどうかを判定する。ステップS12で対象ブロックID iblkが、LFEのブロックID iblk_lfeではないと判定された場合、処理はステップS14に進む。
一方、ステップS12で対象ブロックID iblkが、LFEのブロックID iblk_lfeであると判定された場合、ステップS13において、コントローラ18は、DEMUX11から供給されるLFEフラグが1であるかどうかを判定する。このLEFフラグは、DEMUX11が符号化データを逆多重化することにより得られたものである。
ステップS13でLFEフラグが1であると判定された場合、即ち符号化データにLFEの符号化結果が含まれる場合、コントローラ18は、F/T変換器16からの時間信号の出力を出力器17に指示し、処理をステップS14に進める。
ステップS14において、DEMUX11は、符号化データに対して逆多重化を行い、対象ブロックID iblkのオーディオブロックを抽出し、復号化器12に供給する。
ステップS15において、復号化器12は、DEMUX11から供給されるオーディオブロックを復号し、その結果得られる量子化された周波数信号を逆量子化器13に供給する。
ステップS16において、逆量子化器13は、復号化器12から供給される量子化された周波数信号を逆量子化し、その結果得られる周波数信号をスイッチ14に供給する。
ステップS17において、コントローラ18は、対象ブロックID iblkが、LFEのブロックID iblk_lfeであるかどうかを判定する。ステップS17で対象ブロックID iblkが、LFEのブロックID iblk_lfeではないと判定された場合、コントローラ18は、F/T変換部15の選択をスイッチ14に指示する。スイッチ14は、この指示に応じて、逆量子化器13から供給される周波数信号、即ちフロントLR、センター、またはリアLRに対応する周波数信号を、F/T変換器15に供給する。
そして、ステップS18において、F/T変換器15は、スイッチ14から供給される周波数信号に対して高速IMDCTを行い、その結果得られる時間信号を、出力器17を介して出力する。そして、処理はステップS21に進む。
一方、ステップS17で対象ブロックID iblkが、LFEのブロックID iblk_lfeであると判定された場合、コントローラ18は、F/T変換部16の選択をスイッチ14に指示する。スイッチ14は、この指示に応じて、逆量子化器13から供給される周波数信号、即ちLFE信号の周波数信号を、F/T変換器16に供給する。
そして、ステップS19において、F/T変換器16は、スイッチ14から供給されるLFEの周波数信号に対して直接IMDCTを行い、その結果得られる時間信号を、出力器17を介して出力する。そして、処理はステップS21に進む。
一方、ステップS13でLFEフラグが1ではないと判定された場合、即ち符号化データにLFEのオーディオブロックが含まれていない場合、コントローラ18は、ゼロ信号の出力を出力器17に指示し、処理をステップS20に進める。
ステップS20において、出力器17は、コントローラ18からの指示にしたがってゼロ信号を生成し、LFE信号として出力する。そして処理はステップS21に進む。
ステップS21において、DEMUX11は、対象ブロックID iblkを1だけインクリメントし、処理をステップS22に進める。
ステップS22において、DEMUX11は、対象ブロックID iblkに対してオーディオブロックの種類の総数nblks、即ち4であるかどうかを判定する。ステップS22で対象ブロックID iblkが総数nblksではないと判定された場合、処理はステップS12に戻り、対象ブロックID iblkが総数nblksになるまで、ステップS12乃至S22の処理が繰り返される。
また、ステップS22で対象ブロックID iblkが総数nblksであると判定された場合、即ち全てのオーディオブロックが処理の対象とされた場合、処理は終了する。
<第2実施の形態>
[復号装置の第2実施の構成例]
図7は、本発明を適用した復号装置の第2実施の形態の構成例を示すブロック図である。
[復号装置の第2実施の構成例]
図7は、本発明を適用した復号装置の第2実施の形態の構成例を示すブロック図である。
図7に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図7の復号装置30の構成は、主に、DEMUX11、コントローラ18の代わりにDEMUX31、コントローラ32が設けられている点、および、出力器17が設けられていない点が図1の構成と異なる。復号装置30は、LFEフラグを含まず、LFEの符号化結果を常に含む符号化データを復号する。
具体的には、復号装置30において、DEMUX31は、符号化データを取得し、その符号化データに対して逆多重化を行う。これにより、DEMUX31は、量子化され、符号化された通常の音声信号の周波数信号であるフロントLR、センター、およびリアLRのオーディオブロックを抽出し、復号化器12に供給する。また、DEMUX31は、量子化され、符号化されたLFE信号の周波数信号であるLFEのオーディオブロックを抽出し、復号化器12に供給する。
コントローラ32は、復号対象に基づいて、スイッチ14にF/T変換器15またはF/T変換器16のいずれか一方の選択を指示する。
[符号化データの構成例]
図8は、図7の復号装置30に送信されてくる符号化データの構成例を示す図である。
図8は、図7の復号装置30に送信されてくる符号化データの構成例を示す図である。
図8の符号化データには、先頭から、ヘッダ、フロントLR、センター、LFE、リアLRの順に、データが配置されている。図8の符号化データには、図2の符号化データと異なり、LFEのオーディオブロックが必ず配置される。従って、図8の符号化データには、LFEフラグは配置されない。
[復号装置の処理の説明]
図9は、図7の復号装置30による復号処理を説明するフローチャートである。この復号処理は、例えば、符号化データが復号装置30に入力されたとき開始される。
図9は、図7の復号装置30による復号処理を説明するフローチャートである。この復号処理は、例えば、符号化データが復号装置30に入力されたとき開始される。
図9の復号処理は、図6の復号処理においてステップS12,13、およびS20の処理を除いた処理である。即ち、図9のステップS31乃至S39の処理は、図6のステップS11,S14乃至S19,S21、およびS22の処理と同様である。従って、説明は省略する。
なお、第1および第2実施の形態では、復号対象のブロックIDに基づいて、スイッチ14の供給先が変更されたが、符号化データ内の各オーディオブロックの配置順序に基づいて、スイッチ14の供給先が変更されるようにしてもよい。この場合、LFEが存在し、符号化データの先頭から3番目のオーディオブロックが復号対象とされるときに、F/T変換器16が供給先として選択され、それ以外のオーディオブロックが復号対象とされるときに、F/T変換器15が供給先として選択される。
<第3実施の形態>
[復号装置の第3実施の構成例]
図10は、本発明を適用した復号装置の第3実施の形態の構成例を示すブロック図である。
[復号装置の第3実施の構成例]
図10は、本発明を適用した復号装置の第3実施の形態の構成例を示すブロック図である。
図10の復号装置50は、DEMUX51、復号化器52、逆量子化器53、スイッチ54、F/T変換器55、F/T変換器56、およびメモリ57により構成される。復号装置50は、本来の音声信号の符号化結果である実データと、実データに伝送路等によるエラーが発生したときに本来の音声信号の代わりに用いられるコンシールメント信号の符号化結果である隠蔽データ(Concealment Data)とを含む符号化データを復号する。なお、コンシールメント信号としては、本来の音声信号に比べて狭帯域の信号が用いられる。
復号装置50において、DEMUX51は、符号化データを取得し、その符号化データに対して逆多重化を行う。これにより、DEMUX51は、実データと隠蔽データを抽出する。そして、DEMUX51は、逆多重化時にエラーが発生していない場合、実データを復号化器52に供給し、隠蔽データをメモリ57に供給する。また、DEMUX51は、逆多重化時のエラーの発生の有無に応じて、エラーが発生したかどうかを表すエラーフラグを復号化器52に供給する。
復号化器52は、DEMUX51からのエラーフラグが、エラーが発生していないことを表す場合、DEMUX51から供給される実データを復号する。復号化器52は、復号時にエラーが発生していない場合、復号の結果得られる量子化された本来の音声信号の周波数信号を逆量子化器53に供給し、メモリ57に隠蔽データの記録を指示する。
一方、復号化器52は、DEMUX51からのエラーフラグが、エラーが発生したことを表す場合、または、実データの復号時にエラーが発生した場合、メモリ57から隠蔽データを読み出す。そして、復号化器52は、その隠蔽データを復号し、その結果得られる量子化されたコンシールメント信号の周波数信号を逆量子化器53に供給する。また、復号化器52は、復号時のエラーの発生の有無およびDEMUX51から供給されるエラーフラグに基づいて、エラーフラグをスイッチ52に供給する。
逆量子化器53は、復号化器52から供給される量子化された本来の音声信号またはコンシールメント信号の周波数信号を逆量子化し、その結果得られる本来の音声信号またはコンシールメント信号の周波数信号をスイッチ54に供給する。
スイッチ54は、復号化器52からエラーが発生していないことを表すエラーフラグが供給される場合、逆量子化器53から供給される周波数信号をF/T変換器55に供給する。即ち、逆量子化部53から本来の音声信号の周波数信号が供給される場合、その周波数信号はF/T変換部55に供給される。
一方、スイッチ54は、復号化器52からエラーが発生したことを表すエラーフラグが供給される場合、逆量子化器53から供給される周波数信号をF/T変換器56に供給する。即ち、逆量子化部53からコンシールメント信号の周波数信号が供給される場合、その周波数信号はF/T変換部56に供給される。
F/T変換器55は、スイッチ54から供給される本来の音声信号の周波数信号に対して高速IMDCTを行い、時間信号である本来の音声信号を得て出力する。
F/T変換器56は、スイッチ54から供給されるコンシールメント信号の周波数信号に対して直接IMDCTを行い、時間信号であるコンシールメント信号を得て出力する。
メモリ57は、復号化器52からの指示に応じて、DEMUX51から供給される隠蔽データを記録する。
[符号化データの構成例]
図11は、図10の復号装置50に送信されてくる符号化データの構成例を示す図である。
図11は、図10の復号装置50に送信されてくる符号化データの構成例を示す図である。
図11の符号化データには、先頭から、ヘッダ、実データ、隠蔽データの順にデータがフレーム単位で配置されている。各フレームの隠蔽データは、例えば、そのフレームの実データの狭帯域の周波数信号の符号化結果である。なお、同一の符号化データに含まれる実データと隠蔽データは、対応するフレームが異なっている。具体的には、あるフレームの符号化データには、そのフレームの実データと、そのフレームより1フレーム後の隠蔽データが含まれる。
[隠蔽データの利用方法の説明]
図12は、隠蔽データの利用方法について説明する図である。
図12は、隠蔽データの利用方法について説明する図である。
図12に示すように、n-1フレーム目の符号化データである符号化データ[n-1]には、n-1フレーム目の実データである実データ[n-1]と、nフレーム目の隠蔽データである隠蔽データ[n]が含まれている。
また、同様に、nフレーム目の符号化データである符号化データ[n]には、nフレーム目の実データである実データ[n]と、n+1フレーム目の隠蔽データである隠蔽データ[n+1]が含まれている。n+1フレーム目の符号化データである符号化データ[n+1]には、n+1フレーム目の実データである実データ[n+1]と、n+2フレーム目の隠蔽データである隠蔽データ[n+2]が含まれている。
ここで、n-1フレーム目の符号化データに対してエラーが発生しておらず、nフレーム目の符号化データに対してエラーが発生している場合、復号化器52は、その符号化データより1フレーム前のn-1フレーム目の符号化データに含まれる隠蔽データ[n]を、実データ[n]の代わりに復号する。その結果、実データの消失や破損を隠蔽し、音途切れを防止することができる。
また、同一の符号化データ内に、異なるフレームの実データと隠蔽データが含まれるので、同一のフレームの実データと隠蔽データを同時に消失することを防止することができる。
[復号装置の処理の説明]
図13は、図10の復号装置50による復号処理を説明するフローチャートである。この復号処理は、例えば、符号化データが復号装置50に入力されたとき開始される。
図13は、図10の復号装置50による復号処理を説明するフローチャートである。この復号処理は、例えば、符号化データが復号装置50に入力されたとき開始される。
ステップS51において、DEMUX51は、符号化データを逆多重化する。これにより、DEMUX51は、実データと隠蔽データを抽出する。
ステップS52において、DEMUX51は、逆多重化時にエラーが発生したかどうかを判定する。ステップS52で逆多重化時にエラーが発生していないと判定された場合、ステップS53において、復号化器52は、DEMUX51から供給される実データを復号する。
ステップS54において、復号化器52は、復号時にエラーが発生したかどうかを判定する。ステップS54で復号時にエラーが発生していないと判定された場合、復号化器52は、メモリ57に隠蔽データの記録を指示する。
ステップS55において、メモリ57は、復号化器52からの指示に応じて、DEMUX51から供給される隠蔽データを記録する。
ステップS56において、復号化器52は、エラーフラグ(errFlag)をエラーが発生していないことを表す0に設定し、そのエラーフラグをスイッチ54に供給する。そして、処理はステップS61に進む。
一方、ステップS52で逆多重化時にエラーが発生したと判定された場合、ステップS57において、DEMUX51は、エラーフラグをエラーが発生したことを表す1に設定し、復号化器52に供給する。そして、処理はステップS58に進む。
また、ステップS54で復号時にエラーが発生したと判定された場合、処理はステップS58に進む。
ステップS58において、復号化器52は、メモリ57から隠蔽データを読み出す。ステップS59において、復号化器52は、メモリ57から読み出された隠蔽データを復号し、量子化されたコンシールメント信号の周波数信号を逆量子化器53に供給する。
ステップS60において、復号化器52は、エラーフラグを1に設定し、スイッチ54に供給する。そして、処理はステップS61に進む。
ステップS61において、逆量子化器53は、復号化器52から供給される量子化された本来の音声信号またはコンシールメント信号の周波数信号を逆量子化し、その結果得られる本来の音声信号またはコンシールメント信号の周波数信号をスイッチ54に供給する。
ステップS62において、スイッチ54は、復号化器52から供給されるエラーフラグが1であるかどうかを判定する。ステップS62でエラーフラグが1ではないと判定された場合、即ちエラーフラグが0である場合、スイッチ54は、逆量子化器53から供給される周波数信号である本来の音声信号の周波数信号をF/T変換器55に供給し、処理をステップS63に進める。
ステップS63において、F/T変換器55は、スイッチ54から供給される本来の音声信号の周波数信号に対して高速IMDCTを行い、その結果得られる時間信号を出力し、処理を終了する。
一方、ステップS62でエラーフラグが1であると判定された場合、即ちDMMUX51および復号化器52の少なくとも一方でエラーが発生した場合、スイッチ54は、逆量子化器53から供給される周波数信号であるコンシールメント信号の周波数信号をF/T変換器56に供給する。
そして、ステップS64において、F/T変換器56は、スイッチ54から供給される今シールメント信号の周波数信号に対して直接IMDCTを行い、その結果得られる時間信号を出力し、処理を終了する。
<第4実施の形態>
[本発明を適用したコンピュータの説明]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
[本発明を適用したコンピュータの説明]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図14は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部208やROM(Read Only Memory)202に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブルメディア211に格納(記録)しておくことができる。このようなリムーバブルメディア211は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア211としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブルメディア211からドライブ210を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部208にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)201を内蔵しており、CPU201には、バス204を介して、入出力インタフェース205が接続されている。
CPU201は、入出力インタフェース205を介して、ユーザによって、入力部206が操作等されることにより指令が入力されると、それに従って、ROM202に格納されているプログラムを実行する。あるいは、CPU201は、記憶部208に格納されたプログラムを、RAM(Random Access Memory)203にロードして実行する。
これにより、CPU201は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU201は、その処理結果を、必要に応じて、例えば、入出力インタフェース205を介して、出力部207から出力、あるいは、通信部209から送信、さらには、記憶部208に記録等させる。
なお、入力部206は、キーボードや、マウス、マイク等で構成される。また、出力部207は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
なお、本発明は、周波数時間変換としてIMDCTを行う復号装置だけでなく、IFFT,IDCTなどの他の逆直交変換を行う復号装置にも適用することができる。
また、本発明は、音声信号以外の信号の符号化データを復号する復号装置にも適用することができる。
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
10 復号装置, 11 DEMUX, 14 スイッチ, 15,16 F/T変換器, 17 出力器, 30 復号装置, 31 DEMUX, 50 復号装置, 51 DEMUX, 54 スイッチ, 55,56 F/T変換器
Claims (11)
- 狭帯域信号と広帯域信号を含む第1の周波数信号を取得する取得手段と、
前記第1の周波数信号のうちの前記狭帯域信号に対して直接行列演算を行うことにより逆直交変換を行う直接逆直交変換手段と、
前記第1の周波数信号のうちの前記広帯域信号に対して高速演算法を用いた逆直交変換を行う高速逆直交変換手段と
を備える復号装置。 - 前記第1の周波数信号のうちの前記狭帯域信号を選択して前記直接逆直交変換手段に供給し、前記広帯域信号を選択して前記高速逆直交変換手段に供給する選択手段
をさらに備え、
前記狭帯域信号には、前記狭帯域信号であることを表す情報が付加され、前記広帯域信号には、前記広帯域信号であることを表す情報が付加され、
前記選択手段は、前記情報に基づいて、前記狭帯域信号および前記広帯域信号を選択する
請求項1に記載の復号装置。 - 前記第1の周波数信号のうちの前記狭帯域信号を選択して前記直接逆直交変換手段に供給し、前記広帯域信号を選択して前記高速逆直交変換手段に供給する選択手段
をさらに備え、
前記第1の周波数信号において、前記狭帯域信号と前記広帯域信号は所定の順番で配置され、
前記選択手段は、前記周波数信号内の順番に基づいて、前記狭帯域信号および前記広帯域信号を選択する
請求項1に記載の復号装置。 - ゼロ信号を生成して出力する出力手段
をさらに備え、
前記取得手段は、さらに、前記狭帯域信号を含まず、前記広帯域信号を含む第2の周波数信号を取得し、
前記出力手段は、前記第2の周波数信号の狭帯域信号の逆直交変換結果として前記ゼロ信号を出力する
請求項1に記載の復号装置。 - 前記第1の周波数信号には、前記狭帯域信号が含まれていることを表す情報が付加され、
前記第2の周波数信号には、前記狭帯域信号が含まれていないことを表す情報が付加され、
前記出力手段は、前記情報に基づいて、前記第2の周波数信号の狭帯域信号の逆直交変換結果として前記ゼロ信号を出力する
請求項4に記載の復号装置。 - 前記狭帯域信号は、LFE(Low Frequency Effect)信号であり、
前記広帯域信号は、広帯域の音声信号である
請求項1に記載の復号装置。 - 前記狭帯域信号は、前記広帯域信号にエラーが発生したときに前記広帯域信号の代わりに用いられるコンシールメント信号である
請求項1に記載の復号装置。 - 前記直接逆直交変換手段は、前記広帯域信号にエラーが発生したとき、前記狭帯域信号に対して前記直接行列演算を行うことにより逆直交変換を行い、その結果得られる時間信号を前記広帯域信号の時間信号として出力し、
前記高速逆直交変換手段は、前記広帯域信号にエラーが発生していないとき、前記広帯域信号に対して前記高速演算法を用いた逆直交変換を行い、出力する
請求項7に記載の復号装置。 - 前記直接逆直交変換手段による逆直交変換は、前記狭帯域信号の有効な帯域のスペクトルと所定の係数の積和演算を含む
請求項1に記載の復号装置。 - 復号装置が、
狭帯域信号と広帯域信号を含む周波数信号のうちの前記狭帯域信号に対して直接行列演算を行うことにより逆直交変換を行う直接逆直交変換ステップと、
前記周波数信号のうちの前記広帯域信号に対して高速演算法を用いた逆直交変換を行う高速逆直交変換ステップと
を備える復号方法。 - コンピュータに、
狭帯域信号と広帯域信号を含む周波数信号のうちの前記狭帯域信号に対して直接行列演算を行うことにより逆直交変換を行う直接逆直交変換ステップと、
前記周波数信号のうちの前記広帯域信号に対して高速演算法を用いた逆直交変換を行う高速逆直交変換ステップと
を含む処理を実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010173943A JP2012032713A (ja) | 2010-08-02 | 2010-08-02 | 復号装置、復号方法、およびプログラム |
CN201110212577.5A CN102404075B (zh) | 2010-08-02 | 2011-07-26 | 解码装置和解码方法 |
US13/191,216 US8976642B2 (en) | 2010-08-02 | 2011-07-26 | Decoding device, decoding method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010173943A JP2012032713A (ja) | 2010-08-02 | 2010-08-02 | 復号装置、復号方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012032713A true JP2012032713A (ja) | 2012-02-16 |
Family
ID=45526615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010173943A Withdrawn JP2012032713A (ja) | 2010-08-02 | 2010-08-02 | 復号装置、復号方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8976642B2 (ja) |
JP (1) | JP2012032713A (ja) |
CN (1) | CN102404075B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10892772B2 (en) * | 2018-08-17 | 2021-01-12 | Invensense, Inc. | Low power always-on microphone using power reduction techniques |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5608713A (en) * | 1994-02-09 | 1997-03-04 | Sony Corporation | Bit allocation of digital audio signal blocks by non-linear processing |
EP0798866A2 (en) * | 1996-03-27 | 1997-10-01 | Kabushiki Kaisha Toshiba | Digital data processing system |
US6539050B1 (en) * | 1997-06-26 | 2003-03-25 | Hughes Electronics Corporation | Method for transmitting wideband signals via a communication system adapted for narrow-band signal transmission |
KR100935961B1 (ko) * | 2001-11-14 | 2010-01-08 | 파나소닉 주식회사 | 부호화 장치 및 복호화 장치 |
US7889783B2 (en) * | 2002-12-06 | 2011-02-15 | Broadcom Corporation | Multiple data rate communication system |
CN101010730B (zh) * | 2004-09-06 | 2011-07-27 | 松下电器产业株式会社 | 可扩展解码装置以及信号丢失补偿方法 |
KR100760976B1 (ko) * | 2005-08-01 | 2007-09-21 | (주)펄서스 테크놀러지 | 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법 |
JP2008258992A (ja) | 2007-04-05 | 2008-10-23 | Sony Corp | 無線通信装置 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN101588341B (zh) * | 2008-05-22 | 2012-07-04 | 华为技术有限公司 | 一种丢帧隐藏的方法及装置 |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
-
2010
- 2010-08-02 JP JP2010173943A patent/JP2012032713A/ja not_active Withdrawn
-
2011
- 2011-07-26 CN CN201110212577.5A patent/CN102404075B/zh not_active Expired - Fee Related
- 2011-07-26 US US13/191,216 patent/US8976642B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102404075A (zh) | 2012-04-04 |
US20120026861A1 (en) | 2012-02-02 |
CN102404075B (zh) | 2016-08-03 |
US8976642B2 (en) | 2015-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210398546A1 (en) | Encoding device and encoding method, decoding device and decoding method, and program | |
JP2021107938A (ja) | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 | |
TWI657434B (zh) | 解碼壓縮高階保真立體音響表示之方法及裝置,及編碼壓縮高階保真立體音響表示之方法及裝置 | |
RU2607230C2 (ru) | Адаптация взвешивающих окон анализа или синтеза для кодирования или декодирования путем преобразования | |
WO2003096325A1 (en) | Coding method, coding device, decoding method, and decoding device | |
JP4031909B2 (ja) | 時間領域エイリアシングを効率的に除去する装置及び方法 | |
US9646615B2 (en) | Audio signal encoding employing interchannel and temporal redundancy reduction | |
TW201606751A (zh) | 將高階保真立體音響信號表示之次頻帶內主導方向信號之方向編碼/解碼之方法及裝置 | |
JP5299327B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
RU2769789C2 (ru) | Способ и устройство кодирования параметра межканальной разности фаз | |
EP3507800B1 (en) | Transform-based audio codec and method with subband energy smoothing | |
KR20070090217A (ko) | 스케일러블 부호화 장치 및 스케일러블 부호화 방법 | |
JPWO2020080099A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP2007187749A (ja) | マルチチャンネル符号化における頭部伝達関数をサポートするための新装置 | |
JP2012032713A (ja) | 復号装置、復号方法、およびプログラム | |
JP6094322B2 (ja) | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 | |
JP4649351B2 (ja) | デジタルデータ復号化装置 | |
JP5483813B2 (ja) | マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 | |
JP2022505789A (ja) | サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化 | |
JP5724338B2 (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
JP2005114813A (ja) | オーディオ信号再生装置及び再生方法 | |
JP2011253045A (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
KR20140037118A (ko) | 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기 | |
JP2000250598A (ja) | 音声データ復号化装置、音声データ復号化方法及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20131105 |