JP4539180B2 - 音響復号装置及び音響復号方法 - Google Patents

音響復号装置及び音響復号方法 Download PDF

Info

Publication number
JP4539180B2
JP4539180B2 JP2004168784A JP2004168784A JP4539180B2 JP 4539180 B2 JP4539180 B2 JP 4539180B2 JP 2004168784 A JP2004168784 A JP 2004168784A JP 2004168784 A JP2004168784 A JP 2004168784A JP 4539180 B2 JP4539180 B2 JP 4539180B2
Authority
JP
Japan
Prior art keywords
error
frequency data
frequency
data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004168784A
Other languages
English (en)
Other versions
JP2005345993A (ja
Inventor
茂夫 杉森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2004168784A priority Critical patent/JP4539180B2/ja
Publication of JP2005345993A publication Critical patent/JP2005345993A/ja
Application granted granted Critical
Publication of JP4539180B2 publication Critical patent/JP4539180B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、符号化されたオーディオデータを復号する音響復号装置及び音響復号方法に関する。
オーディオデータを効率的に蓄積したり伝達したりするために、様々な符号化(圧縮)技術が開発されている。このオーディオデータを高能率・高音質で圧縮する代表的な手法として、オーディオデータをサブバンド符号化やMDCT(Modified Discrete Cosine Transform: 変形離散コサイン変換)によって周波数帯域に変換し、また人間の聴覚モデルを利用して人間の耳に聞こえない情報を削減し、さらにハフマン符号化等によって情報の冗長度を減らすことにより、データサイズを減らす方法がある。その代表例として、MPEG(Moving Picture Experts Group)によってISO(International Organization for Standardization)・IEC(International Electro for Standardization)標準式となったMPEG1,2,4オーディオ、Dolby社が策定したDolby Digital(商標)、ソニー株式会社が開発したATRAC(商標)等が挙げられる。MPEGオーディオ規格には複数の方式が存在し、MPEG−1及びMPEG−2オーディオレイヤ3は、通称MP3としてパーソナルコンピュータや携帯用オーディオプレーヤに広く使われている。また、MPEG‐2 AACは、ディジタル放送用の圧縮方式として採用されている。また、Dolby Digital(商標)は、DVD(Digital Versatile Disc)用のオーディオ圧縮方式に採用されている。また、ATRAC(商標)は、主にMini Disk(商標)やMemory Stick Walkman(商標)等の携帯用オーディオプレーヤに採用されている。
ここで、ビデオCD(Compact Disc)や組み込み機器の分野で広く使われているMPEG−1オーディオレイヤ2方式について説明する。MPEG−1オーディオレイヤ2方式の符号化ストリームにおける1フレームには、大きく分けて、フレームの先頭を示す情報を含むヘッダと、各周波数帯域にどれだけの情報を割り当てるかについての情報を含むビットアロケーション情報と、周波数データを正規化したときのスケールファクタをどのサブバンドに使用したかについての情報が含まれているスケールファクタ選択情報と、周波数データを正規化したときの乗算係数のインデックス値が記述されているスケールファクタと、圧縮された音響情報が周波数のインデックス値として記述されているサンプルデータと、アンシラリデータとが多重化されている。
図9は、従来の音響復号装置101を示すブロック図である。音響復号装置101は、符号化ストリームを蓄えるフレームバッファ102と、蓄えられた符号化ストリームから各データを分離するデータ分離部103と、分離されたヘッダを分析するヘッダ分析部104と、分離されたビットアロケーション情報、スケールファクタ選択情報及びスケールファクタを復号するサイド情報復号部105と、サンプルデータを復号し、ビットアロケーション情報を用いて逆量子化するサンプル逆量子化部106と、スケールファクタを用いて周波数データを算出するサンプル逆正規化部107と、複数帯域の周波数データからオーディオデータを合成する帯域合成部108とを備えている。
次に、音響復号装置101の動作について説明する。音響復号装置101に入力された符号化ストリームは、フレームバッファ102に保持される。データ分離部103は、フレームバッファ102に保持された符号化ストリームに対し、その符号化ストリーム中に多重化されている各データを分離する。MPEG‐1 オーディオレイヤ2方式の符号化ストリームの1フレームには、上述した各データが規定された固定ビット長、且つ規定された順序で含まれているため、データ分離部103は、符号化ストリームの先頭から順次規定ビットずつ取り出すことにより、各データを分離する。
データ分離部103によって分離されたヘッダは、ヘッダ分析部104で分析され、データの先頭を意味するシンクワード及びチャネル数と圧縮モードを示すモードの情報が抽出される。ここで、ヘッダ中にCRC情報が含まれている場合には、ヘッダ分析部104は、ヘッダ、ビットアロケーション情報及びスケールファクタ選択情報から計算されたCRCデータと、符号化時に予めフレーム中に付加されたCRCデータとを比較して巡回冗長検査を行う。
巡回冗長検査でエラーが検出された場合には、そのフレーム全体は、復号不可能であるためエラーフレームと判断される。そして、このエラーフレームは、例えば、ミュート処理されたり、正常な前フレームで補間されたりする。
エラーが検出されなかった場合、サイド情報復号部105は、データ分離部103によって分離されたビットアロケーション情報、スケールファクタ選択情報及びスケールファクタを復号する。
データ分離部103によって分離されたサンプルデータは、サンプル逆量子化部106で復号され、復号されたサンプルデータは、サイド情報復号部105によって復号されたビットアロケーション情報を用いて逆量子化される。
サンプル逆量子化部106で逆量子化されたサンプルデータは、サンプル逆正規化部107で、サイド情報復号部105によって復号されたスケールファクタが乗算され、周波数データに変換される。周波数データに変換された段階でのMPEG−1 オーディオレイヤ2方式のデータは、3つのサブフレームからなる32帯域のサブバンドデータ(周波数データ)が、時間軸方向に12グループ続く構成となっている。
帯域合成部108は、サンプル逆正規化部107で変換された周波数データをサブバンド合成や逆MDCT演算することにより、オーディオデータを合成する。MPEG−1オーディオレイヤ2方式では、32サンプルの周波数データを演算することで、32サンプルのPCM(Pulse Code Modulation)データが出力され、これを3サブフレーム×12グループ回繰り返し、1フレームで1chあたり1152サンプルのPCMデータが出力される。
特開平11−355145号公報 特開平6−349198号公報
しかしながら、上述したようなCRC情報によるエラーの検出では、その検出対象であるヘッダ、ビットアロケーション情報及びスケールファクタ選択情報以外のデータのビット誤りは検出できない。すなわち、スケールファクタやサンプルデータにビット誤りやデータ破壊が発生した場合には、エラーを検出することができず、ノイズが発生してしまう。
特許文献1には、スケールファクタ中のエラーに関し、隣接する部分領域を比較する手法が記述されているが、サンプルデータのエラーに関してはその影響は小さいとして何らの対策も記述されていない。しかし、サンプルデータ内でデータ破壊が起こるとそのデータ部分だけ微小なノイズが発生し、受聴者には耳障りな音として認識される虞がある。しかも、符号化ストリームの大部分はサンプルデータが占めるため、この部分のデータにエラーが発生する可能性はヘッダやビットアロケーション情報部分等よりもかなり高い。
また、特許文献2には、アンシラリデータに誤り訂正信号を挿入する方式が提案されている。しかし、この方式では、符号化装置側に誤り訂正信号を挿入するための追加処理が必要となってしまう。また、この方式を用いた音響復号装置は、訂正信号が挿入されていない符号化ストリームに対して、誤り訂正をすることができない。さらに、誤り訂正信号部分のために余分なビットを使う結果、サンプルデータに割り当てる情報量が減り、音質が損なわれてしまう虞がある。
本発明は、このような従来の実情に鑑みて提案されたものであり、サンプルデータ内で発生するエラーを検出し、エラーを検出した場合には、そのエラーを修正するようにした音響復号装置及び音響復号方法を提供することを目的とする。
そこで、上述した目的を達成するために、本発明に係る音響復号装置は、所定の時間間隔毎に分割されたオーディオデータを複数の周波数帯域の周波数データに分割し、上記複数の周波数帯域の周波数データを各グループが各周波数帯域について時系列順に一定数の周波数データを含むように複数のグループに分割し、符号化して得られた符号化ストリームを復号する音響復号装置において、上記符号化ストリームを復号し、上記複数のグループに分割された周波数データを復元する復元手段と、上記復元手段により復元された2つの周波数データの差分の絶対値としきい値とを比較し、上記差分の絶対値が上記しきい値よりも大きい場合、上記差分をとった2つの周波数データのうち一方をエラーと判断するエラー検出手段と、上記エラーと判断された周波数データを修正する修正手段と、上記複数のグループに分割された周波数データからオーディオデータを合成する合成手段とを有し、上記修正手段は、上記エラー検出手段でエラーと判断された周波数データの周波数帯域に応じて上記エラーと判断された周波数データを修正する修正方式を選択することを特徴としている。
また、本発明に係る音響復号方法は、所定の時間間隔毎に分割されたオーディオデータを複数の周波数帯域の周波数データに分割し、上記複数の周波数帯域の周波数データを各グループが各周波数帯域について時系列順に一定数の周波数データを含むように複数のグループに分割し、符号化して得られた符号化ストリームを復号する音響復号方法において、上記符号化ストリームを復号し、上記複数のグループに分割された周波数データを復元する復元工程と、上記復元工程により復元された2つの周波数データの差分の絶対値としきい値とを比較し、上記差分の絶対値が上記しきい値よりも大きい場合、上記差分をとった2つの周波数データのうち一方をエラーと判断するエラー検出工程と、上記エラーと判断された周波数データを修正する修正工程と、上記複数のグループに分割された周波数データからオーディオデータを合成する合成工程とを有し、上記修正工程は、上記エラー検出工程でエラーと判断された周波数データの周波数帯域に応じて上記エラーと判断された周波数データを修正する修正方式を選択することを特徴としている。
本発明によれば、連続する2つの周波数データの差分の絶対値としきい値とを比較することにより、符号化ストリームに多重化されているサンプルデータのエラーを検出することができる。
また、エラーが検出された場合、その周波数データに応じた修正方法を選択することにより、サンプルデータ中のビット誤りやデータ破壊によって発生するノイズを効果的に抑えることができる。
本発明の具体例として示す音響復号装置及び音響復号方法は、サンプルデータを逆量子化及び逆正規化して周波数データにした段階で、サンプルデータに含まれるエラーを検出し、エラーを検出した場合には修正処理を行うものである。なお、本実施の形態では、MPEG‐1 オーディオレイヤ2方式のオーディオデータを用いて説明するが、これに限定されるものではない。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。図1は、MPEG‐1 オーディオレイヤ2方式の符号化ストリームのフォーマットを示す図である。この符号化ストリームの1フレームは、大きく分けて、ヘッダ、ビットアロケーション情報、スケールファクタ選択情報、スケールファクタ、サンプルデータ及びアンシラリデータに分かれている。以下、各データを説明する。
ヘッダには、データの先頭を意味するシンクワード、レイヤ番号、転送データ量を示すビットレート、チャネル数と圧縮モードを示すモード、サンプリング周波数、CRC(Cyclic Redundancy Check)情報等が含まれている。
このCRC情報が含まれている場合には、符号化時にヘッダ、ビットアロケーション情報、スケールファクタ選択情報から計算されたCRCデータがフレーム中に付加されている。すなわち、CRC情報によるビット誤りの保護対象は、ヘッダ、ビットアロケーション情報、スケールファクタ選択情報である。このCRCデータは、復号時のエラーチェックである巡回冗長検査に用いられる。
なお、CRC情報が含まれてない場合には、復号時にエラーの検出ができないため、符号化ストリームにビット誤りやデータ破壊が発生した場合、1フレーム(48KHzサンプリングの場合は24msec, 32KHzサンプリングの場合には32msec)の間、ノイズが発生することになる。
ビットアロケーション情報には、分離された各周波数帯域にどれだけの情報を割り当てるかについての情報が含まれている。
スケールファクタには、周波数データを正規化したときの乗算係数のインデックス値が記述されている。また、スケールファクタ選択情報には、正規化したときのスケールファクタをどのサブバンドに使用したかについての情報が含まれている。
また、サンプルデータには、符号化されたオーディオデータが周波数帯域のインデックス値として記述されている。
図2は、本実施の形態における音響復号装置1の構成を示すブロック図である。音響復号装置1は、入力された符号化ストリームを保持するフレームバッファ2と、符号化ストリームを各データに分離するデータ分離部3と、分離されたヘッダを分析するヘッダ分析部4と、分離されたビットアロケーション情報、スケールファクタ選択情報及びスケールファクタを復号するサイド情報復号部5と、符号化ストリームから分離されたサンプルデータを復号し、ビットアロケーション情報を用いて逆量子化するサンプル逆量子化部6と、スケールファクタを用いて周波数データを算出するサンプル逆正規化部7と、周波数データのエラーを検出するエラー検出部8と、エラー検出部8においてエラーが検出された場合、周波数データの修正を行うサンプル修正部9と、複数の帯域の周波数データからオーディオデータを合成する帯域合成部10とを備えている。
フレームバッファ2は、入力された符号化ストリームをフレーム単位で保持する。
データ分離部3は、フレームバッファ2に保持された符号化ストリームから、その符号化ストリーム中に多重化されている各データを分離する。図1に示すように、MPEG‐1 オーディオレイヤ2方式の符号化ストリームの1フレームには、ヘッダ、ビットアロケーション情報、スケールファクタ選択情報、スケールファクタ、サンプルデータ及びアンシラリデータが規定された固定ビット長、且つ規定された順序で含まれており、データ分離部3は、フレームバッファ2に保持された符号化ストリームの先頭から順次規定ビットずつ取り出し、各データに分離する。
ヘッダ分析部4は、データ分離部3によって分離されたヘッダ中のシンクワード及びモードを分析する。ここで、ヘッダ中にCRC情報が含まれている場合には、ヘッダ分析部4は、ヘッダ、ビットアロケーション情報及びスケールファクタ選択情報から計算されたCRCデータと、符号化時に予めフレーム中に付加されたCRCデータとを比較して巡回冗長検査を行う。
サイド情報復号部5は、データ分離部3によって分離されたビットアロケーション情報、スケールファクタ選択情報及びスケールファクタを復号する。
サンプル逆量子化部6は、データ分離部3によって分離されたサンプルデータを復号し、そのサンプルデータをサイド情報復号部5によって復号されたビットアロケーション情報を用いて逆量子化する。
サンプル逆正規化部7は、サンプル逆量子化部6で逆量子化されたサンプルデータに、サイド情報復号部5によって復号されたスケールファクタを乗算して周波数データを算出する。周波数データが算出された段階でのMPEG−1オーディオレイヤ2方式のデータは、図3(a)に示すように3つのサブフレームからなる32帯域のサブバンドデータ(周波数データ)が、時間軸方向に12グループ続く構成となっている。この周波数データは、周波数の低い順に、0から31までのサブバンド番号が付されている。以下、周波数データを、サンプル番号k(0〜11)、サブフレーム番号(0〜2)t及びサブバンド番号n(0〜31)を用いて、S [k][t][n]で表すこととする。なお、図3(a)に示されているサブバンド境界値は、オーディオデータの符号化の際に符号化された周波数帯域(サブバンド)と符号化されなかった周波数帯域(サブバンド)との境界を示している。
エラー検出部8は、サンプル逆正規化部7によって算出された周波数データのエラーを検出する。エラーの検出は、周波数データの差分の絶対値としきい値とを比較することにより検出する。例えば、サブバンド番号が連続する2つの周波数データの差分の絶対値(| S [k][t][n+1] ‐ S [k][t][n] |)と予め設定されたしきい値とを比較し、差分の絶対値がしきい値よりも大きい場合、サブバンド番号が連続する周波数データS [k][t][n]とS [k][t][n+1]のうち絶対値が大きい方をエラーと判断する。
サンプル修正部9は、エラー検出部8によってエラーが検出された周波数データを修正する。例えば、サブバンド番号が連続する2つの周波数データの差分の絶対値がしきい値になるようにエラーが検出された周波数データを修正する。
帯域合成部10は、各帯域の周波数データをサブバンド合成や逆MDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)演算することにより、オーディオデータを合成する。MPEG‐1 オーディオレイヤ2方式では、図3(b)に示すように32サンプルの周波数データSを演算することで、32サンプルのPCM(Pulse Code Modulation)データが出力され、これを3サブフレーム×12グループ回繰り返し、1フレームで1chあたり1152サンプルのPCMデータが出力される。
次に、本実施の形態における音響復号装置1のエラー検出部8について詳細に説明する。サブバンド合成前の周波数データは、連続する周波数領域方向と、時間軸方向とで関連性がある。例えば人の声や楽器の音などの通常耳にする音源では、その音が周波数データの1サンプルだけから成ることはなく、周波数領域方向にも、また時間軸方向にも値が広がりを持つことで一連の音色になる。しかし、周波数データの一部分が壊れたりしてノイズが発生する場合には、周波数領域方向や時間軸方向において一瞬だけ大きな変化が発生する。本発明では、周波数帯域での急激な値の変化を調べることでノイズを検出する。
図4は、本発明を適用させたエラー検出部8の構成を示すブロック図である。エラー検出部8は、サブバンド番号が連続する2つの周波数データを周波数しきい値テーブル81に基づいて比較する周波数データ比較部82と、前サンプル記憶部83に記憶されたサンプル番号が1つ小さい周波数データと現周波数データとを時間軸しきい値テーブル84に基づいて比較する時間軸データ比較部85とを備えている。
エラー検出部8は、周波数データ比較部82又は時間軸データ比較部85のどちらか一方でもエラーと判断された周波数データをエラーデータとして検出する。エラー検出部8に入力される周波数データは、例えば、図3(a)に示すMPEG−1オーディオレイヤ2方式のように3つのサブフレームからなる32帯域のサブバンドデータ(周波数データ)が、時間軸方向に12グループ続く構成となっている。ここで、グループは、各グループが各周波数帯域について時系列順に3つの周波数データを含むようにしたものであり、サンプル番号k(0〜11)と対応している。
周波数データ比較部82は、サンプル逆正規化部7によって算出された周波数領域方向に連続する2帯域の周波数データS [k][t][n]とS [k][t][n+1]の差分の絶対値Diff[n]を(1)式に示すように算出する。
Diff[n] = | S [k][t][n+1] S [k][t][n] | (1)
すなわち、上記(1)式により、サンプル番号及びサブフレーム番号は同一で、連続するサブバンド番号の周波数データSの差分が求められる。
そして、周波数データ比較部82は、算出された差分の絶対値Diff[n]と周波数しきい値テーブル81のしきい値f[n]とを比較し、この差分の絶対値Diff[n]がしきい値f[n]よりも大きい場合、周波数データS [k][t][n]とS [k][t][n+1]のうち絶対値が大きい方をエラーデータと判断し、その周波数データのサンプル番号k、サブフレーム番号t及びサブバンド番号nのエラー情報を出力する。また、差分を求めた周波数データS [k][t][n]とS [k][t][n+1]とを時間軸データ比較部85に出力する。
周波数しきい値テーブル81は、例えば、図5に示すようにサブバンド番号nに対応したしきい値f[n]を格納している。通常、低域では周波数データの値の変化量が大きく、高域では周波数データの値の変化量が小さいので、これを考慮して周波数しきい値テーブル81を作成することが好ましい。なお、図5に示すしきい値は、0〜25の26個のサブバンドに対応しているが、これは、図3に示す32個のサブバンドのうち0〜25までの26個のサブバンドを有効サブバンドとした例である。すなわち、図3に示すサブバンド境界値をサブバンド番号25までとした場合のものである。
時間軸データ比較部85は、周波数帯域が同じであって前サンプル記憶部83に記憶された周波数データS [k][t][n]と時間的に次の周波数データS [k+1][t][n]との周波数データSの差分の絶対値Diff_t[n]を(2)式に示すように算出する。
Diff_t[n] = | S [k+1][t][n] S [k][t][n] | (2)
すなわち、上記(2)式により、サブバンド番号及びサブフレーム番号は同一で、連続するサンプル番号を持つ周波数データSにより差分が求められる。
そして、時間軸しきい値テーブル84のしきい値t[n]と比較し、このDiff_t[n]がしきい値t[n]よりも大きい場合、周波数データS [k][t][n]とS [k+1][t][n]のうち絶対値の大きい方をエラーデータと判断し、その周波数データのサンプル番号k、サブフレーム番号t及びサブバンド番号nのエラー情報を出力する。
時間軸しきい値テーブル84は、例えば、図6に示すようにサブバンド番号nに対応したしきい値t[n]を格納している。図5に示す周波数しきい値テーブル81と同様に、通常、低域では周波数データの値の変化量が大きく、高域では周波数データの値の変化量が小さいのでこれを考慮して時間軸しきい値テーブル84を作成することが好ましい。また、図6に示す0〜25の26個のサブバンドに対応している時間軸方向のしきい値は、図5に示す周波数領域方向のしきい値と同様に、図3に示す32個のサブバンドのうち0〜25までの26個のサブバンドを有効サブバンドとした例である。
なお、修正対象となる周波数データは、周波数データ比較部82又は時間軸データ比較部85でエラーと判断された2つの周波数データのうち絶対値の大きい方とすることとしたが、絶対値の小さい方ととしてもよい。
また、エラー検出部8は、周波数データ比較部82又は時間軸データ比較部85のどちらか一方でエラーと判断された場合にエラーを検出したこととしたが、周波数データ比較部82及び時間軸データ比較部85の両方でエラーと判断した場合にエラーを検出したこととしてもよい。
また、エラー検出部8は、周波数領域方向に連続する周波数データの差分の絶対値と、時間軸方向の周波数データの差分の絶対値と、周波数領域方向及び時間軸方向に隣接した周波数データの差分の絶対値とを組み合わせて、予め設定されたしきい値と比較するようにしてもよい。ここで、斜め方向の周波数データの差分の絶対値は、周波数データS [k][t][n]とその斜め方向の周波数データS [k+1][t][n+1]とから算出される。
このように、エラー検出部8は、周波数領域方向や時間軸方向などに連続する周波数データの差分の絶対値を用いて、予め算出されたしきい値と比較することにより、各帯域の周波数データ単位でエラーの検出をすることができる。
次に、本実施の形態における音響復号装置1のサンプル修正部9について説明する。サンプル修正部9は、エラー検出部8によってエラーが検出された周波数データを修正し、サンプルデータのノイズを減少させる処理を行う。
図7は、サンプル修正部9の構成を示すブロック図である。サンプル修正部9は、エラー検出部8から入力されたエラー情報に基づいて周波数データを修正する方法を選択する修正方式選択部91と、修正方式選択部91によって選択された修正方法により周波数データを修正する周波数データ修正部92、93、94とを備えている。
ここでは、先ず、各周波数データ修正部92、93、94において行われる修正方法を説明する。また、周波数データの修正は、周波数データ比較部82でエラーと判断された場合も、時間軸データ比較部85でエラーと判断された場合も、同様な方式によって行われる。以下、周波数領域方向又は時間軸方向に連続する周波数データをそれぞれS[m]及びS[m+1]で表し、|S[m+1]| > |S[m] |とする。すなわち、修正対象はS[m+1]として説明する。
(修正方法1)
周波数データ修正部92は、S[m+1]を(3)式に示すように連続する周波数データの差分の絶対値がしきい値になるように修正する。なお、Th[m]は、周波数しきい値テーブル81に格納されたしきい値f[n]又は時間軸しきい値テーブル84に格納されたしきい値t[n]である。
if(S[m+1]>0) S[m+1] = S[m] + Th[m]
else S[m+1] = S[m]−Th[m] (3)
このように、修正対象ではない周波数データS[m]との差分の絶対値がしきい値Th[m]となるように、修正対象の周波数データS[m+1]を修正することで、周波数データ間の急激な変化をなくすことができ、受聴時に気になるノイズを低減することができる。この方式は、通常時でも周波数データの値の変化量が大きい低域部分で、特に有効である。
(修正方法2)
周波数データ修正部93は、(4)式に示すように絶対値の大きなデータを絶対値の小さなデータで置き換える。
S[m+1] = S[m] (4)
周波数データを絶対値の小さいデータで置き換えて修正することで、両者の差分の絶対値を0にすることができる。これによって受聴時に気になるノイズを抑えることができる。
(修正方法3)
周波数データ修正部94は、(5)式に示すように絶対値の大きなデータを0で置き換える。
S[m+1] = 0 (5)
周波数データを0にすることで、その周波数成分をなくすことになり、これによって受聴時に気になるノイズを抑えることができる。この方式は、周波数データの値が0に近い高域部分で、特に有効である。
次に上記3つの修正方法を選択する修正方式選択部91の動作について説明する。修正方式選択部91は、エラー検出部8から入力されたエラー情報に基づいて修正方法を選択する。
(動作例1)
修正方式選択部91は、次に示すように連続する周波数領域方向又は時間軸方向の周波数データS[m]とS[m+1]のうちエラー検出部8でエラーと判断されてない絶対値が小さいS[m]と予め設定された設定値th_numとの大小関係に応じて、修正方法1、2を切り替える。なお、この設定値th_numは、周波数領域方向又は時間軸方向に応じて異なる値であることが好ましい。
S[m] < th_num なら 修正方法2を使用
th_num ≦S[m] なら 修正方法1を使用
S[m]<th_numの場合は、エラーが検出された周波数データS[m+1]が設定値th_numより小さい周波数データS[m]から急に変化した場合を想定しているので、エラーが検出された周波数データS[m+1]をS[m]で置き換える修正方法2を選択する。なお、周波数データS[m]が0の場合は0で置き換えられる。
また、th_num≦S[m]の場合は、周波数データS[m]が大きなものから変化した場合を想定しているので、周波数データの値の変化量をしきい値に抑える修正方法1を選択する。
(動作例2)
また、動作例2として、修正方式選択部91は、エラー検出部8でエラーと判断された周波数データが属する帯域、すなわちサブバンド番号nに応じて、修正方法1、2、3を切り替える。エラーが検出された周波数データのサブバンド番号は、エラー検出部8から出力されたエラー情報に含まれている。
修正選択部91は、帯域毎に付されたサブバンド番号nと、修正方法が変化する境界値th_band1及びth_band2が予め決定されたテーブルとに従い、例えば次のような選択を行う。この境界値は、サンプリング周波数とビットレートに基づいて設定される。
n < th_band1 なら 修正方法1を使用
th_band1 ≦ n < th_band2 なら 修正方法2を使用
th_band2 ≦ n なら 修正方法3を使用
n < th_band1の場合は、周波数データの値の変化量が大きい低域部分でのエラーの発生を想定しているので、変化量をしきい値に抑える修正方法1を選択する。
また、th_band1 ≦ n < th_band2の場合は、周波数データの値の変化量が少ない中〜高域でのエラーの発生を想定しているので、変化量を0にする修正方法2を選択する。
また、th_band2 ≦ nの場合は、通常、周波数データが0になることが多い高域部分でのエラーの発生を想定しているので、周波数データを0で置き換える修正方法3を選択する。
このように、サンプル修正部9は、エラー検出部8から入力されたエラー情報に基づいて修正方法を選択することができるので、エラーが検出された周波数データに適した修正を行うことができる。
次に、帯域合成部10の処理について図8に示すフローチャートを参照して説明する。帯域合成部10には、サンプル修正部9で修正処理された帯域の周波数データを含む各帯域の周波数データが入力される。MPEG方式では、32の帯域の周波数データごとに逆量子化が行われ、帯域合成処理が行われる。
ステップS1では、生成される64個の新たなVベクタに備えて、(6)式により1024個のVベクトル群中、前の結果の64個をシフト処理する。
Figure 0004539180
そして、ステップS2では、入力された32の周波数データから新たなVベクタを(7)式により64個算出する。
Figure 0004539180
Vベクタは、ステップS2で新規に算出された64個のVベクタと過去15回分のVベクタ(64×15=980)とを合わせて1024個用意される。
ステップS3では、(8)式により1024個のVベクトル群から512個のUベクタ群を生成する。
Figure 0004539180
ステップS4では、(9)式によりUベクタ群にウィンドウ処理に用いられる係数である係数Diを乗算し、ウィンドウ処理してWベクタ群を生成する。
Figure 0004539180
ステップ4で生成されたWベクタ群は、所定方向に32個加算されて、(10)式のように1フレーム分のオーディオデータPCM(Pulse Code Modulation)を伸張する(ステップS5)。
Figure 0004539180
以上、説明したように本実施形態における音響復号装置は、符号化ストリームに多重化されているサンプルデータのエラーを検出し、エラーが検出された場合、その周波数データを修正することができるので、サンプルデータ中のビット誤りやデータ破壊によって発生するノイズを抑え、高音質なオーディオデータを提供することができる。
なお、本実施形態では、MPEG‐1オーディオレイヤ2方式のオーディオデータを用いて説明したが、MPEG‐1オーディオレイヤ2方式に限らず、他の方式のオーディオデータにも適用させることができる。
MPEG‐1 オーディオレイヤ2方式の符号化ストリームのオーディオフレームを示す図である。 本実施の形態における音響復号装置の構成を示すブロック図である。 MPEG‐1 オーディオレイヤ2方式におけるサンプルデータの復号を説明するための図である。 本実施の形態におけるエラー検出部の構成を示すブロック図である。 本実施の形態における周波数しきい値テーブルを説明するための図である。 本実施の形態における時間軸しきい値テーブルを説明するための図である。 本実施の形態におけるサンプル修正部の構成を示すブロック図である。 本実施の形態における帯域合成部の動作を示すフローチャートである。 従来の音響復号装置の構成を示すブロック図である。
符号の説明
1 音響復号装置、 2 フレームバッファ、 3 データ分離部、 4 ヘッダ分析部、 5 サイド情報復号部、 6 サンプル逆量子化部、 7 サンプル逆正規化部、 8 エラー検出部、 9 サンプル修正部、 10 帯域合成部、 81 周波数しきい値テーブル、 82 周波数データ比較部、 83 前サンプル記憶部、 84 時間軸しきい値テーブル、 85 時間軸データ比較部、 91 修正方式選択部、 92、93、94 周波数データ修正部、 101 音響復号装置、 102 フレームバッファ、 103 データ分離部、 104 ヘッダ分析部、 105 サイド情報復号部、 106 サンプル逆量子化部、 107 サンプル逆正規化部、 108 帯域合成部

Claims (8)

  1. 所定の時間間隔毎に分割されたオーディオデータを複数の周波数帯域の周波数データに分割し、上記複数の周波数帯域の周波数データを各グループが各周波数帯域について時系列順に一定数の周波数データを含むように複数のグループに分割し、符号化して得られた符号化ストリームを復号する音響復号装置において、
    上記符号化ストリームを復号し、上記複数のグループに分割された周波数データを復元する復元手段と、
    上記復元手段により復元された2つの周波数データの差分の絶対値としきい値とを比較し、上記差分の絶対値が上記しきい値よりも大きい場合、上記差分をとった2つの周波数データのうち一方をエラーと判断するエラー検出手段と、
    上記エラーと判断された周波数データを修正する修正手段と、
    上記複数のグループに分割された周波数データからオーディオデータを合成する合成手段と
    有し、
    上記修正手段は、上記エラー検出手段でエラーと判断された周波数データの周波数帯域に応じて上記エラーと判断された周波数データを修正する修正方式を選択する音響復号装置。
  2. 上記修正手段は、上記エラー検出手段でエラーと判断された周波数データの周波数帯域が所定の境界値より小さい場合、上記エラーと判断されなかった周波数データとの差分の絶対値が上記しきい値となるように、上記エラーと判断された周波数データを修正する請求項記載の音響復号装置。
  3. 上記修正手段は、上記エラー検出手段でエラーと判断された周波数データの周波数帯域が第1の境界値以上、且つ第2の境界値未満の場合、上記エラーと判断された周波数データの値を上記エラーと判断されなかった周波数データの値に置き換えて修正する請求項記載の音響復号装置。
  4. 上記修正手段は、上記エラー検出手段でエラーと判断された周波数データの周波数帯域が所定の境界値以上の場合、上記エラーと判断された周波数データの値を0に置き換えて修正する請求項記載の音響復号装置。
  5. 所定の時間間隔毎に分割されたオーディオデータを複数の周波数帯域の周波数データに分割し、上記複数の周波数帯域の周波数データを各グループが各周波数帯域について時系列順に一定数の周波数データを含むように複数のグループに分割し、符号化して得られた符号化ストリームを復号する音響復号方法において、
    上記符号化ストリームを復号し、上記複数のグループに分割された周波数データを復元する復元工程と、
    上記復元工程により復元された2つの周波数データの差分の絶対値としきい値とを比較し、上記差分の絶対値が上記しきい値よりも大きい場合、上記差分をとった2つの周波数データのうち一方をエラーと判断するエラー検出工程と、
    上記エラーと判断された周波数データを修正する修正工程と、
    上記複数のグループに分割された周波数データからオーディオデータを合成する合成工程とを有し、
    上記修正工程は、上記エラー検出工程でエラーと判断された周波数データの周波数帯域に応じて上記エラーと判断された周波数データを修正する修正方式を選択する音響復号方法。
  6. 上記修正工程は、上記エラー検出工程でエラーと判断された周波数データの周波数帯域が所定の境界値より小さい場合、上記エラーと判断されなかった周波数データとの差分の絶対値が上記しきい値となるように、上記エラーと判断された周波数データを修正する請求項記載の音響復号方法。
  7. 上記修正工程は、上記エラー検出工程でエラーと判断された周波数データの周波数帯域が第1の境界値以上、且つ第2の境界値未満の場合、上記エラーと判断された周波数データの値を上記エラーと判断されなかった周波数データの値に置き換えて修正する請求項記載の音響復号方法。
  8. 上記修正工程は、上記エラー検出工程でエラーと判断された周波数データの周波数帯域が所定の境界値以上の場合、上記エラーと判断された周波数データの値を0に置き換えて修正する請求項記載の音響復号方法。
JP2004168784A 2004-06-07 2004-06-07 音響復号装置及び音響復号方法 Expired - Fee Related JP4539180B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004168784A JP4539180B2 (ja) 2004-06-07 2004-06-07 音響復号装置及び音響復号方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004168784A JP4539180B2 (ja) 2004-06-07 2004-06-07 音響復号装置及び音響復号方法

Publications (2)

Publication Number Publication Date
JP2005345993A JP2005345993A (ja) 2005-12-15
JP4539180B2 true JP4539180B2 (ja) 2010-09-08

Family

ID=35498410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004168784A Expired - Fee Related JP4539180B2 (ja) 2004-06-07 2004-06-07 音響復号装置及び音響復号方法

Country Status (1)

Country Link
JP (1) JP4539180B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2023119555A1 (ja) * 2021-12-23 2023-06-29

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6236931A (ja) * 1985-08-09 1987-02-17 Matsushita Electric Ind Co Ltd 復号装置
JPH05100696A (ja) * 1991-10-04 1993-04-23 Kokusai Electric Co Ltd 音声符号の誤り訂正方法及び装置
JPH07503115A (ja) * 1992-01-27 1995-03-30 ドイチエ トムソン−ブラント ゲゼルシヤフト ミツト ベシユレンクテル ハフツング サブバンド符号器における誤り防止保護方法
JPH07221713A (ja) * 1994-02-03 1995-08-18 Matsushita Electric Ind Co Ltd 符号化信号復号化装置
JPH0855443A (ja) * 1994-08-12 1996-02-27 Matsushita Electric Ind Co Ltd 符号化信号復号化装置
JPH08286698A (ja) * 1994-12-21 1996-11-01 Samsung Electron Co Ltd 音響信号のエラー隠匿方法及びその装置
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
JP2003091294A (ja) * 2001-09-18 2003-03-28 Sharp Corp 音声復号装置、音声復号方法および音声復号プログラム
JP2004500599A (ja) * 1999-12-08 2004-01-08 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング ディジタルオーディオデータの復号方法
JP2007514977A (ja) * 2003-12-19 2007-06-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された周波数領域におけるエラー隠蔽技術

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6236931A (ja) * 1985-08-09 1987-02-17 Matsushita Electric Ind Co Ltd 復号装置
JPH05100696A (ja) * 1991-10-04 1993-04-23 Kokusai Electric Co Ltd 音声符号の誤り訂正方法及び装置
JPH07503115A (ja) * 1992-01-27 1995-03-30 ドイチエ トムソン−ブラント ゲゼルシヤフト ミツト ベシユレンクテル ハフツング サブバンド符号器における誤り防止保護方法
JPH07221713A (ja) * 1994-02-03 1995-08-18 Matsushita Electric Ind Co Ltd 符号化信号復号化装置
JPH0855443A (ja) * 1994-08-12 1996-02-27 Matsushita Electric Ind Co Ltd 符号化信号復号化装置
JPH08286698A (ja) * 1994-12-21 1996-11-01 Samsung Electron Co Ltd 音響信号のエラー隠匿方法及びその装置
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
JP2004500599A (ja) * 1999-12-08 2004-01-08 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング ディジタルオーディオデータの復号方法
JP2003091294A (ja) * 2001-09-18 2003-03-28 Sharp Corp 音声復号装置、音声復号方法および音声復号プログラム
JP2007514977A (ja) * 2003-12-19 2007-06-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された周波数領域におけるエラー隠蔽技術

Also Published As

Publication number Publication date
JP2005345993A (ja) 2005-12-15

Similar Documents

Publication Publication Date Title
JP5485909B2 (ja) オーディオ信号処理方法及び装置
US7328161B2 (en) Audio decoding method and apparatus which recover high frequency component with small computation
JP4521170B2 (ja) 純可逆的音声圧縮における技術革新
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP5326465B2 (ja) オーディオ復号方法、装置、及びプログラム
JP2004361731A (ja) オーディオ復号装置及びオーディオ復号方法
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
WO2007066880A1 (en) Method and apparatus for encoding/decoding
JP2008033269A (ja) デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置
EP1780895B1 (en) Signal decoding apparatus
JP4022504B2 (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
JP2010139671A (ja) オーディオ復号装置、方法、及びプログラム
JP4947145B2 (ja) 復号装置、復号方法、及びプログラム
JP4973397B2 (ja) 符号化装置および符号化方法、ならびに復号化装置および復号化方法
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JP2004109362A (ja) フレーム構造のノイズ除去装置、フレーム構造のノイズ除去方法およびフレーム構造のノイズ除去プログラム
JP3649854B2 (ja) 音声符号化装置
KR20070091512A (ko) 복호화된 오디오 신호의 오류 은폐 방법 및 장치
JP2007178529A (ja) 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法
JPH11355145A (ja) 音響符号器および音響復号器
JP2006023658A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP2002073091A (ja) 復号装置
JP2008158302A (ja) 信号処理装置、信号処理方法、再生装置、再生方法、電子機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100614

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees