JP4530567B2 - デジタルオーディオ復号装置 - Google Patents

デジタルオーディオ復号装置 Download PDF

Info

Publication number
JP4530567B2
JP4530567B2 JP2001098486A JP2001098486A JP4530567B2 JP 4530567 B2 JP4530567 B2 JP 4530567B2 JP 2001098486 A JP2001098486 A JP 2001098486A JP 2001098486 A JP2001098486 A JP 2001098486A JP 4530567 B2 JP4530567 B2 JP 4530567B2
Authority
JP
Japan
Prior art keywords
band
audio data
audio
correction
decoding apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001098486A
Other languages
English (en)
Other versions
JP2002297192A (ja
Inventor
康治 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2001098486A priority Critical patent/JP4530567B2/ja
Publication of JP2002297192A publication Critical patent/JP2002297192A/ja
Application granted granted Critical
Publication of JP4530567B2 publication Critical patent/JP4530567B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、符号化されたオーディオデータを復号するオーディオ復号装置の構成に関し、特に、再生時の聴感的な音質劣化を低減することが可能なオーディオ復号装置の構成に関する。
【0002】
【従来の技術】
現在、MPEG−Audio(Moving Picture Experts Group-Audio)規格(ISO/IEC11172−3,ISO/IEC13818−3,ISO/IEC13818−7)など、オーディオデータを符号化し、データ量を圧縮する方式が多く提案されている。これらの方式では、符号化時に人間が聴感上あまり聞き取ることができない情報を除去することで、データ量を圧縮することを可能としている。
【0003】
また、復号化時には、同じくMPEG−Audio規格などで定められた方式に基づいて、復号処理が行なわれる。このとき、符号化時に除去された情報については復元することができないが、符号化時に除去された情報が聴感上重要でないものであれば、音質の劣化を感じさせることなくオーディオデータを再生することができる。
【0004】
こうしたオーディオ符号化/復号化方式を用いることで、限られた伝送容量での通信や、限られた容量のメディアへの蓄積が可能になる。そのため、インターネットや電話回線による音楽配信、デジタルテレビ放送、ミニディスク(MD:Mini-Disc)や固体メモリを利用した音楽プレーヤーなど、多くの分野で利用されている。
【0005】
以下、従来のデジタルオーディオ復号装置の構成について、図面を参照しながら説明する。
【0006】
図8は、このような従来のデジタルオーディオ復号装置800の構成を説明するための図である。
【0007】
図8を参照して、「圧縮オーディオデータ」は、MPEG−Audio規格などで符号化されたデータである。また、「オーディオデータ」は、復号されたオーディオの時系列データであり、DAC(デジタル/アナログ変換器)、増幅器、スピーカを通して、音として再生することができる。
【0008】
オーディオデコーダ810は、「圧縮オーディオデータ」を入力とし、MPEG−Audio規格に従って、デコード処理を行ない、「オーディオデータ」を出力する。こうして、MPEG−Audio規格などで符号化されたデータの復号を実現でき、DAC、増幅器、スピーカ等の再生系と併せて再生することが可能となる。
【0009】
【発明が解決しようとする課題】
MPEG−Audio規格などに従って、符号化を行なう際に、人間の聴感にそぐわない方法でデータ圧縮が行なわれたり、過度の圧縮率でデータ圧縮が行なわれたりすると、人間の聴取可能な情報まで除去されてしまう場合がある。この場合、このような圧縮データを復号して再生すると、除去されてしまった情報に相当する部分が雑音として知覚され、聴取者には不快感を与えてしまうという問題点があった。
【0010】
本発明は、上記のような問題点を解決するためになされたものであって、その目的は、符号化時に不適切に圧縮されたオーディオデータに対して、復号・再生時に雑音の低減を行ない、良好な音質を提供することが可能なオーディオ復号装置を提供することである。
【0011】
この発明の他の目的は、不適切に圧縮されたオーディオデータを自動的に判別することで、雑音を含んだオーディオデータに対しては雑音を低減して再生し、適切に符号化されたデータに対しては通常の再生を妨げないことが可能なオーディオ復号装置を提供することである。
【0012】
【課題を解決するための手段】
請求項1記載のデジタルオーディオ復号装置は、音声信号を複数の周波数帯域ごとに圧縮したオーディオデータの復号を行なうためのデジタルオーディオ復号装置であって、圧縮されたオーディオデータに含まれる帯域ごとの誤差量を算出する誤差算出手段と、各帯域の誤差量をもとに、補正処理を行なう帯域を決定する帯域決定手段と、決定された帯域に対し補正を行なう補正手段とを備える。
【0013】
請求項2記載のデジタルオーディオ復号装置は、請求項1記載のデジタルオーディオ復号装置の構成に加えて、各帯域の聴感的な感度を算出するための聴感算出手段をさらに備え、帯域決定手段は、各帯域の誤差量と各帯域の聴感的な感度をもとに、補正処理を行なう帯域を決定する。
【0014】
請求項3記載のデジタルオーディオ復号装置は、請求項1または2に記載のデジタルオーディオ復号装置の構成に加えて、オーディオデータに含まれる帯域ごとの誤差量は、オーディオデータの各帯域成分の量子化間隔をもとに算出される。
【0027】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態について説明する。
【0028】
また、以下では、ISO/IEC13818−7(名称は、MPEG-Audio ADVANCED Audio Codec、以下、AACと略す)の中で規定されたadtsフォーマットに対する復号装置を例にとって説明することにする。ただし、本発明はこのような規格に限定されることなく、オーディオデータが周波数分析に基づいて圧縮されており、各周波数帯域ごとに、データ圧縮処理を規定するデータから、量子化に伴う誤差を予測可能なデータ圧縮方式や、圧縮オーディオデータ中のデータに基づいて、ビットレートを算出することが可能な圧縮方式に対して適用可能なものである。
【0029】
[実施の形態1]
図1は、本発明の実施の形態1のデジタルオーディオ復号装置100の構成を説明するための概略ブロック図である。
【0030】
デジタルオーディオ復号装置100は、以下に説明するとおり、入力の圧縮オーディオデータから帯域ごとの誤差量を算出し、その誤差量をもとに補正処理を行なう帯域を決定し、その帯域に対して補正処理を行なうことで、復号時に聴感的な音質劣化を低減することが可能である。
【0031】
図1を参照して、「圧縮オーディオデータ」は、システムへの入力となるAAC規格のデータストリームである。「オーディオデータ」は、「圧縮オーディオデータ」を復号して得られるオーディオの時系列データである。オーディオデコーダ10は、「圧縮オーディオデータ」を入力として、AAC規格の復号処理を行ない、復号結果を「オーディオデータ」として出力するブロックである。以上により、AAC規格に従う通常の復号処理が行なわれる。
【0032】
図1において、誤差算出部20は、「圧縮オーディオデータ」から符号化時に発生した各帯域に含まれる誤差量を算出するブロックである。算出された各帯域の誤差量は、「予測誤差量」として制御帯域判断部30に出力される。
【0033】
誤差算出部20において「予測誤差量」を算出する方法について以下に詳しく説明する。
【0034】
図2は、AAC規格の、特にadtsフォーマットの圧縮データフォーマットを示す概念図である。
【0035】
adtsフォーマットの圧縮データフォーマットは、図2に示すように、adtsフレームというデータ構造の連続である。
【0036】
adtsフレームは、adtsヘッダといくつかのフレームから成り立っている。フレームは、復号処理を行なう単位であり、各チャネルの連続する1024個のオーディオサンプルを格納している。
【0037】
図3は、フレーム内のオーディオサンプルの構成を示す概念図である。
フレーム内のオーディオサンプルは、図3に示すように、周波数変換されて格納されており、周波数帯域ごとに異なる量子化間隔で量子化されている。
【0038】
具体的には、オーディオサンプルは、フレームのデータ構造の中に、以下の形式で格納されている。
【0039】
Sq:量子化されたサンプル(量子化のインデックス値)
Scf:スケーリング因子(周波数帯域ごとに異なる)
ここで、Sqはチャネルごとに1024サンプル存在し、それぞれ1024個に分割された各周波数帯域成分に相当する。一方、Scfは、図3に示すように、1024個に分割された各周波数帯域のいくつかをまとめたスケールファクタバンド(以下、sfb)ごとに存在している。これらを用いて、逆量子化は以下の式に従って行なうことが規格で定められている。
【0040】
【数1】
Figure 0004530567
【0041】
ここで、Sq=SQ,Scf=SCFの場合の量子化誤差Eについて考える。Scf=SCFであって、Sq=SQ−1、Sq=SQ、Sq=SQ+1のそれぞれの場合において、逆量子化の値を求めると以下の式のように表わされる。
【0042】
【数2】
Figure 0004530567
【0043】
ここで、符号化を行なう前の本来のサンプル値をSとすれば、符号化時に、Sq=SQと量子化されるSの範囲は、SがSd(SQ−1,SCF)およびSd(SQ+1,SCF)よりもSd(SQ,SCF)に近い場合であるから、そのような範囲を示すと、以下の式(1)のようになる。さらに、量子化による誤差Eは、E=(S−Sd)と求められるので、Eの範囲は、以下の式(2)のようになる。
【0044】
【数3】
Figure 0004530567
【0045】
上記誤差Eの範囲が広いことは存在する誤差が大きいことを示し、上記誤差Eの範囲が狭いことは存在する誤差が小さいことを示すから、誤差Eの範囲の広さから誤差量の大きさを推定することができる。また、上記の式に従って、誤差Eの範囲は、「圧縮オーディオデータ」中の量子化サンプルSq、スケール因子Scfに依存して算出できることになる。
【0046】
したがって、「圧縮オーディオデータ」中の量子化サンプルSq、スケール因子Scfを用いて量子化間隔を算出し、これを元に「圧縮オーディオデータ」中の各周波数成分に含まれる「予測誤差量」を算出することができる。
【0047】
再び、図1を参照して、制御帯域判断部30は、各帯域の上述したような「予測誤差量」をもとに、補正処理を行なう帯域を決定するブロックである。
【0048】
制御帯域判断部30は、決定した帯域の情報を「制御帯域情報」として帯域補正部40に送出する。
【0049】
次に、制御帯域判断部30において補正処理を行なう帯域を決定する方法について以下にさらに詳しく説明する
許容誤差のしきい値として定数E0を設ける。制御帯域判断部30には、この定数E0が予め格納されており、帯域ごとに「予測誤差量」との比較を行なう。「予測誤差量」が定数E0よりも大きくなる帯域を補正処理を行なう帯域として、また、「予測誤差量」が定数E0以下となる帯域を補正処理を行なわない帯域として判断する。
【0050】
以上の方法で、補正制御を行なう帯域を示した情報である「制御帯域情報」を決定し出力することができる。
【0051】
帯域補正部40は、制御帯域判断部30から送られる「制御帯域情報」に基づいて、「圧縮オーディオデータ」の復号結果である「オーディオデータ」に補正処理を行なう。
【0052】
以下、帯域補正部40において行なう補正処理の方法をさらに詳しく説明する。
【0053】
帯域補正部40は、遮断帯域の異なるいくつかの帯域遮断フィルタ、低域通過フィルタ、高域通過フィルタを格納しており、それらの中から「制御帯域情報」によって補正処理を行なうことを示された帯域を遮断するフィルタを選択する。そして、「オーディオデータ」に対し、選択したフィルタを用いてフィルタ処理を行ない、結果を「補正オーディオデータ」として出力する。
【0054】
以上説明したような動作により、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に、誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能となり、聴感上、雑音を低減した音を提供することができる。
【0055】
[実施の形態2]
実施の形態2のオーディオデータ復号装置の構成は、基本的に実施の形態1のオーディオデータ復号装置100の構成と同様である。
【0056】
ただし、以下に説明するように、制御帯域判断部30において、補正処理を行なう帯域を決定する際の処理が異なる。
【0057】
以下、制御帯域判断部30において、補正処理を行なう帯域を決定する処理の方法について説明する。
【0058】
制御帯域判断部30には、許容誤差のしきい値として定数E0が設けられ、この定数E0が格納されている。
【0059】
最も高い周波数帯域から順に、帯域ごとに「予測誤差量」と定数E0の比較を行ない、初めて「予測誤差量」<定数E0となるような帯域を求める。この帯域より高い周波数の全帯域を補正処理を行なう帯域として判断する。
【0060】
以上の方法で、補正制御を行なう帯域を示す情報である「制御帯域情報」を決定することができる。
【0061】
以上の方法によっても、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になり、聴感上雑音を低減した音を提供することができる。
【0062】
また、このとき、「制御帯域情報」としては境界となる帯域のみの情報を帯域補正部40に送ればよく、より小規模なシステムで実現することが可能である。さらに、帯域補正部40が格納するフィルタは、低域通過フィルタのみの組合せでよく、より小規模なシステムで実現が可能となる。
【0063】
[実施の形態3]
実施の形態3のデジタルオーディオ復号装置の構成は、基本的に実施の形態1のデジタルオーディオ復号装置の構成と同様であるが、以下に説明するように、制御帯域判断部30における処理が異なる。
【0064】
以下、制御帯域判断部30において補正処理を行なう帯域を決定する処理について説明する。
【0065】
まず、許容誤差のしきい値として定数E0を設けておき、制御帯域判断部30にこの定数E0を格納しておく。
【0066】
最も低い周波数帯域から順に、帯域ごとに「予測誤差量」と定数E0の比較を行ない、初めて「予測誤差量」<定数E0となる帯域を求める。この帯域より低い周波数の全帯域を補正処理を行なう帯域として判断する。
【0067】
以上の方法で、補正制御を行なう帯域を示す情報である「制御帯域情報」を決定し出力することができる。
【0068】
以上の方法によっても、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に、誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になり、聴感上、雑音を低減した音を提供することができる。
【0069】
また、このとき、「制御帯域情報」としては境界となる帯域のみの情報を帯域補正部40に送ればよく、より小規模なシステムで実現が可能である。さらに、帯域補正部40が格納するフィルタは、高域通過フィルタのみの組合せでよく、より小規模なシステムで実現が可能である。
【0070】
[実施の形態4]
図4は、本発明の実施の形態4のデジタルオーディオ復号装置200の構成を説明するための概略ブロック図である。
【0071】
デジタルオーディオ復号装置200は、以下に説明するとおり、入力の圧縮オーディオデータから帯域ごとの誤差量を算出し、その誤差量をもとに補正処理を行なう帯域を決定し、その帯域に対しては補正処理を行なうことで、復号時に聴感的な音質劣化を低減する。
【0072】
図4においても、「圧縮オーディオデータ」は、システムへの入力となるAAC規格のデータストリームであるものとする。「オーディオデータ」は「圧縮オーディオデータ」を復号して得られるオーディオの時系列データである。
【0073】
AACなどの規格では、実施の形態1で説明したように、フレーム内のオーディオサンプルは周波数分析された状態で格納されている。したがって、復号処理の全体の流れの中の後段では、IMDCT(Inverse Modified Discrete CosineTransform)など周波数領域から時間領域へ変換する処理が行なわれる。
【0074】
図4を参照して、オーディオデコーダ10.1は、圧縮オーディオデータを入力として、AAC規格などの復号処理のうち、周波数領域から時間領域への変換の前段階の処理までを行ない、その処理の結果である周波数領域でのオーディオサンプルを「中間オーディオデータ1」として出力するブロックである。
【0075】
オーディオデコーダ10.2は、帯域補正部40から出力される周波数領域でのオーディオサンプルである「中間オーディオデータ2」を入力として、AAC規格などの復号処理のうち、周波数領域から時間領域への変換以後の処理を行ない、復号処理の結果である時間領域でのオーディオサンプルを「オーディオデータ」として出力するブロックである。
【0076】
帯域補正部40が何の処理も行なわず、入力である「中間オーディオデータ1」を「中間オーディオデータ2」として出力した場合、以上の処理により、たとえば、AAC規格に従う通常の復号が行なわれる。
【0077】
図4において誤差算出部20、制御帯域判断部30は実施の形態1と同じ処理を行ない、帯域補正部40に補正制御を行なう帯域を示した「制御帯域情報」を送る。
【0078】
帯域補正部40は、制御帯域判断部30から送られる「制御帯域情報」に基づいて、オーディオデコーダ10.1の出力である周波数領域でのオーディオサンプルに補正処理を行なう。
【0079】
帯域補正部40において行なう補正処理の方法について以下にさらに詳しく説明する
帯域補正部40の入力である「中間オーディオデータ1」は周波数領域でのオーディオサンプルである。その中から、「制御帯域情報」によって補正処理を行なうことを示された帯域に相当するオーディオサンプルをゼロ値に置き換え、その周波数成分を除去する。置き換え後のオーディオサンプルを「中間オーディオデータ2」として出力する。
【0080】
この置き換えによって、オーディオデコーダ10.2で時間領域に変換された「オーディオデータ」は、「制御帯域情報」によって補正処理を行なうことを示された帯域成分を含まないデータとして出力される。
【0081】
以上により、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に、誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になり、聴感上、雑音を低減した音を提供することができる。
【0082】
また、周波数領域でサンプル値を間引くことにより、フィルタ処理を行なう必要がないため、より小規模なシステムで実現をすることが可能である。
【0083】
[実施の形態5]
実施の形態5のデジタルオーディオ復号装置の構成は、実施の形態4のデジタルオーディオ復号装置200の構成と基本的に同様であるが、以下に説明するとおり、制御帯域判断部30および帯域補正部40の行なう処理が異なる。
【0084】
制御帯域判断部30は、「予測誤差量」をもとにして、補正処理を行なう帯域の情報とともに、どの程度補正を行なうかを示す「補正係数」を決定し、両者を「制御帯域情報」として帯域補正部40に送る。
【0085】
制御帯域判断部30において補正処理を行なう帯域を決定する方法は実施の形態1と同様である。
【0086】
「補正係数」を算出する方法については以下にさらに詳しく説明する。
許容誤差のしきい値として、制御帯域判断部30に格納された定数E0と、帯域ごとの「予測誤差量」とを用いて、「補正係数」を(E0/「予測誤差量」)として決定する。これは、予測誤差量を何倍すれば許容誤差量になるかを示す係数である。
【0087】
以上の方法で、「制御帯域情報」内の「補正係数」を決定することができる。帯域補正部40は、制御帯域判断部30から送られる「制御帯域情報」に基づいて、オーディオデコーダ10.1の出力である周波数領域でのオーディオサンプルに補正処理を行なう。
【0088】
帯域補正部40において行なう補正処理の方法を以下に説明する。
帯域補正部40の入力である「中間オーディオデータ1」は、周波数領域のオーディオサンプルである。帯域補正部40は、「中間オーディオデータ1」の中から、「制御帯域情報」によって補正処理を行なうことを示された帯域に相当するオーディオサンプルに対して、「制御帯域情報」内の「補正係数」を乗じることにより、補正を行なった値に置き換える。帯域補正部40は、置き換え後のオーディオサンプルを「中間オーディオデータ2」として出力する。
【0089】
この置き換えによって、「中間オーディオデータ2」の各周波数成分が含む誤差量は、許容誤差量E0以下に抑えられ、雑音を低減することが可能となる。また、同時に、必要以上に元のオーディオデータを削除することがなくなるので、補正処理による音質の劣化を抑制することが可能となる。
【0090】
[実施の形態6]
図5は、本発明の実施の形態6のデジタルオーディオ復号装置300の構成を説明するための概略ブロック図である。
【0091】
デジタルオーディオ復号装置300は、以下に説明するとおり、入力の圧縮オーディオデータからビットレートを算出し、そのビットレートをもとに補正処理を行なう帯域を決定して、その帯域に対して補正処理を行なうことで、復号時に聴感的な音質劣化を低減する。
【0092】
図5において、「圧縮オーディオデータ」は、システムへの入力となる、たとえばAAC規格のデータストリームである。「オーディオデータ」は「圧縮オーディオデータ」を復号して得られるオーディオの時系列データである。
【0093】
オーディオデコーダ10は、「圧縮オーディオデータ」を入力として、AAC規格の復号処理を行ない、復号結果を「オーディオデータ」として出力するブロックである。以上により、AAC規格に従う通常の復号処理が行なわれる。
【0094】
図5において、ビットレート算出部50は、「圧縮オーディオデータ」から、圧縮オーディオデータのビットレートを算出するブロックである。算出されたビットレートは、「ビットレート情報」として制御帯域判断部30に出力される。
【0095】
以下、ビットレート算出部50において「ビットレート」を算出する方法について、詳しく説明する。
【0096】
AAC規格の、特にadtsフォーマットの圧縮データフォーマットは、実施の形態1の図2で説明したとおり、adtsフレームというデータ構造の連続である。adtsフレーム中には、サンプリング周波数を示す情報とadtsフレームのサイズを示す情報とadtsフレーム内に格納されているフレーム数を示す情報が格納されている。これらの情報をもとに、以下のようにして「ビットレート」を算出する。
【0097】
adtsフレームサイズ(ビット)×サンプリング周波数(Hz)/(フレーム数×1024)(サンプル)
以上の方法により、「ビットレート」の算出が可能である。
【0098】
制御帯域判断部30は、各帯域のビットレートをもとに補正処理を行なう帯域を決定するブロックである。決定した帯域の情報を「制御帯域情報」として帯域補正部40に送る。
【0099】
制御帯域判断部30において補正処理を行なう帯域を決定する方法を以下に説明する。
【0100】
制御帯域判断部30は、ビットレートと補正処理を行なう帯域の下限との関係をテーブルとして格納しておく。このテーブルは、ビットレートが下がるほど補正処理を行なう帯域も下がる関係を示しているものとする。
【0101】
制御帯域判断部30は、このテーブルを用いて、入力された「ビットレート」に最も近い補正処理を行なう帯域の下限を求める。この下限値より高周波数のすべての帯域を補正処理を行なう帯域として判断する。
【0102】
以上の方法で、補正制御を行なう帯域を示した情報である「制御帯域情報」を決定することができる。
【0103】
帯域補正部40は、制御帯域判断部30から送られる「制御帯域情報」に基づいて、「圧縮オーディオデータ」の復号結果である「オーディオデータ」に補正処理を行なう。
【0104】
帯域補正部40において行なう補正処理の内容を以下に説明する。
帯域補正部40は遮断帯域の異なるいくつかの帯域遮断フィルタ、低域通過フィルタ、高域通過フィルタを格納しており、その中から「制御帯域情報」によって補正処理を行なうことを示された帯域を遮断するフィルタを選択する。そして、「オーディオデータ」に対し、選択したフィルタを用いたフィルタ処理を行ない、結果を「補正オーディオデータ」として出力する。
【0105】
以上により、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に、誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になる。したがって、聴感上、雑音を低減した音を提供することができる。
【0106】
[実施の形態7]
図6は、本発明の実施の形態7のデジタルオーディオ復号装置400の構成を説明するための概略ブロック図である。
【0107】
デジタルオーディオ復号装置400は、以下に説明するとおり、入力の圧縮オーディオデータから帯域ごとの誤差量を算出し、その誤差量と帯域ごとの聴感的感度をもとに補正処理を行なう帯域を決定し、その帯域に対して補正処理を行なうことで、復号時に聴感的な音質劣化を低減する復号装置のシステム構成を示したブロック図である。
【0108】
図6において、「圧縮オーディオデータ」は、システムへの入力となる、たとえばAAC規格のデータストリームである。「オーディオデータ」は、「圧縮オーディオデータ」を復号して得られるオーディオの時系列データである。
【0109】
オーディオデコーダ10は、実施の形態1と同様に、「圧縮オーディオデータ」を入力として、AAC規格の復号処理を行ない、復号結果を「オーディオデータ」として出力するブロックである。以上により、AAC規格に従うと通常の復号処理が行なわれる。
【0110】
図6において、誤差算出部20は実施の形態1と同様であり、「圧縮オーディオデータ」から、符号化時に発生した各帯域に含まれる「予測誤差量」を算出し制御帯域判断部30に出力する。
【0111】
聴覚心理量算出部70は、各帯域において人間の聴感的な感度である「予測聴覚心理量」を決定し、制御帯域判断部30に送る。
【0112】
聴覚心理量算出部70において、「予測聴覚心理量」を決定する方法を以下に説明する。
【0113】
人間の聴覚の感度は、周波数に依存して異なっており、たとえば物理的に同じ大きさの音であっても、4kHzの音と15kHzの音では、4kHzの音の方が大きく聞こえる。こうした聴覚の感度の周波数依存性は、ISO226などの規格にまとめられている。
【0114】
聴覚心理テーブル格納部60は、上述したようなISO226で規定されたような情報をもとに、周波数と聴感上聞き取ることのできない音の最大値との関係を示したテーブルを格納しており、聴覚心理量算出部70では、聴覚心理テーブル格納部60に格納された情報に基づいて、各帯域の「予測聴覚心理量」を算出する。
【0115】
以上のような方法で、「予測聴覚心理量」の決定が可能である。
制御帯域判断部30は、各帯域の「予測誤差量」と「予測聴覚心理量」とをもとに補正処理を行なう帯域を決定するブロックである。決定した帯域の情報を「制御帯域情報」として帯域補正部40に送る。
【0116】
以下、制御帯域判断部30において補正処理を行なう帯域を決定する方法を説明する。
【0117】
制御帯域判断部30は、帯域ごとに「予測誤差量」と「予測聴覚心理量」との比較を行なう。
【0118】
「予測誤差量」>「予測聴覚心理量」となる帯域を補正処理を行なう帯域とし、「予測誤差量」<「予測聴覚心理量」となる帯域を、補正処理を行なわない帯域として判断する。
【0119】
以上の方法で、補正制御を行なう帯域を示した情報である「制御帯域情報」を決定することができる。
【0120】
帯域補正部40の構成は、実施の形態1に示したものと同様であり、「制御帯域情報」に基づいて、「オーディオデータ」の補正処理を行ない、「補正オーディオデータ」として出力する。
【0121】
なお、実施の形態7のデジタルオーディオ復号装置400においても、図4に示したデジタルオーディオ復号装置200の構成と同様に、オーディオデコーダ10を、周波数領域から時間領域への変換の前段階の処理までを行なうオーディオデコーダ10.1と、周波数領域から時間領域への変換以後の処理を行なうオーディオデコーダ10.2とに分割し、帯域補正部40は、オーディオデコーダ10.1の出力を補正して、オーディオデコーダ10.2に与える構成としてもよい。
【0122】
また、実施の形態7のデジタルオーディオ復号装置400においても、実施の形態5のデジタルオーディオ復号装置の構成と同様に、制御帯域判断部30は、「予測誤差量」と「予測聴覚心理量」をもとにして決定された補正処理を行なう帯域の情報とともに、どの程度補正を行なうかを示す「補正係数」を決定し、両者を「制御帯域情報」として帯域補正部40に送る構成としてもよい。帯域補正部40では、実施の形態5と同様にして補正処理を行なう。
【0123】
以上により、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に、誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になり、聴感上、雑音を低減した音を提供することができる。
【0124】
また、聴感的な特性を考慮して誤差量を評価することにより、より人間が聴取する際に適切な雑音の低減を行なうことができる。
【0125】
[実施の形態8]
図7は、本発明の実施の形態8のデジタルオーディオ復号装置500の構成を説明するための概略ブロック図である。
【0126】
デジタルオーディオ復号装置500は、以下に説明するとおり、入力の圧縮オーディオデータから帯域ごとの誤差量と聴感的感度とを算出し、その誤差量と聴感的感度とをもとに補正処理を行なう帯域を決定し、その帯域に対して補正処理を行なうことで、復号時に聴感的な音質劣化を低減する。
【0127】
図7においても、「圧縮オーディオデータ」は、システムへの入力となる、たとえばAAC規格のデータストリームである。「オーディオデータ」は、「圧縮オーディオデータ」を復号して得られるオーディオの時系列データである。
【0128】
オーディオデコーダ10は、実施の形態1と同様に、圧縮オーディオデータを入力として、たとえばAAC規格の復号処理を行ない、復号結果を「オーディオデータ」として出力するブロックである。以上により、AAC規格に従う通常の復号処理が行なわれる。
【0129】
図7において誤差算出部20は実施の形態1および実施の形態7で説明したのと同様な構成を有し、「圧縮オーディオデータ」から符号化時に発生した各帯域における「予測誤差量」を算出し、制御帯域判断部30に出力する。
【0130】
聴覚心理量算出部70は、「圧縮オーディオデータ」をもとに各帯域において人間の聴感的な感度である「予測聴覚心理量」を決定し、制御帯域判断部30に送る。
【0131】
以下では、聴覚心理量算出部70において、「予測聴覚心理量」を決定する方法を説明する。
【0132】
人間の聴覚の感度は、周囲に存在する音に依存して異なり、この現象は「マスキング」として一般に知られている。マスキングでは、ある音に対して、周波数的に近い位置に他の音が存在したり、時間的に近い位置に音が存在したりすると、その音が聞こえにくくなるという現象が現われる。すなわち、たとえば物理的に同じ大きさの4kHzの音であっても、その音のみを聞く場合と、3.5kHzの他の音と一緒に聞く場合とでは、前者の方が音が大きく聞こえるという特性がある。こうした各時刻、各帯域におけるマスキング量を算出する方法としては、たとえば、ISO/IES11172−3などに記載された方法がある。
【0133】
聴覚心理量算出部70では、このようなISO/IEC11172−03などに記載された方法を用いて、「圧縮オーディオデータ」から、その時点で各帯域における聴感上聞き取ることができない音の最大値を算出する。これを各帯域の「予測聴覚心理量」とする。
【0134】
以上のような方法で、「予測聴覚心理量」の決定が可能である。
制御帯域判断部30は、実施の形態7で説明したものと同様の構成を有し、各帯域の「予測誤差量」と「予測聴覚心理量」とをもとに補正処理を行なう帯域を決定し、「制御帯域情報」として帯域補正部40に送る。
【0135】
帯域補正部40は、実施の形態7に示したのと同様の構成を有し、「制御帯域情報」に基づいて、「オーディオデータ」の補正処理を行ない、「補正オーディオデータ」として出力する。
【0136】
なお、実施の形態8のデジタルオーディオ復号装置500においても、図4に示したデジタルオーディオ復号装置200の構成と同様に、オーディオデコーダ10を、周波数領域から時間領域への変換の前段階の処理までを行なうオーディオデコーダ10.1と、周波数領域から時間領域への変換以後の処理を行なうオーディオデコーダ10.2とに分割し、帯域補正部40は、オーディオデコーダ10.1の出力を補正して、オーディオデコーダ10.2に与える構成としてもよい。
【0137】
また、実施の形態8のデジタルオーディオ復号装置500においても、実施の形態5のデジタルオーディオ復号装置の構成と同様に、制御帯域判断部30は、「予測誤差量」と「予測聴覚心理量」をもとにして決定された補正処理を行なう帯域の情報とともに、どの程度補正を行なうかを示す「補正係数」を決定し、両者を「制御帯域情報」として帯域補正部40に送る構成としてもよい。帯域補正部40では、実施の形態5と同様にして補正処理を行なう。
【0138】
以上により、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に、誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になり、聴感上、雑音を低減した音を提供することができる。また、聴感的な特性を考慮して誤差量を評価することにより、より適切な雑音の低減を行なうことが可能となる。
【0139】
[実施の形態9]
実施の形態9のデジタルオーディオ復号装置の構成は、実施の形態7に示したオーディオ復号装置の構成と基本的に同様である。
【0140】
ただし、以下に説明するとおり、制御帯域判断部30において補正処理を行なう帯域を決定する処理の方法が異なる。
【0141】
すなわち、実施の形態9のデジタルオーディオ復号装置においては、最も高い周波数帯域から順に、帯域ごとに「予測誤差量」と「予測聴覚心理量」との比較を行ない、初めて、「予測誤差量」<「予測聴覚心理量」の帯域を求める。この帯域より高い周波数の全帯域を、補正処理を行なう帯域として判断する。以上の方法で、補正制御を行なう帯域を示す情報である「制御帯域情報」を決定することができる。
【0142】
このような方法によっても、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になり、聴感上、雑音を低減した音を提供することができる。
【0143】
また、聴感的な特性を考慮して誤差量を評価することにより、より適切な雑音の低減が行なえる。
【0144】
さらに、このとき、「制御帯域情報」としては境界となる帯域のみの情報を帯域補正部40に送ればよく、より小規模なシステムで実現が可能である。さらに、帯域補正部40が格納するフィルタは、低域通過フィルタのみの組合せでよく、より小規模なシステムで実現が可能である。
【0145】
[実施の形態10]
実施の形態10のデジタルオーディオ復号装置の構成は、基本的に、実施の形態7のデジタルオーディオ復号装置の構成と同様であり、以下に説明するとおり、制御帯域判断部30において、補正処理を行なう帯域を判断する処理が異なる。
【0146】
すなわち、実施の形態10のデジタルオーディオ復号装置においては、最も低い周波数帯域から順に、帯域ごとに「予測誤差量」と「予測聴覚心理量」との比較を行ない、初めて、「予測誤差量」<「予測聴覚心理量」となる帯域を求める。この帯域より低い周波数の全帯域を、補正処理を行なう帯域として判断する。
【0147】
以上の方法で、補正制御を行なう帯域を示す情報である「制御帯域情報」を決定することができる。
【0148】
このような方法によっても、入力されたオーディオデータが誤差を多く含んでいる場合、復号を行なう際に誤差を多く含んだ帯域成分を自動的に除去したオーディオデータを出力することが可能になり、聴感上、雑音を低減した音を提供することができる。また、聴感的な特性を考慮して誤差量を評価することにより、より適切な雑音の低減が行なえる。さらに、このとき、「制御帯域情報」としては境界となる帯域のみの情報を帯域補正部40に送ればよく、より小規模なシステムで実現が可能である。さらに、帯域補正部40が格納するフィルタは、高域通過フィルタのみの組合せでよく、より小規模なシステムで実現が可能である。
【0149】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0150】
【発明の効果】
以上説明したとおり、本発明によれば、符号化時に音質の劣化した圧縮オーディオデータに対し、再生時の音質劣化を低減することが可能なデジタルオーディオ復号装置を提供することができる。
【0151】
さらに、本発明によれば、符号化時に音質の劣化した圧縮オーディオデータに対し、雑音を低減し良好な音質の再生を行なうことが可能なデジタルオーディオ復号装置を提供することができる。さらに、符号化時の音質劣化を自動的に判別し、劣化の少ない圧縮データに対しては、通常の再生を妨げないデジタルオーディオ復号装置を提供することができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態1のデジタルオーディオ復号装置100の構成を説明するための概略ブロック図である。
【図2】 AAC規格の、特にadtsフォーマットの圧縮データフォーマットを示す概念図である。
【図3】 フレーム内のオーディオサンプルの構成を示す概念図である。
【図4】 本発明の実施の形態4のデジタルオーディオ復号装置200の構成を説明するための概略ブロック図である。
【図5】 本発明の実施の形態6のデジタルオーディオ復号装置300の構成を説明するための概略ブロック図である。
【図6】 本発明の実施の形態7のデジタルオーディオ復号装置400の構成を説明するための概略ブロック図である。
【図7】 本発明の実施の形態8のデジタルオーディオ復号装置500の構成を説明するための概略ブロック図である。
【図8】 従来のデジタルオーディオ復号装置800の構成を説明するための図である。
【符号の説明】
10 オーディオデコーダ、20 誤差算出部、30 制御帯域判断部、40帯域補正部、50 ビットレート算出部、60 聴覚心理テーブル格納部、70 聴覚心理量算出部、100,200,300,400,500 デジタルオーディオ復号装置。

Claims (3)

  1. 音声信号を複数の周波数帯域ごとに圧縮したオーディオデータの復号を行なうためのデジタルオーディオ復号装置であって、
    前記圧縮されたオーディオデータに含まれる帯域ごとの誤差量を算出する誤差算出手段と、
    前記各帯域の誤差量をもとに、補正処理を行なう帯域を決定する帯域決定手段と、
    前記決定された帯域に対し補正を行なう補正手段とを備える、デジタルオーディオ復号装置。
  2. 各帯域の聴感的な感度を算出するための聴感算出手段をさらに備え、
    前記帯域決定手段は、前記各帯域の誤差量と各帯域の聴感的な感度をもとに、補正処理を行なう帯域を決定する、請求項1記載のデジタルオーディオ復号装置。
  3. 前記オーディオデータに含まれる帯域ごとの誤差量は、オーディオデータの各帯域成分の量子化間隔をもとに算出される、請求項1または2に記載のデジタルオーディオ復号装置。
JP2001098486A 2001-03-30 2001-03-30 デジタルオーディオ復号装置 Expired - Fee Related JP4530567B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001098486A JP4530567B2 (ja) 2001-03-30 2001-03-30 デジタルオーディオ復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001098486A JP4530567B2 (ja) 2001-03-30 2001-03-30 デジタルオーディオ復号装置

Publications (2)

Publication Number Publication Date
JP2002297192A JP2002297192A (ja) 2002-10-11
JP4530567B2 true JP4530567B2 (ja) 2010-08-25

Family

ID=18952132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001098486A Expired - Fee Related JP4530567B2 (ja) 2001-03-30 2001-03-30 デジタルオーディオ復号装置

Country Status (1)

Country Link
JP (1) JP4530567B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100513729B1 (ko) * 2003-07-03 2005-09-08 삼성전자주식회사 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법

Also Published As

Publication number Publication date
JP2002297192A (ja) 2002-10-11

Similar Documents

Publication Publication Date Title
KR100903017B1 (ko) 고품질 오디오용 가변 코딩 방법
EP1715476B1 (en) Low-bitrate encoding/decoding method and system
JP2005157390A (ja) 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置
JP3765622B2 (ja) オーディオ符号化復号化システム
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JP4454664B2 (ja) オーディオ符号化装置及びオーディオ符号化方法
JP2002517023A (ja) 音声信号の量子化ノイズをマスクするためのシステムと方法
US20090180531A1 (en) codec with plc capabilities
JP4021124B2 (ja) デジタル音響信号符号化装置、方法及び記録媒体
JP5390690B2 (ja) 音声コーデックの品質向上装置およびその方法
JP2004198485A (ja) 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
US20030014241A1 (en) Method of and apparatus for converting an audio signal between data compression formats
KR100378796B1 (ko) 디지탈 오디오 부호화기 및 복호화 방법
JP2004199075A (ja) ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
US20020173969A1 (en) Method for decompressing a compressed audio signal
US20130085762A1 (en) Audio encoding device
JP4530567B2 (ja) デジタルオーディオ復号装置
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
CN113259827A (zh) 基于音频编解码的助听方法、系统、耳机、介质及设备
JP2003280691A (ja) 音声処理方法および音声処理装置
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JP3594829B2 (ja) Mpegオーディオの復号化方法
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JP3504485B2 (ja) 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081111

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090210

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100608

R151 Written notification of patent or utility model registration

Ref document number: 4530567

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees