JP2004500599A - ディジタルオーディオデータの復号方法 - Google Patents
ディジタルオーディオデータの復号方法 Download PDFInfo
- Publication number
- JP2004500599A JP2004500599A JP2001543884A JP2001543884A JP2004500599A JP 2004500599 A JP2004500599 A JP 2004500599A JP 2001543884 A JP2001543884 A JP 2001543884A JP 2001543884 A JP2001543884 A JP 2001543884A JP 2004500599 A JP2004500599 A JP 2004500599A
- Authority
- JP
- Japan
- Prior art keywords
- reference value
- audio data
- frame
- digital audio
- frequency range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 230000011664 signaling Effects 0.000 claims abstract 4
- 230000005236 sound signal Effects 0.000 claims description 6
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 claims description 4
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims 1
- 238000012937 correction Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H2201/00—Aspects of broadcast communication
- H04H2201/10—Aspects of broadcast communication characterised by the type of broadcast system
- H04H2201/20—Aspects of broadcast communication characterised by the type of broadcast system digital audio broadcasting [DAB]
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Circuits Of Receivers In General (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
ディジタルオーディオデータを復号するための方法が提案される。この方法は、伝送された基準値、有利にはスケールファクタに依存して誤り検出を行うために使用される。本発明の方法は、周波数範囲の基準値と同一の周波数範囲の先行の基準値とが指標形成のために比較される。この指標は閾値と比較され、指標が所定の閾値を上回る場合には、このことがシグナリングによって表示される。本発明の実施形態では、オーディオデータが伝送されない周波数範囲に標準値が挿入される。この標準値はこの周波数範囲について指標が形成されないようにする。
Description
【0001】
本発明は、独立請求項記載のディジタルオーディオ信号を復号するための方法に関する。
【0002】
DAB(Digital Audio Broadcasting)では送信側において、伝送すべきディジタルオーディオ信号の全体の周波数スペクトルが周波数範囲に分割されることが公知である。これらの周波数範囲は英語ではサブバンドと称される。周波数範囲毎に最大で3つのスケールファクタが基準値として確定される。各周波数範囲においては、ステレオ伝送でのチャネル毎に36サンプリング値が時間的に連続して形成される。36サンプリング値は、時間的に連続する別個のグループ毎に12サンプリング値に分割される。グループごとに最大で1つのスケールファクタが規定される。1つの周波数範囲の2つまたは3つ全てのスケールファクタが同じまたは少なくとも非常に近似した値であれば、これらのスケールファクタに対して1つのスケールファクタのみが伝送される。したがってサンプリング値及びスケールファクタが伝送されるDABフレーム内では、1つの周波数範囲についてサンプリング値のいずれか1つのグループまたはいずれかのグループに対して、それぞれ1つのスケールファクタが使用できるかがシグナリングされる。これらのスケールファクタはサンプリング値のそれぞれのグループまたは複数のグループにおいて最も大きい信号値を有する。このグループまたはこれら複数のグループにおけるその他の信号値はスケールファクタについて正規化される。
【0003】
受信器では情報源復号化時に誤り検出及び誤り訂正が行われる。このことは先行のチャネル復号化時においてそのような誤り検出及び誤り訂正が行われた後に実施される。情報源を復号化している間のこれらの誤り検出及び誤り訂正は、DABフレームにもスケールファクタにも関係する。このような場合にはディジタルオーディオデータはスケールファクタを用いて逆正規化され、オーディオデータの復号が行われる。
【0004】
発明の利点
独立請求項記載の特徴を備えた、本発明によるディジタルオーディオデータの復号化方法は、これに対して以下の利点を有する。すなわち、誤り訂正または誤り隠蔽を開始するために、妥当性検査によって誤りが検出される。本発明の方法は簡単であり、また時間の経過において跳躍的変化が生じないオーディオデータの特性を使用する。したがって有利には、オーディオデータに依存する時間的に相前後する基準値の比較形成は、誤りが存在するか否かについての信頼性のある結果につながる。
【0005】
本発明の方法は有利には簡単なものであり、あらゆるオーディオデコーダで実現することができる。これに加え本発明の方法を別のオーディオ復号化方式(標準方式)に適用することができる。これらの標準方式には、MPEG−1、MPEG−2及びMPEG−4が属する。これらの標準方式は固有の誤り計算方式を有することができるか、または有していない。
【0006】
従属請求項に記載されている特徴によって、独立請求項記載の有利な実施形態及び改善実施形態が可能である。
【0007】
これに加え多段の誤り検出が行われるのは有利である。何故ならば、上述の誤り検出方法及び誤り訂正方式に、例えばDABでは、別の誤りを発見するためにさらなる方式が追加されるからである。
【0008】
有利には本発明の方法では、DABにおいてはスケールファクタである基準値の間の密接な相関関係が、誤りが存在するか否かを確定するために使用される。オーディオデータでは、時間的に隣接可能なデータは相互に密接な相関関係になる。このことは音声及び音楽の特性である。
【0009】
殊に有利には指標が差分値形成または平均値形成を用いることにより検出され、これにより誤りが存在するか否かのわかりやすく且つ簡単な信頼性のある決定がなされる。さらに本発明の方法はまた信号形式には依存しない。何故ならばそれぞれの信号にとって最適な計算方式を使用できるからである。
【0010】
これに加え、誤りが存在するか否かの決定のシグナリングを、ビット列、有利にはフラッグを用いて行うことは有利であり、これによってこの決定を簡単に評価することができる。
【0011】
指標の評価と基準値の誤り検出とを結合することにより総合的な情報が生じる。この際指標の評価に重きが置かれる。何故ならばここでは時間的に相前後する基準値間の実質的な関係、すなわちオーディオデータ間の密接な相関関係が使用されるからである。
【0012】
さらには基準値、有利にはスケールファクタの他に、ディジタルオーディオデータ伝送に使用されるフレームも誤り検出を備えることは有利である。これによって簡単なやり方で二重の誤り保護が実現される。
【0013】
さらに有利には、周波数範囲でデータが伝送されない場合には、英語ではデフォルトと称すいわゆる標準値が基準値として記録され、またこれらの標準値がそのような基準値として識別されれば有利であり、その結果本発明の誤り検出はここでは行われない。つまりそうでないと、間違って誤りがあるとされてしまうからである。
【0014】
それに加え、適切な標準値を決定することができ、その結果誤り検出を全ての周波数値に対して行うことができる。ここで有利には誤りを示さない指標をもたらすそのような標準値が決定される。すなわち標準値が適切に決定される。これは本発明の方法を簡潔にする。何故ならば標準値の特例に備える必要がないからである。
【0015】
図面
本発明の実施例を図面に示し、以下詳細に説明する。ここで図1は、MPEGレイヤIIフレームを示し、図2は本発明の方法のブロック図を示す。
【0016】
実施例の説明
例えばDAB(Digital Audio Broadcasting)のようなディジタル伝送方法では、送信側においてはいわゆるスケールファクタが使用される。このスケールファクタをここでは以下基準値と称する。しかしながら以下ではさらに、オーディオデータに依存する他の特徴的なデータも基準値として使用できることが示されている。
【0017】
この基準値は連続する周波数範囲において最も強い信号値を表し、この最も強い信号値についてこの周波数範囲内のその他の信号値が正規化される。したがってオーディオ信号値の振幅間の最大差分が低減される。このような場合受信機においては、信号値は同様に伝送された基準値を用いて逆正規化される。
【0018】
例えばラジオ放送プログラム及び他のマルチメディアデータの移動無線受信に適しているDABの他に、ここで記述する方法は、DVB(Digital Video Broadcasting)及びDRM(Digital Radio Mondial)及び別の方式のような他のディジタル無線伝送方式にも適用される。
【0019】
DABのようなディジタル伝送方式では、送信器における情報源符号化によって散布量が、ディジタルの生データ、例えばPCM(Pulscodemodulation)データとしての音声データから得られる。伝送すべきデータを伝送誤りから保護するために、情報源符号化の後に冗長度がチャネル符号化において再び付加される。この冗長度は、チャネル復号をしている間の誤り検出及び誤り訂正を行うために受信側において使用される。これに加え、チャネル復号の後に続く情報源復号においては、また付加的に誤り検出及び誤り訂正が行われる。情報源復号の間の誤り検出及び必要に応じて誤り訂正は、チャネル復号によって既に復号されているデータについて行われる。しかしながら多くの誤りが生じた場合には、情報源復号中のこの誤り検出及び誤り訂正は機能せず、オーディオ品質は劣化する。誤り検出を情報源復号での誤り隠蔽とも解することができる。
【0020】
ディジタル符号化オーディオデータでは、訂正できない誤りは明確に識別可能な、したがって可聴の誤りになる可能性があり、この訂正できない誤りは聴取者にとって誤りのあるアナログオーディオ信号の場合よりもはるかに不快である。ここではすなわち非常に良好なオーディオ品質から非常に劣悪なオーディオ品質まで滑らかに遷移するので、品質が劣悪な場合であっても依然として有効信号は可聴である。
【0021】
このことはディジタルオーディオデータでは全く異なる。チャネル復号化時に受信側においてもはや発生した全ての誤りを訂正することができない場合には、DABでは先ずサンプリング値に被害が及び、激しい音をたてる妨害ノイズが生じる。誤りがますます生じると、基準値としてのスケールファクタにも被害が及び、その結果すさまじい音の妨害ノイズが生じる。さらに全体のフレームも反復的に誤りがあって伝送されると、ミューティングが開始される。
【0022】
したがってここでは、可聴な誤りの発生を絶対的に最小限に抑えるために、確実な誤り検出及び正確な誤り検出に最も重きが置かれる。
【0023】
したがって本発明によれば、誤りが存在するか否かを別の段階において確定するために、情報源復号化の際の付加的な誤り保護に適している指標が生成される。すなわちここでは、本発明の方法は既存の方法に加えて行われるものである。これはここでは、情報源復号化の際の基準値の誤り検出及び誤り訂正に該当する。さてここで誤りが存在する場合には、誤りがあるものとして識別された基準値が、記憶された先行の基準値と置換される。したがって基準値は2つの方法によって誤りについて監視される。
【0024】
択一的に本発明の方法は、ディジタルオーディオデータを復号する際の唯一の誤り検出としても作用することができる。何故ならば、他の誤り検出方式及びフレーム構造に依存しないからである。
【0025】
図1にはMPEG1レイヤIIフレームが図示されている。MPEG1レイヤIIフレームはフレームヘッダ(1)で始まり、このフレームヘッダ(1)にフレーム誤り検出用のフィールド(2)が続く。ここにはチェックサム(英語では巡回冗長検査コード(CRC)と称される)が挿入される。誤りのあるフレームがチェックサムをもとに検出されたならば、適切なフレームが誤りのあるフレームと置換される。例えば先行のフレームをこのために使用することができるか、または誤りのあるフレームに対するミューティングが行われる。択一的に予測も行うことができる。ここで正確に受信または訂正されたフレームから、訂正できないフレーム、したがって誤りのあるフレームが計算される。適切なモデルを用いてこれを評価することができ、したがって予測することができる。
【0026】
チェックサムは伝送効率の理由から、生じ得る全ての誤りは検出できないように構成されている。そのような場合チェックサムはうまく機能しない。チェックサムでは誤りが複数重なり合う場合には相互に訂正することができるが、その結果そのような場合には誤って、チェックサムによって誤りが検出されない。チェックサムの特徴はビット合計の検査であって、オーディオデータの内容に関する考察は、本発明の場合におけるように行われない。
【0027】
ビット割り当て用のフィールド3がこれに続く。DABでは、また別のディジタル伝送方式及び記録方式でも、オーディオ信号は量子化される。この際非直線的な量子化が行われ、心理聴覚的な量子化特性曲線を基礎とする。周波数に関して、音響スペクトルから傑出する音の近傍にあるノイズは耳ではもはや知覚されない。これをマスキング閾値と称す。これによって以下のことが可能となる。すなわち、マスキング閾値よりも下にあるそのようなノイズをデータから遠ざけることによってデータレートを引き下げる。ここではまた種々の周波数範囲が種々に細かくに量子化され、量子化の細分は量子化ノイズが依然としてマスキング閾値以下にあることによって決定される。周波数範囲毎のこの種々の量子化によって、種々多くのビットが周波数範囲毎に割り当てられることになる。例えばビット割り当ては周波数範囲毎に3ビットと16ビットの間で推移する。
【0028】
次のフィールド4には基準値選択が与えられる。周波数範囲について時間的に相前後する基準値が同一または少なくとも非常に近似した量を有するということは十分に考えられる。何故ならば出力はおおよそ一致しているからである。したがって、基準値がサンプリング値の時間的に相前後する別個の複数のグループを表す場合には、周波数範囲に対して複数の基準値を伝送する必要はない。このフィールド4には、どの基準値をサンプリング値のどのグループに対して逆正規化のために使用するべきかが記述されている。
【0029】
フィールド5には基準値自体が記憶されている。フィールド6には実際のオーディオデータがファイルされており、このオーディオデータは基準値でもって逆正規化される。フィールド7には付加データが存在し、この付加データはプログラムに添付された情報、特に後続のフレームの基準値のためのチェックサムを含む。
【0030】
図2は本発明の方法のブロック図を示す。入力側8にはオーディオデータが存在する。ブロック9において、先行のフレームの基準値について誤り検出が行われる。ブロック10では、目下のフレームから指標が抽出され、この指標では先行のフレームの基準値と目下のフレームの基準値とが相互に引かれる。合計が所定の閾値を上回れば、その差は2つの基準値間の相関関係が存在しないほど大きい。このことはオーディオデータでは本来的には生じ得ない。したがってこのような場合は誤りとして検出される。
【0031】
択一的に単なる差分形成の代わりに平均値形成も、例えば標準偏差を計算するために使用することができる。標準偏差が所定の閾値を上回ると、このことは誤りとして検出される。
【0032】
ブロック11には決定段が設けられており、この決定段は相前後する基準値の差分を所定の閾値と比較し、また相応の出力を形成する。すなわち、誤りが存在すればビットを1にセットし、誤りが存在しなければビットを0にセットする。このビットはフラッグとも称される。
【0033】
ブロック12では、基準値に対するブロック9での誤り検出とブロック11での指標解析を用いる誤り検出とが相互に結合される。ここで方法は、ブロック11によって過去のフレームの結果が使用されるように構成されており、したがってブロック9においても過去のフレームの基準値に対する誤り検出が行われる。結合部12は論理的OR結合を用いて誤りが存在するか否かの決定が確定されるように構成されており、すなわち誤りがあれば1がシグナリングされ、エラーがなければ0がシグナリングされ、その結果チェックサムを用いる誤り検出と指標解析との両方は、エラーが検出されないならば誤りを表示する必要はない。
【0034】
誤りが検出されたならば、誤り訂正方式または誤り隠蔽方式を使用する。これにはフレーム反復及び予測が属する。
【0035】
複数の周波数範囲では部分的にオーディオ情報は伝送されない。このオーディオ情報の代わりに標準値、デフォルトがプロットされる。別の基準値を有するデフォルトの差分形成は誤りを指示することができる。この標準値は特徴的である必要がある。この標準値は通常の場合オーディオデータでは生じず、その結果このような場合においては差分形成は行われず、またここではチェックサムを用いる基準値に対する誤り検出のみが行われる。すなわち、基準値の誤り検出用のフラッグがここで0にとどまる。択一的に標準値を、この標準値を用いて形成された指標が常に誤り検出用の閾値よりも下にあるように構成することもできる。したがって標準値は基準値に適応される。このような場合原則的には、簡単に相応の基準値を得ることもでき、その結果差分形成では0が生じる。
【0036】
ブロック13ではエラーが存在するか否かの決定がシグナリングされる。エラーが存在すれば、記憶された基準値が、正確に伝送された過去のフレームから誤りのある基準値の代わりに取られ、エラーが存在しなければ全ての基準値はこのフレームから使用される。
【0037】
ここで記述した基準値としてのスケールファクタの他に、別のデータもこのために使用することができる。このデータには利得ファクタが属し、この利得ファクタは周波数範囲ごとに最適な調整範囲を検出するために必要であり、またオーディオデータに依存する。しかしながらまた別のデータを本発明の方法に使用することができる。唯一の前提条件はオーディオデータの密接な相関関係である。
【図面の簡単な説明】
【図1】
MPEG1レイヤIIフレームである。
【図2】
本発明のブロック図である。
本発明は、独立請求項記載のディジタルオーディオ信号を復号するための方法に関する。
【0002】
DAB(Digital Audio Broadcasting)では送信側において、伝送すべきディジタルオーディオ信号の全体の周波数スペクトルが周波数範囲に分割されることが公知である。これらの周波数範囲は英語ではサブバンドと称される。周波数範囲毎に最大で3つのスケールファクタが基準値として確定される。各周波数範囲においては、ステレオ伝送でのチャネル毎に36サンプリング値が時間的に連続して形成される。36サンプリング値は、時間的に連続する別個のグループ毎に12サンプリング値に分割される。グループごとに最大で1つのスケールファクタが規定される。1つの周波数範囲の2つまたは3つ全てのスケールファクタが同じまたは少なくとも非常に近似した値であれば、これらのスケールファクタに対して1つのスケールファクタのみが伝送される。したがってサンプリング値及びスケールファクタが伝送されるDABフレーム内では、1つの周波数範囲についてサンプリング値のいずれか1つのグループまたはいずれかのグループに対して、それぞれ1つのスケールファクタが使用できるかがシグナリングされる。これらのスケールファクタはサンプリング値のそれぞれのグループまたは複数のグループにおいて最も大きい信号値を有する。このグループまたはこれら複数のグループにおけるその他の信号値はスケールファクタについて正規化される。
【0003】
受信器では情報源復号化時に誤り検出及び誤り訂正が行われる。このことは先行のチャネル復号化時においてそのような誤り検出及び誤り訂正が行われた後に実施される。情報源を復号化している間のこれらの誤り検出及び誤り訂正は、DABフレームにもスケールファクタにも関係する。このような場合にはディジタルオーディオデータはスケールファクタを用いて逆正規化され、オーディオデータの復号が行われる。
【0004】
発明の利点
独立請求項記載の特徴を備えた、本発明によるディジタルオーディオデータの復号化方法は、これに対して以下の利点を有する。すなわち、誤り訂正または誤り隠蔽を開始するために、妥当性検査によって誤りが検出される。本発明の方法は簡単であり、また時間の経過において跳躍的変化が生じないオーディオデータの特性を使用する。したがって有利には、オーディオデータに依存する時間的に相前後する基準値の比較形成は、誤りが存在するか否かについての信頼性のある結果につながる。
【0005】
本発明の方法は有利には簡単なものであり、あらゆるオーディオデコーダで実現することができる。これに加え本発明の方法を別のオーディオ復号化方式(標準方式)に適用することができる。これらの標準方式には、MPEG−1、MPEG−2及びMPEG−4が属する。これらの標準方式は固有の誤り計算方式を有することができるか、または有していない。
【0006】
従属請求項に記載されている特徴によって、独立請求項記載の有利な実施形態及び改善実施形態が可能である。
【0007】
これに加え多段の誤り検出が行われるのは有利である。何故ならば、上述の誤り検出方法及び誤り訂正方式に、例えばDABでは、別の誤りを発見するためにさらなる方式が追加されるからである。
【0008】
有利には本発明の方法では、DABにおいてはスケールファクタである基準値の間の密接な相関関係が、誤りが存在するか否かを確定するために使用される。オーディオデータでは、時間的に隣接可能なデータは相互に密接な相関関係になる。このことは音声及び音楽の特性である。
【0009】
殊に有利には指標が差分値形成または平均値形成を用いることにより検出され、これにより誤りが存在するか否かのわかりやすく且つ簡単な信頼性のある決定がなされる。さらに本発明の方法はまた信号形式には依存しない。何故ならばそれぞれの信号にとって最適な計算方式を使用できるからである。
【0010】
これに加え、誤りが存在するか否かの決定のシグナリングを、ビット列、有利にはフラッグを用いて行うことは有利であり、これによってこの決定を簡単に評価することができる。
【0011】
指標の評価と基準値の誤り検出とを結合することにより総合的な情報が生じる。この際指標の評価に重きが置かれる。何故ならばここでは時間的に相前後する基準値間の実質的な関係、すなわちオーディオデータ間の密接な相関関係が使用されるからである。
【0012】
さらには基準値、有利にはスケールファクタの他に、ディジタルオーディオデータ伝送に使用されるフレームも誤り検出を備えることは有利である。これによって簡単なやり方で二重の誤り保護が実現される。
【0013】
さらに有利には、周波数範囲でデータが伝送されない場合には、英語ではデフォルトと称すいわゆる標準値が基準値として記録され、またこれらの標準値がそのような基準値として識別されれば有利であり、その結果本発明の誤り検出はここでは行われない。つまりそうでないと、間違って誤りがあるとされてしまうからである。
【0014】
それに加え、適切な標準値を決定することができ、その結果誤り検出を全ての周波数値に対して行うことができる。ここで有利には誤りを示さない指標をもたらすそのような標準値が決定される。すなわち標準値が適切に決定される。これは本発明の方法を簡潔にする。何故ならば標準値の特例に備える必要がないからである。
【0015】
図面
本発明の実施例を図面に示し、以下詳細に説明する。ここで図1は、MPEGレイヤIIフレームを示し、図2は本発明の方法のブロック図を示す。
【0016】
実施例の説明
例えばDAB(Digital Audio Broadcasting)のようなディジタル伝送方法では、送信側においてはいわゆるスケールファクタが使用される。このスケールファクタをここでは以下基準値と称する。しかしながら以下ではさらに、オーディオデータに依存する他の特徴的なデータも基準値として使用できることが示されている。
【0017】
この基準値は連続する周波数範囲において最も強い信号値を表し、この最も強い信号値についてこの周波数範囲内のその他の信号値が正規化される。したがってオーディオ信号値の振幅間の最大差分が低減される。このような場合受信機においては、信号値は同様に伝送された基準値を用いて逆正規化される。
【0018】
例えばラジオ放送プログラム及び他のマルチメディアデータの移動無線受信に適しているDABの他に、ここで記述する方法は、DVB(Digital Video Broadcasting)及びDRM(Digital Radio Mondial)及び別の方式のような他のディジタル無線伝送方式にも適用される。
【0019】
DABのようなディジタル伝送方式では、送信器における情報源符号化によって散布量が、ディジタルの生データ、例えばPCM(Pulscodemodulation)データとしての音声データから得られる。伝送すべきデータを伝送誤りから保護するために、情報源符号化の後に冗長度がチャネル符号化において再び付加される。この冗長度は、チャネル復号をしている間の誤り検出及び誤り訂正を行うために受信側において使用される。これに加え、チャネル復号の後に続く情報源復号においては、また付加的に誤り検出及び誤り訂正が行われる。情報源復号の間の誤り検出及び必要に応じて誤り訂正は、チャネル復号によって既に復号されているデータについて行われる。しかしながら多くの誤りが生じた場合には、情報源復号中のこの誤り検出及び誤り訂正は機能せず、オーディオ品質は劣化する。誤り検出を情報源復号での誤り隠蔽とも解することができる。
【0020】
ディジタル符号化オーディオデータでは、訂正できない誤りは明確に識別可能な、したがって可聴の誤りになる可能性があり、この訂正できない誤りは聴取者にとって誤りのあるアナログオーディオ信号の場合よりもはるかに不快である。ここではすなわち非常に良好なオーディオ品質から非常に劣悪なオーディオ品質まで滑らかに遷移するので、品質が劣悪な場合であっても依然として有効信号は可聴である。
【0021】
このことはディジタルオーディオデータでは全く異なる。チャネル復号化時に受信側においてもはや発生した全ての誤りを訂正することができない場合には、DABでは先ずサンプリング値に被害が及び、激しい音をたてる妨害ノイズが生じる。誤りがますます生じると、基準値としてのスケールファクタにも被害が及び、その結果すさまじい音の妨害ノイズが生じる。さらに全体のフレームも反復的に誤りがあって伝送されると、ミューティングが開始される。
【0022】
したがってここでは、可聴な誤りの発生を絶対的に最小限に抑えるために、確実な誤り検出及び正確な誤り検出に最も重きが置かれる。
【0023】
したがって本発明によれば、誤りが存在するか否かを別の段階において確定するために、情報源復号化の際の付加的な誤り保護に適している指標が生成される。すなわちここでは、本発明の方法は既存の方法に加えて行われるものである。これはここでは、情報源復号化の際の基準値の誤り検出及び誤り訂正に該当する。さてここで誤りが存在する場合には、誤りがあるものとして識別された基準値が、記憶された先行の基準値と置換される。したがって基準値は2つの方法によって誤りについて監視される。
【0024】
択一的に本発明の方法は、ディジタルオーディオデータを復号する際の唯一の誤り検出としても作用することができる。何故ならば、他の誤り検出方式及びフレーム構造に依存しないからである。
【0025】
図1にはMPEG1レイヤIIフレームが図示されている。MPEG1レイヤIIフレームはフレームヘッダ(1)で始まり、このフレームヘッダ(1)にフレーム誤り検出用のフィールド(2)が続く。ここにはチェックサム(英語では巡回冗長検査コード(CRC)と称される)が挿入される。誤りのあるフレームがチェックサムをもとに検出されたならば、適切なフレームが誤りのあるフレームと置換される。例えば先行のフレームをこのために使用することができるか、または誤りのあるフレームに対するミューティングが行われる。択一的に予測も行うことができる。ここで正確に受信または訂正されたフレームから、訂正できないフレーム、したがって誤りのあるフレームが計算される。適切なモデルを用いてこれを評価することができ、したがって予測することができる。
【0026】
チェックサムは伝送効率の理由から、生じ得る全ての誤りは検出できないように構成されている。そのような場合チェックサムはうまく機能しない。チェックサムでは誤りが複数重なり合う場合には相互に訂正することができるが、その結果そのような場合には誤って、チェックサムによって誤りが検出されない。チェックサムの特徴はビット合計の検査であって、オーディオデータの内容に関する考察は、本発明の場合におけるように行われない。
【0027】
ビット割り当て用のフィールド3がこれに続く。DABでは、また別のディジタル伝送方式及び記録方式でも、オーディオ信号は量子化される。この際非直線的な量子化が行われ、心理聴覚的な量子化特性曲線を基礎とする。周波数に関して、音響スペクトルから傑出する音の近傍にあるノイズは耳ではもはや知覚されない。これをマスキング閾値と称す。これによって以下のことが可能となる。すなわち、マスキング閾値よりも下にあるそのようなノイズをデータから遠ざけることによってデータレートを引き下げる。ここではまた種々の周波数範囲が種々に細かくに量子化され、量子化の細分は量子化ノイズが依然としてマスキング閾値以下にあることによって決定される。周波数範囲毎のこの種々の量子化によって、種々多くのビットが周波数範囲毎に割り当てられることになる。例えばビット割り当ては周波数範囲毎に3ビットと16ビットの間で推移する。
【0028】
次のフィールド4には基準値選択が与えられる。周波数範囲について時間的に相前後する基準値が同一または少なくとも非常に近似した量を有するということは十分に考えられる。何故ならば出力はおおよそ一致しているからである。したがって、基準値がサンプリング値の時間的に相前後する別個の複数のグループを表す場合には、周波数範囲に対して複数の基準値を伝送する必要はない。このフィールド4には、どの基準値をサンプリング値のどのグループに対して逆正規化のために使用するべきかが記述されている。
【0029】
フィールド5には基準値自体が記憶されている。フィールド6には実際のオーディオデータがファイルされており、このオーディオデータは基準値でもって逆正規化される。フィールド7には付加データが存在し、この付加データはプログラムに添付された情報、特に後続のフレームの基準値のためのチェックサムを含む。
【0030】
図2は本発明の方法のブロック図を示す。入力側8にはオーディオデータが存在する。ブロック9において、先行のフレームの基準値について誤り検出が行われる。ブロック10では、目下のフレームから指標が抽出され、この指標では先行のフレームの基準値と目下のフレームの基準値とが相互に引かれる。合計が所定の閾値を上回れば、その差は2つの基準値間の相関関係が存在しないほど大きい。このことはオーディオデータでは本来的には生じ得ない。したがってこのような場合は誤りとして検出される。
【0031】
択一的に単なる差分形成の代わりに平均値形成も、例えば標準偏差を計算するために使用することができる。標準偏差が所定の閾値を上回ると、このことは誤りとして検出される。
【0032】
ブロック11には決定段が設けられており、この決定段は相前後する基準値の差分を所定の閾値と比較し、また相応の出力を形成する。すなわち、誤りが存在すればビットを1にセットし、誤りが存在しなければビットを0にセットする。このビットはフラッグとも称される。
【0033】
ブロック12では、基準値に対するブロック9での誤り検出とブロック11での指標解析を用いる誤り検出とが相互に結合される。ここで方法は、ブロック11によって過去のフレームの結果が使用されるように構成されており、したがってブロック9においても過去のフレームの基準値に対する誤り検出が行われる。結合部12は論理的OR結合を用いて誤りが存在するか否かの決定が確定されるように構成されており、すなわち誤りがあれば1がシグナリングされ、エラーがなければ0がシグナリングされ、その結果チェックサムを用いる誤り検出と指標解析との両方は、エラーが検出されないならば誤りを表示する必要はない。
【0034】
誤りが検出されたならば、誤り訂正方式または誤り隠蔽方式を使用する。これにはフレーム反復及び予測が属する。
【0035】
複数の周波数範囲では部分的にオーディオ情報は伝送されない。このオーディオ情報の代わりに標準値、デフォルトがプロットされる。別の基準値を有するデフォルトの差分形成は誤りを指示することができる。この標準値は特徴的である必要がある。この標準値は通常の場合オーディオデータでは生じず、その結果このような場合においては差分形成は行われず、またここではチェックサムを用いる基準値に対する誤り検出のみが行われる。すなわち、基準値の誤り検出用のフラッグがここで0にとどまる。択一的に標準値を、この標準値を用いて形成された指標が常に誤り検出用の閾値よりも下にあるように構成することもできる。したがって標準値は基準値に適応される。このような場合原則的には、簡単に相応の基準値を得ることもでき、その結果差分形成では0が生じる。
【0036】
ブロック13ではエラーが存在するか否かの決定がシグナリングされる。エラーが存在すれば、記憶された基準値が、正確に伝送された過去のフレームから誤りのある基準値の代わりに取られ、エラーが存在しなければ全ての基準値はこのフレームから使用される。
【0037】
ここで記述した基準値としてのスケールファクタの他に、別のデータもこのために使用することができる。このデータには利得ファクタが属し、この利得ファクタは周波数範囲ごとに最適な調整範囲を検出するために必要であり、またオーディオデータに依存する。しかしながらまた別のデータを本発明の方法に使用することができる。唯一の前提条件はオーディオデータの密接な相関関係である。
【図面の簡単な説明】
【図1】
MPEG1レイヤIIフレームである。
【図2】
本発明のブロック図である。
Claims (11)
- フレーム内のディジタルオーディオデータを受信し、該ディジタルオーディオデータを復号する、ディジタルオーディオデータの復号方法において、
復号の際にフレームからディジタルオーディオデータに依存する基準値を取り出し、該取り出しを該基準値を用いて指標を形成するために行い、
該指標を所定の閾値と比較し、
該指標が閾値を上回る場合には、閾値を上回ったことをシグナリングによって指示することを特徴とする、ディジタルオーディオデータの復号方法。 - 前記ディジタルオーディオ信号を相前後する周波数範囲に分割し、それぞれ1つの周波数範囲に対するディジタルオーディオデータを、少なくとも1つの基準値、有利にはスケールファクタを用いて、それぞれの周波数範囲について逆正規化し、
それぞれの周波数範囲に対する少なくとも1つの基準値を、指標を形成するためにそれぞれの該周波数範囲に対する先行の基準値と比較する、請求項1記載の方法。 - 前記指標を、基準値と少なくとも1つの先行の基準値との差分形成または平均値形成によって形成する。請求項1または2記載の方法。
- シグナリングをビット列、有利にはフラッグを用いて表示する、請求項2又は3記載の方法。
- 前記ビット列を誤り検出用の指示と比較する、請求項4記載の方法。
- 各フレームに対して誤り検出を行う、請求項5記載の方法。
- 前記フレームは、フレームヘッダ(1)と、フレームの誤り検出用のフィールド(2)と、ビット割り当て用のフィールド(3)と、基準値の選択用のフィールド(4)と、基準値用のフィールド(5)と、ディジタルオーディオデータ用のフィールド(6)と、付加データフィールド(7)とを有する、請求項6記載の方法。
- 前記付加データフィールド(7)は基準値に対する誤り検出用のデータを有する、請求項7記載の方法。
- フレームとしてMPEG1レイヤIIフレームを使用する、請求項8記載の方法。
- 周波数範囲に標準値を基準値としてプロットする場合には、該標準値と先行の基準値との比較は行われない、請求項1から9のいずれか1項記載の方法。
- 先行の基準値との比較が、所定の閾値以下である指標をもたらすように前記標準値を形成する、請求項1から10のいずれか1項記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19959038A DE19959038A1 (de) | 1999-12-08 | 1999-12-08 | Verfahren zur Dekodierung von digitalen Audiodaten |
PCT/DE2000/003896 WO2001043320A2 (de) | 1999-12-08 | 2000-11-07 | Verfahren zur dekodierung von digitalen audiodaten |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004500599A true JP2004500599A (ja) | 2004-01-08 |
Family
ID=7931774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001543884A Withdrawn JP2004500599A (ja) | 1999-12-08 | 2000-11-07 | ディジタルオーディオデータの復号方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7080006B1 (ja) |
EP (1) | EP1238481B1 (ja) |
JP (1) | JP2004500599A (ja) |
DE (2) | DE19959038A1 (ja) |
WO (1) | WO2001043320A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005345993A (ja) * | 2004-06-07 | 2005-12-15 | Sony Corp | 音響復号装置及び音響復号方法 |
JP2008209908A (ja) * | 2007-02-27 | 2008-09-11 | Sharp Corp | 送受信方法、送受信装置及びプログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004522198A (ja) * | 2001-05-08 | 2004-07-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声符号化方法 |
US7428684B2 (en) | 2002-04-29 | 2008-09-23 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Device and method for concealing an error |
DE10219133B4 (de) * | 2002-04-29 | 2007-02-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verschleiern eines Fehlers |
US7580476B2 (en) * | 2003-06-26 | 2009-08-25 | Northrop Grumman Corporation | Communication system and method for improving efficiency and linearity |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4831624A (en) * | 1987-06-04 | 1989-05-16 | Motorola, Inc. | Error detection method for sub-band coding |
US5091945A (en) * | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
DE4202140A1 (de) | 1992-01-27 | 1993-07-29 | Thomson Brandt Gmbh | Verfahren zur uebertragung digitaler audio-signale |
US5617333A (en) * | 1993-11-29 | 1997-04-01 | Kokusai Electric Co., Ltd. | Method and apparatus for transmission of image data |
DE4409960A1 (de) * | 1994-03-23 | 1995-09-28 | Inst Rundfunktechnik Gmbh | Verfahren zur Verminderung der subjektiven Störempfindung bei störungsbehaftetem Empfang bei Verwendung von digital übertragenen Tonsignalen |
JP3046213B2 (ja) * | 1995-02-02 | 2000-05-29 | 三菱電機株式会社 | サブバンド・オーディオ信号合成装置 |
JP2757818B2 (ja) * | 1995-04-20 | 1998-05-25 | 日本電気株式会社 | 補助データ処理回路 |
EP0976216B1 (de) * | 1997-02-27 | 2002-11-27 | Siemens Aktiengesellschaft | Verfahren und anordnung zur rahmenfehlerdetektion zwecks fehlerverdeckung insbesondere bei gsm übertragungen |
DE19735675C2 (de) * | 1997-04-23 | 2002-12-12 | Fraunhofer Ges Forschung | Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom |
US6208959B1 (en) * | 1997-12-15 | 2001-03-27 | Telefonaktibolaget Lm Ericsson (Publ) | Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel |
DE19921122C1 (de) * | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
US6208699B1 (en) * | 1999-09-01 | 2001-03-27 | Qualcomm Incorporated | Method and apparatus for detecting zero rate frames in a communications system |
US6728323B1 (en) * | 2000-07-10 | 2004-04-27 | Ericsson Inc. | Baseband processors, mobile terminals, base stations and methods and systems for decoding a punctured coded received signal using estimates of punctured bits |
-
1999
- 1999-12-08 DE DE19959038A patent/DE19959038A1/de not_active Ceased
-
2000
- 2000-11-07 US US10/149,317 patent/US7080006B1/en not_active Expired - Fee Related
- 2000-11-07 JP JP2001543884A patent/JP2004500599A/ja not_active Withdrawn
- 2000-11-07 WO PCT/DE2000/003896 patent/WO2001043320A2/de active IP Right Grant
- 2000-11-07 DE DE50014248T patent/DE50014248D1/de not_active Expired - Lifetime
- 2000-11-07 EP EP00981165A patent/EP1238481B1/de not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005345993A (ja) * | 2004-06-07 | 2005-12-15 | Sony Corp | 音響復号装置及び音響復号方法 |
JP4539180B2 (ja) * | 2004-06-07 | 2010-09-08 | ソニー株式会社 | 音響復号装置及び音響復号方法 |
JP2008209908A (ja) * | 2007-02-27 | 2008-09-11 | Sharp Corp | 送受信方法、送受信装置及びプログラム |
JP4698688B2 (ja) * | 2007-02-27 | 2011-06-08 | シャープ株式会社 | 送受信方法、送受信装置及びプログラム |
US7965978B2 (en) | 2007-02-27 | 2011-06-21 | Sharp Kabushiki Kaisha | Transmitting/receiving method, transmitter/receiver, and recording medium therefor |
Also Published As
Publication number | Publication date |
---|---|
US7080006B1 (en) | 2006-07-18 |
EP1238481B1 (de) | 2007-04-11 |
WO2001043320A2 (de) | 2001-06-14 |
WO2001043320A3 (de) | 2002-02-14 |
DE50014248D1 (de) | 2007-05-24 |
EP1238481A2 (de) | 2002-09-11 |
DE19959038A1 (de) | 2001-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0214235B1 (en) | Error detection and concealment using predicted signal values | |
US6985856B2 (en) | Method and device for compressed-domain packet loss concealment | |
US7069208B2 (en) | System and method for concealment of data loss in digital audio transmission | |
US6687670B2 (en) | Error concealment in digital audio receiver | |
CN102779519B (zh) | 用于同步多声道扩展数据与音频信号以及用于处理音频信号的装置和方法 | |
US7478309B2 (en) | Transmission line coding method, transmission line decoding method, and apparatus therefor | |
US20040250195A1 (en) | Audio decoder and audio decoding method | |
KR20120064720A (ko) | 오디오 코덱을 갖는 보청기 및 방법 | |
JP2012113318A (ja) | デジタルオーディオデータ復号化方法 | |
JP2004500599A (ja) | ディジタルオーディオデータの復号方法 | |
US7028249B2 (en) | Method and apparatus for protecting lossless transmission of a data stream | |
KR100708123B1 (ko) | 자동으로 오디오 볼륨을 조절하는 방법 및 장치 | |
CA2415424C (en) | Method for error masking of transmission errors in digital audio data | |
JP3649854B2 (ja) | 音声符号化装置 | |
Wang | A Beat-Pattern based Error Concealment Scheme for Music Delivery with Burst Packet Loss. | |
KR20010012668A (ko) | 디지탈 정보신호를 인코딩된 형태 및 인코딩되지 않은형태로 교대로 송신하는 송신장치 | |
JPH1022936A (ja) | 補間装置 | |
US10763885B2 (en) | Method of error concealment, and associated device | |
JP2705201B2 (ja) | 適応後置フイルタ制御方法 | |
Plenge et al. | Combined channel coding and concealment | |
JPH0736496A (ja) | 伝送誤り補償装置 | |
JPH08223126A (ja) | 音声品質改善回路 | |
JPS6337536B2 (ja) | ||
JP2000022551A (ja) | Pcm信号符号化装置及びpcm信号復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071106 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20100324 |