JP6906876B2 - オーディオ信号の符号化および復号化 - Google Patents

オーディオ信号の符号化および復号化 Download PDF

Info

Publication number
JP6906876B2
JP6906876B2 JP2019565426A JP2019565426A JP6906876B2 JP 6906876 B2 JP6906876 B2 JP 6906876B2 JP 2019565426 A JP2019565426 A JP 2019565426A JP 2019565426 A JP2019565426 A JP 2019565426A JP 6906876 B2 JP6906876 B2 JP 6906876B2
Authority
JP
Japan
Prior art keywords
adaptive
data block
data
digital data
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019565426A
Other languages
English (en)
Other versions
JP2020524293A (ja
Inventor
イェンス トフガール ペーターセン、
イェンス トフガール ペーターセン、
Original Assignee
アールティーエックス アー/エス
アールティーエックス アー/エス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アールティーエックス アー/エス, アールティーエックス アー/エス filed Critical アールティーエックス アー/エス
Publication of JP2020524293A publication Critical patent/JP2020524293A/ja
Application granted granted Critical
Publication of JP6906876B2 publication Critical patent/JP6906876B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3044Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
    • H03M7/3046Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM] adaptive, e.g. adaptive differential pulse code modulation [ADPCM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ伝送およびオーディオコーデックの分野に関する。特に、本発明は、ライブパフォーマンスにおけるマイクロフォンや楽器からのオーディオ信号のような、低遅延かつパケット損失に対する高い耐性を備えた高品質デジタルオーディオ信号の無線伝送の分野に関する。
ヘッドセット、マイクロフォン、およびモニタスピーカなどといったリアルタイム双方向オーディオアプリケーションでは、通常、最小限の遅延の通信装置が必要となる。例えば無線伝送のためなど、ビットレートが制限されたデジタル伝送が所望される場合、オーディオ符号化方式の制約は厳しくなる。このようなアプリケーションの場合、適応差動パルス符号変調(ADPCM)に基づくサンプルごとの符号化方式は、魅力的な低遅延を提供する。しかしながら、無線伝送システムは、伝送エラーおよびデータ損失の影響を受けやすい。オーディオ符号化方式は、このような事態を適切な方法で処理し、可能な限り妨害を最小限に抑えなければならない。
現在、使用される圧縮アルゴリズムによって、より長い遅延を受け入れることが通常の慣行である。より少ない圧縮、すなわちサンプルあたりより多くのビットを使用して、かなり低い品質を得て、すなわち所与のビットレートでより少ないSNRを得て、パケット損失によって引き起こされるより多くのアーチファクトを受け入れている。
したがって、上記の説明によれば、本発明の目的は、無線伝送などの不完全な伝送に対してロバストであって、しかも低遅延の入力信号を符号化する方法を提供することである。
第1の態様において、本発明は、デジタル入力信号を符号化する方法であって、前記方法は、
−量子化器による適応量子化および予測器による予測を含む適応差動パルス符号変調(ADPCM)符号化アルゴリズムをデジタル入力信号の時間ブロックに適用し、ADPCMデータビットを適宜生成することと、
−前記適応量子化の内部値を表す少なくとも1つのデータビットを生成することと、
−前記適応量子化の前記内部値を表す前記少なくとも1つのデータビットと、前記適応差動パルス符号変調データビットとを含むデジタルデータブロックを生成することと、
を備える、方法を提供する。
このような方法は、例えばデジタルオーディオ信号の低遅延圧縮を可能にし、同時に、この方法は、例えば伝送エラー又はデータブロックの損失の場合に可聴アーチファクトを最小限にするために、無線伝送に関連するデータブロックの損失の処理に関してロバストである。データブロックに含まれる追加データに基づき、この方法は、対応する内部の適応量子化値を復号器側のデータブロックで表される値に適応させることを可能にし、それによって、伝送エラー後の適応の高速化、またはデータブロックの完全な損失の処理後の可聴アーチファクトの最小化を可能にする。この効果は、例えばADPCMデータブロック内のヘッダなどとして含まれる、各データブロック内の余分なビットを最小限に抑えて得ることができるものであり、したがって、例えば無線マイクロフォンまたはライブパフォーマンス用の無線楽器送信機のパフォーマンスを効率的に改善することができる。
さらなる改善された実施形態では、ADPCM符号化の予測部分の内部値を表すデータの形態で、追加情報をデータブロックに追加することができる。例えば、予測フィルタ係数を含めることによって、復号器は、伝送エラー後により速く適応することと、フィルタの不安定性の問題を防止することと、および/または漏れの少ない予測フィルタを使用することができる。
以下に、本発明の好ましい特徴および実施形態を説明する。
適応量子化の内部値を表す少なくとも1つのデータビットは、適応量子化の内部値のlog2符号化といった、適応量子化の内部値の対数符号化バージョンを特に表してもよい。特に、少なくとも1つのデータビットは、適応量子化の一部を形成するスケーリングファクタなどといった、適応量子化の内部値の対数符号化バージョンの切り捨てバージョンを表してもよく、例えば、適応量子化の包絡推定器に関連して使用されるスケーリングファクタである。
適応量子化の内部値を表す少なくとも1つのデータビットは、各データブロックにおいて4から12bit、例えば8bitであってもよい。
前記予測は、例えば格子形有限インパルス応答フィルタなどといった、有限インパルス応答フィルタに基づく予測器を含むものであってもよく、前記有限インパルス応答フィルタは、複数の有限インパルス応答フィルタ係数を有する。
本方法は、適応差動パルス符号変調符号化アルゴリズムの予測の内部値を表す少なくとも1つのデータビットを生成することと、適応量子化の内部値を表す前記少なくとも1つのデータビットと、予測の内部値を表す前記少なくとも1つのデータビットと、適応差動パルス符号変調データビットと、を含むデジタルデータブロックを生成することと、をさらに含んでもよい。特に、予測部分に格子形FIRフィルタを有する実施形態において、少なくとも1つのデータビットが、前記有限インパルス応答フィルタ係数のうちの少なくとも1つの切り捨てられたバージョンを表してもよい。特に、予測の内部値を表す少なくとも1つのデータビットは、多重化された方法で、デジタルデータブロックのストリームに含まれる。具体的には、各デジタルデータブロックが、複数のFIRフィルタ係数のうちの1つのFIRフィルタ係数の切り捨てられたバージョンに応じて生成されたデータビットを含んでもよい。特に、各フィルタ係数は、例えば8個の最上位ビットなど、4から12個の最上位ビットに切り捨てられてもよい。
この方法は、固定小数点プロセッサアーキテクチャを有するプロセッサによって実行されてもよい。この用途に、前記ADPCM符号化アルゴリズムを適用する前に、ディザノイズを前記デジタル入力信号に付加してもよい。
この方法は、DECT、Bluetooth(登録商標)、Bluetooth LE、Wi−Fi(登録商標)、2.4GHz ISM帯域、5.8GHz ISM、またはデジタルUHF無線信号などの無線周波数信号として表されるデジタルデータブロックを送信することを含んでもよい。
本方法は、デジタル入力信号の連続した時間ブロックを符号化することと、それに応じて、適応量子化の内部値を表す少なくとも1つのデータビットとADPCMデータビットとを各々が含む連続したデジタルデータブロックを生成することと、を備えることが好ましく、それによって、低遅延での無線ライブオーディオストリーミングが可能になることを理解されたい。
この方法は、オーディオに非常に適していることが分かっており、したがって、実施形態では、デジタル入力信号はデジタルオーディオ信号である。
第2の態様において、本発明は、量子化器による適応量子化と、予測器による予測とを含むADPCM復号化アルゴリズムに従って、ADPCM符号化デジタル信号を復号する方法であって、前記方法は、
−ADPCM符号化アルゴリズムに含まれる適応量子化の内部値を表す少なくとも1つのデータビットと、ADPCMデータビットと、を含むデジタルデータブロックを受信することと、
−前記内部値と前記少なくとも1つのデータビットによって表される値との間に所定の閾値を超える差分が検出された場合に、
前記ADPCM符号化アルゴリズムに含まれる前記適応量子化の前記内部値を表す、受信された前記少なくとも1つのデータビットに従って、前記ADPCM復号化アルゴリズムに含まれる前記適応量子化の内部値を調整することと、
−受信されたADPCMデータビットに従ってデジタル出力信号を生成することと、
を備える、方法を提供する。
復号器側において、ADPCM符号化の内部値を表す、受信された少なくとも1つのデータビットを利用することで、例えば、データブロックが無線周波数伝送チャネルを介して受信される場合に、エラーの影響を低減することが可能である。この方法は、前記デジタルデータブロックを表す無線周波数信号を受信することと、前記データブロックがエラーを伴って受信されたかどうかを検出することと、を備えることが好ましい。前記データブロックがエラーを伴って受信されたことが検出された場合、前記適応量子化に関連する適応逆量子化器の出力(逆量子化コードブックの出力)をゼロに設定することが好ましい場合がある。さらに、またはあるいは、前記データブロックがエラーを伴って受信されたことが検出された場合、前記予測器における漏れをゼロに設定するといったように、前記予測器における漏れを調整することが好ましい場合がある。
第3の態様において、本発明は、第1の態様による方法に従って、デジタル入力信号を符号化し、デジタルデータブロックを生成するように構成された符号器、を備える、符号器装置を提供する。特に、符号器装置は、符号器によって生成されたデジタルデータブロックを表す無線周波数信号を送信するように構成された無線周波数送信機を備えてもよい。符号器および無線周波数送信機は、同じ筐体内に配置されてもよく、別個の構成要素として配置されてもよい。
第4の態様において、本発明は、第2の態様による方法に従って、受信されたデジタルデータブロックを復号するように構成された復号器、を備える、復号器装置を提供する。特に、復号器装置は、デジタルデータブロックを表す無線周波数信号を受信するように構成された無線周波数受信機を備えてもよい。復号器および無線周波数受信機は、同じ筐体内に配置されてもよく、別個の構成要素として配置されてもよい。
第5の態様において、本発明は、
−第1の態様による方法に従って、デジタル入力信号を符号化し、デジタルデータブロックを生成するように構成された符号器と、
−前記符号器によって生成された前記デジタルデータブロックを表す無線周波数信号を送信するように構成された無線周波数送信機と、
−前記符号器によって生成された前記デジタルデータブロックを表す前記無線周波数信号を受信するように構成された無線周波数受信機と、
−第2の態様による方法に従って、受信したデジタルデータブロックを復号するように構成された復号器と、
を備える、システムを提供する。
特に、システムは、音響入力に従ってデジタル入力信号を生成するように構成されたマイクロフォンなどのオーディオソースを備えてもよい。
第6の態様において、本発明は、実行されると、プロセッサを備える演算装置またはシステムに、第1の態様による方法を実行させる命令を有する、コンピュータプログラム製品を提供する。
第7の態様において、本発明は、実行されると、プロセッサを備える演算装置またはシステムに、第2の態様による方法を実行させる命令を有する、コンピュータプログラム製品を提供する。
言及されたコンピュータプログラム製品は、専用装置のためのプログラム製品、または汎用コンピュータのためのスタンドアロンのソフトウエア製品であってもよい。プログラムコードの形態であるコンピュータプログラム製品の命令は、例えば、専用オーディオ機器など任意の処理プラットフォームに実装され得たり、例えばプログラマブルデバイスのためのダウンロード可能なアプリケーションの形態によりコンピュータデバイス内の汎用プロセッサに実装され得たりするものであることを理解されたい。
特に、第6及び第7の態様のコンピュータプログラム製品は、コンピュータ可読媒体に格納されてもよく、電子チップに格納されてもよい。例えば、プログラムコードは、中央演算処理装置、デジタル信号プロセッサ、またはフィールドプログラマブルゲートアレイにおいて実装することができる。
本発明の全ての態様の適用分野は、無線ヘッドセット(例えば、ゲーミングヘッドセット)、無線マイクロフォン(例えば、ステージマイクロホン)、無線回線エクステンダ又はインタフェース(例えば、楽器用)、無線スピーカー、無線インターコムシステムなどである。
第1の態様について説明したものと同じ利点および実施形態が、第2、第3、第4、第5、第6、および第7の態様にも適用されるものと理解される。さらに、記載された実施形態は、言及されたすべての態様の間で任意の方法で混合され得ることが理解される。
ここで、添付の図面に関して本発明をより詳細に説明する。
符号化方法の実施形態の簡単なブロック図を示す。 符号化アルゴリズムの実施形態を示す。 復号化アルゴリズムの実施形態を示す。 デジタルデータブロックフォーマットの例を示す。 無線オーディオ信号送信の実施形態のステップを示す。
図面は、本発明を実施する特定の方法を示すもので、添付の特許請求の範囲に含まれる他の可能な実施形態を制限するものと解釈されるべきではない。
図1は、本発明による、例えば、デジタルオーディオ信号といったデジタル入力信号A_Iを符号化するためのADPCM符号化方法の実施形態を簡単な形式で示すブロック図である。デジタル入力信号A_Iの時間ブロックは、量子化器による適応量子化ADQおよび予測器による予測PRを含む適応差動パルス符号変調ADPCM符号化アルゴリズムに投入される。これに応じて、ADPCMデータビットAPMが生成される。これらのデータビットAPMは、復号器がデータビットAPMを復号し、それに応じてデジタル入力信号のレプリカを生成することを可能にする。さらに、符号化方法は、適応量子化ADQの内部値を表す少なくとも1つのデータビットQBを生成することを含む。またさらに、符号化方法は、ADPCMアルゴリズムの予測PRの内部値を表す少なくとも1つのデータビットCFBを生成することを含む。
したがって、符号化アルゴリズムの内部値を表す追加のデータビットQB、CFBは、ADPCMデータビットAPMそれ自身とは別に生成され、これらのデータQB、CFB、APMのすべては、デジタルデータブロック(破線のボックス)に含まれ、デジタルデータブロックは、次いで、例えば、データブロックを復号器に送信する無線周波数送信機に出力される。
符号化アルゴリズムの内部値を表すこれらの余分なデータビットQB、CFBは、復号化アルゴリズムにおいて、最後に受信された内部値を、適応量子化および予測それぞれの対応する内部値の最良の推定値として使用することによって、復号器が、伝送エラーまたはデータブロックの損失に、より良く適応することを可能にする。これにより、伝送エラーおよび/またはデータブロックの損失の場合に、デジタル入力信号A_Iをより少ないアーチファクトで復号器側にて再生させることができる。
したがって、このようなADPCM符号化/復号化方式は、デジタル伝送システムによって伝送されるビットレートを低くし、しかも不完全な無線伝送システムを介して伝送される場合に、復号器が、深刻なアーチファクトなしにロバストな方法で入力信号を復元することが可能である。
図2は、4つの主要な構成要素、適応量子化器、適応逆量子化器、予測器、およびノイズ整形フィルタを有する、特定の符号器の実施形態を示す。特定の符号器は、例えば、24bitの48kHzサンプリング周波数といった、高品質のデジタルオーディオ入力信号A_Iを符号化するのに適している。しかし、この設計は、他の入力信号にも使用できることを理解されたい。
適応量子化器は、符号器入力信号と予測器LPRの出力との間の差分を出力する。この差分は、伝送システムにおける転送のために、量子化器Qにおいて量子化され、より低いビットレートに低減される、すなわち、ADPCMデータビットAPMである。同じ低ビットレートデータは、適応逆量子化器である逆量子化コードブックDQにも供給される。逆量子化器の出力は、フィードバックされ、予測器の出力に加えられる。これら2つの信号を合わせたものが、入力信号の復元を構成し、次の入力信号の処理のために予測器に供給される。適応量子化器および適応逆量子化器は、ルックアップおよび量子化のための、適応スケーリング値とコードブックDQとを有する。適応スケーリング値は、逆量子化器出力包絡、つまり包絡推定器EEからの出力がフィルタリングされた推定値である。必要とされる符号化ビットレートおよび品質に応じて、異なるコードブックDQサイズを使用することができる。コードブックは、1から4bitのオーディオサンプルの異なる符号化比に対応する2から16のエントリを有するのが好ましい。
ADPCMデータビットAPMとは別に、適応量子化に使用される適応逆量子化スケーリングファクタ、すなわち包絡推定器EEからの出力は、log2を使用して符号器L2によって符号化され、さらに切り捨てられる。ADPCM符号化アルゴリズムの適応量子化部分からの、この符号化され切り捨てられたスケーリングファクタQBは、次に、例えばデータブロックのヘッダ部において、ADPCMデータビットAPMと共に出力ストリームに出力される。この内部データQBは、4から16bitなどであってもよく、例えば8bitなら、高品質オーディオ信号に適している。
予測器は、オーディオ信号の確定的部分をモデル化する格子形FIRタイプの適応フィルタLPRを含む。FIRフィルタLPRは、8から20個のタップなどといった、例えば2から40個のタップを有することができ、特定の実施形態においては13個のタップを有する。FIRフィルタLPRは、漸進的なタップ漏れを用いて実施することができる。適応は、勾配適応格子形アルゴリズムGALを使用して実行される。予測器の出力はフィードバックされ、適応量子化器への入力から減算される。したがって、適応量子化器の低ビットレート出力は、理想的には、オーディオ信号の非確定的部分のみを含む。入力信号と復元された信号との間の差分は、符号化スキームによって導入される符号化エラーである。
予測フィルタLPRがオーディオ信号に適応した場合、符号化エラーは、ほぼホワイトノイズとなる。この符号化エラーは、可聴性を低減するために、符号化ノイズのスペクトル整形のための追加のフィルタによって符号器入力にフィードバックされる。これは、いわゆるノイズ整形フィルタであり、静的部H_sおよび適応部H_aを有する。静的フィルタH_sは、ノイズエネルギーをスペクトルの下部から上部にシフトし、適応フィルタH_aは、ノイズのスペクトルを入力信号のスペクトルと同様になるように整形する。このノイズ整形フィルタの適応部H_aのフィルタ係数は、復元されたオーディオ信号のスペクトルを表す予測器適応フィルタLPRから導出される。
ADPCM符号化アルゴリズムの適応量子化部からの追加の内部値QBに加えて、さらなる内部データ、すなわち予測フィルタLPRのFIRフィルタ係数を表すデータCFBが、符号器からのデータストリームに含まれる。これらのデータに必要とされる帯域幅を制限するために、係数は切り捨て(Tr)られ、それらは、例えば、データブロック当たり1つの係数で、連続的に転送されてもよく、したがって、長さXのフィルタがX以上の連続したデータブロックの手段によって完全に転送されることを保証する、多重化された方法でFIRフィルタ係数を転送する。したがって、特定の符号化実施形態では、1つのデータブロックが、適応量子化からの内部値QBと、格子形予測FIRフィルタLPRからの1つのFIR係数CFBとを含む。係数は、通常、4から12個の最上位ビットに切り捨て(Tr)られる。8個の最上位ビットへの切り捨ては、あまり正確さを失うことなく、格子FIRフィルタタイプLPRに対して可能である。
符号器計算が、固定小数点実装のような有限の精度で実施される場合、符号器の適切かつ線形挙動を保証するために、弱いホワイトノイズディザリング信号DNが、符号化アルゴリズムにおけるさらなる処理の前に入力信号A_Iに追加される。
符号化/復号化は、異なるパケットサイズおよびオーバーヘッド比で構成され、使用されることができる。サンプル当たり4、3.6、3.33、3、2.6、2または1.66ビットへの圧縮のための異なるコードブックサイズを得ることができる。
図3は、図2の符号化アルゴリズムと一致する復号化アルゴリズムを示し、したがって、符号器からデータQB、CFB、およびAPMを含むデータブロックを受信し、それに応じて復元出力信号A_Oを生成するように構成される。もちろん、復号器は、包絡推定器EEへの入力としてスケーリングファクタに到達するために、データQBを復号(E2)することによって(つまり、exp2復号)、データQBを復号するように構成される。さらに、単一のFIRフィルタ係数は、予測格子形FIRフィルタLPRへの入力として、順次処理(PS)される。
復号化アルゴリズムは、適応逆量子化器および予測器を備える。入力低レートビットAPMは、適応逆量子化器に供給され、この出力は、符号器においてと同一のやり方で予測器出力に加えられる。この合わせたものは、復号器からの復元出力信号を構成し、次のオーディオサンプルの復号のために予測器に供給される。
符号器および復号器における適応逆量子化器は、低ビットレートデータAPMの同一のシーケンスで動作しているので、それらは同一の信号を出力し、符号器および復号器における予測器適応フィルタLPRも同一の信号を生成し、符号器および復号器における信号および復元された信号は同一である。
同一の開始条件であって、符号器から復号器への伝送エラーがないと仮定した場合、適応逆量子化器および予測器からのすべての内部状態および生成された信号は、符号器および復号器において同一である。しかしながら、符号器および復号器が異なる状態から開始された場合、または伝送エラーが発生した場合、符号器および復号器における適応逆量子化器および予測器は、同一の状態を有さず、同一の復元信号を生成しない。予測器からのフィードバックに基づき、差分は、次に続く全てのサンプルについて継続する。復号器における復元された信号が、符号器における対応する信号に収束することを保証するために、符号器および復号器の両方の適応アルゴリズムに漏れが加えられる。適応逆量子化器は、共通のスケーリング値に向けた小さなバイアスを加えられる。予測器適応フィルタにおいては、1より小さいスケーリングファクタを適応アルゴリズムGALに導入することが可能である。漏れがあると、予測器の予測精度を低下させ、符号化エラーを増加させ、符号器および復号器の性能を低下させる。漏れが大きくなると、伝送エラーの後の、復号器出力が符号器入力信号に収束するまでの時間が短縮されるが、符号化エラーも増大する。オーディオ品質の劣化を避けるために、より小さい漏れを使用することが望ましい。しかしながら、漏れが小さいと、データ損失の後の、出力オーディオが回復するまでの時間を増加させる。より小さな漏れが使用される場合、有限語長の実行による量子化効果でさえ、リミットサイクルの不安定性および非線形性を引き起こし得る。
小さな漏れの望ましい使用を補完するために、適応逆量子化器および予測器における適応フィルタの重要な状態に関する情報を与える追加データQB、CFBを使用することができる。重要な状態とは、適応逆量子化器で使用されるスケーリングファクタと、予測器における格子形FIRフィルタLPRのフィルタ係数である。したがって、データストリームにおいて利用可能な、QBやCFBに符号化されたこれらのデータを用いて、上述の漏れを低減することが可能であり、それによってコーデックの性能を向上させる。
図4は、無線リンクを介して送信されるデータブロックの例を示す。ADPCMデータの各ブロックは、符号器における適応量子化の内部値であるスケーリングファクタが、符号化され(log2)、切り捨てられた、例えば長さ8bitのバージョンのヘッダを有する。さらに、ヘッダに、例えば8個の最上位ビットなどに切り捨てられた予測器FIRフィルタ係数の係数Coef[x]1つが追加される。切り捨てられた係数Coef[x]は、通常、各データブロックに対して1つずつ、連続的に付加される。いくつかのデータブロックの後、例えば13個などといった全ての切り捨てられたフィルタ係数が転送される。全体として、適応量子化器の切り捨てられたスケーリングファクタ、切り捨てられた係数、および低ビットレートデータは、例えばCRCなどといった完全性検査情報も含むデータブロックまたはパケットで送信される。切り捨てられた適応量子化スケーリングファクタおよび係数情報は、復号器によるADPCMデータの処理より前の状態の値を表す。
無線データ受信機は、受信されたデータパケットの完全性をチェックすることができる。データパケットにエラーがある場合、適応逆量子化器DQは、ゼロ出力を生成するように命令される。このような場合、復元された出力信号は、予測器の出力と同じである。さらに、復号出力への損失データパケットの影響を最小限に抑えるために、損失データの期間中に予測器における漏れが除去されてもよい。
データパケットが無線受信機によってエラーなしで受信されると、切り捨てられた量子化スケーリングファクタおよびフィルタ係数が復号器に与えられる。復号器の内部状態値、適応逆量子化スケーリング値、および予測フィルタ係数が、切り捨てによって定義されるそれらのレゾリューションと大きく異なる場合、状態値は、復号処理の開始前に、切り捨てられた値によって示される値、すなわちQB、CFBデータに基づく値に設定される。このアプローチは、低ビットレートデータが生成されたときに符号器が使用する値に非常に近いスケーリング値を、適応逆量子化が使用することを保証する。これは、一連の失われたデータパケットの後にデータが受信される場合、非常に聞こえがちであるクリック音を回避するのに重要なばかりでなく、復号されたオーディオを迅速に回復することができるものである。同様に、予測器フィルタ係数を設定することにより、損失データが終了した後の適応がより速くなる。したがって、復号化アルゴリズムは、その現在の内部値を、受信された対応する追加データQB、CFBと比較することと、所定の閾値を超える差分が検出された場合に、その内部値を調整することを含むことが好ましい。
このアプローチはまた、データパケットの損失を処理するためのソフトミュートおよびアンミュートのための追加の機能を通常必要としないという利点を有する。
図5は、デジタルオーディオ信号を転送するための方法の実施形態のステップを示す。この方法は、デジタルオーディオ信号R_AIを受信することを含む。オーディオ信号は、ADPCM符号化アルゴリズムによって符号化され、結果として、ADPCM符号化ビットを生成(G_APM)する。さらに、この方法は、ADPCM符号化アルゴリズムの適応量子化部分の内部値、例えばスケーリング値を示すデータビットを生成(G_QB)することを含む。次のステップは、ADPCM符号化ビットと、ADPCM符号化アルゴリズムの適応量子化部分の内部値を示すデータビットとの両方を含むデータブロックを無線で送信(WT_DB)することである。次に、データブロックは、無線受信機によって受信(WR_DB)される。例えば、データブロックを損失した場合などに、復号器における現在の対応するスケーリングファクタ値が、受信されたスケーリング値から所定の閾値よりも大きく異なる場合、復号器側において、次のステップは、例えばADPCM符号化アルゴリズムの適応量子化部分のスケーリング値などといった内部値を示すデータビットに応じて、ADPCM復号化アルゴリズムの適応量子化のスケーリングファクタを調整(ADJ_ADQ)することである。次に、受信したADPCMデータビットを復号(DEC_APM)して復号化アルゴリズムを実行し、オーディオ出力信号を生成(G_AO)する。
要約すると、本発明は、低遅延で、しかも中程度のビットレートでの、高品質オーディオのロバストな無線伝送に適したオーディオコーデックを提供する。符号化および復号化方法は、ADPCMに基づくものであって、出力データブロックには、符号化された出力ビットAPMに加えて、追加のデータQB、すなわちADPCM符号化アルゴリズムの適応量子化ADQの内部値を表すデータQB、特に、符号化され、8bitなどに切り捨てられたスケーリングファクタが含まれる。さらに、出力データブロックは、好ましくは、ADPCM符号化アルゴリズムの予測器PRの内部値を表すデータCFBを含んでおり、特に、8bitなどに切り捨てられた格子形予測FIRフィルタの係数を表すデータCFBを連続的に含むことができる。ADPCM符号化アルゴリズムの内部値に関するこれらの追加のデータQB、CFBは、無線伝送におけるデータブロックの損失に対するロバスト性を高めるために、符号器側で利用することができる。特に、復号化アルゴリズムは、符号器から受信された内部値QB、CFBに対応する、現在の内部ADPCM復号値を比較することを含んでもよく、差分がある場合、復号器は、その内部値を受信されたQB、CFBに適応させるか、または上書きしてもよい。これは、データブロック損失後の速い回復を確実にするのに役立ち、それによって、復元された信号におけるアーチファクト、例えば、オーディオの場合、クリック音に対するロバスト性を確実にする。
本発明は特定の実施形態に関連して説明されてきたが、提示された実施例に決して限定されるものとして解釈されるべきではない。本発明の技術的範囲は、添付の特許請求の技術的範囲に照らして解釈されるべきである。特許請求の範囲の文脈において、「含む(including)」または「含む(include)」という用語は、他の可能な要素またはステップを除外しない。また、「a」または「an」などの参照の言及は、複数を排除するものとして解釈されるべきではない。図面に示される要素に関する特許請求の範囲における参照符号の使用はまた、本発明の範囲を限定するものとして解釈されるべきではない。さらに、異なる請求範囲に記載された個々の特徴は場合によっては有利に組み合わせることができ、異なる請求範囲におけるこれらの特徴の言及は、特徴の組み合わせが可能でなく有利でないことを排除しない。


Claims (7)

  1. 量子化器(Q)による適応量子化(DQ)と、予測器(LPR)による予測(PR)とを含む適応差動パルス符号変調復号化アルゴリズムに従って、プロセッサが適応差動パルス符号変調符号化デジタル信号を復号する方法であって、前記方法は、
    −適応差動パルス符号変調符号化アルゴリズムに含まれる適応量子化(ADQ)のスケーリングファクタを表す内部値である少なくとも1つのデータビット(QB)と、適応差動パルス符号変調データビット(APM)と、を含むデジタルデータブロックを受信(WR_DB)することと、
    現在のスケーリングファクタを表す現在の内部値と、受信した前記少なくとも1つのデータビット(QB)によって表される前記内部値との間に所定の閾値を超える差分が検出された場合に、受信された前記少なくとも1つのデータビット(QB)に従って、前記適応差動パルス符号変調復号化アルゴリズムに含まれる前記適応量子化の前記現在の内部値を調整(ADJ_ADQ)することと、
    −受信された適応差動パルス符号変調データビット(APM)を調整後の前記現在の内部値に対応するスケーリングファクタに基づいて復号することによりデジタル出力信号を生成(G_AO)することと、
    を備える、方法。
  2. 前記デジタルデータブロックを表す無線周波数信号を受信することと、
    前記デジタルデータブロックがエラーを伴って受信されたかどうかを検出することと、
    を備える、請求項1に記載の方法。
  3. 前記デジタルデータブロックがエラーを伴って受信されたことが検出された場合、前記適応量子化に関連する適応逆量子化器(DQ)の出力をゼロに設定する、
    請求項2に記載の方法。
  4. 前記デジタルデータブロックがエラーを伴って受信されたことが検出された場合、前記予測器(LPR)における漏れをゼロに設定するように、前記予測器(LPR)における漏れを調整する、
    請求項2または3に記載の方法。
  5. 請求項1から4のいずれかに記載の方法に従って、受信されたデジタルデータブロックを復号するように構成された復号器、
    を備える、復号器装置。
  6. −デジタル入力信号を符号化してデジタルデータブロックを生成する符号器を有する符号器装置と、
    −前記符号器によって生成された前記デジタルデータブロックを表す無線周波数信号を送信するように構成された無線周波数送信機と、
    −前記符号器によって生成された前記デジタルデータブロックを表す前記無線周波数信号を受信するように構成された無線周波数受信機と、
    −請求項5に記載の復号器装置と、
    を有し、
    前記符号器は、
    −量子化器(Q)による適応量子化(ADQ)および予測器(LPR)による予測(PR)を含む適応差動パルス符号変調符号化アルゴリズムをデジタル入力信号の時間ブロックに適用し、適応差動パルス符号変調データビット(APM)を適宜生成(G_APM)することと、
    −前記適応量子化(ADQ)のスケーリングファクタを表す内部値を表す少なくとも1つのデータビット(QB)を生成(G_QB)することと、
    −前記適応量子化(ADQ)の前記内部値を表す前記少なくとも1つのデータビット(QB)と、前記適応差動パルス符号変調データビット(APM)とを含むデジタルデータブロックを生成することと、
    によって前記デジタルデータブロックを生成する、
    システム。
  7. 実行されると、プロセッサを備える演算装置またはシステムに、請求項1から4のいずれかに記載の方法を実行させる命令を有する、
    コンピュータプログラム。

JP2019565426A 2017-06-19 2018-06-15 オーディオ信号の符号化および復号化 Active JP6906876B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA201770475 2017-06-19
DKPA201770475 2017-06-19
PCT/DK2018/050142 WO2018233788A1 (en) 2017-06-19 2018-06-15 AUDIO SIGNAL CODING AND DECODING

Publications (2)

Publication Number Publication Date
JP2020524293A JP2020524293A (ja) 2020-08-13
JP6906876B2 true JP6906876B2 (ja) 2021-07-21

Family

ID=62715790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019565426A Active JP6906876B2 (ja) 2017-06-19 2018-06-15 オーディオ信号の符号化および復号化

Country Status (9)

Country Link
US (1) US11545164B2 (ja)
EP (1) EP3642839B1 (ja)
JP (1) JP6906876B2 (ja)
KR (1) KR102587134B1 (ja)
CN (1) CN110770822B (ja)
AU (1) AU2018289986B2 (ja)
DK (1) DK3642839T3 (ja)
ES (1) ES2922155T3 (ja)
WO (1) WO2018233788A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022047472A1 (en) * 2020-08-24 2022-03-03 Shure Acquisition Holdings, Inc. Microphone system with flexible modulation and coding scheme
US11935546B2 (en) * 2021-08-19 2024-03-19 Semiconductor Components Industries, Llc Transmission error robust ADPCM compressor with enhanced response

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69515907T2 (de) 1994-12-20 2000-08-17 Dolby Lab Licensing Corp Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem
AU9041998A (en) * 1997-12-12 1999-07-05 Thomson Consumer Electronics, Inc Enhanced range/graceful degradation for digital wireless telephone system
CN1134762C (zh) * 1998-05-27 2004-01-14 Ntt移动通信网株式会社 语音译码器和语音译码方法
US6578162B1 (en) * 1999-01-20 2003-06-10 Skyworks Solutions, Inc. Error recovery method and apparatus for ADPCM encoded speech
US7920697B2 (en) * 1999-12-09 2011-04-05 Broadcom Corp. Interaction between echo canceller and packet voice processing
KR20010106656A (ko) * 2000-05-22 2001-12-07 윤종용 Adpcm 코드 전송 에러 감소 방법
JP4215448B2 (ja) * 2002-04-19 2009-01-28 日本電気株式会社 音声復号装置及び音声復号方法
TWI226035B (en) 2003-10-16 2005-01-01 Elan Microelectronics Corp Method and system improving step adaptation of ADPCM voice coding
EP2054879B1 (en) * 2006-08-15 2010-01-20 Broadcom Corporation Re-phasing of decoder states after packet loss
CN101548316B (zh) * 2006-12-13 2012-05-23 松下电器产业株式会社 编码装置、解码装置以及其方法
CN101266796B (zh) * 2007-03-12 2012-05-23 华为技术有限公司 一种量化编解码方法及装置
JP4915576B2 (ja) * 2007-05-28 2012-04-11 パナソニック株式会社 音声伝送システム
US8482439B2 (en) * 2008-12-26 2013-07-09 Kyushu Institute Of Technology Adaptive differential pulse code modulation encoding apparatus and decoding apparatus
TWI392252B (zh) * 2009-01-21 2013-04-01 Mstar Semiconductor Inc 可適性差分脈衝碼調變-解調變系統與方法
EP2348504B1 (en) * 2009-03-27 2014-01-08 Huawei Technologies Co., Ltd. Encoding and decoding method and device
GB2465047B (en) * 2009-09-03 2010-09-22 Peter Graham Craven Prediction of signals
JP5447628B1 (ja) 2012-09-28 2014-03-19 パナソニック株式会社 無線通信装置及び通信端末
EP3671738B1 (en) * 2013-04-05 2024-06-05 Dolby International AB Audio encoder and decoder
EP2830064A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
EP2887350B1 (en) * 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Adaptive quantization noise filtering of decoded audio data
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
GB2559200A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
US10354667B2 (en) * 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data

Also Published As

Publication number Publication date
US11545164B2 (en) 2023-01-03
CN110770822A (zh) 2020-02-07
WO2018233788A1 (en) 2018-12-27
AU2018289986A1 (en) 2020-01-16
KR102587134B1 (ko) 2023-10-06
JP2020524293A (ja) 2020-08-13
DK3642839T3 (da) 2022-07-04
CN110770822B (zh) 2024-03-08
EP3642839B1 (en) 2022-04-13
US20200090672A1 (en) 2020-03-19
ES2922155T3 (es) 2022-09-09
KR20200015746A (ko) 2020-02-12
AU2018289986B2 (en) 2022-06-09
EP3642839A1 (en) 2020-04-29

Similar Documents

Publication Publication Date Title
JP4426483B2 (ja) オーディオ信号の符号化効率を向上させる方法
JP5434592B2 (ja) オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
KR20060007371A (ko) 음성 신호의 스펙트럼 재구성 방법 및 장치
US20110224991A1 (en) Scalable lossless audio codec and authoring tool
KR101207110B1 (ko) 스케일러블 무손실 비트스트림의 인코딩 방법
US9325544B2 (en) Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame
EP1381179A1 (en) Method and apparatus for unequal error protection
JP6906876B2 (ja) オーディオ信号の符号化および復号化
KR101363206B1 (ko) 인터채널과 시간적 중복감소를 이용한 오디오 신호 인코딩
RU2445737C2 (ru) Способ передачи данных в системе связи
US8654984B2 (en) Processing stereophonic audio signals
US20100324911A1 (en) Cvsd decoder state update after packet loss
CA2821603C (en) Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
EP2200025A1 (en) Bandwidth scalable codec and control method thereof
JP4572755B2 (ja) 復号化装置,復号化方法及びデジタル音声通信システム
CN115708333A (zh) 音频通信接收器及音频通信方法
JP6552986B2 (ja) 音声符号化装置、方法及びプログラム
JP3692959B2 (ja) 電子透かし情報埋め込み装置
AL-Rawi ADPCM: US Patents from 2010 to 2016
JP2006276877A (ja) 変換符号化されたデータの復号方法及び変換符号化されたデータの復号装置
JPS5848113B2 (ja) オンセイツウシンホウシキ
JP2009093056A (ja) ディジタル音声通信方法及びディジタル音声通信装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210629

R150 Certificate of patent or registration of utility model

Ref document number: 6906876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150