JP2017503192A - 帯域幅拡張モード選択 - Google Patents
帯域幅拡張モード選択 Download PDFInfo
- Publication number
- JP2017503192A JP2017503192A JP2016538105A JP2016538105A JP2017503192A JP 2017503192 A JP2017503192 A JP 2017503192A JP 2016538105 A JP2016538105 A JP 2016538105A JP 2016538105 A JP2016538105 A JP 2016538105A JP 2017503192 A JP2017503192 A JP 2017503192A
- Authority
- JP
- Japan
- Prior art keywords
- parameters
- band
- mode
- input signal
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 88
- 238000000034 method Methods 0.000 claims description 60
- 230000004044 response Effects 0.000 claims description 51
- 238000004891 communication Methods 0.000 claims description 30
- 238000001514 detection method Methods 0.000 claims description 17
- 230000003595 spectral effect Effects 0.000 claims description 14
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 239000004606 Fillers/Extenders Substances 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 22
- 239000013598 vector Substances 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000005415 magnetization Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
Description
[0040] 以下の説明では、図1のシステム100によって行われる様々な機能が、ある特定の構成要素またはモジュールによって行われるものとして説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分担は、例示のためのものでしかない。代替的な実施形態では、特定の構成要素またはモジュールによって行われる機能は、複数の構成要素またはモジュールの間で分けられる。さらに、代替的な実施形態では、図1の2つ以上の構成要素またはモジュールは、単一の構成要素またはモジュールへと一体化され得る。図1に例示される各構成要素またはモジュールは、ハードウェア(例えば、フィールドプログラマブルゲートウェイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP)、コントローラ、等)、ソフトウェア(例えば、プロセッサによって実行可能な命令)、あるいはそれらの任意の組み合わせを使用して実装され得る。
[0108] 特定の実施形態では、図6の方法600は、中央処理装置(CPU)、デジタルシグナルプロセッサ(DSP)、またはコントローラのような処理ユニットのハードウェア(例えば、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、等)を介して、ファームウェアデバイスを介して、またはこれらの任意の組み合わせによって実装され得る。一例として、図6の方法600は、図7に関して説明されるように、命令を実行するプロセッサによって行われ得る。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1]
デバイスであって、
デコーダ
を備え、前記デコーダは、
受信された入力信号から、第1の複数のパラメータを抽出するように構成された抽出器、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された予測器、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成されたセレクタ、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するように構成されたスイッチと
を備えるデバイス。
[C2]
前記入力信号は、入力ビットストリームに対応し、前記抽出器は、前記予測器が前記第2の複数のパラメータを生成するのと同時に、前記第1の複数のパラメータを抽出するように構成される、C1に記載のデバイス。
[C3]
前記セレクタは、制御入力信号を受信するようにさらに構成され、前記特定のモードは、前記制御入力信号に基づいて選択される、C1に記載のデバイス。
[C4]
前記抽出器は、前記入力信号内の前記低帯域パラメータ情報内に埋め込まれる前記第1の複数のパラメータを抽出するように構成される、C1に記載のデバイス。
[C5]
前記抽出器は、前記入力信号内のウォーターマークを検出するように構成され、前記ウォーターマークは、前記第1の複数のパラメータを符号化する、C1に記載のデバイス。
[C6]
前記抽出器は、前記第1の複数のパラメータに関連付けられたエラー検出データを抽出するようにさらに構成される、C1に記載のデバイス。
[C7]
前記抽出器および前記セレクタに結合されたエラー検出器
をさらに備え、前記エラー検出器は、
前記エラー検出データを受信することと、
前記エラー検出データに基づいてエラー出力を生成することと
を行うように構成され、
前記セレクタは、前記エラー出力に少なくとも部分的に基づいて、前記特定のモードを選択するように構成される、
C6に記載のデバイス。
[C8]
前記第1の複数のパラメータの信頼性を示す有効性データを生成するように構成されたパラメータ有効性チェッカ
をさらに備え、
ここにおいて、前記有効性データは、前記第1の複数のパラメータおよび前記第2の複数のパラメータに少なくとも部分的に基づき、
前記セレクタは、前記有効性データに基づいて前記特定のモードを選択するように構成される、
C7に記載のデバイス。
[C9]
前記セレクタは、前記有効性データが信頼性閾値を満たすこと、かつ、エラーが検出されないと前記エラー出力が示すことを決定することに応答して、前記第1の複数のパラメータを使用する前記第1のモードを選択するように構成される、C8に記載のデバイス。
[C10]
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されると前記エラー出力が示すことを決定することに応答して、前記第2の複数のパラメータを使用する前記第2のモードを選択するようにさらに構成される、C9に記載のデバイス。
[C11]
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されることを前記エラー出力が示すことを決定することに応答して、前記複数の高帯域モードのうちの第3のモードを選択するようにさらに構成され、前記スイッチは、前記第3のモードが選択されると決定することに応答して、いずれの高帯域パラメータも出力しないように構成される、C9に記載のデバイス。
[C12]
前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、C1に記載のデバイス。
[C13]
前記予測器は、
分析データに基づいて前記第2の複数のパラメータを生成するために、前記ブラインド帯域幅拡張を行うように構成されたブラインド帯域幅拡張器と、
前記第1の複数のパラメータに少なくとも部分的に基づいて前記分析データを修正するように構成されたチューナと
を備える、C1に記載のデバイス。
[C14]
前記第1の複数のパラメータは、線スペクトル周波数(LSF)、利得形状、または利得フレームのうちの少なくとも1つを含む、C1に記載のデバイス。
[C15]
前記予測器は、予測利得フレームに基づいて前記第2の複数のパラメータを生成するように構成される、C1に記載のデバイス。
[C16]
前記予測器は、前記第1の複数のパラメータの第1の利得フレームと、前記第2の複数のパラメータの第2の利得フレームとの比に基づいて、前記予測利得フレームを調整するようにさらに構成される、C15に記載のデバイス。
[C17]
前記予測器は、平均線スペクトル周波数(LSF)に基づいて前記第2の複数のパラメータを生成するように構成される、C1に記載のデバイス。
[C18]
前記予測器は、前記第1の複数のパラメータの第1のLSFに基づいて前記平均LSFを調整するようにさらに構成される、C17に記載のデバイス。
[C19]
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
を行うように構成された出力ジェネレータ
をさらに備える、C1に記載のデバイス。
[C20]
方法であって、
デコーダにおいて、受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記デコーダにおいて、前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記デコーダにおいて、前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記特定のモードの選択に応答して、前記第1の複数のパラメータまたは前記第2の複数のパラメータを前記デコーダの出力ジェネレータに送ることと
を備える方法。
[C21]
前記第2の複数のパラメータは、前記第1の複数のパラメータに関連付けられたエラーを検出することに応答して選択される、C20に記載の方法。
[C22]
前記第1の複数のパラメータに関連付けられた周期的冗長検査(CRC)が無効データを示すと決定することに応答して、前記エラーが検出される、C21に記載の方法。
[C23]
前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、C20に記載の方法。
[C24]
命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力することと
を備える動作を行わせる、コンピュータ可読記憶デバイス。
[C25]
前記動作は、
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードが前記第1のモードまたは前記第2のモードであると決定することに応答して、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
前記特定のモードが前記複数の高帯域モードのうちの第3のモードであると決定することに応答して、
前記出力高帯域部分を生成することを控えることと、
前記出力低帯域部分に基づいて前記出力信号を生成することと
をさらに備える、C24に記載のコンピュータ可読記憶デバイス。
[C26]
前記動作は、前記第1の複数のパラメータに関連付けられたエラーレートが閾値エラーレートよりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、C25に記載のコンピュータ可読記憶デバイス。
[C27]
前記動作は、前記第1の複数のパラメータと前記第2の複数のパラメータとの差分が特定の閾値よりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、C25に記載のコンピュータ可読記憶デバイス。
[C28]
前記プロセッサは、エンハンスド適応型マルチレート(eAMR)デコーダへと一体化される、C24に記載のコンピュータ可読記憶デバイス。
[C29]
装置であって、
受信された入力信号から第1の複数のパラメータを抽出するための手段、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するための手段と
を備える装置。
[C30]
前記抽出するための手段、前記生成するための手段、前記選択するための手段、および前記出力するための手段は、デコーダ、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末(PDA)、固定ロケーションデータユニット、またはコンピュータへと一体化される、C29に記載の装置。
Claims (30)
- デバイスであって、
デコーダ
を備え、前記デコーダは、
受信された入力信号から、第1の複数のパラメータを抽出するように構成された抽出器、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された予測器、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成されたセレクタ、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するように構成されたスイッチと
を備えるデバイス。 - 前記入力信号は、入力ビットストリームに対応し、前記抽出器は、前記予測器が前記第2の複数のパラメータを生成するのと同時に、前記第1の複数のパラメータを抽出するように構成される、請求項1に記載のデバイス。
- 前記セレクタは、制御入力信号を受信するようにさらに構成され、前記特定のモードは、前記制御入力信号に基づいて選択される、請求項1に記載のデバイス。
- 前記抽出器は、前記入力信号内の前記低帯域パラメータ情報内に埋め込まれる前記第1の複数のパラメータを抽出するように構成される、請求項1に記載のデバイス。
- 前記抽出器は、前記入力信号内のウォーターマークを検出するように構成され、前記ウォーターマークは、前記第1の複数のパラメータを符号化する、請求項1に記載のデバイス。
- 前記抽出器は、前記第1の複数のパラメータに関連付けられたエラー検出データを抽出するようにさらに構成される、請求項1に記載のデバイス。
- 前記抽出器および前記セレクタに結合されたエラー検出器
をさらに備え、前記エラー検出器は、
前記エラー検出データを受信することと、
前記エラー検出データに基づいてエラー出力を生成することと
を行うように構成され、
前記セレクタは、前記エラー出力に少なくとも部分的に基づいて、前記特定のモードを選択するように構成される、
請求項6に記載のデバイス。 - 前記第1の複数のパラメータの信頼性を示す有効性データを生成するように構成されたパラメータ有効性チェッカ
をさらに備え、
ここにおいて、前記有効性データは、前記第1の複数のパラメータおよび前記第2の複数のパラメータに少なくとも部分的に基づき、
前記セレクタは、前記有効性データに基づいて前記特定のモードを選択するように構成される、
請求項7に記載のデバイス。 - 前記セレクタは、前記有効性データが信頼性閾値を満たすこと、かつ、エラーが検出されないと前記エラー出力が示すことを決定することに応答して、前記第1の複数のパラメータを使用する前記第1のモードを選択するように構成される、請求項8に記載のデバイス。
- 前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されると前記エラー出力が示すことを決定することに応答して、前記第2の複数のパラメータを使用する前記第2のモードを選択するようにさらに構成される、請求項9に記載のデバイス。
- 前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されることを前記エラー出力が示すことを決定することに応答して、前記複数の高帯域モードのうちの第3のモードを選択するようにさらに構成され、前記スイッチは、前記第3のモードが選択されると決定することに応答して、いずれの高帯域パラメータも出力しないように構成される、請求項9に記載のデバイス。
- 前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、請求項1に記載のデバイス。
- 前記予測器は、
分析データに基づいて前記第2の複数のパラメータを生成するために、前記ブラインド帯域幅拡張を行うように構成されたブラインド帯域幅拡張器と、
前記第1の複数のパラメータに少なくとも部分的に基づいて前記分析データを修正するように構成されたチューナと
を備える、請求項1に記載のデバイス。 - 前記第1の複数のパラメータは、線スペクトル周波数(LSF)、利得形状、または利得フレームのうちの少なくとも1つを含む、請求項1に記載のデバイス。
- 前記予測器は、予測利得フレームに基づいて前記第2の複数のパラメータを生成するように構成される、請求項1に記載のデバイス。
- 前記予測器は、前記第1の複数のパラメータの第1の利得フレームと、前記第2の複数のパラメータの第2の利得フレームとの比に基づいて、前記予測利得フレームを調整するようにさらに構成される、請求項15に記載のデバイス。
- 前記予測器は、平均線スペクトル周波数(LSF)に基づいて前記第2の複数のパラメータを生成するように構成される、請求項1に記載のデバイス。
- 前記予測器は、前記第1の複数のパラメータの第1のLSFに基づいて前記平均LSFを調整するようにさらに構成される、請求項17に記載のデバイス。
- 前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
を行うように構成された出力ジェネレータ
をさらに備える、請求項1に記載のデバイス。 - 方法であって、
デコーダにおいて、受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記デコーダにおいて、前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記デコーダにおいて、前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記特定のモードの選択に応答して、前記第1の複数のパラメータまたは前記第2の複数のパラメータを前記デコーダの出力ジェネレータに送ることと
を備える方法。 - 前記第2の複数のパラメータは、前記第1の複数のパラメータに関連付けられたエラーを検出することに応答して選択される、請求項20に記載の方法。
- 前記第1の複数のパラメータに関連付けられた周期的冗長検査(CRC)が無効データを示すと決定することに応答して、前記エラーが検出される、請求項21に記載の方法。
- 前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、請求項20に記載の方法。
- 命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力することと
を備える動作を行わせる、コンピュータ可読記憶デバイス。 - 前記動作は、
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードが前記第1のモードまたは前記第2のモードであると決定することに応答して、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
前記特定のモードが前記複数の高帯域モードのうちの第3のモードであると決定することに応答して、
前記出力高帯域部分を生成することを控えることと、
前記出力低帯域部分に基づいて前記出力信号を生成することと
をさらに備える、請求項24に記載のコンピュータ可読記憶デバイス。 - 前記動作は、前記第1の複数のパラメータに関連付けられたエラーレートが閾値エラーレートよりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、請求項25に記載のコンピュータ可読記憶デバイス。
- 前記動作は、前記第1の複数のパラメータと前記第2の複数のパラメータとの差分が特定の閾値よりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、請求項25に記載のコンピュータ可読記憶デバイス。
- 前記プロセッサは、エンハンスド適応型マルチレート(eAMR)デコーダへと一体化される、請求項24に記載のコンピュータ可読記憶デバイス。
- 装置であって、
受信された入力信号から第1の複数のパラメータを抽出するための手段、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するための手段と
を備える装置。 - 前記抽出するための手段、前記生成するための手段、前記選択するための手段、および前記出力するための手段は、デコーダ、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末(PDA)、固定ロケーションデータユニット、またはコンピュータへと一体化される、請求項29に記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361914845P | 2013-12-11 | 2013-12-11 | |
US61/914,845 | 2013-12-11 | ||
US14/270,963 US9293143B2 (en) | 2013-12-11 | 2014-05-06 | Bandwidth extension mode selection |
US14/270,963 | 2014-05-06 | ||
PCT/US2014/068908 WO2015088919A1 (en) | 2013-12-11 | 2014-12-05 | Bandwidth extension mode selection |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017503192A true JP2017503192A (ja) | 2017-01-26 |
JP2017503192A5 JP2017503192A5 (ja) | 2017-12-21 |
Family
ID=53271812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016538105A Pending JP2017503192A (ja) | 2013-12-11 | 2014-12-05 | 帯域幅拡張モード選択 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9293143B2 (ja) |
EP (1) | EP3080804A1 (ja) |
JP (1) | JP2017503192A (ja) |
KR (1) | KR20160096119A (ja) |
CN (1) | CN105814629A (ja) |
WO (1) | WO2015088919A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018528463A (ja) * | 2015-08-18 | 2018-09-27 | クアルコム,インコーポレイテッド | 帯域幅移行期間中の信号再使用 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
US10362423B2 (en) | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
EP3559849B1 (en) * | 2016-12-22 | 2020-09-02 | Assa Abloy AB | Mobile credential with online/offline delivery |
US11906642B2 (en) * | 2018-09-28 | 2024-02-20 | Silicon Laboratories Inc. | Systems and methods for modifying information of audio data based on one or more radio frequency (RF) signal reception and/or transmission characteristics |
EP3900237B1 (en) * | 2018-12-17 | 2024-05-15 | InterDigital Patent Holdings, Inc. | Signal design associated with concurrent delivery of energy and information |
WO2021087734A1 (zh) * | 2019-11-05 | 2021-05-14 | 海能达通信股份有限公司 | 宽窄带互通环境下语音通讯方法及系统 |
US11985179B1 (en) * | 2020-11-23 | 2024-05-14 | Amazon Technologies, Inc. | Speech signal bandwidth extension using cascaded neural networks |
WO2023147650A1 (en) * | 2022-02-03 | 2023-08-10 | Voiceage Corporation | Time-domain superwideband bandwidth expansion for cross-talk scenarios |
EP4375999A1 (en) * | 2022-11-28 | 2024-05-29 | GN Audio A/S | Audio device with signal parameter-based processing, related methods and systems |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006085176A (ja) * | 2004-09-17 | 2006-03-30 | Harman Becker Automotive Systems Gmbh | 帯域制限オーディオ信号の帯域拡大 |
JP2006527864A (ja) * | 2003-06-17 | 2006-12-07 | 松下電器産業株式会社 | 受信機器、送信機器および伝送システム |
US20120203555A1 (en) * | 2011-02-07 | 2012-08-09 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
JP2013525833A (ja) * | 2010-04-16 | 2013-06-20 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6205130B1 (en) | 1996-09-25 | 2001-03-20 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
DE60204039T2 (de) * | 2001-11-02 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur kodierung und dekodierung von audiosignalen |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
UA91853C2 (ru) * | 2005-04-01 | 2010-09-10 | Квелкомм Инкорпорейтед | Способ и устройство для векторного квантования спектрального представления огибающей |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
BRPI0818927A2 (pt) | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
PL2304723T3 (pl) | 2008-07-11 | 2013-03-29 | Fraunhofer Ges Forschung | Urządzenie i sposób dekodowania zakodowanego sygnału audio |
US8630685B2 (en) | 2008-07-16 | 2014-01-14 | Qualcomm Incorporated | Method and apparatus for providing sidetone feedback notification to a user of a communication device with multiple microphones |
US8880404B2 (en) | 2011-02-07 | 2014-11-04 | Qualcomm Incorporated | Devices for adaptively encoding and decoding a watermarked signal |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
AU2011358654B2 (en) | 2011-02-09 | 2017-01-05 | Telefonaktiebolaget L M Ericsson (Publ) | Efficient encoding/decoding of audio signals |
-
2014
- 2014-05-06 US US14/270,963 patent/US9293143B2/en not_active Expired - Fee Related
- 2014-12-05 KR KR1020167017467A patent/KR20160096119A/ko not_active Application Discontinuation
- 2014-12-05 EP EP14824212.6A patent/EP3080804A1/en not_active Withdrawn
- 2014-12-05 CN CN201480065999.6A patent/CN105814629A/zh active Pending
- 2014-12-05 JP JP2016538105A patent/JP2017503192A/ja active Pending
- 2014-12-05 WO PCT/US2014/068908 patent/WO2015088919A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006527864A (ja) * | 2003-06-17 | 2006-12-07 | 松下電器産業株式会社 | 受信機器、送信機器および伝送システム |
JP2006085176A (ja) * | 2004-09-17 | 2006-03-30 | Harman Becker Automotive Systems Gmbh | 帯域制限オーディオ信号の帯域拡大 |
JP2013525833A (ja) * | 2010-04-16 | 2013-06-20 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム |
US20120203555A1 (en) * | 2011-02-07 | 2012-08-09 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
Non-Patent Citations (2)
Title |
---|
BERND GEISER, ET AL.: "A Qualified ITU-T G.729EV Codec Candidate for Hierarchcal Speech and Audio Coding", 2006 IEEE WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING, JPN6018043313, October 2006 (2006-10-01), pages 114 - 118, XP031011031, ISSN: 0004048012 * |
片岡章俊他: "補助情報を用いたG.711の広帯域化", 電子情報通信学会論文誌, vol. 91, no. 4, JPN6018043315, April 2008 (2008-04-01), pages 1069 - 1081, ISSN: 0003913719 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018528463A (ja) * | 2015-08-18 | 2018-09-27 | クアルコム,インコーポレイテッド | 帯域幅移行期間中の信号再使用 |
Also Published As
Publication number | Publication date |
---|---|
CN105814629A (zh) | 2016-07-27 |
WO2015088919A1 (en) | 2015-06-18 |
US9293143B2 (en) | 2016-03-22 |
KR20160096119A (ko) | 2016-08-12 |
EP3080804A1 (en) | 2016-10-19 |
US20150162008A1 (en) | 2015-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9293143B2 (en) | Bandwidth extension mode selection | |
US10297263B2 (en) | High band excitation signal generation | |
TWI642052B (zh) | 用於產生一高頻帶目標信號之方法及設備 | |
JP6196004B2 (ja) | ハイバンド信号特性に基づいた時間利得調整 | |
KR101783114B1 (ko) | 이득 제어를 수행하는 시스템들 및 방법들 | |
JP6786592B2 (ja) | 帯域幅移行期間中の信号再使用 | |
JP6258522B2 (ja) | デバイスにおいてコーディング技術を切り替える装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171110 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190604 |