JP2017503192A - 帯域幅拡張モード選択 - Google Patents

帯域幅拡張モード選択 Download PDF

Info

Publication number
JP2017503192A
JP2017503192A JP2016538105A JP2016538105A JP2017503192A JP 2017503192 A JP2017503192 A JP 2017503192A JP 2016538105 A JP2016538105 A JP 2016538105A JP 2016538105 A JP2016538105 A JP 2016538105A JP 2017503192 A JP2017503192 A JP 2017503192A
Authority
JP
Japan
Prior art keywords
parameters
band
mode
input signal
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016538105A
Other languages
English (en)
Other versions
JP2017503192A5 (ja
Inventor
ビレット、ステファン・ピエール
シンダー、ダニエル・ジェイ.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2017503192A publication Critical patent/JP2017503192A/ja
Publication of JP2017503192A5 publication Critical patent/JP2017503192A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

デバイスは、抽出器、予測器、セレクタ、およびスイッチを含むデコーダを含む。抽出器は、受信された入力信号から第1の複数のパラメータを抽出するように構成される。入力信号は、符号化されたオーディオ信号に対応する。予測器は、入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成される。第2の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。セレクタは、第1の複数のパラメータを使用する第1のモードと、第2の複数のパラメータを使用する第2のモードとを含む複数の高帯域モードから特定のモードを選択するように構成される。スイッチは、選択された特定のモードに基づいて、第1の複数のパラメータまたは第2の複数のパラメータを出力するように構成される。【選択図】図2

Description

優先権の主張
[0001] 本願は、2014年5月6日に出願された米国特許出願第14/270963号、および2013年12月11日に出願された米国特許仮出願第61/914845号の優先権を主張し、これらは両方とも、「BANDWIDTH EXTENSION MODE SELECTION」と題し、それらの内容は、それの全体が参照により組み込まれている。
[0002] 本開示は一般に、帯域幅拡張に関する。
[0003] 技術の進歩は、より小型でよりパワフルなコンピューティングデバイスをもたらした。例えば、小型で、軽量で、かつユーザによって容易に持ち運ばれるポータブルワイヤレス電話、携帯情報端末(PDA)、およびページングデバイスのような、ワイヤレスコンピューティングデバイスを含む様々なポータブルパーソナルコンピューティングデバイスが現在存在している。より具体的には、セルラ電話およびインターネットプロトコル(IP)電話のようなポータブルワイヤレス電話は、ワイヤレスネットワークを通して音声およびデータパケットを通信することができる。さらに、多くのこのようなワイヤレス電話は、そこに組み込まれる他のタイプのデバイスを含む。例えば、ワイヤレス電話は、デジタルスチールカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤも含み得る。
[0004] デジタル技法による音声の送信は、特に、長距離のデジタル無線電話アプリケーションに広まっている。サンプリングおよびデジタル化することでスピーチが送信される場合、アナログ電話のスピーチ品質を達成するために、毎秒64キロビット(kbps)程度のデータレートが使用され得る。再構築されたスピーチの知覚品質を維持しつつ、チャネルを通して送られる情報量を低減するために、圧縮技法が使用され得る。コーディング、送信、および受信機での再合成によって後続されるスピーチ分析を使用して、データレートの大幅な低減が達成され得る。
[0005] スピーチを圧縮するためのデバイスは、電気通話の多くの分野に用途が見出され得る。例示的な分野はワイヤレス通信である。ワイヤレス通信の分野は、例えば、コードレス電話、ページング、ワイヤレスローカルループ、セルラおよびパーソナル通信サービス(PCT)電話システムといったワイヤレス電話通話、モバイルインターネットプロトコル(IP)電話通話、および衛星通信システムを含む多くのアプリケーションを含む。特定のアプリケーションは、モバイル加入者のためのワイヤレス電話通話である。
[0006] 様々な無線経由(over-the-air)インターフェースが、例えば、周波数分割多元接続(FDMA)、時分割多元接続(TDMA)、符号分割多元接続(CDMA)、および時分割同期CDMA(TD−SCDMA)を含むワイヤレス通信システムのために開発されてきた。それに関連して、例えば、先進移動電話サービス(AMPS)、モバイル通信のためのグローバルシステム(GSM(登録商標))、および暫定規格95(IS−95)を含む様々な国内規格および国際規格が確立されてきた。例示的なワイヤレス電話通話通信システムは、符号分割多元接続(CDMA)システムである。IS−95規格とその派生物、IS−95A、ANSI J−STD−008、およびIS−95B(本明細書では、総称してIS−95と呼ばれる)は、セルラまたはPCS電話通話通信システムに対するCDMA無線経由インターフェースの使用を規定するための電気通話産業機構(TIA)および他の周知の規格団体によって公表される。
[0007] その後、IS−95規格は、より多くの容量と高速のパケットデータシステムを提供するcdma2000およびWCDMA(登録商標)のような「3G」システムへと発展した。cdma2000の2つの変形例は、TIAによって発行されている文書IS−2000(cdma2000 1xRTT)およびIS−856(cdma2000 1xEV−DO)によって提示されている。cdma2000 1xRTT通信システムが、153kbpsのピークデータレートを提供するのに対して、cdma2000 1xEV−DO通信システムは、38.4kbpsから2.4Mbpsの範囲のデータレートのセットを定義する。WCDMA規格は、第3世代パートナーシッププロジェクト「3GPP(登録商標)」の文書番号3G TS 25.211、3G TS 25.212、3G TS 25.213、および3G TS 25.214において具現化されている。IMTアドバンスド(IMT-Advanced:International Mobile Telecommunications Advanced)規格は、「4G」規格について記載している。IMTアドバンスド規格は、4Gサービスに対するピークデータレートを、高いモビリティ通信(例えば、電車および車からの)については毎秒100メガビット(Mビット/秒)に、低いモビリティ通信(例えば、歩行者および静止しているユーザからの)については毎秒1ギガビット(Gビット/秒)に設定する。
[0008] 人のスピーチ生成のモデルに関係のあるパラメータを抽出することでスピーチを圧縮するための技法を用いるデバイスは、スピーチコーダと呼ばれる。スピーチコーダは、エンコーダとデコーダとを備え得る。エンコーダは、着信スピーチ信号を、時間のブロック、すなわち分析フレームへと分割する。各セグメントの時間的な持続時間(すなわち「フレーム」)は、信号のスペクトルエンベロープが比較的静止状態のままであることが見込まれ得るのに十分に短くなるように選択され得る。特定のアプリケーションに適していると考えられる任意のフレーム長またはサンプレイングレートが使用され得るが、例えば、フレーム長は、20ミリ秒であり得、これは、8キロヘルツ(kHz)のサンプリングレートにおける160個のサンプルに対応する。
[0009] エンコーダは、着信スピーチフレームを分析して、ある特定の関連パラメータを抽出し、次に、そのパラメータをバイナリ表現へと、例えば、ビットのセットまたはバイナリデータパケットに量子化する。データパケットは、通信チャネル(すなわち、ワイヤードおよび/またはワイヤレスネットワーク接続)を通して、受信機およびデコーダに送信される。デコーダは、このデータパケットを処理し、処理されたデータパケットを逆量子化してパラメータを生成し、この逆量子化されたパラメータを使用してスピーチフレームを再合成する。
[0010] スピーチコーダの機能は、スピーチ固有の自然の冗長性を取り除くことで、デジタル化されたスピーチ信号を、低ビットレート信号へと圧縮することである。デジタル圧縮は、入力スピーチフレームをパラメータのセットで表現し、量子化を用いて、このパラメータをビットのセットで表現することで達成され得る。入力スピーチフレームが、ビット数Nを有し、スピーチコーダによって生成されるデータパケットがビット数Nを有する場合、スピーチコーダによって達成される圧縮率(compression factor)は、C=N/Nである。課題は、ターゲット圧縮率を達成しつつ、復号されたスピーチの高い音声品質を保持することである。スピーチコーダの性能は、(1)スピーチモデル、すなわち上述された分析と合成プロセスの組み合わせ、がいかにうまく機能するか、および(2)パラメータ量子化プロセスが、1フレームあたりNoビットというターゲットビットレートでいかにうまく行われるかに依存する。ゆえに、スピーチモデルの目標は、各フレームに対してパラメータの小さいセットを用いて、スピーチ信号の本質、すなわちターゲット音声品質、を捕えることである。
[0011] スピーチコーダは一般に、スピーチ信号を説明するためにパラメータ(ベクトルを含む)のセットを利用する。良いパラメータのセットは、理想的には、知覚的に正確なスピーチ信号の再構築のために低いシステム帯域幅を提供する。ピッチ、信号電力、スペクトルエンベロープ(または、フォルマント)、振幅、および位相スペクトルは、スピーチコーディングパラメータの例である。
[0012] スピーチコーダは、スピーチの小さいセグメント(例えば、5ミリ秒(ms)のサブフレーム)を同時に符号化するために高い時間分解能処理を用いることで、時間ドメインスピーチ波形をキャプチャするよう試みる時間ドメインコーダとして実装され得る。サブフレームごとに、コードブック空間からの高精度表現が探索アルゴリズムによって見つけられる。代替的に、スピーチコーダは、パラメータのセット(分析)を用いて、入力スピーチフレームの短期スピーチスペクトルをキャプチャし、スペクトルパラメータからスピーチ波形を再現するために対応する合成プロセスを用いるよう試みる周波数ドメインコーダとして実装され得る。パラメータ量子化器は、知られている量子化技法にしたがって、記憶されているコードベクトルの表現を用いてこれらパラメータを表現することでこれらを保つ(preserve)。
[0013] 1つの時間ドメインスピーチコーダは、コード励起線形予想(CELP)コーダである。CELPコーダでは、スピーチ信号における短期相関または冗長性が、線形予測(LP)分析によって取り除かれ、これは、短期フォルマントフィルタの係数を見つける。短期予測フィルタを着信スピーチフレームに適用することでLP残差信号が生成され、これは、さらに、長期予測フィルタパラメータと後続の確率コードブックとを用いてモデルおよび量子化される。ゆえに、CELPコーディングは、時間ドメインスピーチ波形を符号化するタスクを、LP短期フィルタ係数を符号化することと、LP残差を符号化することという別個のタスクに分割する。時間ドメインコーディングは、固定のレートで(すなわち、各フレームに対して同じビット数Nを使用して)、または可変レートで(この場合、異なるビットレートが、異なるタイプのフレームコンテンツに対して使用される)行われ得る。可変レートコーダは、ターゲット品質を取得するのに適したレベルにパラメータを符号化するのに必要なビット量を使用するよう試みる。
[0014] CELPコーダのような時間ドメインコーダは、時間ドメインスピーチ波形の正確性を保つために、1フレームあたり高いビット数Nに依拠し得る。そのようなコーダは、1フレームあたりのビット数Nが比較的大きい(例えば、8kbps以上)という条件で、優れた音声品質を伝達し得る。低いビットレート(例えば、4kbps以下)では、時間ドメインコーダは、利用可能なビットの限られた数により、高い品質およびロバストな性能を保持することができないだろう。低いビットレートでは、限られたコードブック空間は、時間ドメインコーダの波形整合機能をクリップし、これは、より高いレートの商用アプリケーションで展開される。それゆえ、低いビットレートで動作する多くのCELPコーディングシステムは、ノイズと特徴付けられる、知覚的に顕著な歪みから損害を被る。
[0015] 低いビットレートにおけるCELPコーダへの代替は、「Noise Excited Linear Predictive」(NELP)コーダであり、これは、CELPコーダと同様の原理で動作する。NELPコーダは、コードブックというよりはむしろ、スピーチをモデルするために、フィルタリングされた擬似ランダムノイズ信号を使用する。NELPが、コーディングされたスピーチに対してよりシンプルなモデルを使用するため、NELPは、CELPよりも低いビットレートを達成する。NELPは、無声スピーチまたは沈黙(silence)を圧縮または表現するために使用され得る。
[0016] 2.4kbps程度のレートで動作するコーディングシステムは一般に、事実上、パラメトリックである。すなわち、そのようなコーディングシステムは、規則的なインターバルで、スピーチ信号のピッチ周期およびスペクトルエンベロープ(または、フォルマント)を説明するパラメータを送信することで動作する。そのようなパラメトリックコーダの一例は、LPボコーダである。
[0017] LPボコーダは、1ピッチ周期あたり1パルスで、有声スピーチ信号をモデルする。この基本的な技法は、とりわけ、スペクトルエンベロープについての送信情報を含むように拡大され得る。LPボコーダは一般に合理的な性能を提供するが、それらは、バスと特徴付けられる、知覚的に顕著な歪みをもたらし得る。
[0018] 過去数年、波形コーダおよびパラメトリックコーダのハイブリッドであるコーダが出現してきた。これらのハイブリッドコーダの一例は、プロトタイプ波形補間(PWI)スピーチコーディングシステムである。PWIスピーチコーディングシステムは、プロトタイプピッチ周期(PPP)スピーチコーダとしても知られ得る。PWIスピーチコーディングシステムは、有声スピーチをコーディングするための効率的な方法を提供する。PWIの基本的な概要は、代表的なピッチ周期(プロトタイプ波形)を、その記述を送信するために、および、プロトタイプ波形間を補間することでスピーチ信号を再構築するために、固定のインターバルで抽出することである。PWI方法は、LP残差信号またはスピーチ信号の何れかに作用し得る。
[0019] 典型的な電話システム(例えば、公衆交換電話網(PSTN))では、信号帯域幅が、300ヘルツ(Hz)から3.4キロヘルツ(kHz)という周波数範囲に限られている。セルラ電話通話およびボイスオーバーインターネットプロトコル(VoIP)のような広帯域(WB)アプリケーションでは、信号帯域幅は、50Hzから7kHzの周波数範囲に及ぶ。超広帯域(SWB)コーディング技法は、約16kHzまで拡張する帯域幅をサポートする。信号帯域幅を、3.4kHzの狭帯域電話通話から16kHzのSWB電話通話に拡張することは、了解度(intelligibility)、自然性および、信号再構築の品質を改善し得る。
[0020] SWBコーディング技法は典型的に、信号のより低い周波数部分(例えば、50Hzから7kHz、「低帯域」とも呼ばれる)を符号化および送信することを伴う。例えば、低帯域は、フィルタパラメータおよび/または低帯域励起信号を使用して表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分(例えば、7kHzから16kHz、「高帯域」とも呼ばれる)は、完全には符号化および送信されないだろう。受信デバイスは、高帯域を予測するために信号モデリングを利用し得る。いくつかの実装形態では、低帯域信号のプロパティは、この予測を支援するための高帯域パラメータ(例えば、利得情報、線スペクトル周波数(LSF、線スペクトル対(LSP)とも呼ばれる))を生成するために使用され得る。しかしながら、低帯域と高帯域との間のエネルギ格差(disparities)は、高帯域を不正確に特徴付ける予測された高帯域パラメータに帰着し得る。
[0021] 他の実装形態では、高帯域パラメータ情報は、低帯域で送信され得る。高帯域パラメータは、高帯域パラメータ情報から抽出され得る。これらの実装形態では、高帯域パラメータは、高帯域パラメータ情報が受信されない場合生成されず、これは、高帯域から低帯域への遷移に帰着するだろう。例えば、高帯域パラメータは、特定のオーディオ信号については受信され得、後続のオーディオ信号については受信されないだろう。特定の入力信号に関連付けられた高帯域オーディオは、生成され得、後続のオーディオ信号に関連付けられた高帯域オーディオは、生成されないだろう。特定のオーディオ信号に関連付けられた高帯域オーディオを含む特定の出力信号から、後続のオーディオ信号に関連付けられた後続の出力信号への遷移が存在し得る。後続の出力信号は、後続のオーディオ信号に関連付けられた低帯域を含み得、後続のオーディオ信号に関連付けられた高帯域は含まないだろう。高帯域オーディオを含む特定の出力信号から、高帯域オーディオを含まない後続の出力信号への遷移に関連付けられたオーディオ品質における知覚可能な低下があるだろう。
[0022] 帯域幅拡張技法の動的選択のためのシステムおよび方法が開示される。オーディオデコーダは、符号化されたオーディオ信号を受信し得る。符号化されたオーディオ信号のうちのいくつかは、高帯域の再構築を支援し得る高帯域パラメータを含み得る。他の符号化されたオーディオ信号は、高帯域パラメータを含まないか、または高帯域パラメータに関連付けられた送信エラーが存在するだろう。特定の実施形態では、オーディオデコーダは、高帯域パラメータが成功裏に受信されるとき、受信された高帯域パラメータを使用して高帯域を再構築し得る。高帯域パラメータがオーディオデコーダによって成功裏に受信されないとき、オーディオデコーダは、低帯域に基づいて予測を行うことで高帯域パラメータを生成し得、この予測された高帯域パラメータを使用して高帯域を再構築し得る。代替的な実施形態では、制御入力に基づいて、オーディオデコーダは、受信された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することとを動的に切り替え得る。
[0023] 特定の実施形態では、デバイスはデコーダを含む。デコーダは、抽出器、予測器、セレクタ、およびスイッチを含む。抽出器は、受信された入力信号から第1の複数のパラメータを抽出するように構成される。入力信号は、符号化されたオーディオ信号に対応する。予測器は、入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成される。第2の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第2の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。セレクタは、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成される。複数の高帯域モードは、第1の複数のパラメータを使用する第1のモードと、第2の複数のパラメータを使用する第2のモードとを含む。スイッチは、選択されたモードに基づいて、第1の複数のパラメータまたは第2の複数のパラメータを出力するように構成される。
[0024] 別の特定の実施形態では、方法は、デコーダにおいて、受信された入力信号から第1の複数のパラメータを抽出することを含む。入力信号は、符号化されたオーディオ信号に対応する。方法はまた、デコーダにおいて、入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うことを含む。第2の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第2の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。方法はさらに、デコーダにおいて、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択することを含む。複数の高帯域モードは、第1の複数のパラメータを使用する第1のモードと、第2の複数のパラメータを使用する第2のモードとを含む。方法はさらに、特定のモードの選択に応答して、第1の複数のパラメータまたは第2の複数のパラメータをデコーダの出力ジェネレータに送ることを含む。
[0025] 別の特定の実施形態では、コンピュータ可読記憶デバイスは、プロセッサによって実行されると、プロセッサに動作を行わせる命令を記憶している。動作は、受信された入力信号から第1の複数のパラメータを抽出することを含む。入力信号は、符号化されたオーディオ信号に対応する。動作はまた、入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うことを含む。第2の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第2の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。動作はさらに、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択することを含む。複数の高帯域モードは、第1の複数のパラメータを使用する第1のモードと、第2の複数のパラメータを使用する第2のモードとを含む。動作はまた、選択されたモードに基づいて、第1の複数のパラメータまたは第2の複数のパラメータを出力することを含む。
[0026] 開示される実施形態のうちの少なくとも1つによって提供される特定の利点は、抽出された高帯域パラメータを使用することと、予測された帯域パラメータを使用することとを動的に切り替えることを含む。例えば、オーディオデコーダは、予測された高帯域パラメータを使用することで、抽出された高帯域パラメータに関連付けられたエラーを隠蔽するか、またはその影響(effect)を低減し得る。例えば、ネットワークコンディションがオーディオ送信中悪化し得、これは、抽出された高帯域パラメータに関連付けられたエラーをもたらす。オーディオデコーダは、ネットワーク送信エラーの影響を低減するために、予測された高帯域パラメータを使用することに切り替わり得る。本開示の他の態様、利点、および特徴は、図面の簡単な説明、発明の詳細な説明、および特許請求の範囲を含む本願全体のレビュー後に明らかになるであろう。
[0027] 図1は、帯域幅拡張モード選択を行うように動作可能なシステムの特定の実施形態を例示する図である。 [0028] 図2は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0029] 図3は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0030] 図4は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0031] 図5は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0032] 図6は、帯域幅拡張モード選択の方法の特定の実施形態を例示するフローチャートである。 [0033] 図7は、図1−6のシステムおよび方法にしたがって帯域幅拡張モード選択を行うように動作可能なデバイスのブロック図である。
発明の詳細な説明
[0034] 本明細書で説明される原理は、例えば、ヘッドセット、ハンドセット、または、スピーチ信号置換を行うように構成された他のオーディオデバイスに適用され得る。その文脈によって明示的に限定されない限り、「信号」という用語は、本明細書において、ワイヤ、バス、または他の送信媒体上に表されるようなメモリロケーション(または、メモリロケーションのセット)の状態を含む、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「生成する(generating)」という用語は、本明細書において、計算するまたはそれ以外の方法で生成する(producing)、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「算出する」という用語は、本明細書において、計算する、評価する、平滑化する、および/または複数の値から選択する、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「取得する」という用語は、算出する、導出する、受信する(例えば、別の構成要素、ブロック、またはデバイスから)、および/または取り出す(例えば、メモリレジスタまたは記憶要素のアレイから)、等の、それのあらゆる本来の意味を示すために使用される。
[0035] その文脈によって明示的に限定されない限り、「生成する(producing)」という用語は、算出する、生成する(generating)、および/または提供する、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「提供する」という用語は、算出する、生成する(generating)、および/または生成する(producing)、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「結合される」という用語は、直接的なまたは間接的な電気的または物理的接続を示すために使用される。接続が間接的である場合、「結合」されている構造間に他のブロックまたは構成要素が存在し得ることは、当業者によってよく理解される。
[0036] 「構成」という用語は、それの特定の文脈によって示されているような、方法、装置/デバイス、および/またはシステムに関して使用され得る。本説明および特許請求の範囲において、「備える」という用語が使用されている場合、それは、他の要素または動作を除外しない。「〜に基づいて」という用語(「AはBに基づく」にあるような)は、(i)「少なくとも〜に基づく」(例えば、「Aは少なくともBに基づく」)、および、特定の文脈において適切な場合には(ii)「〜に等しい」(例えば、「AはBに等しい」)というケースを含む、それのあらゆる本来の意味を示すために使用される。AがBに基づく、が、少なくとも基づく、を含むケース(i)では、これは、AがBに結合されている構成を含み得る。同様に、「〜に応答して」という用語は、「少なくとも〜に応答して」を含む、それのあらゆる本来の意味を示すために使用される。「少なくとも1つ」という用語は、「1つまたは複数」を含む、それのあらゆる本来の意味を示すために使用される。「少なくとも2つ」という用語は、「2つ以上」を含む、それのあらゆる本来の意味を示すために使用される。
[0037] 「装置」および「デバイス」という用語は、特定の文脈によって別途示されていない限り、包括的にかつ交換可能に使用される。別途示されていない限り、特定の特徴を有する装置の動作のあらゆる開示はまた、類似する特徴を有する方法を開示するように明示的に意図されており(逆の場合も同じである)、特定の構成に係る装置の動作のあらゆる開示はまた、類似する構成に係る方法を開示するように明示的に意図されている(逆の場合も同じである)。「方法」、「プロセス」、「プロシージャ」、および、「技法」という用語は、特定の文脈によって別途示されていない限り、包括的にかつ交換可能に使用される。「要素」および「モジュール」という用語は、より大きな構成の一部を示すために使用され得る。文書の一部の参照による組み込みはいずれも、また、その一部の内で参照される変数または用語の定義を組み込むものと理解されるものとし、この場合、そのような定義は、この文書の他の箇所だけでなく、組み込まれた一部において参照されているあらゆる図面にも現れる。
[0038] 本明細書で使用される場合、「通信デバイス」という用語は、ワイヤレス通信ネットワークを通した音声および/またはデータ通信のために使用され得る電子デバイスを指す。通信デバイスの例には、セルラ電話、携帯情報端末(PDA)、ハンドヘルドデバイス、ヘッドセット、ワイヤレスモデム、ラップトップコンピュータ、パーソナルコンピュータ、等が含まれる。
[0039] 図1を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの特定の実施形態が示されており、概して100と指定されている。特定の実施形態では、システム100は、復号システムまたは装置(例えば、ワイヤレス電話またはコーダ/デコーダ(CODEC))へと一体化され得る。他の実施形態では、システム100は、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末(PDA)、固定ロケーションデータユニット、またはコンピュータへと一体化され得る
[0040] 以下の説明では、図1のシステム100によって行われる様々な機能が、ある特定の構成要素またはモジュールによって行われるものとして説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分担は、例示のためのものでしかない。代替的な実施形態では、特定の構成要素またはモジュールによって行われる機能は、複数の構成要素またはモジュールの間で分けられる。さらに、代替的な実施形態では、図1の2つ以上の構成要素またはモジュールは、単一の構成要素またはモジュールへと一体化され得る。図1に例示される各構成要素またはモジュールは、ハードウェア(例えば、フィールドプログラマブルゲートウェイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP)、コントローラ、等)、ソフトウェア(例えば、プロセッサによって実行可能な命令)、あるいはそれらの任意の組み合わせを使用して実装され得る。
[0041] 図1−7に描写される実例となる実施形態は、エンハンスド可変レートコーデック−狭帯域広帯域(EVRC−NW)で使用されるものに類似した高帯域モデルに関連して説明されるが、実例となる実施形態のうちの1つまたは複数は、任意の他の高帯域モデルを使用し得る。任意の特定のモデルの使用が例示のためにのみ説明されることは理解されるべきである。
[0042] システム100は、ネットワーク120を介して、第2のデバイス106と通信状態にある第1のデバイス104を含む。第1のデバイス104は、マイクロフォン146に結合され得るか、またはそれと通信状態にあり得る。第1のデバイス104は、エンコーダ114を含み得る。第2のデバイス106は、スピーカ142に結合され得るか、またはそれと通信状態にあり得る。第2のデバイス106は、デコーダ116を含み得る。デコーダ116は、帯域幅拡張モジュール118を含み得る。
[0043] 動作中、第1のデバイス104は、オーディオ信号130(例えば、第1のユーザ152のユーザスピーチ信号)を受信し得る。例えば、第1のユーザ152は、第2のユーザ154との音声呼に従事し得る。音声呼のために、第1のユーザ152は、第1のデバイス104を使用し得、第2のユーザ154は、第2のデバイス106を使用し得る。音声呼中、第1のユーザ152は、第1のデバイス104に結合されたマイクロフォン146に向かって話し掛け得る。オーディオ信号130は、第1のユーザ152が話した複数のワード、1つのワード、または1つのワードの一部に対応し得る。オーディオ信号130は、背景ノイズ(例えば、音楽、ストリートノイズ、別の人物のスピーチ、等)に対応し得る。第1のデバイス104は、マイクロフォン146を介してオーディオ信号130を受信し得る。
[0044] 特定の実施形態では、マイクロフォン146は、オーディオ信号130をキャプチャし得、第1のデバイス104のアナログ/デジタル変換器(ADC)は、キャプチャされたオーディオ信号130を、アナログ波形から、デジタルオーディオサンプルから成るデジタル波形へと変換し得る。デジタルオーディオサンプルは、デジタルシグナルプロセッサによって処理され得る。利得調整器は、オーディオ信号(例えば、アナログ波形またはデジタル波形)の振幅レベルを増加または減少させることで、利得(例えば、アナログ波形またはデジタル波形の)を調整し得る。利得調整器は、アナログドメインまたはデジタルドメインのどちらでも動作し得る。例えば、利得調整器は、デジタルドメインにおいて動作し得、アナログ/デジタル変換器によって生成されたデジタルオーディオサンプルを調整し得る。利得調整の後、エコーキャンセラは、スピーカの出力がマイクロフォン146に入ったことによって作り出された可能性のあるエコーを低減し得る。デジタルオーディオサンプルは、ボコーダ(音声エンコーダ―デコーダ)によって「圧縮」され得る。エコーキャンセラの出力は、例えば、フィルタ、ノイズプロセッサ、レート変換器、等のボコーダ事前処理ブロックに結合され得る。ボコーダのエンコーダ(例えば、エンコーダ114)は、デジタルオーディオサンプルを圧縮し、送信パケット(デジタルオーディオサンプルの圧縮ビットの表現)を形成し得る。例えば、エンコーダは、狭帯域ビットストリームに高帯域情報を「隠蔽する」ためにウォーターマーキングを使用し得る。スピーチコーデックビットストリームへのウォーターマーキングまたはデータ隠蔽は、ネットワークインフラストラクチャに変更を加えることなく、帯域内での追加データの送信を可能にし得る。
[0045] ウォーターマーキングは、新しいコーデックのための新しいインフラストラクチャを展開するコストを負担することなく、ある範囲のアプリケーション(例えば、認証、データ隠蔽、等)に対して使用され得る。1つの可能性のあるアプリケーションは、帯域幅拡張であり得、ここでは、1つのコーデックのビットストリーム(例えば、展開されたコーデック)が、高品質帯域拡張についての情報を含む隠蔽されたビットのためのキャリアとして使用される。キャリアビットストリームおよび隠蔽されたビットを復号することは、キャリアコーデックの帯域幅よりも大きい帯域幅を有するオーディオ信号の合成を可能にし得る(例えば、ネットワークインフラストラクチャを変えることなく、より広い帯域幅が達成され得る)。
[0046] 例えば、狭帯域コーデックは、スピーチの0−4キロヘルツ(kHz)の低帯域部分を符号化するために使用され得、スピーチの4−7kHzの高帯域部分は、個別に符号化され得る。高帯域のためのビットは、狭帯域スピーチビットストリーム内に隠蔽され得る。この例では、広帯域オーディオ信号は、レガシ狭帯域ビットストリームを受信する受信機において復号され得る。別の例では、広帯域コーデックは、スピーチの0−7kHzの低帯域部分を符号化するために使用され得、スピーチの7−14kHzの高帯域部分は、個別に符号化され、広帯域ビットストリームに隠蔽される。この例では、超広帯域オーディオ信号は、レガシ広帯域ビットストリームを受信する受信機において復号され得る。
[0047] ウォーターマークは、適応性があり得る。エンコーダ114は、線形予測(LP)コーディングを使用してオーディオ信号(例えば、スピーチ)を圧縮し得る。エンコーダ114は、オーディオ信号の1フレームあたり、特定の数(例えば、80または160個)のオーディオサンプルを受信し得る。特定の実施形態では、エンコーダ114は、オーディオ信号を圧縮するために、コード励起線形予測(CELP)を行い得る。例えば、エンコーダ114は、適応型コードブック寄与と固定のコードブック寄与との合計に対応する励起信号を生成し得る。適応型コードブック寄与は、励起信号の周期性(例えば、ピッチ)を提供し得、固定のコードブック寄与は、残りのものを提供し得る。
[0048] オーディオ信号の各フレームは、特定の数のサブフレームに対応し得る。例えば、160個のサンプルからなる20ミリ秒(ms)フレームは、各々40個のサンプルからなる4つの5msサブフレームに対応し得る。各固定のコードブックベクトルは、特定の数(例えば、40個)のサンプルを有するサブフレームのサブフレーム励起信号に対応する特定の数(例えば、40個)の成分を有し得る。ベクトルの位置(または、成分)は、0−39とラベル付けされ得る。
[0049] 各固定のコードブックベクトルは、特定の数(例えば、5個)のパルスを含み得る。例えば、固定のコードブックベクトルは、特定の数(例えば、5個)のインターリーブドトラックの各々に、1つの±1パルスを含み得る。各トラックは、特定の各(例えば、8個)の位置(またはビット)に対応し得る。
[0050] 特定の実施形態では、40個のサンプルからなる各サブフレームは、1トラックあたり8つの位置を有する5個のインターリーブドトラックに対応し得る。いくつかの構成では、適応型マルチレート狭帯域(AMR−NB)12.2(この場合、12.2は、毎秒12.2キロビット(kbps)のビットレートを指し得る)が使用され得る。AMR−NB12.2では、1つの40サンプルサブフレームあたり8つの位置のトラックが5個存在する。
[0051] 例えば、固定のコードブックベクトルの位置0,5,10,15,20,25,30,および35がトラック0を形成し得る。別の例では、固定のコードブックベクトルの位置1,6,11,16,21,26,31,および36がトラック1を形成し得る。さらに別の例では、固定のコードブックベクトルの位置2,7,12,17,22,27,32,および37がトラック2を形成し得る。別の例では、固定のコードブックベクトルの位置3,8,13,18,23,28,33,および38がトラック3を形成し得る。さらに別の例では、固定のコードブックベクトルの位置4,9,14,24,29,34,および39がトラック4を形成し得る。
[0052] エンコーダ114は、特定のトラックを符号化するために、特定の数(例えば、2個)の±1パルスおよび1つまたは複数の符号ビットを使用し得る。例えば、エンコーダ114は、1トラックあたり2つのパルスと1つの符号ビットとを符号化し得、この場合、これらパルスの順序は、第2のパルスの符号を決定し得る。8個の可能な位置におけるパルスのロケーションは、3ビットを使用して符号化され得る。この例では、エンコーダ114は、各トラックを符号化するために、7(すなわち、3+3+1)ビットを使用し得、各サブフレームを符号化するために35(すなわち、7×5)ビットを使用し得る。
[0053] エンコーダ114は、サブフレームのどのトラック(例えば、トラック0、トラック1、トラック2、トラック3、および/またはトラック4)がより高い優先度を有するかを決定し得る。例えば、エンコーダ114は、特定の数(例えば、2個)のより高い優先度のトラックを、復号されたサブフレームの知覚的オーディオ品質に対するそれらトラックのインパクトに基づいて識別し得る。エンコーダ114は、より高い優先度のトラックを示す情報が追加的にまたは個別に送信される必要がないように、エンコーダ114およびデコーダ116の両方にある情報を使用して、より高い優先度のトラックを識別し得る。一構成では、長期予測(LTP)寄与は、ウォーターマークから、より高い優先度のトラックを保護するために使用され得る。例えば、LTP寄与は、特定のトラックに対応する主要なピッチパルスにおいてピークを示し得、エンコーダ114およびデコーダ116の両方において利用可能であり得る。例えば、エンコーダ114は、LTP寄与の2つの最も高い絶対値に対応する2つのより高い優先度のトラックを識別し得る。エンコーダ114は、3つの残りのトラックをより低い優先度のトラックとして識別し得る。
[0054] エンコーダ114は、2つのより高い優先度のトラックをウォーターマークせず、より低い優先度のトラックをウォーターマークし得る。例えば、ウォーターマークを符号化するために、エンコーダ114は、より低い優先度のトラックの各々に対応するビット(例えば、7ビット)のうち特定の数(例えば、2個)の最下位ビットを使用し得る。例えば、エンコーダ114は、主要のピッチパルスに対して低減された(例えば、最小の)インパクトを有するウォーターマークで搬送される1つの5msサブフレームあたり6(すなわち、2×3)ビット、合計で毎秒1.2キロビット(kbps)、のウォーターマークを生成し得る。
[0055] LTP信号は、エラーおよびパケット損失に敏感であり得、エラーは、ある時間にわたって伝播し得、結果として、デコーダ116によって受信された、符号化されたオーディオ信号における抹消またはビットエラーの後、長期間の間、エンコーダ114およびデコーダ116は同期がずれることになる。特定の実施形態では、エンコーダ114およびデコーダ116は、より高い優先度のトラックを識別するために、メモリ制限付きLTP寄与を使用し得る。LTPのメモリ制限付きバージョンは、特定のフレームのおよびこの特定のフレームに先行する特定の数(例えば2個)のフレームのコードブック寄与および量子化されたピッチ値に基づいて構築され得る。利得は、1(unity)に設定され得る。エンコーダ114およびデコーダ116によるLTP寄与のメモリ制限付きバージョンの使用は、エラー(例えば、送信エラー)がある場合の性能を大幅に改善し得る。特定の実施形態では、オリジナルのLTP寄与は、低帯域コーディングに使用され得、メモリ制限付きLTP寄与は、ウォーターマークする目的で、より高い優先度のトラックを識別するために使用され得る。
[0056] すべてのトラックにわたってではなく、知覚的オーディオ品質に対してより低いインパクトを有するトラックにおいてウォーターマークを符号化することは、復号されるオーディオ信号の品質の改善に帰着し得る。具体的には、主要のピッチパルスは、主要のピッチパルスに対応するより高い優先度のトラック内にウォーターマークを符号化しないことで、保たれ得る。主要のピッチパルスを保護することは、復号されるオーディオ信号のスピーチ品質に対して肯定的なインパクトを有し得る。
[0057] いくつかの構成では、本明細書で開示されるシステムおよび方法は、AMR−NB12.2の後方相互運用バージョンであるコーデックを提供するために使用され得る。このコーデックは、異なる用語を使用して呼ばれる可能性があるが、便宜上、このコーデックは、本明細書では「eAMR」と呼ばれ得る。eAMRは、狭帯域ビットストリーム内に隠蔽された広帯域情報の「薄い」レイヤをトランスポートする能力を有し得る。eAMRは、ウォーターマーキング(例えば、ステガノグラフィ)技術を使用し得、帯域外シグナリングに依拠しない。使用されるウォーターマークは、狭帯域品質(レガシの相互運用の場合)に対してわずかなインパクトを有し得る。ウォーターマークを用いると、狭帯域品質は、例えば、AMR12.2と比べて、わずかに劣化し得る。いくつかの構成では、エンコーダ114のようなエンコーダは、受信デバイスのレガシデコーダを検出し得(例えば、戻りチャネル上でウォーターマークを検出しないことを通じて)、ウォーターマークを追加することを停止し得、レガシAMR12.2動作に戻る。
[0058] エンコーダ114は、圧縮ビット(例えば、1サブフレームあたり35ビット)に対応する送信パケットを生成し得る。エンコーダ114は、第1のデバイス104に結合されているかまたはそれと通信状態にあるメモリに、送信パケットを記憶し得る。例えば、メモリは、第1のデバイス104のプロセッサによってアクセス可能であり得る。プロセッサは、デジタルシグナルプロセッサと通信状態にある制御プロセッサであり得る。第1のデバイス104は、入力信号102(例えば、符号化されたオーディオ信号)を、ネットワーク120を介して第2のデバイス106に送信し得る。入力信号102は、オーディオ信号130に対応し得る。特定の実施形態では、第1のデバイス104は、トランシーバを含み得る。トランシーバは、何らかの形式の送信パケット(他の情報は、送信パケットに添付され得る)を変調し得、変調された情報を、アンテナを介して無線経由で送り得る。
[0059] 第2のデバイス106の帯域幅拡張モジュール118は、入力信号102を受信し得る。例えば、第2のデバイス106のアンテナは、送信パケットを備える何らかの形式の着信パケットを受信し得る。送信パケットは、第2のデバイス106のボコーダのデコーダ(例えば、デコーダ116)によって「解凍される(uncompressed)」だろう。解凍された信号は、再構築されたオーディオサンプルと呼ばれ得る。再構築されたオーディオサンプルは、ボコーダ事後処理ブロックによって事後処理され得、エコーを取り除くためにエコーキャンセラによって使用され得る。明確さのために、ボコーダのデコーダおよびボコーダ事後処理ブロックは、ボコーダデコーダモジュールと呼ばれ得る。いくつかの構成では、エコーキャンセラの出力は、帯域幅拡張モジュール118によって処理され得る。代替的に、他の構成では、ボコーダデコーダモジュールの出力は、帯域幅拡張モジュール118によって処理され得る。
[0060] 帯域幅拡張モジュール118は、入力信号102から第1の複数のパラメータを抽出するための抽出器を含み得、入力信号102内の高帯域情報から独立して第2の複数のパラメータを予測するための予測器も含み得る。例えば、帯域幅拡張モジュール118は、入力信号102からウォーターマークデータを抽出し得、このウォーターマークデータに基づいて第1の複数のパラメータを決定し得る。特定の実施形態では、ボコーダデコーダモジュールは、eAMRデコーダモジュールであり得る。例えば、デコーダ116は、eAMRデコーダであり得る。帯域幅拡張モジュール118は、入力信号102の高帯域情報から独立した第2の複数のパラメータを生成するために、予測器を使用することでブラインド帯域幅拡張を行い得る。
[0061] 帯域幅拡張モジュール118は、図2−5に関連して説明されるように、オーディオ信号130の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択し得、この特定のモードに基づいて出力信号128を生成し得る。例えば、複数の高帯域モードは、抽出された高帯域パラメータを使用する第1のモード、予測された高帯域パラメータを使用する第2のモード、高帯域パラメータから独立した第3のモード、またはそれらの組み合わせを含み得る。帯域幅拡張モジュール118は、選択されたモードに基づいて、抽出された高帯域パラメータを使用して、予測された高帯域パラメータを使用して、または高帯域パラメータから独立した出力信号128を生成し得る。
[0062] 出力信号128は、利得調整器によって増幅または抑制され得る。第2のデバイス106は、スピーカ142を介して、出力信号128を第2のユーザ154に提供し得る。例えば、利得調整器の出力は、デジタル/アナログ変換器によってデジタル信号からアナログ信号に変換され得、スピーカ142を介して再生され得る。
[0063] システム100は、出力信号を生成するために、抽出された複数のパラメータを使用すること、生成された複数のパラメータを使用すること、またはいずれの高帯域パラメータも使用しないことの切替えを可能にし得る。生成された複数のパラメータを使用することは、抽出された複数のパラメータに関連付けられたエラーがあるときに、高帯域オーディオ信号の生成を可能にし得る。ゆえに、システム100は、入力信号102で発生するエラーがあるときに、エンハンスドオーディオ信号再生を可能にし得る。
[0064] 図2を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの実例となる実施形態が示されており、概して200と指定されている。特定の実施形態では、システム200は、図1のシステム100(または、システム100の1つまたは複数の構成要素)に対応し得るか、またはそれに含まれ得る。例えば、システム200の1つまたは複数の構成要素は、図1の帯域幅拡張モジュール118に含まれ得る。
[0065] システム200は、受信機204を含む。受信機204は、抽出器206および予測器208に結合され得るか、またはそれらと通信状態にあり得る。抽出器206、予測器208、およびセレクタ210は、スイッチ212に結合され得る。受信機204およびスイッチ212は、信号ジェネレータ214に結合され得る。
[0066] 動作中、受信機204は、入力信号(例えば、図1の入力信号102)を受信し得る。入力信号102は、入力ビットストリームに対応し得る。受信機204は、入力信号102を、抽出器206に、予測器208に、および信号ジェネレータ214に提供し得る。入力信号102は、オーディオ信号130の高帯域部分に関連付けられた高帯域パラメータ情報を含む場合も含まない場合もある。例えば、第1のデバイス104のエンコーダ114は、高帯域パラメータ情報を含む入力信号102を生成する場合も生成しない場合もある。例えば、エンコーダ114は、高帯域パラメータ情報を生成するように構成されない場合がある。エンコーダ114が、高帯域パラメータ情報を含めるように入力信号102を生成する場合であっても、この高帯域パラメータ情報は、受信機204によって受信されない場合がある(例えば、送信エラーにより)。特定の実施形態では、入力信号102は、高帯域パラメータ情報に対応するウォーターマークデータ232を含み得る。例えば、エンコーダ114は、ウォーターマークデータ232を、帯域内で、オーディオ信号130の低帯域部分に対応する低帯域ビットストリームに埋め込み得る。
[0067] 抽出器206は、入力信号102から第1の複数のパラメータ220を抽出し得る。第1の複数のパラメータ220は、高帯域パラメータ情報に対応し得る。例えば、第1の複数のパラメータ220は、線スペクトル周波数(LSF)、利得形状(例えば、特定のフレームのサブフレームに対応する時間的利得パラメータ)、利得フレーム(例えば、特定のフレームについての低帯域に対する高帯域のエネルギ比に対応する利得パラメータ)、または高帯域部分に対応する他のパラメータのうちの少なくとも1つを含み得る。特定の実施形態では、第1の複数のパラメータ220のうちの1つまたは複数は、特定の高帯域モデルに対応し得る。例えば、特定の高帯域モデルは、周波数ドメインにおける高帯域拡張、LSF、時間的利得、またはそれらの組み合わせを使用し得る。
[0068] 抽出器206は、入力信号102が高帯域パラメータ情報を含む場合、高帯域パラメータ情報が埋め込まれているだろう、入力信号102のロケーションを決定し得る。例えば、高帯域パラメータ情報は、入力信号102内の低帯域パラメータ情報238に埋め込まれ得る。低帯域パラメータ情報238は、入力信号102の低帯域部分に関連付けられた低帯域パラメータに対応し得る。別の例として、入力信号102は、高帯域パラメータ情報(例えば、第1の複数のパラメータ220)を符号化するウォーターマークデータ232を含み得る。特定の実施形態では、抽出器206は、コードブック(例えば、固定のコードブック(FCB))に基づいてロケーションを決定し得る。例えば、コードブックは、入力信号102のオーディオ符号化プロセスにおいて使用されるトラックの数でインデックス付けされ得る。抽出器206は、最大の長期予測(LTP)寄与を有するある数(例えば、2個)のトラックを、高い優先度のトラックとして決定(または、指定)し得、他のトラックは、低い優先度のトラックとして決定(または、指定)され得る。特定の実施形態では、低い優先度のトラックは、入力信号102の低優先度部分234に対応し得、高い優先度のトラックは、高優先度部分236に対応し得る。抽出器206は、決定されたロケーションから第1の複数のパラメータ220を抽出し得る。例えば、抽出器206は、低優先度部分234から第1の複数のパラメータ220を抽出し得る。第1の複数のパラメータ220は、入力信号102が高帯域パラメータ情報を含む場合、高帯域パラメータに対応し得る。入力信号102が、高帯域パラメータ情報を含まない場合、第1の複数のパラメータ220は、ランダムデータに対応し得る。抽出器206は、スイッチ212に第1の複数のパラメータ220を提供し得る。
[0069] 予測器208は、受信機204から入力信号102を受信し得、第2の複数のパラメータ222を生成し得る。第2の複数のパラメータ222は、入力信号102の高帯域部分に対応し得る。予測器208は、入力信号102から抽出された低帯域パラメータ情報に基づいて、第2の複数のパラメータ222を生成し得る。予測器208は、図3に関連してさらに説明されるように、低帯域パラメータ情報に基づいてブラインド帯域幅拡張を行うことで、第2の複数のパラメータ222を生成し得る。特定の実施形態では、予測器208は、特定の高帯域モデルに基づいて、第2の複数のパラメータ222を生成し得る。例えば、特定の高帯域モデルは、周波数ドメインにおける高帯域拡張、LSF、時間的利得、またはそれらの組み合わせを使用し得る。
[0070] 予測器208は、スイッチ212に第2の複数のパラメータ222を提供し得る。特定の実施形態では、第1の複数のパラメータ220は、予測器208が第2の複数のパラメータ222を生成するのと同時に、抽出器206によって抽出され得る。
[0071] セレクタ210は、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択し得る。複数の高帯域モードは、抽出された高帯域パラメータ(例えば、第1の複数のパラメータ220)を使用する第1のモードと、予測された高帯域パラメータ(例えば、第2の複数のパラメータ222)を使用する第2のモードとを含み得る。セレクタ210は、制御入力230(例えば、制御入力信号)に基づいて特定のモードを選択し得る。制御入力230は、ユーザ入力に対応し得、ユーザセッティングまたはプリファレンスを示し得る。特定の実施形態では、制御入力230は、プロセッサによってセレクタ210に提供され得る。プロセッサは、他のデバイスからエンコーダに関する情報を受信すること、または、1つまたは複数の他のデバイスから通信ネットワークに関する受信することに応答して制御入力230を生成し得る。例えば、制御入力230は、プロセッサが、エンコーダが入力信号102中に高帯域パラメータを含めていないことを示す情報を受信すること、通信ネットワークが送信エラーを経験していることを示す情報を受信すること、またはその両方に応答して、予測された高帯域パラメータを使用することを示し得る。制御入力230は、デフォルト値(例えば、1または2)を有し得る。セレクタ210は、制御入力230が第1の値(例えば、1)を示すことに応答して第1のモードを選択し得、制御入力230が第2の値(例えば、2)を示すことに応答して第2のモードを選択し得る。セレクタ210は、パラメータモード224をスイッチ212に送り得る。パラメータモード224は、選択されたモード(例えば、第1のモードまたは第2のモード)を示し得る。
[0072] 特定の実施形態では、複数の高帯域モードは、任意の高帯域パラメータから独立した第3のモードも含み得る。セレクタ210は、制御入力230が第1の値(例えば、1)を示すことに応答して第1のモードを選択し得、制御入力230が第2の値(例えば、2)を示すことに応答して第2のモードを選択し得、制御入力230が第3の値(例えば、0)を示すことに応答して第3のモードを選択し得る。セレクタ210は、選択されたモード(例えば、第1のモード、第2のモード、または第3のモード)を示すパラメータモード224をスイッチ212に送り得る。
[0073] スイッチ212は、抽出器206から第1の複数のパラメータ220を、予測器208から第2の複数のパラメータ222を、そしてセレクタ210からパラメータモード224を受信し得る。スイッチ212は、パラメータモード224に基づいて、選択されたパラメータ226(例えば、第1の複数のパラメータ220、第2の複数のパラメータ222、または高帯域パラメータなし)を、信号ジェネレータ214に提供し得る。例えば、スイッチ212は、パラメータモード224が第1のモードを示すことに応答して、第1の複数のパラメータ220を信号ジェネレータ214に提供し得る。スイッチ212は、パラメータモード224が第2のモードを示すことに応答して、第2の複数のパラメータ222を信号ジェネレータ214に提供し得る。スイッチ212は、パラメータモード224が第3のモードを示すことに応答して、いずれの高帯域パラメータも信号ジェネレータ214によって使用されないように、いずれの高帯域パラメータも信号ジェネレータ214に提供しないだろう。
[0074] 信号ジェネレータ214は、受信機204から入力信号102を受信し得、スイッチ212から、選択されたパラメータ226を受信し得る。信号ジェネレータ214は、選択されたパラメータ226および入力信号102に基づいて、出力高帯域部分を生成し得る。例えば、選択されたパラメータ226が、高帯域パラメータ(例えば、第1の複数のパラメータ220または第2の複数のパラメータ222)に対応する場合、信号ジェネレータ214は、出力高帯域部分を生成するために、選択されたパラメータ226をモデルおよび/または復号し得る。例えば、信号ジェネレータ214は、出力高帯域部分を生成するために、特定の高帯域モデルを使用し得る。実例となる例として、特定の高帯域モデルは、周波数ドメインにおける高帯域拡張、LSF、時間的利得、またはそれらの組み合わせを使用し得る。より高い周波数帯域に対して使用される特定の高帯域モデルは、復号されたより低い帯域信号に依存し得る。信号ジェネレータ214は、入力信号102に基づいて、出力低帯域部分を生成し得る。例えば、信号ジェネレータ214は、出力低帯域部分を生成するために、入力信号102から低帯域パラメータを抽出、モデル、および/または復号し得る。出力低帯域部分は、出力高帯域部分を生成するために使用され得る。信号ジェネレータ214は、出力低帯域部分と出力高帯域部分とを組み合せることで、出力信号128(例えば、復号されたオーディオ信号)を生成し得る。信号ジェネレータ214は、出力信号128を再生デバイス(例えば、スピーカ)に送信し得る。
[0075] いずれの高帯域パラメータも信号ジェネレータ214に提供されない場合、信号ジェネレータ214は、出力低帯域部分を生成し得、出力高帯域部分を生成することを控え得る。このケースでは、出力信号128は、低帯域オーディオにのみ対応し得る。
[0076] 特定の実施形態では、入力信号102は、略50ヘルツ(Hz)から略16キロヘルツ(kHz)の周波数範囲のデータを含む超広帯域(SWB)信号であり得る。入力信号102の低帯域部分はおよび入力信号102の高帯域部分は、それぞれ50Hz〜7kHzおよび7kHz〜16kHzという重複していない周波数帯域を占有し得る。代替的な実施形態では、低帯域部分および高帯域部分は、それぞれ、50Hz〜8kHzおよび8kHz〜16kHzという重複していない周波数帯域を占有し得る。別の代替的な実施形態では、低帯域部分および高帯域部分は重複し得る(例えば、それぞれ、50Hz〜8kHzおよび7kHz〜16kHz)。
[0077] 特定の実施形態では、入力信号102は、略50Hz〜略8kHzの周波数範囲を有する広帯域(WB)信号であり得る。そのような実施形態では、入力信号102の低帯域部分は、略50Hz〜略6.4kHzの周波数範囲に対応し得、入力信号102の高帯域部分は、略6.4kHz〜略8kHzの周波数範囲に対応し得る。
[0078] 図2のシステム200は、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないこととを、制御入力(例えば、制御入力230)に基づいて動的に切り替えることを可能にし得る。特定の実施形態では、制御入力230は、システム200のリソース(例えば、バッテリ、プロセッサ、または両方)を節約するために変化し得る。例えば、制御入力230は、リソースが節約されるべきであることを示すユーザ入力に基づいて、または、リソース利用性(例えば、バッテリ、プロセッサ、または両方に関連付けられた)が特定の閾値レベルを満たさないことを検出することに基づいて、いずれの高帯域パラメータも使用されるべきでないことを示し得る。システム200のリソースは、制御入力230がいずれの高帯域パラメータも使用されるべきでないことを示すとき、高帯域オーディオを生成しないことで節約され得る。別の実施形態では、制御入力230は、プロセッサが、エンコーダが入力信号102中に高帯域パラメータを含めていないことを示す情報を受信すること、通信ネットワークが送信エラーを経験していることを示す情報を受信すること、またはその両方に応答して、予測された高帯域パラメータを使用することを示し得る。予測された高帯域パラメータを使用することは、高帯域パラメータが存在しないこと、または、それに関連付けられたエラーを隠蔽し得る。ゆえに、システム200は、リソース節約、エラー隠蔽、またはその両方を可能にし得る。
[0079] 図3を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態が開示されており、概して300と指定されている。特定の実施形態では、システム300は、図1のシステム100(または、システム100の1つまたは複数の構成要素)に対応し得るか、またはそれに含まれ得る。例えば、システム300の1つまたは複数の構成要素は、図1の帯域幅拡張モジュール118に含まれ得る。システム300は、受信機204、抽出器206、予測器208、セレクタ210、スイッチ212、および信号ジェネレータ214を含む。図3では、抽出器206は、予測器208に結合される。予測器208は、ブラインド帯域幅拡張器(BBE)304およびチューナ302を含み得る。
[0080] 動作中、抽出器206は、予測器208に第1の複数のパラメータ220を提供し得る。BBE304は、入力信号102の低帯域部分に基づいてブラインド帯域幅拡張を行うことで、第2の複数のパラメータ222を生成し得る。例えば、BBE304は、入力信号102内のどの高帯域情報からも独立した第2の複数のパラメータ222を生成し得る。BBE304は、特定の低帯域パラメータに対応する特定の高帯域パラメータを示すパラメータデータへのアクセスを有し得る。パラメータデータは、トレーニングオーディオサンプルに基づいて生成され得る。例えば、各トレーニングオーディオサンプルは、低帯域オーディオおよび高帯域オーディオを含み得る。特定の低帯域パラメータと特定の高帯域パラメータとの間の相関は、トレーニングオーディオサンプルの低帯域オーディオおよび高帯域オーディオに基づいて決定され得る。パラメータデータは、特定の低帯域パラメータと特定の高帯域パラメータとの間の相関を示し得る。BBE304は、第2の複数のパラメータ222を予測するために、パラメータデータと、入力信号102の低帯域パラメータとを使用し得る。BBE304は、ユーザ入力を介してパラメータデータを受信し得る。代替的に、パラメータデータは、デフォルト値を有し得る。
[0081] 特定の実施形態では、BBE304は、分析データに基づいて、第2の複数のパラメータ222を生成し得る。分析データは、第1の複数のパラメータ220に関連付けられたデータ(例えば、第1の利得フレームおよび/または第1の平均線スペクトル周波数(LSF))を含み得る。分析データは、以前に受信された入力信号に関連付けられた履歴データ(例えば、予測利得フレームおよび/または履歴平均線スペクトル周波数(LSF))を含み得る。例えば、BBE304は、予測利得フレームに基づいて第2の複数のパラメータ222を生成し得る。チューナ302は、第2の複数のパラメータ222の第2の利得フレームに対する第1の複数のパラメータ220の第1の利得フレームの比に基づいて、予測利得フレームを調整し得る。
[0082] 別の例として、入力信号(例えば、入力信号102)に関連付けられた平均LSFは、スペクトル傾斜を示し得る。BBE304は、履歴平均LSFによって示されるスペクトル傾斜により良くマッチするように、第2の複数のパラメータ222をバイアスするために履歴平均LSFを使用し得る。チューナ302は、入力信号102の現在のフレームのために抽出された平均LSFに基づいて履歴平均LSFを調整し得る。例えば、チューナ302は、第1の平均LSFに基づいて履歴平均LSFを調整し得る。特定の実施形態では、BBE304は、現在のフレームのために抽出された平均LSFに基づいて第2の複数のパラメータ222を生成し得る。例えば、BBE304は、第1の平均LSFに基づいて第2の複数のパラメータ222をバイアスし得る。
[0083] システム300は、制御入力(例えば、制御入力230)に基づいた、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないこととの動的な切替えを可能にし得る。加えて、システム300は、受信された高帯域パラメータに関連付けられた分析データに基づいて予測された高帯域パラメータを適応することで、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することとを切り替えるとき、アーティファクトを低減し得る。
[0084] 図4を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態が開示されており、概して400と指定されている。特定の実施形態では、システム400は、図1のシステム100(または、システム100の1つまたは複数の構成要素)に対応し得るか、またはそれに含まれ得る。例えば、システム400の1つまたは複数の構成要素は、図1の帯域幅拡張モジュール118に含まれ得る。
[0085] システム400は、受信機204、抽出器206、予測器208、セレクタ210、スイッチ212、信号ジェネレータ214、チューナ302、およびBBE304を含む。システム400はまた、抽出器206、予測器208、およびセレクタ210に結合されたバリデータ402(例えば、パラメータ有効性チェッカ)を含む。
[0086] 動作中、バリデータ402は、抽出器206から第1の複数のパラメータ220を受信し得、予測器208から第2の複数のパラメータ222を受信し得る。バリデータ402は、第1の複数のパラメータ220と第2の複数のパラメータ222との比較に基づいて第1の複数のパラメータ220の「信頼性」を決定し得る。例えば、バリデータ402は、第1の複数のパラメータ220と第2の複数のパラメータ222との間の差分(例えば、絶対値、標準偏差、等)に基づいて第1の複数のパラメータ220の信頼性を決定し得る。例えば、信頼性は、この差分に逆相関し得る。バリデータ402は、決定された信頼性を示す有効性データ404を生成し得る。バリデータ402は、有効性データ404をセレクタ210に提供し得る。
[0087] セレクタ210は、第1の複数のパラメータ220が、信号再構築に使用するのに信頼性があるかそれとも信頼性がなさすぎるかを、有効性データ404が信頼性閾値を満たす(例えば、超える)かどうかに基づいて決定し得る。例えば、第1の複数のパラメータ220と第2の複数のパラメータ222との間の差分は、高帯域パラメータ情報の送信に関連付けられたエラー(例えば、破損/欠如データ)が存在することを示し得る。別の例として、この差分は、第1の複数のパラメータ220が、ランダムデータに対応することを示し得る(例えば、入力信号102が、高帯域パラメータを含まないようにエンコーダによって生成されるとき)。
[0088] セレクタ210は、ユーザ入力を介して信頼性閾値を受信し得る。信頼性閾値は、ユーザ設定および/またはプリファレンスに対応し得る。代替的に、信頼性閾値は、デフォルト値を有し得る。特定の実施形態では、制御入力230は、信頼性閾値に対応する値を含み得る。
[0089] セレクタ210は、有効性データ404に基づいて、複数の高帯域モードから特定のモードを選択し得る。例えば、セレクタ210は、有効性データ404が信頼性閾値を満たす(例えば、超える)ことに応答して、第1の複数のパラメータ220を使用する第1のモードを選択し得る。セレクタ210は、有効性データ404が信頼性閾値を満たさない(例えば、超えない)ことに応答して、第2の複数のパラメータ222を使用する第2のモードを選択し得る。代替的に、セレクタ210は、有効性データ404が信頼性閾値を満たさないことに応答して、第3のモードを選択し得る。
[0090] 特定の実施形態では、セレクタ210は、有効性データ404と制御入力230とに基づいて特定のモードを選択し得る。例えば、セレクタ210は、有効性データ404が信頼性閾値を満たすとき、第1のモードを選択し得る。セレクタ210は、有効性データ404が信頼性閾値を満たさず、かつ、制御入力230が第1の値(例えば、真)を示すとき、第2のモードを選択し得る。セレクタ210は、有効性データ404が信頼性閾値を満たさず、かつ、制御入力230が第2の値(例えば、偽)を示すとき、第3のモードを選択し得る。
[0091] システム400は、受信された入力信号内の高帯域パラメータ情報の信頼性に基づいた、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないことの動的な切替えを可能にし得る。受信された高帯域パラメータ情報に信頼性があるとき、抽出された高帯域パラメータが使用され得る。受信された高帯域パラメータ情報に信頼性がないとき、受信された高帯域パラメータ情報に関連付けられたエラーを隠蔽するために、予測された高帯域パラメータが使用され得る。特定の実施形態では、システム400は、入力信号102内の高帯域パラメータ情報が、受信機204への送信に先立ち、少量の冗長性およびエラー検出を使用して符号化されることを可能にし得る。エンコーダは、抽出された高帯域パラメータの信頼性を決定するための比較用の予測された高帯域パラメータへのアクセスを有するためにシステム400に依拠し得る。
[0092] 図5を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態が開示されており、概して500と指定されている。特定の実施形態では、システム500は、図1のシステム100(または、システム100の1つまたは複数の構成要素)に対応し得るか、またはそれに含まれ得る。例えば、システム500の1つまたは複数の構成要素は、図1の帯域幅拡張モジュール118に含まれ得る。
[0093] システム500は、受信機204、抽出器206、予測器208、セレクタ210、スイッチ212、信号ジェネレータ214、チューナ302、BBE304、およびバリデータ402を含む。システム500はまた、抽出器206よびセレクタ210に結合されたエラー検出器502を含む。
[0094] 動作中、抽出器206は、エラー検出データ504をエラー検出器502に提供し得る。例えば、抽出器206は、入力信号102からエラー検出データ504を抽出し得る。エラー検出データ504は、高帯域パラメータ情報に関連付けられ得る。例えば、エラー検出データ504は、高帯域パラメータ情報に関連付けられた周期的冗長検査(CRC)データに対応し得る。
[0095] エラー検出器502は、高帯域パラメータ情報に関連付けられたエラーがあるかどうかを決定するために、エラー検出データ504を分析し得る。例えば、エラー検出器502は、CRCデータ(例えば、4ビット)が無効データを示すと決定することに応答してエラーを検出し得る。エラー検出器502は、CRCデータが有効データを示すと決定することに応答していずれのエラーも検出しないだろう。エラー検出データ504を表すために追加のビットを使用することは、高帯域パラメータ情報の送信に関連付けられたエラーを検出する可能性を増加させ得るが、高帯域情報の送信に使用されるビット数を増加させ得る。
[0096] 特定の実施形態では、エラー検出器502は、履歴エラーレート(例えば、CRCチェックに基づいた、エラーのあるフレームの平均エラーレート)を示す状態を維持し得る。この履歴エラーレートは、入力信号102が有効な高帯域パラメータ情報を含むかどうかを決定するために使用され得る。例えば、履歴エラーレートは、入力信号102に関連付けられたCRCデータが誤検出を示すかどうかを決定するために使用され得る。例えば、入力信号102に関連付けられたCRCデータは、入力信号102が高帯域パラメータ情報を含まず、かつ、第1の複数のパラメータ220がランダムデータを表すときであっても有効データを示し得る。エラー検出器502は、平均エラーレートが閾値エラーレートを満たす(例えば、超える)と決定することに応答してエラーを検出し得る。例えば、エラー検出器502は、履歴エラーレートが閾値エラーレートを満たす(例えば、超える)ことに基づいて、エンコーダが高帯域パラメータ情報を送信していないと決定し得る。例えば、エラー検出器502は、平均エラーレートが、ある数(例えば、16個)の最も最近受信されたフレームのうち閾値数(例えば、6個)よりも多くのフレームに関連付けられたエラーを示すと決定することに応答して、エラーを検出し得る。エラー検出器502は、ユーザ設定またはプリファレンスに対応する閾値エラーレートを、ユーザ入力を介して受信し得る。代替的に、閾値エラーレートは、デフォルト値を有し得る。
[0097] エラー検出器502は、エラーが検出されたかどうかを示すエラー出力506をセレクタ210に提供し得る。例えば、エラー出力506は、エラー検出器502によっていずれのエラーも検出されないことを示す第1の値(例えば、0)を有し得る。エラー出力506は、エラー検出器502によって少なくとも1つのエラーが検出されることを示す第2の値(例えば、1)を有し得る。例えば、エラー出力506は、エラー検出データ504(例えば、CRCデータ)が無効データを示すと決定することに応答して、第2の値(例えば、1)を有し得る。別の例として、エラー出力506は、平均エラーレートが閾値エラーレートを満たさないと決定することに応答して、第2の値(例えば、1)を有し得る。
[0098] セレクタ210は、エラー出力506に基づいて高帯域モードを選択し得る。例えば、セレクタ210は、エラー出力506が第1の値(例えば、0)を有すると決定することに応答して、第1の複数のパラメータ220を使用する第1のモードを選択し得る。セレクタ210は、エラー出力506が第2の値(例えば、1)を有すると決定することに応答して、第2のモードまたは第3のモードを選択し得る。
[0099] 特定の実施形態では、セレクタ210は、エラー出力506と有効性データ404とに基づいて高帯域モードを選択し得る。例えば、セレクタ210は、エラー出力506が第1の値(例えば、0)を有すること、かつ、有効性データ404が信頼性閾値を満たす(例えば、超える)ことを決定することに応答して、第1のモードを選択し得る。セレクタ210は、エラー出力506が第2の値(例えば、1)を有すること、または、有効性データ404が信頼性閾値を満たさない(例えば、超えない)ことを決定することに応答して、第2のモードまたは第3のモードを選択し得る。
[0100] 特定の実施形態では、セレクタ210は、エラー出力506と、有効性データ404と、制御入力230とに基づいて高帯域モードを選択し得る。例えば、セレクタ210は、制御入力230が第1の値(例えば、真)を示すこと、エラー出力506が第1の値(例えば、0)を有すること、かつ、有効性データ404が信頼性閾値を満たす(例えば、超える)ことを決定することに応答して、第1のモードを選択し得る。別の例として、セレクタ210は、制御入力230が第1の値(例えば、真)を示すと決定すること、かつ、エラー出力506が第2の値(例えば、1)を有するか、または、有効性データ404が信頼性閾値を満たさない(例えば、超えない)と決定することに応答して、第2のモードを選択し得る。セレクタは、制御入力230が第2の値(例えば、偽)を示すと決定することに応答して第3のモードを選択し得る。
[0101] システム500は、制御入力(例えば、制御入力230)、受信された高帯域パラメータ情報の信頼性(例えば、有効性データ404によって示されるような)、および/または受信されたエラー検出データ(例えば、エラー検出データ504)に基づいた、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないこととの切替えを可能にし得る。システム500は、いずれの高帯域パラメータも使用されるべきでないことを制御入力が示すとき、高帯域オーディオの生成を控えることでリソースの節約を可能にし得る。高帯域オーディオが生成されるとき、システム500は、受信された高帯域パラメータに関連付けられたエラーを検出するか、または、受信された高帯域パラメータは信頼性がないと決定することに応答して、予測された高帯域パラメータを使用して高帯域オーディオを生成することで、受信された高帯域パラメータ情報に関連付けられたエラーを隠蔽し得る。
[0102] 図6を参照すると、帯域幅拡張モード選択の方法の特定の実施形態のフローチャートが示されており、概して600と指定されている。方法600は、図1−5のシステム100−500の1つまたは複数の構成要素によって行われ得る。例えば、方法600は、デコーダにおいて、例えば、図1のデコーダ116の帯域幅拡張モジュール118の1つまたは複数の構成要素によって行われ得る。
[0103] 方法600は、602において、受信された入力信号から第1の複数のパラメータを抽出することを含む。入力信号は、符号化されたオーディオ信号に対応し得る。例えば、図2−5の抽出器206は、図2に関連してさらに説明されたように、入力信号102から第1の複数のパラメータ220を抽出し得る。入力信号102は、符号化されたオーディオ信号に対応し得る。
[0104] 方法600はまた、604において、入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することで、ブラインド帯域幅拡張を行うことを含む。第2の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第2の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され得る。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられ得る。例えば、図2−5の予測器208は、図2−3に関連してさらに説明されたように、第2の複数のパラメータ222を生成し得る。第2の複数のパラメータ222は、入力信号102の高帯域部分に対応し得る。予測器208は、入力信号102の低帯域パラメータに対応する低帯域パラメータ情報に基づいて第2の複数のパラメータ222を生成し得る。
[0105] 方法600は、606において、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択することをさらに含む。例えば、図2−5のセレクタ210は、図2−5に関連してさらに説明されたように、複数の高帯域モードから特定のモードを選択し得る。複数の高帯域モードは、第1の複数のパラメータを使用する第1のモードと、第2の複数のパラメータを使用する第2のモードとを含む。
[0106] 方法600はまた、608において、特定のモードの選択に応答して、デコーダの出力ジェネレータに第1の複数のパラメータまたは第2の複数のパラメータを送ることを含み得る。例えば、図2−5のスイッチ212は、図2−5に関連してさらに説明されたように、特定のモードの選択に応答して、選択されたパラメータ226を信号ジェネレータ214に送り得る。選択されたパラメータ226は、第1の複数のパラメータ220または第2の複数のパラメータ222に対応し得る。
[0107] 図6の方法600は、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することとの動的な切替えを可能にし得る
[0108] 特定の実施形態では、図6の方法600は、中央処理装置(CPU)、デジタルシグナルプロセッサ(DSP)、またはコントローラのような処理ユニットのハードウェア(例えば、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、等)を介して、ファームウェアデバイスを介して、またはこれらの任意の組み合わせによって実装され得る。一例として、図6の方法600は、図7に関して説明されるように、命令を実行するプロセッサによって行われ得る。
[0109] 図7を参照すると、デバイス(例えば、ワイヤレス通信デバイス)の特定の実例となる実施形態のブロック図が描写されており、概して700と指定されている。様々な実施形態では、デバイス700は、図7に例示されたものよりも少ないまたは多くの数の構成要素を有し得る。実例となる実施形態では、デバイス700は、図1の第1のデバイス104または第2のデバイス106に対応し得る。実例となる実施形態では、デバイス700は、図6の方法600にしたがって動作し得る。
[0110] 特定の実施形態では、デバイス700は、プロセッサ706(例えば、中央処理装置(CPU))を含む。デバイス700は、1つまたは複数の追加のプロセッサ710(例えば、1つまたは複数のデジタルシグナルプロセッサ(DSP))を含み得る。プロセッサ710は、スピーチおよびミュージックコーダ―デコーダ(CODEC)708およびエコーキャンセラ712を含み得る。スピーチおよびミュージックCODEC708は、ボコーダエンコーダ714、ボコーダデコーダ716、または両方を含み得る。特定の実施形態では、ボコーダエンコーダ714は、図1のエンコーダ114に対応し得る。特定の実施形態では、ボコーダデコーダ716は、図1のデコーダ116に対応し得る。
[0111] デバイス700は、メモリ732およびCODEC734を含み得る。デバイス700は、アンテナ742に結合されたワイヤレスコントローラ740を含み得る。デバイス700は、ディスプレイコントローラ726に結合されたディスプレイ728を含み得る。スピーカ736、マイクロフォン738、または両方は、CODEC734に結合され得る。特定の実施形態では、スピーカ736は、図1のスピーカ142に対応し得る。特定の実施形態では、マイクロフォン738は、図1のマイクロフォン146に対応し得る。CODEC734は、デジタル/アナログ変換器(DAC)702およびアナログ/デジタル変換器(ADC)704を含み得る。
[0112] 特定の実施形態では、CODEC734は、マイクロフォン738からアナログ信号を受信し、アナログ/デジタル変換器704を使用してこのアナログ信号をデジタル信号に変換し、このデジタル信号をスピーチおよびミュージックコーデック708に提供し得る。スピーチおよびミュージックコーデック708は、このデジタル信号を処理し得る。特定の実施形態では、スピーチおよびミュージックコーデック708は、デジタル信号をCODEC734に提供し得る。CODEC734は、デジタル/アナログ変換器702を使用してこのデジタル信号をアナログ信号に変換し得、そのアナログ信号をスピーカ736に提供し得る。
[0113] デバイス700は、図1の帯域幅拡張モジュール118を含み得る。特定の実施形態では、帯域幅拡張モジュール118の1つまたは複数の構成要素は、プロセッサ706、プロセッサ710、スピーチおよびミュージックコーデック708、ボコーダデコーダ716、CODEC734、またはそれらの組み合わせに含まれ得る。
[0114] メモリ732は、図6の方法600のような、本明細書で開示された方法およびプロセスを行うために、プロセッサ706、プロセッサ710、CODEC734、デバイス700の1つまたは複数の他の処理ユニット、またはそれらの組み合わせによって実行可能な命令760を含み得る。
[0115] システム100−500の1つまたは複数の構成要素は、専用ハードウェア(例えば、回路)を介して、1つまたは複数のタスク行うための命令を実行するプロセッサによって、またはその組み合わせで実装され得る。例として、メモリ732またはスピーチおよびミュージックCODEC708の1つまたは複数の構成要素は、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルク転送MRAM(STT−MRAM)、フラッシュメモリ、読取専用メモリ(ROM)、プログラマブル読取専用メモリ(PROM)、消去可能なプログラマブル読取専用メモリ(EPROM)、電気的に消去可能なプログラマブル読取専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、リムーバルディスク、またはコンパクトディスク読取専用メモリ(CD−ROM)のようなメモリデバイスであり得る。メモリデバイスは、コンピュータ(例えば、CODEC734内のプロセッサ、プロセッサ706、および/またはプロセッサ710)によって実行されると、図6の方法600のうちの1つの少なくとも一部をコンピュータに行わせ得る命令(例えば、命令760)を含み得る。例として、スピーチおよびミュージックCODEC708のメモリ732または1つまたは複数の構成要素は、コンピュータ(例えば、CODEC734内のプロセッサ、プロセッサ706、および/またはプロセッサ710)によって実行されると、図6の方法600の少なくとも一部をコンピュータに行わせる命令(例えば、命令760)を含む非一時的なコンピュータ可読媒体であり得る。
[0116] 特定の実施形態では、デバイス700は、システムインパッケージまたはシステムオンチップデバイス(例えば、モバイル局モデム(MSM))722に含まれ得る。特定の実施形態では、プロセッサ706、プロセッサ710、ディスプレイコントローラ726、メモリ732、CODEC734、帯域幅拡張モジュール118、およびワイヤレスコントローラ740は、システムインパッケージまたはシステムオンチップデバイス722に含まれる。特定の実施形態では、タッチスクリーンおよび/またはキーパッドのような入力デバイス730および電源744は、システムオンチップデバイス722に結合される。さらに、特定の実施形態では、図7に例示されるように、ディスプレイ728、入力デバイス730、スピーカ736、マイクロフォン738、アンテナ742、および電源744は、システムオンチップ722に外付けである。しかしながら、ディスプレイ728、入力デバイス730、スピーカ736、マイクロフォン738、アンテナ742、および電源744の各々は、インターフェースまたはコントローラのような、システムオンチップデバイス722の構成要素に結合され得る。
[0117] デバイス700は、モバイル通信デバイス、スマートフォン、セルラ電話、ラップトップコンピュータ、コンピュータ、タブレット、携帯情報端末、ディスプレイデバイス、テレビジョン、ゲームコンソール、ミュージックプレーヤ、ラジオ、デジタルビデオプレーヤ、デジタルビデオディスク(DVD)プレーヤ、チューナ、カメラ、ナビゲーションデバイス、デコーダシステム、またはそれらの任意の組み合わせを含み得る。
[0118] 実例となる実施形態では、プロセッサ710は、図1−6に関連して説明された方法または動作のすべてまたは一部を実行するように動作可能であり得る。例えば、マイクロフォン738は、オーディ信号(例えば、図1のオーディオ信号130)をキャプチャし得る。ADC704は、キャプチャされたオーディオ信号を、アナログ波形から、デジタルオーディオサンプルから成るデジタル波形へと変換し得る。プロセッサ710は、デジタルオーディオサンプルを処理し得る。利得調整器は、デジタルオーディオサンプルを調整し得る。エコーキャンセラ712は、スピーカ736の出力がマイクロフォン738に入ることで作り出されたであろうエコーを低減し得る。
[0119] ボコーダエンコーダ714は、処理されたスピーチ信号に対応するデジタルオーディオサンプルを圧縮し得、送信パケット(例えば、デジタルオーディオサンプルの圧縮ビットの表現)を形成し得る。例えば、送信パケットは、図1−2に関連して説明されたように、図2のウォーターマークデータ232を含み得る。送信パケットは、メモリ732に記憶され得る。トランシーバは、何らかの形式の送信パケット(例えば、他の情報は、送信パケットに添付され得る)を変調し得、変調されたデータを、アンテナ742を介して送信し得る。
[0120] さらなる例として、アンテナ742は、受信パケットを含む着信パケットを受信し得る。受信パケットは、ネットワークを介して別のデバイスによって送られ得る。例えば、受信パケットは、図1の入力信号102に対応し得る。ボコーダデコーダ716は、受信パケットを解凍するだろう。解凍された受信パケットは、再構築されたオーディオサンプルと呼ばれ得る。エコーキャンセラ712は、この再構築されたオーディオサンプルからエコーを取り除き得る。
[0121] プロセッサ710は、図2−5に関連して説明されるように、受信パケットから第1の複数のパラメータ220を抽出し得、第2の複数のパラメータを生成し得、第1の複数のパラメータ220または第2の複数のパラメータ222を選択するかあるいはいずれの高帯域パラメータも選択せず、そして選択されたパラメータに基づいて出力信号128を生成し得る。利得調整器は、出力信号128を増幅または抑制し得る。DAC702は、この出力信号128をデジタル信号からアナログ信号に変換し得、この変換された信号をスピーカ736に提供し得る。特定の実施形態では、スピーカ736は、図1のスピーカ142に対応し得る。
[0122] 説明された実施形態と関連して、受信された入力信号から第1の複数のパラメータを抽出するための手段を含む装置が開示される。入力信号は、符号化されたオーディオ信号に対応し得る。例えば、抽出するための手段は、図2−5の抽出器206、第1の複数のパラメータを抽出するように構成された1つまたは複数のデバイス(例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ)、またはそれらの任意の組み合わせを含み得る。
[0123] 装置はまた、入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段を含む。第2の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第2の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。例えば、行うための手段は、図2−5の予測器208、第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された1つまたは複数のデバイス(例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ)、またはそれらの任意の組み合わせを含み得る。
[0124] 装置は、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段をさらに含み、複数の高帯域モードは、第1の複数のパラメータを使用する第1のモードと、第2の複数のパラメータを使用する第2のモードとを含む。例えば、選択するための手段は、図2−5のセレクタ210、特定のモードを選択するように構成された1つまたは複数のデバイス(例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ)、またはそれらの任意の組み合わせを含み得る。
[0125] 装置はまた、選択された特定のモードに基づいて、第1の複数のパラメータまたは第2の複数のパラメータを出力するための手段を含む。例えば、出力するための手段は、図2−5のスイッチ212、出力するように構成された1つまたは複数のデバイス(例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ)、またはそれらの任意の組み合わせを含み得る。
[0126] 当業者は、本明細書で開示された実施形態に関連して説明された実例となる様々な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップが、電子ハードウェア、ハードウェアプロセッサのような処理デバイスによって実行されるコンピュータソフトウェア、または両方の組み合わせとして実装され得ることをさらに認識するだろう。実例となる様々な構成要素、ブロック、構成、モジュール、回路、およびステップは一般に、それらの機能の観点から上に説明されている。そのような機能性がハードウェアとして実装されるか実行可能なソフトウェアとして実装されるかは、特定の用途とシステム全体に課される設計の制約とに依存する。当業者は、説明された機能性を特定の用途ごとに様々な方法で実装し得るが、このような実装の決定は、本開示の範囲からの逸脱を引き起こすものとして解釈されるべきでない。
[0127] 本明細書で開示された実施形態に関連して説明されたアルゴリズムまたは方法のステップは、直接ハードウェアで、プロセッサによって実行されるソフトウェアモジュールで、または両者の組み合わせで具現化され得る。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピン注入磁化反転型MRAM(STT−MRAM)、フラッシュメモリ、読取専用メモリ(ROM)、プログラマブル読取専用メモリ(PROM)、消去可能なプログラマブル読取専用メモリ(EPROM)、電気的に消去可能なプログラマブル読取専用メモリ(EEPROM)、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取専用メモリ(CD−ROM)のようなメモリデバイスに存在し得る。例示的なメモリデバイスは、プロセッサがこのメモリデバイスから情報を読み取り、このメモリデバイスに情報を書き込むことができるようにプロセッサに結合される。代替的に、メモリデバイスは、プロセッサに一体化され得る。プロセッサおよび記憶媒体は、特定用途向け集積回路(ASIC)内に存在し得る。ASICは、コンピューティングデバイスまたはユーザ端末内に存在し得る。代替において、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末内にディスクリート構成要素として存在し得る。
[0128] 開示された実施形態の先の説明は、開示された実施形態を製造または使用することを当業者に可能にするために提供される。これらの実施形態への様々な修正は、当業者にとって容易に明らかであり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。ゆえに、本開示は、本明細書で示された実施形態に限定されるようには意図されず、以下の特許請求の範囲によって定義されるような原理および新規な特徴と一致する可能である最も広い範囲が与えられるべきである。
[0128] 開示された実施形態の先の説明は、開示された実施形態を製造または使用することを当業者に可能にするために提供される。これらの実施形態への様々な修正は、当業者にとって容易に明らかであり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。ゆえに、本開示は、本明細書で示された実施形態に限定されるようには意図されず、以下の特許請求の範囲によって定義されるような原理および新規な特徴と一致する可能である最も広い範囲が与えられるべきである。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1]
デバイスであって、
デコーダ
を備え、前記デコーダは、
受信された入力信号から、第1の複数のパラメータを抽出するように構成された抽出器、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された予測器、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成されたセレクタ、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するように構成されたスイッチと
を備えるデバイス。
[C2]
前記入力信号は、入力ビットストリームに対応し、前記抽出器は、前記予測器が前記第2の複数のパラメータを生成するのと同時に、前記第1の複数のパラメータを抽出するように構成される、C1に記載のデバイス。
[C3]
前記セレクタは、制御入力信号を受信するようにさらに構成され、前記特定のモードは、前記制御入力信号に基づいて選択される、C1に記載のデバイス。
[C4]
前記抽出器は、前記入力信号内の前記低帯域パラメータ情報内に埋め込まれる前記第1の複数のパラメータを抽出するように構成される、C1に記載のデバイス。
[C5]
前記抽出器は、前記入力信号内のウォーターマークを検出するように構成され、前記ウォーターマークは、前記第1の複数のパラメータを符号化する、C1に記載のデバイス。
[C6]
前記抽出器は、前記第1の複数のパラメータに関連付けられたエラー検出データを抽出するようにさらに構成される、C1に記載のデバイス。
[C7]
前記抽出器および前記セレクタに結合されたエラー検出器
をさらに備え、前記エラー検出器は、
前記エラー検出データを受信することと、
前記エラー検出データに基づいてエラー出力を生成することと
を行うように構成され、
前記セレクタは、前記エラー出力に少なくとも部分的に基づいて、前記特定のモードを選択するように構成される、
C6に記載のデバイス。
[C8]
前記第1の複数のパラメータの信頼性を示す有効性データを生成するように構成されたパラメータ有効性チェッカ
をさらに備え、
ここにおいて、前記有効性データは、前記第1の複数のパラメータおよび前記第2の複数のパラメータに少なくとも部分的に基づき、
前記セレクタは、前記有効性データに基づいて前記特定のモードを選択するように構成される、
C7に記載のデバイス。
[C9]
前記セレクタは、前記有効性データが信頼性閾値を満たすこと、かつ、エラーが検出されないと前記エラー出力が示すことを決定することに応答して、前記第1の複数のパラメータを使用する前記第1のモードを選択するように構成される、C8に記載のデバイス。
[C10]
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されると前記エラー出力が示すことを決定することに応答して、前記第2の複数のパラメータを使用する前記第2のモードを選択するようにさらに構成される、C9に記載のデバイス。
[C11]
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されることを前記エラー出力が示すことを決定することに応答して、前記複数の高帯域モードのうちの第3のモードを選択するようにさらに構成され、前記スイッチは、前記第3のモードが選択されると決定することに応答して、いずれの高帯域パラメータも出力しないように構成される、C9に記載のデバイス。
[C12]
前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、C1に記載のデバイス。
[C13]
前記予測器は、
分析データに基づいて前記第2の複数のパラメータを生成するために、前記ブラインド帯域幅拡張を行うように構成されたブラインド帯域幅拡張器と、
前記第1の複数のパラメータに少なくとも部分的に基づいて前記分析データを修正するように構成されたチューナと
を備える、C1に記載のデバイス。
[C14]
前記第1の複数のパラメータは、線スペクトル周波数(LSF)、利得形状、または利得フレームのうちの少なくとも1つを含む、C1に記載のデバイス。
[C15]
前記予測器は、予測利得フレームに基づいて前記第2の複数のパラメータを生成するように構成される、C1に記載のデバイス。
[C16]
前記予測器は、前記第1の複数のパラメータの第1の利得フレームと、前記第2の複数のパラメータの第2の利得フレームとの比に基づいて、前記予測利得フレームを調整するようにさらに構成される、C15に記載のデバイス。
[C17]
前記予測器は、平均線スペクトル周波数(LSF)に基づいて前記第2の複数のパラメータを生成するように構成される、C1に記載のデバイス。
[C18]
前記予測器は、前記第1の複数のパラメータの第1のLSFに基づいて前記平均LSFを調整するようにさらに構成される、C17に記載のデバイス。
[C19]
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
を行うように構成された出力ジェネレータ
をさらに備える、C1に記載のデバイス。
[C20]
方法であって、
デコーダにおいて、受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記デコーダにおいて、前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記デコーダにおいて、前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記特定のモードの選択に応答して、前記第1の複数のパラメータまたは前記第2の複数のパラメータを前記デコーダの出力ジェネレータに送ることと
を備える方法。
[C21]
前記第2の複数のパラメータは、前記第1の複数のパラメータに関連付けられたエラーを検出することに応答して選択される、C20に記載の方法。
[C22]
前記第1の複数のパラメータに関連付けられた周期的冗長検査(CRC)が無効データを示すと決定することに応答して、前記エラーが検出される、C21に記載の方法。
[C23]
前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、C20に記載の方法。
[C24]
命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力することと
を備える動作を行わせる、コンピュータ可読記憶デバイス。
[C25]
前記動作は、
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードが前記第1のモードまたは前記第2のモードであると決定することに応答して、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
前記特定のモードが前記複数の高帯域モードのうちの第3のモードであると決定することに応答して、
前記出力高帯域部分を生成することを控えることと、
前記出力低帯域部分に基づいて前記出力信号を生成することと
をさらに備える、C24に記載のコンピュータ可読記憶デバイス。
[C26]
前記動作は、前記第1の複数のパラメータに関連付けられたエラーレートが閾値エラーレートよりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、C25に記載のコンピュータ可読記憶デバイス。
[C27]
前記動作は、前記第1の複数のパラメータと前記第2の複数のパラメータとの差分が特定の閾値よりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、C25に記載のコンピュータ可読記憶デバイス。
[C28]
前記プロセッサは、エンハンスド適応型マルチレート(eAMR)デコーダへと一体化される、C24に記載のコンピュータ可読記憶デバイス。
[C29]
装置であって、
受信された入力信号から第1の複数のパラメータを抽出するための手段、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するための手段と
を備える装置。
[C30]
前記抽出するための手段、前記生成するための手段、前記選択するための手段、および前記出力するための手段は、デコーダ、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末(PDA)、固定ロケーションデータユニット、またはコンピュータへと一体化される、C29に記載の装置。

Claims (30)

  1. デバイスであって、
    デコーダ
    を備え、前記デコーダは、
    受信された入力信号から、第1の複数のパラメータを抽出するように構成された抽出器、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
    前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された予測器、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
    前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成されたセレクタ、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
    前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するように構成されたスイッチと
    を備えるデバイス。
  2. 前記入力信号は、入力ビットストリームに対応し、前記抽出器は、前記予測器が前記第2の複数のパラメータを生成するのと同時に、前記第1の複数のパラメータを抽出するように構成される、請求項1に記載のデバイス。
  3. 前記セレクタは、制御入力信号を受信するようにさらに構成され、前記特定のモードは、前記制御入力信号に基づいて選択される、請求項1に記載のデバイス。
  4. 前記抽出器は、前記入力信号内の前記低帯域パラメータ情報内に埋め込まれる前記第1の複数のパラメータを抽出するように構成される、請求項1に記載のデバイス。
  5. 前記抽出器は、前記入力信号内のウォーターマークを検出するように構成され、前記ウォーターマークは、前記第1の複数のパラメータを符号化する、請求項1に記載のデバイス。
  6. 前記抽出器は、前記第1の複数のパラメータに関連付けられたエラー検出データを抽出するようにさらに構成される、請求項1に記載のデバイス。
  7. 前記抽出器および前記セレクタに結合されたエラー検出器
    をさらに備え、前記エラー検出器は、
    前記エラー検出データを受信することと、
    前記エラー検出データに基づいてエラー出力を生成することと
    を行うように構成され、
    前記セレクタは、前記エラー出力に少なくとも部分的に基づいて、前記特定のモードを選択するように構成される、
    請求項6に記載のデバイス。
  8. 前記第1の複数のパラメータの信頼性を示す有効性データを生成するように構成されたパラメータ有効性チェッカ
    をさらに備え、
    ここにおいて、前記有効性データは、前記第1の複数のパラメータおよび前記第2の複数のパラメータに少なくとも部分的に基づき、
    前記セレクタは、前記有効性データに基づいて前記特定のモードを選択するように構成される、
    請求項7に記載のデバイス。
  9. 前記セレクタは、前記有効性データが信頼性閾値を満たすこと、かつ、エラーが検出されないと前記エラー出力が示すことを決定することに応答して、前記第1の複数のパラメータを使用する前記第1のモードを選択するように構成される、請求項8に記載のデバイス。
  10. 前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されると前記エラー出力が示すことを決定することに応答して、前記第2の複数のパラメータを使用する前記第2のモードを選択するようにさらに構成される、請求項9に記載のデバイス。
  11. 前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されることを前記エラー出力が示すことを決定することに応答して、前記複数の高帯域モードのうちの第3のモードを選択するようにさらに構成され、前記スイッチは、前記第3のモードが選択されると決定することに応答して、いずれの高帯域パラメータも出力しないように構成される、請求項9に記載のデバイス。
  12. 前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、請求項1に記載のデバイス。
  13. 前記予測器は、
    分析データに基づいて前記第2の複数のパラメータを生成するために、前記ブラインド帯域幅拡張を行うように構成されたブラインド帯域幅拡張器と、
    前記第1の複数のパラメータに少なくとも部分的に基づいて前記分析データを修正するように構成されたチューナと
    を備える、請求項1に記載のデバイス。
  14. 前記第1の複数のパラメータは、線スペクトル周波数(LSF)、利得形状、または利得フレームのうちの少なくとも1つを含む、請求項1に記載のデバイス。
  15. 前記予測器は、予測利得フレームに基づいて前記第2の複数のパラメータを生成するように構成される、請求項1に記載のデバイス。
  16. 前記予測器は、前記第1の複数のパラメータの第1の利得フレームと、前記第2の複数のパラメータの第2の利得フレームとの比に基づいて、前記予測利得フレームを調整するようにさらに構成される、請求項15に記載のデバイス。
  17. 前記予測器は、平均線スペクトル周波数(LSF)に基づいて前記第2の複数のパラメータを生成するように構成される、請求項1に記載のデバイス。
  18. 前記予測器は、前記第1の複数のパラメータの第1のLSFに基づいて前記平均LSFを調整するようにさらに構成される、請求項17に記載のデバイス。
  19. 前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
    前記特定のモードに基づいて、出力高帯域部分を生成することと、
    前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
    を行うように構成された出力ジェネレータ
    をさらに備える、請求項1に記載のデバイス。
  20. 方法であって、
    デコーダにおいて、受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
    前記デコーダにおいて、前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
    前記デコーダにおいて、前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
    前記特定のモードの選択に応答して、前記第1の複数のパラメータまたは前記第2の複数のパラメータを前記デコーダの出力ジェネレータに送ることと
    を備える方法。
  21. 前記第2の複数のパラメータは、前記第1の複数のパラメータに関連付けられたエラーを検出することに応答して選択される、請求項20に記載の方法。
  22. 前記第1の複数のパラメータに関連付けられた周期的冗長検査(CRC)が無効データを示すと決定することに応答して、前記エラーが検出される、請求項21に記載の方法。
  23. 前記デコーダは、エンハンスド適応型マルチレート(eAMR)デコーダである、請求項20に記載の方法。
  24. 命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
    受信された入力信号から第1の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
    前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
    前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
    前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力することと
    を備える動作を行わせる、コンピュータ可読記憶デバイス。
  25. 前記動作は、
    前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
    前記特定のモードが前記第1のモードまたは前記第2のモードであると決定することに応答して、
    前記特定のモードに基づいて、出力高帯域部分を生成することと、
    前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
    前記特定のモードが前記複数の高帯域モードのうちの第3のモードであると決定することに応答して、
    前記出力高帯域部分を生成することを控えることと、
    前記出力低帯域部分に基づいて前記出力信号を生成することと
    をさらに備える、請求項24に記載のコンピュータ可読記憶デバイス。
  26. 前記動作は、前記第1の複数のパラメータに関連付けられたエラーレートが閾値エラーレートよりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、請求項25に記載のコンピュータ可読記憶デバイス。
  27. 前記動作は、前記第1の複数のパラメータと前記第2の複数のパラメータとの差分が特定の閾値よりも大きいと決定することに応答して前記第3のモードを選択することをさらに備える、請求項25に記載のコンピュータ可読記憶デバイス。
  28. 前記プロセッサは、エンハンスド適応型マルチレート(eAMR)デコーダへと一体化される、請求項24に記載のコンピュータ可読記憶デバイス。
  29. 装置であって、
    受信された入力信号から第1の複数のパラメータを抽出するための手段、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
    前記入力信号内の高帯域情報から独立した第2の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段、ここにおいて、前記第2の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第2の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
    前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段、ここで、前記複数の高帯域モードは、前記第1の複数のパラメータを使用する第1のモードと、前記第2の複数のパラメータを使用する第2のモードとを含む、と、
    前記選択された特定のモードに基づいて、前記第1の複数のパラメータまたは前記第2の複数のパラメータを出力するための手段と
    を備える装置。
  30. 前記抽出するための手段、前記生成するための手段、前記選択するための手段、および前記出力するための手段は、デコーダ、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末(PDA)、固定ロケーションデータユニット、またはコンピュータへと一体化される、請求項29に記載の装置。
JP2016538105A 2013-12-11 2014-12-05 帯域幅拡張モード選択 Pending JP2017503192A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361914845P 2013-12-11 2013-12-11
US61/914,845 2013-12-11
US14/270,963 US9293143B2 (en) 2013-12-11 2014-05-06 Bandwidth extension mode selection
US14/270,963 2014-05-06
PCT/US2014/068908 WO2015088919A1 (en) 2013-12-11 2014-12-05 Bandwidth extension mode selection

Publications (2)

Publication Number Publication Date
JP2017503192A true JP2017503192A (ja) 2017-01-26
JP2017503192A5 JP2017503192A5 (ja) 2017-12-21

Family

ID=53271812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016538105A Pending JP2017503192A (ja) 2013-12-11 2014-12-05 帯域幅拡張モード選択

Country Status (6)

Country Link
US (1) US9293143B2 (ja)
EP (1) EP3080804A1 (ja)
JP (1) JP2017503192A (ja)
KR (1) KR20160096119A (ja)
CN (1) CN105814629A (ja)
WO (1) WO2015088919A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018528463A (ja) * 2015-08-18 2018-09-27 クアルコム,インコーポレイテッド 帯域幅移行期間中の信号再使用

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
EP3559849B1 (en) * 2016-12-22 2020-09-02 Assa Abloy AB Mobile credential with online/offline delivery
US11906642B2 (en) * 2018-09-28 2024-02-20 Silicon Laboratories Inc. Systems and methods for modifying information of audio data based on one or more radio frequency (RF) signal reception and/or transmission characteristics
EP3900237B1 (en) * 2018-12-17 2024-05-15 InterDigital Patent Holdings, Inc. Signal design associated with concurrent delivery of energy and information
WO2021087734A1 (zh) * 2019-11-05 2021-05-14 海能达通信股份有限公司 宽窄带互通环境下语音通讯方法及系统
US11985179B1 (en) * 2020-11-23 2024-05-14 Amazon Technologies, Inc. Speech signal bandwidth extension using cascaded neural networks
WO2023147650A1 (en) * 2022-02-03 2023-08-10 Voiceage Corporation Time-domain superwideband bandwidth expansion for cross-talk scenarios
EP4375999A1 (en) * 2022-11-28 2024-05-29 GN Audio A/S Audio device with signal parameter-based processing, related methods and systems

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085176A (ja) * 2004-09-17 2006-03-30 Harman Becker Automotive Systems Gmbh 帯域制限オーディオ信号の帯域拡大
JP2006527864A (ja) * 2003-06-17 2006-12-07 松下電器産業株式会社 受信機器、送信機器および伝送システム
US20120203555A1 (en) * 2011-02-07 2012-08-09 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
JP2013525833A (ja) * 2010-04-16 2013-06-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6205130B1 (en) 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
DE60204039T2 (de) * 2001-11-02 2006-03-02 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur kodierung und dekodierung von audiosignalen
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
UA91853C2 (ru) * 2005-04-01 2010-09-10 Квелкомм Инкорпорейтед Способ и устройство для векторного квантования спектрального представления огибающей
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
BRPI0818927A2 (pt) 2007-11-02 2015-06-16 Huawei Tech Co Ltd Método e aparelho para a decodificação de áudio
PL2304723T3 (pl) 2008-07-11 2013-03-29 Fraunhofer Ges Forschung Urządzenie i sposób dekodowania zakodowanego sygnału audio
US8630685B2 (en) 2008-07-16 2014-01-14 Qualcomm Incorporated Method and apparatus for providing sidetone feedback notification to a user of a communication device with multiple microphones
US8880404B2 (en) 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
AU2011358654B2 (en) 2011-02-09 2017-01-05 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006527864A (ja) * 2003-06-17 2006-12-07 松下電器産業株式会社 受信機器、送信機器および伝送システム
JP2006085176A (ja) * 2004-09-17 2006-03-30 Harman Becker Automotive Systems Gmbh 帯域制限オーディオ信号の帯域拡大
JP2013525833A (ja) * 2010-04-16 2013-06-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム
US20120203555A1 (en) * 2011-02-07 2012-08-09 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BERND GEISER, ET AL.: "A Qualified ITU-T G.729EV Codec Candidate for Hierarchcal Speech and Audio Coding", 2006 IEEE WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING, JPN6018043313, October 2006 (2006-10-01), pages 114 - 118, XP031011031, ISSN: 0004048012 *
片岡章俊他: "補助情報を用いたG.711の広帯域化", 電子情報通信学会論文誌, vol. 91, no. 4, JPN6018043315, April 2008 (2008-04-01), pages 1069 - 1081, ISSN: 0003913719 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018528463A (ja) * 2015-08-18 2018-09-27 クアルコム,インコーポレイテッド 帯域幅移行期間中の信号再使用

Also Published As

Publication number Publication date
CN105814629A (zh) 2016-07-27
WO2015088919A1 (en) 2015-06-18
US9293143B2 (en) 2016-03-22
KR20160096119A (ko) 2016-08-12
EP3080804A1 (en) 2016-10-19
US20150162008A1 (en) 2015-06-11

Similar Documents

Publication Publication Date Title
US9293143B2 (en) Bandwidth extension mode selection
US10297263B2 (en) High band excitation signal generation
TWI642052B (zh) 用於產生一高頻帶目標信號之方法及設備
JP6196004B2 (ja) ハイバンド信号特性に基づいた時間利得調整
KR101783114B1 (ko) 이득 제어를 수행하는 시스템들 및 방법들
JP6786592B2 (ja) 帯域幅移行期間中の信号再使用
JP6258522B2 (ja) デバイスにおいてコーディング技術を切り替える装置および方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181106

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190604