JP6396538B2 - 複数のサブバンドを使用するハイバンド信号コーディング - Google Patents

複数のサブバンドを使用するハイバンド信号コーディング Download PDF

Info

Publication number
JP6396538B2
JP6396538B2 JP2017117052A JP2017117052A JP6396538B2 JP 6396538 B2 JP6396538 B2 JP 6396538B2 JP 2017117052 A JP2017117052 A JP 2017117052A JP 2017117052 A JP2017117052 A JP 2017117052A JP 6396538 B2 JP6396538 B2 JP 6396538B2
Authority
JP
Japan
Prior art keywords
signal
khz
highband
baseband
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017117052A
Other languages
English (en)
Other versions
JP2017201404A (ja
Inventor
ベンカトラマン・エス.・アッティ
ベンカテシュ・クリシュナン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2017201404A publication Critical patent/JP2017201404A/ja
Application granted granted Critical
Publication of JP6396538B2 publication Critical patent/JP6396538B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Description

優先権の主張
[0001]本出願は、その内容全体が参照により組み込まれる、両方とも「HIGH−BAND SIGNAL CODING USING MULTIPLE SUB−BANDS」と題する、2015年3月30日に出願された米国出願第14/672,868号および2014年3月31日に出願された米国仮出願第61/973,135号の優先権を主張する。
[0002]本開示は、一般に信号処理に関する。
[0003]技術の進歩により、コンピューティングデバイスは、より小型でより強力になった。たとえば、現在、小型で、軽量で、ユーザが容易に持ち運べる、ポータブルワイヤレス電話、携帯情報端末(PDA)、およびページングデバイスなど、ワイヤレスコンピューティングデバイスを含む、様々なポータブルパーソナルコンピューティングデバイスが存在する。より具体的には、セルラー電話およびインターネットプロトコル(IP)電話などのポータブルワイヤレス電話は、ワイヤレスネットワークを介して音声およびデータパケットを通信することができる。さらに、多くのそのようなワイヤレス電話は、その中に組み込まれた他のタイプのデバイスを含む。たとえば、ワイヤレス電話は、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤをも含むことができる。
[0004]デジタル技法による音声の送信は、特に長距離およびデジタル無線電話アプリケーションでは普及している。再構成されたスピーチの知覚される品質を維持しながら、チャネルを介して送られ得る情報の最小量を決定することに関心があり得る。サンプリングおよびデジタイジングによってスピーチが送信される場合、アナログ電話のスピーチ品質を達成するために64キロビット毎秒(kbps)程度のデータレートが使用され得る。スピーチ分析の使用と、それに続くコーディング、送信、および受信機における再合成によって、データレートの著しい低減が達成され得る。
[0005]スピーチを圧縮するためのデバイスは、電気通信の多くの分野において使用を見出し得る。例示的な分野はワイヤレス通信である。ワイヤレス通信の分野は、たとえば、コードレス電話、ページング、ワイヤレスローカルループ、セルラーおよびパーソナル通信サービス(PCS)電話システムなどのワイヤレステレフォニー、モバイルIPテレフォニー、ならびに衛星通信システムを含む、多くの適用例を有する。特定の適用例は、モバイル加入者のためのワイヤレステレフォニーである。
[0006]たとえば、周波数分割多元接続(FDMA)、時分割多元接続(TDMA)、符号分割多元接続(CDMA)、および時分割同期CDMA(TD−SCDMA)を含むワイヤレス通信システムのために、様々なオーバージエアインターフェースが開発されている。これらのインターフェースに関連して、たとえば高度モバイルフォンサービス(AMPS)、モバイル通信用グローバルシステム(GSM(登録商標))、およびインターリムスタンダード95(IS−95)などを含む様々な国内および国際規格が策定されている。例示的なワイヤレス電話通信システムは符号分割多元接続(CDMA)システムである。IS−95規格およびそれの派生物IS−95A、ANSI J−STD−008、およびIS−95B(本明細書ではIS−95と総称される)は、セルラーまたはPCS電話通信システムのためのCDMAオーバージエアインターフェースの使用を規定するために、電気通信工業会(TIA)および他のよく知られている規格化団体によって策定されている。
[0007]IS−95規格は、その後、より多くの容量および高速パケットデータサービスを提供するcdma2000およびWCDMA(登録商標)などの「3G」システムに発展した。cdma2000の2つの変形態は、TIAによって発行された文書IS−2000(cdma2000 1xRTT)およびIS−856(cdma2000 1xEV−DO)によって提示されている。cdma2000 1xRTT通信システムは153kbpsのピークデータレートを提供するが、cdma2000 1xEV−DO通信システムは、38.4kbpsから2.4Mbpsにわたるデータレートのセットを定義する。WCDMA規格は、第3世代パートナーシッププロジェクト「3GPP(登録商標)」、文書番号3G TS 25.211、3G TS 25.212、3G TS 25.213、および3G TS 25.214に具現されている。国際モバイル電気通信アドバンスト(IMTアドバンスト)仕様は「4G」規格を提示している。IMTアドバンスト仕様は、4Gサービス用のピークデータレートを、(たとえば、列車および車からの)高モビリティ通信のために100メガビット毎秒(Mbit/s)に設定し、(たとえば、歩行者および静止ユーザからの)低モビリティ通信のために1ギガビット毎秒(Gbit/s)に設定する。
[0008]人的スピーチ生成のモデルに関するパラメータを抽出することによってスピーチを圧縮する技法を採用するデバイスは、スピーチコーダと呼ばれる。スピーチコーダはエンコーダとデコーダとを備え得る。エンコーダは、着信スピーチ信号を、時間のブロック、または分析フレームに分割する。時間(または「フレーム」)における各セグメントの持続時間は、一般に、信号のスペクトルエンベロープが比較的定常のままであることが予想され得るのに十分に短くなるように選択される。特定の適用例に好適と見なされる任意のフレーム長またはサンプリングレートが使用され得るが、たとえば、1つのフレーム長は、8キロヘルツ(kHz)のサンプリングレートで160個のサンプルに対応する、20ミリ秒である。
[0009]エンコーダは、着信スピーチフレームを分析していくつかの関連するパラメータを抽出し、次いで、それらのパラメータを2進表現に、たとえば、ビットのセットまたはバイナリデータパケットに量子化する。データパケットは、通信チャネル(すなわち、ワイヤードおよび/またはワイヤレスネットワーク接続)を介して受信機およびデコーダに送信される。デコーダは、データパケットを処理し、それらの処理されたデータパケットを逆量子化してパラメータを生成し、逆量子化されたパラメータを使用してスピーチフレームを再合成する。
[0010]スピーチコーダの機能は、デジタル化されたスピーチ信号を、スピーチに固有の自然な冗長性を除去することによって低ビットレート信号に圧縮することである。このデジタル圧縮は、入力スピーチフレームをパラメータのセットで表し、パラメータをビットのセットで表すために量子化を採用することによって達成され得る。入力スピーチフレームがビット数Niを有し、スピーチコーダによって生成されるデータパケットがビット数Noを有する場合、スピーチコーダによって達成される圧縮係数はCr=Ni/Noである。課題は、ターゲット圧縮係数を達成しながら、復号されたスピーチの高い音声品質を保持することである。スピーチコーダの性能は、(1)スピーチモデル、または上記で説明した分析および合成プロセスの組合せがどの程度良好に機能するか、および(2)パラメータ量子化プロセスがNoビット毎フレームのターゲットビットレートでどの程度良好に実施されるかに依存する。スピーチモデルの目的は、したがって、各フレームについてパラメータの小さいセットを用いて、スピーチ信号の本質、またはターゲット音声品質を捕捉することである。
[0011]スピーチコーダは、概して、スピーチ信号を記述するために(ベクトルを含む)パラメータのセットを利用する。パラメータの良好なセットは、理想的には、知覚的に正確なスピーチ信号の再構成のために低いシステムバンド幅を提供する。ピッチ、信号電力、スペクトルエンベロープ(またはホルマント)、振幅および位相スペクトルは、スピーチコーディングパラメータの例である。
[0012]スピーチコーダは、一度にスピーチの小さいセグメント(たとえば、5ミリ秒(ms)サブフレーム)を符号化するために高い時間分解能処理を採用することによって時間領域スピーチ波形を捕捉することを試みる、時間領域コーダとして実装され得る。各サブフレームについて、探索アルゴリズムによって、コードブック空間からの高精度な代表が見つけられる。代替的に、スピーチコーダは、パラメータのセットを用いて入力スピーチフレームの短期スピーチスペクトルを捕捉すること(分析)と、対応する合成プロセスを採用してスペクトルパラメータからスピーチ波形を再作成することとを試みる、周波数領域コーダとして実装され得る。パラメータ量子化器は、既知の量子化技法に従ってコードベクトルの記憶された表現を用いてパラメータを表すことによって、それらのパラメータを保持する。
[0013]1つの時間領域スピーチコーダは、コード励起線形予測(CELP)コーダである。CELPコーダにおいて、スピーチ信号中の短期相関、または冗長性は、短期ホルマントフィルタの係数を見つける線形予測(LP)分析によって除去される。短期予測フィルタを着信スピーチフレームに適用するとLP残余信号が生成され、このLP残余信号は、長期予測フィルタパラメータおよび後続のストキャスティックコードブックを用いてさらにモデル化され、量子化される。したがって、CELPコーディングは、時間領域スピーチ波形を符号化するタスクを、LP短期フィルタ係数を符号化することと、LP残余を符号化することとの別個のタスクに分割する。時間領域コーディングは、固定レートで(すなわち、フレームごとに同じビット数Noを使用して)実施されるか、または(異なるタイプのフレームコンテンツのために異なるビットレートが使用される)可変レートで実施され得る。可変レートコーダは、コーデックパラメータを、ターゲット品質を取得するのに十分なレベルに符号化するために必要とされるビット量を使用することを試みる。
[0014]CELPコーダなどの時間領域コーダは、時間領域スピーチ波形の正確さを保持するために、フレームごとに高いビット数N0に依拠し得る。そのようなコーダは、フレームごとのビット数Noが比較的大きい(たとえば、8kbps以上)という条件で、優れた音声品質を送出し得る。低いビットレート(たとえば、4kbps以下)では、時間領域コーダは、利用可能なビット数が限られることにより、高い品質およびロバストな性能を保持できないことがある。低いビットレートでは、限られたコードブック空間は、より高いレートの商用適用例において展開される時間領域コーダの波形適合能力をクリッピングする。したがって、経時的な改善にもかかわらず、低いビットレートで動作する多くのCELPコーディングシステムは、雑音として特徴づけられる知覚的に有意なひずみという問題がある。
[0015]低いビットレートでのCELPコーダの代替形態は、CELPコーダと同様の原理の下で動作する「雑音励起線形予測」(NELP)コーダである。NELPコーダは、スピーチをモデル化するために、コードブックではなく、フィルタ処理された擬似ランダム雑音信号を使用する。NELPは、コード化スピーチのためにより単純なモデルを使用するので、NELPはCELPよりも低いビットレートを達成する。NELPは、無声スピーチまたは無音を圧縮または表現するために使用されることができる。
[0016]2.4kbps程度のレートで動作するコーディングシステムは、概して本質的にパラメトリックである。すなわち、そのようなコーディングシステムは、一定の間隔でスピーチ信号のピッチ周期およびスペクトルエンベロープ(またはホルマント)を記述するパラメータを送信することによって動作する。これらのいわゆるパラメトリックコーダを示すのが、LPボコーダシステムである。
[0017]LPボコーダは、ピッチ周期ごとに有声スピーチ信号を単一のパルスでモデル化する。この基本技法は、特に、スペクトルエンベロープに関する送信情報を含むように拡張され得る。LPボコーダが概して妥当な性能を提供するが、それらは、バズとして特徴づけられる、知覚的に有意なひずみを導入することがある。
[0018]近年、波形コーダとパラメトリックコーダの両方のハイブリッドであるコーダが出現した。これらのいわゆるハイブリッドコーダを示すのが、プロトタイプ波形補間(PWI)スピーチコーディングシステムである。PWIコーディングシステムは、プロトタイプピッチ周期(PPP)音声コーダとして知られていることもある。PWIコーディングシステムは、有声スピーチをコーディングするための効率的な方法を提供する。PWIの基本概念は、固定間隔で代表的なピッチ周期(プロトタイプ波形)を抽出し、それの記述を送信し、プロトタイプ波形間で補間することによってスピーチ信号を再構成することである。PWI方法は、LP残差信号または音声信号のいずれに対しても作用し得る。
[0019]スピーチ信号(たとえば、コーディングされたスピーチ信号、再構成されたスピーチ信号、または両方)のオーディオ品質を改善することに研究上の関心および商業上の関心があり得る。たとえば、通信デバイスは、最適よりも低い音声品質をもつスピーチ信号を受信し得る。例示のために、通信デバイスは、音声通話中に別の通信デバイスからスピーチ信号を受信し得る。音声通話品質は、環境雑音(たとえば、風、街頭雑音)、通信デバイスのインターフェースの制限、通信デバイスによる信号処理、パケット損失、バンド幅制限、ビットレート制限など、様々な理由により悪くなり得る。
[0020]従来の電話システム(たとえば、公衆交換電話網(PSTN))では、信号バンド幅は、300ヘルツ(Hz)〜3.4kHzの周波数範囲に制限される。セルラーテレフォニーおよびボイスオーバーインターネットプロトコル(VoIP)などのワイドバンド(WB)適用例では、信号バンド幅は50Hzから7kHzの周波数範囲にわたり得る。スーパーワイドバンド(SWB)コーディング技法は、最大で約16kHzに及ぶバンド幅をサポートする。信号バンド幅を3.4kHzにおけるナローバンドテレフォニーから16kHzのSWBテレフォニーに拡張することにより、信号再構成の品質、了解度、および自然さを改善し得る。
[0021]SWBコーディング技法は、通常、信号の低周波数部分(たとえば、0Hz〜6.4kHz、「ローバンド」とも呼ばれる)を符号化および伝送することを伴う。たとえば、ローバンドは、フィルタパラメータおよび/またはローバンド励起信号を使用して表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分(たとえば、6.4kHz〜16kHz、「ハイバンド」とも呼ばれる)は、完全には符号化および伝送されないことがある。代わりに、受信機は、ハイバンドを予測するために信号モデリングを利用することがある。いくつかの実装形態では、予測を助けるために、ハイバンドに関連するデータが受信機に提供され得る。そのようなデータは「サイド情報」と呼ばれることがあり、利得情報、線スペクトル周波数(LSF、線スペクトル対(LSP)とも呼ばれる)などを含み得る。
[0022]信号モデリングを使用してハイバンドを予測することは、ローバンドに関連するデータ(たとえば、ローバンド励振信号)に基づいてハイバンド励振信号を生成することを含み得る。しかしながら、ハイバンド励振信号を生成することは、複雑で計算コストが高くなり得る、極零(pole-zero)フィルタ処理演算およびダウンミキシング演算を含み得る。さらに、ハイバンド励振信号は、8kHzのバンド幅に制限されることがあり、したがって、ハイバンド(たとえば、6.4kHzから16kHzまで)の9.6kHzバンド幅を正確に予測しないことがある。
[0023]改善されたハイバンド予測のために複数バンド高調波拡張された信号を生成するためのシステムおよび方法が開示される。スピーチエンコーダ(たとえば、「ボコーダ」)が、入力オーディオ信号のハイバンド部分の2つ以上のサブ部分をモデル化するために、ベースバンドにおいて2つ以上のハイバンド励振信号を生成し得る。たとえば、入力オーディオ信号のハイバンド部分は約6.4kHzから約16kHzにわたり得る。スピーチエンコーダは、入力オーディオ信号のローバンド励起を非線形拡張することによって第1のハイバンド励振信号を表す第1のベースバンド信号を生成し得、入力オーディオ信号のローバンド励起を非線形拡張することによって第2のハイバンド励振信号を表す第2のベースバンド信号をも生成し得る。第1のベースバンド信号は、入力オーディオ信号のハイバンド部分の第1のサブバンド(たとえば、約6.4kHzから12.8kHzまで)を表すために0Hzから6.4kHzにわたり得、第2のベースバンド信号は、入力オーディオ信号のハイバンド部分の第2のサブバンド(たとえば、約12.8kHzから16kHzまで)を表すために0Hzから3.2kHzにわたり得る。第1のベースバンド信号および第2のベースバンド信号は、集合的に、入力オーディオ信号のハイバンド部分全体(たとえば、6.4kHzから16kHzまで)のための励振信号を表し得る。
[0024]特定の態様では、方法が、第1のサンプルレートでサンプリングされたオーディオ信号をボコーダにおいて受信することを含む。本方法はまた、オーディオ信号のハイバンド部分の第1のサブバンドに対応する第1のベースバンド信号を生成することと、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することとを含む。第1のサブバンドは、第2のサブバンドとは別個であり得る。第1のサブバンドと第2のサブバンドとのコーディング中に極零フィルタ演算およびダウンミキシング演算はバイパスされ得る。
[0025]別の特定の態様では、装置が、第1のサンプルレートでサンプリングされたオーディオ信号を受信するように構成されたボコーダを含む。ボコーダはまた、オーディオ信号のハイバンド部分の第1のサブバンドに対応する第1のベースバンド信号を生成することと、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することとを行うように構成される。第1のサブバンドは、第2のサブバンドとは別個であり得る。
[0026]別の特定の態様では、非一時的コンピュータ可読媒体は、ボコーダ内のプロセッサによって実行されたとき、第1のサンプルレートでサンプリングされたオーディオ信号を受信することをプロセッサに行わせる命令を含む。命令はまた、オーディオ信号のハイバンド部分の第1のサブバンドに対応する第1のベースバンド信号を生成することと、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することとをプロセッサに行わせるように実行可能である。第1のサブバンドは、第2のサブバンドとは別個であり得る。
[0027]別の特定の態様では、装置が、第1のサンプルレートでサンプリングされたオーディオ信号を受信するための手段を含む。本装置はまた、オーディオ信号のハイバンド部分の第1のサブバンドに対応する第1のベースバンド信号を生成するための、およびオーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成するための手段を含む。第1のサブバンドは、第2のサブバンドとは別個であり得る。
[0028]別の特定の態様では、方法が、第1のサンプルレートでサンプリングされたオーディオ信号をボコーダにおいて受信することを含む。本方法はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号をボコーダのローバンドエンコーダにおいて生成することを含む。本方法は、ボコーダのハイバンドエンコーダにおいて第1のベースバンド信号(たとえば、第1のハイバンド励振信号)を生成することをさらに含む。第1のベースバンド信号を生成することは、ローバンド励振信号の非線形変換された(たとえば、絶対値(|.|)または2乗(.)2関数を使用した)バージョンに対してスペクトル反転演算を実施することを含む。アップサンプリングされたローバンド励振信号に対してそのような非線形変換を実施すると、低い周波数(たとえば、最高6.4kHz)がより高いバンド(たとえば、6.4kHz以上)に高調波的に拡張され得る。第1のベースバンド信号は、オーディオ信号のハイバンド部分の第1のサブバンドに対応する。本方法はまた、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成することを含む。第1のサブバンドは、第2のサブバンドとは別個である。
[0029]別の特定の態様では、装置が、ボコーダのローバンドエンコーダと、ボコーダのハイバンドエンコーダとを含む。ローバンドエンコーダは、第1のサンプルレートでサンプリングされたオーディオ信号を受信するように構成される。ローバンドエンコーダはまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成するように構成される。ハイバンドエンコーダは、第1のベースバンド信号(たとえば、第1のハイバンド励振信号)を生成するように構成される。第1のベースバンド信号を生成することは、ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含む。第1のベースバンド信号は、オーディオ信号のハイバンド部分の第1のサブバンドに対応する。ハイバンドエンコーダはまた、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成するように構成される。第1のサブバンドは、第2のサブバンドとは別個である。
[0030]別の特定の態様では、非一時的コンピュータ可読媒体は、ボコーダ内のプロセッサによって実行されたとき、動作をプロセッサに実施させる命令を含む。動作は、第1のサンプルレートでサンプリングされたオーディオ信号を受信することを含む。動作はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号をボコーダのローバンドエンコーダにおいて生成することを含む。動作は、ボコーダのハイバンドエンコーダにおいて第1のベースバンド信号(たとえば、第1のハイバンド励振信号)を生成することをさらに含む。第1のベースバンド信号を生成することは、ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含む。第1のベースバンド信号は、オーディオ信号のハイバンド部分の第1のサブバンドに対応する。動作はまた、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成することを含む。第1のサブバンドは、第2のサブバンドとは別個である。
[0031]別の特定の態様では、装置が、第1のサンプルレートでサンプリングされたオーディオ信号を受信するための手段を含む。本装置はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成するための手段を含む。本装置は、第1のベースバンド信号(たとえば、第1のハイバンド励振信号)を生成するための手段をさらに含む。第1のベースバンド信号を生成することは、ボコーダのハイバンドエンコーダにおいて、ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含む。第1のベースバンド信号は、オーディオ信号のハイバンド部分の第1のサブバンドに対応する。本装置はまた、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成するための手段を含む。第1のサブバンドは、第2のサブバンドとは別個である。
[0032]別の特定の態様では、方法が、ローバンド部分とハイバンド部分とを有するオーディオ信号をボコーダにおいて受信することを含む。本方法はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号をボコーダのローバンドエンコーダにおいて生成することを含む。本方法は、ローバンド励振信号をアップサンプリングすることに基づいて第1のベースバンド信号(たとえば、第1のハイバンド励振信号)をボコーダのハイバンドエンコーダにおいて生成することをさらに含む。本方法はまた、第1のベースバンド信号に基づいて第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成することを含む。第1のベースバンド信号はオーディオ信号のハイバンド部分の第1のサブバンドに対応し、第2のベースバンド信号はオーディオ信号のハイバンド部分の第2のサブバンドに対応する。
[0033]別の特定の態様では、装置が、ローバンドエンコーダとハイバンドエンコーダとを有するボコーダを含む。ローバンドエンコーダは、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成するように構成される。オーディオ信号はハイバンド部分をも含む。ハイバンドエンコーダは、ローバンド励振信号をアップサンプリングすることに基づいて第1のベースバンド信号(たとえば、第1のハイバンド励振信号)を生成するように構成される。ハイバンドエンコーダは、第1のベースバンド信号に基づいて第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成するようにさらに構成される。第1のベースバンド信号はオーディオ信号のハイバンド部分の第1のサブバンドに対応し、第2のベースバンド信号はオーディオ信号のハイバンド部分の第2のサブバンドに対応する。
[0034]別の特定の態様では、非一時的コンピュータ可読媒体は、ボコーダ内のプロセッサによって実行されたとき、動作をプロセッサに実施させる命令を含む。動作は、ローバンド部分とハイバンド部分とを有するオーディオ信号を受信することを含む。動作はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成することを含む。動作は、ローバンド励振信号をアップサンプリングすることに基づいて第1のベースバンド信号(たとえば、第1のハイバンド励振信号)をボコーダのハイバンドエンコーダにおいて生成することをさらに含む。動作はまた、第1のベースバンド信号に基づいて第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成することを含む。第1のベースバンド信号はオーディオ信号のハイバンド部分の第1のサブバンドに対応し、第2のベースバンド信号はオーディオ信号のハイバンド部分の第2のサブバンドに対応する。
[0035]別の特定の態様では、装置が、ローバンド部分とハイバンド部分とを有するオーディオ信号を受信するための手段を含む。本装置はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成するための手段を含む。本装置は、ローバンド励振信号をアップサンプリングすることに基づいて第1のベースバンド信号(たとえば、第1のハイバンド励振信号)を生成するための手段をさらに含む。本装置はまた、第1のベースバンド信号に基づいて第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成するための手段を含む。第1のベースバンド信号はオーディオ信号のハイバンド部分の第1のサブバンドに対応し、第2のベースバンド信号はオーディオ信号のハイバンド部分の第2のサブバンドに対応する。
[0036]別の特定の態様では、方法が、エンコーダからの符号化オーディオ信号をデコーダにおいて受信することを含む。符号化オーディオ信号はローバンド励振信号を含み得る。本方法はまた、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第1のサブバンドを再構成することを含む。本方法は、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第2のサブバンドを再構成することをさらに含む。たとえば、第2のサブバンドは、第1のアップサンプリング比に従ってローバンド励振信号をアップサンプリングすることに基づいて、および第2のアップサンプリング比に従ってローバンド励振信号をアップサンプリングすることにさらに基づいて再構成され得る。
[0037]別の特定の態様では、装置が、エンコーダから符号化オーディオ信号を受信するように構成されたデコーダを含む。符号化オーディオ信号はローバンド励振信号を含み得る。デコーダはまた、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第1のサブバンドを再構成するように構成される。デコーダは、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第2のサブバンドを再構成するようにさらに構成される。
[0038]別の特定の態様では、非一時的コンピュータ可読媒体は、デコーダ内のプロセッサによって実行されたとき、エンコーダからの符号化オーディオ信号をプロセッサに受信させる命令を含む。符号化オーディオ信号はローバンド励振信号を含み得る。命令はまた、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第1のサブバンドを再構成することをプロセッサに行わせるように実行可能である。命令は、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第2のサブバンドを再構成することをプロセッサに行わせるようにさらに実行可能である。
[0039]別の特定の態様では、装置が、エンコーダから符号化オーディオ信号を受信するための手段を含む。符号化オーディオ信号はローバンド励振信号を含み得る。本装置はまた、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第1のサブバンドを再構成するための手段を含む。本装置は、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第2のサブバンドを再構成するための手段をさらに含む。
[0040]開示する態様のうちの少なくとも1つによって提供される特定の利点は、ハイバンド励振信号と合成ハイバンド信号との生成中に、極零フィルタ処理およびダウンミキシングに関連する複雑で計算コストが高い演算を低減することを含む。本開示の他の態様、利点、および特徴は、以下のセクション、すなわち、図面の簡単な説明と、発明を実施するための形態と、特許請求の範囲とを含む本出願全体の再検討の後に明らかになるであろう。
[0041]複数バンド高調波拡張された信号を生成するように動作可能であるシステムの特定の態様を示す図。 [0042]図1のハイバンド励振発生器の特定の例を示す図。 [0043]図1のハイバンド励振発生器の別の特定の例を示す図。 [0044]第1のモードによるシングルバンド高調波拡張された信号のスーパーワイドバンド生成を示す図。 [0045]第2のモードによる複数バンド高調波拡張された信号のスーパーワイドバンド生成を示す図。 [0046]第2のモードによる複数バンド高調波拡張された信号のフルバンド生成を示す図。 [0047]図1のハイバンド生成回路の特定の態様を示す図。 [0048]第1のモードによる入力オーディオ信号のハイバンド部分のシングルバンドベースバンドバージョンの生成を示す図。 [0049]第2のモードによる入力オーディオ信号のハイバンド部分の複数バンドベースバンドバージョンのスーパーワイドバンド生成を示す図。 [0050]第2のモードによる入力オーディオ信号のハイバンド部分の複数バンドベースバンドバージョンのフルバンド生成を示す図。 [0051]入力オーディオ信号のハイバンド部分の複数のサブバンドを再構成するように動作可能であるシステムの特定の態様を示す図。 [0052]入力オーディオ信号のハイバンド部分の複数のサブバンドを生成するように構成された図8のデュアルハイバンド合成回路の特定の態様を示す図。 [0053]入力オーディオ信号のハイバンド部分の複数のサブバンドの生成を示す図。 [0054]ベースバンド信号を生成する方法の特定の態様を示すフローチャート。 [0055]入力オーディオ信号のハイバンド部分の複数のサブバンドを再構成する方法の特定の態様を示すフローチャート。 [0056]ベースバンド信号を生成する方法の他の特定の態様を示すフローチャート。 [0057]図1〜図13のシステム、図、および方法に従って信号処理演算を実施するように動作可能なワイヤレスデバイスのブロック図。
[0058]図1を参照すると、複数バンド高調波拡張された信号を生成するように動作可能であるシステムの特定の態様が示されており、全体的に100と呼ばれる。特定の態様では、システム100は、符号化システムまたは装置に(たとえば、ワイヤレス電話のコーダ/デコーダ(コーデック)に)組み込まれ得る。他の態様では、システム100は、例示的で非限定的な例として、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、通信デバイス、PDA、固定ロケーションデータユニット、またはコンピュータに組み込まれ得る。特定の態様では、システム100はボコーダに対応するかまたはボコーダの中に含まれ得る。
[0059]以下の説明では、図1のシステム100によって実施される様々な機能は、いくつかの構成要素またはモジュールによって実施されるものとして説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分割は説明のためのものにすぎない。代替態様では、特定の構成要素またはモジュールによって実施される機能は、代わりに、複数の構成要素またはモジュールの間で分割され得る。その上、代替態様では、図1の2つ以上の構成要素またはモジュールが単一の構成要素またはモジュールに統合され得る。図1に示された各構成要素またはモジュールは、ハードウェア(たとえばフィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、コントローラなど)、ソフトウェア(たとえば、プロセッサによって実行可能な命令)、またはそれらの任意の組合せを使用して実装され得る。
[0060]システム100は、入力オーディオ信号102を受信するために構成された分析フィルタバンク110を含む。たとえば、入力オーディオ信号102は、マイクロフォンまたは他の入力デバイスによって提供され得る。特定の態様では、入力オーディオ信号102はスピーチを含み得る。入力オーディオ信号102は、約0Hzから約16kHzまでの周波数範囲内のスピーチコンテンツを含み得る。本明細書で使用する「約」は、記述する周波数の特定の範囲内の周波数を含み得る。たとえば、おおよそ記述する周波数の10パーセント、記述する周波数の5パーセント、記述する周波数の1パーセント内の周波数などを含み得る。例示的で非限定的な例として、「約16kHz」は、15.2kHz(たとえば、16kHz−16kHz*0.05)から16.8kHz(たとえば、16kHz+16kHz*0.05)までの周波数を含み得る。分析フィルタバンク110は、周波数に基づいて入力オーディオ信号102をフィルタ処理して複数の部分にし得る。たとえば、分析フィルタバンク110はローパスフィルタ(LPF)104とハイバンド生成回路106とを含み得る。入力オーディオ信号102は、ローパスフィルタ104とハイバンド生成回路106とに提供され得る。ローパスフィルタ104は、入力オーディオ信号102の高周波成分をフィルタ除去してローバンド信号122を生成するように構成され得る。たとえば、ローパスフィルタ104は、約6.4kHzのカットオフ周波数を有して、約0Hzから約6.4kHzに拡張するバンド幅を有するローバンド信号122を生成し得る。
[0061]ハイバンド生成回路106は、入力オーディオ信号102に基づいてハイバンド信号124、125のベースバンドバージョン126、127(たとえば、第1のハイバンド信号124のベースバンドバージョン126、および第2のハイバンド信号125のベースバンドバージョン127)を生成するように構成され得る。たとえば、入力オーディオ信号102のハイバンドは、約6.4kHzと約16kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分に対応し得る。入力オーディオ信号102のハイバンドは、第1のハイバンド信号124(たとえば、約6.4kHzから約12.8kHzにわたる第1のサブバンド)と、第2のハイバンド信号125(たとえば、約12.8kHzから約16kHzにわたる第2のサブバンド)とに分割され得る。第1のハイバンド信号124のベースバンドバージョン126は、6.4kHzバンド幅(たとえば、0Hz〜6.4kHz)を有し得、第1のハイバンド信号124の6.4kHzバンド幅(たとえば、6.4kHz〜12.8kHzの周波数範囲)を表し得る。同様にして、第2のハイバンド信号125のベースバンドバージョン127は、3.2kHzバンド幅(たとえば、0Hz〜3.2kHz)を有し得、第2のハイバンド信号125の3.2kHzバンド幅(たとえば、12.8kHz〜16kHzの周波数範囲)を表し得る。上記で説明した周波数範囲は説明のためにすぎず、限定的に解釈されるべきではないことに留意されたい。他の態様では、ハイバンド生成回路106は3つ以上のベースバンド信号を生成し得る。ハイバンド生成回路106の動作の例については図5〜図7Bに関してより詳細に説明する。別の特定の態様では、ハイバンド生成回路106はハイバンド分析モジュール150に組み込まれ得る。
[0062]上記の例はSWBコーディング(たとえば、約0Hzから16kHzまでのコーディング)のためのフィルタ処理を示している。他の例では、分析フィルタバンク110は、フルバンド(FB)コーディング(たとえば、約0Hzから20kHzまでのコーディング)のために入力オーディオ信号をフィルタ処理し得る。例示のために、入力オーディオ信号102は、約0Hzから約20kHzまでの周波数範囲内のスピーチコンテンツを含み得る。ローパスフィルタ104は、約8kHzのカットオフ周波数を有して、約0Hzから約8kHzに拡張するバンド幅を有するローバンド信号122を生成し得る。FBコーディングによれば、入力オーディオ信号102のハイバンドは、約8kHzと約20kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分に対応し得る。入力オーディオ信号102のハイバンドは、第1のハイバンド信号124(たとえば、約8kHzから約16kHzにわたる第1のサブバンド)と、第2のハイバンド信号125(たとえば、約16kHzから約20kHzにわたる第2のサブバンド)とに分割され得る。第1のハイバンド信号124のベースバンドバージョン126は、8kHzバンド幅(たとえば、0Hz〜8kHz)を有し得、第1のハイバンド信号124の8kHzバンド幅(たとえば、8kHz〜16kHzの周波数範囲)を表し得る。同様にして、第2のハイバンド信号125のベースバンドバージョン127は、4kHzバンド幅(たとえば、0Hz〜4kHz)を有し得、第2のハイバンド信号125の4kHzバンド幅(たとえば、16kHz〜20kHzの周波数範囲)を表し得る。
[0063]説明しやすいように、別段に留意されない限り、以下の説明では概してSWBコーディングに関して説明する。しかしながら、同様の技法はFBコーディングを実施するために適用され得る。たとえば、SWBコーディングについて図1〜図4A、図5〜図7A、および図8〜図13に関して説明する各信号のバンド幅、したがって周波数範囲は、FBコーディングを実施するために約1.25倍に拡張され得る。非限定的な例として、のために0Hzから6.4kHzにわたる周波数範囲を有するものとしてSWBコーディングについて説明する(ベースバンドにおける)ハイバンド励振信号は、FBコーディング実装形態では0Hzから8kHzにわたる周波数範囲を有し得る。そのような技法をFBコーディングに拡張する非限定的な例については図4Bおよび図7Bに関して説明する。
[0064]システム100は、ローバンド信号122を受信するように構成されたローバンド分析モジュール130を含み得る。特定の態様では、ローバンド分析モジュール130はCELPエンコーダを表し得る。ローバンド分析モジュール130は、LP分析およびコーディングモジュール132と、線形予測係数(LPC)−LSP変換モジュール134と、量子化器136とを含み得る。LSPはLSFと呼ばれることもあり、2つの用語(LSPおよびLSF)は本明細書では互換的に使用され得る。LP分析およびコーディングモジュール132は、ローバンド信号122のスペクトルエンベロープをLPCのセットとして符号化し得る。LPCは、オーディオのフレーム(たとえば、16kHzのサンプリングレートで320個のサンプルに対応する20msのオーディオ)ごとに生成されるか、オーディオのサブフレーム(たとえば、5msのオーディオ)ごとに生成されるか、またはそれらの任意の組合せで生成され得る。フレームまたはサブフレームごとに生成されるLPCの数は、実施されるLP分析の「次数」によって決定され得る。特定の態様では、LP分析およびコーディングモジュール132は、第10次LP分析に対応する11個のLPCのセットを生成し得る。
[0065]LPC−LSP変換モジュール134は、LP分析およびコーディングモジュール132によって生成されたLPCのセットを(たとえば1対1変換を使用して)LSPの対応するセットに変換し得る。代替的に、LPCのセットは、パーコール係数、ログ面積比値、イミッタンススペクトル対(ISP)、またはイミッタンススペクトル周波数(ISF)の対応するセットに1対1変換され得る。LPCのセットとLSPのセットとの間の変換は、誤差なしに可逆であり得る。
[0066]量子化器136は、変換モジュール134によって生成されたLSPのセットを量子化し得る。たとえば、量子化器136は、複数のエントリ(たとえば、ベクトル)を含む複数のコードブックを含むかまたはそれらに結合され得る。LSPのセットを量子化するために、量子化器136は、(たとえば、最小2乗または平均2乗誤差などのひずみ尺度に基づいて)LSPのセット「に最も近い」コードブックのエントリを識別し得る。量子化器136は、コードブック中の識別されたエントリのロケーションに対応するインデックス値または一連のインデックス値を出力し得る。量子化器136の出力は、したがって、ローバンドビットストリーム142中に含まれるローバンドフィルタパラメータを表し得る。
[0067]ローバンド分析モジュール130はまた、ローバンド励振信号144を生成し得る。たとえば、ローバンド励振信号144は、ローバンド分析モジュール130によって実施されるLPプロセス中に生成されるLP残差信号を量子化することによって生成される符号化された信号であり得る。LP残差信号はローバンド励振信号144の予測誤差を表し得る。
[0068]システム100は、分析フィルタバンク110からハイバンド信号124、125のベースバンドバージョン126、127を受信するように、およびローバンド分析モジュール130からローバンド励振信号144を受信するように構成されたハイバンド分析モジュール150をさらに含み得る。ハイバンド分析モジュール150は、ハイバンド信号124、125のベースバンドバージョン126、127に基づいて、およびローバンド励振信号144に基づいてハイバンドサイド情報172を生成し得る。たとえば、ハイバンドサイド情報172は、ハイバンドLSP、利得情報、および/または位相情報を含み得る。
[0069]図示のように、ハイバンド分析モジュール150は、LP分析およびコーディングモジュール152と、LPC−LSP変換モジュール154と、量子化器156とを含み得る。LP分析およびコーディングモジュール152と、変換モジュール154と、量子化器156との各々は、ローバンド分析モジュール130の対応する構成要素に関して上記で説明したように機能し得るが、(たとえば、各係数、LSPなどのためにより少ないビットを使用して)比較的低減された分解能で機能し得る。LP分析およびコーディングモジュール152は、第1のハイバンド信号124のベースバンドバージョン126のためにLPCの第1のセットを生成し得、これらのLPCの第1のセットは、変換モジュール154によってLSPの第1のセットに変換され、コードブック163に基づいて量子化器156によって量子化される。さらに、LP分析およびコーディングモジュール152は、第2のハイバンド信号125のベースバンドバージョン127のためにLPCの第2のセットを生成し得、これらのLPCの第2のセットは、変換モジュール154によってLSPの第2のセットに変換され、コードブック163上で量子化器156ベースによって量子化される。第2のサブバンド(たとえば、第2のハイバンド信号125)は、第1のサブバンド(たとえば、第1のハイバンド信号124)と比較して知覚値を低減した周波数スペクトルに対応するので、LPCの第2のセットは、符号化効率のために(たとえば、より低次のフィルタを使用して)LPCの第1のセットと比較して低減され得る。
[0070]たとえば、LP分析およびコーディングモジュール152、変換モジュール154、ならびに量子化器156は、ハイバンドサイド情報172中に含まれるハイバンドフィルタ情報(たとえば、ハイバンドLSP)を決定するためにハイバンド信号124、125のベースバンドバージョン126、127を使用し得る。たとえば、LP分析およびコーディングモジュール152、変換モジュール154、ならびに量子化器156は、6.4kHzと12.8kHzとの間のバンド幅のためのハイバンドサイド情報172の第1のセットを決定するために第1のハイバンド信号124のベースバンドバージョン126と第1のハイバンド励振信号162とを使用し得る。ハイバンドサイド情報172の第1のセットは、第1のハイバンド信号124のベースバンドバージョン126と第1のハイバンド励振信号162との間の位相シフト、第1のハイバンド信号124のベースバンドバージョン126および第1のハイバンド励振信号162に関連する利得などに対応し得る。さらに、LP分析およびコーディングモジュール152、変換モジュール154、ならびに量子化器156は、12.8kHzと16kHzとの間のバンド幅のためのハイバンドサイド情報172の第2のセットを決定するために第2のハイバンド信号125のベースバンドバージョン127と第2のハイバンド励振信号164とを使用し得る。ハイバンドサイド情報172の第2のセットは、第2のハイバンド信号125のベースバンドバージョン127と第2のハイバンド励振信号164との間の位相シフト、第2のハイバンド信号125のベースバンドバージョン127および第2のハイバンド励振信号164に関連する利得などに対応し得る。
[0071]量子化器156は、変換モジュール154によって提供されるLSPなどのスペクトル周波数値のセットを量子化するように構成され得る。他の態様では、量子化器156は、LSFまたはLSPに加えて、またはその代わりに、1つまたは複数の他のタイプのスペクトル周波数値のセットを受信し、量子化し得る。たとえば、量子化器156は、LP分析およびコーディングモジュール152によって生成されたLPCのセットを受信し、量子化し得る。他の例としては、量子化器156において受信され量子化され得る、パーコール係数、ログ面積比値、およびISFのセットがある。量子化器156は、入力ベクトル(たとえば、ベクトル形式のスペクトル周波数値のセット)を、コードブック163などのテーブルまたはコードブック中の対応するエントリへのインデックスとして符号化するベクトル量子化器を含み得る。別の例として、量子化器156は、1つまたは複数のパラメータを決定するように構成され得、疎なコードブック実装形態などでは、入力ベクトルは、ストレージから取り出されるのではなく、これらのパラメータからデコーダにおいて動的に生成され得る。例示のために、疎なコードブックの例は、3GPP2(第3世代パートナーシップ2)EVRC(拡張可変レートコーデック)などの業界標準に従うCELPおよびコーデックなどのコーディング方式において適用され得る。別の態様では、ハイバンド分析モジュール150は、量子化器156を含み得、(たとえば、フィルタパラメータのセットに従って)合成信号を生成するためにいくつかのコードブックベクトルを使用し、知覚的に重み付けされた領域などにおいてハイバンド信号124、125のベースバンドバージョン126、127に最も良く適合する合成信号に関連するコードブックベクトルのうち1つを選択するように構成され得る。
[0072]ハイバンド分析モジュール150はまた、ハイバンド励振発生器160(たとえば、複数バンド非線形励振発生器)を含み得る。ハイバンド励振発生器160は、ローバンド分析モジュール130からのローバンド励振信号144に基づいて、異なるバンド幅を有する複数のハイバンド励振信号162、164(たとえば、高調波拡張された信号)を生成し得る。たとえば、ハイバンド励振発生器160は、(約6.4kHzと12.8kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分のバンド幅に対応する)約6.4kHzのベースバンドバンド幅を占有す第1のハイバンド励振信号162と、(約12.8kHzと16kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分のバンド幅に対応する)約3.2kHzのベースバンドバンド幅を占有する第2のハイバンド励振信号164を生成し得る。
[0073]ハイバンド分析モジュール150はまた、LP合成モジュール166を含み得る。LP合成モジュール166は、ハイバンド信号124、125のベースバンドバージョン126、127の合成バージョンを生成するために、量子化器156によって生成されたLPC情報を使用する。ハイバンド励振発生器160およびLP合成モジュール166は、受信機におけるデコーダデバイスの動作をエミュレートするローカルデコーダ中に含まれ得る。LP合成モジュール166の出力は、ハイバンド信号124、125のベースバンドバージョン126、127との比較のために使用され得、この比較に基づいてパラメータ(たとえば、利得パラメータ)が調整され得る。
[0074]ローバンドビットストリーム142およびハイバンドサイド情報172は、出力ビットストリーム199を生成するためにマルチプレクサ170によって多重化され得る。出力ビットストリーム199は、入力音声信号102に対応する符号化オーディオ信号を表し得る。出力ビットストリーム199は、送信機198によって(たとえば、ワイヤード、ワイヤレス、または光チャネルを介して)送信および/または記憶され得る。受信機において、オーディオ信号(たとえば、スピーカーまたは他の出力デバイスに提供される入力オーディオ信号102の再構成バージョン)を生成するために、逆演算がデマルチプレクサ(DEMUX)、ローバンドデコーダ、ハイバンドデコーダ、およびフィルタバンクによって実施され得る。ローバンドビットストリーム142を表すために使用されるビット数は、ハイバンドサイド情報172を表すために使用されるビット数よりも実質的に多くなり得る。したがって、出力ビットストリーム199中のビットの大部分はローバンドデータを表し得る。ハイバンドサイド情報172は、信号モデルに従ってローバンドデータからハイバンド励振信号162、164を再生成するために受信機において使用され得る。たとえば、信号モデルは、ローバンドデータ(たとえば、ローバンド信号122)とハイバンドデータ(たとえば、ハイバンド信号124、125)の関係または相関の予測されるセットを表し得る。したがって、異なる信号モデルが、異なる種類のオーディオデータ(たとえば、スピーチ、音楽など)に使用され得、使用中の特定の信号モデルは、符号化オーディオデータの通信の前に、送信機と受信機とによってネゴシエートされ得る(または業界標準によって定義され得る)。信号モデルを使用して、送信機におけるハイバンド分析モジュール150は、受信機における対応するハイバンド分析モジュールが出力ビットストリーム199からハイバンド信号124、125を再構成するために信号モデルを使用することが可能であるように、ハイバンドサイド情報172を生成することが可能になり得る。
[0075]図1のシステム100は、図2A、図2B、および図4に関してさらに詳細に説明するマルチバンドモードに従ってハイバンド励振信号162、164を生成し得、システム100は、図2A〜図3に関してさらに詳細に説明するシングルバンドモードに従って、極零フィルタ処理およびダウンミキシング演算に関連する複雑で計算コストが高い演算を低減し得る。さらに、ハイバンド励振発生器160は、シングルバンドモードに従って生成されたハイバンド励振信号242によって表される入力オーディオ信号102の周波数範囲(たとえば、6.4kHz〜14.4kHz)よりも入力オーディオ信号102のより大きい周波数範囲(たとえば、6.4kHz〜16kHz)を集合的に表す、ハイバンド励振信号162、164を生成し得る。
[0076]図2Aを参照すると、第1のモードに従って図1のハイバンド励振発生器160において使用される第1の構成要素160aの特定の態様と、第2のモードに従ってハイバンド励振発生器160において使用される第2の構成要素160bの第1の非限定的な実装形態とが示されている。たとえば、第1の構成要素160aと第2の構成要素160bの第1の実装形態とは、図1のハイバンド励振発生器160内に組み込まれ得る。
[0077]ハイバンド励振発生器160の第1の構成要素160aは、第1のモードに従って動作するように構成され得、約0Hzと6.4kHzとの間の周波数範囲を占有するローバンド励振信号144に基づいて(約6.4kHzと14.4kHzとの間の入力オーディオ信号102の成分に対応する)約0Hzと8kHzとの間のベースバンド周波数範囲を占有するハイバンド励振信号242を生成し得る。ハイバンド励振発生器160の第1の構成要素160aは、第1のサンプラー202と、第1の非線形変換生成器204と、極零フィルタ206と、第1のスペクトル反転モジュール208と、ダウンミキサ210と、第2のサンプラー212とを含む。
[0078]ローバンド励振信号144は第1のサンプラー202に提供され得る。ローバンド励振信号144は、サンプルのセットとして第1のサンプラー202によって受信され、12.8kHzのサンプリングレート(たとえば、6.4kHzローバンド励振信号144のナイキストサンプリングレート)に対応し得る。たとえば、ローバンド励振信号144は、ローバンド励振信号144のバンド幅のレートの2倍でサンプリングされ得る。図3を参照すると、ローバンド励振信号144の特定の例示的で非限定的な例がグラフ(a)に関して示されている。図3に示された図は例示的であり、いくつかの特徴は明快のために強調されていることがある。図は必ずしも一定の尺度で描かれているとは限らない。
[0079]第1のサンプラー202は、ローバンド励振信号144を2および1/2(たとえば、2.5)倍にアップサンプリングするように構成され得る。たとえば、第1のサンプラー202は、ローバンド励振信号144を5でアップサンプリングし、結果信号を2でダウンサンプリングして、アップサンプリング信号232を生成し得る。ローバンド励振信号144を2および1/2でアップサンプリングすると、ローバンド励振信号144のバンドが0Hzから16kHz(たとえば、6.4kHz*2.5=16kHz)に拡張され得る。図3を参照すると、アップサンプリング信号232の特定の例示的で非限定的な例がグラフ(b)に関して示されている。アップサンプリング信号232は32kHz(たとえば、16kHzアップサンプリング信号232のナイキストサンプリングレート)でサンプリングされ得る。アップサンプリング信号232は第1の非線形変換フィルタ204に提供され得る。
[0080]第1の非線形変換生成器204は、アップサンプリング信号232に基づいて第1の高調波拡張された信号234を生成するように構成され得る。たとえば、第1の非線形変換生成器204は、アップサンプリング信号232に対して非線形変換演算(たとえば、絶対値演算または2乗演算)を実施して、第1の高調波拡張された信号234を生成し得る。非線形変換演算は、元の信号(たとえば、0Hzから6.4kHzまでのローバンド励振信号144)の高調波をより高いバンド(たとえば、0Hzから16kHzまで)に拡張し得る。図3を参照すると、第1の高調波拡張された信号234の特定の例示的で非限定的な例がグラフ(c)に関して示されている。第1の高調波拡張された信号234は極零フィルタ206に提供され得る。
[0081]極零フィルタ206は、約14.4kHzにカットオフ周波数を有するローパスフィルタであり得る。たとえば、極零フィルタ206は、カットオフ周波数において急な減少を有し、第1の高調波拡張された信号234の高周波成分をフィルタ処理して(たとえば、14.4kHzと16kHzとの間の第1の高調波拡張された信号234の成分をフィルタ除去して)、0Hzと14.4kHzとの間のバンド幅を占有するフィルタ処理された高調波拡張された信号236を生成するように構成された、高次フィルタであり得る。図3を参照すると、フィルタ処理された高調波拡張された信号236の特定の例示的で非限定的な例がグラフ(d)に関して示されている。フィルタ処理された高調波拡張された信号236は第1のスペクトル反転モジュール208に提供され得る。
[0082]第1のスペクトル反転モジュール208は、フィルタ処理された高調波拡張された信号236のスペクトルミラー演算を実施して(たとえば、スペクトルを「反転」して)「反転」信号を生成するように構成され得る。フィルタ処理された高調波拡張された信号236のスペクトルを反転すると、フィルタ処理された高調波拡張された信号236の成分が、反転信号の0Hzから16kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、フィルタ処理された高調波拡張された信号236の14.4kHzにおける成分は反転信号の1.6kHzにあり得、フィルタ処理された高調波拡張された信号236の0Hzにおける成分は反転信号の16kHzにあり得る、など。第1のスペクトル反転モジュール208はまた、約9.6kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、「反転」信号の高周波成分をフィルタ除去して(たとえば、9.6kHzと16kHzとの間の反転信号の成分をフィルタ除去して)1.6kHzと9.6kHzとの間の周波数範囲を占有する結果信号238を生成するように構成され得る。図3を参照すると、結果信号238の特定の例示的で非限定的な例がグラフ(e)に関して示されている。結果信号238はダウンミキサ210に提供され得る。
[0083]ダウンミキサ210は、結果信号238を1.6kHzと9.6kHzとの間の周波数範囲からベースバンド(たとえば、0Hzと8kHzとの間の周波数範囲)にダウンミックスしてダウンミックス信号240を生成するように構成され得る。ダウンミキサ210は、2段ヒルベルト変換を使用して実装され得る。たとえば、ダウンミキサ210は、虚数成分と実数成分とを有する2つの5次無限インパルス応答(IIR)フィルタを使用して実装され得、それにより、複雑で計算コストが高い演算が生じ得る。図3を参照すると、ダウンミックス信号240の特定の例示的で非限定的な例がグラフ(f)に関して示されている。ダウンミックス信号240は第2のサンプラー212に提供され得る。
[0084]第2のサンプラー212は、ダウンミックス信号240を2倍にダウンサンプリングして(たとえば、ダウンミックス信号240を1/2倍にアップサンプリングして)ハイバンド励振信号242を生成するように構成され得る。ダウンミックス信号240を2でダウンサンプリングすると、ダウンミックス信号240の周波数範囲が0Hz〜8kHz(たとえば、16kHz*0.5=8kHz)に低減され、サンプリングレートが16kHzに低減され得る。図3を参照すると、ハイバンド励振信号242の特定の例示的で非限定的な例がグラフ(f)に関して示されている。ハイバンド励振信号242(たとえば、8kHzバンド信号)は、16kHz(たとえば、8kHzハイバンド励振信号242のナイキストサンプリングレート)でサンプリングされ得、図3のグラフ(c)における第1の高調波拡張された信号234の6.4kHzと14.4kHzとの間の周波数範囲内の成分のベースバンドバージョンに対応し得る。第2のサンプラー212におけるダウンサンプリングは、(たとえば、第1のスペクトル反転モジュール208によって引き起こされた「反転」を逆転して)成分を結果信号のそれのスペクトル配向に戻すスペクトル反転を生じ得る。本明細書で使用するダウンサンプリングは成分のスペクトル反転を生じ得ることを理解されたい。図1の第1のハイバンド信号124のベースバンドバージョン126(たとえば、0Hz〜6.4kHz)、および図1の第2のハイバンド信号125のベースバンドバージョン127(たとえば、0Hz〜3.2kHz)は、ハイバンド励振信号242の対応する周波数成分と比較されて、ハイバンドサイド情報172(たとえば、エネルギー比に基づく利得係数)が生成される。
[0085]第1の動作モードに従って極零フィルタ206およびダウンミキサ210に関連する複雑で計算コストが高い演算を低減するために、図1のハイバンド分析モジュール150のハイバンド励振発生器160は、第1のハイバンド励振信号162と第2のハイバンド励振信号164とを生成するために、図2Aの第2の構成要素160bの第1の実装形態を介して示される、第2のモードに従って動作し得る。さらに、ハイバンド励振発生器160の第2の構成要素160bの第1の実装形態は、第1の動作モードに従ってハイバンド励振信号242によって表されるバンド幅(たとえば、入力オーディオ信号102の6.4kHz〜14.4kHzの周波数範囲にわたる8kHzバンド幅)よりも入力オーディオ信号102のより大きいバンド幅(たとえば、入力オーディオ信号102の6.4kHz〜16kHzの周波数範囲にわたる9.6kHzバンド幅)を集合的に表す、ハイバンド励振信号162、164を生成し得る。
[0086]ハイバンド励振発生器160の第2の構成要素160bの第1の実装形態は、第1のハイバンド励振信号162を生成するように構成された第1の経路と、第2のハイバンド励振信号164を生成するように構成された第2の経路とを含み得る。第1の経路および第2の経路は、ハイバンド励振信号162、164を生成することに関連するレイテンシを減少させるように並列に動作し得る。代替的に、または追加として、1つまたは複数の構成要素は、サイズおよび/またはコストを低減するために直列またはパイプライン構成で共有され得る。
[0087]第1の経路は、第3のサンプラー214と、第2の非線形変換生成器218と、第2のスペクトル反転モジュール220と、第4のサンプラー222とを含む。ローバンド励振信号144は第3のサンプラー214に提供され得る。第3のサンプラー214は、アップサンプリング信号252を生成するためにローバンド励振信号144を2でアップサンプリングするように構成され得る。ローバンド励振信号144を2でアップサンプリングすると、ローバンド励振信号144のバンドが0Hzから12.8kHz(たとえば、6.4kHz*2=12.8kHz)に拡張され得る。図4Aを参照すると、アップサンプリング信号252の特定の例示的で非限定的な例がグラフ(g)に関して示されている。アップサンプリング信号252は25.6kHz(たとえば、12.8kHzアップサンプリング信号252のナイキストサンプリングレート)でサンプリングされ得る。図4Aに示された図は例示的であり、いくつかの特徴は明快のために強調されていることがある。図は必ずしも一定の尺度で描かれているとは限らない。アップサンプリング信号252は第2の非線形変換生成器218に提供され得る。
[0088]第2の非線形変換生成器218は、アップサンプリング信号252に基づいて第2の高調波拡張された信号254を生成するように構成され得る。たとえば、第2の非線形変換生成器218は、アップサンプリング信号252に対して非線形変換演算(たとえば、絶対値演算または2乗演算)を実施して、第2の高調波拡張された信号254を生成し得る。非線形変換演算は、元の信号(たとえば、0Hzから6.4kHzまでのローバンド励振信号144)の高調波をより高いバンド(たとえば、0Hzから12.8kHzまで)に拡張し得る。図4Aを参照すると、第2の高調波拡張された信号254の特定の例示的で非限定的な例がグラフ(h)に関して示されている。第2の高調波拡張された信号254は第2のスペクトル反転モジュール220に提供され得る。
[0089]第2の反転モジュール220は、第2の高調波拡張された信号254に対してスペクトルミラー演算を実施して(たとえば、スペクトルを「反転」して)「反転」信号を生成するように構成され得る。第2の高調波拡張された信号254のスペクトルを反転すると、第2の高調波拡張された信号254の成分が、反転信号の0Hzから12.8kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、第2の高調波拡張された信号254の12.8kHzにおける成分は反転信号の0Hzにあり得、第2の高調波拡張された信号254の0Hzにおける成分は反転信号の12.8kHzにあり得る、など。第1のスペクトル反転モジュール208はまた、約6.4kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、反転信号の高周波成分をフィルタ除去して(たとえば、6.4kHzと12.8kHzとの間の反転信号の成分をフィルタ除去して)0Hzと6.4kHzとの間のバンド幅を占有する結果信号256を生成するように構成され得る。図4Aを参照すると、結果信号256の特定の例示的で非限定的な例がグラフ(i)に関して示されている。結果信号256は第4のサンプラー222に提供され得る。
[0090]第4のサンプラー222は、結果信号256を2でダウンサンプリングして(たとえば、結果信号256を1/2倍にアップサンプリングして)第1のハイバンド励振信号162を生成するように構成され得る。結果信号256を2でダウンサンプリングすると、結果信号256のバンドが0Hz〜6.4kHz(たとえば、12.8kHz*0.5=6.4kHz)に低減され得る。図4Aを参照すると、第1のハイバンド励振信号162の特定の例示的で非限定的な例がグラフ(j)に関して示されている。第1のハイバンド励振信号162(たとえば、6.4kHzバンド信号)は、12.8kHz(たとえば、6.4kHzの第1のハイバンド励振信号162のナイキストサンプリングレート)でサンプリングされ得、図1の第1のハイバンド信号124(たとえば、6.4kHz〜12.8kHzを占有するハイバンドスピーチ信号)のフィルタ処理されたベースバンドバージョンに対応し得る。たとえば、第1のハイバンド信号124のベースバンドバージョン126は、ハイバンドサイド情報172を生成するために、第1のハイバンド励振信号162の対応する周波数成分と比較され得る。
[0091]第2の経路は、第1のサンプラー202と、第1の非線形変換生成器204と、第3のスペクトル反転モジュール224と、第5のサンプラー226とを含む。ローバンド励振信号144は第1のサンプラー202に提供され得る。第1のサンプラー202は、ローバンド励振信号144を2および1/2(たとえば、2.5)でアップサンプリングするように構成され得る。たとえば、第1のサンプラー202は、ローバンド励振信号144を5でアップサンプリングし、結果信号を2でダウンサンプリングして、アップサンプリング信号232を生成し得る。図4Aを参照すると、アップサンプリング信号232の特定の例示的で非限定的な例がグラフ(k)に関して示されている。アップサンプリング信号232は第1の非線形変換生成器204に提供され得る。
[0092]第1の非線形変換生成器204は、アップサンプリング信号232に基づいて第1の高調波拡張された信号234を生成するように構成され得る。たとえば、第1の非線形変換生成器204は、アップサンプリング信号232に対して非線形変換演算を実施して、第1の高調波拡張された信号234を生成し得る。非線形変換演算は、元の信号(たとえば、0Hzから6.4kHzまでのローバンド励振信号144)の高調波をより高いバンド(たとえば、0Hzから16kHzまで)に拡張し得る。図4Aを参照すると、第1の高調波拡張された信号234の特定の例示的で非限定的な例がグラフ(l)に関して示されている。第1の高調波拡張された信号234は第3のスペクトル反転モジュール224に提供され得る。
[0093]第3のスペクトル反転モジュール224は、第1の高調波拡張された信号234のスペクトルを「反転する」ように構成され得る。第3のスペクトル反転モジュール224はまた、約3.2kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、「反転」信号の高周波成分をフィルタ除去して(たとえば、3.2kHzと16kHzとの間の反転信号の成分をフィルタ除去して)0kHzと3.2kHzとの間のバンド幅を占有する結果信号258を生成するように構成され得る。図4Aを参照すると、結果信号258の特定の例示的で非限定的な例がグラフ(m)に関して示されている。結果信号258は第5のサンプラー226に提供され得る。
[0094]第5のサンプラー226は、結果信号258を5でダウンサンプリングして(たとえば、結果信号258を1/5倍にアップサンプリングして)第2のハイバンド励振信号164を生成するように構成され得る。(たとえば、32kHzのサンプルレートをもつ)結果信号258を5でダウンサンプリングすると、結果信号258のバンドが0Hz〜3.2kHz(たとえば、16kHz*0.2=3.2kHz)に低減され得る。図4Aを参照すると、第2のハイバンド励振信号164の特定の例示的で非限定的な例がグラフ(n)に関して示されている。第2のハイバンド励振信号164(たとえば、3.2kHzバンド信号)は、6.4kHz(たとえば、3.2kHzの第2のハイバンド励振信号164のナイキストサンプリングレート)でサンプリングされ得、図1の第2のハイバンド信号125(たとえば、12.8kHz〜16kHzを占有するハイバンドスピーチ信号)のフィルタ処理されたベースバンドバージョンに対応し得る。たとえば、第2のハイバンド信号125のベースバンドバージョン127は、ハイバンドサイド情報172を生成するために、第2のハイバンド励振信号164の対応する周波数成分と比較され得る。
[0095]第2のモード(たとえば、マルチバンドモード)に従ってハイバンド励振信号162、164を生成するように構成されたハイバンド励振発生器160の第2の構成要素160bの第1の実装形態は、極零フィルタ206およびダウンミキサ210をバイパスし、極零フィルタ206およびダウンミキサ210に関連する複雑で計算コストが高い演算を低減し得ることを諒解されよう。さらに、ハイバンド励振発生器160の第2の構成要素160bの第1の実装形態は、第1の動作モードに従って生成されたハイバンド励振信号242によって表されるバンド幅(たとえば、6.4kHz〜14.4kHz)よりも入力オーディオ信号102のより大きいバンド幅(たとえば、6.4kHz〜16kHz)を集合的に表す、ハイバンド励振信号162、164を生成し得る。
[0096]図2Bを参照すると、第2のモードに従ってハイバンド励振発生器160において使用される第2の構成要素160bの第2の非限定的な実装形態が示されている。ハイバンド励振発生器160の第2の構成要素160bの第2の実装形態は、第1のハイバンド励振発生器280と、第2のハイバンド励振発生器282とを含み得る。
[0097]ローバンド励振信号144は第1のハイバンド励振発生器280に提供され得る。第1のハイバンド励振発生器280は、ローバンド励振信号144をアップサンプリングすることに基づいて第1のベースバンド信号(たとえば、第1のハイバンド励振信号162)を生成し得る。たとえば、第1のハイバンド励振発生器280は、図2Aの第3のサンプラー214と、図2Aの第2の非線形変換生成器218と、図2Aの第2のスペクトル反転モジュール220と、図2Aの第4のサンプラー222とを含み得る。したがって、第1のハイバンド励振発生器280は、図2Aの第2の構成要素160bの第1の実装形態の第1の経路と実質的に同様の様式で動作し得る。
[0098]第1のハイバンド励振信号162は第2のハイバンド励振発生器282に提供され得る。第2のハイバンド励振発生器282は、第1のハイバンド励振信号162を使用して白色雑音を変調して第2のハイバンド励振信号164を生成するように構成され得る。たとえば、第2のハイバンド励振信号164は、白色雑音発生器(たとえば、ランダムまたは擬似ランダム信号を生成する回路)の出力に第1のハイバンド励振信号162のスペクトルエンベロープを適用することによって生成され得る。したがって、第2の構成要素160bの第2の非限定的な実装形態によれば、第2の構成要素160bの第1の非限定的な実装形態の第2の経路は、第1のハイバンド励振信号162と白色雑音とに基づいて第2のハイバンド励振信号164を生成するために第2のハイバンド励振発生器282と「交換され」得る。
[0099]図2A〜図2Bでは、第1の構成要素160aおよび第2の構成要素160bについて、ハイバンド励振発生器160の別個の動作モードに関連付けられるものとして説明しているが、他の態様では、図1のハイバンド励振発生器160は、第1のモードでも動作するように構成されることなしに第2のモードで動作するように構成され得る(たとえば、ハイバンド励振発生器160は極零フィルタ206およびダウンミキサ210を省略し得る)。第2の構成要素160bの第1の実装形態は、図2Aでは2つの非線形変換生成器204、218を含むものとして示されているが、他の態様では、ローバンド励振信号144に基づいて単一の高調波拡張された信号を生成するために単一の非線形変換生成器が使用され得る。単一の高調波拡張された信号は、追加の処理のために第1の経路および第2の経路に提供され得る。
[00100]図2A〜図4AはSWBコーディングハイバンド励起生成を示している。図2A〜図4Aに関して説明した技法およびサンプリング比はフルバンド(FB)コーディングに適用され得る。非限定的な例として、図2A、図2B、および図4Aに関して説明した第2の動作モードはFBコーディングに適用され得る。図4Bを参照すると、第2の動作モードがFBコーディングに関して示されている。図4Bの第2の動作モードについて、ハイバンド励振発生器160の第2の構成要素160bに関して説明する。
[00101]ほぼ0Hzから8kHzにわたる周波数範囲を有するローバンド励振信号が第3のサンプラー214に提供され得る。第3のサンプラー214は、アップサンプリング信号252bを生成するためにローバンド励振信号を2でアップサンプリングするように構成され得る。ローバンド励振信号144を2でアップサンプリングすると、ローバンド励振信号の周波数範囲が0Hzから16kHz(たとえば、8kHz*2=16kHz)に拡張され得る。図4Bを参照すると、アップサンプリング信号252bの特定の例示的で非限定的な例がグラフ(a)に関して示されている。アップサンプリング信号252bは32kHz(たとえば、16kHzアップサンプリング信号252のナイキストサンプリングレート)でサンプリングされ得る。図は必ずしも一定の尺度で描かれているとは限らない。アップサンプリング信号252bは第2の非線形変換生成器218に提供され得る。
[00102]第2の非線形変換生成器218は、アップサンプリング信号252bに基づいて第2の高調波拡張された信号254bを生成するように構成され得る。たとえば、第2の非線形変換生成器218は、アップサンプリング信号252bに対して非線形変換演算(たとえば、絶対値演算または2乗演算)を実施して、第2の高調波拡張された信号254bを生成し得る。非線形変換演算は、元の信号(たとえば、0Hzから8kHzまでのローバンド励振信号)の高調波をより高いバンド(たとえば、0Hzから16kHzまで)に拡張し得る。図4Bを参照すると、第2の高調波拡張された信号254bの特定の例示的で非限定的な例がグラフ(b)に関して示されている。第2の高調波拡張された信号254bは第2のスペクトル反転モジュール220に提供され得る。
[00103]第2の反転モジュール220は、第2の高調波拡張された信号254bに対してスペクトルミラー演算を実施して(たとえば、スペクトルを「反転」して)「反転」信号を生成するように構成され得る。第2の高調波拡張された信号254bのスペクトルを反転すると、第2の高調波拡張された信号254bの成分が、反転信号の0Hzから16kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、第2の高調波拡張された信号254bの16kHzにおける成分は反転信号の0Hzにあり得、第2の高調波拡張された信号254bの0Hzにおける成分は反転信号の16kHzにあり得る、など。第1のスペクトル反転モジュール208はまた、約8kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、反転信号の高周波成分をフィルタ除去して(たとえば、8kHzと16kHzとの間の反転信号の成分をフィルタ除去して)0Hzと8kHzとの間のバンド幅を占有する結果信号256bを生成するように構成され得る。図4Bを参照すると、結果信号256bの特定の例示的で非限定的な例がグラフ(c)に関して示されている。結果信号256bは第4のサンプラー222に提供され得る。
[00104]第4のサンプラー222は、結果信号256bを2でダウンサンプリングして(たとえば、結果信号256bを1/2倍にアップサンプリングして)約0Hzから8kHzにわたる第1のハイバンド励振信号162bを生成するように構成され得る。結果信号256bを2でダウンサンプリングすると、結果信号256bのバンドが0Hz〜8kHz(たとえば、16kHz*0.5=8kHz)に低減され得る。図4Bを参照すると、第1のハイバンド励振信号162bの特定の例示的で非限定的な例がグラフ(d)に関して示されている。第1のハイバンド励振信号162b(たとえば、8kHzバンド信号)は、16kHz(たとえば、8kHzの第1のハイバンド励振信号162bのナイキストサンプリングレート)でサンプリングされ得、第1のハイバンド信号(たとえば、8kHz〜16kHzを占有するハイバンドスピーチ信号)のフィルタ処理されたベースバンドバージョンに対応し得る。たとえば、第1のハイバンド信号124のベースバンドバージョン126は、ハイバンドサイド情報172を生成するために、第1のハイバンド励振信号162bの対応する周波数成分と比較され得る。
[00105]ローバンド励振信号は第1のサンプラー202に提供され得る。第1のサンプラー202は、ローバンド励振信号を2および1/2(たとえば、2.5)でアップサンプリングするように構成され得る。たとえば、第1のサンプラー202は、ローバンド励振信号144を5でアップサンプリングし、結果信号を2でダウンサンプリングして、アップサンプリング信号232bを生成し得る。図4Bを参照すると、アップサンプリング信号232bの特定の例示的で非限定的な例がグラフ(e)に関して示されている。アップサンプリング信号232bは第1の非線形変換生成器204に提供され得る。
[00106]第1の非線形変換生成器204は、アップサンプリング信号232bに基づいて第1の高調波拡張された信号234bを生成するように構成され得る。たとえば、第1の非線形変換生成器204は、アップサンプリング信号232bに対して非線形変換演算を実施して、第1の高調波拡張された信号234bを生成し得る。非線形変換演算は、元の信号(たとえば、0Hzから8kHzまでのローバンド励振信号)の高調波をより高いバンド(たとえば、0Hzから20kHzまで)に拡張し得る。図4Bを参照すると、第1の高調波拡張された信号234bの特定の例示的で非限定的な例がグラフ(f)に関して示されている。第1の高調波拡張された信号234bは第3のスペクトル反転モジュール224に提供され得る。
[00107]第3のスペクトル反転モジュール224は、第1の高調波拡張された信号234bのスペクトルを「反転する」ように構成され得る。第3のスペクトル反転モジュール224はまた、約4kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、「反転」信号の高周波成分をフィルタ除去して(たとえば、4kHzと20kHzとの間の反転信号の成分をフィルタ除去して)0kHzと4kHzとの間のバンド幅を占有する結果信号258bを生成するように構成され得る。図4Bを参照すると、結果信号258bの特定の例示的で非限定的な例がグラフ(g)に関して示されている。結果信号258bは第5のサンプラー226に提供され得る。
[00108]第5のサンプラー226は、結果信号258bを5でダウンサンプリングして(たとえば、結果信号258を1/5倍にアップサンプリングして)第2のハイバンド励振信号164bを生成するように構成され得る。(たとえば、40kHzのサンプルレートをもつ)結果信号258bを5でダウンサンプリングすると、結果信号258bのバンドが0Hz〜4kHz(たとえば、20kHz*0.2=4kHz)に低減され得る。図4Bを参照すると、第2のハイバンド励振信号164bの特定の例示的で非限定的な例がグラフ(h)に関して示されている。第2のハイバンド励振信号164b(たとえば、4kHzバンド信号)は、8kHz(たとえば、4kHzの第2のハイバンド励振信号164bのナイキストサンプリングレート)でサンプリングされ得、16kHz〜20kHzを占有するハイバンドスピーチ信号のフィルタ処理されたベースバンドバージョンに対応し得る。たとえば、第2のハイバンド信号125のベースバンドバージョン127は、ハイバンドサイド情報172を生成するために、第2のハイバンド励振信号164bの対応する周波数成分と比較され得る。
[00109]第2のモード(たとえば、マルチバンドモード)に従ってハイバンド励振信号162b、164bを生成するように構成されたハイバンド励振発生器160の第2の構成要素160bは、極零フィルタ206およびダウンミキサ210をバイパスし、極零フィルタ206およびダウンミキサ210に関連する複雑で計算コストが高い演算を低減し得ることを諒解されよう。さらに、ハイバンド励振発生器160の第2の構成要素160bは、入力オーディオ信号102のより大きいバンド幅(たとえば、8kHz〜20kHz)を集合的に表す、ハイバンド励振信号162b、164bを生成し得る。
[00110]図5を参照すると、第1のモードに従って動作するように構成された図1のハイバンド生成回路106において使用される第1の構成要素106aの特定の態様と、第2のモードに従って動作するように構成されたハイバンド生成回路106において使用される第2の構成要素106bの特定の態様とが示されている。
[00111]第1のモードに従って動作するように構成されたハイバンド生成回路106の第1の構成要素106aは、入力オーディオ信号102に基づいて(約6.4kHzと14.4kHzとの間の入力オーディオ信号102の成分に対応する)約0Hzと8kHzとの間のベースバンド周波数範囲を占有するハイバンド信号540のベースバンドバージョンを生成し得る。ハイバンド生成回路106の第1の構成要素106aは、極零フィルタ502と、第1のスペクトル反転モジュール504と、ダウンミキサ506と、第1のサンプラー508とを含む。
[00112]入力オーディオ信号102は32kHz(たとえば、16kHz入力オーディオ信号102のナイキストサンプリングレート)でサンプリングされ得る。たとえば、入力オーディオ信号102は、入力オーディオ信号102のバンド幅のレートの2倍でサンプリングされ得る。図6を参照すると、入力オーディオ信号の特定の例示的で非限定的な例がグラフ(a)に関して示されている。入力オーディオ信号102は、0Hzと6.4kHzとの間の周波数範囲を占有するローバンドスピーチを含み得、入力オーディオ信号102は、6.4kHzと16kHzとの間の周波数範囲を占有するハイバンドスピーチを含み得る。図6に示された図は例示的であり、いくつかの特徴は明快のために強調されていることがある。図は必ずしも一定の尺度で描かれているとは限らない。入力オーディオ信号102は極零フィルタ502に提供され得る。
[00113]極零フィルタ502は、約14.4kHzにカットオフ周波数を有するローパスフィルタであり得る。たとえば、極零フィルタ502は、カットオフ周波数において急な減少を有し、入力オーディオ信号102の高周波成分をフィルタ処理して(たとえば、14.4kHzと16kHzとの間の入力オーディオ信号102の成分をフィルタ除去して)、0Hzと14.4kHzとの間のバンド幅を占有するフィルタ処理された入力オーディオ信号532を生成するように構成された、高次フィルタであり得る。図6を参照すると、フィルタ処理された入力オーディオ信号532の特定の例示的で非限定的な例がグラフ(b)に関して示されている。フィルタ処理された入力オーディオ信号532は第1のスペクトル反転モジュール504に提供され得る。
[00114]第1のスペクトル反転モジュール504は、フィルタ処理された入力オーディオ信号532に対してミラー演算を実施して(たとえば、スペクトルを「反転」して)「反転」信号を生成するように構成され得る。フィルタ処理された入力オーディオ信号532のスペクトルを反転すると、フィルタ処理された入力オーディオ信号532の成分が、0Hzから16kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、フィルタ処理された入力オーディオ信号532の14.4kHzにおける成分は反転信号の1.6kHzにあり得、フィルタ処理された入力オーディオ信号532の0Hzにおける成分は反転信号の16kHzにあり得る、など。第1のスペクトル反転モジュール208はまた、約9.6kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、反転信号の高周波成分をフィルタ除去して(たとえば、9.6kHzと16kHzとの間の反転信号の成分をフィルタ除去して)1.6kHzと9.6kHzとの間のバンド幅を占有する(ハイバンドを表す)結果信号534を生成するように構成され得る。図6を参照すると、結果信号534の特定の例示的で非限定的な例がグラフ(c)に関して示されている。結果信号534はダウンミキサ506に提供され得る。
[00115]ダウンミキサ506は、結果信号534を1.6kHzと9.6kHzとの間の周波数範囲からベースバンド(たとえば、0Hzと8kHzとの間の周波数範囲)にダウンミックスしてダウンミックス信号536を生成するように構成され得る。図6を参照すると、ダウンミックス信号536の特定の例示的で非限定的な例がグラフ(d)に関して示されている。ダウンミックス信号536は第1のサンプラー508に提供され得る。
[00116]第1のサンプラー508は、ダウンミックス信号536を2倍にダウンサンプリングして(たとえば、ダウンミックス信号536を1/2倍にアップサンプリングして)ハイバンド励振信号540のベースバンドバージョンを生成するように構成され得るように構成され得る。ダウンミックス信号536を2でダウンサンプリングすると、ダウンミックス信号536のバンドが0Hz〜16kHz(たとえば、32kHz*0.5=16kHz)に低減され得る。図6を参照すると、ハイバンド信号540のベースバンドバージョンの特定の例示的で非限定的な例がグラフ(e)に関して示されている。ハイバンド信号540(たとえば、8kHzバンド信号)のベースバンドバージョンは、16kHzのサンプルレートを有し得、6.4kHzと14.4kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分のベースバンドバージョンに対応し得る。たとえば、ハイバンド信号540のベースバンドバージョンは、ハイバンドサイド情報172を生成するために、図2Aのハイバンド励振信号242の対応する周波数成分、または図1〜図2Bの第1および第2のハイバンド励振信号162、164の対応する周波数成分と比較され得る。
[00117]第1の動作モードに従って極零フィルタ502およびダウンミキサ506に関連する複雑で計算コストが高い演算を低減するために、ハイバンド生成回路106は、ハイバンド信号124、125のベースバンドバージョン126、127を生成するために第2のモードに従って動作するように構成され得る。さらに、ハイバンド生成回路106は、第1の動作モードに従ってハイバンド信号540のベースバンドバージョンによって表されるバンド幅成分(たとえば、周波数範囲6.4kHz〜14.4kHz内の8kHzバンド幅)よりも入力オーディオ信号102のより大きいバンド幅成分(たとえば、周波数範囲6.4kHz〜16kHz内の9.6kHzバンド幅)を集合的に表す、ハイバンド信号124、125のベースバンドバージョン126、127を生成し得る。
[00118]ハイバンド生成回路106の第2の構成要素106bは、第1のハイバンド信号124のベースバンドバージョン126を生成するように構成された第1の経路と、第2のハイバンド信号125のベースバンドバージョン127を生成するように構成された第2の経路とを含み得る。第1の経路および第2の経路は、ハイバンド信号124、125のベースバンドバージョン126、127を生成することに関連する処理時間を減少させるために並列に動作し得る。代替的に、または追加として、1つまたは複数の構成要素は、サイズおよび/またはコストを低減するために直列またはパイプライン構成で共有され得る。
[00119]第1の経路は、第2のサンプラー510と、第2のスペクトル反転モジュール512と、第3のサンプラー516とを含む。入力オーディオ信号102は第2のサンプラー510に提供され得る。第2のサンプラー510は、入力オーディオ信号102を5/4でダウンサンプリングして(たとえば、入力オーディオ信号102を4/5でアップサンプリングして)ダウンサンプリング信号542を生成するように構成され得る。入力オーディオ信号102を5/4でダウンサンプリングすると、入力オーディオ信号102のバンドが0Hz〜12.8kHz(たとえば、16kHz*(4/5)=12.8kHz)に低減され得る。図7Aを参照すると、ダウンサンプリング信号542の特定の例示的で非限定的な例がグラフ(f)に関して示されている。ダウンサンプリング信号542は25.6kHz(たとえば、12.8kHzダウンサンプリング信号542のナイキストサンプリングレート)でサンプリングされ得る。図7Aに示された図は例示的であり、いくつかの特徴は明快のために強調されていることがある。図は必ずしも一定の尺度で描かれているとは限らない。ダウンサンプリング信号542は第2のスペクトル反転モジュール512に提供され得る。
[00120]第2のスペクトル反転モジュール512は、ダウンサンプリング信号542に対してミラー演算を実施して(たとえば、スペクトルを「反転」して)「反転」信号を生成するように構成され得る。ダウンサンプリング信号542のスペクトルを反転すると、フィルタ処理されたダウンサンプリング信号542の成分が、0Hzから12.8kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、ダウンサンプリング信号542の12.8kHzにおける成分は反転信号の0Hzにあり得、ダウンサンプリング信号542の0Hzにおける成分は反転信号の12.8kHzにあり得る、など。第2のスペクトル反転モジュール512はまた、約6.4kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、反転信号の高周波成分をフィルタ除去して(たとえば、6.4kHzと12.8kHzとの間の反転信号の成分をフィルタ除去して)0Hzと6.4kHzとの間のバンド幅を占有する(ハイバンドを表す)結果信号544を生成するように構成され得る。図7Aを参照すると、結果信号544の特定の例示的で非限定的な例がグラフ(g)に関して示されている。結果信号544は第3のサンプラー516に提供され得る。
[00121]第3のサンプラー516は、結果信号544を2倍にダウンサンプリングして(たとえば、結果信号544を1/2倍にアップサンプリングして)第1のハイバンド信号124のベースバンドバージョン126を生成するように構成され得る。結果信号544を2でダウンサンプリングすると、結果信号544のバンドが0Hzから12.8kHz(たとえば、25.6kHz*0.5=12.8kHz)に低減され得る。図7Aを参照すると、第1のハイバンド信号124のベースバンドバージョン126の特定の例示的で非限定的な例がグラフ(h)に関して示されている。第1のハイバンド信号124のベースバンドバージョン126(たとえば、6.4kHzバンド信号)は、12.8kHz(たとえば、第1のハイバンド信号124の6.4kHzベースバンドバージョン126のナイキストサンプリングレート)でサンプリングされ得、6.4kHzと12.8kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分のベースバンドバージョンに対応し得る。たとえば、第1のハイバンド信号124のベースバンドバージョン126は、ハイバンドサイド情報172を生成するために、図1〜図2Bの第1のハイバンド励振信号162の対応する周波数成分と比較され得る。
[00122]第2の経路は、第3のスペクトル反転モジュール518と、第4のサンプラー520とを含む。入力オーディオ信号102は第3のスペクトル反転モジュール518に提供され得る。第3のスペクトル反転モジュール518は、約12.8kHzにカットオフ周波数を有するハイパスフィルタ(図示せず)を含み得る。たとえば、ハイパスフィルタは、入力オーディオ信号の低周波成分をフィルタ除去して(たとえば、0Hzと12.8kHzとの間の入力オーディオ信号の成分をフィルタ除去して)12.8kHzと16kHzとの間の周波数範囲を占有するフィルタ処理された入力オーディオ信号を生成するように構成され得る。第3のスペクトル反転モジュール518はまた、フィルタ処理された入力オーディオ信号のスペクトルを「反転」して結果信号546を生成するように構成され得る。図7Aを参照すると、結果信号546の特定の例示的で非限定的な例がグラフ(i)に関して示されている。結果信号546は第4のサンプラー520に提供され得る。
[00123]第4のサンプラー520は、結果信号546を5でダウンサンプリングして(たとえば、結果信号546を1/5倍にアップサンプリングして)6.4kHzのサンプルレートを有する第2のハイバンド信号125のベースバンドバージョン127を生成するように構成され得る。結果信号546を5でダウンサンプリングすると、結果信号546のバンドが0Hzから3.2kHz(たとえば、16kHz*0.2=3.2kHz)に低減され得る。図7Aを参照すると、第2のハイバンド信号125の特定の例示的で非限定的な例がグラフ(j)に関して示されている。第2のハイバンド信号125のベースバンドバージョン127(たとえば、3.2kHzバンド信号)は、6.4kHzのサンプルレート(たとえば、3.2kHzの第2のハイバンド信号125のナイキストサンプリングレート)を有し得、入力オーディオ信号102の12.8kHzと16kHzとの間の周波数範囲を占有する成分のベースバンドバージョンに対応し得る。たとえば、第2のハイバンド信号125のベースバンドバージョン127は、ハイバンドサイド情報172を生成するために、図1〜図2Bの第2のハイバンド励振信号164の対応する周波数成分と比較され得る。
[00124]第2のモード(たとえば、マルチバンドモード)に従ってハイバンド信号124、125のベースバンドバージョン126、127を生成するように構成されたハイバンド生成回路106の第2の構成要素106bは、第1のモード(たとえば、シングルバンドモード)に従って動作することと比較して、極零フィルタ502およびダウンミキサ506に関連する複雑で計算コストが高い演算を低減し得ることを諒解されよう。さらに、ハイバンド生成回路106は、第1の動作モードに従って生成されたハイバンド信号540のベースバンドバージョンによって表されるバンド幅(たとえば、周波数範囲6.4kHz〜14.4kHzの8kHzバンド幅)よりも入力オーディオ信号102のより大きいバンド幅(たとえば、周波数範囲6.4kHz〜16kHzの9.6kHzバンド幅)を集合的に表す、ハイバンド信号124、125のベースバンドバージョン126、127を生成し得る。図5では、第1の構成要素106aおよび第2の構成要素106bについて、ハイバンド生成回路106の別個のモードに関連付けられるものとして説明しているが、他の態様では、図1のハイバンド生成回路106は、第1のモードでも動作するように構成されることなしに第2のモードで動作するように構成され得る(たとえば、ハイバンド生成回路106は極零フィルタ502およびダウンミキサ506を省略し得る)。
[00125]図5〜図7AはSWBコーディングハイバンド生成を示している。図5〜図7Aに関して説明した技法およびサンプリング比はフルバンド(FB)コーディングに適用され得る。非限定的な例として、図5および図7Aに関して説明した第2の動作モードはFBコーディングに適用され得る。図7Bを参照すると、第2の動作モードがFBコーディングに関して示されている。図7Bの第2の動作モードについて、ハイバンド生成回路106の第2の構成要素106bに関して説明する。
[00126]0Hzから20kHzにわたる周波数を有する入力オーディオ信号が第2のサンプラー510に提供され得る。第2のサンプラー510は、入力オーディオ信号を5/4でダウンサンプリングして(たとえば、入力オーディオ信号を4/5でアップサンプリングして)ダウンサンプリング信号542bを生成するように構成され得る。入力オーディオ信号を5/4でダウンサンプリングすると、入力オーディオ信号のバンドが0Hz〜16kHz(たとえば、20kHz*(4/5)=16kHz)に低減され得る。図7Bを参照すると、ダウンサンプリング信号542bの特定の例示的で非限定的な例がグラフ(a)に関して示されている。ダウンサンプリング信号542bは32kHz(たとえば、16kHzダウンサンプリング信号542bのナイキストサンプリングレート)でサンプリングされ得る。ダウンサンプリング信号542bは第2のスペクトル反転モジュール512に提供され得る。
[00127]第2のスペクトル反転モジュール512は、ダウンサンプリング信号542bに対してミラー演算を実施して(たとえば、スペクトルを「反転」して)「反転」信号を生成するように構成され得る。ダウンサンプリング信号542bのスペクトルを反転すると、フィルタ処理されたダウンサンプリング信号542bの成分が、0Hzから16kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、ダウンサンプリング信号542bの16kHzにおける成分は反転信号の0Hzにあり得、ダウンサンプリング信号542bの0Hzにおける成分は反転信号の16kHzにあり得る、など。第2のスペクトル反転モジュール512はまた、約8kHzにカットオフ周波数を有するローパスフィルタ(図示せず)を含み得る。たとえば、ローパスフィルタは、反転信号の高周波成分をフィルタ除去して(たとえば、8kHzと16kHzとの間の反転信号の成分をフィルタ除去して)0Hzと8kHzとの間のバンド幅を占有する(ハイバンドを表す)結果信号544bを生成するように構成され得る。図7Bを参照すると、結果信号544bの特定の例示的で非限定的な例がグラフ(b)に関して示されている。結果信号544bは第3のサンプラー516に提供され得る。
[00128]第3のサンプラー516は、結果信号544bを2倍にダウンサンプリングして(たとえば、結果信号544bを1/2倍にアップサンプリングして)第1のハイバンド信号124のベースバンドバージョン126を生成するように構成され得る。結果信号544bを2でダウンサンプリングすると、結果信号544bのバンドが0Hzから16kHz(たとえば、32kHz*0.5=16kHz)に低減され得る。図7Bを参照すると、第1のハイバンド信号124のベースバンドバージョン126の特定の例示的で非限定的な例がグラフ(c)に関して示されている。第1のハイバンド信号124のベースバンドバージョン126(たとえば、8kHzバンド信号)は、16kHz(たとえば、第1のハイバンド信号124の8kHzベースバンドバージョン126のナイキストサンプリングレート)でサンプリングされ得、8kHzと16kHzとの間の周波数範囲を占有する入力オーディオ信号の成分のベースバンドバージョンに対応し得る。
[00129]0Hzから20kHzにわたる入力オーディオ信号も第3のスペクトル反転モジュール518に提供され得る。第3のスペクトル反転モジュール518は、約16kHzにカットオフ周波数を有するハイパスフィルタ(図示せず)を含み得る。たとえば、ハイパスフィルタは、入力オーディオ信号の低周波成分をフィルタ除去して(たとえば、0Hzと16kHzとの間の入力オーディオ信号の成分をフィルタ除去して)16kHzと20kHzとの間の周波数範囲を占有するフィルタ処理された入力オーディオ信号を生成するように構成され得る。第3のスペクトル反転モジュール518はまた、フィルタ処理された入力オーディオ信号のスペクトルを「反転」して結果信号546bを生成するように構成され得る。図7Bを参照すると、結果信号546の特定の例示的で非限定的な例がグラフ(d)に関して示されている。結果信号546bは第4のサンプラー520に提供され得る。
[00130]第4のサンプラー520は、結果信号546bを5でダウンサンプリングして(たとえば、結果信号546bを1/5倍にアップサンプリングして)8kHzのサンプルレートを有する第2のハイバンド信号125のベースバンドバージョン127を生成するように構成され得る。結果信号546bを5でダウンサンプリングすると、結果信号546bのバンドが0Hzから4kHz(たとえば、20kHz*0.2=4kHz)に低減され得る。図7Bを参照すると、第2のハイバンド信号125の特定の例示的で非限定的な例がグラフ(e)に関して示されている。第2のハイバンド信号125のベースバンドバージョン127(たとえば、4kHzバンド信号)は、8kHzのサンプルレート(たとえば、4kHzの第2のハイバンド信号125のナイキストサンプリングレート)を有し得、0Hzから20kHzにわたる入力オーディオ信号の16kHzと20kHzとの間の周波数範囲を占有する成分のベースバンドバージョンに対応し得る。
[00131]第2のモード(たとえば、マルチバンドモード)に従ってハイバンド信号124、125のベースバンドバージョン126、127を生成するように構成されたハイバンド生成回路106の第2の構成要素106bは、第1のモード(たとえば、シングルバンドモード)に従って動作することと比較して、極零フィルタ502およびダウンミキサ506に関連する複雑で計算コストが高い演算を低減し得ることを諒解されよう。
[00132]図8を参照すると、デュアルハイバンド励起を使用してオーディオ信号のハイバンド部分を再構成するように動作可能であるシステム800の特定の態様が示されている。システム800は、ハイバンド励振発生器802と、ハイバンド合成フィルタ804と、第1の調整器806と、第2の調整器808と、デュアルハイバンド信号生成器810とを含む。特定の態様では、システム800は、復号システムまたは装置に(たとえば、ワイヤレス電話またはコーデックに)組み込まれ得る。他の特定の態様では、システム800は、例示的で非限定的な例として、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、通信デバイス、PDA、固定ロケーションデータユニット、またはコンピュータに組み込まれ得る。いくつかの態様では、システム800の構成要素は、ハイバンドサイド情報172(たとえば、利得比)を決定するためにデコーダ動作を複製するように構成されたエンコーダのローカルデコーダ部分中に含まれ得る(たとえば、ハイバンド励振発生器802は図1のハイバンド励振発生器160に対応し得、ハイバンド合成フィルタ804は図1のLP合成モジュール166に対応し得る)。
[00133]ハイバンド励振発生器802は、ビットストリーム199中でローバンドビットストリーム142の一部として受信されるローバンド励振信号144に基づいて(たとえば、ビットストリーム199はモバイルデバイスの受信機を介して受信され得る)、第1のハイバンド励振信号862と第2のハイバンド励振信号864とを生成するように構成され得る。第1のハイバンド励振信号862は図1〜図2Bの第1のハイバンド励振信号162の再構成バージョンに対応し得、第2のハイバンド励振信号864は図1〜図2Bの第2のハイバンド励振信号164の再構成バージョンに対応し得る。たとえば、ハイバンド励振発生器802は、第1のハイバンド励振発生器896と、第2のハイバンド励振発生器898とを含み得る。第1のハイバンド励振発生器896は、図2Bの第1のハイバンド励振発生器280と実質的に同様の様式で動作し得、第2のハイバンド励振発生器898は、図2Bの第2のハイバンド励振発生器282と実質的に同様の様式で動作し得る。第1のハイバンド励振信号862は約0Hzと6.4kHzとの間のベースバンド周波数範囲を有し得、第2のハイバンド励振信号864は約0Hzと3.2kHzとの間のベースバンド周波数範囲を有し得る。ハイバンド励振信号862、864はハイバンド合成フィルタ804に提供され得る。
[00134]ハイバンド合成フィルタ804は、ハイバンド励振信号862、864およびハイバンドサイド情報172からのLPCに基づいて第1のベースバンド合成信号822と第2のベースバンド合成信号824とを生成するように構成され得る。たとえば、ハイバンドサイド情報172は、ビットストリーム199を介してハイバンド合成フィルタ804に提供され得る。第1のベースバンド合成信号822は入力オーディオ信号102の6.4kHz〜12.8kHz周波数バンドの成分を表し得、第2のベースバンド合成信号824は入力オーディオ信号102の12.8kHz〜16kHz周波数バンドの成分を表す。第1のベースバンド合成信号822は第1の調整器806に提供され得、第2のベースバンド合成信号824は第2の調整器808に提供され得る。
[00135]第1の調整器806は、第1のベースバンド合成信号822およびハイバンドサイド情報172からの利得調整パラメータに基づいて、第1の利得調整されたベースバンド合成信号832を生成するように構成され得る。第2の調整器808は、第2のベースバンド合成信号824およびハイバンドサイド情報172からの利得調整パラメータに基づいて、第2の利得調整されたベースバンド合成信号834を生成するように構成され得る。第1の利得調整されたベースバンド合成信号832は6.4kHzのベースバンドバンド幅を有し得、第2の利得調整されたベースバンド合成信号834は3.2kHzのベースバンドバンド幅を有し得る。利得調整されたベースバンド合成信号832、834はデュアルハイバンド信号生成器810に提供され得る。
[00136]デュアルハイバンド信号生成器810は、第1の利得調整されたベースバンド合成信号832の周波数スペクトルを第1の合成ハイバンド信号842中にシフトするように構成され得る。第1の合成ハイバンド信号842は、約6.4kHzから12.8kHzにわたる周波数バンドを有し得る。たとえば、第1の合成ハイバンド信号842は、6.4kHzから12.8kHzにわたる入力オーディオ信号102の再構成バージョンに対応し得る。デュアルハイバンド信号生成器810はまた、第2の利得調整されたベースバンド合成信号834の周波数スペクトルを第2の合成ハイバンド信号844中にシフトするように構成され得る。第2の合成ハイバンド信号844は、約12.8kHzから16kHzにわたる周波数範囲を有し得る。たとえば、第2の合成ハイバンド信号844は、12.8kHzから16kHzにわたる入力オーディオ信号102の再構成バージョンに対応し得る。デュアルハイバンド信号生成器810の動作について、図9に関してより詳細に説明する。
[00137]図9を参照すると、デュアルハイバンド信号生成器810の特定の態様が示されている。デュアルハイバンド信号生成器810は、第1の合成ハイバンド信号842を生成するように構成された第1の経路と、第2の合成ハイバンド信号844を生成するように構成された第2の経路とを含み得る。第1の経路および第2の経路は、合成ハイバンド信号842、844を生成することに関連する処理時間を減少させるために並列に動作し得る。代替的に、または追加として、1つまたは複数の構成要素は、サイズおよび/またはコストを低減するために直列またはパイプライン構成で共有され得る。
[00138]第1の経路は、第1のサンプラー902と、第1のスペクトル反転モジュール904と、第2のサンプラー906とを含む。第1の利得調整されたベースバンド合成信号832は第1のサンプラー902に提供され得る。図10を参照すると、第1の利得調整されたベースバンド合成信号832の特定の例示的で非限定的な例がグラフ(a)に関して示されている。第1の利得調整されたベースバンド合成信号832は6.4kHzのベースバンドバンド幅を有し得、第1の利得調整されたベースバンド合成信号832は12.8kHz(たとえば、ナイキストサンプリングレート)でサンプリングされ得る。図10に示された図は例示的であり、いくつかの特徴は明快のために強調されていることがある。図は必ずしも一定の尺度で描かれているとは限らない。
[00139]第1のサンプラー902は、アップサンプリング信号922を生成するために、第1の利得調整されたベースバンド合成信号832を2でアップサンプリングするように構成され得る。第1の利得調整されたベースバンド合成信号832を2でアップサンプリングすると、第1の利得調整されたベースバンド合成信号832のバンドが0Hzから12.8kHz(たとえば、6.4kHz*2=12.8kHz)に拡張され得る。図10を参照すると、アップサンプリング信号922の特定の例示的で非限定的な例がグラフ(b)に関して示されている。アップサンプリング信号922は25.6kHz(たとえば、ナイキストサンプリングレート)でサンプリングされ得る。アップサンプリング信号922は第1のスペクトル反転モジュール904に提供され得る。
[00140]第1のスペクトル反転モジュール904は、アップサンプリング信号922のスペクトルを「反転」して結果信号924を生成するように構成され得る。アップサンプリング信号922のスペクトルを反転すると、アップサンプリング信号922の成分が、0Hzから12.8kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、アップサンプリング信号922の0Hzにおける成分は結果信号924の12.8kHzにあり得る、など。図10を参照すると、結果信号924の特定の例示的で非限定的な例がグラフ(c)に関して示されている。結果信号924は第2のサンプラー906に提供され得る。
[00141]第2のサンプラー906は、結果信号924を5/4でアップサンプリングして第1の合成ハイバンド信号842を生成するように構成され得る。結果信号924を5/4でアップサンプリングすると、結果信号924のバンドが0Hz〜16kHz(たとえば、12.8kHz*(5/4)=16kHz)に増加され得、直交ミラーフィルタ(QMF)によって実施され得る。図10を参照すると、第1の合成ハイバンド信号842の特定の例示的で非限定的な例がグラフ(d)に関して示されている。第1の合成ハイバンド信号842は、32kHz(たとえば、ナイキストサンプリングレート)でサンプリングされ得、入力オーディオ信号の6.4kHz〜12.8kHz周波数バンドの再構成バージョンに対応し得る。
[00142]第2の経路は、第3のサンプラー908と、第2のスペクトル反転モジュール910とを含む。第2の利得調整されたベースバンド合成信号834は第3のサンプラー908に提供され得る。図10を参照すると、第2の利得調整されたベースバンド合成信号834の特定の例示的で非限定的な例がグラフ(e)に関して示されている。第2の利得調整されたベースバンド合成信号834は3.2kHzのベースバンドバンド幅を有し得、第2の利得調整されたベースバンド合成信号834は6.4kHz(たとえば、ナイキストサンプリングレート)でサンプリングされ得る。
[00143]第3のサンプラー908は、アップサンプリング信号926を生成するために、第2の利得調整されたベースバンド合成信号834を5でアップサンプリングするように構成され得る。第2の利得調整されたベースバンド合成信号834を5でアップサンプリングすると、第2の利得調整されたベースバンド合成信号834のバンドが0Hzから16kHz(たとえば、3.2kHz*5=16kHz)に拡張され得る。図10を参照すると、アップサンプリング信号926の特定の例示的で非限定的な例がグラフ(f)に関して示されている。アップサンプリング信号926は32kHz(たとえば、ナイキストサンプリングレート)でサンプリングされ得る。アップサンプリング信号926は第2のスペクトル反転モジュール910に提供され得る。
[00144]第2のスペクトル反転モジュール910は、アップサンプリング信号926のスペクトルを「反転」して第2の合成ハイバンド信号844を生成するように構成され得る。アップサンプリング信号926のスペクトルを反転すると、アップサンプリング信号926の成分が、0Hzから16kHzにわたるスペクトルの反対端に変化(たとえば、「反転」)し得る。たとえば、アップサンプリング信号922の0Hzにおける成分は第2の合成ハイバンド信号844の16kHzにあり得、アップサンプリング信号の3.2kHzにおける成分は第2の合成ハイバンド信号844の12.8kHzにあり得る、など。図10を参照すると、第2の合成ハイバンド信号844の特定の例示的で非限定的な例がグラフ(g)に関して示されている。第2の合成ハイバンド信号844は、32kHz(たとえば、ナイキストサンプリングレート)でサンプリングされ得、12.8kHz〜16kHzからわたる入力オーディオ信号の再構成バージョンに対応し得る。
[00145]デュアルハイバンド信号生成器810は、利得調整されたベースバンド合成信号832、834を合成ハイバンド信号842、844に変換することに関連する複雑で計算コストが高い演算を低減し得ることを諒解されよう。たとえば、デュアルハイバンド信号生成器810は、シングルバンド手法において使用されるダウンミキサに関連する複雑で計算コストが高い演算を低減し得る。さらに、デュアルハイバンド信号生成器810によって生成される合成ハイバンド信号842、844は、シングルバンドを使用して生成される合成ハイバンド信号の(たとえば、周波数範囲6.4kHz〜14.4kHz内の)バンド幅よりも入力オーディオ信号102の(たとえば、周波数範囲6.4kHz〜16kHz内の)より大きいバンド幅を表し得る。合成オーディオ信号の特定の例示的で非限定的な例が図10のグラフ(h)に関して示されている。
[00146]図11を参照すると、ベースバンド信号を生成するための方法1100の特定の態様のフローチャートが示されている。方法1100は、図1のシステム100、図1〜図2Bのハイバンド励振発生器160、図1および図5のハイバンド生成回路106、またはそれらの任意の組合せによって実施され得る。たとえば、第1の態様によれば、方法1100は、ハイバンド励振信号162、164を生成するためにハイバンド励振発生器160によって実施され得る。第2の態様によれば、方法1100は、ハイバンド信号124、125のベースバンドバージョン126、127を生成するためにハイバンド生成回路106によって実施され得る。
[00147]方法1100は、1102において、第1のサンプルレートでサンプリングされたオーディオ信号をボコーダにおいて受信することを含む。方法1100はまた、1104において、オーディオ信号のハイバンド部分の第1のサブバンドに対応する第1のベースバンド信号と、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号とを生成することを含む。
[00148]第1の態様によれば、オーディオ信号は、分析フィルタバンク110において受信される32kHzでサンプリングされた入力オーディオ信号であり得る。第1のベースバンド信号は第1のハイバンド励振信号であり、第2のベースバンド信号は第2のハイバンド励振信号である。たとえば、図1を参照すると、ハイバンド励振発生器160は、第1のハイバンド励振信号162(たとえば、第1のベースバンド信号)と、第2のハイバンド励振信号164(たとえば、第2のベースバンド信号)とを生成し得る。第1のハイバンド励振信号162は、第1のハイバンド信号124(たとえば、入力オーディオ信号102のハイバンド部分の第1のサブバンド)に対応する(たとえば、約0Hzと6.4kHzとの間の)ベースバンド周波数範囲を有し得る。たとえば、入力オーディオ信号102のハイバンド部分は、6.4kHzと16kHzとの間の周波数範囲を占有する入力オーディオ信号の成分に対応し得る。第1のハイバンド励振信号162のベースバンド周波数は、6.4kHzと12.8kHzとの間の周波数範囲を占有する入力オーディオ信号102のフィルタ処理された成分に対応し得る。第2のハイバンド励振信号164は、第2のハイバンド信号125(たとえば、入力オーディオ信号102のハイバンド部分の第2のサブバンド)に対応する(たとえば、約0Hzと3.2kHzとの間の)ベースバンド周波数範囲を有し得る。たとえば、第2のハイバンド励振信号164のベースバンド周波数は、12.8kHzと16kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分に対応し得る。
[00149]方法1100の第1の態様によれば、第1のベースバンド信号と第2のベースバンド信号とを生成することは、ボコーダのローバンドエンコーダによって生成されたローバンド励振信号をボコーダのハイバンドエンコーダにおいて受信することを含み得る。たとえば、図1を参照すると、ハイバンド分析モジュール150は、ローバンド分析モジュール130によって生成されたローバンド励振信号144を受信し得る。方法1100の第1の態様によれば、第1のベースバンド信号を生成することは、第1のアップサンプリングされた信号を生成するために第1のアップサンプリング比に従ってローバンド励振信号をアップサンプリングすることを含み得る。たとえば、図2Aを参照すると、第3のサンプラー214は、アップサンプリング信号252を生成するためにローバンド励振信号144を2の比でアップサンプリングし得る。方法1100の第1の態様によれば、第2のベースバンド信号を生成することは、第2のアップサンプリングされた信号を生成するために第2のアップサンプリング比に従ってローバンド励振信号をアップサンプリングすることを含み得る。たとえば、図2Aを参照すると、第1のサンプラー202は、アップサンプリング信号232を生成するためにローバンド励振信号144を2および1/2の比でアップサンプリングし得る。
[00150]第1の態様によれば、方法1100は、第1の高調波拡張された信号を生成するために、第1のアップサンプリングされた信号に対して非線形変換演算を実施することを含み得る。たとえば、図2Aを参照すると、第2の非線形変換生成器218は、高調波拡張された信号254を生成するために、アップサンプリング信号252に対して非線形変換演算を実施し得る。第1の態様によれば、方法1100は、第1のバンド幅拡張された信号を生成するために、第1の高調波拡張された信号に対してスペクトル反転演算を実施することを含み得る。たとえば、図2Aを参照すると、第2のスペクトル反転モジュール220は、信号256(たとえば、第1のバンド幅拡張された信号)を生成するためにスペクトル反転演算を実施し得る。第4のサンプラー222は、第1のハイバンド励振信号162を生成するために、第1のバンド幅拡張された信号256をダウンサンプリングし得る。
[00151]第1の態様によれば、方法1100は、第2の高調波拡張された信号を生成するために、第2のアップサンプリングされた信号に対して非線形変換演算を実施することを含み得る。たとえば、図2Aを参照すると、第1の非線形変換生成器204は、高調波拡張された信号234を生成するために、アップサンプリング信号232に対して非線形変換演算を実施し得る。第1の態様によれば、方法1100は、第1のバンド幅拡張された信号を生成するために、第1の高調波拡張された信号に対してスペクトル反転演算を実施することを含み得る。たとえば、図2Aを参照すると、第3のスペクトル反転モジュール224は、信号258(たとえば、第2のバンド幅拡張された信号)を生成するためにスペクトル反転演算を実施し得る。第5のサンプラー226は、第2のハイバンド励振信号164を生成するために、第2のバンド幅拡張された信号256をダウンサンプリングし得る。
[00152]図11の方法1100は、第1の態様によれば、シングルバンド動作モードに従って極零フィルタ206およびダウンミキサ210に関連する複雑で計算コストが高い演算を低減し得る。さらに、方法1100は、シングルバンドモードに従って生成されたハイバンド励振信号242によって表されるバンド幅(たとえば、6.4kHz〜14.4kHzの周波数範囲)よりも入力オーディオ信号102のより大きいバンド幅(たとえば、6.4kHz〜16kHzの周波数範囲)を集合的に表す、ハイバンド励振信号162、164を生成し得る。
[00153]第2の態様によれば、オーディオ信号は入力オーディオ信号102であり、第1のベースバンド信号は図1の第1のハイバンド信号124のベースバンドバージョン126であり、第2のベースバンド信号は図1の第2のハイバンド信号125のベースバンドバージョン127である。第1のハイバンド信号124のベースバンドバージョン126は、第1のハイバンド信号124(たとえば、入力オーディオ信号102のハイバンド部分の第1のサブバンド)に対応する(たとえば、約0Hzと6.4kHzとの間の)ベースバンド周波数範囲を有し得る。たとえば、入力オーディオ信号102のハイバンド部分は、6.4kHzと16kHzとの間の周波数範囲を占有する入力オーディオ信号の成分に対応し得る。第1のハイバンド信号124のベースバンドバージョン126は、6.4kHzと12.8kHzとの間の周波数範囲を占有する入力オーディオ信号102の成分に対応し得る。第2のハイバンド信号125のベースバンドバージョン127は、第2のハイバンド信号125(たとえば、入力オーディオ信号102のハイバンド部分の第2のサブバンド)に対応する(たとえば、約0Hzと3.2kHzとの間の)ベースバンド周波数範囲を有し得る。たとえば、第2のハイバンド信号125のベースバンドバージョン127は、12.8kHzと16kHzとの間のバンド幅を占有する入力オーディオ信号102の成分に対応し得る。
[00154]方法1100の第2の態様によれば、第1のベースバンド信号を生成することは、第1のダウンサンプリングされた信号を生成するためにオーディオ信号をダウンサンプリングすることを含み得る。たとえば、図5を参照すると、第2のサンプラー510は、ダウンサンプリング信号542を生成するために入力オーディオ信号102を5/4でダウンサンプリングし得る(たとえば、入力オーディオ信号102を4/5でアップサンプリングし得る)。第1の結果信号を生成するために、第1のダウンサンプリングされた信号に対してスペクトル反転演算が実施され得る。たとえば、図5を参照すると、第2のスペクトル反転モジュール512は、結果信号544を生成するために、ダウンサンプリングされた信号542に対してスペクトル反転演算を実施し得る。第1の結果信号は、第1のベースバンド信号を生成するためにダウンサンプリングされ得る。たとえば、図5を参照すると、第3のサンプラー516は、第1のハイバンド信号124のベースバンドバージョン126(たとえば、第1のベースバンド信号)を生成するために結果信号544を2でダウンサンプリングし得る(たとえば、結果信号544を1/2倍にアップサンプリングし得る)。
[00155]方法1100の第2の態様によれば、第2のベースバンド信号を生成することは、第2の結果信号を生成するためにオーディオ信号に対してスペクトル反転演算を実施することを含み得る。たとえば、図5を参照すると、第3のスペクトル反転モジュール518は、結果信号546を生成するために入力オーディオ信号102に対してスペクトル反転演算を実施し得る。第2の結果信号は、第2のベースバンド信号を生成するためにダウンサンプリングされ得る。たとえば、図5を参照すると、第4のサンプラー520は、第2のハイバンド信号125のベースバンドバージョン127(たとえば、第2のベースバンド信号)を生成するために結果信号546を5でダウンサンプリングし得る(たとえば、結果信号546を1/5倍にアップサンプリングし得る)。
[00156]図11の方法1100は、第2の態様によれば、シングルバンド動作モードに従って極零フィルタ502およびダウンミキサ506に関連する複雑で計算コストが高い演算を低減し得る。さらに、方法1100は、シングルバンドモードに従って生成されたハイバンド信号540のベースバンドバージョンによって表されるバンド幅(たとえば、6.4kHz〜14.4kHzの周波数範囲)よりも入力オーディオ信号102のより大きいバンド幅(たとえば、6.4kHz〜16kHzの周波数範囲)を集合的に表す、ハイバンド信号124、125のベースバンドバージョン126、127を生成し得る。
[00157]図12を参照すると、信号再構成のために複数バンド非線形励起を使用する方法1200の特定の態様が示されている。方法1200は、図8のシステム800、図8〜図10のデュアルハイバンド信号生成器810、またはそれらの任意の組合せによって実施され得る。
[00158]方法1200は、1202において、エンコーダからの符号化オーディオ信号をデコーダにおいて受信することを含み、ここで、符号化オーディオ信号はローバンド励振信号を備える。たとえば、図8を参照すると、ハイバンド励振発生器802は、符号化オーディオ信号の一部としてローバンド励振信号144を受信し得る。
[00159]1204において、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第1のサブバンドを再構成し得る。たとえば、図8〜図9を参照すると、デュアルハイバンド信号生成器810は、ローバンド励振信号144から導出された1つまたは複数の合成信号(たとえば、第1の利得調整されたベースバンド合成信号832)に基づいて第1の合成ハイバンド信号842を生成し得る。
[00160]1206において、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第2のサブバンドを再構成し得る。たとえば、図8〜図9を参照すると、デュアルハイバンド信号生成器810は、ローバンド励振信号144から導出された1つまたは複数の合成信号(たとえば、第2の利得調整されたベースバンド合成信号834)に基づいて第2の合成ハイバンド信号844を生成し得る。
[00161]図12の方法1200は、シングルバンド手法において使用されるダウンミキサに関連する複雑で計算コストが高い演算を低減し得る。さらに、デュアルハイバンド信号生成器810によって生成される合成ハイバンド信号842、844は、シングルバンドを使用して生成される合成ハイバンド信号のバンド幅よりも入力オーディオ信号102のより大きいバンド幅(たとえば、6.4kHz〜16kHzの周波数範囲)を表し得る。
[00162]図13を参照すると、ベースバンド信号を生成するための方法1300、1320の他の特定の態様のフローチャートが示されている。第1の方法1300は、図1のシステム100、図1〜図2Bのハイバンド励振発生器160、図1および図5のハイバンド生成回路106、またはそれらの任意の組合せによって実施され得る。同様に、第2の方法1320は、図1のシステム100、図1〜図2Bのハイバンド励振発生器160、図1および図5のハイバンド生成回路106、またはそれらの任意の組合せによって実施され得る。
[00163]第1の方法1300は、1302において、ローバンド部分とハイバンド部分とを有するオーディオ信号をボコーダにおいて受信することを含む。たとえば、図1を参照すると、分析フィルタバンド110は入力オーディオ信号102を受信し得る。入力オーディオ信号102は、約0Hzから16kHzにわたるSWB信号、または約0Hzから20kHzにわたるFB信号であり得る。SWB信号のローバンド部分は0Hzから6.4kHzにわたり得、SWB信号のハイバンド部分は6.4kHzから16kHzにわたり得る。FB信号のローバンド部分は0Hzから8kHzにわたり得、FB信号のハイバンド部分は8kHzから20kHzにわたり得る。
[00164]1304において、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成し得る。たとえば、図1を参照すると、ローバンド励振信号144は、ローバンド分析モジュール130(たとえば、ボコーダのローバンドエンコーダ)によって生成され得る。SWB符号化では、ローバンド励振信号144は約0Hzから6.4kHzにわたり得る。FB符号化では、ローバンド励振信号144は約0Hzから8kHzにわたり得る。
[00165]1306において、ローバンド励振信号をアップサンプリングすることに基づいて、第1のベースバンド信号(たとえば、第1のハイバンド励振信号)を生成し得る。第1のベースバンド信号はオーディオ信号のハイバンド部分の第1のサブバンドに対し得る。たとえば、図2Bを参照すると、第1のハイバンド励振発生器280は、ローバンド励振信号144をアップサンプリングすることによって第1のハイバンド励振信号162を生成し得る。
[00166]1308において、第1のベースバンド信号に基づいて第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成され得る。第2のベースバンド信号はオーディオ信号のハイバンド部分の第2のサブバンドに対し得る。たとえば、図2Bを参照すると、第2のハイバンド励振発生器282は、第2のハイバンド励振信号164を生成するために第1のハイバンド励振信号162を使用して白色雑音を変調し得る。
[00167]第2の方法1320は、1322において、第1のサンプルレートでサンプリングされたオーディオ信号をボコーダにおいて受信することを含む。たとえば、図1を参照すると、分析フィルタバンド110は入力オーディオ信号102を受信し得る。入力オーディオ信号102は、約0Hzから16kHzにわたるSWB信号、または約0Hzから20kHzにわたるFB信号であり得る。SWB信号のローバンド部分は0Hzから6.4kHzにわたり得、SWB信号のハイバンド部分は6.4kHzから16kHzにわたり得る。FB信号のローバンド部分は0Hzから8kHzにわたり得、FB信号のハイバンド部分は8kHzから20kHzにわたり得る。
[00168]1324において、ボコーダのローバンドエンコーダにおいて、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成し得る。たとえば、図1を参照すると、ローバンド励振信号144は、ローバンド分析モジュール130(たとえば、ボコーダのローバンドエンコーダ)によって生成され得る。SWB符号化では、ローバンド励振信号144は約0Hzから6.4kHzにわたり得る。FB符号化では、ローバンド励振信号144は約0Hzから8kHzにわたり得る。
[00169]1326において、ボコーダのハイバンドエンコーダにおいて第1のベースバンド信号を生成し得る。第1のベースバンド信号を生成することは、ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み得る。たとえば、図2Aを参照すると、第2のスペクトル反転モジュール220は、第2の高調波拡張された信号254(たとえば、第2の方法1320によるローバンド励振信号の非線形変換されたバージョン)に対してスペクトル反転演算を実施し得る。ローバンド励振信号144の非線形変換されたバージョンは、第1のアップサンプリング信号252を生成するために第1のアップサンプリング比に従ってローバンド励振信号144を第3のサンプラー214においてアップサンプリングすることによって生成され得る。第2の非線形変換生成器218は、ローバンド励振信号の非線形変換されたバージョンを生成するために第1のアップサンプリング信号252に対して非線形変換演算を実施し得る。第4のサンプラー222は、第1のベースバンド信号(たとえば、第1のハイバンド励振信号162)を生成するために、ローバンド励振信号の非線形変換されたバージョンのスペクトル反転されたバージョンをダウンサンプリングし得る。
[00170]1328において、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成し得る。たとえば、図2Bを参照すると、第2のハイバンド励振発生器282は、第2のベースバンド信号(たとえば、第2のハイバンド励振信号164)を生成するために第1のハイバンド励振信号162を使用して白色雑音を変調し得る。
[00171]図13の方法1300、1320は、第2の態様によれば、シングルバンド動作モードに従って極零フィルタおよびダウンミキサに関連する複雑で計算コストが高い演算を低減し得る。
[00172]特定の態様では、図11〜図13の方法1100、1200、1300、1320は、中央処理ユニット(CPU)、DSP、またはコントローラなどの処理ユニットのハードウェア(たとえば、FPGAデバイス、ASICなど)を介して、ファームウェアデバイスを介して、またはそれらの任意の組合せで実装され得る。一例として、図11〜図13の方法1100、1200、1300、1320は、図14に関して説明するように、命令を実行するプロセッサによって実施され得る。
[00173]図14を参照すると、デバイスの特定の例示的な態様のブロック図が示されており、全体的に1400と呼ばれる。
[00174]特定の態様では、デバイス1400はプロセッサ1406(たとえば、CPU)を含む。デバイス1400は、1つまたは複数の追加のプロセッサ1410(たとえば、1つまたは複数のDSP)を含み得る。プロセッサ1410はスピーチおよび音楽コーデック1408を含み得る。スピーチおよび音楽コーデック1408は、ボコーダエンコーダ1492、ボコーダデコーダ1494、または両方を含み得る。
[00175]特定の態様では、ボコーダエンコーダ1492は複数バンド符号化システム1482得、ボコーダデコーダ1494は複数バンド復号システム1484を含み得る。特定の態様では、複数バンド符号化システム1482は、図1のシステム100の1つもしくは複数の構成要素、図1〜図2Bのハイバンド励振発生器160、ならびに/または図1および図5のハイバンド生成回路106を含む。たとえば、複数バンド符号化システム1482は、図1のシステム100と、図1〜図2Bのハイバンド励振発生器160と、図1および図5のハイバンド生成回路106と、図11および図13の方法1100、1300、1320とに関連する符号化演算を実施し得る。特定の態様では、複数バンド復号システム1484は、図8のシステム800の1つもしくは複数の構成要素および/または図8〜図9のデュアルハイバンド信号生成器810を含み得る。たとえば、複数バンド復号システム1484は、図8のシステム800と、図8〜図9のデュアルハイバンド信号生成器810と、図12の方法1200とに関連する復号動作を実施し得る。複数バンド符号化システム1482および/または複数バンド復号システム1484は、専用ハードウェア(たとえば、回路)を介して、1つもしくは複数のタスクを実施するための命令を実行するプロセッサによって、またはそれらの組合せで実装され得る。
[00176]デバイス1400は、メモリ1432と、アンテナ1442に結合されたワイヤレスコントローラ1440とを含み得る。デバイス1400は、ディスプレイコントローラ1426に結合されたディスプレイ1428を含み得る。スピーカー1436、マイクロフォン1438、または両方がコーデック1434に結合され得る。コーデック1434は、デジタルアナログ変換器(DAC)1402と、アナログデジタル変換器(ADC)1404とを含み得る。
[00177]特定の態様では、コーデック1434は、マイクロフォン1438からアナログ信号を受信し、アナログデジタル変換器1404を使用してアナログ信号をデジタル信号に変換し、デジタル信号をパルスコード変調(PCM)フォーマットなどでスピーチおよび音楽コーデック1408に提供し得る。スピーチおよび音楽コーデック1408はデジタル信号を処理し得る。特定の態様では、スピーチおよび音楽コーデック1408はデジタル信号をコーデック1434に提供し得る。コーデック1434は、デジタルアナログ変換器1402を使用してデジタル信号をアナログ信号に変換し得、アナログ信号をスピーカー1436に提供し得る。
[00178]メモリ1432は、図11〜図13の方法のうちの1つまたは複数など、本明細書で開示する方法およびプロセスを実施するために、プロセッサ1406、プロセッサ1410、コーデック1434、デバイス1400の別の処理ユニット、またはそれらの組合せによって実行可能な命令1460を含み得る。図1、図2A、図2B、図5、図8、および図9のシステムの1つまたは複数の構成要素は、専用ハードウェア(たとえば回路)を介して、1つもしくは複数のタスクを実施するための命令(たとえば、命令1460)を実行するプロセッサによって、またはそれらの組合せで実装され得る。一例として、メモリ1432、またはプロセッサ1406、プロセッサ1410、および/もしくはコーデック1434の1つもしくは複数の構成要素は、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファーMRAM(STT−MRAM)、フラッシュメモリ、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能プログラマブル読取り専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取り専用メモリ(CD−ROM)などのメモリデバイスであり得る。メモリデバイスは、コンピュータ(たとえば、コーデック1434中のプロセッサ、プロセッサ1406、および/またはプロセッサ1410)によって実行されたとき、図11〜図13の方法のうちの1つまたは複数の少なくとも一部をコンピュータに実施させ得る命令(たとえば、命令1460)を含み得る。一例として、メモリ1432、またはプロセッサ1406、プロセッサ1410、および/もしくはコーデック1434の1つもしくは複数の構成要素は、コンピュータ(たとえば、コーデック1434中のプロセッサ、プロセッサ1406、および/またはプロセッサ1410)によって実行されたとき、コンピュータを生起させ、方法図11〜図13のうちの1つまたは複数の少なくとも一部を実施する命令(たとえば、命令1460)を含む非一時的コンピュータ可読媒体であり得る。
[00179]特定の態様では、デバイス1400は、移動局モデム(MSM)など、システムインパッケージまたはシステムオンチップデバイス1422中に含まれ得る。特定の態様では、プロセッサ1406、プロセッサ1410、ディスプレイコントローラ1426、メモリ1432、コーデック1434、およびワイヤレスコントローラ1440は、システムインパッケージまたはシステムオンチップデバイス1422中に含まれる。特定の態様では、タッチスクリーンおよび/またはキーパッドなどの入力デバイス1430、ならびに電源1444がシステムオンチップデバイス1422に結合される。さらに、特定の態様では、図14に示されているように、ディスプレイ1428、入力デバイス1430、スピーカー1436、マイクロフォン1438、アンテナ1442、および電源1444は、システムオンチップデバイス1422の外部にある。しかしながら、ディスプレイ1428、入力デバイス1430、スピーカー1448、マイクロフォン1446、アンテナ1442、および電源1444の各々は、インターフェースまたはコントローラなど、システムオンチップデバイス1422の構成要素に結合され得る。例示的な例では、デバイス1400は、モバイル通信デバイス、スマートフォン、セルラーフォン、ラップトップコンピュータ、コンピュータ、タブレットコンピュータ、携帯情報端末、ディスプレイデバイス、テレビジョン、ゲーミングコンソール、音楽プレーヤ、ラジオ、デジタルビデオプレーヤ、光ディスクプレーヤ、チューナー、カメラ、ナビゲーションデバイス、デコーダシステム、エンコーダシステム、またはそれらの任意の組合せに対応する。
[00180]説明する態様とともに、第1のサンプルレートでサンプリングされたオーディオ信号を受信するための手段を含む第1の装置が開示される。たとえば、オーディオ信号を受信するための手段は、図1の分析フィルタバンク110、図1および図5のハイバンド生成回路106、図14のプロセッサ1410、オーディオ信号を受信するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00181]第1の装置はまた、オーディオ信号のハイバンド部分の第1のサブバンドに対応する第1のベースバンド信号と、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号とを生成するための手段を含み得る。たとえば、第1のベースバンド信号と第2のベースバンド信号とを生成するための手段は、図1および図5のハイバンド生成回路106、図1〜図2Bのハイバンド励振発生器160、図14のプロセッサ1410、第1のベースバンド信号と第2のベースバンド信号とを生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00182]説明する態様とともに、エンコーダから符号化オーディオ信号を受信するための手段を含む第2の装置が開示される。符号化オーディオ信号はローバンド励振信号を備える。たとえば、符号化オーディオ信号を受信するための手段は、図8のハイバンド励振発生器802、図8のハイバンド合成フィルタ804、図8の第1の調整器806、図8の第2の調整器808、図14のプロセッサ1410、符号化オーディオ信号を受信するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00183]第2の装置はまた、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第1のサブバンドを再構成するための手段を含み得る。たとえば、第1のサブバンドを再構成するための手段は、図8のハイバンド励振発生器802、図8のハイバンド合成フィルタ804、図8の第1の調整器806、図8〜図9のデュアルハイバンド信号生成器810、図14のプロセッサ1410、第1のサブバンドを再構成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00184]第2の装置はまた、ローバンド励振信号に基づいて符号化オーディオ信号からオーディオ信号のハイバンド部分の第2のサブバンドを再構成するための手段を含み得る。たとえば、第2のサブバンドを再構成するための手段は、図8のハイバンド励振発生器802、図8のハイバンド合成フィルタ804、図8の第2の調整器808、図8〜図9のデュアルハイバンド信号生成器810、図14のプロセッサ1410、第2のサブバンドを再構成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00185]説明する態様とともに、ローバンド部分とハイバンド部分とを有するオーディオ信号を受信するための手段を含む第3の装置が開示される。たとえば、オーディオ信号を受信するための手段は、図1の分析フィルタバンク110、図1および図5のハイバンド生成回路106、図14のプロセッサ1410、オーディオ信号を受信するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00186]第3の装置はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成するための手段を含み得る。たとえば、ローバンド励振信号を生成するための手段は、図1のローバンド分析モジュール130、図14のプロセッサ1410、ローバンド励振信号を生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00187]第3の装置は、ローバンド励振信号をアップサンプリングすることに基づいてベースバンド信号(たとえば、第1のハイバンド励振信号)を生成するための手段をさらに含み得る。第1のベースバンド信号はオーディオ信号のハイバンド部分の第1のサブバンドに対し得る。たとえば、ベースバンド信号を生成するための手段は、図1および図5のハイバンド生成回路106、図1〜図2Bのハイバンド励振発生器160、図2Aの第3のサンプラー214、図2Aの第2の非線形変換生成器218、図2Aの第2のスペクトル反転モジュール220、図2Aの第4のサンプラー222、図2Bの第1のハイバンド励振発生器280、図14のプロセッサ1410、第1のベースバンド信号を生成するように構成された1つもしくは複数のデバイス(たとえば、たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00188]第3の装置はまた、第1のベースバンド信号に基づいて第2のベースバンド信号(たとえば、第2のハイバンド励振信号)を生成するための手段を含み得る。第2のベースバンド信号はオーディオ信号のハイバンド部分の第2のサブバンドに対し得る。たとえば、第2のベースバンド信号を生成するための手段は、図1および図5のハイバンド生成回路106、図1〜図2Bのハイバンド励振発生器160、図2Bの第2のハイバンド励振発生器282、図14のプロセッサ1410、第2のベースバンド信号を生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00189]説明する態様とともに、第1のサンプルレートでサンプリングされたオーディオ信号を受信するための手段を含む第4の装置が開示される。たとえば、オーディオ信号を受信するための手段は、図1の分析フィルタバンク110、図1および図5のハイバンド生成回路106、図14のプロセッサ1410、オーディオ信号を受信するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00190]第4の装置はまた、オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成するための手段を含み得る。たとえば、ローバンド励振信号を生成するための手段は、図1のローバンド分析モジュール130、図14のプロセッサ1410、ローバンド励振信号を生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00191]第4の装置はまた、第1のベースバンド信号を生成するための手段を含み得る。第1のベースバンド信号を生成することは、ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み得る。第1のベースバンド信号はオーディオ信号のハイバンド部分の第1のサブバンドに対応し得る。たとえば、第1のベースバンド信号を生成するための手段は、図2Aの第3のサンプラー214、図2Aの非線形変換生成器218、図2Aの第2のスペクトル反転モジュール220、図2Aの第4のサンプラー222、図2Bの第1のハイバンド励振発生器280、図1〜図2Bのハイバンド励振発生器160、図14のプロセッサ1410、スペクトル反転演算を実施するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00192]第4の装置はまた、オーディオ信号のハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成するための手段を含む。第1のサブバンドは、第2のサブバンドとは別個であり得る。たとえば、第2のベースバンド信号を生成するための手段は、図1および図5のハイバンド生成回路106、図1〜図2Bのハイバンド励振発生器160、図2Bの第2のハイバンド励振発生器282、図14のプロセッサ1410、第2のベースバンド信号を生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含み得る。
[00193]さらに、本明細書で開示する態様に関して説明した様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、ハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両方の組合せとして実装され得ることを、当業者は諒解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップについて、上記では概してそれらの機能に関して説明した。そのような機能がハードウェアとして実装されるか、または実行可能ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[00194]本明細書で開示する態様に関して説明した方法またはアルゴリズムのステップは、直接ハードウェアで実施され得るか、プロセッサによって実行されるソフトウェアモジュールで実施され得るか、またはその2つの組合せで実施され得る。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファーMRAM(STT−MRAM)、フラッシュメモリ、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能プログラマブル読取り専用メモリ(EEPROM)、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取り専用メモリ(CD−ROM)などのメモリデバイス中に存在し得る。例示的なメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、メモリデバイスに情報を書き込むことができるように、プロセッサに結合される。代替として、メモリデバイスはプロセッサに一体化され得る。プロセッサおよび記憶媒体はASIC中に存在し得る。ASICはコンピューティングデバイスまたはユーザ端末中に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として存在し得る。
[00195]開示する態様の以上の説明は、開示する態様を当業者が製作または使用することを可能にするために提供される。これらの態様への様々な修正は当業者には容易に明らかになり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の態様に適用され得る。したがって、本開示は、本明細書に示された態様に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴に一致する可能な最も広い範囲を与えられるべきである。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
第1のサンプルレートでサンプリングされたオーディオ信号をボコーダにおいて受信することと、
前記オーディオ信号のローバンド部分に基づいてローバンド励振信号を前記ボコーダのローバンドエンコーダにおいて生成することと、
前記ボコーダのハイバンドエンコーダにおいて第1のベースバンド信号を生成することと、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記オーディオ信号のハイバンド部分の第1のサブバンドに対応する、
前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することと、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個である、を備える方法。
[C2]
前記第2のベースバンド信号が、前記第1のベースバンド信号に基づいて生成される、C1に記載の方法。
[C3]
前記第2のベースバンド信号を生成することが、前記第1のベースバンド信号を使用して白色雑音を変調することを備える、C2に記載の方法。
[C4]
前記ローバンド励振信号の前記非線形変換されたバージョンを生成することが、
第1のアップサンプリングされた信号を生成するために第1のアップサンプリング比に従って前記ローバンド励振信号を前記ボコーダの前記ハイバンドエンコーダにおいてアップサンプリングすることと、
前記ローバンド励振信号の前記非線形変換されたバージョンを生成するために、前記第1のアップサンプリングされた信号に対して非線形変換演算を実施することとを備える、C1に記載の方法。
[C5]
前記第1のベースバンド信号を生成するために、前記ローバンド励振信号の前記非線形変換されたバージョンのスペクトル反転されたバージョンをダウンサンプリングすることをさらに備える、C4に記載の方法。
[C6]
前記オーディオ信号の前記ハイバンド部分が、スーパーワイドバンドコーディング方式による約6.4キロヘルツ(kHz)から約16kHzにわたる周波数バンドに対応する、C1に記載の方法。
[C7]
前記第1のサブバンドが約6.4kHzから約12.8kHzにわたり、前記第2のサブバンドが約12.8kHzから約16kHzにわたる、C6に記載の方法。
[C8]
前記オーディオ信号の前記ハイバンド部分が、フルバンドコーディング方式による約8キロヘルツ(kHz)から約20kHzにわたる周波数バンドに対応する、C1に記載の方法。
[C9]
前記第1のサブバンドが約8kHzから約16kHzにわたり、前記第2のサブバンドが約16kHzから約20kHzにわたる、C8に記載の方法。
[C10]
前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、C1に記載の方法。
[C11]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、C10に記載の方法。
[C12]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、C10に記載の方法。
[C13]
第1のサンプルレートでサンプリングされたオーディオ信号を受信することと、
前記オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成することと
を行うように構成されたボコーダのローバンドエンコーダと、
第1のベースバンド信号を生成することと、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記オーディオ信号のハイバンド部分の第1のサブバンドに対応する、
前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することと、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個である、
を行うように構成された前記ボコーダのハイバンドエンコーダとを備える装置。
[C14]
前記第2のベースバンド信号が、前記第1のベースバンド信号に基づいて生成される、C13に記載の装置。
[C15]
前記第2のベースバンド信号を生成することが、前記第1のベースバンド信号を使用して白色雑音を変調することを備える、C14に記載の装置。
[C16]
前記ハイバンドエンコーダが、
第1のアップサンプリングされた信号を生成するために第1のアップサンプリング比に従って前記ローバンド励振信号をアップサンプリングすることと、
前記ローバンド励振信号の前記非線形変換されたバージョンを生成するために、前記第1のアップサンプリングされた信号に対して非線形変換演算を実施することとを行うようにさらに構成された、C13に記載の装置。
[C17]
前記ハイバンドエンコーダが、前記第1のベースバンド信号を生成するために、前記ローバンド励振信号の前記非線形変換されたバージョンのスペクトル反転されたバージョンをダウンサンプリングするようにさらに構成された、C16に記載の装置。
[C18]
前記オーディオ信号の前記ハイバンド部分が、スーパーワイドバンドコーディング方式による約6.4キロヘルツ(kHz)から約16kHzにわたる周波数バンドに対応する、C13に記載の装置。
[C19]
前記第1のサブバンドが約6.4kHzから約12.8kHzにわたり、前記第2のサブバンドが約12.8kHzから約16kHzにわたる、C18に記載の装置。
[C20]
前記オーディオ信号の前記ハイバンド部分が、フルバンドコーディング方式による約8キロヘルツ(kHz)から約20kHzにわたる周波数バンドに対応する、C13に記載の装置。
[C21]
前記第1のサブバンドが約8kHzから約16kHzにわたり、前記第2のサブバンドが約16kHzから約20kHzにわたる、C20に記載の装置。
[C22]
前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、C13に記載の装置。
[C23]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、C22に記載の装置。
[C24]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、C22に記載の装置。
[C25]
ボコーダ内のプロセッサによって実行されたとき、
第1のサンプルレートでサンプリングされたオーディオ信号を受信することと、
前記オーディオ信号のローバンド部分に基づいてローバンド励振信号を前記ボコーダのローバンドエンコーダにおいて生成することと、
前記ボコーダのハイバンドエンコーダにおいて第1のベースバンド信号を生成することと、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記オーディオ信号のハイバンド部分の第1のサブバンドに対応する、
前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することと、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個である、を備える動作を前記プロセッサに実施させる命令を備える非一時的コンピュータ可読媒体。
[C26]
前記第2のベースバンド信号が、前記第1のベースバンド信号に基づいて生成される、C25に記載の非一時的コンピュータ可読媒体。
[C27]
前記第2のベースバンド信号を生成することが、前記第1のベースバンド信号を使用して白色雑音を変調することを備える、C26に記載の非一時的コンピュータ可読媒体。
[C28]
前記動作が、
第1のアップサンプリングされた信号を生成するために第1のアップサンプリング比に従って前記ローバンド励振信号を前記ボコーダの前記ハイバンドエンコーダにおいてアップサンプリングすることと、
前記ローバンド励振信号の前記非線形変換されたバージョンを生成するために、前記第1のアップサンプリングされた信号に対して非線形変換演算を実施することとをさらに備える、C25に記載の非一時的コンピュータ可読媒体。
[C29]
前記動作が、前記第1のベースバンド信号を生成するために、前記ローバンド励振信号の前記非線形変換されたバージョンのスペクトル反転されたバージョンをダウンサンプリングすることをさらに備える、C28に記載の非一時的コンピュータ可読媒体。
[C30]
前記オーディオ信号の前記ハイバンド部分が、スーパーワイドバンドコーディング方式による約6.4キロヘルツ(kHz)から約16kHzにわたる周波数バンドに対応する、C25に記載の非一時的コンピュータ可読媒体。
[C31]
前記第1のサブバンドが約6.4kHzから約12.8kHzにわたり、前記第2のサブバンドが約12.8kHzから約16kHzにわたる、C30に記載の非一時的コンピュータ可読媒体。
[C32]
前記オーディオ信号の前記ハイバンド部分が、フルバンドコーディング方式による約8キロヘルツ(kHz)から約20kHzにわたる周波数バンドに対応する、C25に記載の非一時的コンピュータ可読媒体。
[C33]
前記第1のサブバンドが約8kHzから約16kHzにわたり、前記第2のサブバンドが約16kHzから約20kHzにわたる、C32に記載の非一時的コンピュータ可読媒体。
[C34]
前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、C25に記載の非一時的コンピュータ可読媒体。
[C35]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、C34に記載の非一時的コンピュータ可読媒体。
[C36]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、C34に記載の非一時的コンピュータ可読媒体。
[C37]
第1のサンプルレートでサンプリングされたオーディオ信号を受信するための手段と、
前記オーディオ信号のローバンド部分に基づいてローバンド励振信号を生成するための手段と、
第1のベースバンド信号を生成するための手段と、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記オーディオ信号のハイバンド部分の第1のサブバンドに対応する、
前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成するための手段と、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個である、を備える装置。
[C38]
前記オーディオ信号の前記ハイバンド部分が、スーパーワイドバンドコーディング方式による約6.4キロヘルツ(kHz)から約16kHzにわたる周波数バンドに対応する、C37に記載の装置。
[C39]
前記第1のサブバンドが約6.4kHzから約12.8kHzにわたり、前記第2のサブバンドが約12.8kHzから約16kHzにわたる、C38に記載の装置。
[C40]
前記オーディオ信号の前記ハイバンド部分が、フルバンドコーディング方式による約8キロヘルツ(kHz)から約20kHzにわたる周波数バンドに対応する、C37に記載の装置。
[C41]
前記第1のサブバンドが約8kHzから約16kHzにわたり、前記第2のサブバンドが約16kHzから約20kHzにわたる、C40に記載の装置。
[C42]
前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、C37に記載の装置。
[C43]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、C42に記載の装置。
[C44]
前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、C42に記載の装置。

Claims (34)

  1. 第2のデバイスからビットストリームを第1のデバイスにおいて受信することと、
    前記ビットストリームからローバンド励振信号を前記第1のデバイスのデコーダにおいて生成することと、
    前記デコーダのハイバンド励振発生器において第1のベースバンド信号を生成することと、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記第2のデバイスにおいて受信されたオーディオ信号のハイバンド部分の第1のサブバンドに対応する、
    前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することと、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個である、
    前記第1のベースバンド信号および前記第2のベースバンド信号に少なくとも部分的に基づいて前記オーディオ信号の少なくとも部分的に再構成されたバージョンを出力することと
    を備える方法。
  2. 前記第2のベースバンド信号が、前記第1のベースバンド信号に基づいて生成される、請求項1に記載の方法。
  3. 前記第2のベースバンド信号を生成することが、前記第1のベースバンド信号を使用して白色雑音を変調することを備える、請求項2に記載の方法。
  4. 第1のアップサンプリングされた信号を生成するために第1のアップサンプリング比に従って前記ローバンド励振信号をアップサンプリングすることと、
    前記ローバンド励振信号の前記非線形変換されたバージョンを生成するために、前記第1のアップサンプリングされた信号に対して非線形変換演算を実施することと
    を含む前記ローバンド励振信号の前記非線形変換されたバージョンを生成することさらに備える、請求項1に記載の方法。
  5. 前記第1のベースバンド信号を生成するために、前記ローバンド励振信号の前記非線形変換されたバージョンのスペクトル反転されたバージョンをダウンサンプリングすることをさらに備える、請求項4に記載の方法。
  6. 前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、請求項1に記載の方法。
  7. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、請求項に記載の方法。
  8. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、請求項に記載の方法。
  9. 前記第1のベースバンド信号を生成すること、および前記第2のベースバンド信号を生成することは、モバイル通信デバイスを備えるデバイス内で実施される、請求項1に記載の方法。
  10. 前記第1のベースバンド信号を生成すること、および前記第2のベースバンド信号を生成することは、基地局を備えるデバイス内で実施される、請求項1に記載の方法。
  11. デバイスからビットストリームを受信するように構成された受信機と、
    前記ビットストリームからローバンド励振信号を生成するように構成されたデコーダと、
    第1のベースバンド信号および第2のベースバンド信号に少なくとも部分的に基づいてオーディオ信号の少なくとも部分的に再構成されたバージョンを出力するように構成された1つまたは複数のスピーカーと
    を備え、前記デコーダは、
    第1のベースバンド信号を生成することと、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記デバイスにおいて受信されたオーディオ信号のハイバンド部分の第1のサブバンドに対応する、
    前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することと、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個である、
    を行うように構成されたハイバンド励振発生器を備える、装置。
  12. 前記デコーダが、前記第1のベースバンド信号に基づいて前記第2のベースバンド信号を生成するように構成される、請求項11に記載の装置。
  13. 前記第2のベースバンド信号を生成することが、前記第1のベースバンド信号を使用して白色雑音を変調することを備える、請求項12に記載の装置。
  14. 前記デコーダが、
    第1のアップサンプリングされた信号を生成するために第1のアップサンプリング比に従って前記ローバンド励振信号をアップサンプリングすることと、
    前記ローバンド励振信号の前記非線形変換されたバージョンを生成するために、前記第1のアップサンプリングされた信号に対して非線形変換演算を実施することとを行うようにさらに構成された、請求項11に記載の装置。
  15. 前記デコーダが、前記第1のベースバンド信号を生成するために、前記ローバンド励振信号の前記非線形変換されたバージョンのスペクトル反転されたバージョンをダウンサンプリングするようにさらに構成された、請求項14に記載の装置。
  16. 前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、請求項11に記載の装置。
  17. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、請求項16に記載の装置。
  18. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、請求項16に記載の装置。
  19. 前記受信機および前記デコーダは、モバイルデバイスに組み込まれる、請求項11に記載の装置。
  20. 前記受信機および前記デコーダは、基地局に組み込まれる、請求項11に記載の装置。
  21. ロセッサによって実行されたとき、
    ビットストリームからローバンド励振信号を生成することと、前記ビットストリームは、デバイスから受信される、
    1のベースバンド信号を生成することと、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記デバイスにおいて受信されたオーディオ信号のハイバンド部分の第1のサブバンドに対応する、
    前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成することと、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個であ前記オーディオ信号の少なくとも部分的に再構成されたバージョンは、前記第1のベースバンド信号および前記第2のベースバンド信号に少なくとも部分的に基づいて出力される、
    を備える動作を前記プロセッサに実施させる命令を備える非一時的コンピュータ可読媒体。
  22. 前記第2のベースバンド信号が、前記第1のベースバンド信号に基づいて生成される、請求項21に記載の非一時的コンピュータ可読媒体。
  23. 前記第2のベースバンド信号を生成することが、前記第1のベースバンド信号を使用して白色雑音を変調することを備える、請求項22に記載の非一時的コンピュータ可読媒体。
  24. 前記動作が、
    第1のアップサンプリングされた信号を生成するために第1のアップサンプリング比に従って前記ローバンド励振信号をアップサンプリングすることと、
    前記ローバンド励振信号の前記非線形変換されたバージョンを生成するために、前記第1のアップサンプリングされた信号に対して非線形変換演算を実施することと
    をさらに備える、請求項21に記載の非一時的コンピュータ可読媒体。
  25. 前記動作が、前記第1のベースバンド信号を生成するために、前記ローバンド励振信号の前記非線形変換されたバージョンのスペクトル反転されたバージョンをダウンサンプリングすることをさらに備える、請求項24に記載の非一時的コンピュータ可読媒体。
  26. 前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、請求項21に記載の非一時的コンピュータ可読媒体。
  27. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、請求項26に記載の非一時的コンピュータ可読媒体。
  28. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、請求項26に記載の非一時的コンピュータ可読媒体。
  29. デバイスからビットストリームを受信するための手段と、
    前記ビットストリームからローバンド励振信号を生成するための手段と、
    第1のベースバンド信号を生成するための手段と、ここにおいて、前記第1のベースバンド信号を生成することが、前記ローバンド励振信号の非線形変換されたバージョンに対してスペクトル反転演算を実施することを含み、前記第1のベースバンド信号が、前記デバイスにおいて受信されたオーディオ信号のハイバンド部分の第1のサブバンドに対応する、
    前記オーディオ信号の前記ハイバンド部分の第2のサブバンドに対応する第2のベースバンド信号を生成するための手段と、ここにおいて、前記第1のサブバンドが前記第2のサブバンドとは別個である、
    前記第1のベースバンド信号および前記第2のベースバンド信号に少なくとも部分的に基づいて前記オーディオ信号の少なくとも部分的に再構成されたバージョンを出力するための手段と
    を備える装置。
  30. 前記第1のベースバンド信号が第1のハイバンド励振信号に対応し、前記第2のベースバンド信号が第2のハイバンド励振信号に対応する、請求項29に記載の装置。
  31. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約6.4キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約3.2kHzまでである、請求項30に記載の装置。
  32. 前記第1のハイバンド励振信号のバンド幅が約0ヘルツ(Hz)から約8キロヘルツ(kHz)までであり、前記第2のハイバンド励振信号のバンド幅が約0Hzから約4kHzまでである、請求項30に記載の装置。
  33. 前記ビットストリームを受信するための前記手段と、前記ローバンド励振信号を抽出するための手段と、前記第1のベースバンド信号を生成するための前記手段と、前記第2のベースバンド信号を生成するための前記手段は、モバイルデバイスに組み込まれる、請求項29に記載の装置。
  34. 前記ビットストリームを受信するための前記手段と、前記ローバンド励振信号を抽出するための手段と、前記第1のベースバンド信号を生成するための前記手段と、前記第2のベースバンド信号を生成するための前記手段は、基地局に組み込まれる、請求項29に記載の装置。
JP2017117052A 2014-03-31 2017-06-14 複数のサブバンドを使用するハイバンド信号コーディング Active JP6396538B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201461973135P 2014-03-31 2014-03-31
US61/973,135 2014-03-31
US14/672,868 2015-03-30
US14/672,868 US9542955B2 (en) 2014-03-31 2015-03-30 High-band signal coding using multiple sub-bands

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016559598A Division JP6162347B2 (ja) 2014-03-31 2015-03-31 複数のサブバンドを使用するハイバンド信号コーディング

Publications (2)

Publication Number Publication Date
JP2017201404A JP2017201404A (ja) 2017-11-09
JP6396538B2 true JP6396538B2 (ja) 2018-09-26

Family

ID=54191286

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016559598A Active JP6162347B2 (ja) 2014-03-31 2015-03-31 複数のサブバンドを使用するハイバンド信号コーディング
JP2017117052A Active JP6396538B2 (ja) 2014-03-31 2017-06-14 複数のサブバンドを使用するハイバンド信号コーディング

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016559598A Active JP6162347B2 (ja) 2014-03-31 2015-03-31 複数のサブバンドを使用するハイバンド信号コーディング

Country Status (10)

Country Link
US (2) US9542955B2 (ja)
EP (1) EP3127113B1 (ja)
JP (2) JP6162347B2 (ja)
KR (2) KR102154908B1 (ja)
CN (2) CN107818791B (ja)
CA (2) CA3005797C (ja)
ES (1) ES2755364T3 (ja)
HU (1) HUE045976T2 (ja)
TW (2) TWI652669B (ja)
WO (1) WO2015153548A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN105765655A (zh) * 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
US10115403B2 (en) * 2015-12-18 2018-10-30 Qualcomm Incorporated Encoding of multiple audio signals
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5244512A (en) * 1975-10-06 1977-04-07 Nippon Telegr & Teleph Corp <Ntt> Between-frame coding equipment
FR2550673B1 (fr) * 1983-08-09 1986-07-11 France Etat Systeme de transmission telephonique comprenant au moins un vocodeur a bande de base associe a un modem
TW224191B (ja) * 1992-01-28 1994-05-21 Qualcomm Inc
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
DE602006020686D1 (de) * 2005-01-12 2011-04-28 Nippon Telegraph & Telephone Kodierverfahren und dekodierverfahren mit langzeitvorhersage, vorrichtungen, programm und aufzeichnungsmedium dafür
MX2007012187A (es) 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
TW200727598A (en) * 2005-11-18 2007-07-16 Sony Corp Encoding/decoding device/method and the transmission system
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8280728B2 (en) * 2006-08-11 2012-10-02 Broadcom Corporation Packet loss concealment for a sub-band predictive coder based on extrapolation of excitation waveform
US8005678B2 (en) * 2006-08-15 2011-08-23 Broadcom Corporation Re-phasing of decoder states after packet loss
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
KR100905585B1 (ko) * 2007-03-02 2009-07-02 삼성전자주식회사 음성신호의 대역폭 확장 제어 방법 및 장치
KR101290622B1 (ko) * 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
RU2443028C2 (ru) * 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
US8751225B2 (en) * 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
US8484016B2 (en) * 2010-05-28 2013-07-09 Microsoft Corporation Locating paraphrases through utilization of a multipartite graph
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US20120029926A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US9117440B2 (en) * 2011-05-19 2015-08-25 Dolby International Ab Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal
ES2568640T3 (es) * 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic

Also Published As

Publication number Publication date
US20170084284A1 (en) 2017-03-23
KR20160138454A (ko) 2016-12-05
CN106165012A (zh) 2016-11-23
TWI597721B (zh) 2017-09-01
CA3005797A1 (en) 2015-10-08
CN107818791A (zh) 2018-03-20
US9818419B2 (en) 2017-11-14
BR112016022770A8 (pt) 2021-07-13
JP2017201404A (ja) 2017-11-09
CN106165012B (zh) 2017-09-01
US20150279384A1 (en) 2015-10-01
JP2017515143A (ja) 2017-06-08
JP6162347B2 (ja) 2017-07-12
WO2015153548A1 (en) 2015-10-08
CA2940411A1 (en) 2015-10-08
TWI652669B (zh) 2019-03-01
EP3127113A1 (en) 2017-02-08
TW201735011A (zh) 2017-10-01
ES2755364T3 (es) 2020-04-22
CA2940411C (en) 2018-06-19
KR102154908B1 (ko) 2020-09-10
HUE045976T2 (hu) 2020-01-28
US9542955B2 (en) 2017-01-10
CN107818791B (zh) 2021-09-14
CA3005797C (en) 2019-10-29
BR112016022770A2 (pt) 2017-08-15
EP3127113B1 (en) 2019-08-14
TW201541452A (zh) 2015-11-01
KR20180011861A (ko) 2018-02-02

Similar Documents

Publication Publication Date Title
JP6396538B2 (ja) 複数のサブバンドを使用するハイバンド信号コーディング
KR101849871B1 (ko) 고대역 신호 특성에 기초한 시간 이득 조정
JP6345780B2 (ja) ハイバンドコーディングにおける選択的位相補償
JP6513718B2 (ja) 不一致周波数範囲を使用するハイバンド信号をエンコーディングする方法、エンコーダを備えた装置、エンコーダに実行させる命令を備えたコンピュータ可読記憶媒体、不一致周波数範囲を使用するハイバンド信号をデコーディングする方法、デコーダ、ハイバンド信号を生成する装置、デコーダに実行させる命令を備えたコンピュータ可読記憶媒体
JP6258522B2 (ja) デバイスにおいてコーディング技術を切り替える装置および方法
BR112016022770B1 (pt) Codificação de sinal de banda alta com o uso de múltiplas subbandas
BR112016030386B1 (pt) Codificação de sinal de banda alta com o uso de faixas de frequência incompatíveis
BR112016030381B1 (pt) Método e aparelho para codificar um sinal de áudio e memória legível por computador

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180829

R150 Certificate of patent or registration of utility model

Ref document number: 6396538

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250