JP2009545775A - ゲインファクタ制限のためのシステム、方法及び装置 - Google Patents

ゲインファクタ制限のためのシステム、方法及び装置 Download PDF

Info

Publication number
JP2009545775A
JP2009545775A JP2009523002A JP2009523002A JP2009545775A JP 2009545775 A JP2009545775 A JP 2009545775A JP 2009523002 A JP2009523002 A JP 2009523002A JP 2009523002 A JP2009523002 A JP 2009523002A JP 2009545775 A JP2009545775 A JP 2009545775A
Authority
JP
Japan
Prior art keywords
signal
gain factor
index
factor value
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009523002A
Other languages
English (en)
Other versions
JP5290173B2 (ja
Inventor
カンドハダイ、アナンサパドマナブハン・エー.
クリシュナン、ベンカテシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009545775A publication Critical patent/JP2009545775A/ja
Application granted granted Critical
Publication of JP5290173B2 publication Critical patent/JP5290173B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

開示された構成の範囲は、第2のサブバンドから得られる第1のサブバンドの励振を使って音声信号のサブバンドが別々に符号化される方法を含む。ゲインファクタは、オリジナルの第1のサブバンドと合成された第1のサブバンドとのエンベロープ間の時間的に変化する関係を示すように演算される。ゲインファクタは量子化され、量子化前の値を超過する量子化値は、再符号化される。

Description

(関連出願の相互参照)
本出願は、2006年7月31日付け出願され「METHOD FOR QUANTIZATION OF FRAME GAIN IN A WIDEBAND SPEECH CODER」と題された米国仮出願第60/834,658号の利益を主張する。
この開示は音声符号化に関する。
公衆交換電話網(PSTN)上の音声通信は、伝統的にバンド幅が300−3400kHzの周波数レンジに制限されている。例えばセルラ電話通信及びボイスオーバーIP(インターネットプロトコル,VoIP)のような音声通信用の新しいネットワークは、同じバンド幅制限を有しない可能性があり、それらのようなネットワーク上で広帯域周波数レンジを含む音声通信を送受信することは望ましい可能性がある。例えば、下方に50Hzまで及び/又は上方に7若しくは8kHzまで広がる可聴周波数レンジをサポートすることは望ましい可能性がある。伝統的なPSTNの制限の外側のレンジにオーディオ音声の内容を有する、例えば高品質オーディオ又はオーディオ/ビデオ会議のような、他のアプリケーションをサポートすることもまた、望ましい可能性がある。
音声符号器によりサポートされるレンジを、より高い周波数へ拡張することは、明瞭度を改善する可能性がある。例えば、‘s’及び‘f’のような摩擦音を差別化する情報は、大部分は高周波にある。ハイバンド拡張はまた、例えばプレゼンスのような音声の他の品質を改善する可能性がある。例えば、発声された母音でさえ、PSTNの制限を遠く越えて、スペクトルエネルギーを有する可能性がある。
広帯域音声符号化への一つのアプローチは、広帯域スペクトルをカバーするために、狭帯域音声符号化技術(例えば、0−4kHzのレンジを符号化するように構成されたもの)をスケーリングすることを含む。例えば、音声信号は、高周波成分を含めるために、より高いレートでサンプリングされても良い。また、狭帯域符号化技術は、この広帯域信号を表現するために、より多くのフィルタ係数を用いるように再構成されても良い。しかしながら、例えばCELP(コードブック励振線形予測(codebook excited linear prediction))のような狭帯域符号化技術は、計算上、集中的であり、広帯域CELP符号器は、多くのモバイル及び他の埋め込まれたアプリケーションにとって実用的であるためには、あまりにも多くの処理サイクルを消費するかもしれない。そのような技術を用いて、所望の品質に向けて広帯域信号の全スペクトラムを符号化することはまた、バンド幅の容認しがたいほど大きな増加をもたらすかもしれない。さらに、そのような符号化信号をコード変換することが、その狭帯域部分が、狭帯域符号化を単にサポートするシステムの中へ送信され及び/又はそれにより復号化される前でさえ、要求されるであろう。
コード変換をせずに又は他の有意な修正をせずに、(例えばPSTNチャネルのような)狭帯域チャネルを介して、少なくとも符号化信号の狭帯域部分を送信できるように、広帯域音声符号化を実行することは、望ましい可能性がある。広帯域符号化の拡張の性能はまた、例えば有線及び無線チャネル上の無線セルラ電話通信及び放送のようなアプリケーションでサービスを受けることができるユーザの数の有意な減少を回避するために、望ましい可能性がある。
広帯域音声符号化への他のアプローチは、音声信号の狭帯域部分とハイバンド部分とを、分離されたサブバンドとして符号化することを含む。このタイプのシステムでは、復号器にて既に利用可能な情報から、例えば狭帯域励振信号のようなハイバンド合成フィルタのための励振を得ることによって、性能の増加が実現されるかも知れない。そのようなシステムにおいて、オリジナルのハイバンド信号のレベルと合成されたハイバンド信号のレベルとの間の時間的に変化する関係を示す一連のゲインファクタを、符号化信号に含めることによって、品質が増加されるかも知れない。
一つの構成に従う音声処理の方法は、(A)音声信号の第1のサブバンドに基づく第1の信号の時間部分と、(B)前記音声信号の第2のサブバンドから得られる成分に基づく第2の信号の時間部分との間の関係に基づいて、ゲインファクタ値を演算することと、前記ゲインファクタ値に従って、順序付けられた量子化値のセットの中から第1のインデックスを選択することを含む。また、前記方法は、前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価することと、前記評価の結果に従って、前記順序付けられた量子化値のセットの中から第2のインデックスを選択することを含む。
他の構成に従う音声処理用の装置は、(A)音声信号の第1のサブバンドに基づく第1の信号の時間部分と、(B)前記音声信号の第2のサブバンドから得られる成分に基づく第2の信号の時間部分との間の関係に基づいて、ゲインファクタ値を演算するように構成された演算器と、前記ゲインファクタ値に従って、順序付けられた量子化値のセットの中から第1のインデックスを選択するように構成された量子化器とを含む。前記装置は、(A)前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価し、(B)前記評価の結果に従って、前記順序付けられた量子化値のセットの中から第2のインデックスを選択するように構成されたリミッタを含む。
更なる構成に従う音声処理用の装置は、(A)音声信号の第1のサブバンドに基づく第1の信号の時間部分と、(B)前記音声信号の第2のサブバンドから得られる成分に基づく第2の信号の時間部分との間の関係に基づいて、ゲインファクタ値を演算するための手段と、前記ゲインファクタ値に従って、順序付けられた量子化値のセットの中から第1のインデックスを選択するための手段とを含む。前記装置は、前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価し、前記評価の結果に従って、前記順序付けられた量子化値のセットの中から第2のインデックスを選択するための手段を含む。
広帯域音声符号器A100のブロック図を示す。 広帯域音声符号器A100の実装例A102のブロック図を示す。 広帯域音声復号器B100のブロック図を示す。 広帯域音声符号器B100の実装例B102のブロック図を示す。 フィルタバンクA110の一例のためのローバンド及びハイバンドのバンド幅のカバレッジを示す。 フィルタバンクA110の他の例のためのローバンド及びハイバンドのバンド幅のカバレッジを示す。 音声信号についての周波数対ログ振幅のプロットの一例を示す。 基本的な線型予測符号化システムのブロック図を示す。 狭帯域符号器A120の実装例A122のブロック図を示す。 狭帯域復号器B110の実装例B112のブロック図を示す。 発声された音声に対する残差信号についての周波数対ログ振幅のプロットの一例を示す。 発声された音声に対する残差信号についての時間対ログ振幅のプロットの一例を示す。 長期予測をも実行する基本的な線型予測符号化システムのブロック図を示す。 ハイバンド符号器A200の実装例A202のブロック図を示す。 ハイバンド部分を符号化する方法M10のためのフローチャートを示す。 ゲイン演算タスクT200のためのフローチャートを示す。 ゲイン演算タスクT200の実装例T210のためのフローチャートを示す。 窓関数のダイアグラムを示す。 音声信号のサブフレームに対する図13aで示されるような窓関数の適用を示す。 ハイバンドゲインファクタ演算器A230の実装例A232のブロック図を示す。 ハイバンドゲインファクタ演算器A232を含む構成のブロック図を示す。 ハイバンドゲインファクタ演算器A232の実装例A234のブロック図を示す。 ハイバンドゲインファクタ演算器A232の他の実装例A236のブロック図を示す。 スカラー量子化により実行される一次元マッピングの一例を示す。 ベクトル量子化により実行される多次元マッピングの一つの簡単な例を示す。 スカラー量子化により実行される一次元マッピングの他の例を示す。 入力空間を相異なるサイズの量子化領域へマッピングする一例を示す。 ゲインファクタ値Rに対する量子化値がオリジナル値より大きい例を示す。 一つの一般的な実装例に従うゲインファクタ制限の方法M100のためのフローチャートを示す。 方法M100の実装例M110のためのフローチャートを示す。 方法M100の実装例M120のためのフローチャートを示す。 方法M100の実装例M130のためのフローチャートを示す。 ハイバンド符号器A202の実装例A203のブロック図を示す。 ハイバンド符号器A203の実装例A204のブロック図を示す。 リミッタL10の一つの実装例L12のための動作線図を示す。 リミッタL10の他の実装例L14のための動作線図を示す。 リミッタL10の更なる実装例L16のための動作線図を示す。 ハイバンド復号器B200の実装例B202のためのブロック図を示す。
復号化信号のサブバンド中のエネルギー分布が不正確な場合に、例えば、可聴アーティファクト(audible artifact)が生じる可能性がある。そのようなアーティファクトは、ユーザにとって著しく不愉快である可能性があり、それゆえ符号器の知覚品質(noticeably unpleasant)を低減する可能性がある。
用語「演算(calculating)」は、その文脈により明確に限定されない限り、例えば計算(computing)、生成(generating)及び値のリストからの選択のような、その通常の意味のいずれをも示すためにここに使用される。ここで、用語「含む(comprising)」が、本説明及び特許請求の範囲で使用される場合に、それは他の要素(elements)又は動作(operations)を排除するものではない。用語「AはBに基づいている(A is based on B)」は、ケース(i)「AはBに等しい(A is equal to B)」及びケース(ii)「Aは少なくともBに基づいている(A is based on at least B)」を含めて、その通常の意味のいずれをも示すために使用される。用語「インターネットプロトコル」は、IETF(インターネット技術標準化委員会)RFC(コメント要請)791に記載されているバージョン4と、それに続く例えばバージョン6のようなバージョンを含む。
図1aは、ここに説明されるような方法を実行するように構成される広帯域音声符号器A100のブロック図を示す。フィルタバンクA110は、狭帯域信号S20及びハイバンド信号S30を生成するために、広帯域音声信号S10をフィルタするように構成される。狭帯域符号器A120は、狭帯域(NB)フィルタパラメータS40及び狭帯域残差信号S50を生成するために、狭帯域信号S20を符号化するように構成される。ここでさらに詳しく説明されるように、狭帯域符号器A120は、典型的には、コードブックインデックスとして又は他の量子化形式で、狭帯域フィルタパラメータS40及び符号化狭帯域励振信号S50を生成するように構成される。ハイバンド符号器A200は、ハイバンド符号化パラメータS60を生成するために、符号化狭帯域励振信号S50中の情報に従って、ハイバンド信号S30を符号化するように構成される。ここでさらに詳しく説明されるように、ハイバンド符号器A200は、典型的には、コードブックインデックスとして又は他の量子化形式で、ハイバンド符号化パラメータS60を生成するように構成される。広帯域音声符号器A100の一つの特定の例は、狭帯域フィルタパラメータS40と符号化狭帯域励振信号S50に使用されている約7.55kbps(キロビット/秒)と、ハイバンド符号化パラメータS60に使用されている1kbpsとで、約8.55kbpsのレートにて広帯域音声信号S10を符号化するように構成される。
それら符号化された狭帯域及びハイバンド信号を単一のビットストリームの中へ混合することは望ましい場合がある。例えば、(例えば、有線、光又は無線伝送チャネルを介した)送信又は記憶装置のために、それら符号化信号を、符号化広帯域音声信号として一緒に多重化することが望ましい場合がある。図1bは、狭帯域フィルタパラメータS40、符号化狭帯域励振信号S50及びハイバンドフィルタパラメータS60を多重化信号S70中へ混合するように構成されたマルチプレクサA130を含む広帯域音声符号器A100の実装例A102のブロック図を示す。
符号器A102を含む装置はまた、例えば有線、光又は無線チャネルのような伝送チャネルへ、多重化信号S70を送信するように構成された回路を含んでも良い。そのような装置はまた、例えば、誤り訂正符号化(例えば、レートコンパチブル畳み込み符号化(rate-compatible convolutional encoding))、及び/又は、誤り検出符号化(例えば、巡回冗長符号化)、及び/又は、一つ以上の層のネットワークプロトコルの符号化(例えば、イーサネット(登録商標)、TCP/IP、cdma2000)のような、一つ以上のチャネル符号化動作を、上記信号に対して実行するように構成されても良い。
(狭帯域フィルタパラメータS40及び符号化狭帯域励振信号S50を含む)符号化狭帯域信号が、例えばハイバンド及び/又はローバンド信号のような多重化信号S70の他の部分と独立して、復元及び復号化できるように、マルチプレクサA130が、該符号化狭帯域信号を多重化信号S70の分離可能なサブストリームとして埋め込むように構成されることは望ましい場合がある。例えば、ハイバンドフィルタパラメータS60を剥ぎ取ることによって、該符号化狭帯域信号が復元できるように、多重化信号S70が構成されても良い。そのような特徴の一つの潜在的利点は、狭帯域信号の復号化をサポートするがハイバンド部分の復号化をサポートしないシステムへ符号化広帯域信号を渡す前に、該符号化広帯域信号をコード変換する必要を回避することである。
図2aは、広帯域音声符号器A100により符号化された信号を復号化するために使用される広帯域音声復号器B100のブロック図である。狭帯域復号器B110は、狭帯域信号S90を生成するために、狭帯域フィルタパラメータS40及び符号化狭帯域励振信号S50を復号化するように構成される。ハイバンド復号器B200は、ハイバンド信号S100を生成するために、符号化狭帯域励振信号S50に基づき、狭帯域励振信号S80に従ってハイバンド符号化パラメータS60を復号化するように構成される。この例において、狭帯域復号器B110は、ハイバンド復号器B200に狭帯域励振信号S80を供給するように構成される。フィルタバンクB120は、広帯域音声信号S110を生成するために、狭帯域信号S90及びハイバンド信号S100を混合するように構成される。
図2bは、多重化信号S70から、符号化信号S40,S50及びS60を生成するように構成されたデマルチプレクサB130を含む広帯域音声復号器B100の実装例B102のブロック図である。復号器B102を含む装置は、例えば有線、光又は無線チャネルのような伝送チャネルから多重化信号S70を受信するように構成された回路を含んでも良い。そのような装置はまた、例えば誤り訂正復号化(例えば、レートコンパチブル畳み込み復号化(rate-compatible convolutional decoding))、及び/又は、誤り検出復号化(例えば、巡回冗長復号化)、及び/又は、一つ以上の層のネットワークプロトコルの復号化(例えば、イーサネット、TCP/IP、cdma2000)のような、一つ以上のチャネル復号化動作を、上記信号に対して実行するように構成されても良い。
フィルタバンクA110は、低周波のサブバンド及び高周波のサブバンドを生成するために、帯域分割スキーム(split-band scheme)に従って入力信号をフィルタするように構成される。特定のアプリケーションに対する設計基準に応じて、それら出力サブバンドは、等しいバンド幅を有しても又は等しくないバンド幅を有しても良く、また、オーバーラップしていても又はオーバーラップしていなくても良い。また、3つ以上のサブバンドを生成するフィルタバンクA110の構成も可能である。例えば、そのようなフィルタバンクは、狭帯域信号S20の周波数レンジの下方の周波数レンジ(例えば、50−300Hzのレンジなど)に成分を含む一つ以上のローバンド信号を生成するように構成されても良い。また、そのようなフィルタバンクを、ハイバンド信号S30の周波数レンジの上方の周波数レンジ(例えば、14−20kHz、16−20kHz又は16−32kHzのレンジなど)に成分を含む一つ以上の更なるハイバンド信号を生成するように構成することも可能である。そのような場合、広帯域音声符号器A100は、この一つの信号又はこれら複数の信号を別々に符号化するように実装されても良い。また、マルチプレクサA130は、更なる符号化された一つの信号又は複数の信号を(例えば、分離可能な部分として)含めるように構成されても良い。
図3a及び3bは、二つの異なる実装の例における、広帯域音声信号S10、狭帯域信号S20及びハイバンド信号S30の相対的なバンド幅を示す。これら特定の例の両方において、広帯域の音声信号S10は、(0〜8kHzのレンジ内の周波数成分を表現する)16kHzのサンプリングレートを有し、また、狭帯域信号S20は、(0〜4kHzのレンジ内の周波数成分を表現する)8kHzのサンプリングレートを有するが、そのようなレート及びレンジはここに説明された原理上の制限ではなく、他のサンプリングレート及び/又は周波数レンジに適用されても良い。
図3aの例では、二つのサブバンド間に有意なオーバーラップはない。この例にあるようなハイバンド信号S30は、8kHzのサンプリングレートにダウンサンプルされても良い。図3bの代替例では、両サブバンド信号により3.5〜4kHzの領域が示されているように、上側と下側のサブバンドにはかなりのオーバーラップがある。この例にあるようなハイバンド信号S30は、7kHzのサンプリングレートにダウンサンプルされても良い。図3bの例にあるようなサブバンド間のオーバーラップを与えることで、オーバーラップした領域上に滑らかなロールオフを有するローパス及び/又はハイパスフィルタを符号化システムが使用することを可能にしても良く、及び/又は、オーバーラップした領域の再現された周波数成分の品質を高めても良い。
電話通信用の典型的な送受話器では、変換器(すなわち、マイクロホン及び受話器又はラウドスピーカ)の一つ以上は、7−8kHzの周波数レンジについては、かなり応答が不足している。図3bの例では、広帯域音声信号S10の7−8kHzの間の部分は、符号化信号には含まれていない。ハイパスフィルタ130の他の特定の例は、3.5−7.5kHzの通過帯域を有し、また、他の特定の例は、3.5−8kHzの通過帯域を有する。
符号器は、オリジナルの信号に知覚的には似ているが、実際にはオリジナルの信号と有意に異なる合成信号を生成するように構成されても良い。例えば、ここに説明されるような狭帯域残差からハイバンド励振を得る符号器は、実際のハイバンド残差が復号化信号に完全に存在しないような信号を生成しても良い。それらのような場合、サブバンド間のオーバーラップを与えることで、より少ない可聴アーティファクト及び/又は一つのバンドから他方のバンドへのそれほど顕著でない推移を導くローバンド及びハイバンドの滑らかな混合をサポートしても良い。
フィルタバンクA110及びB120のローバンド及びハイバンドのパスは、それら二つのサブバンドのオーバーラップとは完全に無関係なスペクトルを有するように構成されても良い。私達は、それら2つのサブバンドのオーバーラップを、ハイバンドフィルタの周波数応答が−20dBまで落ちるポイントから、ローバンドフィルタの周波数応答が−20dBまで落ちるポイントまでの距離として定義する。フィルタバンクA110及び/又はB120の様々な例では、このオーバーラップは、約200Hzから約1kHzまで分布する。約600Hzから約400Hzまでのレンジが、符号化効率と知覚的な滑らかさとの間の望ましいトレードオフを表わしても良い。一つの特定の例において、前述のように、オーバーラップは約500Hzである。
幾つかのステージにおいて、図3a及び3bの中で示されるようなサブバンド信号を演算するように、フィルタバンクA110及び/又はB120を実装することは望ましい場合がある。フィルタバンクA110及びB120の特定の実装の要素の応答に関係する更なる説明及び図は、2006年4月3日付け出願され「SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING」と題されたVosらの米国特許出願(代理人明細書番号第050551号)の図3a,3b,4c,4d及び33−39b並びに添付されているテキスト(パラグラフ[00069]-[00087]を含んでいる)に見出されるであろう。また、この参考文献は、参照により組み込むことを許可する米国及び他の区域において、フィルタバンクA110及び/又はB120に関係する追加的開示を提供する目的で、参照してここに組み込まれる。
ハイバンド信号S30は、符号化に有害な高エネルギーのパルス(「バースト」)を含んでいることがあり得る。例えば広帯域音声符号器A100のような音声符号器は、(例えば、ハイバンド符号器A200により)符号化するのに先立ってハイバンド信号S30をフィルタするために、(例えば、2006年4月3日付け出願され「SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND BURST SUPPRESSION」と題されたVosらの米国特許出願(代理人明細書番号第050549号)に記載されているように)バーストサプレッサーを含むように実装されても良い。
狭帯域符号器A120及びハイバンド符号器A200は、典型的には、それぞれ、(A)フィルタを表現する1セットのパラメータ及び(B)入力信号の合成再現を生成するように表現されたフィルタを駆動する励振信号として、入力信号を符号化するソースフィルタのモデルに従って、実装される。図4aは、音声信号のスペクトルエンベロープの例を示す。このスペクトルエンベロープを特徴付けるピークは、声道の共鳴を表わし、フォルマントと呼ばれる。ほとんどの音声符号器は、少なくともこの粗いスペクトル構造を、例えばフィルタ係数のようなパラメータのセットとして、符号化する。
図4bは、狭帯域信号S20のスペクトルエンベロープの符号化に適用される基本的なソースフィルタ構成の一例を示す。分析モジュールは、ある期間(典型的には20ミリ秒(msec))にわたる語音に対応するフィルタを特徴付ける1セットのパラメータを演算する。それらのフィルタパラメータに従って構成されたホワイトニングフィルタ(分析又は予測誤差フィルタとも呼ばれる)は、スペクトル上で信号を平らにするために、スペクトルエンベロープを削除する。その結果生じる白色化信号(残差とも呼ばれる)は、より少ないエネルギー及びそれゆえより少ない変化を有しており、オリジナルの音声信号に比べて符号化するのがより簡単である。残差信号の符号化に起因する誤差はまた、スペクトル上でより一様に広げられても良い。フィルタパラメータ及び残差は、典型的には、チャネル上での効率的な送信のために量子化される。復号器では、フィルタパラメータに従って構成された合成フィルタは、オリジナルの音素を合成したものを生成するために、残差に基づいた信号により励振される。合成フィルタは、典型的には、ホワイトニングフィルタの伝達関数の逆伝達関数を有するように構成される。
図5は、狭帯域符号器A120の基本的な実装例A122のブロック図を示す。この例において、線型予測符号化(LPC)分析モジュール210は、線形予測(LP)係数(例えば、全極型フィルタ1/A(z)の係数)のセットとして、狭帯域信号S20のスペクトルエンベロープを符号化する。分析モジュールは、典型的には、各々のフレームについて演算されている係数の新しいセットをもって、一連のオーバーラップしないフレームとして入力信号を処理する。フレーム周期は、一般に、信号がローカルに静止していると予期されてもよい期間であり、一つの通常の例は、20ミリ秒(8kHzのサンプリングレートでの160個のサンプルと等価)である。一例において、LPC分析モジュール210は、各々の20ミリ秒のフレームのフォルマント構造を特徴付ける10 LPフィルタ係数のセットを演算するように構成される。一連のオーバーラップするフレームとして入力信号を処理する分析モジュールを実装することも可能である。
分析モジュールは、各々のフレームのサンプルを直接分析するように構成されても良いし、又は、窓関数(例えば、ハミングウィンドウ)に従ってサンプルが最初に重み付けされても良い。その分析はまた、例えば30ミリ秒のウィンドウのような、フレームより大きいウィンドウ上で実行されても良い。このウィンドウは、対称(例えば、20ミリ秒のフレームの直前及び直後にそれぞれ5ミリ秒を含むような、5−20−5)でも良いし、又は、非対称(例えば、先行するフレームの最後の10ミリ秒を含むような、10−20)でも良い。LPC分析モジュールは、典型的には、レビンソン・ダービン再帰(Levinson-Durbin recursion)又はルルー・ゲゲン・アルゴリズム(Leroux-Gueguen algorithm)を使用するLPフィルタ係数を演算するように構成される。他の実装では、分析モジュールは、LPフィルタ係数のセットの代わりに、各々のフレームのケプストラム係数のセットを演算するように構成されても良い。
符号器A120の出力レートは、フィルタパラメータの量子化により、再現品質に対する比較的わずかな影響をもって、有意に縮小されても良い。線形予測フィルタ係数は、効率的に量子化するのが難しく、通常、量子化及び/又はエントロピー符号化のための、例えば線スペクトルペア(LSP)又は線スペクトル周波数(LSF)のような、他の表現へマッピングされる。図5の例において、LPフィルタ係数対LSF変換220は、LPフィルタ係数のセットを、対応するLSFのセットに変換する。LPフィルタ係数の他の1対1の表現は、GSM(グローバル移動体通信システム)AMR−WB(適応マルチレートワイドバンド)コーデックにおいて使用される、パーコール(parcor)係数、対数面積比の値(log-area-ratio values)、イミッタンス・スペクトル・ペア(ISP)、及びイミッタンス・スペクトル周波数(ISF)を含む。典型的には、LPフィルタ係数のセットと、対応するLSFのセットとの間の変換は可逆的であるが、それら構成はまた、その変換が誤差の無い非可逆的である符号器A120の実装を含む。
量子化器230は、狭帯域LSFのセット(又は、他の係数表現)を量子化するように構成され、狭帯域符号器A122は、この量子化の結果を狭帯域フィルタパラメータS40として出力するように構成される。そのような量子化器は、典型的には、入力ベクトルを、テーブル又はコードブック中の対応するベクトルエントリーに対するインデックスとして符号化するベクトル量子化器を含む。
図9は、ハイバンド符号器A200の実装例A202のブロック図を示す。ハイバンド符号器A202の分析モジュールA210、変換410及び量子化器420は、前述の狭帯域符号器A122の対応する要素(すなわち、LPC分析モジュール210、変換220及び量子化器230それぞれ)の説明に従って実装されても良いが、より低いオーダーのLPC分析をハイバンドに使用することは望ましい場合がある。これら狭帯域及びハイバンド符号器の要素は、その時々において同じ構造(例えば、ゲートの配列)及び/又はインストラクションのセット(例えば、命令行)を用いて実装することさえ可能である。後述のように、狭帯域符号器A120及びハイバンド符号器A200の動作は、残差信号の処理に関して異なる。
図5に見られるように、狭帯域符号器A122はまた、狭帯域信号S20を、フィルタ係数のセットに従って構成されるホワイトニングフィルタ260(分析又は予測誤差フィルタとも呼ばれる)を通過させることによって、残差信号を生成する。この特定の例において、ホワイトニングフィルタ260は、FIRフィルタとして実装されるが、IIRの実装が用いられても良い。この残差信号は、典型的には、狭帯域フィルタパラメータS40中には表現されていない、例えばピッチに関係する長期構造のような音声フレームの知覚的に重要な情報を含むであろう。量子化器270は、符号化狭帯域励振信号S50として出力するために、この残差信号の量子化表現を演算するように構成される。そのような量子化器は、典型的には、入力ベクトルを、テーブル又はコードブック中の対応するベクトルエントリーに対するインデックスとして符号化するベクトル量子化器を含む。その代わりに、そのような量子化器は、スパース(sparse)コードブック法におけるように、記憶装置から検索されるのではなく、復号器にてベクトルが動的に生成されるもとになる一つ以上のパラメータを送信するように構成されても良い。そのような方法は、例えば代数CELP(コードブック励振線形予測)のような符号化スキーム、及び、例えば3GPP2(第三世代パートナーシップ2)EVRC(エンハンスト可変レートコーデック)のような符復号器において用いられる。
狭帯域符号器A120が、対応する狭帯域復号器にて利用できる値と同じフィルタパラメータ値に従って、符号化狭帯域励振信号を生成することは望ましい。このように、その結果生じる符号化狭帯域励振信号は、例えば量子化誤差のようなそれらのパラメータ値における非理想性(nonidealities)を既にある程度まで説明しても良い。従って、復号器にて利用できる値と同じ係数値を用いて、ホワイトニングフィルタを構成することは望ましい。図5に示されるような符号器A122の基本的な例では、逆量子化器240は、狭帯域符号化パラメータS40を逆量子化し、LSF対LPフィルタ係数変換250は、その結果生じる値を、対応するLPフィルタ係数のセットへ、マップする。この係数のセットは、量子化器270により量子化される残差信号を生成するホワイトニングフィルタ260を構成するために使用される。
狭帯域符号器A120の幾つかの実装例は、コードブックベクトルのセットのうちで、残差信号と最も良く一致する一つを特定することによって、符号化狭帯域励振信号S50を演算するように構成される。しかしながら、狭帯域符号器A120はまた、実際に残差信号を生成せずに、残差信号の量子化表現を演算するように実装されても良いことに留意が必要である。例えば、狭帯域符号器A120は、対応する合成信号を(例えば、フィルタパラメータの現在のセットに従って)生成するために、幾つかのコードブックベクトルを使用し、知覚的に重み付けされた領域中でオリジナルの狭帯域信号S20と最も良く一致する生成信号に関連するコードブックベクトルを選択するように構成されても良い。
ホワイトニングフィルタが狭帯域信号S20から粗いスペクトルエンベロープを取り除いた後でさえ、相当な量の微細な高調波構造が、特に発声された音声について、残っても良い。図7aは、例えば母音のような発声された信号について、ホワイトニングフィルタにより生成されるような、残差信号の一例のスペクトルプロットを示す。この例において見られる周期的な構造は、ピッチと関係があり、同じ話者により話された異なる有声音は、異なるフォルマント構造であるが類似のピッチ構造を有しても良い。図7bは、正しいテンポでのピッチパルスのシーケンスを示すような残差信号の一例の時間領域プロットを示す。
狭帯域符号器A120は、狭帯域信号S20の長期的な高調波構造を符号化するように構成された一つ以上のモジュールを含んでも良い。図8に示されるように、使用されてもよい一つの典型的なCELPパラダイムは、短期的な特性又は粗いスペクトルエンベロープを符号化する開ループのLPC分析モジュールと、これに続く微細なピッチ又はハーモニック構造を符号化する閉ループの長期予測分析とを含む。短期的な特性は、フィルタ係数として符号化され、長期的な特性は、例えばピッチラグ及びピッチゲインのようなパラメータに対する値として符号化される。例えば、狭帯域符号器A120は、一つ以上のコードブックインデックス(例えば、固定コードブックインデックス及び適応コードブックインデックス)及び対応するゲイン値を含む形式で、符号化狭帯域励振信号S50を出力するように構成されても良い。(例えば、量子化器270による)この狭帯域残差信号の量子化表現の演算は、そのようなインデックスを選択すること及びそのような値を演算することを含んでも良い。ピッチ構造の符号化はまた、ピッチプロトタイプ波形の補間(interpolation)を含んでも良く、その動作は、連続するピッチパルス間の差分を演算することを含んでも良い。長期的な構造のモデリングは、典型的に雑音様で非構造的である無声音声に対応するフレームのために無効にされても良い。
図6は、狭帯域復号器B110の実装例B112のブロック図を示す。(例えば、狭帯域符号器A122の逆量子化器240及び変換250に関して前述したように)逆量子化器310は、狭帯域フィルタパラメータS40を(この場合、LSFのセットへ)逆量子化し、LSF対LPフィルタ係数変換320は、LSFをフィルタ係数のセットに変換する。逆量子化器340は、狭帯域励振信号S80を生成するために、狭帯域残差信号S40を逆量子化する。フィルタ係数及び狭帯域励振信号S80に基づいて、狭帯域合成フィルタ330は、狭帯域信号S90を合成する。言い換えると、狭帯域合成フィルタ330は、狭帯域信号S90を生成するために、逆量子化されたフィルタ係数に従って、スペクトル上で狭帯域励振信号S80を成形するように構成される。狭帯域復号器B112はまた、狭帯域励振信号S80を、ここに説明されるように、ハイバンド励振信号S120を得るためにそれを使用するハイバンド符号器A200に対して供給する。後述されるような幾つかの実装例では、狭帯域復号器B110は、例えばスペクトル傾斜、ピッチゲイン、ピッチラグ及び音声モードのような狭帯域信号に関係する更なる情報を、ハイバンド復号器B200に対して提供するように構成されても良い。
狭帯域符号器A122及び狭帯域復号器B112のシステムは、分析合成(analysis-by-synthesis)音声符復号器の基本的な例である。コードブック励振線形予測(CELP)符号化は、分析合成符号化の一つのポピュラーファミリーであり、また、そのような符号器の実装は、固定で適応性のあるコードブックからのエントリーの選択のような動作、誤差最小化動作、及び/又は、知覚的な重み付け動作を含む、残差の波形符号化を実行しても良い。分析合成符号化の他の実装は、混合励振線形予測(MELP)、代数CELP(ACELP)、緩和CELP(RCELP)、規則的パルス励振(RPE)、マルチパルスCELP(MPE)及びベクトル和励振線形予測(VSELP)符号化を含む。関連する符号化方法は、マルチバンド励振(MBE)及びプロトタイプ波形補間(PWI)符号化を含む。標準化された分析合成音声符復号器の例は、残差励振線形予測(RELP)を用いるETSI(欧州電気通信標準協会)-GSMフルレートコーデック(GSM 06.10)、GSM強化フルレートコーデック(ETSI-GSM 06.60)、ITU(国際電気通信連合)標準 11.8kb/s G.729 附属資料 E 符号器、IS-136(時分割多元接続スキーム)のためのIS(暫定基準)-641コーデック、GSM適応マルチレート(GSM-AMR)コーデック、及び4GVTM(第4世代ボコーダTM)コーデック(クアルコム社(サンディエゴ)、CA)を含む。狭帯域符号器A120及び対応する復号器B110は、これらの技術のうちのいずれに従って実装されても良いし、あるいは、(A)フィルタを表現する1セットのパラメータ及び(B)音声信号を再現するために表現されたフィルタを駆動するために用いられる励振信号として、音声信号を表現する他の音声符号化技術(既知であっても又は開発中であっても)に従って実装されても良い。
ハイバンド符号器A200は、ソースフィルタモデルに従ってハイバンド信号S30を符号化するように構成される。例えば、ハイバンド符号器A200は、典型的には、信号のスペクトルエンベロープを表現する1セットのフィルタパラメータを得るために、ハイバンド信号S30のLPC分析を実行するように構成される。狭帯域側におけるように、このフィルタを励振させるために使用されるソース信号は、LPC分析の残差から、あるいはそうでなければ、LPC分析の残差に基づいて、得られても良い。しかしながら、ハイバンド信号S30は、典型的には、狭帯域信号S20に比較して知覚的にはより重要ではなく、また、符号化音声信号が、二つの励振信号を含むことは、高価であろう。符号化広帯域音声信号を転送するために必要とされるビットレートを低減するために、ハイバンドについては、モデル化された励振信号を代わりに使用することは望ましい場合がある。例えば、ハイバンドフィルタのための励振は、符号化狭帯域励振信号S50に基づいても良い。
図9は、ハイバンドフィルタパラメータS60a及びハイバンドゲインファクタS60bを含むハイバンド符号化パラメータS60のストリームを生成するように構成されたハイバンド復号器の実装例A202のブロック図を示す。ハイバンド励振生成器A300は、符号化狭帯域励振信号S50からハイバンド励振信号S120を得る。分析モジュールA210は、ハイバンド信号S30のスペクトルエンベロープを特徴付ける1セットのパラメータ値を生成する。この特定の例において、分析モジュールA210は、ハイバンド信号S30の各々のフレームについて、LPフィルタ係数のセットを生成するためにLPC分析を実行するように構成される。線形予測フィルタ係数対LSF変換410は、LPフィルタ係数のセットを、対応するLSFのセットに変換する。分析モジュール210及び変換220に関して前述したように、分析モジュールA210及び/又は変換410は、他の係数のセット(例えば、ケプストラム係数)及び/又は係数の表現(例えば、ISP)を使用するように構成されても良い。
量子化器420は、ハイバンドLSF(又は、例えばISPのような他の係数表現)のセットを量子化するように構成され、ハイバンド符号器A202は、この量子化の結果をハイバンドフィルタパラメータS60aとして出力するように構成される。そのような量子化器は、典型的には、入力ベクトルを、テーブル又はコードブック中の対応するベクトルエントリーに対するインデックスとして符号化するベクトル量子化器を含む。
ハイバンド符号器A202はまた、ハイバンド励振信号S120及び分析モジュールA210により生成された符号化スペクトルエンベロープ(例えば、LPフィルタ係数のセット)に従って、合成ハイバンド信号S130を生成するように構成された合成フィルタA220を含む。合成フィルタA220は、典型的には、IIRフィルタとして実装されるが、FIRの実装が用いられても良い。一つの特定の例において、合成フィルタA220は、6次の線形自己回帰フィルタとして実装される。
図8に示されるようなパラダイムに従う広帯域音声符号器A100の実装例において、ハイバンド符号器A200は、短期分析又はホワイトニングフィルタにより生成される狭帯域励振信号を受信するように構成されても良い。言い換えれば、狭帯域符号器A120は、長期的な構造を符号化する前に、ハイバンド符号器A200へ狭帯域励振信号を出力するように構成されても良い。しかしながら、ハイバンド符号器A200により生成された符号化パラメータが、その情報における非理想性を既にある程度まで説明してもよいほどのものにできるように、ハイバンド符号器A200が、ハイバンド復号器B200により受信される情報と同じ符号化情報を狭帯域チャネルから受信することは望ましい。したがって、ハイバンド符号器A200が、広帯域音声符号器A100により出力される符号化狭帯域励振信号S50から、同じパラメータ化及び/又は量子化された符号化狭帯域励振信号S80を再構成することは望ましい場合がある。このアプローチの潜在的な一つの利点は、後述するように、ハイバンドゲインファクタS60bのより正確な演算である。
ハイバンドゲインファクタ演算器A230は、フレームについてゲインエンベロープを特定するために、オリジナルのハイバンド信号S30と合成ハイバンド信号S130とのレベル間の一つ以上の差分を演算する。入力ベクトルを、テーブル又はコードブック中の対応するベクトルエントリーに対するインデックスとして符号化するベクトル量子化器として実装されても良い量子化器430は、ゲインエンベロープを特定する一つの値又は複数の値を量子化し、ハイバンド符号器A202は、この量子化の結果をハイバンドゲインファクタS60bとして出力するように構成される。
ここに説明された要素の量子化器の一つ以上(例えば、量子化器230、420又は430)は、分類ベクトル量子化を実行するように構成されても良い。例えば、そのような量子化器は、狭帯域チャネル及び/又はハイバンドチャネルにおける同じフレーム内に既に符号化されている情報に基づいて、コードブックのセットのうちの一つを選択するように構成されても良い。そのような技術は、典型的には、更なるコードブック記憶装置のコスト負担において、高められた符号化効率を提供する。
図9に示されるようなハイバンド符号器A200の実装例において、合成フィルタA220は、分析モジュールA210からフィルタ係数を受信するように構成される。ハイバンド符号器A202の代替実装例は、ハイバンドフィルタパラメータS60aからフィルタ係数を復号化するように構成された逆量子化器及び逆変換を含み、この場合、合成フィルタA220は、復号化されたフィルタ係数を代わりに受信するように構成される。そのような代替構成は、ハイバンドゲイン演算器A230によるゲインエンベロープのより正確な演算をサポートする可能性がある。
一つの特定の例において、狭帯域信号S20の広帯域の拡張が1フレーム当たり11個の追加的な値だけで達成できるように、分析モジュールA210及びハイバンドゲイン演算器A230は、それぞれ、1フレーム当たり、6個のLSFのセット及び5個のゲイン値のセットを出力する。更なる例において、広帯域の拡張を1フレーム当たり12個の追加的な値だけで提供するために、他のゲイン値が各々のフレームのために加算される。耳は高周波での周波数誤差にそれほど敏感でない傾向があり、それは、低いLPC次数でのハイバンド符号化が、より高いLPC次数での狭帯域符号化と同程度の知覚品質を有する信号を生成する場合があるほどのものである。ハイバンド符号器A200の典型的な実装例は、スペクトルエンベロープの高品質な再構成のために1フレーム当たり8〜12ビットを出力し、また、時間エンベロープの高品質な再構成のために1フレーム当たりもう8〜12ビットを出力するように構成されても良い。他の特定の例において、分析モジュールA210は、1フレーム当たり8個のLSFのセットを出力する。
ハイバンド符号器A200の幾つかの実装例は、ハイバンド周波数成分を有するランダムノイズ信号を生成することと、狭帯域信号S20、狭帯域励振信号S80又はハイバンド信号S30の時間領域エンベロープに従って、該ノイズ信号を振幅変調することによって、ハイバンド励振信号S120を生成するように構成される。そのような場合、符号器と復号器のハイバンド励振生成器における対応するノイズ生成器が同じ状態になるように、ノイズ生成器の状態を、符号化音声信号中の他の情報(例えば、狭帯域フィルタパラメータS40若しくはその部分、及び/又は、符号化狭帯域励振信号S50若しくはその部分のような、同じフレーム中の情報)の決定論的な関数にすることは望ましい場合がある。雑音ベースの方法は、無声音について適切な結果を生成する場合があるが、しかしながら、有声音の残差が通常ハーモニックであり従ってある周期的な構造を有することは望ましくない場合がある。
ハイバンド励振生成器A300は、(例えば、符号化狭帯域励振信号S50を逆量子化することによって)狭帯域励振信号S80を取得し、また、狭帯域励振信号S80に基づいて、ハイバンド励振信号S120を生成するように構成される。例えば、ハイバンド励振生成器A300は、例えば狭帯域励振信号S80の非線形処理を使用する、高調波バンド幅拡張(harmonic bandwidth extension)、スペクトル重畳(spectral folding)、スペクトル変換(spectral translation)及び/又は高調波合成のような、一つ以上の技術を実行するように実装されても良い。一つの特定の例において、ハイバンド励振生成器A300は、拡張信号の適応混合(adaptive mixing)により変調ノイズ信号と結合された狭帯域励振信号S80の非線形バンド幅拡張によって、ハイバンド励振信号S120を生成するように構成される。ハイバンド励振生成器A300はまた、拡張及び/又は混合された信号の非スパース(anti-sparseness)フィルタリングを実行するように構成されても良い。
ハイバンド励振生成器A300及びハイバンド励振信号S120の生成に関係する更なる説明及び図は、2006年4月3日付け出願され「SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND EXCITATION GENERATION」と題された、Vosらの米国特許出願第11/397,870号の図11−20及び添付されているテキスト(パラグラフ[000112]-[000146]及び[000156]を含んでいる)に見出されるであろう。また、この参考文献は、参照により組み込むことを許可する米国及び他の区域において、ハイバンド励振生成器A300及び/又は一つのサブバンドのための励振信号を他のサブバンドの符号化励振信号から生成することに関係する追加的開示を提供する目的で、参照してここに組み込まれる。
図10は、狭帯域部分及びハイバンド部分を有する音声信号の該ハイバンド部分を符号化する方法M10のフローチャートを示す。タスクX100は、該ハイバンド部分のスペクトルエンベロープを特徴付ける1セットのフィルタパラメータを演算する。タスクX200は、該狭帯域部分から得られる信号に対して非線形関数を適用することにより、スペクトル拡張信号を演算する。タスクX300は、(A)該1セットのフィルタパラメータと、(B)該スペクトル拡張信号に基づくハイバンド励振信号とに従って、合成ハイバンド信号を生成する。タスクX400は、(C)該ハイバンド部分のエネルギーと、(D)該狭帯域部分から得られる信号のエネルギーとの間の関係に基づいて、ゲインエンベロープを演算する。
復号化された信号の時間的な特性が、それが示すオリジナルの信号を象徴することは、典型的には望ましいであろう。さらに、異なるサブバンドが別々に符号化されるシステムについては、復号化された信号中のサブバンドの相対的な時間的な特性が、オリジナルの信号中のそれらのサブバンドの相対的な時間的な特性に似ていることは望ましい場合がある。符号化された音声信号の正確な再現については、合成広帯域音声信号S100のハイバンド部分と狭帯域部分とのレベル間の比が、オリジナルの広帯域音声信号S10におけるそれに似ていることは望ましい場合がある。ハイバンド符号器A200は、符号化音声信号中に、オリジナルのハイバンド信号の時間エンベロープを表現する情報か、あるいはそうでなければ、オリジナルのハイバンド信号の時間エンベロープに基づいている情報を含むように構成されても良い。ハイバンド励振信号が、例えば符号化狭帯域励振信号S50のような他のサブバンドからの情報に基づいている場合については、特に、符号化されたパラメータが、合成ハイバンド信号とオリジナルのハイバンド信号との時間エンベロープ間の差分について表現する情報を含むことは望ましい場合がある。
ハイバンド信号S30のスペクトルエンベロープに関係のある情報に加えて(すなわち、LPC係数又は類似のパラメータ値により表現されているように)、広帯域信号の符号化パラメータが、ハイバンド信号S30の時間的な情報を含むことは望ましい場合がある。ハイバンド符号化パラメータS60aにより示されているようなスペクトルエンベロープに加えて、例えば、ハイバンド符号器A200は、時間エンベロープ又はゲインエンベロープを特定することにより、ハイバンド信号S30を特徴付けるように構成されても良い。図9に示されるように、ハイバンド符号器A202は、例えばフレーム又はそのある部分での二つの信号のエネルギー間の差分又は比のような、ハイバンド信号S30と合成ハイバンド信号S130との間の関係に従って、一つ以上のゲインファクタを演算するように構成及びアレンジされたハイバンドゲインファクタ演算器A230を含む。ハイバンド符号器A202の他の実装例では、ハイバンドゲイン演算器A230は、同様に構成されるが、代わりにハイバンド信号S30と狭帯域励振信号S80又はハイバンド励振信号S120との間のそのような時間的に変化する関係に従ってゲインエンベロープを演算するようにアレンジされる。
狭帯域励振信号S80の時間エンベロープとハイバンド信号S30の時間エンベロープとは、類似すると思われる。したがって、ハイバンド信号S30と狭帯域励振信号S80との関係に基づくゲインエンベロープ(又は、例えばハイバンド励振信号S120若しくは合成ハイバンド信号S130のような、そこから得られる信号)は、一般に、ハイバンド信号S30のみに基づくゲインエンベロープに比べて、符号化にはより適しているであろう。
ハイバンド符号器A202は、ハイバンド信号S30の各々のフレームについて、一つ以上のゲインファクタを演算するように構成されたハイバンドゲインファクタ演算器A230を含み、ここで、各々のゲインファクタは、合成ハイバンド信号S130とハイバンド信号S30との対応する部分の時間エンベロープの間の関係に基づいている。例えば、ハイバンドゲインファクタ演算器A230は、それら信号の振幅エンベロープ間の比率として又はそれら信号のエネルギーエンベロープ間の比として、各々のゲインファクタを演算するように構成されても良い。一つの典型的な実装例では、ハイバンド符号器A202は、各々のフレームについて5個のゲインファクタ(例えば、連続する5個のサブフレームの各々について1個)を特定する8〜12ビットの量子化インデックスを出力するように構成される。更なる実装例では、ハイバンド符号器A202は、各々のフレームについて一つのフレームレベルゲインファクタを特定する更なる量子化インデックスを出力するように構成される。
ゲインファクタは、例えばオリジナルの信号のエネルギーの基準と合成信号のエネルギーの基準との比Rのような、正規化係数として演算されても良い。比率Rは、(例えば、デシベルスケール上の)線形の値又は対数の値として表現されても良い。ハイバンドゲインファクタ演算器A230は、各々のフレームについてのそのような一つの正規化係数を演算するように構成されても良い。その代わりに又は加えて、ハイバンドゲインファクタ演算器A230は、各々のフレームの幾つかのサブフレームの各々について、一連のゲインファクタを演算するように構成されても良い。一つの例において、ハイバンドゲインファクタ演算器A230は、各々のフレーム(及び/又はサブフレーム)のエネルギーを、二乗和の平方根として演算するように構成される。
ハイバンドゲインファクタ演算器A230は、一つ以上のサブタスクのシリーズを含むタスクとしてゲインファクタ演算を実行するように構成されても良い。図11は、ハイバンド信号S30と合成ハイバンド信号S130との対応する部分の相対的なエネルギーに従って、符号化ハイバンド信号の対応する部分(例えば、フレーム又はサブフレーム)に対するゲイン値を演算するようなタスクの一例T200のフローチャートを示す。タスク220a及び220bは、それぞれの信号の対応する部分のエネルギーを演算する。例えば、タスク220a及び220bは、それぞれの部分のサンプルの二乗和としてエネルギーを演算するように構成されても良い。タスクT230は、それらのエネルギーの比の平方根としてゲインファクタを演算する。この例において、タスクT230は、該部分上の合成ハイバンド信号S130のエネルギーに対する該部分上のハイバンド信号S30のエネルギーの比の平方根として、該部分に対するゲインファクタを演算する。
ハイバンドゲインファクタ演算器A230が、窓関数に従ってそれらエネルギーを演算するように構成されることは望ましい場合がある。図12は、ゲインファクタ演算タスクT200のそのような実装例T210のフローチャートを示す。タスクT215aは、ハイバンド信号S30に対して窓関数を適用する。また、タスクT215bは、合成ハイバンド信号S130に対して同じ窓関数を適用する。タスク220a及び220bの実装例222a及び222bは、それぞれの窓のエネルギーを演算し、タスクT230は、それらエネルギーの比の平方根として該部分のゲインファクタを演算する。
フレームに対するゲインファクタを演算する際に、隣接するフレームにオーバーラップする窓関数を適用することは望ましい場合がある。サブフレームに対するゲインファクタを演算する際に、隣接するサブフレームにオーバーラップする窓関数を適用することは望ましい場合がある。例えば、オーバーラップ加算法(overlap-add fashion)に適用されてもよいゲインファクタを生成する窓関数は、サブフレーム間の不連続を縮小又は回避することを支援しても良い。一例において、ハイバンドゲインファクタ演算器A230は、図13aに示されるような台形の窓関数を適用するように構成される。そこでは、ウィンドウは、二つの隣接するサブフレームの各々を1ミリ秒ずつオーバーラップする。図13bは、20ミリ秒のフレームの5つのサブフレームの各々に対する、この窓関数の適用を示す。ハイバンドゲインファクタ演算器A230の他の実装例は、異なるオーバーラップ期間、及び/又は、対称的でも非対称でもよい異なるウィンドウ形(例えば、矩形、ハミング)を有する窓関数を適用するように構成されても良い。また、ハイバンドゲインファクタ演算器A230の実装例を、一つのフレーム内の異なるサブフレームに対して、及び/又は、異なる長さのサブフレームを含むフレームについて、異なる窓関数を適用するように構成することも可能である。一つの特定の実装例では、ハイバンドゲインファクタ演算器A230は、図13a及び13bに示されるような台形の窓関数を用いてサブフレームゲインファクタを演算するように構成され、また、窓関数を使用せずにフレームレベルゲインファクタを演算するように構成される。
以下の値は、制限なしに、特定の実装のための例として示される。これらの場合のために20ミリ秒のフレームが仮定されているが、他の任意の継続時間が使用されても良い。7kHzでサンプリングされたハイバンド信号については、各々のフレームは140個のサンプルを有する。そのようなフレームが等しい長さの5つのサブフレームに分割される場合、各々のサブフレームは28個のサンプルを有し、また、図13aに示されるようなウィンドウは42個のサンプル幅になるであろう。8kHzでサンプリングされたハイバンド信号については、各々のフレームは160個のサンプルを有する。そのようなフレームが等しい長さの5つのサブフレームに分割される場合、各々のサブフレームは32個のサンプルを有し、また、図13aに示されるようなウィンドウは48個のサンプル幅になるであろう。他の実装例では、任意の幅のサブフレームが使用されても良く、また、ハイバンドゲイン演算器A230の実装例は、一つのフレームの各々のサンプルについて、異なるゲインファクタを生成するように構成することさえできる。
上述したように、ハイバンド符号器A202は、ハイバンド信号S30と狭帯域信号S20に基づく信号(例えば、狭帯域励振信号S80、ハイバンド励振信号S120又は合成ハイバンド信号S130など)との間の時間的に変化する関係に従って一連のゲインファクタを演算するように構成されるハイバンドゲインファクタ演算器A230を含んでも良い。図14aは、ハイバンドゲインファクタ演算器A230の実装例A232のブロック図を示す。ハイバンドゲインファクタ演算器A232は、第1の信号のエンベロープを演算するように構成されるエンベロープ演算器G10の実装例G10a及び第2の信号のエンベロープを演算するように構成されるエンベロープ演算器G10の実装例G10bを含む。エンベロープ演算器G10a及びG10bは同一であっても良いし、あるいは、それらがエンベロープ演算器G10の相異なる実装の実例であっても良い。ある場合には、エンベロープ演算器G10a及びG10bが、その時々において異なる信号を処理するように構成された同じ構造(例えば、ゲートの配列)及び/又はインストラクション(例えば、命令行)のセットとして実装されても良い。
エンベロープ演算器G10a及びG10bは、それぞれ、(例えば、絶対値関数に従って)振幅エンベロープ又は(例えば、二乗関数に従って)エネルギーエンベロープを演算するように構成されても良い。典型的に、各エンベロープ演算器G10a,G10bは、入力信号に関してサブサンプルされるエンベロープ(例えば、入力信号の各々のフレーム又はサブフレームについて一つの値を有するエンベロープ)を演算するように構成される。例えば図11−13bに関して前述したように、エンベロープ演算器G10a及び/又はG10bは、隣接するフレーム及び/又はサブフレームをオーバーラップするように構成される窓関数に従って、エンベロープを演算するように構成されても良い。
ファクタ演算器G20は、二つの時間上の(over time)エンベロープの間の時間的に変化する関係に従って、一連のゲインファクタを演算するように構成される。前記のように一例において、ファクタ演算器G20は、対応するサブフレーム上のそれらエンベロープの比の平方根として、各々のゲインファクタを演算する。その代わりに、ファクタ演算器G20は、例えば対応するサブフレーム中のそれらエンベロープ間の差分又は符号付き二乗差分のような、エンベロープ間の距離に基づいて、各々のゲインファクタを演算するように構成されても良い。デシベル又は他の対数的に基準化された形式のゲインファクタの演算値を出力するファクタ演算器G20を構成することは望ましい場合がある。例えば、ファクタ演算器G20は、それらエネルギー値の対数の差分として、2つのエネルギー値の比の対数を演算するように構成されても良い。
図14bは、ハイバンドゲインファクタ演算器A232を含む一般化された構成のブロック図を示し、それにおいて、エンベロープ演算器G10aは、狭帯域信号S20に基づいて、信号のエンベロープを演算するように構成され、エンベロープ演算器G10bは、ハイバンド信号S30のエンベロープを演算するように構成され、また、ファクタ演算器G20は、ハイバンドゲインファクタS60bを(例えば、量子化器430へ)出力するように構成される。この例において、エンベロープ演算器G10aは、中間処理P1から受信される信号のエンベロープを演算するように構成され、それは、ここに説明されるように、狭帯域励振信号S80の演算、ハイバンド励振信号S120の生成、及び/又は、ハイバンド信号S130の合成を実行するように構成される構造及び/又はインストラクションを含んでも良い。便宜上、エンベロープ演算器G10aが合成ハイバンド信号S130のエンベロープを演算するように構成されると仮定されているが、代わりにエンベロープ演算器G10aが狭帯域励振信号S80又はハイバンド励振信号S120のエンベロープを演算するように構成される実装例が、明確に予期されこれによって開示される。
前述のように、二つ以上の異なる時間分解能でゲインファクタを得ることは望ましい場合がある。例えば、ハイバンドゲインファクタ演算器A230を、符号化されるべきハイバンド信号S30の各々のフレームについて、フレームレベルゲインファクタ及び一連のサブフレームゲインファクタの両方を演算するように構成するのは望ましい場合がある。図15は、第1の信号のフレームレベルのエンベロープ及びサブフレームレベルのエンベロープをそれぞれ演算するように構成されるエンベロープ演算器G10の実装例G10af,G10asを含むハイバンドゲインファクタ演算器A232の実装例A234のブロック図を示す(第1の信号は、例えば、合成ハイバンド信号S130であるが、代わりにエンベロープ演算器G10af,G10asが狭帯域励振信号S80又はハイバンド励振信号S120のエンベロープを演算するように構成される実装例が、明確に予期されこれによって開示される)。ハイバンドゲインファクタ演算器A234はまた、第2の信号(例えば、ハイバンド信号S30)のフレームレベルのエンベロープ及びサブフレームレベルのエンベロープをそれぞれ演算するように構成されるエンベロープ演算器G10bの実装例G10bf,G10bsを含む。
エンベロープ演算器G10af及びG10bfは同一であっても良いし、あるいは、それらがエンベロープ演算器G10の相異なる実装の実例であっても良い。ある場合には、エンベロープ演算器G10af及びG10bfが、その時々において異なる信号を処理するように構成された同じ構造(例えば、ゲートの配列)及び/又はインストラクション(例えば、命令行)のセットとして実装されても良い。同様に、エンベロープ演算器G10as及びG10bsは同一であっても良いし、それらがエンベロープ演算器G10の異なる実装の実例であっても良いし、あるいは、同じ構造及び/又はインストラクションのセットとして実装されても良い。4つのすべてのエンベロープ生成器G10af、G10as、G10bf及びG10bsにとって、その時々において同じ設定可能な構造及び/又はインストラクションのセットとして実装されることが可能である。
ここに説明されるようなファクタ演算器G20の実装例G20f,G20sは、フレームレベルS60bf及びサブフレームレベルゲインファクタS60bsをそれぞれのエンベロープに基づいて演算するように構成される。特定の設計に適するために乗算器又は除算器として実装されてもよい正規化器(Normalizer)N10は、(例えば、サブフレームゲインファクタが量子化される前に)対応するフレームレベルゲインファクタS60bfに従って、サブフレームゲインファクタS60bsの各々のセットを正規化するように構成される。ある場合には、フレームレベルゲインファクタS60bfを量子化し、次に、対応する逆量子化値を用いてサブフレームゲインファクタS60bsを正規化することによって、できる限りより正確な結果を得ることが望まれる場合がある。
図16は、ハイバンドゲインファクタ演算器A232の他の実装例A236のブロック図を示す。この実装例において、図15に示されるような様々なエンベロープ及びゲイン演算器は、エンベロープが演算される前に、第1の信号上で正規化が実行されるように再構成される。正規化器N20は、特定の設計に適するために乗算器又は除算器として実装されても良い。ある場合には、フレームレベルゲインファクタS60bfを量子化し、次に、対応する逆量子化された値を用いて第1の信号を正規化することによって、できる限りより正確な結果を得ることが望まれる場合がある。
量子化器430は、特定の設計に適していると考えられるスカラー及び/又はベクトル量子化の一つ以上の方法を実行する既知又は開発中の任意の技術に従って実装されても良い。量子化器430は、フレームレベルゲインファクタをサブフレームゲインファクタとは別々に量子化するように構成されても良い。一例において、各々のフレームレベルゲインファクタS60bfは、4ビットルックアップテーブル量子化器を用いて量子化され、また、各々のフレームに対するサブフレームゲインファクタS60bsのセットは、4ビットを用いてベクトル量子化される。そのようなスキームは、(www.3gpp2.orgで入手できる、3GPP2ドキュメントC.S0014-Cバージョン0.2のセクション4.18.4において述べられているように)EVRC−WB符号器において、有声音声フレームのために使用される。他の例において、各々のフレームレベルゲインファクタS60bfは、7ビットスカラー量子化器を用いて量子化され、また、各々のフレームに対するサブフレームゲインファクタS60bsのセットは、1ステージ当たり4ビットのマルチステージベクトル量子化器を用いてベクトル量子化される。そのようなスキームは、(上で引用された3GPP2ドキュメントC.S0014-Cバージョン0.2のセクション4.18.4において述べられているように)EVRC−WB符号器において、無声音声フレームに使用される。他のスキームでは、各々のフレームレベルゲインファクタを、そのフレームのサブフレームゲインファクタと一緒に量子化することもできる。
量子化器は、典型的には、離散的な出力値のセットのうちの一つに、入力値をマッピングするように構成される。入力値のレンジが単一の出力値にマッピングされるように、限られた数の出力値が使用できる。対応する出力値を示すインデックスがオリジナルの入力値より少ないビットで送信されても良いので、量子化は符号化効率を増加させる。図17は、スカラー量子化器により実行される一次元マッピングの一例を示し、それにおいて、(2nD−1)/2と(2nD+1)/2との間の入力値は、出力値nDに対してマッピングされる(整数nについて)。
量子化器は、ベクトル量子化器として実装されても良い。例えば、各々のフレームに対するサブフレームゲインファクタのセットは、典型的には、ベクトル量子化器を用いて量子化される。図18は、ベクトル量子化器によって実行される多次元マッピングの一つの簡単な例を示す。この例において、入力空間は、(例えば、最近隣基準(nearest-neighbor criterion)に従って)幾つかのボロノイ(Voronoi)領域に分割される。量子化は、各々の入力値を、ここにポイントで示された対応するボロノイ地域(典型的には、重心)を表わす値にマッピングする。この例において、任意の入力値が異なるわずか6つの状態を有するインデックスによって表わされるように、入力空間は6つの領域に分割される。
図19aは、スカラー量子化器によって実行される一次元マッピングの他の例を示す。この例で、ある初期値a(例えば、0dB)からある最終値b(例えば、6dB)に伸びる入力空間は、n個の領域に分割される。n個の領域の各々の値は、n個の量子化値q[0]〜q[n-1]の対応する一つによって表わされる。典型的な応用では、量子化インデックス(0〜n−1)の送信が、符号器から復号器まで量子化値を転送するのに十分であるように、n個の量子化値のセットが符号器及び復号器に使用できる。例えば、量子化値のセットは、各々のデバイス内の順序付けられたリスト、テーブル又はコードブックにおいて格納されても良い。
図19aは、入力空間がN個の等しいサイズの領域に分割されていることを示すが、代わりに異なるサイズの領域を用いて入力空間を分割することが望ましい場合がある。入力データの予期された分配に従って、量子化値を分布させることにより、より正確な平均の結果が得られることがあり得る。例えば、よりしばしば観測されると予期される入力空間の範囲におけるより高い分解能(すなわち、より小さな量子化領域)及び他のところにおけるより低い分解能を得ることは望ましい場合がある。図19bは、そのようなマッピングの一例を示す。他の例において、aからbに(例えば、対数比で)振幅が大きくなるように、量子化領域のサイズが増加する。(例えば、図18に示されるように)異なるサイズの量子化領域がベクトル量子化において使用されても良い。フレームレベルゲインファクタS60bfを量子化する際に、量子化器430は、要望に応じて均一又は不均一のマッピングを適用するように構成されても良い。同様に、サブフレームゲインファクタS60bsを量子化する際に、量子化器430は、要望に応じて均一又は不均一のマッピングを適用するように構成されても良い。量子化器430は、ファクタS60bf及びS60bsについて別々の量子化器を含むように実装されても良いし、及び/又は、その時々において、ゲインファクタの異なるストリームを量子化するために、同一の設定可能な構造及び/又はインストラクションのセットを使用するように実装されても良い。
前述のように、ハイバンドゲインファクタS60bは、オリジナルのハイバンド信号S30のエンベロープと、狭帯域励振信号S80に基づく信号(例えば、合成ハイバンド信号S130)のエンベロープ間の時間的に変化する関係を符号化する。この関係は、復号化された狭帯域及びハイバンド信号の相対的なレベルが、オリジナルの広帯域音声信号S10の狭帯域及びハイバンド成分のそれらを近似できるように、復号器で再構成されても良い。
復号化音声信号中の様々なサブバンドの相対的なレベルが不正確な場合、可聴アーティファクトが生じる可能性がある。例えば、復号化されたハイバンド信号が、オリジナルの音声信号中に比べて、対応する復号化狭帯域信号に関してより高いレベル(例えば、より高いエネルギー)を有する場合、顕著なアーティファクトが生じる場合がある。可聴アーティファクトは、ユーザの経験を損ね、符号器の知覚品質を低減することがある。知覚的に良好な結果を得るために、サブバンド符号器(例えば、ハイバンド符号器A200)が、合成信号にエネルギーを割り当てることにおいて伝統的(conservative)であることは望ましい場合がある。例えば、合成信号に対するゲインファクタ値を符号化するために伝統的な量子化方法を使用することは望ましい場合がある。
レベルアンバランスに起因するアーティファクトは、増幅されたサブバンドのための励振が他のサブバンドから得られる状況には特に不快である場合がある。そのようなアーティファクトは、例えば、ハイバンドゲインファクタS60bがそのオリジナルの値より大きな値に量子化される場合に、生じることがある。図19cは、ゲインファクタ値Rに対する量子化値がオリジナルの値より大きい例を示す。量子化値は、q[iR]としてここに表示され、ここで、iRは、値Rに関連する量子化インデックスを示し、また、q[・]は、与えられたインデックスにより特定される量子化値を得る動作を示す。
図20aは、一つの一般的な実装例に従うゲインファクタ制限の方法M100のためのフローチャートを示す。タスクTQ10は、サブバンド信号の一部(例えば、フレーム又はサブフレーム)のゲインファクタの値Rを演算する。例えば、タスクTQ10は、合成サブバンドフレームのエネルギーに対するオリジナルのサブバンドフレームのエネルギーの比として、値Rを演算するように構成されても良い。その代わりに、ゲインファクタ値Rは、そのような比の対数(例えば、常用対数)であっても良い。タスクTQ10は、前述したようなハイバンドゲインファクタ演算器A230の実装例によって実行されても良い。
タスクTQ20は、ゲインファクタ値Rを量子化する。そのような量子化は、例えばベクトル量子化方法のような、スカラー量子化の任意の方法(例えば、ここに説明されるような方法)又は特定の符号器の設計に適していると考えられる任意の他の方法により実行されても良い。典型的な応用では、タスクTQ20は、入力値Rに対応する量子化インデックスiRを特定するように構成される。例えば、タスクTQ20は、所望の探索戦略(例えば、最小誤差アルゴリズム)に従って、Rの値を、量子化リスト、テーブル又はコードブック中のエントリーと比較することによって、インデックスを選択するように構成されても良い。この例において、探索戦略の減少する順に(すなわち、q[i-1]≦q[i]のように)量子化テーブル又はリストが配列されているものと仮定されている。
タスクTQ30は、量子化されたゲインの値とオリジナルの値との間の関係を評価する。この例において、タスクTQ30は、量子化されたゲインの値をオリジナルの値と比較する。タスクTQ30が、Rの量子化値がRの入力値以下であることを検出した場合、方法M100が終了する。しかしながら、タスクTQ30が、Rの量子化値がRの入力値を超過することを検出した場合、Rについて異なる量子化インデックスを選択するために、タスクTQ50を実行する。例えば、タスクTQ50は、q[iR]未満の量子化値を示すインデックスを選択するように構成されても良い。
典型的な実装例では、タスクTQ50は、量子化リスト、テーブル又はコードブック中の次に最も低い値を選択する。図20bは、タスクTQ50のそのような実装例TQ52を含む方法M100の実装例M110のためのフローチャートを示し、ここで、タスクTQ52は、量子化インデックスをデクリメントするように構成される。
ある場合には、Rの量子化された値が、ある僅かな量だけ、Rの値を超過することを可能にすることが望ましいことがある。例えば、Rの量子化された値が、知覚品質上、容認できるように低い効果があると予期されるある量又は比率だけ、Rの値を超過することを可能にすることは望ましい場合がある。図20cは、方法M100のそのような実装例M120のためのフローチャートを示す。方法M120は、Rの量子化された値を、Rより大きな上限と比較するタスクTQ30の実装例TQ32を含む。この例において、タスクTQ32は、q[iR]を、Rと閾値Tとの積と比較する。ここで、Tは、1に近いがより大きい値(例えば、1.1又は1.2)を有する。量子化された値が上記積未満(あるいは、以下)であることをタスクTQ32が検出した場合、タスクTQ50の実装例が実行する。タスクTQ30の他の実装例は、Rの値とRの量子化された値との間の差分が閾値に一致し及び/又は閾値を超過するか否か判断するように構成されても良い。
幾つかの場合において、Rに対するより低い量子化値を選択することは、オリジナルの量子化値に比較して、復号化された信号間のより大きな相違をもたらすことがあり得る。例えば、q[iR-1]がRの値よりとても小さい場合に、そのような状況が生じる場合がある。方法M100の更なる実装例は、タスクTQ50の実行又は配置が、候補量子化値(例えば、q[iR-1])のテストを条件とするような方法を含む。
図20dは、方法M100のそのような実装例M130のためのフローチャートを示す。方法M130は、候補量子化値(例えば、q[iR-1])をR未満の下限値と比較するタスクTQ40を含む。この例において、タスクTQ40は、q[iR]を、Rと閾値Tとの積と比較する。ここで、Tは、1に近いが1未満である値(例えば、0.8又は0.9)を有する。候補量子化値が上記積以下(あるいは、未満)であることをタスクTQ40が検出した場合、方法M130が終了する。量子化された値が上記積より大きい(あるいは、以上)ことをタスクTQ40が検出した場合、タスクTQ50の実装例が実行する。タスクTQ40の他の実装例は、候補量子化値とRの値との間の差分が閾値に一致し及び/又は閾値を超過するか否か判断するように構成されても良い。
方法M100の実装例は、フレームレベルゲインファクタS60bf及び/又はサブフレームゲインファクタS60bsに適用しても良い。典型的な応用では、そのような方法は、フレームレベルゲインファクタにのみ適用される。その方法がフレームレベルゲインファクタについて新しい量子化インデックスを選択する場合に、該フレームレベルゲインファクタの新しい量子化値に基づいて、対応するサブフレームゲインファクタS60bsを再計算することは望ましい場合がある。その代わりに、サブフレームゲインファクタS60bsの演算は、ゲインファクタ制限の方法が対応するフレームレベルゲインファクタ上で実行された後に生じるように構成されても良い。
図21は、ハイバンド符号器A202の実装例A203のブロック図を示す。符号器A203は、量子化ゲインファクタ値及びそれらのオリジナルの(すなわち、量子化前の(pre-quantization))値を受信するように構成されるゲインファクタリミッタL10を含む。リミッタL10は、それらの値の関係に従ってハイバンドゲインファクタS60bを出力するように構成される。例えば、リミッタL10は、量子化インデックスの一つ以上のストリームとしてハイバンドゲインファクタS60bを出力するために、ここに説明されるような方法M100の実装例を実行するように構成されても良い。図22は、量子化器430により生成されるようなサブフレームゲインファクタS60bsを出力し、また、リミッタL10を介してフレームレベルゲインファクタS60bfを出力するように構成されたハイバンド符号器A203の実装例A204のブロック図を示す。
図23aは、リミッタL10の一つの実装例L12のための動作線図を示す。リミッタL12は、q[iR]がRより大きいか否か判断するために、Rの量子化前の値と量子化後の(post-quantization)値とを比較する。この表現が真(true)である場合、リミッタL12は、Rに対する新しい量子化値を生成するために、インデックスiRの値を1だけデクリメントすることによって他の量子化インデックスを選択し、そうでない場合、インデックスiRの値は変化しない。
図23bは、リミッタL10の他の実装例L14のための動作線図を示す。この例において、量子化された値は、Rの値と閾値Tとの積と比較される。ここで、Tは、1に近いが1より大きい値(例えば、1.1又は1.2)を有する。q[iR]がTRより大きい(あるいは、以上である)場合、リミッタL14は、インデックスiRの値をデクリメントする。
図23cは、リミッタL10の更なる実装例L16のための動作線図を示し、それは、現在のそれを置き換えるように計画された量子化値が、Rのオリジナルの値に十分に近いか否かを判定するように構成される。例えば、リミッタL16は、次に最も低いインデックスを付けられた量子化値(例えば、q[iR-1])が、Rの量子化前の値から特定の距離又は量子化前の値の特定の割合の範囲内にあるか否かを判断するために付加的な比較を実行するように構成されても良い。この特定の例において、候補量子化値は、Rの値と閾値Tの値の積と比較される。ここで、Tは、1に近いが1未満である値(例えば、0.8又は0.9)を有する。q[iR-1]がTR未満(あるいは、以下)である場合、比較は失敗する。q[iR]及びq[iR-1]についての比較のいずれかが失敗する場合、インデックスiRの値は変化しない。
ゲインファクタ中のばらつきが復号化信号中のアーティファクトを生じさせる可能性があり、(例えば、1タップIIRフィルタなどのような平滑化フィルタの適用によって)ゲインファクタ平滑化の方法を実行するハイバンド符号器A200を構成することは望ましい場合がある。そのような平滑化は、フレームレベルゲインファクタS60bf及び/又はサブフレームゲインファクタS60bsに適用されても良い。そのような場合、リミッタL10及び/又はここに説明されるような方法M100の実装例は、量子化値iRを平滑化前の(pre-smoothed)値Rと比較するように構成されても良い。そのようなゲインファクタ平滑化に関係する更なる説明及び図は、2006年4月21日付け出願され「SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR SMOOTHING」と題された、Vosらの米国特許出願第11/408,390号の図48−55b及び添付されているテキスト(パラグラフ[000254]-[000272]を含んでいる)に見出されるであろう。また、この参考文献は、参照により組み込むことを許可する米国及び他の区域において、ゲインファクタ平滑化に関係する追加的開示を提供する目的で、参照してここに組み込まれる。
量子化器への入力信号が非常に滑らかな場合、量子化の出力空間における値の間の最小のステップに従って、量子化された出力がそれほど滑らかではないことが時々発生し得る。そのような効果は可聴アーティファクトをもたらす場合があり、ゲインファクタのこの効果を低減することは望ましいことがある。ある場合には、ゲインファクタ量子化のパフォーマンスが、時間ノイズシェイピング(temporal noise shaping)を組み込むための量子化器430を実装することにより、改善されても良い。そのようなシェイピングは、フレームレベルゲインファクタS60bf及び/又はサブフレームゲインファクタS60bsに適用されても良い。時間ノイズシェイピングを用いるゲインファクタの量子化に関係する更なる説明及び図は、米国特許出願第11/408,390号の図48−55b及び添付されているテキスト(パラグラフ[000254]-[000272]を含んでいる)に見出されるであろう。また、この参考文献は、参照により組み込むことを許可する米国及び他の区域において、時間ノイズシェイピングを用いるゲインファクタの量子化に関係する追加的開示を提供する目的で、参照してここに組み込まれる。
ハイバンド励振信号S120が、正規化された励振信号から得られる場合については、ソース励振信号の時間軸圧縮(time-warping)に従って、ハイバンド信号S30の時間エンベロープを時間軸圧縮(time-warp)することが望まれる場合がある。そのような時間軸圧縮(time-warping)に関係する更なる説明及び図は、2006年4月3日付け出願され「SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND TIME WARPING」と題されたVosらの米国特許出願(代理人明細書番号第050550号)の図25−29及び添付されているテキスト(パラグラフ[000157]-[000187]を含んでいる)に見出されるであろう。また、この参考文献は、参照により組み込むことを許可する米国及び他の区域において、ハイバンド信号S30の時間エンベロープの時間軸圧縮(time-warping)に関係する追加的開示を提供する目的で、参照してここに組み込まれる。
ハイバンド信号S30と合成ハイバンド信号S130との間の類似の程度は、復号化されたハイバンド信号S100がハイバンド信号S30にどれくらい良く似ているかを示しても良い。具体的には、ハイバンド信号S30の時間エンベロープと合成ハイバンド信号S130との間の類似は、復号化されたハイバンド信号S100が、良い音質を有し且つハイバンド信号S30に知覚的に似ている、と予期できることを示しても良い。それら時間上の(over time)エンベロープ間の大きな変化は、合成信号がオリジナルのものとは非常に異なるという目安として扱われても良く、また、そのような場合、量子化の前にそれらのゲインファクタを特定し減衰させることは望ましい場合がある。そのようなゲインファクタ減衰に関係する更なる説明及び図は、2006年4月21日付け出願され「SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR ATTENUATION」と題されたVosらの米国特許出願(代理人明細書番号第050558号)の図34−39及び添付されているテキスト(パラグラフ[000222]-[000236]を含んでいる)に見出されるであろう。また、この参考文献は、参照により組み込むことを許可する米国及び他の区域において、ゲインファクタ減衰に関係する追加的開示を提供する目的で、参照してここに組み込まれる。
図24は、ハイバンド復号器B200の実装例B202のブロック図を示す。ハイバンド復号器B202は、狭帯域励振信号S80に基づいてハイバンド励振信号S120を生成するように構成されるハイバンド励振生成器B300を含む。特定のシステムデザイン選択に応じて、ハイバンド励振生成器B300は、ここに述べられるようなハイバンド励振生成器A300の実装例のうちのいずれに従って実装されても良い。典型的には、特定の符号化システムのハイバンド符号器のハイバンド励振生成器と同じ応答を有するハイバンド励振生成器B300を実装することは望ましい。しかしながら、ほとんどの場合、狭帯域復号器B110は、典型的には、符号化狭帯域励振信号S50の逆量子化を実行するので、ハイバンド励振生成器B300は、狭帯域復号器B110から狭帯域励振信号S80を受信するように実装されても良く、符号化狭帯域励振信号S50を逆量子化するように構成された逆量子化器を含む必要はない。逆量子化された狭帯域励振信号を、それが例えばフィルタ330のような狭帯域合成フィルタへ入力される前に、フィルタするように構成された非スパースフィルタ600の実例を含むように、狭帯域復号器B110が実装されることもまた、可能である。
逆量子化器560は、ハイバンドフィルタパラメータS60aを(この例では、LSFのセットへ)逆量子化するように構成され、また、LSF対LPフィルタ係数変換570は、(例えば、狭帯域符号器A122の逆量子化器240及び変換250に関して前述したように)LSFをフィルタ係数のセットに変換するように構成される。他の実装例において、前述のように、相異なる係数セット(例えば、ケプストラム係数)及び/又は係数表現(例えば、ISP)が使用されても良い。ハイバンド合成フィルタB200は、ハイバンド励振信号S120及び1セットのフィルタ係数に従って、合成ハイバンド信号を生成するように構成される。(例えば、前述の符号器A202の例におけるように)ハイバンド符号器が合成フィルタを含んでいるシステムについては、その合成フィルタと同じ応答(例えば、同じ伝達関数)を有するハイバンド合成フィルタB200を実装することは望ましい場合がある。
ハイバンド復号器B202はまた、ハイバンドゲインファクタS60bを逆量子化するように構成された逆量子化器580、及び、ハイバンド信号S100を生成するために、合成ハイバンド信号に対して、逆量子化ゲインファクタを適用するように構成及びアレンジされたゲイン制御要素590(例えば、乗算器又は増幅器)を含む。フレームのゲインエンベロープが二つ以上のゲインファクタにより特定される場合については、ゲイン制御要素590は、対応するハイバンド符号器のゲイン演算器(例えば、ハイバンドゲイン演算器A230)により適用されるのと同一又は異なる窓関数でもよい窓関数に従って、それぞれのサブフレームに対してゲインファクタを適用するように構成されたロジックを含んでいても良い。ハイバンド復号器B202の他の実装例では、ゲイン制御要素590は、同様に構成されるが、代わりに狭帯域励振信号S80又はハイバンド励振信号S120に対して逆量子化ゲインファクタを適用するようにアレンジされる。ゲイン制御要素590はまた、(例えば、フレームレベルゲインファクタに従って入力信号を正規化するために、又は、サブフレームのセットに従ってその結果生じる信号を成形するために)二つ以上の時間分解能でゲインファクタを適用するように実装されても良い。
図8に示されるようなパラダイムに従った狭帯域復号器B110の実装例は、長期的な構造(ピッチ又は高調波構造)が復元された後、ハイバンド復号器B200へ狭帯域励振信号S80を出力するように構成されても良い。例えば、そのような復号器は、符号化狭帯域励振信号S50を逆量子化したものとして、狭帯域励振信号S80を出力するように構成されても良い。もちろん、ハイバンド復号器B200が狭帯域励振信号S80を得るために符号化狭帯域励振信号S50の逆量子化を実行するように、狭帯域復号器B110を実装することもまた可能である。
大部分はそれらがハイバンド符号化に適用されるように説明されたが、ここに開示された原理は、音声信号のあるサブバンドの、該音声信号の他のサブバンドに関連する、任意の符号化に適用されても良い。例えば、符号器のフィルタバンクは、ローバンド符号器へ、ローバンド信号(その代わりに又はそれに加えて、一つ以上のハイバンド信号)を出力するように構成されても良く、また、ローバンド符号器は、ローバンド信号のスペクトル解析を実行し、符号化狭帯域励振信号を拡張し、及び、オリジナルのローバンド信号に関連する符号化ローバンド信号に対するゲインエンベロープを演算するように構成されても良い。これらの動作の各々については、ここに説明されるようなバリエーションの全範囲のうちのいずれに従ってもそのような動作を実行するように、ローバンド符号器が構成されても良いことは、明らかに予期されこれによって開示される。
記述された構成の先の提示は、当業者が、ここに開示された構造及び原理を製造し又は利用することを可能にするために提供される。これらの構成への様々な修正が可能であり、また、ここに示された一般的な原理は、他の構成に同様に適用されても良い。例えば、構成は、ハードワイヤード回路、特定用途向けICの中に組み立てられた回路構成、又は、例えばマイクロプロセッサ若しくは他のデジタル信号処理ユニットのような論理素子のアレイにより実行可能なインストラクションであるコードのような、機械読み取り可能なコードである、不揮発性記憶装置へロードされたファームウェアプログラム又はデータ記憶媒体から若しくはデータ記憶媒体へロードされたソフトウェアとして、全体又は一部分において、実装されても良い。データ記録媒体は、例えば半導体メモリ(それは制限なしにダイナミック又はスタティックRAM(ランダムアクセスメモリ)、ROM(読み出し専用メモリ)、及び/又は、フラッシュRAMを含んでも良い)、又は、強誘電体メモリ、磁気抵抗メモリ、オブシンスキー効果メモリ、重合体メモリ若しくは相変化メモリのような、記憶素子のアレイであっても良いし、あるいは、例えば磁気又は光ディスクのようなディスク媒体であっても良い。用語「ソフトウェア」は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理素子により実行可能なインストラクションの任意の一つ以上のセット又はシーケンス、及びそれらのような例の任意の組み合わせを含むと理解されるべきである。
ハイバンドゲインファクタ演算器A230、ハイバンド符号器A200、ハイバンド復号器B200、広帯域音声符号器A100及び広帯域音声復号器B100の実装例の様々な要素はまた、例えば、同じチップ上に又はチップセット中の二つ以上のチップ中に備わる電子的及び/又は光学的なデバイスとして、実装されても良いが、そのような制限のない他の構成も考えられる。そのような装置の一つ以上の要素(例えば、ハイバンドゲインファクタ演算器A230、量子化器430、及び/又は、リミッタL10)は、例えばマイクロプロセッサ、内蔵されたプロセッサ、IPコア、デジタル信号プロセッサ、FPGA(フィールドプログラマブルゲートアレイ)、ASSP(特定用途向け標準製品)及びASIC(特定用途向けIC)のような論理素子(例えば、トランジスタ、ゲート)の一つ以上の固定又はプログラマブルアレイ上で実行するように構成されたインストラクションの一つ以上のセットとして、全体又は一部分において、実装されても良い。一つ以上のそのような要素が、共通の構造(例えば、その時々において異なる要素に対応するコードの部分、その時々において異なる要素に対応するタスクを実行するために実行されるインストラクションのセット、又は、その時々において異なる要素のための動作を実行する電子的及び/又は光学的なデバイスの構成を実行するために用いられるプロセッサ)を有することもまた可能である。さらに、例えば装置が埋め込まれているデバイス若しくはシステムの他の動作に関係するタスクのような、装置の動作と直接関係しないタスクを実行し又はインストラクションのセットを実行するために、一つ以上のそのような要素を用いることが可能である。
それら構成はまた、例えば、それらのような方法を実行するように構成された構造の説明によって、明らかにここに開示されるように、音声符号化、符号化及び復号化の更なる方法を含んでも良い。これらの方法の各々はまた、論理素子のアレイを含むマシン(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ又は他の有限状態マシン)により読み取り可能及び/又は実行可能なインストラクションの一つ以上のセットとして、(例えば、上にリストされたような一つ以上のデータ記録媒体中に)明確に具体化されても良い。したがって、本開示は、上に示された構成に制限されるように意図されるものではなく、むしろ、オリジナルの開示の一部を形成する、出願された付属の特許請求の範囲を含めて、任意の方法でここに開示された原理及び新規な特徴と矛盾しない最も広い範囲を与えられるものである。

Claims (37)

  1. 音声処理の方法において、前記方法は、
    (A)音声信号の第1のサブバンドに基づく第1の信号の時間部分と、(B)前記音声信号の第2のサブバンドから得られる成分に基づく第2の信号の時間部分との間の関係に基づいて、ゲインファクタ値を演算することと、
    前記ゲインファクタ値に従って、順序付けられた量子化値のセットの中から第1のインデックスを選択することと、
    前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価することと、
    前記評価の結果に従って、前記順序付けられた量子化値のセットの中から第2のインデックスを選択することを含む方法。
  2. 前記第1の信号の時間部分は前記第1の信号のフレームであり、前記第2の信号の対応する時間部分は前記第2の信号のフレームである請求項1に記載の音声処理の方法。
  3. 前記第1のサブバンドはハイバンド信号であり、前記第2のサブバンドは狭帯域信号である請求項1に記載の音声処理の方法。
  4. 前記第1のサブバンドはハイバンド信号であり、前記第2の信号はハイバンド信号を合成したものである請求項1に記載の音声処理の方法。
  5. 前記第2の信号は、前記第1のサブバンドから得られる成分に基づいている請求項1に記載の音声処理の方法。
  6. 前記第1のサブバンドから得られる成分は、前記第1のサブバンドのスペクトルエンベロープである請求項5に記載の音声処理の方法。
  7. 前記音声信号の第2のサブバンドから得られる成分は、符号化励振信号である請求項1に記載の音声処理の方法。
  8. 前記第2の信号は、前記第1のサブバンドのスペクトルエンベロープに基づいている請求項7に記載の音声処理の方法。
  9. 前記第1の信号の時間部分と、前記第2の信号の対応する時間部分との間の関係は、前記第1の信号の時間部分のエネルギーの測度と、前記第2の信号の対応する時間部分のエネルギーの測度との間の関係である請求項1に記載の音声処理の方法。
  10. 前記ゲインファクタ値の演算は、前記第1の信号の時間部分のエネルギーの測度と前記第2の信号の対応する時間部分のエネルギーの測度との比に基づくゲインファクタ値の演算を含む請求項9に記載の音声処理の方法。
  11. 前記第1のインデックスの選択は、前記ゲインファクタ値を、複数の前記量子化値の各々と比較することを含む請求項1に記載の音声処理の方法。
  12. 前記第1のインデックスは、前記順序付けられたセットのうちで、前記ゲインファクタ値に最も近い量子化値を示すものである請求項1に記載の音声処理の方法。
  13. 前記関係の評価は、前記第1のインデックスにより示される量子化値が前記ゲインファクタ値を超えるか否か判定することを含む請求項1に記載の音声処理の方法。
  14. 前記関係の評価は、(C)前記第1のインデックスにより示される量子化値が、前記ゲインファクタ値を、特定の量だけ超過するか否か判断することと、(D)前記第1のインデックスにより示される量子化値が、前記ゲインファクタ値を、前記ゲインファクタ値の特定の割合だけ超過するか否か判断することのうちの少なくとも一つを含む請求項1に記載の音声処理の方法。
  15. 前記第2のインデックスの選択は、前記第1のインデックスをデクリメントすることを含む請求項1に記載の音声処理の方法。
  16. 前記第2のインデックスは、前記第1のインデックスにより示される量子化値未満である量子化値を示す請求項1に記載の音声処理の方法。
  17. 前記第2のインデックスは、前記順序付けられたセットのうちで、前記ゲインファクタ値を超過せずに、前記ゲインファクタ値に最も近い量子化値を示す請求項1に記載の音声処理の方法。
  18. 前記第2のインデックスの選択は、前記ゲインファクタ値と前記第2のインデックスにより示される量子化値との間の関係を評価することを含む請求項1に記載の音声処理の方法。
  19. 前記ゲインファクタ値と前記第2のインデックスにより示される量子化値との間の関係の評価は、前記第2のインデックスにより示される量子化値が前記ゲインファクタ値の特定の割合の範囲内にあるか否か判断することを含む請求項18に記載の音声処理の方法。
  20. コンピュータ読み取り可能な媒体を含むコンピュータプログラムプロダクトにおいて、
    前記コンピュータ読み取り可能な媒体は、
    少なくとも一つのコンピュータに、(A)音声信号の第1のサブバンドに基づく第1の信号の時間部分と、(B)前記音声信号の第2のサブバンドから得られる成分に基づく第2の信号の時間部分との間の関係に基づいて、ゲインファクタ値を演算させるためのコードと、
    少なくとも一つのコンピュータに、前記ゲインファクタ値に従って、順序付けられた量子化値のセットの中から第1のインデックスを選択させるためのコードと、
    少なくとも一つのコンピュータに、前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価させるためのコードと、
    少なくとも一つのコンピュータに、前記評価の結果に従って、前記順序付けられた量子化値のセットの中から第2のインデックスを選択させるためのコードとを含むコンピュータプログラムプロダクト。
  21. 音声処理のための装置において、前記装置は、
    (A)音声信号の第1のサブバンドに基づく第1の信号の時間部分と、(B)前記音声信号の第2のサブバンドから得られる成分に基づく第2の信号の時間部分との間の関係に基づいて、ゲインファクタ値を演算するように構成された演算器と、
    前記ゲインファクタ値に従って、順序付けられた量子化値のセットの中から第1のインデックスを選択するように構成された量子化器と、
    (A)前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価し、(B)前記評価の結果に従って、前記順序付けられた量子化値のセットの中から第2のインデックスを選択するように構成されたリミッタとを含む装置。
  22. 前記第1の信号の時間部分は前記第1の信号のフレームであり、前記第2の信号の対応する時間部分は前記第2の信号のフレームである請求項21に記載の装置。
  23. 前記第1のサブバンドはハイバンド信号であり、前記第2のサブバンドは狭帯域信号である請求項21に記載の装置。
  24. 前記音声信号の第2のサブバンドから得られる成分は、符号化励振信号である請求項21に記載の装置。
  25. 前記第2の信号は、前記第1のサブバンドのスペクトルエンベロープに基づいている請求項24に記載の装置。
  26. 前記演算器は、前記第1の信号の時間部分のエネルギーの測度と、前記第2の信号の対応する時間部分のエネルギーの測度との比に基づいて、前記ゲインファクタ値を演算するように構成される請求項21に記載の装置。
  27. 前記リミッタは、前記第1のインデックスにより示される量子化値が前記ゲインファクタ値を超過するか否か判断することによって、前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との関係を評価するように構成される請求項21に記載の装置。
  28. 前記リミッタは、(C)前記第1のインデックスにより示される量子化値が、前記ゲインファクタ値を、特定の量だけ超過するか否か判断することと、(D)前記第1のインデックスにより示される量子化値が、前記ゲインファクタ値を、前記ゲインファクタ値の特定の割合だけ超過するか否か判断することのうちの少なくとも一つによって、前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価するように構成される請求項21に記載の装置。
  29. 前記第2のインデックスは、前記順序付けられたセットのうちで、前記ゲインファクタ値を超過せずに、前記ゲインファクタ値に最も近い量子化値を示す請求項21に記載の装置。
  30. 前記リミッタは、前記第2のインデックスにより示される量子化値が前記ゲインファクタ値の特定の割合の範囲内にあるか否か判断するように構成される請求項21に記載の装置。
  31. 前記装置は、前記演算器、前記量子化及び前記リミッタを含む符号器を有するセルラ電話を含む請求項21に記載の装置。
  32. 前記装置は、インターネットプロトコルのバージョンに準拠するフォーマットを有する複数のパケットを送信するように構成されたデバイスを含み、前記複数のパケットは、前記第1のサブバンドを符号化するパラメータ、前記第2のサブバンドを符号化するパラメータ及び前記第2のインデックスを含む請求項21に記載の装置。
  33. 音声処理のための装置において、前記装置は、
    (A)音声信号の第1のサブバンドに基づく第1の信号の時間部分と、(B)前記音声信号の第2のサブバンドから得られる成分に基づく第2の信号の時間部分との間の関係に基づいて、ゲインファクタ値を演算するための手段と、
    前記ゲインファクタ値に従って、順序付けられた量子化値のセットの中から第1のインデックスを選択するための手段と、
    前記ゲインファクタ値と前記第1のインデックスにより示される量子化値との間の関係を評価し、前記評価の結果に従って、前記順序付けられた量子化値のセットの中から第2のインデックスを選択するための手段とを含む装置。
  34. 前記音声信号の第2のサブバンドから得られる成分は、符号化励振信号である請求項33に記載の装置。
  35. 前記第2の信号は、前記第1のサブバンドのスペクトルエンベロープに基づいている請求項34に記載の装置。
  36. 前記演算のための手段は、前記第1の信号の時間部分のエネルギーの測度と、前記第2の信号の対応する時間部分のエネルギーの測度との比に基づいて、前記ゲインファクタ値を演算するように構成される請求項33に記載の装置。
  37. 前記第2のインデックスは、前記順序付けられたセットのうちで、前記ゲインファクタ値を超過せずに、前記ゲインファクタ値に最も近い量子化値を示す請求項33に記載の装置。
JP2009523002A 2006-07-31 2007-07-31 ゲインファクタ制限のためのシステム、方法及び装置 Active JP5290173B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US83465806P 2006-07-31 2006-07-31
US60/834,658 2006-07-31
US11/610,104 2006-12-13
US11/610,104 US9454974B2 (en) 2006-07-31 2006-12-13 Systems, methods, and apparatus for gain factor limiting
PCT/US2007/074794 WO2008030673A2 (en) 2006-07-31 2007-07-31 Systems, methods, and apparatus for gain factor limiting

Publications (2)

Publication Number Publication Date
JP2009545775A true JP2009545775A (ja) 2009-12-24
JP5290173B2 JP5290173B2 (ja) 2013-09-18

Family

ID=38987459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009523002A Active JP5290173B2 (ja) 2006-07-31 2007-07-31 ゲインファクタ制限のためのシステム、方法及び装置

Country Status (11)

Country Link
US (1) US9454974B2 (ja)
EP (1) EP2047466B1 (ja)
JP (1) JP5290173B2 (ja)
KR (1) KR101078625B1 (ja)
CN (1) CN101496101B (ja)
BR (1) BRPI0715516B1 (ja)
CA (1) CA2657910C (ja)
ES (1) ES2460893T3 (ja)
RU (1) RU2420817C2 (ja)
TW (1) TWI352972B (ja)
WO (1) WO2008030673A2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949117B2 (en) 2009-10-14 2015-02-03 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and methods therefor
JP2015537254A (ja) * 2013-01-15 2015-12-24 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法、復号化方法、符号化装置及び復号化装置
JP2016507783A (ja) * 2013-02-08 2016-03-10 クゥアルコム・インコーポレイテッドQualcomm Incorporated ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2019135551A (ja) * 2014-06-12 2019-08-15 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ信号の時間包絡線を処理するための方法および装置、ならびにエンコーダ

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
KR20080047443A (ko) 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
WO2009116815A2 (en) * 2008-03-20 2009-09-24 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding using bandwidth extension in portable terminal
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
GEP20146081B (en) * 2009-12-07 2014-04-25 Dolby Laboratories Licensing Corp Decoding of multichannel aufio encoded bit streams using adaptive hybrid transformation
WO2012108798A1 (en) 2011-02-09 2012-08-16 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals
WO2012112357A1 (en) * 2011-02-16 2012-08-23 Dolby Laboratories Licensing Corporation Methods and systems for generating filter coefficients and configuring filters
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN104321815B (zh) * 2012-03-21 2018-10-16 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
CN105324982B (zh) * 2013-05-06 2018-10-12 波音频有限公司 用于抑制不需要的音频信号的方法和设备
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830065A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
CN104681032B (zh) * 2013-11-28 2018-05-11 中国移动通信集团公司 一种语音通信方法和设备
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN105225671B (zh) 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及系统
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
US10020002B2 (en) * 2015-04-05 2018-07-10 Qualcomm Incorporated Gain parameter estimation based on energy saturation and signal scaling
US10499165B2 (en) * 2016-05-16 2019-12-03 Intricon Corporation Feedback reduction for high frequencies
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143712A (ja) * 1988-11-25 1990-06-01 Sony Corp デイジタル信号処理装置
JPH0830295A (ja) * 1994-07-20 1996-02-02 Sony Corp ディジタル・オーディオ信号記録・再生方法と装置
JPH08123500A (ja) * 1994-10-24 1996-05-17 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH09230897A (ja) * 1996-02-22 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0828875B2 (ja) 1989-08-21 1996-03-21 三菱電機株式会社 符号化装置および復号化装置
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
AU683058B2 (en) 1995-04-19 1997-10-30 Motorola, Inc. Method and apparatus for low rate coding and decoding
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6397178B1 (en) * 1998-09-18 2002-05-28 Conexant Systems, Inc. Data organizational scheme for enhanced selection of gain parameters for speech coding
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US7260523B2 (en) 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
DE60217522T2 (de) * 2001-08-17 2007-10-18 Broadcom Corp., Irvine Verbessertes verfahren zur verschleierung von bitfehlern bei der sprachcodierung
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US20040002856A1 (en) 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
WO2004097797A1 (en) * 2003-05-01 2004-11-11 Nokia Corporation Method and device for gain quantization in variable bit rate wideband speech coding
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7613607B2 (en) * 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
TWI324336B (en) 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143712A (ja) * 1988-11-25 1990-06-01 Sony Corp デイジタル信号処理装置
JPH0830295A (ja) * 1994-07-20 1996-02-02 Sony Corp ディジタル・オーディオ信号記録・再生方法と装置
JPH08123500A (ja) * 1994-10-24 1996-05-17 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH09230897A (ja) * 1996-02-22 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200600501013; 押切正浩 他: '"ピッチフィルタ処理によるスペクトル符号化を用いた7/10/15kHz帯域スケーラブル符号化"' 電子情報通信学会論文誌D Vol.J89-D,No.2, 20060201, p.281-291 *
CSNJ201110016210; 押切正浩 他: '"AMRをコアにした狭帯域/広帯域スケーラブル音声符号化方式"' 日本音響学会2006年春季研究発表会講演論文集CD-ROM , 20060307, p.389-390 *
JPN6011062821; 押切正浩 他: '"AMRをコアにした狭帯域/広帯域スケーラブル音声符号化方式"' 日本音響学会2006年春季研究発表会講演論文集CD-ROM , 20060307, p.389-390 *
JPN6011062822; 押切正浩 他: '"ピッチフィルタ処理によるスペクトル符号化を用いた7/10/15kHz帯域スケーラブル符号化"' 電子情報通信学会論文誌D Vol.J89-D,No.2, 20060201, p.281-291 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949117B2 (en) 2009-10-14 2015-02-03 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and methods therefor
JP2015537254A (ja) * 2013-01-15 2015-12-24 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法、復号化方法、符号化装置及び復号化装置
JP2017151466A (ja) * 2013-01-15 2017-08-31 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法、復号化方法、符号化装置及び復号化装置
US9761235B2 (en) 2013-01-15 2017-09-12 Huawei Technologies Co., Ltd. Encoding method, decoding method, encoding apparatus, and decoding apparatus
US10210880B2 (en) 2013-01-15 2019-02-19 Huawei Technologies Co., Ltd. Encoding method, decoding method, encoding apparatus, and decoding apparatus
US10770085B2 (en) 2013-01-15 2020-09-08 Huawei Technologies Co., Ltd. Encoding method, decoding method, encoding apparatus, and decoding apparatus
US11430456B2 (en) 2013-01-15 2022-08-30 Huawei Technologies Co., Ltd. Encoding method, decoding method, encoding apparatus, and decoding apparatus
US11869520B2 (en) 2013-01-15 2024-01-09 Huawei Technologies Co., Ltd. Encoding method, decoding method, encoding apparatus, and decoding apparatus
JP2016507783A (ja) * 2013-02-08 2016-03-10 クゥアルコム・インコーポレイテッドQualcomm Incorporated ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2018109770A (ja) * 2013-02-08 2018-07-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2019135551A (ja) * 2014-06-12 2019-08-15 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ信号の時間包絡線を処理するための方法および装置、ならびにエンコーダ

Also Published As

Publication number Publication date
TWI352972B (en) 2011-11-21
RU2009107198A (ru) 2010-09-10
US20080027718A1 (en) 2008-01-31
BRPI0715516B1 (pt) 2019-12-10
WO2008030673A3 (en) 2008-06-26
EP2047466A2 (en) 2009-04-15
TW200820219A (en) 2008-05-01
US9454974B2 (en) 2016-09-27
CN101496101B (zh) 2013-01-23
EP2047466B1 (en) 2014-03-26
WO2008030673A2 (en) 2008-03-13
CN101496101A (zh) 2009-07-29
KR101078625B1 (ko) 2011-11-01
CA2657910A1 (en) 2008-03-13
ES2460893T3 (es) 2014-05-14
BRPI0715516A2 (pt) 2013-07-09
CA2657910C (en) 2015-04-28
JP5290173B2 (ja) 2013-09-18
RU2420817C2 (ru) 2011-06-10
KR20090025349A (ko) 2009-03-10

Similar Documents

Publication Publication Date Title
JP5290173B2 (ja) ゲインファクタ制限のためのシステム、方法及び装置
JP5203929B2 (ja) スペクトルエンベロープ表示のベクトル量子化方法及び装置
JP5722437B2 (ja) 広帯域音声コーディングのための方法、装置、およびコンピュータ可読記憶媒体
CN109545236B (zh) 改进时域编码与频域编码之间的分类
DK1875463T3 (en) SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY
CN101180676A (zh) 用于谱包络表示的向量量化的方法和设备
CN110136742B (zh) 执行噪声调制和增益调节的系统和方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120229

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120307

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120329

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120405

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120419

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130605

R150 Certificate of patent or registration of utility model

Ref document number: 5290173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250