JP2006510922A - 帯域幅適応性量子化方法と装置 - Google Patents

帯域幅適応性量子化方法と装置 Download PDF

Info

Publication number
JP2006510922A
JP2006510922A JP2004527978A JP2004527978A JP2006510922A JP 2006510922 A JP2006510922 A JP 2006510922A JP 2004527978 A JP2004527978 A JP 2004527978A JP 2004527978 A JP2004527978 A JP 2004527978A JP 2006510922 A JP2006510922 A JP 2006510922A
Authority
JP
Japan
Prior art keywords
range
frequency
signal
vector quantizer
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004527978A
Other languages
English (en)
Inventor
エル−マレー、カレド・ヘルミ
カンダダイ、アナンサパドマナブハン・アラサニパライ
マンジュナス、シャラス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2006510922A publication Critical patent/JP2006510922A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Abstract

【課題】帯域幅適応性量子化方法と装置
【解決手段】方法および装置は音響信号のタイプと、ベクトル量子化の前にパラメータ情報を選択的に削除するために音響信号によって示される周波数スペクトルのタイプとを決定することのために与えられる。(430)他方では削除されたパラメータに割り当てられるであろうビットはその後残存のパラメータの量子化に再割当てされることができ、それは合成された音響信号の知覚的な品質の改善という結果になる。(450)代替案として、削除されたパラメータに割り当てられていたであろうビットは落とされ、全体のビットレート減少という結果になる(440)。

Description

本発明は通信システムに関し、そしてより詳しくは、通信システムにおける広帯域信号の伝送に関する。
無線通信分野は、例えば、コードレス電話機、ページング、無線ローカルループ、パーソナル・ディジタル・アッシスタント(PDA)、インターネット電話、および衛星通信システムを含む多くのアプリケーションを有する。特に重要なアプリケーションは遠隔加入者用のセルラ電話システムである。この中で使用されるように、術語“セルラ”システムは、セルラまたはパーソナル通信サービス(PCS)周波数のいずれかを使用しているシステムを含む。種々の無線インターフェイスは、例えば、周波数分割多重アクセス(FDMA)、時分割多重アクセス(TDMA)、符号分割多重アクセス(CDMA)を含むようなセルラ電話システムのために開発された。それとの接続では、例えば、進歩した移動電話サービス(AMPS)、移動体用グローバルシステム(GSM)、および暫定標準95(IS−95)を含む種々の国内および国際標準が制定されていた。IS−95およびそれの派生物(この中ではしばしば集合的にIS−95と呼ばれる)、IS−95A、IS−95B、ANSI J−STD−008、および提案された高速データシステムは電気通信工業協会(TIA)および他の周知の標準類団体によって公布される。
IS−95標準の使用に従って構成されたセルラ電話システムは、高度に効率的で強いセルラ電話サービスを提供するためにCDMA信号処理技術を使用する。実質的にIS−95標準の使用に従って構成された例示的なセルラ電話システムは、米国特許番号第5,103,459号および第4,901,307号に記述されており、これらは本発明の譲受人に譲渡され、引用されてこの中に組み込まれる。CDMA技術を使用している例示的なシステムは、TIAにより発行された、(この中ではcdma2000と呼ばれる)cdma2000 ITU−R無線伝送技術(RTT)候補者寄託である。cdma2000用の標準はIS−2000の草案版内で与えられ、そしてTIAによって同意された。もう1つのCDMA標準は、第3世代パートナーシップ・プロジェクト“3GPP”、文書番号第3G TS25.211号、第3G TS25.212号、第3G TS25.213号、および第3G TS25.214号において具体化されたように、W−CDMA標準である。
上に引用された電気通信標準は、実施され得る種々の通信システムのほんのいくつかの例に過ぎない。これらのシステムの大部分は伝統的な地上有線電話システムと一緒に動作するように構成される。伝統的な地上有線電話システムでは、伝送媒体および端末は4000Hzに帯域制限される。音声は典型的に、このレンジ外で運ばれる制御および信号オーバヘッドと共に、300−3400Hzの狭いレンジで伝送される。地上有線電話システムの物理的な制約の視野内では、セルラ電話システム内の信号伝播は、セルラ加入者ユニットから生起される呼が地上有線ユニットに送信され得るように、これらの同じ狭い周波数制約で実施される。しかしながら、セルラ電話システムは、狭い周波数レンジを必要とする物理的な制約がセルラシステム内には存在しないので、より広い周波数レンジを有する信号を送信することが可能である。広帯域信号の使用はセルラ電話のエンドユーザにとって知覚的に有意な音響品質を提供する。よって、セルラ電話システムを介した広帯域信号の送信への関心は、より一般的となった。より広い周波数レンジを有する信号を発生するための例示的な標準は、1989年に発表された、文書G.722ITU−T、タイトル“64kBits/s内の7kHz音声符号化”内に公表される。
セルラシステム上の広帯域信号の伝送は、信号圧縮装置のための改善のような、システムへの調整を伴う。人間の音声発生のモデルに関連するパラメータを抽出することによって音声を圧縮するための技術を使用する装置は音声符号器と言われる。音声符号器は到来音声信号を数ブロックの時間、または分析フレームに分割する。音声符号器は典型的に符号器と復号器とから成る。符号器はある関連パラメータを抽出するために到来音声フレームを分析し、そしてその後このパラメータをバイナリ表示、即ち、1組のビット、またはバイナリ・データパケットに量子化する。データパケットは通信チャネルを通して受信器と復号器とに伝送される。復号器はデータパケットを処理し、パラメータを生成するためにそれらを逆量子化し(unquantize)、そしてこの逆量子化されたパラメータを使用して音声フレームを再合成する。
音声符号器の機能は、音声内に固有のすべての自然冗長度を取り除くことによって、ディジタル化された音声信号を低いビットレートの信号に圧縮することである。ディジタル圧縮は1組のパラメータを有する入力音声フレームを表示することにより、そして1組のビットを有するパラメータを表示するために量子化を使用することにより達成される。もしも入力音声フレームがビット数Nを有し、そして音声符号器により生成されたデータパケットがビット数Nを有するとすれば、その時音声符号器によって達成される圧縮ファクタはC=N/Nである。課題は目標の圧縮ファクタを達成する一方で、復号された音声の高い音声品質を維持することである。音声符号器の性能は、音声モデル、または上述された分析と合成との組合わせがいかに良く行われるか、およびパラメータ量子化処理がフレーム当たりのNビットの目標ビットレートでいかに良く行われるかによる。音声モデルのゴールはこのように、各フレームについて小規模の組のパラメータ付きの、音声信号の本質、または目標音声品質を獲得することである。
広帯域符号器について、信号の余分の帯域幅は従前の狭帯域信号よりも高い符号化ビットレートを必要とする。よって、増加した帯域幅に関連する高品質を犠牲にせずに広帯域音声信号の符号化ビットレートを減少させるために、新しいビットレート減少技術が必要になる。
[発明の概要]
方法および装置は信号の知覚的な品質を保存する一方で、広帯域音声および音響信号の符号化レートを減少させるためにこの中に示される。1つの局面では、帯域幅適応性ベクトル量子化器が示され、それは、周波数スペクトルの少なくとも1つの分析範囲に関連する信号特性を決定するためのスペクトル内容エレメントと、ここにおいて信号特性は知覚的に無意味な信号の存在または知覚的に有意な信号の存在を示し、およびもしも信号特性が知覚的に無意味な信号の存在を示すならば少なくとも1つの分析範囲から離れて量子化ビットを選択的に割り当てるために少なくとも1つの分析範囲に関連する信号特性を使用するように構成されたベクトル量子化器とを具備する。
もう1つの局面では、ボコーダのビットレートを減少させるための方法が示され、この方法は、周波数スペクトルの範囲内の周波数ダイオフの存在(die-off presence)を決定すること;周波数ダイオフ範囲に関連する複数の係数を量子化することをやめること;および所定のコードブックを使用している残存の周波数スペクトルを量子化すること;を具備する。
もう1つの局面では、1方法はボコーダを通過する音響信号の知覚的な品質を高めるために示され、この方法は、周波数スペクトルの範囲内の周波数ダイオフの存在を決定すること;周波数ダイオフ範囲に関連する複数の係数を量子化することをやめること;他方では周波数ダイオフ範囲を示すために使用されるであろう複数の量子化ビットを再割当てすること;およびスーパーコードブックを使用している残存の周波数スペクトルを量子化することを具備し、ここにおいてこのスーパーコードブックは他方では周波数ダイオフ範囲を示すために使用されるであろう複数の量子化ビットを具備する。
図1に図示されるように、無線通信ネットワーク10は通常複数の遠隔局(加入者ユニットまたは移動局あるいはユーザ装置とも言われる)12a−12d、複数の基地局(基地局トランシーバ(BTS)またはノードBとも言われる)14a-14c、基地局コントローラ(BSC)(無線ネットワーク・コントローラまたはパケット制御機能とも言われる)16、移動体交換センタ(MSC)またはスイッチ18、パケットデータ・サービングノード(PDSN)またはインターワーキング機能(IWF)20、公衆電話交換ネットワーク(PSTN)22(典型的に電話会社)、およびインターネット・プロトコル(IP)ネットワーク24(典型的にインターネット)を含む。単純にするため、4遠隔局12a−12d、3基地局14a−14c、1BSC16、1MSC18、および1PDSN20が示される。任意数の遠隔局12、基地局14、BSC16、MSC18、およびPDSN20が有り得ることは、この分野の技術者によって理解されるであろう。
1つの実施形態では無線通信ネットワーク10はパケットデータサービス・ネットワークである。遠隔局12a−12dは、携帯電話機、IPベースのウェブ・ブラウザ・アプリケーションを実行するラップトップ・コンピュータに接続されるセルラ電話機、関連するハンドフリー・カーキットを有するセルラ電話機、IPベースのウェブ・ブラウザ・アプリケーションを実行するパーソナル・データ・アッシスタント(PDA)、携帯型コンピュータに組み込まれた無線通信モジュール、あるいは無線ローカルループまたはメータ読取システム内で見つけ出される可能性があるような固定位置通信モジュールのような、任意の多数の異なるタイプの無線通信装置であってもよい。最も一般的な実施形態では、遠隔局は任意のタイプの通信ユニットであってもよい。
遠隔局12a−12dは好都合に、例えば、EIA/TIA/IS−707標準に記述されたような1つまたはそれ以上の無線パケットデータ・プロトコルを実行するように構成されてもよい。特定の実施形態では、遠隔局12a−12dはIPネットワーク24を行先と定めるIPパケットを発生し、そしてこのIPパケットをポイント・ツー・ポイント・プロトコル(PPP)を使用しているフレームにカプセル化する。
1つの実施形態ではIPネットワーク24はPSDN20に連結され、PDSN20はMSC18に連結され、MSCはBSC16およびPSTN22に連結され、そしてBSC16は例えば、E1、T1、非同期転送モード(ATM)、インターネット・プロトコル(IP)、ポイント・ツー・ポイント・プロトコル(PPP)、フレームリレー、高ビットレート・ディジタル加入者線(HDSL)、非対象ディジタル加入者線(ADSL)、または他の包括的ディジタル加入者線装置およびサービス(xDSL)を含む任意のいくつかの既知のプロトコルに従う音声および/またはデータパケットの伝送用に構成された有線を介して基地局14a−14cに連結される。代替の実施形態では、BSC16はPDSN20に直接連結され、そしてMSC18はPSDN20に連結されない。
無線通信ネットワーク10の典型的な動作中に、基地局14a−14cは電話呼、ウェブ・ブラウジング、または他のデータ通信に従事した種々の遠隔局12a−12dからの数組のアップリンク信号を受信して復調する。与えられた基地局14a−14cによって受信された各アップリンク信号はこの基地局14a−14c内で処理される。各基地局14a−14cは遠隔局12a−12dへの数組のダウンリンク信号を変調して送信することによって複数の遠隔局12a−12dと通信することができる。例えば、図1に示されるように、基地局14aは第1および第2の遠隔局12a,12bと同時に通信し、そして基地局14cは第3および第4の遠隔局12c,12dと同時に通信する。結果としてのパケットはBSC16に順方向送信され、それは呼資源の割当てと、1つの基地局14a−14cからもう1つの基地局14a−14cへの特定の遠隔局12a−12dのための呼のソフトハンドオフのオーケストレーション(orchestration)を含む移動性管理機能性とを提供する。例えば、遠隔局12cは2基地局14b,14cと同時に通信している。結局、遠隔局12cが1つの基地局14cから十分遠くに移動すると、その呼は他の基地局14bにハンドオフされるであろう。
もしも伝送が従前の電話呼であれば、BSC16は受信データをMSC18に送るであろうし、それはPSTN22とのインターフェイスのための追加のルーチングサービスを提供する。もしも伝送がIPネットワーク24を行先と定めたデータ呼のようなパケットベースの伝送であれば、MSC18はそのデータパケットをPSTN20に送るであろうし、それはそのパケットをIPネットワーク24に送出するであろう。代替として、BSC16はそのパケットをPSTN20に直接送るであろうし、それはそのパケットをIPネットワーク24に送出する。
WCDMAシステムでは、無線通信システム・コンポーネントの術語は異なるが、しかし機能性は同じである。例えば、基地局はUTMS地上局無線アクセスネットワーク(UTRAN)内で動作している無線ネットワーク・コントローラ(RNC)とも呼ばれることができ、ここにおいて“UTMS”はユニバーサル移動通信システムの頭字語である。
典型的に、アナログ音声信号のディジタル信号への変換は符号器によって行われ、そしてディジタル信号の音声信号への逆変換は復号器によって行われる。例示的なCDMAシステムでは、符号化部と復号化部との両者を備えるボコーダが遠隔局および基地局内で照合される。例示的なボコーダは米国特許番号第5,414,796号、タイトル“可変レート・ボコーダ(Variable Rate Vocoder)”に記述されており、本発明の譲受人に譲渡され、引用されてこの中に組み込まれる。ボコーダでは、符号化部は人間の音声発生モデルに関連するパラメータを抽出する。抽出されたパラメータはその後量子化され、そして伝送チャネルを介して伝送される。復号化部は伝送チャネルを介して受信された量子化パラメータを使用している音声を再合成する。このモデルは時変(time-varying)音声信号を正確にモデル化するために絶えず変化している。
このように、音声は数ブロックの時間、即ち分析フレームに分割され、その間パラメータが計算される。パラメータはその後、各新フレームについて更新される。この中で使用されたように、単語“復号器”は伝送媒体を介して受信されたディジタル信号を変換するために使用され得る任意の装置または装置の任意の部分を指す。単語“符号器”は音響信号をディジタル信号に変換するために使用され得る任意の装置または装置の任意の部分を指す。よって、この中に記述された実施形態はCDMAシステムのボコーダで、または代わりとして、非CDMAシステムの符号器および復号器で実施されることができる。
符号励起線形予測符号化(CELP)法が多くの音声圧縮アルゴリズムにおいて使用され、ここにおいてフィルタは音声信号のスペクトル・マグニチュードをモデル化するために使用される。フィルタは出力波形を作り出すために入力波形の周波数スペクトルを修正する装置である。そのような修正は転送関数H(f)=Y(f)/X(f)によって特徴づけられることができ、それは周波数領域における修正出力波形y(t)対原入力波形x(t)に関連性がある。
適切なフィルタ係数のために、このフィルタを通過する励起信号は、音声信号にぴったり近似している波形という結果になるであろう。最適な励起信号の選択はこの中に記述された実施形態の範囲に影響を及ぼさず、そしてさらに検討されないであろう。フィルタの係数は線形予測技術を使用している各音声フレームについて計算されるので、フィルタはその後線形予測符号化(LPC)フィルタと呼ばれる。フィルタ係数は下記の転送関数の係数である:
Figure 2006510922
ここにおいて、LはLPCフィルタの次数である。
一旦、LPCフィルタ係数Aが決定されると、LPCフィルタ係数は量子化されて、受端に送信され、それは音声合成モデル内の受信パラメータを使用するであろう。
LPCフィルタの係数を受端に伝達するための1つの方法は、LPCフィルタの係数を、LPCフィルタ係数よりはむしろその後量子化されて送信される線スペクトル対(LSP)パラメータに変換することを含む。受信器では、量子化されたLSPパラメータは音声合成モデル内での使用のためのLPCフィルタ係数に逆変換される。LSPパラメータはLPCパラメータより良好な量子化特性を有するので、量子化は通常LSP領域内で行われる。例えば、量子化されたLSPパラメータの順序特性(ordering property)は結果としてのLPCフィルタが安定であるだろうことを保証する。LPC係数のLSP係数への変換およびLSP係数を使用することの恩恵は前述の米国特許番号第5,414,796号に詳細に記述されている。
しかしながら、LSP係数量子化はその各々が異なる設計のゴールを達成するための種々の異なる方法で実行され得るので、LSP係数の量子化は本文書内では興味がある。一般に、2つのスキームの1つはLPCまたはLSP係数のいずれかの量子化を実行するために使用される。第1の方法はスカラー量子化(SQ)であり、そして第2の方法はベクトル量子化(VQ)である。この中の方法はLPC係数の表現で記述されているが、しかしながらこの方法がLPC係数およびそのうえ他のタイプのフィルタ係数に適用され得ることは理解されねばならない。LSP係数はまたこの分野では線スペクトル周波数(LSF)とも呼ばれ、そして音声符号化において使用される他のタイプのフィルタ係数は、次のものに限定されないが、イミタンス・スペクトル対(ISP)および離散コサイン変換(DCT)を含む。
1組のLSP係数X=X、ここにおいてi=1,2,…,Lは音声フレームをモデル化するために使用され得る、を仮定されたい。もしもスカラー量子化が使用されれば、その時各要素Xは個別に量子化される。もしもベクトル量子化が使用されれば、その時この組X;i=1,2,…,Lは全体のX、それはその後量子化される、として使用される。スカラー量子化はVQよりも電算機的により単純ではあるが、受入れ可能なレベルの性能を達成するために非常に多数のビットを必要とする。ベクトル量子化はより複雑ではあるが、より小さいビット・バジェット、即ち、量子化されたベクトルを示すために使用できるビット数を必要とする。例えば、係数の数Lが10に等しく、そしてビット・バジェットのサイズがN=30である典型的LSP量子化の問題では、その時使用しているスカラー量子化は係数当たり3ビットのみの割当てを意味するであろう。よって、各係数は、非常に不十分な性能に導く8つの可能な量子化値のみを有するであろう。もしもベクトル量子化が使用されれば、その時全体のN=30ビットは1ベクトルを示すために使用されることができ、それは230の可能な候補値についてそれからそのベクトルの1代表を選択することを可能にする。
しかしながら、230の可能な候補中でベストフィットのための値を探すことは任意の実用的なシステムの資源の範囲を越えている。言い換えれば、直接(direct)VQスキームはLSP量子化の実用的な実施の形態には適していない。よって、2つの他のVQ技術の変種、分割VQ(SPVQ)および多段階VQ(MSVQ)が広く使用される。
SPVQは直接VQスキームを1組のより小さいVQスキームに分割することによって量子化の複雑性とメモリの必要条件とを減少させる。SPVQでは、入力ベクトルXは多数の“サブベクトル”X、j=1,2,…,Nに分割され、ここでNはサブベクトル数であり、そして各サブベクトルXは直接VQを使用して別々に量子化される。図2AはSPVQスキームのブロック図である。例えば、SPVQスキームがビット・バジェットN=30を有する長さL=10のベクトルを量子化するために使用されると仮定されたい。1つの実施の形態では、入力ベクトルXは3つのサブベクトルX1=(x)、X=(x)、およびX=(x10)に分割される。各サブベクトルは3つの直接VQの1つによって量子化され、ここにおいて各直接VQは10ビットを使用する。よって量子化コードブックは1024エントリまたは“コードベクトル”を有する。この例では、メモリ使用率は210コードベクトル×10ワード/コードベクトル=10.240ワードに比例する。さらに、探索の複雑性は均等に減少される。しかしながら、各入力ベクトルについて230=1,073,741,824の選択よりはむしろ1024の選択のみがあるので、そのようなSPVQスキームの性能は直接VQスキームに劣るであろう。SPVQ量子化器において、高い次元(dimensional)(L)の空間内で探索すべきパワーがこのL次元空間をより小さい部分空間(sub-space)に区切ることによって失われることは注意されねばならない。したがって、L次元入力ベクトルにおける全体の構成要素内の相関性を完全に開発するための能力は失われる。
MSVQスキームは、量子化が数段階内で実行されるので、SPVQスキームより少ない複雑性とメモリ使用率とを提供する。入力ベクトルは最初の長さLに保たれる。各段階の出力は次段階への入力である差ベクトルを決定するために使用される。各段階では、差ベクトルは比較的小さいコードブックを使用して近似される。図2BはMSVQスキームのブロック図である。例えば、1つの実例では、(6)段階MSVQは30ビットのビット・バジェットを有する長さ10のLSPベクトルを量子化するために使用される。各段階は5ビットを使用し、その結果、32コードベクトルを有するコードブックとなる。Xを第i段階の入力ベクトルとし、そしてY、ここにおいてYは第i段階のVQコードブックCBから得られた最良のコードベクトルである、を第i段階の量子化された出力としよう。その時次段階への入力は差ベクトルXi+1=X−Yとなるであろう。もしも各段階が5ビットを割り当てられるならば、その時各段階のためのコードブックは25=32コードベクトルを有するであろう。
多段階の使用は入力ベクトルが段階ごとに近似されることを可能にする。各段階で入力のダイナミックレンジは次第に小さくなる。電算機的な複雑性とメモリ使用率とは6段階×32コードベクトル/段階×10ワード/コードベクトル=1920ワードに比例する。よって、MSVQスキームはSPVQスキームより少数の複雑性とメモリの必要条件とを有する。MSVQの多段階構造はまた入力ベクトル統計の広い変動の全域で強さを提供する。しかしながら、MSVQの性能は限定サイズのコードブックのため、そしてそのコードブック探索の“貪欲な(greedy)”性質のため次善である。MSVQの各段階で“最良に”近似した入力ベクトルを見つけ出して、差ベクトルを作り出し、そしてその後次段階でその差ベクトルについて“最良の”代表物(representative)を見つけ出す。しかしながら、各段階での“最良の”代表物の決定は、最終結果が原の、第1の入力ベクトルへの最も近い近似であるだろうことを必ずしも意味しないことは認められる。各段階における最良の候補のみを選択することの不撓性(inflexibility)はこのスキーム全体の性能に害を与える。
SPVQおよびMSVQにおける弱点への1つの解決策は2つの量子化スキームを1つのスキームに結合することである。1つの結合された実施の形態は、予測多段階ベクトル量子化(PMSVQ)スキームである。MSVQと同様に、各段階の出力は次段階への入力である差ベクトルを決定するのに使用される。しかしながら、全体のベクトルとして各段階で各入力を近似するよりはむしろ、各段階での入力は、SPVQスキームについて上述されたような、1群のサブベクトルとして近似される。さらに、各段階の出力はこのスキームの端での使用のために蓄積され、ここにおいて各段階の出力は初期のベクトルの“最良の”全体の代表を決定するために他の段階の出力と一緒に検討される。このように、PMSVQスキームは、“最良の”全体の代表ベクトルについての決定が最終段階の端まで遅延されるので、ただMSVQスキームだけよりも好都合である。しかしながら、PMSVQスキームは多段階構造によって発生されるスペクトル歪の量のため最適ではない。
もう1つの結合された実施の形態は、米国特許番号第6,148,283号、タイトル、“マルチパス多段階ベクトル量子化器を使用する方法と装置(METHOD AND APPARATUS USING MULTI−PATH MULTI−STAGE VECTOR QUANTIZER)”に記述され、それはこの中に引用によって組み込まれて本発明の譲受人に譲渡されたような、分割多段階ベクトル量子化(SMSVQ)である。SMSVQスキームでは、初期段階での入力として全体のベクトルを使用するよりはむしろ、このベクトルはサブベクトルに分割される。各サブベクトルはその後多段階構造により処理される。よって、量子化スキームには並列の、多段階構造がある。各段階のための各入力サブベクトルの大きさは同じもののままであり得るか、またはそのうえさらに小さいサブベクトルに分割され得る。
入力として広帯域信号のフレームを持つようなボコーダのために、LSP係数の量子化は、広帯域信号をモデル化するのに必要なより高い次元のため、狭帯域信号用よりも多数のビットを必要とする。例えば、狭帯域信号用の10次の、即ち転送関数において10フィルタ係数のLPCフィルタを使用するよりはむしろ、より大きい次数のLPCフィルタが広帯域信号フレームをモデル化するために必要である。広帯域ボコーダの1つの実施の形態では、32ビットのビット・バジェットに加えて、16係数を有するLPCフィルタが使用される。この実施の形態では、直接VQコードブック探索は232コードベクトルを通した探索を伴うであろう。LPCフィルタの次数とビット・バジェットとは、この中の実施形態の範囲に影響を及ぼさずに変更され得るシステムパラメータであることは注意されねばならない。よって、この実施形態は多少のタップを有するフィルタと共に使用されることができる。
この中に記述されている実施形態は広帯域ボコーダによって使用されるスペクトル表示を量子化するための新しい帯域幅適応性量子化スキームを作り出すことに関するものである。例えば、帯域幅適応性量子化スキームは、すべてがスペクトル表示として使用されることができる、LPCフィルタ係数、LSP/LSF係数、ISP/ISF係数、DCT係数またはケプストラム係数を量子化するために使用されることができる。他の実例も存在する。新しい帯域幅適応性量子化スキームは、合成された広帯域信号の知覚的な品質を維持および/または改善する一方で、音響広帯域信号を符号化するのに必要なビット数を減少させるために使用されることができる。これらのゴールは、周波数スペクトルの特定の部分を示すために使用されるであろうビットを可変的に割り当てるために信号分類スキームおよびスペクトル分析スキームを使用することによって達成される。帯域幅適応性量子化スキームの原理は、上記されたもののような、種々の他のベクトル量子化スキーム内での適用に拡張されることができる。
第1の実施形態では、フレーム内の音響信号の分類は、音響信号が音声信号か、非音声信号か、または不活性音声信号のいずれかを決定するように実行される。不活性音声信号の例は、無音、背景雑音、または言葉の間のポーズである。非音声は音楽または他の人間以外の音響信号を備えてもよい。音声は有声の(voiced)音声、無声の(unvoiced)音声または一時的(transient)音声から成る。フレームのエネルギー内容、フレームの周期性等のようなファクタに基づいた、フレームによって運ばれることができる音響活動のタイプ上で決定するための種々の方法が存在する。
有声の音声は比較的高度の周期性を示す言語である。ピッチ周期は音声フレームの構成要素であり、フレームの内容を分析して再構成するために使用されることができる。無声の音声は典型的に子音の音を有する。一時的音声フレームは典型的に有声と無声の音声との間の移行である。有声または無声の音声のどちらにも分類されない音声フレームは一時的音声として分類される。任意の合理的な分類スキームが使用され得ることはこの分野の技術者によって理解されるであろう。
音声フレームを分類することは、種々の符号化モードが種々のタイプの音声を符号化するために使用されることができ、通信チャネルのような共有チャネル内の帯域幅のより効率的な使用という結果になるので、有利である。例えば、有声の音声は周期的であり、したがって高度に予測的であるので、低ビットレートで、高度に予測的な符号化モードは有声の音声を符号化するために使用されることができる。この分類の最終の結果は、信号パラメータを伝達するために使用されるべき最良のタイプのボコーダ出力フレームの決定である。前述の米国特許番号第5,414,796号の可変レート・ボコーダでは、パラメータは、その信号の分類によって、フルレート・フレーム、ハーフレート・フレーム、1/4レート・フレーム、または1/8レート・フレームと呼ばれるボコーダ・フレームにおいて運ばれる。
音声フレームのパラメータを運ぶためのボコーダ・フレームのタイプを選択するように音声分類を使用するための1つの方法は、出願中の米国特許出願番号第09/733,740号、タイトル“強い音声分類のための方法と装置(METHOD AND APPARATUS FOR ROBUST SPEECH CLASSIFICATION)”に示されており、それは引用されてこの中に組み込まれ、そして本発明の譲受人に譲渡される。この出願中の特許出願では、音声活動検出器、LPC分析器、およびオープンループピッチ推定器は、種々の過去、現在および将来の音声フレームエネルギー・パラメータを決定するために音声分類器によって使用される情報を出力するように構成される。これらの音声フレームエネルギー・パラメータはその後、音響信号を音声または非音声モードにより正確にそして強く分類するために使用される。
音響信号の分類が1入力フレームについて行われる後に、その入力フレームのスペクトル内容はその時この中に記述された実施形態に従って調べられる。通常この分野で既知であるように、音響信号はしばしばローパス、バンドパス、ハイパスまたは阻止域として分類され得る周波数スペクトルを有する。例えば、無声の音声信号が通常ハイパス周波数スペクトルを有する一方で、有声の音声は通常ローパス周波数スペクトルを有する。ローパス信号について、周波数ダイオフはその周波数レンジのより高い端で起こる。バンドパス信号について、周波数ダイオフはその周波数レンジの低い端およびその周波数レンジの高い端で起こる。阻止域信号について、周波数ダイオフはその周波数レンジの中央で起こる。ハイパス信号について、周波数ダイオフはその周波数レンジの低い端で起こる。この中で使用されるように、術語“周波数ダイオフ”は狭い周波数レンジ、または代替案として、その大きさが閾値未満である周波数スペクトルのエリア内の周波数スペクトルの大きさにおける本質的な減少を指す。この術語の実際の定義は、この術語がその中で使用されている文脈次第である。
この実施形態は音響信号のタイプおよびパラメータ情報を選択的に削除するためにこの音響信号によって示された周波数スペクトルのタイプを決定することに関するものである。その他では、削除されたパラメータ情報に割り当てられるであろうビットはその後、残存のパラメータ情報の量子化に再割当てされることができ、それは合成された音響信号の知覚的な品質の改善という結果になる。代替案として、削除されたパラメータ情報に割り当てられたであろうビットは考慮から落とされ、即ち、それらのビットは送信されず、ビットレートにおける全体の減少という結果になる。
1つの実施形態では、所定の分割位置は、音響信号の分類のため、ある特定のダイオフが起こると期待される周波数で設定される。この中で使用されるように、周波数スペクトル内の分割位置は分析範囲の境界とも呼ばれる。上述されたSPVQスキームにおけるように、分割位置はいかに入力ベクトルXが多数の“サブベクトル”X、j=1,2,…,Nに分割されるであろうかを決定するために使用される。指定された削除位置にあるサブベクトルの係数はその後捨てられ、そしてそれらの捨てられた係数のために割り当てられたビットは送信から落とされるか、または残存のサブベクトル係数の量子化に再割当てされる。
例えば、ボコーダが音響信号のフレームをモデル化するために16次のLPCフィルタを使用するように構成されると仮定されたい。さらにSPVQスキームでは、ローパス周波数要素を記述するために6係数のサブベクトルが使用され、バンドパス周波数要素を記述するために6係数のサブベクトルが使用され、そしてハイパス周波数要素を記述するために4係数のサブベクトルが使用されると仮定されたい。第1のサブベクトル・コードブックは8ビットのコードベクトルを有し、第2のサブベクトル・コードブックは8ビットのコードベクトルを有し、そして第3のサブベクトル・コードブックは6ビットのコードベクトルを有する。
本実施形態は1セクションの分割ベクトル、即ち、サブベクトルの1つが周波数ダイオフと一致するかどうかを決定することに関するものである。音響信号分類スキームによって決定されたように、もしも周波数ダイオフがあれば、その時その特定のサブベクトルは落とされる。1つの実施形態では、落とされたサブベクトルは伝送チャネル上で伝送されるのに必要なコードベクトル・ビット数を下げる。もう1つの実施形態では、落とされたサブベクトルに割り当てられたコードベクトル・ビットは残存のサブベクトルに再割当てされる。上に示された例では、もしも分析フレームが5kHzでのダイオフ周波数を有するローパス信号を運んだのであれば、その時帯域幅適応性スキームの1つの実施形態により、6ビットはコードブック情報を送信するために使用されないか、または代替案として、第1のサブベクトル・コードブックが11ビットのコードベクトルを備え、そして第2のサブベクトル・コードブックが11ビットのコードベクトルを備えるように、これらの6コードブック・ビットは残存コードブックに再割当てされる。そのようなスキームの実施形態はメモリを節約するために、はめ込まれたコードブックで実施されることができる。はめ込まれたコードブック・スキームは、その中に1組のより小さいコードブックがより大きいコードブック内にはめ込まれているものである。
はめ込まれたコードブックは図3におけるように構成されることができる。スーパーコードブック310は2コードベクトルからなる。もしも1ベクトルが量子化用のMビット未満のビット・バジェットを必要とすれば、その時2未満のサイズのはめ込まれたコードブック320はスーパーコードブックから抽出されることができる。種々のはめ込まれたコードブックが各段階のための種々のサブベクトルに割り当てられることができる。この構成は効率的なメモリ節約を提供する。
図4は一般化された帯域幅適応性量子化スキームのブロック図である。ステップ400で、分析フレームは音声または非音声モードにより分類される。ステップ410で、分類情報はスペクトル分析器に供給され、それは信号の周波数スペクトルを分析範囲に分割するためにこの分類情報を使用する。ステップ420で、スペクトル分析器は分析範囲のいずれが周波数ダイオフと一致するかを決定する。もしもどの分析範囲も周波数ダイオフと一致しなければ、その時ステップ435で、その分析フレームに関連するLPC係数はすべて量子化される。もしもいずれかの分析範囲が周波数ダイオフと一致すれば、その時ステップ430で、周波数ダイオフ範囲に関連するLPC係数は量子化されない。1つの実施形態では、プログラムフローはステップ440に進み、ここにおいて周波数ダイオフ範囲に関連しないLPC係数のみが量子化されて送信される。代替の実施形態では、プログラムフローはステップ450に進み、ここにおいて他方では周波数ダイオフ範囲のために指定されるであろう量子化ビットは、その代わりに他の分析範囲に関連する係数の量子化に再割当てされる。
図5Aはローパス周波数スペクトル(図5B)、ハイパス周波数スペクトル(図5C)、バンドパス周波数スペクトル(図5D)、および阻止域周波数スペクトル(図5E)で整列させた16係数の表示である。分類は、分析フレームが有声の音声を運ぶことを示す分析フレームについて行われると仮定されたい。その時このシステムは実施形態の1局面に従って、その分割位置、即ち、上記の例では5kHzより上の分析範囲について量子化ビットを割り当てるべきかを決定するために、ローパス周波数スペクトル・モデルを選択するように構成されるであろう。このスペクトルはその後、音響信号の知覚的に無意味な部分がこの範囲内にあるかを決定するため5kHzと8kHzとの間で分析されるであろう。もしも信号がその範囲内で知覚的に無意味であれば、その時信号パラメータは量子化され、そしてその信号の無意味な部分の何の表示も無しに送信される。信号の知覚的に無意味な部分を示すために使用されない“節約された”ビットは、信号の残存部分の係数を示すために再割当てされることができる。例えば、表1はローパス信号のために選択された周波数への係数の1整列を示す。他の整列は種々のスペクトル特性を有する信号について可能である。
Figure 2006510922
もしも5kHzより上の周波数ダイオフがあれば、その時12係数のみがローパス信号を示す情報を伝達するために必要である。残存の4係数はこの中に記述された実施形態に従って送信される必要はない。1つの実施形態に従うと、“失われた(lost)”4係数に関連するサブベクトル・コードブックのために割り当てられたビットは、他のサブベクトル・コードブックの代わりに分布される。
よって、伝送のためのビット数の減少または信号の残存部分の音響品質における改善がある。どちらの場合にも、落とされたサブベクトルは送信されないであろう“失われた”信号情報という結果になる。実施形態はさらに、音響信号の合成を容易とするために落とされてしまったそれらの部分に“フィラー(filler)”を置き換えることに関するものである。もしも次元が1ベクトルから落とされれば、その時次元は音響信号を正確に合成するためにそのベクトルに加えられねばならない。
1つの実施形態では、フィラーは落とされたサブベクトルの平均係数値を決定することによって発生されることができる。この実施形態の1つの局面では、落とされたサブベクトルの平均係数値は信号パラメータ情報と一緒に送信される。この実施形態のもう1つの局面では、平均係数値は、送信端と受信端との両方で、共有テーブルに蓄積される。実際の平均係数値を信号パラメータと一緒に送信するよりはむしろ、そのテーブル内の平均係数値の配置を識別するインデックスが送信される。受信端はその時平均係数値を決定すべくテーブル・ルックアップを行うためにこのインデックスを使用する。もう1つの実施形態では、分析フレームの分類は適切なフィラー・サブベクトルを選択するために受信端にとって十分な情報を提供する。
もう1つの実施形態では、フィラー・サブベクトルは送信相手からのさらなる情報無しに復号器で発生される一般的なモデルであることができる。例えば、均一な分布はフィラー・サブベクトルとして使用されることができる。もう1つの実施形態では、フィラー・サブベクトルは、現在のフレーム内にコピーされることができる以前のフレームの雑音統計のような、過去の情報であることができる。
上記された置換処理が送信側での分析対合成ループ(analysis-by-synthesis loop)で、および受信器での合成処理の使用のために適用できることは注意されねばならない。
図6は新しい帯域幅適応性量子化スキームに従って構成されるボコーダの機能要素のブロック図である。広帯域信号のフレームはLPC係数を決定するためにLPC分析ユニット600に入力される。LPC係数はLSP係数を決定するためにLSP発生ユニット620に入力される。LPC係数はまた音声活動検出器(VAD)630にも入力され、それは入力信号が音声、非音声、または不活性音声のいずれであるかを決定するために構成される。音声は分析フレーム内にある、と一度決定がなされると、LPC係数と他の信号情報はその時有声、無声、または一時的であるとしての分類のためフレーム分類ユニット640に入力される。フレーム分類ユニットの例は上に引用された米国特許番号第5,414,796号で提供される。
フレーム分類ユニット640の出力はスペクトル内容ユニット650およびレート選択ユニット660に送られる分類信号である。スペクトル内容ユニット650は、特定の周波数帯で信号の周波数特性を決定するために分類信号によって運ばれる情報を使用し、ここにおいて周波数帯の境界は分類信号によって設定される。1つの局面では、スペクトル内容ユニット650は、スペクトルの指定された部分のエネルギーをスペクトルの全体のエネルギーと比較することにより、スペクトルの指定された部分が知覚的に無意味であるかどうかを決定するように構成される。もしもエネルギー比が所定の閾値未満であれば、その時スペクトルの指定された部分は知覚的に無意味であるという決定がなされる。他の局面は、ゼロクロッシングの検査のような、周波数スペクトルの特性を検査するために存在する。ゼロクロッシングはフレーム当たりの信号内のサイン変化の数である。もしも特定の部分内のゼロクロッシング数が低い、即ち、所定の閾値量未満であれば、その時信号は多分、無声の音声よりはむしろ有声の音声から成る。もう1つの実施形態では、フレーム分類ユニット640の機能性は、上に述べられたゴールを達成するためにスペクトル内容ユニット650の機能性と結合されることができる。
レート選択ユニット660は、分析フレーム内で運ばれる信号がフルレートフレーム、ハーフレートフレーム、1/4レートフレーム、または1/8レートフレームのどれによって最良に運ばれるかを決定するために、フレーム分類ユニット640からの分類情報とスペクトル内容ユニット650のスペクトル情報とを使用する。レート選択ユニット660はフレーム分類ユニット640に基づいた初期レート決定を行うように構成される。初期レート決定はその後スペクトル内容ユニット650からの結果に従って変更される。例えば、もしもスペクトル内容ユニット650からの情報が、一部の信号は知覚的に無意味であることを示せば、その時レート選択ユニット660は信号パラメータを運ぶために初めに選択されたよりも小さいボコーダフレームを選択するように構成されてもよい。
実施形態の1つの局面では、VAD630、フレーム分類ユニット640、スペクトル内容ユニット650およびレート選択ユニット660の機能性は帯域幅分析器655内で結合されることができる。
量子化器670はレート選択ユニット660からのレート情報、スペクトル内容ユニット650からのスペクトル内容情報、およびLSP発生ユニット620からのLSP係数を受信するように構成される。量子化器670はLSP係数のための適切な量子化スキームを決定するためにフレームレート情報を使用し、そして特定の、次数群のフィルタ係数の量子化ビット・バジェットを決定するためにスペクトル内容情報を使用する。量子化器670の出力はその後マルチプレクサ695に入力される。
線形予測符号器では、量子化器670の出力はまた分析対合成ループにおいて最適な励起ベクトルを発生するためにも使用され、ここにおいて探索はその信号と合成信号との間の差を最小にする励起ベクトルを選択するためにその励起ベクトルにより実行される。ループの合成部分を実行するために、励起発生器690は最初の信号と同じ次元の入力を持たねばならない。よって、置換ユニット680では、上記の実施形態のいくつかに従って発生されることができる“フィラー”サブベクトルは、励起発生器690への入力を供給するために量子化器670の出力と結合される。励起発生器690は最適な励起ベクトルを選択するためにLPC分析ユニット600からのフィラー・サブベクトルとLPC係数とを使用する。励起発生器690の出力と量子化器670の出力とは結合されるべきマルチプレクサ・エレメント695に入力される。マルチプレクサ695の出力はその後符号化され、そして受信器への伝送のために変調される。
1つのタイプのスペクトル拡散通信システムでは、マルチプレクサ695の出力、即ち、ボコーダフレームのビットは、畳込みまたはターボ符号化され、中継され、そして一連のバイナリ・コードシンボルのシーケンスを生成するようにパンクチュアされる。結果としてのコードシンボルは変調記号のフレームを得るためにインターリーブされる。変調記号はその後ウォルシュ・カバーされ、そして直交位相ブランチ上でパイロット・シーケンスと結合され、PN拡散され、ベースバンド・フィルタされ、そして送信搬送波上で変調される。
図7は受信端での復号化処理の機能ブロック図である。受信励起ビット700の流れは励起発生器ユニット710に入力され、それは音響信号を合成するためにLPC合成ユニット720によって使用されるであろう励起ベクトルを発生する。受信量子化ビット750の流れは脱量子化器(De-Quantizer)760に入力される。脱量子化器760はスペクトル表示、即ちどちらでも送信端で使用された変換の係数値を発生し、それはLPC合成ユニット720でLPCフィルタを発生するために使用されるであろう。しかしながら、LPCフィルタが発生される前に、フィラー・サブベクトルはLPCベクトルの次数を満たすために必要になる可能性がある。置換エレメント770は脱量子化器760からスペクトル表示サブベクトルを受信するように、そして全ベクトルの次数を満たすためにフィラー・サブベクトルをこの受信ベクトルに付加するように構成される。全ベクトルはその後LPC合成ユニット720に入力される。
この実施形態が既存のベクトル量子化スキーム内でどのように動作できるかの1例として、1つの実施形態がSMSVQスキームの文脈内に下記される。以前に注意されたように、SMSVQスキームでは、入力ベクトルはサブベクトルに分割される。各サブベクトルはその後多段階構造により処理される。各段階について各入力サブベクトルの大きさは同一のままであることができ、あるいはいっそう小さいサブベクトルにさらに分割されることができる。
次数16のLPCベクトルが量子化目的のための32ビットのビット・バジェットを割り当てられると仮定されたい。入力ベクトルが3つのサブベクトル:X、X、およびXに分割されると仮定されたい。直接SMSVQスキームに関して、係数割当ておよびコードブックのサイズは次の通りであることができる:
Figure 2006510922
示されているように、第1の段階でサブベクトルXの量子化のために指定されるサイズ26コードベクトルのコードブック、および第2の段階でサブベクトルXの量子化のために指定されるサイズ25コードベクトルのコードブックがある。同様に、他のサブベクトルは割り当てられたコードブック・ビットである。全部の32ビットは広帯域信号のLPC係数を示すために使用される。
もしも1実施形態がビットレートを減少させるべく実施されるならば、その時スペクトルの分析範囲は、その周波数ダイオフ範囲が量子化から削除され得るように、周波数ダイオフのような特性について検査される。サブベクトルXは周波数ダイオフ範囲と一致すると仮定されたい。その時係数割当ておよびコードブックのサイズは次の通りであることができる:
Figure 2006510922
示されているように、32ビット量子化ビット・バジェットは知覚的な品質の損失無しに22ビットに引き下げられることができる。
もしも1実施形態がある分析範囲の音響特性を改善すべく実施されるならば、その時係数割当ておよびコードブックのサイズは次の通りであることができる:
Figure 2006510922
上記の表はサブベクトルXの2つのサブベクトル、X11とX12への分割、および第2段階の初めで、サブベクトルXの2つのサブベクトル、X21とX22への分割を示す。各分割サブベクトルXijは3つの係数を具備し、そして各分割サブベクトルXij用のコードブックは25コードベクトルを具備する。第2段階用のコードブックの各々はX3コードブックからのコードブック・ビットの再割当てによってそれらのサイズを獲得する。
上記実施形態が固定長ベクトルを受信することに関するものであり、そして固定長ベクトルの可変長の量子化表示を形成することに関するものであることは注意されねばならない。新しい帯域幅適応性スキームは、伝送ビットレートを減少させるか、または信号のより知覚的に有意な部分の品質を改善することのどちらかのために、広帯域信号内で伝達される情報を選択的に活用する。上述の実施形態は、次の処理のための入力ベクトルの次元をなお保存する一方で、量子化領域内のサブベクトルの次元を減少させることによってこれらのゴールを達成する。
これと対比して、いくつかのボコーダは入力ベクトルの次数を変更することによってビット減少のゴールを達成する。しかしながら、もしも連続フレーム内のフィルタ係数の数が一様でなければ、直接予測ができないことは注意されねばならない。例えば、もしもそんなに頻繁なLPC係数の更新がなければ、従前のボコーダは典型的に、過去および現在のパラメータを使用してスペクトル・パラメータを補間する。係数値間の補間(または拡張)は、フレーム間の移行がスムーズでないほかに、フレーム間の同じLPCフィルタ次数を獲得するために実施されねばならない。同一の次数変換(order-translation)処理は予測量子化またはLPCパラメータ補間を実行するためにLPCベクトルに対して行われねばならない。米国特許番号第6,202,045号、“可変モデル次数線形予測付き音声符号化(SPEECH CODING WITH VARIABLE MODEL ORDER LINEAR PREDICTION)”を見られたい。本実施形態はビットレートを減少させることまたはLPC係数領域内の入力ベクトルを拡張することまたは短縮することの複雑さの追加無しに、信号の知覚的に有意な部分を改善することに関するものである。
上記実施形態は可変レート・ボコーダ゛の文脈で記述された。しかしながら、上記実施形態の原理はこの実施形態の範囲に影響を及ぼすことなく固定レート・ボコーダまたは他のタイプの符号器に適用可能であることは理解されねばならない。例えば、SPVQスキーム、MSVQスキーム、PMSVQスキーム、またはこれらのベクトル量子化スキームのいくつかの代替の形式は、フレーム分類ユニットによる音声信号の分類を使用しない固定レートのボコーダにおいて実行されることができる。上記実施形態に従って構成された可変レート・ボコーダについて、信号タイプの分類はボコーダ・レートの選択に関するものであり、そしてスペクトル範囲の境界、即ち、周波数帯を定義することに関するものである。しかしながら、他のツールは固定レート・ボコーダにおいて周波数帯の境界を決定するために使用されることができる。例えば、固定レート・ボコーダにおけるスペクトル分析は、信号のどの部分が故意に“失われ”得るかを決定するために別々に示された周波数帯について実行されることができる。これらの“失われた”部分に関するビット・バジェットはその後、上記されたように、信号の知覚的に有意な部分のビット・バジェットに再割当てされることができる。
この分野の技術者は、情報および信号がいろいろな異なるテクノロジーおよびテクニックのいずれかを使用して表され得ることを理解するであろう。例えば、上記説明の全体を通して参照される可能性があるデータ、指示、命令、情報、信号、ビット、記号、およびチップは、電圧、電流、電磁波、磁界または粒子、光学上のフィールドまたは粒子、あるいはそれの任意の組合わせにより表されることができる。
技術者は、この中に開示された実施形態に関して記述された種々の実例となる論理ブロック、モジュール、回路、およびアルゴリズム・ステップは電子ハードウェア、コンピュータ・ソフトウェア、または両者の組合わせとして実施され得ることをさらに認識するであろう。ハードウェアおよびソフトウェアのこの互換性を明確に説明するために、種々の実例となるコンポーネント、ブロック、モジュール、回路、およびステップは、一般にそれらの機能性の表現で上述された。そのような機能性がハードウェアまたはソフトウェアとして実施されるかどうかはシステム全体に課された特定のアプリケーションと設計の制約とによる。熟練技工は各特定のアプリケーションについて異なる方法で記述された機能性を実施できるが、しかしそのような実施の決定が本発明の範囲からの逸脱を引き起こすと理解されてはならない。
この中に開示された実施形態に関して記述された種々の実例となる論理ブロック、モジュール、および回路は、汎用プロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲートアレイ(FPGA)または他のプログラマブルな論理装置、ディスクリート・ゲートまたはトランジスタ論理、ディスクリート・ハードウェア・コンポーネント、あるいはこの中に記述された機能を実行するように設計されたそれのいずれかの組合わせで実施または実行されることができる。汎用プロセッサはマイクロプロセッサであってもよいが、しかし代替案では、プロセッサは任意の従前のプロセッサ、コントローラ、マイクロコントローラ、またはステートマシンであってもよい。プロセッサはまた計算装置、例えば、DSPとマイクロプロセッサとの組合わせ、複数のマイクロプロセッサ、DSPコアとともに1つまたはそれ以上のマイクロプロセッサ、あるいは任意の他のそのような構成として実施されてもよい。
この中に開示された実施形態に関して記述された方法のステップまたはアルゴリズムはハードウェアで、プロセッサにより実行されるソフトウェア・モジュールで、またはこの2つの組合わせで直接具体化されることができる。ソフトウェア・モジュールはRAMメモリ、フラッシュ・メモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、着脱可能形ディスク、CD−ROM、あるいはこの分野において既知の任意の他の形式の蓄積媒体に属してもよい。典型的な蓄積媒体はプロセッサに連結され、そのようなプロセッサはこの蓄積媒体から情報を読み取り、それに情報を書き込むことができる。代替案では、蓄積媒体はプロセッサに一体化されることができる。プロセッサと蓄積媒体とは1つのASIC内に存在してもよい。ASICはユーザ端末内に存在してもよい。代替案では、プロセッサと蓄積媒体とはディスクリート・コンポーネントとして1つのユーザ端末内に存在してもよい。
開示された実施形態の前の説明は、この分野のいかなる技術者も本発明を製作または使用することを可能とするために提供される。これらの実施形態へのいろいろな変更は、この分野の技術者にはたやすく明白であるだろうし、そしてその中に定義された包括的な原理は本発明の精神および範囲から逸脱すること無しに他の実施形態に適用されてもよい。従って、本発明はこの中に示された実施形態に限定されるつもりはなく、しかしむしろこの中に開示された原理および新規な特徴と矛盾しない最も広い範囲が許容されるべきである。
無線通信システムを示す図である。 分割ベクトル量子化スキームを示す図である。 多段階ベクトル量子化スキームを示す図である。 はめ込まれたコードブックを示すブロック図である。 一般化された帯域幅適応性量子化スキームを示すブロック図である。 周波数スペクトルの整列された係数を示す図である。 ローパス周波数スペクトルで整列された16係数の表示を示す図である。 ハイパス周波数スペクトルで整列された16係数の表示を示す図である。 バンドパス周波数スペクトルで整列された16係数の表示を示す図である。 阻止域周波数スペクトルで整列された16係数の表示を示す図である。 新しい帯域幅適応性量子化スキームに従って構成されるボコーダの機能要素を示すブロック図である。 受信端での復号化処理を示すブロック図である。
符号の説明
10…無線通信ネットワーク、12a−12d…複数の遠隔局、14a−14c…複数の基地局、16…基地局コントローラ、18…移動体交換センタ(MSC)またはスイッチ、20…パケットデータ・サービングノード(PDSN)またはインターワーキング機能(IWF)、22…公衆電話交換ネットワーク(PSTN)、24…IPネットワーク、310…スーパーコードブック、320…はめ込まれたコードブック、600…LPC分析ユニット、620…LSP発生ユニット、630…LPC係数はまた音声活動検出器(VAD)、640…フレーム分類ユニット、650…フレーム分類ユニット、660…レート選択ユニット、670…量子化器、680…置換ユニット、690…励起発生器、695…マルチプレクサ、700…受信励起ビット、710…励起発生器ユニット、720…LPC合成ユニット、750…受信量子化ビット、760…脱量子化器、770…置換エレメント

Claims (21)

  1. 周波数スペクトルの少なくとも1つの分析範囲に関連し、知覚的に無意味な信号の存在または知覚的に有意な信号の存在を示す信号特性を決定するためのスペクトル内容エレメントと、
    もしも前記信号特性が知覚的に無意味な信号の存在を示すならば前記少なくとも1つの分析範囲から離れて量子化ビットを選択的に割り当てるために前記少なくとも1つの分析範囲に関連する前記信号特性を使用するように構成されたベクトル量子化器とからなる帯域幅適応性ベクトル量子化器。
  2. 前記スペクトル内容エレメントはさらに前記周波数スペクトルの前記少なくとも1つの分析範囲について少なくとも1つの境界条件を決定することに関するものである請求項1記載の帯域幅適応性ベクトル量子化器。
  3. 前記周波数スペクトルの前記少なくとも1つの分析範囲について少なくとも1つの境界条件を決定するためのフレーム分類エレメントをさらに具備する請求項1記載の帯域幅適応性ベクトル量子化器。
  4. 分析フレームが音声信号または非音声信号のいずれかを備えることを決定するための音声活動検出エレメントと、
    送信フレームタイプを決定するためのレート選択エレメントとをさらに具備し、前記送信フレームタイプは前記音声活動検出エレメントおよび前記フレーム分類エレメントの前記決定に依存する請求項3記載の帯域幅適応性ベクトル量子化器。
  5. 前記少なくとも1つの分析範囲から離れて割り当てられた前記量子化ビットを置換するためにフィラー・サブベクトルを付加するように構成された置換エレメントをさらに具備し、前記置換エレメントの出力は符号器の分析対合成部または受信端での復号器の合成部内で使用される請求項1記載の帯域幅適応性ベクトル量子化器。
  6. 前記ベクトル量子化器は量子化ビットを分析範囲に割り当てるように構成され、この範囲内では前記信号特性は知覚的に有意な信号の存在を示し、さらに前記量子化ビットは知覚的に無意味である少なくとも1つの分析範囲からのものである請求項1記載の帯域幅適応性ベクトル量子化器。
  7. 前記ベクトル量子化器は分割ベクトル量子化を実行するようにさらに構成される請求項1記載の帯域幅適応性ベクトル量子化器。
  8. 前記ベクトル量子化器は多段階ベクトル量子化を実行するようにさらに構成される請求項1記載の帯域幅適応性ベクトル量子化器。
  9. 前記ベクトル量子化器は分割、多段階ベクトル量子化を実行するようにさらに構成される請求項1記載の帯域幅適応性ベクトル量子化器。
  10. 前記ベクトル量子化器は予測多段階ベクトル量子化を実行するようにさらに構成される請求項1記載の帯域幅適応性ベクトル量子化器。
  11. 前記ベクトル量子化器は量子化ビットを割り当てるためのはめ込まれたコードブックをアクセスするようにさらに構成される請求項6記載の帯域幅適応性ベクトル量子化器。
  12. 周波数スペクトルの範囲において周波数ダイオフの存在を決定するための手段と、
    前記周波数ダイオフ範囲に関連する複数の係数を量子化することをやめるための手段と、
    所定のコードブックを使用して前記残存する周波数スペクトルを量子化するための手段とからなるボコーダのビットレートを減少させるための装置。
  13. 周波数スペクトルの範囲において周波数ダイオフの存在を決定するための手段と、
    前記周波数ダイオフ範囲に関連する複数の係数を量子化することをやめるための手段と、
    他方では前記周波数ダイオフ範囲を示すために使用されるであろう複数の量子化ビットを再割当てするための手段と、
    スーパーコードブックを使用して前記残存する周波数スペクトルを量子化するための手段とを具備し、前記スーパーコードブックは他方では前記周波数ダイオフ範囲を示すために使用されるであろう前記複数の量子化ビットからなるボコーダを通過する音響信号の知覚的な品質を高めるための方法。
  14. 周波数スペクトルの範囲において周波数ダイオフの存在を決定し、
    前記周波数ダイオフ範囲に関連する複数の係数を量子化することをやめ、
    所定のコードブックを使用して前記残存する周波数スペクトルを量子化することからなるボコーダのビットレートを減少させるための方法。
  15. 前記残存する周波数スペクトルを量子化することはベクトル量子化器を使用して実行される請求項14記載の方法。
  16. 前記周波数ダイオフの存在を決定することは音声分類により前記周波数ダイオフ範囲の少なくとも1つの境界を決定することを具備する請求項14記載の方法。
  17. 前記周波数ダイオフの存在を決定することは、
    前記範囲対前記周波数スペクトルのエネルギー比を決定し、
    前記エネルギー比を閾値と比較することからなる請求項14記載の方法。
  18. 前記周波数ダイオフの存在を決定することは前記範囲内のゼロクロスの数を検査することからなる請求項14記載の方法。
  19. 周波数スペクトルの範囲において周波数ダイオフの存在を決定し、
    前記周波数ダイオフ範囲に関連する複数の係数を量子化することをやめ、
    他方では前記周波数ダイオフ範囲を示すために使用されるであろう複数の量子化ビットを再割当てし、
    スーパーコードブックを使用して前記残存する周波数スペクトルを量子化することからなり、前記スーパーコードブックは他方では前記周波数ダイオフ範囲を示すために使用されるであろう前記複数の量子化ビットからなるボコーダを通過する音響信号の知覚的な品質を高めるための方法。
  20. 前記周波数ダイオフの存在を決定することは音声分類により該周波数ダイオフ範囲の少なくとも1つの境界を決定することからなる請求項19記載の方法。
  21. 前記残存する周波数スペクトルを量子化することはベクトル量子化を使用して実行される請求項19記載の方法。
JP2004527978A 2002-08-08 2003-08-08 帯域幅適応性量子化方法と装置 Pending JP2006510922A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/215,533 US8090577B2 (en) 2002-08-08 2002-08-08 Bandwidth-adaptive quantization
PCT/US2003/025034 WO2004015689A1 (en) 2002-08-08 2003-08-08 Bandwidth-adaptive quantization

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011094733A Division JP5280480B2 (ja) 2002-08-08 2011-04-21 帯域幅適応性量子化方法と装置

Publications (1)

Publication Number Publication Date
JP2006510922A true JP2006510922A (ja) 2006-03-30

Family

ID=31494889

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2004527978A Pending JP2006510922A (ja) 2002-08-08 2003-08-08 帯域幅適応性量子化方法と装置
JP2011094733A Expired - Fee Related JP5280480B2 (ja) 2002-08-08 2011-04-21 帯域幅適応性量子化方法と装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011094733A Expired - Fee Related JP5280480B2 (ja) 2002-08-08 2011-04-21 帯域幅適応性量子化方法と装置

Country Status (13)

Country Link
US (1) US8090577B2 (ja)
EP (1) EP1535277B1 (ja)
JP (2) JP2006510922A (ja)
KR (1) KR101081781B1 (ja)
AT (1) ATE407422T1 (ja)
AU (1) AU2003255247A1 (ja)
BR (1) BR0313317A (ja)
CA (1) CA2494956A1 (ja)
DE (1) DE60323377D1 (ja)
IL (1) IL166700A0 (ja)
RU (1) RU2005106296A (ja)
TW (1) TW200417262A (ja)
WO (1) WO2004015689A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
JP2008102521A (ja) * 2006-10-18 2008-05-01 Polycom Inc 高速格子ベクトル量子化
US7953595B2 (en) 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100519165B1 (ko) * 2002-10-17 2005-10-05 엘지전자 주식회사 이동 통신 시스템에서 트래픽 처리 방법
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
KR100656788B1 (ko) * 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
US7587314B2 (en) 2005-08-29 2009-09-08 Nokia Corporation Single-codebook vector quantization for multiple-rate applications
US8370132B1 (en) * 2005-11-21 2013-02-05 Verizon Services Corp. Distributed apparatus and method for a perceptual quality measurement service
US20070136054A1 (en) * 2005-12-08 2007-06-14 Hyun Woo Kim Apparatus and method of searching for fixed codebook in speech codecs based on CELP
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
MY181247A (en) 2008-07-11 2020-12-21 Frauenhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
US7889721B2 (en) * 2008-10-13 2011-02-15 General Instrument Corporation Selecting an adaptor mode and communicating data based on the selected adaptor mode
EP4231294B1 (en) 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
BR122020023350B1 (pt) * 2011-04-21 2021-04-20 Samsung Electronics Co., Ltd método de quantização
KR101863687B1 (ko) * 2011-04-21 2018-06-01 삼성전자주식회사 선형예측계수 양자화장치, 사운드 부호화장치, 선형예측계수 역양자화장치, 사운드 복호화장치와 전자기기
PT2939235T (pt) 2013-01-29 2017-02-07 Fraunhofer Ges Forschung Quantização de sinal de áudio de tonalidade adaptativa de baixa complexidade
CN111554311B (zh) * 2013-11-07 2023-05-12 瑞典爱立信有限公司 用于编码的矢量分段的方法和设备
US11704312B2 (en) * 2021-08-19 2023-07-18 Microsoft Technology Licensing, Llc Conjunctive filtering with embedding models

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233500A (ja) * 1988-03-08 1989-09-19 Internatl Business Mach Corp <Ibm> 複数レート音声エンコーデイング方法
JPH06242798A (ja) * 1993-02-19 1994-09-02 Matsushita Electric Ind Co Ltd 変換符号化装置のビット配分方法
JPH06511320A (ja) * 1991-06-11 1994-12-15 クゥアルコム・インコーポレイテッド 可変速度ボコーダ
JPH09172413A (ja) * 1995-12-19 1997-06-30 Kokusai Electric Co Ltd 可変レート音声符号化方式
JPH10187197A (ja) * 1996-12-12 1998-07-14 Nokia Mobile Phones Ltd 音声符号化方法及び該方法を実施する装置
JPH11143499A (ja) * 1997-08-28 1999-05-28 Texas Instr Inc <Ti> 切替え型予測量子化の改良された方法
WO2001006490A1 (en) * 1999-07-19 2001-01-25 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
JP2002091497A (ja) * 2000-09-18 2002-03-27 Nippon Telegr & Teleph Corp <Ntt> オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4901307A (en) * 1986-10-17 1990-02-13 Qualcomm, Inc. Spread spectrum multiple access communication system using satellite or terrestrial repeaters
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
US5598514A (en) * 1993-08-09 1997-01-28 C-Cube Microsystems Structure and method for a multistandard video encoder/decoder
US5764698A (en) 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
JP3283413B2 (ja) * 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JP3147807B2 (ja) * 1997-03-21 2001-03-19 日本電気株式会社 信号符号化装置
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
US6330533B2 (en) * 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
US7092881B1 (en) * 1999-07-26 2006-08-15 Lucent Technologies Inc. Parametric speech codec for representing synthetic speech in the presence of background noise
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
US6570509B2 (en) * 2000-03-03 2003-05-27 Motorola, Inc. Method and system for encoding to mitigate decoding errors in a receiver
JP2002006895A (ja) 2000-06-20 2002-01-11 Fujitsu Ltd ビット割当装置および方法
US7472059B2 (en) 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
KR20020075592A (ko) * 2001-03-26 2002-10-05 한국전자통신연구원 광대역 음성 부호화기용 lsf 양자화기
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233500A (ja) * 1988-03-08 1989-09-19 Internatl Business Mach Corp <Ibm> 複数レート音声エンコーデイング方法
JPH06511320A (ja) * 1991-06-11 1994-12-15 クゥアルコム・インコーポレイテッド 可変速度ボコーダ
JPH06242798A (ja) * 1993-02-19 1994-09-02 Matsushita Electric Ind Co Ltd 変換符号化装置のビット配分方法
JPH09172413A (ja) * 1995-12-19 1997-06-30 Kokusai Electric Co Ltd 可変レート音声符号化方式
JPH10187197A (ja) * 1996-12-12 1998-07-14 Nokia Mobile Phones Ltd 音声符号化方法及び該方法を実施する装置
JPH11143499A (ja) * 1997-08-28 1999-05-28 Texas Instr Inc <Ti> 切替え型予測量子化の改良された方法
WO2001006490A1 (en) * 1999-07-19 2001-01-25 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
JP2003505723A (ja) * 1999-07-19 2003-02-12 クゥアルコム・インコーポレイテッド 音声符号器における目標ビットレートを維持する方法および装置
JP2002091497A (ja) * 2000-09-18 2002-03-27 Nippon Telegr & Teleph Corp <Ntt> オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
JP2008102521A (ja) * 2006-10-18 2008-05-01 Polycom Inc 高速格子ベクトル量子化
US7953595B2 (en) 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
US7966175B2 (en) 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization

Also Published As

Publication number Publication date
US8090577B2 (en) 2012-01-03
AU2003255247A1 (en) 2004-02-25
IL166700A0 (en) 2006-01-15
KR20060016071A (ko) 2006-02-21
RU2005106296A (ru) 2005-08-27
JP2011188510A (ja) 2011-09-22
WO2004015689A1 (en) 2004-02-19
TW200417262A (en) 2004-09-01
KR101081781B1 (ko) 2011-11-09
JP5280480B2 (ja) 2013-09-04
DE60323377D1 (de) 2008-10-16
EP1535277A1 (en) 2005-06-01
ATE407422T1 (de) 2008-09-15
BR0313317A (pt) 2005-07-12
CA2494956A1 (en) 2004-02-19
US20040030548A1 (en) 2004-02-12
EP1535277B1 (en) 2008-09-03

Similar Documents

Publication Publication Date Title
JP5280480B2 (ja) 帯域幅適応性量子化方法と装置
JP5037772B2 (ja) 音声発話を予測的に量子化するための方法および装置
US8032369B2 (en) Arbitrary average data rates for variable rate coders
JP4860890B2 (ja) 無線通信システムにおいて、非対称リンクを生成するために非対称音声コーダを使用するための方法および装置
US7698132B2 (en) Sub-sampled excitation waveform codebooks
KR100935174B1 (ko) 고속 코드-벡터 탐색 장치 및 방법
JP2004501391A (ja) 可変レート音声符号器におけるフレーム消去補償方法
KR100926599B1 (ko) 코드북 벡터 검색의 메모리 요구들을 감소시키는 방법 및 장치
JP4511094B2 (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
KR100756570B1 (ko) 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100301

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110322

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110329

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110726

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110726