JP5173939B2 - Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置 - Google Patents

Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置 Download PDF

Info

Publication number
JP5173939B2
JP5173939B2 JP2009133079A JP2009133079A JP5173939B2 JP 5173939 B2 JP5173939 B2 JP 5173939B2 JP 2009133079 A JP2009133079 A JP 2009133079A JP 2009133079 A JP2009133079 A JP 2009133079A JP 5173939 B2 JP5173939 B2 JP 5173939B2
Authority
JP
Japan
Prior art keywords
signal
coding
rate
encoding
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2009133079A
Other languages
English (en)
Other versions
JP2009239927A (ja
JP2009239927A5 (ja
Inventor
ジェリネク,ミラン
サラミ,レドワン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2009239927A publication Critical patent/JP2009239927A/ja
Publication of JP2009239927A5 publication Critical patent/JP2009239927A5/ja
Application granted granted Critical
Publication of JP5173939B2 publication Critical patent/JP5173939B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Description

本発明は、第1の通信方式を用いる、第1の符号器と第1の復号器とを具備する第1の局を、第2の通信方式を用いる、第2の符号器と第2の復号器とを具備する第2の局と相互運用を行う方法であって、第1の局と第2の局のうちの一方の局の符号器から第1の局と第2の局のうちの他方の局の復号器へ信号符号化パラメータを伝送することにより第1の局と第2の局との間の通信を行う方法に関する。
主観的品質とビットレートとの間での好適なトレードオフを有する効率のよいデジタル狭帯域および広帯域の音声符号化技法に対する要求が、テレビ会議、マルチメディア、および無線通信などの種々のアプリケーション領域で増加している。最近まで、200〜3400Hzの範囲内に制約されていた電話用帯域幅が音声符号化用途アプリケーションで主として利用されていた。しかし、広帯域音声用アプリケーションによって、従来の電話用帯域幅と比べて通信時の了解度の上昇と自然さが得られる。50〜7000Hzの範囲の帯域幅が、面談時の通信の印象を与える良好な品質の配信用として十分な帯域であることが判明している。一般的オーディオ信号用として、この帯域幅は容認できる主観的品質を与えるものではあるが、20〜16000Hzおよび20〜20000Hzの範囲でそれぞれ動作するFMラジオやCDの品質に比べると上記品質はまだ低い品質である。
音声符号器は、通信チャネルを介して伝送されたり、記憶媒体に記憶されたりする音声信号をデジタルビットストリームに変換するものである。この音声信号はデジタル化される。すなわち、サンプルされて、1サンプル当たり通常16ビットで量子化される。音声符号器は、良好な主観的音質を保持しながら、少ないビット数でこれらのデジタルサンプルを表す役割を果たすものである。音声復号器すなわちシンセサイザは、伝送され、記憶されるビットストリームを処理して、このビットストリームを元の音声信号へ変換する。
符号励振線形予測(CELP)符号化は、主観的品質とビットレート間での良好な妥協を達成するための従来技術による最善の技法のうちの1つの技法である。この符号化技法は、無線および有線用アプリケーションの双方におけるいくつかの音声符号化規格の基礎を構成するものである。CELP符号化の際に、サンプルされた音声信号は通常フレームと呼ばれる、N個のサンプルからなる連続ブロックで処理される。Nは一般に10〜30msに対応する所定の数である。線形予報(LP)フィルタが計算され、フレーム毎に伝送される。LPフィルタの計算は一般に先読み、すなわち後続フレームからの5〜15msの音素片の先読みを必要とする。N個のサンプルフレームがサブフレームと呼ばれるさらに小さなブロックに分割される。通常、1フレーム内のサブフレームの個数は3または4であり、4〜10msのサブフレームが結果として得られる。個々のサブフレームで、通常2つの成分(過去との励振と新規の固定コードブック励振)から励振信号が得られる。過去の励振から形成される成分は適応コードブック励振またはピッチ励振と呼ばれることが多い。励振信号を特徴づけるパラメータは符号化され、復号器へ送信され、そこで再構成された励振信号がLPフィルタの入力信号として用いられる。
無線システムでは、符号分割多元接続(CDMA)技術を利用して、ソース制御可変ビットレート(VBR)音声符号化を利用することにより、システムの容量が大幅に改善される。ソース制御VBRの符号化時に、コーデックはいくつかのビットレートで動作し、レート選択モジュールを用いて、音声フレームの性質(例えば有声、無声、トランジェント、背景雑音など)に基づいて符号化に使用するビットレートの検出を行う。その目標は、平均データ転送速度(ADR)とも呼ばれる平均ビットレートで最善の音質を達成することである。レート選択モジュールの同調を行うことにより、コーデックは異なるモードで動作して、異なるモードで異なるADRに達することが可能となり、ADRの上昇に伴ってコーデックのパフォーマンスの向上が図られる。このパフォーマンスの向上によって、音質とシステム容量間でのトレードオフのメカニズムがコーデックに与えられる。CDMAシステム(例えばCDMA ONEとCDMA2000)では、一般に4通りのビットレートが使用され、これらのビットレートはフルレート(FR)、ハーフレート(HR)、4分の1レート(QR)および8分の1レート(ER)と呼ばれる。このシステムでは、レート設定Iとレート設定IIと呼ばれる2つのレート設定がサポートされている。レート設定IIでは、レート選択メカニズムを備えた可変レートコーデックは、14.4、7.2、3.6および1.8kbit/秒の総ビットレートに対応する13.3(FR)、6.2(HR)、2.7(QR)および1.0(E)kbit/秒のソース符号化ビットレートで動作する(エラー検出用の若干のビットが追加される)。
CDMAシステムでは、いくつかの音声フレームでフルレートの代わりにハーフレートを課して、帯域内シグナリング情報(ディム・アンド・バースト(dim-and-burst)シグナリングと呼ばれる)の送信を意図することができる。(セル境界の近くのような)劣悪なチャネル条件の間、本システムにより最大ビットレートとしてのハーフレートの利用も課されて、コーデックのロバスト性の向上を図るようにすることができる。これはハーフレートマックス(max)ビットレートと呼ばれる。典型的には、VBR符号化時に、フレームが、安定した有声音または安定した無声音である場合に、ハーフレートが使用される。個々のタイプの信号に対して2つのコーデック構造が用いられる(無声音の場合、ピッチコードブックなしのCELPモデルが使用され、有声音の場合、周期性の向上と、ピッチインデックス用ビット数の減少とのために信号修正が利用される)。フルレートは、頭子音(onset)、過渡フレームおよび混合有声フレーム用として使用される(一般的CELPモデルが通常使用される)。レート選択モジュールが符号化対象フレームをフルレートフレームとして選択し、かつ、システムがハーフレートフレームを課している場合、音声パフォーマンスの低下が生じることになる。というのは、ハーフレートモードが頭子音と過渡信号とを効率良く符号化する能力を持っていないからである。
適応マルチレート広帯域(AMR−WB)音声コーデックとして知られている広帯域コーデックは、いくつかの広帯域音声電話並びにサービス用としてITU−T(国際電気通信連合−電気通信標準化セクタ)により、並びに、GSMとW−CDMA第3世代無線システム用として3GPP(第3世代パートナプロジェクト)により最近選定されたコーデックである。AMR−WBコーデックは6.6〜23.85kbit/秒の範囲の9ビットレートを備える。CDMA2000システム用としてAMR−WBベースのソースにより制御されるVBRコーデックには、CDMA2000と、AMR−WBコーデックを使用するその他のシステムとの間での相互運用が可能となるという利点がある。12.65kbit/秒のAMR−WBビットレートは、レート設定IIの13.3kbit/秒フルレートに適合する最も近いレートである。CDMA2000広帯域VBRコーデックとAMR−WBとの間の共通レートとしてこのレートを使用して、(音質の低下を生じる)トランスコードを必要とすることなく相互運用性を可能にすることができる。CDMA2000VBR広帯域ソリューションに6.2kbit/秒のハーフレートを追加して、レート設定IIフレームワークでの効率的処理を可能にする必要がある。この時、上記コーデックはいくつかのCDMA2000専用モードでの動作が可能となり、AMR−WBコーデックを使用するシステムとの相互運用性モードを備える。しかし、CDMA2000と、AMR−WBを使用する別のシステムとの間での相互システムタンデムフリーオペレーションコールによって、CDAM2000システムによって、前に説明したように(ディム・アンド・バーストシグナリングの場合のように)ハーフレートの使用が強制される可能性がある。AMR−WBコーデックがCDMA2000広帯域コーデックの6.2kbit/秒ハーフレートを認識しないため、強制ハーフレートフレームが消去済みフレームと解釈される。これは接続パフォーマンスに逆の影響を与えるものとなる。
国際公開第01/52467号 国際公開第00/48170号 特開2000−81898号公報
本発明の第1の態様によれば、第1の通信方式を用いる第1の局であって、第1の符号器と第1の復号器とを具備する第1の局を、第2の通信方式を用いる第2の局であって、第2の符号器と第2の復号器とを具備する第2の局と相互運用を行う方法であり、前記第1の局と前記第2の局のうちの一方の局の符号器から前記第1の局と前記第2の局のうちの他方の局の復号器へ信号符号化パラメータを伝送することにより前記第1の局と前記第2の局との間の通信を行う方法が提供され、上記方法は、前記信号符号化パラメータの伝送中ビットレートを低減するように設計された通信モードを用いて、前記一方の局から前記他方の局へ前記信号符号化パラメータを伝送することを求める要求を受け取るステップと、上記要求に応答して、前記一方の局の符号器から前記信号符号化パラメータの一部を落す(drop)ステップと、前記他方の局の復号器へ残りの信号符号化パラメータを伝送するステップと、上記信号符号化パラメータの上記一部を再生するステップと、上記他方の局の復号器で信号符号化パラメータを復号化するステップと、を具備する。
第1の通信方式を用いる第1の局であって、第1の符号器と第1の復号器とを具備する第1の局を、第2の通信方式を用いる第2の局であって、第2の符号器と第2の復号器とを具備する第2の局と相互運用を行うシステムであって、前記第1の局と前記第2の局のうちの一方の局の符号器から前記第1の局と前記第2の局のうちの他方の局の復号器へ信号符号化パラメータを伝送することにより前記第1の局と前記第2の局との間の通信を行うシステムにおいて、本システムは、信号符号化パラメータの伝送中にビットレートを低減するように設計された通信モードを用いて、前記一方の局から前記他方の局へ信号符号化パラメータを伝送することを求める要求を受け取る手段と、上記要求に応じて、前記一方の局の符号器から信号符号化パラメータの一部を落す手段と、他方の局の復号器へ残りの信号符号化パラメータを伝送する手段と、信号符号化パラメータの一部を再生する手段と、上記信号符号化パラメータを復号化する他方の局の復号器とを具備する。
本発明の第2の態様によれば:第1の通信方式を用いる第1の局であって、第1の符号器と第1の復号器とを具備する第1の局を、第2の通信方式を用いる第2の局であって、第2の符号器と第2の復号器とを具備する第2の局と相互運用を行う方法であり、上記第1の局と上記第2の局のうちの一方の局の符号器から上記第1の局と上記第2の局のうちの他方の局の復号器へ、音響信号に関連する信号符号化パラメータを伝送することにより上記第1の局と第2の局との間の通信を行う方法が提供され、上記方法は、上記音響信号を類別して、上記信号符号化パラメータの伝送用としてフルビットレートが使用される第1の通信モードを用いて、前記一方の局の符号器から上記他方の局の復号器へ上記信号符号化パラメータを伝送すべきかどうかを判定するステップと;上記信号符号化パラメータの伝送中ビットレートを低減するように設計された第2の通信モードを用いて、前記一方の局の符号器から上記他方の局の復号器へ上記信号符号化パラメータを伝送することを求める要求を受け取るステップと、上記音声信号の類別が、上記第1の通信モードを用いて上記信号符号化パラメータを伝送すべきである旨を判定したとき、および、上記第2の通信モードを用いて上記信号符号化パラメータを伝送することを求める上記要求を受け取ったとき、前記一方の局の符号器から上記信号符号化パラメータの一部を落し、上記第2の通信モードを用いて、上記他方の局の復号器へ残りの信号符号化パラメータを伝送するステップと、を具備する。
第1の通信方式を用いる第1の局であって、第1の符号器と第1の復号器とを具備する第1の局を、第2の通信方式を用いる第2の局であって、第2の符号器と第2の復号器とを具備する第2の局と相互運用を行う方法であり、上記第1の局と上記第2の局のうちの一方の局の符号器から上記第1の局と上記第2の局のうちの他方の局の復号器へ、音響信号に関連する信号符号化パラメータを伝送することにより上記第1の局と第2の局との間の通信を行うシステムであって、本システムが、上記音響信号を類別して、上記信号符号化パラメータの伝送用としてフルビットレートが使用される第1の通信モードを用いて、前記一方の局の符号器から上記他方の局の復号器へ上記信号符号化パラメータを伝送すべきかどうかを判定する手段と、上記信号符号化パラメータの伝送中ビットレートを低減するように設計された第2の通信モードを用いて、前記一方の局の符号器から上記他方の局の復号器へ上記信号符号化パラメータを伝送することを求める要求を受け取る手段と、上記音声信号の類別が、上記第1の通信モードを用いて上記信号符号化パラメータを伝送すべきである旨を判定したとき、および、上記第2の通信モードを用いて上記信号符号化パラメータを伝送することを求める上記要求を受け取ったとき、前記一方の局の符号器から上記信号符号化パラメータの一部を落し、上記第2の通信モードを用いて、上記他方の局の復号器へ残りの信号符号化パラメータを伝送する手段と、を具備する。
本発明の第3の態様によれば、第1の局から第2の局へ信号符号化パラメータを伝送する方法が提供され、上記方法は、第1の局と第2の局のうちの一方の局で、フルレート通信モードに基づいて音響信号を符号化するステップと、信号符号化パラメータの伝送中にビットレートを低減するように設計された第2の通信モードを用いて、第1の局と第2の局のうちの前記一方の局から他方の局へ信号符号化パラメータを伝送することを求める要求を受け取るステップと、上記要求に応じて、フルレート通信モードで符号化された信号符号化パラメータを第2の通信モードで符号化された信号符号化パラメータに変換するステップと、上記第2の通信モードで符号化された信号符号化パラメータを第1の局と第2の局のうちの他方の局へ伝送するステップと、を具備する。
第1の局から第2の局へ信号符号化パラメータを伝送するシステムは、第1の局と第2の局のうちの一方の局で、フルレート通信モードに基づいて音響信号を符号化する符号器と、上記信号符号化パラメータの伝送中にビットレートを低減するように設計された第2の通信モードを用いて、上記第1の局と第2の局の前記一方の局から他方の局へ信号符号化パラメータを伝送することを求める要求を受け取る手段と、上記要求に応じて、フルレート通信モードで符号化された信号符号化パラメータを上記第2の通信モードで符号化された信号符号化パラメータに変換する手段と、上記第2の通信モードで符号化された信号符号化パラメータを第1の局と第2の局のうちの他方の局へ伝送する手段とを具備する。
単に例示として示す添付図面を参照しながら、発明を限定するものではない、本発明の実施例についての以下の説明を読むとき、本発明の上述の目的並びにその他の目的、利点並びに特徴はさらに明らかになる。
本発明を利用することができる音声通信システムを示す、発明を限定するものではない例示の概略ブロック図である。 レート決定論理回路を備える可変ビットレートコーデックを示す、発明を限定するものではない例示の機能ブロック図である。 低エネルギフレーム用の汎用HRを用いるレート決定論理回路を備える可変ビットレートコーデックを示す、発明を限定するものではない例示の機能ブロック図である。 レート決定論理回路内にハーフレートシステム要求を含む、図3に従う可変ビットレートコーデックを示す、発明を限定するものではない例示の機能ブロック図である。 発明を限定するものではない本発明の例示実施形態に基づく可変ビットレートコーデックの1例を示す機能ブロック図であり、レート決定論理回路内でのパケットレベル(またはビットストリームレベル)のハーフレートシステム要求が含まれる。 3GPP<−>CDMA2000移動局間での呼あるいはAMR−WB<−>VBR−WB間でのIP呼の形で関与する場合の、VBR−WBの相互運用可能モードにおける、発明を限定するものではない本発明の例示実施形態に基づくディム・アンド・バーストシグナリング法のための1つの例示構成である。 広帯域符号化装置(具体的にはAMR−WB符号器)を示す、発明を限定するものではない例示の概略ブロック図である。 広帯域復号化装置(具体的にはAMR−WB復号器)の発明を限定するものではない例を示す概略ブロック図である。
音声信号に関する以下の説明で、本発明の例示実施形態について説明するが、本発明の概念は別のタイプの信号、特に別のタイプの音響信号(但しこれ以外を排除するものではない)にも同様に適用されるものであることに留意されたい。
図1は、音声符号化装置および音声復号化装置の使用を描く音声通信システム100を示す図である。図1の音声通信システム100は、通信チャネル101を通じて音声信号の伝送をサポートするものである。通信システム100は、例えば、有線、光学的リンクあるいはファイバリンクなどを含むものであってもよいが、通信チャネル101は、一般に、少なくとも一部に無線周波数リンクを備えるシステムである。無線周波数リンクは、セルラ電話システムの場合に見られるように、共有の帯域資源を必要とする多数の同時音声通信をサポートしている場合が多い。図示してはいないが、通信チャネル101は、後で再生するために符号化済み音声信号を記録し格納するシステム100の単一のデバイス実装構成内の記憶デバイスにより置き換えてもよい。
図1の音声通信システム100では、マイク102によって、アナログ音声信号103が生成され、この音声信号はアナログデジタル(A/D)変換器104へ出力され、デジタル音声信号105に変換さる。音声符号器106はデジタル音声信号105を符号化して、1組の信号符号化パラメータ107を生成し、これらのパラメータは2進形式に符号化されて、チャネル符号器108へ転送される。オプションのチャネル符号器108は、通信チャネル101を介して信号符号化パラメータ107を伝送する前に、信号符号化パラメータ107の2進表示に冗長性を付加する。
受信側では、チャネル復号器109は、受信したビットストリーム111内の上記冗長な情報を利用して、伝送中に生じたチャネルエラーを検出し、修正する。音声復号器110は、チャネル復号器109から受信したビットストリーム112を変換して、元の1組の信号符号化パラメータへ戻し、この回復された信号符号化パラメータから、デジタル合成した音声信号113を作成する。音声復号器110で再構成されたデジタル合成済みの音声信号113は、デジタルアナログ(D/A)変換器115によりアナログ形式114に変換され、スピーカーユニット116を通じて再生される。
ソース制御可変ビットレート音声符号化
図2は、4つの符号化ビットレートを制御するレート決定論理回路を備えた可変ビットレートコーデック構成を示す、発明を限定するものではない一例を描く図である。本例では、この組のビットレートには、非活性音声フレーム(8分の1レート(CNG)符号化モジュール208)専用のコーデックビットレートと、無声音フレーム(ハーフレート無声符号化モジュール207)用ビットレートと、安定した有声音フレーム(ハーフレート有声符号化モジュール206)用ビットレートと、別のタイプのフレーム(フルレート符号化モジュール205)用ビットレートとが含まれる。
レート決定論理回路は、フレームに基づいて3つのステップ(201、202、203)で実行される信号の類別ベースとするものであり、この論理回路の処理は当業者に周知のものである。
最初に、音声活動検出器(VAD)201が活性音声フレームと非活性音声フレームとの識別を行う。非活性音声フレーム(背景雑音信号)を検出した場合、信号類別チェーンは終了し、上記フレームは8分の1レートのフレームとして符号化モジュール208で符号化され、快適雑音の発生(CNG)が復号器(CDMA2000レート設定IIに準拠する1.0kbit/秒)で行われる。活性音声フレームが検出された場合、そのフレームは第2の類別器202にかけられる。
第2の類別器202は有声化決定を行う専用の類別器である。類別器202が無声音フレームとして上記フレームを類別した場合、類別チェーンは終了し、該フレームは、無声信号(CDMA2000レート設定IIに準拠する6.2kbit/秒)用として最適化されたハーフレートを用いてモジュール207内で符号化される。類別器202が無声音フレームとして上記フレームを類別しなかった場合、この音声フレームは“安定した有声”類別器203を通じて処理される。
上記フレームが安定した有声フレームとして類別された場合、このフレームは、安定した有声信号(CDMA2000レートIIに準拠する6.2kbit/秒)用の最適化ハーフレートによってモジュール206で符号化される。フレームが安定した有声フレームとして類別されなかった場合、フレームは有声頭子音や急に発達する有声音声信号のような不安定な音素片を含む可能性が大きい。これらのフレームは、一般に、良好な主観的品質を維持するために高いビットレートを必要とする。したがって、この場合、音声フレームは、フルレートフレーム(CDMA2000レート設定IIに準拠する13.3kbit/秒)としてモジュール205で符号化されることになる。
発明を限定するものではない図3に図示の代替実施例では、フレームが“安定した有声”として類別されなかった場合、そのフレームは低いエネルギーのフレーム類別器311を通じて処理される。このフレーム類別器311は、VAD検出器201により考慮されないフレームの検出に用いられる。フレームエネルギーが或る一定のしきい値以下にある場合、フレームは汎用ハーフレート符号器312を用いて符号化され、フレームエネルギーが或る一定のしきい値以下でなければ、フレームはフルレートフレームとしてモジュール205で符号化される。
信号類別用モジュール201、202、203、311は、当業者には周知のものであり、したがって、本明細書ではこのモジュールについてさらなる説明は行わない。発明を限定するものではない図3の例では、異なるビットレートでの符号化モジュールすなわちモジュール205、206、207、208、312は、符号励振線形予測(CELP)符号化法に基づくものであり、やはり当業者には周知のものである。例えば、本明細書で上述したCDMA2000システムのレート設定IIに準拠してビットレートが設定される。
勧告G.722.2として国際電気通信連合(ITU)により標準化され、AMR−WBコーデック(適応マルチレート広帯域コーデック)として知られている広帯域音声コーデック[IT−UT勧告G.722.2“適応マルチレート広帯域(AMR−WB)を使用する16kbit/秒周辺での音声の広帯域符号化”、2002年、ジュネーブ]に関連して、発明を限定するものではない本発明の例示実施形態について本明細書で説明する。このコーデックは、第3世代無線システムにおける広帯域電話用として第3世代パートナプロジェクト(3GPP)により選択されたものである[3GPP TS26.190、“AMR広帯域音声コーデック:トランスコード機能”3GPP技術仕様]。AMR−WBは、6.6〜23.85kbit/秒の9ビットレートで動作することができる。本明細書では、フルレートの一例として12.65kbit/秒のビットレートを使用している。
言うまでもなく、発明を限定するものではない本発明の例示実施形態は、別のタイプのコーデックに適用することも可能である。
読者の便宜を旨として、以下本明細書にAMR−WBコーデックの概観を示す。
AMR−WB符号器の概観
図7を参照すると、701〜711の番号をつけた11個のモジュールに分けられた図7の符号化装置700によって、ブロック毎にサンプル済み音声信号の符号化が行われる。
したがって、入力音声信号712は、フレームと呼ばれる上述のL−サンプルブロックでブロック毎に処理されることになる。
図7を参照すると、サンプルされた入力音声信号712はダウンサンプリングモジュール701でダウンサンプリングされる。この信号は、当業者には周知の技法を用いて16kHzから12.8kHzへダウンサンプルされる。ダウンサンプリングによって符号化効率が上昇する。というのは、さらに狭い周波数帯域が符号化されることになるからである。ダウンサンプリングによってアルゴリズムの複雑さも減ることになる。というのは、フレーム内のサンプル数が減少するからである。ダウンサンプリング後、20msの320個のサンプルフレームは256個のサンプルフレーム(4/5のダウンサンプリング率)へ減少する。
次いで、入力フレームはオプションの前処理モジュール702へ出力される。前処理モジュール702は50Hzのカットオフ周波数でハイパスフィルタから構成されるものであってもよい。ハイパスフィルタ702は50Hz未満の不要の音響成分を除去する。
ダウンサンプルされ、前処理された信号は、sp(n)、n=0,1,2,...,L−1によって示される。但しLはフレーム長(12.8kHzのサンプリング周波数における256)である。この信号sp(n)は、下記の伝達関数を有するプレエンファシスフィルタ703を用いてプレエンファシスされる。
P(z)=1−μz-1
ここでμは0と1との間に在る値(代表値はμ=0.7)を持つプレエンファシス係数である。プレエンファシスフィルタ703の機能は入力音声信号の高い周波数の内容を改善することである。また、プレエンファシスフィルタ703によって、入力音声信号のダイナミックレンジは狭くなり、これによって、プレエンファシスフィルタ703は、固定ポイントにおける実施構成にとってさらに適したものになる。プレエンファシスは、音質の向上に寄与する量子化誤差の適切な全体的聴感重み付けを達成する際に重要な役割も果たすものである。
プレエンファシスフィルタ703の出力信号はs(n)で示される。この信号はモジュール704におけるLP分析の実行に用いられる。LP分析は当業者には周知の技法である。図7の例では自己相関法が用いられている。自己相関法では、信号s(n)は、典型的には30〜40msのオーダーの長さを持つハミングウィンドウを用いてまずウィンドウ化される。これらの自己相関はウィンドウ化された信号から計算され、レビンソン・ダービン(Levinson−Durbin)の漸化式を利用してLPフィルタ係数aiが計算される。但しi=1,...,pであり、pは、広帯域符号化において典型的には16であるLPのオーダーである。パラメータaiはLPフィルタの伝達関数A(z)の係数である。LPフィルタの伝達関数A(z)は下記の関係式により与えられる:
Figure 0005173939
LP分析はモジュール704で実行されるが、モジュール704はLPフィルタ係数の量子化と補間も実行する。LPフィルタ係数は、量子化と補間とにさらに適した別の同等の領域に最初変換される。線スペクトルペア(LSP)とイミタンススペクトルペア(ISP)領域は、量子化と補間とを効率良く実行することができる2つの領域である。16個のLPフィルタ係数(ai)は、分割量子化またはマルチステージ量子化またはこれらの量子化の組み合わせを用いて30〜50ビットのオーダーのビット数で量子化することができる。補間の目的は、フレーム毎に一回LPフィルタ係数を伝送しながらサブフレーム毎にLPフィルタ係数の更新を可能にすることであり、この更新によってビットレートを上げることなく符号器のパフォーマンスの向上が図られる。LPフィルタ係数の量子化と補間とは、当業者には周知の別の処理であると信じられているので、本明細書ではさらに説明はしない。
以下のパラグラフはサブフレームに基づいて行われる残りの符号化処理について説明するものである。入力フレームは、5msの4個のサブフレーム(12.8kHzのサンプリングで周波数の64個のサンプル)に分割される。以下の説明では、フィルタA(z)はサブフレームの量子化されていない補間済みLPフィルタを示し、フィルタA(z)*は、量子化されたサブフレームの補間済みのLPフィルタを示す。フィルタA(z)*はサブフレーム毎に通信チャネルを介する伝送用マルチプレクサ713へ出力される。
分析/合成符号器では、聴感重み付け領域において入力音声信号712と合成音声信号との間の二乗平均誤差を最小化することにより最適ピッチパラメータと新規のパラメータとが探索される。重み付き信号sw(n)は、プレエンファシスフィルタ703からの信号s(n)に応じて聴感重み付けフィルタ705で計算される。広帯域信号に適した一定の分母を持つ聴感重み付けフィルタ705が使用される。聴感重み付けフィルタ705用の伝達関数の1例は、下記の関係式によりって与えられる:
W(z)=A(z/γ1)/(1−γ2-1)(但し0<γ2<γ1≦1)
ピッチ分析を単純化するために、開ループピッチ・ラグTOLの推定が、開ループピッチ探索モジュール706内で重み付き音声信号sw(n)から最初に行われる。次いで、サブフレームに基づいて閉ループピッチ探索モジュール707で行われる閉ループピッチ分析が開ループピッチTOL周辺に限定され、これによって、LTPパラメータT(ピッチラグ)とパラメータb(ピッチ利得)の探索の複雑さが大幅に減少することになる。開ループピッチ分析は、通常、当業者に周知の技法を用いてモジュール706で10ms(2個のサブフレーム)毎に行われる。
LTP(長期予測)分析用の目標ベクトルxが最初に計算される。この計算は、通常、重み付き音声信号sw(n)から重み付け合成フィルタW(z)/A(z)*のゼロ入力応答s0を減算することにより行われる。このゼロ入力応答s0は、LP分析、量子化、補間のモジュール704から得られる量子化済み補間LPフィルタA(z)*に応じて、並びに、LPフィルタA(z)とA(z)*と、励起ベクトルuの初期状態とに応じてメモリ更新モジュール711に格納された重み付け合成フィルタW(z)/A(z)*に応じて、ゼロ入力応答計算機708により計算される。この処理は当業者には周知の処理であるため、さらなる説明は行わない。
重み付け合成フィルタW(z)/A(z)*のN次元インパルス応答ベクトルhは、モジュール704から得られるLPフィルタA(z)とA(z)*の係数を用いてインパルス応答生成装置709で計算される。この場合もまた、上記処理は当業者に周知のものであるので、本明細書ではさらなる説明は行わない。
閉ループピッチ(またはピッチコードブック)パラメータb、t、jは閉ループピッチ探索モジュール707で計算されるが、閉ループピッチ探索モジュール707は目標ベクトルxと、インパルス応答ベクトルhと、開ループピッチ・ラグTOLとを入力として用いる。
上記ピッチ探索は、例えば、下記の式:
(j)=||x−b(j)(j)||2(j=1,2,...,k)
で表わされる、目標ベクトルxと過去の励振yのスケールされたフィルタ済みバージョンとの間での二乗平均重み付きピッチ予測誤差を最小化する最適ピッチラグTと最適ピッチ利得bの発見から構成される。
さらに具体的に述べれば、ピッチ(ピッチコードブック)探索は3段階から構成される。
第1の段階で、重み付き音声信号sw(n)に応じて開ループピッチ探索モジュール706で開ループピッチ・ラグTOLが推定される。以上の説明に示されるように、この開ループピッチ分析は通常、当業者に周知の技法を用いて10ms(2個のサブフレーム)毎に行われる。
第2の段階で、整数ピッチラグ用の閉ループピッチ探索モジュール707で、推定される開ループピッチ・ラグTOL(通常±5)周辺の探索基準値Cが探索され、この探索段によって探索処理手順が大幅に単純化される。すべてのピッチラグについて畳み込みを計算する必要なく、フィルタ済みのコードベクトルyT(このベクトルは以下の説明で規定する)を更新する単純な処理手順が用いられる。探索基準Cの1例を下記に示す:
Figure 0005173939
第2の段階で最適の整数ピッチラグが得られるとすぐに、探索の第3の段階(モジュール707)で、探索基準Cによって、当該最適整数ピッチラグ周辺の分数部分が検査される。例えば、AMR−WB規格が1/4と1/2のサブサンプル分解能を使用しているとする。
広帯域信号では、調波構造は、音素片に応じて或る一定の周波数までしか存在しない。したがって、広帯域音声信号の有声音素片でのピッチ寄与を効率よく表現するために、広帯域スペクトルにわたる周期性の量を変更する柔軟性が必要となる。これは、複数の周波数波形変換フィルタ(例えばローパスフィルタまたは帯域フィルタ)を介してピッチコードベクトルを処理することにより達成される。さらに、上記の規定した平均2乗重み付き誤差e(j)を最小化する周波数整形フィルタが選択される。この選択された周波数整形フィルタはインデックスjにより特定される。
ピッチコードブックインデックスtが符号化され、伝送用として通信チャネルを介してマルチプレクサ713へ送信される。ピッチ利得bが量子化され、マルチプレクサ713へ送信される。エクストラビットを利用して、インデックスjが符号化され、このエクストラビットはマルチプレクサ713へ出力される。
ピッチ、またはLTP(長期予測)パラメータb、T、jが決定されるとすぐに、次のステップは、図7の新規の励振探索モジュール710によって最適の新規の励振を探索するステップから構成される。最初に、LTP寄与値を減算することにより目標ベクトルxが更新される:
x’=x−byT
但しbはピッチ利得であり、yTはフィルタされたピッチコードブックベクトル(選択された周波数整形フィルタ(インデックスj)フィルタを用いてフィルタされ、インパルス応答値hを用いて畳み込みが行われた遅延値Tにおける過去の励振値)である。
CELPでの新規の励振探索処理手順が新規のコードブックで行われ、最適励振コードベクトルckと、目標ベクトルx’と、コードベクトルckのスケールされたフィルタ済みバージョンとの間での平均2乗誤差Eを最小化する利得gとが発見され、例えば、
E=||x’−gHck||2
となる。但し、Hはインパルス応答ベクトルhから導き出される低三角畳み込み行列である。発見された最適コードベクトルckに対応する新規のコードブックのインデックスkと利得gとは、通信チャネルを通る伝送用としてマルチプレクサ213へ出力される。
1995年8月22日にAdoulらに付与米国特許第5,444,816号によれば、使用する新規のコードブックは、合成音質の改善を図るために、所定のスペクトル成分を強める適応プレフィルタF(z)を後に伴う代数的コードブックから成る動的コードブックであってもよいことに留意されたい。さらに具体的に述べれば、上記新規のコードブック探索は、1995年8月22日発行の(Adoulらの)米国特許第5,444,816号、1997年12月17日にAdoulらに付与された第5,699,482号、1998年5月19日にAdoulらに付与された第5,754,976号および1997年12月23日付の(Adoulらの)第5,701,392号に記載のような代数的コードブックによってモジュール710で行われるものであってもよい。
AMR−WB復号器の概観
図8の音声復号器800は、デジタル入力822(デマルチプレクサ817への入力ビットストリーム)と出力側のサンプルされた音声信号823(加算器821の出力)との間で行われる種々のステップを例示するものである。
デマルチプレクサ817は、デジタル入力チャネルから受信した2進情報(入力ビットストリーム822)から信号符号化パラメータを抽出する。受信した個々の2進フレームから抽出される信号符号化パラメータとして、以下のものがある:
− 短期予測パラメータ(STP)とも呼ばれ、1フレーム毎に一回生成される量子化済み補間LP係数A(z)*(ライン825)
− (個々のサブフレーム用の)長期予測(LTP)パラメータT、b、j
− (個々のサブフレーム用の)新規の励振インデックスkおよび利得g
以下本明細書でを説明するように、現在の音声信号は上記パラメータに基づいて合成される。
新規の励振コードブック818はインデックスkに応動して、新規のコードベクトルckを生成し、このコードベクトルckは増幅器824を通じて、復号化された新規の励振利得gによりスケールされる。上述の米国特許第5,444,816号;第5,699,482号;第5,754,976号および第5,701,392号に記載のようなこの新規のコードブック818を利用して新規のコードベクトルckが生成される。
増幅器824の出力部の、生成され、スケールされた上記コードベクトルgckは、周波数依存ピッチエンハンサ805を通じて処理される。
励振信号uの周期性の向上によって有声音素片の品質が改善される。周期性の向上は、低い周波数よりも高い周波数を強調する周波数応答を行う新規のフィルタF(z)(ピッチエンハンサ805)を通じて新規の(固定)励振コードブックから新規のコードベクトルckのフィルタリングを行うことにより達成される。新規のフィルタF(z)の係数は、励振信号uにおける周期性の量に関連する。
新規のフィルタF(z)の係数を導き出す効率のよい可能な方法として、総励振信号u内のピッチ寄与量とこれらの係数とを関連づける方法がある。この結果、より高いピッチ利得に対してより高い周波数がより強く強調される(勾配全体がより強くなる)サブフレーム周期性に依存する周波数応答が生じることになる。この新規のフィルタ805は、励振信号uがさらに周期的になるとき、低い周波数で新規のコードベクトルckのエネルギを下げる効果を有し、これによって、高い周波数よりも低い周波数で励振信号uの周期性が高められる。新規のフィルタ805用に対して提案される式は下記の通りである:
F(z)=−αz+1−αz-1
但しαは励振信号uの周期性のレベルから導き出される周期性係数である。周期性係数αは有声化係数発生器804で計算される。最初に、有声化係数rvが、有声化係数発生器804で下記の式により計算される:
V=(EV−EC)/(EV+EC
但しEvは、スケールされたピッチコードベクトルbvTのエネルギであり、Ecは、スケールされた新規のコードベクトルgckのエネルギである。すなわち:
Figure 0005173939
Figure 0005173939
vの値が−1と1との間に在る(1は純粋に有声の信号に対応し、−1は純粋に無声の信号に対応する)ことに留意されたい。
ピッチコードブック801にピッチ遅延Tを印加することにより上述のスケールされたピッチコードベクトルbvTが生成され、ピッチコードベクトルが生成される。次いで、このピッチコードベクトルはローパスフィルタまたは帯域フィルタ802を通じて処理される。上記フィルタのカットオフ周波数は、インデックスjに関してデマルチプレクサ817から選択され、フィルタされたピッチコードベクトルvTを生成する。次いで、このフィルタされたピッチコードベクトルvTは増幅器826によりピッチ利得bの分だけ増幅されて、スケールされたピッチコードベクトルbvTが生成される。
次いで、有声化係数発生器804で有声化係数αが下記の式により計算される。
α=0.125(1+rV
上記式は、純粋に無声の信号を表わす値0と、純粋に有声の信号表わす値0.25とに対応する。
したがって、強められた信号cfは、新規のフィルタ805(f(z))を通じて、スケールされた新規のコードベクトルgckのフィルタリングを行うことにより計算される。
強められた励振信号u’が下記の式として加算器820により計算される:
u’=cf+bVT
上記処理は符号器700で行われるものではないことに留意されたい。したがって、メモリ803に記憶された拡張機能を用いることなく、励振信号uの過去の値を用いて、ピッチコードブック801の内容を更新して、符号器700と復号器800との間の同期を保持することが肝要となる。したがって、励振信号uを利用してピッチコードブック801のメモリ803が更新され、強められた励振信号u’がLP合成フィルタ806の入力部で用いられることになる。
式1/A(z)*を持つLP合成フィルタ806を通じて上記強められた励振信号u’のフィルタリングを行うことにより合成信号s’が計算される。但しA(z)*は現在のサブフレームにおける量子化され、補間されたLPフィルタである。図8でわかるように、デマルチプレクサ817からライン825で量子化され、補間されたLP係数A(z)*は、LP合成フィルタ806へ出力され、LP合成フィルタ806のパラメータを適宜調整する。ディエンファシスフィルタ807は図7のプレエンファシスフィルタ703の逆フィルタである。ディエンファシスフィルタ807の伝達関数は下記の式で与えられる:
D(z)=1/(1−μz-1
ここで、μは0と1との間に在る値(代表値はμ=0.7)を持つプレエンファシス係数である。より高次のフィルタを使用することも可能である。
ベクトルs’はディエンファシスフィルタD(z)807を通じてフィルタされ、ハイパスフィルタ808を通じて処理されるベクトルsdが得られ、50Hz未満の不要周波数が除去され、さらにshが得られる。
オーバーサンプラ809は図7のダウンサンプラ701の逆処理を行う。例えば、オーバーサンプリングは、当業者には周知の技法を用いて12.8kHzサンプリングレートを元の16kHzサンプリングレートへ変換する。これらのオーバーサンプルされた合成信号をs*で示す。この信号は合成広帯域中間信号とも呼ばれる。
これらのオーバーサンプルされた合成信号s*には、符号器700でダウンサンプリング処理(図7のモジュール701)中に紛失したより高い周波数成分は含まれない。これによって合成音声信号に対するローパス聴感が与えられる。原信号の最大帯域を回復するために、高周波数生成処理手順がモジュール810で実行され、有声化係数発生器804(図8)からの入力が必要となる。
高周波数生成モジュール310から結果として生じる帯域フィルタ済みの雑音シーケンスzが、加算器821によって、オーバーサンプルされた合成音声信号s*に追加され、最終的に再構成された出力音声信号soutが出力部823で得られる。高い周波数を再生する処理の1例が、2000年5月4日公開の国際PCT出願特許WO00/25305に記載されている。
図3に戻って参照すると、フルレート通信モードでAMR−WB規格に準拠するコーデックは12.65kbit/秒で動作し、表1に示すビット割当てによって使用される。AMR−WBコーデックの12.65kbit/秒レートを利用することによって、AMR−WBコーデック規格を使用する別のシステムとの相互運用能力を持つCDMA2000システム用の可変ビットレートコーデックの設計が可能となる。CDMA2000レート設定IIの13.3kbit/秒フルレートに合うように割増しの13ビットが追加される。これらのビットを利用して消去済みフレームの場合のコーデックのロバスト性の向上が図られる。AMR−WBコーデックに関するさらなる詳細については、参考文献“IT−UT勧告G.722.2”の適応マルチレート広帯域(AMR−WB)を利用する16kbit/秒周辺における音声の広帯域符号化(2002年ジュネーブ)” で知ることができる。上記コーデックは、広帯域信号用として最適化される代数的符号励振線形予測(ACELP)モデルに基づくものである。このコーデックは、16kHzのサンプリング周波数によって20ms音声フレームで動作する。LPフィルタパラメータは、46ビットを用いて1フレーム毎に一回符号化される。次いで、フレームは4つのサブフレームに分割され、このサブフレームで適応コードブックインデックスと固定コードブックインデックス並びに利得が1フレーム毎に一回符号化される。固定コードブックは代数的コードブック構造を用いて構築され、このコードブック構造で、サブフレーム内の64個の位置がインタリーブ済みの位置の4つのトラックに分割され、個々のトラック内に2つの極性付きパルスが置かれる。個々のトラックのこれら2つのパルスは9ビットを用いて符号化され、サブフレーム毎に合計36ビットを出力する。
Figure 0005173939
12.65kbit/秒でのAMR−WBに基づいて、可変ビットレート広帯域(VBR−WB)ソリューションは、1つのモードが12.65kbit/秒でAMR−WBと相互運用可能ないくつかの通信モードに従って動作することができる。したがって、13.3kbit/秒を得るために上記未使用の13ビットを追加する相互運用可能なFRと、フレーム消去に対してコーデックのロバスト性を向上させる情報を送信するためにVADビットおよび利用可能な割増しの13ビットを使用する汎用FRまたはCDMA専用FRとの2つのバージョンのフルレート(FR)が使用されることになる。2つのFR符号化バージョンのビット割当てが表2に示されている。フレーム類別情報に必要な割増しビットは存在しないことを指摘しておく。14ビットのFER保護には6ビットのエネルギ情報が含まれる。したがって、63レベルだけを利用してエネルギの量子化が行われ、値63に対応する最終レベルは相互運用可能モードの利用を指示するための予備用として保持される。したがって、相互運用可能なFRの場合、エネルギ情報インデックスは63にセットされる。
Figure 0005173939
安定した有声フレームの場合、符号化モジュール206が用いられる。表3にハーフレート有声ビット割当て示す。この通信モードでの符号化対象フレームが特徴的に非常に周期的であるため、例えば、遷移フレームと比較して良好な主観的品質を維持するには、実質的により低いビットレートで充分である。信号の変更を利用して、20msのフレーム当たり9ビットのみを用いて遅延情報の効率的符号化を可能にして、別の信号符号化パラメータ用として相当の割合のビット予算を節減することができる。信号変更時に、信号は、フレーム当たり9ビットを用いて伝送可能な或る一定のピッチ輪郭に従うように強いられる。良好なパフォーマンスを示す長期予測によって、主観的音質を犠牲にすることなく、固定コードブック励振用として5msのサブフレーム当たり12ビットのみを使用することが可能となる。この固定コードブックは代数的コードブックであり、各1パルスで2トラックを含むが、これに対して、個々のトラックは32個の可能な位置をとる。
Figure 0005173939
無声フレームの場合、適応コードブック(またはピッチコードブック)は使用されない。13ビットガウスコードブックが個々のサブフレームで用いられ、このサブフレームで、コードブック利得は、サブフレーム当たり6ビットで符号化される。平均ビットレートをさらに落す必要があるケースでは、安定した無声フレームの場合であれば、無声4分の1レートの使用が可能であることに留意されたい。
図3に図示のように、低いエネルギセグメントに対しては汎用ハーフレートモード(312)が使用される。上記汎用HRモードは、後程説明する最大ハーフレート処理時に使用することができる。汎用HRのビット割当ては上記表3に示されている。
一例として、各種HR符号器に関連する類別情報については、汎用HRの場合、1ビットを用いてフレームが汎用HRであるか、別のHRであるかが示される。無声HRの場合には、類別用として2ビットが用いられ、第1のビットはフレームが汎用HRではないことを示し、第2のビットはフレームが無声HRであり、有声HRや(後程説明する)相互運用可能なHRではないことを示す。有声HRの場合には、3ビットが用いられ、最初の2ビットはフレームが汎用HRまたは無声HRではないことを示し、第3のビットは、フレームが無声HRまたは相互運用可能なHRであるかどうかを示す。
非活性音声フレーム(無音または背景雑音)を符号化するために、8分の1レート(CNG)符号化モジュール208が利用される。このケースでは、LPフィルタパラメータのみがフレーム当たり14ビットで符号化され、利得がフレーム当たり6ビットで符号化される。復号器での快適雑音発生(CNG)用として上記パラメータは使用される。上記ビット割当てを表4に示す。
Figure 0005173939
システムにより課されるハーフレート処理
CDMA符号化方式によれば、システムは、帯域内シグナリング情報を送るために、いくつかの音声フレームでフルレートの代わりにハーフレートの利用を課すことができる。これはディム・アンド・バーストシグナリングと呼ばれているものである。コーデックのロバスト性の向上を図るために、(セル境界近辺などの)劣悪なチャネル条件の間、本システムは、最大ビットレートとしてハーフレートの利用を課すことも可能である。これはハーフレートマックスと呼ばれている。上述のVBR符号化構成では、フレームが安定した有声フレームまたは安定した無声フレームであるとき、ハーフレートが用いられる。フルレートは頭子音、過渡フレームおよび混合有声フレーム用として用いられる。レート選択モジュールが符号化対象フレームをフルレートフレームとして選択し、かつ、システムがハーフレートフレームを課している場合、音声パフォーマンスの低下が生じることになる。というのは、ハーフレート通信モードが頭子音と過渡フレームとを効率良く符号化する能力を持っていないからである。
さらに、AMR−WBをベースとするVBRレート設定IIソリューションを利用するCDMA2000と、標準規格のAMR−WBを利用する別のシステムとの間での相互システムタンデムフリーオペレーションコールによって、CDMA2000システムは、前に説明したように(ディム・アンド・バーストシグナリングの場合のように)最終的にハーフレートが強制される可能性がある。AMR−WBコーデックはCDMA2000広帯域コーデックの6.2kbit/秒ハーフレートを認識しないため、強制ハーフレートフレームは消去済みフレームと解釈される。これによって接続パフォーマンスの低下が生じることになる。
発明を限定するものではない本発明の例示実施形態は、本システムがハーフレートを課している状況で、CDMA無線システムで動作する可変ビットレート音声コーデックのパフォーマンスの向上を図る新規の技法を実現するものである。さらに、CDMA2000システムによってハーフレートの利用が強制され、かつ、CDMA2000と、AMR−WBコーデックを利用する別のシステムとの間で相互システムタンデムフリーオペレーションが行われる場合、上記新規の技法によってパフォーマンスの向上が図られる。
ディム・アンド・バーストシグナリングまたはハーフレートマックス処理では、類別メカニズムによりフルレートが選択されている間、システムがハーフレートの利用を要求するとき、これは、フレームが無声フレームでもなく、また、安定した有声フレームでもないこと、そして、フレームが、有声頭子音や急に発達する有声音声信号などの不安定な音素片を含む可能性が大きいことを示すことになる。したがって、無声信号または安定した有声信号用として最適化されたハーフレートの利用は音声パフォーマンスの低下を生じることになる。このケースでは、新たなハーフレートモードが必要となり、このような場合に利用できる汎用HRが導入される。したがって、ハーフレートマックスまたはディム・アンド・バースト処理の場合、フレームが有声HRまたは無声HRとして類別されたものでなければ、符号器は汎用HRを使用することになる。しかし、CDMA2000システムでは、パケットレベルシグナリングとして知られている処理が存在し、この処理によって、信号情報は符号器に対して提供されず、フレームが符号化された後もシステムがHRの利用を強制する場合がある。したがって、フレームがFRとして符号化され、かつ、システムがHRを必要とする場合、フレームは消去されたものと宣言されることになる。さらに、VBR符号器が12.65kbit/秒でAMR−WBと相互運用を行う相互運用可能モードで、ハーフレートマックスとディム・アンド・バースト処理とが行われる場合、汎用HRを使用することはできない。というのは、汎用HRはAMR−WBの一部ではないからである。上記の状況(相互運用可能モードでのパケットレベルシグナリングやディム・アンド・バースト並びにハーフレートマックス)でのフレームの消去を防止するために、発明を限定するものではない本発明の例示実施形態では、例えば、フレームがフルレートフレームとして符号化された後、固定コードブックインデックスなどの信号符号化パラメータの一部を落すことにより、フルレートモードから直接導き出されるハーフレートモードが利用される。復号器側では、例えば固定コードブックインデックスなどの信号符号化パラメータの落された部分をランダムに生成することが可能であり、さらに、復号器は、あたかもフルレートであるかのように動作することになる。このハーフレートモードはシグナリングHRまたは相互運用可能なHRと呼ばれている。というのは、符号化と復号化の双方がフルレートで行われるからである。発明を限定するものではない本発明の例示実施形態による相互運用可能なハーフレートモードのビット割当てを表5に示す。発明を限定するものではないこの実施例では、フルレートは12.65kbit/秒でのAMR−WB規格に基づくものであり、ハーフレートは代数的固定コードブックのインデックスに必要な144ビットを落すことにより導き出されるものである。シグナリングHRと相互運用可能なHRの間の相違点として、シグナリングHRは、CDMA2000システム内でのパケットレベルのシグナリング処理で利用され、FER保護ビットをそのまま使用できるという点が挙げられる。シグナリングHRは、代数的コードブックインデックス用の144ビットを落すことにより、表1に示す汎用FRから直接導き出される。クラス情報用の3ビットが追加され、未使用の5ビットを残すFER保護用として6ビットのみが用いられる。相互運用可能なHRは、代数的コードブックインデックス用の144ビットを落すことにより、相互運用可能なFRから導き出される。未使用の12ビットを残すクラス情報用として3ビットが追加される。各種ハーフレートの場合の類別情報について論じた際に前述したように、有声HRまたは相互運用可能なHRの場合3ビットが使用される。シグナリングHRと相互運用可能なHRとを識別するための特別の情報は送信されない。FRの場合と同様、最終レベルの6ビットのエネルギ情報が上記目的のために利用される。63のレベルのみを利用してエネルギの量子化が行われ、値63に対応する最終レベルは相互運用可能モードの利用を指示するための予備用として保持される。したがって、相互運用可能なHRの場合、エネルギ情報インデックスは63にセットされることになる。
Figure 0005173939
図4は、レート決定論理回路内でのハーフレートの利用を求めるシステム要求を追加することにより、図3の機能的、概略ブロック図を描く図である。図3の構成はCDMA2000システム内での処理用として有効である。レート決定チェーンの最後で、モジュール404は、ハーフレートシステム要求が存在するかどうかの検証を行う。フレームが活性音声フレーム(モジュール201)であり、かつ、該フレームが、無声(モジュール202)でもなく、安定した有声(モジュール203)でもなく、低いエネルギ(モジュール311)を持つフレームでもなく、システムがハーフレート処理(モジュール404)を要求しているものであることがレート決定論理回路によって示された場合、汎用ハーフレートを利用してモジュール312でフレームの符号化が行われる。
そうでない(ハーフレートシステム要求存在しない)場合には、音声フレームは、フルレートフレーム(CDMA2000レート設定IIに準拠する13.3kbit/秒)としてモジュール205で符号化される。
図5に図示のような発明を限定するものではない本発明の例示実施形態では、レート決定論理回路と可変レート符号化とは図3に描かれているものと同じである。しかし、フレームが符号化され、ビットが伝送された後、システムがモジュール514でハーフレート処理を要求しているかどうかを検証する検査が行われる。システムがハーフレート処理を要求し、伝送されたフレームがFRフレームである場合、例えば固定コードブックインデックスなどの信号符号化パラメータの一部が落され、シグナリングハーフレートフレーム(モジュール510)の取得が図られる。発明を限定するものではない本実施例では、(汎用、有声、無声、あるいは相互運用可能)ハーフレートモード用として1〜3ビットが使用されることに留意されたい。したがって、シグナリングまたは信号符号化パラメータの部分(固定コードブックインデックス)が落された後、相互運用可能なハーフレートを示す3ビットが付加されることになる。フレーム内のこれらのビットは表5に従って配分される。
固定コードブックインデックスを落す選択は、これらのビットがエラーに対する感度が最も低く、かつ、これらのビットのランダムな生成によるパフォーマンスへのインパクトが小さいという事実に基づいて行われる。しかし、別のビットを落して、一般性を失うことなく相互運用可能なハーフレートまたはシグナリングハーフレートの取得が可能であることに留意すべきである。
発明を限定するものではない本実施例では、符号器側でのシグナリングハーフレート処理または相互運用可能なハーフレート処理時に、符号器はフルレート符号器として動作する。固定コードブック探索が通常のように行われ、12.65kbit/秒で、AMR−WB規格に準拠して、次のフレーム用の適応コードブックの内容とフィルタメモリとを更新する際に所定の固定コードブック励振が利用される[IT−UT勧告G.722.2“適応マルチレート広帯域(AMR−WB)を利用する16kbit/秒周辺における音声の広帯域符号化”(2002年ジュネーブ)][3GPP TS26.190、“AMR広帯域音声コーデック:トランスコード機能”3GPP技術仕様]。したがって、符号器処理の範囲内ではランダムなコードブックインデックスは利用されない。このことは、フレームが通常のフルレート処理で符号化された後、ハーフレートシステム要求(モジュール514)が検証される図5の実施構成で明らかである。
復号器側でのシグナリングハーフレート処理または相互運用可能なハーフレート処理では、例えば固定コードブックのインデックスなどの信号符号化パラメータの落された部分はランダムに生成される。次いで、復号器はフルレート処理時の場合のように動作する。信号符号化パラメータの落された部分を生成する別の方法を利用ことも可能である。例えば、落されたパラメータは、受信済みのビットストリームの一部をコピーすることにより取得することができる。符号器側と復号器側のメモリ間で不整合が生じる可能性があることに留意されたい。というのは、例えば固定コードブック励振などの信号符号化パラメータの落された部分が同じではないはからである。しかし、このような不整合は、通常のレートが2%周辺にあるCDMA2000VBRとAMR−WB間での相互運用時に、特に、ディム・アンド・バーストシグナリングの場合には、パフォーマンスに影響を与えないように思われる。
ディム・アンド・バースト処理で提案される方法のパフォーマンスは、ハーフレートシステム要求が存在しない場合と比べてほとんど透過的である。多くの場合、8分の1レート、4分の1レート、あるいは(汎用、有声または無声)ハーフレートのうちのいずれかのレートでフレームを符号化するようにレート決定論理回路は予め決定している。このような場合、ハーフレートシステム要求は無視される。というのは、ハーフレートシステム要求は符号器により予め収納されていて、フレーム内の信号タイプはハーフレートまたは低いレートでの符号化に適しているからである。
類別論理回路は処理モードに対して適応性があることに留意されたい。したがって、パフォーマンスの向上を図るために、ハーフレート−マックスモードとディム・アンド・バーストシグナリングとで、専用のハーフレートコーデックを使用するために上記類別論理回路をさらに緩和することが可能である(ハーフレート有声と無声とは通常の動作時に比べて相対的に使用頻度が高い)。これは、マルチモード処理に対する一種の拡張であって、類別論理回路をさらに緩和する拡張であり、低い平均データ転送速度を用いるモードが使用される。
CDMA2000システムと、AMR−WB規格を利用する別のシステムとの間でのタンデムフリーオペレーション
前述したように、AMR−WBコーデックに基づくCDMA2000システム用の可変ビットレート広帯域(VBR−WB)コーデックの設計には、CDMA2000システムと、AMR−WB規格を利用する別のシステム(移動GSMシステムまたはW−CDMA第3世代無線システムなど)との間でのタンデムフリーオペレーション(TFO)またはパケット交換処理を可能にするという利点がある。しかし、CDMA2000とAMR−WBを利用する別のシステムとの間での相互システムタンデムフリーオペレーションコールでは、前に説明したようにCDMA2000システムが(ディム・アンド・バースト信号での場合のように)ハーフレートの使用を強制する場合がある。AMR−WBコーデックがCDMA2000広帯域コーデックの6.2kbit/秒ハーフレートを認識しないため、強制ハーフレートフレームは消去済みフレームと解釈される。これによって接続パフォーマンスの低下を生じることになる。前に開示した相互運用可能なハーフレートモードの利用によって、パフォーマンスの大幅な向上が図られる。というのは、上記モードは、AMR−WB規格の12.65kbit/秒レートとの相互運用が可能であるからである。
本明細書で上記に開示したように、相互運用可能なハーフレートは基本的に疑似フルレートであり、コーデックがあたかもフルレートモードにあるかのように動作する疑似フルレートである。この相違点として、例えば代数的コードブックインデックスなどの信号符号化パラメータの一部が最後に落され、伝送されなくなるという点が挙げられる。復号器側では、例えば代数的コードブックインデックスなどの信号符号化パラメータの落された部分はランダムに生成され、次いで、復号器はあたかもフルレートモードにあるかのように動作する。
図6は、発明を限定するものではない本発明の例示実施形態に準拠する構成を示し、CDMA2000システム側における信号情報の帯域内伝送(すなわち、ディム・アンド・バースト条件)中の相互運用可能なハーフレートモードの利用を説明する図である。この図では、別の側はAMR−WB規格を利用するシステムであり、一例として3GPP無線システムを示す。
CDMA2000から3GPPへのまたはAMR−WBを利用する別のシステムへの方向を持つ上記リンクで、多重化サブレイヤがハーフレートモード要求を示す(ディム・アンド・バーストシステム要求601を参照のこと)とき、VBR−WB符号器602は前述の相互運用可能なハーフレート(I−HR)で動作することになる。システムインターフェース604で、I−HRフレームが受信されると、ランダムに生成された代数的コードブックインデックスがIPベースのシステムインターフェース604を介してモジュール603によりビットストリームの形で挿入され、12.65kbit/秒レートが出力される。3GPP側の復号器605は、この12.65kbit/秒レートを通常の12.65kbit/フレームと解釈する。
もう一方の反対方向では、すなわち3GPPまたはAMR−WBを利用する別のシステムからCDMA2000へのリンクでは、システムインターフェース606で、ハーフレート要求(ディム・アンド・バーストシステム要求607を参照のこと)が受信された場合、モジュール608は代数的コードブックインデックスを落し、I−HRフレームタイプを示す3ビットを挿入する。CDMA2000側の復号器609は、VBR−WBソリューションの一部であるI−HRフレームタイプとして動作することになる。
上記提案はシステムインターフェースにおける最小の論理回路を必要とし、ブランク・アンド・バースト(blank-and-burst)フレーム(消去済みフレーム)として、ディム・アンド・バーストフレームの強制を越えるパフォーマンスの大幅な向上を図るものである。
相互運用時の別の問題点として背景雑音フレームの処理がある。AMR−WB側で、符号器610は、DTX(不連続送信)とCNG(快適雑音発生)処理とをサポートする。非活性音声フレーム(無音または背景雑音)は、35ビットを用いてSID(無音記述)フレームとして符号化されるか、あるいは、伝送されない(無データ)かのいずれかの処理が行われる。CDMA2000側では、非活性音声フレームは8分の1レート(ER)を用いて符号化される。ERを用いてSID用35ビットを送信できないため、CNG4分の1レート(QR)用いてAMR−WB側からCDMA2000側へSIDフレームが送信される。AMR−WB側の非伝送無データフレームはERフレームに変換される(本実施例ではすべてのビットが1にセットされる)。相互運用可能モードのCDMA2000側では、ERフレームは復号器によってフレーム消去として処理される。
CDMA2000からAMR−WB側への相互運用では、非活性音素片の開始時に、CNG QRが使用され、次いで、ERフレームが使用される。発明を限定するものではない本発明の例示実施形態では、処理は、8フレーム毎に一回SIDフレームが送信されるAMR−WBでのVAD/DTX/CNG処理の場合と同様である。この場合、第1の非活性音声フレームはCNG QRフレームとして符号化され、次の7フレームはERフレームとして符号化される。システムインターフェースで、CNG QRフレームはAMR−WBSIDフレームに変換され、ERフレームは伝送されない(無データフレーム)。
CNG QRフレームとCNG ERフレームのビット割当てを表6に示す。
Figure 0005173939
発明を限定するものではない本発明の実施例に関連して以上本発明について説明したが、この実施例は、本発明の範囲と精神から逸脱することなく、添付の請求項の範囲内で意のままに変更することが可能である。一例として、固定コードブックインデックスに関連するビットとは異なる別のビット、特に、ビットエラー感度の低いビットを落して、相互運用可能なハーフレートフレームを取得するようにすることも可能である。

Claims (19)

  1. CDMA2000 VBR−WB符号化方式のフルレート符号化モードによって符号化された音響信号を表す信号符号化パラメータを通信システム・インターフェースにおいて受け取ることと、
    前記信号符号化パラメータの伝送中のビットレートを低減するために前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して前記信号符号化パラメータを伝送することを求める要求を受け取ることと、
    前記要求に応じて、前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して残りの信号符号化パラメータの伝送を可能にするために前記信号符号化パラメータの一部分を落とすことであって、前記信号符号化パラメータの落とされた一部分は代数的コードブックの固定コードブックインデックスであることと、
    を含む方法。
  2. 前記残りの信号符号化パラメータと共に伝送されるための符号化モードの識別子を挿入することを更に含む、請求項1に記載の方法。
  3. 前記落とされた固定コードブックインデックスを置換するために置換信号符号化パラメータを生成することを更に含む、請求項1に記載の方法。
  4. 前記置換信号符号化パラメータを生成することは、前記固定コードブックインデックスをランダムに再生成することを含む、請求項3に記載の方法。
  5. 前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して前記残りの信号符号化パラメータを伝送することと、
    前記信号符号化パラメータの前記落とされた一部分を置換するために、置換信号符号化パラメータを生成することと、
    AMR−WB符号化方式のフルレート符号化モードによって前記信号符号化パラメータの前記置換された一部分を含む前記信号符号化パラメータを復号化することと、
    を更に含む、請求項1に記載の方法。
  6. 前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して前記残りの信号符号化パラメータを伝送することを更に含む、請求項1に記載の方法。
  7. 信号符号化パラメータの伝送中のビットレートを低減するために、CDMA2000 VBR−WB符号化方式のフルレート符号化モードの代わりに前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して前記信号符号化パラメータが伝送され終わっているという表示を通信システム・インターフェースにおいて受け取り、及び、前記信号符号化パラメータは、前記CDMA2000 VBR−WB符号化方式のフルレート符号化モードによって符号化された音響信号を表していることと、
    前記表示に応答して、AMR−WB符号化方式のフルレート符号化モードによって第2の信号符号化パラメータを生じさせるように伝送中の前記ビットレートを低減するために落とされた前記信号符号化パラメータの一部分を置換するために置換信号符号化パラメータを生成し、及び、前記信号符号化パラメータの落とされた一部分は、代数的コードブックの固定コードブックインデックスであることと、
    を含む方法。
  8. 前記信号符号化パラメータを受け取ることと、前記第2の信号符号化パラメータを使用して前記音響信号を復号化することと、を更に含む、請求項7に記載の方法。
  9. 前記AMR−WB符号化方式のフルレート符号化モードによって前記第2の信号符号化パラメータを伝送することを更に含む、請求項7に記載の方法。
  10. 請求項1から請求項9までのいずれか一項に記載の方法を行うための命令を含むコンピュータ・プログラムであって、コンピュータ装置が該プログラムを実行することにより、該方法を行う、コンピュータ・プログラム
  11. CDMA2000 VBR−WB符号化方式を使用する第1の局と、AMR−WB符号化方式を使用する第2のとを備える局であって、
    前記第1の局は、
    前記CDMA2000 VBR−WB符号化方式のフルレート符号化モードによって信号符号化パラメータを生成するために音響信号を符号化する手段と、
    前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して前記信号符号化パラメータを伝送するための要求を受け取る手段と、
    前記要求に応答して、前記CDMA2000 VBR−WB符号化方式のフルレート符号化モードによって符号化された前記信号符号化パラメータの一部分を落とすための手段であって、前記信号符号化パラメータの前記落とされた一部分は代数的コードブックの固定コードブックインデックスである手段と、
    前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して残りの信号符号化パラメータを伝送する手段と、
    を備え、前記第2の局は、
    前記残りの信号符号化パラメータを受け取る手段と、
    前記信号符号化パラメータの前記落とされた一部分を置換するための置換信号符号化パラメータを生成する手段と、
    前記残りの信号符号化パラメータと前記生成された置換信号符号化パラメータとを使用して前記信号符号化パラメータを復号化する手段と、
    を備えるシステム。
  12. CDMA2000 VBR−WB符号化方式のフルレート符号化モードによって符号化された音響信号を表している信号符号化パラメータを受け取る手段と、
    前記信号符号化パラメータの伝送中のビットレートを低減するために前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して前記信号符号化パラメータを伝送することを求める要求を受け取る手段と、
    前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して残りの信号符号化パラメータの伝送を可能にするために前記信号符号化パラメータの一部分を落とす手段であって、前記信号符号化パラメータの前記落とされた一部分は代数的コードブックの固定コードブックインデックスである手段と、
    前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードによって前記残りの信号符号化パラメータを伝送する手段と、
    を備える装置。
  13. 前記信号符号化パラメータの一部分を落とす手段は、前記残りの信号符号化パラメータと共に伝送されるための符号化モードの識別情報を挿入するように構成されている、請求項12に記載の装置。
  14. 信号符号化パラメータの伝送中のビットレートを低減するために、CDMA2000 VBR−WB符号化方式のフルレート符号化モードの代わりに前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して前記信号符号化パラメータが伝送され終わっているという表示を受け取り、及び、前記信号符号化パラメータは音響信号を表している手段と、
    前記表示に応答して、AMR−WB符号化方式のフルレート符号化モードによって第2の信号符号化パラメータを生じさせるように伝送中の前記ビットレートを低減するために落とされた前記信号符号化パラメータの一部分を置換するために置換信号符号化パラメータを生成し、及び、前記信号符号化パラメータの前記落とされた一部分は、代数的コードブックの固定コードブックインデックスである手段と、
    を備える装置。
  15. 前記置換信号符号化パラメータを生成する手段は、前記置換信号符号化パラメータをランダムに生成するように構成されている、請求項14に記載の装置。
  16. 前記ランダムに生成された置換信号符号化パラメータは、ランダムに生成された置換固定コードブックインデックスを含む、請求項15に記載の装置。
  17. 前記AMR−WB符号化方式のフルレート符号化モードによって前記信号符号化パラメータの前記置換された一部分を含む前記信号符号化パラメータを伝送する手段を更に備える、請求項16に記載の装置。
  18. 前記信号符号化パラメータを受け取る手段と、前記第2の信号符号化パラメータを使用して前記音響信号を復号化する手段と、を更に備える、請求項14に記載の装置。
  19. 前記CDMA2000 VBR−WB符号化方式のハーフレート符号化モードを使用して残りの信号符号化パラメータを伝送することを更に含む、請求項7に記載の方法。
JP2009133079A 2002-07-05 2009-06-02 Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置 Expired - Lifetime JP5173939B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA002392640A CA2392640A1 (en) 2002-07-05 2002-07-05 A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
CA2,392,640 2002-07-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004518314A Division JP2005532579A (ja) 2002-07-05 2003-06-27 Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置

Publications (3)

Publication Number Publication Date
JP2009239927A JP2009239927A (ja) 2009-10-15
JP2009239927A5 JP2009239927A5 (ja) 2011-04-21
JP5173939B2 true JP5173939B2 (ja) 2013-04-03

Family

ID=30005535

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2004518314A Pending JP2005532579A (ja) 2002-07-05 2003-06-27 Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置
JP2009133079A Expired - Lifetime JP5173939B2 (ja) 2002-07-05 2009-06-02 Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2004518314A Pending JP2005532579A (ja) 2002-07-05 2003-06-27 Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置

Country Status (15)

Country Link
US (1) US8224657B2 (ja)
EP (1) EP1520271B1 (ja)
JP (2) JP2005532579A (ja)
KR (1) KR101105353B1 (ja)
CN (2) CN1692408A (ja)
AT (1) ATE518225T1 (ja)
AU (1) AU2003281378B2 (ja)
BR (1) BR0312467A (ja)
CA (1) CA2392640A1 (ja)
ES (1) ES2367259T3 (ja)
HK (1) HK1130558A1 (ja)
MX (1) MXPA05000285A (ja)
MY (1) MY144845A (ja)
RU (2) RU2326449C2 (ja)
WO (1) WO2004006226A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7499403B2 (en) * 2003-05-07 2009-03-03 Alcatel-Lucent Usa Inc. Control component removal of one or more encoded frames from isochronous telecommunication stream based on one or more code rates of the one or more encoded frames to create non-isochronous telecommunications stream
EP1768106B8 (en) * 2004-07-23 2017-07-19 III Holdings 12, LLC Audio encoding device and audio encoding method
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8209187B2 (en) * 2006-12-05 2012-06-26 Nokia Corporation Speech coding arrangement for communication networks
GB0705324D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
WO2009002245A1 (en) * 2007-06-27 2008-12-31 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for enhancing spatial audio signals
DE102008022125A1 (de) * 2008-05-05 2009-11-19 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen
US8320553B2 (en) * 2008-10-27 2012-11-27 Apple Inc. Enhanced echo cancellation
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101783142B (zh) * 2009-01-21 2012-08-15 北京工业大学 转码方法、装置和通信设备
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
RU2557455C2 (ru) * 2009-06-23 2015-07-20 Войсэйдж Корпорейшн Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
WO2011083849A1 (ja) 2010-01-08 2011-07-14 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
CN102770912B (zh) 2010-01-13 2015-06-10 沃伊斯亚吉公司 使用线性预测滤波的前向时域混叠消除
WO2012002768A2 (ko) * 2010-07-01 2012-01-05 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
ES2530957T3 (es) 2010-10-06 2015-03-09 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio y para proporcionar una mayor granularidad temporal para un códec de voz y de audio unificado combinado (USAC)
CN102104917B (zh) * 2011-02-21 2013-10-09 上海华为技术有限公司 一种调整自适应编码速率的方法、基站控制器及终端
CN103187065B (zh) 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
KR101900319B1 (ko) * 2012-02-07 2018-09-19 삼성전자 주식회사 서비스 연동 수행 방법과 이를 위한 시스템
HUE038398T2 (hu) * 2012-08-31 2018-10-29 Ericsson Telefon Ab L M Eljárás és eszköz hang aktivitás észlelésére
US9589570B2 (en) * 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
EP2936486B1 (en) * 2012-12-21 2018-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Comfort noise addition for modeling background noise at low bit-rates
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
CN104853383B (zh) * 2015-04-02 2018-05-04 四川大学 一种语音码率调整的方法和装置
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
KR102477464B1 (ko) 2015-11-12 2022-12-14 삼성전자주식회사 무선 통신 시스템에서 음성 패킷의 크기를 제어하기 위한 장치 및 방법
CN105517064A (zh) * 2015-12-03 2016-04-20 海能达通信股份有限公司 一种语音码率调整的方法及核心网设备
CN111262587B (zh) * 2018-11-30 2023-06-06 康泰医学系统(秦皇岛)股份有限公司 一种数据压缩方法、装置、设备及计算机可读存储介质

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5568483A (en) * 1990-06-25 1996-10-22 Qualcomm Incorporated Method and apparatus for the formatting of data for transmission
US5511073A (en) * 1990-06-25 1996-04-23 Qualcomm Incorporated Method and apparatus for the formatting of data for transmission
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
EP1675100A2 (en) * 1991-06-11 2006-06-28 QUALCOMM Incorporated Variable rate vocoder
WO1995022818A1 (en) * 1994-02-17 1995-08-24 Motorola Inc. Method and apparatus for group encoding signals
US5519779A (en) * 1994-08-05 1996-05-21 Motorola, Inc. Method and apparatus for inserting signaling in a communication system
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
JPH08146997A (ja) 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
ZA961025B (en) * 1995-02-28 1996-07-16 Qualcomm Inc Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
CA2185745C (en) * 1995-09-19 2001-02-13 Juin-Hwey Chen Synthesis of speech signals in the absence of coded parameters
US5996022A (en) * 1996-06-03 1999-11-30 Webtv Networks, Inc. Transcoding data in a proxy computer prior to transmitting the audio data to a client
US6269338B1 (en) * 1996-10-10 2001-07-31 U.S. Philips Corporation Data compression and expansion of an audio signal
EP1136985B1 (en) * 1996-11-07 2002-09-11 Matsushita Electric Industrial Co., Ltd. Apparatus and method for CELP speech coding and decoding
CN1158776C (zh) * 1998-02-24 2004-07-21 西加特技术有限责任公司 有时变mtr的信道的全速和半速信号空间检测方法和装置
SE516595C2 (sv) * 1998-03-13 2002-02-05 Ericsson Telefon Ab L M Kommunikationsanordning och arbetssätt för behandling av röstmeddelanden
JP2000081898A (ja) * 1998-09-03 2000-03-21 Denso Corp ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6539237B1 (en) * 1998-11-09 2003-03-25 Cisco Technology, Inc. Method and apparatus for integrated wireless communications in private and public network environments
US6182030B1 (en) * 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
JP2000305597A (ja) 1999-03-12 2000-11-02 Texas Instr Inc <Ti> 音声圧縮のコード化
AUPQ141199A0 (en) * 1999-07-05 1999-07-29 Telefonaktiebolaget Lm Ericsson (Publ) Data rate adaptation between mobile stations through transit fixed network
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US7010001B2 (en) * 2000-01-10 2006-03-07 Qualcomm, Incorporated Method and apparatus for supporting adaptive multi-rate (AMR) data in a CDMA communication system
WO2001065544A1 (en) 2000-02-29 2001-09-07 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction speech coder
JP2001267085A (ja) 2000-03-23 2001-09-28 Sanyo Electric Co Ltd 有機発光装置およびその製造方法
WO2001078430A1 (en) * 2000-04-11 2001-10-18 Nokia Corporation Application of rtp and rtcp in the amr transport in voice over ip networks
EP1279167B1 (en) * 2000-04-24 2007-05-30 QUALCOMM Incorporated Method and apparatus for predictively quantizing voiced speech
FI20001577A (fi) * 2000-06-30 2001-12-31 Nokia Mobile Phones Ltd Puheenkoodaus
US6847929B2 (en) * 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
US6789059B2 (en) * 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
US7042841B2 (en) * 2001-07-16 2006-05-09 International Business Machines Corporation Controlling network congestion using a biased packet discard policy for congestion control and encoded session packets: methods, systems, and program products
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US6981184B2 (en) * 2002-04-11 2005-12-27 Motorola, Inc. Apparatus and method for processing a corrupted frame
US6885638B2 (en) * 2002-06-13 2005-04-26 Motorola, Inc. Method and apparatus for enhancing the quality of service of a wireless communication

Also Published As

Publication number Publication date
RU2326449C2 (ru) 2008-06-10
US8224657B2 (en) 2012-07-17
CN1692408A (zh) 2005-11-02
EP1520271B1 (en) 2011-07-27
EP1520271A1 (en) 2005-04-06
AU2003281378B2 (en) 2010-08-19
HK1130558A1 (en) 2009-12-31
MXPA05000285A (es) 2005-09-20
CA2392640A1 (en) 2004-01-05
JP2005532579A (ja) 2005-10-27
JP2009239927A (ja) 2009-10-15
ATE518225T1 (de) 2011-08-15
RU2008102318A (ru) 2009-07-27
WO2004006226B1 (en) 2004-03-04
US20060100859A1 (en) 2006-05-11
RU2461897C2 (ru) 2012-09-20
RU2005102831A (ru) 2005-07-20
BR0312467A (pt) 2005-04-26
WO2004006226A1 (en) 2004-01-15
ES2367259T3 (es) 2011-10-31
CN101494055A (zh) 2009-07-29
AU2003281378A1 (en) 2004-01-23
MY144845A (en) 2011-11-30
CN101494055B (zh) 2012-10-10
AU2003281378A2 (en) 2004-01-23
KR20050016976A (ko) 2005-02-21
KR101105353B1 (ko) 2012-01-16

Similar Documents

Publication Publication Date Title
JP5173939B2 (ja) Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置
EP1554718B1 (en) Methods for interoperation between adaptive multi-rate wideband (amr-wb) and multi-mode variable bit-rate wideband (wmr-wb) speech codecs
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
JP5149198B2 (ja) 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス
JP4658596B2 (ja) 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置
JP2006525533A5 (ja)
JP2002523806A (ja) 雑音補償のための音声分類を採用した音声コーデック
Ahmadi et al. On the architecture, operation, and applications of VMR-WB: The new cdma2000 wideband speech coding standard
EP1808852A1 (en) Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
CA2491623C (en) Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
Paksoy Variable rate speech coding with phonetic classification

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120313

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120612

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121227

R150 Certificate of patent or registration of utility model

Ref document number: 5173939

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term