JP4071631B2 - 音声の非活動中に音声伝送システム間の相互運用性のための方法および装置 - Google Patents

音声の非活動中に音声伝送システム間の相互運用性のための方法および装置 Download PDF

Info

Publication number
JP4071631B2
JP4071631B2 JP2002565303A JP2002565303A JP4071631B2 JP 4071631 B2 JP4071631 B2 JP 4071631B2 JP 2002565303 A JP2002565303 A JP 2002565303A JP 2002565303 A JP2002565303 A JP 2002565303A JP 4071631 B2 JP4071631 B2 JP 4071631B2
Authority
JP
Japan
Prior art keywords
continuous
gain
spectral
average
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002565303A
Other languages
English (en)
Other versions
JP2004527160A (ja
Inventor
エル−マレー、カレッド・エイチ
アナンサパドマナバン、アラサニパライ・ケー
デジャコ、アンドリュー・ピー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2004527160A publication Critical patent/JP2004527160A/ja
Application granted granted Critical
Publication of JP4071631B2 publication Critical patent/JP4071631B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephone Function (AREA)
  • Information Transfer Systems (AREA)
  • Facsimiles In General (AREA)

Description

開示されている実施形態は、無線通信に関する。とくに、開示されている実施形態は、音声の非活動中の、異なる音声伝送システム間の相互運用性のための新規で向上した方法および装置に関する。
ディジタル技術による音声の伝送は、とくに長距離のディジタル無線電話の応用において普及してきた。ディジタル技術による音声の伝送の次の目的は、再構成された音声の知覚品質を維持する一方で、チャンネル上で送ることができる最少情報量を判断することであった。音声を、単に標本化してディジタル化することによって伝送するとき、従来のアナログ電話の音声品質を実現するには、毎秒64キロビット秒(kilobits per second, kbps)のオーダのデータレートが必要である。しかしながら、音声解析を使用し、次に、受信機において適切な符号化、伝送、および再合成をすることによって、データレートを相当に低減することができる。異なる伝送システム間の通信には、種々のタイプの音声に対するこのような符号化方式の相互運用性が必要である。生成される信号の基本的なタイプには、活動音声(active speech)と非活動音声(inactive speech)とがある。活動音声は、有声音(vocalization)を表わし、一方で音声の非活動状態、すなわち非活動音声(non-active speech)には、一般に無音(silence)と背景雑音(background noise)とが含まれる。
人間の音声発声モデルに関係するパラメータを抽出することによって音声を圧縮する技術を用いる装置は、音声符号化器と呼ばれる。音声符号化器は、到来音声信号を、時間ブロック、すなわち解析フレームへ分割する。以下、“フレーム”と“パケット”という用語は、同義である。音声符号化器には、一般に、符号化器と復号化器、すなわちコーデックが構成されている。符号化器は、到来音声フレームを解析して、一定の関連する利得およびスペクトルのパラメータを抽出して、次に、パラメータを二値表示、すなわち1組のビットまたは二値データパケットへ量子化する。データパケットは、通信チャンネル上を受信機および復号化器へ送られる。復号化器は、データパケットを処理し、それらを逆量子化して、パラメータを生成し、次に逆量子化されたパラメータを使用して、フレームを再合成する。
音声符号化器は、音声に固有の自然冗長の全てを取り除くことによって、ディジタル形式の音声信号を低ビットレートの信号へ圧縮する機能を有する。ディジタル圧縮は、入力音声フレームを1組のパラメータで表示し、量子化を用いて、パラメータを1組のビットで表現することによって達成される。入力音声フレームに、多数のビットNが構成されていて、音声符号化器によって生成されたデータパケットに、多数のビットNoが構成されているとき、音声符号化器によって実現される圧縮係数は、C=N/Noである。課題は、目標の圧縮係数を達成する一方で、復号化された音声の高音声品質を維持することである。音声符号化器の性能は、(1)音声モデル、すなわち上述の解析および合成プロセスの組合せが、どのくらい適切に実行されるか、または(2)パラメータ量子化プロセスが、1フレーム当りNoビットの目標ビットレートでどのくらい適切に実行されるかに依存する。したがって、音声モデルは、各フレームごとに、小さい組のパラメータで、音声信号の本質、すなわち目標の音声品質の本質を捕らえることを目的とする。
音声符号化器は、時間領域の符号化器として構成され、これは、高時間解像度の処理を用いて、小さい音声セグメント(通常は、5ミリ秒のサブフレーム)を一度に符号化することによって、時間領域の音声波形を捕捉することを試みる。この技術において知られている種々のサーチアルゴリズムによって、各サブフレームごとに、コードブック空間からの高精度の表示が求められる。その代りに、音声符号化器は、周波数領域符号化器として構成されてもよく、これは、入力音声フレームの短期間の音声スペクトルを1組のパラメータで捕捉し(解析)、対応する合成処理を用いて、スペクトルパラメータから音声波形を再生成することを試みる。パラメータ量子化器は、文献(A. Gersho & R.M. Gray, Vector Quantization and Signal Compression (1992))に記載されている既知の量子化技術にしたがって、符号ベクトルの記憶表示を使用して、それらを表現することによって、パラメータを保全する。所与の伝送システム内の異なるタイプの音声は、異なる構成の音声符号化器を使用して、符号化され、異なる伝送システムは、所与の音声タイプの符号化をそれぞれ実行する。
より低いビットレートで符号化するために、音声をスペクトル、すなわち周波数領域で符号化する種々の方法が展開され、ここでは音声信号は、時間にしたがって変化するスペクトルとして解析される。例えば、文献(R.J. McAulay & T.F. Quatieri, Sinusoidal Coding, in Speech Coding and Synthesis ch.4 (W.B. Kleijin & K.K. Paliwal eds., 1995))を参照すべきである。スペクトル符号化器は、時間にしたがって変化する音声波形を精密に模倣するのではなく、各入力音声フレームの短期間の音声スペクトルを、1組のスペクトルパラメータでモデル化、すなわち予測することを目的とする。次に、スペクトルパラメータをコード化して、復号化されたパラメータを使用して、出力音声フレームを生成する。生成された合成音声は、元の入力音声波形と整合していないが、ほぼ同等の知覚品質を示す。この技術においてよく知られている周波数領域符号化器の例には、マルチバンド励起符号化器(multiband excitation coder, MBE)、シヌソイド変形符号化器(sinusoidal transform coder, STC)、および高調波符号化器(harmonic coder, HC)が含まれる。このような周波数領域符号化器は、小さい組のパラメータを有する高品質のパラメータモデルを与える。小さい組のパラメータは、低ビットレートで使用可能な少数のビットで正確に量子化することができる。
無線音声通信システムでは、より低いビットレートが望ましいときは、一般に、伝送電力レベルを低減し、したがって共通チャンネルの干渉を低減して、可搬形ユニットのバッテリ寿命を延ばすことも望ましい。全体的な伝送データレートの低減は、伝送データの電力レベルを低減するのにも役立つ。通常の電話による会話では、約40パーセントの音声バーストと、60パーセントの無音および背景音響雑音とが構成されている。知覚情報は、背景雑音よりも音声に、より多く含まれる。無音および背景雑音を最低可能ビットレートで伝送することが望ましいので、音声の非活動期間中に、活動音声の符号化レートを使用するのは、非効率である。
会話の音声における低音声活動を利用する一般的なやり方では、音声活動検出器(Voice Activity Detector, VAD)ユニットを使用し、VADユニットは、音声信号と非音声信号とを区別して、データレートを下げて、無音または背景雑音を伝送する。しかしながら、無音または背景雑音の伝送中は、種々のタイプの伝送システム、例えば連続伝送(Continuous Transmission, CTX)システムおよび非連続伝送(Discontinuous Transmission, DTX)システムによって使用される符号化方式は互換性がない。CTXシステムでは、音声が非活動の期間中でも、データフレームが連続的に伝送される。DTXシステムでは、音声が存在しないときは、伝送を中断して、全体的な伝送電力を低減する。GSM(Global System for Mobile Communications)システムの非連続伝送は、国際電気通信連合(International Telecommunications Union, ITU)への欧州電気通信標準化協会(European Telecommunications Standard Institute)の提案(“Digital Cellular Telecommunication System (Phase 2+); Discontinuous Transmission (DTX) for Enhanced Full Rate (EFR) Speech Traffic Channels”、および“Digital Cellular Telecommunication System (Phase 2+); Discontinuous Transmission (DTX) for Adaptive Multi-Rate (AMR) Speech Traffic Channels”)において標準化されている。
CTXシステムには、システムを同期化して、チャンネル品質を監視するための連続伝送モードが必要である。したがって、音声が存在しないときは、より低いレートのコード化モードを使用して、背景ノイズを連続的に符号化する。符号分割多重アクセス(Code Division Multiple Access, CDMA)応用システムでは、このアプローチを使用して、音声呼の可変レートで伝送する。CDMAシステムでは、非活動期間中に、8分の1レートのフレームを伝送する。800ビット/秒(bit per second, bps)、すなわち20ミリ秒(millisecond, ms)のフレーム時間ごとに16ビットを使用して、非活動音声を伝送する。CDMAのような、CTXシステムでは、聞き手を聞き易くするための音声非活動中の雑音情報と、同期化およびチャンネル品質測定値を伝送する。CTX通信システムの受信機側では、音声の非活動期間中に、周囲の背景雑音が常に存在する。
DTXシステムでは、非活動中に、20ミリ秒のフレームごとにビットを伝送する必要はない。GSM、広帯域CDMA、ボイス オーバーIPシステム(Voice Over IP system)、およびある特定の衛星システムは、DTXシステムである。このようなDTXシステムでは、送信機は、音声の非活動期間中は、オフに切換えられる。しかしながら、DTXシステムの受信機側では、音声の非活動期間中は、連続信号は受信されず、したがって背景雑音は、活動音声の期間中は存在するが、無音期間中は存在しない。背景雑音が、交互に、存在したり、存在しなくなったりすると、聞き手にはうるさくて、不快であると感じられる。音声バースト間のギャップを埋めるために、伝送された雑音情報を使用して、受信機側において、“快適雑音”として知られている合成雑音を生成する。雑音統計の周期的な更新は、無音挿入記述子(Silence Insertion Descriptor, SID)フレームとして知られているものを使用して送られる。GSMシステムの快適雑音は、国際電気通信連合(International Telecommunications Union, ITU)への欧州電気通信標準化協会(European Telecommunications Standard Institute)の提案(“Digital Cellular Telecommunication System (Phase 2+); Comfort Noise Aspects for Enhanced Full Rate (EFR) Speech Traffic Channels”、および“Digital Cellular Telecommunication System (Phase 2+); Comfort Noise Aspects for Adaptive Multi-Rate (AMR) Speech Traffic Channels”において標準化されている。送信機が、雑音を含む環境、例えば街路、ショッピングモール、または車両、などの中に位置するときは、快適雑音により、とくに、受信機における聞き取り品質が向上する。
DTXシステムは、非活動音声の期間中に、受信機において、雑音合成モデルを使用して、合成快適雑音を生成することによって、連続的に送られた雑音が存在しないことを補償する。DTXシステムにおいて合成快適雑音を生成するために、雑音情報を保持している1つのSIDフレームを周期的に送る。VADが無音を示すとき、雑音フレーム、すなわちSIDフレームを表わす周期性のDTXは、一般に、20フレーム期間に1回伝送される。
復号化器において快適雑音を生成するためのCTXおよびDTXのシステムの両者に共通のモデルは、スペクトル成形フィルタを使用する。ランダム(ホワイト)励起を利得によって多重化し、受信した利得およびスペクトルのパラメータを使用して、スペクトル成形フィルタによって成形して、合成快適雑音を生成する。励起利得、およびスペクトル成形を表わすスペクトル情報は、伝送パラメータである。CTXシステムでは、利得およびスペクトルパラメータは、8分の1レートで符号化され、フレームごとに伝送される。DTXシステムでは、各期間において、平均/量子化利得を含んでいるSIDフレームを伝送する。快適雑音の符号化および伝送方式におけるこれらの相違のために、非活動音声の期間中に、CTXおよびDTXの伝送システム間に互換性がなくなる。したがって、非音声の情報を送るCTXおよびDTXの音声通信システム間に、相互運用性が必要となる。
本明細書に開示されている実施形態は、CTXとDTXの通信システム間で非音声の情報を伝送する音声通信システム間の相互運用性を促進することによって、上述の必要に対処している。したがって、本発明の1つの態様では、非活動音声の伝送中に、連続伝送通信システムと非連続伝送通信システムとの間に相互運用性を与える方法には、連続伝送システムによって生成された連続非活動音声フレームを、非連続伝送システムによって復号化できる周期性の無音挿入記述子フレームへ変換することと、非連続伝送システムによて生成された周期性の無音挿入記述子フレームを、連続伝送システムによって復号化できる連続非活動音声フレームへ変換することとが含まれる。別の態様では、非活動音声の伝送中に、連続伝送通信システムと非連続伝送通信システムとの間に相互運用性を与えるための連続から非連続へのインターフェイス装置には、連続伝送システムによって生成された連続非活動音声フレームを、非連続伝送システムによって復号化できる周期性の無音挿入記述子フレームへ変換するための連続から非連続への変換ユニットと、非連続伝送システムによって生成された周期性の無音挿入記述子フレームを、連続伝送システムによって復号化できる連続非活動音声フレームへ変換するための非連続から連続への変換ユニットとが構成されている。
開示されている実施形態は、無音または背景雑音の伝送中の、CTXとDTXの通信システム間の相互運用性のための方法および装置を与える。連続の8分の1レートで符号化される雑音フレームは、非連続のSIDフレームへ変換され、DTXシステムへ伝送される。非連続のSIDフレームは、連続の8分の1レートで符号化される雑音フレームへ変換され、CTXシステムがそれを復号化する。CTXからDTXへ相互運用性の適用には、CDMAとGSMの相互運用性(狭帯域幅の音声伝送システム);CDMA次世代ボコーダ(選択可能モードボコーダ)と、ボイス オーバーIPアプリケーションにおいてDTXモードで動作する新しいITU−Tの4キロビット秒のボコーダとの相互運用性;共通の音声符号化器/復号化器を有するが、非活動音声中に異なるCTXまたはDTXモードで動作する将来の音声伝送システム;およびCDMAの広帯域音声伝送システムと、共通の広帯域ボコーダを有するが、音声の非活動中に異なる動作モード(DTXまたはCTX)で動作する他の広帯域音声伝送システムとの相互運用性が含まれる。
したがって、開示されている実施形態では、連続の音声伝送システムのボコーダと、非連続の音声伝送システムのボコーダとの間のインターフェイスの方法および装置を与えている。CTXシステムの情報ビット流は、DTXビット流へマップされ、DTXビット流は、DTXチャンネルにおいて移送され、DTXシステムの受信端において復号化器によって復号化される。同様に、インターフェイスは、ビット流をDTXチャンネルからCTXチャンネルへ変換する。
図1において、第1の符号化器10は、ディジタル化された音声サンプルs(n)を受信し、サンプルs(n)を符号化し、伝送媒体12または通信チャンネル12上で第1の復号化器14へ伝送する。復号化器14は、符号化された音声サンプルを復号化し、出力音声信号SSYNTH(n)を合成する。反対方向へ伝送するときは、第2の符号化器16をディジタル化された音声サンプルs(n)へ符号化し、これを通信チャンネル18上で伝送する。第2の復号化器20は、符号化された音声サンプルを受信して復号化し、合成出力音声信号SSYNTH(n)を生成する。
音声サンプルs(n)は、この技術において知られている種々の方法(例えば、パルス符号変調(pulse code modulation, PCM)、コンパンデッドμ法、またはA法)にしたがって、ディジタル化され、量子化される音声信号を表わす。この技術において知られているように、音声サンプルs(n)は入力データフレームへ構成され、各フレームには、所定数のディジタル化された音声サンプルs(n)が構成されている。例示的な実施形態では、各20ミリ秒のフレームに160サンプルが構成された、8キロヘルツのサンプリングレートが用いられる。別途記載する実施形態では、データ伝送レートは、フレームごとに、フルレートから2分の1レート、4分の1レート、ないし8分の1レートへ変化する。その代りに、他のデータレートを使用してもよい。本明細書で使用されているように、“フルレート”または“ハイレート”という用語は、一般に、8キロビット秒以上のデータレートを指し、“ハーフレート”または“低レート”という用語は、4キロビット秒以下のデータレートを指す。比較的に少ない音声情報を収めているフレームに対しては、より低いビットレートが選択的に用いられるので、データ伝送レートを変更することは有益である。当業者には分かるように、他のサンプリングレート、フレームサイズ、およびデータ伝送レートを使用してもよい。
第1の符号化器10と第2の復号化器20には共に、第1の音声符号化器、すなわち音声コーデックが構成されている。同様に、第2の符号化器16および第1の復号化器14には共に、第2の音声符号化器が構成されている。当業者には、音声符号化器が、ディジタル信号プロセッサ(digital signal processor, DSP)、特定用途向け集積回路(application-specific integrated circuit, ASIC)、ディスクリートなゲート論理、ファームウエア、または従来のプログラマブルソフトウエアモジュール、およびマイクロプロセッサで構成されることが分かるであろう。ソフトウエアモジュールは、RAMメモリ、フラッシュメモリ、レジスタ、またはこの技術において知られている他の形式の書込み可能な記憶媒体の中にあってもよい。その代りに、従来のプロセッサ、制御装置、または状態機械は、マイクロプロセッサに置換してもよい。音声の符号化用にとくに設計されたASICの例は、米国特許第5,926,786号(APPLICATION SPECIFIC INTEGRATED CIRCUIT (ASIC) FOR PERFORMING RAPID SPEECH COMPRESSION IN A MOBILE TELEPHONE SYSTEM)および米国特許第5,784,532号(APPLICATION SPECIFIC INTEGRATED CIRCUIT (ASIC) FOR PERFORMING RAPID SPEECH COMPRESSION IN A MOBILE TELEPHONE SYSTEM)に記載されており、これらの両文献は、ここで開示されている実施形態の譲受人に譲渡され、本明細書において参考文献として全体的に取入れられる。
図2は、無線CTX音声伝送システム200についての例示的な実施形態を示しており、無線CTX音声伝送システム200には、加入者ユニット202、基地局208、および移動交換局(Mobile Switching Center, MSC)214が構成されていて、MSC214は、無音または背景雑音の伝送中にDTXシステムへのインターフェイスになることができる。加入者ユニット202は、移動加入者のためのセルラ電話、コードレス電話、ページング装置、無線ローカルループ装置、パーソナルディジタルアシスタント(personal digital assistant, PDA)、インターネット電話装置、衛星通信システムの構成要素、または通信システムの他のユーザ端末装置が構成されている。図2の例示的な実施形態では、連続音声伝送システム200のボコーダ218と非連続音声伝送システムのボコーダ(図示されていない)との間のCTXからDTXへのインターフェイス216が示されている。両システムのボコーダには、図1に示されている符号化器10と復号化器20とが構成されている。図2には、無線音声伝送システム200の基地局208内に構成されているCTX−DTXのインターフェイスの例示的な実施形態が示されている。代わりの実施形態では、CTX−DTXのインターフェイス216は、DTXモードで動作している他の音声伝送システムへのゲートウエイユニット(図示されていない)内に配置することができる。しかしながら、CTX−DTXのインターフェイス構成要素、またはその機能は、開示されている実施形態の技術的範囲から逸脱することなく、システム全体に物理的に交互に配置してもよいことが分かるであろう。例示的なCTXからDTXへのインターフェイス216には、加入者ユニット202の符号化器10から出力された8分の1レートのパケットを、DTXの互換性のあるSIDパケットへ変換するためのCTXからDTXへの変換ユニット210と、DTXシステムから受信したSIDパケットを、加入者ユニット202の復号化器20によって復号化できる8分の1レートのパケットへ変換するためのDTXからCTXへの変換ユニット212とが構成されている。例示的な変換ユニット210、212には、インターフェイシング音声システムの符号化器/復号化器ユニットが装備されている。CTXからDTXへの変換ユニットは、図4に詳しく記述式に示されている。DTXからCTXへの変換ユニットは、図6に詳しく記述的に示されている。例示的な加入者ユニット202の復号化器20は、DTXからCTXへの変換ユニット212によって出力される8分の1レートのパケットから快適雑音を生成するための合成雑音生成器(図示されていない)を装備している。合成雑音生成器は、図3に詳しく記述的に示されている。
図3は、伝送された雑音情報を使用して、受信機において快適雑音を生成するための、図1および2に示されている復号化器10、20によって使用される合成雑音生成器についての例示的な実施形態を示している。CTXおよびDTXの音声システムの両者において背景雑音を生成するための共通方式では、簡単なフィルタ−励起合成モデルを使用する。各フレームごとに使用可能な制限された低ビットレートを割り当てて、背景雑音を特徴付けるスペクトルパラメータおよびエネルギー利得値を伝送する。DTXシステムでは、伝送された雑音パラメータの補間を使用して、快適雑音を生成する。
ランダム励起信号306は、乗算器302において受信利得によって乗算され、中間信号x(n)、すなわち基準化されたランダム励起が生成される。基準化されたランダム励起x(n)は、受信したスペクトルパラメータを使用して、スペクトル整形フィルタ304によって整形され、合成された背景雑音信号308、y(n)が生成される。スペクトル整形フィルタ304の構成は、当業者には容易に分かるであろう。
図4は、図2に示されているCTXからDTXへのインターフェイス216のCTXからDTXへの変換ユニット210についての例示的な実施形態を示している。背景雑音は、伝送システムのVADが0を出力するとき、すなわち音声が非活動であるときに伝送される。背景雑音が、2つのCTXのシステム間で伝送されるとき、可変レートの符号化器は、利得およびスペクトル情報が構成されている連続の8分の1レートのデータパケットを生成し、同じシステムのCTXの復号化器は、8分の1レートのパケットを受信し、それらを復号化して、快適雑音を生成する。無音または背景雑音が、CTXシステムからDTXシステムへ伝送されるとき、CTXシステムによって生成された連続の8分の1レートのパケットを、DTXシステムによって復号化できる周期性のSIDフレームへ変換することによって、相互運用性を与えなければならない。1つの例示的な実施形態では、CTXとDTXのシステム間に与えなければならない相互運用性は、通信中は、2つのボコーダ間であり、2つのボコーダは、CDMA用の新しい提案されたボコーダ、すなわち選択可能モードボコーダ(Selectable Mode Vocoder, SMV)と、DTX動作モードを使用する新しい提案された4キロビット秒の国際電気通信連合(International Telecommunications Union, ITU)のボコーダである。SMVボコーダは、活動音声に対しては3つの符号化レート(8500、4000、および2000bps)、無音および背景雑音を符号化するときは800bpsを使用する。SMVボコーダとITU−Tボコーダとの両者は、相互運用可能な4000bpsの活動音声の符号化ビット流を有する。音声活動中の相互運用性について、SMVボコーダは、4000bpsの符号化レートのみを使用する。しかしながら、ITUのボコーダは、音声がないときは、伝送を中断し、背景雑音のスペクトルおよびエネルギーのパラメータが構成されているSIDフレームであって、DTX受信機においてのみ復号化できるSIDフレームを周期的に生成するので、音声の非活動中は、ボコーダは相互運用できない。N個の雑音フレームを含む1サイクルにおいて、ITU−Tのボコーダは、雑音統計を更新するための1つのSIDパケットを伝送する。パラメータ、Nは、受信DTXシステムのSIDフレームのサイクルによって判断される。
CTXシステムからDTXシステムへの非活動音声の伝送中の相互運用性は、図4に示されているCTXからDTXへの変換ユニット400によって与えられる。8分の1レートで符号化された雑音フレームは、CTXシステム(図示されていない)の符号化器(図示されていない)から、8分の1レートの復号化器402へ入力される。1つの実施形態では、8分の1レートの復号化器402は、十分に機能的な可変レートの復号化器である。別の実施形態では、8分の1レートの復号化器402は、8分の1レートのパケットから利得およびスペクトル情報のみを抽出できる部分復号化器である。部分復号化器に必要なことは、平均化するのに必要な各フレームのスペクトルパラメータおよび利得パラメータのみを復号化することである。部分デコーダは、必ずしも全信号を再構成できなくてもよい。8分の1レートのデコーダ402は、フレーム緩衝器404内に記憶されているN個の8分の1レートのパケットから、利得およびスペクトル情報を抽出する。パラメータ、Nは、受信DTXシステム(図示されていない)のSIDのフレームサイクルによって判断される。DTX平均化ユニット406は、SID符号化器408へ入力するためのN個の8分の1レートのフレームの利得およびスペクトル情報を平均化する。SIDフレームは、DTXスケジューラ410へ入力され、DTXスケジューラ410は、DTX受信機のSIDフレームサイクル内の適切な時間にパケットを伝送する。CTXシステムからDTXシステムへの非活動音声の伝送中の相互運用性は、このやり方で設定される。
図5は、例示的な実施形態にしたがってCTXからDTXの雑音変換のステップを示すフローチャートである。変換するための8分の1レートのパケットを生成するCTX符号化器は、基地局によってパケットの宛先がDTXシステムであることを知らされる。1つの実施形態では、MSC(図2の214)は、接続の宛先システムに関する情報を保持している。MSCシステムに登録することにより、接続の宛先を識別し、基地局(図2の208)において、8分の1レートのパケットから周期性のSIDフレームへの変換が可能になる。周期性のSIDフレームは、宛先のDTXシステムのSIDフレームサイクルに対応する周期的な伝送に対して適切にスケジュールされている。
CTXからDTXへの変換により、DTXシステムへ移送できるSIDパケットを生成する。音声の非活動中は、CTXシステムの符号化器は、8分の1レートのパケットを、CTXからDTXへの変換ユニット210の復号化器402へ伝送する。
先ず、ステップ502では、N個の連続の8分の1レートの雑音フレームを復号化して、受信パケットのスペクトルおよびエネルギー利得のパラメータを生成する。N個の連続の8分の1レートの雑音フレームのスペクトルおよびエネルギー利得のパラメータを緩衝し、制御フローはステップ504へ進む。
ステップ504では、N個のフレームの雑音を表わすものとして、平均スペクトルパラメータおよび平均エネルギー利得パラメータを、周知の平均化技術を使用して計算する。制御フローは、ステップ506へ進む。
ステップ506では、平均スペクトルおよびエネルギー利得のパラメータを量子化して、量子化されたスペクトルおよびエネルギー利得のパラメータから、SIDフレームを生成する。制御フローは、ステップ508へ進む。
ステップ508では、SIDフレームは、DTXスケジューラによって伝送される。
ステップ502ないし508は、無音または背景雑音のN個の8分の1フレームごとに反復される。当業者は、図5に示されているステップの順序が限定的でないことが分かるであろう。この方法は、開示されている実施形態の技術的範囲から逸脱することなく、記載されているステップを削除または順序変更することによって、容易に変えられる。
図6は、図2に示されているCTXからDTXへのインターフェイス216のDTXからCTXへの変換ユニット212についての1つの実施形態を示している。背景雑音が、2つのDTXシステム間で伝送されるとき、DTX符号化器は、平均利得およびスペクトル情報が収められている周期性のSIDデータパケットを生成し、同じシステムのDTX復号化器は、SIDパケットを周期的に受信し、それらを復号化して、快適雑音を生成する。背景雑音がDTXシステムからCTXシステムへ送られるときは、DTXシステムによって生成された周期性のSIDフレームを、CTXシステムによって復号化できる連続の8分の1レートのパケットへ変換することによって、相互運用性を与えることができる。DTXシステムからCTXシステムへの非活動音声の伝送中は、図6に示されている例示的なDTXからCTXへの変換ユニット600によって、相互運用性が与えられる。
SIDの符号化された雑音フレームは、DTXシステム(図示されていない)の符号化器から、DTX復号化器602へ入力される。DTX復号化器602は、SIDパケットを逆量子化して、SIDの雑音フレームのスペクトルおよびエネルギー情報を生成する。1つの実施形態では、DTX復号化器602は、十分に機能的なDTX復号化器である。別の実施形態では、DTX復号化器602は、SIDパケットから、平均スペクトルベクトルおよび平均利得のみを抽出できる部分復号化器であってもよい。部分DTX復号化器に必要なことは、SIDパケットから、平均スペクトルベクトルおよび平均利得を復号化することである。部分DTX復号化器は、全信号を必ずしも再構成できなくてもよい。平均利得およびスペクトル値は、平均スペクトルおよび利得ベクトル生成器604へ入力される。
平均スペクトルおよび利得ベクトル生成器604は、受信したSIDパケットから抽出した1つの平均スペクトル値および1つの平均利得値から、N個のスペクトル値およびN個の利得値を生成する。N個の伝送されていない雑音フレームに対するスペクトルパラメータおよびエネルギー利得値は、補間技術、補外技術、反復、および置換を使用して計算される。補間技術、補外技術、反復、および置換を使用して、複数のスペクトル値および利得値を生成することにより、固定ベクトル方式で生成される合成雑音よりも、元の背景雑音をより適切に表わす合成雑音を生成する。伝送されたSIDパケットが、実際の無音を表わすとき、スペクトルベクトルは一定であるが、車両の雑音、モールの雑音、などが加わると、固定ベクトルでは不十分になる。N個の生成されたスペクトルおよび利得値は、CTXの8分の1レートの符号化器608へ入力され、CTXの8分の1レートの符号化器608では、N個の8分の1レートのパケットを生成する。CTXの符号化器は、各SIDフレームサイクルごとに、N個の連続の8分の1レートの雑音フレームを出力する。
図7は、例示的な実施形態にしたがって、DTXからCTXの変換のステップを示すフローチャートである。DTXからCTXへの変換では、各受信したSIDパケットごとに、N個の8分の1レートの雑音パケットを生成する。音声の非活動中は、DTXシステムの符号化器は、周期性のSIDフレームを、DTXからCTXへの変換ユニット212のSIDの復号化器602へ伝送する。
先ず、ステップ702では、周期性のSIDフレームを受信する。制御フローはステップ704へ進む。
ステップ704では、平均利得値および平均スペクトル値を、受信したSIDパケットから抽出する。制御フローは、ステップ706へ進む。
ステップ706では、補間技術、補外技術、反復、および置換の順序の並び替えを使用して、1つの平均スペクトル値から、N個のスペクトル値およびN個の利得値を生成し、受信したSIDパケット(1つの実施形態では、2つ前のSIDパケット)から、1つの平均利得値を抽出する。N個の雑音フレームの1サイクルにおいて、N個のスペクトル値およびN個の利得値を生成するのに使用される補間式の1つの実施形態を示す;
p(n+i)=(1−i/N)p(n−N)+i/Np(n)
なお、p(n+i)は、フレームn+i(i=0,1,...,N−1)のパラメータであり、p(n)は、現在のサイクル内の第1のフレームのパラメータであり、p(n−N)は、現在のサイクルより1つ前のサイクル内の第1のフレームのためのパラメータである。制御フローは、ステップ708へ進む。
ステップ708では、N個の8分の1レートの雑音パケットを、生成されたN個のスペクトル値およびN個の利得値を使用して生成する。ステップ702ないし708は、各受信したSIDフレームのために反復される。
当業者には、図7に示されているステップの順序は制限的ではないことが分かるであろう。この方法は、開示されている実施形態の技術的範囲から逸脱することなく、示されているステップを省略したり、またはステップの順序を変えたりすることによって、容易に変更できる。
以上では、音声が非活動である間の音声伝送システム間の相互運用性のための新規で向上した方法および装置について記載した。当業者には、種々の異なる技術および技法を使用して、情報および信号が表現されることが分かるであろう。例えば、上述で参照したデータ、命令、コマンド、情報、信号、ビット、符号、およびチップは、電圧、電流、電磁波、磁界または磁流、光の界または粒子、あるいはこれらの組み合わせによって表現されることができる。
当業者には、さらに、本明細書において開示されている実施形態と関係して記載されている、種々の例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウエア、コンピュータソフトウエア、または両者の組合せとして構成されることが分かるであろう。ハードウエアおよびソフトウエアのこの互換性を明らかに示すために、種々の例示的な構成要素、ブロック、モジュール、回路、およびステップは、機能に関連して上述で概ね記載した。このような機能がハードウエアまたはソフトウエアとして構成されているかどうかは、特定の応用と、システム全体に課されている設計上の制約に依存する。熟練した技能をもつ者は、それぞれの特定の応用のやり方を変更して、記載されている機能を実行するが、このような実行の決定は、本発明の技術的範囲から逸脱しないと解釈すべきである。
本明細書に開示されている実施形態に関連して記載した種々の例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、ディジタル信号プロセッサ(digital signal processor, DSP);特定用途向け集積回路(application specific integrated circuit, ASIC);フィールドプログラマブルゲートアレイ(field programmable gate array, FPGA)または他のプログラマブル論理デバイス;ディスクリートなゲートまたはトランジスタ論理;ディスクリートなハードウエア構成要素、;あるいは本明細書に記載した機能を実行するように設計された組み合わせで構成または実行される。汎用プロセッサは、マイクロプロセッサであってもよいが、その代わりに、プロセッサは従来のプロセッサ、制御装置、マイクロ制御装置、または状態機械であってもよい。プロセッサは、計算装置の組合せ、例えばDSPと1つのマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、またはDSPコアと関連するマイクロプロセッサ、あるいはこのような他の構成としても構成される。
本明細書に開示されている実施形態と関係して記載されている方法またはアルゴリズムのステップは、ハードウエア、プロセッサによって実行されるソフトウエアモジュール、またはこの2つの組合せで直接に取入れることができる。ソフトウエアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、取り外し可能ディスク、CD−ROM、またはこの技術において知られている記憶媒体の他の形態の中に存在する。例示的な記憶媒体は、プロセッサに連結され、プロセッサは記憶媒体から情報を読み出し、かつ記憶媒体へ情報を書込むことができる。その代りに、記憶媒体は、プロセッサと一体構成であってもよい。プロセッサおよび記憶媒体は、ASIC内に存在していてもよい。ASICは加入者ユニット内に存在していてもよい。その代りに、プロセッサおよび記憶媒体は、ユーザ端末内のディスクリートな構成要素として存在していてもよい。
開示されている実施形態についてのこれまでの記述は、当業者が本発明を生成または使用できるように与えられている。これらの実施形態の種々の変形は、当業者には容易に明らかであり、本明細書で定義されている全体的な原理は、本発明の技術的範囲から逸脱せずに、他の実施形態に応用できる。したがって、本発明は、本明細書に示した実施形態に制限されることを意図されていないが、本明細書で開示した原理および新規な特徴にしたがう最も幅広い技術的範囲に一致することを意図されている。
音声符号化器によって、各端部において終端する通信チャンネルのブロック図。 図1に示されている符号化器を取入れて、非音声を伝送するCTX/DTXの相互運用性を支援する無線通信システムのブロック図。 伝送される雑音情報を使用して、受信機において快適雑音を生成するための合成雑音生成器のブロック図。
CTXからDTXへの変換ユニットのブロック図。 CTXからDTXへの変換の変換ステップを示すフローチャート。 DTXからCTXへの変換ユニットのブロック図。 DTXからCTXへの変換の変換ステップを示すフローチャート。
符号の説明
10、16 符号化器、
12、18 通信チャンネル、
14、20 復号化器、
200 無線CTX音声伝送システム
202 加入者ユニット、
208 基地局、
210 CTX−DTXの変換ユニット、
212 DTX−CTXの変換ユニット、
214 移動交換局、
216 インターフェイス、
218 ボコーダ、
302 乗算器、
304 スペクトル整形フィルタ、
306 ランダム励起信号、
308 背景雑音信号、
400 CTXからDTXへの変換ユニット、
402 1/8レート復号化器、
404 緩衝器、
406 DTX平均化ユニット、
408 SID符号化器、
410 DTXスケジューラ、
600 DTXからCTXへの変換ユニット、
602 DTX復号化器、
604 平均スペクトル値および平均利得値生成器、
608 CTXの1/8レートの符号化器。

Claims (31)

  1. 連続非活動音声フレームを非連続非活動音声フレームに変換する方法であって、連続非活動音声フレームが連続伝送システムのために符号化され、非連続非活動音声フレームが非連続伝送システムのために符号化され、
    複数の連続非活動音声フレームから利得およびスペクトル情報を抽出し、
    平均利得パラメータおよび平均スペクトルパラメータを得るために、利得およびスペクトル情報を平均化し、
    平均利得パラメータおよび平均スペクトルパラメータを使用して少なくとも1つの非連続非活動音声フレームを生成することを含む方法。
  2. 非連続非活動音声フレームを連続非活動音声フレームに変換する方法であって、連続非活動音声フレームが連続伝送システムのために符号化され、非連続非活動音声フレームが非連続伝送システムのために符号化され、
    非連続非活動音声フレームから快適雑音情報を抽出し、
    抽出された快適雑音情報から複数のスペクトル値および複数の利得値を生成し、
    複数のスペクトル値の1つおよび複数の利得値の1つから各々生成される、複数の連続非活動音声フレームを生成することを含む方法。
  3. 連続伝送システムは、CDMAシステムである請求項1または2記載の方法。
  4. CDMAシステムは、選択可能モードボコーダを含む請求項2記載の方法。
  5. 非連続伝送システムは、GSMシステムである請求項1または2記載の方法。
  6. 非連続伝送システムは、狭帯域幅の音声伝送システムである請求項1または2記載の方法。
  7. 非連続伝送システムは、ボイス オーバー インターネット プロトコルアプリケーションに対する非連続モードにおいて動作する4キロビット/秒のボコーダを含む請求項1または2記載の方法。
  8. 相互運用性は、連続モードで動作する少なくとも1つの音声伝送システムと、非連続モードで動作する少なくとも1つの音声伝送システムとの間に与えられている請求項1または2記載の方法。
  9. 相互運用性は、第1のCDMA広帯域音声伝送システムと、異なる伝送モードにおいて動作する共通の広帯域ボコーダを有する第2の広帯域音声伝送システムとの間に与えられている請求項1または2記載の方法。
  10. 連続非活動音声フレームは、8分の1レートで符号化される請求項1または2記載の方法。
  11. 連続伝送システムによって生成された前記連続非活動音声フレームを、非連続伝送システムによって復号化できる周期性の無音挿入記述子フレームへ変換するための請求項1の方法であって、
    スペクトルパラメータおよび利得パラメータのグループを生成するため連続非活動音声フレームのグループを復号化し、
    平均スペクトル値を生成するためにスペクトルパラメータのグループを平均化し、
    平均利得値を生成するために利得パラメータのグループを平均化し、
    平均スペクトル値を量子化し、
    平均利得値を量子化し、
    量子化された利得値および量子化されたスペクトル値から無音挿入記述子フレームを生成し、
    受信非連続伝送システムの無音挿入記述子フレームサイクル中の適切な時間に、無音挿入記述子フレームを伝送することを含む方法。
  12. 連続非活動音声フレームが、8分の1レートで符号化される請求項11記載の方法。
  13. 非連続伝送システムによって生成された周期性の無音挿入記述子フレームを連続伝送システムによって復号化できる前記連続非活動音声フレームに変換する請求項2記載の方法であって、
    無音挿入記述子フレームを受信し、
    量子化された平均利得値および量子化された平均スペクトル値を生成するため無音挿入記述子フレーム復号化し、かつ平均利得値および平均スペクトル値を生成するため量子化された平均利得値および量子化された平均スペクトル値を逆量子化し、
    平均利得値および平均スペクトル値から、スペクトル値のグループおよび利得値のグループを生成し、
    スペクトル値のグループおよび利得値のグループから連続非活動音声フレームのグループを符号化することを含む方法。
  14. 補間技術を使用して、スペクトル値のグループと利得値のグループとを生成する請求項13記載の方法。
  15. p(n+i)を、フレームn+i(i=0,1,...,N−1)のパラメータとし、p(n)を、現在のサイクル内の第1のフレームのパラメータとし、p(n−N)を、現在のサイクルの1つ前のサイクル内の第1のフレームのためのパラメータとし、Nを、受信した非連続伝送システムの無音挿入記述子フレームサイクルによって判断するとき、補間技術は、式、p(n+i)=(1−i/N)p(n−N)+i/Np(n)を用いる請求項14記載の方法。
  16. 補外技術を使用して、スペクトル値のグループと利得値のグループとを生成する請求項13記載の方法。
  17. 反復技術を使用して、スペクトル値のグループと利得値のグループとを生成する請求項13記載の方法。
  18. 置換技術を使用して、スペクトル値のグループと利得値のグループとを生成する請求項13記載の方法。
  19. 2つ前の無音挿入記述子フレームを使用して、スペクトル値のグループと利得値のグループとを生成する請求項13記載の方法。
  20. 連続非活動音声フレームが、8分の1レートで符号化される請求項13記載の方法。
  21. 連続非活動音声フレームを非連続非活動音声フレームに変換する装置であって、
    複数の連続非活動音声フレームから利得およびスペクトル情報を抽出する手段と、
    平均利得パラメータおよび平均スペクトルパラメータを得るために利得およびスペクトル情報を平均化する手段と、
    平均利得パラメータおよび平均スペクトルパラメータを使用して少なくとも1つの非連続非活動音声フレームを生成する手段とを含む装置。
  22. 装置が、連続伝送システムによって生成された前記連続非活動音声フレームを非連続伝送システムによって復号化できる周期性の無音挿入記述子フレームに変換する連続から非連続への変換ユニットであり、
    前記抽出する手段が非活動音声フレームのスペクトルおよび利得パラメータを復号化する復号器を含み、
    前記平均化する手段が平均利得値および平均スペクトル値を生成するため非活動音声フレームのグループを平均化する平均化ユニットを含み、
    前記生成する手段が平均利得値および平均スペクトル値を量子化し、かつ平均化された利得値および平均化されたスペクトル値を使用して無音挿入記述子フレームを生成する無音挿入記述子符号化器を含み、前記ユニットが、
    受信非連続伝送システムの無音挿入記述子フレームサイクル中の適切な時間に、無音挿入記述子フレームを伝送する非連続伝送スケジューラをさらに含む、請求項21記載の装置。
  23. 連続非活動音声フレームが、8分の1レートで符号化される請求項22記載の連続から非連続への変換ユニット
  24. スペクトルおよび利得パラメータを記憶するメモリバッファをさらに含む、請求項22記載の連続から非連続への変換ユニット
  25. 復号器が完全な可変レート復号器である請求項22記載の連続から非連続への変換ユニット
  26. 復号器が、8分の1レート符号化フレームから利得およびスペクトルパラメータを抽出することができる、一部8分の1レート復号器である請求項22記載の連続から非連続への変換ユニット
  27. 非連続非活動音声フレームを連続非活動音声フレームへ変換する装置であって、
    非連続非活動音声フレームから快適雑音情報を抽出する手段と、
    抽出された快適雑音情報から複数のスペクトル値および複数の利得値を生成する手段と、
    複数のスペクトル値の1つおよび複数の利得値の1つから各々生成される、複数の連続非活動音声フレームを生成する手段とを含む装置。
  28. 装置が、非連続伝送システムによって生成された周期性の無音挿入記述子フレームを連続伝送システムによって復号化できる連続非活動音声フレームに変換する非連続から連続への変換ユニットであり、
    前記抽出する手段が量子化された平均利得値および量子化された平均スペクトル値を生成するため無音挿入記述子フレームを復号化し、かつ平均利得値および平均スペクトル値を生成するために平均利得値および平均スペクトル値を逆量子化する復号器を含み、
    前記生成する手段(604)が平均利得値および平均スペクトル値からスペクトル値のグループおよび利得値のグループを生成する平均化されたスペクトルおよび利得値生成器を含み、
    前記生成する手段(608)がスペクトル値のグループおよび利得値のグループから連続非活動音声フレームのグループを生成する符号化器を含む、請求項27記載の装置。
  29. 符号化器が連続の8分の1レートのフレームを生成する、請求項28記載の非連続から連続への変換ユニット。
  30. 平均化されたスペクトルおよび利得値生成器がさらに補間器を含む請求項28記載の非連続から連続への変換ユニット。
  31. 平均化されたスペクトルおよび利得値生成器がさらに補外器を含む請求項28記載の非連続から連続への変換ユニット。
JP2002565303A 2001-01-31 2002-01-30 音声の非活動中に音声伝送システム間の相互運用性のための方法および装置 Expired - Fee Related JP4071631B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/774,440 US6631139B2 (en) 2001-01-31 2001-01-31 Method and apparatus for interoperability between voice transmission systems during speech inactivity
PCT/US2002/003013 WO2002065458A2 (en) 2001-01-31 2002-01-30 Method and apparatus for interoperability between voice transmission systems during speech inactivity

Publications (2)

Publication Number Publication Date
JP2004527160A JP2004527160A (ja) 2004-09-02
JP4071631B2 true JP4071631B2 (ja) 2008-04-02

Family

ID=25101236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002565303A Expired - Fee Related JP4071631B2 (ja) 2001-01-31 2002-01-30 音声の非活動中に音声伝送システム間の相互運用性のための方法および装置

Country Status (13)

Country Link
US (2) US6631139B2 (ja)
EP (2) EP1895513A1 (ja)
JP (1) JP4071631B2 (ja)
KR (1) KR100923891B1 (ja)
CN (1) CN1239894C (ja)
AT (1) ATE428166T1 (ja)
AU (1) AU2002235512A1 (ja)
BR (1) BRPI0206835B1 (ja)
DE (1) DE60231859D1 (ja)
ES (1) ES2322129T3 (ja)
HK (1) HK1064492A1 (ja)
TW (1) TW580691B (ja)
WO (1) WO2002065458A2 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7012901B2 (en) * 2001-02-28 2006-03-14 Cisco Systems, Inc. Devices, software and methods for generating aggregate comfort noise in teleconferencing over VoIP networks
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
US20020198708A1 (en) * 2001-06-21 2002-12-26 Zak Robert A. Vocoder for a mobile terminal using discontinuous transmission
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7529220B2 (en) * 2002-07-31 2009-05-05 Interdigital Technology Corporation Wireless receiver
US7542897B2 (en) * 2002-08-23 2009-06-02 Qualcomm Incorporated Condensed voice buffering, transmission and playback
WO2004034379A2 (en) * 2002-10-11 2004-04-22 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
EP1808852A1 (en) * 2002-10-11 2007-07-18 Nokia Corporation Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
US7406096B2 (en) * 2002-12-06 2008-07-29 Qualcomm Incorporated Tandem-free intersystem voice communication
WO2004075582A1 (en) 2003-02-21 2004-09-02 Nortel Networks Limited Data communication apparatus and method for establishing a codec-bypass connection
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
EP1730649A2 (en) * 2004-03-05 2006-12-13 Vanu, Inc. Controlling jitter effects
WO2005089055A2 (en) 2004-03-19 2005-09-29 Nortel Networks Limited Communicating processing capabilites along a communications path
US8027265B2 (en) 2004-03-19 2011-09-27 Genband Us Llc Providing a capability list of a predefined format in a communications network
EP1757033A4 (en) * 2004-06-09 2009-04-22 Vanu Inc BANDWIDTH REDUCTION OF A LAND CONNECTION
EP1768106B8 (en) * 2004-07-23 2017-07-19 III Holdings 12, LLC Audio encoding device and audio encoding method
US7911945B2 (en) * 2004-08-12 2011-03-22 Nokia Corporation Apparatus and method for efficiently supporting VoIP in a wireless communication system
CN100369444C (zh) * 2004-09-30 2008-02-13 北京信威通信技术股份有限公司 一种在scdma系统中非连续式传输全速率语音的方法
US20060095590A1 (en) * 2004-11-04 2006-05-04 Nokia Corporation Exchange of encoded data packets
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20070064681A1 (en) * 2005-09-22 2007-03-22 Motorola, Inc. Method and system for monitoring a data channel for discontinuous transmission activity
CN100442933C (zh) * 2005-11-30 2008-12-10 华为技术有限公司 配置上行不连续发送dtx参数的方法
KR100790110B1 (ko) * 2006-03-18 2008-01-02 삼성전자주식회사 모폴로지 기반의 음성 신호 코덱 방법 및 장치
CN101090359B (zh) * 2006-06-13 2010-12-08 中兴通讯股份有限公司 基于不连续发送预测的流控方法
KR20080003537A (ko) * 2006-07-03 2008-01-08 엘지전자 주식회사 이동 단말기의 통화 중 노이즈 제거 방법 및 이를 위한이동 단말기
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US20080058004A1 (en) * 2006-08-29 2008-03-06 Motorola, Inc. System and method for reassigning an uplink time slot from a circuit-switched gprs mobile device to a different packet-switched gprs mobile device
CA2663904C (en) * 2006-10-10 2014-05-27 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
US8209187B2 (en) * 2006-12-05 2012-06-26 Nokia Corporation Speech coding arrangement for communication networks
WO2008082605A1 (en) * 2006-12-28 2008-07-10 Genband Inc. Methods, systems, and computer program products for silence insertion descriptor (sid) conversion
US20080171537A1 (en) * 2007-01-16 2008-07-17 Hung-Che Chiu Method of providing voice stock information via mobile apparatus
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
US8195454B2 (en) 2007-02-26 2012-06-05 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
CN101355738B (zh) * 2007-07-25 2011-07-13 中兴通讯股份有限公司 一种Abis接口不连续传输模式的语音传输装置及方法
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
CN101394225B (zh) * 2007-09-17 2013-06-05 华为技术有限公司 一种话音传输的方法和装置
CN101394660B (zh) * 2007-09-17 2012-09-05 华为技术有限公司 一种确定下行发送模式的方法和装置
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
DE102008009720A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN101783142B (zh) * 2009-01-21 2012-08-15 北京工业大学 转码方法、装置和通信设备
US8352252B2 (en) * 2009-06-04 2013-01-08 Qualcomm Incorporated Systems and methods for preventing the loss of information within a speech frame
US8908541B2 (en) 2009-08-04 2014-12-09 Genband Us Llc Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway
US8589153B2 (en) * 2011-06-28 2013-11-19 Microsoft Corporation Adaptive conference comfort noise
US8982741B2 (en) * 2012-05-11 2015-03-17 Intel Corporation Method, system and apparatus of time-division-duplex (TDD) uplink-downlink (UL-DL) configuration management
WO2014075208A1 (zh) * 2012-11-13 2014-05-22 华为技术有限公司 语音类问题检测方法及应用语音通信网络系统的网元设备
EP3550562B1 (en) * 2013-02-22 2020-10-28 Telefonaktiebolaget LM Ericsson (publ) Methods and apparatuses for dtx hangover in audio coding
CN110072021B (zh) * 2014-02-28 2022-01-07 杜比实验室特许公司 一种在音频电话会议混合系统中的方法、装置和计算机可读介质
CN104978970B (zh) 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统
CN105101109B (zh) * 2014-05-15 2019-12-03 哈尔滨海能达科技有限公司 警用数字集群系统的不连续发送的实现方法、终端和系统
CN110097892B (zh) * 2014-06-03 2022-05-10 华为技术有限公司 一种语音频信号的处理方法和装置
JP2016038513A (ja) 2014-08-08 2016-03-22 富士通株式会社 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
EP3185646B1 (en) * 2015-12-22 2018-11-07 Intel IP Corporation Method for sharing a wireless transmission medium in a terminal device and wireless communication device and wireless communication circuit related thereto
WO2018164165A1 (ja) * 2017-03-10 2018-09-13 株式会社Bonx 通信システム、通信システムに用いられるapiサーバ、ヘッドセット、及び携帯通信端末

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US5828662A (en) * 1996-06-19 1998-10-27 Northern Telecom Limited Medium access control scheme for data transmission on code division multiple access (CDMA) wireless systems
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5868662A (en) * 1997-06-16 1999-02-09 Advanced Urological Developments Method for improving observation conditions in urethra and a cystoscope for carrying out the method
US6347081B1 (en) * 1997-08-25 2002-02-12 Telefonaktiebolaget L M Ericsson (Publ) Method for power reduced transmission of speech inactivity
US6108560A (en) * 1997-09-26 2000-08-22 Nortel Networks Corporation Wireless communications system
US6182035B1 (en) * 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
DE69940649D1 (de) * 1998-11-24 2009-05-07 Ericsson Telefon Ab L M Effiziente Inband-Signalisierung für diskontinuierliche Übertragung und Konfigurationsänderungen in Kommunikationssystemen mit adaptiver Mehrfachrate
US6389067B1 (en) * 1999-06-10 2002-05-14 Qualcomm, Inc. Method and apparatus for using frame energy metrics to improve rate determination

Also Published As

Publication number Publication date
US20040133419A1 (en) 2004-07-08
EP1356459B1 (en) 2009-04-08
ES2322129T3 (es) 2009-06-17
KR100923891B1 (ko) 2009-10-28
ATE428166T1 (de) 2009-04-15
US7061934B2 (en) 2006-06-13
WO2002065458A3 (en) 2002-11-14
DE60231859D1 (de) 2009-05-20
EP1895513A1 (en) 2008-03-05
TW580691B (en) 2004-03-21
CN1239894C (zh) 2006-02-01
WO2002065458A2 (en) 2002-08-22
CN1514998A (zh) 2004-07-21
US20020101844A1 (en) 2002-08-01
KR20030076646A (ko) 2003-09-26
BRPI0206835B1 (pt) 2016-12-06
BR0206835A (pt) 2004-08-24
HK1064492A1 (en) 2005-01-28
US6631139B2 (en) 2003-10-07
EP1356459A2 (en) 2003-10-29
AU2002235512A1 (en) 2002-08-28
JP2004527160A (ja) 2004-09-02

Similar Documents

Publication Publication Date Title
JP4071631B2 (ja) 音声の非活動中に音声伝送システム間の相互運用性のための方法および装置
KR101960200B1 (ko) 리던던시 기반의 패킷 송신 에러 복구 시스템 및 방법
US8432935B2 (en) Tandem-free intersystem voice communication
KR100912030B1 (ko) 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치
JP4842472B2 (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
EP3776548A1 (en) Truncateable predictive coding
US6940967B2 (en) Multirate speech codecs
TWI630602B (zh) 在頻寬轉換週期期間之信號再使用
KR20090129450A (ko) 고정된 배경 잡음의 평활화를 위한 방법 및 장치
JP2005503574A5 (ja)
CA2293165A1 (en) Method for transmitting data in wireless speech channels
US7542897B2 (en) Condensed voice buffering, transmission and playback
US7233896B2 (en) Regular-pulse excitation speech coder
US7584096B2 (en) Method and apparatus for encoding speech
Choudhary et al. Study and performance of amr codecs for gsm
KR20090082495A (ko) 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법
KR100684944B1 (ko) 이동통신 시스템에서 전송되는 음성 데이터에 대한 음질 개선 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070808

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080117

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4071631

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110125

Year of fee payment: 3

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120125

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130125

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140125

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees