JP2012098740A - 音声通信におけるフレーム消失キャンセル - Google Patents

音声通信におけるフレーム消失キャンセル Download PDF

Info

Publication number
JP2012098740A
JP2012098740A JP2011270440A JP2011270440A JP2012098740A JP 2012098740 A JP2012098740 A JP 2012098740A JP 2011270440 A JP2011270440 A JP 2011270440A JP 2011270440 A JP2011270440 A JP 2011270440A JP 2012098740 A JP2012098740 A JP 2012098740A
Authority
JP
Japan
Prior art keywords
frame
frames
speech
delay
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011270440A
Other languages
English (en)
Other versions
JP5362808B2 (ja
Inventor
Diaz Spindler Serafin
セラフィン・ダイアズ・スピンドラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2012098740A publication Critical patent/JP2012098740A/ja
Application granted granted Critical
Publication of JP5362808B2 publication Critical patent/JP5362808B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】音声通信用のフレーム消失キャンセル技術を提供する。
【解決手段】それぞれが音声パラメータを有するフレームのシーケンスを受信する音声デコーダ108は、音声パラメータからスピーチを生成するスピーチジェネレータ308を含んでいる。フレーム消失キャンセルモジュール306は、前のフレームの1つにおける音声パラメータ、及び、後のフレームの1つにおける音声パラメータから、フレームシーケンスにおけるフレーム消失の音声パラメータを再構築する。
【選択図】図3

Description

本開示は、一般に、音声通信に関し、更に詳しくは、音声通信用のフレーム消失キャンセル技術に関する。
従来、デジタル音声通信は、回線交換ネットワーク上で行なわれてきた。回線交換ネットワークは、通話が持続している間、2つの端末間で物理的経路が確立されるネットワークである。回線交換用途では、送信端末が、音声情報を含むパケットのシーケンスを、物理的経路を介して受信端末へ送る。受信端末は、パケットに含まれている音声情報を使用してスピーチを合成する。パケットが送信中に失われる場合、受信端末は、失われた情報を隠蔽することを試みるかもしれない。これは、以前に受信されたパケット内の情報から、失われたパケットに含まれる音声情報を再構築することにより達成されうる。
最近の技術の進歩は、パケット交換ネットワークによるデジタル音声通信への道を開いた。パケット交換ネットワークは、パケットが、宛先アドレスに基づいて、ネットワークを介して経路付けられるネットワークである。パケット交換通信を用いて、ルータは、各パケットのための経路を個別に決定し、目的地に到達するために利用可能な任意の経路に沿ってパケットを送る。その結果、パケットは、受信端末に、同時にあるいは同じ順番で到着しない。ジッタバッファは、パケットを順番通りに戻し、それらを連続的なシーケンシャル様式で再生するために受信端末で使用されうる。
ジッタバッファの存在は、失われたパケットのために再構築された音声情報の品質を改善するユニークな機会を提供する。ジッタバッファは、受信端末によって受信されたパケットを、再生される前に格納するので、音声情報は、失われたパケットについて、再生シーケンスにおいて、失われたパケットの前後のパケット内の情報から再構築される。
音声デコーダが開示される。この音声デコーダは、それぞれが音声パラメータを有するフレームのシーケンスを受信し、音声パラメータからスピーチを生成するように構成された音声ジェネレータを含む。音声デコーダはまた、前のフレームの1つにおける音声パラメータ、及び、後のフレームの1つにおける音声パラメータから、フレームシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールを含む。
音声復号方法が開示される。この方法は、それぞれが音声パラメータを有するフレームのシーケンスを受信することと、前のフレームの1つにおける音声パラメータ、及び、後のフレームの1つからの音声パラメータから、フレームシーケンスにおけるフレーム消失の音声パラメータを再構築することと、フレームシーケンスにおける音声パラメータからスピーチを生成することとを含む。
フレームシーケンスを受信するように構成された音声デコーダが開示される。フレームの各々は、音声パラメータを含んでいる。この音声デコーダは、音声パラメータからスピーチを生成する手段と、前のフレームの1つにおける音声パラメータ、及び、後のフレームの1つにおける音声パラメータから、フレームシーケンスにおけるフレーム消失の音声パラメータを再構築する手段とを含む。
通信端末もまた開示される。この通信端末は、受信機と、それぞれが音声パラメータを有するフレームのシーケンスを受信機から受信するように構成された音声デコーダとを含む。音声デコーダは、音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、前のフレームの1つにおける音声パラメータ、及び、後のフレームの1つにおける音声パラメータから、フレームシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールとを含む。
本発明の他の実施形態は、本発明の様々な実施形態が示され、例示によって記述されている以下の詳細記述から、当業者に容易に明白になるであろうことが理解される。理解されるように、本発明は、その精神及び範囲から逸脱することなく、その他及び異なる実施形態となることができ、かつ、幾つかの詳細は、その他様々な観点において変形することができる。従って、これら図面及び詳細記述は、本来例示的なものとして見なされ、限定的と見なされるものではない。
図1は、送信媒体を介した送信端末及び受信端末の一例を示す概念ブロック図である。 図2は、送信端末における音声エンコーダの一例を示す概念ブロック図である。 図3は、図1に示す受信端末のより詳細な概念ブロック図である。 図4は、音声デコーダにおけるフレーム消失キャンセルモジュールの機能を例示するフロー図である。
本発明の局面は、添付図面において例として示されており、限定として示されているものではない。
添付図面に関連して述べられた詳細説明は、本発明の様々な実施形態の説明として意図されており、本発明が実現される唯一の実施形態を示すとは意図されていない。この詳細説明は、本発明の完全な理解を与えることを目的とした具体的な詳細を含んでいる。しかしながら、本発明は、これら具体的詳細なく実現されうることが当業者に明らかになるであろう。幾つかのインスタンスでは、本発明の概念を不明瞭にしないために、良く知られた構成及びコンポーネントがブロック図形式で示される。
図1は、送信媒体を介した送信端末102と受信端末104との例を示す概念ブロック図である。送信端末102及び受信端末104は、電話、コンピュータ、オーディオブロードキャスト及び受信機器、ビデオ会議機器等を含む音声通信をサポートすることができる任意のデバイスでありうる。1つの実施形態では、送信端末102及び受信端末104は、符号分割多元接続(CDMA)機能を用いて実現されるが、実際には、任意の多元接続技術で実現されうる。CDMAは、当該技術において周知のスペクトル拡散通信に基づく変調及び多元接続スキームである。
送信端末102は、音声エンコーダ106を備えて示されており、受信端末104は、音声デコーダ108を備えて示されている。音声エンコーダ106は、人間のスピーチ生成モデルに基づいてパラメータを抽出することによって、ユーザインタフェース110からのスピーチを圧縮するために使用されうる。送信機112は、これらパラメータを含むパケットを、送信媒体114を介して送信するために使用されうる。送信媒体114は、例えばインターネット、企業イントラネット、又はその他任意の送信媒体のようなパケットベースのネットワークでありうる。送信媒体112のもう1つの終端にある受信機116は、パケットを受信するために使用されうる。音声デコーダ108は、パケット内のパラメータを使用して、スピーチを合成する。そして、合成されたスピーチは、受信端末104のユーザインタフェース118に提供されうる。図示していないが、例えば、巡回冗長検査(CRC)機能、インタリーブ、デジタル変調、及びスペクトル拡散処理を含む畳み込み符合化のような様々な信号処理機能が、送信機112及び受信機116の両方において実行されうる。
ほとんどの用途では、通信に対する各パーティは、受信のみならず送信も行う。従って、各端末は、音声エンコーダ及び音声デコーダを必要とするだろう。音声エンコーダ及び音声デコーダは、個別のデバイスであるか、あるいは、「ボーコーダ」として知られている単一のデバイスに統合されうる。次に示す詳細説明では、端末102,104は、送信媒体114の一方の終端において音声エンコーダ106を備えて記述され、もう一方の終端において音声デコーダ108を備えて記述される。当業者は、本明細書で記述した概念を、どのようにして2方向通信へ拡張するかを容易に認識するであろう。
送信端末102の少なくとも1つの実施形態では、スピーチは、ユーザインタフェース110から音声エンコーダ106へフレームで入力される。各フレームは更に、サブフレームに分割されている。これら任意のフレーム境界は、一般に、本明細書における場合もそうであるが、幾つかのブロック処理が実行されるところで使用される。しかしながら、ブロック処理以外の連続処理が実施されるのであれば、スピーチサンプルは、フレーム(及びサブフレーム)に分割される必要はない。当業者であれば、以下に示すブロック技術をどのようにして連続処理に拡張できるかを容易に認識するであろう。記述した実施形態では、送信媒体114を介して送信される各パケットは、具体的な用途及び全体の設計制約に依存して1又は複数のフレームを含みうる。
音声エンコーダ106は、可変レート又は固定レートのエンコーダでありうる。可変レートエンコーダは、スピーチ内容に依存して、フレームからフレームへと多くのエンコーダモード間を動的に切り換える。音声デコーダ108はまた、フレームからフレームへと、対応するデコーダモード間を動的に切り換える。受信端末104において、許容可能な信号再生成を維持しながら、各フレームについて、利用可能な最も低いビットレートを達成するために、特定のモードが選択される。一例として、アクティブなスピーチが、フルレート又はハーフレートで符合化される。背景雑音は、一般に、1/8レートで符号化される。可変レートエンコーダ及び固定レートエンコーダともに、当該技術において良く知られている。
音声エンコーダ106及び音声デコーダ108は、線形予測符号化(LPC:Linear Predictive Coding)を使用しうる。LPC符合化の背景にある基本概念は、スピーチは、その強度及びピッチによって特徴付けられ、スピーチソース(声帯)によってモデル化されうることである。声帯からのスピーチは、声道(喉と口)を通って移動し、「フォルマント」と称される共振によって特徴付けられる。LPC音声エンコーダ106は、フォルマントを推定し、スピーチからその効果を取り除き、残りのスピーチの強度およびピッチを推定することにより、スピーチを分析する。受信端におけるLPC音声デコーダ108は、処理を逆にすることによりスピーチを合成する。特に、LPC音声デコーダ108は、残りのスピーチを使用してスピーチソースを生成し、フォルマントを使用してフィルタ(声道を表わす)を生成し、フィルタを介してスピーチソースを走らせてスピーチを合成する。
図2は、LPC音声エンコーダ106の一例を示す概念ブロック図である。LPC音声エンコーダ106は、LPCモジュール202を含んでいる。それは、スピーチからフォルマントを推定する。基本的な解法は、前のスピーチサンプル(スピーチサンプルの短い項に関連)の一次結合としてフレーム内の各スピーチサンプルを示す微分方程式である。この微分方程式の係数は、フォルマントを特徴付ける。また、これらの係数を計算する様々な方法は、当技術において周知である。LPC係数は、スピーチからフォルマントの効果を取り除く逆フィルタ206に適用されうる。スピーチを受信端において再構築できるように、残りのスピーチは、LPC係数とともに、送信媒体を介して送信される。LPC音声エンコーダ106の少なくとも1つの実施形態では、より良い送信及び数学的操作の効率化のために、LPC係数が、ラインスペクトルペア(LSP)に変換される(204)。
冗長なマテリアルを除去し、スピーチを表すのに必要な情報を動的に低減するために、更なる圧縮技術が使用される。これは、人間の声帯の周期的振動によって引き起こされる一定の基本周波数が存在するという事実を利用することにより達成されうる。これらの基本周波数はしばしば「ピッチ」と称される。ピッチは、(1)スピーチセグメントの自己相関関数を最大にする多くのスピーチサンプルにおける「遅延」と、(2)「適応コードブック利得」とを含む「適応コードブックパラメータ」によって定量化される。適応コードブック利得は、スピーチの長期的な周期性がサブフレームベースでどれだけ強いのかを測定する。この長期的な周期性は、受信端末への送信前に、残りのスピーチから引かれる(210)。
減算器210からの残りのスピーチは、更に、任意の数の方法で符号化されうる。より一般的な方法の1つは、システム設計者によって作成されるコードブック212を用いる。コードブック212は、パラメータを、最も典型的な残りのスピーチ信号へ割り当てるテーブルである。動作では、減算器210からの残りのスピーチが、コードブック212内の全てのエントリと比較される。エントリに対して、最も近い一致を持つパラメータが選択される。固定コードブックパラメータは、「固定コードブック係数」および「固定コードブック利得」を含む。固定コードブック係数は、フレームのための新たな情報(エネルギー)を含む。それは、基本的には、フレーム間の相違の符号化表示である。固定コードブック利得は、スピーチの現在のサブフレームに新たな情報(固定コードブック係数)を適用するために、受信端末104の音声デコーダ108が使用すべき利得を表す。
また、ピッチ推定器208も、「デルタ遅延」あるいは「D遅延」と称される付加的な適応コードブックパラメータを生成するために使用されうる。このD遅延は、現在のフレームと、前のフレームとの間で測定された遅延差である。しかしながら、それは、限定範囲を有しており、2つのフレーム間の遅延差がオーバーフローする場合、0に設定されうる。このパラメータは、スピーチを合成するために受信端末104内の音声デコーダ108によって使用されない。代わりに、それは、喪失したフレーム又は損失したフレームのためのスピーチサンプルのピッチを計算するために使用される。
図3は、図1に示す受信端末104におけるより詳細な概念ブロック図を示す。この構成では、音声デコーダ108は、ジッタバッファ302、フレーム誤り検出器304、フレーム消失キャンセルモジュール306、及びスピーチジェネレータ308を含む。音声デコーダ108は、ボーコーダの一部として、スタンドアロンエンティティとして実現されるか、あるいは、受信端末104内の1又は複数のエンティティにわたって分散される。音声デコーダ108は、ハードウェア、ファームウェア、ソフトウェア、あるいはそれらの任意の組合せとして実現されうる。一例として、音声デコーダ108は、マイクロプロセッサ、デジタルシグナルプロセッサ(DSP)、プログラマブルロジック、専用ハードウェア、又は、その他任意のハードウェア及び/又はソフトウェアベースの処理エンティティで実現されうる。音声デコーダ108は、その機能の観点から以下のように説明される。それが実装される方法は、特定のアプリケーション、および設計全体に課された設計制約に依存するだろう。当業者であれば、これら状況下におけるハードウェア構成、ファームウェア構成、及びソフトウェア構成の相互置換性と、各特定用途のために、説明した機能をどのように最良に実現するかを認識するであろう。
ジッタバッファ302は、音声デコーダ108のフロントエンドに位置しうる。ジッタバッファ302は、ネットワーク混雑、タイミングドリフト、及びルート変更によるパケット到着時における変化によって引き起こされたジッタを除去するハードウェアデバイス又はソフトウェア処理である。ジッタバッファ302は、全てのパケットが、正しい順序でスピーチジェネレータ308へ連続的に提供され、結果として、非常に少ないオーディオ歪みでのクリアな関係になるように、到着パケットを遅延させる。ジッタバッファ302は、固定式あるいは適応式でありうる。固定式ジッタバッファは、パケットに固定遅延を導入する。一方、適応式ジッタバッファは、ネットワーク遅延における変化に適合する。固定式及び適応式の両ジッタバッファは、当該技術において周知である。
図1に関して以前説明したように、例えば、CRC機能、インタリーブ、デジタル変調、及びスペクトル拡散処理を含む畳み込み符号化のような様々な信号処理機能が、送信端末102によって実行される。CRCチェック機能を行なうために、フレーム誤り検出器304が使用されうる。あるいは、又はそれに加えて、2〜3名前を挙げると、チェックサムやパリティビットを含むその他のフレーム誤り検出技術が使用されうる。何れの場合であれ、フレーム誤り検出器304は、フレーム消失が生じたかどうかを判定する。「フレーム消失」は、フレームが喪失したか、あるいは損失したかの何れかを意味する。現在のフレームが消失していないとフレーム誤り検出器304が判定すると、フレーム消失キャンセルモジュール306は、スピーチジェネレータ308に、ジッタバッファ302からのフレーム用の音声パラメータを発行するだろう。一方、フレーム誤り検出器304は、現在のフレームが消失したと判定すると、フレーム消失キャンセルモジュール306へ「フレーム消失フラグ」を与えるだろう。後でより詳細に説明するように、フレーム消失キャンセルモジュール306は、消失したフレームの音声パラメータを再構築するために使用されうる。
ジッタバッファ302から発行されたか、あるいは、フレーム消失キャンセルモジュール306によって再構築された音声パラメータは、スピーチジェネレータ308に提供される。特に、逆コードブック312は、固定コードブック係数を残りのスピーチに変換し、かつ、固定コードブック利得を、その残りのスピーチに適用するために使用される。次に、ピッチ情報が、残りのスピーチに加え戻される(318)。このピッチ情報は、「遅延」から、ピッチデコーダ314によって計算される。ピッチデコーダ314は、本質的には、スピーチサンプルの前のフレームを生成した情報のメモリである。適応コードブック利得は、残りのスピーチへ加えられる318前に、ピッチデコーダ314によって各サブフレーム内のメモリ情報へ加えられる。そして、残りのスピーチは、スピーチにフォルマントを加えるために、逆変換322からのLPC係数を用いてフィルタ320に通される。そして、生の合成スピーチが、スピーチジェネレータ308からポストフィルタ324へ提供されうる。ポストフィルタ324は、スピーチを平滑化し、帯域外成分を低減する傾向があるオーディオ帯域内のデジタルフィルタである。
フレーム消失キャンセル処理の品質は、音声パラメータを再構築する際の精度で改善する。再構築されたスピーチパラメータの精度が高くなることは、フレームのスピーチ内容が高い場合に達成される。これは、フレーム消失キャンセル技術を経た最大の音声品質利得は、音声エンコーダ及び音声デコーダがフルレート(最大スピーチ内容)で動作された場合に得られることを意味する。フレーム消失の音声パラメータを再構築するために、ハーフレートフレームを使用することは、幾つかの音声品質ゲインを提供するが、利得は限定されている。一般に、1/8レートフレームは、どのスピーチ内容も含まず、もって、どの音声品質利得も与えない。従って、音声デコーダ108の少なくとも1つの実施形態では、フレームレートが十分に高い場合に限り、将来のフレームにおける音声パラメータが使用され、音声品質利得が達成される。一例として、音声デコーダ108は、前のフレームと将来のフレームとの両方が、フルレート又はハーフレートで符号化されるのであれば、消失したフレームにおける音声パラメータを再構築するために、前のフレームと将来のフレームとの両方における音声パラメータを使用しうる。そうでない場合には、消失したフレーム内の音声パラメータは、前のフレームからのみ再構築される。音声品質利得の尤度が低い場合、このアプローチは、フレーム消失キャンセル処理の複雑さを低減する。フレーム誤り検出器304からの「レート決定」は、フレーム消失の前のフレームと将来のフレームとのための符号化モードを示すために使用されうる。
図4は、フレーム消失キャンセルモジュール306の動作を例示するフロー図である。フレーム消失キャンセルモジュール306は、ステップ402において動作を開始する。動作は、一般に、ネットワーク上の2つの端末間のコール設定手順の一部として開始される。一旦動作可能になると、フレーム消失キャンセルモジュール306は、音声セグメントの第1のフレームがジッタバッファ302から発行されるまで、ステップ404においてアイドル状態を維持する。第1のフレームが発行されると、フレーム消失キャンセルモジュール306は、ステップ406において、フレーム誤り検出器304からの「フレーム消失フラグ」を監視する。「フレーム消失フラグ」がクリアされるのであれば、フレーム消失キャンセルモジュール306は、ステップ408において、次のフレームを待ち、その後、処理を繰り返す。一方、ステップ406において、「フレーム消失フラグ」が設定された場合には、フレーム消失キャンセルモジュール306は、そのフレームのためのスピーチパラメータを再構築するだろう。
フレーム消失キャンセルモジュール306は、先ず、将来のバッファからの情報が、ジッタバッファ302内において利用可能であるかを判定することによって、そのフレームのためのスピーチパラメータを再構築する。ステップ410では、フレーム消失キャンセルモジュール306は、フレーム誤り検出器304によって生成された「利用可能な将来のフレームのフラグ」を監視することにより、この判定を行う。「利用可能な将来のフレームのフラグ」がクリアされると、フレーム消失キャンセルモジュール306は、ステップ412において、将来のフレーム内の情報の恩恵なしで、前のフレームからスピーチパラメータを再構築しなければならない。一方、「利用可能な将来のフレームのフラグ」が設定されると、フレーム消失キャンセルモジュール306は、前のフレームと将来のフレームとの両方からの情報を用いることにより、増強されたキャンセルを提供しうる。しかしながら、フレームレートが音声品質利得を達成するのに十分に高い場合のみ、この処理は行なわれる。フレーム消失キャンセルモジュール306は、ステップ413において、この判定を行う。何れにせよ、フレーム消失キャンセルモジュール306が一旦現在のフレームのスピーチパラメータを再構築すると、ステップ408において次のフレームを待ち、次に、この処理を繰り返す。
ステップ412では、フレーム消失キャンセルモジュール306は、前のフレームからの情報を用いて、消失したフレームのスピーチパラメータを再構築する。喪失フレームのシーケンスにおける第1のフレーム消失の場合、フレーム消失キャンセルモジュール306は、最後に受信したフレームからの「遅延」とLSPとをコピーして適応コードブック利得を、最後に受信したフレームのサブフレームにわたった平均利得に設定し、固定コードブック利得をゼロに設定する。電力(適応コードブック利得)が低い場合、適応コードブック利得もフェードし、ランダムな要素はLSP及び「遅延」である。
上述したように、将来のフレームからの情報が利用可能であり、かつ、フレームレートが高い場合、改善された誤りキャンセルが達成される。ステップ414では、フレーム消失シーケンスのLSPは、前のフレーム及び将来のフレームから直線的に補間されうる。ステップ416では、将来のフレームからのD遅延を用いて遅延が計算されうる。そして、もしもD遅延が0であれば、遅延は、前のフレーム及び将来のフレームから直線的に補間されうる。ステップ418では、適応コードブック利得が計算されうる。少なくとも2つの異なるアプローチが使用されうる。第1のアプローチは、LSP及び「遅延」と似た方法で適応コードブック利得を計算する。すなわち、適応コードブック利得は、前のフレーム及び将来のフレームから直線的に補間される。もしも「遅延」が既知である場合、すなわち、将来のフレームのD遅延がゼロではなく、現在のフレームの遅延が正確であり、推定されない場合には、第2のアプローチが、適応コードブック利得を高い値に設定する。非常に積極的なアプローチは、適応コードブック利得を1に設定することにより用いられうる。あるいは、適応コードブック利得は、前のフレーム及び将来のフレームの間の補間値と、1との間の何れかに設定されうる。何れの場合であれ、将来のフレームからの情報が利用可能ではないのであれば、経験したほど適応コードブック利得のフェージングはない。将来からの情報を持つことは、消失されたフレームが、何れかのスピーチコンテンツを持つかを消失キャンセルモジュール306に伝えるので、これは単純に可能である(ユーザは、消失フレームの送信直前に通話をやめているかもしれない)。最後に、ステップ420では、固定コードブック利得が0に設定される。
ここで開示された実施形態に関連して記述された様々の説明的論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、アプリケーションに固有の集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)あるいはその他のプログラマブル論理デバイス、ディスクリートゲートあるいはトランジスタロジック、ディスクリートハードウェア部品、又は上述された機能を実現するために設計された上記何れかの組み合わせを用いて実現又は実行されうる。汎用プロセッサとしてマイクロプロセッサを用いることが可能であるが、代わりに、従来技術によるプロセッサ、コントローラ、マイクロコントローラ、あるいは状態機器を用いることも可能である。プロセッサは、たとえばDSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアに接続された1つ以上のマイクロプロセッサ、またはこのような任意の構成である計算デバイスの組み合わせとして実現することも可能である。
ここで開示された実施形態に関連して記述された方法やアルゴリズムは、ハードウェアや、プロセッサによって実行されるソフトウェアモジュールや、これらの組み合わせによって直接的に具現化される。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、あるいは当該技術分野で知られているその他の型式の記憶媒体に収納されうる。記憶媒体は、プロセッサがそこから情報を読み取り、またそこに情報を書き込むことができるようにプロセッサに結合される。または、記憶媒体はプロセッサに統合されうる。
開示された実施形態における上述の記載は、当該技術分野におけるいかなる人であっても、本発明の活用または利用を可能とするように提供される。これらの実施形態への様々な変形例もまた、当該技術分野における熟練者に対しては明らかであって、ここで定義された一般的な原理は、本発明の主旨または範囲を逸脱せずに他の実施形態にも適用されうる。このように、本発明は、ここで示された実施形態に制限されるものではなく、ここで記載された原理と新規の特徴に一致した最も広い範囲に相当するものを意図している。
開示された実施形態における上述の記載は、当該技術分野におけるいかなる人であっても、本発明の活用または利用を可能とするように提供される。これらの実施形態への様々な変形例もまた、当該技術分野における熟練者に対しては明らかであって、ここで定義された一般的な原理は、本発明の主旨または範囲を逸脱せずに他の実施形態にも適用されうる。このように、本発明は、ここで示された実施形態に制限されるものではなく、ここで記載された原理と新規の特徴に一致した最も広い範囲に相当するものを意図している。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[発明1]
それぞれが音声パラメータを有するフレームのシーケンスを受信し、かつ、前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
1又は複数の前のフレームの音声パラメータ、及び1又は複数の後のフレームの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールと
を備えるデコーダ。
[発明2]
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームの1つを含む複数の前記後のフレームからの音声パラメータとから、前記フレーム消失の音声パラメータを再構築するように構成された発明1に記載の音声デコーダ。
[発明3]
前記フレーム消失キャンセルモジュールは、前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームの1つにおける音声パラメータと、前記後のフレームの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された発明1に記載の音声デコーダ。
[発明4]
前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを更に備える発明1に記載の音声デコーダ。
[発明5]
前記ジッタバッファは更に、前記前のフレームの1又は複数からの音声パラメータと、前記後のフレームの1又は複数からの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された発明4に記載の音声デコーダ。
[発明6]
前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える発明1に記載の音声デコーダ。
[発明7]
前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された発明1に記載の音声デコーダ。
[発明8]
前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された発明1に記載の音声デコーダ。
[発明9]
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明8に記載の音声デコーダ。
[発明10]
前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明8に記載の音声デコーダ。
[発明11]
前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームの前記適応コードブック利得を再構築するように構成された発明1に記載の音声デコーダ。
[発明12]
前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された発明1に記載の音声デコーダ。
[発明13]
前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された発明1に記載の音声デコーダ。
[発明14]
それぞれが音声パラメータを有するフレームのシーケンスを受信することと、
少なくとも1つの前のフレームにおける音声パラメータ、及び少なくとも1つの後のフレームからの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと、
前記フレームのシーケンスの音声パラメータからスピーチを生成することと
を備える音声復号方法。
[発明15]
前記フレーム消失の音声パラメータは、前記前のフレームのうちの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームのうちの1つを含む複数の前記後のフレームにおける音声パラメータとから再構築される発明14に記載の方法。
[発明16]
前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値より上にあることを判定することと、
その判定に応じて、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと
を備える発明14に記載の方法。
[発明17]
正確なシーケンスで受信されるように、前記フレームを再調整することを更に備える発明14に記載の方法。
[発明18]
前記フレーム消失を検出することを更に備える発明14に記載の方法。
[発明19]
前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記消失したフレームのラインスペクトルペアは、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって再構築される発明14に記載の方法。
[発明20]
前記後のフレームの1つは、前記消失したフレームに続く次のフレームであり、
前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、前記後のフレームの1つにおける前記差分値が範囲内であるとの判定に応じて、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延が再構築される発明14に記載の方法。
[発明21]
前記後のフレームの1つは、前記消失したフレームに続く次のフレームではなく、前記フレームの各々における音声パラメータは、遅延を含み、前記消失したフレームの遅延は、前記前のフレームの1つの遅延と、前記後のフレームの1つの遅延との間を補間することによって再構築される発明14に記載の方法。
[発明22]
前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記消失したフレームの前記適応コードブック利得は、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより再構築される発明14に記載の方法。
[発明23]
前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得が再構築される発明14に記載の方法。
[発明24]
前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記消失したフレームの音声パラメータは、前記消失したフレームの固定コードブック利得をゼロに設定することによって再構築される発明14に記載の方法。
[発明25]
それぞれが音声パラメータを有するフレームのシーケンスを受信するように構成された音声デコーダであって、
前記音声パラメータからスピーチを生成する手段と、
少なくとも1つの前のフレームにおける音声パラメータと、少なくとも1つの後のフレームにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築する手段と
を備える音声デコーダ。
[発明26]
前記フレームを前記スピーチ生成手段へ正確なシーケンスで提供する手段を更に備える発明25に記載の音声デコーダ。
[発明27]
受信機と、
それぞれが音声パラメータを有するフレームのシーケンスを前記受信機から受信するように構成された音声デコーダであって、
前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
1又は複数の前のフレームの音声パラメータと、1又は複数の後のフレームの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールとを備える音声デコーダとを備える通信端末。
[発明28]
前記フレーム消失キャンセルモジュールは、前記前のフレームのうちの1つと、前記後のフレームのうちの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームのうちの1つにおける音声パラメータと、前記後のフレームのうちの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された発明27に記載の通信端末。
[発明29]
前記音声デコーダは更に、前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを備える発明27に記載の通信端末。
[発明30]
前記ジッタバッファは更に、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された発明29に記載の通信端末。
[発明31]
前記音声デコーダは、前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える発明27に記載の通信端末。
[発明32]
前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された発明27に記載の通信端末。
[発明33]
前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された発明27に記載の通信端末。
[発明34]
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明33に記載の通信端末。
[発明35]
前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明33に記載の通信端末。
[発明36]
前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームのための前記適応コードブック利得を再構築するように構成された発明27に記載の通信端末。
[発明37]
前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された発明27に記載の通信端末。
[発明38]
前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された発明27に記載の通信端末。

Claims (38)

  1. それぞれが音声パラメータを有するフレームのシーケンスを受信し、かつ、前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
    1又は複数の前のフレームの音声パラメータ、及び1又は複数の後のフレームの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールと
    を備えるデコーダ。
  2. 前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームの1つを含む複数の前記後のフレームからの音声パラメータとから、前記フレーム消失の音声パラメータを再構築するように構成された請求項1に記載の音声デコーダ。
  3. 前記フレーム消失キャンセルモジュールは、前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームの1つにおける音声パラメータと、前記後のフレームの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された請求項1に記載の音声デコーダ。
  4. 前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを更に備える請求項1に記載の音声デコーダ。
  5. 前記ジッタバッファは更に、前記前のフレームの1又は複数からの音声パラメータと、前記後のフレームの1又は複数からの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された請求項4に記載の音声デコーダ。
  6. 前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える請求項1に記載の音声デコーダ。
  7. 前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
    前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された請求項1に記載の音声デコーダ。
  8. 前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
    前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された請求項1に記載の音声デコーダ。
  9. 前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項8に記載の音声デコーダ。
  10. 前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項8に記載の音声デコーダ。
  11. 前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
    前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームの前記適応コードブック利得を再構築するように構成された請求項1に記載の音声デコーダ。
  12. 前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
    フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された請求項1に記載の音声デコーダ。
  13. 前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
    前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された請求項1に記載の音声デコーダ。
  14. それぞれが音声パラメータを有するフレームのシーケンスを受信することと、
    少なくとも1つの前のフレームにおける音声パラメータ、及び少なくとも1つの後のフレームからの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと、
    前記フレームのシーケンスの音声パラメータからスピーチを生成することと
    を備える音声復号方法。
  15. 前記フレーム消失の音声パラメータは、前記前のフレームのうちの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームのうちの1つを含む複数の前記後のフレームにおける音声パラメータとから再構築される請求項14に記載の方法。
  16. 前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値より上にあることを判定することと、
    その判定に応じて、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと
    を備える請求項14に記載の方法。
  17. 正確なシーケンスで受信されるように、前記フレームを再調整することを更に備える請求項14に記載の方法。
  18. 前記フレーム消失を検出することを更に備える請求項14に記載の方法。
  19. 前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
    前記消失したフレームのラインスペクトルペアは、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって再構築される請求項14に記載の方法。
  20. 前記後のフレームの1つは、前記消失したフレームに続く次のフレームであり、
    前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、前記後のフレームの1つにおける前記差分値が範囲内であるとの判定に応じて、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延が再構築される請求項14に記載の方法。
  21. 前記後のフレームの1つは、前記消失したフレームに続く次のフレームではなく、前記フレームの各々における音声パラメータは、遅延を含み、前記消失したフレームの遅延は、前記前のフレームの1つの遅延と、前記後のフレームの1つの遅延との間を補間することによって再構築される請求項14に記載の方法。
  22. 前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
    前記消失したフレームの前記適応コードブック利得は、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより再構築される請求項14に記載の方法。
  23. 前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
    前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得が再構築される請求項14に記載の方法。
  24. 前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
    前記消失したフレームの音声パラメータは、前記消失したフレームの固定コードブック利得をゼロに設定することによって再構築される請求項14に記載の方法。
  25. それぞれが音声パラメータを有するフレームのシーケンスを受信するように構成された音声デコーダであって、
    前記音声パラメータからスピーチを生成する手段と、
    少なくとも1つの前のフレームにおける音声パラメータと、少なくとも1つの後のフレームにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築する手段と
    を備える音声デコーダ。
  26. 前記フレームを前記スピーチ生成手段へ正確なシーケンスで提供する手段を更に備える請求項25に記載の音声デコーダ。
  27. 受信機と、
    それぞれが音声パラメータを有するフレームのシーケンスを前記受信機から受信するように構成された音声デコーダであって、
    前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
    1又は複数の前のフレームの音声パラメータと、1又は複数の後のフレームの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールとを備える音声デコーダとを備える通信端末。
  28. 前記フレーム消失キャンセルモジュールは、前記前のフレームのうちの1つと、前記後のフレームのうちの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームのうちの1つにおける音声パラメータと、前記後のフレームのうちの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された請求項27に記載の通信端末。
  29. 前記音声デコーダは更に、前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを備える請求項27に記載の通信端末。
  30. 前記ジッタバッファは更に、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された請求項29に記載の通信端末。
  31. 前記音声デコーダは、前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える請求項27に記載の通信端末。
  32. 前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
    前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された請求項27に記載の通信端末。
  33. 前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
    前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された請求項27に記載の通信端末。
  34. 前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項33に記載の通信端末。
  35. 前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項33に記載の通信端末。
  36. 前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
    前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームのための前記適応コードブック利得を再構築するように構成された請求項27に記載の通信端末。
  37. 前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
    前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された請求項27に記載の通信端末。
  38. 前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
    前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された請求項27に記載の通信端末。
JP2011270440A 2005-01-31 2011-12-09 音声通信におけるフレーム消失キャンセル Active JP5362808B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/047,884 2005-01-31
US11/047,884 US7519535B2 (en) 2005-01-31 2005-01-31 Frame erasure concealment in voice communications

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007553348A Division JP2008529423A (ja) 2005-01-31 2006-01-30 音声通信におけるフレーム消失キャンセル

Publications (2)

Publication Number Publication Date
JP2012098740A true JP2012098740A (ja) 2012-05-24
JP5362808B2 JP5362808B2 (ja) 2013-12-11

Family

ID=36217009

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007553348A Withdrawn JP2008529423A (ja) 2005-01-31 2006-01-30 音声通信におけるフレーム消失キャンセル
JP2011270440A Active JP5362808B2 (ja) 2005-01-31 2011-12-09 音声通信におけるフレーム消失キャンセル

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007553348A Withdrawn JP2008529423A (ja) 2005-01-31 2006-01-30 音声通信におけるフレーム消失キャンセル

Country Status (8)

Country Link
US (1) US7519535B2 (ja)
EP (1) EP1859440A1 (ja)
JP (2) JP2008529423A (ja)
KR (1) KR100956522B1 (ja)
CN (1) CN101147190B (ja)
MY (1) MY144724A (ja)
TW (1) TW200703234A (ja)
WO (1) WO2006083826A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
US7395202B2 (en) * 2005-06-09 2008-07-01 Motorola, Inc. Method and apparatus to facilitate vocoder erasure processing
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
CN101207468B (zh) * 2006-12-19 2010-07-21 华为技术有限公司 丢帧隐藏方法、系统和装置
EP2112653A4 (en) * 2007-05-24 2013-09-11 Panasonic Corp AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT
CN101321033B (zh) * 2007-06-10 2011-08-10 华为技术有限公司 帧补偿方法及系统
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR100899810B1 (ko) 2007-12-17 2009-05-27 한국전자통신연구원 가변대역 멀티코덱을 위한 고정 지연 발생 장치 및 그 방법
US8428938B2 (en) 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
WO2011065741A2 (ko) * 2009-11-24 2011-06-03 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8428959B2 (en) * 2010-01-29 2013-04-23 Polycom, Inc. Audio packet loss concealment by transform interpolation
PL2676265T3 (pl) 2011-02-14 2019-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do kodowania sygnału audio z stosowaniem zrównanej części antycypacji
PL2676264T3 (pl) 2011-02-14 2015-06-30 Fraunhofer Ges Forschung Koder audio estymujący szum tła podczas faz aktywnych
KR101551046B1 (ko) * 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
US9026434B2 (en) 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
JP6037184B2 (ja) * 2012-09-28 2016-12-07 国立研究開発法人産業技術総合研究所 多孔質媒体を利用したアッセイ装置
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
US9672833B2 (en) * 2014-02-28 2017-06-06 Google Inc. Sinusoidal interpolation across missing data
US10157620B2 (en) 2014-03-04 2018-12-18 Interactive Intelligence Group, Inc. System and method to correct for packet loss in automatic speech recognition systems utilizing linear interpolation
EP2922054A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
CN107369455B (zh) 2014-03-21 2020-12-15 华为技术有限公司 语音频码流的解码方法及装置
US10217466B2 (en) * 2017-04-26 2019-02-26 Cisco Technology, Inc. Voice data compensation with machine learning
WO2019000178A1 (zh) * 2017-06-26 2019-01-03 华为技术有限公司 一种丢帧补偿方法及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01248200A (ja) * 1988-03-30 1989-10-03 Toshiba Corp 音声復号化装置
JPH02282299A (ja) * 1989-04-24 1990-11-19 Matsushita Electric Ind Co Ltd 音声復号化装置
JPH0588697A (ja) * 1991-09-26 1993-04-09 Kokusai Denshin Denwa Co Ltd <Kdd> 欠落音声補間方式
JPH07311597A (ja) * 1994-03-14 1995-11-28 At & T Corp 音声信号合成方法
JPH07325594A (ja) * 1994-03-14 1995-12-12 At & T Corp 復号器において使用されるパラメータ信号アダプタの動作方法
JPH08227300A (ja) * 1994-10-14 1996-09-03 At & T Corp 符号化システムの性能を改善する方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04149600A (ja) * 1990-10-12 1992-05-22 Fujitsu Ltd 音声復号化方式
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
US6205130B1 (en) * 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
JPH10336147A (ja) * 1997-06-03 1998-12-18 Oki Electric Ind Co Ltd Cdma送受信装置および送信レート可変方法
JP2000081898A (ja) * 1998-09-03 2000-03-21 Denso Corp ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置
WO2000063885A1 (en) 1999-04-19 2000-10-26 At & T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US7027989B1 (en) * 1999-12-17 2006-04-11 Nortel Networks Limited Method and apparatus for transmitting real-time data in multi-access systems
GB2360178B (en) * 2000-03-06 2004-04-14 Mitel Corp Sub-packet insertion for packet loss compensation in Voice Over IP networks
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
JP2002162998A (ja) * 2000-11-28 2002-06-07 Fujitsu Ltd パケット修復処理を伴なう音声符号化方法
US6564580B2 (en) 2001-06-29 2003-05-20 Exxonmobil Upstream Research Company Process for recovering ethane and heavier hydrocarbons from methane-rich pressurized liquid mixture
EP1433164B1 (en) 2001-08-17 2007-11-14 Broadcom Corporation Improved frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
JP3722366B2 (ja) * 2002-02-22 2005-11-30 日本電信電話株式会社 パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JP4331928B2 (ja) * 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
JP2005077889A (ja) * 2003-09-02 2005-03-24 Kazuhiro Kondo 音声パケット欠落補間方式

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01248200A (ja) * 1988-03-30 1989-10-03 Toshiba Corp 音声復号化装置
JPH02282299A (ja) * 1989-04-24 1990-11-19 Matsushita Electric Ind Co Ltd 音声復号化装置
JPH0588697A (ja) * 1991-09-26 1993-04-09 Kokusai Denshin Denwa Co Ltd <Kdd> 欠落音声補間方式
JPH07311597A (ja) * 1994-03-14 1995-11-28 At & T Corp 音声信号合成方法
JPH07325594A (ja) * 1994-03-14 1995-12-12 At & T Corp 復号器において使用されるパラメータ信号アダプタの動作方法
JPH08227300A (ja) * 1994-10-14 1996-09-03 At & T Corp 符号化システムの性能を改善する方法

Also Published As

Publication number Publication date
MY144724A (en) 2011-10-31
US20060173687A1 (en) 2006-08-03
CN101147190A (zh) 2008-03-19
US7519535B2 (en) 2009-04-14
CN101147190B (zh) 2012-02-29
KR20070099055A (ko) 2007-10-08
WO2006083826A1 (en) 2006-08-10
JP5362808B2 (ja) 2013-12-11
JP2008529423A (ja) 2008-07-31
KR100956522B1 (ko) 2010-05-07
EP1859440A1 (en) 2007-11-28
TW200703234A (en) 2007-01-16

Similar Documents

Publication Publication Date Title
JP5362808B2 (ja) 音声通信におけるフレーム消失キャンセル
JP5405659B2 (ja) 消去されたスピーチフレームを再構成するためのシステムおよび方法
TWI464734B (zh) 用於在一語音訊框內避免資訊流失的系統與方法
KR101009561B1 (ko) 패킷 손실 은폐를 위한 피치 예측
US20070150262A1 (en) Sound packet transmitting method, sound packet transmitting apparatus, sound packet transmitting program, and recording medium in which that program has been recorded
WO2007143953A1 (fr) Dispositif et procédé pour dissimulation de trames perdues
Sanneck et al. Speech-property-based FEC for Internet telephony applications
US8996389B2 (en) Artifact reduction in time compression
US10614818B2 (en) Apparatus and method for generating an error concealment signal using individual replacement LPC representations for individual codebook information
CN1302513A (zh) 用于发送多媒体信号的传输系统
Ogunfunmi et al. Speech over VoIP networks: Advanced signal processing and system implementation
Johansson et al. Bandwidth efficient AMR operation for VoIP
JP3566931B2 (ja) 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
CN1929355B (zh) 语音包丢失恢复系统以及方法
JP4093174B2 (ja) 受信装置および方法
JP4135621B2 (ja) 受信装置および方法
Rodbro et al. Time-scaling of sinusoids for intelligent jitter buffer in packet based telephony
Le Development of a loss-resilient internet speech transmission method
Mertz et al. Voicing controlled frame loss concealment for adaptive multi-rate (AMR) speech frames in voice-over-IP.
JP2016105168A (ja) Adpcmコーデックでのパケット損失隠蔽方法及びplc回路を備えるadpcm復号器
Ho et al. Improved lost frame recovery techniques for ITU-T G. 723.1 speech coding system
JPH10161696A (ja) 音声符号化装置および音声復号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130612

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130904

R150 Certificate of patent or registration of utility model

Ref document number: 5362808

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250