JP4955243B2 - VoIPネットワーク・アプリケーションで遅れて到着するパケットに対応する音声了解度を高める方法および装置 - Google Patents

VoIPネットワーク・アプリケーションで遅れて到着するパケットに対応する音声了解度を高める方法および装置 Download PDF

Info

Publication number
JP4955243B2
JP4955243B2 JP2005271253A JP2005271253A JP4955243B2 JP 4955243 B2 JP4955243 B2 JP 4955243B2 JP 2005271253 A JP2005271253 A JP 2005271253A JP 2005271253 A JP2005271253 A JP 2005271253A JP 4955243 B2 JP4955243 B2 JP 4955243B2
Authority
JP
Japan
Prior art keywords
packet
time
voice packet
given
given voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005271253A
Other languages
English (en)
Other versions
JP2006094499A (ja
Inventor
ジョン ジャニスゼウスキ トーマス
リー ミンキュー
ウィリアム マックゴーワン ジェームズ
チャールズ レッチオーネ マイケル
Original Assignee
アルカテル−ルーセント ユーエスエー インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント ユーエスエー インコーポレーテッド filed Critical アルカテル−ルーセント ユーエスエー インコーポレーテッド
Publication of JP2006094499A publication Critical patent/JP2006094499A/ja
Application granted granted Critical
Publication of JP4955243B2 publication Critical patent/JP4955243B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、一般にパケット・ベースの通信ネットワークに関し、より詳細には一般のVoIP(Voice-Over-Internet-Protocol)や詳細にはワイアレスVoIPなどの電気通信技術向けの、通常再生するには過度に遅れて到着するパケットが存在する場合に音声了解度を高める方法および装置に関する。
北米およびヨーロッパの電気通信産業は、目下CDMAおよびGSMの世界から「3G」(第3世代)のワイアレス技術を発進させる準備をしている。(CDMAおよびGSMは当業者には十分に周知のワイアレス通信標準である。)CDMAサイドでは、CDMA1xEvDO(やはり当業者には周知である)によって、標準モデムの10倍の速さのワイアレス・データ接続が実現できる。しかし、EvDO(Evolution Data OnlyまたはEvolution Data Optimized)という名前が示唆するように、音声トラフィックは依然として3G(第3世代)1xの回線交換チャネルを介して伝送される。当然ながら、次のステップはIP上の音声トラフィックをワイアレス高速パケット・チャネル上で転送することである。
高品質のVoIP(Voice over IP)をワイアレス・パケット・チャネル上で実現するのは前途多難である。通常、IPのオーバーヘッドは、音声ペイロード情報に比べて非常に大きい。典型的な通信ネットワークを通過する典型的なエンド・ツー・エンドの遅延を低減させる必要がある。こうしたエンド・ツー・エンドの遅延を低減させる1つの方式は、復号器におけるジッタ・バッファの再生遅延を最小限に抑えることである。残念ながら、ジッタ・バッファの再生遅延を最小限に抑えることの1つの直接的影響は、パケットが遅れて到着することにより、パケット・ロス率が増加することである。
再生時に1つまたは複数のパケットが受信端に遅れて到着するとき、従来の復号器は、この遅れてきたパケットを単に破棄する。というのも、復号器はパケット・ロス隠蔽(PLC)方式による置換データをすでに提供しているからである。(当業者には周知の通り、PLC方式は、ほとんどの音声復号器により、喪失したパケットに応答して使用されている。こうした方式では、喪失したパケット中で符号化されている音声信号を欠落させることの有害な影響を最小限に抑えようと試みるための様々な技法を使用するが、もっとも一般的には、前のパケットが、場合によっては修正されて、喪失したパケットの代わりに繰り返される、ある種のパケット繰返し方式を使用する。)
しかし、予測ベースの音声符号器とともに使用されるある従来技法では、復号器を再同期させるために遅れてくるパケットを利用することによって、従来型の復号器に比べて何らかの改善が得られてきた。その結果、遅れてくるパケットに起因するエラー(実際にはPLC方式による置換パケットに起因するエラー)が伝搬してしまうことがなくなる。こうした手法で、従来方式での音声品質を著しく改善することができる。しかし、この再同期方式を使用しても、遅れてきたパケットは実際には決して再生されず、それは音声の一部分が無くなることがあることを意味する。これは潜在的な了解度問題に通じることがある。たとえば、単語「spy」から音素「s」を運んでいるパケットが喪失する場合、結果として音声は「スパイ(spy)」ではなく「パイ(pie)」のような音になることがある。
PLC方式だけでは、遅れてくるパケットを使用する復号器の再同期を用いても、こうした問題を是正できそうもない。
本発明の諸原理によれば、通常再生するには過度に遅れて到着するパケットが存在する場合に、たとえば、VoIP(Voice-Over-Internet-Protocol)などの音声のネットワーク通信での音声了解度を高める方法および装置が提供される。具体的には、本発明の原理によれば、遅れてくる音声パケットが音声復号器によって受信されるとき、そのパケット、および必要ならば1つまたは複数の後続の追加パケットは、復号器が符号器に「追いつく」ことができるように標準所要時間よりも短い時間で再生される。さらに、有利にはこれは潜在的に重要などんな音声セグメントをも失うことなく行われる。すなわち、有利には遅れてくるパケットは、音素セグメントが保存され、それによって高い音声品質が維持されるような方式で扱われる。
具体的には、本発明の例示的な諸実施形態では、音声フレームが通常はいくつかのサブ・フレーム(通常は2つまたは3つ)として復号化されることを利用する。したがって、本発明の例示的な一実施形態によれば、有利には連続フレーム間で位相関係を維持しながら、各フレームからの1つのサブ・フレームはスキップされる。たとえば、1つのフレームが2つのサブ・フレームとして復号化される場合、所与の1フレームのうちの1つのサブ・フレームをスキップすると、実際に元の所要時間の半分(たとえば、20ミリ秒のパケットに対して10ミリ秒)に等しい時間で音声が再生される。(これは、パケット全体を2倍の速度で再生して、音声の高さを大幅にひずませることと同じではないことに留意されたい。)一方、1つのフレームが3つのサブ・フレームとして復号化される場合、所与の1フレームのうちの1つのサブ・フレームをスキップすると、実際に所要時間のほんの3分の2の時間で音声が再生される。したがって、1つのフレームが遅れてくる場合、復号器は、有利には多くとも3つのフレーム内で(あるいは、後続の無音セグメントにおいて)符号器と同期する。
図1に、本発明の例示的な一実施形態による、VoIPネットワーク・アプリケーションにおいて遅れて到着するパケットが存在する場合に音声了解度を高めるための方法のブロック図が示してある。図1の例示的な実施形態の復号器は、ジッタ・バッファを周期的に、たとえば、1パケットが20ミリ秒の音声データを含むとすると20msec(ミリ秒)毎に検査する。具体的には、判断ボックス11で、次のパケットが時間内に利用可能かどうかを判断する。利用可能な場合、判断ボックス12で、時間遅れがパケットの長さにエンド・ツー・エンドの遅延を加えたものより小さいかどうかを判断する。小さい場合、処理の流れは、ブロック13に進み、そこでパケットが復号化され、さらにブロック14に進み、そこで復号化されたデータがDAC(D/A変換器)に送られ再生される。したがって、パケットが時間内に到着し続けている場合は、図のブロック13および14の処理が繰り返される。符号器のタイム・スタンプと復号器のタイム・スタンプの間の時間遅れは、有利にはパケットの長さ(この例では20ミリ秒)にエンド・ツー・エンドの遅延を加えたものよりも小さくなるように設定することができる。
次に、パケットnは、喪失したか遅れたために時間内に再生用として利用できない(たとえば、ジッタ・バッファが空である)、と判断ボックス11で判断されたと仮定する。この場合、図1の例示的なアルゴリズムでは、利用できない音声を置換音声データで置き換えるために、パケット・ロス隠蔽アルゴリズムを走らせる(ブロック15)。次いで、次のパケット(すなわちパケットn+1)も再生時間を逃した場合、復号器はパケットが到着するまでパケット・ロス隠蔽アルゴリズム(ブロック15)を使用し続ける。パケット・ロス隠蔽中は、復号器で再生されている音声データのタイム・スタンプは、有利には符号器のタイム・スタンプに比べて先に進まないことに留意されたい。したがって、パケットが喪失するまたは遅れるときは、符号器と復号器の間で時間遅れが生じる。新しいパケットが到着するたびに、復号器はタイム・スタンプを検査し、次いで本発明の原理に従って、エンド・ツー・エンドの遅延を一定に保つために、パケットの再生時間を短縮することによって有利には符号器との再同期を試みる。具体的には、この時間遅れが所定の閾値(下記参照)よりも小さいかどうかを判断ボックス16で判断し、小さい場合には、本発明の原理に従って(図のブロック17に示すように)所要時間の修正を実施する。時間遅れが閾値よりも大きい場合には、このパケットは(図のブロック18に示すように)完全にスキップされる。
より具体的には、復号器が現サイクルの終わりに検査するときにジッタ・バッファ中に利用可能なパケットがある場合は、有利には復号器は1つのパケットを取り出し、この新しいパケットが、遅れて到着したパケットnなのか、それともパケットnをスキップしてパケットn+1なのかを判断する。この新しいパケットが実際にパケットn+1である場合には、パケットnは恐らく喪失したと仮定することができ、したがって復号器はパケットn+1を復号化する。一方、この新しいパケットが遅れてきたパケットnである場合には、この遅れてきたパケットnも復号化され、次のパケットn+1に進む前に再生される。(従来技術のシステムにおけるこのシナリオでは、符号器に遅れずについていくために、遅れてきたパケットnは破棄され、復号器は次のパケットn+1に進む。すなわち、パケットnは決して再生されない。このように、復号器と符号器は同期したままであるが、パケットn中の音声データは破棄される。)
しかし、復号器を符号器と同期させるために、遅れてきたパケットnは、本発明の原理に従って、有利には元のパケットの長さよりも短い所要時間で再生される。さらに、追加の未来のフレームも(復号器を同期させるのに必要な場合)実際より短い所要時間で再生することができる。具体的には、時間短縮されるこのようなパケットの数は、選択されている所要時間修正率に依存する。たとえば、フレームnが遅れて到着し、標準の所要時間の3分の2の時間で再生された場合、パケットn+2が再生された後に符号器と同期するために、フレームn+1およびn+2も、有利にはその標準の所要時間の3分の2の時間で再生される。(本発明の他の例示的な実施形態によれば、遅れてくるパケットが続き、遅延バジェットが許容する場合は、このパケットを通常の時間コースで再生することができ、したがって実際により多くのジッタを受け入れることができるように決定することができる。)
明らかに、復号器は無期限にフレームを待つことはできない。したがって、パケットは遅れているのか、それとも実際には喪失していると見なすべきなのかを判断するために有利には所定の制限時間が設けられる。(前記の判断ボックス16で使用される時間閾値の説明を参照。)たとえば、有利にはこの所定の制限時間を2つまたは3つのパケットの長さ(通常40〜60ミリ秒)に等しくなるように設定することができる。次いで、この閾値(すなわち制限時間)より遅く到着するどんなパケットも、本発明の例示的な一実施形態によれば、復号器の内部状態を更新するために使用することができるが、有利には普通ならこれらのパケットは再生されずに(図のブロック18に示すように)破棄される。(言い換えれば、これらの「過度に遅れてくる」パケットが復号器の内部状態を更新するために実際に使用される場合は、有利にはそこからのどんな復号器出力も破棄される。)
図2には、音声符号器とある音声復号器の間のタイミング・シーケンスの関係の例を示す1組の図が示してある。図中の矢印はパケットが復号器に到着する時点を示している。また矢印の上の番号はフレーム・シーケンスを表している。ネットワークのジッタが原因で、矢印間の時間間隔は通常は等しくないことに留意されたい。
図2(a)には、すべてのパケットが時間内に到着する場合の、符号器および復号器のタイミング・シーケンス図が示してある。具体的には、この図では5つのパケットを示しており、そのすべてが時間内に到着し、ジッタは小さい。すべてのパケットが復号化され、正常に再生される。このタイミング・シーケンス図は、従来技術の復号器および本発明の例示的な一実施形態による復号器の両方に適用される。
図2(b)には、パケットが行方不明になり遅れて受信されない場合の、符号器および復号器のタイミング・シーケンス図が示してある。具体的には、図では、パケットが喪失したとき(パケット2)、パケット・ロス隠蔽アルゴリズムが、その前のパケット(すなわちパケット1)に基づいて置換パケットを生成することによってギャップを埋め(図では1’で表してある)、パケット2をスキップし、次いで(時間内に受信された)パケット3に移る様子を示している。この場合も、このタイミング・シーケンス図は、従来技術の復号器および本発明の例示的な一実施形態による復号器の両方に適用される。
図2(c)には、パケットが遅れて受信される場合の、符号器および従来技術の復号器のタイミング・シーケンス図が示してある。具体的には、従来技術の復号器では、(図中のパケット2の場合のように)パケットが過大なジッタを経験し、その同期を喪失するとき、パケット・ロス隠蔽アルゴリズムは、(図2(b)と同様に)この場合もギャップを埋める。しかし、遅れてきたパケット2は完全に脱落し、あるいは復号器の内部状態を更新するためだけに使用される。次いで、従来技術の復号器は(時間内に受信された)パケット3に移る。しかし、いずれの場合でも、パケット2は決して再生されない。
図2(d)には、パケットが遅れて受信される場合の、符号器および本発明の例示的な一実施形態による例示的な復号器のタイミング・シーケンス図が示してある。すなわち、本発明の例示的な復号器によれば、音声の了解度にとって重要になることがあるどんな音も失わずに(この場合ではパケット4において)復号器が符号器と同期するために、有利には遅れてきたパケット2および(間に合って到着した)パケット3は再生されるが、所要時間は標準よりも短くなる。具体的には、図2(d)において、所要時間が修正されたパケット(すなわちパケット2および3)は例示的に半分の所要時間で再生され、その結果パケット4で同期が達成される。
図2(e)には、いくつかの連続するパケットが遅れて受信され、その遅れてきたパケットのすべてではないがいくつかが再生される場合の、符号器および本発明の例示的な一実施形態による例示的な復号器のタイミング・シーケンス図が示してある。前述の通り、復号器が遅れてくるパケットを無期限に待たないように、有利には最大タイムアウトの閾値が設定される。図2(e)には、この閾値が3つのパケットの長さに等しい時間に設定されている例が示してある。図では、遅れてきたパケット2が、時刻の閾値を過ぎてしまうまで到着しなかったために、最終的には到着したのにスキップされることに留意されたい。さらに、復号器が使用すべきパケットを受信する前に、3つの連続する置換パケット(パケット1’、1’’、および1’’’)が生成されることに留意されたい。具体的には、図にはパケット3、4、5、および6が示してあり、各々の所要時間は、この場合も例示的にその標準所要時間の半分に修正される。
最後に、図2(f)には、2つの連続するパケットが遅れてきて、その次のパケットが行方不明になる場合の、符号器および本発明の例示的な一実施形態による例示的な復号器のタイミング・シーケンス図が示してある。(具体的には、パケット2および3が遅れ、パケット4が行方不明になる。)パケット4が喪失しても、遅れてきたパケットによって、復号器はパケット5においてすでに符号器と同期していることに留意されたい。したがって、パケット4にはパケット・ロス隠蔽の必要はなく、有利には本発明の例示的な復号器はパケット5の再生を続ける。
音声信号の所要時間を修正する方法はいくつかあり、本発明の様々な例示的な実施形態に従って使用することができる。本発明の例示的な一実施形態によれば、周知のピッチ同期波形重畳合成(PSOLA)法を使用することができる。この方法によって、高い音声品質をもたらす技法が得られ、この方法は、所要時間の修正を利用するテキスト音声合成の用途で使用される、もっとも普及している信号処理方法である。
本発明の他の例示的な実施形態によれば、(PSOLA法の使用と比較して)より簡単な代替方法は、復号器で復号され再生されるサブ・フレームの数を単に制御することである。典型的な音声コーデック(符号器/復号器システム)では、音声フレームは復号化されて、(たとえば、周知のG.729音声符号化規格では)2つのサブ・フレームか、または(たとえば、周知のEVRC符号化規格では)3つのサブ・フレームになる。フレームが復号化されて2つのサブ・フレームになる場合、1つのサブ・フレームをスキップすることは、実際には半分の時間間隔で音声を再生することと同じである。この場合、単一のフレームが遅れてくるときは、復号器は、最後のフレームを含む2つのフレームを復号化した後に符号器と同期する。一方、1つのフレームが復号化されて3つのサブ・フレームになる場合、(3つのサブ・フレームから)1つのサブ・フレームをスキップすることは、標準所要時間の3分の2でフレームを再生することと同等である。この場合、単一フレームが遅れてくるときは、復号器は、最後のフレームを含む3つのフレームを復号化した後に符号器と同期する。
前述の説明はすべて、本発明の一般的な原理を単に例示したものに過ぎないことに留意されたい。当業者なら、本明細書ではっきりと説明または図示しなくても、本発明の趣旨および範囲内に含まれ、本発明の原理を実施した他の様々な構成を考案できることが理解されよう。さらに、本明細書で説明したすべての例および条件付きの表現は、主として、本発明の原理および当技術を前進させるために発明者が与えたコンセプトを理解する際に読者の助けとなるような、教育目的のためだけのものであることは明らかであり、具体的に説明されたこうした例および条件への限定がないと解釈すべきである。さらに、本発明の原理、態様、および実施形態、ならびに本発明の具体的な例を説明する本明細書でのすべての記述は、本発明の構造的および機能的な均等物を包含するものである。また、こうした均等物は、現在知られている均等物ならびに将来開発される均等物、すなわち、構造に関係なく同じ機能を実施するどんな開発要素をも含むものである。
したがって、たとえば、どんな流れ図(フロー・チャート、フロー・ダイアグラム)、状態遷移図、擬似コードなども、コンピュータで読取り可能な媒体において実質上表される様々なプロセスであって、コンピュータまたはプロセッサが明示されていてもいなくても、そうしたコンピュータまたはプロセッサによって実行することができる様々なプロセスを表すことが、当業者には理解されよう。したがって、たとえばこうした流れ図で示される各ブロックは、たとえば流れ図のブロックで説明されているような具体的な機能を指定するための手段として特許請求の範囲で明示されることもある物理的な要素を潜在的に表していると理解することができる。さらに、こうした流れ図のブロックは、たとえば、ディスクや半導体記憶装置など前記のコンピュータで読取り可能な媒体中に含まれることがある物理的信号または記憶された物理的データを表していると理解することもできる。
本発明の例示的な一実施形態による、VoIPネットワーク・アプリケーションにおいて遅れて到着するパケットが存在する場合に音声了解度を高めるための方法のブロック図である。 音声符号器とある音声復号器の間のタイミング・シーケンスの関係の例を示す1組の図である。図2(a)は、すべてのパケットが時間内に到着する場合の符号器と復号器のタイミング・シーケンス図である。図2(b)は、1つのパケットが行方不明で、遅れて受信されない場合の符号器と復号器のタイミング・シーケンス図である。図2(c)は、1つのパケットが遅れて受信される場合の符号器と従来技術の復号器のタイミング・シーケンス図である。図2(d)は、1つのパケットが遅れて受信される場合の、符号器と本発明の例示的な一実施形態による例示的な復号器のタイミング・シーケンス図である。図2(e)は、いくつかの連続するパケットが遅れて受信され、この遅れてきたパケットのすべてではないがそのいくつかが再生される場合の、符号器と本発明の例示的な一実施形態による例示的な復号器のタイミング・シーケンス図である。図2(f)は、2つの連続するパケットが遅れ、その次のパケットが行方不明になる場合の、符号器と本発明の例示的な一実施形態による例示的な復号器のタイミング・シーケンス図である。

Claims (10)

  1. パケット・ベースの通信ネットワークを介して、一連の符号化された音声パケットとして受信される音声を再生する方法であって、
    所与の音声パケットが再生のために復号化されなければならない時点より前に、該所与の音声パケットが受信されていないと判断するステップと、
    パケット・ロス隠蔽技法を使用して、該所与の音声パケットを置換音声データで置き換えるステップと、
    該所与の音声パケットの代わりに該置換音声データを再生するステップと、
    該置換音声データの該再生後の時点で、該所与の音声パケットを受信するステップと、
    所要時間修正バージョンを生成するために受信されて置き換えられた該所与の音声パケットを修正するステップであって、該所与の音声パケットの該所要時間修正バージョンが該所与の音声パケットに比べて時間の長さが短縮された音声を含むステップと、
    該所与の音声パケットを置き換えた該置換音声データが再生された後に、該所与の音声パケットの該所要時間修正バージョンを再生するステップとを含む方法。
  2. 請求項1に記載の方法において、
    該所与の音声パケットが再生のために復号化されなければならない時点より前に、該所与の音声パケットが受信されていないと判断する該ステップが、該所与の音声パケットが再生のために復号化されなければならない該時点にジッタ・バッファが空であると判断するステップを含む方法。
  3. 請求項1に記載の方法において、
    該置換音声データが、該一連の符号化された音声パケット中の前の音声パケットに基づいて生成される方法。
  4. 請求項1に記載の方法において、
    該所与の音声パケットの該所要時間修正バージョンが、ピッチ同期波形重畳合成(PSOLA)技法を使用して該所与の音声パケットから生成される方法。
  5. 請求項1に記載の方法において、
    該所与の音声パケットが、複数のサブ・フレームからなる音声フレームを含み、該所与の音声パケットの該所要時間修正バージョンが、該複数のサブ・フレームから、そのうちの1つ又は複数のサブ・フレームを除去することによって、該所与の音声パケットから生成される方法。
  6. 請求項1に記載の方法において、
    該置換音声データの該再生後の時点で受信されている該所与の音声パケットも、該所与の音声パケットが再生のために復号化されなければならない該時点の後、所定の制限時間より前の時点で受信されている、と判断するステップをさらに含む方法。
  7. 請求項1に記載の方法において、
    該一連の音声パケット中の該所与の音声パケットに続く1つ又は複数の音声パケットを受信するステップと、
    対応する所要時間修正バージョンを生成するためにある数の該後続音声パケットを修正するステップであって、該ある数の後続音声パケットの各々の該所要時間修正バージョンが、該対応する後続音声パケットに比べて時間の長さが短縮された音声を含むステップと、
    該所与の音声パケットの該所要時間修正バージョンが再生された後に、該後続音声パケットの該ある数の該所要時間修正バージョンの各々を再生するステップとをさらに含む、請求項1に記載の方法。
  8. 請求項1に記載の方法において、
    パケット・ベースの通信ネットワークを介して、一連の符号化された音声パケットとして受信される音声がVoIPを含む方法。
  9. パケット・ベースの通信ネットワークを介して、一連の符号化された音声パケットとして受信される音声を再生する装置であって、
    所与の音声パケットが再生のために復号化されなければならない時点より前に、該所与の音声パケットが受信されていない、と判断する処理と
    パケット・ロス隠蔽技法を使用して、該所与の音声パケットを置換音声データで置換する処理と
    該所与の音声パケットの代わりに該置換音声データを再生する処理と
    該置換音声データの該再生後の時点で、該所与の音声パケットを受信する処理と
    該所与の音声パケットの所要時間修正バージョンが該所与の音声パケットに比べて時間の長さが短縮された音声を含む該所要時間修正バージョンが生成されるように、受信され置き換えられた該所与の音声パケットを修正する処理と
    該所与の音声パケットを置換した該置換音声データが再生された後に、該所与の音声パケットの該所要時間修正バージョンを再生する処理とを実行するように適合されたプロセッサを含む装置。
  10. 請求項9に記載の装置において、
    該所与の音声パケットが再生のために復号化されなければならない時点より前に、該所与の音声パケットが受信されていない、と判断する処理が、該所与の音声パケットが再生のために復号化されなければならない該時点にジッタ・バッファが空であると判断する処理を含む装置。
JP2005271253A 2004-09-24 2005-09-20 VoIPネットワーク・アプリケーションで遅れて到着するパケットに対応する音声了解度を高める方法および装置 Expired - Fee Related JP4955243B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/948,933 US7783482B2 (en) 2004-09-24 2004-09-24 Method and apparatus for enhancing voice intelligibility in voice-over-IP network applications with late arriving packets
US10/948933 2004-09-24

Publications (2)

Publication Number Publication Date
JP2006094499A JP2006094499A (ja) 2006-04-06
JP4955243B2 true JP4955243B2 (ja) 2012-06-20

Family

ID=36126681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005271253A Expired - Fee Related JP4955243B2 (ja) 2004-09-24 2005-09-20 VoIPネットワーク・アプリケーションで遅れて到着するパケットに対応する音声了解度を高める方法および装置

Country Status (2)

Country Link
US (1) US7783482B2 (ja)
JP (1) JP4955243B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050160858A1 (en) * 2002-07-24 2005-07-28 M 2 Medical A/S Shape memory alloy actuator
US7359979B2 (en) * 2002-09-30 2008-04-15 Avaya Technology Corp. Packet prioritization and associated bandwidth and buffer management techniques for audio over IP
US20040073690A1 (en) 2002-09-30 2004-04-15 Neil Hepworth Voice over IP endpoint call admission
US7978827B1 (en) 2004-06-30 2011-07-12 Avaya Inc. Automatic configuration of call handling based on end-user needs and characteristics
US20070174047A1 (en) * 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
CN101610249A (zh) * 2008-06-18 2009-12-23 鸿富锦精密工业(深圳)有限公司 抖动缓冲器及抖动缓冲方法
US8218751B2 (en) 2008-09-29 2012-07-10 Avaya Inc. Method and apparatus for identifying and eliminating the source of background noise in multi-party teleconferences
US9137051B2 (en) 2010-12-17 2015-09-15 Alcatel Lucent Method and apparatus for reducing rendering latency for audio streaming applications using internet protocol communications networks
US9177570B2 (en) * 2011-04-15 2015-11-03 St-Ericsson Sa Time scaling of audio frames to adapt audio processing to communications network timing
EP3321935B1 (en) 2013-06-21 2019-05-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time scaler, audio decoder, method and a computer program using a quality control
AU2014283320B2 (en) * 2013-06-21 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
US10701124B1 (en) 2018-12-11 2020-06-30 Microsoft Technology Licensing, Llc Handling timestamp inaccuracies for streaming network protocols

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57158247A (en) * 1981-03-24 1982-09-30 Tokuyama Soda Co Ltd Flame retardant polyolefin composition
US4726019A (en) * 1986-02-28 1988-02-16 American Telephone And Telegraph Company, At&T Bell Laboratories Digital encoder and decoder synchronization in the presence of late arriving packets
US6366959B1 (en) * 1997-10-01 2002-04-02 3Com Corporation Method and apparatus for real time communication system buffer size and error correction coding selection
US6744764B1 (en) * 1999-12-16 2004-06-01 Mapletree Networks, Inc. System for and method of recovering temporal alignment of digitally encoded audio data transmitted over digital data networks
US6850496B1 (en) * 2000-06-09 2005-02-01 Cisco Technology, Inc. Virtual conference room for voice conferencing
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
EP1536582B1 (en) * 2001-04-24 2009-02-11 Nokia Corporation Methods for changing the size of a jitter buffer and for time alignment, communications system, receiving end, and transcoder
US7266127B2 (en) * 2002-02-08 2007-09-04 Lucent Technologies Inc. Method and system to compensate for the effects of packet delays on speech quality in a Voice-over IP system
US7324444B1 (en) * 2002-03-05 2008-01-29 The Board Of Trustees Of The Leland Stanford Junior University Adaptive playout scheduling for multimedia communication
US7362770B2 (en) * 2002-09-06 2008-04-22 Lsi Logic Corporation Method and apparatus for using and combining sub-frame processing and adaptive jitter-buffers for improved voice quality in voice-over-packet networks
US7289451B2 (en) * 2002-10-25 2007-10-30 Telefonaktiebolaget Lm Ericsson (Publ) Delay trading between communication links
US7302385B2 (en) * 2003-07-07 2007-11-27 Electronics And Telecommunications Research Institute Speech restoration system and method for concealing packet losses
US7337108B2 (en) * 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
US7424026B2 (en) * 2004-04-28 2008-09-09 Nokia Corporation Method and apparatus providing continuous adaptive control of voice packet buffer at receiver terminal
US7447983B2 (en) * 2005-05-13 2008-11-04 Verizon Services Corp. Systems and methods for decoding forward error correcting codes

Also Published As

Publication number Publication date
JP2006094499A (ja) 2006-04-06
US20060074681A1 (en) 2006-04-06
US7783482B2 (en) 2010-08-24

Similar Documents

Publication Publication Date Title
JP4955243B2 (ja) VoIPネットワーク・アプリケーションで遅れて到着するパケットに対応する音声了解度を高める方法および装置
JP4933605B2 (ja) 適応デジッタバッファの方法及び装置
EP1423930B1 (en) Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
JP2006238445A (ja) 仮想ジッタ・バッファおよび時間スケール修正を使用した、VoiceoverIP通信ネットワークにおいてネットワーク・ジッタを処理する方法および装置
US7394833B2 (en) Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
ES2836220T3 (es) Sistema y procedimiento de recuperación de errores de transmisión de paquetes basada en redundancia
US7830862B2 (en) System and method for modifying speech playout to compensate for transmission delay jitter in a voice over internet protocol (VoIP) network
EP1805919A1 (en) Method and apparatus for managing end-to-end voice over internet protocol media latency
EP1449378B1 (en) System and method for compensating packet delay variations
JP2002185498A (ja) 音声パケットの再生待ち合わせ処理方法,音声パケットの伝送遅延ゆらぎ吸収装置
Lee et al. Enabling Wireless VoIP
LECOMTE et al. Packet loss and concealment
Bäckström et al. Packet Loss and Concealment
EP1892916A1 (en) Method for signal transmission, transmitting apparatus and communication system
JPH05145505A (ja) 音声伝送方法
Bhute et al. Error concealment schemes for speech packet transmission over IP network
JP2009231939A (ja) 音声パケット通信方法および音声パケット通信装置
BR112017001088B1 (pt) Dispositivo e método de recuperação de erro de transmissão de pacote com base em redundância
JPH09270756A (ja) 音声パケット再生方法とその装置
JP2008048060A (ja) 移動無線端末装置
CA2468768A1 (en) System and method for compensating packet delay variations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110208

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110606

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110906

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120315

R150 Certificate of patent or registration of utility model

Ref document number: 4955243

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees