JP5174182B2 - 再生遅延推定 - Google Patents

再生遅延推定 Download PDF

Info

Publication number
JP5174182B2
JP5174182B2 JP2010535913A JP2010535913A JP5174182B2 JP 5174182 B2 JP5174182 B2 JP 5174182B2 JP 2010535913 A JP2010535913 A JP 2010535913A JP 2010535913 A JP2010535913 A JP 2010535913A JP 5174182 B2 JP5174182 B2 JP 5174182B2
Authority
JP
Japan
Prior art keywords
frame
jitter buffer
delay
time
receiving terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010535913A
Other languages
English (en)
Other versions
JP2011505743A (ja
Inventor
ヨナス ルンドベリ,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2011505743A publication Critical patent/JP2011505743A/ja
Application granted granted Critical
Publication of JP5174182B2 publication Critical patent/JP5174182B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/062Synchronisation of signals having the same nominal but fluctuating bit rates, e.g. using buffers
    • H04J3/0632Synchronisation of packets and cells, e.g. transmission of voice via a packet network, circuit emulation service [CES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/90Buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/90Buffering arrangements
    • H04L49/9023Buffering arrangements for implementing a jitter-buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/90Buffering arrangements
    • H04L49/9084Reactions to storage capacity overflow
    • H04L49/9089Reactions to storage capacity overflow replacing packets in a storage arrangement, e.g. pushout
    • H04L49/9094Arrangements for simultaneous transmit and receive, e.g. simultaneous reading/writing from/to the storage element

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephone Function (AREA)

Description

本発明は、受信端末における必要なジッタ・バッファ段数を推定する方法と、受信端末におけるジッタ・バッファ管理の方法、および受信端末に関する。
例えば、IP(インターネット・プロトコル)電話では、音声サンプルを送信端末から受信端末に転送し、接続の待ち時間、即ち遅延により、送信端末と受信端末との間でデータ・パケットを伝送するのに必要とする時間が定まる。パケットは、パケット交換ネットワークのノードでバッファに一時的に蓄積され、バッファでの蓄積時間の変化は遅延における変動となり、これは遅延ジッタといわれる。通常、回線交換ネットワークはジッタを最小とするよう設計されるが、その一方、パケット交換ネットワークは、後続の送信のためバッファにパケットをキューイングすることによりリンク利用を最大とするよう設計され、これは遅延ジッタに加わるであろう。
IPネットワークを介して音声信号を運ぶために使用されるプロトコルは、一般にVoIP(ボイス・オーバ・インターネット・プロトコル)と言われ、単一化されたネットワークが多数のサービスに使用可能となる。着信IP通話は、任意の位置にあるIP電話に自動的に経路指定可能であり、それによってユーザは、旅行中、位置に関係なく同じ電話番号を使用して電話をかけること、および、電話を受けることができる。しかしながら、VoIPは、遅延、パケット損失および上記に述べた遅延ジッタのような欠点を含む。次の音声パケットが到達していなかったため、再生する音声データを再生(プレイアウト)バッファが使い果たす場合、遅延ジッタによりバッファ・アンダーランに至る可能性があるが、ジッタの結果は、通常、受信端末にあるジッタ・バッファによって縮小される。現在のネットワーク条件で決まる或る所与のパケット損失率において全体遅延を最小化するため、全体の遅延時間を一定に保つように、または緩やかに変換するように、パケットの音声サンプルを再生する前に、ジッタ・バッファ、即ちジッタ除去バッファは、可変の余分の遅延を加える。それによって、遅延ジッタによるバッファ・アンダーランの発生は避けられる可能性があるが、全体の遅延は増加するであろう。
用語のIPパケット、即ちパケットは、以下、IPレベルでのデータの単位と定義され、そのデータにはIPペイロードとヘッダとを含む。IPペイロードには、UDPペイロードとUDPヘッダとを含むUDPパケットを含めてもよく、UDPペイロードには、RTPペイロードとRTPヘッダとを含むRTPパケットを含めてもよい。それ故、VoIPでは、各IPパケットに、使用するプロトコル、例えば、IP、UDPおよびRTPからのヘッダのほかに、音声サンプルの一つ以上のグループを含むRTPペイロードを含むであろう。以下、サンプルの各グループを音声フレームと定義する。AMR−NB/WB(順応マルチレート−狭帯域/広帯域)では、各音声フレームは20msの音声サンプルを含み、これは、サンプリング周波数が異なるため、AMR−NBでは160音声サンプルに、AMR−WBでは320音声サンプルに対応する。以下、音声フレームにおけるサンプル数を音声フレーム長と定義する。
AMR−NBのサンプリング周波数を8000と指定する、即ち、音声信号を8000回/秒でサンプルし、各160サンプルを一つに音声フレームにグループ化するので、送信のため毎秒50音声フレームを生成するであろう。もし各パケットで一つの音声フレームのみを送信するなら、パケットは50パケット/秒のパケットレートで送信されるであろうし、もし各パケットに二つの音声フレームを統合するなら、パケットは25パケット/秒のパケットレートで送信されるであろう。
もし各パケットで一つの音声フレームのみを送信するなら、この音声フレームのタイム・スタンプは、受信パケットのためのRTP提示タイム・スタンプに対応し、これはパケットのRTPヘッダで見付けられる。しかしながら、パケットが二つ以上の音声フレームを含むなら、連続した音声フレームのタイム・スタンプは、RTPタイム・スタンプに適当な数の音声フレーム長を加えて計算してもよい。
IPパケットのRTPペイロードにおける伝送のため、音声サンプルはAMR符号器により圧縮され、音声信号を再構成する場合、受信後復号される。全ての音声フレームが符号化されるまでIPパケットの伝送は遅延するであろうから、一つのIPパケットに二つ以上の音声フレームを統合することは、パケット化遅延をもたらすであろう。従って、ひとつのIPパケットで一つの音声フレームのみを送信することは有利である。
それ故、パケット交換の伝送ネットワークは、本質的に送信遅延における変動をもたらし、VoIPのような実時間サービスは、低遅延と中断のない再生の両方を必要とする。上記で説明したように、伝送における遅延変動を補償するよう再生を遅延させるため、通常、受信パケットの音声フレームをジッタ・バッファに蓄積し、もし最高の伝送遅延を有する音声フレームがスケジュールされた再生時間前に到達できるのに十分な長さ音声フレームを遅延させるなら、受信端末は音声信号の適切な再構成を行うことができるであろう。
ジッタは、パケット間時間の歪み、即ち、元の信号送信のパケット間時間と比較した場合の受信パケット間の時間間隔として説明でき、音声フレームの大部分が時間内に到達できるのに十分な長さ再生を遅延させるように、VoIP応用のジッタ除去を設計すべきである。予定の再生時間後に到達する遅れた音声フレームが音声品質を脅かすことがない限り、再生遅延を削減することができるであろう。
図1はIPネットワーク12におけるパケット化音声10の送信を示し、再生バッファ16の前に配置するジッタ・バッファ14を示しているが、もし伝送の遅延変動を補償するよう再生をジッタ・バッファにおいて遅延させるなら、受信端末は信号の正しい再構成を行なうことができるであろう。IPネットワーク12を通じた送信後の遅延変動を、それぞれA、BおよびCに関連するバイト/時間図で図に示す。Aに関連するバイト/時間図は送信音声を示し、Bに関連するバイト/時間図はIPネットワーク12を通して送信じた後の受信した歪のある音声を示し、Cのバイト/時間図は遅延ジッタ・バッファ14の後の音声を示す。それ故、Bに関連するバイト/時間図はIPネットワークを通じた送信によりもたらされる遅延ジッタを示し、Cに関連するバイト/時間図はジッタ・バッファ14でのジッタ補償後の受信音声信号を示す。
音声フレームがジッタ・バッファで費やす時間は実際の送信遅延と現在の再生遅延で決まり、再生遅延を調整するため、標準再生速度より速くかまたは遅く、ジッタ・バッファ内の音声フレームは消費される。VoIPのジッタ・バッファ管理の重要な部分は、到来するジッタの予測に基づき最適な再生遅延を得ようと常に努力するよう、ジッタ・バッファを制御することである。現在のジッタ、同じく過去のジッタ測定の両方に基づくか、または再生遅延が増加するしかないという表示として遅れた音声フレームを使用することにより、そのような予測を行なってもよい。
それ故、VoIP応用のためのジッタを測定する典型的な従来の技術的解決策は、例えば、パケット間隔の測定、即ち、パケット間時間に基づくか、または期待と実際のパケット到達時間の差に基づく。また、もし送信遅延が既知であれば、ジッタを推定することも可能である。
図2a、2bおよび2cでは、一つの音声フレームのみが各パケットに含まれる。図2aは、パケット間時間、即ち、音声フレームの送信前のパケット間隔、即ち、連続する音声フレームの送信の間の時間間隔を示す。もし音声フレームを、例えば20msの時間間隔で送信するなら、音声サンプルの連続ストリームとして音声を送信するので、各音声フレームの音声サンプル、例えば、160サンプルは、20msで送信されるであろう。それ故、パケット間時間21a、21b、21cは送信前は等しく、音声フレームのサンプルの送信時間、即ち、音声フレーム長に対応するであろう。ジッタのため、送信後の実際のパケット間時間は、送信前のパケット間時間と異なる可能性があり、これを図2bと2cに示す。
図2bでは、送信後の実際のパケット間時間(パケット間隔)、即ち、連続するパケット/音声フレームの到達の間の時間間隔を、22a、22bおよび22cで表示する。
図2cでは、連続するパケット/音声フレームの期待する到達時間と実際の到達時間との間の差を23a、23bおよび23cで表示する。
従来は、実際のパケット間隔、即ち、パケット間時間に基づき、または期待する到達時間に基づき、ジッタを計算することができる。
パケット間時間に基づいて計算したジッタは到達間時間ジッタと称してもよく、以下、期待パケット間時間に比較して、送信後の実際のパケット間時間22a、22b、22cと定義するが、期待パケット間時間は送信前のパケット間時間21a、21b、21cおよび音声フレーム長24に対応するものである。もっと具体的には、到達間時間ジッタ(ジッタ[k、k-1])は、サンプルの番号で表現して、次のアルゴリズムにより定義してもよい:
ジッタ[k、k-1]=(到達時間[k]−到達時間[k−1])×サンプリング周波数−音声フレーム長×各パケットの音声フレーム数。
上記のアルゴリズムでは、次におけるのと同様に、“k”インデックスは、受信したシーケンスにおけるパケットを参照する。もし一つのパケットが一つの音声フレームのみを含むなら、期待パケット間時間は音声フレーム長24に対応し、最小ジッタは決してこれより少ないことはないであろう。20m秒に対応して、一つのパケットに160サンプルを含む音声フレーム一つのみを備えるAMR−NB(順応マルチレート−狭帯域)では、上記のアルゴリズムから計算されるように、最小ジッタは音声フレーム長、例えば、-160サンプルに対応するであろう。ゼロ以下の値を有するジッタは、パケットが余りにも早く到達したことを意味し、最小ジッタは、パケットを、その前に送信されたパケットと同じ時間に受信した時に起こるであろう。もし160サンプルに対応する20msの間隔でパケットを送信するなら、パケットをその前に送信されたパケットと同じ時間に受信する場合に最小ジッタは起こり、もしパケットが一つの音声フレームのみを含むのであれば、その最小ジッタは−160サンプルあろう。
パケットの期待到達時間に基づいて計算されるジッタは、期待到達時間を見付け出すため、サンプル数で表現した、パケットのRTP提示タイム・スタンプと一緒に固定基準点を使用できる。
最初のパケットがその基準であれば、そのジッタ(ジッタ[k、k-1])は、次のアルゴリズムに従って表わしてもよく、サンプル数で表わしたジッタは:
ジッタ[k、1]=(到達時間[k]−到達時間[1])×サンプリング周波数−(タイム・スタンプ[k]−タイム・スタンプ[1])。
或いは、従来のジッタ測定は既知の送信遅延を使用してもよく、受信器が最大と最小の送信遅延の間の差として再生遅延を推定する。しかしながら、もし送信遅延が既知である場合のみ、この方法をのみ使用できる。
ジッタ測定のためにパケット間時間を使用する上記で説明した従来の方法、即ち、到達間時間ジッタの測定は、実行するのは容易であるが、使用するのは困難である。或るレベルの遅延音声フレーム、即ち、例えば、0.5%を越えない或る損失率を維持することを希望するVoIPクライアントは、測定したジッタを、バッファで必要な数の音声フレームに定量化することができなければならず、それは到達間時間ジッタでは不可能である。メディア・パケットをある周期で符号化する限り、いかなるメディア固有情報も用いずにIP/UDP(インターネット・プロトコル/ユーザ・データグラム・プロトコル)レベルで到達間時間ジッタを測定できる。実際、信号の異なるセグメントは異なって符号化され、従って、RTPタイム・スタンプを使用しなければならない。
更に、従来のジッタ測定方法は固定基準点を使用することができ、各パケットに対してジッタを測定することにより、あるレベルの遅延パケット、即ち損失率を達成する再生遅延を見付け出すことができるであろう。しかしながら、セッションの間に基準点を変更するなら、固定基準点は、全ての古いジッタ測定の再計算を必要とし、ジッタを再計算するため、前に受信したパケットからのデータを受信器で蓄積しておかなければならない。
更に、送信器および受信器が、符号化/復号化手順のサンプリング周波数を制御するため、異なるクロックを使用し、これらのクロックがお互いに同期していないため、局部クロック周波数における小さな差、即ち、クロック・スキューが時間とともに累積し、ジッタ・バッファのシステム的なオーバランまたはアンダーランをもたらす可能性がある。もし最近受信したパケットと基準として使用したパケットとの間の時間差が余りにも大きいなら、クロック・スキューは再生遅延の不正確な推定の原因となるリスクがある。ジッタを推定するこの方法を使用して、再生遅延をどのように変更するかを決定するためジッタ測定の確率分布関数を使用できるので、ジッタ・バッファ測定には、再生遅延をジッタ・バッファで必要な数の音声フレームに定量化する必要がない。しかしながら、より小さい遅延が、再生遅延を縮小するというように統計上の効果を持つまでには幾らかの時間を必要とするため、減少する遅延に適応する場合にはこの方法は余りにも遅い可能性がある。
それ故、上記で説明した、ジッタを推定する従来の方法は、様々な欠点を持つ。
本発明の目的は、上記で概要を説明した問題に取り組むことであり、添付の独立した特許請求項に従う、受信端末における方法によりおよび受信端末により、さらに従属特許請求項に従う実施形態により、この目的およびその他は達成される。
第一の側面により、本発明は、最低の送信遅延で送信した、最速の音声フレームである以前の受信音声フレームを検索するステップと、前記検索した最速の以前の受信音声フレームに関連する蓄積データを使用して、前記受信音声フレームのために推定必要再生遅延を計算するステップと、前記推定必要再生遅延を要求ジッタ・バッファ段数に変換するステップとにより、IPパケットの受信音声フレームのために、要求ジッタ・バッファ段数を推定する受信端末における方法を提供する。
第二の側面により、本発明は、本発明の第一の側面に従って、IPパケットを受信した場合に各音声フレームのために要求ジッタ・バッファ段数を推定することにより、ジッタ・バッファ管理の受信端末における方法を提供する。
第三の側面により、本発明は、ジッタ・バッファ、再生・ユニット、およびIPパケットの受信音声フレームのために要求ジッタ・バッファ段数を推定する装置を備える受信端末を提供する。前記装置には、最低の送信遅延で送信した最速の音声フレームである前の受信音声フレームを検索する手段と、前記検索した最速の以前の受信音声フレームに関連する蓄積データを使用して、前記受信音声フレームのために推定必要再生遅延を計算する手段と、前記計算した推定必要再生遅延を必要ジッタ・バッファ段数に変換する手段とを備える。
実際の送信遅延に関する知識なしに必要ジッタ・バッファ・サイズを推定できることは、本発明の利点である。更に、本発明は、ある損失率、即ち、遅れた音声フレーム率を達成ため、ジッタ・バッファで必要な音声フレームの要求数について、正確で信頼のある推定を可能とし、送信器と受信器との間のクロック・スキューはその推定に小さな影響を持つのみであろう。加えて、低い複雑度とメモリ必要条件であるため、本発明を移動端末に容易に導入できる。
以下の添付図面を参照して、ここで本発明について更に詳細に説明する。
IPネットワークを介して、音声パケットをジッタ・バッファおよび受信端末(図示せず)の再生・ユニットに如何に転送するかを示すブロック図である。 送信の前および後のパケット間時間を示す。 本発明の実施形態による、ジッタ・バッファ管理の方法を概略的に示すフロー図である 前に受信したインデックス0、1、2および3を有する4個の前の受信音声フレームの送信遅延を示すが、より大きな差[i]は、より低い送信遅延、即ち、より早い音声フレームを表示している。 ジッタ・バッファから音声フレームを受信する再生・ユニットを示す。 本発明による、受信音声フレームのための要求ジッタ・バッファ段数を推定する方法の第一の実施形態を示すフロー図である。 図6の方法の更なる実施形態を示すフロー図である。 推定方法の更なる実施形態による、到達時間または最も速い前の音声フレームと再生時間との間の関係を示す。 音声フレームの到達時間と、最も早い再生時間と、マージンとの間の関係を示す。 n個の音声フレームを含むRTPパケットを示す。 本発明による、ジッタ・バッファ、再生・ユニットおよびジッタ・バッファ管理ユニットを備える受信端末を示すブロック図である。 本発明によるジッタ・バッファ段数推定を備えるジッタ・バッファ管理を示すフロー図である。 典型的ジッタ・バッファ管理を示すヒストグラムである。
以下の説明では、本発明の完全な理解を提供するため、特別なアーキテクチャおよびステップのシーケンスのような特定の詳細について説明する。しかしながら、当業者には明らかなことであるが、これらの特定の詳細から離れる可能性のあるその他の実施形態において、本発明を実行してもよい。
更に、明らかなことであるが、プログラムされたマイクロプロセッサまたは汎用目的のコンピュータと連動するソフトウエア機能を使用して、および特定用途向け集積回路を使用して、またはその両方を使用して、説明する機能を実装できる可能性がある。また、方法の形式で本発明を説明する場合、コンピュータ・プログラム製品で、同じくコンピュータ・プロセッサとメモリを備えるシステムで、本発明を実装できる可能性があり、メモリは、説明した機能を実行できる可能性のある一つ以上のプログラムで符号化されている。
本明細書で次の略語を以下で使用する。
VoIP:ボイス・オーバ・インターネット・プロトコル
IP/UDP:インターネット・プロトコル/ユーザ・データグラム・プロトコル
AMR−NB:順応マルチレート−狭帯域
PSTN:公衆交換電話ネットワーク
RTP:実時間伝送プロトコル
IMS:インターネット・プロトコル・マルチメディア・サブシステム。
加えて、以下では次の定義を使用する。
arrival_time[i]:音声フレーム“i”の到達時間(サンプル数で表現され、サンプリング周波数に応じて決まるタイムスタンプ)。
arrival_time_sec[i]:音声フレーム“i”の到達時間(秒)
earliest_play−out_time[i]:音声フレームが再生される可能性のある最も早い時点。これを計算するためには、進行中の再生および再生周期を考慮しなければならない。
audio frame_length:音声フレーム長、サンプル数で表示され、サンプリング周波数に応じて決まる。
max_audio frame_in_buffer:最後に受信した音声フレームのための再生遅延(再生遅延[0])を処理するのに要する、ジッタ・バッファ内の音声フレームの最大数。ジッタ・バッファ内の音声フレームの数は、音声フレームを抽出する直前に計数する。
max_index:最小の送信遅延を有する音声フレーム、即ち、最速音声フレームのインデックス。
play−out_delay[i]:音声フレーム“i”に対する再生遅延。
play−out_period:音声バッファからデータを取ってくる周期(タイムスタンプ)であり、実際の実装により決まる。
play−out_time[i]:音声フレーム“i”に対する再生時間。
play−out_timestamp[last_played_audio frame]:最後に再生した音声フレームに対するRTPタイム・スタンプ。
sample_freq:音声サンプルのサンプリング周波数。
time_stamp[i]:音声フレーム“i”に対するRTPタイム・スタンプ。
本発明の基本的概念は、パケット交換ネットワークにおける受信音声フレームの変動する送信遅延、即ち、ジッタを処理するのに必要な最小再生遅延の推定に関し、最小再生遅延は、ジッタ・バッファにおける必要な音声フレーム数、即ち、必要なジッタ・バッファ段数として表わされる。
図3は、本発明による、前記ジッタ・バッファ段数推定を含む典型的ジッタ・バッファ管理を示すフロー図である。ステップ31で、ネットワーク・インタフェースから配信されたメディア・パケットが受信端末に到達する。ステップ32で、RTPペイロードをパケット分解し、各フレームに関連するデータ、即ち、到達時間およびRTPタイム・スタンプと一緒に、全ての受信音声フレームをジッタ・バッファに蓄積する。もしRTPパケットで複数の音声フレームを配信するなら、音声フレーム長に見合った数をRTPタイム・スタンプに追加することにより、各音声フレームのタイム・スタンプを計算する。更に、複数の音声フレームの場合、ステップ33で、n個の音声フレームを有するパケットの各音声フレームに対して、例えば、次のアルゴリズムによるサンプル数で表現した、新規の調整到達時間[j]を計算することにより、パケット化遅延を排除するために調整を行なうのが望ましい。
Adusted_arrival_time[j]=arrival_time[j]−(time_stamp[n]−time_stamp[j])、
ここでj=1からnであり、1はパケットにおける最初の音声フレームを示し、nは最後の音声フレームを示す。
次のステップ34−37は受信パケットの各音声フレームに対して繰り返される。ステップ34で、受信端末に蓄積した情報を使用して、受信音声フレームに対して必要なジッタ・バッファ段数を推定し、ステップ35で、ジッタ・バッファ管理に推定ジッタ・バッファ段数を利用できるようにする。ステップ36で、次の推定のために必要な情報を蓄積し、ステップ37で、パケットが更に音声フレームを含まないかどうかを決定する。もしそうでなければ、受信パケットの全ての音声フレームに対して推定を実行し終わるまで、ステップ34−37を繰り返す。
しかしながら、本発明は、ジッタ・バッファ管理のための完全な方法に第一に向けるのでなく、ジッタ・バッファ管理の重要な部分である要求ジッタ・バッファ段数に変換した再生遅延の推定のみに向ける。それ故、本発明の核心部は、図3のステップ34と36に対応し、これらのステップについて以下でもっと完全に説明するであろう。
もし受信IPパケットに二つ以上の音声フレームを含むなら、前記アルゴリズムにおける到達時間は、パケット化遅延を排除するため、上記のアルゴリズムによって計算した新規の調整到達時間に以下では対応してもよい。
図3のステップ34で、望ましくは最大40個の音声フレームまで、前の受信音声フレームからの蓄積情報を使用して、現在の音声フレーム、即ち、最後の受信音声フレームに対して再生遅延を推定する。ステップ34の最初の部分には、受信音声フレームについての情報を蓄積するリストを検討し、各音声フレームの到達時間をその提示時間と比較することにより、前に受信し蓄積した音声フレームの中で、最小の送信遅延(max_index)を持つ音声フレームのインデックスを見つけ出すことを含む。最小の送信遅延を有する前の受信音声フレームは最速の音声フレームであり、従って、ジッタ・バッファでより多くの時間を費やすであろう。最後の受信音声フレームと最速の音声フレームとの間の比較を行なうことを可能とするためには、例えば、秒で与えられる到達時間を、その到達時間にサンプリング周波数を乗算して、サンプル数に変換することにより、同じ時間単位を使用しなければならない。その結果、到達時間と提示時間は両方ともRTPタイム・スタンプの単位を使用しているので、比較可能である。インデックス“i”はデータストレージにおける音声フレームのインデックスを表わし、音声フレームのインデックスの範囲は、例えば、0と40の間である。インデックス“i”=0は、最後の受信音声フレーム、即ち、再生遅延を計算した音声フレームでもある現在の音声フレームを表わす。最初は、40個の音声フレームを受信してしまうまで、殆んどの音声フレームを使用してはならない。
図4は、0から3の番号を付与した4個の音声フレームに対する提示時間のタイム・スタンプと音声フレームの到達時間および差diff[i]を示す。音声フレーム0は最後の受信音声フレームであり、次のアルゴリズムにより、サンプル数で表わした到達時間arrival_time[i]が定義される。
arrival_time[i]=arrival_time_sec[i]×sample_freq。
タイム・スタンプまたは到達時間のどちらかから一定値を加算/減算して、i=0から40に対してtime_stamp[i]>arrival_time[i]ということを保証しなければならない。その差diff[i]は次のアルゴリズムで計算できる。
diff[i]=time_stamp[i]−arrival_time[i]。
その結果、最小の送信遅延を有する音声フレーム、即ち、最速音声フレームに対するインデックスは、蓄積データから検索でき、max_indexはi=0から40に対してdiff[i]を最大にするインデックスである。図4では、max_indexは3に対応し、最速音声フレームを表わす。
次のステップは、基準点として最低の送信遅延を有する音声フレーム、即ち、最速音声フレームを使用して、最後の受信音声フレーム、即ち、現在の音声フレームに対して、サンプルで表わした再生遅延を計算することである。もし最後の受信音声フレームを直ちに再生するなら、計算した再生遅延に従い、最低の送信遅延を有する音声フレームをジッタ・バッファにより遅延させるべきである。図3のステップ34で、例えば、最後の受信音声フレームと最速の音声フレームとの間の到達時間差を決定することにより、そして前記到達時間差と、前記最後の受信音声フレームと最速の音声フレームとの間のタイム・スタンプ差との間の差を決定することにより、最後の受信音声フレームに対するサンプルの再生遅延、play−out_delay[0]を推定する。それは、次のアルゴリズムで表わすことができ、サンプル数で表現される。
play−out_delay[0]=(arrival_time[0]−arrival_time[max_index])−(time_stamp[0]−time_stamp[max_index])。
本発明により、サンプルの推定再生遅延は、推定再生遅延に対応するジッタ・バッファで必要な音声フレームの数、max_audio frame_in_buffer、即ち、要求ジッタ・バッファ段数で定量化される。例えば、次のアルゴリズムに従い、サンプルの推定再生遅延と音声フレームのサンプル数との間の関係を決定することにより、これを実行しても良い。
max_audio frame_in_buffer=1+ceil(play−out_delay[0]/audio frame_length)。
ceil(x)は無限大に向かって最も近い整数にxを丸める、即ち、もし再生遅延が161サンプルであり、audio frame_lengthが160サンプルであれば、ceil(161/160)は2となり、そうでなければ音声フレームはジッタ・バッファに収容されないであろう。ジッタ・バッファにおける音声フレームの数は、音声フレームを抽出する直前に計数されるので、max_audio frame_in_bufferを計算する場合に、数1(1つ)を加算しなければならない。
この推定を行なうことを可能とするため、前の受信音声フレームに関する情報が利用可能でなければならない。この情報を図3のステップ36で蓄積し、その情報には、最後の受信音声フレームに関するデータ、例えば、到達時間、RTP(実時間伝送プロトコル)タイム・スタンプを含み、音声フレーム長に適した数を、RTPパケット・タイム・スタンプとRTPシーケンス番号とに加算することにより、二つ以上の音声フレーム含むパケットの各音声フレームに対して計算してもよい。また、その情報には、現在の再生状態に関するデータ、最後にプレイした音声フレームのための再生時間および最後にプレイした音声フレームのためのRTPタイム・スタンプを含み、もっと正確な推定を獲得する、本発明の更なる実施形態に従い、再生遅延を推定するために、これらを使用することができるであろう。
図6は、本発明の基本的概念、即ち、上記に説明した図3のステップ34に対応して、受信音声フレームのための必要なジッタ・バッファ段数を如何に推定するかを示すフロー図である。図6のステップ61で、蓄積情報を使用して、最低の送信遅延を有する前の受信音声フレーム、即ち、最速音声フレームを検索する。ステップ62で、受信音声フレームと前記検索した最速音声フレームのデータ、例えば、上記で説明した前記音声フレームの到達時間とタイム・スタンプを使用して、受信音声フレームの再生遅延を計算する。ステップ63で、再生遅延を、ジッタ・バッファで必要な音声フレームの数を示す、必要なジッタ・バッファ段数に変換して推定再生遅延を提供する。この変換は、例えば、サンプルでの推定再生遅延と受信音声フレームのサンプル数との間の関係を決定することにより、上記で説明したように実行してもよい。
図5で、ジッタ・バッファ(図示せず)を、音声バッファ52と音声変換器54とを備える再生ユニット50に接続する。受信端末のジッタ・バッファは、通常、再生ユニット50の音声バッファ52に接続される。音声変換器54は、定期的に音声バッファ52からサンプルを取ってくる。この周期をplay−out_periodとして指定する。もし音声バッファが空であれば、ジッタ・バッファから音声フレームを取ってきて、復号し、音声バッファに蓄積し、例えば、20msの再生周期で、ここから音声変換器54がデータを取ってきてもよい。音声フレームをサンプル数で表現した長さはコーデックに依存し、audio frame_lengthで指定されなければならないが、AMR−NB(順応マルチレート−狭帯域)音声フレーム長は、20m秒に対応して160サンプルである。
本発明によれば、再生遅延はサンプルで推定され、ジッタ・バッファ管理のために適応される、音声フレーム数で表わされる必要なジッタ・バッファ段数に変換される。本発明の更なる実施形態によれば、現在の再生状態はまた、再生遅延の推定において、または必要なバッファ段数への再生遅延の変換において考慮される。
図7は、再生遅延が如何に計算され、ケース1、ケース2およびケース3が表示するように、異なる再生状態に依存して定量化されるかを示す。
ステップ75で、ケース1によって計算した再生遅延は、再生が進行しないか、ステップ70で決定される必要な遅延より最大20m秒大きい予測再生遅延で受け入れ可能な場合の再生状態に関する。ケース1によれば、音声フレーム[0]のためのサンプルの再生遅延、即ち、play−out_delay[0]は、例えば、上記でも説明した次のアルゴリズムにより計算する。
play−out_delay[0]=(arrival_time[0]−arrival_time[max_index])−(time_stamp[0]−time_stamp[max_index])。
従って、この推定再生遅延は、例えば、上記でも説明した次のアルゴリズムにより、ジッタ・バッファで必要な音声フレームの最大数、max_audio frame_in_buffer、即ち必要なバッファ段数で定量化されてもよい。
max_audio frame_in_buffer=1+ceil(play−out_delay[0]/audio frame_length)
ceil(x)は無限大に向かって最も近い整数にxを丸める。ジッタ・バッファにおける音声フレーム数は、音声フレームを抽出直前に計数するので、max_audio frame_in_bufferを計算する場合に、数1(1つ)を加えなければならない。
ステップ74で、ケース2によって計算した再生遅延は、ステップ73で決定したように、最速の音声フレーム、音声フレーム[max_index]が到達する場合で、しかし現在の音声フレーム、音声フレーム[0]が到達しない場合で、再生が進行する場合のような再生状態に関する。サンプル数で表わした音声フレーム[0]の再生遅延は、例えば、次のアルゴリズムで計算される。
play−out_delay[0]=(arrival_time[0]−earliest_play−out_time[max_index]−(time_stamp[0]−time_stamp[max_index])。
earliest_play−out_time[max_index]はデータをジッタ・バッファから取ってくる時に依存する。図8aは、80a、80b、80cおよび80dで表示する時間例において再生のためにジッタ・バッファから取ってきたデータを示し、再生周期81は例えば、20m秒であってもよい。最速の音声フレームに対する到達時間、arrival_time[max_index]は82で表示され、その最速の音声フレームに対する最も早い再生時間、earliest_play−out_time[max_index]は、80bで表示する時間例に対応する。それ故、図8aは、arrival_time[max_index]と再生時間との間の関係を示し、arrival_time[max_index]82とearliest_play−out_time[max_index]80bとの間の最大距離は、play−out_period81より短いであろう。
従って、推定再生遅延は、ケース1で使用する同じアルゴリズムにより、ジッタ・バッファで要求される音声フレームの最大数、即ち、必要バッファ段数で定量化されてもよい。
max_audio frame_in_buffer=1+ceil(play−out_delay[0]/audio frame_length)。
ステップ72で、ケース3により計算する再生遅延は、ステップ71で決定するように、現在および最速の前の音声フレーム、即ち、音声フレーム[0]と音声フレーム[max_index]が到達する両方の場合の、再生が進行する場合に関する。ケース3によれば、上記で説明したケース2と同じようにしてplay−out_delay[0]を計算するが、必要なジッタ・バッファ段数にplay−out_delay[0]を変換する前にマージンを計算する。本マージンを図8bに示すが、サンプル数で表わした次のアルゴリズムにより計算してもよい。
マージン=ceil(play−out_delay[0]/audio frame_length)×audio frame_length−play−out_delay[0]。
図8bは、最後の(現在の)音声フレームの到達時間、即ち、83で表示したarrival_time[0]と、前記音声フレームの最も早い再生、即ち、80bで表示した前記音声フレームのearliest_play−out_timeとの間の関係と、前記マージン84とを示す。サンプルで表わした推定再生遅延を、ジッタ・バッファで必要な音声フレーム数、即ち、バッファ段数に変換する。もし現在の音声フレームの最も早い再生時間80bが前記マージン84以内に起こるなら、即ち、もしearliest_play−out_time[0]<(arrival_time[0]+マージン)なら、次のアルゴリズムによりジッタ・バッファ段数を計算してもよい。
max_audio_frame_in_buffer=1+floor(play−out_delay[0]/audio frame_length)、
ここでfloor(x)はマイナス無限大に向かって最も近い整数にxを丸める。
しかしながら、もし現在の音声フレームの最も早い再生時間80bがマージン84以内にないなら、即ち、もしearliest_play−out_time[0]≧(arrival_time[0]+マージン)なら、次のアルゴリズムに従ってジッタ・バッファ段数を計算してもよい。
max_audio_frame_in_buffer=1+ceil(play−out_delay[0]/audio frame_length)、
ここでceil(x)は、無限大に向かって最も近い整数にxを丸める。ジッタ・バッファにおける音声フレーム数は、音声フレームを抽出直前に計数するので、上記のアルゴリズムに従って、max_audio frame_in_bufferを計算する場合に、数1(1つ)を加えなければならない。
それ故、上記に説明したように、再生遅延推定は、受信音声フレーム到達時間とRTPタイム・スタンプを使用する。もし各受信IPパケットに多重音声フレームを含むなら、各受信音声フレームに対して、1つの余分の音声フレーム長をRTPパケット・タイム・スタンプに加算することにより、各フレームのタイム・スタンプを計算する。
更に、もし音声フレーム集合が、同じRTPパケットに多重音声フレームを配信することを表示するなら、パケットを送信できる前にパケットの最後の音声フレームを符号化してしまうまで、パケットの第一の音声フレームは待たなければならない。これはパケット化遅延と呼称され、望ましくは、再生遅延推定に影響を与えるべきではない。従って、本発明によるジッタ・バッファ管理の方法の更なる実施形態に従い、パケット化遅延を排除するよう、最後の受信パケットの音声フレームの到達時間を調整する。この調整を図3のステップ33に示し、本図に関連して上記で説明する。図3に関連して前に説明した次のアルゴリズムにより、n個の音声フレームを有するパケットに対する新規の調整到達時間、adjusted_arrival_time[j]を計算してもよい。
adjusted_arrival_time[j]=arrival_time[j]−(time_stamp[n]−time_stamp[j])、
ここでj=1からnであり、1はパケットにおける最初の音声フレームを表わし、nは最後の音声フレームを表わす。
図9は、n個の音声会話音声フレーム94を含むRTPパケット92を示す。二つ以上の音声フレーム94を含むパケット92で、上記で説明したように、音声フレーム長に適した(サンプル数での)数をパケット92のRTPヘッダのRTP提示タイム・スタンプに加算することにより、連続した各音声フレームのタイム・スタンプを計算してもよい。
図10は本発明による受信端末101の典型的実施形態を示す。受信端末は、典型的には、例えばIP電話のようなユーザ端末であるが、代わりに受信端末は、例えばIPネットワークとPSTN(公衆交換電話ネットワーク)との間のゲートウエイのような、IPパケットを受信するよう構成した任意のクライアント端末であってもよい。受信端末には、ジッタ・バッファ103と再生ユニット104が提供され、同じく、本発明による要求ジッタ・バッファ段数を推定するための装置105を備える、ジッタ・バッファ・マネージャ102が提供される。この装置105には、前に受信した最速の音声フレームを検索する手段106と、受信音声フレームのために、サンプルで推定再生遅延を計算するために手段107と、推定再生遅延に対応するために、ジッタ・バッファの必要なサイズに前記推定再生遅延を変換する手段108とを備える。
好ましい実施形態によれば、最後の受信音声フレームと最速音声フレームとの間の到達時間差を決定するよう、また更に、前記到達時間差と、最後の受信音声フレームと最速音声フレームとの間のタイム・スタンプ差との差異を決定するよう、推定再生遅延を計算するための前記手段107を構成する。好ましくは、推定再生遅延のサンプル数と音声フレームのサンプル数との間の関係を決定するよう、推定再生遅延をジッタ・バッファの必要なサイズに変換するための前記手段108を構成する。
本発明のその他の実施形態によれば、もし少なくとも最速の音声フレームが到達する時に再生が進行するなら、最後の受信音声フレームと最速音声フレームとの間の到達時間差としての代わりに、最後の受信音声フレームの到達時間と最速音声フレームの最も早い再生時間との間の差として、計算するための前記手段107が前記到達時間差異を決定するであろうというように、再生状態を考慮するよう、推定再生遅延を計算するための手段107および推定再生遅延をジッタ・バッファ・サイズに変換するための手段108を構成する。
望ましくは、ジッタ・バッファ・マネージャ102にはまた、例えば、時間スケーリング技術により、すなわち音声フレームを廃棄することまたは繰り返すことにより、再生速度を適応させる適応ユニット109を提供する。
図11は、本発明のよるジッタ・バッファ段数推定を備えるジッタ・バッファ管理の典型的な方法を示す。図11のステップ110で、ネットワークからパケットを受信する。ステップ112で、本発明により、各受信音声フレームのために、ジッタ・バッファで必要な音声フレーム数を推定する。ステップ113で、これらの推定のヒストグラムを生成するが、そのヒストグラムを図12に示す。
図12に、ジッタ・バッファの推定必要サイズをx軸に示し、このバッファ・サイズを要求する音声フレーム数をy軸に示す。ヒストグラムの各棒は会話音声フレームを表わし、より後ろの音声フレームはより大きなジッタ・バッファを要求する。図11に示すように、この典型的なジッタ・バッファ管理により、バッファで必要とする音声フレーム数を見付け出すため本ヒストグラムを使用し、ステップ114で、遅延した音声フレームのある率、即ち、損失率を達成するが、低損失率は、ジッタ・バッファのより大きなサイズを必要とする。全ての音声フレームで割算した遅延音声フレーム数として、損失率をヒストグラムに示す。ステップ115で、ジッタ・バッファの音声フレームの最大数、即ち、ジッタ・バッファ段数が、ヒストグラムにおける斜線で表わす値に対応するよう、ジッタ・バッファを制御する。
本発明は、例えば、3GPP TS 26.114で指定するIMS電話の最低限の性能必要条件を満たすジッタ・バッファ管理のために簡略化すること、および、VoIPクライアントで本発明を実装することにより、品質と遅延の間の良好なトレードオフを確保することという幾つかの利点を持つ。更に、本発明は、実際の送信遅延についての知識を全く持たずにジッタ・バッファを管理する手段を提供し、同じく、ある損失率、即ち、遅れた音声フレーム速度を達成するため、ジッタ・バッファで必要な音声フレームの要求数について正確で信頼性できる推定を可能とする。送信器と受信器との間のクロック・スキューは、推定に小さな影響を持つのみであり、本発明の更なる実施形態によれば、最小のサイズを見付け出すためにジッタ・バッファ・サイズを推定する場合、クライアントの再生状態を考慮する。加えて、低い複雑度とメモリ必要条件のため、移動端末に本発明を容易に導入できる。
無線システムの共通な特性は高い固有の遅延であるため、VoIPに対するエンド・ツー・エンド遅延必要条件は、アクセス技術の関係なく同じであり、無線システムは、ジッタ削減を実行するため、有線システムより、より少ない時間を持つ。本発明を使用することにより、ジッタ・バッファにおける再生遅延を最小にすることができる。
本発明について、特別な典型的実施形態を参照して説明したが、本説明は、一般的に、本発明の概念を示すことを意図するのみであり、本発明の範囲を制限するものとして受け取るべきではない。

Claims (23)

  1. 受信端末における、IPネットワークのうちの受信音声フレームのために必要ジッタ・バッファ段数を推定する方法であって、
    受信音声フレームの各々の到達時間とタイム・スタンプとを蓄積データとして蓄積するステップと、
    各受信音声フレームについて、前記蓄積データを用いて、当該受信音声フレーム以前の受信音声フレームのから最低の送信遅延で送信されたフレームのインデックスを見出すことにより、最速の以前の受信音声フレームを検索するステップ(61)と、
    前記受信音声フレームおよび検索された前記最速の以前の受信音声フレームに関連する蓄積データを使用して、前記受信音声フレームの推定した必要な再生遅延を計算するステップ(62)と、
    前記推定した必要な再生遅延を必要なジッタ・バッファ段数に変換するステップ(63)と
    を有することを特徴とする方法。
  2. 推定した必要な再生遅延を計算するステップ(62)には、前記受信音声フレームと前記最速の以前の受信音声フレームとの間の到達時間差の決定を含むことを特徴とする請求項1に記載の方法。
  3. 推定した必要な再生遅延を計算する前記ステップには、前記到達時間差と、前記受信音声フレームと前記最速の以前の受信音声フレームとの間のタイム・スタンプ差との間の差の決定を更に含む
    ことを特徴とする請求項2に記載の方法。
  4. 前記推定した必要な再生遅延を必要なジッタ・バッファ段数に変換するステップには、推定再生遅延のサンプル数と前記受信音声フレームのサンプル数との間の関係の決定を含むことを特徴とする請求項1乃至3のいずれか一項に記載の方法。
  5. 前記受信音声フレーム各々のために、1個の追加音声フレーム長をRTPパケット・タイム・スタンプに加算することにより、複数の音声フレームを含むパケットの音声フレームのタイム・スタンプを計算することを特徴とする請求項に記載の方法。
  6. 少なくとも前記最速の以前の受信音声フレームが到達したとき、再生が進行していたなら、前記受信音声フレームの到達時間と前記最速の以前の受信音声フレームの最も早い再生時間との間の差として、前記推定した必要な再生遅延を計算する前記ステップにおいて前記到達時間差を決定することを特徴とする請求項2又は3に記載の方法。
  7. 計算された前記推定した必要な再生遅延の必要なジッタ・バッファ段数への変換において、現在の再生状態を考慮することを特徴とする請求項1乃至のいずれか一項に記載の方法。
  8. 受信端末におけるジッタ・バッファ管理の方法であって、
    IPパケットを受信するとき、請求項1乃至7のいずれか一項に記載の方法に従って各音声フレームに対して必要ジッタ・バッファ段数を推定することを特徴とする受信端末におけるジッタ・バッファ管理の方法。
  9. パケット化遅延の影響を排除するため、必要なジッタ・バッファ段数を推定する前に、パケット分解したひとつのIPパケットに含まれた複数の音声フレーム各々の到達時間を調整するステップを更に含むことを特徴とする請求項に記載の、受信端末におけるジッタ・バッファ管理の方法。
  10. 前記受信音声フレームのために推定した必要なジッタ・バッファ段数を示すヒストグラムを生成するステップを更に含むことを特徴とする請求項またはに記載の、受信端末におけるジッタ・バッファ管理の方法。
  11. ある音声フレーム損失率を達成するため、ヒストグラムを使用してジッタ・バッファ段数を制御するステップを更に含むことを特徴とする請求項10に記載の、受信端末におけるジッタ・バッファ管理の方法。
  12. ジッタ・バッファ(103)と再生・ユニット(50、104)とを備える受信端末(101)であって、
    IPパケットのうちの受信音声フレームのために必要ジッタ・バッファ段数を推定する装置(105)を備えることを特徴とし、
    前記ジッタ・バッファ段数推定装置(105)には、
    前記受信音声フレーム各々の到達時間とタイム・スタンプとを蓄積データとして蓄積するステップと、
    各受信音声フレームについて、前記蓄積データを用いて、当該受信音声フレーム以前の受信音声フレームのから最低の送信遅延で送信したフレームのインデックスを見出すことにより、最速の以前の受信音声フレームを検索する手段(106)と、
    前記受信音声フレームおよび検索した前記最速の以前の受信音声フレームに関連する蓄積データを使用して、前記受信音声フレームの推定した必要な再生遅延を計算する手段(107)と、
    前記計算した推定した必要な再生遅延を必要なバッファ段数に変換する手段(108)とを備えることを特徴とする受信端末。
  13. 再生・ユニット(50)には音声バッファ(52)と音声変換器(54)とを備え、
    所定の再生周期で音声バッファからデータを取ってくるよう、音声変換器を構成したことを特徴とする請求項12に記載の受信端末。
  14. 前記受信音声フレームと検索した前記最速の以前の受信音声フレームとの間の到達時間差を決定するよう、前記推定した必要な再生遅延を計算する手段(107)を構成することを特徴とする請求項12または13に記載の受信端末。
  15. 前記到達時間差と、前記受信音声フレームと検索された前記最速の以前の受信音声フレームとの間のタイム・スタンプ差との間の差を決定するよう、前記推定した必要な再生遅延を計算する手段(107)を更に構成したことを特徴とする請求項14に記載の受信端末。
  16. 推定した必要な再生遅延のサンプル数と前記受信音声フレームのサンプル数との間の関係を決定するよう、前記推定した必要な再生遅延を必要なジッタ・バッファ段数に変換する手段(108)を構成したことを特徴とする請求項12乃至15のいずれか一項に記載の受信端末。
  17. 少なくとも前記最速の受信音声フレームが到達したとき、再生が進行していたなら、受信音声フレームの到達時間と前記最速の以前の受信音声フレームの最も早い再生時間との間の差として、前記到達時間差を決定することを特徴とする請求項14又は15に記載の受信端末。
  18. 計算した前記再生遅延を必要なジッタ・バッファ段数に変換する場合に現在の再生状態を考慮するよう、前記変換の手段(108)を構成したことを特徴とする請求項12乃至17のいずれか一項に記載の受信端末。
  19. ジッタ・バッファ管理の手段(102)を更に備え、該手段(102)には、前記ジッタ・バッファ段数推定装置を備えることを特徴とする請求項12乃至18のいずれか一項に記載の受信端末。
  20. 前記ジッタ・バッファ管理の手段(102)には、再生速度を適応させる適応ユニット(109)を更に備えることを特徴とする請求項19に記載の受信端末。
  21. パケット化遅延の影響を排除するため、必要なジッタ・バッファ段数を推定する前に、パケット分解されたひとつのIPパケットに含まれた複数の音声フレーム各々の到達時間を調整するよう、ジッタ・バッファ管理の手段(102)を構成したことを特徴とする請求項19または20に記載の受信端末。
  22. 前記受信音声フレームのために推定な必要ジッタ・バッファ段数を示すヒストグラムを生成するよう、前記ジッタ・バッファ管理の手段を更に構成したことを特徴とする請求項19乃至21のいずれか一項に記載の受信端末。
  23. ある音声フレーム損失率を達成するため、ヒストグラムを使用してジッタ・バッファ段数を制御するよう、前記ジッタ・バッファ管理の手段を更に構成したことを特徴とする請求項19乃至22のいずれか一項に記載の受信端末。
JP2010535913A 2007-11-30 2008-09-09 再生遅延推定 Active JP5174182B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US99133607P 2007-11-30 2007-11-30
US60/991,336 2007-11-30
PCT/SE2008/051003 WO2009070093A1 (en) 2007-11-30 2008-09-09 Play-out delay estimation

Publications (2)

Publication Number Publication Date
JP2011505743A JP2011505743A (ja) 2011-02-24
JP5174182B2 true JP5174182B2 (ja) 2013-04-03

Family

ID=40678825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010535913A Active JP5174182B2 (ja) 2007-11-30 2008-09-09 再生遅延推定

Country Status (6)

Country Link
US (1) US20100290454A1 (ja)
EP (1) EP2215785A4 (ja)
JP (1) JP5174182B2 (ja)
AU (1) AU2008330261B2 (ja)
BR (1) BRPI0819456A2 (ja)
WO (1) WO2009070093A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4975672B2 (ja) * 2008-03-27 2012-07-11 京セラ株式会社 無線通信装置
CN102792658B (zh) * 2009-12-29 2016-03-16 意大利电信股份公司 在通信网络中进行时间测量
KR101399604B1 (ko) * 2010-09-30 2014-05-28 한국전자통신연구원 지터버퍼 조정장치, 전자장치 및 그 방법
WO2012074442A1 (en) * 2010-11-30 2012-06-07 Telefonaktiebolaget Lm Ericsson (Publ) Method for determining an aggregation scheme in a wireless network.
IN2014KN00967A (ja) * 2011-10-07 2015-10-09 Ericsson Telefon Ab L M
CN103888381A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 用于控制抖动缓冲器的装置和方法
KR101953613B1 (ko) 2013-06-21 2019-03-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램
AU2014283256B2 (en) 2013-06-21 2017-09-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control
CN103594103B (zh) * 2013-11-15 2017-04-05 腾讯科技(成都)有限公司 音频处理方法及相关装置
CN105099795A (zh) * 2014-04-15 2015-11-25 杜比实验室特许公司 抖动缓冲器水平估计
WO2016050328A1 (en) * 2014-09-30 2016-04-07 Telefonaktiebolaget L M Ericsson (Publ) Managing jitter buffer depth
EP3357197B1 (en) * 2015-09-29 2019-07-24 Dolby Laboratories Licensing Corporation Method and system for handling heterogeneous jitter
US10735508B2 (en) * 2016-04-04 2020-08-04 Roku, Inc. Streaming synchronized media content to separate devices
US10686897B2 (en) 2016-06-27 2020-06-16 Sennheiser Electronic Gmbh & Co. Kg Method and system for transmission and low-latency real-time output and/or processing of an audio data stream
EP3386218B1 (en) * 2017-04-03 2021-03-10 Nxp B.V. Range determining module
US11062722B2 (en) 2018-01-05 2021-07-13 Summit Wireless Technologies, Inc. Stream adaptation for latency
CN114097010B (zh) * 2019-07-18 2023-12-12 三菱电机株式会社 信息处理装置、计算机能读取的记录介质和信息处理方法
CN111787268B (zh) * 2020-07-01 2022-04-22 广州视源电子科技股份有限公司 音频信号的处理方法、装置、电子设备及存储介质
DE102021117762B3 (de) 2021-07-09 2022-08-18 Dfs Deutsche Flugsicherung Gmbh Verfahren zur Jitter-Kompensation bei einem Empfangen von Sprachinhalt über IP basierte Netzwerke und Empfänger hierfür sowie Verfahren und Vorrichtung zum Senden und Empfangen von Sprachinhalt mit Jitter-Kompensation

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6212206B1 (en) * 1998-03-05 2001-04-03 3Com Corporation Methods and computer executable instructions for improving communications in a packet switching network
US6259677B1 (en) * 1998-09-30 2001-07-10 Cisco Technology, Inc. Clock synchronization and dynamic jitter management for voice over IP and real-time data
US6452950B1 (en) * 1999-01-14 2002-09-17 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive jitter buffering
US6865162B1 (en) * 2000-12-06 2005-03-08 Cisco Technology, Inc. Elimination of clipping associated with VAD-directed silence suppression
US7110422B1 (en) * 2002-01-29 2006-09-19 At&T Corporation Method and apparatus for managing voice call quality over packet networks
GB2392062A (en) * 2002-05-24 2004-02-18 Zarlink Semiconductor Ltd Method of organising data packets in a buffer
US7936672B2 (en) * 2002-10-09 2011-05-03 Juniper Networks, Inc. System and method for buffer management in a packet-based network
JP4462996B2 (ja) * 2004-04-27 2010-05-12 富士通株式会社 パケット受信方法及びパケット受信装置
CN1926824B (zh) * 2004-05-26 2011-07-13 日本电信电话株式会社 声音分组再现方法、声音分组再现装置
US7746847B2 (en) * 2005-09-20 2010-06-29 Intel Corporation Jitter buffer management in a packet-based network
US7590139B2 (en) * 2005-12-19 2009-09-15 Teknovus, Inc. Method and apparatus for accommodating TDM traffic in an ethernet passive optical network

Also Published As

Publication number Publication date
BRPI0819456A2 (pt) 2015-05-05
JP2011505743A (ja) 2011-02-24
EP2215785A4 (en) 2016-12-07
AU2008330261A1 (en) 2009-06-04
AU2008330261B2 (en) 2012-05-17
EP2215785A1 (en) 2010-08-11
WO2009070093A1 (en) 2009-06-04
US20100290454A1 (en) 2010-11-18

Similar Documents

Publication Publication Date Title
JP5174182B2 (ja) 再生遅延推定
FI108692B (fi) Menetelmä ja laite datapakettien prosessoinnin ajoittamiseksi
KR100902456B1 (ko) 단 대 단 VoIP 매체 지연을 관리하는 방법 및 장치
US7079486B2 (en) Adaptive threshold based jitter buffer management for packetized data
US7379466B2 (en) In band signal detection and presentation for IP phone
US7243150B2 (en) Reducing the access delay for transmitting processed data over transmission data
US9380100B2 (en) Real-time VoIP transmission quality predictor and quality-driven de-jitter buffer
CN102761468B (zh) 一种自适应调整语音抖动缓存区的方法及系统
CN107534589B (zh) 去抖动缓冲器更新
JP4744444B2 (ja) ストリームデータ受信再生装置、通信システムおよびストリームデータ受信再生方法
JP2001313717A (ja) 受信パケットを処理する電子システムおよび方法
JP2005269632A (ja) 通信端末装置、電話データ受信方法、通信システムおよびゲートウェイ
EP3220603B1 (en) Jitter buffer apparatus and method
JP3874112B2 (ja) 揺らぎ吸収バッファの制御方法および制御装置
KR100677179B1 (ko) Ip 전화를 위한 동적 지연 관리
EP2070294B1 (en) Supporting a decoding of frames
WO2013142705A1 (en) Voice communication method and apparatus and method and apparatus for operating jitter buffer
JP4130612B2 (ja) パケット処理装置
US8085803B2 (en) Method and apparatus for improving quality of service for packetized voice
Jelassi et al. A Self-tuned Quality-Aware De-jittering Buffer Scheme of Packetized Voice Conversations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121227

R150 Certificate of patent or registration of utility model

Ref document number: 5174182

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250