JP2010206555A - 通信システム、通信端末、バッファ制御方法及びプログラム - Google Patents

通信システム、通信端末、バッファ制御方法及びプログラム Download PDF

Info

Publication number
JP2010206555A
JP2010206555A JP2009050018A JP2009050018A JP2010206555A JP 2010206555 A JP2010206555 A JP 2010206555A JP 2009050018 A JP2009050018 A JP 2009050018A JP 2009050018 A JP2009050018 A JP 2009050018A JP 2010206555 A JP2010206555 A JP 2010206555A
Authority
JP
Japan
Prior art keywords
data
communication
time
attribute value
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009050018A
Other languages
English (en)
Inventor
Masaru Kanetomo
大 金友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009050018A priority Critical patent/JP2010206555A/ja
Publication of JP2010206555A publication Critical patent/JP2010206555A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】 より精度の高いバッファ時間を決定することができる通信システムを得る。
【解決手段】 送信端末3の付加部32は、音声通話と同期対象の他の通信のデータが送信部31を用いて送信される時に他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を他の通信のデータと同期すべき音声データに付加して送信部33を用いて送信する。受信端末4の決定部42は、受信部43で受信される音声データに付加された属性値を基に他の通信のデータが送信されてから受信されるまでの時間である通信遅延時間を推定して音声データのバッファ部44へのバッファ時間を決定する。
【選択図】 図1

Description

本発明は通信システム、通信端末、バッファ制御方法及びプログラムに関し、特に端末間で音声通話を含む複数の通信アプリケーションソフトウェアを用いて通信を行う通信システムに関する。
広帯域な通信回線の低廉化により、ネットワークを介したコミュニケーションは従来の音声通話から、音声通話に共同作業用のホワイトボード、資料共有などのデータ共有アプリケーションを組み合わせた高度なコミュニケーションに進化している。このようなコミュニケーション環境では、ユーザは電話で話をしながら、共有ホワイトボード上で図を描いたり、必要に応じて資料をファイル転送で送ったりするなど、複数のメディアを同時に利用しながらコミュニケーションが行なわれている。
複数のメディアを同時に利用する場合にはメディア間の同期が重要であり、ズレが大きくなった場合にはユーザが違和感を覚えるだけでなく、コミュニケーションが成立しなくなることもある。非特許文献1では、音声と映像の2つのメディアを同時に利用する場合の同期ズレの検知限や許容限について述べられている。
メディア間の同期を実現するためには、端末において先に受信されたメディアのデータを出力前にバッファリングすることにより、メディアの受信時刻のズレを調整することが一般的である。一方、バッファリングはエンドトゥエンドでの遅延時間を増加させる。エンドトゥエンドでの遅延時間は短いほうがユーザの体感品質が高い(非特許文献2参照)ため、バッファ時間はメディア間のズレに応じて調整しなければならない。
複数メディアの同時利用時にバッファ時間が適切な長さになるように調整するための技術の一例が特許文献1に記載されている。特許文献1に記載の技術は、音声と映像を利用したコミュニケーションを対象としており、以下の手順により実現される。
1. 音声パケットの再生時に、同期すべき映像パケットの有無と映像のバッファ時間が確認される。
2. 同期すべき映像パケットが受信されていない場合や映像バッファ時間が指定より短い場合、音声パケットが無音であれば、同期すべき映像パケットが受信され、バッファ時間が指定された長さになるまで無音の音声パケットが繰り返し再生される。無音の音声パケットを利用することにより、同じ音声パケットを繰り返し再生した場合でも、ユーザが感じる品質の劣化を緩和することができる。
3. 映像のバッファ時間が指定より長い場合には、同期すべき映像パケット以前に受信した映像パケットは破棄される。
特許文献1に記載の技術では、音声の再生時に同期対象メディアのパケット到着を待つ場合、再生される音声パケットが無音でなければ該パケットの繰り返し再生によって後続の音声パケットの再生を遅らせて映像パケットの到着を待つことができない。その理由は、バッファ時間の調整タイミングが音声パケットの再生時であるため、繰り返し再生の対象が他に選択の余地がないためである。
これに対して、特許文献2には、タイムスタンプ付きメディアデータパケットをメディアシンクへ送出するメディアソースが再生時間オフセットを決定し、各メディアシンクはメディアデータパケットのタイムスタンプが表す時間に再生時間オフセットを加えてパケットの共通再生時間を決定することが記載されている。
特開2007−318283号公報 特開2004−104796号公報
「解説・報告 リップシンク〜映像と音声のタイミング〜」、<URL : http://www.nhk.or.jp/strl/publica/dayori/dayori9705/kaisetsu1-j.html> 「IPネットワーク技術に関する研究会 報告書」、<URL : http://www.soumu.go.jp/s-news/2002/020222_3.html>
特許文献2に記載の技術では、バッファ時間に相当する再生時間オフセットは、メディアシンクと交渉を行うものの送信側であるメディアソースが決定するようにしている。しかし、より精度の高いバッファ時間の決定のためには受信側で決定が行われることが望ましい。また、特許文献2に記載の技術では、主に2つの音声データを対象としているので、バッファ時間の決定にデータサイズの変動が考慮されていない。データサイズの変動がある場合でも、精度の高いバッファ時間の決定を可能とすることが望ましい。
本発明の目的は、上述した課題を解決し、より精度の高いバッファ時間を決定することができる通信システム、通信端末、バッファ制御方法及びプログラムを提供することにある。
本発明による通信システムは、音声通話の音声データを送信する第1の送信手段と、前記音声通話と同期対象の他の通信のデータを送信する第2の送信手段と、前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加し、前記属性値が付加された前記音声データを前記第1の送信手段に出力する付加手段とを含む送信端末と、前記第1の送信手段からの前記音声データを受信する第1の受信手段と、前記第1の受信手段により受信される前記音声データを蓄積するバッファ手段と、前記第2の送信手段からの前記他の通信のデータを受信する第2の受信手段と、前記第1の受信手段により受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記送信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定手段とを含む受信端末とを含むことを特徴とする。
本発明による通信端末は、他の通信端末へ音声通話の音声データを送信する第1の送信手段と、前記他の通信端末へ前記音声通話と同期対象の他の通信のデータを送信する第2の送信手段と、前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加し、前記属性値が付加された前記音声データを前記第1の送信手段に出力する付加手段と、前記他の通信端末の前記第1の送信手段からの前記音声データを受信する第1の受信手段と、前記第1の受信手段により受信される前記音声データを蓄積するバッファ手段と、前記他の通信端末の前記第2の送信手段からの前記他の通信のデータを受信する第2の受信手段と、前記第1の受信手段により受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記他の通信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定手段とを含むことを特徴とする。
本発明によるバッファ制御方法は、通信端末のバッファ制御方法であって、他の通信端末へ音声通話の音声データを送信する第1の送信ステップと、前記他の通信端末へ前記音声通話と同期対象の他の通信のデータを送信する第2の送信ステップとを含み、前記第1の送信ステップは、前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加する付加ステップを含み、前記他の通信端末の前記第1の送信ステップにて送信される前記音声データを受信する第1の受信ステップと、前記第1の受信ステップにて受信される前記音声データを自端末のバッファ手段に蓄積するステップと、前記他の通信端末の前記第2の送信ステップにて送信される前記他の通信のデータを受信する第2の受信ステップと、前記第1の受信ステップにて受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記他の通信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定ステップとを更に含むことを特徴とする。
本発明によるプログラムは、通信端末のバッファ制御方法をコンピュータに実行せしめるプログラムであって、他の通信端末へ音声通話の音声データを送信する第1の送信処理と、前記他の通信端末へ前記音声通話と同期対象の他の通信のデータを送信する第2の送信処理とを含み、前記第1の送信処理は、前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加する処理を含み、前記他の通信端末の前記第1の送信処理にて送信される前記音声データを受信する第1の受信処理と、前記第1の受信処理にて受信される前記音声データを自端末のバッファ手段に蓄積する処理と、前記他の通信端末の前記第2の送信処理にて送信される前記他の通信のデータを受信する第2の受信処理と、前記第1の受信処理にて受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記他の通信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定処理とを更に含むことを特徴とする。
本発明によれば、より精度の高いバッファ時間を決定することができるという効果が得られる。
本発明の原理を説明するための通信システムの概略構成を示す図である。 本発明の原理を説明するための通信端末の概略構成を示す図である。 本発明の第1の実施の形態による通信端末の構成を示す図である。 本発明の第1の実施の形態による通信端末の送信側の動作を示すフローチャートである。 本発明の第1の実施の形態による通信端末の受信側の動作を示すフローチャートである。 本発明の第2の実施の形態におけるデータ種別の例を示す図である。 本発明の第2の実施の形態におけるNW情報保存部に記憶される同期対象メディアのデータ送受信履歴の例を示す図である。 本発明の第2の実施の形態における同期方法保存部に記憶される通信遅延時間の推定ルールの例を示す図である。 本発明の第2の実施の形態における更新された同期対象メディアのデータ送受信履歴の例を示す図である。
本発明の実施の形態について説明する前に、本発明の理解を助けるために、本発明の原理について図面を参照して説明する。図1は本発明の原理を説明するための通信システムの概略構成を示す図である。
図1に示した通信システムは、送信端末3と、受信端末4とを含む。送信端末3は、音声通話の音声データを送信する第1の送信部33と、音声通話と同期対象の他の通信のデータを送信する第2の送信部31と、他の通信のデータ送信時に他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を他の通信のデータと同期すべき音声データに付加し、属性値が付加された音声データを第1の送信部33に出力する付加部32とを含む。
受信端末4は、第1の送信部33からの音声データを受信する第1の受信部43と、第1の受信部43により受信される音声データを蓄積するバッファ部44と、第2の送信部31からの他の通信のデータを受信する第2の受信部41と、第1の受信部43により受信される音声データに属性値が付加されている場合、属性値を基に他の通信のデータが送信端末3により送信されてから自端末4により受信されるまでの時間である通信遅延時間を推定して音声データのバッファ部44へのバッファ時間を決定する決定部42とを含む。
このように、送信端末3は、他の通信のデータ送信時に他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を他の通信のデータと同期すべき音声データに付加して送信し、受信端末4は、受信される音声データに付加された属性値を基に他の通信のデータの通信遅延時間を推定して音声データのバッファ部44へのバッファ時間を決定するようにしている。同期対象の一方のデータである音声データの受信完了後に受信端末4がバッファ時間を決定することになるので、より精度の高いバッファ時間の決定が可能である。また、データ量を示す情報を含む属性値を基にバッファ時間が決定されるので、データ量に応じた精度の高いバッファ時間の決定が可能である。
図2は本発明の原理を説明するための通信端末の概略構成を示す図である。図2に示した通信端末5は、他の通信端末へ音声通話の音声データを送信する第1の送信部56と、他の通信端末へ音声通話と同期対象の他の通信のデータを送信する第2の送信部51と、他の通信のデータ送信時に他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を他の通信のデータと同期すべき音声データに付加し、属性値が付加された音声データを第1の送信部56に出力する付加部57とを含む。
さらに、通信端末5は、他の通信端末の第1の送信部56からの音声データを受信する第1の受信部54と、第1の受信部54により受信される音声データを蓄積するバッファ部55と、他の通信端末の第2の送信部51からの他の通信のデータを受信する第2の受信部52と、第1の受信部54により受信される音声データに属性値が付加されている場合、属性値を基に他の通信のデータが他の通信端末により送信されてから自端末5により受信されるまでの時間である通信遅延時間を推定して音声データのバッファ部55へのバッファ時間を決定する決定部53とを含む。
このように、通信端末5は、他の通信のデータ送信時に他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を他の通信のデータと同期すべき音声データに付加して他の通信端末へ送信する。また、通信端末5は、他の通信端末から受信される音声データに付加された属性値を基に他の通信のデータの通信遅延時間を推定して音声データのバッファ部55へのバッファ時間を決定するようにしている。同期対象の一方のデータである音声データの受信完了後に受信側がバッファ時間を決定することになるので、より精度の高いバッファ時間の決定が可能である。また、データ量を示す情報を含む属性値を基にバッファ時間が決定されるので、データ量に応じた精度の高いバッファ時間の決定が可能である。
以下、本発明の実施の形態について図面を参照して説明する。
図3は本発明の第1の実施の形態による通信端末の構成を示す図である。図3において、通信端末1は、データ処理装置11と、記憶装置12とを含む。データ処理装置11は、離散データ送信部111と、離散データ受信部112と、同期データ通知部113と、バッファ時間決定部116と、音声データ受信部117と、バッファ部118と、同期データ付加部11Bと、音声データ送信部11Cと、2つの入力部114及び11Aと、2つの出力部115及び119とを含む。記憶装置12は、NW(ネットワーク)情報保存部121と、同期方法保存部122とを含む。なお、通信端末2の構成は通信端末1の構成と同一である。
通信端末1及び2が互いに通信することで、通信端末1及び2を利用するユーザ間で音声ともう一つの異なるメディアを利用したコミュニケーションを行うことができる。通信端末1及び2は直接通信する場合もあれば、何らかの中継装置を利用して通信する場合もある。音声以外のもう一つのメディアは、ユーザ間での資料共有やホワイトボード共有のように、ユーザの操作があった時に該操作に対応するデータを送受信することで成立するメディア(以降、離散型メディアと称する)である。
入力部114は、離散型メディアについてユーザによる操作があった場合に、対応する制御データやコンテンツデータを同期データ通知部113に送る。同期データ通知部113は入力部114からデータを受け取ると、データの種別やデータの大きさといった該データの属性値を取得して同期データ付加部11Bに送信する。また、同期データ通知部113は、入力部114から受信されたデータを離散データ送信部111に送る。データの種別としてはコンテンツデータか制御データか、または画像かユーザによる書き込みかといったコンテンツの種類などが考えられる。
離散データ送信部111は、同期データ通知部113から受信されたデータにその時点の時刻情報をタイムスタンプとして付与し、通信相手の通信端末に対し送信する。通信相手の通信端末の離散データ送信部111から送信されたデータは、離散データ受信部112で受信される。離散データ受信部112は、受信データのタイムスタンプ(送信時刻)及び受信時刻、並びに受信データの属性値をNW情報保存部121に保存する。また、離散データ受信部112は、受信データを出力部115に送る。出力部115は、受信データの内容を出力装置に出力する。
なお、離散データ受信部112は、同期データ通知部113と同様に受信データの属性値を取得するようにしてもよい。あるいは、同期データ通知部113が入力部114から受信されたデータに該データの属性値を付加して離散データ送信部111に送出するようにし、離散データ受信部112は受信データに付加された属性値を送受信時刻と共に抽出するようにしてもよい。
入力部11Aは、音声通話に関してマイクからのデータを受信し、パケット化して同期データ付加部11Bに送る。同期データ付加部11Bは、通常は入力部11Aから受け取ったパケットをそのまま音声データ送信部11Cに送る。しかし、同期データ付加部11Bは、同期データ通知部113より離散型メディアデータの属性値を受け取った場合には、その時点で入力部11Aから受け取った音声パケットに対し、離散型メディアデータの属性値を付加してから音声データ送信部11Cに送る。音声データ送信部11Cは、同期データ付加部11Bからの音声パケットにその時点の時刻をタイムスタンプとして付与し、通信相手の通信端末に対し送信する。
通信相手の通信端末の音声データ送信部11Cから送信された音声パケットは、音声データ受信部117で受信される。音声データ受信部117は通常、受信された音声パケットをそのままバッファ部118に送る。しかし、音声データ受信部117は、離散型メディアデータの属性値が付加された音声パケットを受信した場合には、受信パケットをバッファ部118に送ると共に、バッファ時間決定部116に受信パケットのタイムスタンプ(送信時刻)及び受信時刻、並びに受信パケットに付加されていた属性値を送る。
バッファ時間決定部116は、同期方法保存部122に保存された推定ルールに従って、音声データ受信部117から受け取ったデータと、NW情報保存部121に蓄積された過去の離散型メディアデータのデータ量、データ種別及び通信遅延時間の情報とを用いて、受信パケットに付加された属性値に対応する離散型メディアデータの通信遅延時間を推定する。通信遅延時間は、データの送信時刻と受信時刻の差であり、通信相手の通信端末によりデータが送信されてから自端末により受信されるまでの時間を意味する。
同期方法保存部122に保存された推定ルールについて述べる。基本的に通信遅延時間の推定にはデータ量と通信遅延時間の関係が利用される。しかし、情報の利用範囲は、NW情報保存部121に存在する全ての情報を利用することや、現状の状態だけを知るために現在からある一定時間の範囲の過去の情報だけを利用することが考えられる。また、NWの変動が曜日・日付(月初や月末、企業における給料日や5・10のつく日など)・時刻に依存することを利用して、現在と類似の状況での過去情報だけを利用することも考えられる。また、音声パケットの通信遅延時間の情報を併せて利用することも考えられる。
バッファ時間決定部116は、これらのルールのうちいずれかを常に用いてもよいし、属性値を基にルールを選択してもよい。また、バッファ時間決定部116は、属性値を基に通信遅延時間の推定を行うか否かを決定してもよい。
バッファ時間決定部116は、推定された離散型メディアデータの通信遅延時間を基に音声パケットのバッファ時間を決定し、バッファ部118に通知する。バッファ時間は、同期対象である離散型メディアのデータと完全に同期して音声を出力できるバッファ時間でもよいし、メディア間の同期ズレに対する人間の検知限を利用して、人間には両者が全く同期していると感じる範囲で音声が先に出力されるようにバッファ時間が決定されてもよい。
バッファ部118は、バッファ時間決定部116からバッファ時間の通知を受けると、その時点でのバッファ時間と異なる場合には、通知されたバッファ時間になるようにバッファ時間の変更を行なう。バッファ時間を延ばす場合には、既にバッファ部118にバッファ済の音声パケットの中に無音音声パケットがあれば、その無音パケットを繰り返し再生することによりバッファ時間が調整される。また、バッファ時間を短縮する場合には、無音パケットの再生を行なわないことによりバッファ時間が調整される。バッファ部118に送られた音声パケットは、バッファ部118で一時的にバッファリングされた後、出力部119を通じて音声として出力される。
次に、本発明の第1の実施の形態の動作について図3〜図5を参照して説明する。図4は本発明の第1の実施の形態による通信端末の送信側の動作を示すフローチャートであり、図5は本発明の第1の実施の形態による通信端末の受信側の動作を示すフローチャートである。
通信端末1及び2間の通信中は、常に音声通話による音声データが端末1及び2間で送受信されている。音声パケットは、入力部11Aから同期データ付加部11Bを経て音声データ送信部11Cから送信される。この際に、同期データ付加部11Bは後述する離散型メディアのデータ送受信がない限り、音声パケットの転送処理以外は何も処理を行なわない。通信相手の通信端末の音声データ送信部11Cから送信されたデータは音声データ受信部117で受信され、受信データはバッファ部118において指定されたバッファ時間だけバッファリングされた後に、出力部119より出力される。
図4において、通信中にユーザが離散型メディアで操作を行なった場合(ステップS1)、該操作に対応するデータが同期データ通知部113に入力される。同期データ通知部113は、入力されたデータの属性値を取得して同期データ付加部11Bに送信すると共に、入力されたデータを離散データ送信部111に送る(ステップS2)。
離散型メディアデータの属性値を受け取った同期データ付加部11Bは、その時点で入力部11Aから受け取った音声パケットに対して離散型メディアデータの属性値を付加し、属性値が付加された音声パケットを音声データ送信部11Cに送る(ステップS3)。音声データ送信部11Cは、音声パケットにその時点の時刻情報をタイムスタンプとして付与して通信相手の通信端末に送信する(ステップS4)。送信された音声パケットは、通信相手の通信端末の音声データ受信部117で受信される。
これらの動作と平行して、離散データ送信部111は、離散型メディアのデータを通信相手の通信端末に送信する(ステップS5)。送信された離散型メディアのデータは、通信相手の通信端末の離散データ受信部112で受信される。
図5において、音声データ受信部117で受信された音声パケットに離散型メディアデータの属性値が付加されている場合(ステップS11)、音声データ受信部117は、音声パケットに付加された属性値を音声パケットの送信時刻及び受信時刻と共にバッファ時間決定部116に送り、音声パケット自体はバッファ部118に送る(ステップS12)。なお、この音声パケットの受信時点では、同期対象の離散型メディアのデータは未だ受信されていないものとする。
バッファ時間決定部116は、音声データ受信部117から受け取ったデータと、NW情報保存部121に蓄積された過去の離散型メディアデータのデータ量、データ種別及び通信遅延時間の情報と、同期方法保存部122に保存された推定ルールとを用いて、音声パケットに付加された属性値に対応する離散型メディアデータの通信遅延時間を推定する。そして、バッファ時間決定部116は、推定された通信遅延時間を基に音声パケットのバッファ時間を決定し、バッファ部118に通知する(ステップS13)。
バッファ部118は、通知されたバッファ時間になるようにバッファ時間の変更を行う(ステップS14)。音声パケットは変更された時間分バッファリングされた後、出力部119により音声として出力される(ステップS15)。これらの動作と並行して、同期対象の離散型メディアのデータが離散データ受信部112で受信される(ステップS16)。離散データ受信部112は、受信データの送信時刻、受信時刻及び属性値をNW情報保存部121に保存する(ステップS17)。また、受信データは出力部115に送られ、出力される(ステップS18)。
なお、音声データ受信部117で受信された音声パケットに離散型メディアデータの属性値が付加されていない場合は(ステップS11)、音声データ受信部117は、受信パケットをバッファ部118に送り(ステップS19)、受信パケットはバッファ部118において予め指定されたバッファ時間だけバッファリングされた後に、出力部119より出力される(ステップS20)。
以上説明したように、本発明の第1の実施の形態では、通信端末1及び2各々は、離散型メディアのデータ送信時に離散型メディアのデータの属性値を該データと同期すべき音声データに付加して通信相手の通信端末へ送信する。また、通信端末1及び2各々は、通信相手の通信端末から受信される音声データに付加された属性値を基に離散型メディアのデータの通信遅延時間を推定して音声データのバッファ時間を決定するようにしている。
本発明の第1の実施の形態では、同期対象の一方のデータである音声データの受信完了後、離散型メディアデータの受信前に、受信側が離散型メディアデータの通信遅延時間を推定してバッファ時間を決定するので、より精度の高いバッファ時間の決定が可能である。また、属性値は少なくともデータ量を示す情報を含み、この属性値を基にバッファ時間が決定されるので、データ量に応じた精度の高いバッファ時間の決定が可能である。
また、本発明の第1の実施の形態では、バッファ時間の調整タイミングが音声パケットの再生時でなく、音声パケットの受信直後からバッファ時間の変更を行なうようにしているので、既に受信済でバッファ部118にバッファされている無音音声データをバッファ時間の変更に利用することが可能になる。
また、本発明の第1の実施の形態では、離散型メディアデータの受信とは関係無しに音声パケットの受信直後にバッファ時間を決定するようにしているので、離散型メディアデータの受信前でもメディア間の同期ズレに対する人間の検知限を利用してユーザには同期しているように感じさせながら音声を先行して出力することが可能である。
次に、本発明の第2の実施の形態について図3〜図9を参照して説明する。図6は本発明の第2の実施の形態におけるデータ種別の例をしめす図である。図7は本発明の第2の実施の形態におけるNW情報保存部に記憶される同期対象メディアのデータ送受信履歴の例を示す図である。図8は本発明の第2の実施の形態における同期方法保存部に記憶される通信遅延時間の推定ルールの例を示す図である。図9は本発明の第2の実施の形態における更新された同期対象メディアのデータ送受信履歴の例を示す図である。
本発明の第2の実施の形態は、図3に示した通信端末1及び2としてPC(パーソナルコンピュータ)を想定し、データ処理装置11として中央演算装置とメモリ、記憶装置12としてハードディスクを想定する。メモリ上のコンピュータプログラムが中央演算装置で実行されることにより、図3の各部の機能が実現される。さらに、通信端末1及び2はIP(インターネットプロトコル)ネットワークにより結ばれている。
また、通信端末1及び2において音声通話と同時に利用される通信アプリケーションは資料共有アプリケーション(AP)であり、コミュニケーションを行なっているユーザ間で複数ページからなる資料を表示し、表示ページを同期させたり、資料上に図形や文字をユーザが追記したりすることが可能なAPである。IPネットワーク上では、音声通話はRTP(Real−time Transport Protocol)を、資料共有APは独自プロトコルを用いてデータが送受信される。また、遅延に弱い音声パケットを優先して送信する制御がIPネットワークでは設定されている。
PC1及び2間の通信中、すなわち2人のユーザが資料を見ながら音声通話をしているとき、資料共有AP上でユーザが操作をしない限りは資料共有APのデータは流れず、音声通話のパケットだけがPC1及び2間で送受信されている。一方のユーザが資料の重要な部分を示すために資料共有AP上で円を描くと(図4のステップS1)、円に対応するデータが生成される。この生成されたデータの属性値として、データ量=1.12Kbyteとデータの種別を示すID=1(図6参照、図形に相当)が、その時点で通信相手PCに送信するために生成された音声のRTPパケットの拡張ヘッダ部に挿入される(図4のステップS2及びS3)。
拡張ヘッダ部に属性値が挿入されたRTPパケットは、他のRTPパケット同様に、拡張ヘッダ部にさらにその時点の時刻12:11:43.235をタイムスタンプとして挿入された後、通信相手PCに対して送信される(図4のステップS4)。一方、資料共有APにより生成された円に対応したデータも、その時点の時刻12:11:43.230をタイムスタンプとしてヘッダ部に挿入された後、通信相手PCに対して送信される(図4のステップS5)。
通信相手PCでは、音声パケットが時刻12:11:43.250に受信される。IPネットワークでの優先制御により、音声パケットが先に受信され、資料共有APのデータは通信相手PCで未だ受信されていない。受信された音声パケットの拡張ヘッダ部に挿入されていた資料共有APのデータの属性値(データ種別ID=1及びデータ量=1.12Kbyte)と、過去の資料共有APのデータ送受信履歴(図7参照)と、推定ルール(図8参照)とに基づいて、資料共有APの円に対応するデータの通信遅延時間が推定される(図5のステップS11〜S13)。
ここで、図8の推定ルールから、通信遅延時間は図7のデータ種別ID=1に関する過去のデータ2件を利用して算出される。まず、図8の「平均スループット」は、それぞれのデータについて「データ量÷送信時刻と受信時刻の差」により算出されるスループットの平均を用いる。したがって、通信遅延時間=データ量÷平均スループット=1120÷((950÷(180−100)+1045÷(680−560))÷2)≒109msと推定される。
音声パケットが送信されてから受信されるまでに通信遅延で既に15ms経過しているため、人間の検知限を40ms見込んだ場合、音声のバッファ時間は109ms−15ms−40ms=54msとなる(図5のステップS13)。現在のバッファ時間が60msであるとすると、既にバッファされている音声パケットの中で無音のものを再生せずにスキップすることで、バッファ時間が6ms短縮される(図5のステップS14)。54msのバッファリングの後、音声パケットは音声として出力される(図5のステップS15)。
一方、通信相手PCにおいて、資料共有APの円に対応するデータが12:11:43.345に受信されると(図5のステップS16)、該データの送信時刻、受信時刻及び属性値(データ種別ID=1及びデータ量=1.12Kbyte)が資料共有APのデータ送受信履歴に追加される(図5のステップS17、履歴は図7から図9に遷移)。また、受信された資料共有APのデータはすぐに出力され、資料上に円として表示され(図5のステップS18)、したがって、対応する音声との同期が実現される。
本発明の第2の実施の形態においても、本発明の第1の実施の形態と同様の効果が得られることは勿論である。
本発明は、音声通話と他のメディアを組み合わせて行なうコミュニケーションにおける通信端末での品質制御に適用可能である。
1,2,5 通信端末
3 送信端末
4 受信端末
11 データ処理装置
12 記憶装置
31,51 第2の送信部
32,57 付加部
33,56 第1の送信部
41,52 第2の受信部
42,53 決定部
43,54 第1の受信部
44,55,118 バッファ部
111 離散データ送信部
112 離散データ受信部
113 同期データ通知部
114,11A 入力部
115,119 出力部
116 バッファ時間決定部
117 音声データ受信部
11B 同期データ付加部
11C 音声データ送信部
121 NW情報保存部
122 同期方法保存部

Claims (25)

  1. 音声通話の音声データを送信する第1の送信手段と、前記音声通話と同期対象の他の通信のデータを送信する第2の送信手段と、前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加し、前記属性値が付加された前記音声データを前記第1の送信手段に出力する付加手段とを含む送信端末と、
    前記第1の送信手段からの前記音声データを受信する第1の受信手段と、前記第1の受信手段により受信される前記音声データを蓄積するバッファ手段と、前記第2の送信手段からの前記他の通信のデータを受信する第2の受信手段と、前記第1の受信手段により受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記送信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定手段とを含む受信端末と、
    を含むことを特徴とする通信システム。
  2. 前記第2の送信手段は、前記他の通信のデータに時刻情報を付与して送信し、前記受信端末は、前記第2の受信手段により受信される前記他の通信のデータの送信時刻、受信時刻及び前記属性値を記憶する記憶手段を更に含み、前記決定手段は、前記第1の受信手段により受信される前記音声データに付加された前記属性値と前記記憶手段の内容とを基に前記通信遅延時間を推定することを特徴とする請求項1記載の通信システム。
  3. 前記決定手段は、前記第1の受信手段により受信される前記音声データに付加された前記属性値を基に前記通信遅延時間の推定ルールを決定することを特徴とする請求項1または2記載の通信システム。
  4. 前記他の通信のデータの前記属性値は該データのデータ種別を示す情報を更に含み、前記推定ルールは前記データ種別毎に予め定められていることを特徴とする請求項3記載の通信システム。
  5. 前記決定手段は、前記第1の受信手段により受信される前記音声データに付加された前記属性値を基に前記通信遅延時間の推定の実行の可否を決定することを特徴とする請求項1〜4いずれか記載の通信システム。
  6. 前記決定手段は、推定された前記通信遅延時間と、前記音声データと前記他の通信のデータとの間の同期ずれに対する人間の検知限に基づいて予め定められた時間とを基に前記バッファ時間を決定することを特徴とする請求項1〜5いずれか記載の通信システム。
  7. 前記第1の送信手段は、前記音声データに時刻情報を付与して送信し、前記決定手段は、前記推定された通信遅延時間と前記予め定められた時間に加えて更に、前記第1の受信手段により受信される前記音声データの送信時刻と受信時刻の差である該音声データの通信遅延時間をも基に前記バッファ時間を決定することを特徴とする請求項6記載の通信システム。
  8. 前記他の通信は、ユーザ操作に応答して生成される該操作に応じたデータを端末間で送受信する通信機能であることを特徴とする請求項1〜7いずれか記載の通信システム。
  9. 他の通信端末へ音声通話の音声データを送信する第1の送信手段と、
    前記他の通信端末へ前記音声通話と同期対象の他の通信のデータを送信する第2の送信手段と、
    前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加し、前記属性値が付加された前記音声データを前記第1の送信手段に出力する付加手段と、
    前記他の通信端末の前記第1の送信手段からの前記音声データを受信する第1の受信手段と、
    前記第1の受信手段により受信される前記音声データを蓄積するバッファ手段と、
    前記他の通信端末の前記第2の送信手段からの前記他の通信のデータを受信する第2の受信手段と、
    前記第1の受信手段により受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記他の通信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定手段とを含むことを特徴とする通信端末。
  10. 前記第2の送信手段は、前記他の通信のデータに時刻情報を付与して送信し、前記通信端末は、前記第2の受信手段により受信される前記他の通信のデータの送信時刻、受信時刻及び前記属性値を記憶する記憶手段を更に含み、前記決定手段は、前記第1の受信手段により受信される前記音声データに付加された前記属性値と前記記憶手段の内容とを基に前記通信遅延時間を推定することを特徴とする請求項9記載の通信端末。
  11. 前記決定手段は、前記第1の受信手段により受信される前記音声データに付加された前記属性値を基に前記通信遅延時間の推定ルールを決定することを特徴とする請求項9または10記載の通信端末。
  12. 前記他の通信のデータの前記属性値は該データのデータ種別を示す情報を更に含み、前記推定ルールは前記データ種別毎に予め定められていることを特徴とする請求項11記載の通信端末。
  13. 前記決定手段は、前記第1の受信手段により受信される前記音声データに付加された前記属性値を基に前記通信遅延時間の推定の実行の可否を決定することを特徴とする請求項9〜12いずれか記載の通信端末。
  14. 前記決定手段は、推定された前記通信遅延時間と、前記音声データと前記他の通信のデータとの間の同期ずれに対する人間の検知限に基づいて予め定められた時間とを基に前記バッファ時間を決定することを特徴とする請求項9〜13いずれか記載の通信端末。
  15. 前記第1の送信手段は、前記音声データに時刻情報を付与して送信し、前記決定手段は、前記推定された通信遅延時間と前記予め定められた時間に加えて更に、前記第1の受信手段により受信される前記音声データの送信時刻と受信時刻の差である該音声データの通信遅延時間をも基に前記バッファ時間を決定することを特徴とする請求項14記載の通信端末。
  16. 前記他の通信は、ユーザ操作に応答して生成される該操作に応じたデータを端末間で送受信する通信機能であることを特徴とする請求項9〜15いずれか記載の通信端末。
  17. 通信端末のバッファ制御方法であって、
    他の通信端末へ音声通話の音声データを送信する第1の送信ステップと、
    前記他の通信端末へ前記音声通話と同期対象の他の通信のデータを送信する第2の送信ステップとを含み、
    前記第1の送信ステップは、前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加する付加ステップを含み、
    前記他の通信端末の前記第1の送信ステップにて送信される前記音声データを受信する第1の受信ステップと、
    前記第1の受信ステップにて受信される前記音声データを自端末のバッファ手段に蓄積するステップと、
    前記他の通信端末の前記第2の送信ステップにて送信される前記他の通信のデータを受信する第2の受信ステップと、
    前記第1の受信ステップにて受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記他の通信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定ステップとを更に含むことを特徴とするバッファ制御方法。
  18. 前記第2の送信ステップは、前記他の通信のデータに時刻情報を付与して送信し、前記第2の受信ステップは、前記第2の受信ステップにて受信される前記他の通信のデータの送信時刻、受信時刻及び前記属性値を自端末の記憶手段に記憶するステップを含み、前記決定ステップは、前記第1の受信ステップにて受信される前記音声データに付加された前記属性値と前記記憶手段の内容とを基に前記通信遅延時間を推定することを特徴とする請求項17記載のバッファ制御方法。
  19. 前記決定ステップは、前記第1の受信ステップにて受信される前記音声データに付加された前記属性値を基に前記通信遅延時間の推定ルールを決定することを特徴とする請求項17または18記載のバッファ制御方法。
  20. 前記他の通信のデータの前記属性値は該データのデータ種別を示す情報を更に含み、前記推定ルールは前記データ種別毎に予め定められていることを特徴とする請求項19記載のバッファ制御方法。
  21. 前記決定ステップは、前記第1の受信ステップにて受信される前記音声データに付加された前記属性値を基に前記通信遅延時間の推定の実行の可否を決定することを特徴とする請求項17〜20いずれか記載のバッファ制御方法。
  22. 前記決定ステップは、推定された前記通信遅延時間と、前記音声データと前記他の通信のデータとの間の同期ずれに対する人間の検知限に基づいて予め定められた時間とを基に前記バッファ時間を決定することを特徴とする請求項17〜21いずれか記載のバッファ制御方法。
  23. 前記第1の送信ステップは、前記音声データに時刻情報を付与して送信し、前記決定ステップは、前記推定された通信遅延時間と前記予め定められた時間に加えて更に、前記第1の受信ステップにて受信される前記音声データの送信時刻と受信時刻の差である該音声データの通信遅延時間をも基に前記バッファ時間を決定することを特徴とする請求項22記載のバッファ制御方法。
  24. 前記他の通信は、ユーザ操作に応答して生成される該操作に応じたデータを端末間で送受信する通信機能であることを特徴とする請求項17〜23いずれか記載のバッファ制御方法。
  25. 通信端末のバッファ制御方法をコンピュータに実行せしめるプログラムであって、
    他の通信端末へ音声通話の音声データを送信する第1の送信処理と、
    前記他の通信端末へ前記音声通話と同期対象の他の通信のデータを送信する第2の送信処理とを含み、
    前記第1の送信処理は、前記他の通信のデータ送信時に前記他の通信のデータの属性値として少なくとも該データのデータ量を示す情報を含む情報を前記他の通信のデータと同期すべき前記音声データに付加する処理を含み、
    前記他の通信端末の前記第1の送信処理にて送信される前記音声データを受信する第1の受信処理と、
    前記第1の受信処理にて受信される前記音声データを自端末のバッファ手段に蓄積する処理と、
    前記他の通信端末の前記第2の送信処理にて送信される前記他の通信のデータを受信する第2の受信処理と、
    前記第1の受信処理にて受信される前記音声データに前記属性値が付加されている場合、前記属性値を基に前記他の通信のデータが前記他の通信端末により送信されてから自端末により受信されるまでの時間である通信遅延時間を推定して前記音声データの前記バッファ手段へのバッファ時間を決定する決定処理とを更に含むことを特徴とするプログラム。
JP2009050018A 2009-03-04 2009-03-04 通信システム、通信端末、バッファ制御方法及びプログラム Pending JP2010206555A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009050018A JP2010206555A (ja) 2009-03-04 2009-03-04 通信システム、通信端末、バッファ制御方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009050018A JP2010206555A (ja) 2009-03-04 2009-03-04 通信システム、通信端末、バッファ制御方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2010206555A true JP2010206555A (ja) 2010-09-16

Family

ID=42967570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009050018A Pending JP2010206555A (ja) 2009-03-04 2009-03-04 通信システム、通信端末、バッファ制御方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2010206555A (ja)

Similar Documents

Publication Publication Date Title
US9591262B2 (en) Flow-control based switched group video chat and real-time interactive broadcast
Montagud et al. Inter-destination multimedia synchronization: schemes, use cases and standardization
EP1398931B1 (en) Synchronous play-out of media data packets
JP5291190B2 (ja) インターネットプロトコルテレビジョンに関するチャネル変更応答時間を短縮する方法および装置
CA2173355A1 (en) Method and apparatus for multiple media digital communication system
US10778742B2 (en) System and method for sharing multimedia content with synched playback controls
KR20080038251A (ko) 장치로 멀티미디어 스트림들에 대해 아무 동기화도수행하지 말라거나 동기화 지연을 포함하도록 시그날링하는 방법
US8538470B2 (en) Call server, call terminal, call system, transfer processing method, and program storage medium storing program thereof
CN107113283B (zh) 在低延迟多媒体流式传输环境中处理有问题的模式的方法
US8571189B2 (en) Efficient transmission of audio and non-audio portions of a communication session for phones
Huang et al. Tsync: A new synchronization framework for multi-site 3d tele-immersion
US10925014B2 (en) Method and apparatus for synchronization in a network
CN101133590B (zh) 见你所见(swys)
JP2005184580A (ja) 通信システム、情報処理装置および方法、並びに、プログラムおよび記録媒体
JP2015012557A (ja) 映像音声処理装置、映像音声処理システム、映像音声同期方法、プログラム
US20220311812A1 (en) Method and system for integrating video content in a video conference session
JP2010206555A (ja) 通信システム、通信端末、バッファ制御方法及びプログラム
JP2008028599A (ja) マルチメディアデータの再生方法及びこの方法を実施するための主通信機及び従通信機ならびにプログラム
JP4994320B2 (ja) グループ通信装置及びグループ通信プログラム
Sithu et al. Media synchronization control in multimedia communication
KR101480653B1 (ko) 미러링크 사운드 출력 제어방법
JP2022006536A (ja) 通信システム、通信装置、及び通信プログラム
Mu et al. Network delay and bandwidth estimation for cross-device synchronized media
WO2024080975A1 (en) Client adaptation for real-time meeting data recovery
WO2024080974A1 (en) Media adaptation for lost content recovery in real-time online meetings