JP2015080255A - 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法 - Google Patents

低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法 Download PDF

Info

Publication number
JP2015080255A
JP2015080255A JP2014251422A JP2014251422A JP2015080255A JP 2015080255 A JP2015080255 A JP 2015080255A JP 2014251422 A JP2014251422 A JP 2014251422A JP 2014251422 A JP2014251422 A JP 2014251422A JP 2015080255 A JP2015080255 A JP 2015080255A
Authority
JP
Japan
Prior art keywords
endpoint
audio signal
signal
video
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014251422A
Other languages
English (en)
Inventor
シヴァンラール,レハ
Civanlar Reha
エレフゼリアディス,アレクサンドロス
Eleftheriadis Alexandros
シャピロ,オファー
Shapiro Ofer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vidyo Inc
Original Assignee
Vidyo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vidyo Inc filed Critical Vidyo Inc
Publication of JP2015080255A publication Critical patent/JP2015080255A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1827Network arrangements for conference optimisation or adaptation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • H04L65/4038Arrangements for multi-party communication, e.g. for conferences with floor control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/567Multimedia conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】マルチエンドポイントビデオ信号会議を実施するシステムおよび方法を提供する。
【解決手段】会議エンドポイントが、信頼性の高い通信チャネルと信頼性の低い通信チャネルの対達によってリンクされる。会議ビデオ信号は、基本層および拡張層フォーマットでスケーラブル符号化される。最小画質に対応するビデオ信号基本層が、信頼性の高いチャネルを介して通信される。ビデオ信号拡張層を、信頼性の低いチャネルを介して通信する。会議サーバは、中間符号化または再符号化操作なしに、ビデオ層情報の送信側エンドポイントから受信側エンドポイントへのスイッチングを仲介する。スケーラブル符号化オーディオ信号または非スケーラブル符号化オーディオ信号を使用して、ビデオ会議をオーディオ会議と統合する。
【選択図】図1

Description

本願は、2005年7月20日出願の米国仮出願第60/701,108号および第60/701,109号、2005年9月7日出願の第60/714,741号および第60/714,600号、ならびに2005年10月4日出願の第60/723,347号および第60/723,348号の特典を主張するものである。さらに、本願は、同時出願の米国特許出願第60/701,108号、第60/723,392号[video coding]、第60/701,111号、第60/714,600号、第60/723,347号[trunk]、および第60/701,110号[Jitter]に関連する。上述の優先権出願および関連出願のすべては、その全体が参照により本明細書に組み込まれる。
本発明はマルチメディア技術および遠隔通信に関する。詳細には、本発明は、マルチパーティ会議アプリケーション(multiparty conferencing application)のためのオーディオおよびビデオデータの通信または配布に関する。より詳細には、本発明は、スケーラブルビデオおよびオーディオ符号化技法を利用した会議システムおよび方法の実装を対象とする。
コンピュータネットワーク(例えばインターネット)は今や、メディアおよび情報の配信用の従来型配布システム(例えば郵便または電話)に取って代わっている。マルチメディアおよび遠隔通信技術の最近の進歩は、ビデオおよびオーディオ通信機能および会議機能と、IP PBX、インスタントメッセージング、ウェブ会議などのインターネットプロトコル(「IP」)通信システムとの融合を含む。ビデオ通信をそのようなシステムに効果的に統合するために、システムは一般に、ポイントツーポイント通信とマルチポイント通信の両方をサポートしなければならない。そのようなアプリケーションで使用されるマルチポイントサーバ(会議ブリッジ(conference bridge)、マルチポイント会議ユニットすなわち「MCU」とも呼ばれる)は、マルチパーティ会議の複数の参加者からのメディアストリームを混合し、それをすべての会議参加者に配布しなければならない。好ましくは、MCUは、(1)連続的存在(continuous presence)(例えば、複数の参加者を同時に見ることができるように)、(2)ビューまたはレイアウトの個人別化(personalization)(例えば、各参加者が参加者自身の他の参加者のビューを選ぶことができ、他の参加者の一部を大きいフォーマットで閲覧し、一部を小さいフォーマットで閲覧することができるように)、(3)誤り局所化(error localization)(例えば、伝送で誤りが生じたとき、その参加者とサーバとの間で誤りを解決することができる)、(4)ランダムエントリ(例えば、新しい参加者が会議に入ることが、他の参加者に影響を及ぼさず、またはその影響が最小限となる)、および(5)レート整合(例えば、様々な帯域幅を有する様々なネットワーク接続を介して各参加者を接続することができ、各参加者は、参加者自身のレートで会議ブリッジからデータを受信することができるように)を含むオプションも提供すべきである。
「トランスコーディング」MCUと呼ばれる現在のMCU解決策は、MCU内ですべてのビデオストリームを復号し、各参加者について個人別レイアウトを作成し、各参加者に送信するために参加者個別のデータストリームを再符号化し、例えば参加者の利用可能な帯域幅を考慮することなどによってこうした有利な機能を達成する。しかし、この解決策は、ビデオストリームの伝送に著しい遅延を加え、ビデオデータの品質を低下させ、かつ開発および配置するのに費用がかかる(そのようなシステムは通常、複雑な専用デジタル信号プロセッサを必要とする)。
代替のMCU解決策は、いわゆる「スイッチング」MCUに基づく。この解決策では、選択された単一の参加者(すなわち「アクティブな話者」)」のビデオおよび/またはオーディオ信号のみが、MCUから他の1人またはすべての参加者に送信される。すべての参加者のオーディオ信号に対して音声活動の定量的尺度を適用することによってアクティブな話者/参加者を選択することができる。アクティブな話者の選択は通常はMCUで実施されるが、1つまたは複数の音声活動標識の計算も(送信前に)エンドポイント上で実施することができる。スイッチングMCUは、トランスコーディングMCUよりもDSP処理が少なく、複雑でないものであるが、それに対応して、有する機能が少ない(例えば、誤り局所化がなく、レート整合がなく、ランダムエントリ機能が限られている)。
さらに、圧縮領域でビデオストリームを組み合わせるために、あるビデオ規格に特有の方法を実装する試みが行われてきた。ITU-T H.261規格に基づく方法は、H.261 QCIFイメージを会議ブリッジに送信することを要求し、次いで会議ブリッジは、QCIFイメージのうちの4つを組み合わせて1つのCIFイメージを作成する。ITU-T H.263やH.264などのより新しいビデオコーデックは、構成サブピクチャのそれぞれをより大きいピクチャの別々のスライスとみなすことにより、符号化ピクチャをより大きなピクチャとして組み合わせ、または「合成」することを可能にする。上記およびその他の同様の方法は、非常にビデオ圧縮規格特有のものとなる傾向があり、個人別レイアウトをサポートせず(すなわち、すべての参加者は、所与の参加者を同一の解像度で見ることを強制される)、誤り回復力(error resilience)、またはレート整合をサポートしない。上記およびその他の同様の方法はまた、ビデオとオーディオの適切な同期、ならびにジッタバッファ管理に関する、MCU設計者にとっての新たな課題も生み出す。他の解決策は、すべてのデータストリームをすべての参加者に送ることに基づいており、こうした解決策は、レート整合またはエンドポイントによる解像度の選択をサポートしない。
現在のところ、利用可能なビデオ通信解決策はまた、パケット損失に対する回復力がなく、費用のかかる専用ネットワーク構成を除いて、動作が予測不能である。大部分の他のアプリケーションにとって問題とはならない可能性があるネットワークエラー状態は、ビデオ会議では受け入れられない品質となる可能性がある。
符号化効率の全般的な改善を対象とする新しいデジタルビデオおよびオーディオ「スケーラブル」符号化技法も、いくつかの新しい構造的特徴を有する。具体的には、重要な新しい特徴はスケーラビリティである。スケーラブル符号化では、元の信号または源信号が、2つ以上の階層構造のビットストリームを使用して表される。階層構造は、所与のビットストリームの復号化が下位階層の他の一部またはすべてのビットストリームの可用性に依存することを示唆する。各ビットストリームは、それが依存するビットストリームと共に、特定の時間的品質(例えば、信号対雑音比すなわちSNR)、または(ビデオに関する)空間解像度で元の信号の表現を提供する。
「スケーラブル」という用語は、数に関する大きさまたはスケールを指すのではなく、一般に、様々な解像度または品質での元の信号または源信号の効率的な表現に対応する1組の様々なビットストリームを提供する符号化技法の能力を指す。来たるべきITU-T H.264 Annex F仕様(Scalable Video Coding、SVCと呼ばれる)は、時間的、空間的、および時間的解像度のすべてでビデオ符号化スケーラビリティを実現するビデオ符号化規格の一例であり、H.264規格の拡張である(Advanced Video Coding、すなわちAVCとも呼ばれる)。別のずっと古い例は(ITU-T H.262としても発行された)ISO MPEG-2であり、ISO MPEG-2は、3つのすべてのタイプのスケーラビリティを実現した。ITU G.729.1(G.729EVとも呼ばれる)は、スケーラブルオーディオ符号化を実現する規格の一例である。
符号化でのスケーラビリティは、所与のシステムが様々なアクセスネットワーク(例えば、様々な帯域幅で接続されたクライアント)、ネットワーク条件(帯域幅変動)、またはクライアント装置(例えば、大型モニタを使用するパーソナルコンピュータと、ずっと小型の画面を備えるハンドヘルド装置)と協働することを可能にするビューと共にストリーミングおよびブロードキャストする際のビデオおよびオーディオ配布問題に対する解決策として設計された。
現在、マルチメディア会議アプリケーションの改善に対して考慮が払われている。具体的には、スケーラブルビデオおよびオーディオ符号化技法を使用することによって会議サーバアーキテクチャを改善することに対して注意が向けられている。望ましい会議サーバアーキテクチャおよびデータ符号化技法は、個人別レイアウト、連続的存在、レート整合、誤り回復力、およびランダムエントリ、ならびに低遅延をサポートすることになる。
本発明は、マルチポイントおよびポイントツーポイント会議アプリケーションのためのメディア通信サーバアーキテクチャを提供する。メディア通信サーバアーキテクチャは、スケーラブルビデオ符号化(SVC)データおよび/または、スケーラブルオーディオ符号化(SAC)データあるいは一般には符号化ビットストリームから複数の品質を導出することのできるように符号化されたオーディオ、についての低遅延通信向けに設計される。以下ではサーバをスケーラブルビデオ符号化サーバ(SVCS)と呼ぶが、同一のサーバ設計および動作はオーディオにも当てはまることを理解されたい。特にオーディオアプリケーションの文脈では、別法として、サーバを記述するのにスケーラブルオーディオ符号化サーバ(SACS)も使用することができる。本発明のサーバ/クライアントアーキテクチャは、低遅延かつ誤り回復力が改善された、連続的存在、個人別レイアウト、およびレート整合などの会議機能を提供することができる。有利なことに、本発明のサーバ/クライアントアーキテクチャは、いくつかのスケーラブル符号化メディア信号を選択的に多重化し、複数の層の解像度、ビットレート、品質、およびフレームレートを提供することにより、著しく低減された処理要件でこうした会議機能を提供する。
本発明はさらに、統計的に多重化されたビデオストリーム中の大きいパケットまたはフレームのサーバ駆動同期により、ネットワークリンクでの帯域幅使用率を最適化する方法を提供する。
本発明の例示的実施形態は、スケーラブルオーディオおよびビデオストリームに関する基本層パケットを多重化することにより、低遅延かつ帯域幅効率の良いデータ通信のための方法を提供する。オーディオ符号化は、ある場合には非スケーラブルでよい。
別の例示的実施形態では、本発明は、スケーラブルビデオベースの会議に関するサーバベースのレート制御を実現し、そのサーバベースのレート制御では、サーバが、より重要なストリームのビデオ品質を高めるポリシーベースまたはコンテンツベースの方式を実施する。
さらに別の例示的実施形態では、本発明は、低遅延かつ機能豊富な(feature-rich)サービス(例えば、連続的存在、レート整合、および個人別レイアウト)を提供する方式で、スケーラブルビデオ符号化に基づいていくつかのクライアント会議ユニットを縦続接続する方法を提供する。この方法は同時に、異機種ネットワーク内および異機種ネットワーク間のトラフィックを最適化する。
さらに別の例示的実施形態では、本発明は、スケーラブルビデオ会議サーバを使用するテレビ会議でのセッションボーダーコントロール(session border control)機能を統一する方法を提供する。
以下の好ましい実施形態の詳細な説明および添付の図面から、本発明の別の機能、性質、および様々な利点がより明らかとなるであろう。
別段の記述がない限り、図示される実施形態の同様の機能、要素、構成要素、または部分を示すのに、各図全体を通して同一の参照番号および参照文字が使用される。さらに、これから図を参照しながら本発明を詳細に説明するが、例示的実施形態に関連してそのように行う。
本発明の原理による、エンドポイント送信機からクライアント受信機にスケーラブルビデオおよび/またはオーディオデータを配信するように構成されるマルチポイント会議サーバ(SVCS)システムの略図である。 本発明の原理による、マルチポイントSVCS(またはSACS)の内部スイッチング構造を示すブロック図である。 本発明の原理による、スター型縦続接続構成(star-cascaded arrangement)として構成されたSVCS/SACSシステムの略図である。 本発明の原理による、例示的SVCSシステムの4つの送信機によって与えられる、シミュレーションした組合せ帯域幅を示すグラフである。 本発明の原理による、例示的SVCSシステムでの多重化ビデオデータストリーム中の大きいフレームをスタッガリングすることによって達成される帯域幅一様性を示すグラフである。 本発明の原理による、例示的SVCSシステムでのオーディオおよびビデオパケット多重化および多重化解除のための構成の略図である。 本発明の原理による、例示的スケーラブル符号化多層データフォーマットと、例示的SVCSシステムと共に使用される符号化スケーラブル層データに関する可能な予測経路の略図である。 本発明の原理による、様々な送信側からのオーディオストリーム成分が選択され、高信頼性および低信頼性チャネルを使用して受信機に送られる例示的SACSの動作の略図である。
本発明は、マルチポイントおよびポイントツーポイント会議アプリケーションのためのシステムおよび方法を提供する。システムおよび方法は、ビデオおよびオーディオデータを配信するように設計され、ビデオおよびオーディオデータは、適切なスケーラブル符号化技法を使用して符号化される。そのような技法は、ソースデータをいくつかの異なるビットストリームとして符号化し、そのいくつかの異なるビットストリームは、様々な時間的解像度、品質解像度(すなわちSNRの点での)、およびビデオの場合には空間解像度で、元の信号の表現を提供する。
便宜上、本明細書では本発明のシステムおよび方法を主にビデオ信号の文脈で説明する。しかし、システムおよび方法がオーディオ信号、あるいはビデオ信号とオーディオ信号の組合せで等しく動作可能であることを理解されよう。
図1に、マルチポイントおよびポイントツーポイント会議アプリケーションのための、電子またはコンピュータネットワーク環境で実装することのできる例示的システム100を示す。システム100は、1つまたは複数のネットワークサーバ(例えばScalable Video Conferencing Server(SVCS)110)を使用して、会議参加者またはクライアント120、130、および140へのカスタマイズデータの配信を調整する。SVCS110は、例えば、会議の他の参加者に送信するためにエンドポイント140で生成されたビデオストリーム150の配信を調整することができる。システム100では、ビデオストリーム150がまず、SVC技法を使用して多数のデータ構成要素(例えば、層150aおよび150b)として適切に符号化またはスケールダウンされる。複数のデータ層は、様々な特徴または機能(例えば空間解像度、フレームレート、画質、信号対雑音比(SNR)など)を有することができる。例えば、電子ネットワーク環境内の様々な個々のユーザ要件およびインフラストラクチャ仕様(例えば、CPU能力、ディスプレイサイズ、ユーザプリファレンス、および帯域幅)を考慮して、データ層の様々な特性または特徴を適切に選択することができる。
システム100の例示的実装は、様々なデータ要件または必要性を有する参加者間のマルチパーティ会議をサポートするように設計される。この実装では、受信機データストリーム(例えばビデオストリーム150)から、会議でのそれぞれの特定の参加者/受信側について適切な量の情報を選択し、選択/要求された量の情報だけをそれぞれの参加者/受信側に転送するようにSVCS110が適切に構成される。例えば、図1は、ビデオストリーム150から選択された量の情報(例えばデータストリーム122および132)を示し、それらがSVCS110によってそれぞれクライアント120および130に転送される。受信側エンドポイント要求(例えば、個々の会議参加者によって要求される画質)に応答して、ネットワーク条件およびポリシーの考慮時に適切な選択を行うようにSVCS110を構成することができる。
このカスタマイズデータ選択および転送方式は、SVCビデオストリームの内部構造を利用し、それにより、様々な解像度、フレームレート、および/または帯域幅などを有する複数の層にビデオストリームを明確に分割することが可能となる。図1は、会議へのエンドポイント140のメディア入力を表すSVCビデオストリーム150の例示的内部構造を示す。この例示的内部構造は、「基本」層150bと、1つまたは複数の別個の「拡張」層150aとを含む。層150aおよび150bは全体として、会議へのエンドポイント140のメディア入力150のすべてを表す。基本層150bは、ある基本品質レベルで元のメディアを復号化または回復するのに不可欠なものである。したがってSVCS110は、すべての受信側エンドポイント120および130に基本層150bを転送する。拡張層150aは、情報を追加して、回復されたメディアの品質を向上させるが、回復されたメディアは、選択された量だけが個々の受信側エンドポイント120および130に転送される。例えば、受信側エンドポイント130は低帯域幅クライアントでよく、図1に示される3つの拡張層150aのうちの1つだけを受信することを選ぶことができる。
システム100では、1つまたは複数のチャネル(例えばチャネル170および180。これらは仮想および/または物理チャネルでよい)を介してエンドポイントとの間のSVCデータストリーム(例えばビデオストリーム150)の伝送を実施することができる。SVCデータストリームの特定の層を搬送するように各データ搬送チャネルを設計することができる。例えば、High Reliability Channel(HRC)170は、基本画質データ層(基本層150b)を搬送することができる。同様に、1つまたは複数のLow Reliability Channel(LRC)180は、「ピクチャに対する拡張(enhancements-to-the-picture)」データ層(例えば、より良好な品質、解像度、またはフレームレートの層150a)を搬送することができる。LRCのいずれかに対する情報損失によって受信側ユニット(例えばSVCS110またはエンドポイント120および130)で受信される画質が大幅に、または許容できないほど劣化しないように、送信されるSVCデータストリームを構成または階層化することができる。信頼性の高いHRCを介する基本層の伝送は、受信されるピクチャが少なくとも最低限の画質または基本的な画質を有することを保証する。HRC170が未使用帯域幅を有する場合、基本層150bに加えて、HRC170を介して拡張層150aの一部またはすべても搬送することができる。HRC170が層のすべてを搬送するのに十分な帯域幅を有する場合、LRC180が全く使用されない可能性がある。そのような場合、LRC180ではなく、単一の通信チャネル(すなわちHRC170)のみがシステム100内に存在することができ、またはシステム100内に単一の通信チャネルのみを実装することができる。
高優先順位パケットでさえも失う可能性のあるベストエフォート型通信ネットワーク上のシステム100の実装は、「Method Of And Apparatus For The Transmission Of High And Low Priority Segments Of A Video Bitstream Over Packet Networks」という名称の米国特許第5,481,312号に記載されているような適切な拡張損失回復力および回復機構(例えば前方誤り訂正(FEC)機構および自動再送要求(ARQ)機構)を使用することにより、基本層伝送の保全性を保護することができる。参照特許は、参照によりその全体が本明細書に組み込まれる。差異化サービス(DiffServ)を可能にするインターネットプロトコル(IP)ネットワーク上のシステム100の実装では、DiffServによって提供される高信頼性接続を介して基本層を伝送することができる。
専用HRC170を確立する適切な方法が利用可能ではない実装において、または専用伝送チャネルの信頼性が不確かである場合、基本層伝送の保全性を保証するための代替方法を実装するようにシステム100を構成することができる。例えば、伝送ユニット(例えば送信側エンドポイント140またはSVCS110)がHRCを介する伝送の信頼性を高めることを意図した基本層情報の伝送を先取りして反復するようにシステム100を構成することができる。実際の反復伝送数は、伝送チャネル誤り条件に依存する可能性がある。別法として、または加えて、送信側ユニットが基本層情報をキャッシュし、受信側エンドポイントまたはSVCSの要求時に情報を再送信するようにシステム100を構成することができる。この要求時再送信(retransmission-upon-request)は少なくとも、元の伝送での情報損失が迅速に検出される場合に効果的であることがある。上述のシステム100構成は、利用可能な伝送チャネルタイプおよび条件に応じて、個々のクライアント-SVCS接続、SVCS-クライアント接続、SVCS-SVCS接続、およびそれらの任意の組合せ上での基本層情報の確実な配信に有用である。
システム100のある実装では、参加見込みの受信側エンドポイントに転送するために、受信されるSVCビデオストリーム(例えばビデオストリーム150)中の基本層情報および拡張層情報を再編または再指定するようにSVCS110を構成することができる。各参加見込みの受信側エンドポイントまたは受信側エンドポイントのグループについて、基本層および拡張層情報の再指定をカスタマイズすることができる。次いで、SVCS110は、再指定された基本層および拡張層をそれぞれ適切なHRC接続およびLRC接続を介して、参加見込み受信側エンドポイントに転送することができる。再指定プロセスにより、インバウンドHRCを介してSVCS110に送信された情報を再分類し、アウトバウンドLRC上で特定の受信側エンドポイントに転送することができる。逆に、インバウンドLRCを介してSVCS110に送信された情報を再分類し、アウトバウンドHRC上で特定の受信側エンドポイントに転送することができる。
1つまたは複数の選択可能な符号化構造または動作モードを使用するようにシステム100およびその構成要素(例えばSVCS100)を構成することができる。同時出願の米国特許出願[codec]には、ビデオ会議アプリケーションに適した例示的符号化構造が記載されている。図7を参照すると、例示的動作モードにおいて、時間解像度0、1、および2と呼ばれる3つの時間的解像度(例えば毎秒7.5、15、30フレーム)に対応する層と、空間解像度LおよびSと呼ばれる2つの空間的解像度(例えばQCIFおよびCIF)に対応する層とを含むようにSVCデータストリーム(例えばデータストリーム150)を符号化することができる。この命名法では、基本層は、毎秒7.5フレームのL0層である。S0は、CIF解像度および毎秒7.5フレームのソースの表現に対応し、S1は、CIF解像度および毎秒15フレームのソースの表現に対応する。
図7に示される多階層符号化フォーマットまたは構造は、L0ピクチャがL0ピクチャに基づいて符号化され(すなわちL0ピクチャから予測され)、L1ピクチャがL0ピクチャおよび/またはL1ピクチャに基づいて符号化され、L2ピクチャがL0ピクチャ、L1ピクチャ、および/またはL2ピクチャに基づいて符号化されるようなものである。空間的拡張層S0からS2を符号化するのに並列方式が使用される。この特定の方式では、L1およびL2層情報を復号する能力は、それぞれL0層およびL0+L1層の可用性に依存する。QCIFからCIFに高めるために、拡張解像度ピクチャ(enhanced resolution picture)(すなわち層S0、S1、S2)も利用可能にすることができる。S0〜S2層のいずれかを復号する能力は、下層の対応する1つまたは複数のL0〜L2層が利用可能であることを必要とする。さらに、S1層情報およびS2層情報を復号する能力は、それぞれS0層およびS0+S1層の可用性に依存する。
本発明の例示的アプリケーションでは、マルチポイントテレビ会議を確立するのにシステム100を使用することができる。会議では、送信側エンドポイントは、L0〜L2およびS0〜S2層フォーマットとして符号化されるその入力情報を受信側エンドポイントに転送するためにSVCS110に送信することができる。L0、L1、およびS0層をHRC上で送信することができ、L2、S1、およびS2層をLRC上で送信することができる。SVCS100は、階層化された情報を混合および整合し、各受信側エンドポイントに転送される情報量をカスタマイズすることができる。受信側エンドポイントは、例えば様々なビットレート、解像度、フレームレートを有する、カスタマイズされた混合および整合済みの層組合せ(mixed-and-matched layer combination)を受信することができる。表1に、SVCS110がHRCおよびLRCを介して受信側エンドポイントに転送することのできる、L0〜L2およびS0〜S2層の例示的な混合および整合済み層組合せを示す。
Figure 2015080255
特定のエンドポイント(例えばエンドポイント120)に位置する会議参加者は、多くのビデオ会議参加者のうちのある特定の参加者(例えばエンドポイント140に位置する参加者)に選択的に注意を払うこと、または焦点を当てることを望むことがある。システム100により、エンドポイント120のそのような会議参加者が、対象とする参加者/エンドポイント(例えばエンドポイント140)の高品質ビュー(例えばCIF高フレームレート)と、他の対象としない会議参加者/エンドポイント(例えばエンドポイント130)についての一般的なより低品質のビュー(例えばQCIF低フレームレート)とを要求することが可能となる。SVCS110は、対象とするエンドポイントからの高品質ビューのカスタム化データストリーム150Hおよび対象としないエンドポイントからのより低品質のビューのカスタム化データストリーム150Lをそれぞれ、要求側参加者/エンドポイント120に転送することによって要求に応答する。次いで、要求側エンドポイント120は、受信したデータストリームすべてを復号し、要求したビデオ品質で各データストリームを個々に表示することができる。図1は、例えば、エンドポイント120の要求側参加者に提示される、対象とする参加者/エンドポイント140の高品質CIFビューディスプレイ190を示す。システム100は、表示に関する複数のレベルの追加の解像度、時間的解像度、および画質を提供できることを理解されよう。
SVCS100をさらに、対象とする送信側エンドポイントに、会議の任意のエンドポイントによる現要求のすべてを満たすのに必要な少なくとも最低限の量の品質および解像度情報をその入力データストリーム(例えばデータストリーム150)に含めるように指令するように構成することができる。
SVCS100は、マルチポイント会議のエンドポイント間で情報を調整またはルーティングするスイッチとして働く。図2は、ネットワークインターフェースカード(NIC)によって通信ネットワークにリンクされるSVC100の内部スイッチング構造の一例を示す。多層に符号化されている情報をスイッチング行列に従って多重化解除し、多重化し、切り換えるようにSVC100の内部スイッチング構造を設計することができる。ソフトウェアおよび/またはハードウェアユニット(例えばマルチプレクサおよびデマルチプレクサ)の任意の適切な構成として内部スイッチング構造を実現することができる。
システム100では、情報が、情報の最初に符号化された層フォーマットを維持しながら、SVCを介して送信側エンドポイントから受信側エンドポイントに搬送されることに気付くであろう。SVC110自体での中間復号化または再符号化操作は不要である。この特徴は、中間トランジットまたはブリッジングポイント(例えばMCU)が送信側エンドポイントから受信された符号化データを復号し、再符号化し、次いで再符号化後データを受信側エンドポイントに送信する「タンデム符号化プロセス」を配置する従来の会議構成とは対照的である。タンデム符号化プロセスは、情報の伝送でアルゴリズム遅延を導入し、さらに、関係する符号化/復号化の反復によって画質が低下する。
有利には、本発明の会議システムは、SVC技法を利用して、SVCS110を介してデータストリームを転送する際のアルゴリズム遅延を回避し、またはそれを最小限に抑え、拡張品質ビデオデータをエンドポイントに配信する。本発明の会議システムで使用することのできるSVC技法またはモードの追加の特徴が、例えば、参照により本明細書に組み込まれる同時出願の米国特許出願第[SVC]に記載されている。参照される特許出願は、SVCS110によるビデオストリーム情報の抽出および切換えを容易にする特定のビデオ符号化および伝送方式を記述している。
前述のように、有利には、本発明の会議システムおよび方法は、従来の会議構成で実現可能なものよりも優れており、信頼性の高い方式で、高品質、低遅延、機能豊富なビデオ会議機能を提供する。本発明の会議システムおよび方法の利点は、少なくとも部分的には、2つの会議システムユニット間で各SVCデータストリーム中の全体の情報の様々な部分を搬送するための1対の平行な経路またはチャネル(例えばHRCおよびLRC)の確立によるものである。所望の最小会議機能に必要で重要な又は不可欠な情報が、優れた伝送特性を有するチャネル(すなわちHRC。HRCは、より信頼性の高いチャネル、ジッタの低いチャネル、および/またはよりセキュアなチャネルでよい)を介して送信される。会議システム実装に於いて、HRCは、実装環境にとって実際的または適合するような任意の適切な方式で、確立することができる。表2は、様々な電子ネットワーク実装環境でHRCを確立するための例示的な実際的または適合するオプションを特定している。
Figure 2015080255
単に図示および説明の都合上のために、図1では単一のSVCS110が例示的マルチポイント会議サーバ(SVCS)システム100に配置されるように示されていることを理解されよう。複数のSVCS110または同様のサーバをシステム100に配置してマルチポイントビデオ会議セッションを提供することができる。複数のSVCS110実装は、例えばマルチポイントテレビ会議が(例えば帯域幅のコストまたはサービス品質の点で)異機種ネットワークに渡るときに有利なことがある。複数のSVCS110実装はまた、会議接続要求(例えばマルチポイントテレビ会議セッションでの多数の参加者)が単一のSVCS110の能力(例えば物理的装置または帯域幅制限)を超える可能性が高いときに望ましいことがあり、または必要であることがある。複数のアクセスサービスプロバイダからの参加者、または複数の会議参加者が様々な会社の場所にいる地理的範囲の広い会社ネットワーク上の参加者間のアプリケーション・サービス・プロバイダー(ASP)ベースの会議を含む状況でテレビ会議セッションを実施するためには、いくつかのリンクされたSVCS110を配置することが特に有利であることがある。
縦続接続構成で複数のSVCS110をリンクまたは配置することができ、それにより、他の幾何学的構成に勝る良好なネットワーク使用率および良好なシステムスケーラビリティを実現することができる。ブリッジ(例えばハードウェアMCU)に基づく従来型会議技術は、多くの性能およびコスト上の理由により縦続接続構成には適していないことに気付くであろう。例えば、従来型会議構成では、複数のMCUを通過する呼は、横切ったMCUの数に比例する遅延を受け、または遅延を蓄積する。さらに、呼情報品質が、各MCUでのタンデム符号化プロセスのために、横切ったMCUの数に比例して低下する。さらに、従来型会議構成では、ピクチャ/データ解像度が、縦続接続されたMCUの数が増加するにつれて低下し、それによって参加者/エンドポイントは、他の参加者のうちの少なくとも一部のより高い解像度ピクチャを選択する能力を奪われる。一方、本発明のSVCSは、SVCSが縦続接続されたときであっても遅延を追加せず、画質が低下しない。
図3は、異機種かつ地理的に様々な通信ネットワークドメイン(例えばAOL、Verizon、Comcast、およびFrance Telecom Network)にわたって広がるマルチポイントテレビ会議セッションをホストすることのできる例示的SVCSシステム300を示す。SVCSシステム300は、複数のSVCS110を配置する。個々のSVCS110は、様々な通信ネットワークおよび/または様々なドメインに配置することができ、通信チャネル(例えばHRCおよびLRC)によって他のSVCS110にリンクされる。リンクされたSVCS110を、スター型構成トポロジ(図示)、フルメッシュ構成トポロジまたは冗長構成トポロジ、こうしたトポロジの混合、あるいは任意の他の適切な結合トポロジとして配置することができる。
動作の際に、単一マルチポイント会議セッションに関する通信を、様々なドメイン内または様々なネットワーク上に配置された複数のSVCS110を介して配布することができる。配置されるすべてのSVCS110は、会議構造およびトポロジ全体についての情報を共有することができる。さらに、リンクされたすべてのSVCS110を、情報ストリームを効率的にアドレス指定または経路指定するように(例えば、費用のかかる広域ネットワーク上に重複した情報を送ることを回避するように)構成することができる。
図3に示されるマルチポイントビデオ会議セッションでは、France Telecomドメイン内のすべての参加者/クライアント303は、「エンドポイントA」(例えば参加者/クライアント404)を高解像度で注視し、または見ることを好む可能性がある。逆に、Comcastのドメイン内のすべての参加者/クライアント202は、エンドポイントAを低解像度で注視し、または見ることを好む可能性がある。システム300は、システム100と同様に、会議参加者/クライアントの閲覧プリファレンスを認識および確認するように構成される。したがって、参加者/クライアント202および303の閲覧プリファレンスに応答して、システム300は、エンドポイントAの近接SVCS110(図示せず)に対してSVC低解像度基本層と高解像度拡張層情報のどちらもストリーミングするようにエンドポイントAに指令する。近接SVCS110は、基本層情報および拡張層情報を、SVCS110ネットワークのスター型構成の中央の、AOLドメイン内のSVCS110に転送する。参加者/クライアント303の閲覧プリファレンスに応答して、中央SVCS110は、France Telecom SVCS110に高解像度情報と低解像度情報のどちらも転送することができる。さらに、参加者/クライアント202の閲覧プリファレンスに応答して、中央SVCS110は、Comcast SVCS110に低解像度情報のみを転送することができる。図3では、中央SVCS110から下流側SVCS110に送信された情報のタイプが、それぞれ表示「A high + low」および「A low」で示されている。
システム300は対話式会議に適していることを理解されよう。AOLドメイン内に位置する中央SVCS110を有する、図3に示す集中型環境では、エンドポイントAから参加者/クライアント303への情報伝送は、3つのSVCS110(すなわち、近接SVCS、中央SVCS、およびFrance Telecom SVCS)を通過する。したがって、エンドポイントAとエンドポイントAの情報伝送の受信側303との間の信号遅延は、ネットワーク遅延足す、個々のSVCSユニット遅延の3倍とに等しい。しかし、本発明のスイッチング行列SVCS設計は、個々のSVCSユニット遅延が本質的にゼロであることを保証する。このことは、通常は200msよりも長い従来のMCU遅延と対照をなすことになる。システム300または類似のシステムで本発明のSVCSの代わりに従来のMCUを使用すると、エンドポイントAから参加者/クライアント303までの信号伝送で600msの遅延が追加されることになる。この遅延量により、従来のMCUベースのシステムは対話式会議に対して使用不能となる。
本発明のSVCSベースのシステムを、所望の会議機能を低下させる可能性のあるネットワーク輻輳または他の環境因子に対応するようにさらに構成することができる。例えば、システム300を構成することができる。ネットワーク輻輳を受けるエンドポイントまたはSVCSが、他のSVCSに信号を送って、他のSVCSに送られた拡張層を除去して転送しないようにし、会議セッションの維持または持続に対する、ネットワーク輻輳の影響を低減することができる。
さらに、または別法として、マルチポイント会議セッションに対してスケーラブル符号化ベースのレート制御を利用するように本発明のSVCSベースのシステムを構成することができる。この機能は、移動物体および突然の場面変化が送信されるビデオイメージの品質を維持するのに必要なビデオ帯域幅制御を実現することができる。通常、撮像された物体がビデオシーンで急激または突然に移動したとき、送信されるビデオ品質を維持するのに必要なビデオ帯域幅は、長期平均帯域幅要件よりも100%以上増加する可能性がある。従来の固定レートまたは非スケーラブルビデオベースのシステムでは、移動物体または場面変化によって引き起こされるビデオ品質の全体の劣化は、伝送ビットレートを維持してパケットの除去を回避する「プリエンプティブ劣化」伝送方式を使用することによって回避される。伝送ビットレートを維持することにより、フレームがスキップされ、SNRが低下し、これらのどちらも、少なくとも一時的にビデオ品質を低下させる可能性がある。しかし、大部分のビデオ閲覧状況では、そのような一時的または過渡的な品質変化は、閲覧者にとって目障りとなり、または当惑させるものとなる可能性がある。少なくともこの理由で、「プリエンプティブ劣化」伝送方式は、移動物体または突然の場面変化が伝送されるビデオイメージの品質を維持するのに満足の行く解決策ではない。本発明のスケーラブルビデオベースのシステムは、従来型固定レートビデオシステムでは許容される一時的または過渡的な品質変化さえも回避し、または最小限に抑えるように設計される。
ビデオ品質を低下させる運動または場面変化が検出されたとき、送信側エンドポイントがその基本層(例えば層150b)の伝送に関するビットレートを維持するが、その拡張層(150a)伝送に関する帯域幅を増大させるように本発明のスケーラブルビデオベースのシステムを構成することができる。拡張層で搬送される情報の増大は、基本層伝送での運動または場面変化によって引き起こされる固定レートの基本層伝送でのビデオ品質劣化を補償することができる。このようにして、少なくとも、基本層と拡張層をどちらも受信することのできる受信側エンドポイントについて、運動または場面変化を通じて、ビデオストリームの全体の品質を維持することができる。ネットワーク容量が受信側エンドポイントに基本層と拡張層のどちらも配信するのに十分なものである場合、ビデオ品質が維持される。ネットワーク容量が拡張層のより高いビットレート伝送を配信するのには不十分である場合、ビデオ品質のレベルは、従来型プリエンプティブ劣化方式の下で得られるはずのものと同じとなる可能性がある。拡張層情報の伝送を増大させることによってビデオ品質劣化を補償する方法は、ベースビットレートが一定に保たれないシステム実装でも適用可能である。
図4に、ビデオ品質劣化に対処する際の本発明のスケーラブル符号化ベースのレート制御システムおよび方法の利点を実証する一例を示す。この例では、SVCSによるマルチポイント会議構成でリンクされる4つの送信機からの組合せ帯域幅を調査した。シミュレーションでは、各送信機チャネルは2kビット/フレームのベース帯域幅、2〜8kビット/フレームの拡張層帯域幅を有し、拡張層帯域幅は、フレームの7%について10kビットだけ増大した。平均の全「フレームサイズ」は30kビットである。
図4は、各送信機チャネル上の帯域幅の標準偏差が平均帯域幅の約50%であり、組合せデータストリームの標準偏差は平均帯域幅のわずか約18%であることを示す。この約3:1の観測標準偏差比は、送信される信号情報がSVCSによる組合せストリーム上で1標準偏差でクリッピングされるときにクリッピングされるフレーム数と比較して、送信される信号情報をそれぞれの個々の送信機チャネル上で1標準偏差でクリッピングする結果、3倍の数のフレームがクリッピングされることを示す。後者の状況は従来型プリエンプティブ劣化方式に対応し、前者の状況は、上述のようにビットレートを調節することによってビデオ品質劣化を補償する本発明の方法に対応する。
ビデオ品質劣化に対処する際の本発明のスケーラブル符号化ベースのレート制御システムおよび方法は、任意の適切なアルゴリズムを使用して、データストリームを混合することができ、所与の参加者/エンドポイントに割り振られた全帯域幅を制御することができる。帯域幅割振りのためにSVCSで使用することのできる適切なアルゴリズムは、例えば統計的多重化、所与の参加者についてのネットワークアクセスのタイプ、ビットストリームの同期、および参加者/エンドポイントの選別格付け(triage)に基づくことができる。これらの例示的アルゴリズムのそれぞれの特徴を、以下のパラグラフで、マルチポイントビデオ会議アプリケーションの文脈で説明する。
統計的多重化: ビデオを劣化させる運動が、すべての参加者/エンドポイントで同時に生じる可能性は低い。ほとんどの場合、ある特定の時間に1人の参加者/エンドポイントのみが、運動または変化する場面を伴うビデオを送信する。したがって、SVCS110アルゴリズムは、特定の時間に1つの発信元のみが、その会議データストリームを送信するためにその帯域幅の長期平均シェアよりも多く寄与することを許可することができる。図4を参照しながら上記で説明したように、追加の帯域幅の割振りは、画質が低下する回数を低減する。
所与の参加者についてのネットワークアクセスのタイプ: 受信側エンドポイントが、ビデオストリーム帯域幅と比べて広い帯域幅を有するネットワーク接続を介して会議にアクセスすることができる場合がある。そのような場合、SVCS110は常に、向上した帯域幅補償の拡張品質層を受信側エンドポイントに転送することができる。さらに、SVCS110は、受信側エンドポイントと動的に通信し、向上した帯域幅の割振りの効果性を判定することができる。ある場合、向上した帯域幅のスパイクが受信されないことがあり、または向上した帯域幅のスパイクが、基本層伝送に関するチャネル品質を低下させる可能性がある(ジッタ、遅延、またはパケット損失の増大)。そのような場合、SVCS110は、必要に応じて拡張層伝送をクリッピングすることにより、基本層伝送についての平均ビットレートを維持または上昇させることができる。SVCS110は、残りの層の情報の配信についてサービス品質優先順位を再構成することもできる。
ビットストリームの同期: SVCデータストリームでは、ある符号化フレームは他のフレームよりも長くなる傾向がある。例えば、L0ピクチャはL1ピクチャよりも大きく、L1ピクチャも通常はL2ピクチャよりも大きい。様々なストリームに対してより大きいフレームをスタッガリング(staggering)することによって帯域幅一様性を達成することができる(例えば図5参照)。したがって、SVCS110は、会議エンドポイントの一部またはすべてに制御信号を送信して、標準時間的スレッディングシーケンス中のより大きいフレーム、または挿入することのできるイントラフレームがスタッガリングされ、それによってビットレートが特定の所望の値を超えてピークに達することがないように保証することができる。SVCS110は、会議参加者/エンドポイントのそれぞれによって生成されたレートを監視することができる。異なるビデオソースまたは新しいビデオソースからのより大きいパケットがSVCS110に同期して到着するとき、SVCS110は、会議参加者/エンドポイントのうちの1つまたは複数に、その時間的スレッディングシーケンスを変更してスタッガリングを達成するように指令することができる。参加者/エンドポイントは、例えばビデオソース上のサンプル時間を変更することによって、または階層化シーケンスをシフトすることによってその時間的スレッディングシーケンスを変更することができる。
参加者/エンドポイントの選別格付け: ある参加者/エンドポイントから受信した拡張層をレート制御のために廃棄しなければならない場合には、SVCS110は、情報を廃棄するために参加者/エンドポイントを優先順位付けすることを試みることができる。SVCS110は、より重要な参加者/エンドポイントに関連する拡張層を保持し、重要性の低い他の参加者/エンドポイントに関連する拡張層のみを廃棄することができる。SVCS110は、例えば会議でのアクティブな話者を識別することにより、より重要な参加者/エンドポイントを動的に識別することができる。SVCS110は、オーディオ層を介して、あるいはオーディオ会議装置または参加者/エンドポイントからそのような識別を受信することによって、アクティブな話者を識別することができる。あるいは、SVCS110は、会議優先順位ポリシーを先験的に確立することもでき、会議優先順位ポリシーは、組織内のランク、会議司会者機能、または他のアプリケーションレベル情報などの適切な基準に基づいて、所与の会議セッションの参加者/エンドポイントに優先順位を割り当てる。次いで、SVCS110は、先験的に割り当てられた優先順位を使用して、より重要な参加者/エンドポイントを識別することができる。
本発明のビデオ会議システムおよび方法を、ビデオ会議セッションでのオーディオ会議機能を統合するようにさらに構成することができる。一般に、オーディオ会議自体は、いくつかの理由のためにビデオ会議よりも実装が単純である。例えば、オーディオで必要とされる帯域幅は通常、ビデオに対して必要な帯域幅の5〜10%のみであり、オーディオ情報をパケット損失から保護することが、ビデオ情報を保護するよりも容易となる。さらに、オーディオ信号は、符号化/復号化のために必要な処理能力がビデオ信号よりも低い。オーディオ信号を符号化/復号化するのに必要な処理能力は、1〜2桁小さくてよい。さらに、オーディオパケットはビデオパケットよりもずっと短い時間フレームを含むことができるので、オーディオ信号遅延はビデオ信号遅延よりも制御可能である。しかし、パケットサイズを低減することによってオーディオ信号遅延を縮小することにより、それに対応して増加するパケットヘッダ数に関連する帯域幅オーバヘッドが増大する。したがって、少なくとも一部の帯域幅環境では、従来型オーディオ会議でのオーディオ信号品質は低くてよい。
本発明のSVCベースの統合オーディオおよびビデオ会議システムおよび方法は、オーディオ基本層信号とビデオ基本層信号の帯域幅が近く、同様のサービス品質(QoS)を必要とすることを認識することによってオーディオ信号遅延および品質問題に効果的に対処する。したがって、統合オーディオおよびビデオ会議システムでの送信側エンドポイントは、オーディオおよびビデオ基本層信号に関するペイロードを伝送用の単一パケットとして多重化し、それによってパケットオーバヘッドを低減するように構成される。組合せパケットは、受信側エンドポイントで(例えばポイントツーポイント呼出しで)、またはSVCS110で多重化解除することができる。ある実装では、外部関連オーディオ会議ブリッジ(オーディオMCU)がオーディオ会議機能を実施することができる。
ある実装では、本発明のSVCベースの統合オーディオおよびビデオ会議システムおよび方法は、スケーラブルオーディオ符号化(SAC)、または符号化ビットストリームから複数の品質を導出することのできる他のオーディオ符号化技法を使用することができる(図6参照)。SACの使用により、SVCS110または関連するオーディオ会議ブリッジでの信号処理の必要が最小限に抑えられる。そのような実装では、SVC110がSVCストリームを切り換えて転送するのと同じまたは類似の方式で、SACストリームを復号化/符号化することなく、SVCS110でSACストリームを切り換えて受信側エンドポイントに転送することができる(図1〜5)。SACは、複数のオーディオ品質を送信するのに効果的かつ効率的な方式を提供する方法である。しかし、オーディオとビデオが同一のネットワークを介して送信されるとき、複数の品質の非スケーラブルオーディオを送信することに勝るスケーラブルオーディオを送信することに関するビットレート節約は、スケーラブルビデオの場合の節約と比較して少ないことがある。ある状況では、例えばレガシー・システムとの互換性のために、SVCS110で切り換えられるスケーラブルビデオストリームと共に非スケーラブルオーディオストリームを引き続き使用することが望ましいことがある。
図6は、オーディオおよびビデオストリームを多重化および多重化解除する例示的構成を示す。構成600aは組合せオーディオおよびビデオストリーム610を示し、組合せオーディオおよびビデオストリーム610は、送信側エンドポイント140によって多重化され、並列のベストエフォート型チャネルと信頼性の高いチャネルを介して送信される。オーディオストリーム610が、非スケーラブル符号化される場合、オーディオストリーム610は、受信側エンドポイント120に転送するためにMCUまたは関連する会議サーバ630上で復号化および再混合される。オーディオストリーム610が、スケーラブル符号化される場合、受信側エンドポイント120のみで復号化してよい。
本発明のSVCおよびSACベースの統合オーディオおよびビデオ会議システムは、信号転送方式を使用して、会議参加者/話者間の対話式議論またはリアルタイム議論を妨害する可能性のあるオーディオクリッピング効果を最小限に抑え、または低減することができる。例示的方式では、各送信側エンドポイント140は、スケーラブルオーディオストリームを(低品質層および高品質層で)、そのストリームで表される話者の音量の標識と共に送信する。SVCS110は、音量標識でソートされた次のN人の話者に関する高品質および低品質(およびビットレート)層中の最強のストリームを受信側エンドポイントに転送する。Nは通常は1から3でよい。信号強度標識をSACSで計算することもできる。受信したストリームのすべてはエンドポイントで混合することができる。この方式では、ある話者からの信号がゆっくりと弱まって新しい話者が割り込むとき、トーク・スパート(talk spurt)の初期部分を含むスムースな遷移をすべての聴取者が利用可能である。そのような方式を用いない場合、話者が話し始めたときに話者のオーディオクリッピングが生じる可能性がある。このようにスケーラブルオーディオ符号化を利用することにより、本発明は、オーディオスイッチングに一般に関連する欠点を克服する。
図8は、複数のエンドポイント(例えばエンドポイント810A〜E)間の会議セッション801でのSACS800の動作の例示的構成を示す。SACS800は、複数の品質で符号化されるオーディオ信号830を受信および処理するように構成される。各エンドポイントは、様々な品質層または成分を有するオーディオ信号830を送信することができる。エンドポイント「i」からのオーディオ信号830中の様々な品質成分が図8に略図で示されており、増分品質層が、左側の基本層から始まって左側から右側に配列されている。SACS800は、各エンドポイント810A〜Eからのオーディオ信号830中の適切な量の情報を選び、会議セッション801の参加エンドポイントのそれぞれに転送する。選択され(例えば850Aおよび850B)、特定のエンドポイント(例えば、それぞれエンドポイント820Aおよび820B)に転送される情報の量およびタイプは、特定の受信側エンドポイントの特徴または必要に依存することがある。例えば、高品質音を再生することができ、そのような品質をサポートすることのできるネットワーク接続を有するエンドポイント820Aでは、SACS800は高品質情報850Aを転送することができる。逆に、高品質音を再生することができないか、又はそのような品質をサポートすることのできるネットワーク接続を有さないエンドポイント820Bでは、SACS800は、850Aより低品質の情報850Bのみを転送することができる。
図8に示される会議801の特定の時間または瞬間に、エンドポイント810Aを「アクティブな話者」とみなすことができ、その結果、その伝送830Aからより良好なオーディオ品質が聴取者に提供される。エンドポイント810Bおよび810Cを「一時的な話者」とみなすことができ、そのエンドユーザは、(i)現在は実際の話者であるが、エンドポイント810Aから生じる中断および雑音によって一時的に遮られている、(ii)エンドポイント810Aと同時に小さい音声で話している、または(iii)前の話者であり、その話者について、SACS800が、最高品質で始まり、最低品質で終わる信号成分の転送を徐々に停止している。これらすべての場合において、エンドポイント810Bおよび810Cからのオーディオ信号成分を、混合のために聴取者(例えばエンドポイント820Aおよび820B)が利用可能となる。この特徴により、様々な話者構成間のクリッピングのない遷移が可能となる。図8に示される会議例でのエンドポイント810Dおよび810Eは非話者であるとみなされるが、低品質情報830Dおよび830EをSACS800に送信中である。SACS800は、その音量がセッション801のN個の強いオーディオストリームのうちの1つとなった場合、この情報をオーディオミックス中に含むことができる。
あるオーディオ符号化技法では、受信機/デコーダはオーディオストリームを適切に復号化するために複数のパケットを必要とすることがある。さらに、デコーダは、その再生ジッタバッファを充填するために複数のパケットを必要とすることがある。そのような場合、すべての着信ストリームについて1つまたは複数のオーディオパケットをキャッシュし、適切な時に(例えば、そのようなストリームが受信機で必要とされるとみなされた後に)キャッシュしたものを受信機に転送するように、SACベースのサーバ(例えばSVCS110)を構成することができる。
低遅延オーディオが必要な会議アプリケーションでは、わずか10から20ミリ秒のサンプルを含むオーディオデータパケットが一般に使用される。そのようなアプリケーションでは、パケットヘッダ(例えば、IP、TCP、またはUDP、およびRTP情報)によって導入される、オーディオデータ(データ本体)に対する極めて著しいオーバヘッドが存在する。このオーバヘッドは200%もの高さとなる可能性がある。そのようなアプリケーションでは、特定の受信機に向けられた1つまたは複数のパケットを1つの組合せパケットに集約し、次いで1つの組合せパケットを受信機に送信することによってオーディオストリームに関するレート制御を実施するようにSACベースのサーバ(例えばSVCS110)を構成することができる。1つの組合せパケットの伝送によってヘッダオーバヘッドが低減されるが、その犠牲として、その特定の受信機への送信で遅延が導入される。集約/キャッシュ時間とパケットオーバヘッドの節約との平衡を取ることによってレート制御を実施するようにSVCS110を構成することができる。
このレート制御方式をさらに、エンドポイントで従来の無音および/または音量検出方式と組み合わせることができる。多くの音声通信システムでは、エンドポイントは無音検出方式を実施し、取り込まれたオーディオ中に音声情報が存在しないとみなされるときに、オーディオがネットワークで伝送されない。無音検出方式は、しきい値レベルを設定し、望ましくない雑音がネットワークを介して送信されないようにフィルタリングする。しかし、オーディオ伝送についてのこのしきい値レベルの設定によってはしばしば、話者割り込み(cut-in)のトーク・スパート(talk spurt)のクリッピングが生じる。本発明による例示的なSACベースの音声通信システムでは、2つのしきい値を実装することができ、低い方のしきい値の後、基本層情報がSACベースのサーバ(例えばSVCS110)によって送信され、高い方のしきい値の後、高品質拡張層が送信される。このようにして、話者割り込みトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができる。
上述の本発明のSVCおよびSACベースの会議システムおよび方法は、ゼロ遅延と、SVCS110の計算上効率的な会議機能とを使用する。本発明によれば、マルチパーティ呼出しとポイントツーポイント呼出しに共通しているSVCS110の機能を通信ネットワーク設計に統合することができ、または通信ネットワーク設計で利用することができるので有利である。例えば、セッションボーダーコントローラ、プロキシ、および他のファイアウォール、ならびにネットワークアドレス変換(NAT)トラバーサル機構との統合が有利となる可能性がある。すべてのこうした「メディアプロキシ」装置または機構は、(例えばポイントツーポイント呼出しについて)2つのドメインまたはネットワーク間のインターフェースポイント(ネットワークエッジ)上でサーバを通るメディアトラフィックをルーティングするサーバを使用することができる。例示的ネットワーク設計では、好ましくは、SVCS110はネットワークエッジ位置に配置される。あらゆるポイントツーポイント呼出しをマルチパーティ呼出しに拡張することができるので、SVCSをメディアプロキシ装置として使用すること、ならびにより高品質の呼出し構成変更(すなわちポイントツーポイントからマルチポイントに)を実施することが効率的であることがある。ネットワークエッジに配置されたSVCS110を、ビデオトラフィックの制御を改善するのに使用することができる。参照により本明細書に組み込まれる同時出願の米国特許出願第 号は、より良好なネットワーク使用率およびQoSリンクの管理を達成するために様々なビデオストリームの同期を含むビデオトラフィック制御の方式を説明している。
本発明の好ましい実施形態と考えられるものを説明したが、本発明の精神から逸脱することなくそれに対して別の変更および修正を行えることを当業者は理解するであろうし、すべてのそのような変更および修正が本発明の真の範囲内に包含されることを主張するものとする。
本発明によれば、ハードウェアとソフトウェアの任意の適切な組合せを使用してSVCS、SACS、および会議構成を実現できることも理解されよう。上述のSVCSおよび会議構成を実現しおよび動作させるソフトウェア(すなわち命令)をコンピュータ可読媒体上で提供することができ、コンピュータ可読媒体は、限定はしないが、ファームウェア、メモリ、記憶装置、マイクロコントローラ、マイクロプロセッサ、集積回路、ASIC、オンラインダウンロード可能媒体、および他の利用可能な媒体を含むことができる。

Claims (73)

  1. ビデオ信号が基本層および1つまたは複数の拡張層を含む層にスケーラブルに符号化されるマルチエンドポイントビデオ信号会議システムであって、
    少なくとも1つの受信側エンドポイントおよび少なくとも1つの送信側エンドポイントにそれぞれ少なくとも1つの通信チャネルによってリンクされたスケーラブルビデオ符号化サーバ(SVCS)を備え、
    前記SVCSを前記エンドポイントのそれぞれとリンクする前記通信チャネルのうちの少なくとも1つがサービス品質の向上を提供し、
    前記SVCSが、送信側エンドポイントの少なくとも1つのリンク通信チャネルを介して送信側エンドポイントから受信したビデオ信号層を、受信側エンドポイントの少なくとも1つのリンク通信チャネルを介して受信側エンドポイントに選択的に転送するように構成される会議システム。
  2. 前記SVCSが、動的スイッチング行列を使用して、前記送信側エンドポイントから受信した前記ビデオ信号層を前記受信側エンドポイントに転送するように構成される請求項1に記載の会議システム。
  3. 前記SVCSが、送信側エンドポイントから受信したビデオ信号を、前記ビデオ信号を復号化および/または再符号化することなく受信側エンドポイントに転送するように構成される請求項1に記載の会議システム。
  4. 前記SVCSが、ビデオ信号層を選択的に多重化し、リンクされたエンドポイントに転送することにより、連続的存在機能、個人別化(personalized)レイアウト機能、レート整合機能、誤り局所化機能、およびランダムエントリ機能のうちの少なくとも1つを、SVCSを介してリンクされた少なくとも1つのエンドポイントに提供するように構成される請求項1に記載の会議システム。
  5. 前記SVCSが、様々な信号特性を有するビデオ信号層を選択的に多重化し、受信側エンドポイントに転送するように構成され、前記様々な信号特性が、様々な解像度特性、ビットレート特性、品質特性、およびフレームレート特性のうちの少なくとも1つを含む請求項4に記載の会議システム。
  6. 前記SVCSがさらに、
    複数の送信側エンドポイントからのビデオ信号を統計的に多重化すること、および
    複数の送信側エンドポイントからのビデオ信号の伝送を同期して、多重化ビデオ信号中の平均より大きいビデオフレームをスタッガリングすること
    の少なくとも一方によって帯域幅条件に対処するように構成される請求項4に記載の会議システム。
  7. 前記SVCSが、受信側エンドポイントに優先順位を割り当てる会議システム優先順位ポリシーに従う優先順位で、拡張信号層を受信側エンドポイントに転送するように構成される請求項4に記載の会議システム。
  8. 前記SVCSがさらに、ビデオ信号の処理に加えてオーディオ信号を処理するように構成される請求項1に記載の会議システム。
  9. 複数のリンクされたSVCSをさらに備える請求項1に記載の会議システム。
  10. 前記リンクされたSVCSが、異機種通信ネットワークドメインにわたって配設される請求項9に記載の会議システム。
  11. 前記SVCSがさらに、セッションネットワークボーダーコントロール機能、メディアプロキシ機能、ファイアウォール機能、およびネットワークアドレス変換機能のうちの少なくとも1つを提供するように構成される請求項1に記載の会議システム。
  12. オーディオ信号が、符号化領域でビットストリームから複数の品質を導出することができるような成分として符号化されるマルチエンドポイントオーディオ信号会議システムであって、
    オーディオ会議の少なくとも1つの受信側エンドポイントおよび少なくとも1つの送信側エンドポイントにそれぞれ少なくとも1つの通信チャネルによってリンクされたスケーラブルオーディオ符号化サーバ(SACS)を備え、
    前記SACSが、送信側エンドポイントの少なくとも1つのリンク通信チャネルを介して送信側エンドポイントから受信したオーディオ信号成分を、受信側エンドポイントの少なくとも1つのリンク通信チャネルを介して受信側エンドポイントに選択的に転送するように構成される会議システム。
  13. 前記オーディオ信号が、基本層および1つまたは複数の拡張層を含む階層化成分としてスケーラブルに符号化される請求項12に記載の会議システム。
  14. 前記SVCSを前記エンドポイントのそれぞれとリンクする前記通信チャネルのうちの少なくとも1つがサービス品質の向上を提供する請求項12に記載の会議システム。
  15. 送信側エンドポイントから受信した前記オーディオ信号が、信号強度標識と関連付けられる請求項12に記載の会議システム。
  16. 前記SACSがさらに、
    受信した最強のオーディオ信号のすべての品質成分を、送信元の参加者を除くすべての参加者に転送し、
    受信した強度の低いいくつかのオーディオ信号のすべての品質成分未満を、送信元の参加者を除くすべての参加者に転送し、
    受信した強度の低い残りのオーディオ信号の品質成分を転送しないように構成される請求項15に記載の会議システム。
  17. 送信側エンドポイントから受信された前記オーディオ信号が、前記SACSによって前記受信側エンドポイントに転送され、前記受信側エンドポイントで混合される請求項12に記載の会議システム。
  18. 前記SACSが、前記受信機が特定の品質レベルで特定の送信側エンドポイントからのオーディオ信号の復号化を開始する必要があるとき、かつ品質成分が前記受信機で受信された前のオーディオフレーム内に存在しなかった場合、送信側エンドポイントから受信したオーディオ成分をキャッシュし、キャッシュした成分を特定の受信機に転送するように構成される請求項12に記載の会議システム。
  19. 前記通信チャネルがパケットベースであり、前記SACSが、パケットヘッダオーバヘッドを軽減するために、特定の受信機に向けられたいくつかのオーディオパケットを1つの組合せパケットとして集約し、次いで前記1つの組合せパケットを前記受信機に転送してレート制御を実施するように構成される請求項12に記載の会議システム。
  20. 前記SACSが、信号強度標識が第1しきい値を超過したときに送信側エンドポイントから受信した基本層情報のみを転送し、信号強度標識が第2しきい値を超過したときにのみ、送信側エンドポイントから受信した拡張層情報を転送するように構成され、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができる請求項13に記載の会議システム。
  21. 前記エンドポイントが、信号強度標識が第1しきい値を超過したときに基本層情報のみを送信し、信号強度標識が第2しきい値を超過したときにのみ、拡張層情報を送信するように構成され、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができる請求項13に記載の会議システム。
  22. 前記SACSが、動的スイッチング行列を使用して、前記送信側エンドポイントから受信したオーディオ信号成分を前記受信側エンドポイントに転送するように構成される請求項12に記載の会議システム。
  23. 前記SACSが、送信側エンドポイントから受信したオーディオ信号を、前記オーディオ信号を復号化および/または再符号化することなく受信側エンドポイントに転送するように構成される請求項12に記載の会議システム。
  24. 前記SACSが、オーディオ信号成分を選択的に多重化し、リンクされたエンドポイントに転送することにより、連続的存在機能、個人別化レイアウト機能、レート整合機能、誤り局所化機能、およびランダムエントリ機能のうちの少なくとも1つを、SACSを介してリンクされた少なくとも1つのエンドポイントに提供するように構成される請求項12に記載の会議システム。
  25. 前記SACSが、様々な信号特性を有するオーディオ信号成分を選択的に多重化し、受信側エンドポイントに転送するように構成され、前記様々な信号特性が、サンプリングレート、ビットレート、品質、およびオーディオ信号チャネル数のうちの少なくとも1つを含む請求項24に記載の会議システム。
  26. 前記SACSが、受信側エンドポイントに優先順位を割り当てる会議システム優先順位ポリシーに従う優先順位で、拡張信号層を受信側エンドポイントに転送するように構成される請求項24に記載の会議システム。
  27. 前記SACSがさらに、オーディオ信号の処理に加えてビデオ信号を処理するように構成される請求項12に記載の会議システム。
  28. 複数のリンクされたSACSをさらに備える請求項12に記載の会議システム。
  29. 前記リンクされたSACSが、異機種通信ネットワークドメインにわたって配設される請求項28に記載の会議システム。
  30. 前記SACSがさらに、セッションボーダーコントロール機能、メディアプロキシ機能、ファイアウォール機能、およびネットワークアドレス変換機能のうちの少なくとも1つを提供するように構成される請求項12に記載の会議システム。
  31. 符号化オーディオ信号の複数の品質成分がそれぞれ、独立して復号化可能な、前記オーディオ信号の符号化されたものからなる請求項12に記載の会議システム。
  32. 前記SACSが、信号強度標識が第1しきい値を超過したときに送信側エンドポイントから受信した1つの品質成分のみを転送し、信号強度標識が第2しきい値を超過したときにのみ、送信側エンドポイントから受信した追加の品質成分を転送するように構成され、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができる請求項12に記載の会議システム。
  33. 前記エンドポイントが、信号強度標識が第1しきい値を超過したときに1つの品質成分のみを送信し、信号強度標識が第2しきい値を超過したときにのみ、追加の品質成分を送信するように構成され、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができる請求項12に記載の会議システム。
  34. 送信側エンドポイントから受信された前記オーディオ信号が、前記SACSで計算される信号強度標識と関連付けられる請求項12に記載の会議システム。
  35. 送信側エンドポイントから受信された前記オーディオ信号が、前記送信側エンドポイントで計算される信号強度標識と関連付けられる請求項12に記載の会議システム。
  36. 電子通信ネットワークを介するマルチエンドポイントビデオ信号会議のための方法において、前記ネットワークが、他のチャネルと比較して優れたサービス品質を有する、エンドポイントをリンクする少なくとも1つの通信チャネルと、会議エンドポイントをリンクする通信チャネルを有する方法であって、
    スケーラブルビデオ符号化ビデオ信号を得ることであって、前記ビデオ信号が、基本層および拡張層からの少なくとも1つの層を含む階層化フォーマットで符号化されること、
    前記符号化ビデオ信号の少なくとも1つの層を選択すること、および
    優れたサービス品質を有する前記通信チャネルを介して、選択した層内の情報を前記エンドポイントに転送すること
    を含む方法。
  37. 優れたサービス品質を有する前記通信チャネルを介して前記選択した層内の情報を前記エンドポイントに転送することが、動的スイッチング行列を使用して、前記情報をエンドポイントに切り換えることを含む請求項36に記載の方法。
  38. 優れたサービス品質を有する前記通信チャネルを介して前記選択した層内の情報を前記エンドポイントに転送することが、前記ビデオ信号を復号化および/または再符号化することなく前記エンドポイントに前記情報を転送することを含む請求項36に記載の方法。
  39. ビデオ信号層を選択的に多重化し、前記会議エンドポイントに転送し、それによって連続的存在機能、個人別化レイアウト機能、レート整合機能、誤り局所化機能、およびランダムエントリ機能のうちの少なくとも1つを前記会議エンドポイントに提供することをさらに含む請求項36に記載の方法。
  40. ビデオ信号層を選択的に多重化し、前記会議エンドポイントに転送することが、様々な信号特性を有するビデオ信号層を選択的に多重化し、受信側エンドポイントに転送することを含み、前記様々な信号特性が、様々な解像度特性、ビットレート特性、品質特性、およびフレームレート特性のうちの少なくとも1つを含む請求項39に記載の方法。
  41. 複数の送信側エンドポイントからのビデオ信号を統計的に多重化すること、および
    複数の送信側エンドポイントからのビデオ信号の伝送を同期して、多重化ビデオ信号中の平均より大きいビデオフレームをスタッガリングすること
    の少なくとも一方によってネットワーク帯域幅条件に応答することをさらに含む請求項39に記載の方法。
  42. 受信側エンドポイントに優先順位を割り当てる優先順位ポリシーに従う優先順位で、拡張信号層を受信側エンドポイントに転送することをさらに含む請求項39に記載の方法。
  43. ビデオ信号の転送に加えてオーディオ信号を転送することをさらに含む請求項36に記載の方法。
  44. 少なくとも1つのリンクされたSVCSを使用して、前記エンドポイントへの情報の転送を仲介することをさらに含む請求項36に記載の方法。
  45. 異機種通信ネットワークドメインにわたって配設される複数のリンクされるSVCSを使用して、前記エンドポイントへの情報の転送を仲介することをさらに含む請求項36に記載の方法。
  46. 前記SVCSを使用して、セッションネットワークボーダーコントロール機能、メディアプロキシ機能、ファイアウォール機能、およびネットワークアドレス変換機能のうちの少なくとも1つを提供することをさらに含む請求項36に記載の方法。
  47. 電子通信ネットワークを介するマルチエンドポイントオーディオ信号会議のための方法において、前記ネットワークが、前記会議エンドポイント(すなわち送信側エンドポイントおよび受信側エンドポイント)をリンクする通信チャネルを有する方法であって、
    符号化領域でビットストリームから複数の品質を導出することができるように成分ビットストリームとして符号化されるオーディオ信号を得ること、および
    送信側エンドポイントのそれぞれのリンク通信チャネルを介して送信側エンドポイントから受信したオーディオ信号成分を、受信側エンドポイントのそれぞれのリンク通信チャネルを介して受信側エンドポイントに選択的に転送すること
    を含む方法。
  48. 前記オーディオ信号が、基本層および1つまたは複数の拡張層を含む階層化成分としてスケーラブルに符号化される請求項47に記載の方法。
  49. 前記ネットワークが、他のネットワークチャネルと比較して優れたサービス品質を有する、エンドポイントをリンクする少なくとも1つの通信チャネルを有し、優れたサービス品質を有する前記少なくとも1つの通信チャネルを介して、前記エンドポイントにオーディオ信号成分を選択的に転送することをさらに含む請求項47に記載の方法。
  50. オーディオ信号を得ることが、信号強度標識を含むオーディオ信号を得ることを含む請求項47に記載の方法。
  51. 信号強度標識を含むオーディオ信号を送信側エンドポイントから受信すること、
    受信した最強のオーディオ信号のすべての品質成分を、送信元のエンドポイントを除くすべてのエンドポイントに転送すること、
    受信した強度の低いいくつかのオーディオ信号のすべての品質成分未満を、送信元のエンドポイントを除くすべてのエンドポイントに転送すること、および
    受信した強度の低い残りのオーディオ信号の品質成分を全エンドポイントに転送しないこと
    をさらに含む請求項50に記載の方法。
  52. SACSを使用して、送信側エンドポイントから受信された前記オーディオ信号を前記受信側エンドポイントに転送し、前記受信側エンドポイントで前記オーディオ信号を混合することをさらに含む請求項47に記載の方法。
  53. 送信側エンドポイントから受信したオーディオ信号成分をキャッシュし、キャッシュしたオーディオ成分を特定の受信側エンドポイントに転送することをさらに含み、前記特定の受信側エンドポイントが、特定の品質レベルで特定の送信側エンドポイントからの前記オーディオ信号の復号化を開始しており、前記品質レベルの前記オーディオ成分を以前に受信していなかった請求項47に記載の方法。
  54. 前記会議エンドポイントをリンクする前記ネットワーク通信チャネルがパケットベースであり、
    パケットヘッダオーバヘッドを軽減するために、特定の受信側エンドポイントに向けられたいくつかのオーディオパケットを1つの組合せパケットとして集約すること、および
    次いで前記1つの組合せパケットを前記特定の受信側エンドポイントに転送してレート制御を実施すること
    をさらに含む請求項47に記載の方法。
  55. 信号強度標識が第1しきい値を超過したときに、送信側エンドポイントから基本層情報のみを転送すること、および
    前記信号強度標識が第2しきい値を超過したときにのみ、前記送信側エンドポイントから拡張層情報を転送し、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができること
    をさらに含む請求項48に記載の方法。
  56. 信号強度標識が第1しきい値を超過したときに、送信側エンドポイントから受信した基本層情報のみを転送すること、および
    前記信号強度標識が第2しきい値を超過したときにのみ、前記送信側エンドポイントから受信した拡張層情報を転送し、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができること
    をさらに含む請求項48に記載の方法。
  57. 送信側エンドポイントのそれぞれのリンク通信チャネルを介して送信側エンドポイントから受信したオーディオ信号成分を、受信側エンドポイントのそれぞれのリンク通信チャネルを介して受信側エンドポイントに選択的に転送することが、動的スイッチング行列を有するSACSを使用して、オーディオ信号成分の受信および転送を仲介することを含む請求項47に記載の方法。
  58. 送信側エンドポイントから受信したオーディオ信号を受信側エンドポイントに選択的に転送することが、前記オーディオ信号を復号化および/または再符号化することなく転送することを含む請求項47に記載の方法。
  59. 送信側エンドポイントから受信したオーディオ信号を受信側エンドポイントに選択的に転送することが、オーディオ信号成分を選択的に多重化および転送することを含み、それによって連続的存在機能、個人別化レイアウト機能、レート整合機能、誤り局所化機能、およびランダムエントリ機能のうちの少なくとも1つが前記受信側エンドポイントに提供される請求項47に記載の方法。
  60. 送信側エンドポイントから受信したオーディオ信号を受信側エンドポイントに選択的に転送することが、様々な信号特性を有するオーディオ信号成分を選択的に多重化し、受信側エンドポイントに転送することを含み、前記様々な信号特性が、様々なサンプリングレート、ビットレート、品質、およびオーディオ信号チャネル数のうちの少なくとも1つを含む請求項59に記載の方法。
  61. 送信側エンドポイントから受信したオーディオ信号を受信側エンドポイントに選択的に転送することが、受信側エンドポイントに優先順位を割り当てる会議システム優先順位ポリシーに従う優先順位で、拡張信号層を受信側エンドポイントに転送することを含む請求項59に記載の方法。
  62. オーディオ信号の処理に加えてビデオ信号を受信および転送することをさらに含む請求項47に記載の方法。
  63. 少なくとも1つのSACSを使用して、オーディオ信号成分の転送を仲介することをさらに含む請求項47に記載の方法。
  64. 異機種通信ネットワークドメインにわたって配設される複数のリンクされるSACSを使用して、前記エンドポイントへのオーディオ信号成分の転送を仲介することをさらに含む請求項63に記載の会議システム。
  65. 複数のリンクされたSACSを使用してオーディオ信号成分の転送を仲介すること、および前記リンクされたSACSを使用して、セッションネットワークボーダーコントロール機能、メディアプロキシ機能、ファイアウォール機能、およびネットワークアドレス変換機能のうちの少なくとも1つを提供することをさらに含む請求項47に記載の方法。
  66. 前記符号化オーディオ信号の前記複数の品質成分がそれぞれ、前記オーディオ信号の独立な符号化されたものからなる請求項47に記載の方法。
  67. 信号強度標識が第1しきい値を超過したときに、送信側エンドポイントから1つの品質成分のみを送信すること、および
    前記信号強度標識が第2しきい値を超過したときにのみ、前記送信側エンドポイントから追加の品質成分を送信し、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができること
    をさらに含む請求項47に記載の方法。
  68. 信号強度標識が第1しきい値を超過したときに、送信側エンドポイントから受信した1つの品質成分のみを転送すること、および
    前記信号強度標識が第2しきい値を超過したときにのみ、前記送信側エンドポイントから受信した追加の品質成分を転送し、それによって話者割り込みのトーク・スパートのクリッピングを最小限に抑えることができ、またはより目立たないようにすることができること
    をさらに含む請求項47に記載の方法。
  69. 送信側エンドポイントから受信された前記オーディオ信号が、前記SACSで計算される信号強度標識と関連付けられる請求項47に記載の方法。
  70. 送信側エンドポイントから受信された前記オーディオ信号が、前記送信側エンドポイントで計算される信号強度標識と関連付けられる請求項47に記載の方法。
  71. ビデオ信号が基本層および1つまたは複数の拡張層を含む層としてスケーラブルに符号化されるマルチエンドポイントビデオ信号会議システムであって、
    対応する通信チャネルで少なくとも1つの受信側エンドポイントおよび少なくとも1つの送信側エンドポイントにリンクされたスケーラブルビデオ符号化サーバ(SVCS)を備え、
    前記SVCSが、前記少なくとも1つの送信側エンドポイントから受信されるビデオ信号層を選択的に多重化し、少なくとも1つの受信側エンドポイントに転送することにより、連続的存在機能、個人別化レイアウト機能、レート整合機能、誤り局所化機能、およびランダムエントリ機能のうちの少なくとも1つを、前記少なくとも1つの受信側エンドポイントに提供するように構成される会議システム。
  72. 会議エンドポイントをリンクする通信チャネルを有する電子通信ネットワークを介するマルチエンドポイントビデオ信号会議のための方法であって、
    スケーラブルビデオ符号化ビデオ信号を得ることであって、前記ビデオ信号が、基本層および拡張層からの少なくとも1つの層を含む階層化フォーマットで符号化されること、
    前記符号化ビデオ信号の少なくとも1つの層を選択すること、および
    ビデオ信号層を選択的に多重化し、リンク通信チャネルを介して前記会議エンドポイントに転送し、それによって連続的存在機能、個人別化レイアウト機能、レート整合機能、誤り局所化機能、およびランダムエントリ機能のうちの少なくとも1つを前記会議エンドポイントに提供すること
    を含む方法。
  73. 請求項36から70および72の少なくとも一項に記載のステップを実施する一式の命令を含むコンピュータ可読媒体。
JP2014251422A 2005-09-07 2014-12-12 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法 Pending JP2015080255A (ja)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US71474105P 2005-09-07 2005-09-07
US71460005P 2005-09-07 2005-09-07
US60/714,741 2005-09-07
US60/714,600 2005-09-07
US72334805P 2005-10-04 2005-10-04
US72334705P 2005-10-04 2005-10-04
US60/723,347 2005-10-04
US60/723,348 2005-10-04

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012150968A Division JP2012239184A (ja) 2005-09-07 2012-07-05 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法

Publications (1)

Publication Number Publication Date
JP2015080255A true JP2015080255A (ja) 2015-04-23

Family

ID=39590780

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2008552286A Active JP5265383B2 (ja) 2005-09-07 2006-07-21 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法
JP2012150968A Pending JP2012239184A (ja) 2005-09-07 2012-07-05 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法
JP2014251422A Pending JP2015080255A (ja) 2005-09-07 2014-12-12 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2008552286A Active JP5265383B2 (ja) 2005-09-07 2006-07-21 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法
JP2012150968A Pending JP2012239184A (ja) 2005-09-07 2012-07-05 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法

Country Status (4)

Country Link
EP (1) EP1966917B1 (ja)
JP (3) JP5265383B2 (ja)
CN (1) CN103023666B (ja)
WO (1) WO2008082375A2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102036071B (zh) * 2005-12-08 2014-04-02 维德约股份有限公司 用于视频通信系统中的差错弹性和随机接入的系统和方法
AU2007214423C1 (en) 2006-02-16 2012-03-01 Vidyo, Inc. System and method for thinning of scalable video coding bit-streams
US8320450B2 (en) 2006-03-29 2012-11-27 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
US7898950B2 (en) 2006-08-18 2011-03-01 Microsoft Corporation Techniques to perform rate matching for multimedia conference calls
US8773494B2 (en) 2006-08-29 2014-07-08 Microsoft Corporation Techniques for managing visual compositions for a multimedia conference call
US20100149301A1 (en) * 2008-12-15 2010-06-17 Microsoft Corporation Video Conferencing Subscription Using Multiple Bit Rate Streams
US8380790B2 (en) * 2008-12-15 2013-02-19 Microsoft Corporation Video conference rate matching
US8169936B2 (en) * 2009-12-22 2012-05-01 Motorola Solutions, Inc. Decoupled cascaded mixers architechture and related methods
WO2011094077A1 (en) * 2010-01-26 2011-08-04 Vidyo, Inc. Low complexity, high frame rate video encoder
JP6103003B2 (ja) * 2010-02-24 2017-03-29 株式会社リコー 伝送端末、伝送方法、及びプログラム
US8947492B2 (en) 2010-06-18 2015-02-03 Microsoft Corporation Combining multiple bit rate and scalable video coding
EP2408205A1 (en) * 2010-07-12 2012-01-18 Alcatel Lucent A video server, video client and method of scalable encoding video files
JP5899710B2 (ja) * 2010-09-06 2016-04-06 株式会社リコー 伝送システム
JP2012178672A (ja) * 2011-02-25 2012-09-13 Ricoh Co Ltd 中継装置、多拠点テレビ会議システム
EP2525533B1 (en) * 2011-05-16 2014-02-26 Alcatel Lucent Method and apparatus for providing bidirectional communication between segments of a home network
CN102790872B (zh) * 2011-05-20 2016-11-16 南京中兴软件有限责任公司 一种视频会议的实现方法及系统
JP5906150B2 (ja) * 2012-07-12 2016-04-20 日本電信電話株式会社 映像品質制御装置及び方法及びプログラム
GB2513345B (en) * 2013-04-23 2017-07-26 Gurulogic Microsystems Oy Data communication system and method
CN103442202B (zh) * 2013-08-22 2017-09-26 北京智谷睿拓技术服务有限公司 视频通信方法及装置
DE102013220901A1 (de) 2013-10-15 2015-04-16 Continental Automotive Gmbh Verfahren zur Übertragung von digitalen Audio- und/oder Videodaten
JP6408020B2 (ja) 2014-02-28 2018-10-17 ドルビー ラボラトリーズ ライセンシング コーポレイション 遠隔会議における知覚的に連続的な混合
JP2015192230A (ja) * 2014-03-27 2015-11-02 沖電気工業株式会社 会議システム、会議サーバ、会議方法及び会議プログラム
CN108134915B (zh) 2014-03-31 2020-07-28 宝利通公司 用于混合式拓扑媒体会议系统的方法和系统
US9332224B2 (en) 2014-05-29 2016-05-03 International Business Machines Corporation Adaptive video streaming for communication sessions
WO2016003344A1 (en) * 2014-07-04 2016-01-07 Telefonaktiebolaget L M Ericsson (Publ) Priority of uplink streams in video switching
CN106534760B (zh) * 2015-09-15 2020-07-28 华为技术有限公司 一种媒体流传输方法、设备及系统
US10531047B2 (en) 2017-09-29 2020-01-07 Apple Inc. Multiway audio-video conferencing with multiple communication channels per device
CN108243066B (zh) * 2018-01-23 2020-01-03 电子科技大学 低延迟的网络服务请求部署方法
KR102212401B1 (ko) * 2018-06-18 2021-02-04 애플 인크. 디바이스당 다중 통신 채널들을 갖는 멀티웨이 오디오-비디오 회의
EP3618442B1 (en) * 2018-08-27 2020-09-30 Axis AB An image capturing device, a method and computer program product for forming an encoded image
US20200120211A1 (en) * 2018-10-10 2020-04-16 Avaya Inc. Dynamic agent media type selection based on communication session quality of service parameters
GB202015670D0 (en) * 2020-10-02 2020-11-18 Communication Security Group Inc End-to-end encrypted group communications

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06125361A (ja) * 1992-10-09 1994-05-06 Nippon Telegr & Teleph Corp <Ntt> 音声パケット通信方式
JP2003179580A (ja) * 2001-12-12 2003-06-27 Sony Corp データ通信システム、データ送信装置、データ受信装置、および方法、並びにコンピュータ・プログラム
JP2005130428A (ja) * 2003-09-29 2005-05-19 Ntt Communications Kk 双方向画像通信装置、その処理方法及びクライアント装置並びにプログラム
JP2005516557A (ja) * 2002-01-30 2005-06-02 モトローラ・インコーポレイテッド ビデオ会議システム及び動作方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19860531C1 (de) * 1998-12-30 2000-08-10 Univ Muenchen Tech Verfahren zur Übertragung codierter digitaler Signale
US6816194B2 (en) * 2000-07-11 2004-11-09 Microsoft Corporation Systems and methods with error resilience in enhancement layer bitstream of scalable video coding
US7158534B2 (en) * 2000-11-30 2007-01-02 Imajet Communications, Inc. Unified distributed architecture for a multi-point video conference and interactive broadcast systems
US6496217B1 (en) * 2001-06-12 2002-12-17 Koninklijke Philips Electronics N.V. Video communication system using model-based coding and prioritzation techniques
KR100931915B1 (ko) * 2002-01-23 2009-12-15 노키아 코포레이션 비디오 코딩시 이미지 프레임들의 그루핑
JP4329358B2 (ja) * 2003-02-24 2009-09-09 富士通株式会社 ストリーム配信方法、及びストリーム配信システム
US20050024487A1 (en) * 2003-07-31 2005-02-03 William Chen Video codec system with real-time complexity adaptation and region-of-interest coding
CN1216491C (zh) * 2003-10-16 2005-08-24 上海交通大学 基于对等互连的多点视频会议系统的应用层组播方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06125361A (ja) * 1992-10-09 1994-05-06 Nippon Telegr & Teleph Corp <Ntt> 音声パケット通信方式
JP2003179580A (ja) * 2001-12-12 2003-06-27 Sony Corp データ通信システム、データ送信装置、データ受信装置、および方法、並びにコンピュータ・プログラム
JP2005516557A (ja) * 2002-01-30 2005-06-02 モトローラ・インコーポレイテッド ビデオ会議システム及び動作方法
JP2005130428A (ja) * 2003-09-29 2005-05-19 Ntt Communications Kk 双方向画像通信装置、その処理方法及びクライアント装置並びにプログラム

Also Published As

Publication number Publication date
WO2008082375A3 (en) 2008-12-31
CN103023666B (zh) 2016-08-31
EP1966917A2 (en) 2008-09-10
JP2012239184A (ja) 2012-12-06
JP2009518996A (ja) 2009-05-07
WO2008082375A2 (en) 2008-07-10
EP1966917A4 (en) 2011-07-06
JP5265383B2 (ja) 2013-08-14
EP1966917B1 (en) 2016-05-04
CN103023666A (zh) 2013-04-03

Similar Documents

Publication Publication Date Title
JP5265383B2 (ja) 低遅延かつ分散した会議アプリケーション向けコンファレンスサーバアーキテクチャのためのシステムおよび方法
US9338213B2 (en) System and method for a conference server architecture for low delay and distributed conferencing applications
US7593032B2 (en) System and method for a conference server architecture for low delay and distributed conferencing applications
CA2779498C (en) System and method for a conference server architecture for low delay and distributed conferencing applications
US8436889B2 (en) System and method for videoconferencing using scalable video coding and compositing scalable video conferencing servers
CA2633366C (en) System and method for videoconferencing using scalable video coding and compositing scalable video conferencing servers
US7979885B2 (en) Real time bit rate switching for internet protocol television
US8502858B2 (en) System and method for multipoint conferencing with scalable video coding servers and multicast
CA2615459C (en) System and method for a conference server architecture for low delay and distributed conferencing applications
JP2005506812A (ja) 会議に参加するための多様な端末が接続可能な音声、映像その他のデータブリッジから構成される会議システム
US6853650B1 (en) Communication network, method for transmitting a signal, network connecting unit and method for adjusting the bit rate of a scaled data flow
Chen et al. Dynamic resource allocation for robust distributed multi-point video conferencing
Johanson Video communication over the Internet

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160426