JP2007116683A - 電気通信システム - Google Patents

電気通信システム Download PDF

Info

Publication number
JP2007116683A
JP2007116683A JP2006272576A JP2006272576A JP2007116683A JP 2007116683 A JP2007116683 A JP 2007116683A JP 2006272576 A JP2006272576 A JP 2006272576A JP 2006272576 A JP2006272576 A JP 2006272576A JP 2007116683 A JP2007116683 A JP 2007116683A
Authority
JP
Japan
Prior art keywords
videophone
video
network
call
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006272576A
Other languages
English (en)
Other versions
JP4566177B2 (ja
Inventor
Robert Craig Campbell
クレイグ キャンベル,ロバート
David Markham Drury
マーカム ドゥルーリー,デービッド
Richard R Huber
アール. ヒューバー,リチャード
John P Strait
ピー. ストレイト,ジョン
Peter D Hill
ディー. ヒル,ピーター
Brian Rosen
ローゼン,ブライアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Marconi Intellectual Property Ringfence Inc
Original Assignee
Marconi Intellectual Property Ringfence Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marconi Intellectual Property Ringfence Inc filed Critical Marconi Intellectual Property Ringfence Inc
Publication of JP2007116683A publication Critical patent/JP2007116683A/ja
Application granted granted Critical
Publication of JP4566177B2 publication Critical patent/JP4566177B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1423Digital output to display device ; Cooperation and interconnection of the display device with other functional units controlling a plurality of local displays, e.g. CRT and flat panel display
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/003Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
    • G09G5/005Adapting incoming signals to the display format of the display terminal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/0442Handling or displaying different aspect ratios, or changing the aspect ratio
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/02Networking aspects
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/10Use of a protocol of communication by packets in interfaces along the display data pipeline
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2380/00Specific applications

Abstract

【課題】電話のように、瞬時にオンできて、信頼性が高い通信デバイスを提供する。
【解決手段】ビデオフォンは、シーンのビデオ画像を得るイメージング機構を有し、そのビデオ画像からシーンの第1ビデオストリームと、シーンの第2ビデオストリームとを生成し、第1ビデオストリーム及び第2ビデオストリームを同時にネットワークに送る生成機構を持つ。生成機構は、イメージング機構と通信する。ビデオフォンは、シーンが異なる複数のビデオストリームをネットワークから受信する機構を有し、複数のビデオストリームの各々のシーンを並べて表示する機構を持つ。
【選択図】図9

Description

本発明は、総じて通信分野に関しており、具体的には、ビデオ及びオーディオ通信に係る装置及び方法に関する。
この出願は、本願と同時に出願された米国意匠特許出願第29/158,247号「Videophone」と、本願と同時に出願された米国特許出願第10/115,323号「Method and Apparatus for Displaying Images in Combination With Taking Images」とに関係している。これら出願は、マルコーニ コミュニュケーションズ インコーポレイテッドに譲渡されるものであり、引用をもって本明細書の一部となる。
本発明は、ビデオフォンに関する。より詳細に述べると、本発明は、ビデオフォンに関しており、該ビデオフォンは、高解像度、高フレームレート、全二重(full-duplex)、低遅延、ビデオ、オーディオ、ステレオエコーキャンセル、セルフサービングマルチパーティ会議サービス(self serving multiparty conferencing services)、プレゼンスサービス(presence services)、共有サーフェスサービス(shared surface services)及びTV配信に関わる要素を有する。
地理的に離れて分散したチームは、本質的にあらゆる大企業(マルコーニ、フォード、ボーイング、IBM)にて現実のものとなっており、どの企業も、多くの新規な事業(start-up)を確保している。出張は、高費用、低効率で望ましくない(ロマンスが失われる)。リソース(人間)は、高費用で、制限があり、移動させるのが難しい。
地理的に離れて分散したチームのメンバーが利用する通信システムをアップグレードして、彼らが一緒にいたら得られるであろう通信の程度にさらに近づけることで、このようなチームのメンバー間の通信を大きく改善する必要がある。音声通信に関して今日知られているように、電話は、日常生活が自然に延長したものであり、チームのメンバー、又は互いに通信するユーザーの要求を満たしている。アップグレードされた通信システムは、電話のように、ユーザーにとって信頼できる自然なものであり、基本的には電話であって、しかしながら、ユーザにとって極めて自然に、少なくともビデオの特徴が加わっている必要がある。このような通信システムの遅延を含むオーディオ及びビデオの質は、ユーザを自然に通信させるのに充分でなければならない。スクリーン、スピーカ、マイクロホン、及びユーザ間に生じ得る数千マイルの距離は、姿を消すべきである。
通信環境は、誰が会議に参加しているか、他のユーザが何をしているかについて、及び彼らが何時如何にして話しているかについて、「直ちに知る(just know)」能力を各ユーザに与える必要がある。機構について考えるオーバーヘッドが無い状態で、ユーザは、「井戸端(water cooler)」の即興の議論や、遠隔のランチさえも可能であるべきである。
全ての動作及び機能は、トレーニングの必要が無く、明らかであるべきである。ターゲットのユーザには、電話のパワーユーザと電話の使用が最小限度の人とに加えて、コンピュータのエキスパート及び初心者が含まれている。存在しない「異常因子」は極めて低くあるべきである。名前、電話番号、スケジュール、場所、遠隔時間(remote time)、現在の状態、コール履歴等の情報は、容易に利用できるべきである。電話番号を瞬時に得て、それらにリンクしてダイヤルすることによって、この通信システムは、このような情報のリアルタイムな発信源とされるべきである。それは、エクスチェンジやPDA等の、現存するコンタクト情報ソースへのインターフェイスであるべきであって、ユーザの制御性を妥協させることなく、ユーザの動作を適切に最少化すべきである。
電話によるコールで人工衛星中継を利用する者は誰でも充分に理解しているように、短い待ち時間は、自然な通信を可能とするキーファクタである。今日まで、ビデオ通信の待ち時間によって、大きな技術的問題がもたらされてきた。ビデオエンコード、典型的なネットワーク遅延、及びビデオデコードの遅延全部によって、受け入れ難い結果が生じてしまう。RTP方式は、低遅延に加えて、満足できる低ジッタレートをもたらさなかった。その結果、現在のビデオ会議技術は、真に効果的な通信に必要なトランスペアレンシー(transparency)を与えていない。デスクトップ用に画面上にて作り出されたマルチユーザ会議において、満足できるプレゼンテーションはなかった。現存する電話会議システムの弱点は、参加者数が増加するにつれて、通信の実効性が低下することである。2人を超える人物が会議に参加すると、システムの制御、管理、インターフェイス、及びパフォーマンスは低下する傾向があり、メディアのトランスペアレンシーは失われる。
本発明は、最も一般的な形態である卓上電話機に置き換わる大量製造物を目的としており、該製造物は、強化された一連の機能を有し、上述した問題に解決策を与えるものである。本発明は、現在の通信環境にリアルタイムビジョン及びその他の補助を与えて、その結果、本当の意味でのテレプレゼンス(telepresence)を与えるものである。言い換えると、現在のツールで得られるよりも、直接的で会議により近い状態で、1又は2以上の人間を遠隔地間で交信させる能力である。本発明により、以下の事項がもたらされる。
≡ それは、地理的に離れて分散した組織内にて、通信の効率及び効果の両方を劇的に改善する能力をもたらす。
≡ 通信にビジュアルな特質を含めることで、効率は改善する。我々は、最大70%まで通信コンテンツをビジュアルにし、音声のみの通信は行わない。
≡ イベントの駆動(アドホック)を直接的に容易にする能力によって、計画通信よりも効率は改善する。このかつてのカテゴリーは、全ローカル通信のおよそ70%を示しており、我々はそれを遠隔通信に拡張できる。
≡ 最も一般的なビデオ会議は、専用の部屋で行われ、先だって予約が必要であるが、現在の電話機のような、卓上で継続的に利用されるこのツールをユーザが有することで、このようなビデオ会議と比較して、効率が改善される。
≡ 「プレゼンス」情報の分布を通じて、効率が改善し、通信の試みのより多くが成功裡に完了することは確実にされる。
≡ 通信が別々に行われて、ユーザが同時に用いるコンピューティングプラットホームがもたらされることで、効率は改善する。
≡ 問題を解決する討議グループを作り出す時間を低減し、決定時間を顕著に早めて、出張の必要性を大きく低減することで、効率は改善する。
≡ 出張の低減は、有意義な時間を増やすだけでなく、飛行機やホテルの費用についてコストを大きく低減する。
≡ 最も関係する人々が、単に目前にいるだけではなく、議論に含まれることを保証することによって、効果は促進する。
≡ また、高品質のビジョンがシンプルなフォンコンタクトに追加される場合、個人の間の関係が改善されて、効果は促進する。
≡ それは、組織内の誰でも直ちに「使える」ために、特別な場所で利用できる技能を与えて、このような技能をさらに有意義に使用させる。
≡ それは、特に、会社の上級管理者から会社全体への職員間通信の管理を大幅に改善する手段であって、団結心及び参加精神を引き起こす。
≡ 全く新しい如何なるツールと同様に、組織の利益のために、賢い人々は、我々が現段階では推測すらできない、それを有効に生かす方法を発明するだろう。
本発明は、ユーザが親しんでいる電話システムの拡張である。即ち、通信プラットホームであって、PCアプリケーションではない。瞬時のアクセス、信頼性、及び簡単で直感的な機能は、それに付属する鍵となる性質である。
現在存在するビデオコラボレーション製品の幾つかは、以下の通りである。
マイクロソフト ネットミーティング。それを使用しようと試みる誰もがその限界を知る。耐え難いほど遅い。そのビデオは、利用不可能に近い。オーディオは、低質である。ユーザインターフェイスは、基本的なコールを除いて全て理解し難い。
ポリコム ViaVideoTM。ViaVideoTM は、H.323機器であり、モニタ上部のハウジング内にカメラと、ある種のオーディオ処理とを含んでおり、PCとUSB接続をする。その製品は、最大で384KまでのレートのH.261品質のビデオを生成し、該ビデオは、PCスクリーンにウインドウで出力されて、ユーザインターフェイス用に、IR遠隔制御はスクリーンエミュレーションされる。ビデオは満足できるが、カメラは比較的貧弱である。オーディオ品質は満足でき、エコーキャンセルは使用可能である。しかし、全体的な印象は、効果的な通信に必要なトランスペアレンシーに達していない。そのビデオが行うことは、ビデオ品質のレベルを600$程度の新たなプライスポイントで提供することである。プレゼンス、電話の組込み、及びCTIはない。PCスクリーンのウインドウサイズは、他に行えることを制限する。
Webexは、ウェブべースの会議を行う製品であり、本質的にサービスとして提供される。現在の製品は、インターネット(大文字I)ベースであるので、それに伴う主要な問題は帯域幅である。現在の実施形態は、サーバーベースであり、このことによって、それにできることが制限される。Webexは、ネットミーティングよりもさらに素朴な共有サーフェスオプションを有しており、オーディオは低品質であり、ビデオ、CTI、プレセンス等は有していない。
Teraglobalは、アップルプラットホームをベースにしており、ビデオフォンとしては存在せずに、通信を機能の1つとする統合的なアプリケーションプラットホームをベースとしている。その技術は、このプラットホームと、基礎を成しており、それが実現される「デジタルDNA」モトローラパワーPCプロセッサとに密接に関係している。その統合的な製品は、独自仕様であって、他の如何なる要素とも共通性がない。彼らは、必要な統合化を行うために、彼ら自身のe−メール、カレンダ及びスケジュールプログラムを構築するより仕方がなかった。(それらは、帯域幅を1.5Mbits/secに制限していることを考えると)それは、品質を有している。その調査ツールの会議制御機能及びこれと似た機能は、それを大きな会議ドメインに置く。グループコラボレーションは、このような機能を必要とせず、参加者の数が極めて少ない場合と比較して、多くの参加者がユーザの知識を低下させることに対応する必要もない。例えば、通常の会議のプレゼンテーションでは、セミオートマチックで「伝達される(handed-off)」話し手の大きな映像が1つあり、他の参加者のサムネイルは、数秒毎に更新される。
本発明は、幾つかの端末(装置)と、それら装置内に設けられない特徴を与える1組のサーバと、現存する設備と、外部のPSTNサービスとに製品を接続する一組のゲートウェイとで構成されている、本発明で与えられる基本的な機能は、以下の通りである。
≡ 「オンネット(on-net)」の全てのコールでビデオが利用でき、オーディオとビデオの品質が非常に高いテレフォニーサービス。
≡ オーディオ及びビデオに関しており、臨機応変であり又は予め計画されており、完全にセルフサービスであって、テレフォニーサービスに完全に組み込まれたマルチパーティー会議サービス。
≡ コラボレーションの利用可能性を決定する種々のツールを伴うプレゼンスサービス。
≡ 共有サーフェスサービス−−電子ホワイトボード、アプリケーションの共有、ドキュメントの共有、関係するPC上でリンクされたアプリケーションによるプレゼンテーションの配信。
≡ ブロードキャストなビデオTV配信のような、価値のあるその他の付加的なサービス。
本発明は、劇的な新しい機能を電話に与えるものであり、コンピュータに電話が行うことをさせるものではない。このことによって、得意とする事柄について、コンピュータの完全な同時使用が可能となり、一方で、通信について、フレキシブルであるが特定用途向けの機器が得られる。ユーザインターフェイスと、物理的デザインとが、この用途について調整されて、PCではなく、現在の電話のように、瞬時にオンできて、信頼性が高い通信デバイスを提供する。また、このアプローチによって、デバイスの動作環境が管理されて、PCのハードウエア及びソフトウエアの構成問題に関したサポートの問題が排除される。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得るイメージング手段を具えている。ビデオフォンは、シーンの第1ビデオストリームと、シーンの第2ビデオストリームとをビデオ画像から生成して、第1ビデオストリーム及び第2ビデオストリームをネットワーク上に同時に送る生成手段とを具える。生成手段は、イメージング手段と通信する。生成手段は、シーンの複数のビデオストリームを生成できるのが好ましく、ビデオストリームの各々は異なっているのが好ましい。
本発明は、ビデオコールをする方法に関する。その方法は、シーンのビデオ画像を得る工程を具える。シーンの第1ビデオストリームと、シーンの第2ビデオストリームとをビデオ画像から生成する工程がある。第1ビデオストリームと第2ビデオストリームをネットワーク上に同時に送る工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンが異なる複数のビデオストリームをネットワークから受信する受信手段を具える。ビデオフォンは、複数のビデオストリームの異なるシーンを並べて表示する表示手段を具えている。受信手段は、表示手段と通信する。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンが異なる複数のビデオストリームをネットワークから受信する受信手段を具える。ビデオフォンは、複数のビデオストリームの異なるシーンを、様々な大きさの所定の領域に同時に表示する表示手段を具える。表示手段は、受信手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、シーンが異なる複数のビデオストリームを、ネットワークから受信する工程を具えている。複数のビデオストリームの異なるシーンを、様々な大きさの所定の領域に同時に表示する工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、テレビジョンチャンネルのビデオストリームを少なくとも1つ含んでおり、シーンが異なる複数のビデオストリームを、ネットワークから受信する受信手段を具える。ビデオフォンは、テレビジョンチャンネルの隣に、複数のビデオストリームのシーンの少なくとも1つを表示する表示手段を具えている。表示手段は、受信手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、テレビジョンチャンネルのビデオストリームを少なくとも1つ含んでおり、シーンが異なる複数のビデオストリームをネットワークから受信する工程を具える。テレビジョンチャンネルの隣に、複数のビデオストリームのシーンの少なくとも1つを表示する工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得るイメージング手段を具えている。ビデオフォンは、ビデオ画像から、シーンのビデオストリームを、好ましくはシーンの複数のビデオストリームを生成して、会議ブリッジ又はMCUを用いることなく、複数の送り先に向けて、シーンの1又は複数のビデオストリームをネットワーク上に同時に送信する生成手段を具えている。生成手段は、イメージング手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を含む。シーンのビデオストリームをビデオ画像から生成する工程がある。会議ブリッジ又はMCUを用いることなく、複数の送り先に向けて、シーンのビデオストリームをネットワーク上に同時に送信する工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得るイメージング手段を具えている。ビデオフォンは、連続的なPを用いて、シーンのビデオストリームをビデオ画像から生成して、ネットワークにビデオストリームを送る生成手段を具えており、生成手段は、イメージング手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。連続的なPを用いて、シーンのビデオストリームをビデオ画像から生成し、ネットワークにビデオストリームを送る工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得るイメージング手段を具えている。ビデオフォンは、シーンのビデオストリームをビデオ画像から生成して、ビデオフォンのユーザがない場合にシーンの領域をクリップして、ネットワークにビデオストリームを送る生成手段を具えている。生成手段は、イメージング手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。シーンのビデオストリームをビデオ画像から生成する工程がある。ビデオフォンのユーザがない場合にシーンの領域をクリップする工程がある。ネットワークにビデオストリームを送る工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得るイメージング手段を具えている。ビデオフォンは、ビデオ画像からシーンのビデオストリームを生成し、シーンのオーディオストリームを生成し、ネットワークにビデオストリームを送り、シーンにて所定の閾値を超えたノイズがある場合にのみ、ネットワークにオーディオストリームを送る生成手段を具えている。生成手段は、イメージング手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。シーンのビデオストリームをビデオ画像から生成し、シーンのオーディオストリームを生成する工程がある。ネットワークにビデオストリームを送り、シーンにて所定の閾値を超えたノイズがある場合にのみ、ネットワークにオーディオストリームを送る工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得るイメージング手段を具えている。ビデオフォンは、シーンのビデオストリームをビデオ画像から生成し、パケット化の目的を除いて、ビデオストリームのフレームバッファリング無しで、ビデオストリームをネットワークに送る生成手段を具えている。生成手段は、イメージング手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。ビデオフォンは、シーンのビデオストリームをビデオ画像から生成し、パケット化の目的を除いて、ビデオストリームのフレームバッファリング無しで、ビデオストリームをネットワークに送る工程がある。
本発明は、ネットワーク用のプレゼンスセンサ(presence sensor)に関する。プレゼンスセンサは、人物がシーンに存在するか否かを示すプレゼンスインジケータを生成する生成手段を具えている。プレゼンスセンサは、プレゼンスインジケータをネットワークに送信する送信手段を具えている。送信手段は、生成手段と通信する。センサは、所定の時間内にプレゼンスインジケータが生成されようとしている旨を、シーンの人物に警告する手段を具えるのが好ましい。
本発明は、ネットワークで人の存在を検知する方法に関する。その方法は、人物がシーンに存在するか否かを示すプレゼンスインジケータを生成する工程を具える。プレゼンスインジケータをネットワークに送信する工程がある。所定の時間内にプレゼンスインジケータが生成されようとしている旨を、シーンの人物に警告する工程があるのが好ましい。
本発明は、ビデオコールをするためのタッチスクリーン用のページに関する。ぺージは、パーソナルコンタクトのリストと、それらに関連する、ビデオフォン、フォン(SIPが好ましい)、電話番号、又はアクセスする通常のフォンのアドレス(SIPが好ましい)とを具える。ページは、各コンタクトに関するボタンを具えており、タッチされるとそのボタンに関するコンタクトにコールを申し込む。ページは、各コンタクトに関係しており、そのコンタクトが関係する(ビデオ)フォンにあるか否かを示すプレゼンスインジケータを含むのが好ましい。
本発明は、ビデオコールをする方法に関する。その方法はコンタクトに関するタッチスクリーンのページ上のボタンをタッチする工程を具える。ボタンに関係するアドレスで、コンタクトにビデオコールを申し込む工程がある。各コンタクトに関係しており、そのコンタクトが、関係する(ビデオ)フォンにて存在し、利用できるか否かを示すプレゼンスインジケータを表示する工程があるのが好ましい。
本発明は、人物又はコンタクトと通信する方法に関する。その方法は、人物のアドレス又は電話番号をコールする工程を具える。ビデオフォンで指示された場合、ビデオメッセージをビデオフォンに残す工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、ビデオコールをかける人に指示してビデオメッセージを残す手段を具える。ビデオフォンは、見られることが望まれるまで、ビデオメッセージを保存する手段を具える。
本発明は、ビデオフォンに関する。ビデオフォンは、解像度が少なくとも640×480であるシーンのビデオストリームを、好ましくは、少なくとも640×480ピクセルであり、遅延が100ms未満であり、フレームレートが1秒間に少なくとも25フレームであるシーンのビデオストリームを生成する手段を具えている。ビデオフォンは、全二重であって、ステレオエコーキャンセルが施されるシーンのオーディオストリームを生成する手段を具えている。
本発明は、人物と通信する方法に関する。その方法は、解像度が少なくとも640×480のシーンのビデオストリームを、好ましくは、少なくとも720×480ピクセルであり、遅延が100ms未満であり、フレームレートが、1秒間に少なくとも25フレームであるシーンのビデオストリームを生成する工程を具えている。全二重であって、ステレオエコーキャンセルが施されるシーンのオーディオストリームを生成する工程がある。人物のビデオフォンに、ビデオストリーム及びオーディオストリームを送信する工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、ネットワークから受信したビデオストリームを表示するディスプレイスクリーンを具えている。ビデオフォンは、シーンから音を受け取るマイクロホン手段を具えている。ビデオフォンは、ネットワークから受信したオーディオストリームをシーンに再生するスピーカ手段を具えている。ビデオフォンは、スピーカ手段で生成されるシーンへのノイズをモニタして、スピーカ手段で生成されるノイズを所望のレベルに維持するようにスピーカ手段を調節するモニタ手段を具えている。モニタ手段は、スピーカ手段及びマイクロホン手段と通信する。
本発明は、ビデオフォンを動作させる方法に関する。その方法は、ディスプレイスクリーンに、ネットワークから受信したビデオストリームを表示する工程を具える。マイクロホン手段でシーンから音を受け取る工程がある。ネットワークから受信したオーディオストリームを、スピーカ手段でシーンに再生する工程がある。スピーカ手段で生成されるシーンへのノイズをモニタして、スピーカ手段で生成されるノイズを所望のレベルに維持するようにスピーカ手段を調節する工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、送り先にビデオコールをするための音声コマンドを認識する手段を具える。ビデオフォンは、ビデオコールをして、その音声コマンドを用いて、そのビデオコールを送り先にアナウンスする手段を具えている。
本発明は、ビデオコールをする方法に関する。その方法は、ビデオフォンを用いて、送り先にビデオコールをするための音声コマンドを認識する工程を具える。ビデオフォンを用いてビデオコールをして、その音声コマンドを用いて、そのビデオコールを送り先にアナウンスする工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、別個に設けられた複数のディスプレイスクリーンを具えている。ビデオフォンは、複数のスクリーンが連続的な1つのスクリーンであるかのように、複数のスクリーン上に、ネットワークから受信した複数のビデオストリームの異なるシーンを同時に表示する表示手段を具えている。表示手段は、複数のディスプレイスクリーンと通信する。
本発明は、ビデオコールを得る方法に関する。その方法は、シーンが異なる複数のビデオストリームを受信する工程を具える。複数のスクリーンが連続的な1つのスクリーンであるかのように、互いに接続された複数のディスプレイスクリーン上に、複数のビデオストリームの異なるシーンを同時に表示する工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得る第1イメージング手段を具えている。ビデオフォンは、第1イメージング手段とは異なるシーンのビデオ画像を得る第2イメージング手段を具えている。ビデオフォンは、第1イメージング手段又は第2イメージング手段で得られたビデオ画像のどちらか一方から、シーンの少なくとも1つのビデオストリームを、好ましくは複数のストリームを生成して、ネットワーク上に1又は2以上のビデオストリームを送信する生成手段を具えている。生成手段は、第1イメージング手段又は第2イメージング手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、第1イメージング手段でシーンのビデオ画像を得る工程を具える。第2イメージング手段でシーンのビデオ画像を得る工程がある。第1イメージング手段又は第2イメージング手段で得られたビデオ画像のどちらか一方から、シーンのビデオストリームを生成して、ネットワーク上にビデオストリームを送信する工程がある。
本発明は、会議を開催する装置に関する。その装置は、ネットワークから、異なる場所から送られるノイズに関連するNつのオーディオストリームを受信する。ここで、Nは、2より大きい、又は2と等しい整数である。装置は、NつのオーディオストリームからMつのオーディオストリームを選択する手段を具えている。ここで、Mは、Nより小さい、又はNと等しい整数である。その装置は、Mつのオーディオストリームをミキシングして再生する手段を具えている。
本発明は、会議を開催するシステムに関する。システムは、ネットワークを具える。システムは、ネットワークを通じて互いに接続されたNつのノードを具えている。ここで、Nは、3よりも大きく、又は3と等しい整数である。各ノードは、そのノードでノイズが閾値を超えた場合、オーディオストリームをネットワークに送信する。各ノードは、Nつのノードから送られるMつのオーディオストリームを再生する。ここで、Mは、Nよりも小さい整数である。各ノードは、所定の時間にそのノードで再生されるMつのオーディオストリームのノイズレベルに基づいて、その時間のそれぞれの閾値を決定する。閾値は動的であり、独立に決定されて、Nつのノード間に分布する。各ノードは、他の任意のノードが再生しているMつのオーディオストリームを必ずしも再生しない。
本発明は、会議を開催する方法に関する。その方法は、異なる場所から送られるノイズに関係するNつのオーディオストリームを、ネットワークから受信する工程を具えている。ここで、Nは、3より大きい、又は3に等しい整数である。NつのオーディオストリームからMつのオーディオストリームを選択する工程がある。ここで、Mは、Nより小さく、又はNに等しい整数である。Mつのオーディオストリームをミキシングして再生する工程がある。
本発明は、会議を開催する装置に関する。その装置は、所定の時間にてオーディオストリームに閾値を超えるノイズがある場合、ネットワークにオーディオストリームを送る手段を具えている。装置は、所定の時間にネットワークから受信する複数のオーディオストリームのノイズの関数として、閾値を動的に決定する手段を具える。
本発明は、会議を開催する方法に関する。その方法は、ネットワークから受信する複数のオーディオストリームのノイズの関数として閾値を動的に決定し、オーディオストリームをネットワークに送る工程を具えている。オーディオストリームに閾値を超えたノイズがある場合、ネットワークにオーディオストリームを送信する工程がある。
図を参照すると、幾つかの図を通じて類似又は同じ部分には、同様な符号が用いられている。特に、図1、図8及び図10には、ビデオフォン(15)が示されている。ビデオフォン(15)は、シーンのビデオ画像を得るイメージング手段(30)を具えている。ビデオフォン(15)は、シーンの第1ビデオストリーム及び第2ビデオストリームをビデオ画像から生成し、第1ビデオストリーム及び第2ビデオストリームを同時にネットワーク(40)に送信する生成手段を具えている。その生成手段は、イメージング手段(30)と通信する。生成手段は、シーンの複数のビデオストリームを生成できるのが好ましく、各ビデオストリームは異なっているのが好ましい。生成手段は、イメージング手段(30)と通信するエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と、フィールドゲートアレイ(38)と通信するネットワークインターフェイス(42)とを含んでいるのが好ましい。
本発明は、ビデオコールをする方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。シーンの第1ビデオストリームと、シーンの第2ビデオストリームとをビデオ画像から生成する工程がある。第1ビデオストリーム及び第2ビデオストリームを、ネットワーク(40)に同時に送信する工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、シーンが異なる複数のビデオストリームを、ネットワーク(40)から受信する受信手段を具える。ビデオフォン(15)は、複数のビデオストリームの異なるシーンを並べて表示する表示手段を具える。受信手段は表示手段と通信する。受信手段は、ネットワークインターフェイス(42)を含んでおり、表示手段は、ネットワークインターフェイス(42)と通信するディスプレイコントローラ(52)と、ディスプレイコントローラ(52)と通信するディスプレイスクリーン(54)とを含んでいるのが好ましい。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、シーンが異なる複数のビデオストリームをネットワーク(40)から受信する受信手段を具える。ビデオフォン(15)は、複数のビデオストリームの異なるシーンを、様々な大きさの所定の領域に同時に表示する表示手段を具える。表示手段は、受信手段と通信する。受信手段は、ネットワークインターフェイス(42)を含み、表示手段は、ネットワークインターフェイス(42)と通信するディスプレイコントローラ(52)と、ディスプレイコントローラ(52)と通信するディスプレイスクリーン(54)とを含んでいるのが好ましい。
本発明は、ビデオコールの方法に関する。その方法は、シーンが異なる複数のビデオストリームをネットワーク(40)から受信する工程を具える。複数のビデオストリームの異なるシーンを、様々な大きさの所定の領域に同時に表示する工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、テレビジョンチャンネルのビデオストリームを少なくとも1つ含んでおり、シーンが異なる複数のビデオストリームを、ネットワーク(40)から受信する受信手段を具える。ビデオフォン(15)は、テレビジョンチャンネルの隣に、複数のビデオストリームのシーンの少なくとも1つを表示する表示手段を具えている。表示手段は受信手段と通信する。受信手段は、ネットワークインターフェイス(42)及びデコーダ(34)を含むのが好ましい。表示手段は、ネットワークインターフェイス(42)及びデコーダ(34)と通信するディスプレイコントローラ(52)と、ディスプレイコントローラ(52)と通信するディスプレイスクリーン(54)とを具えるのが好ましい。
本発明は、ビデオコールの方法に関する。その方法は、テレビジョンチャンネルのビデオストリームを少なくとも1つ含んでおり、シーンが異なる複数のビデオストリームを、ネットワーク(40)から受信する工程を具える。テレビジョンチャンネルの隣に、複数のビデオストリームのシーンの少なくとも1つを表示する工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、シーンのビデオ画像を得るイメージング手段(30)を具えている。ビデオフォン(15)は、ビデオ画像から、シーンのビデオストリームを、好ましくはシーンの複数のビデオストリームを生成して、会議ブリッジ又はMCUを用いることなく、複数の送り先に向けて、シーンの1又は複数のビデオストリームをネットワーク(40)上に同時に送信する生成手段を具えている。生成手段は、イメージング手段(30)と通信する。生成手段は、イメージング手段(30)と通信するエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と、フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えているのが好ましい。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。シーンのビデオストリームをビデオ画像から生成する工程がある。会議ブリッジ又はMCUを用いることなく、複数の送り先に向けて、ネットワーク(40)上に、シーンのビデオストリームを同時に送信する工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、シーンのビデオ画像を得るイメージング手段(30)を具えている。ビデオフォン(15)は、連続的なPを用いて、シーンのビデオストリームをビデオ画像から生成し、ネットワーク(40)にビデオストリームを送る生成手段を具えており、生成手段は、イメージング手段(30)と通信する。生成手段は、イメージング手段(30)と通信するエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と、フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えているのが好ましい。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。連続的なPを用いて、シーンのビデオストリームをビデオ画像から生成し、ネットワーク(40)にビデオストリームを送る工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、シーンのビデオ画像を得るイメージング手段(30)を具えている。ビデオフォン(15)は、シーンのビデオストリームをビデオ画像から生成して、ビデオフォン(15)のユーザがないシーンの領域をクリップして、ネットワーク(40)にビデオストリームを送る生成手段を具えている。生成手段は、イメージング手段(30)と通信する。生成手段は、メインコントローラ(50)と、イメージング手段(30)及びメインコントローラ(50)と通信するエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と、フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えているのが好ましい。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。シーンのビデオストリームをビデオ画像から生成する工程がある。ビデオフォン(15)のユーザがないシーンの領域をクリップする工程がある。ネットワーク(40)にビデオストリームを送る工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、シーンのビデオ画像を得るイメージング手段(30)を具えている。ビデオフォン(15)は、シーンのビデオストリームをビデオ画像から生成し、シーンのオーディオストリームを生成し、ネットワーク(40)にビデオストリームを送って、シーンにて所定の閾値を超えたノイズがある場合にのみ、ネットワーク(40)にオーディオストリームを送る生成手段を具えている。生成手段は、イメージング手段(30)と通信する。生成手段は、メインコントローラ(50)と、イメージング手段(30)及びメインコントローラ(50)と通信するエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と、フィールドプログラマブルゲートアレイ(38)及びメインコントローラ(50)と通信するDSP(62)と、フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えているのが好ましい。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。ビデオ画像からシーンのビデオストリームを生成し、シーンのオーディオストリームを生成する工程がある。ネットワーク(40)にビデオストリームを送り、シーンにて所定の閾値を超えたノイズがある場合にのみ、ネットワーク(40)にオーディオストリームを送る工程がある。
本発明は、ビデオフォンに関する。ビデオフォンは、シーンのビデオ画像を得るイメージング手段を具えている。ビデオフォンは、シーンのビデオストリームをビデオ画像から生成し、パケット化の目的を除いて、ビデオストリームのフレームバッファリング無しで、ビデオストリームをネットワークに送る生成手段を具えている。生成手段は、イメージング手段と通信する。
本発明は、ビデオコールの方法に関する。その方法は、シーンのビデオ画像を得る工程を具えている。ビデオフォンは、シーンのビデオストリームをビデオ画像から生成し、パケット化の目的を除いて、ビデオストリームのフレームバッファリング無しで、ビデオストリームをネットワーク(40)に送る工程がある。
本発明は、図12に示す、ネットワーク(40)用のプレゼンスセンサ(76)に関する。プレゼンスセンサ(76)は、人物がシーンに存在するか否かを示すプレゼンスインジケータを生成する生成手段を具えている。プレゼンスセンサ(76)は、プレゼンスインジケータをネットワーク(40)に送信する送信手段を具えている。送信手段は生成手段と通信する。センサ(76)は、所定の時間内にプレゼンスインジケータが生成されようとしている旨を、シーンの人物に警告する手段を具えるのが好ましい。インジケータ生成手段は、イメージング手段(30)を含んでおり、送信手段は、イメージング手段(30)と通信するフィールドプログラマブルゲートアレイ(38)と、フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えている。
本発明は、ネットワーク(40)で人を検知する方法に関する。その方法は、人物がシーンに存在するか否かを示すプレゼンスインジケータを生成する工程を具える。プレゼンスインジケータをネットワーク(40)に送信する工程がある。所定の時間内にプレゼンスインジケータが生成されようとしている旨を、シーンの人物に警告する工程があるのが好ましい。
本発明は、図13に示すように、ビデオコールをするためのタッチスクリーン用のページ(78)に関する。ぺージ(78)は、ビデオフォンの電話番号のリスト(77)を具える。ページは、各電話番号に関したデジグネータ(designator)を具えており、タッチされるとそのデジグネータに関する電話番号にビデオコールを申し込む。ページ(78)は、各電話番号に関するプレゼンスインジケータ(79)を含んでおり、プレゼンスインジケータ(79)は、その電話番号に関するビデオフォン(15)に、人物がいるか否かを示すのが好ましい。プレゼンスインジケータ(79)は、各ビデオフォン(15)のシーンの画像とすることができる。
本発明は、ビデオコールをする方法に関する。その方法は、ビデオフォン(15)の電話番号に関するタッチスクリーンのページ上のボタンをタッチする工程を具える。ボタンに関連した電話番号で、ビデオフォン(15)にビデオコールを申し込む工程がある。ビデオフォン(15)の各電話番号に関係するプレゼンスインジケータであって、その電話番号に関するビデオフォン(15)に人物がいる否かを示すプレゼンスインジケータを表示する工程があるのが好ましい。
本発明は、人物と通信する方法に関する。その方法は、人物のビデオフォン(15)の電話番号にコールする工程を具える。ビデオフォン(15)で指示された場合、ビデオメッセージをビデオフォン(15)に残す工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、ビデオコールをかける人に指示してビデオメッセージを残す指示手段を具える。ビデオフォン(15)は、見られることを希望されるまで、ビデオメッセージを保存する保存手段を具える。指示手段は、ビデオフォンと通信するサーバ(66)を含んでいるのが好ましく、保存手段は、サーバ(66)と通信するビデオメッセージメモリを含むのが好ましい。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、解像度が少なくとも640×480であるシーンのビデオストリームを、好ましくは少なくとも640×480ピクセルであり、遅延が100ms未満であり、フレームレートが1秒間に少なくとも25フレームである、シーンのビデオストリームを生成する生成手段を具えている。ビデオフォン(15)は、全二重であって、ステレオエコーキャンセルが施されるシーンのオーディオストリームを生成する手段を具えている。 ビデオストリーム生成手段は、イメージング手段(30)と、該イメージング手段(30)と通信するエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と、フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えているのが好ましい。オーディオストリーム生成手段は、マイクロホン手段と、マイクロホン手段と通信するオーディオインターフェイスと、オーディオインターフェイス及びネットワークインターフェイス(42)と通信するDSP(62)とを具えているのが好ましい。
本発明は、人物と通信する方法に関する。その方法は、解像度が少なくとも640×480のシーンのビデオストリームを、好ましくは少なくとも720×480ピクセルであり、遅延が100ms未満であり、フレームレートが1秒間に少なくとも25フレームである、シーンのビデオストリームを生成する工程を具えている。全二重であって、ステレオエコーキャンセルが施されるシーンのオーディオストリームを生成する工程がある。人物のビデオフォン(15)に、ビデオストリーム及びオーディオストリームを送信する工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、ネットワーク(40)から受信したビデオストリームを表示するディスプレイスクリーン(54)を具えている。ビデオフォン(15)は、シーンから音を受け取るマイクロホン手段を具えている。ビデオフォン(15)は、ネットワーク(40)から受信したオーディオストリームをシーンにて再生するスピーカ手段を具えている。ビデオフォン(15)は、スピーカ手段で生成されるシーンへのノイズをモニタして、スピーカ手段で生成されるノイズを所望のレベルに維持するようにスピーカ手段を調節するモニタ手段とを具えている。モニタ手段は、スピーカ手段及びマイクロホン手段と通信する。マイクロホン手段は、マイクロホンアレイを含むのが好ましい。スピーカ手段は、複数のスピーカを含むのが好ましい。モニタ手段は、DSP(62)と、該DSP(62)と通信するメインコントローラ(50)とを含むのが好ましい。
本発明は、ビデオフォン(15)を動作させる方法に関する。その方法は、ディスプレイスクリーン(54)に、ネットワーク(40)から受信したビデオストリームを表示する工程を具える。マイクロホン手段でシーンから音を受け取る工程がある。ネットワーク(40)から受信したオーディオストリームを、スピーカ手段でシーンに再生する工程がある。スピーカ手段で生成されるシーンへのノイズをモニタして、スピーカ手段で生成されるノイズを所望のレベルに維持するようにスピーカ手段を調節する工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、送り先にビデオコールをするための音声コマンドを認識する認識手段を具える。ビデオフォン(15)は、ビデオコールをして、その音声コマンドを用いて、そのビデオコールを送り先にアナウンスする手段を具えている。認識手段は、マイクロホン手段と、該マイクロホン手段と通信するDSP(62)と、DSP(62)と通信するメインコントローラ(50)とを具えているのが好ましい。コールをする手段は、メインコントローラ(50)及びDSP(62)と、該メインコントローラ(50)及びDSP(62)と通信するフィールドプログラマブルゲートアレイ(38)と、フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えているのが好ましい。
本発明は、ビデオコールをする方法に関する。その方法は、ビデオフォン(15)を用いて送り先にビデオコールをするための音声コマンドを認識する工程を具える。ビデオフォン(15)を用いてビデオコールをして、その音声コマンドを用いて、そのビデオコールを送り先にアナウンスする工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、別個に設けられた複数のディスプレイスクリーン(54)を具えている。ビデオフォン(15)は、複数のスクリーンが連続的な1つのスクリーンであるかのように、ネットワーク(40)から受信した複数のビデオストリームの異なるシーンを、複数のスクリーン上に同時に表示する表示手段を具えている。表示手段は、複数のディスプレイスクリーン(54)と通信する。表示手段は、メインコントローラ(50)と、該メインコントローラ(50)及び別個の複数のディスプレイスクリーン(54)と通信するディスプレイコントローラ(52)と、該ディスプレイコントローラ(52)と通信するネットワークインターフェイス(42)とを具えているのが好ましい。
本発明は、ビデオコールを得る方法に関する。その方法は、シーンが異なる複数のビデオストリームを受信する工程を具える。複数のスクリーンが連続的な1つのスクリーンであるかのように、互いに接続された複数のディスプレイスクリーン(54)上に、複数のビデオストリームの異なるシーンを同時に表示する工程がある。
本発明は、ビデオフォン(15)に関する。ビデオフォン(15)は、シーンのビデオ画像を得る第1イメージング手段(30)を具えている。ビデオフォン(15)は、第1イメージング手段(30)とは異なるシーンのビデオ画像を得る第2イメージング手段(30)を具えている。ビデオフォン(15)は、第1イメージング手段(30)又は第2イメージング手段(30)で得られたビデオ画像のどちらか一方から、シーンのビデオストリームを生成して、ネットワーク(40)上に1又は2以上のビデオストリームを送信する生成手段とを具えている。生成手段は、第1イメージング手段(30)又は第2イメージング手段(30)と通信する。生成手段は、メインコントローラ(50)と、第1イメージング手段(30)、第2イメージング手段(30)及びメインコントローラ(50)と通信するエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と、該フィールドプログラマブルゲートアレイ(38)と通信するネットワークインターフェイス(42)とを具えるのが好ましい。
本発明は、ビデオコールの方法に関する。その方法は、第1イメージング手段(30)でシーンのビデオ画像を得る工程を具える。第2イメージング手段(30)でシーンのビデオ画像を得る工程がある。第1イメージング手段(30)又は第2イメージング手段(30)で得られたビデオ画像のどちらか一方から、シーンのビデオストリームを生成して、ネットワーク(40)上にビデオストリームを送信する工程がある。
本発明は、図14に示すように、会議を開催する装置(80)に関する。その装置は、ネットワーク(40)から、異なる場所から送られるノイズに関するNつのオーディオストリームを受信する受信手段を具えている。ここで、Nは、3より大きい、又は3と等しい整数である。装置は、NつのオーディオストリームからMつのオーディオストリームを選択する選択手段を具えている。ここで、Mは、Nより小さい、又はNと等しい整数である。その装置は、Mつのオーディオストリームをミキシングして再生する手段を具えている。
受信手段は、異なる場所から送られる画像に関するP個のビデオストリームを受信するのが好ましい。ここで、Pは3より大きい又は3と等しい整数である。選択手段は、P個のビデオストリームから、S個のビデオストリームを選択するのが好ましく、S個のビデオストリームを再生する手段があるのが好ましい。ここで、Sは、Pより小さい整数である。装置は、ローカルなオーディオストリームが閾値を超えた場合に、そのローカルなオーディオストリームをネットワーク(40)に送る送信手段を具えているのが好ましい。閾値は動的であって、選択手段で選択されたMつのオーディオストリームのノイズレベルに基づいて、閾値を決定する決定手段があるのが好ましい。決定手段は、その閾値を、Mつのオーディオストリームに関するMつの異なる場所で受信される閾値に基づいて決定するのが好ましい。送信手段は、ネットワークインターフェイス(42)と、該ネットワークインターフェイス(42)と通信するフィールドプログラマブルゲートアレイ(38)と、該フィールドプログラマブルゲートアレイ(38)と通信するDSP(62)とを具えているのが好ましい。決定手段は、DSP(62)を含んでいるのが好ましい。受信手段は、ネットワークインターフェイス(42)と、該ネットワークインターフェイス(42)と通信するフィールドプログラマブルゲートアレイ(38)と、該フィールドプログラマブルゲートアレイ(38)と通信するDSP(62)とを具えているのが好ましい。選択手段及びミキシング手段は、DSP(62)を含むのが好ましい。
本発明は、会議を開催するシステムに関する。システムは、ネットワーク(40)を具えている。システムは、ネットワーク(40)を通じて互いに接続されたNつのノードを具えている。ここで、Nは、3よりも大きく、又は3と等しい整数である。各ノードは、そのノードでノイズが閾値を超えた場合、オーディオストリームをネットワーク(40)に送信する。各ノードは、Nつのノードから送られるMつのオーディオストリームを再生する。ここで、Mは、Nよりも小さい整数である。各ノードは、所定の時間にそのノードで再生されるMつのオーディオストリームのノイズレベルに基づいて、その時間の各々の閾値を決定する。閾値は動的であり、独立に決定されて、Nつのノード間に分布している。各ノードは、他の任意のノードが再生しているMつのオーディオストリームを必ずしも再生しない。
本発明は、会議を開催する方法に関する。その方法は、異なる場所から送られるノイズに関係するNつのオーディオストリームを、ネットワーク(40)から受信する工程を具えている。ここで、Nは、3より大きい、又は3に等しい整数である。NつのオーディオストリームからMつのオーディオストリームを選択する工程がある。ここで、Mは、Nより小さく、又はNに等しい整数である。Mつのオーディオストリームをミキシングして再生する工程がある。
本発明は、会議を開催する装置に関する。その装置は、所定の時間にてオーディオストリームに閾値を超えるノイズがある場合、ネットワーク(40)にオーディオストリームを送信する送信手段を具えている。装置は、所定の時間にネットワーク(40)から受信する複数のオーディオストリームのノイズの関数として、閾値を動的に決定する決定手段を具える。送信手段は、ネットワークインターフェイス(42)と、該ネットワークインターフェイス(42)と通信するフィールドプログラマブルゲートアレイ(38)と、該フィールドプログラマブルゲートアレイ(38)と通信するDSP(62)とを具えているのが好ましい。決定手段は、DSP(62)を具えているのが好ましい。
本発明は、会議を開催する方法に関する。その方法は、ネットワーク(40)から受信する複数のオーディオストリームのノイズの関数として、閾値を動的に決定し、オーディオストリームをネットワーク(40)に送る工程を具えている。オーディオストリームに閾値を超えたノイズがある場合、ネットワーク(40)にオーディオストリームを送信する工程がある。
本発明は、電気通信システム(10)に関する。システム(10)は、ネットワーク(40)を含む。システム(10)は、ネットワーク(40)を通じて互いに通信する第1ノード(80)と、第2ノード(82)と、少なくとも第3ノード(84)とを具える。第1ノード(80)は、該第1ノード(80)でのシーンの第1ビデオストリームと、該第1ノード(80)でのシーンの第2ビデオストリームと、該第1ノード(80)でのシーンのオーディオストリームとを、第2及び第3ノード(84)に送る。第2及び第3ノード(84)は、オーディオストリームと、第1ビデオストリーム又は第2ビデオストリームの何れか一方とを再生する。
第1ビデオストリームのフレームレートは、1秒当たり25フレームよりも大きく、第2ビデオストリームのフレームレートは、1秒当たり25フレームよりも小さいのが好ましい。第1ビデオストリームのビットレートは、1秒当たり1.5Mbitsよりも大きく又はそれに等しく、第2ビデオストリームのフレームレートは、1秒当たり1.5Mbitsよりも小さいのが好ましい。第2及び第3ノード(84)は、ディスプレイスクリーンを有しているのが好ましく、第2又は第3ノード(84)が第1ビデオストリームを表示する場合、それらは、スクリーンの20%より大きい又はそれに等しい領域に渡る大きな画像として、第1ビデオストリームを表示し、第2及び第3ノード(84)が第2ビデオストリームを表示する場合、それらは、スクリーンの20%より小さい領域に渡る小さな画像として、第2ビデオストリームを表示する。システム(10)は、ネットワーク(40)を通じて、第1、第2及び第3ノード(84)と通信する第4ノードを含むのが好ましく、該第4ノードは、第1、第2及び第3ノード(84)に、デレビジョンチャンネルのテレビジョンビデオストリームを送信する。第1、第2及び第3ノード(84)は、第1ビデオストリームと並べてデレビジョンビデオストリームをスクリーンに表示できる。
第2ノード(82)は、該第2ノード(82)のシーンの第1ビデオストリームと、該第2ノード(82)のシーンの第2ビデオストリームと、シーンのオーディオストリームとを、第3ノード(84)に送る。第3ノード(84)は、ディスプレイコントローラ(52)を有しており、該ディスプレイコントローラ(52)は、スクリーンに表れる画像を制御して、各ノードから送られる第1ビデオストリームの各々を、第3ノード(84)のスクリーンに並べて再生する。ネットワーク(40)は、イーサネット(登録商標)又はATMネットワーク(40)であるのが好ましい。第1及び第2ノード(82)の第1ビデオストリーム、第2ビデオストリーム及びオーディオストリームは、会議ブリッジやMCUを用いることなく、ビデオ会議コール用にネットワーク(40)に送られるのが好ましい。各ノードは、ビデオ会議コール用に、ATMポイントツーマルチポイントストリームを用いるのが好ましい。
第3ノード(84)は、第1又は第2ノード(82)から送られる第1又は第2ビデオストリームのどれを表示するかを予め決定するのが好ましい。第1又は第2ノード(82)における各々のシーンでユーザが話している場合、又は、第3ノード(84)が第1又は第2ノード(82)から送られるビデオストリームを表示することを予め決定していた場合、第3ノード(84)は、第1又は第2ノード(82)から送られるビデオストリームを表示することを選択する。第1及び第2ノード(82)から送られる第1ビデオストリームは、ネットワーク(40)で送られる場合に、MPEG−2フォーマットのような所望のフォーマットであるのが好ましい。第1及び第2ノード(82)は、連続的なPを用いて、第1及び第2ノード(82)の第1ビデオストリームを、MPEG−2フォーマットにするのが好ましい。第1及び第2ノード(82)は、第1及び第2ノード(82)のシーンの第1ビデオストリームを夫々クリップするのが好ましい。
第1及び第2ノード(82)は、各々のシーンにて、ユーザがいない場所に関する部分をビデオストリームから除去して、各々シーンの第1ビデオストリームをクリップするのが好ましい。第1及び第2ノード(82)のシーンにてノイズが閾値を超える場合にのみ、第1及び第2ノード(82)は、第1及び第2ノード(82)のシーンのオーディオストリームを夫々送るのが好ましい。第1ノード(80)は、自動的なプレゼンスセンサを有しており、該センサは、第1ノード(80)のシーンにユーザがいるか否かを判断して、ユーザが第1ノード(80)にいるか否かを示すプレゼンスインジケータを生成するのが好ましい。第1ノード(80)は、第2及び第3ノード(84)にプレゼンスインジケータを送るのが好ましい。第1ノード(80)は、警告信号を生成して、第1ノード(80)のシーンのあらゆるユーザに、プレゼンスインジケータが所定の時間内に形成されようとしていることを警告するのが好ましい。
第1ノード(80)は、第1シーンのビデオ画像を得て、ビデオストリームを生成するイメージング手段を含むのが好ましい。システム(10)は、イメージング手段と通信するエンコーダ(36)を含んでおり、該エンコーダ(36)は、フレームバッファリングを行うことなく、第1ビデオストリームをMPEG−2フォーマットに圧縮及びエンコードするのが好ましい。第1ノード(80)は、エンコーダ(36)と通信するフィールドプログラマブルゲートアレイ(38)を含み、該フィールドプログラマブルゲートアレイ(38)は、第1ビデオストリームをパケット化するのが好ましい。フィールドプログラマブルゲートアレイ(38)は、イメージング手段から第1ビデオストリームを受信し、第1ノード(80)の第2ビデオストリームを生成し、その第2ビデオストリームをパケット化するのが好ましい。第1ノード(80)は、フィールドプログラマブルゲートアレイ(38)及びネットワーク(40)と通信するネットワークインターフェイス(42)を含んでおり、第1ノード(80)の第1ビデオストリームをネットワーク(40)に転送し、第2ノード(82)から第1ビデオストリームを受信し、それをフィールドプログラマブルゲートアレイ(38)に送るのが好ましい。
第1ノード(80)は、第1シーンの音声を受け取って、第1ノード(80)のオーディオストリームを生成するマイクロホン手段を具えているのが好ましい。第1ノード(80)は、ネットワークインターフェイス(42)と通信して、第2ノード(82)から送られるオーディオストリームを再生するスピーカ手段を具えるのが好ましい。第1ノード(80)は、DSP(62)を含んでおり、該DSP(62)は、第1ノード(80)のオーディオストリームをパケット化し、そのオーディオストリームをフィールドプログラマブルゲートアレイ(38)に与えるのが好ましい。フィールドプログラマブルゲートアレイ(38)は、第1ノード(80)のオーディオストリームをネットワークインターフェイス(42)に転送し、該ネットワークインターフェイス(42)は、第1ノード(80)のオーディオストリームをネットワーク(40)に転送する。また、DSP(62)は、第2ノード(82)のオーディオストリームをフィールドプログラマブルゲートアレイ(38)から受信する。第1ノード(80)は、オーディオインターフェイス(60)を含んでおり、該オーディオインターフェイス(60)は、マイクロホン手段から第1ノード(80)のオーディオストリームを受信して、それをデジタル化してDSP(62)に与えるのが好ましい。オーディオインターフェイス(60)は、DSP(62)から受信した第2ノード(82)のオーディオストリームを、スピーカ手段が再生できるようにアナログ形式に変換するのが好ましい。
ネットワークインターフェイス(42)は、第1ノード(80)のオーディオストリーム及びビデオストリームのパケットに、それらがネットワーク(40)に送られる前にタイムスタンプを付すのが好ましい。また、ネットワークインターフェイス(42)は、タイムスタンプを用いて、第1ノード(80)が受信した第2ノード(82)のビデオストリーム及びオーディオストリームのパケットを並べるのが好ましい。これによって、第2ノード(82)のビデオストリーム及びオーディオストリームが、第1ノード(82)で再生される場合に、第2ノード(82)のシーンの画像に関係した音声が再生される。システム(10)は受信メモリを含むのが好ましく、第2ノード(82)から送られる第1ビデオストリームは、受信メモリに受信及び格納される。また、システム(10)は、ネットワークインターフェイス(42)に接続されたメインコントローラ(50)と、エンコーダ(36)と、フィールドプログラマブルゲートアレイ(38)と、それらを制御するDSP(62)とを含むのが好ましく、メインコントローラ(50)がネットワークインターフェイス(42)に指示すると、第2ノード(82)の第1ビデオストリームが選択されて、それが受信メモリに送られる。メインコントローラ(50)は、受信メモリに格納された第2ノードの第1ビデオストリームをデコード及び伸張して、それをディスプレイコントローラ(52)に送る。
第1ノード(80)は、ディスプレイコントローラ(52)に接続されたLCDコントローラを含んでおり、ディスプレイスクリーンは、LCDコントローラに接続されたパネルディスプレイを含んでいるのが好ましい。LCDコントローラは、ディスプレイコントローラ(52)から第2ノード(82)の第1ビデオストリームを受信し、第2ノード(82)の第1ビデオストリームをパネルに表示する準備をする。システム(10)は、タッチスクリーンを含んでいるのが好ましく、該スクリーン上には機能に関連したボタンがあり、タッチスクリーン及びメインコントローラ(50)に接続されたタッチスクリーンコントローラは、ユーザによってタッチスクリーン上でタッチされたボタンに関する情報をメインコントローラ(50)に転送する。第1ノード(80)は、デコーダ(34)を含むのが好ましく、該デコーダ(34)は、イメージング手段から送られた第1ノード(80)のシーンの第1ビデオストリームを、デジタル形式に変換して、それをエンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)に与える。デコーダ(34)は、フィールドプログラマブルゲートアレイ(38)及びエンコーダ(36)に接続されており、テレビジョンビデオストリーム及びその他のアナログ形式のストリームを受信して、それらをデジタル形式に変換するのが好ましい。
カメラ手段は、デコーダ(34)と通信するアナログビデオカメラ、エンコーダ(36)及びフィールドプログラマブルゲートアレイ(38)と通信するデジタルビデオカメラ、又は、フィールドプログラマブルゲートアレイ(38)と通信するファイヤライン(fire wire)カメラを具えているのが好ましい。フィールドプログラマブルゲートアレイ(38)は、ファイヤラインカメラから受信した如何なるビデオストリームをもエンコーダ(36)に送る。DSP(62)は、第1ノード(80)のシーンのオーディオストリームにステレオエコーキャンセルを行うのが好ましい。エンコーダ(36)は、第1ノード(80)の第1ビデオストリームの解像度を少なくとも720×640ピクセルとするのが好ましく、マイクロホン手段及びスピーカ手段は全二重であるのが好ましい。DSP(62)は、スピーカ手段で生成されたノイズのレベルについてマイクロホン手段をモニタして、所望のノイズレベルを維持するようにスピーカ手段を調整するのが好ましい。メインコントローラ(50)は、ユーザのコマンドを認識して、ビデオ会議用に別のユーザに自動的にコールをし、そのコマンドを用いて、その他のユーザに、彼らがビデオ会議にリクエストされている旨をアナウンスするのが好ましい。
第1ノード(80)がビデオコールを受け入れられない場合に、第1ノード(80)にはビデオメールが有るのが好ましい。システム(10)はサーバ(66)を含んでおり、該サーバ(66)は、ネットワーク(40)及び第1ノード(80)と通信し、第1ノード(80)がビデオコールを受信しない場合に、第1ノード(80)のためにビデオコールを受信するのが好ましい。そして、サーバ(66)は、第1ノード(80)が受信しないビデオコールに関しるビデオメッセージを格納して、第1ノード(80)で見られることを待っているビデオメッセージがある旨のビデオコール待ちメッセージを、第1ノード(80)に送る。第1ノード(80)には、ディスプレイコントローラ(52)に接続された複数のディスプレイパネルがあるのが好ましく、異なるノードから送られる第1ビデオストリームの画像は、それら複数のパネルが1つの連続的なパネルであるかのように、並べてパネルに表示されるのが好ましい。第1ノード(80)は、第2イメージング手段を含んでおり、該手段は、第1ノード(80)のシーンのビューが第1イメージング手段とは異なっている第1ノード(80)の第1ビデオストリームを生成するのが好ましい。メインコントローラ(50)は、フィールドプログラマブルゲートアレイ(38)から送られる第1ノード(80)の第2ビデオストリームをディスプレイコントローラ(52)に送り、該ストリームは、第1ノード(80)のユーザがディスプレイパネル上で第1ノード(80)のシーンを見るように、パネルに表示されるのが好ましい。第1ノード(80)、第2ノード(82)及び第3ノード(84)は、ビデオフォン(15)を含むのが好ましい。第1ノード(80)、第2ノード(82)及び第3ノード(84)は、ビデオフォン(15)と通信するPC(68)を含むことが可能である。
本発明は、図17に示すように、電気通信装置(93)に関する。装置(93)は、少なくとも第1ネットワーク(88)と通信する通信手段を具える。装置(93)は、パケットより第1ノード(92)のアドレスを格納して、通信手段によって装置(93)から送られるパケットに装置(93)のアドレスを収納する収納手段を具えている。パケットは、第1ネットワーク(88)を通じて第1ノード(92)から送られて、通信手段で受信される。通信手段は、第1ネットワーク(88)と、該第1ネットワーク(88)とは異なる第2ネットワーク(90)と通信するのが好ましい。格納・収納手段は、第2ネットワーク(90)に関するパケットに、装置(93)のアドレスを収納する。パケットは、通信手段によって、第2ネットワーク(90)に送られるのが好ましい。通信手段は、ネットワークインターフェイス(42)を含んでおり、格納・収納手段は、ネットワークインターフェイス(42)及びメインコントローラ(50)を含むのが好ましい。装置(93)は、ビデオフォン、ゲートウェイ、ルータ、又はスイッチであるのが好ましい。
本発明は、図15に示すように、電気通信システム(94)に関する。システム(94)は、第1ネットワーク(88)を具えている。システム(94)は、第1ネットワーク(88)と通信する始端(originating)ノード(86)を具えている。該始端ノード(86)は、第1ネットワーク(88)に関する始端ノード(86)のアドレスを有するパケットを、第1ネットワーク(88)に送る。システム(94)は、第1ネットワーク(88)と異なる第2ネットワーク(90)を具える。システム(94)は、第1ネットワーク(88)及び第2ネットワーク(90)と通信する始端ゲートウェイ(81)を具えており、該始端ゲートウェイ(81)は、第1ネットワーク(88)に関するアドレスと、第2ネットワーク(90)に関するアドレスとを有している。始端ゲートウェイ(81)は、第1ネットワーク(88)からパケットを受信し、始端ノード(86)のアドレスを格納し、第2ネットワーク(90)に関する始端ゲートウェイ(81)のアドレスをパケットに収納し、そのパケットを第2ネットワーク(90)に送信する。システム(94)は、終端ノード(85)を具えている。該終端ノード(85)は、第2ネットワーク(90)に関するアドレスを有しており、第2ネットワーク(90)と通信し、パケットを受信し、第2ネットワーク(90)に関する始端ゲートウェイ(81)のアドレスを保存し、終端ノード(85)のアドレスと共に、始端ゲートウェイ(81)にリターンパケットを送る。始端ゲートウェイ(81)は、終端ノード(85)からリターンパケットを受信して、終端ノード(85)のアドレスを保存し、第1ネットワーク(88)に関する始端ゲートウェイ(81)のアドレスをリターンパケットに収納し、リターンパケットを第1ネットワーク(88)に送る。始端ノード(86)は、リターンパケットを受信し、第1アドレスに関する始端ゲートウェイ(81)のアドレスを格納する。第1ネットワーク(88)又は第2ネットワーク(90)は、イーサネット又はATMネットワークの何れかであって、始端ノード及び終端ノードは、ビデオフォン(15)であるのが好ましい。
本発明は、図16に示すように、電気通信システム(95)に関する。システム(95)は、第1ネットワーク(88)を具える。システム(95)は、第1ネットワーク(88)と通信する始端ノード(86)を具えており、該始端ノード(86)は、第1ネットワーク(88)に関する始端ノード(86)のアドレスを有するパケットを、第1ネットワーク(88)に送る。システム(95)は、第1ネットワーク(88)と異なる第2ネットワーク(90)を具える。システム(95)は、第1ネットワーク(88)及び第2ネットワーク(90)と通信する始端ゲートウェイ(81)を具えており、該始端ゲートウェイ(81)は、第1ネットワーク(88)に関するアドレスと、第2ネットワーク(90)に関するアドレスとを有している。始端ゲートウェイ(81)は、第1ネットワーク(88)からパケットを受信し、始端ノード(86)のアドレスを格納し、第2ネットワーク(90)に関する始端ゲートウェイ(81)のアドレスをパケットに収納し、そのパケットを第2ネットワーク(90)に送信する。システム(95)は、第2ネットワーク(90)と異なる第3ネットワーク(92)を具える。システム(95)は、第2ネットワーク(90)及び第3ネットワーク(92)と通信する終端ゲートウェイ(83)を具えており、該終端ゲートウェイ(83)は、第3ネットワーク(92)に関するアドレスと、第2ネットワーク(90)に関するアドレスとを有している。終端ゲートウェイ(83)は、第2ネットワーク(90)からパケットを受信し、始端ゲートウェイ(81)のアドレスを格納し、第3ネットワーク(92)に関する終端ゲートウェイ(83)のアドレスをパケットに収納し、そのパケットを第3ネットワーク(92)に送信する。システム(95)は終端ノード(85)を具えており、該終端ノード(85)は、第3ネットワーク(92)に関するアドレスを有しており、第3ネットワーク(92)と通信する。終端ノード(85)は、第3ネットワーク(92)に関する終端ゲートウェイ(83)のアドレスを保存し、終端ノード(85)のアドレスと共に、リターンパケットを終端ゲートウェイ(83)に送る。終端ゲートウェイ(83)は、終端ノード(85)からリターンパケットを受信し、終端ノード(85)のアドレスを保存し、第2ネットワーク(90)に関する終端ゲートウェイ(83)のアドレスをリターンパケットに収納し、そのリターンパケットを第2ネットワーク(90)に送る。始端ゲートウェイ(81)は、終端ゲートウェイ(83)からリターンパケットを受信し、終端ゲートウェイ(83)のアドレスを保存し、第1ネットワーク(88)に関する始端ゲートウェイ(81)のアドレスをリターンパケットに収納し、そのリターンパケットを第1ネットワーク(88)に送る。始端ノード(86)は、リターンパケットを受信して、第1アドレスに関する始端ゲートウェイ(81)のアドレスを格納する。第1ネットワーク(88)及び第3ネットワーク(92)は、同じタイプのネットワークであり、始端及び終端ノードは、ビデオフォン(15)であるのが好ましい。
本発明は、始端ノード(86)から終端ノード(85)にパケットを送信する方法に関する。その方法は、第1ネットワーク(88)に関する始端ノード(86)のアドレスを有するパケットを、始端ノード(86)から第1ネットワーク(88)に送る工程がある。第1ネットワーク(88)及び第2ネットワーク(90)と通信する始端ゲートウェイ(81)にて、第1ネットワーク(88)から送られるパケットを受信し、第1ネットワーク(88)に関するアドレスと、第2ネットワーク(90)に関するアドレスとを有する始端ゲートウェイ(81)に、始端ノード(86)のアドレスを格納し、第2ネットワーク(90)に関する始端ゲートウェイ(81)のアドレスをパケットに収納し、第2ネットワーク(90)にパケットを送る工程がある。第2ネットワーク(90)から送られるパケットを終端ノード(85)で受信し、第2ネットワーク(90)に関する始端ゲートウェイ(81)のアドレスを保存し、終端ノード(85)のアドレスと共に、リターンパケットを終端ノード(85)から始端ゲートウェイ(81)に送る工程がある。終端ノード(85)から送られるリターンパケットを始端ゲートウェイ(81)で受信し、始端ゲートウェイ(81)にて終端ノード(85)のアドレスを保存し、第1ネットワーク(88)に関する始端ゲートウェイ(81)のアドレスをリターンパケットに収納し、始端ゲートウェイ(81)を用いて第1ネットワーク(88)にリターンパケットを送信する工程がある。始端ノード(86)でリターンパケットを受信し、第1ネットワーク(88)に関する始端ゲートウェイ(81)のアドレスを始端ノード(86)に格納する工程がある。始端ゲートウェイ(81)は、終端ノード(85)から送られるリターンパケットを受信し、終端ノード(85)のアドレスを保存し、第1ネットワーク(88)に関する始端ゲートウェイ(81)のアドレスをリターンパケットに収納し、第1ネットワーク(88)にリターンパケットを送信する。始端ノード(86)は、リターンパケットを受信し、第1アドレスに関する始端ゲートウェイ(81)のアドレスを格納する。リターンパケットを受信する工程の後に、始端ゲートウェイ(81)について始端ノード(86)に格納されたアドレスと、終端ノード(85)について始端ゲートウェイ(81)に格納されたアドレスとを用いて、始端ゲートウェイ(81)を通じて、始端ノード(86)から終端ノード(85)に第2パケットを送信する工程があるのが好ましい。
図8、図9及び図10を参照すると、好ましい実施例の動作では、Sビデオを伴うソニー製の一般的なアナログビデオカメラ(32)のような撮像装置(30)は、該撮像装置(30)で得られるシーンの画像を電気信号に変換する。その電気信号は、配線を通って、フィリップス製SAA7144 NTSC/PAL/デコーダのようなビデオデコーダ(34)に送られる。ビデオデコーダ(34)は、電気信号をデジタル信号に変換して、BT656フォーマットのようなシーンの画素のストリームとしてそれらを送る。画素のストリームは、ビデオデコーダ(34)から送り出されて、第1ストリームと、第1ストリームと同じである第2ストリームとに分けられる。エンコーダ(36)は、IBM eNV 420エンコーダであるのが好ましく、画素の第1ストリームを受信し、それを処理してMPEG-2フォーマットのデータストリームを生成する。ビデオエンコーダ(36)で生成されたデータストリームは、カメラで生成された際と比較して約50分の1のサイズに圧縮される。MPEG-2ストリームは、エンコードされたデジタルストリームであって、後にパケット化される以前にフレームバッファリングされないので、遅延が最小化されている。エンコードされたMPEG-2デジタルストリームは、フィールドプログラマブルゲートアレイ(FPGA)(38)と、MPEG-2ストリームを生成するソフトウエアとを用いて、RTPによってパケット化される。そして、PLX 9054 PCIインターフェイス(44)を通じて、ネットワークインターフェイス(42)を用いて、イーサネット802.P、又は毎秒155メガビットのATMのようなネットワーク(40)に送信される。必要ならば、CNNや映画のようなVCRやテレビジョンショーに関するビデオストリームがデコーダ(34)で受信され、ディスプレイコントローラ(52)に直接供給されて表示される。デコーダコントローラ(46)は、FPGA(38)に配置されてデコーダ(34)に接続されており、デコーダ(34)の動作を制御する。
また、デジタルカメラ(47)を用いる場合、カメラで生成されたストリームは、既にデジタルフォーマットであって、デコーダ(34)に供給される必要はない。デジタルカメラ(47)から送られるデジタルストリームは、BT 656フォーマットであって、カメラから直接に第1及び第2ストリームに分けて送り出されて、ビデオデコーダ(34)を通ることはない。
さらに、1394 インターフェイスファイヤラインカメラ(48)のようなファイヤラインカメラ(48)を用いると、デジタル信号を直接FPGA(38)に供給できる。ファイヤラインカメラ(48)を用いると、FPGA(38)から非常に短い距離を超えてデータストリームの生成が行われる場合に、デジタル信号が、例えばケーブルによって、ファイヤラインカメラ(48)から長い距離でサポートされる利点がある。FPGA(38)は、ファイヤラインカメラ(48)から送られるデジタル信号をエンコーダ(36)に供給して、上述の処理が行われる。そして、FPGA(38)は、以下に説明するように、低フレームレートのストリームを生成する。
第2ストリームはFPGA(38)に供給されて、FPGA(38)及びソフトウエアは、モーションJPEGストリームのような低フレームレートのストリームを生成する。第2ストリームは、第1ストリームよりも低い帯域幅を必要とする。FPGA(38)及びメインコントローラ(50)は、ソフトウェアによるエンコードを用いて、この低フレームレートのストリームを圧縮及びパケット化し、それをPCIインターフェイス(44)に供給する。続いて、PCIインターフェイス(44)は、ネットワークインターフェイスカード(56)を通じてネットワークインターフェイス(42)にそれを転送する。ネットワークインターフェイス(42)は、それをネットワーク(40)に送信する。エンコードされたMPEG-2デジタルストリーム及び低フレームレートストリームは、基本的に同じであるが独立した2つのデータストリームである。しかしながら、低フレームレートストリームは、MPEG-2データストリームと比較して縮小されており、MPEG-2ストリームと比較して、同一シーンの表示が小さく、ネットワーク(40)のリソースが少なくてすむ。
ネットワーク(40)上では、各デジタルストリームは、所望の受信ビデオフォン(15)に運ばれる。会議のパーティが2を超える場合には、各デジタルストリームは、複数の受信ビデオフォン(15)に運ばれる。データは、SIPを用いてルーティングされる。受信ビデオフォン(15)のネットワークインターフェイスカード(56)は、第1及び第2データストリームのパケットを受信し、パケットのデータと、メインコントローラで選択されたビデオストリーム(第1又は第2)とを受信メモリに送る。受信ビデオフォン(15)のメインコントローラ(50)は、ソフトウエアを用いて、選択された受信データストリームをデコード及び伸張し、それをディスプレイコントローラ(52)に転送する。ディスプレイコントローラ(52)は、一般的なスケーリングハードウエアを用いて、VGAデジタルフラットパネルディスプレイに再生画像を表示する。受信ビデオフォン(15)のユーザは、タッチスクリーン(74)を用いて、2つのデータストリームのうちどちらが表示されるかを選択する。必要に応じて、ユーザは両方を選択し、シーンの大きい画像と小さい画像とが表示される。しかしながら、送信ビデオフォン(15)から送られる両方のストリームが表示されることは、通常生じないだろう。表示用のプロトコルの説明は、以下で行われる。シーンの大きい画像又はシーンの小さい画像の何れかを選択するオプションを有することで、ユーザは、システム(10)のリソースを割り当てて、見る者にとってその時にさらに重要である者が、大きく鮮明な画像で見られるように選択できる。一方で、ユーザがまだ見たいと思うがその時に重要ではない者も、まだ見られ得る。
2以上のビデオストリームがある場合(会議コールが行っている場合)、ディスプレイコントローラ(52)は、個々のビデオストリームをディスプレイ(54)に並べて表示する。ディスプレイ(54)に並べて形成された画像はクリップされており、縮小されていない。シーンにおける物の大きさは変化しておらず、単に、各データストリームのシーンにおける夫々の側の外領域が削除される。必要ならば、シーンの小さい画像に関するストリームの画像は、ディスプレイ(54)のスクリーンにて、右下隅に並べて表示される。図9に示すように、ディスプレイコントローラ(52)は、一般的なデジタルビデオをLCDコントローラ(72)に供給する。ディスプレイコントローラ(52)は、ATI又はNvidia製であり、一般的なVGAコントローラである。LCDコントローラ(72)は、ディスプレイコントローラ(52)から送られる一般的なデジタルビデオを得て、フィリップスや富士通のパネルのような、使用する特定のパネルに適した画像を作成する。
画像のクリップをさらに向上させるため、単に、画像の部分的削除を外側端部から中央に向けて行う代わりに、関係ある情報を示さない部分を画像からクリップする。画像の左側又右側にて人物が話している場合、外端部の各々からクリップする代わりに、人物が画像の右側にいる場合、画像の左側からクリップするのが望ましく、人物が画像の左側にいる場合、画像の右側からクリップするのが望ましい。外端部の各々からクリップすると、人物の部分が失われることが起こり得る。ビデオトラッキングを用いることで、形成される画像を見て、画像内で変化が起こっている場所を解析して、画像内で人物がいる場所を特定する。人物は、画像のその他の領域に対して相対的に動いており、この相対移動を特定することで、画像における人物の位置が決定され得る。このビデオトラッキングによって、クリップを、変化が最も少なくなる端部又は複数の端部にて起こすことが可能となる。代わりに、又はビデオトラッキングと併せて、オーディオトラッキングを用いて、画像のクリップを行うことを補助できる。ビデオフォン(15)はマイクロホンアレイを有しており、マイクロホンアレイの数々の要素に音が達する異なる瞬間にて、一般的な三角測量(triangulation)を行うことで、マイクロホンアレイに対して人物が何処に配置されているかを決定できる。画像になっているシーンに対するマイクロホンの位置は知られているので、画像における人物の位置も分かる。
ビデオフォン(15)の機能は、モニタ上のタッチスクリーン(74)で制御される。タッチスクリーン(74)は、一般的なガラスのタッチスクリーンであって、タッチスクリーンコントローラ(76)に生信号を供給する。公知のように、生信号は、ユーザが所定の場所でガラスに触ると生じる超音波で感知される。そして、タッチスクリーンコントローラ(76)は生信号を得ると、それらをスクリーン上のX及びY位置に関する有意義な情報に変換して、この情報をメインコントローラ(50)に送る。
テレビジョン又はVCR接続が利用される場合、テレビジョン又は映画はデコーダ(34)に供給されて、その供給は、ビデオフォン(15)で受信されるその他の信号と同様に制御される。テレビジョン又は映画は、ディスプレイ(54)上にて、別のビデオフォン(15)に関係したビデオのシーンの横に表示される。
シーンのオーディオストリームは、基本的に、オーディオビデオストリームと平行な同様の経路を通るが、オーディオストリームは、マイクロホン、サウンドカード、ヘッドセット又はハンドセットのようなオーディオレシーバ(58)から、コーデックのようなCSクリスタル4201オーディオインターフェイス(60)に供給される。オーディオインターフェイス(60)は、ボリューム及びミキシングの制御に加えて、信号のアナログデジタル変換及びデジタルアナログ変換を行う。オーディオインターフェイス(60)は、オーディオ信号をデジタル化して、TCI 320C6711 又は 6205 DSP(62)に送る。その後、DSP(62)は、デジタル化されたオーディオストリームをパケット化し、そのデジタル化されたオーディオストリームをFPGA(38)に転送する。続いて、FPGA(38)は、それをPCIインターフェイス(44)に与える。オーディオストリームは、その後、ネットワークインターフェイスカード(56)を通ってネットワーク(40)に送信される。オーディオストリームは受信ビデオフォン(15)で受信されて、FPGA(38)を通ってDSP(62)に、さらにはオーディオインターフェイス(60)に送られる。デジタル信号は、オーディオインターフェイス(60)にてアナログ信号に変換されて、スピーカ(64)で再生される。
ネットワークインターフェイスカード(56)は、ネットワーク(40)に送信されるオーディオパケット及びビデオパケットの各々にタイムスタンプを付す。ビデオフォン(15)が受信したオーディオ及びビデオパケットが処理される速度は、充分に速いので、人間の目及び耳は、シーンのビデオに合わせられるオーディオのずれを、視聴の際に識別できない。20〜30ミリ秒未満という制限が、シーンのオーディオ及びビデオ情報の処理になされて、シーンのビデオ及びオーディオの関係が維持される。シーンのオーディオ及びビデオの同期を受信ビデオフォン(15)にて受信される際に保証するために、各パケットのタイムスタンプが参照されて、対応するオーディオベースのパケットとビデオベースのパケットが受信ビデオフォン(15)にて並べられて、対応するように基本的に同時に再生される。これによって、受信ビデオフォン(15)のユーザに識別されるようなシーンのビデオ及びオーディオのずれは存在しなくなる。
ENC−DSPボードは、IBM eNV MPEG−2エンコーダ及びサポート回路と、オーディオエンコード及びデコードをするDSP(62)と、PCIインターフェイス(44)とを含んでいる。それは、高性能PC(68)プラットホーム及びディスプレイ(54)システム(10)に与えられる完全なビデオフォン(15)端末機能に必要なハードウエアを含んでいる。それは、フルサイズのPCI2.2に準拠したデザインである。カメラ、1又は複数のマイクロホン、及びスピーカ(64)は、このボードにインターフェイスする。DSP(62)は、オーディオエンコード、デコード、ミキシング、ステレオ配置(stereo placement)、レベルコントロール、ギャップフィリング(gap filling)、パケット化、及びその他のオーディオ機能、例えば、ステレオAEC、ビームステアリング、ノイズキャンセル、キーボードクリックキャンセルやリバーバレイション(reverberation)を行う。FPGA(38)は、セロクシア(Celoxia)(ヘンデル−C(Handel-C))ツールを用いて開発され、再構成可能である。レイアウトは、1〜3百万ゲートレンジで部品をサポートする。
このボードは、デジタルカメラ(47)チップインターフェイス、ハードウエア又は「ビデオDSP」ベースのマルチチャンネルビデオデコーダ(34)インターフェイス、DVI入出力コネクタを用いたビデオオーバーレイを含んでおり、ビデオオーバーレイと共に、フルダンプなフレームバッファを可能としている。
NTSC又はPALビデオを用いて、エンコーダ(36)は、640×480である、好ましくは720×480又はより高解像度である高品質なビデオストリームを生成する。ビットレートは、フレーム当たりの最大ビットが制限されるように制御されて、ネットワーク(40)に渡って伝送遅延が抑制される。デコーダ(34)は、データの第1マクロブロックを受信すると、一枚のデコードを開始する。ある種のバッファリングが行われてもよく、軽微なジッタが調整されて、画像が向上する。
MPEG-2は、広く使用及び実施されており、DVD及びVCDのエンコード、デジタルVCR、及びTiVoのようなビデオ録画装置に加えて、DSSやその他のデジタルTV放送の基礎となっている。通常、4から50Mbit/secのビデオ伝送が選択されると考えられる。MPEG-2は、広く使用されているので、比較的低コストであり、デコードについての、つい最近ではさらにエンコードについての高集積化されたソリューションが、現在商業的に入手可能である。
MPEG-2は、一般的な圧縮方法と考えられるよりは、むしろエンコードされたビデオのシンタックス(syntax)であると考えられる。仕様がシンタックス及びエンコード方法を定める一方で、定められたシンタックスに従う限り、その方法の使用について非常に広い自由度がある。この理由から、MPEG-2に関する一般化は、しばしば誤り又は不正確である。特定の用途へのMPEG-2のパフォーマンスを評価するためには、特定のエンコード方法と意図した応用について、より低いレベルの詳細まで達する必要がある。
ネットワーク(40)に関連した問題と共に、低遅延のエンコード及びデコードの問題は、ビデオフォン(15)プロジェクトにとって興味深い。MPEG-2のアルゴリズムにおける3つの主要な問題があり、これらはネットワーク(40)に渡って高い品質のビデオを得るために理解される必要がある。
≡ GOP(Group Of Pictures)構造及びその遅延における効果。
≡ 遅延及びネットワーク(40)の要求に関するビットレートの効果、エンコードされたフレームサイズ変化、VBVバッファ。
≡ パケット損失の質に関するGOP構造の効果。
GOP構造及び遅延:
MPEG-2は、3種類のエンコードフレーム:I,P及びBを定義している。最も普通に使用されるGOP構造は、16フレーム長のIPBBPBBPBBPBBPBBである。この構造の問題は、連続するBフレームの各々は、Bフレームは前後のフレームから推測される動きであるので、Bフレームのエンコードが開始できる前に、次のフレームがキャプチャされる必要がある。各フレームは33msecであるので、これは、Bフレームがない構造を超えて、このGOP構造に最小で66msecの遅延を加える。結果として、このことによって、I及び/又はPフレームのみを含んでおり、MPEG-2の仕様で、SP@ML(シンプルプロファイル)エンコードとして定められた、低遅延のGOP構造が導かれる。
ビットレート、エンコードフレームサイズ、及びVBV:
Bフレームが除かれてエンコード遅延が最小化されると、GOP構造は、Iフレームと、Iフレームに対するPフレームとで構成される。Iフレームは、完全にフレーム内符号化されているので、これを行うために多くのビットが必要とされて、次のPフレームのビットは少なくなる。
IフレームはPフレームの8倍大きく、そのビットレートは公称(nominal)の5倍である可能性があることに留意すべきである。このことは、ネットワーク(40)の要求と遅延とに直接的な影響を与える。帯域幅に制限がある場合、Iフレームはネットワーク(40)のリストリクションにてバッファリングされて、結果として限定されたセグメントに渡って、複数のフレームの時間の遅延が加わるであろう。再生レートがネットワークの帯域幅ではなく、ビデオに合わせられるので、このバッファはレシーバに適合する必要がある。上記データで用いられるサンプルは、低動作オフィスシーンであった。シーンが変化する高動作のコンテントでは、フレームには、コンテントに応じたビットが割り当てられて、シーンが変化する際には幾つかの大きなPフレームが生じるであろう。
この振る舞いを制御するために、MPEG-2は、VBVバッファ(ビデオバッファリングベリファ)を使用する。VBVバッファは、最大エンコードフレームサイズと公称のビットレートとの間の比率をある程度制御する。公称ビットレートで示されたサイズの2倍より小さくIフレームが制限されるように、VBVを確実に制限することで、加えられるバッファリング遅延を1フレーム時間に制限できる。VBVのサイズを制限することによって、画質が犠牲となる。Iフレームが大きい理由は、次のPフレームの良いベースを与えるためであり、Iフレームのサイズが制限される場合、質は、より低いビットレート(<4Mビット)へと顕著に低下する。2Mビットでは、平均フレームサイズは8Kバイトであり、このサイズの2倍でさえも、Iフレームと同様にDCT圧縮される320×240のJPEG画像を、良質でエンコードするのには不十分である。
Iフレームのみのエンコードによって、エンコードフレームサイズは、より一致するが、質がより低下する。低ビットレートのIフレームのみをエンコードすることは、MPEG-2のアルゴリズムの圧縮能力の大部分を活用していない。
MPEG-2の仕様は、CBR(Constant Bit Rate)及びVBR(Variable Bit Rate)モードを定めており、ストリーム内にて可変なGOP構造を可能とする。CBRモードは、必要に応じてパッディング(padding)を行って、各GOPについて一定数のビットを生成するように定められている。VBRは、エンコード帯域幅を可変にすることで、一定の質を得ることを意図としており、より簡単なセクションにおけるより低いビットレートでこのことが補償されている限り、ストリームにて、困難なエンコード領域により多くのビットを割り当てることが可能となる。VBRは、2(two)パス又はシングルパステクニックを用いて実現できる。可変GOP構造によって、例えば、シーンが遷移する境界におけるIフレームの配置にて、目で見える圧縮アーチファクトが除去される。低遅延が求められており、VBR又は可変GOPを実施するためにビットを小さくする必要があるので、これらのモードは、ビデオフォン(15)の用途には、ほとんど関連がない。
典型的なGOP構造におけるP及びBフレームは、Iフレームと、以前のP及びBフレームとに依存しているので、データの損失は、次のIフレームまでの全てのフレームに影響を与えて、エラーが生じる。このことは、また、スタートアップの待ち時間に影響を与えて、例えば、DSSシステム(10)でチャンネルをオンにする場合、デコーダ(34)は、画像の表示を開始する前にIフレームを待つ。このために、GOP長、構造及びビットレートは、用途及び配信システム(10)に対して調整される必要がある。IPを用いたリアルタイムコラボレーションの場合、信頼性のあるプロトコルを用いてハンドシェイク及び再送するのに要する遅延を受け入れる余裕はないので、遅れたパケットは失われたとして取り扱う必要があり、RTPやUDPのような信頼性がない転送プロトコルが用いられる。パケット損失がビデオの質に与える効果について、様々な解析がなされており、典型的なIPB GOP構造では、1%のパケット損失が30%のフレーム損失を生じる事が示されている。より短いGOP構造、究極的にはIフレームのみのストリーム(質の損失がある)は、これを幾分抑える。また、FEC(Forward Error Correction)テクニックは、損失が生じると、これを幾分抑えることができる。しかし、MPEG-2の問題の一つは、明らかに、データ損失をあまり許容できないことである。
連続的Pフレームエンコードと呼ばれるGOP構造は、上記の問題に対処して、比較的低ビットレートで、優れたビデオの質をビデオフォン(15)に与える。連続的Pエンコードは、Pフレーム内にて、フレームのマクロブロックをフレーム内エンコードする能力を用いる。各フレームにて、16×16ピクセルのマクロブロックの擬似乱数セットをエンコードし、その他をモーションコーディング(motion-coding)して、Iフレームのビットの同等物を各フレームに分布させる。擬似乱数を用いてマクロブロックの選択をすると、頻出する時間スケールで全てのブロックが更新されるので、スタートアップとシーンの変化は、妥当な方法で処理される。
IBMは、このアルゴリズムをS420エンコーダで実施しており、フルフレームDCTアップデートレートを8フレーム(3.75回/秒)に設定している。典型的なオフィス及び会議のコンテントでは、その結果は、非常に優れたものとなる。エンコードによる遅延、エンコードされたフレームのサイズの変化、パケット損失は、ビデオフォン(15)にとって非常に理想的な振る舞いとなっている。エンコードされたサンプルを見ると、シーン変化と非常に動的なコンテントについてはエンコーダ(36)アーチファクトが現れるが、コラボレーションで典型的である話し手の顔のコンテントについては、質は非常に良い。
高質のオーディオは、効果的なコミュニケーションにおいて欠かすことができない。高質とは、全二重であり、帯域幅が7kHzであり(電話は3.2kHz)、信号対雑音比が30dBより大きく、知覚できるエコー、クリッピング又はゆがみがないことである。設定は非常に容易で、可能な限りケーブルは少ない。オンボードの診断は、問題及びその解決方法とを示す。スピーカ(64)からの音には、音のレベルの高低に関係なく、大きなはじけ音やうなり音が無い。
失われた又は遅れたパケットのオーディオ信号は、先のオーディオ信号に基づいて「満たす」ことができる。オーディオバッファは、ネットワーク(40)のジッタとオーディオに加わる遅延との間のバランスとして約50msとすべきである。320サンプル又は20msの現在のパケットサイズを減らすならば、エンコード及びデコード遅延が減るであろう。しかしながら、20msは、RTPパケットの一般的なデータ長である。
以下に説明するプロセスの幾つかは、市販の製品で利用されている。しかしながら、コスト低減と集積化を図るために、それらはDSP(62)として実施されるであろう。別の実施例では、1つのDSP(62)が上記のプロセスに加えて音響エコーキャンセルをも行うのではなく、第2DSP(62)が、音響エコーキャンセルを行い得る。
オーディオシステム(10)は、送信及び受信セクションを有している。送信セクションは、以下の要素で構成される。
マイクロフォン:
スピーカフォンに対する主要な不満の一つに、離れた所で聞く音がこもってしまうことがある。このこもった音は、部屋の反響によって生じるものであり、直接音のパワーに対する反射(反響)音のパワーの比、として考えるのが良い。現在、ピックアップを改善する最も良い方法は、マイクロフォンを話し手に近づけて配置して、直接音のパワーを増加させることである。オフィス環境では、マイクロフォンは、PC(68)のモニタに、ビデオフォン(15)端末に、ホワイトボードに配置できる。
自動ゲイン制御:
各マイクロフォンのプリアンプのゲインは自動的に調節されて、ADCレンジが十分に使用される。プリアンプゲインは、AEC及びノイズリダクションのようなその他のオーディオプロセスに送られる。
CODEC:
簡単な形式では、これはADCデバイスとなる。しかしながら、テキサスインスツルメント及びアナログデバイスインコーポレイテッドのような幾つかの企業は、アナログアンプとアナログマルチプレクサを具えるCODECを有している。また、同様に制御されるDACがチップ上にある。先に説明した自動ゲイン制御は、CODEC内で実施されて、DSP(62)で制御される。
ノイズリダクション:
2つの方法のノイズリダクションを用いることで、SNRを改善できる。第1の方法は、一般にノイズゲーティング(noise gating)と呼ばれており、現在の信号レベルに応じてチャンネルをオン・オフする。第2の方法は、適応ノイズキャンセル(ANC)であり、マイクロフォンの信号から不要なノイズを取り去る。オフィス環境では、ANCを用いて、PAアナウンス、ファンノイズ、ある場合にはキーボードのクリック音でさえ除去できるであろう。
ノイズリダクション又はゲーティングのアルゴリズムは、クールエディトやゴールドウェーブのような市販のオーディオ編集パッケージで利用できる。このようパッケージは、特別な効果を加えて、記録からスクラッチ及びポップノイズを除去し、テープ記録からヒスノイズも除去できる。
音響エコーキャンセル:
エコーが聞こえるのは、話し手の声が50msを超えた後に話し手に戻る場合である。エコーは、非常に気を散らせるので、除去される必要がある。エコーの2つのソースとして、ラインエコーと音響エコーがある。ラインエコーは、2本線の電話システム(10)の特性による。PSTNは、ラインエコーキャンセラ(LEC)を用いて、このエコーを除去する。スピーカフォンシステム(10)を用いる場合、アコーステックエコーは、電話のスピーカとマイクロホン間で起こる。離れたスピーカからの音は、離れたマイクロホンで拾われて話し手に戻る。音響エコーキャンセル(AEC)は、LECよりも難しい。部屋の音響は、モデルよりも複雑で、人の動きで急に変化するからである。ASPI EF1210のようなスタンドアロンデバイスから、DSP(62)のプラットフォームで動くように最適化されたシグナルワークスのオブジェクトモジュールに亘る、多くのAECプロダクトがある。
オートミキシング:
オートミキシングは、互いにミキシングされるマイクロホン信号を選択し、ミキサのモノラル出力をエンコーダ(36)に送る。選択基準は、最も音が大きいソースの近くのマイクロホンを用いること、又は閾値レベルを超えた音を受けているマイクロホンを用いることを基本にしている。オートミキサは、様々なベンダーから商業的に入手でき、電話会議及び電話教育システムで使用されている。
エンコーディング:
データ伝送の帯域幅を低減するため、典型的な信号特性と我々のスピーチの理解力を利用して、オーディオ信号はより低いビットレートに圧縮される。現在、G.722コーデックが、適度なビットレートである64kビット/秒にて、最も良いオーディオ品質(7kHz帯域幅@14ビット)を提供する。
RTP伝送:
エンコードオーディオデータは、20msecのセグメントに分割されて、リアルタイムプロトコル(RTP)パケットとして送られる。RTPは、VoIP及び電話会議の用途に必要なリアルタイムデータ交換用に特別に設計された。
受信セクションは、以下の要素で構成される。
RTP受信:
RTPパケットは、1又は2以上の離れた場所から送られるオーディオストリームを含んでおり、各々のバッファに置かれる。失われた又は遅れたパケットが検出されると、その情報がギャップハンドラー(Gap Handler)に送られる。順序が正しくないパケットは、遅れたパケットの特殊な例であって、同じように遅れたパケットは、多分廃棄される。代わりに、少なくとも1つのパケット長についてオーディオ信号の再生を遅らせるバッファを用いてもよい。バッファのサイズは、両端間の遅延が100msより長くないように制限される必要があるだろう。
デコーディング:
G.722オーディオストリームは、CODEC用のPCMサンプルにデコードされる。
ギャップハンドリング:
ネットワークに渡ってRTPパケットは失われ、又は破損するであろう。それ故に、ギャップハンドラーは、過去のパケットのスペクトル及び統計に基づいて、失われたデータを「満たす」。最小の場合として、ゼロがデータストリームに加えられてデータが作成されるが、スペクトル内挿又は外挿アルゴリズムを用いてデータを満たすことができる。
バッファリング:
ネットワークジッタは、連続的なオーディオ再生を可能とするために、バッファリングを必要とするだろう。恐らく、このバッファは、短期のジッタ統計と待ち時間の効果との間の妥協に基づいて、そのサイズ(故に待ち時間も)調整するであろう。
レート制御:
ビデオフォン(15)端末の公称のサンプルレートは、16kHzである。しかしながら、わずかな差異が存在しているならば処理される必要があるだろう。例えば、北のビデオフォン(15)が現在16,001Hzでサンプリングする一方で、南のビデオフォン(15)は15,999Hzでサンプリングする。よって、南の端末は、スピーカに出力するよりも1秒当たりに1だけ多いサンプルを積み重ねており、北の端末では、同じだけけの量が不足するだろう。受信バッファの長期の統計によって、サンプリングレートの差異を決定して、(北のビデオフォン(15)のための)適切な内挿、又は(南のビデオフォン(15)のための)デシメーションのファクタを計算できる。
ボリューム制御:
スピーカ(64)から来る音のボリュームを調整することは、通常、離れた聴取者によって行われる。より良い方法は、部屋のマイクロホンで聞こえる大きさに基づいて、スピーカ(64)からの音を自動的に調整することであろう。バックグラウンドノイズ及び聴取者自身の嗜好のようなその他の因子を考慮することもできる。
ステレオ配置:
場所が異なる離れた話し手を、聴野(auditory field)に置くことができる。だから、場所Aの人物は常に左から、場所Bの人物は真ん中から、場所Cの人物は右から聞こえるということになるだろう。この配置によって、話をしている者に追従することが容易になる。
スピーカ:
音の質は、スピーカ(64)及びその筺体の質である程度決定される。如何なる場合でも、自己増幅型スピーカ(64)がビデオフォン(15)端末に使用される。
差別化(Differentiation):
ポリコムサウンドステーションのような現在の会議システムは、充分ではあるが帯域が制限された全二重のオーディオ品質をもたらす。しかしながら、帯域幅は、3500Hzまで制限されており、その結果、音質は、耳に負担を掛けるものとなり、際立った摩擦音の場合には顕著である。
ビデオフォン(15)は、帯域幅を7kHzに広げ、複数のマイクロホンを自動ミキシングして、部屋の反響音を最小にする。3人又はそれより多い人物が話している場合、離れた参加者の各々は、ステレオ音場において独自の場所に配置されるだろう。高質のオーディオピックアップと増加した帯域幅とを組み合わせることで、ネットワーク(40)に渡る会議は、そこに居る者に素早くアプローチするだろう。
オーディオシステム(10)は、複数のマイクロホンを用いているので音をよく拾い、ワイドバンドエンコーダ(G.722)を用いて、トールグレード(tollgrade)で現在提供されているよりも良い忠実度を得ている。加えて、複数パーティの会議では、離れた話し手のステレオ配置が行われて、音響エコーキャンセルシステム(10)によるハンズフリー動作が可能となる。部屋のボリューム調整は、エンドユーザの単一管理で自動的に制御されて、全体的な音のレベルが調整される。
ビデオフォン(15)ネットワーク(40)では、ゲートウェイ(70)は、SIPではない物をSIP環境に接続する。普通、プロトコルの差異に加えて電気的な差異がある。ゲートウェイ(70)の大半は、他の電話又はビデオ会議デバイスを、ビデオフォン(15)のシステム(10)に接続する。
ゲートウェイ(70)は、インターフェイスで区別される。一方の側はネットワーク(40)であり、ビデオフォン(15)では、これはイーサネット又はATMである。外側は、アナログ電話線又はRS−232ポートであろう。ポートのタイプ、番号及び特徴は、あるゲートウェイ(70)を他と区別する。ネットワーク(40)の側には、RTP又はALL2のような転送プロトコルと、SIP、メガコ(Megaco)又はMGCPのような信号伝達プロトコルとがある。
外側では、与えられたインターフェイスに応じた多種多様なプロトコルがあってよい。例えば、ISDN(Q.931)又はPOTSシグナリングがあろう。PSTNゲートウェイ(70)は、PSTNラインをビデオフォン(15)システム(10)にその場で接続する。PBXゲートウェイ(70)によって、ビデオフォン(15)システム(10)は、メーカー独自仕様の電話をエミュレートして、その場にあるPBXへの互換性を与える。POTSゲートウェイ(70)は、みすぼらしいアナログフォンをビデオフォン(15)システム(10)に接続する。H.323ゲートウェイ(70)は、H.323システム(10)を、SIPベースのビデオフォン(15)システム(10)に接続する。これは、信号伝達のみのゲートウェイ(70)であり、メディアサーバ(66)は、H.261からMPEGへの変換を行う。
ビデオフォン(15)で実行可能な3つの技術として、セッション開始プロトコル(SIP)、セッション記述プロトコル(SDP)、リアルタイム転送プロトコル(RTP)があり、これらは全て、引用をもって本明細書の一部となる。
SIPは、パケットネットワークに渡る音声及びビデオセッションを初期化し、管理し、終了する信号伝達プロトコルである。
SDPは、マルチメディアセッションの初期化におけるセッション告知、セッション案内、及びその他のフォームを目的とするマルチメディアセッションを時述する。SIPは、SDPを用いてメディアセッションを記述する。
RTPは、マルチキャスト又はユニキャストのネットワーク(40)でのサービスに渡って、オーディオ、ビデオ又はシミュレーションデータのようなリアルタイムデータを転送する用途に適しているエンドツーエンドのネットワーク(40)転送機能を与える。SIPは、RTPを用いてメディアセッション伝送を行う。
ビデオフォン(15)は、如何なる会議ブリッジ又はMCUも用いることなく、3又は4以上のパーティで会議を行える。これは、SIPで定められるようにATMポイントツーマルチポイントストリームを用いて達成される。さらに詳細に述べると、MPEG-2ストリーム及び低フレームレートストリームがパケット化されてネットワーク(40)に転送される場合、各パケットのヘッダ情報は、周知のように、会議の受信ビデオフォン(15)の全てのアドレスを特定する。この情報から、パケットがネットワーク(40)に転送される場合に、SIPは、異なるパケットについて必要な接続を確立して、所望のビデオフォン(15)の送り先にそれらが達することができる。
如何なる会議ブリッジも使用しない会議の例として、10個のビデオフォン(15)があって、それらは、会議のパーティがいる別々の場所に配置されているとする。各ビデオフォン(15)は、オーディオベースのストリームと、MPEG-2ベースのストリームと、低フレームレートベースのストリームとを生成する。しかしながら、各ビデオフォンは、これらストリームの何れも自分に送り戻さないので、パーティが10であるビデオフォン(15)の会議では、各々は、その他9個のビデオフォン(15)と効率的に通信可能となる。一方で、ビデオフォン(15)がそれ自身と通信する場合には、帯域幅を最大限に使用するために、どのビデオフォン(15)で生成されたビデオも、必要ならばビデオフォン(15)で生成されたオーディオも、基本的にそれが他のビデオフォン(15)であるかのように見られ、又は聞かれ得る。しかし、以下で説明するように内部チャンネルを通ると、ネットワーク(40)のどの帯域幅の使用も必要とされない。
会議では、各ビデオフォン(15)は、9つのオーディオベースのデータストリームを受信する。3つのMPEG-2ベースのデータストリームと、6つの低フレームレートベースのデータストリームとがある。必要ならば、レシーバは、低フレームレートの9つのストリームを選択して、ディスプレイ(54)は各ビデオフォン(15)の小さい画像を表示し、又は、MPEG-2ベースの4つのストリームを選択して、ディスプレイ(54)は会議の4つのビデオフォン(15)からの画像で満たされる。4つのMPEG-2ベースのデータストリームが表示されるならば、ディスプレイ(54)に表示用の領域はないので、低フレームレートベースのストリームの画像を表示されない。3つのMPEG-2ベースのデータストリームが表示される場合、6つの低フレームレートベースのストリームを表示できる。各ストリームは、いろいろなビデオフォン(15)にて、上述したように作成及び受信される。
大きな画像を4つより多く会議で表示することが求められるならば、これを達成する方法は、追加のビデオフォン(15)が互いに接続されて、図7に示すように、個々のビデオフォン(15)のディスプレイは、一列に並べられる。あるビデオフォン(15)をマスターとすることができ、追加のビデオフォンが加えられると、それはマスタービデオフォン(15)のスレーブとなる。マスタービデオフォン(15)は、異なっているビデオフォン(15)に渡って、大きい及び小さい画像の表示を制御する。
会議のビデオフォン(15)のディスプレイに、誰が大きい画像として、誰が小さい画像として表示されるかを決定するプロトコルについて、1つの好ましい実施例は、最近の3人の話し手を大きく表示し、その他のパーティを小さく表示するというものである。即ち、現在話をしているパーティと、それ以前の2人の話し手とが大きく表示される。会議の各ビデオフォン(15)は、会議のオーディオベースのストリームの全てを受信するので、各ビデオフォン(15)は、そのメインコントローラ(50)を用いて、所定の瞬間にて話が起こっている場所を割り出し、さらに、ネットワークインターフェイスカード(56)が、話が生じているビデオフォン(15)のMPEG-2ストリームを受け取るが、低フレームレートストリームを受け取らないようにする。別のプロトコルでは、あるビデオフォン(15)は、リード又はモデレータビデオフォン(15)として設定され、リードビデオフォン(15)は、大きい及び小さい画像について、他の全てのビデオフォン(15)が見ているものを選別する。さらに別のプロトコルでは、誰を大きくし、誰を小さくするかという画像の選択は固定されて、会議を通じて同一に維持される。プロトコルは、各ビデオフォン(15)が、受信する画像をそれらがどのように表示するのを欲しているかを調べるというようにできる。MPEG-2ベースのストリーム及び低フレームレートストリームの両方が、ネットワーク(40)上にて、会議の受信ビデオフォンに転送される。その結果、両方のビデオストリームは、各受信ビデオフォン(15)にて利用でき、選択されているディスプレイ(54)のプロトコルに応じて表示される。
各ビデオフォン(15)で転送されるオーディオベースのストリームについては、帯域幅をさらに効果的に使用するために、そして、如何なる送信ビデオフォン(15)又は受信ビデオフォン(15)にてなされる処理要求を減らして、オーディオ処理を補助するために、オーディオストリームは、送信ビデオフォン(15)にて所定のデジベルの閾値を超えたオーディオがある場合にのみ、ビデオフォン(15)で送信される。十分大きな音のオーディオストリームを送信することのみによって、話が生じている場合に達するように又は超えるように閾値が較正されているとの仮定の下、基本的に帯域幅を使う以外に何も貢献しない外部からのバックグラウンドノイズが送受されることが防がれるだけでなく、話のオーディオストリームのみが受信されているので、話に関するMPEG-2ストリームを選択することが助けられる。
上述のように、特定のビデオフォン(15)が、他のビデオフォン(15)に送られている自分の画像を見たい場合には、FPGA(38)で作成された低フレームレートストリームがビデオフォン(15)のローカルメモリに送られる。しかしながら、低フレームレートストリームが、パケット化されて、ビデオフォン(15)からネットワーク(40)に送られる場合に起こり得るような圧縮は行われない。このローカルメモリから、ソフトウェアを伴うメインプロセッサは、それを処理して、それをディスプレイ(54)に小さい画像として表示させる。
さらに、ビデオフォン(15)は、ネットワーク(40)から受信したどのオーディオ又はビデオストリームが聞かれるか又は見られるかを制御する。ビデオフォン(15)のユーザが見たい又は聞きたいよりも多くのパーティが会議にある状況において、ビデオフォン(15)のユーザは、会議全体を構成するオーディオ又はビデオストリームの一部のみを見る又は聞くように選択できる。例えば、パーティが100ある会議では、ユーザは、見ることができる100の画像から全23の画像について、3つのビデオストリームをスクリーン上の大きな画像として、20のビデオストリームをスクリーン上の小さな画像として見ることを選択する。ビデオフォン(15)のユーザは、声の大きな3人の話し手を大きな画像として表示し、また、会議のパーティのタッチスクリーンを介して、小さな画像として表示する20のパーティを選択する。これらパーティは、タッチスクリーンのページにリストアップされている。他のプロトコルを選択できて、小さな画像として表示される20の画像を、会議が始まって各パーティが紹介をした時刻からの、会議における最新の話し手になるようにできる。表示されるビデオストリームの数を制御することで、組織が会議に適合し、ビデオフォン(15)のリソースの使用がより良く割り振られる。
スクリーンで表示される個々の画像について、各画像に関連した選択が可能である。例えば、1つの画像を会議コールのモデレータで選択し、2つの画像を、会議の現時点で最後の/最も声が大きい話し手とし、その他の画像を、その他の会議の参加者全てからユーザが選択した人物とすることができる。このように、会議のあらゆる参加者又はユーザは、会議の参加者の全数から画像の様々な選択ができるであろう。そして、必要とされる最大帯域幅は、会議の参加者の数に拘わらず、1つのビデオストリームをネットワークに送るためのものとなり、1つのビデオストリームをネットワークから受け取るためのものとなる。
オーディオストリームに関して、最も声の大きい3人の話し手の各々の画像がスクリーンに表示される間は、それらの話し手のオーディオストリームのみが選択されて聞かれる制限をビデオフォン(15)に課すことができる。DSP(62)は、受信したオーディオストリームを解析して、声が最も大きい話し手の3つのオーディオストリームのみを再生させて、同時に、声が最も大きい話し手の3つのオーディオストリームに関係した、大きな画像の第1ビデオストリームのみを受信するようにネットワークインターフェイス(42)に指示する。一般的には、大勢の人々が同時に話すと、混乱が増加して、理解が妨げられる。故に、ユーザによる制御がオーディオストリームに行われることで、組織のある程度にそれらを認識させることが可能となる。
オーディオストリームの制御の一環として、上述のように、各ビデオフォン(15)は、そのビデオフォン(15)のノイズが閾値を超えた場合にのみ、オーディオストリームを送る。好ましくは、閾値は動的であって、所定の時刻における、声の大きな3人の話し手に関連した音の大きな3つのオーディオストリームのノイズレベルに基づいている。このため、オーディオストリームが声の大きな3人の話し手オーディオストリームの一つとして認められてので、その他のオーディオストリームのノイズレベルは、モニタされて、特定される必要がある。DSP(62)は、ネットワーク(40)を介してネットワークインターフェイス(42)から送られるオーディオストリームを受信する。そして、DSP(62)は、オーディオストリームを調べて、最も大きなノイズを有する3つのストリームを特定し、最も声の大きい3人の話し手のものとして特定されている受信した3つのオーディオストリームのノイズレベルを、ビデオフォン(15)のシーンのノイズレベルと比較する。ビデオフォン(15)のシーンのノイズレベルが、受信したどのオーディオストリームよりも大きい場合、ビデオフォン(15)は、そのオーディオストリームをネットワーク(40)に送る。DSP(62)によるこのような解析が、会議の各ビデオフォンで独立に行われて、会議に渡って分散した解析が行われる。各ビデオフォンは、その他の全てのビデオフォンと独立して、受信したオーディオストリームに関する解析を自ら行う。明らかに、これらオーディオストリームは、所定の時間にて声の大きい3人の話し手の1人のものであると十分に保証できるほどシーンのノイズが大きいと、個々のビデオフォン(15)が判別した後にのみ、各ビデオフォン(15)によって送られる。各ビデオフォン(15)は その結果、受信したオーディオストリームの情報を得て、それを自己のノイズレベルとの比較の基礎として用いる。そして、各ビデオフォン(15)は、独自に閾値の決定を行っている。
分散した解析を行う別の方法では、各ビデオフォンが、DSP(62)にて用いられるべき閾値となるものを決定した後、会議の他の全てのビデオフォンにこの閾値が送られる。これにより、全てのビデオフォンは、他の全てのビデオフォンが閾値としたものを検討でき、例えば、それらの閾値を平均して、そのビデオフォンのシーンに適用される閾値を特定する。
声が最も大きい3人の話し手のビデオストリームを選択する技術を用いることで、パーティが大きな声で一度に話し始めて、混乱と不理解が生じる瞬間があるかも知れない。しかしながら、そのようにすることで、それはノイズを閾値のレベルに上げて、非常に短い間に、他と同程度の大きさのノイズを生成していないオーディオストリームは除去されて、声の最も大きな3人の話し手のオーディオストリームのみが再度選択されて聞こえるであろう。また、その他のオーディオストリームは選択されておらず、これらオーディオストリームが寄与しているかも知れないノイズのある程度が取り除かれる。このことは、時に、3つを超えるオーディオストリームがビデオフォン(15)で受信されることを意味している。3個を超えるビデオフォンで、ある瞬間にノイズが閾値を超えて、このようなビデオフォンの各々がその時にオーディオストリームを生成してネットワーク(40)に送り得るからである。しかしながら、今し方説明したように、一旦閾値が変更されると、事態は終わるだろう。オーディオストリームに関したこの分散した解析は、ここで説明したビデオフォン(15)に限定されることはなく、ビデオストリームの有無に拘わらず、如何なるタイプの音声を用いた会議でも利用可能である。
使用する帯域幅の節約を重要視しており、必要なもののみを送って帯域幅を節約することから、画像のクリップは、受信ビデオフォン(15)ではなくエンコーダ(36)にて行われる。送信ビデオフォン(15)が、それの画像が受信ビデオフォン(15)にてどのように現れるかを知っている場合、エンコーダ(36)は、シーンの大きな画像を、それが送信される前にクリップする。そして、画像のそれほど大きくない部分が送信されて、帯域幅を使用する。クリップが受信ビデオフォン(15)で起こる場合、ソフトウエアを伴ったメインプロセッサは、受信した画像がディスプレイコントローラ(52)に供給される前に、それを処理するであろう。
第2カメラをビデオフォン(15)に接続すると、シーンの別の眺めが得られる。例えば、部屋では、第1カメラ、即ち主カメラが、視聴者又は話し手の顔に焦点を合わせて配置される。しかしながら、部屋にはさらに人がいて、ビデオフォン(15)を制御する人は、受信ビデオフォン(15)の他の視聴者を見たいと欲する。例えば、第2カメラは、部屋の上隅に配置されて、主カメラよりも基本的に部屋のかなり広い領域を見る。第2カメラの出力はデコーダ(34)に与えられる。デコーダ(34)は、ビデオ出力を受け取る幾つかのポートを有している。または、第2カメラから送られるストリームが既にデジタル化されている場合、それは、主カメラと同様なチャンネルを通じて、ビデオフォン(15)の処理要素に与えられる。各ビデオフォン(15)は、その外に送られるものは何でも制御し、送信するカメラ出力の選択は、ビデオフォン(15)を制御する視聴者によってなされる。一方で、あるビデオフォン(15)のカメラから送信されるストリームを制御及び選択する能力を、離れた受信ビデオフォン(15)に与えることができる。制御ビデオフォン(15)からの制御信号は、ネットワーク(40)を通じて送信されて、送信用に選択されたストリームを与える個々のビデオフォン(15)にて受信される。第2カメラに加えて、DVD、VCR又はホワイトボードカメラのビデオ出力のような、その他のタイプの如何なるビデオ出力も、ビデオフォン(15)を通じて供給されてよい。
好ましい実施例では、ビデオフォン(15)はピークモードで動作する。ピークモードでは、ビデオフォン(15)のカメラは、前方のシーンのスチル画像を取得して、この画像を受信すると予め決めている他のビデオフォン(15)に送信する。例えば、スピードダイアルメニュに、このようなビデオフォン(15)のリストがある。または、ピークモードでは、得られたスチル画像がビデオフォン(15)で保持されて、要求に応じて、そのビデオフォン(15)にコールしたいと思っている者に供給される。理想的には、ビデオフォン(15)の好ましい使用形態に合致するように、ビデオフォン(15)のユーザは、ビデオフォン(15)の外へ送られるものを全て制御して、単に、ピークモードをオフにすることを選択し、又はどの画像が送られるかを制御する。アクティブコールが起こると、ピークモードはオフになって、ピークモードと、連続的な画像ストリームがカメラで得られるアクティブコールとの間で矛盾が生じない。ピークモードでは、所定の時間間隔で、例えば、1分、5分、30分間隔等で、シーンのスチル画像が得られる。ピークモードでは、スチル画像が得られる前の所定の時間にて、例えば、画像が得られる5又は10秒前にて、オーディオキューが示されて、まさに画像が撮られようとしており、見苦しくないようにすべき旨の警告が、カメラの前にいる者に与えられる。オーディオキューは、ビープ音、ピング(ping)音、若しくはその他の録音されたノイズ、又はメッセージとすることができる。このように、ピークモードが用いられる場合には、ビデオフォン(15)のカメラの前におけるシーンのピークが他のビデオフォン(15)で利用可能となり、その他のビデオフォン(15)に、カメラに関わる人物の存在が示される。
プレセンスセンサの別の実施例では、カメラの前の領域に対するカメラの自動レンズの位置を、プレゼンスセンサとして働かせる。カメラの前に人がいない場合、カメラの自動レンズは、その領域内の物体又は壁に焦点を当てる。人物がカメラの前にいる場合、自動レンズはその人物に焦点を当てる。人物によって、人物がレンズの前にいない場合と異なる位置にレンズが配置される。レンズの焦点を表示するカメラの信号は、カメラからFPGA(38)に送られる。FPGA(38)は、その後、例えば、送信ビデオフォン(15)のスピードダイヤルリストにあるビデオフォン(15)の受信側のような、所定のリストにあるビデオフォン(15)の受信側に焦点の情報を送る。これによって、視聴者がビデオフォン(15)の前にいるか否かが受信ビデオフォン(15)に知らされて、誰がいることが示される。
また、ビデオフォン(15)はビデオメールを提供する。あるビデオコール(15)から別のビデオフォン(15)へのビデオコールが試みられて、所定時間後に、例えば4回ベルが鳴った後に、受信ビデオフォン(15)がビデオコールに応答しない場合、受信ビデオフォン(15)に関連したビデオサーバ(66)がビデオコールに応答する。ビデオサーバ(66)は、送信ビデオフォン(15)から送られるビデオコールに応答し、送信ビデオフォン(15)に、記録されたオーディオメッセージを、又は、記録されたビデオ画像を伴ったオーディオメッセージを送る。これらメッセージは、応答しない受信ビデオフォン(15)から送られて、前もってビデオサーバ(66)に記録されている。ビデオサーバ(66)は、メッセージを再生して、電話をかける人に、オーディオ、又はオーディオ及びビデオキューを与えて、ビープ音のような所定の表示の後にメッセージを残す。所定の表示が起こると、電話をかける人は、その人のビデオ画像に加えて発言を含んだメッセージを残す。ビデオ及びオーディオメッセージは、ビデオサーバ(66)にてメモリに格納される。メッセージは、必要なだけ長くでき、又は、定められた所定の時間間隔に限定できる。所定の時間間隔が経過した後、又は、電話をかける人がコールを済ませて終了した後、ビデオサーバ(66)は、ビデオメッセージを保存して、最初のコールに応答しなかった受信ビデオフォン(15)に信号を送る。受信ビデオフォン(15)の視聴者は、ビデオメッセージを待っている。このメッセージはテキスト若しくは、受信ビデオフォン(15)のディスプレイ(54)に表示されるビデオ画像とすることができ、または、単に、メッセージライトとすることもできる。メッセージライトが点灯すると、受信ビデオフォン(15)の視聴者に、視聴者へのビデオメールがある旨が知らされる。
視聴者がビデオメールを見ることを希望する場合、視聴者は、単にタッチスクリーン(74)の領域を選択するだけで、ビデオメールを起動できる。ユーザには、ビデオメールの読み出しを含めた、メールに関する一連の操作オプションが示される。メールの読み出しでは、信号がビデオサーバ(66)に送られて、ビデオフォン(15)のディスプレイ(54)にて視聴者用にビデオメールが再生される。画像のストリームがビデオサーバ(66)から送られて、ビデオストリーム用の上述の経路を通じて受信ビデオフォン(15)に向かい、それを介して表示される。ビデオフォン(15)の視聴者が、ビデオサーバ(66)にメッセージを記録して、視聴者がビデオコールに答えない場合にビデオコールに応答するためには、視聴者はタッチスクリーン(74)の領域にタッチして、ビデオサーバ(66)を動作させる。視聴者は、所定の時間に、オーディオ又はオーディオ及びビデオのメッセージを記録するように促される。視聴者がこれを行うと、メッセージが作成される。
ビデオフォン(15)は、ユーザがボリューム調整することなく、所定のレベルでスピーカを動作させる。ビデオフォン(15)のスピーカ(64)はマイクロホンでキャリブレーションできるので、マイクロフォンが非常に大きいノイズを拾う場合には、メインコントローラ(50)及びDSP(62)は、スピーカ(64)のオーディオ出力のレベルを下げて、ノイズレベルを低減する。所定且つ所望のレベルを設定することで、ビデオフォン(15)は、視聴者が何かを行うことなく、自動的にボリュームの大きさを制御する。
ビデオフォン(15)は、特定の人物に話しかける問合せを認識すると、受信ビデオフォン(15)でのトーン又は信号のような、認識に用いられる所定のスピーチパターンを用いて、受信ビデオフォン(15)にコールが要求されている旨を、受信ビデオフォン(15)の視聴者に知らせるようにプログラムできる。例えば、言葉「ヘイ、クレイグ(Hey Craig)」がビデオフォン(15)で用いられて、コールがクレイグに向けて開始されるべきものであることが送信ビデオフォン(15)で認識される。視聴者が「ヘイ、クレイグ」を言うことで、送信ビデオフォンが自動的にクレイグへのコールを開始し、言葉「ヘイ、クレイグ」がクレイグの受信ビデオフォン(15)に送られる。クレイグの受信ビデオフォン(15)が鳴って、コールがクレイグに要求されていることを示す代わりに、言葉「ヘイ、クレイグ」が、直ちにクレイグのビデオフォン(15)にアナウンスされる。これは、クレイグの注意を喚起するために通常起こされるベルに置き換わる。この動作を行う機能は、メインコントローラ(50)及びDSP(62)で実現されるであろう。発言「ヘイ、クレイグ」は、視聴者によってアナウンスされて、上述のようにサーバ(66)に送信される。サーバ(66)は、発言を解析して、命令として言葉を認識し、命令に記されたパーティにコールを開始する。その後、サーバ(66)は、クレイグのビデオフォン(15)のアドレス情報を用いて、クレイグのビデオフォン(15)とコールを開始し、クレイグのビデオフォン(15)で「ヘイ、クレイグ」になる信号又は音色を発生させる。
当該技術分野で周知のように、エンコーダ(36)は、各フレームの最初及び最後を特定できる。エンコーダ(36)がデータを受信すると、それはフレームのデータをエンコードして、フレームが完全になるまで格納する。エンコーダ(36)が使用するアルゴリズムによって、格納されたフレームは、次のフレームを形成するための基礎として用いられる。格納されたフレームは、次のフレームをエンコードするためのリファレンスフレームとして働く。これは、基本的に、最初からのフレーム全部ではなく、あるフレームから次のフレームへのフレームの変化がエンコードの中心だからである。その後、エンコードされたフレームは、上述のように、直ちに送り出されて、パケット化される。フレームは、パケット化を除いてバッファリングされることはないので、遅延は最小限に抑えられる。なお、エンコーダ(36)がフレームのデータをエンコードする際に、データの送信速度をさらに速くするために、フレーム全体がエンコードされることを待たないで、エンコードされたデータをパケット化のために順序付けしてもよい。また、先に説明した理由から、エンコードされたデータは、フレームを形成するために格納されるので、リファレンスフレームがフレームで利用可能となる。しかしながら、別個に、データは、エンコード中にパケット化のために送られて、パケット化の準備中にフレームを形成する。しかし、パケットが送信可能となって、フレームの一部分のみがパケットを部分的に構成する場合であっても、フレームの残りの部分が別個のパケットとして送信されて、フレーム情報を伴う両方のパケットが受信ビデオフォン(15)で受信されるまで、フレームは形成されない。
図1を参照すると、ビデオフォン(15)がネットワーク(40)に接続されている。ビデオフォン(15)は、銅又はマルチモードファイバーの何れかの上にて、10/100イーサネット接続と、オプションとしてATM155Mbps接続とをサポートしている。各ビデオフォン(15)端末は、通常、ユーザのPC(68)に取り付けられている。ビデオフォン(15)の役割は、(会議)コールのオーディオ及びビデオ特性を与えることである。PC(68)は、その他の機能に用いられる。ビデオフォン(15)を用いてコールを確立することで、PC(68)間のマイクロソフトネットミーティングセッションが確立される。これによって、ユーザは、ウインドウベースのプログラム、例えば、パワーポイントプレゼンテーションやスプレッドシートと協動すること、電子ホワイトボードと画像を交換すること、ファイルを転送すること、テキストベースのチャットプログラムを使用すること等が行える。ビデオフォン(15)端末がどのように接続されているかに拘わりなく、PC(68)は、イーサネットに接続できる。PC(68)は、当然に、ATM LANにも接続できる。PC(68)と、関連する送信ビデオフォン(15)とは、ネットワーク(40)を通じて相互に通信する。PC(68)と、関連する送信ビデオフォン(15)とが相互に通信することで、PC(68)は、送信ビデオフォン(15)が話している相手を知る。その後、PC(68)は、送信ビデオフォン(15)が話している相手である受信ビデオフォン(15)のPC(68)と通信可能となる。また、PC(68)は、ビデオフォン(15)にコールすることも可能である。
システム(10)の機能の大半は、サーバーベースであって、ビデオフォン(15)のプロキシサーバで動作するソフトウエアで実現されている。プロキシサーバは、SIPプロキシサーバであるのが好ましい。基本機能をもたらすために第1サーバが必要とされ、第2サーバは、弾力的な動作に、言い換えると、第1サーバが失敗したイベントを保全するサービスに必要とされる。このような場合、サーバとビデオフォン(15)のソフトウエアは、バックアップサーバ(66)に自動的にスワップする。この構成を用いて、ネットワーク(40)上の他のビデオフォン(15)に、さらに、好ましくはSIPフォンであるネットワークに登録された電話に、ビデオフォン(15)はコールをすることが可能となり、また、これらからのコールを受け取ることが可能となる。
メディアサーバは、一連のメディアストリーム上のユーザに一連のサービスを提供する。メディアサーバ(66)は、主サーバ(feature server)で(好ましく主サーバで)制御される。それは、ユーザインボキャブル(user-invocable)な種々の機能の一部として、メディアストリームの送信側と受信側を与えるために用いられる。メディアサーバで与えられるサービスは、会議ブリッジ、記録及び再生、トランスコーディング、音色及びアナウンスメントである。
メディアサーバ(66)は、LAN又はWAN上にあるボックスである。通常、それは、その他の接続を有していない。それは、SIPデバイスであるのが好ましい。主サーバは、ビデオフォン(15)端末から発する信号経路内にある。しかしながら、メディアの経路は、メディアサーバ(66)から装置に直通するだろう。
動作中、ユーザは、ビデオメール等の機能を要求してよい。主サーバ(66)は、ユーザインターフェイス及び信号機能を与え、メディアサーバ(66)は、(使用されるならば)マルチメディアプロンプト(multimedia prompt)機能と、メッセージの記録再生機能を与えるだろう。
ビデオフォン(15)端末が、(SIPビデオフォンのような)プロトコル外又は基準外の(ビデオ)フォンにコールをし、又はそれらのコールを受け入れることを可能にするために、SIPゲートウェイのようなゲートウェイ(70)が加えられる。4本のアナログラインを有するゲートウェイ(70)が、PSTNに直接接続されるか、ローカルPBXのアナログラインに接続される。出力ラインを供給する通常の規則が適用される。一般的な1本の中継ラインが6人のユーザの全てに供給される。つまり、どのユーザも自分のフォンを用いて、勤務時間外の10分間、外部接続にダイヤルすると仮定する。ビデオフォン(15)端末が現在のPBXの拡張として働く場合、着信コールに関する限り、1本のアナログラインが各ビデオフォン(15)に必要となる。
CNNのようなTVソースが、ビデオフォン(15)のユーザに利用される。ビデオフォン(15)のビデオサーバ(66)によって、このサービスが可能となる。サーバ(66)は、1つのビデオチャンネルとの接続をサポートし、そのチャンネルは、ネットワーク(40)上のどのビデオフォン(15)のユーザでも利用される。ビデオチャンネルは、通常の2つの会議セッションと同等である。チューナは、利用可能なチャンネルをセットする。新たなビデオフォン(15)のビデオサーバ(66)が、ユーザが同時利用を願う異なるチャンネルの各々について設定に加えられる。
また、ビデオフォン(15)のサーバ(66)(好ましくはSIP)は、ユーザデータのデータベースを持っており、ユーザコンタクト情報のローカルキャッシュを含んでいる。このデータべースは、ユーザに関するメインコンタクトデータべースと同期化できる。同期化は、例えば、アウトルック/エクスチェンジのユーザによって、ロータスノーツのユーザのために行われる。別個のプログラムが、NTベースの如何なるサーバ(66)プラットホームでも動作して、同期化を行う。扱うサイトの数に拘わらず、1つのサーバのみが必要とされる。
図2に示すように、通常、ビデオフォン(15)端末は、幾つかのサイトに渡って分散しており、ワイドエリアネットワーク(40)と協力する。あるサーバ(66)は、1つのキャンパスにて、最大で100個以上のビデオフォン(15)を十分に扱える。サイト上のビデオフォン(15)の数が増加すると、ある段階でさらにサーバをインストールする必要が生じる。
ビデオフォン(15)が幾つかのサイトを渡って分散すると、中央サーバに基づいてそれらを動作可能となるが、WANで使用される帯域幅と、WANへの依存とを考慮すると、これは勧められる構成ではない。好ましくは、各サイトは少なくとも1つのサーバ(66)を有しており、該サーバ(66)は、SIPが用いられる場合、SIPサーバ(66)であるのが好ましい。さらに忠告すると、最も簡単で容易な構成は各サイトが、好ましくはSIPである二重のサーバを有することである。しかしながら、遠隔のサイトサーバの代わりとして、中央サーバを用いることも可能である。
ビデオフォン(15)は、ネットワーク(40)の何処においても、1つの中央ゲートウェイ(70)からPSTN又はPBXベースの送信コールが可能である。しかしながら、ビデオフォン(15)が、受信コールを受け入れるためにローカルPBXの延長でもなければならない場合には、PSTNゲートウェイ(70)は、各場所に与えられることが必要である。そのサイトの全てのビデオフォン(15)ついて、ゲートウェイ(70)のポートが必要となる。
中央CNNサーバ(66)は、ネットワーク(40)上のどのビデオフォン(15)にも、TVチャンネルを配信する。それにも拘わらず、WANに渡ってその帯域幅を得るよりは、サイト特有のサーバを含むことが好ましいであろう。
ビデオフォン(15)は、(ファイバーと銅のオプションを用いて)10/100イーサネットネットワーク(40)又は155Mbits/sec のATMネットワーク(40)の何れか一方に接続できる。ATMに接続されたビデオフォン(15)は、IPコントロールプレーンを用いて、コールのエンドポイントのATMアドレスを定めて、そして、ATM信号を発して、エンドポイント間で搬送チャンネル(bearer channel)を確立する。搬送チャンネルは、スイッチドバーチャル回路(SVC)で確立され、完全なQoSの要求が特定される。
各ビデオストリームは、セッティングと帯域幅のネゴシエーションによって定められるように、2Mbpsと6Mbpsの間で双方向に送信可能である。ディスプレイ手段が2以上のビデオストリームを表示できるので、各ビデオフォンを全接続するのに要求される帯域幅は、コールのパーティ数と共に増加する。送信端のクリップによって、要求される最大の帯域幅は、単一のビデオストリームで使用される帯域幅の約2.5倍となる。サイトに幾つかのビデオフォン(15)がある場合、ユーザとトランク(trunk)間の通常のテレフォンレシオ(telephone ratio)が、ビデオフォン(15)のセッションに加わる。言い換えると、ビデオフォン(15)のユーザは、各コールにて平均して2人の他人と、つまり2つのストリームで会話すると予想され、ユーザは、その時に平均して10分間ビデオフォン(15)を用いる。平均エンコードレートが3Mbpsである場合、このことより、6Mbpsの帯域幅が必要となり、この帯域幅では、最大6人までのユーザをサポートすることが期待される。
図3に示すように、ビデオフォン(15)は、ビデオフォン(15)端末の密度が低い場合に、「p」で動作可能な('p' enabled)イーサネットネットワーク(40)で動作する。ビデオフォン(15)のシステム(10)は、2個のビデオフォン(15)を互いにリンクするネットワーク(40)のATM部分に渡ってSVCを確立すると共に、「p」で動作可能なイーサネットを用いることで、十分なクオリティオブサービスが接続のイーサネット部分に渡って与えられることを保証する。
ビデオフォン(15)のシステム(10)の基本的な構成要素が、図4に示されている。それらは共にマルチメディア協動ツールを生成して、それらツールは、地理的に分散したチームが交流する能力を増進させる。このようなチームは、ほとんど全ての大企業で存在しており、次第に増加している。さらに、彼らが効果的及び効率的に働くことを助けるツールは、10年前からほとんど変わっておらず、多くの面で不満足なものである。ビデオフォン(15)は、包括的な方法を用いて現存するシステムの多くの問題に対処し、遠隔地間の共同作業に断続的な(discontinuous)改善をもたらす。それは、新たに利用可能な技術を用いて可能となり、クオリティオブサービスと正しいミキシング機能で差別化され、優れたユーザインターフェイスの開発によって使用可能となり、標準ベースのアーキテクチャを用いることで、拡張可能なように設計される。
オーディオ及びビデオストリームは、上述のように、例えば、周知のSIP技術を用いて、ネットワーク上の始端ビデオフォン(15)から終端ビデオフォン(15)に送信される。SIPメッセージは、異種のネットワークに渡ってIPルーティング技術を用いてルーティングされる。異種のネットワークのメディアストリームには、より直接的な経路が要求される。好ましくは、図15に示すように、会議の始端ビデオフォン(15)がイーサネットに接続されて、会議の終端ビデオフォン(15)がATMネットワークに接続されている場合、始端及び終端ビデオフォン間のネットワークを渡るパケットについて、以下に述べるアドレッシングが起こる。始端ビデオフォン(15)は、パケットをイーサネットに送って、始端ビデオフォンのIPアドレスを用いて通信が行われる。パケットは、イーサネットをATMネットワークにリンクする始端ゲートウェイ(81)に到達する。始端ゲートウェイ(81)では、始端ビデオフォン(15)のIPアドレスが、パケットから保存される。始端ゲートウェイ(81)は、始端ゲートウェイ(81)のATMアドレスをパケットに加えて、終端ビデオフォン(15)にパケットを送る。終端ビデオフォン(15)がパケットを受信すると、それは、始端ゲートウェイ(81)のATMアドレスをパケットより格納して、始端ゲートウェイ(81)にリターンパケットを送り返す。リターンパケットは、終端ビデオフォン(15)がパケットを受信したことを示しており、終端ビデオフォン(15)のATMアドレスを伴っている。始端ゲートウェイ(81)は、リターンパケットを受信すると、終端ビデオフォン(15)のATMアドレスを保存し、始端ゲートウェイ(81)のIPアドレスをリターンパケットに加える。リターンパケットは、その後、始端ゲートウェイ(81)から始端ビデオフォン(15)に送り返される。
このように、始端ビデオフォン(15)と終端ビデオフォン(15)間の経路全体に渡るクリティカルなノード、始端ビデオフォン(15)及び終端ビデオフォン(15)の具体的アドレスが、経路のクリティカルなノードの各々で知られる。最低でも、経路の各ノードは、経路の次のノードのアドレスを知る。必要ならば、個々のパケットが経路に沿って動くにつれて、追加されたアドレスがそれらに保存されて、経路の各ノードは、パケットが向かう次のノードよりも、クリティカルなノードのアドレスについてより多くを知る。これは、パケットがノードからノードへ移動すると、具体的な例としては、始端ビデオフォン(15)から始端ゲートウェイ(81)に、それから終端ビデオフォン(15)に、そして、終端ビデオフォン(15)から始端ゲートウェイ(81)に、それから始端ビデオフォン(15)に戻るように、パケットが移動すると、各ノードは、受け取った個々のパケットを送った前のノードのクリティカルなアドレスを保存し、次のノードが含まれるネットワークのタイプに関した自己のアドレスを持ち込むことによる。その結果として、各ノードが次のノードにパケットを送るのに必要なクリティカルなアドレスは、経路を通じて分布する。
イーサネット上の始端ビデオフォン(15)からATMネットワーク上の終端ビデオフォン(15)にパケットを転送するこの例は、逆の場合、つまり、始端端末つまり始端ビデオフォン(15)がATMネットワークと通信し、終端ビデオフォン(15)がイーサネットと通信する場合にも適用できる。
同様にして、経路は、イーサネットと通信する始端ビデオフォン(15)と、イーサネットと通信する終端ビデオフォン(15)とを含み、図16に示すように、パケットが行き来するATMネットワークが中間にあるように構成され得る。このような場合、各端に配置された2つのゲートウェイがあって、それらは、イーサネットとATMネットワークのインターフェイスとなる。先述のように、処理では、追加ノードが単純に経路に加えられる。始端ゲートウェイ(81)は、自己のATMアドレスをパケットに取り込んで、それを終端ゲートウェイ(83)に送る。終端ゲートウェイ(83)は、始端ゲートウェイのATMアドレスを保存し、終端ゲートウェイのIPアドレスをパケットに加えて、イーサネット上で終端ビデオフォン(15)に送る。リターンパケットについて、同じ事が逆に起こる。各ゲートウェイは、先のゲートウェイ又は終端ビデオフォン(15)から得た個々のアドレス情報を保存して、自己のアドレスをリターンパケットに加える。リターンパケットは、最終的に始端ビデオフォン(15)に送られる。始端ゲートウェイ(81)及び始端ビデオフォン(15)は、終端ゲートウェイ(83)又は始端ゲートウェイ(81)のATMアドレスを夫々保存し、経路に渡る各リンクにおける個々のアドレスが、より効率的に格納されて、接続のパケットは、迅速に順次転送される。
例えば、SIPルーティング情報(または、標準的なルーティング情報であれば何でも用いられる)をパケットに収納するという、当業者に周知の技術と同様な技術を用いて、ビデオフォン(15)のメインコントローラ(50)及びネットワークインターフェイス(42)は、ビデオフォン(15)のアドレスを、それがネットワーク(40)に送る各パケットに加える。また、ネットワークインターフェイス(42)は、ネットワーク上のノードから送られるパケットから受け取ったアドレス情報を、ローカルメモリに格納する。同じように、ネットワーク(40)のゲートウェイについて同様な構成が適用される。周知のように、ゲートウェイは、パケットをその最終的な送り先に移動させる制御手段及びデータ処理手段を有している。ゲートウェイの制御機構のネットワークインターフェイス(42)及びメインコントローラ(50)は、SIPルーティング情報に関した周知の技術で動作し、パケットから受け取ったアドレス情報を格納し、パケットを送ろうとしているネットワーク(40)につ関する自己のアドレス情報をパケットに収納する。例えば、ゲートウェイ又はビデオフォン(15)のアドレス情報は、パケットのヘッダー部のフィールドに配置される。実施例では、終端及び始端ソースとしてビデオフォン(15)が使用されているが、パケットを生成及び受信するデバイスであればどのようなタイプも、このスキーム全体にて使用されることに留意すべきである。
バーチャルプレゼンスビデオ−フォン(ビデオフォン)(15)は、デスクトップのネットワーク(40)装置であり、個人用の通信端末である。それは、ユーザの机のフォンに置き換わって、現在のPBX端末の全ての機能を提供するものであり、ビデオフォン(15)の大きなタッチスクリーン(74)によって、ユーザインターフェイスが簡単になり、使用が容易になっている
ビデオフォン(15)は、全ての個人間通信にビデオの特徴を加えて、見聞をバーチャルなものに変化させる。従来では、ビデオ会議システムのビデオの質は、トランスペアレントであるのに技術的に不十分であった。ビデオフォン(15)は、十分に高い質のビデオをもたらして、見聞を正確に生成する最初の個人用ビデオフォンである。効果面では、リアルタイムビデオ通信が放送されるTVの質に近い画像の質を有しているだけでなく、待ち時間が非常に短く維持されなくてはならない。会話が自然に流れるためには、リップシンク(Lip Sync)もまた重要である。これらのような問題の全ては、ビデオフォン(15)のビデオサブシステムのデザインにて対処されている。ビデオフォン(15)は、この用途に特別に構成された最新のエンコーダ(36)及びデコーダ(34)技術を用いている。言い換えると、ビデオフォン(15)は、「そこにある」ように可能な限り近づいている。
また、ビデオフォン(15)は、ハイファイの、CDに近い音質のオーディオチャンネルを使用することで、従来のスピーカフォンの性能を改善し、透明で明瞭な音声を提供する。ステレオのオーディオチャンネルは、各参加者のオーディオの空間的な差異を与える。進歩したステレオエコーキャンセルは、ユニットスピーカ(64)の音をキャンセルするだけでなく、騒々しい部屋でさえも、通常の会議のレベルにて、話し手に会議を続けることを可能にする。
ビデオフォン(15)は、最大で4つの離れたパーティによる(即ち5方向の)ビデオ会議コールを、及び/又は、最大で10つのパーティによるオーディオ会議コールを確立して、直接的にサポートする。各ユーザは、彼/彼女のワークグループにおける他のメンバー全てについて、利用状況を見ることができる。ビデオフォン(15)は、マルチストリームのマルチメディアセッションを確立し、修正し、クリアする手段として、セッション開始プロトコル(SIP)を用いるのが好ましい。ビデオフォン(15)は、ゲートウェイ(70)を通じて、その他のSIPフォン又はその他のフォンへのオーディオコールを確立できる。
ビデオフォン(15)は、それが取り付けられるネットワーク(40)に高度な要求をする。ビデオフォン(15)のビデオフォンコールは、連続的な高帯域幅を提供して、帯域幅、待ち時間及びジッタを保証するようにネットワーク(40)に要求する。マルコーニ株式会社は、高度なクオリティオブサービス用途をサポートするネットワークを提供することを専門に行っている。ビデオフォン(15)の会議部屋バージョンも利用可能である。
ビデオフォン(15)は、通信端末(プラットホーム)であり、ユーザのPC(68)を用いて、コンピューティングプラットホームを完全に統合する能力を有している。PC(68)用のビデオフォン(15)のアプリケーションは、PC(68)と、これに関係するビデオフォン(15)端末との間で多くのインテグレーションサービスを提供する。これには、ビデオフォン(15)の会議コールのパーティ間でネットミーティングセッションを自動的に確立することが含まれ、もし可能であるならば、ホワイトボードやプレゼンテーション等のアプリケーションが共有される。また、PC(68)上の番号にビデオフォン(15)で「ドラッグアンドドロップ」ダイヤルをすることを含むその他の機能も含まれる。
一連のサーバは、好ましくは各々がSIPサーバであって、これらを用いて、ネットワーク(40)装置のコールの制御及び機能が実現される。これらは、通常のコンピューティングプラットホーム上で動作するソウトウェアサーバであって、リダンダンシ(redundancy)の能力がある。また、これらのサーバは、ユーザコンタクト情報データベースとユーザ選択データベースのローカルコピーを管理する。これらサーバで利用できるアプリケーションによって、企業の、又はその他のLDAPアクセス可能なディレクトリへのアクセスがもたらされる。
同期サーバ(66)は、ユーザメインコンタクトデータベースと、サーバ(66)(好ましくはSIP)上のローカルコピーとの間の同期を維持する。アウトルックエクスチェンジ又はロータスノーツの同期化がサポートされる。一連のメディアゲートウェイ(70)は、アナログ又はデジタルPSTNネットワーク(40)に使用される。一連のメディアゲートウェイ(70)は、最も一般的なPABX装置とインターフェイスして、それらPABXに関係するボイスメールシステムを含んでいる。
メディアサーバ(66)は、ビデオフォン(15)端末に多数のサービスを提供する。それは、必要に応じて、4つのパーティに渡るビデオ会議の会議ブリッジ(Bridging-Conference server)(66)として働く。また、それによって、ビデオフォン(15)の規格と、H320/H323のような、その他の一般的なオーディオ又はビデオフォーマットとの間でトランスコーディングが可能となる。それによって、録音再生機能が提供されて、セッションが録音再生可能となる。それによって、トーン及びアナウンスメントのソースがもたらされる。
SIPファイヤーウォールのような、使用されている規格に従うファイヤーウォールが、(SIPプロキシソフトウェアのような)一般的なプロキシソフトウェアの制御下において、動的に生成されたRTPストリームを安全に通過させるのに必要とされる。TVサーバ(66)がソース又はTV配給元として機能して、ビデオフォン(15)のユーザは、例えばCNNのような、サポートされている任意のチャンネルを選択できる。
ビデオフォン(15)は、イーサネット及びATMデスクトップ用である。ビデオフォン(15)端末はエンドツーエンドのATM SVCをサポートし、それらを用いて、必要なレベルのクオリティオブサービスで接続を確立する。また、ビデオフォン(15)は、LANEサービスを用いてIP接続をサポートする。これを行って要求されるQoSを保証するために、LANE2が必要とされる。ビデオフォン(15)は、ATMに接続されたデスクトップPC(68)へのATMパススルーを与え、又は、ATMからイーサネットへのパススルーを与えるので、イーサネットを介してPC(68)に接続可能となる。
ビデオフォン(15)には、エンドツーエンドQoSをサポートすることが必要とされる。イーサネットに接続されたビデオフォン(15)について、ユーザ接続は、802.1p、ディフサーブ(DiffServ)及び/又はイントサーブ(IntServ)、或いはそれ以上をサポートする必要がある。送り先がATMネットワーク(40)を用いて到達可能である場合、イーサネットからATMへのゲートウェイ(70)が与えられる。SIPプロキシサーバ(66)及びSIPシグナリングは、ターゲットのビデオフォン(15)端末に最も近いATMのエンドポイントを、即ち、それがATM接続されていればそのATMアドレスを、又は、最も近いATMゲートウェイ(70)を確立する。シグナリングは、適切なQoSで、ネットワーク(40)のATM部分に渡ってSVCを確立する。このSVCは、離れた端部にて適切な優先度表示を生成する特定のイーサネットフローにリンクされる。
ビデオフォン(15)の製品ラインは、幾つかの端末(装置)と、これら装置に構築されない特徴を与える一連のサーバと、現存する設備及び外部のPSTNサービスに製品を接続する一連のゲートウェイ(70)とで構成される。システム(10)で与えられる基本的な機能は以下の通りである。
≡ 「オンネット(on-net)」の全てのコールでビデオが利用でき、オーディオとビデオの品質が非常に高いテレフォニーサービス。
≡ オーディオ及びビデオに関しており、臨機応変に又は予め計画されており、完全にセルフサービスであって、テレフォニーサービスに完全に組み込まれたマルチパーティー会議サービス。
≡ コラボレーションの可能性を決定する種々のツールを伴うプレゼンスサービス。
≡ 共有サーフェスサービス−電子ホワイトボード、アプリケーションの共有、ドキュメントの共有、プレゼンテーションの配信。
≡ その他の価値が、放送されるビデオ(大勢へのマイクメッセージ)のTV配信のようなサービスに加えられる。オンラインのインタラクティブトレーニング等である。必要ならば、セッションを記録するサービスも利用される。
ビデオフォン(15)は、劇的に新しい機能を有する電話であって、電話がすることをコンピュータが行おうとしているのではない。これによって、コンピュータが得意である事柄に、コンピュータを完全に同時利用する一方で、通信について、柔軟な、しかし用途が特定された装置を提供できる。ユーザインターフェイス及び物理的なデザインは、この用途に合わせられて、瞬時にオンになり、PC(68)のようではなく現在の電話のような、高い信頼性のあるデバイスがもたらされる。また、このアプローチは、デバイスの動作環境の制御をもたらして、PC(68)のハードウェア及びソフトウエアの構成上の問題に関するサポートの問題が無くなる。
人的要因の研究は、オーディオの質が、効果的でトランスペアレントな通信にとって、最も重要な唯一の因子であることを、幾度となく明らかにしてきた。ハンドセットは重要であるが、質が優れたハンズフリーオーディオによって、新たなレベルの効果的な遠隔共同作業がもたらされる。ハンズフリーオーディオは、音響エコーキャンセル(AEC)と、オートゲインコントロール(AGC)と、ワイドバンドなオーディオ能力(G.722 8kHz帯域幅又はそれより大きい)と、ステレオ出力と、PC(68)の音声出力の統合とを含んている。高質のマイクロフォンアレイもあり、空き缶(tin-can)効果を制限するように設定及び処理される。
ビジュアル出力と、ボタン/選択入力とについて、簡単で、クリーンで、直感的理解が容易であり、柔軟性が充分にあるプラットフォームが用いられる。これは、第1のビデオフォンモデルでは、高質のTFTフルカラースクリーンであり、17インチのダイアゴナルな(diagonal)16×9のスクリーンで、解像度は、1260×768又はそれより大きく、中間解像度(medium resolution)の長寿命タッチパネルで覆われている。明るく(>200nit)、視角が広い(>+−60°)アクティブマトリックスパネルが用いられて、フルモーションビデオを表示し、オフィス環境にて満足に鑑賞される。より大きく、より明るく、より早く、コントラストがより高く、視角がより広いスクリーンを使用してよい。
ビデオフォン(15)は、TFTカラーLCDを用いており、インテルセレロン/440MMX及びLynxVGAコントローラに基づいたVGAタイプのディスプレイ(54)インターフェイスを伴うアーキテクチャのような、PC(68)を有している。
高質のデジタル480ラインのプログレッシブスキャンカメラが用いられて、少なくとも640×480ビデオで、1秒当たり30フレームが得られる。ビデオフォン(15)は、MPEG2エンコードを用いており、セットトップボックスに関するビデオエンコーダ(36)技術を利用している。様々な異なるビットレートを生じることができ、ビデオの質は、1対1のコールに利用されるリソースと、1又多対多のコールの最高質の参加者とに適したものになる。統合された高質のカメラモジュールがスクリーン近くに配置され、外部ビデオ入力(ファイヤライン)が設けられて、追加のカメラ、VCR又はその他のビデオソースが使用可能となる。
デスクトップへの現存するイーサネット接続は、10/100BaseTであり、LAN、WAN、PC(68)デスクトップや、種々のサーバ、プロキシ及びゲートウェイ(70)への接続に必要な唯一の接続である。オーディオ及びビデオのタイムクリティカルなRTPストリームには、802.1pを用いて優先順位が付与されて、QoSのために、LANのイーサネットドメイン内に機構が提供される。また、ディフサーブもサポートされ、RSVPはオプションとしてサポートされる。デスクトップへの配線をさらに設ける必要がないように、ビデオフォン(15)は、小さな10/100イーサネットスイッチを含んでおり、現存するデスクトップのポートがフォンとPC(68)の両方で使用できる。
また、ビデオフォン(15)は、ATMインターフェイスをサポートする。インターフェイスは、HE155Mbits/secカードの使用をベースとしており、ファイバー又は銅のインターフェイスを伴っている。ビデオフォン(15)には、ATMパススルーポートが設けられており、ATM接続されたデスクトップに接続され、又は、イーサネット接続されたPC(68)が、ATM接続されたビデオフォン(15)に接続される。
会議部屋環境についてのコスト及び性能のトレードオフは、デスクトップについてのトレードオフと明らかに異なっている。ビデオプロジェクションと、遠隔でパン/チルト/ズームが可能な複数のカメラと、複数のマイクロホンと、リアプロジェクション型ホワイトボードと、会議部屋環境に適したその他の製品とが、会議ルームのビデオフォン(15)に統合される。会議部屋環境とデスクトップの相互作用は、シームレスでトランスペアレントである。この環境は、OEM装置を大いに使用するであろう。OEM装置は、デスクトップ用に所定の位置に配置されて、同じ設備及び標準器に接続されている。ハードウェアのデザインは、基本的に同様であって、複数のマイクロホンについてさらにオーディオをサポートし、複数のカメラ及びディスプレイについてさらにビデオをサポートする。その代わりに、低コストのSIPフォンにリンクするPC(68)のアプリケーションが使用されてもよい。アプリケーションは、PC(68)がタッチスクリーン(74)を有している場合、マウス又はタッチスクリーン(74)の何れか一方で駆動される。それらのデスクトップとその他の配置が、上述のコラボレーション機能を必要としない場合、システム(10)と共に動作する典型的なフォンが使用できて、配線又はPBXを追加する必要はない。
SIP(セッション開始プロトコル)標準を用いて、端末装置は1又は2以上のサーバでサポートされており、これらサーバは、登録、ロケーション、ユーザプロファイル、プレゼンス、及び種々のプロキシサービスを行う。これらサーバは、廉価なリナックス又はBSDマシンであって、LANに接続されている。
ビデオフォン(15)は、PBX機能のキーセットが設けられたフォンであって、キーセットには、トランスファー、フォワード、3(及び4、5、・・・)パーティ会議、呼び手(caller)ID、コール履歴等が含まれる。これら機能の幾つかは、「CPL」と称されるSIP拡張機構のトップに構築されてよい。拡張機構は、実際には言語であって、安全で拡張可能な方法で、コールの処理が行われる。
ビデオフォン(15)は、アクティブプレゼンス及びインスタントメッセージングを提供する。分散したグループによる共同作業は日々増加しており、プレゼンスは、このような作業に対して最も革新的なツールであって、それによって、人々は、誰がいるのか、彼らは何をしているのかを知ることができる。それは、オーバーヘッドが非常に小さい発呼のベースとなり、テレフォンタグ及び従来の番号のダイヤリングが無くなり、グループに働きかけて、現在一般的であるバラバラの1対1のフォン会議を通じてよりもよりグループとして通信可能となる。インスタントメッセージング(リアルタイムeメール)の統合は、おそらくPC(68)のキーボードを入力に使用して、短いテキストのメッセージを遅延なく交換する方法を与える。
ビデオフォン(15)は、分散/冗長(redundant)アーキテクチャを提供する。これは、フォンシステム(10)であって、信頼性が必要とされる。また、それは、ローカルエクステンションを用いて中央管理され、分散したサーバは、全てのユーザに「瞬時に」応答する。SIPプロキシの種々の機能の各々は、例えば、SIPが用いられている場合、ネットワーク(40)内に配置された冗長バージョンを用いて、それらが一連の物理的サーバ内にて任意に結合できるように展開される。
マイクロソフトネットミーティングは、共有サーフェス及び共有アプリケーション機能に用いられる。PC(68)及びPDA用のコンピュータ/テレフォニーインターフェイス(CTI)を用いることができ、これは、統合されたコンタクトリスト、選択されたフォンの番号又は名前へのオートダイヤリング、コール履歴のカレンダーロギング、コンタクトの自動エントリ等の機能を含んでいる。
RTPフローが動的に割り付けられるUDPポートを用いるので、SIPには、ファイヤーウォールに関する問題があり、アドレス/ポート情報がSIPメッセージに載せられる。これは、ファイヤーウォールが、SIPメッセージをトラックして、適切なアドレス/ポートの組合せについてファイヤーウォールに「ピンホール」を開ける必要があることを意味する。さらに、NATが使用される場合、適切に変更されたアドレス/ポートを有するように、メッセージが変更される必要がある。このような仕事を達成する2つの方法がある。一つの方法は、ファイヤーウォール内にその能力を構築することである。トップ3のファイヤーウォールベンダー(チェックポイント、ネットワークアソシエーツ及びAxxcent)は、これを提供している。一方の方法は、メインのファイヤーウォールと並行動作して、単にSIPを扱う特殊用途のファイヤーウォールを設けることである。このようなファイヤーウォールの市販バージョンには、マイクロアプリアンスのものがある。SIP又はネットミーティングは好ましい実施例であって、必要とされるそれらの機能が個々に実行されることに留意すべきである。必要な機能が与えられる場合には、それらの代替物が使用されてよい。
図5は、ビデオフォン(15)端末の主たる物理的構成要素を示している。スタンドは、メインディスプレイ(54)パネルの高さを容易に調整し、その高さにパネルを保持する手段を与える。高さ調整の範囲は、少なくとも6インチの行程であって、異なる高さのユーザに対処できる。スタンドは机の上に置かれており、デスクトップの高さは画一化されていると仮定する。スタンドとメインユニット間のリンクは、ユーザの好みに合うように、限定された角度で垂直方向にチルトして、その角度で容易にロックされる。チルトの量は、垂直方向について−0+15E必要とされる。メインユニットは、オプションとしてのスタンドアセンブリを必要とすることなく、壁に直接掛けることができる。
メインユニットのケースは、ビデオフォン(15)の設計におけるその他の構成要素全てのハウジングであって、図5に示した全てのものと内部の電子装置の全てとを含んでいる。ケースには、左側又は右側の何れか一方にハンドセットが装着される。右利きの人は左手でハンドセットを手に取る傾向があり(彼らは、右手でタッチスクリーン(74)を駆動し、書き物をする)、左利きの人はその反対である。左側の位置が通常であるが、ハンドセットを右側に配置することも可能である。スピーカジャックがケースに設けられており、スピーカ(64)をビデオフォン(15)から離れて備え付けることができる。入力は、関係したPC(68)のスピーカ出力を処理するために設けられており、ビデオフォン(15)は、PC(68)及びビデオフォン(15)のオーディオを制御できる。スピーカ(64)への(ブルートゥース又はソニー規格による)ワイヤレス接続が使用できる。
ハンドセットはユニットとして設けられており、RJ9コイルケーブル及びコネクタジャックを用いて接続する。置かれている場合には、ハンドセットは容易に手に取られて、さらに、邪魔にならないようにすべきである。ハンドセットオプションは、ハンドセット標準のキーパッドを提供する。ワイヤレスのハンドセットは、端末のユーザの機動性を向上させるために用いられる。
ジャックは、ステレオハンドセット+マイクロホンの接続用に設けられる。ユーザは、ハンドセット+ブーム(boom)が装着されたマイクロホン、又はヘッドセットのみの使用を選択でき、入力デバイスとしてマイクロフォンアレイが用いられる。端末のユーザの機動性を改善するワイヤレスヘッドセット用のオプションがある。
IRポートが設けられて、PDA及びその他のIRデバイスにインターフェイスする。IRポートは、容易にアクセス可能なようにメインケース上に配置される。差し当たって、フォン及びPDAのIRインターフェイスは、最も一般的なものであり、それ故、同様な理由から、IRインターフェイスと同様に、ブルートゥースインターフェイスもそのように要求される。
アレイマイクロホンは、ケーシングに埋め込まれる。アレイは、端末の通常動作の結果として、外部ノイズを生成してはならない。特に、タッチパネル上でユーザの動作を検出可能にすべきではない。アレイマイクロホンによって、ユニットのフロント回りの(例えば6フィートの)円弧及び水平面の110E内にて、所定のデジベルのバックグラウンドノイズが存在する状態にて、ユーザは、通常の会話レベルで話すことができる。ユニットは、マイクロホンが動作/非動作である旨の明確な表示を、即ち「オンフック」又は「オフフック」と同等である表示をする必要がある。ビデオフォン(15)のユーザは、知らない間に聞かれていないという安心を求めるであろう。これは、カメラの機械的なシャッタと同等なオーディオとなる。
メインのビデオフォン(15)ユニットは、スマートカードリーダオプションを具えており、個人的な特徴を用いた端末への安全なアクセスがもたらされる。ビデオフォン(15)へのアクセスは、スクリーン上び簡単なパスワードログオンからセキュリティフォブ(fob)までの、数々のアクセスコントロール特徴を必要とするだろう。スマートカードリーダは、これらアクセス方法の一つを提供する。
チルト及びパンがスクリーンから制御可能である場合、好ましくは、パン及びチルトが電子的機構のみを用いており、機械的機構を必要としない場合、明らかに利点がある。カメラのマウントは、可能な限りメインスクリーンの上部に近いように装着されて、アイコンタクトが改善されるべきである。
カメラには、480pの出力を生成する能力があるデジタルカメラを用いるべきである。カメラの出力は、MPEG−2エンコーダ(36)に送られる。カメラを動的に設定可能として、カメラの出力が最適化されて、エンコーダ(36)の選択された出力データレートでエンコーダ(36)に送られるようにすべきである。顔は、カメラが受信する入力の大部分を形成する。それ故に、肌のトーンについて広い範囲のライティング状態下で行われる正確なキャプチャが、基本的な特性となる。
カメラは、3luxに至るまでの、肌のトーンについて広い範囲のライティング状態下で動作すべきである。カメラは、自動ホワイトバランスを行えるべきである。ホワイトバランスの変化は緩やかであり、キャプチャされた画像の移行(transient)が画像の摂動(perturbation)を起こさないようにすべきである。最後の5秒に渡る変化のみが、ホワイトバランスを変化させるべきである。カメラは、18インチから10フィートまでで焦点が合うべきであり、即ち、大きな被写界深度を有している。カメラは、20フィートまでで焦点が合うのが好ましい。ホワイトボードに何か情報がある場合、ユーザとその情報の両方に対してピントが合う必要がある。オートフォーカスは、ユーザの動作中にカメラが最適な焦点を絶えず探すものであり、受信機側にて乱れた画像を生じるので避ける必要がある。
カメラは、1人のユーザがちょうどカメラの前にいる設定から、数人のユーザが同時に1つのビデオフォン(15)上にある設定まで、有限のズーム能力(limited zoom capability)を可能としている。その代わりとして、異なったレンズが設けられてもよい。レンズの視野について述べると、これは、例えば30Eの視野から75Eの視野として定められ得る。
カメラは、例えば1280×960の画像のような、送信に要されるよりも大きな画像を入力できるべきである。これは、有限のズームと、水平及び垂直のパンとを電気的に可能とし、カメラに関するエレクトロメカニカルな制御の必要性を無くす。「オンスクリーン」の装着が、単にカメラのサイズで出来なくなることがないように、カメラは物理的に小さくすべきである。
中間解像度の長寿命タッチパネルは、ビデオフォン(15)と通信する主要な方法を構成し、メインディスプレイ(54)の前部を構成する。何度も指が接触することから、パネルは、汚れを落とす掃除の繰り返しと、ディスプレイ(54)の質に影響を与えるであろう指紋とに耐えなくてはならない。タッチパネルの較正が、即ち、タッチパネル上で触られる領域とディスプレイ(54)の下部の間のアライメントが「フォールスタッチ(false touch)」の要求を保証することが容易であるべきである。
タッチスクリーン(74)の表面は、表面の反射を可能な限り少なくして、窓に向いている場合でもディスプレイ(54)が鮮明であるようにすべきである。「フォールスタッチ」がまれにしか起きないということが必要とされる。タッチパネルの解像度の要求は、それ故に、タッチが区別しようとしている最も小さいディスプレイ(54)の領域に非常に依存している。解像度と視差の誤差とは相まって、平均的な訓練を受けたユーザが、これらの因子によって「フォールスタッチ」をする可能性が5%未満になるようにすべきである(20回の選択に1回のフォールスタッチがある)。このフォールスタッチ率は2%未満であるのが好ましい。即ち、50回の選択に1回のフォールスタッチがある。
必要に応じて、成功したタッチの音響及び/又は視覚フィードバックがユーザに与えられなければならない。これらのトーンは、その時点にてタッチスクリーン(74)のディスプレイ(54)上にあるものに応じて変化してよい。例えば、キーボードを用いている場合、キーボード音に似た音が適切であり、ダイヤルパッドを用いている場合、個々に異なる音が適切であり、その他も同様である。音響フィードバックは、全ての状況にて必要ではなく、タッチの成功を示すある音響又は視覚的な表示がユーザの助けとなってもよい。ユーザは、トーンのオン/オフが可能であり、ある設定画面にて、タッチに関係したトーン、トーンの持続時間及びボリュームレベルの設定が可能とすべきである。デフォルト値が与えられるべきである。また、タッチスクリーン(74)には、指に加えてペンが使用できる。
ディスプレイ(54)パネルは、少なくとも17インチダイアゴナルフラットパネル(又はより良いもの)であって、フルカラーディスプレイ技術を用いており、アスペクト比は16×9であるのが好ましいが、16×10でもよい。
スクリーンの解像度は、少なくとも1280×768とすべきである。視認可能な角度は、垂直平面及び水平平面の双方について、少なくとも6E外の軸とすべきである。スクリーンのコントラスト比は、一般的な300:1よりも良くすべきである。色解像度は、1色当たり少なくとも6ビットとすべきであり、即ち、プロトタイプユニットで適切な、1色当たり6ビットで262Kの色を表示できるようにすべきである。ディスプレイ(54)パネルは、充分に高輝度であって、充分に明るく又は自然に明るくされた部屋でさえも、楽に見られるようにすべきである。輝度は、少なくとも300cd/cm2とすべきである。ディスプレイ(54)及びデコードのエレクトロニクスは、720Pの高解像度の画像を表示可能とすべきである。このような画像は、ネットワーク(40)上の適当なソースから送られる。
バックライトは、最小寿命にて、少なくとも25,000時間で最大輝度の50%に至るものとすべきであろう。ビデオフォン(15)端末が休止しており、バックライトが切れている場合、着信コールがある場合やユーザがタッチスクリーンの何処かに触れた場合、バックライトは自動的にオンになるべきである。タッチスクリーンがオフになった後の休止期間は、ユーザによって設定可能であって、この設定は、「オフしない」ことまで含むべきである。
ビデオフォン(15)の接続領域に必要な接続が、図6に示されている。各コネクタの要件は、以下の段落にて簡潔に説明されている。
2つのRJ45 10/100イーサネットコネクタは、ネットワーク(40)への接続、及び関係するPC(68)からの接続に用いられる。
ATMパーソナリティモジュールにオプションのプラグが設けられて、光学及び銅のインターフェスの両方について、ビデオフォン(15)が、容易に155Mbits/secのインターフェイスをサポート可能にすべきである。
USBポートが設けられて、例えば、キーボード、マウス、廉価なカメラ等のオプションである種々の周辺機器が容易に接続可能にすべきである。
1394(ファイヤライン)インターフェイスが設けられて、外部の(ファイヤライン)カメラ又はその他のビデオソースに接続可能とすべきである。そのインターフェイスによって、ファイヤラインインターフェイスの完全なインバンドカメラ制御が可能となる。必要な外部コンバータが用いられて、Sビデオからファイヤライン入力への変換をすべきである。会議へのビデオフォンの出力において、このソースをメインカメラソースの代わりに使用可能とすべきである。ノーマル又は「CNN」モードを、即ち、このビデオソース上でクリップ可能(clippable)又はクリップ不可能であるかを特定可能とすべきである。XVGAビデオ出力が設けられて、ビデオフォン(15)が外部プロジェクタを駆動可能とすべきである。その画像は、メインディスプレイ(54)に表示されたものを反映する。
オーディオ入力は、PCオーディオ出力に供給されるべきである。PC(68)のオーディオとビデオフォン(15)とのオーディオの統合を確保するために、1組のスピーカ(64)のみが配置されるであろう。PC(68)の音は、ビデオフォン(15)のオーディオチャンネルを通るであろう。1つ又は1対のジャックが設けられて、ヘッドセットと、ブームが取り付けられたマイクロホンとが接続される。ヘッドセットのみの動作も、内蔵マイクロホンアレイを用いて可能とする必要がある。ヘッドセットジャックが比較的アクセスし難い場合、ヘッドセットを接続されたままにして、ユーザの制御によって、オーディオがヘッドセット上であるか否かを選択可能にすべきである。外部の左側及び右側スピーカ(64)が接続される。図7に示すように、1、2又は3つのビデオフォン(15)ユニットを、それらが、単一の機能のユニットであるかのように使用可能である。
2以上のビデオフォンが配置される場合、1つのユニットのみがメイン制御パネルとして動作し、その他のユニットはビデオと、表示されているそのビデオに直接関係した制御手段とを表示する。これらの如何なる配置についても1組のスピーカ(64)のみが必要とされるのみであろう。
マイクロホン入力及びオーディオストリームに関して、多数のオプションが設けられて、一般的な1つのマイクロホン入力を用いることから、各マイクロホンアレイからビデオフォンのビデオソースにオーディオを送ることまで、可能とされるべきである。
ビデオ入力について、多数のオプションが設けられるべきである。デフォルトでは、「制御パネル」ビデオフォン(15)のビューが送信されるべきである。帯域幅がさらに利用可能である場合、各ユーザは、ユーザが表示されるスクリーンからビデオを得られ、さらに自然な経験が得られる。複数のビデオフォン(15)端末の調整は、LAN接続を用いて得られ、つまり、特殊な如何なる連絡ケーブルも必要とされない。
ビデオフォン(15)は、多数の主な機能を提供する。
−それは、オフィスフォンとなる。
−それは、ユーザのフォンとなる。
−それは、ビデオフォンとなる。
−それは、会議フォンとなる。
−それは、ビデオ会議フォンとなる。
−それは、コンタクトの詳細への容易なアクセスと、それらの管理とを行う。
−それは、ボイス/ビデオメールへのアクセスと、それらの管理とを行う。
ユニットの機能は、2つのカテゴリ、つまりユーザ機能及びシステム機能に分類される。
ユーザ機能は、ユーザが利用できる全ての機能である。
システム(10)機能は、I.T.が要求する機能であって、モニタを設定し、ビデオフォン(15)端末を維持するものである。それらは、通常のユーザには見えない。実際に、デザイン全体の重要な目的は、ユーザに非常にシンプルなインターフェイスが与えられて、ほとんど訓練することなくビデオフォン(15)が使えることを確実にすることである。
以下に示される基本的な機能の組は、利用可能とすべき機能の最小の組である。
ビデオフォン(15)は、ユーザが端末にログオンしていない場合、通常の電話として動作する。その機能は、関連するPC(68)があることに全く依存してはならない。
以下に示されるビデオフォン(15)の機能は、オフィスにおける一般的なフォンのものである。
端末は、サイトに奉仕するPABX上の一般的な内線番号を得ることが可能である。
端末は、PABX上の、ビデオフォン(15)のネットワーク(40)上の、又は外部のフォンの区別なく、どんなフォンから送られた着信コールをも受け取ることが可能である。
ビデオフォン(15)は、互換性のあるその他のSIPフォンから送られるコールを受け入れ可能である。
着信コールは、設定されたように(以下の設定スクリーンの要件を参照のこと)ベルのトーンを生成する。特に、ビデオを含むビデオフォン(15)コールのベルトーンには、コールがビデオフォン(15)の端末から送られるか否かに拘わらず、オーディオのみのコールと区別するベルトーンが選択できる。
着信コールは、ディスプレイ(54)のステータス領域に、着信コールの表示を生成する。この表示は、着信コールで得られる情報と同じ程度の発呼側ID情報を与えるか、誰も応答できないことを示さなくてはならない。
a)着信コールのステータス表示上にあるコールアクセプトボタンを押すことで、着信コールを受け入れできる。
b)ハンドセットを持ち上げることで、着信コールを受け入れできる。これは、提供されるオプションの全てを、即ちビデオ及びオーディオを常に受け入れる。
ユーザは、コール中に、ハンドセットと、ハンズフリー(スピーカフォン)動作との間で切り替え可能である。コール中にハンドセットを持ち上げると、スピーカフォンモードからハンドセットに自動的に切り替わる。スピーカフォンモードを再選択することなしにハンドセットを戻すと、コールが切断される。
スクリーン上の表示は、モードで、即ち、ハンドセット又はハンズフリーで定められるべきである。
コールステータスバーは、コールの継続時間を表示できる。
メインディスプレイ(54)上での簡単な制御により、着信コールのボリュームを調整可能である。ヘッドセット及びスピーカのボリュームは独立して調節可能とすべきである。
スピーカフォンモードである場合、コールを切断することなくハンドセットをハンドセットスタンドに戻すことが可能である。
a)ユーザが、コールステータス表示上のクリアボタンを押すと、コールが終了する。
b)ハンドセットモードであって、ハンズフリーが選択されていない場合に、ユーザがハンドセットを戻すと、コールが終了する。
c)コールがビデオフォン(15)に確実に示されている場合に、離れたパーティがコールを切ると、コールが終了する。
ホールド−コールをホールドし、さらにコールのホールドを再度オフにすることを可能とすべきである。ホールド状態は、ホールドされたコールに出るボタンを用いて、ステータス表示に表示されるべきである。
コール待ち−さらに送られる着信コールは、ディスプレイ(54)のステータス領域に着信コール表示を生成する。それは、設定メニュで使用可能とされない場合、コールのトーンを生成しない。
現在の動作モード、即ちハンドセット又はハンズフリーモードにて、ステータスディスプレイ(54)上のコールアクセプトボタンを用いて、新たな着信コールを受け入れできる。
別の着信コールを受け入れると、現在のコールは自動的にホールドになる。
任意のコール上で「ホールド中止」ボタンを押すと、その他のコールは自動的にホールドに移行する。
同時に存在する処理可能な着信コールの数は、ステータスディスプレイ(54)のスペースを利用して設定される。それは、2つのコール未満にはされない。
現在のコールの数が処理可能な数を超える場合、その他の着信コールは、
a)ビジートーンを発生させ、又は、
b)ボイスメールに直ちにフォワードされ、
c)設定された転送番号に直ちにフォワードされ、
d)記録メッセージを送られる。
「コールフォワードビジー」設定が、ユーザによって定められる。
着信コールが受け入れ限界内であって、(設定自在な)時間間隔内で応答されない場合、コールは、
a)ボイスメールにフォワードされる。
b)以前に設定された転送番号にフォワードされる。
c)記録メッセージを送られる。
「コールフォワードノーアンサー」設定が、ユーザによって定められる。
コール転送−ユーザは、どんなコールもその他の番号に容易に転送できる。転送機能は、コールをホールドして、新しい番号にダイヤル可能である。鳴り響くトーンが聞こえると、ユーザに、転送を完了するオプションが与えられる。また、ユーザは、新たな番号と通話して、その後、転送を開始すること、又は、会議コールの全て(3つの)パーティを初めて合わせることの何れか一方を行う。後者の場合、その会議コールを抜け出す機能が、ユーザに提供される。コールした端末から、応答が、又は直ちにボイスメールが送られない場合には、ユーザに、元のコールに戻るオプションが与えられる。
コールフォワード−予め設定された番号に着信コールを自動的にフォワードするようにフォンを設定できる必要がある。コールフォワードは、
a)無条件であり(unconditional)、
b)ビジーの場合にフォワードし、
c)応答がない場合にフォワードする。
会議コール−ボイスコールが最初であるか否かに拘わらず、オーディオのみの会議で会議コールが可能である。少なくとも3つのコールで、即ち4方向の会話で、会議を開催可能である。常に1つの会議をサポートすることのみが要求されるが、やはり、コール待ちについて先に説明したように、もう1つの着信コールを受け入れ可能であることも要求される。プロトタイプでは、特定の会議への1つの着信コールを受け入れることのみ可能であって、即ち、ビデオフォンではないコールに外部ブリッジが必要であってよい。
着信コールステータス表示のオプションによって、会議接続にコールを加え、又はそれから除去できる。
着信又は発信コールであるか否かに拘わらず、コールを会議に加えることが可能である。
遠隔の会議ユーザがコールを切った場合、そのコールの行程は自動的にクリアされる。
コールは、ハンズフリーにされるか、ハンドセットを用いて行われる。ハンドセットを持ち上げることで、コール中でないならばダイヤルパッドが使用可能となり、オーディオがハンドセットに繋げられる。オンスクリーントーンのダイヤルパッド(即ち、数字「1」から「0」と「」及び「#」)が必要とされる。さらに、ポーズボタンが設けられて、(PABXと通じるために(但し、ゲートウェイ(70)がこの要求を排除するようにプログラムできる場合を除く))ダイヤルされる文字列にポーズを挿入可能となる。+キーが加えられて、+記号は、そのロケーションについてインターナショナルなアクセス文字列に自動的に変換されるように配慮すべきである。
入力エラーを修正するキー(例えば[バック]キー)及び入力をクリアするクリアキーも必要とされる。[バック]キーを短押しすると、最後に入力された番号が除去されて、長押しすると、番号の除去が継続されて、終わると番号のレジスタがクリアされる。
番号表示は、自動的にローカルな番号フォーマットに変換される。[これには、国ごとにスタイルが異なるので、ユーザが動作する国を選択する必要がある。また、インターナショナルコードが入力される場合には、そのコードは、番号の残りの部分をフォーマットする基礎として用いられる。]
トーン番号パッドを用いて機能を選択するサービスに接続される場合、オンスクリーンのキーパッド、又はハンドセットのキーが用いられる際に、正しいトーンが、そのサービスの指示にて生成される。ダイヤルパッドは、コールが如何様に開始されるかに拘わらず、この機能を与える。
リダイヤル−適当に特定されるファンクションを一度タッチすると、最後にダイヤルした番号をリダイヤルできる。
オートリダイヤル−例えば、[リダイヤル]ボタンを一定時間そのままにしておくと、オートリダイヤル機構が動作を開始する。先の試みが、試みた回数ビジー信号を返す場合、リターンオートリダイヤルは、自動的にコールを繰り返す。
キャンプオンビジー(CAMP ON BUSY)−それをサポートするデバイスにコールをする場合、「キャンプオンビジー」機能が利用される。コールされたパーティがコールに出れるようになると、キャンプオンビジーは、ユーザにコールバックする。コールされた番号がキャンプオンビジーをサポートできない場合、メッセージが生成されて、「このサービスは利用できない」旨が述べられる。
ユーザがビデオフォン(15)にログオンしていない場合、適当なログオン画面を表示可能である。
頻出する失敗着信・送信コールのログは、統合されたダイヤル画面にて適当なビューで表示される。「リダイヤルした最後の番号」の設備にアクセスする1又は2回のタッチが、常にダイヤルスクリーン上で行える。さらに、これらのログの記述が以下にされている。
ビデオフォン(15)端末で利用できる機能のフルセットにアクセスするためには、ユーザは、端末にログインしなくてはならない。ログイン画面が出されてユーザは名前とパスワードを入力する。これは、ネットワーク(40)への通常のアクセスで名前とパスワードを入れるのと同様に行える。ビデオフォン(15)端末は、それ故に、サイトのユーザ認証サービスを利用するであろう。ビデオフォン(15)がこれらの認証サービスを利用できるように、IT作業者が設定可能とするのに必要な画面が出される。ユーザを同定する別の方法は、例えば、スマートカード又はIDフォブを用いることである。ユーザには、ビデオフォン(15)端末にログインする前に、PC(68)に既にログオンしている必要はない。
複数のユーザが、1つのビデオフォン(15)にログオンでき、鳴り響く着信トーンは、各ユーザについて異なるようにできる。また、着信コールの表示は、コールしているパーティの名前に加えて、コールされたパーティの名前を特定する。複数のユーザが1つのビデオフォン(15)にログオンする場合、コールをフォワードする機能の全ては、コールの届け先であるユーザに特定されている。
ユーザが既に自分のPC(68)にログインしている場合、ビデオフォン(15)へのログオン行為により、ユーザがログオンしたPC(68)と、このことをPC(68)から確認するビデオフォン(15)端末との間で連関が生じる。ユーザは、複数のビデオフォン(15)端末に同時にログオンできる。動作中のビデオフォン(15)は、そのユーザへへのコールが最初に応答されるものである。
ホームページ画面は、(フルスクリーンモードを除いて)全ての画面が見られるステータス領域を含んでいる。ステータスは、ログオンしたユーザの名前、又は「ログオンしているユーザがない」旨を含んでいる。また、ユーザの「プレゼンス」状態、ビデオ及びオーディオ送信用のアイコン、ボイスメール「メッセージ」表示、及び日付がある。
ユーザのボイスメールシステム(10)に聞かれていないボイスメールがある場合、「メッセージ」表示は、明るくされて、点滅する。表示器を押すと、ボイスメール操作画面が立ち上がる。
日付領域をタッチすると、カレンダー機能にアクセスできる。
ホームページにはコントロールバー領域が設けられて、この領域は全ての画面に渡って視認される(フルスクリーンモードを除く)。
コントロールバーは、最も頻繁に使用されたコントロール機能への直接的なアクセスを可能とし、その他全ての機能へのアクセスも可能とする。アイコンはボタン上で使用されて、また、テキストは、機能の目的を強調するために用いられる。
また、制御パネルは、マイクロホン、カメラ及びスピーカ(64)の統括的な制御をする。制御では、それらの動作状態が、例えばオン又はオフが、そして使用可能なアイコンの場所が明確に示される。
自己の画像が利用でき、カメラで撮影された画像と、アクティブコールの終端で視認できるその部分の両方とが示される。自己の画像をオン・オフすること、そして、常時オンであるか、アクティブコールが確立すると一度だけオンになるかを決定できる。
スクリーンのメインビデオ領域にて、常時、即ち、コール中の場合又はコール中でない場合等にて、カメラの画像を表示可能である。その画像は、1つのビデオコールに対応するものであって、その他のビデオ表示上にオーバーレイする。ビデオのフルスクリーンバージョンを表示可能である。これは、デジタルミラーと考えることができ、カメラが表示する又はしている画像に彼/彼女が満足していることをユーザに確認可能とする。
診断目的では、エンコード及びデコード後にユーザが画像を見られることが望ましく、これによって、ユーザは、離れた所で見られることになる画像の質を把握できる。このモードがサポートされると、カメラの画像と、エンコード、デコードされた画像とが並べて表示される。コンタクト情報に関する画像として用いるために、ユーザは、自己の画像をキャプチャできる。
ホーム画面の大部分は、統合されたダイヤル機能に割り当てられる。4つの主たる補助機能は、スピードダイヤル表示、ディレクトリアクセス表示、ダイヤルパッド、及びコールログへのアクセスである。ダイヤルパッドと、コールログへのアクセスとは、使い易さと両立した最小限度の表示領域を占めており、スピードダイヤル/コンタクトページに利用される領域が最大にされる。スピードダイヤル領域が優先して詳細にわたっており、主な補助機能の全てについて共通した要求は、スピードダイヤルの下のみで詳細にされており、その他の3つの機能には黙示的に含まれる。ダイヤル領域の機能は、コールがなされる相手であるユーザを選択する。
スピードダイヤル領域は、ダイヤルスクリーンのその他の要求に合わせて、可能な限り大きくできる。20を超えるスピードダイヤルのロケーションが適切である。各ロケーションは充分に大きく、そのロケーションに格納される人物の詳細な情報が、通常の動作におけるスクリーンからの距離、例えば3フィートにて非常に読み易いようにされる。
スピードダイヤルロケーションに格納されたユーザの情報は、人物名を、知られているならば「プレゼンスステータス」を、そのスピードダイヤルが選択されている場合はコールされる番号を、ユーザがビデオコールをサポートしているか否かを示すアイコンとを含んでいる。また、詳細情報には、ビデオの種類が、例えば、ビデオフォン(15)、互換性のあるMPEG2、H271等が含まれる。
その領域には、クリア領域が設けられており、このクリア領域は、コールを開始する際にタッチされる。使用されるならば、親指の爪の絵が含まれる。長い名前(即ち、スピードダイヤルボタンに割り当てられたスペースに納まらない名前)を処理する方法が提供される。
標準的なインターナショナルフォーマット、即ち「+国コードエリアコード番号」における通常の電話番号は、この番号にコールするのに必要な外部アクセスとインターナショナルアクセスコードとに自動的に変換される。
スピードダイヤルページ上にて、人物に関するコンタクトの完全な詳細が利用できる。コンタクトの詳細では、ユーザがコールできる全ての番号が示されて、スピードダイヤルページで用いられるデフォルト番号として、これらの番号から1つの番号を選択する手段がもたらされる。そのコンタクトページへのこのリンクを用いて、そのユーザの別の番号を選択してダイヤルできる。
ユーザ情報は、その人物に関するつい最近のコール履歴を含んでおり、例えば、コール履歴は、失敗着信コール、送信コールの何れか一方である最後の10コールである。「ラストコール」情報のみを提供することは、受け入れ可能な最小の機能であろう。
スピードダイヤルエントリに関してコンタクトの詳細を編集し、及び/又は、スピードダイヤルページに新たなコンタクトエントリを作成することが可能である。コンタクト画面、ディレクトリ画面、又はコールログ画面からスピードダイヤルページにエントリをコピーできる。スピードダイヤルページからコンタクト画面又はディレクトリ画面にエントリをコピーできる。スピードダイヤルエントリを削除すること、又はそのエントリを別のコンタクトページに移動することが可能である(即ち、コピーとオリジナルの削除)。
スピードダイヤルページ上にてユーザの掲載を制御可能である。また、ある方法(カラーコーディング)で、スピードダイヤルユーザの様々なクラスを、即ち、ビジネス、家族、仲間、ベンダー、顧客を区別することが可能である。スピードダイヤルページは、コンタクト情報におけるその他の複数のカテゴリからの名称をかなり含んでいてもよい。自動認証のある種のフォーム、例えば、姓・名・会社や姓・名・会社の後にクラス等のフォームが用いられる。
ユーザのグループを、1つのスピードダイヤルエントリとして定義できる。それは、グループのサイズが最大会議コールのサイズに限定される場合に受け入れられる。スピードダイヤルページからディレクトリビューを選択可能である。ディレクトリビューは、スピードダイヤルページと同じ画面領域を占める。ビデオフォン(15)がアクセスするオンラインのディレクトリの範囲から選択が可能である。デフォルトは、アウトルック及び/又はロータスノーツのディレクトリであって、それらは、ユーザの主なコンタクトの詳細を含んでいる。選択されたディレクトリの名前は表示される。
アウトルック又はノーツのコンタクトリストにおいてユーザによって確立されたカテゴリーは、選択時に利用できる。カテゴリの数が表示領域に合っていない場合、ボタンが設けられて、リストを、スクロールアップ又はスクロールダウンする。リストは、アルファベット順に整理される。
スピードダイヤルカテゴリは、スピードダイヤルページに配置されるカテゴリである。スピードダイヤルページが一杯になって、もはやこのコンタクトカテゴリにさらに名称を加えることができなく、それらが既存のエントリに取って変わらない場合、何らかの表示がされる。最近のコール順にスピードダイヤルエントリを順序付ける機能があり、即ち、最後に用いられたスピードダイヤルエントリは下側に配置されるであろう。これは、どのエントリが削除される最適の候補であるかを見るために用いられて、より使われる番号を入力可能とする。
最小限のユーザ入力で、選択されたカテゴリからエントリを容易に見つけて選択できる。エントリ選択機構は、比較的短いリストと、非常に長いリスト(10000の名前)とについて働く必要がある。その機構は、検索されるテキスト文字列を入力できる必要がある。提示されたデータのソート順を、性、名又は組織で選択できる必要がある。入力エラーを修正して、全検索を迅速に再開する手段がある。
検索キーの順番は重要であって、ユーザが変更できることが好ましい。言い換えると、例えば、最も左の検索キーを押し続けることにより、ユーザは、姓、名又は会社(又は、属性の拡張リスト。これは、例えば、特定の部署又は特定の場所にいる者、例えば”韓国にいる者”を見つけるために使用される)による検索をすることを選択する。第2キーは、その後、第1キーの検索の限定を行い、以下同様となる。よって、複数のキーが、会社、姓、名と設定される。例えばマルコーニの場合、姓についてマルコーニをアルファベット順に検索するユーザ検索が行われる。各ソートカテゴリが選択された場合、そのカテゴリフィールドの同じ値を用いて、エントリの下位の順序付けが黙示的になされるのは明らかである。姓が選択される場合、黙示的な下位の順序は、名そして会社であり、会社が選択される場合、黙示的な下位の順序は、姓そして名であり、名が選択される場合、黙示的な下位の順序は、姓そして会社である。
コールログ画面は、送信、着信及び失敗というコールの3つのカテゴリの最近のエントリを表示する。選択されたカテゴリは明瞭に示される。加えて、「頻出する」カテゴリがあって、該カテゴリは、任意のタイプの最近のコール(200未満)について、頻繁に用いられる番号をリストアップする。コールダイヤル画面からダイヤルパッドにアクセス可能である。かなりの量のコールログデータの処理をもたらす値の解析は保留される。
最低の場合でも、「メッセージ」がタッチされて、ユーザへのボイスメールシステム(10)への接続がなされると、このユーザのボイスメールが入力され、ダイヤルパッドが表示されて、フォンのキーが通常押されるようにボイスメールが制御される。「ボイスメール」画面の大部分にはボタンがあって、メールシステム(10)の各機能にアクセス可能である。アクセスされる機能には、例えば、次メッセージ、先メッエージ、メッセージ再生、メッセージ転送、メッセージ応答、コール送信等がある。各ファンクション内のキー押しと等価な全てのものにもアクセス可能であって、記録開始、記録停止、記録レビュー、記録削除等がある。全てのファンクションはボタン上にあり、各々のDMFトーンに変換される。
「フォワード」番号又はどのボイスメールコマンドも、ユーザの番号リストが入力される必要があり、スピードダイヤル又はディレクトリ画面ビューから選択できる。その選択によって、ユーザの番号の適当な部分が自動的に挿入される。これは、ボイスメッセージをグループにフォワードするのに特に有用であろう。ユーザは、ビデオフォン(15)上にて日時を設定可能である。適当なネットワーク(40)サービスによって、日時を自動的に設定できるのが好ましい。
カレンダ機能が利用できて、ユーザのアウトルック/パーム/ノーツスケジュール/カレンダアプリケーションと統合される。単に、日、週又は月単位で、(アウトルック又はパームのスクリーンで)任意の日付の予定が見られて、アウトルック又はパームデータベースを介してのみ可能な変更と新たなエントリとが見られることが最小限要求されるであろう。
かなり多くのユーザが自分のカレンダを保持しておらず、実際には自分の机にPC(68)がないであろうが、情報を見る必要がある事態は起こり得る。画面のステータス部にあるユーザステータス領域にタッチして、ユーザは自己のステータスを設定する。ユーザには、選択可能な一連のステータスオプションがあり、i)空き、ii)ビジー−コール中であり、別のコールが受け取れない、iii)接触禁止−コール中ではないが、中断可能ではない、iv)5分内に戻る、v)オフィス外、vi)休日を含んでいる。
ビデオフォン(15)に1つのコールがある場合、1つの着信ストリームから、会議における最大数のストリームまでがサポートされる。ビデオ会議では、端末は、1つの会議コールの部分として、他のパーティへの少なくとも4つの接続をサポートする。最大サイズのビデオ会議コールがある場合さえも、少なくとも2つの独立したオーディオのみのコールを受け入れ可能であり、オーディオコールは会議(consultation)ホールド転送され得る。ビデオフォン(15)は、少なくとも3つの「コール状態(instance)」を同時に、つまり、独立したコールを最大で3つまでサポートできる。1つのコールのみがアクティブにできる。つまり、コール制御は、1度に、1つのコールのみに行われる。1を超えるコールが受け入れ可能である。つまり、ユーザのオーディオ及びビデオは、アクティブであるか否かに拘わらず、受け入れられた各コールに送信されている。オーディオ及びビデオがホールド中のユーザに送信されず、そのユーザから送られるオーディオ及びビデオも止められている場合、進行中のコールはホールドされてよい。
着信コールのステータスは、コントロール表示領域に示される。コール自体と、インコール制御とがディスプレイ(54)のメインセクションに示される。
コールステータスは、以下の通りである。
i) 着信コール。
ii) 受入及びアクティブ−ユーザのオーディオ(ビデオコールの場合はビデオも)は、種々のミュート制御を受けて、このコールに接続され、コール制御がこのコールに適用される。
iii) 受入及び非アクティブ−上記と同様であるが、コール制御はこのコールに適用されない。
iv) 受入及びホールド−ユーザのオーディオ(ビデオコールの場合はビデオも)は、このコールへ送信されていない。
v) 受入及び転送。
コールステータスは、各コールについて示される。受け入れられた1つのコールのみがアクティブとなる。受け入れられたコールは、そのコールに関連したコール表示の領域を又は制御パネルのコールステータスを、タッチすることでアクティブにされる。先のアクティブコールは何れも、アクティブに設定されない。2度目のタッチは、アクティブ状態をオフにする。着信コールの表示は、コールがビデオ接続を申し出ているか否かを示す。表示がないことは、オーディオのみのコールを意味する。着信コールの表示は、その着信コールに関するパーティの名称を示す。これは、直ちに、ユーザが1対1でコールされているか、又は会議への参加を勧誘されているかを示す。
ユーザは、以下のオプションを用いて着信コールを処理する。
i) 音声のみのコールとしてコールを受け入れる。
ii) ビデオコール(音声を含む)としてコールを受け入れる。
iii) ボイスメールを送る。
ビデオフォン(15)端末を設定して、サポートされるコールの最大数まで、着信コールに自動応答できる。申し出があると、自動応答は、オーディオ及びビデオ接続を生成する。 コールが一旦起こると、ユーザステータスは、自動的に「インコール」に変化する。アクティブなコールがないと、ユーザステータスは、前の状態(一般的には「空き(available)状態」)に戻る。
ユーザは、コールユーザデータも配布されるか否かを設定可能である。ユーザが、既に1又は2以上のコールを受け入れている場合、及び、全てのコールがホールドである又はアクティブでない場合、このコールは、受け入れられると新らしいコール状態を生成する。受け入れられたがアクティブでないコールは全て、この新しいコールをユーザが扱う最中に、ユーザの見聞きを継続して行う。受け入れられたコールの1つが受け入れられてアクティブとなる場合、新しいコールがそのコールに加えられる。コールが受け入れられると、そのコールの全てのパーティは、新しい呼出し側にとって、会議の参加者となる。
ある時間(10秒より大きい)の後、ユーザがコールに出ない場合、コールは、「フォワードオンノーサンサー(Forward on No Answer)」設定で定められたように、自動的にフォワードされるであろう。上述のように、フォワードは、コールの宛先であるユーザに特定される。ユーザステータスに「ドゥノットディスターブ(Do not disturb)」若しくは「ビジー(busy)」が付される場合、又は、最大数のコールが処理されている状態で「ビジー」状態が設定された場合、コールは、「フォワードオンビジー」及び「フォワードオンドゥノットディスターブ」設定で定められたように「直ちに」転送される。実施されるならば、「ショウフォワーデットコール(show forwarded calls)」設定で修正される。
「ショウフォワーデットコール」設定を用いて、着信コールが転送される前に、ユーザがある時間(5秒より大きい)の間、着信コール表示を見ることを選択できる。(これは、コールを受け取ることを望まない場合に、ユーザに対して、コールへの積極的な動作が要求されるのではなく、動作が必要とされないことを意味する。)これは、ビデオフォン(15)が既に最大数のコールを処理していることによってビジー状態が生じている場合には、これは機能しない。
コールと共に送られる(非常に短い)テキストメッセージを作成する能力は、コールの重要性及びそれがどの程度の長さであるかについて、さらに情報を運ぶ有用な方法である。メッセージを作成して送信コールに加える要件は、以下に説明される。存在する場合、着信コールテキストメッセージは、着信コールに関連して表示される。ディスプレイ(54)は、複数の着信コールが同時にある場合に、テキストメッセージの表示に対処する。また、テキストメッセージは、着信又は失敗コールログに格納される。
コールパラメータネゴシエーションは、ネットワーク(40)規定のパラメータと現在のネットワーク(40)利用内にてコールを確立するのに要するものに制限される。設定により、ユーザは、その他のビデオフォン(15)端末に対してコールの選択を明示できて、例えば、常時ビデオを提供すること、決してビデオを提供しなこと、ビデオを提供することを希望しているか否かを各コールに尋ねることが可能になる。
キャンプオンアベイラブル(Camp on Available)は、他のビデオフォン(15)のユーザへのコールについてサポートされる。これは、ユーザの状態が「空き状態」に変化すると、ユーザにコールを開始する。コールされたユーザがグループである場合、グループの全てのメンバーが「空き状態」である場合にのみ、コールが開始される。
会議コールでは、スピードダイヤル又はディレクトリリストのある場所が人物のグループを示している場合、その各々がコールの参加者となる。この機能を実施するための推奨される処理は、各コールを順番に行い、直ちにそのコールが会議に加えられるべき旨の動作要求確認をするものである。これによって、コールがボイスメールに直行する場合、エスケープルートが与えられる。最初の呼出し側の動作が完了すると、つまり、コール中であるかコールが拒否されると、次の番号が処理される。
半二重である送信コールを、言い換えると、コールされたパーティからオーディオ及び/又はを要求する送信コールを生成できるが、あるタイプのコールではどちらも送信しない。それは、プルモードである。同様に、プッシュモードを生成可能である。プッシュモードでは、送信コールは、オーディオ及び/又はビデオを送るが、如何なるオーディオ又はビデオをも要求できない。このモードは、無人端末に、又は会議にて消極的な役割のみをするユーザの端末に、選択的にコンテンツを配信するために使用されてよい。
スピーカ(64)、ハンドセット及びヘッドセットのボリュームは、全て個別に調節される。スピーカは、オン・オフされる。スピーカをオフにするとマイクロホンがオフにされる。ステータス表示は、スピーカ及びマイクロホンの状態を示す。
マイクロホンは、オフにでき、オンに戻すこともできる。ステータス表示は、マイクロホンのミュートの状態を示す。
カメラは、オフにでき、オンに戻すこともできる。ステータス表示は、カメラのミュートの状態を示す。
インコール制御は、アクティブなコールのみに働く。受け入れられたコールは、アクティブでない場合に、進行中のコールのステータス表示を制御パネルにてタッチするか、特定のインコール制御ファンクション領域を除くコール表示領域の何処かをタッチすることで、アクティブにされる。現在アクティブであるその他のアクティブなコールは、非アクティブにされる。アクティブなコールは、同じ領域を続いて押すことで非アクティブにされる。制御によって、アクティブなコールは切られる。会議コールでは、それによって、コール状態の全ての要素がクリアされる。
コールは、会議コントロールに受け入れられて、アクティブとされて機能する。会議コントロールをタッチすると、現在のアクティブコール状態を、アクティブにされる次のコールに加える。会議コントロールは、再度押されて非アクティブにされるまで、又は別のコールがアクティブにされるまでの何れかの場合にて、コールがアクティブであることを示す。現在アクティブである全てのコールが会議コール状態に加えられた後、コールは1つの会議コールになり、会議コントロールのアクティブ表示は消える。再度述べると、会議は、他のコールが加えられるコールを選択し、その後、そのコールに加えられるコールを選択する。
会議コールに繋がれたあるパーティを終了する方法は、そのパーティがコールを切ることである。様々な理由から、ユーザは、コール状態の各部分を独立に制御したいと希望するだろう。これは、脱会議(de-conference)能力によって実現できる。例えば、3秒より長くコール状態をタッチすることで、サブメニューが表示される。サブメニューでは、コール状態の個々のメンバーを特定でき、脱会議について選択され得る。このコールは、その後会議から除去されて、別個のコール状態として確立される。それには、通常の全ての制御が適用されて、特にクリア可能である。
転送ファンクションはアクティブコールを転送する。転送コントロールがタッチされると、統合されたダイヤル画面が表示されて、アクティブコールがホールドされる。しかしながら、それはインコール動作に関わっていることが表示されている。転送コントロールは、再度押されて、転送がキャンセルされるまで、又は、ユーザがコールの転送を希望する番号のダイヤルが選択及び押されるまで、コールがアクティブであることを示す。
送信コールが一旦開始されると、転送コントロールは状態の変化を表示し、コントロールがタッチされると、「ブラインド」転送が起こって、コール状態が画面から除かれる。その代わりに、コール先の番号が応答するまで、ユーザは待ってもよく、コール先の番号が応答する時点で、新しいコール状態が生成されて、ユーザはコール先のパーティと会話ができ、転送ファンクションは状態を再度変化させる。そして、それを再度押すことで、両方のコールの転送及び終了が完了する旨が表示される。別の方法では、転送されている呼出側との会話に戻って、転送処理が再スタートされ、又はコールが終了する。転送は主要な機構であり、それによって、「アドミン(admin)」はコールをセットアップし、それを「ボス(boss)」に転送する。この場合、転送されたコールをアドミンが「聞き」続けることが不可能であるのは重要である。これは、安全な環境には特に重要である。
ホールドコントロールをタッチすると、アクティブコールはホールドされる。ホールドでは、送信ビデオ及びオーディオストリームは中断されて、ホールドされている旨の表示が離れた端に与えられる。着信オーディオ及びビデオストリームはもはや表示されない。ホールド状態は、コントロールバー上でコール状態表示上に示される。何らかのコールがホールドされている場合、ホールドコントロールはホールドがアクティブである旨を表示する。アクティブコールがホールドである場合にホールドを再度押すと、ホールドが解除されて、コールは表示された状態に戻る。
メイン制御パネルを制御することで、ホーム画面を立ち上げて、その他の全ての非コールファンクションにアクセス可能となる。メインが選択された表示がされる。メインが再度押されると、現在のコールの表示が再度行われて、メインが選択から外される。受け入れられて表示されたコール内のパーティの各々について、及び表示された各コールについて、分離コントロールが適用される。個々のユーザの各々から送られるオーディオのボリュームを調整することが必要とされる。画面に表示されたオーディオ及び/又はビデオを独立してミュートすることが可能である。ステータスインジケータがあって、オーディオ又はビデオミュートがオンであるか否かを示す。
2以上のコール状態が常に表示できる場合、例えば、2人の他人の会議コールに加えて1人の他人への新たなコールがある場合、完全なコール状態についてオーディオ及び/又はビデオをミュートすることが可能である。例えば、第2コールで話している間に、オーディオについて2つのパーティの会議をミュート可能である。
ビデオをサポート可能なオーディオのみの接続上で、ビデオをリクエストすることが可能である。ビデオリクエストの受け入れ又は拒絶も可能である。接続が合意されるとビデオ接続が確立される、設定ページアイテムによって、ユーザは、ビデオリクエストを常時受け入れ、又は常時拒絶可能である。
各接続について、搬送(bearer)チャンネルパラメータを、つまり、ビデオの着信及び送信エンコードレートを、オーディオもあるならばそのレートを表示できる。コール中では、制御はアクティブコールのみに働く。受け入れられたコールは、アクティブでない場合、アクティブにされる。
どのユーザも「搬送チャンネルクオリティモニタ」を利用可能である。このモニタは、携帯電話の信号強度メータのようなビットであって、例えば、オーディオ及びビデオチャンネル上でエラー又は損失パケットがない場合には、100%のグリーンバーとなり、損失レート又は待ち時間が所定のレートに達すると黄色のバーとなり、より高いレートに至ると赤いバーとなる。このタイムフレームにおけるエラーがユーザのビデオに影響するので、時間積分は短く、例えば50ミリ秒とされる。従って、例えば、受信側でビデオのアーチファクトが見られて、同時にモニタバーが黄色又は赤に移動する場合、受信側は、ネットワーク(40)の混雑が生じていることを知る。
コール内で、ビデオエンコードパラメータを変更する、つまりエンコードレート増加又は減少することをリクエストできる。このリクエストを受け入れ又は拒否することが可能であり、送信ビデオレートを変更する方法が与えられる。ビデオフォン(15)は、全ての参加者に対して1つの送信エンコードレートを生じる。それは、受信ストリームの全てにて異なる受信レートを受け入れ可能である。
サイドバーへのリクエストが可能であり、そのリクエストを受け入れ又は拒否することも可能である。受け入れられる場合、サイドバーは両方の参加者から他の全ての者へのオーディオストリームを切る。これによって、彼らはプライベートな会議ができ、その一方で、彼らは、全ての議論を聞き、さらに、全ての参加者を見続け、それらに見られ続ける。ビデオ及びサイドバーリクエストの両方の方法で短いメッセージを送ることができる。
コールが着信コールであるか送信コールであるかに拘わらず、ビデオビューへのスクリーン移行はスムースでなくてはならない。オーディオは、ビデオを予想してよい。この移行がされ得るまで(即ち、ビデオへの移行において、ジャンピ(jumpy)な画像、半分しか形成されていないフレーム等があるべきではない)、ビデオは表示されるべきではない。ユーザのディスプレイ(54)のビデオ画面への移行は、コールが「進行中」である後にのみ開始し、コールを開始する時点では行われない。ユーザから送られるビデオの表示は、ユーザのディスプレイ(54)に割り当てられた表示領域を最大限利用する。インディスプレイコントロールは、この1つのコー状態の1人のユーザの表示を、フルスクリーン表示に変換する。「フルスクリーン」表示の内の何処かをタッチすると、標準表示に戻る。既に言及したインコールコントロールに加えて、ユーザ名が表示される。ディスプレイ(54)及びコントロールパネルのコール状態は、コールがアクティブか否かを、即ち、インコールの一般的な制御が動作するか否かを示す。あるコール状態が起きていると、そのコール状態を押すことで、又はインコールの特定のコントロール領域から離れたメインディスプレイ(54)上の何処かを押すことで、アクティブがインアクティブとなる。
1つのコール状態から2つのパーティのコールへの移行はスムースであって、第2コールが「進行中」になると開始される。ディスプレイ(54)は、ユーザのディスプレイ(54)に割り付けられた表示領域を最大限に使用する。必要ならば、ビデオは変倍よりも各縁部をクリップされて、使用領域に合わせられる。フルスクリーン表示を2又は3以上にする要求はない。既に述べたインコントロールに加えて、ユーザ名が各パーティに表示される。両方のパーティが単一のコール状態の部分であることが示される。ディスプレイ(54)及びコントロールパネルのコール状態は、コールがアクティブか否かを示す。パーティがさらにビデオコールに加わるにつれて、着信ビデオは使用領域に合うように、その都度クリップされる。
共にパーティが単一コールである2つのコール状態では、これらユーザ各々への2つの別個のコールがあって、双方が表示される。オンスクリーン表示及びコールコントロール表示は、独立した別個の2つのコールがあること、さらに、どれかがアクティブであるか否かとを明確に示す。コールの何れか一方がホールドにされる場合、そのコールはもはや表示されず、ディスプレイ(54)は、単一コール状態の単一コールの表示に戻る。
ユーザ領域には、上記に記載されたものに加えて、以下の組合せの何れかが表示される。
各々が単一パーティのコールである、4つのコール状態。
あるコールが2つのパーティであって、その他が単一パーティのコールである3つのコール状態。
1つのコールが最大で3つのパーティのコールであるか、2つのコールが2つのパーティのコールである、2つのコール状態。
「CNN」スタイル表示要求は、上記した単一コール状態の単一コールの要求であって、フルスクリーン表示が可能である。また、画面の半分に「CNN」スタイルコールを表示し、残りの半分を1又は2つのユーザ表示領域として使用可能である。後者は、2つの独立したコール状態、又は、パーティが2つである単一のコール状態である。
様々なレベルで音声及びデータの暗号化をすることが可能である。診断、テスト、測定及び管理機構にアクセスすると、SMF(simple management framework)が用いられる。言い換えると、アクセスは、3つの方法、SNMP、ウェブ及びクラフト(craft)インターフェイスを通じて、全ての機能を可能にする。ビデオフォン(15)端末は、遠隔管理可能であり、オンサイトのIT専門家が日々の動作を見ることや、ソフトウェアをアップグレートしてバグを修正することは不要である。障害診断も遠隔で可能であって、問題が、ユニットハードウェア、ユニット設定、ユニットソフトウェア、ネットワーク(40)又はネットワーク(40)サービスに関連しているか否かを判断できる。管理では、IP接続が仮定され得るが、ビデオフォン(15)への比較的低帯域幅での接続である必要がある。
通常動作下では、電源が入れられると、ビデオフォン(15)は、ハードウェアシステム(10)テストを短縮バージョンで行う。これが不合格であると、ビデオフォン(15)は、メインスクリーンにブート失敗メッセージを表示する。端末は、より長いハードウェア診断モードに強制的にされ得る。これは、キーボードをUSPポートに取り付けることで、又は、ユニットの電源を入れてタッチスクリーンの右上隅を押すことでなされる。このモードによって、基本的なオペレーティングシステムとさらに強力な診断にアクセスして、ハードウェアが不合格であるか否かを判断可能となる。
一連の単純なテストを含めることができ、これによって、ビデオフォン(15)がブートアップテストをパスするが正しい機能をユーザに提供していない場合に、ユーザは活動可能である。端末には、ローカルキーボード(及びマウス)について技術的インターフェイスが設けられており、診断ユニット又システム(10)の問題を支援する。これによって、オーディオ及びビデオ等の様々な診断にアクセス可能となる。
遠隔制御下で、ビデオフォン(15)端末のソフトウェアの新たなバージョンを安全にダウンロード可能である。安全については、ダウンロードされたバージョンに不備が起こる場合は、ローカルな介入(即ち、誰かがCDを挿入すること)を行うことなく、先のバージョンに戻すことが可能である。特定のビデオフォン(15)端末上のソフトウェアのバージョン番号と、ユニットのハードウェアのシリアル番号と、アセンブリ修正番号と、キーサブアセンブリのシリアル番号及びアセンブリ修正番号とを、管理インターフェイスを通じて読み出しできる。システム(10)がクラッシュした場合、ビデオフォン(15)は、そのクラッシュの診断を支援する情報を格納し、又は情報の格納を完了している。ビデオフォン(15)がリブートされると、この情報は解析のためにリモートサイトからオンラインで回収できる。
ビデオフォン(15)は、全ての動作、イベント及び状態の変化のランニングログを保持する。ログは、記録装置がこの機能に割り当てできる限りにおいて保持される。少なくとも1月分の動作量について格納可能であるべきである。このデータには、多数のカテゴリが含まれており、例えば、安全カテゴリは、ユーザがコールした番号等のユーザデータを含んでおり、ユーザによってのみ公開可能である。コール数、コール状態(即ち、コール状態及び状態当たりのエンドポイントの数)、エンコーダ(36)及びデコーダ(34)の特性、搬送チャンネルエラーレポート等のような一般的なデータは、あまり慎重を期するデータではない。システム(10)レベルの問題を診断し、一連のイベントを生成することを助ける一手段として、キーが押されたことを毎回記録することが可能である。
ビデオフォン(15)は、IPレベル及びSIPレベルの両方で、コントロールプレーンレベルでエクスチェンジを、離れた遠隔端末(ビデオフォン(15)端末に遠隔接続されたラインモニタを有する同等物)にコピーする。端末の管理は、多数のパラメータ、例えばネットワーク(40)のクオリティを、モニタする。閾値を設定して、これらの閾値に到達した場合に警告を発することが可能である。ATMインターフェイス及びイーサネットインターフェイスの両方は、(例えばrmonと同等な)一般的な測定をする。測定は、ビデオフォン(15)で利用される。ビデオフォン(15)は、1又は2以上のネットワークマネージメントシステムに警告を送ることが可能である。
説明を目的として上述の実施例について本発明を詳細に記載したが、このような詳細は単に説明を目的とするものであり、当該技術分野における通常の知識を有する者は、特許請求の範囲に記載されたものを除き、本発明の範囲から逸脱することなく本発明の変形が可能である。
添付の図面では、本発明の好ましい実施例と、本発明を実施する好ましい方法が示されている。
図1は、本発明のシステムの概略図である。 図2は、本発明のネットワークの概略図である。 図3は、PC及びネットワークに接続されたビデオフォンの概略図である。 図4は、本発明のシステムの概略図である。 図5a及び図5bは、ビデオフォンの正面及び側面の概略図である。 図6は、ビデオフォンの接続パネルの概略図である。 図7は、ビデオフォンのマルチスクリーン配置の概略図である。 図8は、ビデオフォンのブロック図である。 図9は、ビデオフォンのアーキテクチャのブロック図である。 図10は、システムの概略図である。 図11は、システムの概略図である。 図12は、プレゼンスセンサのブロック図である。 図13は、ビデオフォンのタッチスクリーンのページである。 図14は、本発明の装置のブロック図である。 図15は、本発明のシステムの概略図である。 図16は、本発明のもう一つのシステムの概略図である。 図17は、本発明の装置の概略図である。

Claims (13)

  1. シーンのビデオ画像を取得するイメージング手段(30)と、
    シーンのビデオストリームをビデオ画像から生成すると共にシーンのオーディオストリームを生成し、ビデオストリームをネットワーク(40)上に送ると共に、シーンにてノイズが所定の閾値を超える場合にのみ、オーディオストリームをネットワーク(40)上に送る生成手段(36)(38)(50)(62)とを具えており、
    生成手段(36)(38)(50)(62)は、イメージング手段(30)と通信することを特徴とするビデオフォン(15)。
  2. シーンのビデオ画像を取得する工程と、
    シーンのビデオストリームをビデオ画像から生成すると共にシーンのオーディオストリームを生成する工程と、
    ビデオストリームをネットワーク(40)上に送ると共に、シーンにてノイズが所定の閾値を超える場合にのみ、オーディオストリームをネットワーク(40)上に送る工程とを含むことを特徴とするビデオコール方法。
  3. ネットワーク(40)から受け取ったビデオストリームを表示するディスプレイスクリーン(54)と、
    シーンの音声を受け取るマイクロホン手段(58)(60)と、
    ネットワーク(40)から受け取ったオーディオストリームをシーンにて再生するスピーカ手段(64)と、
    シーンにてスピーカ手段で再生されたノイズをモニタし、スピーカ手段を調整して、スピーカ手段で生成されたノイズを所望のレベルに維持するモニタ手段(50)(62)とを具えており、
    モニタ手段は、スピーカ手段及びマイクロホン手段と通信することを特徴とするビデオフォン(15)。
  4. ネットワーク(40)から受け取ったビデオストリームをディスプレイスクリーン(54)上に表示する工程と、
    シーンの音声をマイクロホン手段で受け取る工程と、
    スピーカ手段を用いて、ネットワーク(40)から受け取ったオーディオストリームを、シーンにて再生する工程と、
    シーンにてスピーカ手段で生成されるノイズをモニタし、スピーカ手段を調整して、スピーカ手段で生成されたノイズを所望のレベルに維持する工程とを含むことを特徴とするビデオフォン(15)を動作させる方法。
  5. Nは3より大きい又は3と等しい整数であって、異なる場所から送られるノイズに関するN個のオーディオストリームを、ネットワーク(40)から受け取る受信手段(38)(42)(62)と、
    MはNより小さい又はNと等しい整数であって、N個のオーディオストリームからM個のオーディオストリームを選択する選択手段(62)と、
    M個のオーディオストリームをミキシングして再生する手段(62)とを具えることを特徴とする装置(93)。
  6. Pは3より大きい又は3と等しい整数であって、受信手段は、異なる場所から送られる画像に関するP個のビデオストリームを受け取り、
    SはPより小さい整数であって、選択手段は、P個のビデオストリームからS個のビデオストリームを選択し、
    S個のビデオストリームを再生する手段を含むことを特徴とする請求項5に記載の装置(93)。
  7. ローカルなオーディオストリームに閾値を超えたノイズがある場合、ローカルなオーディオストリームをネットワーク(40)に送る手段(38)(42)(62)を具えることを特徴とする、請求項5又は6に記載の装置(93)。
  8. 閾値は動的であって、選択手段で選択されたM個のオーディオストリームのノイズレベルに基づいて閾値を決定する決定手段(62)を含むことを特徴とする、請求項5乃至7の何れかに記載の装置(93)。
  9. 決定手段は、M個のオーディオストリームに関するM個の異なる場所から受け取った閾値に基づいて閾値を決定することを特徴とする請求項5乃至8の何れかに記載の装置(93)。
  10. ネットワーク(40)と、ネットワーク(40)を通じて互いに接続されたN個のノード(80)(82)(84)とを具えており、
    Nは3より大きい又は3と等しい整数であって、各ノードは、そのノードで閾値を超えたノイズがある場合、オーディオストリームをネットワーク(40)に送り、
    MはNより小さい整数であって、各ノードは、N個のノードから選ばれたM個のオーディオストリームを再生する再生手段を具えており、
    各ノードは、所定の時間にてそのノードで再生されたM個のオーディオストリームのノイズレベルに基づいて、その時間にて閾値を決定し、
    各ノードの閾値は動的であって、独立に決定されて、N個のノード間に分布しており、
    各ノードは、M個のオーディオストリームの種々の組合せを再生する再生手段を具えていることを特徴とするシステム(10)。
  11. Nは3より大きい又は3と等しい整数であって、異なる場所から送られるノイズに関するN個のオーディオストリームを、ネットワーク(40)から受け取る工程と、
    MはNより小さい又はNと等しい整数であって、N個のオーディオストリームからM個のオーディオストリームを選択する工程と、
    M個のオーディオストリームをミキシングして再生する工程とを含むことを特徴とする会議を開催する方法。
  12. 所定の時間にてオーディオストリームに閾値を超えたノイズがある場合に、オーディオストリームをネットワーク(40)に送る手段(38)(42)(62)と、
    所定の時間にてネットワーク(40)から受け取った複数のオーディオストリームのノイズの関数として、閾値を動的に決定する手段(62)とを具えることを特徴とする装置(93)。
  13. 所定の時間にてネットワーク(40)から受け取った複数のオーディオストリームのノイズの関数として、ネットワーク(40)にオーディオストリームを送るために用いる閾値を動的に決定する工程と、
    オーディオストリームに閾値を超えたノイズがある場合に、オーディオストリームをネットワーク(40)に送る工程とを具えることを特徴とする会議を開催する方法。
JP2006272576A 2002-03-27 2006-10-04 電気通信システム Expired - Fee Related JP4566177B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/114,402 US7404001B2 (en) 2002-03-27 2002-03-27 Videophone and method for a video call

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003579460A Division JP4372558B2 (ja) 2002-03-27 2003-03-27 電気通信システム

Publications (2)

Publication Number Publication Date
JP2007116683A true JP2007116683A (ja) 2007-05-10
JP4566177B2 JP4566177B2 (ja) 2010-10-20

Family

ID=28453783

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2003579460A Expired - Fee Related JP4372558B2 (ja) 2002-03-27 2003-03-27 電気通信システム
JP2006272607A Pending JP2007068198A (ja) 2002-03-27 2006-10-04 電気通信システム
JP2006272576A Expired - Fee Related JP4566177B2 (ja) 2002-03-27 2006-10-04 電気通信システム
JP2006272635A Pending JP2007110712A (ja) 2002-03-27 2006-10-04 電気通信システム

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2003579460A Expired - Fee Related JP4372558B2 (ja) 2002-03-27 2003-03-27 電気通信システム
JP2006272607A Pending JP2007068198A (ja) 2002-03-27 2006-10-04 電気通信システム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2006272635A Pending JP2007110712A (ja) 2002-03-27 2006-10-04 電気通信システム

Country Status (7)

Country Link
US (2) US7404001B2 (ja)
EP (2) EP1491044B1 (ja)
JP (4) JP4372558B2 (ja)
AT (1) ATE311723T1 (ja)
AU (1) AU2003216647A1 (ja)
DE (1) DE60302561T2 (ja)
WO (1) WO2003081892A2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009084190A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 接続装置および接続方法
JP2010528561A (ja) * 2007-05-29 2010-08-19 トリニティ ビデオ コミュニケーションズ、インコーポレイテッド Codec駆動タッチスクリーンテレビ会議コントロールシステム
JP2015133736A (ja) * 2007-08-23 2015-07-23 サムスン エレクトロニクス カンパニー リミテッド モバイルビデオ電話間の選好画像フォーマットを決定する方法及び装置
KR20160068481A (ko) * 2014-12-05 2016-06-15 삼성전자주식회사 모바일 디바이스 및 모바일 디바이스의 메모리 관리 방법

Families Citing this family (199)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2515488C (en) * 2003-02-10 2013-04-16 Raindance Communications, Inc. Methods and apparatus for providing egalitarian control in a multimedia collaboration session
US8254372B2 (en) 2003-02-21 2012-08-28 Genband Us Llc Data communication apparatus and method
FR2851863A1 (fr) * 2003-02-28 2004-09-03 France Telecom Systeme de telecommunication permettant une diffusion de flux multimedia via un reseau de communication public
US20110181686A1 (en) * 2003-03-03 2011-07-28 Apple Inc. Flow control
US7231229B1 (en) * 2003-03-16 2007-06-12 Palm, Inc. Communication device interface
US7586938B2 (en) 2003-10-24 2009-09-08 Microsoft Corporation Methods and systems for self-describing multicasting of multimedia presentations
US20040249889A1 (en) * 2003-06-03 2004-12-09 Drommond David E. Method and system for processing interactive communications
US20050015444A1 (en) * 2003-07-15 2005-01-20 Darwin Rambo Audio/video conferencing system
US7827575B2 (en) * 2003-09-30 2010-11-02 Canon Kabushiki Kaisha TV apparatus, its control method, network TV system and computer program
US20050086699A1 (en) * 2003-10-16 2005-04-21 Hamilton Relay, Inc. Video relay system and method
KR100578251B1 (ko) * 2003-11-26 2006-05-11 (주)씨앤에스 테크놀로지 비디오-레디 인터넷 전화기
KR100552513B1 (ko) 2003-12-17 2006-02-14 삼성전자주식회사 브이오아이피 서비스를 제공하는 장치 및 그 방법
JP4128961B2 (ja) * 2004-01-26 2008-07-30 株式会社東芝 無線通信装置、無線通信方法及び無線通信プログラム
FR2866181B1 (fr) * 2004-02-09 2006-03-31 Canon Europa Nv Procede et dispositif de distribution d'un signal audiovisuel dans un reseau de communication, procede et dispositif de validation correspondants.
US20050237931A1 (en) * 2004-03-19 2005-10-27 Marconi Communications, Inc. Method and apparatus for conferencing with stream selectivity
WO2005089055A2 (en) 2004-03-19 2005-09-29 Nortel Networks Limited Communicating processing capabilites along a communications path
US7773581B2 (en) * 2004-03-19 2010-08-10 Ericsson Ab Method and apparatus for conferencing with bandwidth control
US8027265B2 (en) 2004-03-19 2011-09-27 Genband Us Llc Providing a capability list of a predefined format in a communications network
TWI238638B (en) * 2004-04-22 2005-08-21 Benq Corp Method and device for multimedia processing
ATE451776T1 (de) * 2004-05-10 2009-12-15 Ericsson Telefon Ab L M Verfahren und telekommunikationssystem zum einleiten einer erweiterten kommunikationsverbindung
US8296366B2 (en) * 2004-05-27 2012-10-23 Microsoft Corporation Efficient routing of real-time multimedia information
NO20042409L (no) * 2004-06-09 2005-12-12 Tandberg Telecom As System og metode for detektering av tilstedevaerelse.
JP4479376B2 (ja) 2004-06-29 2010-06-09 パナソニック株式会社 ネットワークカメラ及びネットワークシステム
EP1612977A3 (en) * 2004-07-01 2013-08-21 Yamaha Corporation Control device for controlling audio signal processing device
US7539187B2 (en) * 2004-07-07 2009-05-26 Qvidium Technologies, Inc. System and method for low-latency content-sensitive forward error correction
US20060029051A1 (en) * 2004-07-30 2006-02-09 Harris John C System for providing IP video telephony
US20060029050A1 (en) * 2004-08-05 2006-02-09 Harris John C IP video telephone having integrated devices
JP4655190B2 (ja) * 2004-08-06 2011-03-23 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
KR100624690B1 (ko) * 2004-09-03 2006-09-19 삼성전자주식회사 화상 통신 망에서의 호 처리 장치 및 그 방법
MX2007002558A (es) * 2004-09-03 2007-06-11 Telecom Italia Spa Metodo y sistema para instalacion de comunicaciones de video telefono, equipo relacionado y producto de programa de computadora.
US7830864B2 (en) * 2004-09-18 2010-11-09 Genband Us Llc Apparatus and methods for per-session switching for multiple wireline and wireless data types
US7729346B2 (en) * 2004-09-18 2010-06-01 Genband Inc. UMTS call handling methods and apparatus
US20060090166A1 (en) * 2004-09-30 2006-04-27 Krishna Dhara System and method for generating applications for communication devices using a markup language
US20060159099A1 (en) * 2004-10-01 2006-07-20 Hensley Steven M Videoconferencing device and system
US8576270B1 (en) 2004-10-08 2013-11-05 Glowpoint, Inc. Intelligent call management and redirection
US7076390B1 (en) * 2004-10-18 2006-07-11 Kla-Tencor Technologies Corporation Memory load balancing
US7730129B2 (en) 2004-10-20 2010-06-01 Inbit, Inc. Collaborative communication platforms
KR100603576B1 (ko) * 2004-12-06 2006-07-24 삼성전자주식회사 이종 단말간 영상 신호 전송 시스템 및 그 방법
KR100693049B1 (ko) * 2004-12-28 2007-03-12 삼성전자주식회사 화상통화를 위한 통신단말 간의 커플링제어시스템 및 그방법
JP4490830B2 (ja) * 2005-01-13 2010-06-30 株式会社東芝 Ip電話交換装置
US7560636B2 (en) * 2005-02-14 2009-07-14 Wolfram Research, Inc. Method and system for generating signaling tone sequences
KR100785294B1 (ko) * 2005-02-28 2007-12-12 삼성전자주식회사 패킷 통신 서비스를 제공하는 시스템 및 그 방법
KR100612252B1 (ko) * 2005-02-28 2006-08-14 삼성전자주식회사 패킷 통신 서비스를 제공하는 시스템 및 그 방법
WO2006105095A2 (en) * 2005-03-29 2006-10-05 Glowpoint, Inc. Video communication call authorization
US8606949B2 (en) * 2005-04-20 2013-12-10 Jupiter Systems Interconnection mechanism for multiple data streams
US20070002777A1 (en) * 2005-05-31 2007-01-04 Glowpoint, Inc. Video-communication interface
US8185583B2 (en) * 2005-06-03 2012-05-22 Siemens Enterprise Communications, Inc. Visualization enhanced presence system
KR100678166B1 (ko) * 2005-07-27 2007-02-02 삼성전자주식회사 어쿠스틱 쇼크를 방지하기 위한 오디오 신호의 출력 볼륨을설정하는 방법 및 이를 위한 이동 통신 단말기
US7703013B1 (en) * 2005-08-16 2010-04-20 Adobe Systems Inc. Methods and apparatus to reformat and distribute content
US7742758B2 (en) 2005-08-19 2010-06-22 Callpod, Inc. Mobile conferencing and audio sharing technology
US7792150B2 (en) 2005-08-19 2010-09-07 Genband Us Llc Methods, systems, and computer program products for supporting transcoder-free operation in media gateway
US20070100940A1 (en) * 2005-08-25 2007-05-03 Glowpoint, Inc. Systems and methods for implementing a single-number follow me service for videoconferencing
US8892629B2 (en) * 2005-09-01 2014-11-18 Samsung Electronics Co., Ltd. System and method for displaying a virtual meeting room
US7620158B2 (en) * 2005-09-02 2009-11-17 Hamilton Relay, Inc. Video relay system and method
JP2007074115A (ja) * 2005-09-05 2007-03-22 Hitachi Ltd 音声通信端末、メディアサーバおよび音声通信のロック制御方法
US8867524B1 (en) * 2005-09-30 2014-10-21 At&T Intellectual Property Ii, L.P. Method and apparatus for activating an incoming call voice session on a video display device
US7746997B2 (en) * 2005-10-07 2010-06-29 Avaya Inc. Interactive telephony trainer and exerciser
SE530507C2 (sv) * 2005-10-18 2008-06-24 Craj Dev Ltd Kommunikationssystem
US7701930B2 (en) * 2005-10-25 2010-04-20 Ittiam Systems (P) Ltd. Technique for providing virtual N-way video conferencing to IP videophones
US20070120949A1 (en) * 2005-11-22 2007-05-31 Inventec Multimedia & Telecom Corporation Video, sound, and voice over IP integration system
US8713105B2 (en) * 2006-01-03 2014-04-29 Cisco Technology, Inc. Method and apparatus for transcoding and transrating in distributed video systems
US8125931B2 (en) * 2006-01-10 2012-02-28 Utbk, Inc. Systems and methods to provide availability indication
US7835346B2 (en) * 2006-01-17 2010-11-16 Genband Us Llc Methods, systems, and computer program products for providing transcoder free operation (TrFO) and interworking between unlicensed mobile access (UMA) and universal mobile telecommunications system (UMTS) call legs using a media gateway
US8593502B2 (en) 2006-01-26 2013-11-26 Polycom, Inc. Controlling videoconference with touch screen interface
US8872879B2 (en) 2006-01-26 2014-10-28 Polycom, Inc. System and method for controlling videoconference with touch screen interface
US7979059B2 (en) * 2006-02-06 2011-07-12 Rockefeller Alfred G Exchange of voice and video between two cellular or wireless telephones
US20070220161A1 (en) * 2006-03-15 2007-09-20 Microsoft Corporation Broadcasting a presentation over a messaging network
US8588578B2 (en) * 2006-03-29 2013-11-19 Transpacific Digidata, Llc Conversion of video data to playable format
US7843486B1 (en) 2006-04-10 2010-11-30 Avaya Inc. Selective muting for conference call participants
KR100810269B1 (ko) * 2006-04-18 2008-03-06 삼성전자주식회사 휴대 단말기 및 그 단말기의 화상 통화 서비스 수행 방법
US8952974B2 (en) * 2006-04-20 2015-02-10 Cisco Technology, Inc. Latency reduction in a display device
US7710450B2 (en) 2006-04-20 2010-05-04 Cisco Technology, Inc. System and method for dynamic control of image capture in a video conference system
US7707250B2 (en) * 2006-05-02 2010-04-27 Callpod, Inc. Wireless communications connection device
US8582555B2 (en) * 2006-05-12 2013-11-12 Oracle International Corporation SIP routing customization
US8571012B2 (en) * 2006-05-12 2013-10-29 Oracle International Corporation Customized sip routing to cross firewalls
US8326927B2 (en) * 2006-05-23 2012-12-04 Cisco Technology, Inc. Method and apparatus for inviting non-rich media endpoints to join a conference sidebar session
US9537704B2 (en) * 2006-05-24 2017-01-03 At&T Intellectual Property I, L.P. Method and apparatus for migrating active communication session between terminals
EP1868363B1 (en) 2006-06-16 2009-05-27 Ericsson AB System, method and node for limiting the number of audio streams in a teleconference
US9338028B2 (en) * 2006-06-19 2016-05-10 Nokia Technologies Oy Utilizing information of a local network for determining presence state
US20070291655A1 (en) * 2006-06-19 2007-12-20 Avaya Technology Llc Waveform Quality Feedback for Internet Protocol Traffic
US20070294721A1 (en) * 2006-06-20 2007-12-20 Sbc Knowledge Ventures, Lp System and method of providing supplemental video content related to targeted advertisements in a video stream
KR100750189B1 (ko) * 2006-07-04 2007-08-17 삼성전자주식회사 이동통신 단말기에서 화상통화 화면 공유 장치 및 방법
US20080016156A1 (en) * 2006-07-13 2008-01-17 Sean Miceli Large Scale Real-Time Presentation of a Network Conference Having a Plurality of Conference Participants
US7965170B2 (en) * 2006-07-14 2011-06-21 Lear Corporation Supervised and unsupervised seat folding
US8687037B2 (en) * 2006-09-12 2014-04-01 Savant Systems, Llc Telephony services for programmable multimedia controller
US8335873B2 (en) 2006-09-14 2012-12-18 Opentv, Inc. Method and systems for data transmission
US11303684B2 (en) 2006-09-14 2022-04-12 Opentv, Inc. Methods and systems for data transmission
US7965309B2 (en) * 2006-09-15 2011-06-21 Quickwolf Technology, Inc. Bedside video communication system
US7948513B2 (en) * 2006-09-15 2011-05-24 Rockefeller Alfred G Teleconferencing between various 4G wireless entities such as mobile terminals and fixed terminals including laptops and television receivers fitted with a special wireless 4G interface
US8649489B2 (en) * 2006-10-13 2014-02-11 At&T Intellectual Property I, L.P. Method and apparatus for improving identification of a party in a communication transaction
JP4693754B2 (ja) * 2006-11-28 2011-06-01 株式会社東芝 会議システムとその会議データ保存方法
US20080129816A1 (en) * 2006-11-30 2008-06-05 Quickwolf Technology, Inc. Childcare video conferencing system and method
US20080141294A1 (en) * 2006-12-12 2008-06-12 General Instrument Corporation Method and System for Managing Access to a Video Communication Device
US8384753B1 (en) * 2006-12-15 2013-02-26 At&T Intellectual Property I, L. P. Managing multiple data sources
EP2108193B1 (en) 2006-12-28 2018-08-15 Genband US LLC Methods, systems, and computer program products for silence insertion descriptor (sid) conversion
US8463927B2 (en) * 2006-12-29 2013-06-11 Ebay Inc. Video mail through peer to peer network
US7957603B2 (en) * 2006-12-29 2011-06-07 Intel Corporation Digital image decoder with integrated concurrent image prescaler
US20080181197A1 (en) * 2007-01-29 2008-07-31 International Business Machines Corporation Delivering Unified User Experience By Automatically Teaming Up Information Appliances With General Purpose PC Through Internet
US8631069B2 (en) * 2007-03-01 2014-01-14 Oracle International Corporation Web and multi-media conference
US8059809B1 (en) * 2007-03-16 2011-11-15 Nextel Communications Inc. Systems and methods of establishing group calls
US8208615B2 (en) * 2007-04-27 2012-06-26 Cisco Technology, Inc. Calculating a fully qualified number
US8253770B2 (en) * 2007-05-31 2012-08-28 Eastman Kodak Company Residential video communication system
US8154578B2 (en) * 2007-05-31 2012-04-10 Eastman Kodak Company Multi-camera residential communication system
US8154583B2 (en) * 2007-05-31 2012-04-10 Eastman Kodak Company Eye gazing imaging for video communications
US8159519B2 (en) * 2007-05-31 2012-04-17 Eastman Kodak Company Personal controls for personal video communications
JP2008311798A (ja) * 2007-06-12 2008-12-25 Hitachi Communication Technologies Ltd 映像・音声会議システム
AU2008282223B2 (en) 2007-07-30 2014-07-03 Contour Ip Holding, Llc Components of a portable digital video camera
KR101417002B1 (ko) 2007-08-29 2014-07-08 엘지전자 주식회사 다자 영상 통화 기능을 제공하는 이동 통신 단말기 및 다자영상 통화의 모드 전환 방법
US8200520B2 (en) 2007-10-03 2012-06-12 International Business Machines Corporation Methods, systems, and apparatuses for automated confirmations of meetings
US7983718B1 (en) * 2007-10-11 2011-07-19 Sprint Spectrum L.P. Wireless phones with keys displaying image files
US8179422B2 (en) * 2007-12-20 2012-05-15 Cisco Technology, Inc. System and method for video conferencing
US8203593B2 (en) 2007-12-28 2012-06-19 Motorola Solutions, Inc. Audio visual tracking with established environmental regions
US8144187B2 (en) * 2008-03-14 2012-03-27 Microsoft Corporation Multiple video stream capability negotiation
EP2266269B1 (en) 2008-04-02 2019-01-02 Twilio Inc. System and method for processing telephony sessions
US8837465B2 (en) 2008-04-02 2014-09-16 Twilio, Inc. System and method for processing telephony sessions
WO2009126165A1 (en) * 2008-04-11 2009-10-15 T-Mobile Usa, Inc. Digital picture frame having communication capabilities
US8144181B2 (en) * 2008-06-12 2012-03-27 Cisco Technology, Inc. Ad hoc telepresence manager
TWI475814B (zh) * 2008-07-04 2015-03-01 Twinhead Int Corp To prevent the sound generated by the audio output device
KR101003922B1 (ko) * 2008-08-04 2010-12-30 인하대학교 산학협력단 멀티미디어 서비스를 제공하기 위한 스케쥴링 방법
US8103666B1 (en) * 2008-08-19 2012-01-24 Miller Frank W Variable audio/visual data incorporation system and method
JP5307508B2 (ja) * 2008-08-29 2013-10-02 キヤノン株式会社 通信装置、通信方法、コンピュータプログラム
JP5410720B2 (ja) * 2008-09-25 2014-02-05 日立コンシューマエレクトロニクス株式会社 ディジタル情報信号送受信装置、およびディジタル情報信号送受信方法
DE102008049715A1 (de) * 2008-09-30 2010-04-08 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Anordnung zum Anbinden zumindest einer Mensch-Maschine-Schnittstelle zur Manipulation von zumindest einer im Rahmen von Videokonferenzen mit einem Videokonferenzsystem verbundenen Datenquelle
US8514265B2 (en) * 2008-10-02 2013-08-20 Lifesize Communications, Inc. Systems and methods for selecting videoconferencing endpoints for display in a composite video image
US20100110160A1 (en) * 2008-10-30 2010-05-06 Brandt Matthew K Videoconferencing Community with Live Images
CN101442654B (zh) * 2008-12-26 2012-05-23 华为终端有限公司 视频通信中视频对象切换的方法、装置及系统
US20100190526A1 (en) * 2009-01-28 2010-07-29 International Business Machines Corporation Cellular Telephone Using Multiple Accounts
US8745255B2 (en) * 2009-02-24 2014-06-03 Microsoft Corporation Configuration and distribution of content at capture
WO2010124136A1 (en) * 2009-04-24 2010-10-28 Delta Vidyo, Inc. An efficient video skimmer
KR101717090B1 (ko) * 2009-06-09 2017-03-20 삼성전자주식회사 사용자 정보 제공방법 및 이를 적용한 디바이스
US8301697B2 (en) * 2009-06-16 2012-10-30 Microsoft Corporation Adaptive streaming of conference media and data
EP2439941A4 (en) * 2009-06-19 2013-09-25 Shenzhen Tcl New Technology TELEVISION AND METHOD FOR REALIZING VIDEO MESSAGE
US8224380B2 (en) * 2009-07-08 2012-07-17 V.R. Technology Co., Ltd. Structure of an apparatus for sharing video input/output modules among handheld devices
US8370433B2 (en) * 2009-07-24 2013-02-05 Cisco Technology, Inc. System and method for transitioning communications in a conferencing environment
US8908541B2 (en) 2009-08-04 2014-12-09 Genband Us Llc Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway
GB2473429B (en) * 2009-09-07 2013-12-11 Snow Leopard Invest Ltd A video-collaboration apparatus and method
US20110173300A1 (en) * 2009-11-25 2011-07-14 Isaac Levy IPTV Presence And Interaction Protocol
US8526587B2 (en) * 2009-12-23 2013-09-03 Oracle America, Inc. Web guided collaborative audio
WO2011100417A1 (en) * 2010-02-10 2011-08-18 Oovoo, Llc System and method for video communication on mobile devices
KR101644598B1 (ko) 2010-02-12 2016-08-02 삼성전자주식회사 복수의 디스플레이 장치를 포함하는 영상 시스템 제어방법
US9210200B1 (en) * 2010-02-15 2015-12-08 Insors Integrated Communications Methods, systems and program products for connecting users to operating nodes
CN101854509A (zh) * 2010-04-09 2010-10-06 中兴通讯股份有限公司 一种可视通话的接入方法和可视通话装置
US8787547B2 (en) * 2010-04-23 2014-07-22 Lifesize Communications, Inc. Selective audio combination for a conference
US8717408B2 (en) 2010-05-13 2014-05-06 Lifesize Communications, Inc. Conducting a private videoconference within a videoconference via an MCU
US8717409B2 (en) 2010-05-13 2014-05-06 Lifesize Communications, Inc. Conducting a direct private videoconference within a videoconference
CA2800398A1 (en) * 2010-05-25 2011-12-01 Vidyo, Inc. Systems and methods for scalable video communication using multiple cameras and multiple monitors
US10237411B2 (en) * 2010-06-09 2019-03-19 International Business Machines Corporation Simultaneous participation in a plurality of web conferences
US20120017149A1 (en) * 2010-07-15 2012-01-19 Jeffrey Lai Video whisper sessions during online collaborative computing sessions
JP5760783B2 (ja) * 2010-07-29 2015-08-12 株式会社リコー コミュニケーション端末およびプログラム
WO2012018786A1 (en) * 2010-08-02 2012-02-09 Ncomputing Inc. System and method for efficiently streaming digital video
EP4290856A3 (en) 2010-09-13 2024-03-06 Contour IP Holding, LLC Portable digital video camera configured for remote image acquisition control and viewing
US8472754B1 (en) 2010-11-11 2013-06-25 Amazon Technologies, Inc. Image artifact prevention
US8842152B2 (en) * 2011-05-03 2014-09-23 Mitel Networks Corporation Collaboration appliance and methods thereof
US8860779B2 (en) * 2011-05-23 2014-10-14 Broadcom Corporation Two-way audio and video communication utilizing segment-based adaptive streaming techniques
US8832284B1 (en) 2011-06-16 2014-09-09 Google Inc. Virtual socializing
US8976218B2 (en) 2011-06-27 2015-03-10 Google Technology Holdings LLC Apparatus for providing feedback on nonverbal cues of video conference participants
US8966095B2 (en) 2011-07-08 2015-02-24 Avaya Inc. Negotiate multi-stream continuous presence
US10260754B2 (en) * 2011-07-12 2019-04-16 Viking Range, Llc Advanced electronic control display
US9077848B2 (en) 2011-07-15 2015-07-07 Google Technology Holdings LLC Side channel for employing descriptive audio commentary about a video conference
US9088661B2 (en) * 2011-08-02 2015-07-21 Genesys Telecommunications Laboratories, Inc. Hands-free voice/video session initiation using face detection
US8754926B1 (en) 2011-11-29 2014-06-17 Google Inc. Managing nodes of a synchronous communication conference
CN103297825B (zh) * 2012-02-24 2018-01-23 北京四达时代软件技术股份有限公司 一种实现地面数字电视多媒体便携式终端
US20130254372A1 (en) * 2012-03-20 2013-09-26 Whitney Pierce Computer activity monitoring device
EP2658232A1 (en) * 2012-04-23 2013-10-30 Onmobile Global Limited Method and system for an optimized multimedia communications system
US8830295B2 (en) 2012-05-23 2014-09-09 Google Inc. Multimedia conference endpoint transfer system
US8941712B2 (en) 2012-06-14 2015-01-27 Logitech Europe S.A. Call movement in a conferencing system
US9021301B2 (en) 2012-06-14 2015-04-28 Logitech Europe S.A. High availability conferencing architecture
US8830296B1 (en) 2012-06-26 2014-09-09 Google Inc. Endpoint device-specific stream control for multimedia conferencing
KR101391942B1 (ko) 2012-07-18 2014-05-30 주식회사 마이티웍스 오디오 스티어링 동영상 시스템 및 그 제공방법
US9191619B2 (en) 2012-08-01 2015-11-17 Google Inc. Using an avatar in a videoconferencing system
US8983662B2 (en) * 2012-08-03 2015-03-17 Toyota Motor Engineering & Manufacturing North America, Inc. Robots comprising projectors for projecting images on identified projection surfaces
US9007425B1 (en) * 2012-08-31 2015-04-14 Securus Technologies, Inc. Software-controlled lighting for video visitation devices
CN104469255A (zh) 2013-09-16 2015-03-25 杜比实验室特许公司 改进的音频或视频会议
US9473740B2 (en) 2012-10-24 2016-10-18 Polycom, Inc. Automatic positioning of videoconference camera to presenter at presentation device
CN202995529U (zh) 2012-11-28 2013-06-12 杨金荣 一种手持式终端的单手操控手柄
US8978112B2 (en) 2013-03-14 2015-03-10 Sorenson Communications, Inc. Methods, devices, and systems for remotely controlling a plurality of communication devices
CA2952696A1 (en) * 2013-06-15 2014-12-18 The SuperGroup Creative Omnimedia, Inc. Method and apparatus for interactive two-way visualization using simultaneously recorded and projected video streams
US8976220B2 (en) 2013-07-05 2015-03-10 Sorenson Communications, Inc. Devices and methods for hosting a video call between a plurality of endpoints
US10652504B2 (en) 2014-03-28 2020-05-12 Aetonix Systems Simple video communication platform
CA2941431C (en) * 2014-03-28 2018-01-09 Aetonix Systems Simple video communication platform
EP2933987B1 (en) 2014-04-17 2019-11-20 Gurulogic Microsystems OY Additional information on a caller
US10706426B2 (en) * 2014-04-30 2020-07-07 Ncr Corporation Automated remote transaction assistance
TWI602436B (zh) * 2014-05-06 2017-10-11 虛擬會議系統
US9549152B1 (en) * 2014-06-09 2017-01-17 Google Inc. Application content delivery to multiple computing environments using existing video conferencing solutions
US9949000B1 (en) 2015-03-17 2018-04-17 8X8, Inc. IPBX control interface for distributed networks
US9473738B2 (en) 2015-03-17 2016-10-18 Sorenson Communications, Inc. Communication systems, communication endpoints, and related methods for remotely controlling communication endpoints
US9819903B2 (en) 2015-06-05 2017-11-14 The SuperGroup Creative Omnimedia, Inc. Imaging and display system and method
US10540223B1 (en) * 2016-02-22 2020-01-21 Amazon Technologies, Inc. System for determining error data
CN107332815B (zh) * 2016-04-29 2022-09-27 中兴通讯股份有限公司 异构端点间通道建立方法及装置
US9832308B1 (en) 2016-05-12 2017-11-28 Google Inc. Caller preview data and call messages based on caller preview data
US9762729B1 (en) 2016-05-12 2017-09-12 Google Inc. Caller preview for video calls
US9532004B1 (en) * 2016-05-12 2016-12-27 Google Inc. Animated user identifiers
US20180352156A1 (en) 2017-06-02 2018-12-06 Apple Inc. High-Quality Audio/Visual Conferencing
US10572107B1 (en) * 2017-06-23 2020-02-25 Amazon Technologies, Inc. Voice communication targeting user interface
US10848802B2 (en) * 2017-09-13 2020-11-24 Cisco Technology, Inc. IP traffic software high precision pacer
CN110675889A (zh) 2018-07-03 2020-01-10 阿里巴巴集团控股有限公司 音频信号处理方法、客户端和电子设备
US10805663B2 (en) * 2018-07-13 2020-10-13 Comcast Cable Communications, Llc Audio video synchronization
US11765320B2 (en) 2021-08-11 2023-09-19 Google Llc Avatar animation in virtual conferencing
CN115361569B (zh) * 2022-08-10 2023-10-20 深圳乐播科技有限公司 一种云会议中的动态帧投屏方法及相关产品

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06296278A (ja) * 1993-04-07 1994-10-21 Fujitsu Ltd 多地点制御装置、テレビ会議端末装置及び多地点テレビ会議システム
JPH08279835A (ja) * 1995-01-30 1996-10-22 Internatl Business Mach Corp <Ibm> マルチメディア・ストリーム転送方法、音声制御ビデオ会議装置及びデータ転送装置
JPH0970029A (ja) * 1995-08-31 1997-03-11 Canon Inc 多地点間通信システムおよび通信端末装置
JPH09163334A (ja) * 1995-12-14 1997-06-20 Fujitsu Ltd 話者検出回路及びテレビ会議装置
JPH09204200A (ja) * 1995-12-12 1997-08-05 Onliveo Technol Inc 会議システム
JPH09233231A (ja) * 1996-02-20 1997-09-05 Internatl Business Mach Corp <Ibm> データ伝送方法及び装置
JPH11164301A (ja) * 1997-11-25 1999-06-18 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化処理方法
JP2000134596A (ja) * 1998-10-21 2000-05-12 Nec Eng Ltd 多地点テレビ会議システム及び多地点テレビ会議システムの制御方法
JP2001274923A (ja) * 2000-03-28 2001-10-05 Nec Eng Ltd 携帯電話伝送システム
JP2002051312A (ja) * 2000-07-31 2002-02-15 Ricoh Co Ltd 情報処理装置、情報処理方法およびその方法をコンピュータに実行可能な記録媒体

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0530502A (ja) * 1991-07-24 1993-02-05 Hitachi Ltd 一体型テレビ電話機
JP2611620B2 (ja) * 1993-06-16 1997-05-21 日本電気株式会社 端末通知型予約接続方式
JPH0758823A (ja) * 1993-08-12 1995-03-03 Nippon Telegr & Teleph Corp <Ntt> 電話発信システム
US5689641A (en) 1993-10-01 1997-11-18 Vicor, Inc. Multimedia collaboration system arrangement for routing compressed AV signal through a participant site without decompressing the AV signal
JPH08294100A (ja) * 1995-04-20 1996-11-05 Canon Inc 通信端末及び監視システム
JPH08336122A (ja) * 1995-06-08 1996-12-17 Nec Corp 自動回線切断機能付き遠隔会議装置
JP3835771B2 (ja) * 1996-03-15 2006-10-18 株式会社東芝 コミュニケーション装置及びコミュニケーション方法
KR20050052484A (ko) 1997-03-17 2005-06-02 마츠시타 덴끼 산교 가부시키가이샤 데이터 처리방법
US6611519B1 (en) * 1998-08-19 2003-08-26 Swxtch The Rules, Llc Layer one switching in a packet, cell, or frame-based network
JP2000165833A (ja) * 1998-11-26 2000-06-16 Matsushita Electric Ind Co Ltd 代理画像通信装置及び方法
GB2358538B (en) 1999-11-24 2003-11-05 Orange Personal Comm Serv Ltd Mobile communications
US6857132B1 (en) * 2000-01-14 2005-02-15 Terayon Communication Systems, Inc. Head end multiplexer to select and transmit video-on-demand and other requested programs and services
JP2001231030A (ja) * 2000-02-16 2001-08-24 Matsushita Electric Ind Co Ltd 被介護者撮影装置
JP2001268532A (ja) * 2000-03-23 2001-09-28 Fuji Xerox Co Ltd 画像通信装置
CA2342095A1 (en) 2000-03-27 2001-09-27 Symagery Microsystems Inc. Image capture and processing accessory
US7487112B2 (en) * 2000-06-29 2009-02-03 Barnes Jr Melvin L System, method, and computer program product for providing location based services and mobile e-commerce
JP3868236B2 (ja) * 2001-04-18 2007-01-17 日本電信電話株式会社 在席情報伝達装置および在席情報伝達方法
US7012893B2 (en) * 2001-06-12 2006-03-14 Smartpackets, Inc. Adaptive control of data packet size in networks
US20030101253A1 (en) * 2001-11-29 2003-05-29 Takayuki Saito Method and system for distributing data in a network
JP2003230116A (ja) * 2002-01-31 2003-08-15 Ricoh Co Ltd 対人通信装置、対人通信システム、プログラムおよび記録媒体

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06296278A (ja) * 1993-04-07 1994-10-21 Fujitsu Ltd 多地点制御装置、テレビ会議端末装置及び多地点テレビ会議システム
JPH08279835A (ja) * 1995-01-30 1996-10-22 Internatl Business Mach Corp <Ibm> マルチメディア・ストリーム転送方法、音声制御ビデオ会議装置及びデータ転送装置
JPH0970029A (ja) * 1995-08-31 1997-03-11 Canon Inc 多地点間通信システムおよび通信端末装置
JPH09204200A (ja) * 1995-12-12 1997-08-05 Onliveo Technol Inc 会議システム
JPH09163334A (ja) * 1995-12-14 1997-06-20 Fujitsu Ltd 話者検出回路及びテレビ会議装置
JPH09233231A (ja) * 1996-02-20 1997-09-05 Internatl Business Mach Corp <Ibm> データ伝送方法及び装置
JPH11164301A (ja) * 1997-11-25 1999-06-18 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化処理方法
JP2000134596A (ja) * 1998-10-21 2000-05-12 Nec Eng Ltd 多地点テレビ会議システム及び多地点テレビ会議システムの制御方法
JP2001274923A (ja) * 2000-03-28 2001-10-05 Nec Eng Ltd 携帯電話伝送システム
JP2002051312A (ja) * 2000-07-31 2002-02-15 Ricoh Co Ltd 情報処理装置、情報処理方法およびその方法をコンピュータに実行可能な記録媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010528561A (ja) * 2007-05-29 2010-08-19 トリニティ ビデオ コミュニケーションズ、インコーポレイテッド Codec駆動タッチスクリーンテレビ会議コントロールシステム
JP2015133736A (ja) * 2007-08-23 2015-07-23 サムスン エレクトロニクス カンパニー リミテッド モバイルビデオ電話間の選好画像フォーマットを決定する方法及び装置
US9549013B2 (en) 2007-08-23 2017-01-17 Samsung Electronics Co., Ltd. Method and apparatus for determining preferred image format between mobile video telephones
WO2009084190A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 接続装置および接続方法
KR20160068481A (ko) * 2014-12-05 2016-06-15 삼성전자주식회사 모바일 디바이스 및 모바일 디바이스의 메모리 관리 방법
KR102403063B1 (ko) * 2014-12-05 2022-05-30 삼성전자주식회사 모바일 디바이스 및 모바일 디바이스의 메모리 관리 방법

Also Published As

Publication number Publication date
WO2003081892A2 (en) 2003-10-02
EP1491044A2 (en) 2004-12-29
EP1628480A2 (en) 2006-02-22
JP2007110712A (ja) 2007-04-26
ATE311723T1 (de) 2005-12-15
DE60302561D1 (de) 2006-01-05
DE60302561T2 (de) 2006-06-14
US20070186002A1 (en) 2007-08-09
US7404001B2 (en) 2008-07-22
JP2007068198A (ja) 2007-03-15
EP1628480A3 (en) 2010-09-01
US20080273079A1 (en) 2008-11-06
JP4566177B2 (ja) 2010-10-20
EP1491044B1 (en) 2005-11-30
JP2005521340A (ja) 2005-07-14
AU2003216647A8 (en) 2003-10-08
JP4372558B2 (ja) 2009-11-25
WO2003081892A3 (en) 2004-02-12
AU2003216647A1 (en) 2003-10-08

Similar Documents

Publication Publication Date Title
JP4566177B2 (ja) 電気通信システム
JP5129989B2 (ja) 会議レイアウト制御及び制御プロトコル
RU2398362C2 (ru) Соединение независимых мультимедийных источников в конференц-связь
EP1868363B1 (en) System, method and node for limiting the number of audio streams in a teleconference
US20070294263A1 (en) Associating independent multimedia sources into a conference call
US20120086769A1 (en) Conference layout control and control protocol
US20070291667A1 (en) Intelligent audio limit method, system and node
US7773581B2 (en) Method and apparatus for conferencing with bandwidth control
US20050237931A1 (en) Method and apparatus for conferencing with stream selectivity
US20100225736A1 (en) Virtual Distributed Multipoint Control Unit
US20140253675A1 (en) Media Detection and Packet Distribution in a Multipoint Conference
MX2007006910A (es) Asociacion de fuentes de multimedia independientes en una llamada de conferencia.
MX2007006914A (es) Metodo, sistema y nodo de limite de audio inteligentes.
MX2007006912A (es) Control de modelo de conferencia y protocolo de control.

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20080514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100519

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100524

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100621

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100713

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100803

R150 Certificate of patent or registration of utility model

Ref document number: 4566177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130813

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees