(A)主たる実施形態
以下、本発明による多地点会議サーバ及び多地点会議サーバプログラム、並びに、多地点会議システムの一実施形態を、図面を参照しながら説明する。実施形態の多地点会議サーバ及び多地点会議システムは、ビデオ会議サーバ及びビデオ会議システムであり、呼制御プロトコルとしてSIPを適用しているものである。
(A−1)実施形態の構成
(A−1−1)多地点ビデオ会議システムの全体構成
図1は、実施形態の多地点ビデオ会議システムの全体構成を示すブロック図である。
図1において、実施形態の多地点ビデオ会議システム1は、複数のビデオ会議端末(SIP UA)2、3、呼制御サーバ(SIP Proxy)4及び多地点ビデオ会議サーバ(SIP MCU)5を有する。これら複数のビデオ会議端末2、3、呼制御サーバ4及び多地点ビデオ会議サーバ5は、ネットワーク6を介して相互に接続される。
ビデオ会議端末は、インスタントメッセージ(IM)の機能に対応しているIM対応ビデオ会議端末2と、インスタントメッセージの機能に対応していないIM未対応ビデオ会議端末3とに分類される。1回の会議の入室者(参加者)のビデオ会議端末が、全てIM対応ビデオ会議端末2であっても良く、全てIM未対応ビデオ会議端末3であっても良いが、この実施形態の多地点ビデオ会議システム1は、IM対応ビデオ会議端末2及びIM未対応ビデオ会議端末3が混在することを意図してなされたものである。
また、呼制御サーバ4及び多地点ビデオ会議サーバ5がそれぞれ異なる装置で構成されていても良く、また、1つの装置に、呼制御サーバ4及び多地点ビデオ会議サーバ5が構成されていても良い。
(A−1−2)IM対応ビデオ会議端末の機能的構成
図2は、IM対応ビデオ会議端末2の機能的な構成を示すブロック図である。
IM対応ビデオ会議端末2は、パソコンなどの汎用的な情報処理装置にIM対応ビデオ会議端末用のプログラムを搭載して構成されたものであっても良く、IM対応ビデオ会議端末用のプログラムを搭載した専用端末として構築されたものであっても良いが、IM対応ビデオ会議端末用プログラムを、機能的に整理すると図2で表すことができる。
なお、IM対応ビデオ会議端末2は、ハードウェア的には、ソフトウェアを実行するためのハードウェア構成(CPUやメモリなど)に加え、通信を実行する通信部や、映像信号を得るビデオカメラや、映像信号を表示するディスプレイや、音声信号を得るマイクロホンや、音声信号を発音するスピーカや、インスタントメッセージなどを入力する入力装置(例えばキーボード)などを備えている。
IM対応ビデオ会議端末2は、SIPから見た場合、UA(User Agent)に相当するものであり、通信処理部10、接続処理部11、映像/音声処理部12、IM処理部13及び制御部14を有する。
通信処理部10は、呼制御サーバ4及び多地点ビデオ会議サーバ5と通信するものである。通信処理部10は、SIPを用いて、呼制御サーバ4及び多地点ビデオ会議サーバ5から、接続処理部11やIM処理部13で処理されるメッセージを受信したり、RTP(Real−time Transport Protocol)を用いて、多地点ビデオ会議サーバ5から、映像/音声処理部12で処理される映像データ/音声データを受信したりするものである。通信処理部10は、接続処理部11、IM処理部13で処理されたメッセージを、SIPを用いて、呼制御サーバ4及び多地点ビデオ会議サーバ5に送信したり、映像/音声処理部12で処理された映像データ/音声データを、RTPを用いて、多地点ビデオ会議サーバ5に送信したりするものである。
以上のように、多地点ビデオ会議サーバ5の通信処理部10は、多地点ビデオ会議サーバ5と通信する場合において、映像データ/音声データはRTPを用いて多地点ビデオ会議サーバ5と直接授受し、メッセージはSIPを用いて、呼制御サーバ4を経由して多地点ビデオ会議サーバ5と授受する。
接続処理部11は、通信処理部10によって、呼制御サーバ4を経由して、多地点ビデオ会議サーバ5内の仮想会議室への接続処理(入室/退室など)を行うものである。
映像/音声処理部12は、当該IM対応ビデオ会議端末2と多地点ビデオ会議サーバ5とが接続しているときに(入室状態で)、図示しないビデオカメラから与えられた映像データや、マイクロホンが捕捉した音声データを通信処理部10によって多地点ビデオ会議サーバ5に送信させたり、多地点ビデオ会議サーバ5が送信し、通信処理部11が受信した映像データをディスプレイに表示させたり、多地点ビデオ会議サーバ5が送信し、通信処理部11が受信した音声データをスピーカから発音出力させたりするものである。
IM処理部13は、キーボードなどから入力されたインスタントメッセージを、通信処理部11によって多地点ビデオ会議サーバ5に送信させたり、多地点ビデオ会議サーバ5が送信し、通信処理部11が受信したインスタントメッセージを、ディスプレイに表示させたり、音声信号に変換した上でスピーカから発音出力させたりするものである。
制御部14は、通信処理部10、接続処理部11、映像/音声処理部12、IM処理部13を含む当該IM対応ビデオ会議端末2全体の制御を行うものである。
(A−1−3)IM未対応ビデオ会議端末の機能的構成
図3は、IM未対応ビデオ会議端末3の機能的な構成を示すブロック図である。
IM未対応ビデオ会議端末3は、パソコンなどの汎用的な情報処理装置にIM未対応ビデオ会議端末用のプログラムを搭載して構成されたものであっても良く、IM未対応ビデオ会議端末用のプログラムを搭載した専用端末として構築されたものであっても良いが、IM未対応ビデオ会議端末用プログラムを、機能的に整理すると図3で表すことができる。
なお、IM未対応ビデオ会議端末3は、ハードウェア的には、ソフトウェアを実行するためのハードウェア構成(CPUやメモリなど)に加え、通信を実行する通信部や、映像信号を得るビデオカメラや、映像信号を表示するディスプレイや、音声信号を得るマイクロホンや、音声信号を発音するスピーカなどを備えている。操作部としては、電源のON、OFF、入室、退室の指示などを行う最低限のものがあれば良い。
IM未対応ビデオ会議端末3は、SIPから見た場合、UAに相当するものであり、通信処理部20、接続処理部21、映像/音声処理部22及び制御部23を有する。上述したIM対応ビデオ会議端末2が備えていたIM処理部13と同様な機能部を、IM未対応ビデオ会議端末3は備えていない。
IM未対応ビデオ会議端末3の通信処理部20は、IM対応ビデオ会議端末2の通信処理部10とほぼ同様なものであり、同様な処理についてはその説明を省略する。当該IM未対応ビデオ会議端末3がIM処理部を搭載していないため、通信処理部20とIM処理部との間でのメッセージの授受がない点が、IM対応ビデオ会議端末2の通信処理部10と異なっている。
IM未対応ビデオ会議端末3の接続処理部21は、IM対応ビデオ会議端末2の接続処理部11と同様なものであり、その処理の説明は省略する。
IM未対応ビデオ会議端末3の映像/音声処理部22は、IM対応ビデオ会議端末2の映像/音声処理部12と同様なものであり、その処理の説明は省略する。但し、同じ時刻の会議室の映像データであっても、IM対応ビデオ会議端末2に与えられる映像データと、IM未対応ビデオ会議端末3に与えられる映像データとが異なることもある。
制御部23は、通信処理部20、接続処理部21、映像/音声処理部22を含む当該IM未対応ビデオ会議端末3全体の制御を行うものである。
(A−1−4)呼制御サーバの機能的構成
図4は、呼制御サーバ4の機能的な構成を示すブロック図である。
呼制御サーバ4は、汎用的な情報処理装置に呼制御サーバ用のプログラムを搭載して構成されたものであっても良く、呼制御サーバ用のプログラムを搭載した専用端末として構築されたものであっても良いが、呼制御サーバ用プログラムを、機能的に整理すると図4で表すことができる。
なお、呼制御サーバ4は、ハードウェア的には、ソフトウェアを実行するためのハードウェア構成(CPUやメモリなど)に加え、通信を実行する複数の通信部を備えていれば良い。
呼制御サーバ4は、SIPから見た場合、Proxyサーバに相当するものであり、送信元装置(例えば、ビデオ会議端末2、3)から受信したメッセージ(SIP信号)を、そのメッセージ内に記載されている送信先に対して送信する代行送信機能を担っている。呼制御サーバ4は、通信処理部30、呼制御処理部31及び制御部32を有する。
通信処理部30は、各ビデオ会議端末2、3や多地点ビデオ会議サーバ5と通信するものである。すなわち、通信処理部30は、SIPを用いて、各ビデオ会議端末2、3や多地点ビデオ会議サーバ5から、呼制御処理部31で処理されるメッセージを受信したり、呼制御処理部31で処理されたメッセージを、SIPを用いて、各ビデオ会議端末2、3や多地点ビデオ会議サーバ5に送信したりするものである。
呼制御処理部31は、各ビデオ会議端末2、3や多地点ビデオ会議サーバ5などの送信先装置から、メッセージを受信すると、メッセージの内容を解析し、メッセージにおけるToヘッダのSIP−URIを抽出し、抽出したSIP−URIを、図示しないロケーションサーバを参照して、IPアドレスに変換し、SIP−URIが変換されたこのIPアドレスを送信先アドレスとして送信先装置にメッセージを送信するものである。
制御部32は、通信処理部30及び呼制御処理部31を含む当該呼制御サーバ4全体の制御を行うものである。
(A−1−5)多地点ビデオ会議サーバの機能的構成
図5は、多地点ビデオ会議サーバ5の機能的な構成を示すブロック図である。
多地点ビデオ会議サーバ5は、汎用的な情報処理装置に多地点ビデオ会議サーバ用のプログラムを搭載して構成されたものであっても良く、多地点ビデオ会議サーバ用のプログラムを搭載した専用端末として構築されたものであっても良いが、多地点ビデオ会議サーバ用プログラムを、機能的に整理すると図5で表すことができる。
なお、多地点ビデオ会議サーバ5は、ハードウェア的には、ソフトウェアを実行するためのハードウェア構成(CPUやメモリなど)に加え、通信を実行する複数の通信部を備えていれば良い。
多地点ビデオ会議サーバ5は、MCU(Multipoint Control Unit)に相当するものであり、通信処理部40、接続処理部41、映像/音声処理部42、IM処理部43及び制御部44を有する。
通信処理部40は、IM対応ビデオ会議端末2、IM未対応ビデオ会議端末3及び呼制御サーバ4と通信する。通信処理部40は、SIPを用いて、IM対応ビデオ会議端末2、IM未対応ビデオ会議端末3及び呼制御サーバ4から、接続処理部41、IM処理部43で処理されるメッセージを受信する。また、通信処理部40は、RTPを用いて、IM対応ビデオ会議端末2及びIM未対応ビデオ会議端末3から、映像/音声処理部42で処理される映像データ/音声データを受信する。さらに、通信処理部40は、SIPを用いて、IM対応ビデオ会議端末2、IM未対応ビデオ会議端末3及び呼制御サーバ4に、接続処理部41、IM処理部43で処理されたメッセージを送信する。さらにまた、通信処理部40は、RTPを用いて、IM対応ビデオ会議端末2及びIM未対応ビデオ会議端末3に、映像/音声処理部42で処理された映像データ/音声データを送信する。
接続処理部41は、呼制御サーバ4を介して、ビデオ会議端末2、3との間の入室/退出に関する接続処理を実行する。
接続処理部41は、入室に関する接続処理を、SIPのメッセージを用いた次の3ウェイハンドシェイク(1)〜(3)の処理を実行する。
(1)接続処理部41は、呼制御サーバ4を介して、IM対応ビデオ会議端末2又はIM未対応ビデオ会議端末3から送信されるINVITEメソッド(以下、メソッドを省略して記載していることもある)を受信する。
(2)接続処理部41は、INVITEを受信後、呼制御サーバ4を介して、送信元のIM対応ビデオ会議端末2又はIM未対応ビデオ会議端末3に200 OKを送信する。
(3)接続処理部41は、INVITEに対する200 OKを送信後、呼制御サーバ4を介して、IM対応ビデオ会議端末2又はIM未対応ビデオ会議端末3から送信されるACKを受信する。
接続処理部41は、退室に関する接続処理を、SIPのメッセージを用いた次の2ウェイハンドシェイク(4)、(5)の処理を実行する。
(4)接続処理部41は、呼制御サーバ4を介して、IM対応ビデオ会議端末2又はIM未対応ビデオ会議端末3から送信されるBYEを受信する。
(5)接続処理部41は、BYEを受信後、呼制御サーバ4を介して、送信元のIM対応ビデオ会議端末2又はIM未対応ビデオ会議端末3に200 OKを送信する。
接続処理部41は、上記(1)の処理において、接続してきたビデオ会議端末2、3から受信したINVITEメソッドにおけるAllowヘッダ中にMESSAGEメソッドが含まれるか否かにより、接続してきたビデオ会議端末2、3のIM処理能力を判定する。接続処理部41は、Allowヘッダ中にMESSAGEメソッドが含まれる場合には、送信元のビデオ会議端末はIM対応ビデオ会議端末2であると判断し、一方、Allowヘッダ中にMESSAGEメソッドが含まれない場合には、送信元のビデオ会議端末はIM未対応ビデオ会議端末3であると判断する。接続処理部41は、判定結果(IM対応/IM未対応の情報と、ビデオ会議端末のSIP URI)を、映像/音声処理部42に送信する。
接続処理部41において、上記のように呼制御に基づいて、ビデオ会議端末2、3の接続処理(入室/退室)が行われるので、各ビデオ会議端末2、3及び多地点ビデオ会議サーバ5内の仮想会議室が有するシステムにユニークな任意の識別子(SIP URI)を特定することができる。そのため、多地点ビデオ会議サーバ5(の接続処理部41)は、どのビデオ会議端末2、3が仮想会議室に接続(入室)しているか、どのビデオ会議端末2、3が仮想会議室から切断(退室)したかをリアルタイムに知ることができ、接続しているビデオ会議端末2、3の情報を管理することができる。例えば、管理情報をテーブル構成で管理し、テーブルに識別子(SIP URI)が記述されているビデオ会議端末2、3が入室中の端末であり、退室に伴い、識別子が削除される。また、識別子に対応付けて、IM対応かIM未対応かが記述される。さらに、後述するようなインスタントメッセージの1種である途中入室者や現入室者リストを表示したときに、表示を見た者が直ちに入室者を理解し易いように、識別子に対応付けて、通称を記述しておくようにしても良い。因みに、SIP信号のFromヘッダに通称が含まれていることは多い。
映像/音声処理部42は、IM対応ビデオ会議端末2又はIM未対応ビデオ会議端末3が送信し、通信処理部40が受信した映像データと音声データを処理(加工編集)するものである。
映像/音声処理部42が実行する映像データや音声データの加工編集は、既存のビデオ会議システムにおけるものと同様であり、例えば、次のようなものが含まれる。(a)各参加者の映像(各端末からの映像)を縮小し、参加者全員の映像を一枚の映像にはめ込む。(b)音声ゲインの高い参加者の映像に切り替え、若しくは、他の参加者より大きなウィンドウとする。(c)送信元以外の任意の参加者の音声を合成する。映像/音声処理部42によって処理(加工編集)された映像データと音声データは、通信処理部40によって、IM対応ビデオ会議端末2、IM未対応ビデオ会議端末3に送信される。
さらに、映像/音声処理部42は、接続処理部41から受信した端末のIM対応、未対応の判定結果に基づいて、少なくとも1台のIM未対応ビデオ会議端末3が入室していることを認識したときには、IM未対応ビデオ会議端末入室時の処理として、インスタントメッセージを処理(加工編集)する。この実施形態の場合、インスタントメッセージの種類として、IM対応ビデオ会議端末2が送信したインスタントメッセージ(参加者メッセージ)と、後述するIM処理部43が生成したインスタントメッセージ(サーバ生成メッセージ)とがある。
映像/音声処理部42が実行するインスタントメッセージの加工編集は、例えば、次のようなものが含まれる(詳細は、動作説明の項で説明する)。(ア)吹き出し方式:インスタントメッセージに係るビデオ会議端末の表示映像の上に吹き出しとしてインスタントメッセージを合成する。(イ)テロップ方式:全参加者合成映像の決まった位置にテロップとしてインスタントメッセージを合成する。
IM処理部43は、IM対応ビデオ会議端末2が送信したインスタントメッセージ(参加者メッセージ)を通信処理部40が受信したときには、次のような処理を実行する。すなわち、IM処理部43は、接続中(入室中)の全て(送信元の端末が含まれても含まれていなくてもどちらでも良い)のIM対応ビデオ会議端末2に受信インスタントメッセージを送信すると共に、IM未対応ビデオ会議端末3へもその情報を伝達できるようにすべく受信インスタントメッセージを映像/音声処理部42に与える。
また、IM処理部43は、所定のイベントが生じたときには、インスタントメッセージ(サーバ生成メッセージ)を生成し、接続中(入室中)の全てのIM対応ビデオ会議端末2に生成インスタントメッセージを送信すると共に、IM未対応ビデオ会議端末3へもその情報を伝達できるようにすべく生成インスタントメッセージを映像/音声処理部42に与える。
制御部44は、通信処理部40、接続処理部41、映像/音声処理部42、IM処理部43を含む当該多地点ビデオ会議サーバ5全体の制御を行うものである。
(A−2)実施形態の動作
次に、実施形態の多地点ビデオ会議システム1の動作を、図面を参照しながら説明する。以下では、インスタントメッセージに関係する動作を説明する。
(A−2−1)参加者メッセージの配信動作
以下、いずれかのIM対応ビデオ会議端末が送信したテキストデータ列でなるインスタントメッセージ(すなわち、参加者メッセージ)を、他の全てのビデオ会議端末に多地点ビデオ会議サーバが配信する場合の動作を説明する。
図6は、参加者メッセージの配信動作の、参加者メッセージの流れを示す説明図である。
いずれかのIM対応ビデオ会議端末(この項の説明では符号2Sを用いる)が送信した参加者メッセージは、呼制御サーバ4を経由して、多地点ビデオ会議サーバ5に到達する(S1)。
多地点ビデオ会議サーバ5は、参加者メッセージの送信元以外の入室中のビデオ会議端末を確認する。IM対応ビデオ会議端末(この項の説明では符号2Rを用いる)が入室中であれば、多地点ビデオ会議サーバ5は、入室中の全てのIM対応ビデオ会議端末に、受信した参加者メッセージを加工することなく(テキストデータ列のまま)、呼制御サーバ4経由で同報配信する(S2)。また、IM未対応ビデオ会議端末3が入室中であれば、多地点ビデオ会議サーバ5は、受信した参加者メッセージを映像データに合成した上で、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)で同報配信する(S3)。
因みに、従来であれば、IM対応ビデオ会議端末2Sは、他のIM対応ビデオ会議端末2Rに呼制御サーバ4を介し、参加者メッセージをP2Pで与えることができたが、IM未対応ビデオ会議端末3に対しては、参加者メッセージの情報を一切与えることができなかった。
図7は、インスタントメッセージの映像データへの合成方式の説明図であり、4名の入室者の映像を含む仮想会議室映像データに合成する場合を示している。図7(A)は、仮想会議室映像データにおける所定の入室者の映像部分に、吹き出しとしてインスタントメッセージを合成する吹き出し合成方式を示している。図7(B)は、仮想会議室映像データにおける所定位置にインスタントメッセージをテロップとして合成するテロップ合成方式を示している。
上述のように、参加者メッセージを合成する場合には、その送信元の入室者を、所定の入室者とした吹き出し合成方式を適用する。但し、仮想会議室映像データに参加者メッセージの送信元の入室者を含まれていない場合には、テロップ合成方式を適用する。
参加者メッセージが呼制御サーバ4経由で到来したIM対応ビデオ会議端末2Rは、呼制御サーバ4を経由しないで到来した仮想会議室映像データと共に、参加者メッセージを表示させる。IM対応ビデオ会議端末2Rにおけるこの際の表示方法は、既存の表示方法を適用できる。例えば、図示は省略するが、参加者メッセージに係るウィンドウ画像と、仮想会議室映像データに係るウィンドウ画像とを並設して表示しても良く、一方のウィンドウ画像を他のウィンドウ画像上にしかも上下を切り替えられるように表示しても良い。
図8は、参加者メッセージの配信時の各部シーケンス図である。図8は、入室中のビデオ会議端末として、2つのIM対応ビデオ会議端末2S及び2Rと、1つのIM未対応ビデオ会議端末3がある場合を示している。図9は、参加者メッセージの配信時の多地点ビデオ会議サーバ5の動作を示すフローチャートである。
IM対応ビデオ会議端末2Sに係る入室者が端末の入力装置を用いてインスタントメッセージ(参加者メッセージ)を入力して転送を指示すると、IM対応ビデオ会議端末2S(のIM処理部13)が、入力された参加者メッセージを含むSIPのMESSAGEメソッドを形成し、呼制御サーバ4経由で多地点ビデオ会議サーバ5に送信する(S11)。多地点ビデオ会議サーバ5は、MESSAGEメソッドを受信すると、受信応答である200 OKメソッドを、呼制御サーバ4経由でIM対応ビデオ会議端末2Sに返信する(S12)。
例えば、MESSAGEメソッドのボディに、インスタントメッセージ(参加者メッセージやサーバ生成メッセージ)を盛り込む。盛り込むインスタントメッセージの表記は任意であり、例えば、HTML(Hyper Text Markup Language)で記述したものを適用できる。
また、多地点ビデオ会議サーバ5は、MESSAGEメソッドの受信時には、入室者管理情報に基づき、図9に示すように、送信元のIM対応ビデオ会議端末2S以外に、入室中のIM対応ビデオ会議端末があるか否かを判別する(S21)。図8の例では、送信元のIM対応ビデオ会議端末2S以外に、IM対応ビデオ会議端末2Rがあるので、多地点ビデオ会議サーバ5は、入室中の全てのIM対応ビデオ会議端末2Rに、呼制御サーバ4経由でMESSAGEメソッドを転送する(図8のS13、図9のS22)。MESSAGEメソッドの転送を受けたIM対応ビデオ会議端末2Rは、受信応答である200 OKメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に返信する(S14)。MESSAGEメソッドの転送を受けたIM対応ビデオ会議端末2Rは、MESSAGEメソッドに含まれているインスタントメッセージ(参加者メッセージ)を表示させる。
多地点ビデオ会議サーバ5は、MESSAGEメソッドの送信元のIM対応ビデオ会議端末2S以外に入室中のIM対応ビデオ会議端末がない場合や、MESSAGEメソッドの送信元のIM対応ビデオ会議端末2S以外に入室中のIM対応ビデオ会議端末2RがあってそのIM対応ビデオ会議端末2RにMESSAGEメソッドを転送した場合には、入室中のIM未対応ビデオ会議端末があるか否かを判別する(S23)。図8の例では、IM未対応ビデオ会議端末3があるので、多地点ビデオ会議サーバ5は、仮想会議室映像データに、受信したMESSAGEメソッドに含まれているインスタントメッセージ(参加者メッセージ)を合成し、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)で、入室中の全てのIM未対応ビデオ会議端末3に同報配信する(図8のS15、図9のS24)。入室中のIM未対応ビデオ会議端末がない場合には、一連の処理を終了する。
(A−2−2)ビデオ会議端末の入室時動作
次に、あるビデオ会議端末が仮想会議室に新たに入室した場合の動作を説明する。
図10は、仮想会議室への新たな入室動作における、インスタントメッセージ(サーバ生成メッセージ)等の流れを示す説明図である。
あるIM対応ビデオ会議端末(この項の説明では符号2Xを用いる)が新たに仮想会議室に入室するための信号を多地点ビデオ会議サーバ5に与える(S31)。多地点ビデオ会議サーバ5は、新入室者以外の入室中のビデオ会議端末を確認する。他のIM対応ビデオ会議端末(この項の説明では符号2Yを用いる)が既に入室していれば、多地点ビデオ会議サーバ5は、既入室の全てのIM対応ビデオ会議端末2Yに、新入室者を通知するためのインスタントメッセージを生成して、呼制御サーバ4経由で同報配信する(S32)。また、IM未対応ビデオ会議端末3が既に入室していれば、多地点ビデオ会議サーバ5は、新入室者を通知するために生成したインスタントメッセージを映像データに合成した上で、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)でIM未対応ビデオ会議端末3に同報配信する(S33)。
なお、S31〜S33の信号やインスタントメッセージの授受は、新たに仮想会議室に入室したビデオ会議端末が、IM未対応ビデオ会議端末の場合にも同様に実行される。
さらに、多地点ビデオ会議サーバ5は、既入室のビデオ会議端末2Y、3を新入室者に通知するためのインスタントメッセージを生成して、呼制御サーバ4経由で新入室に係るIM対応ビデオ会議端末2Xに送信する(S34)。図10は、新入室に係るビデオ会議端末がIM対応ビデオ会議端末(2X)の場合を示しているが、新入室に係るビデオ会議端末がIM未対応ビデオ会議端末の場合には、多地点ビデオ会議サーバ5は、既入室のビデオ会議端末を新入室者に通知するためのインスタントメッセージを生成した後、映像データに合成した上で、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)で新入室に係るIM未対応ビデオ会議端末に送信することとなる。
因みに、従来であれば、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2に自己が生成したインスタントメッセージ(サーバ生成メッセージ)を与えることができたが、IM未対応ビデオ会議端末3に対しては、自己が生成したインスタントメッセージを一切与えることができなかった。
図11は、あるビデオ会議端末の仮想会議室への新たな入室時の各部シーケンス図である。図11は、入室中のビデオ会議端末として、IM対応ビデオ会議端末2YとIM未対応ビデオ会議端末3とがあり、そのような仮想会議室へIM対応ビデオ会議端末2Xが新たに入室する場合を示している。図12は、あるビデオ会議端末の仮想会議室への新たな入室時の多地点ビデオ会議サーバ5の動作を示すフローチャートである。
あるIM対応ビデオ会議端末2Xに係る者が、IM対応ビデオ会議端末2Xに対して仮想会議室へ入室するための操作を行うと、IM対応ビデオ会議端末2Xは、入室要求としてSIPのINVITEメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に送信する(S41)。このとき送信されるINVITEメソッドは、SIPにおいて、呼制御開始要求として送信されるものと同様である。INVITEメソッドを受信した多地点ビデオ会議サーバ5は、受信応答である200 OKメソッドを呼制御サーバ4経由でIM対応ビデオ会議端末2Xに返信し(S42)、IM対応ビデオ会議端末2Xはセッションが確立されたことを理解した旨を表すACKメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に送信する(S43)。
多地点ビデオ会議サーバ5は、新たな入室者に係るIM対応ビデオ会議端末2Xとのセッションが確立すると、仮想会議室の映像データにIM対応ビデオ会議端末2Xからの映像データも含めるように操作する(図12のS51)。
また、多地点ビデオ会議サーバ5は、受信したINVITEメソッドにおけるFromヘッダからIM対応ビデオ会議端末2XのSIP URIを抽出し、入室者管理情報に入室者端末の識別子として追加する(S52)。この際、入室者の通称も併せて抽出して追加するようにしても良い。さらに、多地点ビデオ会議サーバ5は、受信したINVITEメソッドにおけるAllowヘッダのフィールドに「MESSAGE」が記載されているか否かを確認し(S53)、「MESSAGE」が記載されている場合には、入室者管理情報の追加した識別子に対応付けてインスタントメッセージに対応している端末である旨を記述し(S54)、「MESSAGE」が記載されていない場合には、入室者管理情報の追加した識別子に対応付けてインスタントメッセージに対応していない端末である旨を記述する(S55)。図11の例の場合には、INVITEメソッドの送信元のIM対応ビデオ会議端末2Xは、IM対応であるのでその旨が記述される。Allowヘッダは、INVITEメソッドの送信元端末が取り扱うことができるメソッドの種類を記述するフィールドであるため、MESSAGEメソッドを取り扱うことができると記述しているビデオ会議端末は、IM対応の端末である。例えば、「INVITE,ACK,CANCEL,BYE,OPTIONS,PRACK,MESSAGE,SUBSCRIBE,NOTIFY,REFER,UPDATE」と記述されているAllowヘッダを有するINVITEメソッドを受信した場合、MESSAGEを含んでいるので、その送信元のビデオ会議端末をIM対応である判定する。
さらに、多地点ビデオ会議サーバ5は、INVITEメソッドの受信時に、入室者管理情報に基づき、送信元のIM対応ビデオ会議端末2X以外に、入室中のIM対応ビデオ会議端末があるか否かを判別する(S56)。図11の例では、送信元のIM対応ビデオ会議端末2X以外に、IM対応ビデオ会議端末2Yがあるので、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Xが新たに入室したことを通知するインスタントメッセージを生成し、そのインスタントメッセージをMESSAGEメソッドに盛り込んで、既に入室している全てのIM対応ビデオ会議端末2Yに、呼制御サーバ4経由で送信する(図11のS44、図12のS57)。MESSAGEメソッドの送信を受けたIM対応ビデオ会議端末2Yは、受信応答である200 OKメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に返信する(S45)。MESSAGEメソッドの送信を受けたIM対応ビデオ会議端末2Yは、MESSAGEメソッドに含まれているインスタントメッセージ(サーバ生成メッセージ)を表示させる。
ここで、多地点ビデオ会議サーバ5は、例えば、「xxxが入室しました。」という固定の文章(テンプレート)を予め用意しておき、「固定文章」中の「xxx」に、INVITEメソッドの送信元のSIP URI若しくは通称などを挿入することで、インスタントメッセージ(サーバ生成メッセージ)を生成させる。多地点ビデオ会議サーバ5が生成する他のインスタントメッセージも、同様な方法で生成する。
なお、例えば、多地点ビデオ会議サーバ5は、「新たな入室者がありました。」のような入室者を具体的に特定していないインスタントメッセージを生成するようにしても良い(この場合、「生成」よりも「記憶情報の読み出し」と表現した方が良い)。特許請求の範囲における「生成」は、このような場合を含むものとする。
多地点ビデオ会議サーバ5は、INVITEメソッドの送信元のIM対応ビデオ会議端末2X以外に入室中のIM対応ビデオ会議端末がない場合や、INVITEメソッドの送信元のIM対応ビデオ会議端末2X以外の入室中のIM対応ビデオ会議端末2Yへのサーバ生成メッセージを送信した場合には、入室中のIM未対応ビデオ会議端末があるか否かを判別する(S58)。図11の例では、IM未対応ビデオ会議端末3があるので、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Xが新たに入室したことを通知するインスタントメッセージを生成し、仮想会議室映像データに、そのサーバ生成メッセージを合成し、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)で、入室中の全てのIM未対応ビデオ会議端末3に同報配信する(図11のS46、図12のS59)。この場合の合成方式は、多地点ビデオ会議サーバ5がインスタントメッセージの生成元であるため、図7(B)に示したようなテロップ合成方式となる。
多地点ビデオ会議サーバ5は、入室中のIM未対応ビデオ会議端末がない場合や、入室中のIM未対応ビデオ会議端末に対してサーバ生成メッセージを合成した映像データを送信した場合には、INVITEメソッドを送信した新入室のビデオ会議端末はIM対応ビデオ会議端末があるか否かを判別する(S60)。図11の例では、新入室のビデオ会議端末がIM未対応ビデオ会議端末2Xであるので、そのIM対応ビデオ会議端末2Xに入室中の他のビデオ会議端末を教示するためのインスタントメッセージを入室中端末の管理情報から生成し、そのインスタントメッセージをMESSAGEメソッドに盛り込んで、そのIM対応ビデオ会議端末2Xに呼制御サーバ4経由で送信する(図11のS47、図12のS61)。このMESSAGEメソッドの送信を受けたIM対応ビデオ会議端末2Xは、受信応答である200 OKメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に返信する(S48)。図11とは異なるが、INVITEメソッドを送信した新入室のビデオ会議端末がIM未対応ビデオ会議端末の場合には、そのIM対応未ビデオ会議端末3に入室中の他のビデオ会議端末を教示するためのインスタントメッセージを入室中端末の管理情報から生成し、仮想会議室映像データに、そのサーバ生成メッセージを合成し、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)で、新入室のIM未対応ビデオ会議端末3に送信する(S62)。
(A−2−3)ビデオ会議端末の退室時動作
次に、あるビデオ会議端末が仮想会議室から退室した場合の動作を説明する。
図13は、仮想会議室からの退室動作における、インスタントメッセージ(サーバ生成メッセージ)等の流れを示す説明図である。
あるIM対応ビデオ会議端末(この項の説明では符号2Xを用いる)が仮想会議室から退室するための信号を多地点ビデオ会議サーバ5に与える(S71)。多地点ビデオ会議サーバ5は、退室者以外の入室中のビデオ会議端末を確認する。退室者以外に、入室中のIM対応ビデオ会議端末(この項の説明では符号2Yを用いる)があれば、多地点ビデオ会議サーバ5は、入室中の全てのIM対応ビデオ会議端末2Yに、退室者を通知するためのインスタントメッセージを生成して、呼制御サーバ4経由で同報配信する(S72)。また、IM未対応ビデオ会議端末3が入室中であれば、多地点ビデオ会議サーバ5は、退室者を通知するために生成したインスタントメッセージを映像データに合成した上で、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)でIM未対応ビデオ会議端末3に同報配信する(S73)。
図13は、退室に係るビデオ会議端末がIM対応ビデオ会議端末(2X)の場合を示しているが、IM未対応ビデオ会議端末が退室する場合にも、インスタントメッセージの同様な授受がなされる。
図14は、あるビデオ会議端末の仮想会議室からの退室時の各部シーケンス図である。図14は、IM対応ビデオ会議端末2Xが退室し、退室後に、IM対応ビデオ会議端末2YとIM未対応ビデオ会議端末3とが仮想会議室に残る場合を示している。図15は、あるビデオ会議端末が仮想会議室から退室するときの多地点ビデオ会議サーバ5の動作を示すフローチャートである。
あるIM対応ビデオ会議端末2Xに係る者が、IM対応ビデオ会議端末2Xに対して仮想会議室から退室するための操作を行うと、IM対応ビデオ会議端末2Xは、退室要求としてSIPのBYEメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に送信する(S81)。BYEメソッドを受信した多地点ビデオ会議サーバ5は、受信応答である200 OKメソッドを呼制御サーバ4経由でIM対応ビデオ会議端末2Xに返信する(S82)。IM対応ビデオ会議端末2Xは、自己とのセッションが切断されたことを認識する。
多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Xの退室に応じ、仮想会議室の映像データを、IM対応ビデオ会議端末2Xからの映像データを含めないように変更する(図15のS91)。多地点ビデオ会議サーバ5は、入室者管理情報から、退室したIM対応ビデオ会議端末2Xの情報(識別子やIM対応の有無など)を消去する(S92)。
また、多地点ビデオ会議サーバ5は、BYEメソッドの受信時に、入室者管理情報に基づき、残っている(入室中の)ビデオ会議端末の中に、IM対応ビデオ会議端末があるか否かを判別する(S93)。図14の例では、IM対応ビデオ会議端末2Yがいるので、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Xが退室したことを通知するインスタントメッセージを生成し、そのインスタントメッセージをMESSAGEメソッドに盛り込んで、残っている全てのIM対応ビデオ会議端末2Yに、呼制御サーバ4経由で送信する(図14のS83、図15のS94)。MESSAGEメソッドの送信を受けたIM対応ビデオ会議端末2Yは、受信応答である200 OKメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に返信する(S84)。MESSAGEメソッドの送信を受けたIM対応ビデオ会議端末2Yは、MESSAGEメソッドに含まれているインスタントメッセージ(サーバ生成メッセージ)を表示させる。
多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Xの退室後においてIM対応ビデオ会議端末が残っていない場合や、残っているIM対応ビデオ会議端末2Yへ退室を通知するサーバ生成メッセージを送信した場合には、退室後において、IM未対応ビデオ会議端末が残っているか否かを判別する(S95)。図14の例では、IM未対応ビデオ会議端末3が残っているので、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Xが退室したことを通知するインスタントメッセージを生成し、仮想会議室映像データに、そのサーバ生成メッセージを合成し、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)で、残っている全てのIM未対応ビデオ会議端末3に同報配信する(図14のS85、図15のS96)。
(A−2−4)会議室制御情報の通知動作
次に、多地点ビデオ会議サーバ5が仮想会議室の制御を実行している場合に、ビデオ会議端末への通知が必要と判断した場合の動作を説明する。
実施形態の多地点ビデオ会議システム1においては、多地点ビデオ会議サーバ5が種々の制御を行っており、その制御の内容や結果をビデオ会議端末2、3から報知させたいことも生じる。例えば、マイクロホンからの信号レベルに応じて発言者制御(いわゆるマイク制御)を行っている場合、追加して発言権を得た者がいることを全てのビデオ会議端末2、3から報知させたい。
図16は、このような発言者制御動作における、インスタントメッセージ(サーバ生成メッセージ)等の流れを示す説明図である。
多地点ビデオ会議サーバ5は、いずれかのビデオ会議端末2、3に発言権を付与し、そのビデオ会議端末からの音声データを全てのビデオ会議端末に配信している状態においても、各ビデオ会議端末のマイクロホンが捕捉している信号レベルを監視している。そして、信号レベルが所定条件を満たす他のビデオ会議端末がいる場合には、仮想会議室の合成音声データに、その端末からの音声データも含める(合成する)。
なお、各ビデオ会議端末が発言権要求用の操作子を有し、操作子で要求された発言権の調停を行って、仮想会議室の合成音声データに含める音声データの切替制御を行うものであっても良い。
多地点ビデオ会議サーバ5は、あるIM対応ビデオ会議端末(この項の説明では符号2Mを用いる)が新たに発言権(この項での発言権とは、仮想会議室の合成音声データに自己からの音声データを合成する権利を言うこととする)を得た場合には、その旨を通知するインスタントメッセージを生成して、呼制御サーバ4経由で送信する(S101)。例えば、「発言が許されました。発言して下さい。」のインスタントメッセージを生成し、IM対応ビデオ会議端末2Mへの送信で音声で発音出力することを指示する。多地点ビデオ会議サーバ5は、発言許可者以外の入室中のビデオ会議端末を確認する。発言許可者以外に、入室中のIM対応ビデオ会議端末(この項の説明では符号2Nを用いる)があれば、多地点ビデオ会議サーバ5は、入室中の全てのIM対応ビデオ会議端末2Nに、発言許可者を通知するためのインスタントメッセージ(例えば、「xxxに発言が許されました。」;出力方法を音声出力としている)を生成し、呼制御サーバ4経由で同報配信する(S102)。また、IM未対応ビデオ会議端末3が入室中であれば、多地点ビデオ会議サーバ5は、発言許可者を通知するために生成したインスタントメッセージを仮想会議室映像データに合成した上で、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)でIM未対応ビデオ会議端末3に同報配信する(S103)。
図16は、発言許可者に係るビデオ会議端末がIM対応ビデオ会議端末(2X)の場合を示しているが、IM未対応ビデオ会議端末が発言許可者に係るビデオ会議端末の場合には、多地点ビデオ会議サーバ5は、生成したインスタントメッセージを仮想会議室映像データに合成した上で送信することになる。
図17は、あるビデオ会議端末へ発言権を付与した際の各部シーケンス図である。図17は、IM対応ビデオ会議端末2Mへ発言権を付与し、他に、IM対応ビデオ会議端末2NとIM未対応ビデオ会議端末3とが仮想会議室にある場合を示している。図18は、あるビデオ会議端末へ発言権を付与したときの多地点ビデオ会議サーバ5の動作を示すフローチャートである。
IM対応ビデオ会議端末2Mに発言権が付与されると、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Mからの音声データを合成するように変更すると共に(図18のS121)、発言権が付与されたビデオ会議端末用のインスタントメッセージ(サーバ制御メッセージ)を生成し、そのインスタントメッセージを音声出力するようにMESSAGEメソッドに盛り込んで、発言権を得たIM対応ビデオ会議端末2Mに、呼制御サーバ4経由で送信する(図17のS111、図18のS122)。このMESSAGEメソッドの送信を受けたIM対応ビデオ会議端末2Mは、受信応答である200 OKメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に返信する(S112)。IM対応ビデオ会議端末2Mは、MESSAGEメソッドに含まれているインスタントメッセージ(サーバ生成メッセージ)を発音出力させる。
また、多地点ビデオ会議サーバ5は、発言権付与端末の追加時に、入室者管理情報に基づき、入室中のビデオ会議端末の中に、IM対応ビデオ会議端末があるか否かを判別する(S123)。図17の例では、IM対応ビデオ会議端末2Nがあるので、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Mに発言権を付与したことを通知するインスタントメッセージを生成し、そのインスタントメッセージを音声出力するようにMESSAGEメソッドに盛り込んで、入室中の全てのIM対応ビデオ会議端末2Nに、呼制御サーバ4経由で送信する(図17のS113、図18のS124)。このMESSAGEメソッドの送信を受けたIM対応ビデオ会議端末2Nは、受信応答である200 OKメソッドを、呼制御サーバ4経由で多地点ビデオ会議サーバ5に返信する(S114)。IM対応ビデオ会議端末2Nは、MESSAGEメソッドに含まれているインスタントメッセージ(サーバ生成メッセージ)を発音出力させる。
多地点ビデオ会議サーバ5は、発言権が付与されたIM対応ビデオ会議端末2M以外に入室中のIM対応ビデオ会議端末がない場合や、入室中のIM対応ビデオ会議端末2Nに対して他端末が発言権を付与された旨のサーバ生成メッセージを送信した場合には、入室中のIM未対応ビデオ会議端末があるか否かを判別する(S125)。図17の例では、IM未対応ビデオ会議端末3があるので、多地点ビデオ会議サーバ5は、IM対応ビデオ会議端末2Mに発言権を付与したことを通知するインスタントメッセージを生成し、仮想会議室映像データに、そのサーバ生成メッセージを合成し、呼制御サーバ4を経由しない、映像データについての通常の経路(RTP)で、残っている全てのIM未対応ビデオ会議端末3に同報配信する(図17のS115、図18のS126)。
(A−3)実施形態の効果
以上のように、上記実施形態によれば、複数種類のビデオ会議端末が混在していても全ての会議端末に対してインスタントメッセージの提示サービスを提供することができる。
(B)他の実施形態
上記実施形態では、インスタントメッセージを、そのインスタントメッセージの種類で定まる全てのビデオ会議端末に配信するものを示したが、多地点ビデオ会議サーバに、インスタントメッセージを配信する端末か否かを設定できるようにしておき、許可されたビデオ会議端末にのみ配信するようにしても良い。この場合であっても、IM未対応のビデオ会議端末が配信対象の場合には、仮想会議室映像データにインスタントメッセージを合成して配信することになる。
同様に、IM対応のビデオ会議端末に対しては、設定によって、映像データとの合成でインスタントメッセージを配信できるようにしても良い。
上記実施形態の説明では、仮想会議室映像データが各端末からの映像が同じ大きさを有するように説明したが、各端末からの映像が同じ大きさである必要はない。例えば、話者優先画像(話者の映像が他の映像より大きい画像)であっても良い。
上記実施形態では、会議室制御情報が音声合成のON情報であるものを示したが、会議室制御情報はこれに限定されるものではない。例えば、音声合成のOFF情報(特定のビデオ会議端末を音声合成の対象から外したという情報)を会議室制御情報としても良く、この場合のインスタントメッセージ例として、「xxxをミュートしました。」を挙げることができる。また例えば、単独映像への切り替え情報(特定のビデオ会議端末の映像に切り替えたという情報)を会議室制御情報としても良く、この場合のインスタントメッセージ例として、「xxxに映像を切り替えました。」を挙げることができる。ここで、会議室制御情報が、議長制御に基づいて形成されるものであっても良い。
上記実施形態では、多地点ビデオ会議サーバが受信したINVITEメソッドのAllowヘッダにMESSAGEが記述されているか否かに基づいて、ビデオ会議端末がIM対応か否かを判定するものを示したが、判定方法はこれに限定されるものではない。例えば、MESSAGEメソッドを判定対象に投げてみて(送信してみて)200 OKメソッドが所定時間内に返信されるか否かでIM対応か否かを判定するようにしても良い。
上記実施形態では、多地点ビデオ会議サーバ及び多地点ビデオ会議システムに本発明の技術思想を適用したものを示したが、音声会議などの他の会議システムにも、本発明の技術思想を適用することができる。