JP4425887B2 - ビデオ会議システム、ビデオ会議システムに使用される端末、端末の処理方法、そのプログラム - Google Patents

ビデオ会議システム、ビデオ会議システムに使用される端末、端末の処理方法、そのプログラム Download PDF

Info

Publication number
JP4425887B2
JP4425887B2 JP2006205054A JP2006205054A JP4425887B2 JP 4425887 B2 JP4425887 B2 JP 4425887B2 JP 2006205054 A JP2006205054 A JP 2006205054A JP 2006205054 A JP2006205054 A JP 2006205054A JP 4425887 B2 JP4425887 B2 JP 4425887B2
Authority
JP
Japan
Prior art keywords
terminal
information
video
audio
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006205054A
Other languages
English (en)
Other versions
JP2007195136A (ja
Inventor
鑑 豊島
武 井上
仁 上松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006205054A priority Critical patent/JP4425887B2/ja
Publication of JP2007195136A publication Critical patent/JP2007195136A/ja
Application granted granted Critical
Publication of JP4425887B2 publication Critical patent/JP4425887B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、各端末が映像情報および音声情報を相互に交換することによって、参加者が端末を介して会議を行うことができるビデオ会議システムに関する。
従来から、複数の端末が相互通信可能なネットワークに接続され、各端末が映像情報および音声情報を相互に通信することによって、参加者が端末を介して会議を行うことができるビデオ会議システムがある。
ビデオ会議システムには、各端末が、他の端末から音声情報を受信し、それらを個別に処理して他の端末それぞれの音量を算出して音量の比較を行い、その結果、音量の大きな端末を音声入力中であると判断し、その端末から映像を受信し、表示する方法がある(例えば、特許文献1参照)。また、音量の小さな、または、小さくなった端末からの映像については、受信を停止する。このような処理と動作を逐次行うことで、自動的に音声入力状態の端末の映像を表示することができる。
特開2006−005526号公報 IETF RFC 2362 "Flexcastによる段階的導入に優れたマルチキャストシステムの設計と実装", 電子情報通信学会論文誌 D-1, VOL.J88‐D, NO.2 pp272‐291, 2005年.
しかし、特許文献1に記載された映像音声配信方法では、他の端末から送られてくる音声情報から音量を算出する処理(音量算出処理)を各端末が個別に行わなければならず、ビデオ会議システム全体での音量算出処理量が大きいという問題がある。
また、特許文献1に記載された映像音声配信方法では、音量の算出を行うために、音声が符号化された音声情報を受信し、その入力した音声情報を端末毎に復号化することが音量算出処理の前に必要になる。
もし、ビデオ会議システムの端末として市販PC(Personal Computer)をベースマシンとして使用する場合には、複数の端末から入力した符号化された音声情報をミキシングして音声として出力することは可能である。しかし、前記の、入力した音声情報を端末毎に復号化してそれぞれの音量算出処理を行うことは、そのままではできない。このような場合には、これらの機能をPC上に実装しなければならないという問題がある。
そこで、本発明では、ビデオ会議システム全体での音量算出処理量を削減することを目的とする。また、音量を算出するために音声情報を端末毎に復号化することを不要にすることも目的とする。
本発明は、前記課題を解決するために創案されたものであり、請求項1に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムであって、各前記端末が、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、自端末の前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記映像停止要求情報を送信する構成とした。
このような構成によれば、ビデオ会議システムの各端末の処理部が、音声入力部を介して受信した音声信号の音量を算出し、算出した音量に基づいて自端末が音声入力状態か否かを判定し、この判定に基づいた自端末の状態を示す状態情報を他の各端末に送信する。これによって、状態情報を受信した端末は、状態情報に基づいて映像情報の要求を他の各端末に送信し、受信した映像を表示することができる。したがって、音量の算出処理は、音声入力部を介して受信した端末において行えばよく、ビデオ会議システム全体での音量算出処理量を軽減することができると共に、音量を算出するために音声情報を復号化する必要がなくなる。
また、このような構成によれば、ビデオ会議システムの各端末の処理部が、他の端末から判定の結果を受信すると、判定の結果および当該端末の識別情報を、状態情報として自端末の状態情報記憶部に格納し、自端末の状態情報記憶部に格納されている状態情報に基づいて、映像送信要求情報の送信先の端末と映像停止要求情報の送信先の端末とを選択し、選択した端末に映像送信要求情報または映像停止要求情報を送信することが可能である。したがって、状態情報記憶部に他の端末の状態情報を格納しておくことによって、他の端末から送信された状態情報を受信するタイミングが端末によって異なる場合でも、状態情報記憶部に格納された各端末の状態情報を受信すれば、各端末の状態情報に基づいて、映像送信要求情報の送信先の端末と映像停止要求情報の送信先の端末とを選択し、選択した端末に映像送信要求情報または映像停止要求情報を送信し、映像情報を送信させ、また映像情報の送信を停止させることが可能である。
また、請求項2に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムであって、各前記端末が、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、自端末の前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像停止要求情報を送信する構成とした。
このような構成によれば、ビデオ会議システムの各端末の処理部が、他の端末から判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の状態情報記憶部に格納し、状態情報記憶部に格納されている状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末に音声映像送信要求情報または音声映像停止要求情報を送信することが可能である。したがって、状態情報記憶部に他の端末の状態情報を格納しておくことによって、他の端末から送信された状態情報を受信するタイミングが端末によって異なる場合でも、状態情報記憶部に格納された各端末の状態情報を受信すれば、各端末の状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末に音声映像送信要求情報または音声映像停止要求情報を送信し、映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項3に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムであって、各前記端末が、音声を入力する音声入力部と、情報を処理する処理部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、前記複数の端末が、第1の端末群と、第2の端末とを含んで構成され、前記第1の端末群の前記処理部が、前記判定の結果を前記第2の端末に送信し、前記第2の端末が、前記第1の端末群からの状態情報を格納する状態情報記憶部をさらに備え、前記第2の端末の前記処理部が、前記第1の端末群から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として前記第2の端末の前記状態情報記憶部に格納し、前記第2の端末の前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末の識別情報を前記第1の端末群に送信する構成とした。
このような構成によれば、ビデオ会議システムの第1の端末群の処理部が、判定の結果を第2の端末に送信し、第2の端末の処理部が、第1の端末群から判定の結果を受信すると、判定の結果および当該端末の識別情報を、状態情報として第2の端末の状態情報記憶部に格納し、第2の端末の状態情報記憶部に格納されている状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末の識別情報を第1の端末群に送信することが可能である。したがって、端末の識別情報を受信した第1の端末群が、その端末の識別情報によって特定される端末に音声映像送信要求情報または音声映像停止要求情報を送信し、映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項4に記載の発明は、請求項3に記載のビデオ会議システムにおいて、前記第1の端末群の前記処理部が、前記第2の端末から前記音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、当該識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信する構成とした。
このような構成によれば、第1の端末群の処理部が、第2の端末から音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信することが可能である。したがって、端末の識別情報を受信した第1の端末群が、その端末の識別情報によって特定される端末に音声映像送信要求情報または音声映像停止要求情報を送信し、映像情報および音声情報を送信させることが可能である。したがって、端末の識別情報を受信した第1の端末群が、その端末の識別情報によって特定される端末から映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項5に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末であって、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記映像停止要求情報を送信する構成とした。
このような構成によれば、ビデオ会議システムに使用される端末の処理部が、音声入力部を介して受信した音声信号の音量を算出し、算出した音量に基づいて自端末が音声入力状態か否かを判定し、この判定に基づいた自端末の状態を示す状態情報を他の各端末に送信する。これによって、状態情報を受信した端末は、状態情報に基づいて映像情報の要求を他の各端末に送信し、受信した映像を表示することができる。したがって、音量の算出処理は、音声入力部を介して受信した端末において行えばよく、ビデオ会議システム全体での音量算出処理量を軽減することができると共に、音量を算出するために音声情報を復号化する必要がなくなる。
また、請求項6に記載の発明は、請求項5に記載の端末において、映像を入力する映像入力部をさらに備え、前記処理部が、他の前記端末か前記映像送信要求情報を受信すると、前記映像入力部を介して受信した映像信号を符号化し、前記映像送信要求情報の送信元端末に送信し、他の前記端末から前記映像停止要求情報を受信すると、符号化した前記映像信号の前記映像停止要求情報の送信元端末への送信を停止する構成とした。
このような構成によれば、ビデオ会議システムに使用される端末の処理部が、他の端末から映像送信要求情報を受信すると、映像入力部を介して受信した映像信号を符号化し、映像送信要求情報の送信元端末に送信し、他の端末から映像停止要求情報を受信すると、符号化した映像信号の映像停止要求情報の送信元端末への送信を停止することが可能である。したがって、他の端末から映像送信要求情報を受信すると、自端末の映像入力部を介して受信した映像信号を符号化し、映像送信要求情報の送信元端末に送信し、送信元端末に自端末の映像を表示させ、他の端末から映像停止要求情報を受信すると、符号化した映像信号の映像停止要求情報の送信元端末への送信を停止し、送信元端末に自端末の映像の表示を停止させることが可能である。
また、請求項7に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末であって、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像停止要求情報を送信する構成とした。
このような構成によれば、ビデオ会議システムに使用される端末の処理部が、他の端末から判定の結果を受信すると、判定の結果および当該端末の識別情報を、状態情報として自端末の状態情報記憶部に格納し、状態情報記憶部に格納されている状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末に音声映像送信要求情報または音声映像停止要求情報を送信することが可能である。したがって、状態情報記憶部に他の端末の状態情報を格納しておくことによって、他の端末から送信された状態情報を受信するタイミングが端末によって異なる場合でも、状態情報記憶部に格納された各端末の状態情報を受信すれば、各端末の状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末に音声映像送信要求情報または音声映像停止要求情報を送信し、映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項8に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末であって、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末の識別情報を他の前記端末に送信する構成とした。
このような構成によれば、ビデオ会議システムに使用される端末の処理部が、他の端末から判定の結果を受信すると、判定の結果および当該端末の識別情報を、状態情報として自端末の状態情報記憶部に格納し、状態情報記憶部に格納されている状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末の識別情報を他の端末に送信することが可能である。したがって、状態情報記憶部に他の端末の状態情報を格納しておくことによって、他の端末から送信された状態情報を受信するタイミングが端末によって異なる場合でも、状態情報記憶部に格納された各端末の状態情報を受信すれば、各端末の状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末の識別情報を他の端末に送信することができる。また、これによって、端末の識別情報を受信した端末が、その端末の識別情報によって特定される端末に音声映像送信要求情報または音声映像停止要求情報を送信し、映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項9に記載の発明は、請求項8に記載の端末において、前記処理部が、他の前記端末か前記音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、当該識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信する構成とした。
このような構成によれば、ビデオ会議システムに使用される端末の処理部が、他の端末から音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信することが可能である。したがって、受信した端末の識別情報によって特定される端末に映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項10に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末の処理方法であって、前記端末が、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として前記状態情報記憶部に格納し、前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記映像停止要求情報を送信する方法とした。
このような方法によれば、ビデオ会議システムに使用される端末の処理部が、音声入力部を介して受信した音声信号の音量を算出し、算出した音量に基づいて自端末が音声入力状態か否かを判定し、この判定に基づいた自端末の状態を示す状態情報を、他の各端末に送信する。これによって、状態情報を受信した端末は、状態情報に基づいて映像情報の要求を他の各端末に送信し、受信した映像を表示することができる。したがって、音量の算出処理は、音声入力部を介して受信した端末において行えばよく、ビデオ会議システム全体での音量算出処理量を軽減することができると共に、音量を算出するために音声情報を復号化する必要がなくなる。
また、このような方法によれば、端末の処理部が、他の端末から判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の状態情報記憶部に格納し、状態情報記憶部に格納されている状態情報に基づいて、映像送信要求情報の送信先の端末と映像停止要求情報の送信先の端末とを選択し、選択した端末に映像送信要求情報または映像停止要求情報を送信することが可能である。したがって、状態情報記憶部に他の端末の状態情報を格納しておくことによって、他の端末から送信された状態情報を受信するタイミングが端末によって異なる場合でも、状態情報記憶部に格納された各端末の状態情報を受信すれば、各端末の状態情報に基づいて、映像送信要求情報の送信先の端末と映像停止要求情報の送信先の端末とを選択し、選択した端末に映像送信要求情報または映像停止要求情報を送信し、映像情報を送信させ、また映像情報の送信を停止させることが可能である。
また、請求項11に記載の発明は、請求項10に記載の端末の処理方法において、前記端末が、映像を入力する映像入力部をさらに備え、前記処理部が、他の前記端末から前記映像送信要求情報を受信すると、前記映像入力部を介して受信した映像信号を符号化し、前記映像送信要求情報の送信元端末に送信し、他の前記端末から前記映像停止要求情報を受信すると、符号化した前記映像信号の前記映像停止要求情報の送信元端末への送信を停止する方法とした。
このような方法によれば、端末の処理部が、他の端末から映像送信要求情報を受信すると、映像入力部を介して受信した映像信号を符号化し、映像送信要求情報の送信元端末に送信し、他の端末から映像停止要求情報を受信すると、符号化した映像信号の映像停止要求情報の送信元端末への送信を停止することが可能である。したがって、他の端末から映像送信要求情報を受信すると、自端末の映像入力部を介して受信した映像信号を符号化し、映像送信要求情報の送信元端末に送信し、送信元端末に自端末の映像を表示させ、他の端末から映像停止要求情報を受信すると、符号化した映像信号の映像停止要求情報の送信元端末への送信を停止し、送信元端末に自端末の映像の表示を停止させることが可能である。
また、請求項12に記載の発明は、請求項10または請求項11に記載の端末の処理方法において、前記端末が、表示可能な映像数を含む端末選択ルール情報を格納する端末選択ルール情報記憶部をさらに備え、前記処理部が、前記表示可能な映像数を超えない範囲内で、前記映像送信要求情報の送信先の前記端末を選択し、当該選択した端末に前記映像送信要求情報を送信する方法とした。
このような方法によれば、端末の処理部が、表示可能な映像数を超えない範囲内で、映像送信要求情報の送信先の端末を選択し、選択した端末に映像送信要求情報を送信することが可能である。したがって、表示可能な映像数を超えない範囲内で選択された映像送信要求情報の送信先の端末に映像情報を送信させることが可能である。
また、請求項13に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末の処理方法であって、前記端末が、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像停止要求情報を送信する方法とした。
このような方法によれば、端末の処理部が、他の端末から判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の状態情報記憶部に格納し、状態情報記憶部に格納されている状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末に音声映像送信要求情報または音声映像停止要求情報を送信することが可能である。したがって、状態情報記憶部に他の端末の状態情報を格納しておくことによって、他の端末から送信された状態情報を受信するタイミングが端末によって異なる場合でも、状態情報記憶部に格納された各端末の状態情報を受信すれば、各端末の状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末に音声映像送信要求情報または音声映像停止要求情報を送信し、映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項14に記載の発明は、複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末の処理方法であって、前記端末が、音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、前記処理部が、前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末の識別情報を他の前記端末に送信する方法とした。
このような方法によれば、端末の処理部が、他の端末の状態情報を格納する状態情報記憶部をさらに備え、処理部が、他の端末から判定の結果を受信すると、判定の結果および当該端末の識別情報を、状態情報として自端末の状態情報記憶部に格納し、状態情報記憶部に格納されている状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、当該選択した端末の識別情報を他の端末に送信することが可能である。したがって、状態情報記憶部に他の端末の状態情報を格納しておくことによって、他の端末から送信された状態情報を受信するタイミングが端末によって異なる場合でも、状態情報記憶部に格納された各端末の状態情報を受信すれば、各端末の状態情報に基づいて、音声映像送信要求情報の送信先の端末と音声映像停止要求情報の送信先の端末とを選択し、選択した端末の識別情報を他の端末に送信することができる。また、これによって、端末の識別情報を受信した端末が、その端末の識別情報によって特定される端末に音声映像送信要求情報または音声映像停止要求情報を送信し、映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項15に記載の発明は、請求項14に記載の端末の処理方法において、前記処理部が、他の前記端末か前記音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、当該識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信する方法とした。
このような方法によれば、端末の処理部が、他の端末から音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、その識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信することが可能である。したがって、受信した端末の識別情報によって特定される端末に映像情報および音声情報を送信させ、また映像情報および音声情報の送信を停止させることが可能である。
また、請求項16に記載の発明は、請求項10乃至請求項15のいずれか1項に記載の端末の処理方法をコンピュータに実行させるための端末の処理プログラムとした。
このようなプログラムによれば、コンピュータにインストールされて実行される事によって、請求項10乃至請求項15のいずれか1項に記載の端末の処理方法をコンピュータに実行させることが可能である。
本発明によれば、ビデオ会議システム全体での音量算出処理量を軽減することができる。また、音量を算出するために音声情報を復号化する必要がなくなる。その結果、ビデオ会議システムに使用される端末に求められる能力が低くなり、経済性が増すという効果もある。
まず、図11乃至図13を用いて、特許文献1に記載されたビデオ会議システムによる映像音声配信方法の概略について説明する。
図11は、従来技術(特許文献1)におけるビデオ会議システムの概略図である。図11に示すように、複数のビデオ会議端末(端末1〜端末3)が、相互通信可能なネットワーク4に接続されている。このビデオ会議システム(以下、単に「システム」とも呼ぶ)では、端末が相互に音声情報と映像情報を交換し、ビデオ会議を実現する。このシステムの特徴は、映像情報を選択的に交換する点である。各端末は、他の端末から継続的に音声情報を受信する。その音声情報から音量を計算し、音量の大小を比較する。音量が最大である端末を「音声入力状態」である(端末を利用する参加者が発言中である)と判定し(以下、この端末を「音声入力状態の端末」と呼ぶ)、その音声入力状態の端末に映像送信要求情報を送信する。すると、音声入力状態の端末から映像情報が配信され、発言者の映像が映し出される。発言者が変わると、音量が最大である端末も変わるため、映像送信要求情報の送信先が変更され、表示される発言者も切り替わる。
このような方法により、複数の端末1〜端末3は、自動的に発言者の映像を表示することができる。なお、同時に表示する発言者数は複数でもよいが、以下では簡単のために1人を表示するものとして記述する。
図12は、従来技術(特許文献1)におけるビデオ会議システムに使用される端末の機能ブロック図である。
図12に示すように、端末1は、パケット受信部21と、パケット送信部22と、音声入力部23(例えば、マイクなど)と、映像入力部25(例えば、ビデオカメラなど)と、音声復号化部26と、音声出力部27(例えば、スピーカーなど)と、映像復号化部28と、映像表示部29(例えば、ディスプレー装置など)と、映像符号化部30と、情報分別部31’と、音声復号化部32と、音量算出部33と、音量比較部34と、音量情報記憶部35と、映像要求部36と、音声符号化部24とを含んで構成される。
パケット送信部22は、端末1の外部に各種情報を送信する機能を有する。
パケット受信部21は、端末1の外部から送信された各種情報を受信する機能を有する。
音声入力部23は、入力した音声を音声信号として出力する機能を有する。
映像入力部25は、入力した映像を映像信号として出力する機能を有する。
音声復号化部26は、符号化された音声情報を復号して、音声信号を出力する機能を有する。符合化された音声情報が複数の場合には、さらにミキシングを行い、音声信号として出力する。
音声出力部27は、音声信号から音声を出力する機能を有する。
映像復号化部28は、符号化された映像情報を復号化して、映像信号を出力する機能を有する。
映像表示部29は、映像信号から映像を表示する機能を有する。
情報分別部31’は、パケット受信部21を介して受信した各種情報を仕分ける機能を有する。情報分別部31’は、映像情報を受信すると、受信した映像情報を映像復号化部28に出力する。また、情報分別部31’は、音声情報を受信すると、それを音声復号化部26に出力すると同時に、音声復号化部32にも出力する。
音声復号化部32は、情報分別部31’から入力した音声情報を端末毎に復号化して、音量算出部33に出力する。この音量情報の生成処理は、端末数をnとすると、(自分以外の端末の数が(n−1)であることにより)(n−1)回行い、図11に示した構成では算出処理を2回行う。
音量算出部33は、音声復号化部32から入力した、復号化された音声情報に基づいて、音量を表す数値である音量情報を生成し、音量比較部34に出力する。音量情報の単位としては、dB(デシベル)などがあるが、ビデオ会議システム内で統一して音量の大小を表せるものであれば、どのようなものでも使用できる。
音量比較部34は、複数の端末の音量情報を比較し、音声入力状態の端末を特定する。各端末からの音量情報は異なる時刻に到着するため、必要に応じて音量情報記憶部35に格納しておき、比較のときに音量情報記憶部35の音量情報を読み出して用いる。
映像要求部36は、音量比較部34から通知される音声入力状態の端末が変更された場合、新たな音声入力状態の端末に映像送信要求情報を送信する。
音声符号化部24は、音声入力部23を介して受信した音声信号を符号化して音声情報を生成し、パケット送信部22を介して他の各端末へ送信する。
映像符号化部30は、映像入力部25を介して受信した映像信号を符号化して映像情報を生成し、パケット送信部22を介して他の各端末へ送信する。
図13は、従来技術(特許文献1)におけるビデオ会議システムの動作を示すシーケンス図である。
ここでは、端末1での発言者映像の切り替えについて説明する。
なお、図13では、端末1が受信する音声情報と映像情報と、端末1が送信する映像送信要求情報を示し、他の端末が受信する音声情報や映像情報、他の端末が送信する映像送信要求情報などは省略されている。
まず、端末2を利用している参加者が発言しているとする。端末1は、常時、端末2から音声情報を受信し(S901)、この音声情報を基に音量を算出する(S902)と共に、端末3から音声情報を受信し(S903)、この音声情報を基に音量を算出している(S904)。この例では2端末分の音量算出処理を行っているが、端末数をnとすると自分以外の端末の数が(n−1)であることから、端末(n−1)台分の音量算出処理を行うことになる。端末1は、算出された音量を比較し(S905)、例えば、端末2が音声入力状態の端末であると判断すると、端末1は、端末2に映像送信要求情報を送信する(S906)。端末2は、映像送信要求情報を受信すると、端末1に映像情報の送信を開始する(S907)。端末1は映像情報を受信すると、その映像情報を基に映像を表示する(S908)。
続いて、端末2を利用している参加者が発言を終え、端末3を利用している参加者が発言したとする。端末1は、常時、端末2から音声情報を受信して(S909)、音量を算出している(S910)と共に、端末3からも音声情報を受信して(S911)、音量を算出している(S912)ので、ここでも先ほどと同様に、2(=(n−1))端末分の音量算出処理を行なっている。端末1は、算出された音量を比較し(S913)、端末3が音声入力状態の端末であると判断すると、端末3に映像送信要求情報を送信する(S914)。端末3は映像送信要求情報を受信すると、端末1に映像情報の送信を開始する(S915)。端末1は映像情報を受信すると、その映像情報を基に映像を表示する(S916)。以上のように動作するので、自動的に切り替えが行われ、常に音声入力状態の端末の映像が表示される。
なお、端末1が音声入力状態の場合、端末1からは端末2か端末3のどちらか音量の大きい方に映像送信要求情報が送信され、その端末からの映像が端末1に表示され、自画像は表示されない。端末2か端末3には、もちろん端末1の映像が表示される。
≪第1の実施形態≫
次に、第1の実施形態について説明する。第1の実施形態におけるビデオ会議システムの概略図は、図11と同様である。但し、ネットワーク4(図11参照)は、IP(Internet Protocol) MulticastプロトコルやFlexcastプロトコル(非特許文献2)のように、同報に優れた通信方式をサポートしていることが好ましい。そのような構成であれば、効率的に映像情報、音声情報などを複数の端末に同時に分配することが可能となる。以下では、前記プロトコルをサポートしているものとして記述する。
図1は、第1の実施形態におけるビデオ会議システムに使用される端末の機能ブロック図である。
図1に示すように、端末1は、パケット受信部21と、パケット送信部22と、音声入力部23と、映像入力部25と、音声復号化部26と、音声出力部27と、映像復号化部28と、映像表示部29と、映像符号化部30と、情報分別部31と、音量算出部33と、映像要求部36と、音声符号化部24と、端末選択部38と、状態情報記憶部39と、状態判定部40と、端末選択ルール情報記憶部41と、映像符号化部30とを含んで構成される。
図1の端末1は、図12に示した従来技術(特許文献1)におけるビデオ会議システムに使用される端末1と、音声復号化部32、音量比較部34および音量情報記憶部35が存在せず、逆に、端末選択部38、状態情報記憶部39、状態判定部40および端末選択ルール情報記憶部41が存在する点において異なる。
また、パケット受信部21、パケット送信部22、音声入力部23、映像入力部25、音声復号化部26、音声出力部27、映像復号化部28および映像表示部29の機能について、従来技術におけるビデオ会議システムに使用される端末の機能と同様の部分は、説明を省略する。
図3は、第1の実施形態におけるビデオ会議システムに使用される端末のハードウェア構成図である。ビデオ会議システムに使用される端末のハードウェア構成について、適宜図1を参照しながら説明する。
図3に示すように、端末1は、CPU(Central Processing Unit)100と、メモリ200と、記憶部300と、入力装置400と、出力装置500とを含んで構成される。図1に示した端末1内の各機能は、ビデオ会議システムの端末機能を実現するためのソフトウェア(プログラム)が、メモリ200に格納され、CPU100によってそのソフトウェアが実行されることにより実現されるシステムである。なお、CPU100およびメモリ200は、請求項に記載の処理部に相当する。
また、記憶部300は、ハードディスク装置などによって構成され、図1に示した状態情報記憶部39や、端末選択ルール情報記憶部41などを有している。
さらに、入力装置400は、パケット受信部21と、音声入力部23と、映像入力部25とを含んで構成される。例えば、音声入力部23としては、マイクなどがある。映像入力部25としては、ビデオカメラなどがある。
また、出力装置500は、パケット送信部22と、音声出力部27と、映像表示部29とを含んで構成される。音声出力部27としては、スピーカーなどがある。映像表示部29としては、ディスプレー装置などがある。
パケット受信部21およびパケット送信部22は、何らかの通信手段(イーサネット(登録商標)など)を有し、IPパケットを送受信する。
端末が市販PCで実現される場合には、前記の構成要素は、音声入力部23、映像入力部25、音声出力部27および映像表示部29を除いて、専用チップや復号チップなどによって実現される。
図1に戻って、端末1の各機能の説明を続ける。
パケット送信部22は、入力した各情報に情報分別ID(Identification)を付加する。即ち、音声符号化部24から入力した情報には「0」を、状態判定部40から入力した情報には「1」を、映像要求部36から入力した情報には「2」を、映像符号化部30から入力した情報には「3」を、それぞれ情報分別IDとして付加する。さらに、パケット送信部22は、パケット内に、自端末のIDを設定して送信する。ここで、端末IDとしては、例えば、IPアドレスを用いるようにしてもよいし、ビデオ会議システムに参加する端末に割り当てられる識別子などを用いるようにしてもよい。
また、情報分別部31からは、各種情報が端末IDと共に隣接する各機能ブロックに出力される。情報分別部31は、パケット受信部21を介して受信したパケットを、パケットに設定されている情報分別IDにより仕分ける機能を有する。情報分別IDには、例えば、「0:音声情報」「1:状態情報」「2:映像送信要求」「3:映像情報」「4:映像停止要求」などが設定されている。
情報分別部31は、情報分別IDにより音声情報を受信したと判定すると、受信した音声情報を音声復号化部26に出力し、音声復号化部26は各端末からの音声情報をミキシングされた音声信号として音声出力部27に出力し、音声出力部27はそれを音声に再生する。また、同様に、映像情報を受信したと判定すると、映像復号化部28に出力して映像情報を復号化し、映像表示部29は映像を表示する。
なお、発言者が変わったときに、同報に優れた通信方式として、例えばFlexcastプロトコルを使用した場合、少なくとも前発言者の映像情報は、タイムアウトになるまで発言者の端末から送られてくるので、新発言者の端末から送られてくる映像情報と前発言者の端末から送られてくる映像情報との2種類の映像情報が映像復号化部28に入力されることになる。すると、映像復号化部28は、新発言者の端末から送られてくる映像情報を復号化することできず、映像表示部29に新発言者の映像を出力できない。
このような状況を避けるために、端末選択部38の出力する端末選択情報を情報分別部31に入力し、情報分別部31で、選択された端末からの映像情報のみを映像復号化部28に出力する(選択された端末以外からの映像情報は廃棄する)ようにする。もしくは、端末選択部38の出力する端末選択情報を映像復号化部28に入力し、映像復号化部28で、選択された端末からの映像情報のみを復号化する(選択された端末以外からの映像情報は廃棄する)ようにする。
また、情報分別部31は、状態情報を受信すると、受信した状態情報を端末選択部38に出力する。ここで、状態情報とは、端末IDと、その端末の「状態」とを含む情報である。「状態」に関する詳細な説明は後記する。図11に示したようにビデオ会議システムに参加する端末数が3である場合として、音声情報および状態情報がそれぞれ2本の矢印で描いている(受信する音声情報数は、端末数がnのとき(n−1)となるので、この例では、3−1=2本となる)。さらに、情報分別部31は、映像送信要求情報を受信すると、送信要求信号を映像符号化部30に出力する。
端末選択部38は、他の端末から送信された状態情報に基づいて、映像送信要求情報または映像停止要求情報を送信する端末(送信先の端末)を選択する。
まず、端末選択部38は、情報分別部31から各端末の状態情報を受信する。状態情報は端末ごとに異なる時刻に到着するため、「端末ID」とその端末の「状態」を状態情報記憶部39に格納しておく。端末選択部38は、映像を表示する端末の選択時に状態情報記憶部39から読み出して、音声入力状態が変化した端末を選択する(音声入力状態が変化した端末のIDを受信する)「音声入力状態端末選択処理」を実行する。
端末の「状態」としては、例えば、「0:音声入力状態以外」や、「1:音声入力状態」などが考えられる。端末選択部38が状態情報記憶部39を参照して、「0:音声入力状態以外」から「1:音声入力状態」に変化した端末を音声入力状態に変化した端末であると決定する方法などが考えられる。また、この音声入力状態端末選択処理は、例えば、定期的に、または、状態情報を情報分別部31から受信したタイミングで実行する方法などが考えられる。但し、タイミングはこれらに限定されるものではない。
図4は、第1の実施形態におけるビデオ会議システムに使用される端末の状態情報記憶部39に格納される状態情報を示す図である。図4を参照して(適宜図1参照)、状態情報について説明する。ここでは、端末1の状態情報記憶部39に記憶される状態情報を示す。
図4に示すように、端末1の状態情報記憶部39に格納される状態情報390は、端末1以外の端末(端末2および端末3)に関する端末ID391と状態392とを含んでいる。図4の例では、端末2の端末ID391を「2」、端末3の端末ID391を「3」とした場合が示されており、各端末の状態がそれぞれ「0:音声入力状態以外」「1:音声入力状態」であることを示している。
図1に戻って、説明を続ける。
また、端末選択部38は、音声入力状態端末選択処理において音声入力状態に変化した端末であると認定された端末(状態情報記憶部39の状態情報が「0:音声入力状態以外」から「1:音声入力状態」に書き換えられた端末)の端末IDと共に、映像送信要求情報の送信を指示する通知を映像要求部36に出力する。また、端末選択部38は、端末選択ルール情報記憶部41に格納されている端末選択ルール情報(各端末の中から、映像送信要求情報を送信する端末(送信先の端末)を選択するためのルール情報)を参照し、それに基づいて、映像送信要求情報を送信する端末(送信先の端末)を選択し、選択した端末のIDを映像要求部36に出力する「映像送信端末選択処理」を実行することもできる。端末選択ルールについては後記する。なお、この端末選択ルール情報は、ユーザ個々に事前に設定しておくなどの方法により、端末選択ルール情報記憶部41に格納しておく。また、映像送信端末選択処理は、例えば、音声入力状態端末選択処理において音声入力状態に変化した端末が選択された場合や、端末選択ルール情報記憶部に格納されている端末選択ルール情報が変更された場合に実行する方法などが考えられるが、タイミングはこれらに限定されるものではない。
ここで、例えば、端末選択ルール情報として、ユーザが、端末に同時に表示する話者画面の数(端末が同時に表示できる映像数)を設定できる場合について説明する。音声入力状態として状態情報記憶部39に記録されている端末の数をX、端末が同時に表示できる話者場面の数をYとすると、端末選択部38は、以下の判定を行う。
X<YまたはX=Yであると判定した場合、音声入力状態として状態情報記憶部39に記録されている端末のIDをすべて表示可能な端末のIDとする。
X>Yの場合、音声入力状態として状態情報記憶部39に記録されているX個の端末のIDから、Y個の端末のIDを選択し、表示可能な端末のIDとする。X個の端末からY個の端末を選択する方法として、音声入力状態として状態情報記憶部39に記録されている端末のいずれかを表示できればよいのであれば、例えば、端末に割り振られた管理番号(端末ID)の若い順や、その逆順に選択する方法などが考えられる。これによって、表示可能な映像数を超えない範囲内で、映像送信要求情報を送信する端末(送信先の端末)を選択し、選択した端末に映像送信要求情報を送信することができる。
端末選択部38は、選択した端末のIDと共に映像送信要求情報の送信を指示する通知を映像要求部36へ出力する。また、端末選択部38は、映像送信要求情報を送信済みの端末であるか否かに関する情報を端末のIDと対応させて状態情報記憶部39に保存しておき、表示可能な端末のうち、映像送信要求情報が未送信である端末のIDを状態情報記憶部39から受信して、映像送信要求情報の送信を指示する通知と共に映像要求部36へ出力するようにしてもよい。
また、端末選択部38は、受信したパケットにより状態情報記憶部39の状態情報が「1:音声入力状態」から「0:音声入力状態以外」に書き換えられると、該当端末のIDと共に映像停止要求情報の送信を指示する通知を映像要求部36へ送るようにしてもよい。これにより、音声入力状態ではなくなった端末からの映像情報の送信を停止できる。また、端末選択部38は、タイマ機能を有し、状態情報記憶部39の状態が「1:音声入力状態」のまま一定期間以上状態情報を送信しない端末がある場合は、当該端末が音声入力状態ではなくなったと判断して、映像要求部36を介して当該端末に映像停止要求情報を送信するようにしてもよい。その場合、端末選択部38が、一定期間以上状態情報を送信しない端末を音声入力状態以外の端末であると判断することができるので、端末選択部38が「0:音声入力状態以外」を受信する必要がなくなる。即ち、状態判定部40がパケット送信部22を介して「0:音声入力状態以外」を送信する処理は不要となる。また、その場合、受信したパケットにより状態情報記憶部39の状態情報が「1:音声入力状態」から「0:音声入力状態以外」に書き換えられることがなくなるので、端末選択部38は、映像停止要求情報の送信を指示する通知を映像要求部36へ送る処理も不要となる。
映像要求部36は、映像送信要求情報の送信先の端末IDおよび映像送信要求情報の送信を指示する通知を受信すると、映像送信要求情報を生成する。その際に、映像送信要求情報内の情報分別IDに、例えば「2:映像送信要求」を設定する。映像送信要求情報内に映像の送信宛先を示す端末IDを設け、自端末のIDを設定してもよい。映像要求部36は、生成された映像送信要求情報を送信先の端末IDと共にパケット送信部22に出力する。
また、映像要求部36は、映像停止要求情報の送信先の端末IDおよび映像停止要求情報の送信を指示する通知を受信すると、映像停止要求情報を生成する。その際に、映像停止要求情報内の情報分別IDに、例えば「4:映像停止要求」を設定する。映像停止要求情報内の映像の送信宛先を示す端末IDを設け、自端末のIDを設定してもよい。映像要求部36は、生成された映像停止要求情報を送信先の端末IDと共にパケット送信部22に出力する。
音量算出部33は、音声入力部23から入力した音声信号から音量を算出して音量情報を生成し、該音量情報を状態判定部40に出力する。
状態判定部40は、音量算出部33から入力した音量情報に基づいて、自端末が音声入力状態か否かを判定し、この判定結果を含む状態情報を、パケット送信部22を介して他の端末に送信する。状態判定部40は、例えば、音声入力状態と音声入力状態以外との閾値を管理し、音量算出部33から入力した音量がその閾値以上であれば、状態情報に含まれる「状態」を「1:音声入力状態」に、閾値未満の場合は「0:音声入力状態以外」に設定することなどを行う。また、状態情報に情報分別IDとして、例えば「1:状態情報」を設定して付加する。
音声符号化部24は、音声入力部23から入力した音声信号を符号化して音声情報を生成し、パケット送信部22を介して他の端末へ送信する。また、音声情報に情報分別IDとして、例えば「0:音声情報」を設定して付加する。
映像符号化部30は、情報分別部31から、送信端末IDと共に送信要求信号を受信すると、その送信要求信号をトリガとして、映像入力部25から入力した映像信号を符号化して映像情報を作成し、送信端末IDと共にパケット送信部22に出力する。映像符号化部30は、一度送信要求信号を受信すると、予め時間を設定されたタイマがタイムアウトになるか、後記の停止要求信号を受信するまで、映像情報を出力し続ける。
パケット送信部22から出力された映像情報パケットは、図11のネットワーク4を介して、送信要求信号を送信した端末に送られる。
また、映像符号化部30は、情報分別部31から送信端末IDと共に停止要求信号を受信すると、その停止要求信号をトリガとして、映像停止要求情報を送信した端末に映像情報を送信する処理を停止する。
図2は、第1の実施形態におけるビデオ会議システムの動作を示すシーケンス図である。ここでは、端末1での発言者映像の切り替えについて説明する。
なお、図2では、端末1が受信する音声情報、状態情報および映像情報と、端末1が送信する映像送信要求情報を示し、他の端末が受信する音声情報、状態情報、映像情報、他の端末が送信する映像送信要求情報などは省略されている。
まず、端末2を利用している参加者が発言しているとする。端末1は、常時、端末2から音声情報を受信し(S101)、また同時に、S102で端末2によって判定された端末2の状態(「1:音声入力状態」)および端末IDを状態情報として受信する(S103)。また、端末1は、常時、端末3から音声情報を受信し(S104)、S105で端末3によって判定された端末3の状態(「0:音声入力状態以外」)および端末IDを状態情報として受信する(S106)。図2では、音声情報および状態情報を一回ずつしか受信していないように描かれているが、実際には連続する情報を受信している。
端末2および端末3は、音声入力状態であるか否かを示す状態情報を送信するために、図1に示した自端末の音声入力部23から入力される音声信号を基に音量を算出し、閾値と比較して状態を判定する。一つの端末における音声入力状態であるか否かの音量算出処理は、ビデオ会議に参加している端末数nに関係なく、1台分である。
端末1は、端末2および端末3から受信した状態情報に基づいて、映像を受信する端末(映像を送信させる端末)を選択し(S107)、その端末に映像送信要求情報を送信する。ここでは、映像を表示する端末として端末2を選択し、端末1は端末2に映像送信要求情報を送信する(S108)。端末2は、映像送信要求情報を受信すると、映像情報を送信し(S109)、第11図のネットワーク4を介して端末1に届けられる。図2では、映像情報を一つしか送信していないように描かれているが、実際には連続して情報を送信している。端末1は映像情報を受信すると、その映像情報を基に映像を表示する(S110)。
続いて、端末2を利用している参加者が発言を終え、端末3を利用している参加者が発言したとする。端末1は、端末2から音声情報を受信しつつ(S111)、S112で端末2によって判定された端末2の状態(「0:音声入力状態以外」)および端末IDを状態情報として受信する(S113)。また、端末3から音声情報を受信しつつ(S114)、S115で端末3によって判定された端末3の状態(「1:音声入力状態」)および端末IDを状態情報として受信する(S116)。
端末1は、端末2および端末3から受信した状態情報に基づいて、映像を受信する端末(映像を送信させる端末)を選択し(S117)、その端末に映像送信要求情報を送信する。ここでは、映像を表示する端末として端末3を選択し、端末1は端末3に映像送信要求情報を送信する(S118)。端末3は、映像送信要求情報を受信すると、映像情報を送信し(S119)、第11図のネットワーク4を介して端末1に届けられる。
ここで、端末1は、端末2からの映像情報の送信を停止するために、端末2へ映像停止要求情報を送信してもよい。あるいは、タイムアウトなどの機構により、映像情報の送信停止を待ってもよい。図2では、図が煩雑になるのを避けるために、端末2からの映像情報の送信を停止する方法については明記していない。
端末1は映像情報を受信すると、その映像情報を表示する(S120)。
以上のように動作するので、音声入力状態の端末の映像に自動的に切り替えられ、常に発言者の映像が常時される。
ここで、特許文献1に記載されたビデオ会議システムと、第1の実施形態におけるビデオ会議システムの音量算出処理を比較する。
特許文献1に記載されたビデオ会議システムでは、参加者数をnとすると、各端末は他の端末から送られる(n−1)台分の音声情報に対して音量算出処理を行う。このため、ビデオ会議システム全体での音量算出処理量は、(n−1)×n台分となる。
一方、第1の実施形態におけるビデオ会議システムでは、各端末は自端末に入力される音声情報に対してのみ音量を算出すればよいため、ビデオ会議システム全体での音量算出処理量は、n台分となる。
なお、第1の実施形態におけるビデオ会議システムでは、状態情報を他の端末に配信する必要があるが、状態情報は数値情報であり、情報量が少ないため、システムに大きな負荷をかけることはない。
また、図1において、状態判定部40は、パケット送信部22を介して自端末宛に状態情報を送信し、パケット受信部21を介して受信してもよい。その場合、受信された自端末の状態情報は、状態情報記憶部39に格納され、端末選択部38によって他の端末の状態情報と同様に処理される。また、状態判定部40は、自端末の状態情報を端末選択部38に直接出力するようにしてもよい。その場合も、自端末の状態情報は、状態情報記憶部39に格納され、端末選択部38によって他の端末の状態情報と同様に処理される。
≪第2の実施形態≫
次に、第2の実施形態について説明する。
第1の実施形態では、各端末が音声情報を常時相互に送り合っていたが、第2の実施形態では、音声情報を相互に送り合うことはせず、音声入力の状態情報のみを相互に送り合う。各端末は、他の端末から送られてきた音声入力の状態情報に基づいて、音声が入力中の端末(音声入力状態端末)を選択し、その端末に対して音声と映像の送信要求(以下、音声映像送信要求)を送信し、選択された端末からの音声と映像の情報を受信する点において、第1の実施形態と異なる。
以下では、第1の実施形態と同等の部分については、第1の実施形態における構成要素と同一の符号(記号)を付し、説明を省略する。第2の実施形態におけるビデオ会議システムの概略図は、図11に示す通りである。
図5は、第2の実施形態におけるビデオ会議システムに使用される端末の機能ブロック図である。
端末選択部38Aは、音声入力状態端末選択処理において音声入力状態に変化した端末を選択し、その端末のIDと共に音声映像送信要求情報の送信を指示する通知を音声映像要求部42に出力する。このときの音声入力状態端末選択処理は、第1の実施形態と同様である。また、第1の実施形態と同様に、端末選択部38Aは、受信した状態情報により状態情報記憶部39内のある端末の状態が「1:音声入力状態」から「0:音声入力状態以外」に書き換えられると、該当端末のIDと共に音声映像停止要求情報の送信を指示する通知を音声映像要求部42へ出力するようにしてもよい。
音声映像要求部42は、送信先となる端末のIDと共に音声映像送信要求情報の送信を指示する通知を入力されると、送信先となる端末のIDと共に音声映像送信要求情報を、パケット送信部22に出力する。また、音声映像要求部42は、送信先となる端末のIDと共に音声映像停止要求情報の送信を指示されると、送信先となる端末のIDと共に音声映像停止要求情報を、パケット送信部22に出力する。
パケット送信部22は、少なくとも、入力された情報に自端末のIDを設定して音声映像送信要求情報、または、音声映像停止要求情報のパケットを作成し、送信先となる端末に向けて送信する。
パケット受信部21は、音声映像送信要求情報のパケットを受信すると、その情報(少なくとも、音声映像送信要求と、該要求を送信してきた端末のID)を情報分別部31Aに出力する。同様に、パケット受信部21は、音声映像停止要求情報のパケットを受信すると、その情報(少なくとも、音声映像停止要求と、該要求を送信してきた端末のID)を情報分別部31Aに出力する。
情報分別部31Aは、音声映像送信要求情報を受信すると、送信要求信号を送信端末IDと共に映像符号化部30に出力すると同時に、音声符号化部24Aにも同様に出力する。また、情報分別部31Aは、音声映像停止要求情報を受信すると、停止要求信号を送信端末IDと共に映像符号化部30に出力すると同時に、音声符号化部24Aにも同様に出力する。なお、映像符号化部30が送信要求信号および停止要求信号を受信した際の処理は、第1の実施形態における映像送信要求情報および映像停止要求情報をそれぞれ受信した際の処理と同様である。
音声符号化部24Aは、情報分別部31Aから、送信端末IDと共に音声映像送信要求情報を受信すると、その音声映像送信要求情報をトリガとして、音声入力部23から入力した音声信号を符号化して音声情報を作成し、送信端末IDと共にパケット送信部22に出力する。音声符号化部24Aは、一度音声映像送信要求情報を受信すると、予め時間を設定されたタイマがタイムアウトになるか、後記の停止要求信号を受信するまで、音声情報を出力し続ける。
パケット送信部22から出力された音声情報パケットは、図11のネットワーク4を介して、音声映像送信要求情報を送信した端末に送られる。
また、音声符号化部24Aは情報分別部31Aから、送信端末IDと共に停止要求信号を受信すると、その停止要求信号をトリガとして、音声映像停止要求情報の送信元の端末に音声情報を送信する処理を停止する。
図6は、第2の実施形態におけるビデオ会議システムの動作を示すシーケンス図である。ここでは、端末1での発言者映像の切り替えについて説明する。
なお、図6では、端末1Aが受信する音声情報、状態情報および映像情報と、端末1Aが送信する音声映像送信要求情報を示し、他の端末が受信する音声情報、状態情報、映像情報、他の端末が送信する音声映像送信要求情報などは省略されている。
まず、端末2Aを利用している参加者が発言しているとする。端末1Aは、S201で端末2Aによって判定された端末2Aの状態(「1:音声入力状態」)および端末IDを状態情報として常時受信している(S202)。また、端末1Aは、S203で端末3Aによって判定された端末3Aの状態(「0:音声入力状態以外」)および端末IDを状態情報として常時受信している(S204)。
端末1Aは、端末2Aおよび端末3Aから受信した状態情報に基づいて音声映像送信を開始させる端末を選択し(S205)、その端末に音声映像送信要求情報を送信する。ここでは、端末2Aが音声映像送信を開始させる端末であると判定し、端末1Aは、端末2Aに音声映像送信要求情報を送信する(S206)。端末2Aは音声映像送信要求情報を受信すると、端末1Aに音声と映像の情報の送信を開始し(S207とS209)、端末1Aはその音声情報と映像情報を受信して、音声を出力し(S208)、映像を表示する(S210)。
続いて、端末2Aを利用している参加者が発言を終え、端末3Aを利用している参加者が発言したとする。端末1Aは、S211で端末2Aによって判定された端末2Aの状態(「0:音声入力状態以外」)および端末IDを状態情報として受信する(S212)。また、ほぼ同時に、端末1Aは、S213で端末3Aによって判定された端末3Aの状態(「1:音声入力状態」)および端末IDを状態情報として受信する(S214)。
端末1Aは、端末2Aおよび端末3Aから受信した状態情報に基づいて、発言者の音声と映像を送信してもらう端末を選択し(S215)、その端末に音声映像送信要求情報を送信する。ここでは、端末3Aが発言者の音声と映像を送信してもらう端末であると選択され、端末1Aは、端末3Aに音声映像送信要求情報を送信する(S216)。端末3Aは音声映像送信要求情報を受信すると、端末1Aに音声情報と映像情報の送信を開始し(S217とS219)、端末1Aはその音声情報と映像情報を受信して、音声を出力し(S218)、映像を表示する(S220)。
なお、本実施形態では、音声情報と映像情報が別々に送られるように記述しているが、MPEG2エンコード(Moving Picture Experts Group 2 encode)のように、音声情報と映像情報が一つのパケットに詰められて送られる場合もあり、そのような場合には、S207とS209、および、S217とS219は一本の矢印で表示される。
第2の実施形態によれば、他の端末から受信した状態情報に基づいて、発言者の音声と映像を表示する端末を選択し、その端末に音声映像送信要求情報を送信するため、不要な映像情報および音声情報がネットワーク4(図11参照)内を流れることがなくなり、ビデオ会議システムにかかる負荷を低減することができる。
≪第3の実施形態≫
次に、第3の実施形態について説明する。第3の実施形態は、ビデオ会議システムを構成する複数の端末のうち少なくとも1台が、ビデオ会議システムを構成する各端末から状態情報を受信して、音声映像送信要求情報の送信先の端末を選択する処理を代表して行う点が異なる。
このため、本実施形態では、各端末の状態情報が主催者端末に送られる。また、主催者端末で選択された端末の情報(端末IDなど)が各端末に配信される点において、第2の実施形態と異なる。それ以外の構成については、第2の実施形態における構成と同一で、それらに同一の符号(記号)を付け、説明を省略する。第3の実施形態におけるビデオ会議システムの概略図を、図11に示す。また、ビデオ会議システムを構成する複数の端末のうち、代表して行う処理を実行する端末を、主にビデオ会議を主催する者が使用すると考えられることから、以下では「主催者端末」と呼ぶことにする。また、それ以外の端末は、主にビデオ会議に参加する者が使用すると考えられることから、以下では「参加者端末」と呼ぶことにする。
本実施形態では、主催者端末は端末1で、端末2と端末3が参加者端末であるとして説明するが、全ての端末に主催者端末と参加者端末の両方の機能を具備しておき、会議が開催される毎に、どれか一つの端末が主催者端末となり、残りの端末が参加者端末となるようにしてもよい。
図7は、第3の実施形態におけるビデオ会議システムに使用される主催者端末の機能ブロック図である。
状態判定部40Aは、音量算出部33から入力した音量情報に基づいて、自端末が音声入力状態か否かを判定し、この判定結果を含む状態情報を予め設定された主催者端末IDと共にパケット送信部22に出力し、パケット送信部22は該入力情報をパケット化し、自身の主催者端末1Bに向けて出力する。端末1がOS(Operating System)(Linux(登録商標)やWindows(登録商標)など)内でIPパケットの送受信処理を行っている場合には、ループバックデバイスなどにより、該IPパケットはパケット送信部22から端末外部に出力されることなくパケット受信部21に入力される。IPパケット処理を行うインターフェイス機能によっては、IPパケットはパケット送信部22から一度ネットワーク4(図11参照)に出力され、そこを経由して、自身の主催者端末1Bのパケット受信部21に受信される場合もあり得る。
各端末から送られてきた状態情報は、以下、第2の実施形態と同様に、情報分別部31Bから端末選択部38Bに送られる。
端末選択部38Bは、音声と映像を要求する端末(音声映像送信要求情報の送信先の端末)を選択し、選択された音声映像送信要求情報の送信先の端末の端末IDを端末選択情報としてパケット送信部22に出力する。端末の選択方法については、端末選択部38Aによる選択方法と同様である。
パケット送信部22に入力された端末選択情報は、パケット化されて各端末に送られる。該端末選択情報が主催者端末1Bのパケット受信部21に入力される経路は、前記の状態情報の場合と同様である。
また、情報分別部31Bは、パケット受信部21から端末選択情報を受信すると、受信した端末選択情報を音声映像要求部42に出力する。音声映像要求部42は、音声映像要求を送信先端末IDと共にパケット送信部22に出力する。パケット送信部22に入力された音声映像要求情報は、パケット化されて送信先端末IDで示された端末に送られる。
図8は、第3の実施形態におけるビデオ会議システムに使用される参加者端末の機能ブロック図である。ここでは、図7を用いて説明した主催者端末と構成が異なる点についてのみ説明し、説明しない部分については、図7と同様である。
参加者端末2Bは、図7に示した主催者端末1Bから端末選択部38B、状態情報記憶部39および端末選択ルール情報記憶部41を削除した構成となっている。これは、ビデオ会議システムを構成する各端末が、主催者端末1Bに状態情報を送信し、この主催者端末1Bが代表して端末選択処理を実行するためである。
情報分別部31Cは、パケット受信部21から送られた各種情報を情報IDにより分別してそれぞれの機能ブロックに出力するが、参加者端末2Bには端末選択部38Bがないため、情報分別部31Cには状態情報を分別する機能は不要である。その他の機能については、主催者端末1Bの情報分別部31B(図7参照)と同様である。但し、図7に示した主催者端末1Bの情報分別部31Bと同様の機能を持っていても動作に支障はない。(情報分別部31、情報分別部31Bならびに情報分別部31Cは、出力先が設定されていない情報については廃棄する。)
このように、参加者端末2Bは主催者端末1Bから一部の機能を削除したものとなっているため、一つの端末が主催者端末と参加者端末の両方の機能を具備することは容易であり、会議開催毎に主催者端末を変更することも容易にできる。以下、端末1が主催者端末となっている場合で説明を続ける。
図9は、第3の実施形態におけるビデオ会議システムの動作を示すシーケンス図である。図9を参照して、第3の実施形態におけるビデオ会議システムの処理の流れについて説明する。説明は、主催者端末1Bを中心に行う。
参加者端末2Bを利用している参加者が発言しているとする。主催者端末1Bは、S301で参加者端末2Bによって判定された参加者端末2Bの状態(「1:音声入力状態」)および端末IDを状態情報として常時受信している(S302)。また、主催者端末1Bは、S303で主催者端末1Bによって判定された主催者端末1Bの状態(「0:音声入力状態以外」)および端末IDを状態情報として常時受信している(S304)。さらに、主催者端末1Bは、S305で参加者端末3Bによって判定された参加者端末3Bの状態(「0:音声入力状態以外」)および端末IDを状態情報として常時受信している(S306)。
主催者端末1Bは、参加者端末2Bと主催者端末1Bと参加者端末3Bから受信した状態情報に基づいて、音声映像送信を開始させる端末を選択する(S307)。ここでは、参加者端末2Bが音声映像送信を開始させる端末であると判定し、端末選択情報には参加者端末2Bの端末IDが設定される。
主催者端末1Bは、端末選択情報を、参加者端末2Bと主催者端末1Bと参加者端末3Bとに送信する(S308、S309およびS310)。具体的送信方法として、主催者端末1Bから各端末それぞれに送ることも可能であるし、図11のネットワーク4にマルチキャスト機能がある場合には、それを使って主催者端末1Bからマルチキャスト的に送ることも可能である。
端末選択情報を受信した参加者端末2Bと主催者端末1Bと参加者端末3Bとは、受信した端末選択情報に設定されている端末IDによって、音声映像送信要求情報の送信先の端末が参加者端末2Bであることを知り、参加者端末2Bに音声映像送信要求情報を送信する(S311、S312およびS313)。
参加者端末2Bは、参加者端末2Bと主催者端末1Bと参加者端末3Bから音声映像送信要求情報を受信すると、参加者端末2Bと主催者端末1Bと参加者端末3Bに向けて音声映像情報の送信を開始する。具体的送信方法として、前記と同様に、図11のネットワーク4にマルチキャスト機能がある場合には、それを使って参加者端末2Bから各端末それぞれにマルチキャスト的に送ることも可能であるし、ユニキャスト的に送ることも可能である。
参加者端末2Bは、他の端末と同様に、自端末宛に送られてきた音声情報と映像情報を受信し(S314とS316)、受信した音声情報を基に音声を出力し(S315)、受信した映像情報を基に映像を表示する(S317)。また、同様に、主催者端末1Bも、送られてきた音声情報と映像情報を受信し(S318とS320)、受信した音声情報を基に音声を出力し(S319)、受信した映像情報を基に映像を表示する(S321)。同様に、参加者端末3Bも、送られてきた音声情報と映像情報を受信し(S322とS324)、受信した音声情報を基に音声を出力し(S323)、受信した映像情報を基に映像を表示する(S325)。
以上のような処理により、主催者端末1Bが、音声入力状態にある端末として参加者端末2Bを選択し、その選択した端末のIDを主催者端末1B、参加者端末2Bおよび参加者端末3Bに通知することによって、主催者端末1B、参加者端末2Bおよび参加者端末3Bにおいて、参加者端末2Bの音声および映像を再生することができる。
以上において説明したように、第3の実施形態によれば、ビデオ会議システムを構成する複数の端末において、再生される映像および音声を統一することが可能である。各端末での画面構成が統一されることによって、会議をより円滑に運営することが可能になる。さらに、各端末は、状態情報を主催者端末にのみ送信すればよいので、ネットワーク4(図11参照)を通過するパケットのトラヒックを低減することができる。なお、本実施形態においては、各端末が主催者端末に、発言に関する状態情報を送信する構成としたが、各端末が主催者端末に、状態情報の代わりに音声情報を送信し、主催者端末が、受信した音声情報に基づいて音声入力状態にある端末を選択する構成とすることも可能である。
≪第3の実施形態の変形例≫
次に、第3の実施形態の変形例について説明する。第3の実施形態の変形例は、主催者端末が自端末の状態情報を、パケット送信部22を介して自端末に送信せずに、自端末内で端末選択部に直接出力する点において、第3の実施形態と異なる。それ以外の構成については、第3の実施形態における構成と同一の符号(記号)を付し、説明を省略する。
図10は、第3の実施形態の変形例におけるビデオ会議システムに使用される主催者端末の機能ブロック図である。
状態判定部40Bは、音量算出部33から入力した音量情報に基づいて、自端末が音声入力状態か否かを判定し、この判定結果を含む状態情報を、端末選択部38Bに出力する。このような構成によって、主催者端末1Cでは、自端末の状態情報を、パケット送信部22、パケット受信部21および情報分別部31Bで処理することが不要となり、自端末の状態情報のパケットが端末の外に一旦出力される場合には、ネットワーク4(図11参照)を通過するパケットのトラヒックも低減される。
また、ここで述べた変形例は、第1の実施形態および第2の実施形態でも行うことができる。即ち、状態判定部40の出力信号を直接端末選択部38に入力する構成である。この場合の端末選択部は、状態判定部40から直接入力された状態情報を含めて端末選択を行う処理が必要とされるが、自端末が選択された場合、自端末の映像を表示することができる。
さらに、以上述べた種々の実施形態および変形例で、各端末が他の端末に情報を要求して入手するPull型の仕組みで説明したものは、技術的不都合が生じない範囲内において、Push型で配信する方法でも実現でき、また、逆に、各端末が他の端末に情報を送信するPush型の仕組みで説明したものを、Pull型で入手する方法でも実現でき、自由に組み合わせることが可能である。
例えば、第3の実施形態またはその変形例において、各端末が音声情報および映像情報をPull型で受信するようにしたが、第1の実施形態において説明したように、各端末が映像情報をPull型で受信し、音声情報をPush型で受信するように構成することも可能である。
第1の実施形態におけるビデオ会議システムに使用される端末の機能ブロック図である。 第1の実施形態におけるビデオ会議システムの動作を示すシーケンス図である。 第1の実施形態におけるビデオ会議システムに使用される端末のハードウェア構成図である。 第1の実施形態におけるビデオ会議システムに使用される端末の状態情報記憶部に格納される状態情報を示す図である。 第2の実施形態におけるビデオ会議システムに使用される端末の機能ブロック図である。 第2の実施形態におけるビデオ会議システムの動作を示すシーケンス図である。 第3の実施形態におけるビデオ会議システムに使用される主催者端末の機能ブロック図である。 第3の実施形態におけるビデオ会議システムに使用される参加者端末の機能ブロック図である。 第3の実施形態におけるビデオ会議システムの動作を示すシーケンス図である。 第3の実施形態の変形例におけるビデオ会議システムに使用される主催者端末の機能ブロック図である。 従来技術および本実施形態におけるビデオ会議システムの概略図である。 従来技術におけるビデオ会議システムに使用される端末の機能ブロック図である。 従来技術におけるビデオ会議システムの動作を示すシーケンス図である。
符号の説明
1〜3 端末
4 ネットワーク
21 パケット受信部
22 パケット送信部
23 音声入力部
24 音声符号化部
25 映像入力部
26 音声復号化部
27 音声出力部
28 映像復号化部
29 映像表示部
30 映像符号化部
31 情報分別部
32 音声復号化部
33 音量算出部
34 音量比較部
35 音量情報記憶部
36 映像要求部
38 端末選択部
39 状態情報記憶部
40 状態判定部
41 端末選択ルール情報記憶部
42 音声映像要求部

Claims (16)

  1. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムであって、
    各前記端末は、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    自端末の前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記映像停止要求情報を送信する
    ことを特徴とするビデオ会議システム。
  2. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムであって、
    各前記端末は、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    自端末の前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像停止要求情報を送信する
    ことを特徴とするビデオ会議システム。
  3. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムであって、
    各前記端末は、
    音声を入力する音声入力部と、情報を処理する処理部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    前記複数の端末は、
    第1の端末群と、第2の端末とを含んで構成され、
    前記第1の端末群の前記処理部は、
    前記判定の結果を前記第2の端末に送信し、
    前記第2の端末は、
    前記第1の端末群からの状態情報を格納する状態情報記憶部をさらに備え、
    前記第2の端末の前記処理部は、
    前記第1の端末群から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として前記第2の端末の前記状態情報記憶部に格納し、
    前記第2の端末の前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末の識別情報を前記第1の端末群に送信する
    ことを特徴とするビデオ会議システム。
  4. 前記第1の端末群の前記処理部は、
    前記第2の端末から前記音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、当該識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信する
    ことを特徴とする請求項3に記載のビデオ会議システム。
  5. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末であって、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記映像停止要求情報を送信する
    ことを特徴とする端末。
  6. 映像を入力する映像入力部をさらに備え、
    前記処理部は、
    他の前記端末か前記映像送信要求情報を受信すると、前記映像入力部を介して受信した映像信号を符号化し、前記映像送信要求情報の送信元端末に送信し、他の前記端末から前記映像停止要求情報を受信すると、符号化した前記映像信号の前記映像停止要求情報の送信元端末への送信を停止する
    ことを特徴とする請求項5に記載の端末。
  7. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末であって、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像停止要求情報を送信する
    ことを特徴とする端末。
  8. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末であって、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末の識別情報を他の前記端末に送信する
    ことを特徴とする端末。
  9. 前記処理部は、
    他の前記端末か前記音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、当該識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信する
    ことを特徴とする請求項8に記載の端末。
  10. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末の処理方法であって、
    前記端末は、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記映像停止要求情報を送信する
    ことを特徴とする端末の処理方法。
  11. 前記端末は、
    映像を入力する映像入力部をさらに備え、
    前記処理部は、
    他の前記端末から前記映像送信要求情報を受信すると、前記映像入力部を介して受信した映像信号を符号化し、前記映像送信要求情報の送信元端末に送信し、他の前記端末から前記映像停止要求情報を受信すると、符号化した前記映像信号の前記映像停止要求情報の送信元端末への送信を停止する
    ことを特徴とする請求項10に記載の端末の処理方法。
  12. 前記端末は、
    表示可能な映像数を含む端末選択ルール情報を格納する端末選択ルール情報記憶部をさらに備え、
    前記処理部は、
    前記表示可能な映像数を超えない範囲内で、前記映像送信要求情報の送信先の前記端末を選択し、当該選択した端末に前記映像送信要求情報を送信する
    ことを特徴とする請求項10または請求項11に記載の端末の処理方法。
  13. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末の処理方法であって、
    前記端末は、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像送信要求情報を送信し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末に前記音声映像停止要求情報を送信する
    ことを特徴とする端末の処理方法。
  14. 複数の端末が相互通信可能なネットワークに接続され、各前記端末が映像情報および音声情報を相互に通信可能なビデオ会議システムに使用される端末の処理方法であって、
    前記端末は、
    音声を入力する音声入力部と、情報を処理する処理部と、他の前記端末の状態情報を格納する状態情報記憶部とを備え、
    前記処理部は、
    前記音声入力部を介して受信した音声信号の音量を算出し、当該算出した音量が所定の閾値以上である場合に、自端末が音声入力状態であると判定し、当該算出した音量が所定の閾値未満である場合に、自端末が音声入力状態以外であると判定し、当該判定の結果を他の前記端末に送信し、
    他の前記端末から前記判定の結果を受信すると、当該判定の結果および当該端末の識別情報を、状態情報として自端末の前記状態情報記憶部に格納し、
    前記状態情報記憶部に格納されている前記状態情報に基づいて、他の前記端末のうち音声入力状態になった端末の中から音声映像送信要求情報の送信先の端末を選択し、他の前記端末のうち音声入力状態以外になった端末の中から音声映像停止要求情報の送信先の端末を選択し、当該選択した端末の識別情報を他の前記端末に送信する
    ことを特徴とする端末の処理方法。
  15. 前記処理部は、
    他の前記端末か前記音声映像送信要求情報または音声映像停止要求情報の送信先の端末の識別情報を受信すると、当該識別情報によって識別される端末に音声映像送信要求情報または音声映像停止要求情報を送信する
    ことを特徴とする請求項14に記載の端末の処理方法。
  16. 請求項10乃至請求項15のいずれか1項に記載の端末の処理方法をコンピュータに実行させるための端末の処理プログラム。
JP2006205054A 2005-12-20 2006-07-27 ビデオ会議システム、ビデオ会議システムに使用される端末、端末の処理方法、そのプログラム Active JP4425887B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006205054A JP4425887B2 (ja) 2005-12-20 2006-07-27 ビデオ会議システム、ビデオ会議システムに使用される端末、端末の処理方法、そのプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005367287 2005-12-20
JP2006205054A JP4425887B2 (ja) 2005-12-20 2006-07-27 ビデオ会議システム、ビデオ会議システムに使用される端末、端末の処理方法、そのプログラム

Publications (2)

Publication Number Publication Date
JP2007195136A JP2007195136A (ja) 2007-08-02
JP4425887B2 true JP4425887B2 (ja) 2010-03-03

Family

ID=38450436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006205054A Active JP4425887B2 (ja) 2005-12-20 2006-07-27 ビデオ会議システム、ビデオ会議システムに使用される端末、端末の処理方法、そのプログラム

Country Status (1)

Country Link
JP (1) JP4425887B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363809B2 (en) 2007-10-26 2013-01-29 Panasonic Corporation Teleconference terminal apparatus, relaying apparatus, and teleconferencing system
JP5942364B2 (ja) * 2011-03-31 2016-06-29 株式会社リコー 伝送管理システム、伝送システム、及びプログラム
CN108924465B (zh) * 2018-06-26 2021-02-09 广州视源电子科技股份有限公司 视频会议发言人终端的确定方法、装置、设备和存储介质

Also Published As

Publication number Publication date
JP2007195136A (ja) 2007-08-02

Similar Documents

Publication Publication Date Title
JP5781441B2 (ja) マルチビットレートストリームを使用するビデオ会議のサブスクリプション
EP1860841B1 (en) Method and system for replacing media stream in a communication process of a terminal
AU2017254981A1 (en) Reduced latency server-mediated audio-video communication
JP6172610B2 (ja) テレビ会議用システム
JP2005269347A (ja) Ipネットワークを用いた多地点会議システムとその構成方法
US10079867B2 (en) Apparatus, system, and method of controlling output of content data, and recording medium
CN108055497B (zh) 一种会议信号播放方法和装置、视频会议终端、移动设备
JP6269610B2 (ja) 情報処理装置、画像表示方法、通信システム、プログラム
JP4331049B2 (ja) データ伝送装置およびデータ伝送方法
US20180270452A1 (en) Multi-point connection control apparatus and method for video conference service
WO2014154065A2 (zh) 传输数据方法、媒体采集设备、视频会议终端及存储介质
JP2019149661A (ja) テレビ会議装置
JP2004146913A (ja) テレビ会議システム及びそれに用いる端末、接続制御方法並びに接続制御プログラム
CN113542660A (zh) 一种实现会议多画面高清显示的方法、系统及存储介质
CN112099750A (zh) 一种屏幕共享方法、终端、计算机存储介质以及系统
JP4425887B2 (ja) ビデオ会議システム、ビデオ会議システムに使用される端末、端末の処理方法、そのプログラム
JP2008288974A (ja) ビデオ会議システム及びビデオ会議装置
US11943073B2 (en) Multiple grouping for immersive teleconferencing and telepresence
CN111803924A (zh) 云游戏的多终端同步显示方法、装置及可读存储介质
CN116320514A (zh) 一种音视频会议直播的方法、系统、电子设备和介质
KR20220137938A (ko) 원격 단말용 원격 회의 및 텔레프레즌스를 위한 다중 오디오 믹싱 이득을 시그널링하기 위한 기술
JP7232846B2 (ja) ボイスチャット装置、ボイスチャット方法及びプログラム
JP5086366B2 (ja) 会議端末装置、中継装置、および会議システム
JP2009089156A (ja) 配信システムおよび配信方法
JP6481937B2 (ja) テレビ会議用通信装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090508

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090721

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091020

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091127

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091209

R150 Certificate of patent or registration of utility model

Ref document number: 4425887

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131218

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350