JPH11177952A - ビデオ会議装置 - Google Patents

ビデオ会議装置

Info

Publication number
JPH11177952A
JPH11177952A JP9341450A JP34145097A JPH11177952A JP H11177952 A JPH11177952 A JP H11177952A JP 9341450 A JP9341450 A JP 9341450A JP 34145097 A JP34145097 A JP 34145097A JP H11177952 A JPH11177952 A JP H11177952A
Authority
JP
Japan
Prior art keywords
data
audio data
audio
header information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9341450A
Other languages
English (en)
Other versions
JP3031320B2 (ja
Inventor
Mikio Sugiyama
実輝雄 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9341450A priority Critical patent/JP3031320B2/ja
Publication of JPH11177952A publication Critical patent/JPH11177952A/ja
Application granted granted Critical
Publication of JP3031320B2 publication Critical patent/JP3031320B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 複数の端末が参加するビデオ会議において、
発言者を効果的に表示することができ、しかも画像デー
タが必要でない場合、画像データの処理を行わず、CP
U及びネットワークの負荷を抑えることができるビデオ
会議装置の提供。 【解決手段】 音声データ処理手段122は、音声デー
タの送信の際には、音声データヘッダ情報格納部124
に格納されたヘッダ情報を音声データに付加して送信
し、また受信した音声データからヘッダ情報を取得し、
音声データヘッダ情報格納部124に格納する。表示制
御手段127は音声データヘッダ情報格納部124に格
納されたヘッダ情報にしたがって画像データを表示装置
116に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワークに接
続され、音声データ、画像データ、テキストデータ等の
送受信を行うことのできるビデオ会議装置に関する。
【0002】
【従来の技術】近年、電話回線、LAN等のネットワー
クに接続されたパーソナルコンピュータやビデオ会議端
末を使い、お互いの顔を見ながら話をしたり、アプリケ
ーションソフトウェアやホワイトボード等でデータを共
有する機能を有し、テキストデータ、グラフィックスデ
ータ、音声データ、および画像データ等をリアルタイム
にやりとりすることができるビデオ会議装置が実用化さ
れている。これらのビデオ会議装置は、カメラ等の画像
入力装置が接続され、ビデオ会議参加者や会議資料等を
撮影することができ、撮影した動画像データもしくは画
像データを表示することができる。
【0003】従来、この種のビデオ会議装置は、例えば
特開平7−107451号公報に記載されている。この
公報に記載されているビデオ会議装置は、テレビ会議に
おける発言者を特定することを可能にし、会議の進行を
円滑にし、混乱の発生を未然に防ぐことのできるビデオ
会議装置を提供することを目的としている。
【0004】図9は、この公報に記載された実施例のブ
ロック図である。図9に示すように、会議の模様を撮影
するカメラ201と、受信した映像を画面に表示するモ
ニタ202と、送信する画像信号を符号化すると共に受
信した画像信号を復号化する画像信号符号化/復号化部
203と、受信した音声信号を復号化すると共に復号化
した音声信号を増幅する受信音声増幅回路を含む音声信
号復号化部206と、音声信号を音声に変えて出力する
スピーカ204と、音声信号を入力するマイクロホン2
09と、入力音声信号を符号化する音声信号符号化部2
10と、画像信号、音声信号、データおよび会議制御信
号を多重/分離する多重化/分離部211と、通信回線
213とのインターフェイスを取る通信インターフェイ
ス212とを備え、音声に変えて出力するスピーカ通信
相手先の出席者の氏名および発言者の音声を登録する通
信相手先情報記憶部208と、通信相手先情報記憶部2
08における登録を制御すると共にこの登録に基づいて
発言者を特定する通信相手先認識部207と、特定され
た発言者の氏名をモニタ202に表示する通信相手先表
示部205とを備えている。
【0005】この画像通信端末装置では、相手先から送
られてきた信号は、多重化/分離部211で画像信号、
音声信号、データおよび会議制御信号に分離され、この
内、画像信号は、画像信号符号化/復号化部203で復
号された後、通信相手先表示部205を経てモニタ20
2に送られ、モニタの画面に相手先の映像を映し出す。
また、音声信号は、音声信号復号化部206で復号化・
増幅された後、スピーカ204に送られ音声として出力
される。音声信号は、同時に通信相手先情報記憶部20
8および通信相手先認識部207に送られる。
【0006】通信相手先情報記憶部208は、不揮発性
メモリ(EEPROM等)で構成され、音声信号が入力
したとき、通信相手先認識部207からの指示がある場
合には、入力した音声データを格納する。また、通信相
手先情報記憶部208は、別に入力された相手先の会議
出席者の氏名を音声データと関連付けて記憶する。
【0007】通信相手先認識部207は、音声信号が入
力すると、通信相手先情報記憶部208に格納された音
声データを読み出し、入力音声信号の音声データと比較
する。それらの一致を検出したときは、その音声データ
に対応する出席者氏名のデータを通信相手先情報記憶部
208から読み出し、その出席者氏名のデータを通信相
手先表示部205に出力する。
【0008】通信相手先表示部205は、通信相手先認
識部207から出席者氏名のデータを受け取ると、この
データを画像信号に加えてモニタ202に送り、モニタ
202は、相手先から送られた映像に重ねて出席者氏名
を画面に表示する。
【0009】次に、動作について説明する。
【0010】この画像通信端末装置を用いてテレビ会議
を開く場合は、会議冒頭に各出席者が自己紹介を行い、
その間を利用して、受信側は、通信相手先認識部207
を通じて通信相手先情報記憶部208に音声データの記
憶を行わせる。同時に受信者は、発言中の出席者氏名
を、入力装置を用いて通信相手先情報記憶部208に入
力し、通信相手先情報記憶部208に、出席者氏名と音
声データとを関連テーブルに記憶させる。
【0011】こうして通信相手先情報記憶部208にお
ける準備が整った後は、相手先の出席者が発言した場合
には、その音声信号を受信した通信相手先認識部207
が、音声データを通信相手先情報記憶部208に記憶さ
れた音声データと比較し、発言者の氏名を検出する。検
出された発言者氏名は、通信相手先表示部205に送出
され、モニタ画面に表示させる。従って、受信側の出席
者は、モニタに表示された氏名から発言者を認識するこ
とができる。
【0012】また、会議の信号に伴って通信相手先情報
記憶部208の登録データを拡充していく方法を採るこ
とも可能である。この場合は、発言者の会議における発
言中に、その音声データを通信相手先情報記憶部208
に記憶させると共に、その発言者の氏名を確認して通信
相手先情報記憶部208に登録する。
【0013】通信相手先認識部207は、会議中、通信
相手先情報記憶部208に記憶されたデータと発言者の
音声データとを常時比較し、一致する音声データを検出
した場合は、通信相手先情報記憶部208から発言者氏
名を読み出し、それをモニタ202の画面に表示する。
【0014】一方、音声データが一致しない場合は、そ
の音声データを通信相手先情報記憶部208に登録する
と共に、発言者氏名を確認して通信相手先情報記憶部2
08に登録する。
【0015】この方式では、会議において発言しない者
の音声データを記録する必要がないため、記録すべきデ
ータ量が少なくて済む。
【0016】こうして、音声認識に基づいて、会議にお
ける発言者をモニタ上で明らかにすることにより、出席
者は、発言者を正しく認識することができ、テレビ会議
を円滑に進めることができる。
【0017】なお、発言者を表示する手段としては、氏
名の表示以外に、顔写真の静止画を表示したり、モニタ
画像中の発言者の位置を矢印で表示する等の方法を採る
こともできる。
【0018】また、発言者に応じた記号を画面に表示さ
せて、受信者を理解させる方法を採ることもできる。こ
の場合には、通信相手先情報記憶部208に予め格納し
た複数種類の記号と音声データとの対応テーブルを通信
相手先情報記憶部208内に形成するだけで足りるた
め、通信相手先情報記憶部208への発言者の氏名の入
力が不要になり、構成および操作を簡略化することがで
きる。
【0019】なお、発言者のモニタ上への表示は、必要
に応じて行なう。
【0020】また、特開平7−336660号公報に
は、表示されている発言者が誰であるかを容易に認識で
き、しかも会議参加者に関する映像情報を自然かつ詳細
に認識できることを目的とするテレビ会議システムが記
載されている。
【0021】図10は、この公報に記載された実施例の
全体構成を示すブロック図である。図10において、端
末301a〜gと端末制御装置302とは、デジタル通
信網としてのISDN303を介して相互に通信可能に
接続されている。
【0022】各端未301a〜301gは、同様に構成
されており、カメラ311と、マイク312と、モニタ
313と、スピーカ314と、映像情報を所定のフォー
マット(例えば、共通中間フォーマット=CIF(35
2×288ドット))で圧縮符号化するCODEC31
5と、音声情報を圧縮符号化するCODEC316と、
映像情報を伸張復号化するCODEC317と、音声情
報を伸張復号化するCODEC318とをそれぞれ備え
ている。
【0023】端末制御装置302は、音声制御部321
と、画面サイズテーブル部322と、音声レベル判定部
323と、画面サイズ制御部324と、画面合成部32
5とを備える。音声制御部321は、各端末301a〜
301gから送信された音声情報を全て加算合成し、合
成した音声情報を各端末301a〜301gに対して返
送する。画面サイズテーブル部322は、図11に示す
テーブルT上に相互に異なる4つの表示サイズS1〜S
4を格納している。表示サイズS1〜S4は、各端末3
01a〜301gの映像情報の表示サイズをそれぞれ表
し、例えば、300×300ドット、200×150ド
ット、180×100ドット、150×80ドットにそ
れぞれ選ばれている。
【0024】音声レベル判定部323は、各端末301
a〜301gから送信された音声情報の音声レベルを測
定し、測定結果に基づいて音声レベルに対応して各端末
301a〜301gから送信された映像情報の表示サイ
ズの相対的な大小をそれぞれ決定し、決定結果に基づい
て画面サイズテーブル部322から表示サイズS1〜S
4を読み出す。また、音声レベル判定部323は、モニ
タ313の一画面における表示位置を決定する。画面サ
イズ制御部324は、各端末301a〜301g送信さ
れた映像情報のフォーマットを音声レベル判定部323
により指定された表示サイズに変換する。画面合成部3
25は、各端末301a〜301gの変換された映像情
報を1つの画面に全て合成し、合成した映像情報を各端
末301a〜301gに返送する。
【0025】次いで、図10の動作を説明する。まず、
各端末301a〜301gからの音声情報および映像情
報の送信動作について説明する。各端末は、ISDN3
03を通じて端末制御装置302に対して発呼し、例え
ば端末301aと端末制御装置302との間のコネクシ
ョンを確立する。次いで、カメラ311から会議参加者
Aに関する映像情報を取り込むとともに、マイク312
から会議参加者Aの音声情報を取り込む。そして、CO
DEC315、316によりデジタル化、圧縮した映像
情報、音声情報をISDN303を通じて端末制御装置
302へ送信する。他の端末301b〜301gでも上
記と同様の動作が行われ、映像情報と音声情報とが端末
制御装置302へ送信される。
【0026】次に、端末制御装置302の動作について
説明する。音声制御部321は、各端末301a〜30
1gから送信された音声情報を全て加算合成する。ま
た、各端末301a〜301gから送信された音声情報
は、音声レベル判定部323に入力される。音声レベル
判定部323は、各端末301a〜301gの音声情報
の音声レベルを測定し、測定結果に基づいて音声レベル
に対応して各端末301a〜301gから送信された映
像情報の表示サイズの相対的な大小をそれぞれ決定す
る。各端末の音声レベルに応じて画面サイズテーブル部
322から端末毎に映像情報を表示する画像サイズ情報
を読み出す。
【0027】例えば、端末301e(図示せず)の会議
参加者E(図10において図示せず)の音声レベルが最
も大きい場合、音声レベル判定部323は、会議参加者
Eを発言者であると判定し、端末301eに対して画像
サイズテーブル部322から最も大きな表示サイズS1
を読み出すとともに、他の端末301a〜301d、3
01f、301gに対して相対的に小さな表示サイズS
3を読み出す。そして、音声レベル判定部323は、読
み出した各端末301a〜301gの画像情報の表示サ
イズS1、S3を画面サイズ制御部324に通知する。
通知があると、画面サイズ制御部324は、各端未30
1a〜301gから入力された映像情報を補完あるいは
間引きすることによって表示する画面のサイズを音声レ
ベル判定部323から指定されたサイズS1、S3にそ
れぞれ変換する。これにより、端末301eの映像情報
の表示サイズが相対的に大きくなり、他の端末301a
〜301d、301f、301gの表示サイズが相対的
に小さくなる。
【0028】また、音声レベル判定部323は、表示サ
イズS1、S3にそれぞれ変換された画像情報の表示位
置を画面合成部325に通知する。通知があると、画面
合成部325は、音声レベル判定部323の指定にした
がって表示サイズS1、S3にそれぞれ変換された映像
情報を1枚の画面(例えば、Video Graphics Array=V
GA(640×480ドット))上に合成する。音声制
御部321において合成された音声情報は、ISDN3
03を介して各端末301a〜301gに返送される。
また、画面合成部325において合成された映像情報
は、ISDN303を介して各端末301a〜301g
に返送される。
【0029】次いで、各端末301a〜gの音声情報お
よび映像情報の受信動作について説明する。端末301
a〜301gは、受信した音声情報をCODEC318
により復号化し、スピーカ314から再生する。これに
より、各端未301a〜301gのそれぞれにおいて会
議参加者全員の音声を聞くことができる。また、端末3
01a〜301gは、受信した映像情報をCODEC3
17により復号化し、モニタ313の画面上に表示す
る。これにより、各端末301a〜301gのそれぞれ
において会議参加者全員の映像を見ることができる。
【0030】図12は、端末301a〜301gのモニ
タ313に映し出された一画面を示す図である。図12
において、参加者Eの映像の表示サイズS1は、他の参
加者A〜D、F、Gの表示サイズS3よりも大きく映し
出されている。したがって、現在の発言者が参加者Eで
あることが容易に想像できる。また、参加者Eの表示サ
イズが大きいので、発言者の表示や仕草や発言者が示し
た資料なども自然、かつ詳細に認識することができる。
【0031】なお、音声レベル判定部323を、音声レ
ベルの最も大きな端末の画像情報の表示位置をモニタ3
13の一画面におけるほぼ中心に決定するよう構成して
もよい。この場合には、図13に示すように、音声レベ
ルの最も大きな端末301eの発言者Eの画像情報が各
端末301a〜301gのモニタ303のほぼ中心に表
示されることになる。したがって、常にモニタ313の
中心に発言者の画像情報が映し出されるので、視線の移
動がなくなり、発言者の認識がさらに容易になる。
【0032】また、上述の実施例では、2つのレベルで
表示サイズを決定するようにしたが、音声レベルの大き
さに比例して3以上のレベルで表示サイズを決定するよ
うにしてもよい。この場合、音声レベル判定部323
を、各端末301a〜301gの映像情報の表示サイズ
の大きさの順番に並ぶよう各端末301a〜301gの
表示位置を決定するよう構成してもよい。この場合に
は、図14に示すように、音声レベルの最も大きい参加
者E、参加者A、参加者Bの順で表示サイズが並ぶこと
になる。したがって、現在主に討論に参加している者
(例えば質疑応答など)がEとAとBであることが容易
に認識できるとともに、メインの発言者が常に同じ位置
に表示されるため、視線の移動も必要なく、発言者の認
識がさらに容易になる。
【0033】図15は、特開平7ー336660号公報
に記載された第二の実施例のテレビ会議システムの全体
構成を示すブロック図である。なお、図10の実施例と
対応する部分には、同一番号を付し、説明を省略する。
図15の実施例においては、各端末301a〜301g
には、左右のチャネル用のスピーカ314R、314L
と、CODEC318R、318Lが設けられている。
また、端末制御装置302の音声レベル判定部323
は、音声制御部321に対して音声レベルの最も大きな
端末の画像情報の表示位置を通知するよう構成されてい
る。音声制御部321は、音声レベル判定部323の通
知にしたがって、音声レベルの最も大きな端末の音像が
画像情報の表示位置に定位するように合成した音声情報
を左右の2チャネルで、かつ2チャネルの音声情報の音
声レベルを変化させて返送するよう構成されている。
【0034】次いで、図15の動作を説明する。なお、
端末301a〜301gの音声情報および映像情報の送
信動作、映像情報の受信動作は、図10の場合と同様で
あるので、説明を省略する。また、端末制御装置302
の映像情報の合成動作も図10の場合と同様であるの
で、説明を省略する。
【0035】したがって、まず、端末制御装置302の
音声情報の合成動作を説明する。音声レベル判定部32
3は、音声制御部321に対して最も大きな音声レベル
の端末、例えば301eの映像情報の表示位置だけを通
知する。音声制御部321は、音声レベル判定部323
からの通知により、合成した音声情報を左右の2チャネ
ルで、かつ2チャネルの音声情報の音声レベルを変化さ
せて返送する。
【0036】ここで、例えば、モニタ313上の表示が
図12のように合成されている場合、最も音声レベルの
大きな参加者Eの映像情報は、画面の左下に表示されて
いる。このため、音声制御部321は、参加者Eの音声
情報については左(L)チャネルの音声レベルを右
(R)チャネルの音声レベルよりも高くし、その他の参
加者A〜D、F、Gの音声情報については左(L)チャ
ネル、右(R)チャネルとも同じ音声レベルで合成す
る。そして、音声制御部321は、このように合成した
左(L)チャネルおよび右(R)チャネルの音声情報を
各端末301a〜301gに返送する。
【0037】端未301a〜301gは、受信した左
(L)チャネルと右(R)チャネルの音声情報をCOD
EC318L、318Rにより復号化し、スピーカ31
4L、314Rから再生する。ここで、会議参加者Eの
音声情報は左(L)チャネルの音声レベルが右(R)チ
ャネルの音声レベルよりも高く合成されている。このた
め、再生される参加者Eの音像は、左右のスピーカ31
4L、314Rの中心よりも左側に定位する。したがっ
て、会議参加者Eの表示位置と音像の定位置とが一致
し、発言者の認識がさらに容易になる。
【0038】なお、各端末301a〜301gから送信
した音声情報を端末制御装置302からその端末に返送
するようにしたが、その端末に対しては返送しないよう
にしてもよい。これにより、ハウリングを防止すること
ができる。また、各端末301a〜301gから送信し
た映像情報を端末制御装置302からその端末に返送す
るようにしたが、その端末に対しては返送しないように
してもよい。これにより、音声レベルの最も大きい参加
者の映像の表示サイズをさらに大きくすることができる
ので、さらに現在の発言者を容易に認識でき、発言者の
表情や仕草や発言者が示した資料なども自然、かつ詳細
に認識することができる。
【0039】また、音声レベル判定部323は、音声制
御部321に対して最も大きな音声レベルの端末だけを
通知するようにしたが、他の端末の映像情報の表示位置
についても、通知するようにしてもよい。この場合に
は、図14のような場合であっても、会議参加者A、B
の表示位置と音像の定位位置とが一致し、発言者の認識
がさらに容易になる。
【0040】
【発明が解決しようとする課題】特開平7−10745
1号公報に記載されている実施例の第1の問題点は、音
声データの記録および関連テーブルを作成するのに手間
取ることである。
【0041】その理由は、会議冒頭に各出席者が自己紹
介を行ない、その間を利用して、受信側が会議参加者の
音声データを記憶するとともに、出席者氏名を入力する
必要があるためである。特に、会議参加者が多い場合
に、出席者氏名と音声データを関連付けた関連テーブル
を作成するのに時間がかかる。
【0042】特開平7−107451号公報に記載され
ている実施例の第2の問題点は、発言者の音声データを
記憶した音声データと常時比較するために、CPUに負
荷がかかることである。
【0043】その理由は、会議中、記憶された音声デー
タと発言者の音声データを常時比較し、発言者の音声デ
ータを検出しているためである。
【0044】特開平7−107451号公報に記載され
ている実施例の第3の問題点は、会議の進行を円滑に行
えないことである。
【0045】その理由は、発言者を特定するための音声
データの記憶を、会議開催時もしくは、会議進行中に行
うことを挙げているが、どちらの方法においても、発言
者の氏名を入力装置を介し、入力する必要があることか
ら会議の進行を妨げる恐れがあるためである。また、発
言者を特定する方法として、発言者に応じた記号を画面
に表示させる方法を挙げているが、会議参加者が多くな
ると、参加者に対応した多数の記号を用意する必要が生
じるという問題と、記号による発言者の特定が難しくな
るという問題が生じる。
【0046】特開平7−336660号公報に記載され
ている実施例の問題点は、ネットワークの負荷およびC
PUの負荷が大きくなるということである。
【0047】その理由は、会議用端末と端末制御装置で
構成され、各端末から送信される音声情報および映像情
報を端未制御装置において、合成し各端末に返送してい
る。そのため、接続する端末数が増加すると、端末制御
装置のCPU負荷が増加するとともに、通信回線のトラ
フィックも増加するという問題が生じる。
【0048】そこで本発明の目的は、上記従来技術の問
題点を解決するもので、会議に参加する端末のCPU負
荷、およびネットワークのトラフィックを軽減し、なお
かつ、会議参加者の特定が容易に行えるとともに、会議
の進行を円滑に行えるビデオ会議装置を提供することで
ある。
【0049】
【課題を解決するための手段】上記の課題を解決するた
め、本発明のビデオ会議装置は、通信回線を介して相互
に接続されるビデオ会議装置本体、音声入力装置、画像
入力装置、データ入力装置、音声出力装置および表示装
置とより成り、前記ビデオ会議装置本体は、音声データ
の入出力制御を行う音声制御手段と、送受信される音声
データに端末を識別するための情報や、画像データの表
示指示、および形式、表示時間等の音声データヘッダ情
報の付加、ならびに取得する音声データ処理手段と、通
信回線に送出するデータを所定の形式に多重化処理し、
また受信したデータを音声データ及び画像データに分離
する処理を行う多重分離化手段と、データ入力装置から
入力した音声データヘッダ情報、および受信した音声デ
ータから音声データヘッダ情報を取得し格納する音声デ
ータヘッダ情報格納部と、音声データヘッダ情報に格納
された音声データヘッダ情報の画像表示指示情報によ
り、画像データの符号化ならびに復号化を行う画像デー
タ処理手段と、音声データヘッダ情報に従い表示制御を
行うメイン制御手段と、メイン制御手段の指示に従い表
示装置の表示制御を行う表示制御手段と通信回線を介し
てデータの送受信制御を行うための回線制御手段とを有
する。
【0050】本発明において、音声データ処理手段は、
送信する音声データに音声データヘッダ情報格納部に格
納した音声データヘッダ情報を付加するとともに、受信
した音声データから音声データヘッダ情報を取得し音声
データヘッダ情報格納部に格納する。音声データヘッダ
情報格納部は、データ入力装置から入力された音声デー
タヘッダ情報を格納するとともに、音声データ処理手段
から供給される音声データヘッダ情報を格納する。メイ
ン制御手段は、ビデオ会議装置本体の各部の制御、なら
びに音声データヘッダ情報の付加および取得、音声デー
タヘッダ情報の格納、および表示の制御を行う。
【0051】
【発明の実施の形態】本発明の実施の形態を図面を参照
して説明する。
【0052】図1は、本発明の一実施形態におけるビデ
オ会議装置の構成を表わしたものである。この装置は、
ビデオ会議装置本体111と、これに接続された入力装
置としての音声入力装置112、画像入力装置113お
よびデータ入力装置114と、出力装置としての音声出
力装置115および表示装置116から構成されてお
り、通信回線117を介して会議の相手としての図示し
ないビデオ会議装置と接続されるようになっている。
【0053】ここで、ビデオ会議装置本体111は、動
画像データ、画像データ、音声データ、テキストデー
タ、グラフィックスデータ等の各種のデータを、他の図
示しないビデオ会議装置と会議のために相互に入出力す
るための回路装置である。音声入力装置112は、マイ
クロフォンに代表されるもので、音声の入力を行うため
のものである。音声出力装置115は、スピーカやヘッ
ドフォンに代表されるもので、音声を出力するためのも
のである。画像入力装置113は、カメラに代表され、
画像の入力を行うようになっている。これに対して、デ
ータ入力装置114は、マウス、トラッキングボールの
ようなポインティングデバイスやキーボードに代表され
るもので、このビデオ会議装置の操作のための各種デー
タを入力するためのものである。表示装置116は、画
像入力装置113から入力された画像データや、通信回
線117によって受信した圧縮された画像データを復号
して得られた画像データあるいは接続先の図示しないビ
デオ会議装置に送出される画像データ等の画像データを
表示するもので、CRTや液晶等のディスプレイ装置に
よって構成される。
【0054】ビデオ会議装置本体111は、音声入力装
置112ならびに音声出力装置115と接続された音声
制御手段121を備えている。音声制御手段121は音
声データの入出力制御を行うもので、音声データ処理手
段122と接続されている。音声データ処理手段122
は、多重分離化手段123、およびメイン制御手段12
8とも接続されており、音声制御手段121を介して入
力される音声データを圧縮し、メイン制御手段128か
ら供給される図2に示すような音声データヘッダ情報を
付加し、多重分離化手段123に出力するとともに、多
重分離化手段123から受信した圧縮された音声データ
の復号を行い、音声制御手段121に出力するととも
に、付加されている音声データヘッダ情報を取得し、メ
イン制御手段128への出力を行う。
【0055】多重分離化手段123は、回線制御手段1
25を介して通信回線117と接続される外、画像デー
タ処理手段126を介して表示制御手段127と接続さ
れており、圧縮された音声データや画像データを通信回
線117に送出する際に所定のデータ形式に多重化する
処理と、回線制御手段125から受信したデータを音声
データならびに画像データに分離する処理を行う。ま
た、回線制御手段125は通信回線117を介してデー
タの送受信制御を行うためのものである。
【0056】ここで、表示制御手段127は、画像入力
装置113および表示装置116と接続されており、こ
れらの装置から入力される画像データを表示装置116
に視覚的に表示する際の表示制御を行うとともに、メイ
ン制御手段128の指示に従い表示を行う。画像データ
処理手段126は、表示制御手段127を介して入力さ
れる画像データの符号化ならびに、回線制御手段125
および多重分離化手段123を介して入力される画像デ
ータの復号化の処理を行う。
【0057】ビデオ会議装置本体111にはメイン制御
手段128も配置されている。メイン制御手段128
は、データ入力装置114、および各部と接続されてビ
デオ会議装置としての各種制御を行うためのものであ
る。
【0058】音声データヘッダ情報格納部124は、図
示されていない会議の相手の図2に示す音声データヘッ
ダ情報を格納するとともに、メイン制御手段128を介
してデータ入力装置114から入力された音声データヘ
ッダ情報を格納するためのものである。
【0059】図2は、音声データに付加されるへッダ情
報の構成を示す図である。音声ヘッダ情報は、図2
(a)に示す通り、固定長で構成される端末識別情報、
画像表示指示情報、および画像表示時間情報等で構成さ
れる。ここで、端末識別情報は、会議に参加しているビ
デオ会議装置を識別するための情報を示し、端末番号、
参加者氏名等の音声データの判別に使われる情報が格納
されている。
【0060】画像表示指示情報は、画橡データの表示/
非表示の設定情報を示し、自端末から送信される画像デ
ータの相手側での表示/非表示、および受信した画像デ
ータの自端末での表示/非表示の設定情報が格納されて
いる。
【0061】画像形式情報は、画像データの形式情報を
示し、画像データが静止画データ形式、もしくは動画像
データ形式かを示す情報が格納されている。
【0062】画像表示時間情報は、画像データの表示す
る長さを設定する情報を示し、自端末から送信される画
像データの相手側での表示時間、および受信した画像デ
ータの自端末での表示時間が格納されている。
【0063】図2(b)は、図2(a)と同様な音声デ
ータヘッダ情報に、可変長のテキスト情報と、音声デー
タヘッダ情報の総バイト数が追加された構成となってい
る。
【0064】可変長のテキスト情報は、会議に参加して
いる相手に対し、画像データとともに表示するテキスト
データが格納されている。
【0065】ヘッダ情報バイト数には、ヘッダ情報の総
バイト数が格納されている。
【0066】次に、本発明のビデオ会議装置の動作につ
いて図面を参照して説明する。
【0067】まず、ビデオ会議を開始する前に、予め図
2に示す音声データヘッダ情報を入力し、音声データヘ
ッダ情報格納部124に格納する。
【0068】ビデオ会議の開始に際して、ビデオ会議装
置本体111は、通信回線117を介して接続されてい
る図示しないビデオ会議装置と接続し、音声データヘッ
ダ情報格納部124に格納された自端末の音声データヘ
ッダ情報を送信するとともに接続先の音声データヘッダ
情報を取得し、音声データヘッダ情報格納部124に格
納する。
【0069】ビデオ会議中の音声デ−タの送信は、ま
ず、音声制御手段121を介して音声入力装置112か
ら入力されたデータが音声データ処理手段122に入力
される。音声データ処理手段122は、入力された音声
データに、音声データヘッダ情報格納部124に格納さ
れた自端末の音声ヘッダ情報を付加して多重分離化手段
123に出力し、回線制御手段125および通信回線1
17を介して会議参加者に送出される。
【0070】ビデオ会議中の音声データの受信は、音声
データ処理手段122が多重分離化手段123から音声
制御処理手段122に入力された音声データを復号化
し、また音声データヘッダ情報を取得して、音声制御手
段121に音声データのみが出力される。取得された音
声データヘッダ情報は、メイン制御手段128を介して
音声データヘッダ情報格納部124に送出され、受信し
た端末識別情報に対応した音声データヘッダ情報に上書
きされる。音声データヘッダ情報格納部124は音声デ
ータヘッダ情報を上書きすると、受信した音声データを
識別する端末識別情報と音声データヘッダ情報書き込み
完了信号をメイン制御手段128に出力する。
【0071】図3はメイン制御手段の音声データ受信時
の処理フローを示す。メイン制御手段128は、音声デ
ータヘッダ情報書き込み完了信号を受信すると画像デー
タの表示処理を開始する。すなわち、音声データヘッダ
情報書き込み完了信号を受信すると、メイン制御手段1
28は端末識別情報に対応する音声データヘッダ情報を
音声データヘッダ情報格納部124から取得する(ステ
ップA1、A2)。取得した音声データヘッダ情報の設
定を解析し、表示制御手段127に画像データの表示方
法を指示する(ステップA3、A4)。
【0072】表示制御手段127は、メイン制御手段1
28から供給される表示方法の指示に従い、画像データ
処理手段126から入力される画像データの表示を行
う。
【0073】次に、本発明の第二の実施形態について図
面を参照して説明する。
【0074】図4は、本発明の別の実施形態の全体構成
を表したものである。なお、図1の実施形態と対応する
部分には、同一番号を付し、その説明を省略する。
【0075】図4の実施形態において、音声データヘッ
ダ情報格納部124に格納された音声データヘッダ情報
の画像表示指示情報が非表示に設定された場合、画像デ
ータ処理手段126に対し、画像データの符号化/復号
化を制御する信号が供給されている。
【0076】次いで、図4の動作を説明する。なお、ビ
デオ会議を開始する前の音声データヘッダ情報の準備、
ビデオ会議の開始時の各端末の音声データヘッダ情報の
音声データヘッダ情報124への格納、および音声の送
受信の動作について、図1の場合と同様の部分について
は、説明を省略する。したがって、ビデオ会議に参加し
ている端末において、画像表示指示情報の設定を非表示
にした場合、画像データ処理手段126は、音声データ
ヘッダ情報格納部124から供給される制御信号の指示
に従い、表示制御手段127を介して入力される画像デ
ータの符号化を行わない。また、他端末から入力された
音声データヘッダ情報の画像表示指示情報の設定が非表
示の場合も同様に、回線制御手段125および多重分離
化手段123を介して入力される画像データの復号化処
理を行わない。
【0077】なお、音声データヘッダ情報の画像表示指
示情報が表示に設定されると、画像データの符号化処
理、ならびに復号化処理を再開する。
【0078】本発明の実施形態について実例に基づいて
説明する。
【0079】図5(a)は、図1に示すビデオ会議装置
本体111で構成される端末A、B、C、Dの各々が通
信回線117に接続された場合のビデオ会議の構成例を
示している。会議開始に際し、各端末はあらかじめ音声
データヘッダ情報の設定を行っているものとし、図5
(b)は、各端末の音声データヘッダ情報格納部124
に格納された音声データヘッダ情報を示している。
【0080】図6は画面に発言者のみを表示する場合の
例を示し、図7は画面に会議参加者を複数表示する場合
の例を示している。
【0081】図6(a)は、会議に参加している端末で
のデータの流れを示しており、仮に、この端末を端末B
として、通信回線117を介して、端末Bに入力される
音声データを(1)入力音声データ、端末Bから音声出
力装置115に出力される音声データを(2)出力音声
データ、表示装置116に表示される出力画像データを
(3)出力画像データとする。
【0082】いま、時間t1に端末A、時間t2に端末
B、時間t3に端末C、時間t4に端末Dが発言を行っ
た場合の処理について説明する。図6(b)は、その時
の端末Bの表示装置116に表示される画面を示してい
る。
【0083】時間tlの端末Aの発言は、通信回線11
7を介して、ビデオ会議装置本体111に入力され、音
声データヘッダ情報は音声データ処理手段122に格納
され、音声データは、音声制御手段121を介して音声
出力装置115から出力される((1)入力音声デー
タ、(2)出力音声データ)。
【0084】入力された画像データは、音声データヘッ
ダ情報格納部124に格納された端末識別情報「A」の
指示に従い、表示装置116に動画像データが10秒間
表示される(図6(b)t1)。
【0085】時間t2の端末Bの発言の音声データは、
端末Aの音声データの処理と同様に処理され、音声出力
装置115から出力される。画像データは、音声データ
ヘッダ情報格納部124に格納された端末識別情報
「B」の画像表示指示情報の設定が非表示であることか
ら、表示装置116には、画像データは何も表示されな
い(図6(b)t2)。
【0086】時間t3の端末Cの発言の音声データは、
端末A、Bの発言の際の処理と同様に処理され、画像デ
ータは、音声データヘッダ情報格納部124に格納され
た端末識別情報「C」の指示に従い、表示装置116
に、静止画像データが5秒間表示される(図6(b)t
3)。
【0087】時間t4の端末Dの発言の際のデータの処
理は、時間t2の処理と同様となり、表示装置116に
は、画像データは何も表示されない(図6(b)t
4)。
【0088】図7(a)は、会議に参加している端末で
のデータの流れを示しており、仮に、この端末を端末B
とすると、通信回線117を介して、端末Bに入力され
る音声データを(1)入力音声データ、端末Bから音声
出力装置115に出力される音声データを(2)出力音
声データ、表示装置116に表示される出力画像データ
を(3)〜(6)参加者画像とする。
【0089】(3)〜(6)は、各端末の画像データの
ストリームを表しており、端末Aの画像データのストリ
ームをみると、端末Aが発言している際に入力される動
画像データを10秒間、表示装置116に表示している
ことを意味する。端末Bの画像データのストリームをみ
ると、端末Bが発言している際に入力される動画像デー
タは、音声データヘッダ情報の画面表示指示情報が非表
示に設定されていることから、表示装置116に表示す
る画像データがないことを意味する。端末Cの画像デー
タのストリームをみると、端末Cが発言している際に入
力される静止画像データが、表示装置116にそれまで
表示している静止画像データから切り替わって表示され
たことを意味する。端末Dの画像データのストリームを
みると、端未Dが発言している際に入力される静止画像
データは、音声データヘッダ情報の画面表示指示情報が
非表示に設定されていることから、表示装置116に表
示する画像データがないことを意味する。
【0090】図7(b)は、表示装置116に表示され
る画面の一例を示し、端末Aの音声データ入力時(t
1)および端末Cの音声データ入力時を表している。左
上の端末Bの表示領域は、画像入力装置113から入力
される画像データを表示している状態を示している。
【0091】時間t1の端末Aの発言時は、表示装置1
16の画面中央に端末Aから入力される画像データが表
示され、右上に端末Cから入力される画像C’が表示さ
れている。
【0092】時間t2の端末Cの発言時は、表示装置1
16の画面右上の端末Cから入力された静止画像C’か
ら、画面中央に端末Cから入力される静止画像Cに切り
替わる。
【0093】次に、図2(b)に示す可変長テキスト情
報を含んだ音声データヘッダ情報の場合について説明す
る。前述の事例と同様な構成で会議が開催され、音声デ
ータおよび画像データの処理がされるもとのして、図8
は、表示装置116に音声データヘッダ情報に含まれた
テキストデータを表示していることを示している。ここ
で、テキストデータの表示位置等は、ユーザが自由に設
定および変更できるものとする。
【0094】
【発明の効果】これまで説明したように、本発明によれ
ば以下のような効果を奏するものである。
【0095】第1の効果は、ビデオ会議の進行を円滑に
行うことができることである。
【0096】その理由は、端末を識別するための情報
等、いくつかの設定を入力するだけで、ビデオ会議を開
催することができるため、初期設定が簡単なことと、設
定した情報を必要に応じて変更するだけで済むためであ
る。
【0097】第2の効果は、CPU処理の負荷およびネ
ットワークの負荷を抑えることができることである。
【0098】その理由は、音声データヘッダ情報の画像
表示指示信号の設定により、画像データの符号化ならび
に復号化処理を行うか否かの制御を行い、画像データ処
理を行わない場合はCPUの負荷が減るとともに、画像
データの送受信も行わないためネットワークの負荷も抑
えることができるためである。
【0099】第3の効果は、ビデオ会議における発言者
の特定が容易に行え、なおかつ発言者を有効的に画面に
表示することができることである。
【0100】その理由は、音声データヘッダ情報に付加
された端末識別情報から発言者を特定することができ、
なおかつ画像表示指示情報、画像形式情報、画像表示時
間情報等、画像データの送信側の意図する情報が付加さ
れているためである。
【0101】第4の効果は、同一の端末を複数の参加者
が使用した場合でも、発言者を容易に特定することがで
きることである。
【0102】その理由は、音声データヘッダ情報に付加
された端末識別情報に発言者の氏名を入力することがで
きるためである。
【0103】第5の効果は、テキストデータを画像デー
タとリンクして表示できることである。
【0104】その理由は、音声データヘッダ情報にテキ
スト情報を付加しているためである。
【図面の簡単な説明】
【図1】本発明の実施形態の構成を示すブロック図
【図2】(a)音声データヘッダ情報の構成を示す図、
(b)可変長のテキスト情報とヘッダ情報の総バイト数
を追加した音声データヘッダ情報の構成を示す図
【図3】本発明の実施形態の動作を説明するためのフロ
ーチャート
【図4】本発明の別の実施形態の構成を示すブロック図
【図5】(a)ビデオ会議の構成例を示す図、(b)各
端末の音声データヘッダ情報格納部に格納された音声デ
ータヘッダ情報を示す図
【図6】(a)会議に参加している端末でのデータの流
れを示す図、(b)会議参加者の表示装置に表示される
例を示す図
【図7】(a)会議に参加している端末でのデータの流
れを示す図、(b)会議参加者の表示装置に表示される
例を示す図
【図8】表示装置に音声データヘッダ情報に含まれるテ
キストデータを表示している図
【図9】従来のテレビ会議装置の一実施例を示すブロッ
ク図
【図10】従来のテレビ会議装置の別の実施例を示すブ
ロック図
【図11】図10の画面サイズテーブル部に設けられた
テーブルTの構成を示す図
【図12】会議参加者のモニタに表示される例を示す図
【図13】会議参加者のモニタに表示される第2例を示
す図
【図14】会議参加者のモニタに表示される第3例を示
す図
【図15】従来のテレビ会議装置のさらに別の実施例を
示すブロック図
【符号の説明】
111 ビデオ会議装置本体 112 音声入力装置 113 画像入力装置 114 データ入力装置 115 音声出力装置 116 表示装置 117 通信回線 121 音声制御手段 122 音声データ処理手段 123 多重分離化手段 124 音声データヘッダ情報格納部 125 回線制御手段 126 画像データ処理手段 127 表示制御手段 128 メイン制御手段

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 通信回線を介して相互に接続されるビデ
    オ会議装置本体、音声入力装置、画像入力装置、データ
    入力装置、音声出力装置および表示装置より成るビデオ
    会議装置において、前記ビデオ会議装置本体は、 音声データの入出力制御を行う音声制御手段と、 送受信される音声データに端末を識別するための情報
    や、画像データの表示指示、および形式、表示時間等の
    音声データヘッダ情報の付加、ならびに取得する音声デ
    ータ処理手段と、 通信回線に送出するデータを所定の形式に多重化処理
    し、また受信したデータを音声データ及び画像データに
    分離する処理を行う多重分離化手段と、 データ入力装置から入力した音声データヘッダ情報、お
    よび受信した音声データから音声データヘッダ情報を取
    得し格納する音声データヘッダ情報格納部と、 音声データヘッダ情報に格納された音声データヘッダ情
    報の画像表示指示情報により、画像データの符号化なら
    びに復号化を行う画像データ処理手段と、 音声データヘッダ情報に従い表示制御を行うメイン制御
    手段と、 メイン制御手段の指示に従い表示装置の表示制御を行う
    表示制御手段と通信回線を介してデータの送受信制御を
    行うための回線制御手段とを具備することを特徴とする
    ビデオ会議装置。
  2. 【請求項2】 取得した音声データヘッダ情報により、
    画像データの処理を行うか否かを決定することを特徴と
    する請求項1記載のビデオ会議装置。
  3. 【請求項3】 通信回線に接続され、ビデオ会議に参加
    している他端末における画像データの表示制御を決定す
    る音声データヘッダ情報を音声データに付加することを
    特徴とする請求項1乃至2記載のビデオ会犠装置。
  4. 【請求項4】 受信した音声データに付加された音声デ
    ータヘッダ情報の端末識別情報により、音声データと同
    時に受信した画像データの表示位置、大きさ等を設定し
    表示するよう構成されていることを特徴とする請求頂1
    乃至2記載のビデオ会議装置。
  5. 【請求項5】 受信した音声データに付加された音声デ
    ータヘッダ情報の画像表示指示情報により、音声データ
    と同時に受信した画像データの表示の制御を決定するよ
    う構成されていることを特徴とする請求項1乃至2記載
    のビデオ会議装置。
  6. 【請求項6】 受信した音声データに付加された音声デ
    ータヘッダ情報の画像表示時間情報により、音声データ
    と同時に受信した画像データの表示時間を決定するよう
    構成されていることを特徴とする請求項1乃至2記載の
    ビデオ会議装置。
  7. 【請求項7】 受信した音声データに付加された音声デ
    ータヘッダ情報のテキスト情報を、音声データと同時に
    受信した画像データとを一緒に表示するよう構成されて
    いることを特徴とする請求項1乃至2記載のビデオ会議
    装置。
JP9341450A 1997-12-11 1997-12-11 ビデオ会議装置 Expired - Fee Related JP3031320B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9341450A JP3031320B2 (ja) 1997-12-11 1997-12-11 ビデオ会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9341450A JP3031320B2 (ja) 1997-12-11 1997-12-11 ビデオ会議装置

Publications (2)

Publication Number Publication Date
JPH11177952A true JPH11177952A (ja) 1999-07-02
JP3031320B2 JP3031320B2 (ja) 2000-04-10

Family

ID=18346177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9341450A Expired - Fee Related JP3031320B2 (ja) 1997-12-11 1997-12-11 ビデオ会議装置

Country Status (1)

Country Link
JP (1) JP3031320B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008109686A (ja) * 2007-11-19 2008-05-08 Yamaha Corp 音声会議端末装置およびプログラム
WO2009004731A1 (ja) * 2007-07-05 2009-01-08 Panasonic Corporation 画像音声通信装置及び画像表示方法
JP2010233045A (ja) * 2009-03-27 2010-10-14 Brother Ind Ltd 会議支援装置、会議支援方法、会議システム、会議支援プログラム
US7864934B2 (en) 2005-02-21 2011-01-04 Ntt Docomo, Inc. Telephone used in a telephone system for transmitting data from an authorized telephone with speech authority to an unauthorized telephone without speech authority
US8487956B2 (en) 2005-11-29 2013-07-16 Kyocera Corporation Communication terminal, system and display method to adaptively update a displayed image

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7864934B2 (en) 2005-02-21 2011-01-04 Ntt Docomo, Inc. Telephone used in a telephone system for transmitting data from an authorized telephone with speech authority to an unauthorized telephone without speech authority
US8487956B2 (en) 2005-11-29 2013-07-16 Kyocera Corporation Communication terminal, system and display method to adaptively update a displayed image
WO2009004731A1 (ja) * 2007-07-05 2009-01-08 Panasonic Corporation 画像音声通信装置及び画像表示方法
JP2008109686A (ja) * 2007-11-19 2008-05-08 Yamaha Corp 音声会議端末装置およびプログラム
JP2010233045A (ja) * 2009-03-27 2010-10-14 Brother Ind Ltd 会議支援装置、会議支援方法、会議システム、会議支援プログラム

Also Published As

Publication number Publication date
JP3031320B2 (ja) 2000-04-10

Similar Documents

Publication Publication Date Title
JP2751923B1 (ja) 多地点テレビ会議システムおよび多地点テレビ会議装置
JPH07336660A (ja) テレビ会議システム
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
JP6179834B1 (ja) テレビ会議装置
JP2002504273A (ja) オーディオおよびマルチメディア会議を記録して索引をつける方法と装置
US7425979B2 (en) Communication system
US20060125914A1 (en) Video input for conversation with sing language, video i/o device for conversation with sign language, and sign language interpretation system
US20040249967A1 (en) Primary data stream communication
JP2009033298A (ja) 通信システム及び通信端末
JP2008288974A (ja) ビデオ会議システム及びビデオ会議装置
JPH09271006A (ja) 多地点テレビ会議装置
JP3031320B2 (ja) ビデオ会議装置
JP2003023612A (ja) 画像通信端末装置
CN109802968B (zh) 一种会议发言系统
JP2009118316A (ja) 音声通信装置
JP2001268078A (ja) 通信制御装置、その方法およびその提供媒体と通信装置
JP2000324463A (ja) テレビ会議システム
JP2008141348A (ja) 通信装置
JP4850690B2 (ja) 通信会議装置
JPH1023383A (ja) テレビ会議システム
JP2003339034A (ja) ネットワーク会議システム、ネットワーク会議方法およびネットワーク会議プログラム
US11764984B2 (en) Teleconference method and teleconference system
JPH10126757A (ja) ビデオ会議システム
JPH07162824A (ja) 通信システム及び端末装置
JPH01206765A (ja) テレビ会議システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees