JP3512828B2 - Video conference system - Google Patents

Video conference system

Info

Publication number
JP3512828B2
JP3512828B2 JP03911593A JP3911593A JP3512828B2 JP 3512828 B2 JP3512828 B2 JP 3512828B2 JP 03911593 A JP03911593 A JP 03911593A JP 3911593 A JP3911593 A JP 3911593A JP 3512828 B2 JP3512828 B2 JP 3512828B2
Authority
JP
Japan
Prior art keywords
volume level
control unit
unit
video camera
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03911593A
Other languages
Japanese (ja)
Other versions
JPH06253305A (en
Inventor
野 博 孝 川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP03911593A priority Critical patent/JP3512828B2/en
Publication of JPH06253305A publication Critical patent/JPH06253305A/en
Application granted granted Critical
Publication of JP3512828B2 publication Critical patent/JP3512828B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、送信時の音量レベルを
自動調整可能とするテレビ会議システムに関するもので
ある。 【0002】 【従来の技術】近年、テレビ会議システムは、従来の電
話機に用いられている音声によるコミュニケーション手
段に加え、ディスプレイ装置等を用いて文字や図形等の
視覚的な情報を相手側とリアルタイムに交換し得る手段
として開発されてきた。CCITTにおいても、オーデ
ィオビジュアル・サービス用のビデオ符号化方式および
多重化方式、通信手順が正式勧告化され、企業活動の広
域化およびデジタル通信網の普及に伴い、各社からCC
ITT勧告に準拠したTV会議システムや動画TV電話
などが開発されている。 【0003】以下、図面を参照しながら従来のテレビ会
議システムについて説明する。図3は従来のテレビ会議
システムの機能ブロック図である。図3において、1は
相手からの画像あるいは自画像を表示するモニタ、2は
モニタ1に画像の表示の切り替え制御などを行なう表示
制御部、3は動画を撮影するための動画カメラ、4は動
画カメラ3の焦点合わせやアングル調整を行なう動画カ
メラ制御部、5は静止画を読み取るスキャナ、6は動画
カメラ3およびスキャナ5で撮影した画像の符号化/復
号化を行なう画像コーデック部、7は音声入力用のマイ
ク、8は音声出力用のスピーカ、9は音声の符号化/復
号化を行なう音声コーデック部、10は動画カメラ3の
倍率やアングルの操作およびテレライティングなどを行
なうための座標入力部、11は座標入力部10からの座
標情報を処理するテレライティング制御部、12は電話
番号の入力、機能の選択を行なうためのキーボード、1
3は各部間のデータ入出力処理などの端末全体を制御す
る端末制御部、14は画像、音声、テレライティングデ
ータをCCITT勧告H.221(オーディオビジュア
ルテレサービスにおける64Kビット/s チャンネルの
フレーム構造)のフレームフォーマットで多重化し、ま
た相手から送られてきたフレームから画像、音声テレラ
イティングデータに分離する多重化/分離部、15はC
CITT勧告H.242(1920Kビット/s までの
デジタルチャンネルを使用したオーディオビジュアル端
末間の通信を設定する方式)に基づいた通信手順を実行
するBAS(Bitrate Allocation Signal )制御
部、16はISDN回線18に端末を接続するための回
線インタフェース、17は発着呼、切断等の呼の管理を
行なう呼制御処理部、18は伝送路としてのISDN回
線である。 【0004】以上のように構成された従来のテレビ会議
システムについて、以下その動作を説明する。キーボー
ド12から相手側端末の電話番号が設定され、発信キー
が押されると、端末制御部13は呼制御処理部17に通
知し、呼制御処理部17は回線インタフェース16を介
して相手側端末との間でBチャンネルの接続を行なう。
接続完了後、Bチャンネルを使ってBAS制御部15に
よりH.242に基づいたモード設定が行なわれ、デー
タ送受信が開始される。自側端末から相手側端末に対し
て動画の送信を行なう場合には、動画カメラ3により記
録された画像データを自側のモニタ1へ直接表示すると
ともに、画像コーデック部6で動画圧縮の規格であるC
CITT勧告H.261に従って圧縮を施す。スキャナ
5で読み込んだ静止画像も動画像と同様な処理を施し、
BAS制御部15のモードに従い、回線インタフェース
16を介してISDN回線18へ伝送され、相手側端末
へ送信する。相手側端末では、受信した圧縮符号化デー
タを画像コーデック部6で伸長および復号化を施し、画
像であれば表示制御部2を介してモニタ1に表示する。
音声を自側端末から相手側端末に対して送信する場合に
は、マイク7から入力された音量レベルのままの音声デ
ータに対し、音声コーデック部9でCCITT勧告G.
722またはG.728に従った符号化を行ない、IS
DN回線18を介して相手側端末へ送信する。 【0005】 【発明が解決しようとする課題】しかしながら、上記し
た従来のテレビ会議システムでは、送話音量が固定され
ているため、送話者のマイクに対する位置の変化と発声
音量の変化に対応できず、送話者がマイクに近い場合は
音量が大きすぎ、送話者がマイクから遠い場合は音量が
小さすぎるので、受話側で受話音量をボリューム等で加
減させるといった人為的な作業を必要とする問題点を有
していた。 【0006】本発明は、上記問題を解決し、送信音量が
一定になるように自動的に変更可能なテレビ会議システ
ムを提供することを目的としている。 【0007】 【課題を解決するための手段】本発明は、上記目的を達
成するために、従来の構成に、音量レベル検知部と音量
レベル制御部とを加え、動画カメラ制御部で得られる焦
点距離情報から送話者の音量レベルを推定するとともに
音量レベル制御部へ音量レベルの初期値を通知し、送話
が開始されると音量レベル制御部においてマイクから入
力した音声データの振幅部分のデータに修正を加え、送
話者の位置の変化によって動画カメラ制御部からの焦点
距離情報が変化した場合は音量レベル制御部での音量レ
ベル設定値の変更を行なうようにしたものである。音量
レベル検知部では、あらかじめ設定しておいた音量レベ
ルをしきい値とし、サンプリング毎に得られる音量レベ
ル値から一定時間内での音量レベルの最大値を求めてし
きい値と比較し、音量レベル制御部では、動画カメラ制
御部における焦点距離情報から得られる送話者の位置か
ら推定される音量レベルと、音量レベル検知部で実際に
得られた比較結果とに基づいて、送信する送話者の音声
レベルを一定間隔で自動調整するようにしたものであ
る。 【0008】 【作用】本発明は、上記した構成により、動画カメラ制
御部から与えられる焦点距離情報から判明する送話者の
位置からその送話者の大体の音量レベルを推定し、マイ
クから入力される送話者の実際の音量レベルと予め定め
た設定値とを比較し、実際の音量レベルが設定値よりも
小さければ設定値を上げ、実際の音量レベルが設定値よ
りも大きければ設定値を下げることにより、送信する音
量レベルを一定に自動調整することができる。 【0009】 【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。図1は本発明の一実施例における
テレビ会議システムの機能ブロック図であり、図3に示
す従来例の構成に音量レベル検知部19と音量レベル制
御部20とを追加したものである。すなわち図1におい
て、1は相手からの画像あるいは自画像を表示するモニ
タ、2はモニタ1に画像の表示の切り替え制御などを行
なう表示制御部、3は動画を撮影するための動画カメ
ラ、4は動画カメラ3の焦点合わせやアングル調整を行
なう動画カメラ制御部、5は静止画を読み取るスキャ
ナ、6は動画カメラ3およびスキャナ5で撮影した画像
の符号化/復号化を行なう画像コーデック部、7は音声
入力用のマイク、8は音声出力用のスピーカ、9は音声
の符号化/復号化を行なう音声コーデック部、10は動
画カメラ3の倍率やアングルの操作およびテレライティ
ングなどを行なうための座標入力部、11は座標入力部
10からの座標情報を処理するテレライティング制御
部、12は電話番号の入力、機能の選択を行なうための
キーボード、13は各部間のデータ入出力処理などの端
末全体を制御する端末制御部、14は画像、音声、テレ
ライティングデータをCCITT勧告H.221(オー
ディオビジュアルテレサービスにおける64Kビット/
s チャンネルのフレーム構造)のフレームフォーマット
で多重化し、また相手側端末から送られてきたフレーム
から画像、音声テレライティングデータに分離する多重
化/分離部、15はCCITT勧告H.242(192
0Kビット/s までのデジタルチャンネルを使用したオ
ーディオビジュアル端末間の通信を設定する方式)に基
づいた通信手順を実行するBAS(Bitrate Allocat
ionSignal )制御部、16はISDN回線18に端末
を接続するための回線インタフェース、17は発着呼、
切断等の呼の管理を行なう呼制御処理部、18は伝送路
としてのISDN回線である。19は音量レベル設定値
と音声コーデック部9から検知された音声の振幅を比較
して音量レベルの判定を行なう音量レベル検知部、20
は動画カメラ制御部4における焦点距離情報から得られ
る送話者の位置および音量レベル検知部19からの比較
結果によって、相対的に音声データ内の振幅部分のデー
タを加減させる音量レベル制御部である。 【0010】以上のように構成された本実施例のテレビ
会議システムについて、以下その動作を説明する。キー
ボード12から相手側端末の電話番号が設定され、発信
キーが押されると、端末制御部13は呼制御処理部17
に通知し、呼制御処理部17は回線インタフェース16
を介して相手側端末との間でBチャンネルの接続を行な
う。接続完了後、Bチャンネルを使ってBAS制御部1
5によりH.242に基づいたモード設定が行なわれ、
データ送受信が開始される。自側端末から相手側端末に
対して動画の送信を行なう場合には、動画カメラ3によ
り記録された画像データを自側のモニタ1へ直接表示す
るとともに、画像コーデック部6で動画圧縮の規格であ
るCCITT勧告H.261に従って符号化を施し、B
AS制御部15のモードに従い、回線インタフェース1
6を介してISDN回線18へ伝送し、相手側端末へ送
信する。相手側端末では、受信した圧縮符号化データを
画像コーデック部6で復号化を施す。スキャナ5で読み
込んだ静止画像も動画像と同様な処理を施し、画像であ
れば表示制御部2を介してモニタ1に表示する。 【0011】次に、音声を自側端末から相手側端末に対
して送信する場合について、図2に示す音量レベル推移
チャートを用いて説明する。まず、起動後において、動
画カメラ制御部4で得られる焦点距離情報から送話者の
位置を確認し、送話者の音量レベルを推定し、音量レベ
ル制御部20へ音量レベルの初期値を通知する(区間
A)。送話が開始されると音量レベル制御部20におい
てマイク7から入力した音声データの振幅部分のデータ
に修正を加えていく。すなわち、一定の間隔(tx )で
音量レベルのピークを音量レベル検知部19で検知し、
予め基準用として設定される音量レベルのピーク値と比
較し、実際に得られる音量レベルが小さいようであれ
ば、前に焦点距離情報から設定された音量レベル設定値
を引き上げ(区間B)、逆に実際に得られる音量レベル
が大きいようであれば、音量レベル制御部20での音量
レベル設定値を引き下げる(区間C)。次に、送話者の
位置が変化したことが動画カメラ制御部4から得られた
焦点距離情報から判明した場合、同様にして音量レベル
制御部20での音量レベル設定値の変更を行なう(区間
D)。 【0012】音量レベルに修正を加えられた後の音声デ
ータは、従来例と同様に音声コーデック部9で符号化を
行ない、多重/分離部14で多重化を施された後、動画
の場合と同様にISDN回線18を介して相手側端末へ
送信される。また、受信の場合には、相手側端末から受
信した音声符号化データを音声コーデック部9で復号化
し、スピーカ8へ出力する。 【0013】 【発明の効果】以上のように、本発明によれば、予め定
められた音量レベル設定値と音声コーデック部から検出
された音声の振幅とを比較して音量レベルの判定を行な
う音量レベル検知部と、動画カメラ制御部における焦点
距離情報から得られる送話者の位置および音量レベル検
知部における比較結果に基づいて一定間隔で前記音量レ
ベル設定値を調整する音量レベル制御部とを備え、動画
カメラ制御部で得られる焦点距離情報から送話者の音量
レベルを推定するとともに音量レベル制御部へ音量レベ
ルの初期値を通知し、送話が開始されると音量レベル制
御部においてマイクから入力した音声データの振幅部分
のデータに修正を加え、送話者の位置の変化によって動
画カメラ制御部からの焦点距離情報が変化した場合は音
量レベル制御部での音量レベル設定値の変更を行なうよ
うにしているので、送話者の音量の変化を確実に捕らえ
ることができるとともに、アナログ−デジタル変換後で
データ圧縮を行なう前に音量レベルを調整するため、各
音声符号化方式に依存せず、かつ簡単な構成で送信音量
レベルを自動調節することができる。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video conference system capable of automatically adjusting a volume level during transmission. 2. Description of the Related Art In recent years, a video conference system uses a display device or the like to provide visual information such as characters and figures in real time with a remote party in addition to voice communication means used in conventional telephones. It has been developed as an exchangeable means. At CCITT, video coding and multiplexing systems and communication procedures for audiovisual services have been officially recommended, and with the expansion of corporate activities and the spread of digital communication networks, CCITT
Video conference systems, video TV phones, and the like that comply with the ITT recommendations have been developed. Hereinafter, a conventional video conference system will be described with reference to the drawings. FIG. 3 is a functional block diagram of a conventional video conference system. In FIG. 3, reference numeral 1 denotes a monitor for displaying an image from the other party or a self-portrait, 2 a display control unit for controlling switching of image display on the monitor 1, 3 a video camera for capturing a video, and 4 a video camera. A video camera controller 3 for focusing and angle adjustment 3; a scanner 5 for reading a still image; 6 an image codec for encoding / decoding images captured by the video camera 3 and the scanner 5; A microphone for audio output; 8 a speaker for audio output; 9 an audio codec unit for encoding / decoding audio; 10 a coordinate input unit for operating the magnification and angle of the video camera 3 and performing telewriting; 11 is a telewriting control unit for processing coordinate information from the coordinate input unit 10, 12 is a keyboard for inputting telephone numbers and selecting functions,
Reference numeral 3 denotes a terminal control unit that controls the entire terminal such as data input / output processing between units, and 14 denotes image, audio, and telewriting data according to CCITT Recommendation H.3 A multiplexing / separating unit for multiplexing in a frame format of H.221 (a frame structure of 64 Kbit / s channel in audiovisual teleservice), and for demultiplexing a frame sent from the other party into image and audio telewriting data;
CITT Recommendation H. A BAS (Bitrate Allocation Signal) control unit that executes a communication procedure based on H.242 (a method for setting up communication between audiovisual terminals using digital channels up to 1920 Kbit / s), and 16 connects the terminal to the ISDN line 18 A line interface 17 for managing calls such as incoming and outgoing calls and disconnections, and 18 an ISDN line as a transmission line. [0004] The operation of the conventional video conference system configured as described above will be described below. When the telephone number of the remote terminal is set from the keyboard 12 and the call key is pressed, the terminal control unit 13 notifies the call control processing unit 17, and the call control processing unit 17 communicates with the remote terminal via the line interface 16. Between the B channels.
After the connection is completed, the BAS control unit 15 uses the B channel to transmit H.264. The mode setting based on 242 is performed, and data transmission / reception is started. When transmitting a moving image from the own terminal to the other terminal, the image data recorded by the moving image camera 3 is directly displayed on the monitor 1 of the own device, and the image codec unit 6 uses the moving image compression standard. Some C
CITT Recommendation H. 261 is applied. The still image read by the scanner 5 is subjected to the same processing as the moving image,
According to the mode of the BAS control unit 15, the data is transmitted to the ISDN line 18 via the line interface 16 and transmitted to the partner terminal. The other terminal expands and decodes the received compressed and coded data in the image codec unit 6, and displays an image on the monitor 1 via the display control unit 2 if the image is an image.
When transmitting the voice from the local terminal to the other terminal, the voice codec unit 9 applies the CCITT Recommendation G.10 to the voice data at the volume level input from the microphone 7.
722 or G. 728, and performs coding according to IS
The data is transmitted to the partner terminal via the DN line 18. However, in the above-described conventional video conference system, since the volume of the transmitted voice is fixed, it is possible to cope with a change in the position of the transmitter with respect to the microphone and a change in the volume of the uttered voice. If the speaker is close to the microphone, the volume is too high, and if the speaker is far from the microphone, the volume is too low. Had problems. An object of the present invention is to solve the above-mentioned problem and to provide a video conference system which can automatically change the transmission volume so as to be constant. [0007] In order to achieve the above object, the present invention adds a volume level detection unit and a volume level control unit to the conventional configuration, and provides a focus obtained by a moving image camera control unit. Estimate the speaker's volume level from the distance information and notify the volume level control unit of the initial value of the volume level, and when the transmission starts, the volume level data of the audio data input from the microphone in the volume level control unit the modifications added, if the focal length information from the change in Therefore video camera control unit of the position of the talker is changed is obtained to carry out the change of the volume level setting value at the volume level control unit. The volume level detection unit uses a preset volume level as a threshold, calculates the maximum value of the volume level within a certain period of time from the volume level value obtained for each sampling, compares it with the threshold, and The level control unit transmits a transmission voice based on the volume level estimated from the position of the speaker obtained from the focal length information in the video camera control unit and the comparison result actually obtained by the volume level detection unit. The voice level of the person is automatically adjusted at regular intervals. According to the present invention, with the above-described configuration, the approximate volume level of a sender is estimated from the position of the sender determined from the focal length information given from the moving image camera control unit, and the estimated level is input from the microphone. The actual volume level of the speaker to be transmitted is compared with a predetermined set value, and if the actual volume level is lower than the set value, the set value is increased, and if the actual volume level is higher than the set value, the set value is increased. , The volume level to be transmitted can be automatically adjusted to be constant. An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a functional block diagram of a video conference system according to an embodiment of the present invention, in which a volume level detection unit 19 and a volume level control unit 20 are added to the configuration of the conventional example shown in FIG. That is, in FIG. 1, reference numeral 1 denotes a monitor for displaying an image from the other party or a self-portrait, 2 a display control unit for performing switching control of image display on the monitor 1, 3 a video camera for capturing a video, and 4 a video camera. A video camera controller for adjusting the focus and angle of the camera 3, a scanner 5 for reading a still image, 6 an image codec for encoding / decoding images captured by the video camera 3 and the scanner 5, and a voice 7 An input microphone, 8 is a speaker for audio output, 9 is an audio codec unit for encoding / decoding audio, and 10 is a coordinate input unit for operating the magnification and angle of the video camera 3 and performing telewriting. , 11 are telewriting control units for processing coordinate information from the coordinate input unit 10, and 12 are keys for inputting telephone numbers and selecting functions. Over de, 13 terminal control unit that controls the entire terminal, such as data input and output processing between each section, 14 image, audio, tele-writing data CCITT Recommendation H. 221 (64 Kbit / s for audiovisual teleservices)
A multiplexing / separating unit for multiplexing in the frame format of the s channel (frame structure of the s channel) and for demultiplexing the image and audio telewriting data from the frame transmitted from the partner terminal. 242 (192
BAS (Bitrate Allocat) that executes a communication procedure based on a method for setting up communication between audiovisual terminals using digital channels up to 0 Kbit / s.
ionSignal) control unit, 16 is a line interface for connecting a terminal to the ISDN line 18, 17 is an incoming / outgoing call,
A call control processor 18 for managing calls such as disconnection is an ISDN line as a transmission path. Reference numeral 19 denotes a volume level detection unit which compares the volume level set value with the amplitude of the voice detected by the voice codec unit 9 to determine the volume level.
Reference numeral denotes a sound volume level control unit for relatively adjusting the data of the amplitude part in the audio data based on the position of the sender obtained from the focal length information in the video camera control unit 4 and the comparison result from the sound volume level detection unit 19. . The operation of the video conference system according to the present embodiment configured as described above will be described below. When the telephone number of the other terminal is set from the keyboard 12 and the call key is pressed, the terminal control unit 13
And the call control processing unit 17
The connection of the B channel is performed with the terminal on the other end through the terminal. After the connection is completed, the BAS control unit 1 uses the B channel.
According to H.5. 242 based on the mode setting,
Data transmission / reception is started. When transmitting a moving image from the own terminal to the other terminal, the image data recorded by the moving image camera 3 is directly displayed on the monitor 1 of the own device, and the image codec unit 6 uses the moving image compression standard. Certain CCITT Recommendation H. 261 and perform encoding according to
According to the mode of the AS control unit 15, the line interface 1
6 to the ISDN line 18 and to the destination terminal. In the other terminal, the received compression-encoded data is decoded by the image codec unit 6. A still image read by the scanner 5 is subjected to the same processing as a moving image, and if it is an image, the still image is displayed on the monitor 1 via the display control unit 2. Next, a case where voice is transmitted from the local terminal to the remote terminal will be described with reference to a volume level transition chart shown in FIG. First, after activation, the position of the speaker is confirmed from the focal length information obtained by the video camera controller 4, the volume level of the speaker is estimated, and the initial value of the volume level is notified to the volume level controller 20. (Section A). When the transmission is started, the volume level control unit 20 corrects the data of the amplitude portion of the voice data input from the microphone 7. In other words, the peak of the volume level is detected by the volume level detection unit 19 at regular intervals (tx),
If the actually obtained volume level is smaller than the peak value of the volume level set in advance as a reference, the volume level set value previously set from the focal length information is increased (section B), and conversely. If the volume level actually obtained is high, the volume level set value in the volume level control unit 20 is reduced (section C). Next, when it is determined from the focal length information obtained from the moving image camera controller 4 that the position of the speaker has changed, the volume level set value is similarly changed in the volume level controller 20 (section). D). The audio data after the volume level has been modified is encoded by the audio codec unit 9 and multiplexed by the multiplexing / demultiplexing unit 14 in the same manner as in the conventional example, and then the video data is processed. Similarly, it is transmitted to the partner terminal via the ISDN line 18. In the case of reception, the audio coded data received from the partner terminal is decoded by the audio codec 9 and output to the speaker 8. As described above, according to the present invention, the sound volume level is determined by comparing a predetermined sound volume level setting value with the amplitude of the sound detected from the sound codec unit. A level detector, and a volume level controller that adjusts the volume level set value at regular intervals based on the position of the speaker obtained from the focal length information in the video camera controller and the comparison result in the volume level detector. Estimating the speaker's volume level from the focal length information obtained by the video camera control unit and notifying the volume level control unit of the initial value of the volume level, and when the transmission is started, the volume level control unit the data to modify the amplitude portion of the input voice data added, the volume Les If the focal length information from thus moving the camera control unit to change the position of the talker is changed Since the volume level set value is changed in the bell control unit, a change in the volume of the speaker can be reliably detected, and the volume level can be reduced before performing data compression after analog-digital conversion. Since the adjustment is performed, the transmission volume level can be automatically adjusted with a simple configuration without depending on each audio coding method.

【図面の簡単な説明】 【図1】本発明の一実施例におけるテレビ会議システム
の機能ブロック図。 【図2】本発明の一実施例における音量レベルの推移を
示すタイムチャート。 【図3】従来のテレビ会議システムの機能ブロック図。 【符号の説明】 1 モニタ 2 表示制御部 3 動画カメラ 4 動画カメラ制御部 5 スキャナ 6 画像コーデック部 7 マイク 8 スピーカ 9 音声コーデック部 10 座標入力部 11 テレライティング制御部 12 キーボード 13 端末制御部 14 多重化/分離部 15 BAS制御部 16 回線インタフェース 17 呼制御処理部 18 ISDN回線 19 音量レベル検知部 20 音量レベル制御部
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a functional block diagram of a video conference system according to an embodiment of the present invention. FIG. 2 is a time chart showing a transition of a sound volume level in one embodiment of the present invention. FIG. 3 is a functional block diagram of a conventional video conference system. [Description of Signs] 1 monitor 2 display control unit 3 video camera 4 video camera control unit 5 scanner 6 image codec unit 7 microphone 8 speaker 9 audio codec unit 10 coordinate input unit 11 telewriting control unit 12 keyboard 13 terminal control unit 14 multiplexing Separation / separation unit 15 BAS control unit 16 Line interface 17 Call control processing unit 18 ISDN line 19 Volume level detection unit 20 Volume level control unit

Claims (1)

(57)【特許請求の範囲】 【請求項1】 音声信号と画像信号とを符号化し、通信
回線を介して送信するテレビ会議システムにおいて、 自側の動画カメラの焦点合わせとアングルの調整を行な
う動画カメラ制御部と、 マイクから入力した音声を符号化する音声コーデック部
と、 予め定められた音量レベル設定値と前記音声コーデック
部から検出された音声の振幅とを比較して音量レベルの
判定を行なう音量レベル検知部と、 前記動画カメラ制御部における焦点距離情報から得られ
る送話者の位置および前記音量レベル検知部における比
較結果に基づいて一定間隔で前記音量レベル設定値を調
整する音量レベル制御部とを備え、 前記動画カメラ制御部で得られる焦点距離情報から送話
者の音量レベルを推定するとともに前記音量レベル制御
部へ音量レベルの初期値を通知し、送話が開始されると
前記音量レベル制御部においてマイクから入力した音声
データの振幅部分のデータに修正を加え、送話者の位置
の変化によって動画カメラ制御部からの焦点距離情報が
変化した場合は音量レベル制御部での音量レベル設定値
の変更を行ない、また、 振幅部分のデータの修正は、音量レベル検知部が一定の
間隔で音量レベルのピークを検知し、予め基準用として
設定される音量レベルのピーク値と比較し、実際に得ら
れる音量レベルが小さいようであれば、前に焦点距離情
報から設定された音量レベル設定値を引き上げ、実際に
得られる音量レベルが大きいようであれば音量レベル設
定値を引き下げるようにすることを特徴とする テレビ会
議システム。
(57) [Claim 1] In a video conference system that encodes an audio signal and an image signal and transmits the encoded signal via a communication line, focus adjustment and angle adjustment of a video camera on the own side are performed. A video camera control unit; an audio codec unit that encodes audio input from a microphone; and a predetermined volume level set value and a sound amplitude detected from the audio codec unit. A volume level detection unit to be performed; and a volume level control for adjusting the volume level set value at regular intervals based on a position of a speaker obtained from focal length information in the video camera control unit and a comparison result in the volume level detection unit. And estimating the volume level of the speaker from the focal length information obtained by the video camera control unit, and Notifies the initial value of the quantity level, the data to modify the amplitude portion of the audio data inputted from the microphone in the sound volume level control section and the transmission is started addition, thus moving the camera to change the position of the talker If the focal length information from the control unit changes had row changes volume level setting value at the volume level control unit, also fixes the data of the amplitude portion, the volume level detecting unit is constant
Detect the peak of the volume level at intervals, and use it as a reference
Compare with the set volume level peak value and
If the volume level seems to be low,
The volume level set value from the
If the volume level obtained is high, set the volume level.
A video conference system characterized by lowering the fixed value .
JP03911593A 1993-02-26 1993-02-26 Video conference system Expired - Fee Related JP3512828B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03911593A JP3512828B2 (en) 1993-02-26 1993-02-26 Video conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03911593A JP3512828B2 (en) 1993-02-26 1993-02-26 Video conference system

Publications (2)

Publication Number Publication Date
JPH06253305A JPH06253305A (en) 1994-09-09
JP3512828B2 true JP3512828B2 (en) 2004-03-31

Family

ID=12544090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03911593A Expired - Fee Related JP3512828B2 (en) 1993-02-26 1993-02-26 Video conference system

Country Status (1)

Country Link
JP (1) JP3512828B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100565184B1 (en) * 1998-12-08 2006-06-13 엘지전자 주식회사 Volume Control Circuit of Collective Video Conference System
JP5134876B2 (en) 2007-07-11 2013-01-30 株式会社日立製作所 Voice communication apparatus, voice communication method, and program
JP5418327B2 (en) * 2010-03-16 2014-02-19 株式会社リコー Video conferencing equipment
JP6089268B2 (en) * 2012-09-07 2017-03-08 パナソニックIpマネジメント株式会社 Residential security system

Also Published As

Publication number Publication date
JPH06253305A (en) 1994-09-09

Similar Documents

Publication Publication Date Title
US5473366A (en) Television-telephone apparatus having a message-keeping function and an automatic response transmission function
US20020093531A1 (en) Adaptive display for video conferences
JP3330183B2 (en) Image communication terminal
JP3512828B2 (en) Video conference system
JPH0738863A (en) Image communication terminal equipment
KR20020096486A (en) Remote supervisory apparatus and method using mobile phone
JPH1093940A (en) Video telephone system for remote monitoring
KR0153607B1 (en) Method of connecting a call of a videophone
JPH0998397A (en) Video telephone set and video telephone communication method
KR20000039400A (en) Method for transmitting intraimages in video telephone
JP3202575B2 (en) Videophone equipment
JP3334253B2 (en) Video communication device
JP3065647B2 (en) Multimedia terminal and its received video display method
JPH0662396A (en) Picture communication terminal equipment
JPH06296277A (en) Video telephone system
KR100397692B1 (en) A photograph telephone
JP2001016558A (en) System and method for communication and terminal device
KR0180712B1 (en) Video conferencing system for recognizing meeting participant and method thereof
JP3475541B2 (en) Image communication terminal device
JPH05219500A (en) Visual telephone set
JPH08130514A (en) Picture communication terminal equipment
JP3332479B2 (en) Image communication terminal device and freeze control method
JPH07222125A (en) Video telephone system
JPH08205109A (en) Image communication terminal equipment
JPH04124985A (en) Multimedia communication equipment

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040108

LAPS Cancellation because of no payment of annual fees