JPH1032804A - Video conference equipment - Google Patents

Video conference equipment

Info

Publication number
JPH1032804A
JPH1032804A JP8201023A JP20102396A JPH1032804A JP H1032804 A JPH1032804 A JP H1032804A JP 8201023 A JP8201023 A JP 8201023A JP 20102396 A JP20102396 A JP 20102396A JP H1032804 A JPH1032804 A JP H1032804A
Authority
JP
Japan
Prior art keywords
camera
zoom
level
zoom level
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8201023A
Other languages
Japanese (ja)
Inventor
Hideki Otsuki
英樹 大槻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP8201023A priority Critical patent/JPH1032804A/en
Publication of JPH1032804A publication Critical patent/JPH1032804A/en
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a video conference equipment which can realize a noise elimination function, corresponding to a zoom level of a camera. SOLUTION: This equipment is provided with a camera 8 which is provided with a zoom function, a microphone 1 which inputs a voice for an area picked up by the camera 8, a control part 9 which controls zooming of the camera 8 and recognizes a zoom level and a noise elimination means (DSP: digital signal processing circuit) 3, and the part 9 sets such a noise elimination level in the following way, in response to the zoom level of the camera 8. The higher the zoom level becomes, the higher a noise elimination level of the means 3 becomes.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、テレビ会議装置に
係わり、特にその音声制御技術に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video conference apparatus, and more particularly to a voice control technique for the same.

【0002】[0002]

【従来の技術】一般に、テレビ会議装置において使用さ
れているカメラは、ズーム機能が付いているものが多
い。参加者全員を写し、会議全体の雰囲気を画像にした
い場合はズームレベルを低くし(ワイドという)、発言
者一人をクローズアップしたい場合はズームレベルを高
くする(テレという)、というように使い分けられる。
2. Description of the Related Art In general, many cameras used in video conference equipment have a zoom function. If you want to capture all participants and make the atmosphere of the whole meeting an image, lower the zoom level (called wide), and if you want to close up one speaker, raise the zoom level (called tele). .

【0003】また同時に、テレビ会議装置では、マイク
からの入力音声に対してノイズ除去機能を有するものが
多い。このノイズ除去機能は、入力音声のレベルやエネ
ルギー値に応じて、それらがある程度以下の場合はノイ
ズと見なしてカットする、という制御を行う。このカッ
トするスレッシュ値(ノイズ除去レベル)は予め固定的
に設定される。
At the same time, many video conference devices have a function of removing noise from voice input from a microphone. This noise removal function performs control such that if the level is below a certain level, it is regarded as noise and cut according to the level or energy value of the input voice. The threshold value (noise removal level) to be cut is fixedly set in advance.

【0004】また、ITU−T勧告G722などの16
KHz音声コーデックなどを行う場合、そのエコーキャ
ンセル機能において、一般的な8KHz音声コーデック
の場合と同等の処理量に押さえるため、入力音声の帯域
を二つに分割し、高音域は余りエコー成分がないことを
利用して、エコーキャンセル処理ではなく、ノイズ除去
処理でこれに対応するようにしている。この高域ノイズ
除去機能はノイズサプレッサと呼ばれており、このとき
の作動参照値はノイズサプレッサ係数として予め固定的
に設定される。
In addition, 16 standards such as ITU-T recommendation G722
In the case of performing a KHz voice codec or the like, the echo canceling function divides the input voice band into two in order to reduce the processing amount to the same level as that of a general 8 KHz voice codec, and the high frequency range has little echo component. Taking advantage of this fact, the noise is removed instead of the echo cancellation processing. This high-frequency noise removal function is called a noise suppressor, and the operation reference value at this time is fixedly set in advance as a noise suppressor coefficient.

【0005】さらに、マイク入力にオートゲインコント
ロール機能(AGC)を有するものの場合、予め固定的
に設定された反応速度係数に基づき、ワイドなどの場合
の小さな入力音声に対してはゲインを大きくして音量を
上げ、テレなどの場合の大きな入力音声に対してはゲイ
ンを小さくして音量を下げるようにしている。
Further, when the microphone input has an automatic gain control function (AGC), the gain is increased for small input voices such as wide ones based on a reaction speed coefficient fixedly set in advance. The volume is raised, and the volume is lowered by decreasing the gain for a loud input voice in the case of tele or the like.

【0006】[0006]

【発明が解決しようとする課題】ところが、このような
従来のテレビ会議装置においては、前述したように、ノ
イズ除去機能におけるカットするスレッシュ値(ノイズ
除去レベル)が固定であったため、ズームに対応した音
声の臨場感の変化が得られなかった。つまり、ノイズ除
去レベルを比較的大きく設定すると、ワイドのとき参加
者は有意な発言でも比較的小さな声で話すため、有意な
発言がノイズとしてカットされてしまう。また、ノイズ
除去レベルを比較的小さく設定すると、テレの場合に話
者以外の声まで入ってしまい、話者の音声が聞き取りに
くくなる。テレの場合は、ある特定の人(話者)がある
程度はっきりと大きな声で発言していると思われるた
め、ノイズと見なしてカットすべきレベルは大きめでも
かまわない。反面、ワイドの場合、全員がやや小声で話
している可能性があるため、ノイズと見なすレベルは下
げるべきである。これは、ノイズサプレッサと呼ばれる
高域ノイズ除去機能においても言えることである。
However, in such a conventional video conference apparatus, as described above, the threshold value (noise elimination level) to be cut by the noise elimination function is fixed, and therefore, the zooming function is supported. No change in the presence of the sound was obtained. In other words, if the noise removal level is set to a relatively large value, the participants speak with a relatively small voice even if the speech is significant in the wide range, so that the significant speech is cut off as noise. Also, if the noise removal level is set to a relatively small level, even voices other than the speaker enter in the case of telephoto, making it difficult to hear the voice of the speaker. In the case of tele, it is considered that a certain person (speaker) speaks with a loud voice to some extent, so that the level to be cut as noise may be higher. On the other hand, if you're wide, everyone may be talking a little quietly, so the level of noise should be reduced. This is also true for a high-frequency noise removal function called a noise suppressor.

【0007】また、マイク入力にオートゲインコントロ
ール機能を有するものの場合、やはり、テレの場合は有
意な発言が大きな音量で入り、ワイドの場合は小さいと
見なせるが、従来装置の場合は反応速度係数が固定的に
設定されているため、ズームに最適なオートゲインコン
トロールを実現することができなかった。
[0007] In the case of a microphone input having an auto gain control function, a significant speech comes in at a large volume in the case of tele, and it can be regarded as small in the case of wide, but the response speed coefficient is reduced in the case of the conventional device. Because of the fixed setting, it was not possible to achieve optimal auto gain control for zooming.

【0008】そこで、本発明はこのような問題点を解決
するためになされたものであり、ズームレベルに対応し
たノイズ除去機能を実現できるテレビ会議装置を提供す
ることを目的とするものである。
Accordingly, the present invention has been made to solve such a problem, and an object of the present invention is to provide a video conference apparatus capable of realizing a noise removing function corresponding to a zoom level.

【0009】また、ノイズサプレッサと呼ばれる高域ノ
イズ除去機能においても、ズームレベルに対応したノイ
ズ除去機能を実現できるテレビ会議装置を提供すること
を目的とするものである。
It is another object of the present invention to provide a video conference apparatus capable of realizing a noise removing function corresponding to a zoom level even in a high-frequency noise removing function called a noise suppressor.

【0010】また、その時々のズームに最適なオートゲ
インコントロール機能を実現できるテレビ会議装置を提
供することを目的とするものである。
It is another object of the present invention to provide a video conference apparatus capable of realizing an automatic gain control function which is optimal for each zoom.

【0011】[0011]

【課題を解決するための手段】上記目的を達成するため
に、本願の請求項1に記載の発明は、ズーム機能を有す
るカメラと、このカメラが撮影する領域の音声を入力す
るマイクと、前記カメラのズームを制御し、ズームレベ
ルを認識する制御部と、前記マイクからの入力音声に対
して予め設定されたノイズ除去レベルに基づきノイズ除
去を行うノイズ除去手段とを備え、前記制御部は、カメ
ラのズームレベルに応じて、ズームレベルが高くなるほ
ど前記ノイズ除去手段のノイズ除去レベルを高く設定す
るようにしたものである。
According to one aspect of the present invention, a camera having a zoom function, a microphone for inputting sound in an area photographed by the camera, A control unit that controls the zoom of the camera and recognizes a zoom level, and a noise removing unit that removes noise based on a preset noise removal level with respect to the input voice from the microphone, and the control unit includes: According to the zoom level of the camera, the higher the zoom level, the higher the noise elimination level of the noise elimination means is set.

【0012】また、請求項2に記載の発明は、ズーム機
能を有するカメラと、このカメラが撮影する領域の音声
を入力するマイクと、前記カメラのズームを制御し、ズ
ームレベルを認識する制御部と、エコーキャンセル機能
として、入力音声を低域と高域に帯域分割し、低域はエ
コーキャンセル処理を行い、高域は予め設定されたノイ
ズサプレッサ係数に基づきノイズ除去処理を行った後、
それらを帯域合成するエコーキャンセラとを備え、前記
制御部は、カメラのズームレベルに応じて、ズームレベ
ルが高くなるほど前記エコーキャンセラのノイズサプレ
ッサ係数を高く設定するようにしたものである。
According to a second aspect of the present invention, there is provided a camera having a zoom function, a microphone for inputting sound in an area photographed by the camera, and a control unit for controlling the zoom of the camera and recognizing a zoom level. And, as an echo canceling function, the input voice is divided into low and high bands, low band is subjected to echo cancellation processing, and high band is subjected to noise removal processing based on a preset noise suppressor coefficient.
An echo canceller that combines the bands with each other, wherein the control unit sets the noise suppressor coefficient of the echo canceller higher as the zoom level increases in accordance with the zoom level of the camera.

【0013】また、請求項3に記載の発明は、ズーム機
能を有するカメラと、このカメラが撮影する領域の音声
を入力するマイクと、前記カメラのズームを制御し、ズ
ームレベルを認識する制御部と、前記マイクからの入力
音声に対して予め設定された反応速度係数に基づきゲイ
ンを自動調整するオートゲインコントローラとを備え、
前記制御部は、カメラのズームレベルに応じて、ズーム
レベルが高くなるほど前記オートゲインコントーラの反
応速度係数を小さく設定し、大きい音量に対してはオー
トゲインコントローラの反応速度を速くし、小さい音量
に対しては反応速度を遅くするようにしたものである。
According to a third aspect of the present invention, there is provided a camera having a zoom function, a microphone for inputting sound in an area photographed by the camera, and a control unit for controlling the zoom of the camera and recognizing a zoom level. An automatic gain controller that automatically adjusts the gain based on a reaction speed coefficient set in advance for the input voice from the microphone,
The control unit, according to the zoom level of the camera, sets a smaller response speed coefficient of the auto gain controller as the zoom level becomes higher, and increases the response speed of the auto gain controller for a large volume, and sets the response speed to a small volume. On the other hand, the reaction speed is reduced.

【0014】[0014]

【発明の実施の形態】以下、本願の各発明の実施形態を
図面を参照して説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0015】図1は、本願の各発明に係るテレビ会議装
置の実施形態を示すブロック図であり、ここでは発明に
係る要部(主に音声処理系)のみを示す。
FIG. 1 is a block diagram showing an embodiment of a video conference apparatus according to each invention of the present application. Here, only a main part (mainly an audio processing system) according to the invention is shown.

【0016】図において、1はマイクで、2はマイク1
から入力されるアナログ音声信号を所定のサンプリング
周波数でサンプリングしてA/D変換し、デジタル音声
信号にするA/Dコンバータである。
In the figure, 1 is a microphone, 2 is a microphone 1
This is an A / D converter which samples an analog audio signal input from the A / D converter at a predetermined sampling frequency and A / D converts the analog audio signal into a digital audio signal.

【0017】3は入力デジタル信号にソフトウエアによ
る各種デジタル処理を施して各種処理機能を実現可能な
DSP回路(デジタル信号処理回路)で、ここでは当該
DSP回路3により、前記A/Dコンバータ2からのデ
ジタル音声信号に対するノイズ除去機能とエコーキャン
セル機能とAGC(オートゲインコントロール)機能が
実現されている。また、4も上記と同様なDSP回路
で、このDSP回路4は音声CODEC(コーデック)
用で、前記DSP回路3から出力される送信用の音声デ
ータの符号化と、受信した符号化音声データの復号化処
理を行う。なお、上記各DSP回路3,4は、その周辺
機器であるROMやRAMを内蔵しているものとする。
Reference numeral 3 denotes a DSP circuit (digital signal processing circuit) capable of performing various digital processing by software on an input digital signal to realize various processing functions. , A noise removal function, an echo cancellation function, and an AGC (auto gain control) function for the digital audio signal. 4 is a DSP circuit similar to the above, and this DSP circuit 4 is a voice CODEC (codec).
In this case, encoding of transmission audio data output from the DSP circuit 3 and decoding of the received encoded audio data are performed. Each of the DSP circuits 3 and 4 has a built-in ROM and RAM as its peripheral devices.

【0018】5はISDN等の通信回線に接続され、テ
レビ会議通信に係る各種プロトコル制御を行う通信制御
装置である。
Reference numeral 5 denotes a communication control device which is connected to a communication line such as an ISDN and performs various protocol controls related to video conference communication.

【0019】6は受信した音声データが前記音声COD
EC用のDSP回路4で復号化されて出力されるデジタ
ル音声信号をD/A変換して、得られたアナログ音声信
号をスピーカ7に出力するD/Aコンバータである。な
お、DSP回路4から出力される受信デジタル音声信号
はもう一つのDSP回路3に入力されており、そのエコ
ーキャンセル機能で使用される。
6 indicates that the received voice data is the voice COD.
This is a D / A converter that D / A converts a digital audio signal decoded and output by the EC DSP circuit 4 and outputs the obtained analog audio signal to the speaker 7. Note that the received digital audio signal output from the DSP circuit 4 is input to another DSP circuit 3 and is used in its echo canceling function.

【0020】8はズーム機能付きカメラ、9は前記カメ
ラ8、各DSP回路3,4、通信制御装置5、さらには
図示しない装置各部を制御する制御部であり、CPU,
ROM,RAM等から成る。ここでは、この制御部9に
よりカメラ8のズームが制御されており、制御部9はカ
メラ8のズームレベルを常に認識している。
Reference numeral 8 denotes a camera with a zoom function. Reference numeral 9 denotes a control unit for controlling the camera 8, each of the DSP circuits 3 and 4, the communication control unit 5, and each unit of the device (not shown).
It is composed of ROM, RAM and the like. Here, the zoom of the camera 8 is controlled by the control unit 9, and the control unit 9 always recognizes the zoom level of the camera 8.

【0021】次に、このように構成されたテレビ会議装
置の動作について説明する。
Next, the operation of the video conference apparatus configured as described above will be described.

【0022】まず、請求項1記載の発明の実施形態に係
る動作を、図2に示すフローチャートと図3に示すズー
ムレベル・ノイズ除去レベル対応表を参照して説明す
る。
First, the operation according to the embodiment of the present invention will be described with reference to a flowchart shown in FIG. 2 and a zoom level / noise removal level correspondence table shown in FIG.

【0023】制御部9は、カメラ8のズームを制御する
とともに、常時、ズームレベルを認識してズームレベル
が変化したか否かをチェックしている(判断101のN
oループ)。ズームレベルの変化を検知すると、その時
のズームレベルをチェックする(判断101のYes→
処理102)。そして、図3に示すように予め設定され
ているズームレベル・ノイズ除去レベル対応表を参照し
て、その時のズームレベルに対応するノイズ除去レベル
を決定し、DSP回路3に制御データとして出力して、
そのノイズ除去機能部にセットする(処理103)。そ
して、再び上記判断101に戻り、ズームレベルの変化
を監視する。
The control unit 9 controls the zoom of the camera 8 and constantly recognizes the zoom level and checks whether the zoom level has changed (N in decision 101).
o loop). When a change in the zoom level is detected, the zoom level at that time is checked (Yes in decision 101 →
Process 102). Then, referring to a preset zoom level / noise elimination level correspondence table as shown in FIG. 3, a noise elimination level corresponding to the zoom level at that time is determined, and output to the DSP circuit 3 as control data. ,
It is set in the noise removal function section (process 103). Then, the process returns to the determination 101 again, and the change in the zoom level is monitored.

【0024】音声処理系では、マイク1から音声を取り
込み、A/Dコンバータ2でデジタルデータに変換し、
DSP回路3に転送する。DSP回路3は、入力された
デジタル音声データに対して、前記制御部9によりセッ
トされたノイズ除去レベルに従ってノイズ除去処理を行
う。DSP回路3から出力された音声データは、次のD
SP回路4によって所定の符号化処理を施され、通信制
御装置5を介して回線に送出され、相手側のテレビ会議
装置に送られる。
In the audio processing system, audio is taken in from the microphone 1 and converted into digital data by the A / D converter 2.
Transfer to the DSP circuit 3. The DSP circuit 3 performs a noise removal process on the input digital audio data according to the noise removal level set by the control unit 9. The audio data output from the DSP circuit 3 is
A predetermined encoding process is performed by the SP circuit 4, sent out to the line via the communication control device 5, and sent to the other party's video conference device.

【0025】このようにして、カメラ8のズームレベル
から音場での有意音声のレベルの大きさを判断し、ノイ
ズ除去レベルを変化させるため、その時の会議の内容に
適したノイズ除去機能を動作させることができる。
In this manner, the level of the significant voice in the sound field is determined from the zoom level of the camera 8 and the noise elimination level is changed, so that the noise elimination function suitable for the contents of the conference at that time is operated. Can be done.

【0026】次に、請求項2記載の発明の実施形態に係
る動作を、図4に示すフローチャートと図5に示すズー
ムレベル・ノイズサプレッサ係数対応表を参照して説明
する。
Next, the operation according to the second embodiment of the present invention will be described with reference to a flowchart shown in FIG. 4 and a zoom level / noise suppressor coefficient correspondence table shown in FIG.

【0027】まず、エコーキャンセラの動作について、
簡単に説明する。エコーキャンセラは、受信して会議室
内に出力する音声信号に所定のフィルタ演算を施すこと
により、擬似エコー信号を作り出し、これを入力音声信
号から減ずることで、エコー除去を行う。
First, the operation of the echo canceller will be described.
A brief description will be given. The echo canceller generates a pseudo echo signal by performing a predetermined filter operation on the audio signal received and output into the conference room, and performs echo removal by subtracting the pseudo echo signal from the input audio signal.

【0028】その原理は、例えば、8KHzサンプリン
グの場合で、0.1秒(エコーの残響時間)のエコーキ
ャンセルを行う場合、800サンプルについて800の
係数を用意し、1サンプル(125μs間)について8
00次の積和演算を行うのが基本である。すると、16
KHzの場合、1600次の積和演算を、上記の半分の
62.5μs間に行わなければならないため、約4倍の
演算能力を必要とすることになる。
The principle is that, for example, in the case of 8 KHz sampling, when performing echo cancellation of 0.1 second (echo reverberation time), 800 coefficients are prepared for 800 samples, and 8 coefficients are obtained for one sample (for 125 μs).
Basically, a 00-order product-sum operation is performed. Then 16
In the case of KHz, since the 1600-order product-sum operation must be performed within 62.5 μs, which is the half of the above, about four times the calculation capability is required.

【0029】そこで、16KHzの場合、高域と低域の
二つに帯域分割し、それぞれを8KHzのデータとして
扱う、という技術がある。このとき、高域にはエコー成
分は余りないことから、低域のみエコーキャンセル処理
を行い、高域はノイズ除去処理を行った後、元の16K
Hzに再合成するものである。すなわち、16KHzの
エコーキャンセラに上述したのと同様のノイズ除去機能
(ノイズサプレッサ)が含まれる場合がある。
In the case of 16 KHz, there is a technique that divides the frequency band into a high frequency band and a low frequency band, and treats each band as 8 KHz data. At this time, since there is not much echo component in the high band, echo cancellation processing is performed only in the low band, noise removal processing is performed in the high band, and the original 16K
Hz. That is, the 16 kHz echo canceller may include the same noise removing function (noise suppressor) as described above.

【0030】その場合において、本実施形態では、前記
実施形態におけるノイズ除去機能の制御を同様の制御
を、このノイズサプレッサについて行う。
In this case, in the present embodiment, the same control as the control of the noise removing function in the above embodiment is performed for this noise suppressor.

【0031】すなわち、制御部9は、カメラ8のズーム
レベルが変化したか否かをチェックし(図4の判断20
1のNoループ)、ズームレベルの変化を検知すると、
その時のズームレベルをチェックする(判断201のY
es→処理202)。そして、図5に示すように予め設
定されているズームレベル・ノイズサプレッサ係数対応
表を参照して、その時のズームレベルに対応するノイズ
サプレッサ係数を決定し、DSP回路3に制御データと
して出力して、そのエコーキャンセル機能部にセットす
る(処理203)。そして、再び上記判断201に戻
り、ズームレベルの変化を監視する。
That is, the control unit 9 checks whether or not the zoom level of the camera 8 has changed (determination 20 in FIG. 4).
1 No loop), when a change in zoom level is detected,
Check the zoom level at that time (Y in decision 201)
es → process 202). Then, referring to a preset zoom level / noise suppressor coefficient correspondence table as shown in FIG. 5, a noise suppressor coefficient corresponding to the zoom level at that time is determined, and is output to the DSP circuit 3 as control data. Is set in the echo cancel function section (process 203). Then, the process returns to the judgment 201 again to monitor the change of the zoom level.

【0032】音声処理系では、マイク1から音声を取り
込み、A/Dコンバータ2でデジタルデータに変換し、
DSP回路3に転送する。DSP回路3は、入力された
デジタル音声データに対して、前記制御部9によりセッ
トされたノイズサプレッサ係数に従った高域ノイズ除去
処理を含むエコーキャンセル処理を行う。DSP回路3
から出力された音声データは、次のDSP回路4によっ
て所定の符号化処理を施され、通信制御装置5を介して
回線に送出され、相手側のテレビ会議装置に送られる。
In the audio processing system, audio is taken in from the microphone 1 and converted into digital data by the A / D converter 2.
Transfer to the DSP circuit 3. The DSP circuit 3 performs an echo canceling process on the input digital audio data, including a high-frequency noise removing process according to the noise suppressor coefficient set by the control unit 9. DSP circuit 3
The audio data output from is subjected to a predetermined encoding process by the next DSP circuit 4, sent out to the line via the communication control device 5, and sent to the other party's video conference device.

【0033】このようにして、カメラ8のズームレベル
から音場での有意音声のレベルの大きさを判断し、エコ
ーキャンセル機能におけるノイズサプレッサの動作レベ
ルを変化させるため、その時の会議の内容に適したノイ
ズサプレッサ機能を動作させることができる。
In this way, the level of the significant sound level in the sound field is determined from the zoom level of the camera 8 and the operation level of the noise suppressor in the echo canceling function is changed, so that it is suitable for the contents of the conference at that time. Noise suppressor function can be operated.

【0034】次に、請求項3記載の発明の実施形態に係
る動作を、図6に示すフローチャートと図7に示すズー
ムレベル・AGC反応速度係数対応表を参照して説明す
る。
Next, the operation according to the third embodiment of the present invention will be described with reference to the flowchart shown in FIG. 6 and the zoom level / AGC reaction speed coefficient correspondence table shown in FIG.

【0035】前述してきた実施形態同様、制御部9は、
カメラ8のズームを制御するとともに、常時、ズームレ
ベルを認識してズームレベルが変化したか否かをチェッ
クしている(判断301のNoループ)。ズームレベル
の変化を検知すると、その時のズームレベルをチェック
する(判断301のYes→処理302)。そして、図
7に示すように予め設定されているズームレベル・AG
C反応速度係数対応表を参照して、その時のズームレベ
ルに対応するAGC反応速度係数を決定し、DSP回路
3に制御データとして出力して、そのAGC機能部にセ
ットする(処理303)。そして、再び上記判断301
に戻り、ズームレベルの変化を監視する。
As in the above-described embodiment, the control unit 9
In addition to controlling the zoom of the camera 8, the zoom level is always recognized to check whether the zoom level has changed (No loop of the determination 301). When the change in the zoom level is detected, the zoom level at that time is checked (Yes in determination 301 → process 302). Then, as shown in FIG. 7, a preset zoom level / AG
The AGC reaction speed coefficient corresponding to the zoom level at that time is determined with reference to the C reaction speed coefficient correspondence table, output to the DSP circuit 3 as control data, and set in the AGC function unit (process 303). And, again, the above-mentioned judgment 301
Return to and monitor the change in zoom level.

【0036】音声処理系では、マイク1から音声を取り
込み、A/Dコンバータ2でデジタルデータに変換し、
DSP回路3に転送する。DSP回路3は、入力された
デジタル音声データに対して、前記制御部9によりセッ
トされたAGC反応速度係数に従ってオートゲインコン
トロール処理を行う。DSP回路3から出力された音声
データは、次のDSP回路4によって所定の符号化処理
を施され、通信制御装置5を介して回線に送出され、相
手側のテレビ会議装置に送られる。
In the audio processing system, audio is taken in from the microphone 1 and converted into digital data by the A / D converter 2.
Transfer to the DSP circuit 3. The DSP circuit 3 performs an automatic gain control process on the input digital audio data according to the AGC reaction speed coefficient set by the control unit 9. The audio data output from the DSP circuit 3 is subjected to a predetermined encoding process by the next DSP circuit 4, sent out to the line via the communication control device 5, and sent to the other party's video conference device.

【0037】このようにして、カメラ8のズームレベル
から音場での有意音声のレベルの大きさを判断し、オー
トゲインコントローラの反応速度係数を変化させるた
め、テレのときの大きい音量に対してはオートゲインコ
ントローラの反応速度が速くなり、ワイドのときの小さ
い音量に対しては反応速度が遅くなるので、その時の会
議の内容に適したオートゲインコントロール機能を動作
させることができる。
In this manner, the level of the significant sound level in the sound field is determined from the zoom level of the camera 8 and the response speed coefficient of the auto gain controller is changed. Since the response speed of the auto gain controller becomes faster and the response speed becomes slower for a small sound volume when the camera is wide, the auto gain control function suitable for the content of the conference at that time can be operated.

【0038】なお、上記実施形態においては、説明を分
かりやすくするため、請求項1に対応するノイズ除去機
能と、請求項2に対応するエコーキャンセル機能と、請
求項3に対応するAGC機能を個別に説明したが、これ
らはそれぞれ単独に行われても良いし、それらのうちの
2つ又全てを同時に行うようにしても良い。
In the above embodiment, the noise removing function according to the first aspect, the echo canceling function according to the second aspect, and the AGC function according to the third aspect are separately described for easy understanding. As described above, these may be performed independently, or two or all of them may be performed simultaneously.

【0039】[0039]

【発明の効果】以上のように、本願の請求項1記載の発
明によれば、ズーム機能を有するカメラと、このカメラ
が撮影する領域の音声を入力するマイクと、前記カメラ
のズームを制御し、ズームレベルを認識する制御部と、
前記マイクからの入力音声に対して予め設定されたノイ
ズ除去レベルに基づきノイズ除去を行うノイズ除去手段
とを備え、前記制御部は、カメラのズームレベルに応じ
て、ズームレベルが高くなるほど前記ノイズ除去手段の
ノイズ除去レベルを高く設定するようにしたので、カメ
ラのズームレベルから音場での有意音声のレベルの大き
さを判断し、ノイズ除去レベルを変化させるため、その
時の会議の内容に適したノイズ除去機能を動作させるこ
とができる効果がある。
As described above, according to the first aspect of the present invention, a camera having a zoom function, a microphone for inputting audio of an area photographed by the camera, and a zoom of the camera are controlled. A control unit for recognizing a zoom level,
Noise removing means for removing noise based on a noise removal level set in advance for the input sound from the microphone, wherein the controller removes the noise as the zoom level becomes higher according to the zoom level of the camera. Because the noise reduction level of the means is set high, the level of the significant sound in the sound field is determined from the zoom level of the camera, and the noise reduction level is changed, so it is suitable for the contents of the meeting at that time There is an effect that the noise removing function can be operated.

【0040】また、請求項2記載の発明によれば、ズー
ム機能を有するカメラと、このカメラが撮影する領域の
音声を入力するマイクと、前記カメラのズームを制御
し、ズームレベルを認識する制御部と、エコーキャンセ
ル機能として、入力音声を低域と高域に帯域分割し、低
域はエコーキャンセル処理を行い、高域は予め設定され
たノイズサプレッサ係数に基づきノイズ除去処理を行っ
た後、それらを帯域合成するエコーキャンセラとを備
え、前記制御部は、カメラのズームレベルに応じて、ズ
ームレベルが高くなるほど前記エコーキャンセラのノイ
ズサプレッサ係数を高く設定するようにしたので、カメ
ラのズームレベルから音場での有意音声のレベルの大き
さを判断し、エコーキャンセル機能におけるノイズサプ
レッサの動作レベルを変化させるため、その時の会議の
内容に適したノイズサプレッサ機能を動作させることが
できる効果がある。
According to the second aspect of the present invention, a camera having a zoom function, a microphone for inputting sound in an area photographed by the camera, and control for controlling the zoom of the camera and recognizing the zoom level As an echo cancel function, the input sound is divided into low and high frequency bands, low frequency is subjected to echo cancellation processing, and high frequency is subjected to noise removal processing based on a preset noise suppressor coefficient. An echo canceller that combines them in a band, and the control unit sets the noise suppressor coefficient of the echo canceller higher as the zoom level increases according to the zoom level of the camera. Judgment of the level of the significant sound in the sound field and the operation level of the noise suppressor in the echo cancellation function Order to reduction, there is an effect that it is possible to operate the noise suppressor functions suitable to the content of the conference at that time.

【0041】また、請求項3記載の発明によれば、ズー
ム機能を有するカメラと、このカメラが撮影する領域の
音声を入力するマイクと、前記カメラのズームを制御
し、ズームレベルを認識する制御部と、前記マイクから
の入力音声に対して予め設定された反応速度係数に基づ
きゲインを自動調整するオートゲインコントローラとを
備え、前記制御部は、カメラのズームレベルに応じて、
ズームレベルが高くなるほど前記オートゲインコントー
ラの反応速度係数を小さく設定し、大きい音量に対して
はオートゲインコントローラの反応速度を速くし、小さ
い音量に対しては反応速度を遅くするようにしたので、
カメラのズームレベルから音場での有意音声のレベルの
大きさを判断し、オートゲインコントローラの反応速度
係数を変化させるため、その時の会議の内容に適したオ
ートゲインコントロール機能を動作させることができる
効果がある。
According to the third aspect of the present invention, a camera having a zoom function, a microphone for inputting sound in an area photographed by the camera, and control for controlling the zoom of the camera and recognizing the zoom level Unit, comprising an auto gain controller that automatically adjusts the gain based on a reaction speed coefficient set in advance with respect to the input voice from the microphone, and the control unit, according to the zoom level of the camera,
As the zoom level becomes higher, the reaction speed coefficient of the auto gain controller is set smaller, and the reaction speed of the auto gain controller is increased for a large volume, and the reaction speed is decreased for a small volume.
Judging the level of the significant sound level in the sound field from the zoom level of the camera and changing the reaction speed coefficient of the auto gain controller, it is possible to operate the auto gain control function suitable for the content of the meeting at that time. effective.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本願の各発明に係るテレビ会議装置の実施形態
の要部を示すブロック図。
FIG. 1 is a block diagram showing a main part of an embodiment of a video conference apparatus according to each invention of the present application.

【図2】請求項1記載の発明の実施形態に係る動作を示
すフローチャート。
FIG. 2 is a flowchart showing an operation according to the embodiment of the invention described in claim 1;

【図3】ズームレベル・ノイズ除去レベル対応表を示す
図。
FIG. 3 is a diagram showing a zoom level / noise removal level correspondence table.

【図4】請求項2記載の発明の実施形態に係る動作を示
すフローチャート。
FIG. 4 is a flowchart showing an operation according to the embodiment of the invention described in claim 2;

【図5】ズームレベル・ノイズサプレッサ係数対応表を
示す図。
FIG. 5 is a diagram showing a correspondence table between a zoom level and a noise suppressor coefficient.

【図6】請求項3記載の発明の実施形態に係る動作を示
すフローチャート。
FIG. 6 is a flowchart showing an operation according to the embodiment of the invention described in claim 3;

【図7】ズームレベル・AGC反応速度係数対応表を示
す図。
FIG. 7 is a diagram showing a correspondence table between a zoom level and an AGC reaction rate coefficient.

【符号の説明】[Explanation of symbols]

1 マイク 2 A/Dコンバータ 3,4 DSP回路 5 通信制御装置 6 D/Aコンバータ 7 スピーカ 8 ズーム機能付きカメラ 9 制御部 Reference Signs List 1 microphone 2 A / D converter 3, 4 DSP circuit 5 communication control device 6 D / A converter 7 speaker 8 camera with zoom function 9 control unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 ズーム機能を有するカメラと、 前記カメラが撮影する領域の音声を入力するマイクと、 前記カメラのズームを制御し、ズームレベルを認識する
制御部と、 前記マイクからの入力音声に対して予め設定されたノイ
ズ除去レベルに基づきノイズ除去を行うノイズ除去手段
とを備え、 前記制御部は、カメラのズームレベルに応じて、ズーム
レベルが高くなるほど前記ノイズ除去手段のノイズ除去
レベルを高く設定することを特徴とするテレビ会議装
置。
A camera having a zoom function; a microphone for inputting audio of an area photographed by the camera; a control unit for controlling zoom of the camera and recognizing a zoom level; A noise removing unit that removes noise based on a preset noise removing level, wherein the control unit increases the noise removing level of the noise removing unit as the zoom level increases in accordance with the zoom level of the camera. A videoconferencing device characterized by setting.
【請求項2】 ズーム機能を有するカメラと、 前記カメラが撮影する領域の音声を入力するマイクと、 前記カメラのズームを制御し、ズームレベルを認識する
制御部と、 エコーキャンセル機能として、入力音声を低域と高域に
帯域分割し、低域はエコーキャンセル処理を行い、高域
は予め設定されたノイズサプレッサ係数に基づきノイズ
除去処理を行った後、それらを帯域合成するエコーキャ
ンセラとを備え、 前記制御部は、カメラのズームレベルに応じて、ズーム
レベルが高くなるほど前記エコーキャンセラのノイズサ
プレッサ係数を高く設定することを特徴とするテレビ会
議装置。
2. A camera having a zoom function, a microphone for inputting sound in an area photographed by the camera, a control unit for controlling zoom of the camera and recognizing a zoom level, and an input sound as an echo canceling function. The band is divided into a low band and a high band, and the low band performs an echo cancellation process, the high band performs a noise removal process based on a preset noise suppressor coefficient, and then has an echo canceller that performs band synthesis on them. The video conference apparatus, wherein the control unit sets the noise suppressor coefficient of the echo canceller to be higher as the zoom level becomes higher, according to the zoom level of the camera.
【請求項3】 ズーム機能を有するカメラと、 前記カメラが撮影する領域の音声を入力するマイクと、 前記カメラのズームを制御し、ズームレベルを認識する
制御部と、 前記マイクからの入力音声に対して予め設定された反応
速度係数に基づきゲインを自動調整するオートゲインコ
ントローラとを備え、 前記制御部は、カメラのズームレベルに応じて、ズーム
レベルが高くなるほど前記オートゲインコントーラの反
応速度係数を小さく設定し、大きい音量に対してはオー
トゲインコントローラの反応速度を速くし、小さい音量
に対しては反応速度を遅くすることを特徴とするテレビ
会議装置。
A camera having a zoom function; a microphone for inputting audio of an area photographed by the camera; a control unit for controlling zoom of the camera and recognizing a zoom level; An automatic gain controller that automatically adjusts a gain based on a reaction speed coefficient set in advance, wherein the control unit adjusts the reaction speed coefficient of the auto gain controller as the zoom level increases as the zoom level of the camera increases. A videoconferencing device characterized in that the response speed of the auto gain controller is set to be low for a large volume and the response speed is decreased for a low volume.
JP8201023A 1996-07-12 1996-07-12 Video conference equipment Pending JPH1032804A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8201023A JPH1032804A (en) 1996-07-12 1996-07-12 Video conference equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8201023A JPH1032804A (en) 1996-07-12 1996-07-12 Video conference equipment

Publications (1)

Publication Number Publication Date
JPH1032804A true JPH1032804A (en) 1998-02-03

Family

ID=16434183

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8201023A Pending JPH1032804A (en) 1996-07-12 1996-07-12 Video conference equipment

Country Status (1)

Country Link
JP (1) JPH1032804A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931138B2 (en) 2000-10-25 2005-08-16 Matsushita Electric Industrial Co., Ltd Zoom microphone device
WO2006077934A1 (en) * 2005-01-21 2006-07-27 Matsushita Electric Industrial Co., Ltd. Band division noise suppressor and band division noise suppressing method
CN102098436A (en) * 2009-12-14 2011-06-15 佳能株式会社 Imaging apparatus and its control method
GB2486639A (en) * 2010-12-16 2012-06-27 Zarlink Semiconductor Inc Reducing noise in an environment having a fixed noise source such as a camera
JP2014158310A (en) * 2012-02-07 2014-08-28 Google Inc Control system and control method for varying audio level in communication system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931138B2 (en) 2000-10-25 2005-08-16 Matsushita Electric Industrial Co., Ltd Zoom microphone device
WO2006077934A1 (en) * 2005-01-21 2006-07-27 Matsushita Electric Industrial Co., Ltd. Band division noise suppressor and band division noise suppressing method
CN102098436A (en) * 2009-12-14 2011-06-15 佳能株式会社 Imaging apparatus and its control method
GB2486639A (en) * 2010-12-16 2012-06-27 Zarlink Semiconductor Inc Reducing noise in an environment having a fixed noise source such as a camera
JP2014158310A (en) * 2012-02-07 2014-08-28 Google Inc Control system and control method for varying audio level in communication system

Similar Documents

Publication Publication Date Title
US10553235B2 (en) Transparent near-end user control over far-end speech enhancement processing
JP2645611B2 (en) Audio processing system for electronic conference system
US6904146B2 (en) Full duplex echo cancelling circuit
US20020172350A1 (en) Method for generating a final signal from a near-end signal and a far-end signal
US5390244A (en) Method and apparatus for periodic signal detection
US20040218755A1 (en) Echo canceller with reduced requirement for processing power
JP2606171B2 (en) Receiving volume automatic variable circuit
KR20060042492A (en) Method and apparatus for eliminating acoustic echo in mobile terminal
WO2002028075A2 (en) Removing noise feedback in conference calls due to accoustical cross talk
JPH1032804A (en) Video conference equipment
JP4857652B2 (en) Noise canceller and microphone device
US5579389A (en) Histogram-based processing of audio signals
US5566238A (en) Distributed processing of audio signals
KR20010081857A (en) Noise remove apparatus for digital portable telephone
JP3069547B2 (en) Speech rate hands-free unit and speech system
JPH10240283A (en) Voice processor and telephone system
US5631967A (en) Processing audio signals using a state variable
US5592547A (en) Processing audio signals using a discrete state machine
JPH1023172A (en) Echo eliminating device
CN104301564A (en) Intelligent conference telephone with mouth shape identification
Foley Adaptive periodic noise cancellation for the control of acoustic howling
JP3028866B2 (en) Handset side tone control circuit
JP2618137B2 (en) Voice transmission and reception telephone equipment
WO2004012426A1 (en) System and method for speakerphone operation in a communications device
JPH1032638A (en) Video conference system