JP3441112B2 - Multipoint communication controller - Google Patents

Multipoint communication controller

Info

Publication number
JP3441112B2
JP3441112B2 JP15026493A JP15026493A JP3441112B2 JP 3441112 B2 JP3441112 B2 JP 3441112B2 JP 15026493 A JP15026493 A JP 15026493A JP 15026493 A JP15026493 A JP 15026493A JP 3441112 B2 JP3441112 B2 JP 3441112B2
Authority
JP
Japan
Prior art keywords
voice
unit
data
noise
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP15026493A
Other languages
Japanese (ja)
Other versions
JPH0715535A (en
Inventor
茂信 松田
幸正 杉野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP15026493A priority Critical patent/JP3441112B2/en
Publication of JPH0715535A publication Critical patent/JPH0715535A/en
Application granted granted Critical
Publication of JP3441112B2 publication Critical patent/JP3441112B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、3地点以上のテレビ
会議端末を用いて多地点テレビ会議を実現する多地点間
通信制御装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multipoint communication control apparatus for realizing a multipoint video conference using video conference terminals at three or more points.

【0002】[0002]

【従来の技術】図13は例えば特開平1−286689
号公報に示された従来の多地点間通信制御装置を示すブ
ロック図である。また、図14は従来の多地点間通信制
御装置の音声処理部を示すブロック図である。図13に
おいて1は当該多地点間通信制御装置であり、2は全体
を制御・管理するシステム制御部である。3は図示を省
略した各テレビ会議端末を接続する回線インタフェース
部(以下回線I/F部という)である。
2. Description of the Related Art FIG. 13 shows, for example, Japanese Patent Laid-Open No. 1-286689.
FIG. 11 is a block diagram showing a conventional multipoint communication control device disclosed in Japanese Patent Publication No. FIG. 14 is a block diagram showing a voice processing unit of a conventional multipoint communication control device. In FIG. 13, 1 is the multipoint communication control device, and 2 is a system control unit that controls and manages the whole. Reference numeral 3 denotes a line interface unit (hereinafter referred to as line I / F unit) for connecting each video conference terminal (not shown).

【0003】4a〜4mは前記各テレビ会議端末より受
信した多重データを、音声データ、映像データおよび汎
用データに分離する分離部である。5a〜5mは各テレ
ビ会議端末へ送信される音声データ、映像データおよび
汎用データを多重する多重部である。
Denoted at 4a to 4m are demultiplexing units for demultiplexing the multiplexed data received from each of the video conference terminals into audio data, video data and general-purpose data. Reference numerals 5a to 5m are multiplexing units for multiplexing audio data, video data, and general-purpose data transmitted to each video conference terminal.

【0004】6は分離部4a〜4mのそれぞれで分離さ
れた各音声データを加算して多重部5a〜5mに送る音
声処理部、7は各分離部4a〜4mで分離された映像デ
ータの1つを選択して多重部5a〜5mに送る映像処理
部であり、8は各分離部4a〜4mで分離された各汎用
データの1つを選択して多重部5a〜5mに送る汎用デ
ータ処理部である。
Reference numeral 6 is an audio processing unit for adding the audio data separated by the separating units 4a to 4m and sending it to the multiplexing units 5a to 5m, and 7 is 1 of the video data separated by the separating units 4a to 4m. A general-purpose data processing unit 8 selects one of the general-purpose data and sends it to the multiplex units 5a to 5m by selecting one of the general-purpose data separated by each of the separation units 4a to 4m. It is a department.

【0005】また、図14は音声処理部6の構成を示す
ブロック図である。図において、9a〜9mは分離部4
a〜4mにて分離された非線形(符号化された)音声デ
ータを線形データに復号する音声復号化部であり、10
a〜10mは音声加算された線形データを非線形音声デ
ータに符号化する音声符号化部である。11は音声加算
部12にて利得制御を行うための音声検出情報を音声復
号化部9a〜9mより送られてくる各線形音声データか
ら生成する音声検出部であり、12は復号化された音声
データを加算し、適正なレベルになるよう利得を制御す
る音声加算部である。また、図15は従来の音声処理部
における入力音声データの変化に対する出力音声データ
の利得制御を表したグラフである。図中、音声出力目標
値とは利得を制御する際、近づけようとする目標値であ
る。AGC用音声検出しきい値とは有効な音声データに
対して利得制御を行うかどうかを判定するためのしきい
値である。
FIG. 14 is a block diagram showing the structure of the voice processing unit 6. In the figure, 9a to 9m are separation parts 4
a voice decoding unit that decodes the non-linear (coded) voice data separated in a to 4 m into linear data.
Reference characters a to 10m are voice coding units that code the linear data to which the voice is added to the non-linear voice data. Reference numeral 11 is a voice detection unit that generates voice detection information for performing gain control in the voice addition unit 12 from each linear voice data sent from the voice decoding units 9a to 9m, and 12 is the decoded voice. It is a voice addition unit that adds data and controls the gain so that the level becomes appropriate. Further, FIG. 15 is a graph showing gain control of output audio data with respect to changes in input audio data in a conventional audio processing unit. In the figure, the voice output target value is a target value to which the gain is controlled when the gain is controlled. The AGC voice detection threshold is a threshold for determining whether to perform gain control on valid voice data.

【0006】次に動作について説明する。図13で回線
I/F部3に回線を経由して接続されたテレビ会議端末
の中で、会議を開催しようとするテレビ会議端末(親端
末)が多地点間通信制御装置1に対してどのテレビ会議
端末と多地点テレビ会議を開催するのか指示する。
Next, the operation will be described. In FIG. 13, among the video conference terminals connected to the line I / F unit 3 via the line, the video conference terminal (parent terminal) that intends to hold the conference is connected to the multipoint control unit 1. Instruct whether to hold a multipoint video conference with the video conference terminal.

【0007】システム制御部2は当該要求を受け取る
と、回線I/F部3に対して指定されたテレビ会議端末
を呼び出すように指示を出す。呼び出された各テレビ会
議端末と当該多地点間通信制御装置1との間の回線が接
続されると、音声データ、映像データおよび汎用データ
を多重した多重データの送受信が行われて、多地点テレ
ビ会議が開始される。
When the system control unit 2 receives the request, it instructs the line I / F unit 3 to call the specified video conference terminal. When the line between each called video conference terminal and the multipoint communication control device 1 is connected, transmission and reception of multiple data in which audio data, video data and general-purpose data are multiplexed is performed, and a multipoint television is transmitted. The meeting starts.

【0008】テレビ会議端末から送信されてくる多重デ
ータは、回線I/F部3で受信された後、それぞれに対
応する分離部4a〜4mに渡され、ここで音声データ、
映像データおよび汎用データに分離され、音声データは
音声処理部6に映像データは映像処理部7に、汎用デー
タは汎用データ処理部8に送信される。
[0008] The multiplexed data transmitted from the video conference terminal is received by the line I / F unit 3 and then passed to the corresponding separating units 4a to 4m, where voice data,
Video data and general-purpose data are separated, and audio data is transmitted to the audio processing unit 6, video data to the video processing unit 7, and general-purpose data to the general-purpose data processing unit 8.

【0009】音声処理部6では、各分離部4a〜4mか
らの音声データを図14の対応する音声復号化部9a〜
9mで受信し、非線形データから線形データに復号化
し、音声検出部11へ送る。音声検出部11では音声加
算部12で利得制御を行うための音声検出情報を生成
し、音声加算部12へ渡す。音声加算部12では音声検
出部より受け取った音声データを加算し、また受け取っ
た音声検出情報に基づいて、あらかじめ設定されている
音声出力目標値レベルに加算した音声データが近づくよ
う利得を制御する。利得制御の行われた音声データは音
声符号化部10a〜10mへ送られ、線形データから非
線形データに符号化され、図13の多重部5a〜5mへ
送られて各テレビ会議端末へと送信される。
In the voice processing unit 6, the voice data from the respective separating units 4a to 4m are converted into the corresponding voice decoding units 9a to 9a in FIG.
It is received at 9 m, decoded from non-linear data to linear data, and sent to the voice detection unit 11. The voice detection unit 11 generates voice detection information for performing gain control in the voice addition unit 12, and passes it to the voice addition unit 12. The voice adding unit 12 adds the voice data received from the voice detecting unit, and controls the gain so that the voice data added to the preset voice output target value level approaches based on the received voice detection information. The gain-controlled audio data is sent to the audio encoding units 10a to 10m, encoded from linear data to nonlinear data, sent to the multiplexing units 5a to 5m in FIG. 13, and sent to each video conference terminal. It

【0010】次に、図15を用いて従来の利得制御につ
いて説明する。図15において区間Aは音声検出部11
が音声レベルがAGC用音声検出しきい値より上である
ことを検出した場合を示している。この場合には音声検
出信号300が音声検出部11から音声加算部12に出
力される。音声加算部12においては区間Aの音声レベ
ルを音声出力目標値に近づけるように制御する。
Next, the conventional gain control will be described with reference to FIG. In FIG. 15, the section A is the voice detection unit 11
Indicates that the voice level is detected to be higher than the voice detection threshold value for AGC. In this case, the voice detection signal 300 is output from the voice detection unit 11 to the voice addition unit 12. The voice adding unit 12 controls the voice level of the section A so as to approach the voice output target value.

【0011】次に、区間Bにおいては音声レベルはAG
C用音声検出しきい値より下回っており、無音状態であ
ると判定される。この場合には区間Aで用いた利得がそ
のまま保持されるため、音声加算部においては区間Bに
対しても利得を上げるような演算を行う。
Next, in section B, the audio level is AG
It is below the C voice detection threshold value, and it is determined that there is no sound. In this case, since the gain used in the section A is retained as it is, the voice addition unit performs an operation to increase the gain also in the section B.

【0012】次に、区間Cは音声レベルがAGC用音声
検出しきい値より上である場合を示している。この場合
にも音声検出信号300が音声加算部12に出力され
る。区間Cの音声レベルはこの例においては音声出力目
標値と同じであるため音声加算部においては利得が1に
設定される。
Next, section C shows a case where the voice level is above the AGC voice detection threshold value. Also in this case, the voice detection signal 300 is output to the voice addition unit 12. In this example, the voice level in the section C is the same as the voice output target value, so that the gain is set to 1 in the voice adder.

【0013】区間Dにおいては、音声レベルがAGC用
音声検出しきい値よりも下であるが、区間Cの利得(=
1)がそのまま保持されるため音声加算部12において
区間Dの音声レベルには変化がない。次に、区間Eにお
いては音声レベルがAGC用音声検出しきい値より上で
あり、かつ音声出力目標値よりも上であるため、音声加
算部において−の利得が与えられ、音声レベルは音声レ
ベル目標値と一致させられる。
In section D, the voice level is lower than the AGC voice detection threshold value, but the gain (=
Since 1) is held as it is, the voice level of the section D is not changed in the voice adding unit 12. Next, in the section E, since the voice level is higher than the AGC voice detection threshold value and higher than the voice output target value, a gain of − is given in the voice adding unit, and the voice level is the voice level. It can be matched with the target value.

【0014】また、区間FにおいてはAGC用音声検出
しきい値より下回っている場合であるが、区間Eにおい
て−の利得を与えられているため区間Fにおいてはその
利得がそのまま保持されており雑音のレベルが下げられ
る。
Further, in the section F, the gain is below the AGC voice detection threshold value. However, since the gain of-is given in the section E, the gain is held as it is in the section F and the noise is kept. The level of can be lowered.

【0015】[0015]

【発明が解決しようとする課題】従来の多地点間通信制
御装置は以上のような音声処理部の構成になっているた
め、雑音に対する処理がなされておらず、音声加算部1
2にて適正な音声レベルにするため、1以上の利得が付
加された場合、雑音のレベルも高くなり、音声が聞きづ
らくなる等の問題があった。例えば、図15に示した区
間Bにおいては音声レベルがAGC用音声検出しきい値
より下回っており、雑音と判定されているにもかかわら
ず利得が1以上のまま保持されているため、雑音のレベ
ルを高くしてしまうという問題があった。
Since the conventional multipoint-to-point communication control apparatus has the above-described voice processing unit, no processing is performed on noise, and the voice adding unit 1 is not used.
When a gain of 1 or more is added in order to obtain an appropriate voice level in 2, the noise level becomes high and the voice becomes difficult to hear. For example, in the section B shown in FIG. 15, the voice level is lower than the AGC voice detection threshold value, and the gain is maintained at 1 or more even though it is determined to be noise, so that There was a problem of raising the level.

【0016】この発明は、上記のような問題点を解消す
るためになされたもので、雑音制御部によって雑音と判
定されたレベルの音声信号に対して1以下の利得を付加
し、音声加算部で1以上の利得を付加されていても入力
された雑音レベル以下にする多地点間通信制御装置を得
ることを目的とする。
The present invention has been made to solve the above problems, and adds a gain of 1 or less to a voice signal of a level determined to be noise by a noise control unit, and a voice addition unit. It is an object of the present invention to obtain a multipoint communication control device that keeps the input noise level or lower even if a gain of 1 or more is added.

【0017】[0017]

【課題を解決するための手段】この発明に係る多地点間
通信制御装置は音声処理部において、音声検出部ととも
に雑音制御部を設け、音声入力データが雑音かそれ以外
かを判定するための雑音制御用音声検出しきい値を設
け、その雑音制御用音声検出しきい値以下の音声入力信
号に対しては1以下の利得を加えて音声レベルを下げる
ようにしたものである。
In a multipoint communication control apparatus according to the present invention, a noise control section is provided in a voice processing section together with a voice detection section, and a noise for determining whether or not voice input data is noise. A voice detection threshold for control is provided, and a voice input signal below the voice detection threshold for noise control is added with a gain of 1 or less to lower the voice level.

【0018】この発明に係る多地点間通信制御装置は、
音声加算する端末数に応じて雑音のレベルを低減するこ
とを特徴とするものである。
A multipoint communication control apparatus according to the present invention is
The feature is that the noise level is reduced according to the number of terminals to which voice is added.

【0019】この発明に係る多地点間通信制御装置は、
音声加算する端末数で割ったレベルまで雑音レベルを低
減することを特徴とするものである。
The multipoint communication control apparatus according to the present invention is
The feature is that the noise level is reduced to a level divided by the number of terminals for voice addition.

【0020】この発明に係る多地点間通信制御装置は、
雑音制御部が用いる雑音制御用音声検出しきい値を適応
的に変化させることを特徴とするものである。
A multipoint communication control apparatus according to the present invention is
It is characterized in that the noise control voice detection threshold value used by the noise control unit is adaptively changed.

【0021】この発明に係る多地点間通信制御装置は、
雑音制御部が複数のテレビ会議端末からの音声データを
各チャネル毎に時分割に順に処理することを特徴とする
ものである。
The multipoint communication control apparatus according to the present invention is
It is characterized in that the noise control unit sequentially processes the audio data from a plurality of video conference terminals in time division for each channel.

【0022】この発明に係る多地点間通信制御装置は、
雑音制御部が音声データのレベルと雑音制御用音声検出
しきい値を比較する比較部と複数のサンプル数を1ブロ
ックとしてブロック単位に雑音かどうかを比較する第1
の判定部と、複数のブロックにまたがって雑音かどうか
を判定する第2の判定部を備えたことを特徴とするもの
である。
A multipoint communication control apparatus according to the present invention comprises:
A noise control unit compares a voice data level with a noise control voice detection threshold value and a comparison unit that sets a plurality of samples as one block and determines whether the noise is in block units.
And a second determining unit for determining whether or not there is noise across a plurality of blocks.

【0023】この発明に係る多地点間通信制御装置は、
復号化部が音声データを低域データと高域データに復号
する場合、雑音制御部は低域データを用いて雑音かどう
かを判定することを特徴とするものである。
The multipoint communication control apparatus according to the present invention is
When the decoding unit decodes the voice data into low frequency band data and high frequency band data, the noise control unit uses the low frequency band data to determine whether or not it is noise.

【0024】[0024]

【作用】この発明における音声処理部は、雑音制御部に
て雑音のレベルを下げた状態で音声加算を行うため、従
来のように雑音を加算して雑音レベルが上がってしまう
ことがなく、多地点テレビ会議において良好な音声を得
ることができる。
Since the voice processing unit according to the present invention performs voice addition with the noise level being lowered by the noise control unit, there is no possibility of adding noise as in the conventional case and raising the noise level. Good audio can be obtained in point video conferences.

【0025】[0025]

【実施例】実施例1.以下、この発明の一実施例を図に
基づいて説明する。図1において6は多地点間通信制御
装置における音声処理部である。9a〜9mは各チャネ
ルからの非線形音声データを線形データに復号化する復
号化部、10a〜10mは各チャネルへの線形音声デー
タを非線形音声データに符号化する符号化部である。1
1は音声復号化部9a〜9mから送られてくる各チャネ
ル毎の線形音声データから音声加算部12にて利得制御
を行うために必要な音声検出情報を生成し、音声加算部
12へ渡す音声検出部である。12は各テレビ会議端末
からの音声データを加算したのち、音声検出部からの音
声検出情報をもとに各チャネル毎に音声出力目標値のレ
ベルになるよう利得を制御する音声加算部である。13
は音声入力データが雑音かそれ以外かを判定するための
音声しきい値を持ち、各チャネル毎に雑音を判定し、雑
音のみ低減させる雑音制御部である。
EXAMPLES Example 1. An embodiment of the present invention will be described below with reference to the drawings. In FIG. 1, reference numeral 6 is a voice processing unit in the multipoint communication control device. Denoted at 9a to 9m are decoding units for decoding the non-linear audio data from each channel into linear data, and denoted at 10a to 10m are coding units for encoding the linear audio data to each channel into non-linear audio data. 1
Reference numeral 1 is voice that generates voice detection information necessary for gain control in the voice adder 12 from the linear voice data for each channel sent from the voice decoders 9a to 9m, and passes the voice detection information to the voice adder 12. It is a detection unit. Reference numeral 12 is a voice addition unit that adds voice data from each video conference terminal and then controls the gain so as to reach the level of the voice output target value for each channel based on the voice detection information from the voice detection unit. Thirteen
Is a noise control unit that has a voice threshold value for determining whether the voice input data is noise or not, determines the noise for each channel, and reduces only the noise.

【0026】また、図1において100a〜100mは
復号化部9a〜9mから出力される4チャネルのデータ
が多重化された音声データである。また、200a〜2
00mは雑音制御部13により雑音が低減された音声デ
ータである。300は音声検出部11により出力される
音声検出信号である。400a〜400mは音声加算部
12より出力される音声出力目標値のレベルになるよう
利得を制御された音声データである。
Further, in FIG. 1, reference numerals 100a to 100m are audio data in which 4-channel data output from the decoding units 9a to 9m are multiplexed. Also, 200a-2
00 m is voice data whose noise is reduced by the noise control unit 13. A voice detection signal 300 is output by the voice detection unit 11. 400a to 400m should be at the level of the voice output target value output from the voice addition unit 12.
Is audio data that has been controlled gain.

【0027】復号化部9a〜9m、符号化部10a〜1
0mはそれぞれ4チャネルのデータを復号化あるいは符
号化する。音声検出部11および雑音制御部13は4チ
ャネルの音声データを入力し、それぞれのチャネルに対
して音声を検出するとともに雑音を制御する。音声加算
部は入力した音声データを加算するとともに加算した音
声から自己のチャネルの音声分を差し引き、その後、利
得が音声出力の目標レベルになるように利得制御を行
い、符号化部に出力する。
Decoding sections 9a to 9m and coding sections 10a to 1
0m decodes or encodes 4-channel data. The voice detection unit 11 and the noise control unit 13 input voice data of four channels, detect voices for the respective channels, and control noise. The voice addition unit adds the input voice data and subtracts the voice component of its own channel from the added voice, and then performs gain control so that the gain reaches the target level of voice output, and outputs the gain to the encoding unit.

【0028】次に、図2は音声入力レベルの変動に対す
る利得の制御を表した図である。この利得の制御は各チ
ャネル毎に行われる。また、図2の中で音声出力目標値
とは利得を制御し、人間の音声を適正なレベルにする際
の目標値である。この音声出力目標値は音声加算部12
が符号化部10a〜10mに対して出力する音声データ
の目標値である。AGC用音声検出しきい値とは図1の
音声検出部11から音声加算部12へ渡す有音検出情報
を決定するしきい値である。音声入力レベルがこのAG
C用音声検出しきい値を越えている場合には、音声検出
部11は音声検出信号300を音声加算部12に対して
出力する。雑音制御用音声検出しきい値とは、雑音制御
部13にて雑音かそれ以外かを判定し、雑音のみ低減さ
せるためのしきい値である。
Next, FIG. 2 is a diagram showing the control of the gain with respect to the fluctuation of the voice input level. This gain control is performed for each channel. Further, in FIG. 2, the voice output target value is a target value when the gain is controlled and the human voice is set to an appropriate level. This voice output target value is the voice addition unit 12
Is the target value of the audio data output to the encoding units 10a to 10m. The AGC voice detection threshold value is a threshold value that determines the voiced detection information to be passed from the voice detection unit 11 to the voice addition unit 12 in FIG. The voice input level is this AG
When it exceeds the C voice detection threshold value, the voice detection unit 11 outputs the voice detection signal 300 to the voice addition unit 12. The noise control voice detection threshold is a threshold for determining whether noise is present or not in the noise controller 13 and reducing only noise.

【0029】次に動作について説明する。多地点テレビ
会議が開始されるまでの動作は従来例と同一のため省略
する。音声検出部11では復号化部9a〜9mから送ら
れてくる音声データの中でAGC用音声検出しきい値よ
りレベルの高い音声入力データかどうかを判定し、その
情報を音声加算部12へ送る。また、雑音制御部13で
は音声検出部11から受け取った音声データに対し、雑
音制御用音声検出しきい値より低い雑音か、それ以外か
を判定し、図2の区間BおよびGに示すように、雑音で
あれば1以下の利得を付加してレベルを下げる。また、
雑音でなければ、区間Cのように利得1のままそのデー
タを音声加算部12へ送る。音声加算部12では音声検
出部11からの音声検出情報に基づき音声を加算し、加
算した音声データに対して音声出力目標値になるよう利
得を制御する。利得の制御は、区間AおよびEのよう
に、AGC用音声検出しきい値より高いレベルの音声デ
ータについてのみ行う。図2に示すとおり、区間Aのよ
うに出力目標値より低く、かつAGC用音声検出しきい
値より高い音声データには1以上の利得を付加し、出力
目標値のレベルにする。また、区間Eのように、出力目
標値より高い音声データには1以下の利得を付加し、出
力目標値のレベルにする。区間DおよびFのように、A
GC用音声検出しきい値より低いレベルの音声データ
は、前の利得を保持することにより急激な利得の変化を
なくし、違和感を軽減する。
Next, the operation will be described. The operation up to the start of the multipoint video conference is the same as in the conventional example, and will not be repeated. The voice detection unit 11 determines whether the voice data sent from the decoding units 9a to 9m is voice input data having a level higher than the AGC voice detection threshold value, and sends the information to the voice addition unit 12. . Further, the noise control unit 13 determines whether the voice data received from the voice detection unit 11 is noise lower than the noise control voice detection threshold value or not, and as shown in sections B and G of FIG. If it is noise, a gain of 1 or less is added to lower the level. Also,
If it is not noise, the data is sent to the voice addition unit 12 with a gain of 1 as in the section C. The voice adding unit 12 adds voices based on the voice detection information from the voice detecting unit 11, and controls the gain so that the added voice data has a voice output target value. The gain control is performed only for the voice data whose level is higher than the AGC voice detection threshold, as in the sections A and E. As shown in FIG. 2, a gain of 1 or more is added to the voice data that is lower than the output target value and higher than the AGC voice detection threshold, as in the section A, to obtain the output target value level. In addition, as in the section E, a gain of 1 or less is added to the audio data higher than the output target value to bring it to the level of the output target value. As in sections D and F, A
The voice data having a level lower than the voice detection threshold for GC retains the previous gain to eliminate a sudden change in the gain and reduce the discomfort.

【0030】次に、図3を用いて音声処理部6について
さらに説明する。図3において、20は分離された音声
を受信するための受信側音声ハイウェイ、9aは受信側
音声ハイウェイ20から受信された音声を復号化する復
号化部、24は復号化部9aで復号化された音声データ
を直列並列変換する直列並列変換部、25は2方向から
アクセスすることが可能なデュアルポートラム、11は
音声を検出する音声検出部、13は雑音を制御する雑音
制御部である。復号化部9aはディジタルシグナルプロ
セッサー#1(DSP#1)22から構成されており音
声検出部11と雑音制御部13は同じくディジタルシグ
ナルプロセッサー(DSP)26から構成されている。
28は8ビットデータを4ビットのデータに時分割する
分割部、30は音声加算部12に対して音声データを出
力するための音声加算ハイウェイである。
Next, the voice processing unit 6 will be further described with reference to FIG. In FIG. 3, reference numeral 20 is a receiving side voice highway for receiving separated voice, 9a is a decoding unit for decoding the voice received from the receiving side voice highway 20, and 24 is a decoding unit 9a. A serial-parallel converter for converting the voice data into a serial-parallel converter, a dual port memory 25 accessible from two directions, a voice detector 11 for detecting voice, and a noise controller 13 for controlling noise. The decoding unit 9a is composed of a digital signal processor # 1 (DSP # 1) 22, and the voice detection unit 11 and the noise control unit 13 are also composed of a digital signal processor (DSP) 26.
Reference numeral 28 is a division unit for time-dividing 8-bit data into 4-bit data, and 30 is a voice addition highway for outputting voice data to the voice addition unit 12.

【0031】31は音声加算部12から加算された音声
を入力するための音声加算ハイウェイ、32は先出し、
先入れを行うFIFO、34は並列直列変換を行う並列
直列変換部、33はFIFO32と並列直列変換部34
に対してデータの入出力を制御する送信制御部である。
35は2メガヘルツのクロックとタイミングパルスを入
力することにより、タイミングを生成するカウンタ、2
3,27はカウンタ35からのカウントに基づきタイミ
ングを発生するタイミング生成部である。10aは送信
する音声データを符号化する符号化部、36は符号化部
10aを構成するディジタルシグナルプロセッサー(D
SP#1)である。21は送信する音声を多重部に伝え
るための送信側音声ハイウェイである。
Reference numeral 31 is a voice addition highway for inputting voices added from the voice addition unit 12, 32 is first-out,
First-in-first-out FIFO, 34 is a parallel-to-serial converter that performs parallel-to-serial conversion, and 33 is the FIFO 32 and parallel-to-serial converter 34
Is a transmission control unit that controls the input / output of data with respect to.
35 is a counter that generates timing by inputting a 2 MHz clock and a timing pulse, 2
Reference numerals 3 and 27 are timing generators that generate timing based on the count from the counter 35. Reference numeral 10a is an encoding unit for encoding the audio data to be transmitted, and 36 is a digital signal processor (D
SP # 1). Reference numeral 21 is a transmitting side audio highway for transmitting the audio to be transmitted to the multiplexing unit.

【0032】次に、図4から図7を用いて図3に示した
各部のタイミングチャートについて説明する。図4は復
号化部9aが入力する符号化データ#1を示す図であ
る。また、図4は同時に符号化部10aが出力する符号
化データ#1を示している。図4に示すように、復号化
部9aはタイミング生成部23からFSR#1信号を受
信し、符号化データ#1の先頭を検出する。符号化デー
タ#1の先頭を検出すると、復号化部9aはそのチャネ
ルの符号化データを入力し、所定の規則に基づき復号化
を行う。符号化データは56キロbpsあるいは64キ
ロbpsの場合が存在するが何れの場合においてもこの
復号化部9aにおいて非線形音声データから線形音声デ
ータに復号化される。
Next, a timing chart of each part shown in FIG. 3 will be described with reference to FIGS. 4 to 7. FIG. 4 is a diagram showing encoded data # 1 input by the decoding unit 9a. Further, FIG. 4 shows the coded data # 1 output from the coding unit 10a at the same time. As shown in FIG. 4, the decoding unit 9a receives the FSR # 1 signal from the timing generation unit 23 and detects the beginning of the encoded data # 1. When the head of the coded data # 1 is detected, the decoding unit 9a inputs the coded data of that channel and performs decoding according to a predetermined rule. There are cases where the encoded data is 56 kbps or 64 kbps, and in either case, the decoding unit 9a decodes the non-linear audio data into linear audio data.

【0033】復号化部9aは各チャネル毎に音声データ
を低域データと高域データに分けて復号化を行う。低域
データは周波数が低い帯域のデータであり、高域データ
は周波数帯域の高いデータをいう。低域データのために
16ビットを使用し、また、高域データのために16ビ
ットを使用する。したがって1つのチャネルにあわせて
32ビットを用いてデータを復号化する。このように復
号化部9aから出力されるデータは1つのチャネルに対
して32ビットの線形データとなる。復号化部で復号化
された32ビットのリニアデータは他の3つの復号化部
から出力される32ビットリニアデータと多重化されて
直列並列変換部に入力される。この直列並列変換部24
に入力されるデータを図5に示す。
The decoding unit 9a divides the audio data into low-frequency data and high-frequency data for each channel to perform decoding. The low frequency data is data in a low frequency band, and the high frequency data is data in a high frequency band. 16 bits are used for low band data and 16 bits are used for high band data. Therefore, data is decoded using 32 bits for one channel. In this way, the data output from the decoding unit 9a becomes 32-bit linear data for one channel. The 32-bit linear data decoded by the decoding unit is multiplexed with the 32-bit linear data output from the other three decoding units and input to the serial / parallel conversion unit. This serial-parallel converter 24
The data input to is shown in FIG.

【0034】図5は復号化部から出力された32ビット
リニアデータを4多重した場合を示す図である。この4
多重されたリニアデータをここではリニア受信データと
呼ぶ。リニア受信データはチャネル1からチャネル4ま
での低域データと、チャネル1からチャネル4までの高
域データで構成されている。図に示すように低域データ
のチャネル1からチャネル4までのデータが連続し、次
に、高域データのチャネル1からチャネル4までのデー
タが連続する。このデータは8Kフレームパレスに同期
しており、低域データと高域データはタイミング生成部
23から出力されるFSX#1信号に同期して出力され
る。また、低域データおよび高域データの各チャネルの
データは16ビットから構成されている。例えばチャネ
ル1の低域リニア受信データは16ビットから構成され
ている。このようにリニア受信データは直列並列変換部
24を経由して8ビットの並列データに変換されデュア
ルポートラム25に入力される。音声検出部および雑音
制御部はこのデュアルポートラム25に入力された音声
データに対して音声検出および雑音制御を行い音声加算
ハイウェイ30に出力する。
FIG. 5 is a diagram showing a case where the 32-bit linear data output from the decoding section is multiplexed four times. This 4
Here, the multiplexed linear data is referred to as linear received data. The linear reception data is composed of low band data from channel 1 to channel 4 and high band data from channel 1 to channel 4. As shown in the figure, low frequency band data from channel 1 to channel 4 continues, and then high frequency data from channel 1 to channel 4 continues. This data is synchronized with the 8K frame palace, and the low frequency data and the high frequency data are output in synchronization with the FSX # 1 signal output from the timing generation unit 23. Further, the data of each channel of low band data and high band data is composed of 16 bits. For example, the low-frequency linear reception data of channel 1 is composed of 16 bits. In this way, the linear received data is converted into 8-bit parallel data via the serial / parallel converter 24 and input to the dual port RAM 25. The voice detection unit and the noise control unit perform voice detection and noise control on the voice data input to the dual port RAM 25, and output the voice data to the voice addition highway 30.

【0035】図6は、音声加算ハイウェイにデータを送
受信するタイミングを示す図である。図3に示した音声
検出部11および雑音制御部13はチャネル1からチャ
ネル4までの音声検出および雑音制御を行うものであ
る。したがって、図3に示したような回路を6個設ける
ことにより、24チャネルのデータを扱うことができ
る。音声加算ハイウェイは例えば最大24チャネルのデ
ータを送受信できるものとする。このような場合、デー
タは図6に示すようにチャネル1からチャネル8までの
低域データが音声加算ハイウェイに出力され、次に、チ
ャネル9からチャネル16の低域データが出力され、次
に、チャネル17からチャネル24の低域データが出力
される。さらに所定のあき時間を設けた後、チャネル1
から8の高域データが出力され、さらにチャネル9から
チャネル16の高域データが出力され、チャネル17か
らチャネル24の高域データが出力される。
FIG. 6 is a diagram showing the timing of transmitting and receiving data on the voice addition highway. The voice detection unit 11 and the noise control unit 13 shown in FIG. 3 perform voice detection and noise control for channels 1 to 4. Therefore, by providing six circuits as shown in FIG. 3, 24-channel data can be handled. It is assumed that the voice addition highway can transmit and receive data of, for example, a maximum of 24 channels. In such a case, as shown in FIG. 6, low-frequency data from channel 1 to channel 8 is output to the audio addition highway, then low-frequency data from channel 9 to channel 16 is output, and then, The low frequency data of channel 17 is output from channel 17. Channel 1 after a further open time
8 to 8 are output, high channel data of channel 9 to channel 16 are output, and high frequency data of channel 17 to channel 24 are output.

【0036】図7は分割部28によって4ビットに分割
されたデータを示す図である。図7は図6に示したチャ
ネル1からチャネル3の低域データのビット構成を示す
図である。各チャネルのデータは図5に示したように、
低域データおよび高域データとも16ビットで構成され
ており、分割部28により4ビットづつに分割されるた
め、4クロックで1つのチャネルの低域データあるいは
高域データを音声加算ハイウェイに出力する。
FIG. 7 is a diagram showing data divided into 4 bits by the dividing unit 28. FIG. 7 is a diagram showing the bit configuration of the low frequency band data of channels 1 to 3 shown in FIG. The data of each channel is as shown in FIG.
Both the low-frequency data and the high-frequency data are composed of 16 bits, and are divided into 4-bit units by the dividing unit 28, so that the low-frequency data or high-frequency data of one channel is output to the audio addition highway in 4 clocks. .

【0037】次に、図8を用いて音声検出部11と雑音
制御部13の構成および動作について説明する。図8に
おいて、700は第1の検出部、800は第2の検出
部、130は第1の比較部、140は第1の判定部、1
50は第2の判定部で、これらは第1の検出部700を
構成している。またさらに、160は第2の比較部、1
70は第3の判定部、180は第4の判定部で、これら
は第2の検出部800を構成している。910は雑音制
御用音声検出しきい値、920はAGC用音声検出しき
い値である。また、930は入力された音声データが雑
音と判定された場合に、その雑音を除去するための雑音
除去部である。
Next, the configuration and operation of the voice detection unit 11 and the noise control unit 13 will be described with reference to FIG. In FIG. 8, 700 is a first detection unit, 800 is a second detection unit, 130 is a first comparison unit, 140 is a first determination unit,
Reference numeral 50 denotes a second determination unit, which constitutes a first detection unit 700. Furthermore, 160 is a second comparison unit, 1
Reference numeral 70 denotes a third determination unit and 180 denotes a fourth determination unit, which form a second detection unit 800. Reference numeral 910 is a noise control voice detection threshold value, and 920 is an AGC voice detection threshold value. A noise removal unit 930 removes noise when the input voice data is determined to be noise.

【0038】次に動作について説明する。まず、音声検
出器への入力信号は第1の検出部700、第2の検出部
800、それぞれに入力される。このうち、第1の検出
部700は第1の比較部130、第1の判定部140、
第2の判定部150からなり、雑音制御用音声検出しき
い値910との判定結果を出力する。また、第2の検出
部800は第2の比較部160、第3の判定部170、
第4の判定部180からなり、有音または無音の判定結
果を出力する。
Next, the operation will be described. First, the input signal to the voice detector is input to the first detection unit 700 and the second detection unit 800, respectively. Of these, the first detection unit 700 includes a first comparison unit 130, a first determination unit 140,
The second determination unit 150 is provided and outputs the determination result with the noise control voice detection threshold value 910. Further, the second detection unit 800 includes a second comparison unit 160, a third determination unit 170,
The fourth determination unit 180 is provided, and outputs the determination result of voiced or silent.

【0039】次に、第1の検出部700の動作につい
て、さらに詳しく説明する。入力信号は、まず、第1の
比較部130において雑音制御用音声検出しきい値91
0と比較される。第1の判定部140は上記第1の比較
部130における比較結果をもとに、ある一定時間のブ
ロック単位で有音または雑音の判定を行う。例えば、図
5に示すような16ビットのデータを1サンプルとした
場合に、8サンプルを1つのブロックとし、この8サン
プルの中に1つでも雑音制御用音声検出しきい値910
を越すものがあればこのブロックを有音と判定する。ま
た逆に8サンプルの中で、雑音制御用音声検出しきい値
910を越えるものが1つもない場合には、このブロッ
クを雑音と判定する。第2の判定部150は、ある定め
たブロック数(例えば10ブロック)の間、連続して第
1の判定部140が雑音と判定した場合にのみ雑音、そ
れ以外の場合には有音と判定して、この判定結果を第1
の検出部700の判定結果として出力する。
Next, the operation of the first detector 700 will be described in more detail. The input signal is first subjected to noise control voice detection threshold value 91 in first comparison section 130.
Compared to 0. The first determination unit 140 determines whether there is sound or noise in block units for a certain fixed time based on the comparison result of the first comparison unit 130. For example, when 16-bit data as shown in FIG. 5 is set as one sample, eight samples are set as one block, and at least one of these eight samples is used as a noise control voice detection threshold 910.
If there is something that exceeds the threshold, this block is determined to be sound. On the contrary, if none of the 8 samples exceeds the noise control voice detection threshold value 910, this block is determined as noise. The second determination unit 150 determines noise only when the first determination unit 140 continuously determines noise for a predetermined number of blocks (for example, 10 blocks), and determines that there is sound otherwise. Then, the result of this determination is
It is output as the determination result of the detection unit 700 of.

【0040】雑音除去部930は第1の検出部700か
らの判定結果を入力し、その結果が雑音であることを示
している場合には、入力された音声データに対して1以
下の利得を掛け合わせることにより、雑音のレベルを低
下させる。図2に示した区間Bおよび区間Gは、このよ
うにして第1の検出部700がこの区間にある音声デー
タを雑音と判定した場合を示しており、1以下の利得を
付加することにより雑音を低下させた場合を示してい
る。
The noise removing unit 930 inputs the determination result from the first detecting unit 700, and when the result indicates that it is noise, a gain of 1 or less is applied to the input voice data. The multiplication reduces the noise level. Sections B and G shown in FIG. 2 show the case where the first detection unit 700 determines that the voice data in this section is noise in this way, and noise is added by adding a gain of 1 or less. Shows the case of decreasing.

【0041】次に、第2の検出部800の動作について
述べる。入力信号は、まず、第2の比較部160におい
て、AGC用音声検出しきい値920と比較される。こ
のAGC用音声検出しきい値920はあらかじめ定めた
値であり、上記雑音制御用音声検出しきい値910の適
応範囲よりも高い値であり、通常は予期しうる最大の背
景雑音レベルよりも高く設定してある。第3の判定部1
70は上記第2の比較部160における比較結果をもと
に、ある一定時間のブロック単位で有音または無音の判
定を行う。例えば、前述したように16ビットのデータ
を1サンプルとし、8サンプルで1つのブロックを構成
し、この8サンプルの中に1つでもAGC用音声検出し
きい値920を越えるものがある場合には有音と判定
し、そうでない場合は無音と判定する。第4の判定部1
80はある定めたブロック数(例えば10ブロック)に
ついて連続して第3の判定部170が有音と判定した場
合にのみ有音、それ以外の場合には無音と判定して、こ
の判定結果を第2の検出部800の判定結果として出力
する。
Next, the operation of the second detector 800 will be described. The input signal is first compared with the AGC voice detection threshold value 920 in the second comparison section 160. The AGC voice detection threshold 920 is a predetermined value, which is higher than the applicable range of the noise control voice detection threshold 910, and is usually higher than the maximum expected background noise level. It is set. Third determination unit 1
Reference numeral 70 determines whether or not there is sound in a block unit for a certain fixed time based on the comparison result in the second comparison unit 160. For example, as described above, 16-bit data is taken as one sample, one block is made up of eight samples, and if even one of these eight samples exceeds the AGC voice detection threshold value 920, It is determined to be voiced, and otherwise it is determined to be silent. Fourth determination unit 1
The reference numeral 80 determines that the sound is present only when the third determination unit 170 determines that the sound is continuous for a certain number of blocks (for example, 10 blocks), and otherwise determines that the sound is not present. It is output as the determination result of the second detection unit 800.

【0042】図2に示す区間A〜区間Gはこのようにし
て連続して有音と判定された場合、あるいは連続して雑
音と判定された場合等の区間をそれぞれ示している。前
述した第1の検出部700および第2の検出部800
は、図5に示した低域データのみを用いて行われる。す
なわち高域データを参照せずに比較判定が行われる。こ
のように低域データを用いるのは音声レベルが低域デー
タによって大きく左右されるのに対して、音声レベルが
高域データによっては左右されないことをとらえたもの
である。すなわち高域データを参照しないことにより比
較判定が容易に行えることになる。このように第1の検
出部700および第2の検出部800が低域データを用
いるのに対し、雑音除去部930は雑音を除去するため
に低域データと高域データの両方を用いる。これは低域
データのみを用いて雑音と判定された区間に対して低域
データおよび高域データの両方の利得を下げなければな
らないためである。
Sections A to G shown in FIG. 2 respectively indicate sections in the case where it is continuously determined to be voiced in this way, or the case where it is continuously determined to be noise. The above-described first detection unit 700 and second detection unit 800
Is performed using only the low frequency data shown in FIG. That is, the comparison determination is performed without referring to the high frequency data. The use of low-frequency data in this way is because the audio level is largely influenced by the low-frequency data, whereas the audio level is not influenced by the high-frequency data. That is, comparison determination can be easily performed by not referring to the high frequency data. As described above, the first detection unit 700 and the second detection unit 800 use low frequency data, whereas the noise removal unit 930 uses both low frequency data and high frequency data in order to remove noise. This is because it is necessary to reduce the gain of both the low band data and the high band data with respect to the section determined to be noise using only the low band data.

【0043】実施例2.次に、図9を用いてこの発明の
他の実施例について説明する。図9において図8と異な
る点は雑音制御用音声検出しきい値910が適応的に定
められる点である。図9において、110は入力される
音声データおよび第2の検出部800の出力に基づき背
景雑音レベルを算出する雑音レベル算出部、120は背
景雑音レベルに基づき雑音制御用音声検出しきい値91
0を設定する閾値設定部である。また、940は有音時
間のハングオーバ処理を行うハングオーバ付加部であ
る。
Example 2. Next, another embodiment of the present invention will be described with reference to FIG. 9 is different from FIG. 8 in that the noise detection voice detection threshold value 910 is adaptively determined. In FIG. 9, 110 is a noise level calculation unit that calculates the background noise level based on the input voice data and the output of the second detection unit 800, and 120 is the noise detection voice detection threshold value 91 based on the background noise level.
This is a threshold setting unit that sets 0. Further, reference numeral 940 is a hangover addition unit that performs a hangover process for a voiced time.

【0044】この実施例においては入力する音声データ
の無音時における背景雑音レベルを雑音レベル算出部1
10において第2の検出部800からの出力に応じて算
出し、この算出結果にしたがって雑音制御用音声検出し
きい値910を域値設定部120が設定するように構成
しているので、背景雑音レベルが変化する場合でも適応
的に雑音制御用音声検出しきい値910を変化させるこ
とができる。なお、ハングオーバ付加部940では第2
の検出部800の出力が有音から無音へ変化したのち、
一定時間中に有音判定を保持するハングオーバ付加処理
を行い、これを音声検出の出力信号300とすることに
よって音声の話尾等の切断を防いでいる。
In this embodiment, the noise level calculation unit 1 calculates the background noise level of the input voice data when there is no sound.
10 is calculated according to the output from the second detection unit 800, and the threshold value setting unit 120 sets the noise detection voice detection threshold value 910 according to the calculation result. Even when the level changes, the noise control voice detection threshold 910 can be adaptively changed. The hangover addition unit 940 uses the second
After the output of the detection unit 800 changes from voiced to silence,
By performing a hangover addition process for holding the voiced judgment during a certain period of time and using this as an output signal 300 for voice detection, disconnection of the tail of the voice or the like is prevented.

【0045】また、雑音レベル算出部110はあるブロ
ック区間内における音声信号のサンプルの絶対値をとっ
た後にそれらの加算平均値を算出し、この加算平均値と
第2の比較部160における比較結果とに基づいて背景
雑音レベルを算出する。すなわちブロック区間内におい
て音声信号がAGC用音声検出しきい値920を1度も
越えなかった場合には、算出された加算平均値を用いて
背景雑音レベルの算出を行う。しかし、ブロック区間内
において入力信号がAGC用音声検出しきい値920を
少なくとも1度越えた場合は、背景雑音レベルの算出を
停止し、以前に算出した背景雑音レベルの値を維持す
る。そして、続いて閾値設定部120は雑音レベル算出
部110の出力結果に基づき第1の比較部130で用い
る。この様にして雑音制御用音声検出しきい値910を
適応的に定める。
Further, the noise level calculation unit 110 calculates the addition average value of the samples of the audio signal in a certain block interval and then calculates the addition average value thereof, and the comparison result in the second comparison unit 160. The background noise level is calculated based on and. That is, when the voice signal never exceeds the AGC voice detection threshold value 920 in the block section, the background noise level is calculated using the calculated average value. However, when the input signal exceeds the AGC voice detection threshold value 920 at least once in the block section, the calculation of the background noise level is stopped and the previously calculated background noise level value is maintained. Then, subsequently, the threshold setting unit 120 is used by the first comparing unit 130 based on the output result of the noise level calculating unit 110. In this way, the noise control voice detection threshold value 910 is adaptively determined.

【0046】図9に示した例においては、第2の比較部
160の出力に基づいて音声レベル算出部110の動作
を制御しているが、第3の判定部170あるいは第4の
判定部180の出力に基づいて雑音レベル算出部110
の動作を制御しても構わない。またこの実施例では、雑
音レベル算出部110はブロック内の音声信号のサンプ
ルの加算平均値を算出し、これにより背景雑音レベルを
求めているが加算平均値の代わりにブロック内の2乗平
均値あるいは最大ピーク値等を用いてもよい。
In the example shown in FIG. 9, the operation of the voice level calculating section 110 is controlled based on the output of the second comparing section 160, but the third judging section 170 or the fourth judging section 180 is controlled. Noise level calculation unit 110 based on the output of
The operation of may be controlled. In addition, in this embodiment, the noise level calculation unit 110 calculates the average value of the samples of the audio signals in the block, and the background noise level is calculated from this, but the root mean square value in the block is used instead of the average value. Alternatively, the maximum peak value or the like may be used.

【0047】実施例3.次に、雑音制御部13における
雑音の低減動作についてさらに説明する。雑音制御部1
3は1以下の利得を付加することにより雑音を低減させ
るが、この雑音のレベルを0にするものではない。むし
ろ0にするよりある程度雑音を残しておく方が人間の聴
覚に対して自然さを残すことになる。雑音を0にしてし
まうとかえって違和感を感じ不自然なものとなってしま
う。従って雑音を低減させる場合にその低減の度合いを
どのようにしたらよいかを考慮すべきである。ここでは
端末の数(チャネル数)に応じて雑音を低減させる場合
について以下に説明する。
Example 3. Next, the noise reduction operation in the noise control unit 13 will be further described. Noise control unit 1
3 reduces noise by adding a gain of 1 or less, but does not make the noise level 0. Rather, it is more natural to leave noise to some extent than to make it to human hearing. If the noise is set to 0, it feels strange and becomes unnatural. Therefore, when reducing noise, it is necessary to consider how to reduce the noise. Here, a case where noise is reduced according to the number of terminals (the number of channels) will be described below.

【0048】雑音制御部13において雑音制御用音声検
出しきい値より低いレベルの雑音を低減させる場合に、
音声加算する端末数に応じて低減するレベルを変更する
ことにより、音声加算したデータに、ある程度の雑音を
残すことができる。このようにすれば雑音制御を行った
データについても完全な無音ではなくなるため、雑音制
御を行ったデータと、行っていないデータとの間の急激
なレベルの変化がなくなり、会議中における音声の違和
感を低減することができる。
When the noise control unit 13 reduces the noise level lower than the noise control voice detection threshold value,
By changing the level to be reduced according to the number of terminals to which voice is added, it is possible to leave some noise in the voice-added data. In this way, the noise-controlled data will not be completely silent, so there will be no sudden change in the level between the noise-controlled data and the non-noise-controlled data. Can be reduced.

【0049】図10はこの実施例における音声処理部を
表すブロック図であり、13は雑音制御用音声検出しき
い値を持ち、しきい値以下のレベルの音声データを、音
声加算する端末数(n)で割ったレベル(1/n)まで
下げる1/n雑音制御部であり、その他は実施例1と同
一である。図11は実施例3の回路における入力音声デ
ータの変化に対する利得制御を実施した出力音声データ
を表している。音声出力目標値、AGC制御用音声検出
しきい値、雑音制御用音声検出しきい値は実施例1と同
一である。
FIG. 10 is a block diagram showing a voice processing unit in this embodiment. Reference numeral 13 denotes a voice control threshold value for noise control, and the voice data of a level below the threshold value is added to the number of terminals (voice addition). It is a 1 / n noise control unit that lowers the level (1 / n) divided by n), and is otherwise the same as the first embodiment. FIG. 11 shows output voice data in which gain control is performed with respect to changes in input voice data in the circuit of the third embodiment. The voice output target value, the AGC control voice detection threshold value, and the noise control voice detection threshold value are the same as those in the first embodiment.

【0050】次に動作について説明する。1/n雑音制
御部13は雑音制御用音声検出しきい値を持ち、音声検
出部11から受け取った音声データに対し、しきい値以
上か以下かを判定し、しきい値以下のデータを音声加算
する端末数(n)で割ったレベル(1/n)まで下げ
る。加算する端末数情報はシステム制御部から受け取
る。このようにすれば、加算された音声データ中の雑音
は(1/n)×n=1となり、1端末分のレベルとなる
ため、雑音のレベルは加算する前のレベルと同一にな
り、完全な無音状態はなくなる。これにより、雑音制御
が行われたデータと行われていないデータの間で急激な
レベルの変化がなくなるため、会議中における音声の違
和感を低減することができる。
Next, the operation will be described. The 1 / n noise control unit 13 has a noise detection voice detection threshold value, determines whether the voice data received from the voice detection unit 11 is greater than or equal to the threshold value, and outputs the data below the threshold value as voice. It is lowered to the level (1 / n) divided by the number of terminals (n) to be added. Information on the number of terminals to be added is received from the system control unit. In this way, the noise in the added voice data is (1 / n) × n = 1, which is the level of one terminal, so that the noise level is the same as the level before the addition, and The silent state disappears. As a result, there is no sudden change in the level between the data for which noise control has been performed and the data for which noise control has not been performed, so that it is possible to reduce the discomfort of voice during a conference.

【0051】実施例4.上記実施例においては、雑音と
判定された音声データを音声加算する端末数(n)で割
ったレベルまで下げる場合について説明したが、必ずし
も端末数で割る場合に限る必要はない。音声加算部では
音声を加算した後、自己のチャネルの音声を差し引いた
残りの音声を出力している。例えば、3つの端末A,
B,Cから音声データを入力している場合には、端末A
に対しては端末BとCの音声データを加算して出力す
る。また端末Bに対しては端末Aと端末Cの音声データ
を加算して出力する。また、端末Cに対しては端末Aと
端末Bの音声データを加算して出力する。従って、3端
末がテレビ会議を行っている場合には各端末には他の2
端末の音声データが出力されることになる。このような
場合には雑音と判定された音声データを3分の1にする
のではなく2分の1としても構わない。すなわち、テレ
ビ会議に参加している端末数と実際に音声加算する端末
数が異なる場合がある。また、音声加算する端末数にあ
る範囲を設け、例えば1台から3台までの場合が3分の
1、4台から6台の場合が5分の1、7台から10台ま
でが10分の1というようなあるテーブルを用意して、
そのテーブルに従って雑音を低減させるようにしても構
わない。
Example 4. In the above embodiment, the case has been described in which the voice data determined to be noise is reduced to the level divided by the number of terminals (n) to which voice is added, but it is not necessarily limited to the case of dividing by the number of terminals. After adding the voices, the voice adding unit outputs the remaining voices after subtracting the voices of its own channel. For example, three terminals A,
When voice data is being input from B and C, terminal A
, The audio data of terminals B and C are added and output. Further, the voice data of the terminals A and C are added to the terminal B and output. Further, the audio data of the terminals A and B are added to the terminal C and output. Therefore, when three terminals are engaged in a video conference, each terminal has another
The voice data of the terminal will be output. In such a case, the voice data determined as noise may be reduced to ½ instead of ⅓. That is, the number of terminals participating in the video conference may differ from the number of terminals that actually add voice. In addition, a certain range is set for the number of terminals for voice addition. For example, 1 to 3 is 1/3, 4 to 6 is 1/5, and 7 to 10 is 10 minutes. Prepare a table like No. 1
Noise may be reduced according to the table.

【0052】実施例5.上記実施例1においては、音声
加算部12において音声レベルを音声出力目標値に近づ
ける場合について説明したが、音声検出部11あるいは
雑音制御部13においてそれぞれのチャネルからの音声
データのレベルを音声出力目標値に揃えるようにしても
構わない。図12は各音声検出部11あるいは雑音制御
部13が音声出力の利得を制御する場合を示したもので
ある。各チャネルからの音声データは音声検出部11あ
るいは雑音制御部13において音声出力目標値にレベル
を合わせられた後音声加算部12に出力される。音声加
算部12においてはこれらの音声を加算した後、再び音
声出力目標値にそのレベルを合わせられて出力する。
Example 5. In the above-described first embodiment, the case where the voice level is made to approach the voice output target value in the voice adding unit 12 has been described, but the voice detection unit 11 or the noise control unit 13 sets the voice data level from each channel to the voice output target. You may make it match with a value. FIG. 12 shows a case where each voice detection unit 11 or noise control unit 13 controls the gain of voice output. The voice data from each channel is output to the voice adder 12 after the level is adjusted to the voice output target value in the voice detector 11 or the noise controller 13. In the voice adding unit 12, after adding these voices, the level is adjusted again to the voice output target value and the voice output target value is output.

【0053】実施例6.上記実施例においては、図8に
示すように第1の検出部700と第2の検出部800が
同様な構成を用いてしきい値と音声データのレベルを比
較した場合について説明したが、第1の検出部700と
第2の検出部800は同じ構成をとる必要はない。ま
た、構成が同様な場合でも1ブロックを構成するサンプ
ル数を異なるようにしても構わないし、あるいはブロッ
ク数を異なるようにしても構わない。
Example 6. In the above embodiment, the case where the first detecting unit 700 and the second detecting unit 800 compare the threshold value and the level of the audio data by using the same configuration as shown in FIG. 8 has been described. The first detector 700 and the second detector 800 do not have to have the same configuration. Further, even if the configurations are the same, the number of samples forming one block may be different, or the number of blocks may be different.

【0054】実施例7.上記実施例1においては、音声
検出部11が音声データを入力して雑音制御部13が音
声データを音声加算部に出力する場合について説明した
が、逆に雑音制御部13が音声データを入力し、音声検
出部11が音声データを音声加算部に出力するようにし
ても構わない。すなわち、音声検出部が音声を検出する
動作と雑音制御部が雑音を制御する動作はどちらが先に
行われても構わない。
Example 7. In the first embodiment described above, the case where the voice detection unit 11 inputs the voice data and the noise control unit 13 outputs the voice data to the voice addition unit has been described. On the contrary, the noise control unit 13 inputs the voice data. The voice detection unit 11 may output the voice data to the voice addition unit. That is, it does not matter which of the operation of detecting the voice by the voice detection unit and the operation of controlling the noise by the noise control unit is performed first.

【0055】[0055]

【発明の効果】以上のように、この発明によれば雑音制
御部を設けたことにより、音声加算し、適正な音声レベ
ルになるよう利得を制御しても雑音レベルが高くなるこ
とがなくなり、良好な音声を用いた多地点テレビ会議を
実現することができる。
As described above, according to the present invention, by providing the noise control section, the noise level does not increase even if the voices are added and the gain is controlled so as to obtain an appropriate voice level. A multipoint video conference using good voice can be realized.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明における音声処理部のブロック図であ
る。
FIG. 1 is a block diagram of a voice processing unit according to the present invention.

【図2】この発明における音声処理部の入力音声データ
変化に伴う出力音声データの変化を表す図である。
FIG. 2 is a diagram showing a change in output voice data accompanying a change in input voice data of a voice processing unit according to the present invention.

【図3】この発明における音声処理部のより詳細なブロ
ック図である。
FIG. 3 is a more detailed block diagram of a voice processing unit in the present invention.

【図4】この発明の音声処理部の入力データのタイミン
グチャート図である。
FIG. 4 is a timing chart of input data of the voice processing unit according to the present invention.

【図5】この発明における音声処理部の符号化部から音
声検出部へのデータのタイミングチャート図である。
FIG. 5 is a timing chart of data from the encoding unit of the audio processing unit to the audio detection unit according to the present invention.

【図6】この発明における音声処理部の音声加算ハイウ
ェイデータの送受信タイミング図である。
FIG. 6 is a transmission / reception timing chart of voice addition highway data of the voice processing unit according to the present invention.

【図7】この発明における音声処理部の音声加算ハイウ
ェイデータの送受信タイミング図である。
FIG. 7 is a transmission / reception timing diagram of voice addition highway data of the voice processing unit according to the present invention.

【図8】この発明における音声処理部の音声検出部と雑
音制御部のブロック図である。
FIG. 8 is a block diagram of a voice detection unit and a noise control unit of the voice processing unit according to the present invention.

【図9】この発明における音声処理部の音声検出部と雑
音制御部のブロック図である。
FIG. 9 is a block diagram of a voice detection unit and a noise control unit of the voice processing unit according to the present invention.

【図10】この発明における音声処理部のブロック図で
ある。
FIG. 10 is a block diagram of a voice processing unit in the present invention.

【図11】この発明における音声処理部の入力音声デー
タ変化に伴う出力音声データの変化を表す図である。
FIG. 11 is a diagram showing a change in output voice data according to a change in input voice data of the voice processing unit according to the present invention.

【図12】この発明における利得の制御動作の一例を示
す図である。
FIG. 12 is a diagram showing an example of a gain control operation in the present invention.

【図13】従来の多地点間通信制御装置のブロック図で
ある。
FIG. 13 is a block diagram of a conventional multipoint control controller.

【図14】従来の音声処理部のブロック図である。FIG. 14 is a block diagram of a conventional audio processing unit.

【図15】従来の音声処理部における入力音声データ変
化に伴う出力音声データの変化を表す図である。
FIG. 15 is a diagram showing a change in output voice data associated with a change in input voice data in a conventional voice processing unit.

【符号の説明】[Explanation of symbols]

1 多地点間通信制御装置 2 システム制御部 3 回線インタフェース部 4a〜4m 分離部 5a〜5m 多重部 6 音声処理部 7 映像処理部 8 汎用データ処理部 9a〜9m 音声復号化部 10a〜10m 音声符号化部 11 音声検出部 12 音声加算部 13 雑音制御部 110 雑音レベル算出部 120 閾値設定部 130 第1の比較部 140 第1の判定部 150 第2の判定部 160 第2の比較部 170 第3の判定部 180 第4の判定部 300 音声検出信号 700 第1の検出部 800 第2の検出部 910 雑音制御用音声検出しきい値 920 AGC用音声検出しきい値 930 雑音除去部 940 ハングオーバ付加部 1 Multipoint communication controller 2 System control unit 3 line interface section 4a-4m separation part 5a-5m Multiplexing part 6 Audio processing unit 7 Video processing unit 8 General-purpose data processing unit 9a-9m speech decoding unit 10a to 10m speech coding unit 11 Voice detector 12 Voice adder 13 Noise control unit 110 noise level calculator 120 threshold setting unit 130 First comparison unit 140 First determination unit 150 Second determination unit 160 Second comparison unit 170 Third determination unit 180 Fourth determination unit 300 voice detection signal 700 first detector 800 Second detection unit 910 Noise detection threshold for noise control 920 AGC voice detection threshold 930 Noise removal unit 940 Hangover addition part

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−851(JP,A) 特開 平3−157044(JP,A) 特開 平2−148099(JP,A) 特開 平4−151953(JP,A) 特開 昭57−171400(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04M 3/56 H04N 7/15 H04M 11/00 ─────────────────────────────────────────────────── ─── Continuation of the front page (56) Reference JP-A-4-851 (JP, A) JP-A-3-157044 (JP, A) JP-A2-148099 (JP, A) JP-A-4- 151953 (JP, A) JP-A-57-171400 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) H04M 3/56 H04N 7/15 H04M 11/00

Claims (7)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数地点のテレビ会議端末間における多
地点テレビ会議を実現する多地点間通信制御装置におい
て、 テレビ会議端末から受信する多重化データから少なくと
も音声データを分離する分離部と、 上記分離部により分離した音声データが雑音かそれ以外
かを判定するための雑音制御用音声検出しきい値を記憶
し、上記雑音制御用音声検出しきい値と上記分離部によ
り分離した音声データのレベルとを比較して、上記雑音
制御用音声検出しきい値以下の音声データのレベルを低
減させて出力し、上記雑音制御用音声検出しきい値を越
える音声データをそのまま出力する雑音制御部と、 上記分離部により分離した音声データが有音であるか無
音であるかを判定するための自動利得制御(Autom
atic Gain Control,AGC)用音声
検出しきい値であって上記雑音制御用音声検出しきい値
よりも高い値であるAGC用音声検出しきい値を記憶
し、上記AGC用音声検出しきい値と上記分離部により
分離した音声データのレベルとを比較して、上記分離部
により分離した音声データが有音であるか無音であるか
を判定し、判定の際に上記AGC用音声検出しきい値を
上記雑音制御用音声検出しきい値よりも高い値としたこ
とによって上記雑音制御用音声検出しきい値以下の音声
データを無音と判定し、判定結果から、有音であるか無
音であるかを示す音声検出情報を生成する音声検出部
と、 上記雑音制御部により出力された音声データを他のテレ
ビ会議端末から受信して上記雑音制御部より出力された
音声データに加算し、加算した音声データを上記音声検
出部により生成された音声検出情報に基づいて適正な音
声レベルになるよう利得を制御する音声加算部と、 上記音声加算部により加算された音声データを他のデー
タと多重化し、テレビ会議端末へ送信する多重部とを備
えたことを特徴とする多地点間通信制御装置。
1. A multipoint communication control apparatus for realizing a multipoint videoconference between videoconference terminals at a plurality of points, and a separation unit for separating at least voice data from multiplexed data received from the videoconference terminal; Storing a noise control voice detection threshold value for determining whether the voice data separated by the unit is noise or not, and the noise control voice detection threshold value and the level of the voice data separated by the separation unit. And a noise control unit that reduces the level of voice data below the noise control voice detection threshold and outputs the voice data, and outputs voice data that exceeds the noise control voice detection threshold as is. Automatic gain control (Autom) for determining whether the audio data separated by the separation unit is voiced or silent.
(Atic Gain Control, AGC) voice detection threshold value for AGC, which is a value higher than the noise control voice detection threshold value, is stored and stored as the AGC voice detection threshold value. By comparing with the level of the audio data separated by the separation unit , the separation unit
Whether the voice data separated by is voiced or silent
The AGC voice detection threshold value is set at the time of the determination.
The value must be higher than the noise detection threshold for noise control.
And the sound below the noise detection threshold for noise control
The data is judged to be silent, and the judgment result indicates whether or not there is sound.
A voice detection unit that generates voice detection information indicating whether it is sound, and voice data output by the noise control unit is received from another video conference terminal and added to the voice data output by the noise control unit. , A voice addition unit that controls the gain so that the added voice data has an appropriate voice level based on the voice detection information generated by the voice detection unit, and the voice data added by the voice addition unit is converted into another data. And a multiplexing unit that multiplexes and transmits to a video conference terminal.
【請求項2】 上記雑音制御部は、音声加算する端末数
に応じて雑音のレベルを低減することを特徴とする請求
項1記載の多地点間通信制御装置。
2. The multipoint communication control apparatus according to claim 1, wherein the noise control unit reduces the noise level according to the number of terminals to which voice is added.
【請求項3】 上記雑音制御部は、音声加算する端末数
(n)で割ったレベル(1/n)まで雑音レベルを低減
することを特徴とする請求項2記載の多地点間通信制御
装置。
3. The multipoint communication control apparatus according to claim 2, wherein the noise control unit reduces the noise level to a level (1 / n) divided by the number (n) of terminals to be voice-added. .
【請求項4】 上記雑音制御部は、上記雑音制御用音声
検出しきい値を適応的に変化させることを特徴とする請
求項1記載の多地点間通信制御装置。
4. The noise control unit, the noise control voice
The multipoint communication control device according to claim 1, wherein the detection threshold is adaptively changed.
【請求項5】 上記雑音制御部は、複数のテレビ会議端
末からの音声データを時分割に順に処理して音声加算部
に出力することを特徴とする請求項1記載の多地点間通
信制御装置。
5. The multipoint communication control device according to claim 1, wherein the noise control unit processes the audio data from the plurality of video conference terminals in a time-divisional order and outputs the processed audio data to the audio addition unit. .
【請求項6】 上記雑音制御部は、音声データのレベル
上記雑音制御用音声検出しきい値を比較する比較部
と、所定のサンプル数を1ブロックとして各ブロック毎
にその比較結果を判定する第1の判定部と、第1の判定
部の判定結果に基づき複数ブロックにわたって音声デー
タが雑音かどうかの判定を行う第2の判定部を備えたこ
とを特徴とする請求項1記載の多地点間通信制御装置。
6. The noise control unit determines the comparison result for each block, with a comparison unit for comparing the level of the voice data and the noise detection voice detection threshold value and a predetermined number of samples as one block. The multipoint according to claim 1, further comprising: a first determination unit and a second determination unit that determines whether or not the voice data is noise over a plurality of blocks based on the determination result of the first determination unit. Inter-communication control device.
【請求項7】 上記多地点間通信制御装置は、上記分離
部により分離した音声データを低域データと高域データ
に復号する復号化部を有し、上記雑音制御部は、低域デ
ータを用いて雑音かそれ以外かを判定することを特徴と
する請求項1記載の多地点間通信制御装置。
7. The multipoint-to-point communication control device includes a decoding unit that decodes the voice data separated by the separation unit into low-frequency data and high-frequency data, and the noise control unit converts the low-frequency data. The multipoint communication control device according to claim 1, wherein it is determined whether it is noise or not using noise.
JP15026493A 1993-06-22 1993-06-22 Multipoint communication controller Expired - Fee Related JP3441112B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15026493A JP3441112B2 (en) 1993-06-22 1993-06-22 Multipoint communication controller

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15026493A JP3441112B2 (en) 1993-06-22 1993-06-22 Multipoint communication controller

Publications (2)

Publication Number Publication Date
JPH0715535A JPH0715535A (en) 1995-01-17
JP3441112B2 true JP3441112B2 (en) 2003-08-25

Family

ID=15493145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15026493A Expired - Fee Related JP3441112B2 (en) 1993-06-22 1993-06-22 Multipoint communication controller

Country Status (1)

Country Link
JP (1) JP3441112B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4919077B2 (en) * 2007-10-05 2012-04-18 ヤマハ株式会社 Voice communication terminal and voice communication system
JP4850191B2 (en) * 2008-01-16 2012-01-11 富士通株式会社 Automatic volume control device and voice communication device using the same

Also Published As

Publication number Publication date
JPH0715535A (en) 1995-01-17

Similar Documents

Publication Publication Date Title
US4815132A (en) Stereophonic voice signal transmission system
US5809472A (en) Digital audio data transmission system based on the information content of an audio signal
US5818514A (en) Video conferencing system and method for providing enhanced interactive communication
US4577310A (en) Station interface for digital electronic telephone switching system having centralized digital audio processor
US5068899A (en) Transmission of wideband speech signals
EP0475196B1 (en) Method for processing audio signals in a sub-band coding system
JP2000174909A (en) Conference terminal controller
HK1022224A1 (en) Conference calling system and method for a wireless communications channel
US5334977A (en) ADPCM transcoder wherein different bit numbers are used in code conversion
US6078882A (en) Method and apparatus for extracting speech spurts from voice and reproducing voice from extracted speech spurts
JP3441112B2 (en) Multipoint communication controller
JPS6074861A (en) Conference connecting method and circuit
JP2000124915A (en) Method and device for decoding soundless compressed code
JP4296154B2 (en) Audio transmission system
US5706393A (en) Audio signal transmission apparatus that removes input delayed using time time axis compression
JP3208629B2 (en) Relay switching control method
JPH1188513A (en) Voice processing unit for inter-multi-point communication controller
JP3133353B2 (en) Audio coding device
JPH11355450A (en) Voice detecting device and speech communication device
JP2878018B2 (en) Transit exchange for coded voice signals
JP2661567B2 (en) Multipoint video conference system
JPH10112760A (en) Tone quality degradation preventing system
JPH0564275A (en) Digital multiplex device
JPS5941599B2 (en) Redundancy removed PCM audio transmission method
JP2002099299A (en) Silent compressed voice coding and decoding device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030603

LAPS Cancellation because of no payment of annual fees