JP2016111673A

JP2016111673A - 自動音声調整装置

Info

Publication number: JP2016111673A
Application number: JP2015136624A
Authority: JP
Inventors: 波多野　渉; Wataru Hatano; 渉波多野
Original assignee: Tamura Corp
Current assignee: Tamura Corp
Priority date: 2014-07-30
Filing date: 2015-07-08
Publication date: 2016-06-20
Anticipated expiration: 2035-07-08
Also published as: JP5988461B2

Abstract

【課題】聞き手にとって違和感のない音声信号を出力することができる自動音声調整装置を提供する。【解決手段】本装置は、複数の音声信号入力部１ａ，１ｂ，１ｃと、各音声信号入力部１ａ，１ｂ，１ｃから入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部２ａ，２ｂ，２ｃと、各音声処理部２ａ，２ｂ，２ｃからの処理済みの音声信号を出力する複数の音声信号出力部３ａ，３ｂ，３ｃを有する。係数決定部４は、各音声処理部２ａ，２ｂ，２ｃに対して、それぞれ各音声処理部２ａ，２ｂ，２ｃ用のゲインシェア係数を出力する。係数決定部４は、複数の音声信号入力部１ａ，１ｂ，１ｃから入力された音声信号のレベルが、予め設定された閾値を超えた場合には、その閾値に基づいてゲインシェア係数を出力し、入力された音声信号のレベルが閾値以下の場合には、各音声信号のレベルに基づいてゲインシェア係数を出力する。【選択図】図１

Description

本発明は、複数のチャンネルからの入力信号のレベルを調整する自動音声調整装置に関する。

従来の自動音声調整装置において、複数の音声入力のゲイン調整には、ゲート型とゲインシェアリング型の２つの方式があり、近年では、ゲインシェアリング型の装置が主流である。これらの装置の機能としては、下記のものがある。

（１）トータルのミックスレベルを１としたときに、構成されるそれぞれのチャンネルのレベルの割合に従い、各チャンネルのレベルを配分することにより、マイクの数によらず一定のレベルのミックス信号を生成する。
（２）しゃべり待ちなどで使用していないマイクは、ゲインを抑え込むことにより他のチャンネルに回り込んだ音声信号のレベルを抑制し、全体のハウリングマージン、ノイズの低減を実現する。
（３）しゃべりはじめの音声信号の欠落を抑えたり、欠落時間の調整が可能である。これにより、フェーダのレベルを上げる時間を調整できる。

（４）未使用マイクなどのレベルの低いマイクをオフする時間（リリースタイム）が調整可能である。これにより、フェーダのレベルを下げる時間を調整できる。
（５）対象チャンネルの自動混合機能（オートミックス機能）のオン・オフが可能である。
（６）全チャンネルの音声信号の混合割合に対して、自チャンネルの混合割合の増減を調整することが可能である。
（７）例えば、混合割合は４グループまで構成でき、各グループに対して任意のチャンネルを登録することが可能である。

このような観点から、自動音声調整装置に関する提案が、たとえば下記の特許文献に示すように従来からなされている。

特開２０１０−０９８５６２号公報特開２００２−１４２２８６号公報

従来の自動音声調整装置は、複数の音声信号のトータルのゲインを１とした場合、それぞれの入力信号の割合に応じて各チャンネルに配分されるゲイン（各チャンネルからの入力信号に乗じるゲインシェア係数）が決定される。ゲインの配分は、一番大きな音に対して、一番多くのゲインが配分される。したがって、使用していないチャンネルは、ゲインが小さくなるため不要音が小さくなり全体の音質が向上する。他方、使用チャンネルが複数ある場合、比較して小さいほうの音声信号は有効な信号であるにもかかわらずゲインが小さく設定されてしまう。また、二人の話者による掛け合いの番組等では、しゃべり手が交互に代わるため、その都度チャンネルごとにレベルの変動が生じてしまい、全体の音声としてつながり感の無い不自然なものとなる場合がある。

このような従来技術の問題点を図６により説明する。例えば、入力信号として、音声１〜３の３つのチャンネルがあり、このうち、音声１は出力される音声信号がなく、レベル0.2のノイズのみが出力され、音声２と音声３はそれぞれレベル0.5のしゃべり１と、レベル0.8のしゃべり２の音声信号が出力されるとする。

従来技術では、ゲインシェア係数の合計が1.0となるように、音声１のチャンネルの入力信号0.2に対してはゲインシェア係数(0.2/(0.2+0.5+0.8))=0.133を、音声２のチャンネルの入力信号0.5に対してはゲインシェア係数(0.5/(0.2+0.5+0.8))=0.333を、音声３のチャンネルの入力信号0.8に対してはゲインシェア係数(0.8/(0.2+0.5+0.8))=0.533を乗じていた。なお、小数点４桁目を四捨五入しているので、計算上はゲインシェア係数の合計が1.0になっていない。

その結果、音声１のチャンネルの出力は、0.2*(0.2/(0.2+0.5+0.8))=0.0266となり、ノイズが1/4に抑えられる。音声２のチャンネルの出力は、0.5*(0.5/(0.2+0.5+0.8))=0.166となり、入力レベル0.2に対して0.64倍小さくなる。音声３のチャンネルの出力は0.8*(0.8/(0.2+0.5+0.8))=0.427となり、入力信号に比較して、３つのチャンネルに占める音声３の出力レベルが大きくなる。

このように従来技術では、ノイズの出力レベルが低く抑えられる利点はあるものの、しゃべり１としゃべり２のバランスが崩れ、入力レベルが小さいしゃべり２の音声出力が低下してしまい、聞き取りにくくなる欠点があった。また、入力レベルが小さなしゃべり１は、しゃべり２の入力レベルの大きさにより変動するため、しゃべり１の入力レベルが同じ大きさであっても出力レベルが変動してしまい、聞き手にとって違和感が大きかった。

本発明は前記のような従来技術の問題点を解決するために提案されたものである。本発明の目的は、所定のレベル以上の複数の音声信号が入力されたとき、これらの差分を無視して等分にゲインを配分することにより、聞き手にとって違和感のない音声信号を出力することができる自動音声調整装置を提供することにある。

前記の目的を達成するために、本発明の自動音声調整装置は、次のような構成を有することを特徴とする。
（１）複数の音声信号入力部。
（２）前記各音声信号入力部から入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部。
（３）前記各音声処理部からの処理済みの音声信号を出力する複数の音声信号出力部。
（４）前記各音声処理部に対して、それぞれ各音声処理部用のゲインシェア係数を出力する係数決定部。
（５）前記係数決定部は、前記複数の音声信号入力部から入力された音声信号のレベルが、予め設定された閾値を超えた場合には、その閾値に基づいてゲインシェア係数を出力し、入力された音声信号のレベルが前記閾値以下の場合には、各音声信号のレベルに基づいてゲインシェア係数を出力する。

前記係数決定部が、前記閾値の設定部と、各音声信号のレベル値の入力部と、音声信号のレベル値が閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を演算する演算部を備えていることが好ましい。

本発明によれば、複数の入力信号レベルを監視して、有効な入力信号のゲインを大きくしてその他の未使用チャンネルのゲインを抑えるというオペレータの操作を自動で行う自動音声調整装置において、全体のゲインの総和に対する各入力信号のゲインの配分を行うに当たり、任意のレベル（閾値）以上の入力信号に対しては、同一レベル（閾値）の入力と設定することにより、出力信号の音声レベルを安定させて、聞き手にとって不自然な音声出力にならない効果を発揮することができる。

本発明の第１実施形態の構成を示すブロック図。第１実施形態の機能を示すブロック図。第２実施形態の機能を示すブロック図。第３実施形態の機能を示すブロック図。第４実施形態の機能を示すブロック図。従来の音声調整装置の機能を示すブロック図。

［１．第１実施形態］
［１−１．第１実施形態の構成］
以下、本発明の第１実施形態を図１に従って具体的に説明する。図１に示す通り、本実施形態の装置は、複数の音声信号入力部１ａ，１ｂ，１ｃと、各音声信号入力部１ａ，１ｂ，１ｃから入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部２ａ，２ｂ，２ｃと、各音声処理部２ａ，２ｂ，２ｃからの処理済みの音声信号を出力する複数の音声信号出力部３ａ，３ｂ，３ｃを有する。各音声信号入力部１ａ，１ｂ，１ｃと音声処理部２ａ，２ｂ，２ｃには、係数決定部４が接続されている。

係数決定部４が、閾値の設定部４１と、各音声信号のレベル値の入力部４２と、音声信号のレベル値が閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を計算する演算部４３を備えている。

閾値の設定部４１は、所定の音声レベル以上の入力信号が入力された場合に、入力された音声レベル値をそのまま演算部４３に出力することなく、予め設定した音声レベル値を、入力された音声レベル値に代えて演算部４３に出力するための閾値を、オペレータが設定するためのものである。各音声信号のレベル値の入力部４２は、音声信号入力部１ａ，１ｂ，１ｃに接続されており、音声信号入力部１ａ，１ｂ，１ｃに入力された音声信号のレベル値を入力して、その値を演算部４３に出力するものである。

演算部４３は、音声信号入力部１ａ，１ｂ，１ｃから入力された音声信号のレベル値と、閾値とを比較して、音声信号入力部１ａ，１ｂ，１ｃから入力された音声信号のレベル値が、予め設定された閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値として、各音声信号のレベル値の総和を計算する。その後、各音声信号のレベル値を各音声信号のレベル値の総和で除することにより、ゲインシェア係数を計算する。演算部４３が計算した各音声信号のゲインシェア係数は、それぞれ音声処理部２ａ，２ｂ，２ｃに出力される。

音声処理部２ａ，２ｂ，２ｃは、入力された音声信号のレベル値に、演算部４３で得られた各ゲインシェア係数を乗じて、音声信号出力部３ａ，３ｂ，３ｃから出力する音声信号のレベル値を決定する。

［１−２．第１実施形態の作用効果］
図２は、前記のような構成を有する第１実施形態の作用を説明するブロック図である。図２において、入力信号として、音声信号入力部１ａ，１ｂ，１ｃに対応して音声１〜３の３つのチャンネルがあり、このうち、音声１は出力される音声信号がなく、レベル0.2のノイズのみが出力され、音声２と音声３はそれぞれレベル0.5のしゃべり１と、レベル0.8のしゃべり２の音声信号が出力されるとする。一方、設定部４１には、予め閾値として0.5を設定しておく。

この状態で、係数決定部４の各音声信号のレベル値の入力部４２に、音声信号入力部１ａ，１ｂ，１ｃからそれぞれのレベル値が入力されると、演算部４３はそれぞれのレベル値と閾値とを比較し、閾値よりも低いレベル値の音声１のチャンネルについてはゲインシェア係数(0.2/(0.2+0.5+0.5))=0.167を、閾値と等しいレベル値の音声２のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.2+0.5+0.5))=0.417を、閾値よりも高いレベル値の音声３のチャンネルの入力信号0.8に対しては、入力信号のレベル値に閾値を代入してゲインシェア係数(0.5/(0.2+0.5+0.5))= 0.417を計算する。

その結果、音声１のチャンネルの出力は、0.2*(0.2/(0.2+0.5+0.5))=0.033となり、ノイズチャンネルの大きさは抑え込まれる。また、音声２のチャンネルの出力は、0.5*(0.5/(0.2+0.5+0.5))=0.208、音声３のチャンネルの出力は0.8*(0.5/(0.2+0.5+0.5))=0.333となり、しゃべり１と２のバランスは0.625と一定に保たれると共に、しゃべり２の大きさにしゃべり１のレベルが左右されないことが分かる。

以上の通り、本実施形態によれば、入力信号のノイズは低く抑えられると共に、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。

［２．第２実施形態］
［２−１．第２実施形態の構成］
以下、本発明の第２実施形態について説明する。第２実施形態の構成は、第１実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、話者の近傍に音声信号の入力を制御するＯＮ／ＯＦＦスイッチ（ＳＷ）であるカフボックスを設けるようにし、話者の音声信号の、音声信号入力部への入力を制限できるようにした点である。

［２−２．第２実施形態の作用効果］
図３は、前記のような構成を有する第２実施形態の作用を説明するブロック図である。
図３において、入力信号として、音声信号入力部１ａ，１ｂ，１ｃに対応して音声１〜３の３つのチャンネルがあり、このうち、音声１は話者がいないため、スイッチをＯＦＦとし、ノイズによる音声の入力をしないようにしている。したがって、音声１のレベルは0.0となる。音声２と音声３はそれぞれレベル0.5のしゃべり１と、レベル0.8のしゃべり２の音声信号が出力されるとする。一方、設定部４１には、予め閾値として0.5を設定しておく。

この状態で、係数決定部４の各音声信号のレベル値の入力部４２に、音声信号入力部１ａ，１ｂ，１ｃからそれぞれのレベル値が入力されると、演算部４３はそれぞれのレベル値と閾値とを比較し、閾値よりも低いレベル値の音声１のチャンネルについてはゲインシェア係数(0.0/(0.0+0.5+0.5))=0.0を、閾値と等しいレベル値の音声２のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.0+0.5+0.5))=0.5を、閾値よりも高いレベル値の音声３のチャンネルの入力信号0.8に対しては、入力信号のレベル値に閾値を代入してゲインシェア係数(0.5/(0.0+0.5+0.5))= 0.5を計算する。

その結果、音声１のチャンネルの出力は、0.2*(0.0/(0.0+0.5+0.5))=0.0となり、ノイズチャンネルの大きさは抑え込まれる。また、音声２のチャンネルの出力は、0.5*(0.5/(0.0+0.5+0.5))=0.25、音声３のチャンネルの出力は0.8*(0.5/(0.0+0.5+0.5))=0.4となり、しゃべり１と２のバランスは0.625と一定に保たれると共に、しゃべり２の大きさにしゃべり１のレベルが左右されないことが分かる。

以上の通り、本実施形態によれば、入力信号のノイズの影響を抑えられると共に、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。

［３．第３実施形態］
［３−１．第３実施形態の構成］
以下、本発明の第３実施形態について説明する。第３実施形態の構成は、第１実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、各音声信号出力部の前段にハウリング検出部を各音声信号にそれぞれ設け、いずれかの音声信号でハウリングが検出された場合、係数決定部４の演算部４３に対し、ハウリングが検出されなくなるまでゲインシェア係数を小さくする制御を行うようにした点である。具体的には、図4で示す合計値を大きくするようにした点である。
なお、本実施形態では、ハウリング検出部は、各信号処理部の後段で、各音声信号出力部の前段に配置したが、各信号処理部の前段でも良い。

［３−２．第３実施形態の作用効果］
図４は、前記のような構成を有する第３実施形態の作用を説明するブロック図である。
図４において、入力信号として、音声信号入力部１ａ，１ｂ，１ｃに対応して音声１〜３の３つのチャンネルがあり、このうち、音声１はハウリングを起こしている音声とし、音声１のレベルは1.2で出力されるとする。音声２と音声３はそれぞれレベル0.5のしゃべり１と、レベル0.8のしゃべり２の音声信号が出力されるとする。一方、設定部４１には、予め閾値として0.5を設定しておく。

この状態で、係数決定部４の各音声信号のレベル値の入力部４２に、音声信号入力部１ａ，１ｂ，１ｃからそれぞれのレベル値が入力されると、演算部４３はそれぞれのレベル値と閾値とを比較し、閾値よりも高いレベル値の音声１のチャンネルの入力信号1.2についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、閾値と等しいレベル値の音声２のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、閾値よりも高いレベル値の音声３のチャンネルの入力信号0.8についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、計算する。

その結果、音声１のチャンネルの出力は、1.2*(0.5/(0.5+0.5+0.5))=0.400、音声２のチャンネルの出力は、0.5*(0.5/(0.5+0.5+0.5))=0.167、音声３のチャンネルの出力は0.8*(0.5/(0.5+0.5+0.5))=0.266となる。

この場合、音声１はハウリングを有しているので、音声信号１のハウリング検出部はハウリングを検出する。ここで、ハウリングとは、例えば音声信号をフーリエ変換したした際に特定の周波数で所定のレベル値を超えている状態であり、ハウリングを検出するとはその状態を検出することをいう。ただし、ハウリングの検出方法は、一般的な他の方法で行っても良い。

ハウリングを検出した際、ゲインシェア係数を低く設定するため、音声信号出力の合計値である1.5を例えば0.1大きくする。
その結果、音声１のチャンネルの入力信号1.2についてはゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))=0.313を、音声２のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))=0.313を、音声３のチャンネルの入力信号0.8に対しては、ゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))= 0.313を計算する。

すると音声１チャンネルの出力は、1.2*(0.5/(0.5+0.5+0.5+0.1))=0.376、音声２チャンネルの出力は、0.5*(0.5/(0.5+0.5+0.5+0.1))=0.157、音声3チャンネルの出力は、0.8*(0.5/(0.5+0.5+0.5+0.1))=0.250となる。

しかし、音声チャンネル１でまだハウリングを検出している場合は、さらに、上記計算をハウリングが無くなるまで繰り返すようにする。
なお、上記例では、0.1を加算したが、0.01を加算するようにしても良いし、ハウリングの程度によって加算する値を変更するようにしても良い。

以上の通り、本実施形態によれば、ハウリングを含む入力信号についても、全体の音声出力信号レベル比を変えずに、全体のバランスを考慮しつつ、音声のレベル制御ができ、また、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。

本制御は、ハウリングの状態を解消するのに、全体の音声レベルを下げるのと同じ効果を得ることができる。
また、ハウリングキャンセラー等のように、ハウリングを起こしている所定の周波数をカットすることもないので、音質も高音質に保つことができる。

なお、ハウリングを検出すると、ゲインシェア係数を算出するために音声入力レベル値の合計値を大きくする制御を行ったが、ハウリングを検出しなくなった場合、すぐにその制御を解放し、元の制御に戻してもよいが、ハウリングを検出しなくなってから所定時間経過後に制御を解放するようにしても良い。また、音声が自然になくなり所定時間経過後や、カフボックス等により音声入力をOFFにしたタイミングや、別の番組（音声プログラム）に変更され、音声処理部の設定が変更された後でも良い。ハウリングを検出したり、検出しなかったりとなった場合、制御が不安定な状態になるのを防止するためである。

［４．第４実施形態］
［４−１．第４実施形態の構成］
以下、本発明の第４実施形態について説明する。本実施形態の構成は、第３実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、ハウリング検出部でハウリングが検出されてから、ハウリングが検出されなくなるまでゲインシェア係数を小さくする制御の仕方で異なる。具体的には、ハウリングを検出される音声信号に対して音声信号レベル値を小さくするように制御した点で異なる。

［４−２．第４実施形態の作用効果］
図５は、前記のような構成を有する第３実施形態の作用を説明するブロック図である。
図５において、入力信号として、音声信号入力部１ａ，１ｂ，１ｃに対応して音声１〜３の３つのチャンネルがあり、このうち、音声１はハウリングを起こしている音声とし、音声１のレベルは1.2で出力されるとする。音声２と音声３はそれぞれレベル0.5のしゃべり１と、レベル0.8のしゃべり２の音声信号が出力されるとする。一方、設定部４１には、予め閾値として0.5を設定しておく。

この場合、音声１はハウリングを有しているので、音声信号１のハウリング検出部はハウリングを検出する。なお、ハウリングの検出方法は、第３実施形態と同様である。

ハウリングを検出した際、ハウリングを検出している音声に対するゲインシェア係数を低く設定するため、音声信号レベル値を例えば0.1小さくする。
その結果、音声１のチャンネルの入力信号1.2についてはハウリングを検出しているので、ゲインシェア係数(0.4/(0.5+0.5+0.5))=0.267を、音声２のチャンネルの入力信号0.5、音声３のチャンネルの入力信号0.8はハウリングを検出していないので、ゲインシェア係数(0.5/(0.5+0.5+0.5))= 0.333を計算する。

すると音声１チャンネルの出力は、1.2*(0.4/(0.5+0.5+0.5))=0.320、音声２チャンネルの出力は、0.5*(0.5/(0.5+0.5+0.5))=0.167、音声3チャンネルの出力は、0.8*(0.5/(0.5+0.5+0.5))=0.266となる。なお、音声チャンネル１でまだハウリングを検出している状態となっている場合は、さらに、上記計算をハウリングが無くなるまで上記制御を繰り返す。

なお、第３実施形態と同様に、0.1下げる制御ではなく、0.01下げる制御にしても良いし、ハウリングの度合いによって、下げる値を変更するようにしても良い。

以上の通り、本実施形態によれば、ハウリングを含む入力信号レベルを抑えつつ、ハウリングが検出されていない音声２と音声３のバランスを変えずに、全体のバランスを考慮しつつ、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。

また、本制御は、ハウリング状態を解消する際、ハウリングを起こしている音声の信号レベルを下げるのと同じ効果を得ることができる。
また、ハウリングキャンセラー等のように、ハウリングを起こしている所定の周波数をカットすることもないので、音質も高音質に保つことができる。

なお、ゲインシェア係数を算出するために音声入力レベル値を下げる制御を行ったが、この制御を解放し、元の制御に戻すタイミングは、第３実施形態と同じである。

［５．第５実施形態］
各音声信号入力部にハウリング検出器を設けるようにし、演算部でレベル値の合算をする前に音声信号のレベルをハウリングしないように音量レベルを下げるようにしても良い。

ハウリングを検知しなくなるまで出力レベルを下げる制御を行い、音声レベルがハウリングしていなレベルまで下がった後、その後の処理は第１実施形態で説明した通り、ゲインシェア係数が算出され、各音声のレベル制御がされる。

［６．他の実施形態］
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。以下は、その一例である。
（１）音声信号入力部、音声処理部、音声信号出力部は、入力チャンネル数に応じて適宜増減することができる。
（２）係数決定部の構成は図示のものに限らず、各音声処理部内に係数決定部を設けることができる。また、図示の実施形態では、演算部で入力された音声信号のレベル値と閾値とを比較したが、音声信号のレベル値の入力部において閾値との比較を行い、演算部はその結果に従って、ゲインシェア係数を計算してもよい。
（３）閾値の設定部は、オペレータが手動で設定する以外に、予めプログラムによって閾値を設定することも可能である。例えば、放送内容がしゃべり主体の時間帯にのみ本発明の処理を適用し、音楽主体の時間帯では本発明の処理を行わないように設定したり、しゃべりが主体の時間帯でもしゃべりの特性に応じて、閾値を自動的に変化させるように予め閾値変更用のプログラムを設定しておくこともできる。
（４）音声信号が、男女、人数の増減などによって異なる場合には、例えば、聴感補正フィルタの逆数を手動で設定した閾値に乗じて補正後の閾値を決定するなど、各音声信号の特性に合わせた閾値を設定することで、男性の野太い声や女性の高い声を聞き取りやすくすることも可能である。
（５）演算部で、入力信号と閾値のレベルの総和を計算する場合に、音声信号入力部ごとに重み付け係数など、レベル値を調整するためのパラメータを設定することも可能である。例えば、予め音声信号入力部から入力される信号の種類が判明している場合、入力されたレベル値にパラメータを乗じて閾値と比較したり、ゲインシェア係数を計算することもできる。
（６）前記（５）と同様に、閾値を音声信号入力部ごとに異なる値に設定することもできる。例えば、第１実施形態において、チャンネル１の閾値をバックグラウンドノイズとなる値（例えば、閾値を0.2とするなど）に設定することにより、チャンネル１で突発的に発生する大きな音声によるノイズの影響をなくすことができ、チャンネル２、チャンネル３の音声に対し、効率的にバックグラウンドノイズをマスクことができる。
（７）第２実施形態において、スイッチは、カフボックスに限定されるものではなく、音声信号の入力を制御するＯＮ／ＯＦＦスイッチ（ＳＷ）であれば良い。例えば、音声調整装置の操作パネルにあるＯＮ／ＯＦＦスイッチなどである。
（８）さらに、上記スイッチ操作により音声信号の入力を制限するのではなく、前記（６）のように、スイッチ操作によりバックグラウンドノイズとなる値に閾値の設定を変更するようにしても良い。

１ａ，１ｂ，１ｃ…音声信号入力部
２ａ，２ｂ，２ｃ…音声処理部
３ａ，３ｂ，３ｃ…音声信号出力部
４…係数決定部
４１…閾値設定部
４２…音声信号のレベル値の入力部
４３…ゲインシェア係数の演算部

Claims

複数の音声信号入力部と、
前記各音声信号入力部から入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部と、
前記各音声処理部からの処理済みの音声信号を出力する複数の音声信号出力部と、
前記各音声処理部に対して、それぞれ各音声処理部用のゲインシェア係数を出力する係数決定部とを備え、
前記係数決定部は、前記複数の音声信号入力部から入力された音声信号のレベルが、
予め設定された閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を出力することを特徴とする自動音声調整装置。
前記係数決定部が、
前記閾値の設定部と、
各音声信号のレベル値の入力部と、
音声信号のレベル値が閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を演算する演算部を備えていることを特徴とする請求項１に記載の自動音声調整装置。