JP2016111673A - 自動音声調整装置 - Google Patents
自動音声調整装置 Download PDFInfo
- Publication number
- JP2016111673A JP2016111673A JP2015136624A JP2015136624A JP2016111673A JP 2016111673 A JP2016111673 A JP 2016111673A JP 2015136624 A JP2015136624 A JP 2015136624A JP 2015136624 A JP2015136624 A JP 2015136624A JP 2016111673 A JP2016111673 A JP 2016111673A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- input
- level
- audio signal
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】聞き手にとって違和感のない音声信号を出力することができる自動音声調整装置を提供する。【解決手段】本装置は、複数の音声信号入力部1a,1b,1cと、各音声信号入力部1a,1b,1cから入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部2a,2b,2cと、各音声処理部2a,2b,2cからの処理済みの音声信号を出力する複数の音声信号出力部3a,3b,3cを有する。係数決定部4は、各音声処理部2a,2b,2cに対して、それぞれ各音声処理部2a,2b,2c用のゲインシェア係数を出力する。係数決定部4は、複数の音声信号入力部1a,1b,1cから入力された音声信号のレベルが、予め設定された閾値を超えた場合には、その閾値に基づいてゲインシェア係数を出力し、入力された音声信号のレベルが閾値以下の場合には、各音声信号のレベルに基づいてゲインシェア係数を出力する。【選択図】図1
Description
本発明は、複数のチャンネルからの入力信号のレベルを調整する自動音声調整装置に関する。
従来の自動音声調整装置において、複数の音声入力のゲイン調整には、ゲート型とゲインシェアリング型の2つの方式があり、近年では、ゲインシェアリング型の装置が主流である。これらの装置の機能としては、下記のものがある。
(1)トータルのミックスレベルを1としたときに、構成されるそれぞれのチャンネルのレベルの割合に従い、各チャンネルのレベルを配分することにより、マイクの数によらず一定のレベルのミックス信号を生成する。
(2)しゃべり待ちなどで使用していないマイクは、ゲインを抑え込むことにより他のチャンネルに回り込んだ音声信号のレベルを抑制し、全体のハウリングマージン、ノイズの低減を実現する。
(3)しゃべりはじめの音声信号の欠落を抑えたり、欠落時間の調整が可能である。これにより、フェーダのレベルを上げる時間を調整できる。
(2)しゃべり待ちなどで使用していないマイクは、ゲインを抑え込むことにより他のチャンネルに回り込んだ音声信号のレベルを抑制し、全体のハウリングマージン、ノイズの低減を実現する。
(3)しゃべりはじめの音声信号の欠落を抑えたり、欠落時間の調整が可能である。これにより、フェーダのレベルを上げる時間を調整できる。
(4)未使用マイクなどのレベルの低いマイクをオフする時間(リリースタイム)が調整可能である。これにより、フェーダのレベルを下げる時間を調整できる。
(5)対象チャンネルの自動混合機能(オートミックス機能)のオン・オフが可能である。
(6)全チャンネルの音声信号の混合割合に対して、自チャンネルの混合割合の増減を調整することが可能である。
(7)例えば、混合割合は4グループまで構成でき、各グループに対して任意のチャンネルを登録することが可能である。
(5)対象チャンネルの自動混合機能(オートミックス機能)のオン・オフが可能である。
(6)全チャンネルの音声信号の混合割合に対して、自チャンネルの混合割合の増減を調整することが可能である。
(7)例えば、混合割合は4グループまで構成でき、各グループに対して任意のチャンネルを登録することが可能である。
このような観点から、自動音声調整装置に関する提案が、たとえば下記の特許文献に示すように従来からなされている。
従来の自動音声調整装置は、複数の音声信号のトータルのゲインを1とした場合、それぞれの入力信号の割合に応じて各チャンネルに配分されるゲイン(各チャンネルからの入力信号に乗じるゲインシェア係数)が決定される。ゲインの配分は、一番大きな音に対して、一番多くのゲインが配分される。したがって、使用していないチャンネルは、ゲインが小さくなるため不要音が小さくなり全体の音質が向上する。他方、使用チャンネルが複数ある場合、比較して小さいほうの音声信号は有効な信号であるにもかかわらずゲインが小さく設定されてしまう。また、二人の話者による掛け合いの番組等では、しゃべり手が交互に代わるため、その都度チャンネルごとにレベルの変動が生じてしまい、全体の音声としてつながり感の無い不自然なものとなる場合がある。
このような従来技術の問題点を図6により説明する。例えば、入力信号として、音声1〜3の3つのチャンネルがあり、このうち、音声1は出力される音声信号がなく、レベル0.2のノイズのみが出力され、音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。
従来技術では、ゲインシェア係数の合計が1.0となるように、音声1のチャンネルの入力信号0.2に対してはゲインシェア係数(0.2/(0.2+0.5+0.8))=0.133を、音声2のチャンネルの入力信号0.5に対してはゲインシェア係数(0.5/(0.2+0.5+0.8))=0.333を、音声3のチャンネルの入力信号0.8に対してはゲインシェア係数(0.8/(0.2+0.5+0.8))=0.533を乗じていた。なお、小数点4桁目を四捨五入しているので、計算上はゲインシェア係数の合計が1.0になっていない。
その結果、音声1のチャンネルの出力は、0.2*(0.2/(0.2+0.5+0.8))=0.0266となり、ノイズが1/4に抑えられる。音声2のチャンネルの出力は、0.5*(0.5/(0.2+0.5+0.8))=0.166となり、入力レベル0.2に対して0.64倍小さくなる。音声3のチャンネルの出力は0.8*(0.8/(0.2+0.5+0.8))=0.427となり、入力信号に比較して、3つのチャンネルに占める音声3の出力レベルが大きくなる。
このように従来技術では、ノイズの出力レベルが低く抑えられる利点はあるものの、しゃべり1としゃべり2のバランスが崩れ、入力レベルが小さいしゃべり2の音声出力が低下してしまい、聞き取りにくくなる欠点があった。また、入力レベルが小さなしゃべり1は、しゃべり2の入力レベルの大きさにより変動するため、しゃべり1の入力レベルが同じ大きさであっても出力レベルが変動してしまい、聞き手にとって違和感が大きかった。
本発明は前記のような従来技術の問題点を解決するために提案されたものである。本発明の目的は、所定のレベル以上の複数の音声信号が入力されたとき、これらの差分を無視して等分にゲインを配分することにより、聞き手にとって違和感のない音声信号を出力することができる自動音声調整装置を提供することにある。
前記の目的を達成するために、本発明の自動音声調整装置は、次のような構成を有することを特徴とする。
(1)複数の音声信号入力部。
(2)前記各音声信号入力部から入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部。
(3)前記各音声処理部からの処理済みの音声信号を出力する複数の音声信号出力部。
(4)前記各音声処理部に対して、それぞれ各音声処理部用のゲインシェア係数を出力する係数決定部。
(5)前記係数決定部は、前記複数の音声信号入力部から入力された音声信号のレベルが、予め設定された閾値を超えた場合には、その閾値に基づいてゲインシェア係数を出力し、入力された音声信号のレベルが前記閾値以下の場合には、各音声信号のレベルに基づいてゲインシェア係数を出力する。
(1)複数の音声信号入力部。
(2)前記各音声信号入力部から入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部。
(3)前記各音声処理部からの処理済みの音声信号を出力する複数の音声信号出力部。
(4)前記各音声処理部に対して、それぞれ各音声処理部用のゲインシェア係数を出力する係数決定部。
(5)前記係数決定部は、前記複数の音声信号入力部から入力された音声信号のレベルが、予め設定された閾値を超えた場合には、その閾値に基づいてゲインシェア係数を出力し、入力された音声信号のレベルが前記閾値以下の場合には、各音声信号のレベルに基づいてゲインシェア係数を出力する。
前記係数決定部が、前記閾値の設定部と、各音声信号のレベル値の入力部と、音声信号のレベル値が閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を演算する演算部を備えていることが好ましい。
本発明によれば、複数の入力信号レベルを監視して、有効な入力信号のゲインを大きくしてその他の未使用チャンネルのゲインを抑えるというオペレータの操作を自動で行う自動音声調整装置において、全体のゲインの総和に対する各入力信号のゲインの配分を行うに当たり、任意のレベル(閾値)以上の入力信号に対しては、同一レベル(閾値)の入力と設定することにより、出力信号の音声レベルを安定させて、聞き手にとって不自然な音声出力にならない効果を発揮することができる。
[1.第1実施形態]
[1−1.第1実施形態の構成]
以下、本発明の第1実施形態を図1に従って具体的に説明する。図1に示す通り、本実施形態の装置は、複数の音声信号入力部1a,1b,1cと、各音声信号入力部1a,1b,1cから入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部2a,2b,2cと、各音声処理部2a,2b,2cからの処理済みの音声信号を出力する複数の音声信号出力部3a,3b,3cを有する。各音声信号入力部1a,1b,1cと音声処理部2a,2b,2cには、係数決定部4が接続されている。
[1−1.第1実施形態の構成]
以下、本発明の第1実施形態を図1に従って具体的に説明する。図1に示す通り、本実施形態の装置は、複数の音声信号入力部1a,1b,1cと、各音声信号入力部1a,1b,1cから入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部2a,2b,2cと、各音声処理部2a,2b,2cからの処理済みの音声信号を出力する複数の音声信号出力部3a,3b,3cを有する。各音声信号入力部1a,1b,1cと音声処理部2a,2b,2cには、係数決定部4が接続されている。
係数決定部4が、閾値の設定部41と、各音声信号のレベル値の入力部42と、音声信号のレベル値が閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を計算する演算部43を備えている。
閾値の設定部41は、所定の音声レベル以上の入力信号が入力された場合に、入力された音声レベル値をそのまま演算部43に出力することなく、予め設定した音声レベル値を、入力された音声レベル値に代えて演算部43に出力するための閾値を、オペレータが設定するためのものである。各音声信号のレベル値の入力部42は、音声信号入力部1a,1b,1cに接続されており、音声信号入力部1a,1b,1cに入力された音声信号のレベル値を入力して、その値を演算部43に出力するものである。
演算部43は、音声信号入力部1a,1b,1cから入力された音声信号のレベル値と、閾値とを比較して、音声信号入力部1a,1b,1cから入力された音声信号のレベル値が、予め設定された閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値として、各音声信号のレベル値の総和を計算する。その後、各音声信号のレベル値を各音声信号のレベル値の総和で除することにより、ゲインシェア係数を計算する。演算部43が計算した各音声信号のゲインシェア係数は、それぞれ音声処理部2a,2b,2cに出力される。
音声処理部2a,2b,2cは、入力された音声信号のレベル値に、演算部43で得られた各ゲインシェア係数を乗じて、音声信号出力部3a,3b,3cから出力する音声信号のレベル値を決定する。
[1−2.第1実施形態の作用効果]
図2は、前記のような構成を有する第1実施形態の作用を説明するブロック図である。図2において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1は出力される音声信号がなく、レベル0.2のノイズのみが出力され、音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
図2は、前記のような構成を有する第1実施形態の作用を説明するブロック図である。図2において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1は出力される音声信号がなく、レベル0.2のノイズのみが出力され、音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
この状態で、係数決定部4の各音声信号のレベル値の入力部42に、音声信号入力部1a,1b,1cからそれぞれのレベル値が入力されると、演算部43はそれぞれのレベル値と閾値とを比較し、閾値よりも低いレベル値の音声1のチャンネルについてはゲインシェア係数(0.2/(0.2+0.5+0.5))=0.167を、閾値と等しいレベル値の音声2のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.2+0.5+0.5))=0.417を、閾値よりも高いレベル値の音声3のチャンネルの入力信号0.8に対しては、入力信号のレベル値に閾値を代入してゲインシェア係数(0.5/(0.2+0.5+0.5))= 0.417を計算する。
その結果、音声1のチャンネルの出力は、0.2*(0.2/(0.2+0.5+0.5))=0.033となり、ノイズチャンネルの大きさは抑え込まれる。また、音声2のチャンネルの出力は、0.5*(0.5/(0.2+0.5+0.5))=0.208、音声3のチャンネルの出力は0.8*(0.5/(0.2+0.5+0.5))=0.333となり、しゃべり1と2のバランスは0.625と一定に保たれると共に、しゃべり2の大きさにしゃべり1のレベルが左右されないことが分かる。
以上の通り、本実施形態によれば、入力信号のノイズは低く抑えられると共に、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。
[2.第2実施形態]
[2−1.第2実施形態の構成]
以下、本発明の第2実施形態について説明する。第2実施形態の構成は、第1実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、話者の近傍に音声信号の入力を制御するON/OFFスイッチ(SW)であるカフボックスを設けるようにし、話者の音声信号の、音声信号入力部への入力を制限できるようにした点である。
[2−1.第2実施形態の構成]
以下、本発明の第2実施形態について説明する。第2実施形態の構成は、第1実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、話者の近傍に音声信号の入力を制御するON/OFFスイッチ(SW)であるカフボックスを設けるようにし、話者の音声信号の、音声信号入力部への入力を制限できるようにした点である。
[2−2.第2実施形態の作用効果]
図3は、前記のような構成を有する第2実施形態の作用を説明するブロック図である。
図3において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1は話者がいないため、スイッチをOFFとし、ノイズによる音声の入力をしないようにしている。したがって、音声1のレベルは0.0となる。音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
図3は、前記のような構成を有する第2実施形態の作用を説明するブロック図である。
図3において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1は話者がいないため、スイッチをOFFとし、ノイズによる音声の入力をしないようにしている。したがって、音声1のレベルは0.0となる。音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
この状態で、係数決定部4の各音声信号のレベル値の入力部42に、音声信号入力部1a,1b,1cからそれぞれのレベル値が入力されると、演算部43はそれぞれのレベル値と閾値とを比較し、閾値よりも低いレベル値の音声1のチャンネルについてはゲインシェア係数(0.0/(0.0+0.5+0.5))=0.0を、閾値と等しいレベル値の音声2のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.0+0.5+0.5))=0.5を、閾値よりも高いレベル値の音声3のチャンネルの入力信号0.8に対しては、入力信号のレベル値に閾値を代入してゲインシェア係数(0.5/(0.0+0.5+0.5))= 0.5を計算する。
その結果、音声1のチャンネルの出力は、0.2*(0.0/(0.0+0.5+0.5))=0.0となり、ノイズチャンネルの大きさは抑え込まれる。また、音声2のチャンネルの出力は、0.5*(0.5/(0.0+0.5+0.5))=0.25、音声3のチャンネルの出力は0.8*(0.5/(0.0+0.5+0.5))=0.4となり、しゃべり1と2のバランスは0.625と一定に保たれると共に、しゃべり2の大きさにしゃべり1のレベルが左右されないことが分かる。
以上の通り、本実施形態によれば、入力信号のノイズの影響を抑えられると共に、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。
[3.第3実施形態]
[3−1.第3実施形態の構成]
以下、本発明の第3実施形態について説明する。第3実施形態の構成は、第1実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、各音声信号出力部の前段にハウリング検出部を各音声信号にそれぞれ設け、いずれかの音声信号でハウリングが検出された場合、係数決定部4の演算部43に対し、ハウリングが検出されなくなるまでゲインシェア係数を小さくする制御を行うようにした点である。具体的には、図4で示す合計値を大きくするようにした点である。
なお、本実施形態では、ハウリング検出部は、各信号処理部の後段で、各音声信号出力部の前段に配置したが、各信号処理部の前段でも良い。
[3−1.第3実施形態の構成]
以下、本発明の第3実施形態について説明する。第3実施形態の構成は、第1実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、各音声信号出力部の前段にハウリング検出部を各音声信号にそれぞれ設け、いずれかの音声信号でハウリングが検出された場合、係数決定部4の演算部43に対し、ハウリングが検出されなくなるまでゲインシェア係数を小さくする制御を行うようにした点である。具体的には、図4で示す合計値を大きくするようにした点である。
なお、本実施形態では、ハウリング検出部は、各信号処理部の後段で、各音声信号出力部の前段に配置したが、各信号処理部の前段でも良い。
[3−2.第3実施形態の作用効果]
図4は、前記のような構成を有する第3実施形態の作用を説明するブロック図である。
図4において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1はハウリングを起こしている音声とし、音声1のレベルは1.2で出力されるとする。音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
図4は、前記のような構成を有する第3実施形態の作用を説明するブロック図である。
図4において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1はハウリングを起こしている音声とし、音声1のレベルは1.2で出力されるとする。音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
この状態で、係数決定部4の各音声信号のレベル値の入力部42に、音声信号入力部1a,1b,1cからそれぞれのレベル値が入力されると、演算部43はそれぞれのレベル値と閾値とを比較し、閾値よりも高いレベル値の音声1のチャンネルの入力信号1.2についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、閾値と等しいレベル値の音声2のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、閾値よりも高いレベル値の音声3のチャンネルの入力信号0.8についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、計算する。
その結果、音声1のチャンネルの出力は、1.2*(0.5/(0.5+0.5+0.5))=0.400、音声2のチャンネルの出力は、0.5*(0.5/(0.5+0.5+0.5))=0.167、音声3のチャンネルの出力は0.8*(0.5/(0.5+0.5+0.5))=0.266となる。
この場合、音声1はハウリングを有しているので、音声信号1のハウリング検出部はハウリングを検出する。ここで、ハウリングとは、例えば音声信号をフーリエ変換したした際に特定の周波数で所定のレベル値を超えている状態であり、ハウリングを検出するとはその状態を検出することをいう。ただし、ハウリングの検出方法は、一般的な他の方法で行っても良い。
ハウリングを検出した際、ゲインシェア係数を低く設定するため、音声信号出力の合計値である1.5を例えば0.1大きくする。
その結果、音声1のチャンネルの入力信号1.2についてはゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))=0.313を、音声2のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))=0.313を、音声3のチャンネルの入力信号0.8に対しては、ゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))= 0.313を計算する。
その結果、音声1のチャンネルの入力信号1.2についてはゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))=0.313を、音声2のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))=0.313を、音声3のチャンネルの入力信号0.8に対しては、ゲインシェア係数(0.5/(0.5+0.5+0.5+0.1))= 0.313を計算する。
すると音声1チャンネルの出力は、1.2*(0.5/(0.5+0.5+0.5+0.1))=0.376、音声2チャンネルの出力は、0.5*(0.5/(0.5+0.5+0.5+0.1))=0.157、音声3チャンネルの出力は、0.8*(0.5/(0.5+0.5+0.5+0.1))=0.250となる。
しかし、音声チャンネル1でまだハウリングを検出している場合は、さらに、上記計算をハウリングが無くなるまで繰り返すようにする。
なお、上記例では、0.1を加算したが、0.01を加算するようにしても良いし、ハウリングの程度によって加算する値を変更するようにしても良い。
なお、上記例では、0.1を加算したが、0.01を加算するようにしても良いし、ハウリングの程度によって加算する値を変更するようにしても良い。
以上の通り、本実施形態によれば、ハウリングを含む入力信号についても、全体の音声出力信号レベル比を変えずに、全体のバランスを考慮しつつ、音声のレベル制御ができ、また、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。
本制御は、ハウリングの状態を解消するのに、全体の音声レベルを下げるのと同じ効果を得ることができる。
また、ハウリングキャンセラー等のように、ハウリングを起こしている所定の周波数をカットすることもないので、音質も高音質に保つことができる。
また、ハウリングキャンセラー等のように、ハウリングを起こしている所定の周波数をカットすることもないので、音質も高音質に保つことができる。
なお、ハウリングを検出すると、ゲインシェア係数を算出するために音声入力レベル値の合計値を大きくする制御を行ったが、ハウリングを検出しなくなった場合、すぐにその制御を解放し、元の制御に戻してもよいが、ハウリングを検出しなくなってから所定時間経過後に制御を解放するようにしても良い。また、音声が自然になくなり所定時間経過後や、カフボックス等により音声入力をOFFにしたタイミングや、別の番組(音声プログラム)に変更され、音声処理部の設定が変更された後でも良い。ハウリングを検出したり、検出しなかったりとなった場合、制御が不安定な状態になるのを防止するためである。
[4.第4実施形態]
[4−1.第4実施形態の構成]
以下、本発明の第4実施形態について説明する。本実施形態の構成は、第3実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、ハウリング検出部でハウリングが検出されてから、ハウリングが検出されなくなるまでゲインシェア係数を小さくする制御の仕方で異なる。具体的には、ハウリングを検出される音声信号に対して音声信号レベル値を小さくするように制御した点で異なる。
[4−1.第4実施形態の構成]
以下、本発明の第4実施形態について説明する。本実施形態の構成は、第3実施形態の構成と以下の点で異なり、その他の点は同一である。異なる点は、ハウリング検出部でハウリングが検出されてから、ハウリングが検出されなくなるまでゲインシェア係数を小さくする制御の仕方で異なる。具体的には、ハウリングを検出される音声信号に対して音声信号レベル値を小さくするように制御した点で異なる。
[4−2.第4実施形態の作用効果]
図5は、前記のような構成を有する第3実施形態の作用を説明するブロック図である。
図5において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1はハウリングを起こしている音声とし、音声1のレベルは1.2で出力されるとする。音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
図5は、前記のような構成を有する第3実施形態の作用を説明するブロック図である。
図5において、入力信号として、音声信号入力部1a,1b,1cに対応して音声1〜3の3つのチャンネルがあり、このうち、音声1はハウリングを起こしている音声とし、音声1のレベルは1.2で出力されるとする。音声2と音声3はそれぞれレベル0.5のしゃべり1と、レベル0.8のしゃべり2の音声信号が出力されるとする。一方、設定部41には、予め閾値として0.5を設定しておく。
この状態で、係数決定部4の各音声信号のレベル値の入力部42に、音声信号入力部1a,1b,1cからそれぞれのレベル値が入力されると、演算部43はそれぞれのレベル値と閾値とを比較し、閾値よりも高いレベル値の音声1のチャンネルの入力信号1.2についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、閾値と等しいレベル値の音声2のチャンネルの入力信号0.5についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、閾値よりも高いレベル値の音声3のチャンネルの入力信号0.8についてはゲインシェア係数(0.5/(0.5+0.5+0.5))=0.333を、計算する。
その結果、音声1のチャンネルの出力は、1.2*(0.5/(0.5+0.5+0.5))=0.400、音声2のチャンネルの出力は、0.5*(0.5/(0.5+0.5+0.5))=0.167、音声3のチャンネルの出力は0.8*(0.5/(0.5+0.5+0.5))=0.266となる。
この場合、音声1はハウリングを有しているので、音声信号1のハウリング検出部はハウリングを検出する。なお、ハウリングの検出方法は、第3実施形態と同様である。
ハウリングを検出した際、ハウリングを検出している音声に対するゲインシェア係数を低く設定するため、音声信号レベル値を例えば0.1小さくする。
その結果、音声1のチャンネルの入力信号1.2についてはハウリングを検出しているので、ゲインシェア係数(0.4/(0.5+0.5+0.5))=0.267を、音声2のチャンネルの入力信号0.5、音声3のチャンネルの入力信号0.8はハウリングを検出していないので、ゲインシェア係数(0.5/(0.5+0.5+0.5))= 0.333を計算する。
その結果、音声1のチャンネルの入力信号1.2についてはハウリングを検出しているので、ゲインシェア係数(0.4/(0.5+0.5+0.5))=0.267を、音声2のチャンネルの入力信号0.5、音声3のチャンネルの入力信号0.8はハウリングを検出していないので、ゲインシェア係数(0.5/(0.5+0.5+0.5))= 0.333を計算する。
すると音声1チャンネルの出力は、1.2*(0.4/(0.5+0.5+0.5))=0.320、音声2チャンネルの出力は、0.5*(0.5/(0.5+0.5+0.5))=0.167、音声3チャンネルの出力は、0.8*(0.5/(0.5+0.5+0.5))=0.266となる。なお、音声チャンネル1でまだハウリングを検出している状態となっている場合は、さらに、上記計算をハウリングが無くなるまで上記制御を繰り返す。
なお、第3実施形態と同様に、0.1下げる制御ではなく、0.01下げる制御にしても良いし、ハウリングの度合いによって、下げる値を変更するようにしても良い。
以上の通り、本実施形態によれば、ハウリングを含む入力信号レベルを抑えつつ、ハウリングが検出されていない音声2と音声3のバランスを変えずに、全体のバランスを考慮しつつ、閾値以上のレベルの入力信号については、それよりもレベル値が大きい他の音声信号の影響を受けることがないので、入力信号のレベル値の割合に応じてゲインが配分されることになり、聞き手にとって違和感がない効果がある。
また、本制御は、ハウリング状態を解消する際、ハウリングを起こしている音声の信号レベルを下げるのと同じ効果を得ることができる。
また、ハウリングキャンセラー等のように、ハウリングを起こしている所定の周波数をカットすることもないので、音質も高音質に保つことができる。
また、ハウリングキャンセラー等のように、ハウリングを起こしている所定の周波数をカットすることもないので、音質も高音質に保つことができる。
なお、ゲインシェア係数を算出するために音声入力レベル値を下げる制御を行ったが、この制御を解放し、元の制御に戻すタイミングは、第3実施形態と同じである。
[5.第5実施形態]
各音声信号入力部にハウリング検出器を設けるようにし、演算部でレベル値の合算をする前に音声信号のレベルをハウリングしないように音量レベルを下げるようにしても良い。
各音声信号入力部にハウリング検出器を設けるようにし、演算部でレベル値の合算をする前に音声信号のレベルをハウリングしないように音量レベルを下げるようにしても良い。
ハウリングを検知しなくなるまで出力レベルを下げる制御を行い、音声レベルがハウリングしていなレベルまで下がった後、その後の処理は第1実施形態で説明した通り、ゲインシェア係数が算出され、各音声のレベル制御がされる。
[6.他の実施形態]
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。以下は、その一例である。
(1)音声信号入力部、音声処理部、音声信号出力部は、入力チャンネル数に応じて適宜増減することができる。
(2)係数決定部の構成は図示のものに限らず、各音声処理部内に係数決定部を設けることができる。また、図示の実施形態では、演算部で入力された音声信号のレベル値と閾値とを比較したが、音声信号のレベル値の入力部において閾値との比較を行い、演算部はその結果に従って、ゲインシェア係数を計算してもよい。
(3)閾値の設定部は、オペレータが手動で設定する以外に、予めプログラムによって閾値を設定することも可能である。例えば、放送内容が しゃべり主体の時間帯にのみ本発明の処理を適用し、音楽主体の時間帯では本発明の処理を行わないように設定したり、しゃべりが主体の時間帯でもしゃべりの特性に応じて、閾値を自動的に変化させるように予め閾値変更用のプログラムを設定しておくこともできる。
(4)音声信号が、男女、人数の増減などによって異なる場合には、例えば、聴感補正フィルタの逆数を手動で設定した閾値に乗じて補正後の閾値を決定するなど、各音声信号の特性に合わせた閾値を設定することで、男性の野太い声や女性の高い声を聞き取りやすくすることも可能である。
(5)演算部で、入力信号と閾値のレベルの総和を計算する場合に、音声信号入力部ごとに重み付け係数など、レベル値を調整するためのパラメータを設定することも可能である。例えば、予め音声信号入力部から入力される信号の種類が判明している場合、入力されたレベル値にパラメータを乗じて閾値と比較したり、ゲインシェア係数を計算することもできる。
(6)前記(5)と同様に、閾値を音声信号入力部ごとに異なる値に設定することもできる。例えば、第1実施形態において、チャンネル1の閾値をバックグラウンドノイズとなる値(例えば、閾値を0.2とするなど)に設定することにより、チャンネル1で突発的に発生する大きな音声によるノイズの影響をなくすことができ、チャンネル2、チャンネル3の音声に対し、効率的にバックグラウンドノイズをマスクことができる。
(7)第2実施形態において、スイッチは、カフボックスに限定されるものではなく、音声信号の入力を制御するON/OFFスイッチ(SW)であれば良い。例えば、音声調整装置の操作パネルにあるON/OFFスイッチなどである。
(8)さらに、上記スイッチ操作により音声信号の入力を制限するのではなく、前記(6)のように、スイッチ操作によりバックグラウンドノイズとなる値に閾値の設定を変更するようにしても良い。
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。以下は、その一例である。
(1)音声信号入力部、音声処理部、音声信号出力部は、入力チャンネル数に応じて適宜増減することができる。
(2)係数決定部の構成は図示のものに限らず、各音声処理部内に係数決定部を設けることができる。また、図示の実施形態では、演算部で入力された音声信号のレベル値と閾値とを比較したが、音声信号のレベル値の入力部において閾値との比較を行い、演算部はその結果に従って、ゲインシェア係数を計算してもよい。
(3)閾値の設定部は、オペレータが手動で設定する以外に、予めプログラムによって閾値を設定することも可能である。例えば、放送内容が しゃべり主体の時間帯にのみ本発明の処理を適用し、音楽主体の時間帯では本発明の処理を行わないように設定したり、しゃべりが主体の時間帯でもしゃべりの特性に応じて、閾値を自動的に変化させるように予め閾値変更用のプログラムを設定しておくこともできる。
(4)音声信号が、男女、人数の増減などによって異なる場合には、例えば、聴感補正フィルタの逆数を手動で設定した閾値に乗じて補正後の閾値を決定するなど、各音声信号の特性に合わせた閾値を設定することで、男性の野太い声や女性の高い声を聞き取りやすくすることも可能である。
(5)演算部で、入力信号と閾値のレベルの総和を計算する場合に、音声信号入力部ごとに重み付け係数など、レベル値を調整するためのパラメータを設定することも可能である。例えば、予め音声信号入力部から入力される信号の種類が判明している場合、入力されたレベル値にパラメータを乗じて閾値と比較したり、ゲインシェア係数を計算することもできる。
(6)前記(5)と同様に、閾値を音声信号入力部ごとに異なる値に設定することもできる。例えば、第1実施形態において、チャンネル1の閾値をバックグラウンドノイズとなる値(例えば、閾値を0.2とするなど)に設定することにより、チャンネル1で突発的に発生する大きな音声によるノイズの影響をなくすことができ、チャンネル2、チャンネル3の音声に対し、効率的にバックグラウンドノイズをマスクことができる。
(7)第2実施形態において、スイッチは、カフボックスに限定されるものではなく、音声信号の入力を制御するON/OFFスイッチ(SW)であれば良い。例えば、音声調整装置の操作パネルにあるON/OFFスイッチなどである。
(8)さらに、上記スイッチ操作により音声信号の入力を制限するのではなく、前記(6)のように、スイッチ操作によりバックグラウンドノイズとなる値に閾値の設定を変更するようにしても良い。
1a,1b,1c…音声信号入力部
2a,2b,2c…音声処理部
3a,3b,3c…音声信号出力部
4…係数決定部
41…閾値設定部
42…音声信号のレベル値の入力部
43…ゲインシェア係数の演算部
2a,2b,2c…音声処理部
3a,3b,3c…音声信号出力部
4…係数決定部
41…閾値設定部
42…音声信号のレベル値の入力部
43…ゲインシェア係数の演算部
Claims (2)
- 複数の音声信号入力部と、
前記各音声信号入力部から入力された音声信号に対して、所定のゲインシェア係数を乗じる複数の音声処理部と、
前記各音声処理部からの処理済みの音声信号を出力する複数の音声信号出力部と、
前記各音声処理部に対して、それぞれ各音声処理部用のゲインシェア係数を出力する係数決定部とを備え、
前記係数決定部は、前記複数の音声信号入力部から入力された音声信号のレベルが、
予め設定された閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を出力することを特徴とする自動音声調整装置。 - 前記係数決定部が、
前記閾値の設定部と、
各音声信号のレベル値の入力部と、
音声信号のレベル値が閾値以下の場合にはそのレベル値を、音声信号のレベル値が閾値を超えた場合にはその音声信号の閾値を音声信号のレベル値とし、各音声信号のレベル値の総和に基づいてゲインシェア係数を演算する演算部を備えていることを特徴とする請求項1に記載の自動音声調整装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014154629 | 2014-07-30 | ||
JP2014154629 | 2014-07-30 | ||
JP2014248632 | 2014-12-09 | ||
JP2014248632 | 2014-12-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016111673A true JP2016111673A (ja) | 2016-06-20 |
JP5988461B2 JP5988461B2 (ja) | 2016-09-07 |
Family
ID=56125079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015136624A Active JP5988461B2 (ja) | 2014-07-30 | 2015-07-08 | 自動音声調整装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5988461B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002142286A (ja) * | 2000-11-01 | 2002-05-17 | Yamaha Corp | ディジタル・ミキサー |
JP2009017343A (ja) * | 2007-07-06 | 2009-01-22 | Yamaha Corp | 収音装置 |
JP2010098562A (ja) * | 2008-10-17 | 2010-04-30 | Tamura Seisakusho Co Ltd | 音声調整システム、調整方法およびリモートコントローラ |
JP2011077649A (ja) * | 2009-09-29 | 2011-04-14 | Oki Electric Industry Co Ltd | 収音装置、利得制御方法、およびプログラム |
JP2014078297A (ja) * | 2012-10-10 | 2014-05-01 | Teac Corp | 録音装置 |
-
2015
- 2015-07-08 JP JP2015136624A patent/JP5988461B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002142286A (ja) * | 2000-11-01 | 2002-05-17 | Yamaha Corp | ディジタル・ミキサー |
JP2009017343A (ja) * | 2007-07-06 | 2009-01-22 | Yamaha Corp | 収音装置 |
JP2010098562A (ja) * | 2008-10-17 | 2010-04-30 | Tamura Seisakusho Co Ltd | 音声調整システム、調整方法およびリモートコントローラ |
JP2011077649A (ja) * | 2009-09-29 | 2011-04-14 | Oki Electric Industry Co Ltd | 収音装置、利得制御方法、およびプログラム |
JP2014078297A (ja) * | 2012-10-10 | 2014-05-01 | Teac Corp | 録音装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5988461B2 (ja) | 2016-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9431982B1 (en) | Loudness learning and balancing system | |
US9820071B2 (en) | System and method for binaural noise reduction in a sound processing device | |
EP2389773B1 (en) | Hearing aid and a method of detecting and attenuating transients | |
GB2532379B (en) | Two-stage wind noise reduction method | |
US9214916B2 (en) | Acoustic processing device | |
US9571055B2 (en) | Level adjustment device and method | |
US20110002467A1 (en) | Dynamic enhancement of audio signals | |
JP2007174155A (ja) | 拡声システム | |
US20140064529A1 (en) | Apparatus and method of shielding external noise for use in hearing aid device | |
US20160005417A1 (en) | A noise reduction method and system | |
GB2527126A (en) | Noise cancellation with dynamic range compression | |
JP2008148179A (ja) | 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法 | |
US10109293B2 (en) | Voice signal processing apparatus and voice signal processing method | |
JP5988461B2 (ja) | 自動音声調整装置 | |
EP3691124B1 (en) | Audio system and method for controlling same | |
CN114257917B (zh) | 用于耳机的噪声处理方法、系统及耳机 | |
US10499165B2 (en) | Feedback reduction for high frequencies | |
US11743641B2 (en) | Hearing device with in-ear microphone and related method | |
WO2010000042A1 (en) | Linear gain amplification for mid-to-high intensity sounds in a compressive sound processor | |
WO2018021402A1 (ja) | 音処理装置及び方法 | |
JPH10308999A (ja) | 音声レベルバランス指示装置 | |
US11653147B2 (en) | Hearing device with microphone switching and related method | |
US11757420B2 (en) | Method for dynamically adjusting adjustable gain value to equalize input signal to generate equalizer output signal and associated leveling equalizer | |
JP2020080509A (ja) | 聴覚特性検出装置、補聴器、聴覚特性検出プログラム、および補聴器プログラム | |
TW202306309A (zh) | 等化第一輸入訊號以產生等化器輸出訊號的方法以及調平等化器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160805 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160805 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5988461 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |