JP5547432B2 - Automatic volume control device - Google Patents
Automatic volume control device Download PDFInfo
- Publication number
- JP5547432B2 JP5547432B2 JP2009168407A JP2009168407A JP5547432B2 JP 5547432 B2 JP5547432 B2 JP 5547432B2 JP 2009168407 A JP2009168407 A JP 2009168407A JP 2009168407 A JP2009168407 A JP 2009168407A JP 5547432 B2 JP5547432 B2 JP 5547432B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- band
- channel
- audio
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は自動音量制御装置に関し、より詳細には、音楽が流されている空間において会話が行われた場合に、発話に応じて音楽の出力レベルを音声帯域のモノラル成分のみ低減させることにより、円滑な会話を実現することが可能な自動音量制御装置に関する。 The present invention relates to an automatic volume control device, and more particularly, by reducing only the monaural component of the audio band according to the utterance when the conversation is performed in a space where music is played, The present invention relates to an automatic volume control device capable of realizing smooth conversation.
走行中の車両の室内では、運転(走行)中に音楽やラジオ番組等を流すことが多い。このような状況において、運転手と同乗者とが会話を行う場合には、音楽等の再生音によって、円滑な会話(会話の聞き取り等)が妨げられてしまうおそれがあった。 In the interior of a running vehicle, music and radio programs are often played while driving (running). In such a situation, when the driver and the passenger have a conversation, there is a possibility that a smooth conversation (listening of the conversation, etc.) may be hindered by the reproduced sound such as music.
一般的な車載用オーディオ装置には、音量を調節するための音量調節スイッチや、音量を一時的に低減させるためのミュートスイッチなどが設けられている(例えば、特許文献1および特許文献2参照)。このため、運転者等は、音量調節スイッチやミュートスイッチを操作することにより、会話を妨げない程度まで音楽等の再生音量を低減させることが多かった。 A general in-vehicle audio apparatus is provided with a volume control switch for adjusting the volume, a mute switch for temporarily reducing the volume, and the like (see, for example, Patent Document 1 and Patent Document 2). . For this reason, the driver or the like often reduces the playback volume of music or the like to such an extent that the conversation is not hindered by operating the volume control switch and the mute switch.
しかしながら、会話を行う度に音量調節スイッチを操作して再生音を低減する方法では、操作が煩雑になり、かえって円滑な会話を妨げてしまうおそれがあるという問題があった。一方で、ミュートスイッチを用いて音楽の再生音(出力レベル)を低減させる方法では、会話が途切れた状態においてもそのまま音楽の再生音が低減された状態となってしまい、音楽やラジオ番組等を楽しむことができないという問題があった。 However, the method of operating the volume control switch every time a conversation is performed to reduce the reproduced sound has a problem that the operation becomes complicated and may hinder smooth conversation. On the other hand, with the method of reducing the music playback sound (output level) using the mute switch, the music playback sound is reduced even when the conversation is interrupted. There was a problem that I could not enjoy it.
このため、音量調節スイッチやミュートスイッチを操作することなく会話が成立するような大きな声を、発話者が発することにより、音楽等を再生させたままの状態で会話を行うこともしばしば行われるが、会話が続く場合には、発話者はもちろんのこと会話の相手側においても会話に疲労を感じてしまうおそれがあるという問題があった。 For this reason, it is often the case that a speaker utters a loud voice that can establish a conversation without operating a volume control switch or a mute switch, and the conversation is performed while music is being reproduced. When the conversation continues, there is a problem that the conversation partner may feel tired as well as the speaker.
本発明は、上記問題に鑑みてなされたものであり、運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うことが可能な自動音量制御装置を提供することを課題とする。 The present invention has been made in view of the above problems, and a driver or a passenger does a smooth conversation in a normal state without operating a volume control switch or a mute switch and without generating a loud voice. It is an object of the present invention to provide an automatic sound volume control device that can be used.
上記課題を解決するために、本発明に係る自動音量制御装置は、マイクにより取得された音響信号より音声信号の検出を行う音声検出手段と、音源により出力されるLチャンネル用の音楽信号とRチャンネル用の音楽信号とのそれぞれを、音声帯域に対応する周波数帯域からなる第1音声帯域信号と、前記音声帯域に対応しない周波数帯域からなる非音声帯域信号とに帯域分割する帯域分割手段と、Lチャンネル用の前記第1音声帯域信号とRチャンネル用の前記第1音声帯域信号とのいずれか一方の音声帯域信号だけ位相反転を行う位相反転手段と、該位相反転手段により位相反転されたLチャンネル用の前記第1音声帯域信号あるいはRチャンネル用の前記第1音声帯域信号のいずれか一方の音声帯域信号と、前記位相反転手段により位相反転されなかった他方の音声帯域信号とを合成することにより、Lチャンネル用の第2音声帯域信号とRチャンネル用の第2音声帯域信号とを生成する音声帯域信号合成手段と、前記音声検出手段により前記音声信号の検出が行われた場合に、前記音声帯域信号合成手段により生成されたLチャンネル用の前記第2音声帯域信号とRチャンネル用の前記第2音声帯域信号とを各チャンネル用の音声帯域信号として出力し、前記音声検出手段により前記音声信号の検出が行われなかった場合には、前記帯域分割手段により帯域分割されたLチャンネル用の前記第1音声帯域信号とRチャンネル用の前記第1音声帯域信号とをそのまま各チャンネル用の音声帯域信号として出力する音声帯域信号選択手段と、該音声帯域信号選択手段により出力されたLチャンネル用の音声帯域信号およびRチャンネル用の音声帯域信号と、前記帯域分割手段において帯域分割されたLチャンネル用の非音声帯域信号およびRチャンネル用の非音声帯域信号とを、それぞれのチャンネル毎に合成することにより、Lチャンネル用の全帯域の音楽信号およびRチャンネル用の全帯域の音楽信号とを生成する音楽信号合成手段とを備えることを特徴とする。 In order to solve the above-described problems, an automatic volume control device according to the present invention includes an audio detection unit that detects an audio signal from an acoustic signal acquired by a microphone, an L channel music signal output from a sound source, and an R signal. Band division means for dividing each of the channel music signals into a first audio band signal composed of a frequency band corresponding to an audio band and a non-audio band signal composed of a frequency band not corresponding to the audio band; Phase inversion means for performing phase inversion for only one of the audio band signals of the first audio band signal for the L channel and the first audio band signal for the R channel, and L that has been phase inverted by the phase inversion means. Either the first audio band signal for the channel or the first audio band signal for the R channel and the phase inverting means A voice band signal synthesizing unit that generates a second voice band signal for the L channel and a second voice band signal for the R channel by synthesizing the other voice band signal that has not been inverted; and the voice detection unit When the audio signal is detected by the above, the second audio band signal for the L channel and the second audio band signal for the R channel generated by the audio band signal synthesis means are used for each channel. When the audio signal is output as an audio band signal and the audio signal is not detected by the audio detection unit, the first audio band signal for the L channel and the R channel for the channel divided by the band division unit Voice band signal selection means for outputting the first voice band signal as it is as a voice band signal for each channel, and output by the voice band signal selection means The L-channel audio band signal and the R-channel audio band signal, and the L-channel non-audio band signal and the R-channel non-audio band signal that are band-divided by the band dividing unit, respectively. It is characterized by comprising music signal synthesizing means for generating a music signal for the entire band for the L channel and a music signal for the entire band for the R channel by combining each channel.
本発明に係る自動音量制御装置によれば、Lチャンネル用の音楽信号とRチャンネル用の音楽信号とのそれぞれを、音声帯域に対応する周波数帯域からなる第1音声帯域信号と、音声帯域に対応しない周波数帯域からなる非音声帯域信号とに帯域分割した後に、Lチャンネル用の第1音声帯域信号とRチャンネル用の第1音声帯域信号とのいずれか一方の音声帯域信号だけ位相反転させて、位相反転されなかった他方の音声帯域信号に合成させるので、合成された第2音声帯域信号は、モノラル成分の出力(信号レベル)が合成により低減された状態になる。 According to the automatic volume control device of the present invention, each of the L channel music signal and the R channel music signal corresponds to the first audio band signal having a frequency band corresponding to the audio band and the audio band. After the frequency is divided into non-voice band signals composed of non-frequency bands, only one of the voice band signals of the first voice band signal for the L channel and the first voice band signal for the R channel is inverted, Since the other voice band signal that has not undergone phase inversion is synthesized, the synthesized second voice band signal is in a state where the output (signal level) of the monaural component is reduced by synthesis.
このようにして音声帯域におけるモノラル成分の出力(信号レベル)が低減された音楽信号(第2音声帯域信号)と帯域分割手段により帯域分割された非音声帯域信号とを合成することにより、音楽信号の全体的なステレオ感を維持した状態で、会話の妨げとなり得る音声帯域のモノラル成分の信号レベルだけを効果的に低減させることができるので、音楽が流れる状況であっても円滑な会話を楽しむことが可能となる。 The music signal is synthesized by synthesizing the music signal (second audio band signal) in which the output (signal level) of the monaural component in the audio band is reduced in this way and the non-audio band signal band-divided by the band dividing unit. Because it can effectively reduce only the signal level of the monaural component of the voice band that can hinder conversation while maintaining the overall stereo feeling, enjoy smooth conversation even when music flows It becomes possible.
また、会話中であっても音楽信号における全体的なステレオ感(特に非音声帯域信号のステレオ成分)は維持されているので、円滑な会話を実現させつつ、音楽の音質(臨場感や迫力など)の低下を抑制することが可能となる。 In addition, the overall stereo feeling of the music signal (especially the stereo component of the non-speech band signal) is maintained even during a conversation, so the sound quality of the music (realism, power, etc.) can be achieved while realizing a smooth conversation. ) Can be suppressed.
さらに、上述したように音楽信号合成手段により生成された全帯域の音楽信号において、音声帯域のモノラル成分における信号レベルを低減させる場合とは、音声検出手段により音声信号が検出された時だけ、つまり、発話者により言葉が発せられた時だけであるため、会話が行われる時だけ自動的に音楽の音声帯域におけるモノラル成分の信号レベルを低減させることができる。 Furthermore, as described above, in the music signal of the entire band generated by the music signal synthesizing unit, the signal level in the monaural component of the audio band is reduced only when the audio signal is detected by the audio detecting unit. Since it is only when words are spoken by the speaker, the signal level of the monaural component in the audio band of music can be automatically reduced only when conversation is performed.
また、このように音声信号の検出に応じて音楽信号の音量制御が行われるため、会話が行われていない状態(会話が途切れた状態など)では、音声帯域におけるモノラル成分の低減処理(音量制御)は行われない。このため、会話が行われていない状態(音声信号の検出がない状態)では、音楽信号において低減処理(音量制御)が全く行われないので、良質な音質の音楽を楽しむことが可能となる。 In addition, since the volume control of the music signal is performed in response to the detection of the audio signal in this way, in a state where the conversation is not being performed (such as a state where the conversation is interrupted), the monaural component reduction processing (volume control) ) Is not performed. For this reason, in a state where no conversation is performed (a state in which no audio signal is detected), no reduction processing (volume control) is performed on the music signal, so that it is possible to enjoy high-quality music.
また、前記音声帯域信号合成手段は、前記音声帯域信号合成手段により合成処理されたLチャンネル用の前記第2音声帯域信号とRチャンネル用の前記第2音声帯域信号とに対して、それぞれのチャンネルに応じたゲインの重み付けを行うゲイン付加手段を有するものであってもよい。 Further, the voice band signal synthesizing unit is configured to provide a channel for each of the second voice band signal for the L channel and the second voice band signal for the R channel synthesized by the voice band signal synthesizing unit. There may be provided gain adding means for weighting the gain in accordance with.
このように、本発明に係る自動音量制御装置では、ゲイン付加手段により、モノラル成分の低減が成された第2音声帯域信号に対して、それぞれのチャンネルに応じたゲインの重み付けが行われるため、音声帯域信号においてモノラル成分の低減が行われていても、残されたステレオ成分が強調されることになるので、音声帯域(ボーカル成分)を含む全体的なステレオ感を高く維持することが可能となる。 As described above, in the automatic sound volume control device according to the present invention, the gain addition unit weights the gain corresponding to each channel for the second audio band signal in which the monaural component is reduced. Even if the monaural component is reduced in the audio band signal, the remaining stereo component is emphasized, so that the overall stereo feeling including the audio band (vocal component) can be kept high. Become.
さらに、ゲイン付加手段により第2音声帯域信号に対する重み付け処理が行われるため、Lチャンネル用の第2音声帯域信号とRチャンネル用の第2音声帯域信号とが無相関な信号となり、音楽信号合成手段において音楽信号の合成を行う場合において、ステレオ成分の音楽信号が干渉してしまうことを防止することが可能となる。 Further, since the weight addition processing is performed on the second audio band signal by the gain adding means, the second audio band signal for the L channel and the second audio band signal for the R channel become an uncorrelated signal, and the music signal synthesizing means It is possible to prevent the stereo component music signal from interfering when the music signal is synthesized in FIG.
また、上述した自動音量制御装置において、前記帯域分割手段は、前記音源により出力されるLチャンネル用の前記音楽信号とRチャンネル用の前記音楽信号とのそれぞれを、音声帯域に対応する周波数帯域からなる前記第1音声帯域信号と、前記音声帯域よりも低い周波数帯域からなる低域信号と、前記音声帯域よりも高い周波数帯域からなる高域信号とに帯域分割すると共に、前記第1音声帯域信号のみ位相反転を行い、前記音楽信号合成手段は、前記音声帯域信号選択手段により出力されたLチャンネル用の前記音声帯域信号およびRチャンネル用の前記音声帯域信号と、Lチャンネル用の前記低域信号およびRチャンネル用の前記低域信号と、Lチャンネル用の前記高域信号およびRチャンネル用の前記高域信号とを、それぞれのチャンネル毎に合成することにより、Lチャンネル用の全帯域の音楽信号およびRチャンネル用の全帯域の音楽信号とを生成するものであってもよい。 Further, in the automatic volume control device described above, the band dividing unit extracts each of the music signal for L channel and the music signal for R channel output from the sound source from a frequency band corresponding to a voice band. The first audio band signal is divided into the first audio band signal, the low frequency signal having a frequency band lower than the audio band, and the high frequency signal having a frequency band higher than the audio band, and the first audio band signal And the music signal synthesizing means outputs the audio band signal for the L channel and the audio band signal for the R channel output by the audio band signal selecting means, and the low frequency signal for the L channel. And the low frequency signal for the R channel, the high frequency signal for the L channel, and the high frequency signal for the R channel, respectively. By synthesizing each tunnel, it may be configured to generate a full-band music signals for music signals and R-channel of the total bandwidth of the L-channel.
このように、非音声帯域信号として、音声帯域よりも低い周波数帯域からなる低域信号と、音声帯域よりも高い周波数帯域からなる高域信号とに、音声信号を帯域分割することにより、音楽信号合成手段において合成処理が行われた音楽信号の高帯域および低帯域のステレオ成分をより効果的に発現することが可能となる。 Thus, as a non-speech band signal, the audio signal is divided into a low-frequency signal having a frequency band lower than the voice band and a high-frequency signal having a frequency band higher than the voice band. It becomes possible to express the high-band and low-band stereo components of the music signal subjected to the synthesis processing in the synthesis means more effectively.
さらに、帯域分割手段において第2音声帯域信号のみ、あらかじめ位相反転を行うことにより、音楽信号合成手段で各帯域の信号を合成する場合において、各信号間で干渉が生じてしまうことを低減させることが可能となる。 Furthermore, by performing phase inversion only for the second audio band signal in the band dividing means in advance, it is possible to reduce the occurrence of interference between the signals when the music signal synthesizing means synthesizes the signals of each band. Is possible.
本発明に係る自動音量制御装置によれば、Lチャンネル用の音楽信号とRチャンネル用の音楽信号とのそれぞれを、音声帯域に対応する周波数帯域からなる第1音声帯域信号と、前記音声帯域に対応しない周波数帯域からなる非音声帯域信号とに帯域分割した後に、Lチャンネル用の第1音声帯域信号とRチャンネル用の第1音声帯域信号とのいずれか一方の音声帯域信号だけ位相反転させて、位相反転されなかった他方の音声帯域信号に合成させるので、合成された第2音声帯域信号は、モノラル成分の出力(信号レベル)が合成により低減された状態になる。 According to the automatic volume control device of the present invention, each of the L channel music signal and the R channel music signal is divided into the first voice band signal having a frequency band corresponding to the voice band and the voice band. After band division into non-voice band signals having non-corresponding frequency bands, only one of the voice band signals of the first voice band signal for L channel and the first voice band signal for R channel is inverted in phase. Therefore, the synthesized second audio band signal is in a state in which the output of the monaural component (signal level) is reduced by the synthesis.
このようにして音声帯域におけるモノラル成分の出力(信号レベル)が低減された音楽信号(第2音声帯域信号)と帯域分割手段により帯域分割された非音声帯域信号とを合成することにより、音楽信号の全体的なステレオ感を維持した状態で、会話の妨げとなり得る音声帯域のモノラル成分の信号レベルだけを効果的に低減させることができるので、音楽が流れる状況であっても円滑な会話を楽しむことが可能となる。 The music signal is synthesized by synthesizing the music signal (second audio band signal) in which the output (signal level) of the monaural component in the audio band is reduced in this way and the non-audio band signal band-divided by the band dividing unit. Because it can effectively reduce only the signal level of the monaural component of the voice band that can hinder conversation while maintaining the overall stereo feeling, enjoy smooth conversation even when music flows It becomes possible.
以下、本発明に係る自動音量制御装置について、図面を用いて詳細に説明を行う。 Hereinafter, an automatic sound volume control apparatus according to the present invention will be described in detail with reference to the drawings.
図1は、本実施の形態に係る自動音量制御装置の概略構成を示したブロック図である。なお、本実施の形態では、自動音量制御装置1が車両に設置される場合を一例として示して説明する。本実施の形態に係る自動音量制御装置1を車両に設置することにより、会話の有無に応じて、音源より出力される音楽信号のうち音声帯域のモノラル成分のみを自動的に低減させることが可能になる。 FIG. 1 is a block diagram showing a schematic configuration of the automatic volume control device according to the present embodiment. In the present embodiment, the case where the automatic volume control device 1 is installed in a vehicle will be described as an example. By installing the automatic volume control device 1 according to the present embodiment in a vehicle, it is possible to automatically reduce only the monaural component of the voice band in the music signal output from the sound source according to the presence or absence of conversation. become.
本実施の形態に係る自動音量制御装置1は、図1に示すように、音声強調処理部2、音声検出部(音声検出手段)3、第1帯域分割部(帯域分割手段)4、第2帯域分割部(帯域分割手段)5、音量制御部(位相反転手段、音声帯域信号合成手段、音声帯域信号選択手段、ゲイン付加手段)6、第1合成部(音楽信号合成手段)7、第2合成部(音楽信号合成手段)8、第1パワーアンプ9、第2パワーアンプ10、スピーカ11a,11b、マイクMにより概略構成されている。
As shown in FIG. 1, the automatic sound volume control apparatus 1 according to the present embodiment includes a voice enhancement processing unit 2, a voice detection unit (speech detection unit) 3, a first band division unit (band division unit) 4, a second Band division unit (band division unit) 5, volume control unit (phase inversion unit, voice band signal synthesis unit, voice band signal selection unit, gain addition unit) 6, first synthesis unit (music signal synthesis unit) 7, second A synthesizing unit (music signal synthesizing means) 8, a first power amplifier 9, a
[音声強調処理部]
まず、音声強調処理部2について説明する。図2は、音声強調処理部2の概略構成を示したブロック図である。音声強調処理部2は、オーディオキャンセラ部15と、ノイズキャンセラ部16とを有している。音声強調処理部2は、マイクMで取得された音響信号の中から、音楽信号や車両走行騒音などのノイズ音を低減させる役割を有している。
[Speech enhancement processor]
First, the speech enhancement processing unit 2 will be described. FIG. 2 is a block diagram showing a schematic configuration of the speech enhancement processing unit 2. The speech enhancement processing unit 2 includes an
[オーディオキャンセラ部]
次に、オーディオキャンセラ部15について説明を行う。オーディオキャンセラ部15は、図3に示すように、第1バンドパスフィルタ部21と、第2バンドパスフィルタ部22と、第1遅延部23と、第2遅延部24と、第1適応フィルタ部25と、第2適応フィルタ部26とを有している。
[Audio canceller]
Next, the
第1バンドパスフィルタ部21および第2バンドパスフィルタ部22は、音源より出力された2チャンネルの音楽信号、すなわちLチャンネル(左側)用の音楽信号LおよびRチャンネル(右側)用の音楽信号Rに対して200Hz〜2.6kHz程度の帯域制限を行うことにより、音声信号のうち主に音声帯域の信号のみを通過させる役割を有している。
The first band-
第1遅延部23および第2遅延部24は、第1バンドパスフィルタ部21および第2バンドパスフィルタ部22により帯域制限処理が行われた音響信号に対して遅延処理を施す役割を有している。第1遅延部23および第2遅延部24による遅延処理によって、マイクMにより取得された音響信号の伝搬遅延の補正を行うことが可能となる。
The
第1適応フィルタ部25は、第1FIR部28、第1LMS部29、第1加算部30により概略構成されており、第2適応フィルタ部26は、第2FIR部31、第2LMS部32、第2加算部33により概略構成されている。
The first
第1FIR部28は、有限のインパルス応答フィルタを備えており、第1LMS部29によって行われる係数制御に基づいて、マイクMで集音された音響信号に対してフィルタ処理を施す機能を有している。第1加算部30は、第1FIR部28によりフィルタ処理が行われた音楽信号Lの位相を反転させた状態で、マイクMより入力される音響信号に対して加算する(実質的には、マイクMの音響信号から、フィルタ処理が行われた音楽信号Lの音響信号を減算する)。第1加算部30により加算処理された音響信号は、第1適応フィルタ部25から出力されるとともに、第1LMS部29へ出力される。
The
第1LMS部29は、第1加算部30より取得した音響信号(マイクMの音響信号からフィルタ処理が行われた音楽信号Lが減算された信号)と、音源からの音楽信号Lとを用い、最小二乗アルゴリズムに基づいて第1FIR部28におけるフィルタの係数制御を行う。このように第1LMS部29を第1適応フィルタ部25に設けることによって、LMSアルゴリズムを適用することが可能となる。
The
また、第2適応フィルタ部26は、図3に示すように、第1適応フィルタ部25における第1FIR部28と、第1LMS部29と、第1加算部30とを、第2FIR部31と、第2LMS部32と、第2加算部33に置き換えたものであり、第2適応フィルタ部26の構成およびその機能は、第1適応フィルタ部25と同じであるため、説明を省略する。
Further, as shown in FIG. 3, the second
第2適応フィルタ部26の第2加算部33では、第1適応フィルタ部25においてフィルタ処理が行われた音響信号に対して、第2FIR部31によりフィルタ処理が行われた音楽信号Rを、位相を反転させた状態で加算する(実質的には、第1適応フィルタ部25においてフィルタ処理が行われた音響信号から、第2FIR部31によりフィルタ処理が行われた音楽信号Rを減算する)。第2加算部33により加算処理された音響信号は、第2適応フィルタ部26からノイズキャンセラ部16へ出力されるとともに、第2LMS部32へ出力される。
In the second addition unit 33 of the second
なお、オーディオキャンセラ部15では、図3に示すように、第1適応フィルタ部25および第2適応フィルタ部26がカスケード接続されている。従って、オーディオキャンセラ部15では、第1適応フィルタ部25においてマイクMから入力された音響信号を音楽信号Lで減算処理した後に、第2適応フィルタ部26において第1適応フィルタ部25で減算処理された音響信号を音楽信号Rで減算処理する構成となっている。この場合において、第1適応フィルタ部25は第2適応フィルタ部26よりも早く収束させることが必要となるため、適応速度を大きく設定している。なお、音源が2チャンネル以上ある場合は、チャンネル数に応じて適応フィルタ部の設置数を増加することにより同様の効果を奏することが可能である。
In the
[ノイズキャンセラ部]
ノイズキャンセラ部16は、スペクトル減算法などを用いて、オーディオキャンセラ部15より入力される信号からノイズ信号の除去を行う役割を有している。具体的に説明すると、オーディオキャンセラ部15から出力される信号には、音声信号とノイズ信号(音声以外の信号)とが含まれている。ノイズキャンセラ部16は、周波数スペクトルにおける時間的に定常的な成分(会話が行われていない状況、音声がない区間における成分)
)をノイズパターンとして推定・保持しており、音声信号とノイズ信号とが含まれる入力信号(オーディオキャンセラ部15より入力される信号)の周波数領域において、保持するノイズパターンを減算すると同時に、ノイズパターン自体を更新し続けることにより、入力信号(オーディオキャンセラ部15より入力される信号)からノイズ信号の除去を行う。
[Noise canceller]
The
) Is estimated and held as a noise pattern, and at the same time as the noise pattern to be subtracted in the frequency domain of the input signal including the audio signal and the noise signal (signal input from the audio canceller unit 15), the noise pattern By continuing to update itself, the noise signal is removed from the input signal (the signal input from the audio canceller 15).
上述したようにオーディオキャンセラ部15においてフィルタ処理を行うことによって、さらに、ノイズキャンセラ部16においてノイズ除去処理を行うことによって、マイクMで取得された音響信号の中から、音楽信号や車両走行騒音などのノイズ音が低減されるので、発話者の音声を強調させることが可能となる。
As described above, by performing filter processing in the
[音声検出部]
次に、音声検出部3について説明する。図4は、音声検出部3の概略構成を示したブロック図である。音声検出部3は、図4に示すように、実効値検出部41と、移動平均部42と、音声検出スレッショルド部43と、音声信号ホールド部44とを有している。
[Audio detector]
Next, the voice detection unit 3 will be described. FIG. 4 is a block diagram showing a schematic configuration of the voice detection unit 3. As shown in FIG. 4, the voice detection unit 3 includes an effective
実効値検出部41は、音声強調処理部2によって音声強調処理が行われた音声信号において、所定区間の実効値の検出を行う役割を有している。移動平均部42は、実効値検出部41において実効値の検出が行われた信号に対して、所定区間の移動平均を求める役割を有している。音声検出スレッショルド部43は、あらかじめ設定された音声検出スレッショルド(閾値)に基づいて、信号レベルが音声検出スレッショルド(閾値)を超えた音声信号の検出を行う役割を有している。
The effective
図5は、移動平均部42において移動平均が求められた音声信号と、音声検出スレッショルド部43において設定される音声検出スレッショルドとの関係を示した図である。音声検出スレッショルド部43において音声信号の検出を行う場合、音声強調処理部2より入力される音声信号は、音声強調処理部2においてノイズ音が低減されて発話者の音声が強調された状態となっているので、音声検出スレッショルドに基づく音声信号の検出を容易に行うことが可能である。図5において音声検出スレッショルドよりも高い信号レベルとなる部分(例えば、図5に示した音声区間に該当する部分など)が音声信号の検出部分として判断されることになる。
FIG. 5 is a diagram showing a relationship between the voice signal whose moving average is obtained by the moving
音声信号ホールド部44は、音声検出スレッショルド部43において検出された音声検出信号に対して所定時間の保持を行う役割を有している。音声信号ホールド部44によりホールド処理された音声信号は、音声検出信号として音量制御部6に出力される。
The audio
[第1帯域分割部]
次に、第1帯域分割部4について説明する。図6は、第1帯域分割部4の概略構成を示したブロック図である。第1帯域分割部4は、図6に示すように、第1ローパスフィルタ部51と第2ローパスフィルタ部52と、第1ハイパスフィルタ部53と、第2ハイパスフィルタ部54と、位相反転部55とを有している。
[First Band Division]
Next, the first band dividing unit 4 will be described. FIG. 6 is a block diagram showing a schematic configuration of the first band dividing unit 4. As shown in FIG. 6, the first band dividing unit 4 includes a first low-
第1ローパスフィルタ部51および第2ローパスフィルタ部52は、低域通過型の3次のバタワース(Butterworth)・フィルタを2段カスケード接続することにより構成されたものであり、また、第1ハイパスフィルタ部53および第2ハイパスフィルタ部54は、高域通過型の3次のバタワース・フィルタを2段カスケード接続することにより構成されている。
The first low-
本実施の形態に係る第1ローパスフィルタ部51、第2ローパスフィルタ部52、第1ハイパスフィルタ部53および第2ハイパスフィルタ部54を用いて、入力された音楽信号Lを、低域音楽信号L、中域音楽信号Lおよび高域音楽信号Lへ帯域分割するためのフィルタ特性は、図7に示した状態になる。具体的に、第1ローパスフィルタ部51のカットオフ周波数は300Hz、第2ローパスフィルタ部52のカットオフ周波数は6,000Hz、第1ハイパスフィルタ部53のカットオフ周波数は300Hz、第2ハイパスフィルタ部54のカットオフ周波数は6,000Hzに設定されている。
Using the first low-
このようにしてカットオフ周波数が設定される第1ローパスフィルタ部51、第2ローパスフィルタ部52、第1ハイパスフィルタ部53および第2ハイパスフィルタ部54を、図6に示すようにそれぞれを組み合わせることによって、第1帯域分割部4に入力される音楽信号Lを、低域用の音楽信号として帯域分割が行われた低域音楽信号(非音声帯域信号)Lと、中域用の音楽信号として帯域分割が行われた中域音楽信号(第1音声帯域信号)Lと、高域用の音楽信号として帯域分割が行われた高域音楽信号(非音声帯域信号)Lとに分割することが可能となる。ここで、中域音楽信号の帯域幅は、第2ローパスフィルタ部52のカットオフ周波数と、第1ハイパスフィルタ部53のカットオフ周波数より明らかなように、音声信号の音声帯域に相当する帯域として設定されている。
The first low-
位相反転部55は、第2ローパスフィルタ部52および第1ハイパスフィルタ部53によりフィルタ処理が行われた中域音楽信号Lの位相を反転させる役割を有している。帯域分割により中域音楽信号を生成する場合には、図7に示すように、音楽信号に対して第2ローパスフィルタ部52が適用されてカットオフ周波数が6,000Hz以下の信号レベルのみが音楽信号の出力として認められ、さらに、第1ハイパスフィルタ部53が適用されてカットオフ周波数が300Hz以上の信号レベルのみが音楽信号の出力として認められることになる。このため、位相反転部55によって中域音楽信号の位相を反転させることにより、低域周波数部分および高域周波数部分の出力値が強調されることになり、第1合成部7で帯域分割されたそれぞれの音楽信号を合成する場合において、それぞれの信号間で生ずる干渉を低減させることが可能となる。
The phase inverting unit 55 has a role of inverting the phase of the mid-range music signal L that has been filtered by the second low-
なお、第2帯域分割部5は、第1帯域分割部4と実質的に同一の構成であり、入力された音楽信号Rをフィルタ処理により低域音楽信号Rと中域音楽信号Rと高域音楽信号Rとに帯域分割する。第2帯域分割部5の構成については、第1帯域分割部4と同一であるため、ここでの詳細な説明は省略する。
The second
[音量制御部]
次に、音量制御部6について説明する。図8は、音量制御部6の概略構成を示したブロック図である。音量制御部6は、図8に示すように、位相反転部(位相反転手段)61と、合成部(音声帯域信号合成手段)62と、第1ゲイン部(ゲイン付加手段)63と、第2ゲイン部(ゲイン付加手段)64と、選択部(音声帯域信号選択手段)65とを有している。
[Volume control section]
Next, the volume control unit 6 will be described. FIG. 8 is a block diagram showing a schematic configuration of the volume control unit 6. As shown in FIG. 8, the volume control unit 6 includes a phase inversion unit (phase inversion unit) 61, a synthesis unit (audio band signal synthesis unit) 62, a first gain unit (gain addition unit) 63, and a second unit. A gain section (gain addition means) 64 and a selection section (voice band signal selection means) 65 are provided.
位相反転部61は、第2帯域分割部5により帯域分割された中域音楽信号Rに対して位相反転を行う役割を有しており、合成部62は、位相反転された中域音楽信号Rと、第1帯域分割部4により帯域分割された中域音楽信号Lとの合成を行う役割を有している。このように、中域音楽信号Lに対して、位相反転された中域音楽信号Rを合成することにより、中域音楽信号Rと中域音楽信号Lとの共通する音楽成分であるモノラル成分が除去されることになる。
The phase inversion unit 61 has a role of performing phase inversion on the mid-range music signal R band-divided by the second band-splitting
特に、中域音楽信号Rおよび中域音楽信号Lは、音楽信号における音声帯域成分、つまり、音楽信号におけるボーカル帯域に該当するため、合成部62による合成処理によって、ボーカル帯域のモノラル成分の除去が行われることになる。一方で、合成された中域音楽信号(第2音声帯域信号)において、中域音楽信号Rと中域音楽信号Lとで共通していない音楽成分は残されることになるので、結果として中域音楽信号においてステレオ成分は保持された状態となる。
In particular, the mid-range music signal R and the mid-range music signal L correspond to the voice band component in the music signal, that is, the vocal band in the music signal. Therefore, the monaural component in the vocal band is removed by the synthesis processing by the
第1ゲイン部63および第2ゲイン部64は、ボーカル帯域のモノラル成分が除去された中域音楽信号に対してLチャンネル用およびRチャンネル用のゲインの重み付けを行うことにより、位相とレベルの補正を行う役割を有している。ボーカル帯域のモノラル成分が除去された(ステレオ成分が保持された)中域音楽信号は、第1ゲイン部63において0.707(1/√2)倍のゲインの重み付けが行われ、また、第2ゲイン部64において、−0.707(−1/√2)倍のゲインの重み付けが行われる。第1ゲイン部63においてゲインの重み付けが行われた中域音楽信号はLチャンネル用の中域音楽信号となり、第2ゲイン部64において重み付けが行われた中域音楽信号はRチャンネル用の中域音楽信号となる。 The first gain unit 63 and the second gain unit 64 perform phase and level correction by weighting the L channel and R channel gains to the mid-range music signal from which the monaural component of the vocal band has been removed. Has a role to do. The mid-range music signal from which the monaural component of the vocal band has been removed (the stereo component is retained) is weighted with a gain of 0.707 (1 / √2) in the first gain unit 63, and In the 2-gain unit 64, gain weighting of -0.707 (-1 / √2) times is performed. The mid-range music signal weighted by the first gain unit 63 is an L-channel mid-range music signal, and the mid-range music signal weighted by the second gain unit 64 is the R-channel mid-range music signal. It becomes a music signal.
この重み付け処理によって、Lチャンネル用およびRチャンネル用のそれぞれの中域音楽信号は、チャンネル間で無相関な信号になると共に、それぞれのステレオ成分が強調されることになるため、次述する第1合成部7および第2合成部8において各帯域の音楽信号を合成する場合において、音楽信号がステレオ成分において干渉してしまうことを防止することが可能となると共に、ステレオ成分の音質劣化を低減させることが可能になる。 As a result of this weighting process, the mid-range music signals for the L channel and the R channel become uncorrelated signals between the channels, and the respective stereo components are emphasized. When the music signal of each band is synthesized in the synthesis unit 7 and the second synthesis unit 8, it is possible to prevent the music signal from interfering with the stereo component, and to reduce the deterioration of the sound quality of the stereo component. It becomes possible.
選択部65は、音声検出部3により出力された音声検出信号に応じて、音量制御部6より第1合成部7へ出力する中域音楽信号L'と、第2合成部8へ出力する中域音楽信号R'との決定を行う役割を有している。具体的に選択部65は、音声検出信号に基づいて音声の検出が行われたと判断した場合には、第1合成部7へ出力する中域音楽信号L'としてモノラル成分の除去が行われたLチャンネル用の中域音楽信号を選択すると共に、第2合成部8へ出力する中域音楽信号R'としてモノラル成分の除去が行われたRチャンネル用の中域音楽信号を選択する。
The
一方で、選択部65は、音声検出信号に基づいて音声の検出が行われなかったと判断した場合には、第1合成部7へ出力する中域音楽信号L'としてモノラル成分の除去が行われていないLチャンネル用の中域音楽信号L(つまり、第1帯域分割部4において帯域分割された中域音楽信号L)を選択すると共に、第2合成部8へ出力する中域音楽信号R'としてモノラル成分の除去が行われていないRチャンネル用の中域音楽信号R(つまり、第2帯域分割部5において帯域分割された中域音楽信号R)を選択する。選択部65により選択されたLチャンネル用の中域音楽信号(中域音楽信号L')は、第1合成部7へ出力され、選択されたRチャンネル用の中域音楽信号(中域音楽信号R')は、第2合成部8に出力される。
On the other hand, when the
[第1合成部および第2合成部]
第1合成部7は、第1帯域分割部4において帯域分割された低域音楽信号Lおよび高域音楽信号Lと、音量制御部6により出力された中域音楽信号L'とを合成して第1パワーアンプ9へと出力する役割を有している。マイクMにより音声信号が取得された場合、第1合成部7において合成される中域音楽信号L'(音声帯域に該当)は、モノラル成分が除去された状態となる。このため、車室内で会話が行われた場合には、会話の妨げとなり得る中域成分のモノラル成分のみが低減された状態となり、円滑な会話を行うことが可能となる。さらに、マイクMにより音声信号が取得された場合には、音楽のモノラル成分は除去されてしまうが、ステレオ成分は除去されることがないため、音楽の音質(臨場感や迫力など)を損なうことがない。
[First synthesis unit and second synthesis unit]
The first synthesizing unit 7 synthesizes the low-frequency music signal L and the high-frequency music signal L band-divided by the first band dividing unit 4 with the mid-range music signal L ′ output from the volume control unit 6. It has a role to output to the first power amplifier 9. When the audio signal is acquired by the microphone M, the mid-range music signal L ′ (corresponding to the audio band) synthesized by the first synthesis unit 7 is in a state where the monaural component is removed. For this reason, when a conversation is performed in the passenger compartment, only the monaural component of the middle region that can hinder the conversation is reduced, and a smooth conversation can be performed. Furthermore, when an audio signal is acquired by the microphone M, the monaural component of the music is removed, but the stereo component is not removed, so that the sound quality of the music (such as presence and power) is impaired. There is no.
第2合成部8も、第1合成部7と同様に、第2帯域分割部5において帯域分割された低域音楽信号Rおよび高域音楽信号Rと、音量制御部6により出力された中域音楽信号R'とを合成して第2パワーアンプ10へと出力する役割を有している。第2合成部8においても、マイクMで音声信号が取得された場合、音声帯域に該当する中域音楽信号のモノラル成分が除去された状態となるため、会話の妨げとなり得る中域成分のモノラル成分のみが低減され、円滑な会話を行うことが可能となる。さらに、ステレオ成分は除去されることがないため、音楽の音質(臨場感や迫力など)を損なうことがなくなる。
Similarly to the first synthesizing unit 7, the second synthesizing unit 8 also includes the low-frequency music signal R and the high-frequency music signal R that are band-divided by the second
第1パワーアンプ9では、第1合成部7により出力された音楽信号を増幅した後にスピーカ11aより出力させ、第2パワーアンプ10では、第2合成部8により出力された音楽信号を増幅した後にスピーカ11bより出力させる。
The first power amplifier 9 amplifies the music signal output from the first synthesis unit 7 and then outputs it from the
次に、上述した自動音量制御装置1を用いて、音楽信号のモノラル成分が低減された場合と低減されていない場合とのそれぞれの音楽信号の周波数特性を、図9〜図12を用いて説明する。 Next, the frequency characteristics of the music signal when the monaural component of the music signal is reduced and when it is not reduced will be described with reference to FIGS. 9 to 12 using the automatic volume control device 1 described above. To do.
図9は、マイクMにより取得される音声信号の周波数特性を一例として示している。このような音声信号がマイクMで取得される場合において、図10および図11に示すようなホワイト雑音が、音楽信号の一例として音源から出力される場合について説明する。なお、図10に示すホワイト雑音は、Lチャンネル用のホワイト雑音とRチャンネル用のホワイト雑音とが同一のモノラル信号である場合を示し、図11に示すホワイト雑音は、Lチャンネル用のホワイト雑音とRチャンネル用のホワイト雑音とがそれぞれ無相関のステレオ信号である場合を示している。 FIG. 9 shows an example of frequency characteristics of an audio signal acquired by the microphone M. In the case where such an audio signal is acquired by the microphone M, a case where white noise as shown in FIGS. 10 and 11 is output from a sound source as an example of a music signal will be described. The white noise shown in FIG. 10 shows a case where the white noise for the L channel and the white noise for the R channel are the same monaural signal, and the white noise shown in FIG. 11 is the same as the white noise for the L channel. A case is shown in which the white noise for the R channel is an uncorrelated stereo signal.
図10に示されるように音量制御が行われていない状態では、ホワイト雑音に特有な周波数特性(周波数にかかわらず信号レベルが一定)が示されているが、音量制御が行われた状態では、中帯域の信号レベルが顕著に低減されている様子が示されている。図10に示したホワイト雑音の場合には、Lチャンネル用のホワイト雑音とRチャンネル用のホワイト雑音とが同一のモノラル信号であり、中帯域におけるモノラル成分が多いため、信号レベルの低減が顕著に表れることになる。この中帯域におけるモノラル成分の信号レベルの低減により、円滑な会話を実現することが可能となる。 In the state where the volume control is not performed as shown in FIG. 10, the frequency characteristic peculiar to white noise (the signal level is constant regardless of the frequency) is shown, but in the state where the volume control is performed, It is shown that the signal level in the middle band is significantly reduced. In the case of the white noise shown in FIG. 10, since the white noise for the L channel and the white noise for the R channel are the same monaural signal and there are many monaural components in the middle band, the signal level is significantly reduced. Will appear. By reducing the signal level of the monaural component in the middle band, smooth conversation can be realized.
一方で、図11の場合、音量制御が行われていない状態では、ホワイト雑音に特有な周波数特性(周波数にかかわらず信号レベルが一定)が示されているが、音量制御が行われた状態であっても、ホワイト雑音に特有な周波数特性(周波数にかかわらず信号レベルが一定)が示され、制御の有無によって信号レベルの変化を判断することが困難となっている。図11に示したホワイト雑音の場合には、Lチャンネル用のホワイト雑音とRチャンネル用のホワイト雑音とがそれぞれ無相関のステレオ信号であるため、中帯域におけるモノラル成分が存在せず、信号レベルの低減が行われないためである。このようにモノラル成分以外のステレオ成分に関しては中帯域における信号レベルの低減が行われないので、音楽の音質(臨場感や迫力など)などを維持することが可能となる。 On the other hand, in the case of FIG. 11, in a state where the volume control is not performed, a frequency characteristic peculiar to white noise (a signal level is constant regardless of the frequency) is shown, but in a state where the volume control is performed. Even in such a case, the frequency characteristic peculiar to white noise (the signal level is constant regardless of the frequency) is shown, and it is difficult to determine a change in the signal level depending on the presence or absence of control. In the case of the white noise shown in FIG. 11, since the white noise for the L channel and the white noise for the R channel are uncorrelated stereo signals, there is no monaural component in the middle band, and the signal level This is because there is no reduction. As described above, since the signal level in the middle band is not reduced for stereo components other than the monaural component, it is possible to maintain the sound quality of the music (such as presence and power).
図12は、ボーカル音を含んだ音楽信号を用いた場合における周波数特性を示しており、図12における音楽信号では、Lチャンネル用とRチャンネル用との音楽信号がステレオ成分(モノラル成分も含む)を備えているものとする。図12に示すように、音量制御を行った場合と、音量制御を行わない場合とのそれぞれの音楽信号の周波数特性を比較すると、ボーカル帯域(音声帯域)に該当する中帯域の信号レベルだけが大きく減衰し、高帯域および低帯域の信号レベルは、音量制御の有無にかかわらずほとんど同じような信号レベルを維持した状態となっている。 FIG. 12 shows frequency characteristics when a music signal including a vocal sound is used. In the music signal in FIG. 12, the music signals for the L channel and the R channel are stereo components (including monaural components). It shall be equipped with. As shown in FIG. 12, when comparing the frequency characteristics of music signals when the volume control is performed and when the volume control is not performed, only the signal level of the middle band corresponding to the vocal band (voice band) is obtained. The signal levels of the high band and the low band are largely attenuated, and are almost in the same state regardless of whether or not the volume control is performed.
図12に示す場合には、ボーカル帯域に該当する中帯域のモノラル成分のみ低減されるため、中帯域の信号レベルが低減されるが、高帯域および低帯域に関してはモノラル成分の低減処理が行われないため信号レベルに変化が生じないことになる。一方で、音楽信号のステレオ成分に関しては、音量制御の有無にかかわらず信号レベルの低減が生じないため、ほぼ全ての周波数において一様に出力が確保されている。 In the case shown in FIG. 12, only the middle band monaural component corresponding to the vocal band is reduced, so that the signal level of the middle band is reduced. However, the monaural component reduction processing is performed for the high band and the low band. Therefore, the signal level does not change. On the other hand, regarding the stereo component of the music signal, since the signal level does not decrease regardless of whether or not the volume control is performed, the output is ensured uniformly at almost all frequencies.
このように、LチャンネルとRチャンネルとの間が無相関な信号となるステレオ信号においては、第1合成部7および第2合成部8において音楽信号の合成処理を行っても干渉が発生していない。一方で、中帯域(ボーカル帯域)におけるモノラル成分に関しては、図12に示すように、約10dB程度の信号レベルの減衰が生じており、会話の妨げとなり得る音声帯域(ボーカル帯域、中帯域)の信号レベル(音量)だけを効果的に低減させる(制御する)ことが可能となる。なお、中帯域における信号レベルの減衰量は、音楽のボーカルのレベルに応じて可変し、ボーカルのレベルが大きくなるほど減衰が相対的に大きくなる。 As described above, in the stereo signal that is an uncorrelated signal between the L channel and the R channel, interference occurs even if the first synthesis unit 7 and the second synthesis unit 8 perform the music signal synthesis process. Absent. On the other hand, with respect to the monaural component in the middle band (vocal band), as shown in FIG. 12, the signal level is attenuated by about 10 dB, and the voice band (vocal band, middle band) that can hinder the conversation. Only the signal level (volume) can be effectively reduced (controlled). Note that the amount of attenuation of the signal level in the middle band varies according to the vocal level of music, and the attenuation increases relatively as the vocal level increases.
以上、説明したように、本実施の形態に係る自動音量制御装置1によれば、Lチャンネル用の音楽信号Lを、低域音楽信号L、中域音楽信号L、高域音楽信号Lに帯域分割し、同様に、Rチャンネル用の音楽信号Rを、低域音楽信号R、中域音楽信号R、高域音楽信号Rに帯域分割した後に、Rチャンネル用の中域音楽信号Rの位相を反転させてLチャンネル用の中域音楽信号Lと合成させることにより、スピーカ11a、11bより出力させる音楽信号の音声帯域(中帯域)におけるモノラル成分の出力(信号レベル)を低減させることができる。
As described above, according to the automatic volume control device 1 according to the present embodiment, the music signal L for the L channel is banded into the low frequency music signal L, the mid frequency music signal L, and the high frequency music signal L. Similarly, after dividing the music signal R for the R channel into the low-frequency music signal R, the mid-range music signal R, and the high-frequency music signal R, the phase of the mid-range music signal R for the R channel is divided. By inverting and synthesizing with the mid-range music signal L for the L channel, it is possible to reduce the output (signal level) of the monaural component in the audio band (mid-band) of the music signal output from the
このため、スピーカ11a,11bより出力される音楽信号の全体的なステレオ感を維持した状態で、会話の妨げとなり得る音声帯域のモノラル成分の信号レベルだけを効果的に低減させることができ、音楽が流れる状況であっても円滑な会話環境を実現することが可能となる。また、会話中であっても音楽信号における全体的なステレオ感(特に低域音楽信号と高域音楽信号のステレオ成分)は維持することができるので、円滑な会話を実現させつつ、音楽の音質(臨場感や迫力など)の低下を抑制することが可能となる。
For this reason, it is possible to effectively reduce only the signal level of the monaural component in the voice band that can hinder conversation while maintaining the overall stereo feeling of the music signals output from the
特に、本実施の形態に係る自動音量制御装置1では、第1ゲイン部63および第2ゲイン部64においてモノラル成分の低減が成された中域音楽信号に対してチャンネル毎に重み付け処理が行われているため、中域音楽信号においてモノラル成分の低減が行われた場合であっても残されたステレオ成分が強調され、音声帯域(ボーカル帯域)を含む全体的なステレオ感を高く維持することが可能となる。 In particular, in the automatic volume control device 1 according to the present embodiment, a weighting process is performed for each channel on the mid-range music signal whose monaural component has been reduced in the first gain unit 63 and the second gain unit 64. Therefore, even if the monaural component is reduced in the mid-range music signal, the remaining stereo component is emphasized, and the overall stereo feeling including the voice band (vocal band) can be maintained high. It becomes possible.
さらに、第1ゲイン部63および第2ゲイン部64において中域音楽信号に対する重み付け処理が行われるため、Lチャンネル用の中域音楽信号とRチャンネル用の中域音楽信号とが無相関な信号となり、第1合成部7および第2合成部8において音楽信号の合成を行う場合において、ステレオ成分の音楽信号が干渉してしまうことを防止することが可能となる。 Further, since the first gain unit 63 and the second gain unit 64 perform weighting processing on the mid-range music signal, the L-channel mid-range music signal and the R-channel mid-range music signal become uncorrelated signals. In the case where the music signals are synthesized in the first synthesis unit 7 and the second synthesis unit 8, it is possible to prevent the stereo component music signals from interfering with each other.
さらに、上述した音声帯域におけるモノラル成分の出力低減は、マイクMにより音声信号が検出されたと音声検出部3により判断された時に、音量制御部6において制御されるため、発話者による会話が行われた時だけ、自動的に音楽信号レベルを低減させることができる。また、このように音声検出に応じて音楽信号の音量制御が行われるため、会話が行われていない状態(会話が途切れた状態など)では、音声帯域におけるモノラル成分の音量低減制御は行われないため、会話が行われていない状態では(音声信号の検出がない場合には)、音楽信号の信号レベルの低減処理(音量制御)が全く行われなくなり、良質な音質の音楽を楽しむことが可能となる。 Furthermore, since the output reduction of the monaural component in the voice band described above is controlled by the volume control unit 6 when the voice detection unit 3 determines that a voice signal has been detected by the microphone M, a conversation by the speaker is performed. The music signal level can be automatically reduced only when In addition, since the volume control of the music signal is performed according to the voice detection in this way, the volume reduction control of the monaural component in the voice band is not performed in a state where the conversation is not performed (a state where the conversation is interrupted). Therefore, when there is no conversation (when no audio signal is detected), the signal level reduction processing (volume control) of the music signal is not performed at all, and it is possible to enjoy high-quality music. It becomes.
さらに、第1帯域分割部4および第2帯域分割部5において帯域分割を行った中域音楽信号には、位相反転部55においてあらかじめ位相反転が行われているので、第1合成部7および第2合成部8において、高域音楽信号および低域音楽信号と共に音声信号の合成を行う場合において、各信号間で干渉が生じてしまうことを低減させることが可能となる。
Further, since the phase inversion is performed in advance in the phase inversion unit 55 for the mid-range music signal that has been subjected to the band division in the first band division unit 4 and the second
また、オーディオキャンセラ部15の第1適応フィルタ部25および第2適応フィルタ部26においてLMS適応アルゴリズムを適用することにより、音声信号における音声信号成分以外の信号成分(ノイズ成分)が効果的に低減され、さらに、ノイズキャンセラ部16においてノイズ信号の除去が行われているので、音声検出部3における音声信号の検出精度の向上を図ることが可能となる。
Further, by applying the LMS adaptive algorithm in the first
以上、本発明に係る自動音量制御装置について、図面を用いて詳細に説明した、本発明に係る自動音量制御装置は、上述した実施の形態に限定されるものではない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 The automatic volume control device according to the present invention described above in detail with reference to the drawings for the automatic volume control device according to the present invention is not limited to the above-described embodiment. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.
例えば、本実施の形態では、自動音量制御装置1を車両に設置する場合を一例として示したが、本発明に係る自動音量制御装置は、車両に設置されるものには限定されず、音楽などが流れる空間において、音楽などにより会話が妨げられるおそれがある環境であれば、車室内には限定されず、異なる環境・空間に設置することも可能である。 For example, in the present embodiment, the case where the automatic volume control device 1 is installed in a vehicle is shown as an example. However, the automatic volume control device according to the present invention is not limited to that installed in a vehicle, such as music. As long as it is an environment in which a conversation may be hindered by music or the like in a space where music flows, the present invention is not limited to a vehicle interior, and can be installed in a different environment / space.
また、本実施の形態では、Lチャンネル用の音楽信号Lを、低域音楽信号L、中域音楽信号L、高域音楽信号Lの3帯域に帯域分割し、同様に、Rチャンネル用の音楽信号Rを、低域音楽信号R、中域音楽信号R、高域音楽信号Rの3帯域に帯域分割した場合について説明を行ったが、本発明に係る自動音量制御装置は、3帯域に分割されるものには限定されない。本発明に係る自動音量制御装置では、音声帯域を含む音声帯域信号と、音声帯域以外の帯域を含む非音声帯域信号とに少なくとも帯域分割することができればよく、非音声帯域信号に該当する信号は、高域信号および低域信号のみに限定されず、さらに細かく帯域分割されるものであってもよい。 In the present embodiment, the music signal L for the L channel is divided into three bands, ie, the low frequency music signal L, the mid frequency music signal L, and the high frequency music signal L, and similarly the music for the R channel. Although the case where the signal R is band-divided into three bands of the low-frequency music signal R, the mid-range music signal R, and the high-frequency music signal R has been described, the automatic volume control device according to the present invention is divided into three bands. It is not limited to what is done. In the automatic sound volume control device according to the present invention, it is only necessary to be able to at least divide a band into a voice band signal including a voice band and a non-voice band signal including a band other than the voice band. However, the present invention is not limited to the high frequency signal and the low frequency signal, and may be further divided into bands.
1 …自動音量制御装置
2 …音声強調処理部
3 …音声検出部(音声検出手段)
4 …第1帯域分割部(帯域分割手段)
5 …第2帯域分割部(帯域分割手段)
6 …音量制御部(位相反転手段、音声帯域信号合成手段、音声帯域信号選択手段、ゲイン付加手段)
7 …第1合成部(音楽信号合成手段)
8 …第2合成部(音楽信号合成手段)
9 …第1パワーアンプ
10 …第2パワーアンプ
11a、11b …スピーカ
15 …(音声強調処理部の)オーディオキャンセラ部
16 …(音声強調処理部の)ノイズキャンセラ部
21 …(オーディオキャンセラ部の)第1バンドパスフィルタ部
22 …(オーディオキャンセラ部の)第2バンドパスフィルタ部
23 …(オーディオキャンセラ部の)第1遅延部
24 …(オーディオキャンセラ部の)第2遅延部
25 …(オーディオキャンセラ部の)第1適応フィルタ部
26 …(オーディオキャンセラ部の)第2適応フィルタ部
28 …(第1適応フィルタ部の)第1FIR部
29 …(第1適応フィルタ部の)第1LMS部
30 …(第1適応フィルタ部の)第1加算部
31 …(第2適応フィルタ部の)第2FIR部
32 …(第2適応フィルタ部の)第2LMS部
33 …(第2適応フィルタ部の)第2加算部
41 …(音声検出部の)実効値検出部
42 …(音声検出部の)移動平均部
43 …(音声検出部の)音声検出スレッショルド部
44 …(音声検出部の)音声信号ホールド部
51 …(第1帯域分割部の)第1ローパスフィルタ部
52 …(第1帯域分割部の)第2ローパスフィルタ部
53 …(第1帯域分割部の)第1ハイパスフィルタ部
54 …(第1帯域分割部の)第2ハイパスフィルタ部
55 …(第1帯域分割部の)位相反転部
61 …(音量制御部の)位相反転部(位相反転手段)
62 …(音量制御部の)合成部(音声帯域信号合成手段)
63 …(音量制御部の)第1ゲイン部(ゲイン付加手段)
64 …(音量制御部の)第2ゲイン部(ゲイン付加手段)
65 …(音量制御部の)選択部(音声帯域信号選択手段)
M …マイク
DESCRIPTION OF SYMBOLS 1 ... Automatic volume control apparatus 2 ... Voice emphasis processing part 3 ... Voice detection part (voice detection means)
4 ... 1st band division part (band division means)
5: Second band dividing unit (band dividing means)
6 ... Volume control section (phase inversion means, voice band signal synthesis means, voice band signal selection means, gain addition means)
7 ... 1st synthetic | combination part (music signal synthetic | combination means)
8 ... 2nd synthetic | combination part (music signal synthetic | combination means)
9 ...
62 ... Synthesizer (of sound volume controller) (voice band signal synthesizer)
63... First gain section (gain adding means) (of volume control section)
64 ... 2nd gain part (of gain control part) (gain addition means)
65 ... Selection unit (of sound volume control unit) (voice band signal selection means)
M ... Mike
Claims (3)
音源により出力されるLチャンネル用の音楽信号とRチャンネル用の音楽信号とのそれぞれを、音声帯域に対応する周波数帯域からなる第1音声帯域信号と、前記音声帯域に対応しない周波数帯域からなる非音声帯域信号とに帯域分割する帯域分割手段と、
Lチャンネル用の前記第1音声帯域信号とRチャンネル用の前記第1音声帯域信号とのいずれか一方の音声帯域信号だけ位相反転を行う位相反転手段と、
該位相反転手段により位相反転されたLチャンネル用の前記第1音声帯域信号あるいはRチャンネル用の前記第1音声帯域信号のいずれか一方の音声帯域信号と、前記位相反転手段により位相反転されなかった他方の音声帯域信号とを合成することにより、Lチャンネル用の第2音声帯域信号とRチャンネル用の第2音声帯域信号とを生成する音声帯域信号合成手段と、
前記音声帯域信号合成手段により生成されたLチャンネル用の第2音声帯域信号とRチャンネル用の第2音声帯域信号とのいずれか一方に対して、他方に対する位相反転補正を行う位相補正手段と、
前記音声検出手段により前記音声信号の検出が行われた場合に、前記位相補正手段によりいずれか一方の位相反転補正が行われたLチャンネル用の前記第2音声帯域信号およびRチャンネル用の前記第2音声帯域信号を各チャンネル用の音声帯域信号として出力し、前記音声検出手段により前記音声信号の検出が行われなかった場合には、前記帯域分割手段により帯域分割されたLチャンネル用の前記第1音声帯域信号とRチャンネル用の前記第1音声帯域信号とをそのまま各チャンネル用の音声帯域信号として出力する音声帯域信号選択手段と、
該音声帯域信号選択手段により出力されたLチャンネル用の音声帯域信号およびRチャンネル用の音声帯域信号と、前記帯域分割手段において帯域分割されたLチャンネル用の非音声帯域信号およびRチャンネル用の非音声帯域信号とを、それぞれのチャンネル毎に合成することにより、Lチャンネル用の全帯域の音楽信号およびRチャンネル用の全帯域の音楽信号とを生成する音楽信号合成手段と
を備えることを特徴とする自動音量制御装置。 Voice detection means for detecting a voice signal from an acoustic signal acquired by a microphone;
Each of the L channel music signal and the R channel music signal output by the sound source includes a first voice band signal having a frequency band corresponding to a voice band and a non-frequency band having a frequency band not corresponding to the voice band. Band dividing means for dividing a band into audio band signals;
Phase inversion means for performing phase inversion of only one audio band signal of the first audio band signal for the L channel and the first audio band signal for the R channel;
Either the first audio band signal for the L channel or the first audio band signal for the R channel that has been phase-inverted by the phase inversion means, and the phase inversion has not been inverted by the phase inversion means. Voice band signal synthesis means for generating a second voice band signal for the L channel and a second voice band signal for the R channel by synthesizing the other voice band signal;
Phase correction means for performing phase inversion correction on the other of the second audio band signal for L channel and the second audio band signal for R channel generated by the audio band signal synthesis means;
If the detection of the audio signal has been performed by the voice detection means, the first for the second voice band signal and R channel for L channel is one of the phase inversion correction has been performed by the phase correcting means When two audio band signals are output as audio band signals for each channel and the audio signal is not detected by the audio detecting means, the second channel for the L channel divided by the band dividing means is used. Audio band signal selection means for outputting one audio band signal and the first audio band signal for the R channel as they are as an audio band signal for each channel;
The voice band signal for L channel and the voice band signal for R channel output by the voice band signal selecting means, the non-voice band signal for L channel and the non-voice for R channel divided by the band dividing means. And a music signal synthesizing unit for synthesizing the audio band signal for each channel to generate a full-band music signal for the L channel and a full-band music signal for the R channel. Automatic volume control device.
ことを特徴とする請求項1に記載の自動音量制御装置。 The phase correction means has a gain corresponding to each channel for the second audio band signal for L channel and the second audio band signal for R channel synthesized by the audio band signal synthesis means. The automatic volume control device according to claim 1, further comprising a function as a gain addition unit that performs weighting of the sound.
前記音楽信号合成手段は、前記音声帯域信号選択手段により出力されたLチャンネル用の前記音声帯域信号およびRチャンネル用の前記音声帯域信号と、Lチャンネル用の前記低域信号およびRチャンネル用の前記低域信号と、Lチャンネル用の前記高域信号およびRチャンネル用の前記高域信号とを、それぞれのチャンネル毎に合成することにより、Lチャンネル用の全帯域の音楽信号およびRチャンネル用の全帯域の音楽信号とを生成すること
を特徴とする請求項1又は請求項2に記載の自動音量制御装置。 The band dividing unit is configured to convert each of the music signal for L channel and the music signal for R channel output from the sound source into the first audio band signal having a frequency band corresponding to an audio band, The frequency band is divided into a low frequency signal consisting of a frequency band lower than the audio band and a high frequency signal consisting of a frequency band higher than the audio band, and only the first audio band signal is phase-inverted,
The music signal synthesizing unit is configured to output the audio band signal for the L channel and the audio band signal for the R channel output from the audio band signal selecting unit, the low frequency signal for the L channel, and the audio signal for the R channel. By combining the low frequency signal, the high frequency signal for the L channel and the high frequency signal for the R channel for each channel, the music signal for the entire band for the L channel and the total for the R channel The automatic sound volume control device according to claim 1 or 2, wherein a band music signal is generated.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009168407A JP5547432B2 (en) | 2009-07-17 | 2009-07-17 | Automatic volume control device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009168407A JP5547432B2 (en) | 2009-07-17 | 2009-07-17 | Automatic volume control device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011024058A JP2011024058A (en) | 2011-02-03 |
JP5547432B2 true JP5547432B2 (en) | 2014-07-16 |
Family
ID=43633714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009168407A Expired - Fee Related JP5547432B2 (en) | 2009-07-17 | 2009-07-17 | Automatic volume control device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5547432B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5899865B2 (en) * | 2011-11-22 | 2016-04-06 | ヤマハ株式会社 | Acoustic signal processing apparatus and program |
JP7255405B2 (en) * | 2019-07-23 | 2023-04-11 | ヤマハ株式会社 | Sound output assurance system, sound output assurance device, sound output assurance method, and sound output assurance program |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2829044B2 (en) * | 1988-11-29 | 1998-11-25 | パイオニア株式会社 | Auto voice change device |
JPH03297300A (en) * | 1990-04-16 | 1991-12-27 | Pioneer Electron Corp | Voice cancel circuit |
JPH0541293U (en) * | 1991-10-31 | 1993-06-01 | 株式会社ケンウツド | Narrow band phase inverter and in-vehicle audio system |
JP3213145B2 (en) * | 1993-12-16 | 2001-10-02 | アルパイン株式会社 | Automotive audio equipment |
JPH07311585A (en) * | 1994-05-17 | 1995-11-28 | Sony Corp | Vocal cancelling circuit |
US6876748B1 (en) * | 1999-10-25 | 2005-04-05 | Harman International Industries, Incorporated | Digital signal processing for symmetrical stereophonic imaging in automobiles |
JP2002374599A (en) * | 2001-06-13 | 2002-12-26 | Nippon Hoso Kyokai <Nhk> | Sound reproducing device and stereophonic sound reproducing device |
JP2007166478A (en) * | 2005-12-16 | 2007-06-28 | Matsushita Electric Ind Co Ltd | Hands-free system, and vehicle-mounted device and mobile phone used therefor |
-
2009
- 2009-07-17 JP JP2009168407A patent/JP5547432B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011024058A (en) | 2011-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011015018A (en) | Automatic sound volume controller | |
JP6367352B2 (en) | Management of telephony and entertainment audio on vehicle voice platforms | |
CN102077609B (en) | Acoustic processing apparatus | |
KR101989062B1 (en) | Apparatus and method for enhancing an audio signal, sound enhancing system | |
JP2016126335A (en) | Sound zone facility having sound suppression for every zone | |
JP6870078B2 (en) | Noise estimation for dynamic sound adjustment | |
CN108353229B (en) | Audio signal processing in a vehicle | |
JP2007003994A (en) | Sound system | |
WO2006030752A1 (en) | Sound processing apparatus | |
US8340963B2 (en) | Echo suppressing system, echo suppressing method, recording medium, echo suppressor, sound output device, audio system, navigation system and mobile object | |
JP2002051392A (en) | In-vehicle conversation assisting device | |
KR20170072132A (en) | Sound reproduction with active noise control in a helmet | |
JP4448464B2 (en) | Noise reduction method, apparatus, program, and recording medium | |
CN109076302B (en) | Signal processing device | |
JP5547432B2 (en) | Automatic volume control device | |
WO2016059878A1 (en) | Signal processing device, signal processing method, and computer program | |
JP2008070878A (en) | Voice signal pre-processing device, voice signal processing device, voice signal pre-processing method and program for voice signal pre-processing | |
JP2006166110A (en) | In-vehicle audio equipment | |
JP4977551B2 (en) | Active noise control device | |
JP5883580B2 (en) | Filter coefficient determination device | |
JP2541062B2 (en) | Sound reproduction device | |
JP6155132B2 (en) | Low frequency complement device and low frequency complement method | |
JP6632246B2 (en) | Noise reduction device, noise reduction method, and in-vehicle system | |
JP2012187995A (en) | Sound reproducing apparatus for use in vehicle | |
JP2011035685A (en) | Automatic volume controller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5547432 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |