JP6729744B1 - 収音装置、収音プログラム及び収音方法 - Google Patents

収音装置、収音プログラム及び収音方法 Download PDF

Info

Publication number
JP6729744B1
JP6729744B1 JP2019066528A JP2019066528A JP6729744B1 JP 6729744 B1 JP6729744 B1 JP 6729744B1 JP 2019066528 A JP2019066528 A JP 2019066528A JP 2019066528 A JP2019066528 A JP 2019066528A JP 6729744 B1 JP6729744 B1 JP 6729744B1
Authority
JP
Japan
Prior art keywords
target area
area sound
sound
level adjustment
adjustment coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019066528A
Other languages
English (en)
Other versions
JP2020167530A (ja
Inventor
一浩 片桐
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2019066528A priority Critical patent/JP6729744B1/ja
Application granted granted Critical
Publication of JP6729744B1 publication Critical patent/JP6729744B1/ja
Publication of JP2020167530A publication Critical patent/JP2020167530A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 エリア収音処理の際に音質劣化を抑制する収音装置、収音プログラム及び収音方法を提供する。【解決手段】 本発明は、収音装置に関する。そして、本発明の収音装置は、複数のマイクアレイのビームフォーマ出力に基づく目的方向信号を取得する手段と、取得した目的方向信号から非目的エリア音を抽出し目的方向信号から非目的エリア音をスペクトル減算することにより目的エリア音を抽出する手段と、入力信号に目的エリア音が含まれるか否か判定する手段と、目的エリア音判定処理の結果を含む要素に基づいて混合用信号のレベルを調整するレベル調整係数を決定する手段と、決定されたレベル調整係数の変化を所定時間かけて所定の変化パターンで制御する手段と、制御されたレベル調整係数で調整したレベル調整済混合用信号を目的エリア音と混合して混合後信号をエリア収音結果として出力する手段とを有することを特徴とする。【選択図】 図1

Description

本発明は、収音装置、収音プログラム及び収音方法に関し、例えば特定のエリアの音を強調し、それ以外のエリアの音を抑圧するエリア収音処理に適用し得る。
従来、複数の音源が存在する環境下において、ある特定の方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下、「BF」と呼ぶ)がある。BFとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。BFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。
図15は、マイクロホン数が2個の場合の減算型BF300に係る構成を示すブロック図である。
図16に示す減算型BF300は、遅延器310と減算器320とを有している。
減算型BF300は、まず遅延器310により目的とする方向に存在する音(以下、「目的音」と呼ぶ)が各マイクロホンに到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。時間差は下記(1)式により算出される。ここで「d」はマイクロホン間の距離であり、「c」は音速であり、「τL」は遅延量である。また、ここで「θ」は、各マイクロホン(M1、M2)の間を結んだ直線に対する垂直方向から目的方向への角度である。
ここで、死角がマイクロホンM1とマイクロホンM2の中心に対し、マイクロホンM1の方向に存在する場合、遅延器310は、マイクロホンM1の入力信号x(t)に対し遅延処理を行う。その後、減算型BF300では、減算器320が(2)式に従い減算処理を行う。
減算器320では、周波数領域でも同様に減算処理を行うことができ、その場合(2)式は以下(3)式のように変更される。
Figure 0006729744
図16は、2個のマイクロホンM1、M2を用いた減算型BF300により形成される指向特性を示す図である。
ここでθ=±π/2の場合、減算器320で形成される指向性は図16(a)に示すように、カージオイド型の単一指向性となり、θ=0,πの場合は、図16(b)のような8の字型の双指向性となる。ここでは、入力信号から単一指向性を形成するフィルタを「単一指向性フィルタ」と呼び、双指向性を形成するフィルタを「双指向性フィルタ」と呼ぶものとする。
また、減算器320では、スペクトル減算法(Spectral Subtraction;以下単に「SS」とも呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。SSによる指向性は、(4)式に従い全周波数、又は指定した周波数帯域で形成される。(4)式では、マイクロホンM1の入力信号Xを用いているが、マイクロホンM2の入力信号Xでも同様の効果を得ることができる。ここでβはSSの強度を調節するための係数である。
減算器320では、減算処理時に値がマイナスになった場合は、0または元の値を小さくした値に置き換える処理(フロアリング処理)を行う。この方式により、減算器320では、双指向性フィルタにより目的方向以外に存在する音(以下、「非目的音」と呼ぶ)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
Figure 0006729744
ところで、ある特定のエリア内に存在する音(以下、「目的エリア音」と呼ぶ)だけを収音したい場合、減算型BFを用いるだけでは、そのエリアの周囲に存在する音源(以下、「非目的エリア音」と呼ぶ)も収音してしまう可能性がある。そこで特許文献1の記載技術では、複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する手法(以下、「エリア収音」と呼ぶ)を提案している。
従来のエリア収音では、まず各マイクロホンアレイのBF出力に含まれる目的エリア音の振幅スペクトルの比率を推定し、それを補正係数とする。例えば、2つのマイクロホンアレイを使用する場合、目的エリア音振幅スペクトルの補正係数は、「(5)式、(6)式」または「(7)式、(8)式」により算出される。
Figure 0006729744
ここで、「Y1k(n)」、「Y2k(n)」は、それぞれ第1、第2のマイクロホンアレイのBF出力の振幅スペクトルである。また、「N」は周波数ビンの総数であり、「k」は周波数である。さらに、「α(n)」、「α(n)」は、それぞれ第1、第2のマイクロホンアレイのBF出力に対する振幅スペクトル補正係数である。さらにまた、「mode」は最頻値、「median」は中央値をそれぞれ表している。
従来のエリア収音処理では、その後、補正係数により各BF出力を補正し、SSすることで、目的エリア方向に存在する非目的エリア音を抽出する。更に抽出した非目的エリア音を各BFの出力からSSすることにより目的エリア音を抽出することができる。
この場合、従来のエリア収音処理では、第1のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出するには、(9)式に示すように、第1のマイクロホンアレイのBF出力Y(n)から第2のマイクロホンアレイのBF出力Y(n)に振幅スペクトル補正係数αを掛けたものをSSする。同様に(10)式に従い、第2のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出する。
その後、従来のエリア収音処理では、(11)式、(12)式に従い、各BF出力から非目的エリア音をSSして目的エリア音を抽出する。(11)式は第1のマイクロホンアレイを基準として目的エリア音を抽出する処理を示しており、(12)式は第2のマイクロホンアレイを基準として目的エリア音を抽出する処理を示している。
Figure 0006729744
ここでγ(n)、γ(n)はSS時の強度を変更するための係数である。
従来のエリア収音処理では、目的エリア音を抽出するために、(4)式と(11)及び(12)式で非線形処理であるSSを行っているため、高雑音環境下ではミュージカルノイズと呼ばれる不快な異音が発生する恐れがある。
そこで、特許文献2の記載技術では、入力信号に目的エリア音が存在している区間と存在していない区間を判定し、目的エリア音が存在していない区間ではエリア収音処理した音を出力しないことにより、ミュージカルノイズなどの異音を抑えている。
特許文献2の記載技術では、目的エリア音が存在しているかどうかを判定するために、まず(13)式に従い入力信号と目的エリア音を抽出した出力(以後、「エリア音出力」と呼ぶ)間の振幅スペクトル比R(=エリア音出力/入力信号)を算出する。
また、目的エリア内に音源が存在する場合、入力信号Xとエリア音出力Zには目的エリア音が共通に含まれるため、目的エリア音成分の振幅スペクトル比は1に近い値となる。
逆に、非目的エリア音成分は、エリア音出力では抑圧されているため、振幅スペクトル比は小さい値となる。
その他の背景雑音成分に関してもエリア収音処理では複数回のSSを行うため、専用の雑音抑圧処理を事前にしなくてもある程度抑圧され、振幅スペクトル比は小さい値となる。
逆に、目的エリア音が存在しない場合、エリア音出力には、入力信号と比べて消し残りの弱い雑音しか含まれていないため、振幅スペクトル比は全体域で小さい値となる。
特許文献2の記載技術では、この特徴により、(14)式に従い各周波数で求めた振幅スペクトル比の平均値Uを取ると、目的エリア音が存在するときと存在しないときとで大きな差が生まれることになる。
ここでmとnは、それぞれ処理帯域(周波数帯域)の上限と下限であり、例えば音声情報が十分に含まれる100Hzから6kHzとする。
そして、特許文献2の記載技術では、平均パワースペクトル比を予め設定した閾値で判定し、目的エリア音が存在しないと判定された場合は、エリア音出力データを出力せずに無音、もしくは入力信号のゲインを小さくした音を出力する。
Figure 0006729744
特許文献3では、背景雑音と非目的エリア音の大きさに応じて、マイクの入力信号と推定雑音の音量レベルをそれぞれに調節し、抽出した目的エリア音に混合することにより、ミュージカルノイズをマスキングして影響を抑えている。目的エリア音を抽出する処理により発生するミュージカルノイズは、背景雑音と非目的エリア音の音量レベルが大きいほど強くなるため、特許文献3の記載技術では、混合する入力信号と推定雑音の総和の音量レベルも、背景雑音と非目的エリア音の音量レベルに比例して大きくしている。また、特許文献3の記載技術において、背景雑音の音量レベルは、背景雑音を抑圧する過程で求める推定雑音から算出する。さらに、特許文献3の記載技術において、非目的エリア音の音量レベルは、それぞれ(3)式で抽出する非目的音と(9)式、(10)式で抽出する非目的エリア音を合わせたものから算出する。さらにまた、特許文献3の記載技術では、混合する入力信号と推定雑音の比率は、推定雑音と非目的エリア音の音量レベルから決定する。目的エリアの近くに非目的エリア音が存在する場合、混合する入力信号の音量レベルが大きすぎると、目的エリア音が存在しないときには、非目的エリア音だけが聞こえ、どちらが目的エリア音なのかが分からなくなってしまう。そこで、特許文献3の記載技術では、非目的エリア音が大きいときは混合する入力信号の音量レベルを下げ、推定雑音の音量レベルを大きくして混合する。つまり非目的エリア音が存在しないか音量レベルが小さい場合は入力信号の割合を多くし、逆に非目的エリア音の音量レベルが大きい場合推定雑音の割合を多くして混合する。特許文献3の手法は、ミュージカルノイズをマスキングするだけでなく、マイク入力信号に含まれる目的エリア音の成分により、目的エリア音の歪みを補正し、音質を改善する効果もある。
特開2014−072708号公報 特開2016−127457号公報 特開2017−183902号公報
浅野太著、"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−"、日本音響学会編、コロナ社、2011年2月25日発行
しかしながら、特許文献2に記載された手法では、高雑音環境下において、ミュージカルノイズの発生を抑えることはできるが、目的エリア音の歪を改善することができない。また、特許文献2に記載された手法では、目的エリア音が存在しないと判定された際に無音とする場合は、誤判定してしまうと音が欠落する。さらに、特許文献2に記載された手法では、目的エリア音が存在しないと判定された際に入力信号を小さくした音を出力する場合は、目的エリア音と切り替わったときに、歪んだ目的エリア音と入力信号とで音が不連続になり違和感が生じる可能性がある。
一方、特許文献3に記載された手法では、高雑音環境下において、ミュージカルノイズの影響を抑え、かつ目的エリア音の歪を改善することができる。しかしながら、特許文献3に記載された手法では、背景雑音と非目的エリア音のレベルがどちらも大きい場合は、混合信号のレベルも大きくなるため、目的エリア音が存在しない区間での雑音抑圧の効果が弱まってしまう問題がある。
以上のような問題に鑑みて、エリア収音処理の際に音質劣化を抑制する収音装置、収音プログラム及び収音方法が望まれている。
第1の本発明の収音装置は、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかの判定結果を出力する目的エリア音判定手段と、(4)前記目的エリア音判定手段が出力した判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定して出力する混合レベル調整手段と、(5)前記混合レベル調整手段が出力した前記レベル調整係数を取得し、取得した前記レベル調整係数の変化を制御する制御処理を行って出力するものであって、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態から目的エリア音非含有判定状態に変化したことに伴い、前記混合レベル調整手段が出力する前記レベル調整係数が第1の値から第2の値に変化した場合、出力する前記レベル調整係数を第1の時間かけて所定の変化パターンで前記第1の値から前記第2の値に変化させる制御処理を行うレベル調整係数制御手段と、(6)前記混合用信号のレベルを、前記レベル調整係数制御手段から出力された前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段とを有することを特徴とする。
第2の本発明の収音プログラムは、コンピュータを、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかの判定結果を出力する目的エリア音判定手段と、(4)前記目的エリア音判定手段が出力した判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定して出力する混合レベル調整手段と、(5)前記混合レベル調整手段が出力した前記レベル調整係数を取得し、取得した前記レベル調整係数の変化を制御する制御処理を行って出力するものであって、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態から目的エリア音非含有判定状態に変化したことに伴い、前記混合レベル調整手段が出力する前記レベル調整係数が第1の値から第2の値に変化した場合、出力する前記レベル調整係数を第1の時間かけて所定の変化パターンで前記第1の値から前記第2の値に変化させる制御処理を行うレベル調整係数制御手段と、(6)前記混合用信号のレベルを、前記レベル調整係数制御手段から出力された前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段として機能させることを特徴とする。
第3の本発明は、収音方法において、(1)指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、レベル調整係数制御手段、及び混合手段を有し、(2)前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、(3)前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、(4)前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかの判定結果を出力し、(5)前記混合レベル調整手段は、前記目的エリア音判定手段が出力した判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定して出力し、(6)前記レベル調整係数制御手段は、前記混合レベル調整手段が出力した前記レベル調整係数を取得し、取得した前記レベル調整係数の変化を制御する制御処理を行って出力するものであって、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態から目的エリア音非含有判定状態に変化したことに伴い、前記混合レベル調整手段が出力する前記レベル調整係数が第1の値から第2の値に変化した場合、出力する前記レベル調整係数を第1の時間かけて所定の変化パターンで前記第1の値から前記第2の値に変化させる制御処理を行い、(7)前記混合手段は、前記混合用信号のレベルを、前記レベル調整係数制御手段から出力された前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力することを特徴とする。
本発明によれば、エリア収音処理の際に音質劣化を抑制する収音装置、収音プログラム及び収音方法を提供することができる。
実施形態に係る収音装置の機能的構成を示すブロック図である。 実施形態に係る収音装置のハードウェア構成の例について示したブロック図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その1)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その2)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その3)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その4)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その5)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その6)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その7)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その8)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その9)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その10)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その11)について示した図である。 実施形態に係る混合レベル制御部がレベル調整係数を制御する際の変更パターンの例(その12)について示した図である。 従来の減算型BFの構成を示すブロック図である。 従来の減算型BFにより形成される指向性フィルタの例について示した説明図である。
(A)主たる実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の一実施形態を図面を参照して説明する。
(A−1)実施形態の構成
図1は、この実施形態に係る収音装置100の機能的構成を示すブロック図である。
収音装置100は、2つのマイクロホンアレイMA(MA1、MA2)を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。
マイクロホンアレイMA1、MA2は、目的エリアが存在する空聞の任意の場所に配置される。目的エリアに対するマイクロホンアレイMA1、MA2の位置は、指向性が目的エリアでのみ重なればどこでも良く、例えば目的エリアを挟んで対向に配置しても良い。各マイクロホンアレイMAは2つ以上のマイクロホンMから構成され、各マイクロホンMにより音響信号を収音する。この実施形態では、各マイクロホンアレイMAに、音響信号を収音する2つのマイクロホンM1、M2が配置されるものとして説明する。すなわち、この実施形態において、各マイクロホンアレイMAは、2chマイクロホンアレイを構成しているものとする。2個のマイクロホンM1、M2の間の距離は限定されないものであるが、この実施形態の例では、2個のマイクロホンM1、M2の間の距離は3cmとする。なお、マイクロホンアレイMAの数は2つに限定するものではなく、目的エリアが複数存在する場合、全てのエリアをカバーできる数のマイクロホンアレイMAを配置する必要がある。
次に、図1を用いて収音装置100の内部構成について説明する。
図1に示す通り、収音装置100は、信号入力部1、指向性形成部2、遅延補正部3、空間座標データ4、補正係数算出部5、目的エリア音抽出部6、目的エリア音判定部7、雑音レベル算出部8、混合レベル調整部9、混合レベル制御部10及び信号混合部11を有している。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
次に、図2を用いて、収音装置100のハードウェア構成について説明する。
図2は、収音装置100のハードウェア構成の例について示したブロック図である。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
図2では、収音装置100を、ソフトウェア(コンピュータ)を用いて構成する際のハードウェア構成の例について示している。
図2に示す収音装置100は、ハードウェア的な構成要素として、プログラム(実施形態の収音プログラムを含む)がインストールされたコンピュータ200を有している。また、コンピュータ200は、収音プログラム専用のコンピュータとしてもよいし、他の機能のプログラムと共用される構成としてもよい。
図2に示すコンピュータ200は、プロセッサ201、一次記憶部202、及び二次記憶部203を有している。一次記憶部202は、プロセッサ201の作業用メモリ(ワークメモリ)として機能する記憶手段であり、例えば、DRAM(Dynamic Random Access Memory)等の高速動作するメモリを適用することができる。二次記憶部203は、OS(Operating System)やプログラムデータ(実施形態に係る収音プログラムのデータを含む)等の種々のデータを記録する記憶手段であり、例えば、FLASHメモリやHDD等の不揮発性メモリを適用することができる。この実施形態のコンピュータ200では、プロセッサ201が起動する際、二次記憶部203に記録されたOSやプログラム(実施形態に係る収音プログラムを含む)を読み込み、一次記憶部202上に展開して実行する。
なお、コンピュータ200の具体的な構成は図2の構成に限定されないものであり、種々の構成を適用することができる。例えば、一次記憶部202が不揮発メモリ(例えば、FLASHメモリ等)であれば、二次記憶部203については除外した構成としてもよい。
(A−2)実施形態の動作
次に、以上のような構成を有するこの実施形態の収音装置100の動作(実施形態の収音方法)を説明する。
信号入力部1は、各マイクロホンアレイMA(MA1、MA2)が収音した音響信号の入力をうけるとその音響信号をアナログ信号からデジタル信号に変換する。そして、信号入力部1は、当該音響信号(デジタル信号)を、所定の方法(例えば、高速フーリエ変換)を用いて、時間領域から周波数領域へ変換する。以下では、各マイクロホンアレイMAにおいて、マイクロホンM1、M2の周波数領域の入力信号を、それぞれX、Xとして説明する。
指向性形成部2は、マイクロホンアレイ毎に入力信号に対し、(4)式に従いBFにより目的エリア方向に指向性を形成する。以下では、マイクロホンアレイMA1、MA2のBF出力の振幅スペクトルを、それぞれY1k(n)、Y2k(n)として説明する。
遅延補正部3は、目的エリアと各マイクロホンアレイの距離の違いにより発生する遅延を算出し、補正する。遅延補正部3は、まず空間座標データ4から目的エリアの位置とマイクロホンアレイの位置を取得し、各マイクロホンアレイへの目的エリア音の到達時間の差を算出する。次に、遅延補正部3は、最も目的エリアから遠い位置に配置されたマイクロホンアレイを基準として、全てのマイクロホンアレイに目的エリア音が同時に到達するように遅延を加える。
空間座標データ4は、全ての目的エリアと各マイクロホンアレイと各マイクロホンアレイを構成するマイクロホンの位置情報を保持する。
補正係数算出部5は、各BF出力に含まれる目的エリア音成分の振幅スペクトルを同じにするための補正係数を算出する。以下では、マイクロホンアレイMA1、MA2のBF出力に対する補正係数を、α(n)、α(n)として説明する。補正係数算出部5は、「(5)式、(6)式」または「(7)式、(8)式」に従い補正係数を算出する。
目的エリア音抽出部6は、補正係数算出部5で算出した補正係数により補正した各BF出力から、目的エリア方向に存在する非目的エリア音を抽出する。そして、目的エリア音抽出部6は、補正係数算出部5で算出した補正係数により補正した各BF出力データを、例えば、(9)式もしくは(10)式に従いSSし、目的エリア方向に存在する非目的エリア音(N(n)又はN(n))を抽出する。さらに、目的エリア音抽出部6は、抽出した非目的エリア音(N(n)又はN(n))を、各BFの出力から(11)式、もしくは(12)式に従いSSすることにより、目的エリア音(Z(n)又はZ(n))を抽出する。
目的エリア音判定部7は、入力信号に目的エリア音が存在するか否かを判定する処理(以下、「目的エリア音判定処理」と呼ぶ)を行う。目的エリア音判定部7は、目的エリア音判定処理で、入力信号に目的エリア音が存在すると判定した場合には、「目的エリア音有り」を示すデータ(信号)を出力し、入力信号に目的エリア音が存在しない判定した場合には、「目的エリア音無し」を示すデータ(信号)を出力する。以下では、目的エリア音判定部7が「目的エリア音有り」を出力している状態を「目的エリア音含有判定状態」と呼び、目的エリア音判定部7が「目的エリア音無し」を出力している状態を「目的エリア音非含有判定状態」とも呼ぶものとする。
目的エリア音判定部7における目的エリア音判定処理の方式は限定されないものであり種々の方式を適用することができる。この実施形態では、目的エリア音判定部7は、特許文献2の方式により目的エリア音判定処理を行うものとする。例えば、目的エリア音判定部7は、各周波数について目的エリア音と入力信号の振幅スペクトル比を(13)式に従って求め、各周波数で求めた振幅スペクトル比Rの平均値Uを(14)式に従って求める。そして、目的エリア音判定部7は、求めたUを予め設定した閾値と比較することで、目的エリア音が存在するかしないかを判定する。
なお、目的エリア音判定部7では、判定結果が「目的エリア音無し」から「目的エリア音有り」に切り替わると、その後所定期間(例えば、数秒程度の期間;以下、この期間を「TH」と表す))内は、判定処理に用いる算出結果に関わらず、「目的エリア音有り」の判定結果を出力する機能(以下、「ハングオーバ機能」と呼ぶ)に対応するようにしてもよい。例えば、目的エリア音判定部7は、出力する判定結果が「目的エリア音無し」から「目的エリア音有り」に切り替わった後、期間THの間に、算出結果に基づく判定結果が「目的エリア音無し」に切り替わった場合でも、期間THが経過するまでの間、「目的エリア音有り」の判定結果の出力を継続(出力を固定)する。なお、以下では、目的エリア音判定部7において、期間THを計時中(経過中)に算出結果に基づく判定結果が「目的エリア音無し」に切り替わった第1のタイミングから、期間THの計時が完了するまでの第2のタイミングまでの状態を「ハングオーバ状態」と呼び、ハングオーバ状態の期間を「ハングオーバ期間」と呼ぶものとする。
雑音レベル算出部8は、目的エリア音判定部7で「目的エリア音無し」と判定したときの入力信号のレベルを、推定した雑音のレベル(以下、「推定雑音レベルP」と呼ぶ)として算出する。例えば、雑音レベル算出部8は、目的エリア音判定部7が、「目的エリア音無し」と1回判定したときの入力信号のレベルを推定雑音レベルPとして取得するようにしてもよい。また、例えば、雑音レベル算出部8は、目的エリア音判定部7が「目的エリア音無し」と判定したときの入力信号を複数回分取得して、その平均値(平均レベル)を推定雑音レベルPとして取得するようにしてもよい。さらに、雑音レベル算出部8は、複数回分の入力レベルの平均値を推定雑音レベルPとして取得する場合、忘却係数を設定し、過去の信号と現在の信号とで重み付け(時系列が古い信号ほど低い重み付け)をしても良い。
混合レベル調整部9は、目的エリア音判定部7における判定結果を含む要素を考慮して、混合信号のレベルを調整するための係数(以下、「レベル調整係数」とよぶ)を決定する。すなわち、混合レベル調整部9は、目的エリア音判定部7における判定結果が「目的エリア音有り」の状態(目的エリア音含有判定状態)であるか、「目的エリア音無し」の状態(目的エリア音非含有判定状態)であるかで、レベル調整係数を変更するようにしてもよい。例えば、混合レベル調整部9は、予め、「目的エリア音有り」の状態と「目的エリア音無し」の状態とで、それぞれに対応するレベル調整係数(レベル調整係数の初期値)を設定しておくようにしてもよい。また、混合レベル調整部9では、ユーザの操作(例えば、ユーザによるコンピュータ200に対する操作)に応じて、適用するレベル調整係数の変更(レベル調整係数を初期値から変更)することを可能としてもよい。また、例えば、混合レベル調整部9は、全周波数でレベル調整係数を同じ値としても良いし、周波数毎に異なる値を設定しても良い。
また、混合レベル調整部9は、推定雑音レベルPを考慮して出力するレベル調整係数を変更するようにしてもよい。例えば、混合レベル調整部9は、推定雑音レベルPが所定の閾値以上となる場合に、「目的エリア音無し」の状態(目的エリア音非含有状態)において決定したレベル調整係数を下げる処理(一定値減算する処理)を行うようにしてもよい。
以下では、混合レベル調整部9が「目的エリア音有り」の状態(目的エリア音含有状態)において決定したレベル調整係数を「μ」と表し、「目的エリア音無し」の状態(目的エリア音非含有状態)において決定したレベル調整係数を「μ」と表すものとする。
以上のように、混合レベル調整部9には、目的エリア音判定部7における判定結果を含む要素を考慮してレベル調整係数を決定する処理を行う。
混合レベル制御部10は、目的エリア音判定部7で判定結果が切り替わる際(混合レベル調整部9で決定するレベル調整係数が切り替わる際)に、最終的に信号混合部11に供給するレベル調整係数(以下、「μ」と表す)を所定の変更パターンに従って制御する処理を行う。混合レベル制御部10がレベル調整係数μを決定する処理の詳細については後述する。
信号混合部11は、混合レベル制御部10で設定されたレベル調整係数μを混合用信号(入力信号)に掛け、目的エリア音抽出部6で抽出された目的エリア音と混合した出力信号を出力する。以下では、信号混合部11が出力する出力信号を「W」と表すものとする。なお、以下では、マイクロホンアレイMA1を基準とした目的エリア音Zを用いて生成された出力信号を「W」と表し、マイクロホンアレイMA2を基準とした目的エリア音Zを用いて生成された出力信号を「W」と表すものとする。
例えば、目的エリア音抽出部6が(11)式に従いマイクロホンアレイMA1を基準としてエリア収音処理を行った場合、信号混合部11が出力する最終的な出力信号Wは以下の(15)式に従い生成(混合)される。
ここで、「XMIX」は入力信号であり、「ρ」は目的エリア音の大きさを調整するパラメータである。例えば、信号混合部11は、目的エリア音判定部7における判定が「目的エリア音無し」の場合、ρを0と設定することで、結果として混合信号XMIXの成分だけを出力する状態となってもよい。これにより、出力信号Wにおいてミュージカルノイズの発生を完全に抑えることができる。すなわち、収音装置100は、結果として混合信号のみが出力する構成としてもよい。さらに、例えば、目的エリア音判定部7における判定が「目的エリア音有り」の場合、信号混合部11は、目的エリア音の平均振幅スペクトルが一定になるようにρを動的に変更することで、出力レベルを安定させることができる。
なお、目的エリア音抽出部6が(12)式に従いマイクロホンアレイMA2を基準としてエリア収音処理を行った場合、信号混合部11が出力する最終的な出力信号Wは以下の(16)式に従い生成(混合)される。
Figure 0006729744
次に、混合レベル制御部10がレベル調整係数μを制御する処理の詳細について説明する。
混合レベル制御部10は、例えば、図3に示すように、「目的エリア音有り」から「目的エリア音無し」へと判定が切り替わったタイミングでμをμからμに切り替え、「目的エリア音無し」から「目的エリア音有り」へと判定が切り替わったタイミングでμをμからμに切り替えるようにしてもよい。しかしながら、図3のように、「目的エリア音有り」から「目的エリア音無し」に判定が切り替わったタイミングで、目的エリア音に混合する混合用信号のレベル(μMIXのレベル)が急に切り替わる状態となると、出力信号Wに含まれる雑音(非目的エリア音、背景雑音)の大きさが何度も急激に変化し、受聴者に不快感を生じさせる恐れがある。そこで、この実施形態の混合レベル制御部10は、少なくとも、「目的エリア音有り」の状態から「目的エリア音無し」の状態に切り替わったタイミングにおいては、レベル調整係数μを、μから所定の時間内に所定の変更パターンでμへ変更させる処理を行う。
以下では、図4〜図14を用いて、混合レベル制御部10によるレベル調整係数μの制御パターンの例について説明する。
例えば、「目的エリア音有り」のレベル調整係数μが「目的エリア音有り」のレベル調整係数μよりも大きい場合を想定する。この場合、混合レベル制御部10は、例えば、μをμTからμへ変更する際、図4に示すように、μを予め設定した時間内に一定の割合で線形に減少させるようにしてもよい。また、この場合、混合レベル制御部10は、例えば、μをμTからμへ変更する際、図5に示すように、一定時間ごとに一定の値ずつ段々に減少させるようにしてもよい。さらに、この場合、混合レベル制御部10は、μをμTからμへ変更する際、例えば、図6や図7に示すように、二次関数(指数関数)に基づき減少させるようにしてもよいし、図8に示すようにロジスティック関数に基づき非線形に減少させても良い。以下では、μがμからμへ変更する際にかかる時間を「混合レベル制御区間TA」と呼ぶものとする。
混合レベル制御部10において、各時間におけるレベル調整係数μを設定するには、変更パターンを関数として用意し、μと、μのレベル差(以下、「LD」と表す)と、μからμへの変更にかかる時間(混合レベル制御区間TA)とからフィルタを設計して算出するようにしても良い。混合レベル制御部10において、μ、μ、及び混合レベル制御区間TAは予め設定しておいても良いし、処理中に任意の値に変更可能(例えば、ユーザの操作に応じて変更)とするようにしてもよい。混合レベル制御部10において、μ、μ、及び混合レベル制御区間TAが予め設定されており、かつ変更することがない場合は、事前に混合レベル制御区間TA内のμ(時間ごとのμの変更パターン)を算出して保持おいても良い。また、混合レベル制御部10において、μの変更パターンごとのフィルタをデータベースとして用意し、その都度選択しても良い。
目的エリア音判定部7において、判定結果が「目的エリア音無し」から「目的エリア音有り」に切り替わった場合、混合レベル制御部10は、図3や図9に示すように、μを瞬時にμからμへ変更するようにしてもよいが、混合レベル制御区間TAの場合(μをμからμに変更する場合;上述の図4〜図8)と同様に、所定時間をかけて徐々に変更するようにしても良い。
具体的には、例えば、混合レベル制御部10は、μをμからμへ変更する際、図10に示すように、μを予め設定した時間内に一定の割合で線形に増加させるようにしてもよい。以下では、μがμからμへ変更する際にかかる時間を「混合レベル制御区間TB」と呼ぶものとする。
この場合、混合レベル制御部10では、μをμからμへの変更にかかる時間(混合レベル制御区間TB)をμからμへの変更にかかる時間(混合レベル制御区間A)よりも短く設定することが望ましい。
また、出力信号Wの供給先において、目的エリア音の出力に遅延が許される場合(例えば、供給先がリアルタイム性の低い音声認識処理装置の場合等)、混合レベル制御部10は、図11に示すように、判定結果が「目的エリア音無し」から「目的エリア音有り」に判定が変わった時点から過去に遡り、「目的エリア音無し」の区間でμからμへの変更を開始するように制御しても良い。図11では、判定結果が「目的エリア音無し」から「目的エリア音有り」に判定が変わった時点より所定時間前の時点(混合レベル制御区間TB分前の時点)から、μcの値の増加(μからμへ増加)が開始している。例えば、信号混合部11に所定時間分の出力信号Wがバッファリングされている場合を想定する。このとき、混合レベル制御部10が、判定結果が「目的エリア音無し」から「目的エリア音有り」に判定が変わるタイミングを検知すると、所定時間前の時点からμcを増加(μNからμTへ増加)させたデータを信号混合部11に供給し、信号混合部11で所定時間前の時点からの出力信号Wを生成しなおして出力(バッファリングしている出力データWを破棄し、新たに出力信号Wのデータを生成しなおして出力)するようにしてもよい。
さらに、混合レベル制御区間TAの途中で、「目的エリア音無し」から「目的エリア音有り」へ判定が変わった場合、混合レベル制御部10は、μの減少(μからμへの変更)を打ち切り、その時点からμをμへ変更するようにしてもよい。例えば、混合レベル制御部10は、図12に示すように、混合レベル制御区間TAの途中で、「目的エリア音無し」から「目的エリア音有り」へ判定が変わった時点で瞬時にμをμに変更するようにしてもよい。また、例えば、混合レベル制御部10は、図13に示すように、混合レベル制御区間TAの途中で、「目的エリア音無し」から「目的エリア音有り」へ判定が変わった時点から、μを徐々に増加させ、混合レベル制御区間TBの時間をかけてμに変更するようにしてもよい。さらに目的エリア音の出力に遅延が許される場合は、図11のように判定結果が「目的エリア音無し」から「目的エリア音有り」に判定が変わった時点から過去に遡り、「目的エリア音無し」の区間でμからμへの変更を開始するように制御しても良い。なお、混合レベル制御部10は、混合レベル制御区間TBの途中で、「目的エリア音有り」から「目的エリア音無し」へ判定が変わった場合も同様の制御を行って、μをμに変更するようにしてもよい。
さらにまた、目的エリア音判定部7において、ハングオーバ機能が有効である場合、混合レベル制御部10は、ハングオーバ期間(以下、「混合レベル制御区間TC」と呼ぶ)が開始した時点で、μをμからμへの変更する制御を開始しても良い。このとき、目的エリア音判定部7において、混合レベル制御区間TCの変更パターンは、通常の混合レベル制御区間TAと同じでも良いし、図14に示すように別の変更パターンとするようにしてもよい。図14の例では、ハングオーバ期間(混合レベル制御区間TC)におけるμcの変化量(混合レベルμcの変化の傾き;時間あたりの変化量)より、ハングオーバ期間(混合レベル制御区間TC)の後に続く混合レベル制御区間TAの変化量の方が大きくなっている。なお変更パターンは、図3から図8に示したパターンを任意に組み合わせることができる。
(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
この実施形態の収音装置100では、目的エリア音が存在する区間と存在しない区間とで混合用信号のレベルを調節し、目的エリア音に入力信号を混合信号として混合することで、ミュージカルノイズの影響を抑え、目的エリア音の音質を改善し、目的エリア音が存在しないときの雑音の混入を抑えることができる。
また、この実施形態の収音装置100では、目的エリア音が存在する区間から存在しない区間へ変わった際、混合用信号のレベル(レベル調整係数μ)を瞬時に変更するのではなく、一定の時間をかけて所定の変更パターンで変更していくことで、混合用信号に含まれる雑音レベルの変化を穏やかにすることができる。これにより、この実施形態の収音装置では、目的エリア音が存在する区間(目的エリア音の強調)と、目的エリア音が存在しない区間(雑音の抑圧)の切り替わりが自然になり、聴者(出力信号Wの聴者)の不快感を軽減する効果が期待できる。
さらに、この実施形態の収音装置100(混合レベル制御部10)では、μをμからμへ変更する際にかかる時間(混合レベル制御区間B)を、μをμからμへ変更する際にかかる時間(混合レベル制御区間A)よりも短く設定している。これにより、この実施形態の収音装置100では、目的エリア音が存在する区間から目的エリア音が存在しない区間への切り替わりに時間をかけて自然としつつ、目的エリア音が存在しない区間から目的エリア音が存在する区間への切り替わりを素早くすることでより確実に目的エリア音を聴者(出力信号Wの聴者)に聴かせることができる。
(B)他の実施形態
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(B−1)上記の各実施形態において、遅延補正部3および空間座標データ4は必須ではないため除外するようにしてもよい。例えば、各マイクロホンアレイMAと目的エリア音の配置により、当初から遅延が発生しないか無視できる程度であれば、遅延補正部3の処理および空間座標データ4を除外するようにしてもよい。
(B−2)上記の各実施形態において、補正係数算出部5は必須ではないため除外するようにしてもよい。例えば、各マイクロホンアレイMAと目的エリア音の配置により、各マイクロホンM(各マイクロホンアレイMAを構成する各マイクロホンM)で捕捉される目的エリア音の振幅スペクトルの差が小さいことが明白な場合は、補正係数算出部5の処理を除外してもよい。
(B−3)上記の各実施形態において、推定雑音レベルPを考慮せずにレベル調整係数を決定する場合には、雑音レベル算出部8は除外するようにしてもよい。
100…収音装置、1…信号入力部、2…指向性形成部、3…遅延補正部、4…空間座標データ、5…補正係数算出部、6…目的エリア音抽出部、7…目的エリア音判定部、8…雑音レベル算出部、9…混合レベル調整部、10…混合レベル制御部、11…信号混合部、MA1、MA2…マイクアレイ、M1、M2…マイクロホン。

Claims (9)

  1. 複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
    前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかの判定結果を出力する目的エリア音判定手段と、
    前記目的エリア音判定手段が出力した判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定して出力する混合レベル調整手段と、
    前記混合レベル調整手段が出力した前記レベル調整係数を取得し、取得した前記レベル調整係数の変化を制御する制御処理を行って出力するものであって、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態から目的エリア音非含有判定状態に変化したことに伴い、前記混合レベル調整手段が出力する前記レベル調整係数が第1の値から第2の値に変化した場合、出力する前記レベル調整係数を第1の時間かけて所定の変化パターンで前記第1の値から前記第2の値に変化させる制御処理を行うレベル調整係数制御手段と、
    前記混合用信号のレベルを、前記レベル調整係数制御手段から出力された前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と
    を有することを特徴とする収音装置。
  2. 前記レベル調整係数制御手段は、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態から目的エリア音含有判定状態に変化したことに伴い、前記混合レベル調整手段が出力する前記レベル調整係数が前記第2の値から前記第1の値に変化した場合、出力する前記レベル調整係数を第2の時間かけて所定の変化パターンで前記第2の値から前記第1の値に変化させる制御処理を行うことを特徴とする請求項1に記載の収音装置。
  3. 前記レベル調整係数制御手段において、前記第2の時間は、前記第1の時間よりも短い時間に設定されていることを特徴とする請求項2に記載の収音装置。
  4. 前記レベル調整係数制御手段は、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態から目的エリア音非含有判定状態に変化したことに伴って、出力する前記レベル調整係数を前記第1の値から前記第2の値に向けて変化させている途中で、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態に変化した場合、出力する前記レベル調整係数を前記第2の値に向けて変化させる制御処理を中止し、出力する前記レベル調整係数を前記第1の値に向けて変化させる制御処理を開始することを特徴とする請求項2又は3に記載の収音装置。
  5. 前記レベル調整係数制御手段は、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態から目的エリア音含有判定状態に変化したことに伴って、出力する前記レベル調整係数を前記第2の値から前記第1の値に向けて変化させている途中で、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態に変化した場合、出力する前記レベル調整係数を前記第1の値に向けて変化させる制御処理を中止し、出力する前記レベル調整係数を前記第2の値に向けて変化させる制御処理を開始することを特徴とする請求項2〜4のいずれかに記載の収音装置。
  6. 前記レベル調整係数制御手段は、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態から目的エリア音含有判定状態に変化した場合、前記第2の時間分過去に遡って出力する前記レベル調整係数を前記第2の値から前記第1の値に変化させる制御処理を開始させることを特徴とする請求項2に記載の収音装置。
  7. 前記目的エリア音判定手段は、出力する判定結果が目的エリア音非含有判定状態から目的エリア音含有判定状態に切り替わった後、所定期間の間出力する判定結果を目的エリア音非含有判定状態に変更させないハングオーバ機能に対応しており、
    前記レベル調整係数制御手段は、前記目的エリア音判定手段が出力する判定結果が目的エリア音非含有判定状態から目的エリア音含有判定状態に切り替わった後、前記所定期間が経過する前に、前記入力信号と目的エリア音の振幅スペクトルに基づく判定結果が目的エリア音非含有判定状態となるハングオーバ状態となると、出力する前記レベル調整係数を前記第1の値から前記第2の値に向けて変化させる制御処理を開始する
    ことを特徴とする請求項2に記載の収音装置。
  8. コンピュータを、
    複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
    前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかの判定結果を出力する目的エリア音判定手段と、
    前記目的エリア音判定手段が出力した判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定して出力する混合レベル調整手段と、
    前記混合レベル調整手段が出力した前記レベル調整係数を取得し、取得した前記レベル調整係数の変化を制御する制御処理を行って出力するものであって、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態から目的エリア音非含有判定状態に変化したことに伴い、前記混合レベル調整手段が出力する前記レベル調整係数が第1の値から第2の値に変化した場合、出力する前記レベル調整係数を第1の時間かけて所定の変化パターンで前記第1の値から前記第2の値に変化させる制御処理を行うレベル調整係数制御手段と、
    前記混合用信号のレベルを、前記レベル調整係数制御手段から出力された前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と
    して機能させることを特徴とする収音プログラム。
  9. 収音方法において、
    指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、レベル調整係数制御手段、及び混合手段を有し、
    前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、
    前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、
    前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかの判定結果を出力し、
    前記混合レベル調整手段は、前記目的エリア音判定手段が出力した判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定して出力し、
    前記レベル調整係数制御手段は、前記混合レベル調整手段が出力した前記レベル調整係数を取得し、取得した前記レベル調整係数の変化を制御する制御処理を行って出力するものであって、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態から目的エリア音非含有判定状態に変化したことに伴い、前記混合レベル調整手段が出力する前記レベル調整係数が第1の値から第2の値に変化した場合、出力する前記レベル調整係数を第1の時間かけて所定の変化パターンで前記第1の値から前記第2の値に変化させる制御処理を行い、
    前記混合手段は、前記混合用信号のレベルを、前記レベル調整係数制御手段から出力された前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する
    ことを特徴とする収音方法。
JP2019066528A 2019-03-29 2019-03-29 収音装置、収音プログラム及び収音方法 Active JP6729744B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019066528A JP6729744B1 (ja) 2019-03-29 2019-03-29 収音装置、収音プログラム及び収音方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019066528A JP6729744B1 (ja) 2019-03-29 2019-03-29 収音装置、収音プログラム及び収音方法

Publications (2)

Publication Number Publication Date
JP6729744B1 true JP6729744B1 (ja) 2020-07-22
JP2020167530A JP2020167530A (ja) 2020-10-08

Family

ID=71663938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019066528A Active JP6729744B1 (ja) 2019-03-29 2019-03-29 収音装置、収音プログラム及び収音方法

Country Status (1)

Country Link
JP (1) JP6729744B1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5482854B2 (ja) * 2012-09-28 2014-05-07 沖電気工業株式会社 収音装置及びプログラム
JP5488679B1 (ja) * 2012-12-04 2014-05-14 沖電気工業株式会社 マイクロホンアレイ選択装置、マイクロホンアレイ選択プログラム及び収音装置
JP6107151B2 (ja) * 2013-01-15 2017-04-05 富士通株式会社 雑音抑圧装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2020167530A (ja) 2020-10-08

Similar Documents

Publication Publication Date Title
JP6065030B2 (ja) 収音装置、プログラム及び方法
JP6187626B1 (ja) 収音装置及びプログラム
JP6065028B2 (ja) 収音装置、プログラム及び方法
US9781508B2 (en) Sound pickup device, program recorded medium, and method
JP5772151B2 (ja) 音源分離装置、プログラム及び方法
JP6540730B2 (ja) 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法
US10085087B2 (en) Sound pick-up device, program, and method
JP6436180B2 (ja) 収音装置、プログラム及び方法
JP6729744B1 (ja) 収音装置、収音プログラム及び収音方法
JP2016163135A (ja) 収音装置、プログラム及び方法
JP2019068133A (ja) 収音装置、プログラム及び方法
US11095979B2 (en) Sound pick-up apparatus, recording medium, and sound pick-up method
JP6725014B1 (ja) 収音装置、収音プログラム及び収音方法
JP6065029B2 (ja) 収音装置、プログラム及び方法
JP6624256B1 (ja) 収音装置、プログラム及び方法
JP6879340B2 (ja) 収音装置、収音プログラム、及び収音方法
JP7380783B1 (ja) 収音装置、収音プログラム、収音方法、判定装置、判定プログラム及び判定方法
JP7158976B2 (ja) 収音装置、収音プログラム及び収音方法
JP6624255B1 (ja) 収音装置、プログラム及び方法
JP6885483B1 (ja) 収音装置、収音プログラム及び収音方法
JP7404657B2 (ja) 音声認識装置、音声認識プログラム、及び音声認識方法
JP6923025B1 (ja) 収音装置、プログラム及び方法
JP6669219B2 (ja) 収音装置、プログラム及び方法
JP2024027617A (ja) 音声認識装置、音声認識プログラム、音声認識方法、収音装置、収音プログラム及び収音方法
JP6785166B2 (ja) 音声信号補償装置、音声信号補償方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200615

R150 Certificate of patent or registration of utility model

Ref document number: 6729744

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150