JP2017022468A - 収音装置、プログラム及び方法 - Google Patents
収音装置、プログラム及び方法 Download PDFInfo
- Publication number
- JP2017022468A JP2017022468A JP2015136455A JP2015136455A JP2017022468A JP 2017022468 A JP2017022468 A JP 2017022468A JP 2015136455 A JP2015136455 A JP 2015136455A JP 2015136455 A JP2015136455 A JP 2015136455A JP 2017022468 A JP2017022468 A JP 2017022468A
- Authority
- JP
- Japan
- Prior art keywords
- target area
- sound
- area sound
- component
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000003491 array Methods 0.000 claims abstract description 53
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000000605 extraction Methods 0.000 claims description 32
- 238000001228 spectrum Methods 0.000 claims description 15
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 230000005236 sound signal Effects 0.000 claims description 8
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 238000009408 flooring Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【課題】反響の強い環境下においても、目的エリア音成分の歪みを抑え、かつ目的エリア音以外の成分を抑圧することができるようにする。
【解決手段】本発明に係る収音装置は、複数のマイクロホンアレイの各入力信号に対して、目的エリアの方向に指向性を形成し、遅延補正後の各信号を用いて非目的エリア音を抑圧し、目的エリア音を抽出する。その出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更にマイクロホンアレイ毎の各信号から算出したパワー比を利用して目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更し、マイクロホンアレイにより収音された音響信号に、エリア収音フィルタをかけて目的エリア音以外の成分を抑圧して目的エリア音を強調する。
【選択図】 図1
【解決手段】本発明に係る収音装置は、複数のマイクロホンアレイの各入力信号に対して、目的エリアの方向に指向性を形成し、遅延補正後の各信号を用いて非目的エリア音を抑圧し、目的エリア音を抽出する。その出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更にマイクロホンアレイ毎の各信号から算出したパワー比を利用して目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更し、マイクロホンアレイにより収音された音響信号に、エリア収音フィルタをかけて目的エリア音以外の成分を抑圧して目的エリア音を強調する。
【選択図】 図1
Description
本発明は、収音装置、プログラム及び方法に関し、複数の音源が存在する環境下において、特定の方向の音を音源のみを強調し収音する収音装置に適用し得るものである。
複数の音源が存在する環境下において、ある特定の方向の音のみ強調し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下、「BF」と呼ぶ。)がある。BFとは、複数のマイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。
BFは、加算型と減算型の大きく2つの種類に分けられる。特に、減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。
図3は、従来の減算型BFを採用した収音装置PSの構成を示すブロック図である。図3において、収音装置PSは、2個のマイクロホンを備える場合を例示する。
目的の方向に存在する音(以下、「目的音」と呼ぶ。)が各マイクロホンM1及びM2に到来すると、遅延器DELは、マイクロホンM1及びM2により到来した信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。時間差は、下記式(1)により算出される。
τi=(dsinθL)/c …(1)
τi=(dsinθL)/c …(1)
(1)式において、dはマイクロホンM1及びM2の間の距離、Cは音速、τiは遅延量(時間差)である。また、θLは、各マイクロホンM1及びM2を結んだ直線に対する垂直方向から目的方向への角度である。
ここで、死角は、マイクロホンM1及びM2の中心に対し、マイクロホンM1の方向に存在する場合、マイクロホンM1の入力信号x1(t)に対し遅延処理を行う。その後、減算器SUBは、(2)式に従って減算処理を行う。
a(t)=x2(t)−x1(t−τL) …(2)
a(t)=x2(t)−x1(t−τL) …(2)
減算処理は、周波数領域でも同様に行うことができる。その場合、(2)式は以下のように変更される。
A(ω)=X2(ω)−e−jωτLX1(ω) …(3)
A(ω)=X2(ω)−e−jωτLX1(ω) …(3)
ここで、θL=±π/2の場合、マイクロホンM1及びM2により形成される指向性は、図4(A)に示すように、カージオイド型の単一指向性となる。一方、θL=0,πの場合、マイクロホンM1及びM2により形成される指向性は、図4(B)のような8の字型の双指向性となる。以下では、入力信号から単一指向性を形成するフィルタを単一指向性フィルタと呼称し、双指向性を形成するフィルタを双指向性フィルタと呼称する。
減算器SUBは、スペクトル減算法(Spectral Subtraction;以下「SS」と呼ぶ。)を用いることで、双指向性の死角に強い指向性を形成することもできる。
減算器SUBは、SSによる指向性の形成を(4)式に従って行う。(4)式では、マイクロホンM1の入力信号X1を用いている。なお、マイクロホンM2の入力信号X2を用いる場合も、同様の効果を得ることができる。ここで、βは、SSの強度を調節するための係数である。減算時に値がマイナスになった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行う。この方式は、双指向性フィルタにより目的方向以外に存在する音(以下、「非目的音」と呼ぶ。)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
|Y(ω)|=|X1(ω)|−β|A(ω)| …(4)
|Y(ω)|=|X1(ω)|−β|A(ω)| …(4)
上記の減算型BFを用いれば、目的音方向に鋭い指向性を形成することができる。
しかしながら、ある特定のエリア内に存在する音(以下、「目的エリア音」と呼ぶ。)だけを収音したい場合、減算型BFの指向性は直線的である。そのため、目的エリアと同じ方向に存在する音源(以下、「非目的エリア音」と呼ぶ。)も収音してしまう問題がある。
特許文献1では、複数のマイクロホンアレイMA1及びMA2を用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する手法を提案している。
浅野太著,"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−",日本音響学会編,コロナ社,2011年2月25日発行
しかしながら、特許文献1の記載技術は、マイクロホンアレイによるBF出力と、目的エリア音成分の抽出の2回に亘ってスペクトル減算を行っているため、出力された目的音が歪んでしまう可能性がある。
また、反響の強い環境下で、目的エリア音を収音する際、非目的エリア音の成分が十分に抑圧されずに残ってしまうという問題も生じ得る。例えば、反響がある場合、マイクロホンアレイの一方のBF出力に含まれる非目的エリア音が、壁等により反射して、もう一方のマイクロホンアレイのBF出力に含まれる可能性がある。この場合、エリア収音処理を行っても、非目的エリア音を完全に抑圧することができずに残ってしまうことがある。
そのため、エリア収音処理において、反響の強い環境下においても、目的エリア音成分の歪みを抑え、かつ目的エリア音以外の成分を抑圧することができる収音装置、方法及びプログラムが求められている。
本発明は、上記課題に鑑みたものであり、以下のような構成を備えるものである。
第1の本発明に係る収音装置は、(1)複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成する指向性形成手段と、(2)指向性形成手段からの出力に対して、目的エリアと各マイクロホンアレイの遅延と、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出する目的エリア音抽出手段と、(3)目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に各マイクロホンアレイの指向性形成手段からの出力間のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更するエリア収音フィルタ形成手段と、(4)マイクロホンアレイにより収音された音響信号に、エリア収音フィルタ形成手段により形成されたエリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調するエリア音強調手段とを有することを特徴とする。
第2の本発明に係る収音プログラムは、コンピュータを、(1)複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成する指向性形成手段と、(2)指向性形成手段からの出力に対して、目的エリアと各マイクロホンアレイの遅延と、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出する目的エリア音抽出手段と、(3)目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に各マイクロホンアレイの指向性形成手段からの出力間の各信号のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更するエリア収音フィルタ形成手段と、(4)マイクロホンアレイにより収音された音響信号に、エリア収音フィルタ形成手段により形成されたエリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調するエリア音強調手段として機能させることを特徴とする。
第3の本発明に係る収音方法は、(1)指向性形成手段が、複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成し、(2)目的エリア音抽出手段が、指向性形成手段からの出力に対して、目的エリアと各マイクロホンアレイの遅延と、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出し、(3)エリア収音形成手段が、目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に各マイクロホンアレイの指向性形成手段からの出力間の各信号のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更し、(4)エリア音強調手段が、マイクロホンアレイにより収音された音響信号に、エリア収音フィルタ形成手段により形成されたエリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調することを特徴とする。
以上のように、本発明によれば、エリア収音処理において、複数のマイクロホンアレイのそれぞれのビームフォーマ出力の比を利用してフィルタを形成することで、反響が強い環境下においても、目的エリア音成分の歪を抑え、かつ目的エリア音以外の成分を抑圧することができる。
(A)本発明の基本的な概念
特許文献1に記載の手法は、後述する(7)式、(8)式に従い演算することで、目的とするエリアの周囲に非目的エリア音が存在していても、目的エリア音を収音することができる。
特許文献1に記載の手法は、後述する(7)式、(8)式に従い演算することで、目的とするエリアの周囲に非目的エリア音が存在していても、目的エリア音を収音することができる。
しかし、(4)式に従ったマイクロホンアレイMA1、MA2のBF出力と、(8)式に従った目的エリア音成分の抽出とにおいて、2回のスペクトル減算(SS)を行っている。そのため、出力された目的エリア音が歪んでしまう可能性がある。
さらに、反響が強い環境下では、非目的エリア音が十分に抑圧されずに残ってしまう問題がある。
図5は、反響がない環境下におけるエリア収音処理における各成分の振幅スペクトルの変化を示した図である。
図5(A)に示すように、マイクロホンアレイMA1のBF出力Y1には、目的エリア音と目的エリア方向に存在する非目的エリア音N1とが含まれている。また、マイクロホンアレイ2のBF出力Y2には、目的エリア音と非目的エリア音N2とが含まれている。
目的エリア音抽出部6は、N1を抽出するために、(7)式に従い、BF出力Y1から、BF出力Y2に補正係数α1を掛けたものをSSする。これにより、BF出力Y1とBF出力Y2とに共通に含まれる目的エリア音が抑圧され、BF出力Y1に含まれる非目的エリア音N1が残ることになる(図5(A)参照)。この際、BF出力Y2に含まれている非目的エリア音N2は、BF出力Y1に含まれない。そのため、SSを行うと、その成分(非目的エリア音N2)は値がマイナスになるが、フロアリング処理を行うため影響はない。
その後、目的エリア音抽出部6は、(8)式に従い、BF出力Y1から非目的エリア音N1をSSすると、非目的エリア音N1が全て抑圧され、目的エリア音のみを抽出できる(図5(B)参照)。なお、(8)式において、γ1はSS時の強度を変更するための係数である。
しかし、図6に示すように、反響があると、一方のBF出力に含まれる非目的エリア音が、壁に反射にしてもう一方のBF出力に含まれる可能性がある。
図7は、マイクロホンアレイMA1のBF出力Y1に非目的エリア音(直接音)が含まれ、マイクロホンアレイMA2のBF出力Y2に非目的エリア音(反射音)が含まれる場合のエリア収音処理における各成分の振幅スペクトルの変化を示した図である。
図7の場合、図5の場合と異なり、BF出力Y2に、非目的エリア音N1の反射音N1´が含まれている。そのため、BF出力Y1からBF出力Y2をSSすると、目的エリア音だけでなく非目的エリア音N1も抑圧されてしまい、抽出した非目的エリア音N1”は、本来の非目的エリア音N1よりもパワーが小さくなる(図7(A)参照)。
そのため、BF出力Y1から非目的エリア音N1”をSSしても、BF出力Y1に含まれる非目的エリア音N1を全て抑圧することができず、目的エリア音出力Z1に、非目的エリア音N1が残ってしまうことになる(図7(B)参照)。
これらの問題に対して、本願発明者は、SSの出力を、目的音としてそのまま出力するのではなく、SSの出力をもとにフィルタを形成し、入力信号にそのフィルタをかけることで目的音の歪を低減させる手法を提案している(参考文献;特願2015−38628号)。
上記参考文献に記載の手法では、まずSSにより抽出された成分の内、パワーが閾値以下の成分は非目的音であると判定し値を0とし、それ以外の成分を1とするフィルタを形成する。さらに、SS出力のパワーを入力信号のパワーで割り、別の閾値と比較し、それ以下の成分のフィルタの値を0に変更する。最後に、このフィルタを入力信号に掛けることで、目的音成分に影響を与えずに非目的音成分のみ抑圧する。
上記参考文献に記載の手法をエリア収音処理に適用すれば、SSによる目的エリア音成分の劣化を防ぐことができる。また、反響が原因で非目的エリア音が残ってしまう問題に対しても、フィルタの形成時にSS出力のパワーと入力信号のパワーの比を利用しているため、残った非目的エリア成分を抑圧することができる。
図7に示す状況において、目的エリア音出力Z1とY1のパワー比を求めると、目的エリア音成分は1に近くなる。また、非目的エリア音は残っているとはいえ抑圧されているので1よりも小さい値となる。この差異を利用し、フィルタを形成することで、反響が強い環境下にも対応することができる。
しかしながら、エリア収音処理においては、図7に示す状況だけではなく、図8に示すようなマイクロホンアレイMA1のBF出力Y1に、直接音ではなく反射音が含まれる状況も考えられる。
図8は、マイクロホンアレイ1のBF出力に非目的エリア音(反射音)、マイクロホンアレイ2のBF出力に非目的エリア音(直接音)が含まれる場合のエリア収音処理における各成分の振幅スペクトルの変化を示した図である。
このような状況では、BF出力Y1には非目的エリア音N1だけでなく、非目的エリアN2の反射音である非目的エリア音N2´も含まれている。
非目的エリア音を抽出するために、BF出力Y1からBF出力Y2をSSしても、非目的エリア音N1を抽出することはできるが、BF出力Y2に含まれる非目的エリア音N2の方が、非目的エリア音N2´よりもパワーが大きいため、全て抑圧されてしまい抽出できない(図8(A)参照)。
その後、BF出力Y1から非目的エリア音N1をSSしても、非目的エリアN1は抑圧できるが、非目的エリア音N2´はそのまま残ってしまうことになる(図8(B)参照)。
そのため、このような状況で、目的エリア音出力Z1とBF出力Y1のパワー比を求めても、目的エリア音出力Z1とBF出力Y1に含まれる非目的エリア音N2´のパワーは同じであるため、パワー比は「1」に近くなり、目的エリア音成分と区別がつかず、非目的エリア音N2´を抑圧するフィルタを形成することができない。
そこで、本発明の第1の実施形態では、フィルタを形成する際、入力と出力の信号のパワー比ではなく、各マイクロホンアレイのBF出力のパワー比を用いる。
通常、各BF出力に含まれる非目的エリア音成分が、直接音か反射音かを判断することは難しい。しかし、反射音は直接音よりもパワーが小さいため、各BF出力の比を求めると「1」よりも小さい、もしくは大きい値になると予想される。
また、目的エリア音成分は、各BF出力に同じ大きさで含まれているため、比は1に近くなる。この違いを利用することで、反響が強い環境下においても目的エリア音のみ強調できるフィルタを形成することが可能となる。
(B)第1の実施形態
以下では、本発明の収音装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳細に説明する。
以下では、本発明の収音装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳細に説明する。
(B−1)第1の実施形態の構成
図1は、第1の実施形態に係る収音装置の内部構成を示すブロック図である。
図1は、第1の実施形態に係る収音装置の内部構成を示すブロック図である。
第1の実施形態に係る収音装置100は、2個のマイクロホンアレイMA1及びMA2を用いて、目的エリアの音源からの目的エリア音を収音するものである。
マイクロホンアレイMA1及びMA2は、少なくとも2個以上のマイクロホンを有する。図1では、マイクロホンアレイMA1が、3個のマイクロホンM1〜M3を有する場合を例示する。マイクロホンアレイMA1は、マイクロホンM1、M2を目的エリアの方向に対して水平となるように配置する。さらに、マイクロホンM1、M2を結んだ直線と直交し、かついずれかのマイクロホンM1、M2を取る直線上にマイクロホンM3が配置されている。すなわち、3個のマイクロホンM1、M2、M3は、直角二等辺三角形の頂点に配置されている場合を例示する。なお、この実施形態では、マイクロホンアレイMA2もマイクロホンアレイMA1と同様の構成を有するものとする。
マイクロホンアレイMA1及びMA2は、目的エリアが存在する空間の任意の場所に設けられたものである。目的エリアに対するマイクロホンアレイMA1及びMA2の位置は、各マイクロホンアレイMA1及びMA2の指向性が目的エリアでのみ重なるのであれば、特に限定されるものではない。例えば、目的エリアに対して、マイクロホンアレイMA1とマイクロホンアレイMA2の指向性が交差するように、マイクロホンアレイMA1及びMA2を配置するようにしても良い。また例えば、目的エリアを挟んで、マイクロホンアレイMA1及びMA2が対向するように、マイクロホンアレイMA1及びMA2を配置するようにしても良い。
なお、マイクロホンアレイの数は、2個に限定されるものではなく、複数の目的エリアが存在する場合、全てのエリアをカバーできる数のマイクロホンアレイを配置するようにしても良い。
図1において、第1の実施形態に係る収音装置100は、信号入力部1−1、信号入力部1−2、指向性形成部2−1、指向性形成部2−2、遅延補正部3、空間座標データ記憶部4、目的エリア音パワー補正係数算出部5、目的エリア音抽出部6、エリア収音フィルタ形成部7、エリア音強調部8を有する。収音装置100を構成する各構成要素の詳細な説明は、後述する。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成されるものであっても良いし、一部又は全部についてソフトウェア(プログラム等)として構成されるものでも良い。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータに、第1の実施形態の収音プログラムをインストールすることにより構築されるものでも良い。
(B−2)第1の実施形態の動作
次に、第1の実施形態に係る収音装置100における収音処理の動作を、図面を参照しながら詳細に説明する。
次に、第1の実施形態に係る収音装置100における収音処理の動作を、図面を参照しながら詳細に説明する。
マイクロホンアレイMA1、MA2はそれぞれ、3個のマイクロホンM1、M2、M3により音響信号を収音する。マイクロホンアレイMA1により収音された音響信号は信号入力部1−1に与えられる。また、マイクロホンアレイMA2により収音された音響信号は信号入力部1−2に与えられる。
信号入力部1−1と1−2はそれぞれ、マイクロホンアレイMA1とMA2からの音響信号をアナログ信号からデジタル信号に変換して入力する。その後、信号入力部1−1と1−2は、例えば高速フーリエ変換等を用いて、マイクロホンアレイMA1とMA2からの入力信号を時間領域から周波数領域に変換し、指向性形成部2−1と2−2に与える。
指向性形成部2−1と2−2はそれぞれ、ビームフォーマ(BF)により、マイクロホンアレイMA1及びMA2からの信号の指向性を形成する。この実施形態では、指向性形成部2−1と2−2は、(4)式に従ったBFにより、マイクロホンアレイMA1及びMA2毎に、目的エリア方向に対し、マイクロホンアレイMA1とMA2の前方に指向性を形成する。
例えば、指向性形成部2−1と2−2は、目的エリアに対して直交する線上に並んで配置されたマイクロホンM1、M2で双指向性フィルタを形成し、目的方向に並行する線上に並んで配置されたマイクロホンM2、M3で目的方向に死角を向ける単一指向性フィルタを形成する。具体的には、指向性形成部2−1と2−2は、マイクロホンM1,M2の出力信号について、θL=0とし、(1)式及び(3)式に従った演算を行ない、(4)式に従って双指向性フィルタを形成する。また、指向性形成部2−1と2−2は、マイクロホンM2、M3の出力信号について、θL=−π/2とし、(1)式及び(3)式に従った演算を行ない、(4)式に従って単一指向性フィルタを形成する。
指向性形成部2−1と2−2では、BFにより、各マイクロホンアレイMA1、MA2の指向性が前方にのみ形成されるため、後方(マイクロホンアレイから見て目的エリアと逆方向)から回り込む残響の影響を抑えることができる。また、指向性形成部2−1と2−2では、それぞれのBFにより、各マイクロホンアレイMA1、MA2の後方に位置する非目的エリア音を予め抑圧し、目的エリアの収音処理のSN比を改善することができる。
空間座標データ記憶部4は、全ての目的エリアの位置情報(すなわち、目的エリアの範囲を示す位置情報)と、各マイクロホンアレイMA1、MA2の位置情報と、各マイクロホンアレイMA1、MA2を構成するマイクロホンM1〜M3の位置情報を保持する。空間座標データ記憶部4で記憶される位置情報の具体的な形式や表示単位は、目的エリア、各マイクロホンアレイMA1、MA2との間の相対的な位置関係が認識可能な形式であれば限定されない。
遅延補正部3は、目的エリアと各マイクロホンアレイの距離の違いにより発生する遅延を算出し、補正するものである。
遅延補正部3は、まず空間座標データ記憶部4から目的エリアの位置情報とマイクロホンアレイMA1、MA2の位置情報を取得し、各マイクロホンアレイMA1、MA2への目的エリア音の到達時間の差を算出する。次に、遅延補正部3は、最も目的エリアから遠い位置に配置されたマイクロホンアレイMA1、MA2を基準として、全てのマイクロホンアレイMA1、MA2に目的エリア音が同時に到達するように遅延(遅延時間差)を加えて位相を一致させる。
目的エリア音パワー補正係数算出部5は、各BF出力に含まれる目的エリア音成分のパワーを同じにするための補正係数(「パワー補正係数)とも呼ぶ。)を(5)式または(6)式に従い算出するものである。
ここで、(5)式、(6)式において、Y1kとY2kはマイクロホンアレイMA1とMA2のBF出力の振幅スペクトル、Nは周波数ビンの総数、kは周波数、α1は各BF出力に対するパワー補正係数である。また、modeは最頻値、medianは中央値を表している。
目的エリア音抽出部6は、目的エリア音パワー補正係数算出部5で算出した補正係数を用いて各BF出力を補正する。次に、目的エリア音抽出部6は、補正係数で補正した各BF出力を用いて、(7)式に従いスペクトル減算法(SS)し、目的エリア方向に存在する雑音(すなわち、非目的エリア音)を抽出する。さらに、目的エリア音抽出部6は、抽出した雑音を各BF出力から、(8)式に従いSSすることにより目的エリア音を抽出する。
N1=Y1−α1Y2 …(7)
Z1=Y1−γ1N1 …(8)
N1=Y1−α1Y2 …(7)
Z1=Y1−γ1N1 …(8)
エリア収音フィルタ形成部7は、目的エリア音抽出部6の出力信号を推定目的エリア成分とし、各成分のパワーと閾値とを比較し、その比較結果に基づいてエリア収音フィルタを形成するものである。
具体的に、エリア収音フィルタ形成部7は、目的エリア音抽出部6の出力Z1を推定目的エリア成分とし、各成分のパワーと閾値T1とを比較する。そして、エリア収音フィルタ形成部7は、閾値T1よりも小さい成分を「0」、それ以外の成分を「1」とするエリア収音フィルタH1を形成するものである。ここで、kは周波数である。
さらに、エリア収音フィルタ形成部7は、(10)式に従い、各BF出力の比Pを算出する。各BF出力Y1kとY2kとの比Pkを(10)式により算出することで、非目的エリア音成分が直接音、反射音に関係なく判定することが可能となる。
次に、エリア収音フィルタ形成部7は、(10)式で算出した各BF出力の比Pと別の閾値T2とを比較する。そして、閾値T2よりも大きい成分のフィルタ値を0に変更する。なお、エリア収音フィルタ形成部7は、目的エリア音以外の成分のフィルタ値は「0」でなく、「0から1までの間の任意の値」に設定しても良い。
Pkの値は、目的エリア音成分であれば、「0」に近くなり、値が大きくなるほど非目的エリア音である可能性が高くなる。そこで、例えば閾値T2を「0.5」と設定して、H1の値が「1」である成分の内、PkがT2よりも大きな値の成分を「0」に変更し、エリア収音フィルタH1の値を更新する((11)式)。
エリア音強調部8は、(12)式に従い、信号入力部1−1の入力信号X1に対して、エリア収音フィルタ形成部7で形成したエリア収音フィルタH1をかけ、目的エリア音以外の成分を抑圧し、目的エリア音を強調する。
ここで、フィルタH1の値は、「0」と「1」の2値でなくても良く、「0から1までの間の任意の値」を設定し、SN比を操作することもできる。例えば、目的エリア音以外の成分を20dB抑圧する設定にすれば、非目的エリア音を完全に抑圧せずに環境音の一部として残すことになる。
(B−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、エリア収音処理において、複数のマイクロホンアレイのそれぞれのBF出力の比を利用してフィルタを形成することで、反響が強い環境下においても、目的エリア音成分の歪を抑え、かつ目的エリア音以外の成分を抑圧することができる。
以上のように、第1の実施形態によれば、エリア収音処理において、複数のマイクロホンアレイのそれぞれのBF出力の比を利用してフィルタを形成することで、反響が強い環境下においても、目的エリア音成分の歪を抑え、かつ目的エリア音以外の成分を抑圧することができる。
(C)第2の実施形態
次に、本発明に係る収音装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳細に説明する。
次に、本発明に係る収音装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳細に説明する。
(C−1)第2の実施形態の構成
図2は、第2の実施形態に係る収音装置100Aの内部構成を示すブロック図である。
図2は、第2の実施形態に係る収音装置100Aの内部構成を示すブロック図である。
第2の実施形態の収音装置100Aも、第1の実施形態と同様に、2個のマイクロホンアレイMA1、MA2を用いて、目的エリアの音源からの目的エリア音を収音するものである。
図2において、収音装置100Aは、第1の実施形態で説明した、信号入力部1−1、信号入力部1−2、指向性形成部2−1、指向性形成部2−2、遅延補正部3、空間座標データ記憶部4、目的エリア音パワー補正係数算出部5、目的エリア音抽出部6、エリア収音フィルタ形成部7、エリア音強調部8に加えて、SSフィルタ形成部9−1、SSフィルタ形成部9−2、目的音強調部10−1、目的音強調部10−2を有する。
第2の実施形態は、第1の実施形態で説明した処理において、各マイクロホンアレイMA1、MA2からの入力信号をBFにより指向性を形成する際に、SSの出力をもとに目的音成分以外を抑圧するフィルタを形成し、入力信号にそのフィルタを掛け、目的音を強調する機能を追加したものである。
また、エリア音強調部8は、信号入力部1−1の出力ではなく、遅延補正部3の出力を受け取るように変更されている。
(C−2)第2の実施形態の動作
次に、第2の実施形態に係る収音装置100における収音処理の動作を、図面を参照しながら詳細に説明する。
次に、第2の実施形態に係る収音装置100における収音処理の動作を、図面を参照しながら詳細に説明する。
マイクロホンアレイMA1により収音された音響信号は信号入力部1−1に与えられる。また、マイクロホンアレイMA2により収音された音響信号は信号入力部1−2に与えられる。
信号入力部1−1と1−2はそれぞれ、マイクロホンアレイMA1とMA2からの音響信号をアナログ信号からデジタル信号に変換して入力する。その後、信号入力部1−1と1−2は、例えば高速フーリエ変換等を用いて、マイクロホンアレイMA1とMA2からの入力信号を時間領域から周波数領域に変換し、指向性形成部2−1と2−2、目的音強調部10−1と10−2に与える。
指向性形成部2−1と2−2はそれぞれ、第1の実施形態と同様にして、(4)式に従ったBFにより、マイクロホンアレイMA1及びMA2毎に、目的エリア方向に対し、マイクロホンアレイMA1とMA2の前方に指向性を形成する。
SSフィルタ形成部9−1と9−2は、それぞれ指向性形成部2−1、2−2の出力をもとにフィルタH21とH22を形成する。ここで、フィルタH21、H22は、パワーが閾値T3以上の成分を目的音であると判定し、目的音成分を「1」、それ以外の成分を「0」に設定する。なお、目的音以外の成分のフィルタの値は「0」でなく「0から1の間で任意の値」を設定しても良い。
その後、SSフィルタ形成部9−1と9−2は、指向性形成部2−1と2−2からの出力と入力信号とのパワー比R1kとR2kを利用して、フィルタの値を補正する。パワー比R1kとR2kは、周波数毎に(13)、(14)式に従い算出する。ここで、Y1kとY2kはそれぞれ指向性形成部2−1、2−2の出力のk番目の周波数のパワー、X1kとX2kはそれぞれ信号入力部1−1、1−2の出力のk番目の周波数のパワーである。例えば、R1k、R2kが闘値T4以下で、かつパワーが閾値T3を超えている成分は、非目的音成分と判定し、フィルタの値を「1」から「0」に変更する。
目的音強調部10−1、10−2はそれぞれ、信号入力部1−1、1−2の出力に、SSフィルタ形成部9−1、9−2で形成したフィルタをかけ、非目的音成分を抑圧し、目的音を強調する((15)、(16)式)。ここでX1とX2は、信号入力部1−1、1−2の出力のパワーである。
遅延補正部3は、まず空間座標データ記憶部4から目的エリアの位置情報とマイクロホンアレイMA1、MA2の位置情報を取得し、各マイクロホンアレイMA1、MA2への目的エリア音の到達時間の差を算出する。
次に、遅延補正部3は、最も目的エリアから遠い位置に配置されたマイクロホンアレイMA1、MA2を基準として、目的音強調部10−1、10−2により目的音が強調された各出力を用いて、全てのマイクロホンアレイMA1、MA2に目的エリア音が同時に到達するように遅延(遅延時間差)を加えて位相を一致させる。
目的エリア音パワー補正係数算出部5は、第1の実施形態と同様にして、目的音強調部10−1、10−2からの各出力に含まれる目的エリア音成分のパワーを同じにするための補正係数を(5)式または(6)式に従い算出するものである。
目的エリア音抽出部6は、目的エリア音パワー補正係数算出部5で算出した補正係数を用いて、目的音強調部10−1、10−2の各出力を補正する。次に、目的エリア音抽出部6は、補正係数で補正した各出力を用いて、(7)式に従いスペクトル減算法(SS)し、目的エリア方向に存在する雑音(すなわち、非目的エリア音)を抽出する。さらに、目的エリア音抽出部6は、抽出した雑音を各BF出力から、(8)式に従いSSすることにより目的エリア音を抽出する。
エリア収音フィルタ形成部7は、目的エリア音抽出部6の出力信号を推定目的エリア成分とし、各成分のパワーと閾値とを比較し、その比較結果に基づいてエリア収音フィルタを形成するものである。
エリア音強調部8は、遅延補正部3からの出力信号に対して、エリア収音フィルタ形成部7で形成したエリア収音フィルタH1をかけ、目的エリア音以外の成分を抑圧し、目的エリア音を強調する。
(C−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、各マイクロホンアレイからの入力信号をBFにより指向性を形成する際に、SSの出力をもとに目的音成分以外を抑圧するフィルタを形成し、入力信号にそのフィルタを掛けて、目的音を強調するものである。この場合でも、第2の実施形態によれば、第1の実施形態と同様の効果を奏する。
以上のように、第2の実施形態によれば、各マイクロホンアレイからの入力信号をBFにより指向性を形成する際に、SSの出力をもとに目的音成分以外を抑圧するフィルタを形成し、入力信号にそのフィルタを掛けて、目的音を強調するものである。この場合でも、第2の実施形態によれば、第1の実施形態と同様の効果を奏する。
(D)他の実施形態
本発明は、上述した各実施形態に限定されるものではなく、以下に例示するような変形実施形態にも適用できる。
本発明は、上述した各実施形態に限定されるものではなく、以下に例示するような変形実施形態にも適用できる。
(D−1)上述した各実施形態では、マイクロホンが捕捉して得た音響信号をリアルタイムに処理するものを示したが、マイクロホンが捕捉して得た音響信号を記録媒体に記憶し、その後、記憶媒体から読み出して処理して目的音、目的エリア音の強調信号を得るようにしても良い。このように記録媒体を利用する場合には、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良い。同様に、リアルタイム処理をする場合でも、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良く、通信により信号を遠隔地に供給するようにしても良い。
(D−2)上述した各実施形態では、エリア収音フィルタ形成部が、(10)式に従いフィルタの値を変更する場合を例示した。(10)式では、Pk=(1−Y2K/Y1K)を算出する場合を例示したが、(10)式に限定されるものではなく、各信号Y2K/Y1kに応じて、フィルタの値を変更するようにしても良い。
100、100A…収音装置、MA1、MA2…マイクロホンアレイ、1(1−1、1−2)…信号入力部、2(2−1、2−2)…指向性形成部、3…遅延補正部、4…空間座標エータ記憶部、5…目的エリア音パワー補正係数、6…目的エリア音抽出部、7…エリア収音フィルタ形成部、8…エリア音強調部、9(9−1、10−2)…SSフィルタ形成部、10(10−1、10−2)…目的音強調部。
第1の本発明に係る収音装置は、(1)複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成する指向性形成手段と、(2)指向性形成手段からの出力に対して、目的エリアと各マイクロホンアレイの遅延とに基づいて、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出する目的エリア音抽出手段と、(3)目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に各マイクロホンアレイの指向性形成手段からの出力間のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更するエリア収音フィルタ形成手段と、(4)マイクロホンアレイにより収音された音響信号に、エリア収音フィルタ形成手段により形成されたエリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調するエリア音強調手段とを有することを特徴とする。
第2の本発明に係る収音プログラムは、コンピュータを、(1)複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成する指向性形成手段と、(2)指向性形成手段からの出力に対して、目的エリアと各マイクロホンアレイの遅延とに基づいて、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出する目的エリア音抽出手段と、(3)目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に各マイクロホンアレイの指向性形成手段からの出力間の各信号のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更するエリア収音フィルタ形成手段と、(4)マイクロホンアレイにより収音された音響信号に、エリア収音フィルタ形成手段により形成されたエリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調するエリア音強調手段として機能させることを特徴とする。
第3の本発明に係る収音方法は、(1)指向性形成手段が、複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成し、(2)目的エリア音抽出手段が、指向性形成手段からの出力に対して、目的エリアと各マイクロホンアレイの遅延とに基づいて、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出し、(3)エリア収音フィルタ形成手段が、目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に各マイクロホンアレイの指向性形成手段からの出力間の各信号のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定してエリア収音フィルタの値を変更し、(4)エリア音強調手段が、マイクロホンアレイにより収音された音響信号に、エリア収音フィルタ形成手段により形成されたエリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調することを特徴とする。
Claims (6)
- 複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成する指向性形成手段と、
上記指向性形成手段からの出力に対して、目的エリアと上記各マイクロホンアレイの遅延と、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出する目的エリア音抽出手段と、
上記目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に上記各マイクロホンアレイの上記指向性形成手段からの出力間のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定して上記エリア収音フィルタの値を変更するエリア収音フィルタ形成手段と、
上記マイクロホンアレイにより収音された音響信号に、上記エリア収音フィルタ形成手段により形成された上記エリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調するエリア音強調手段と
を有することを特徴とする収音装置。 - 上記エリア収音形成手段が、上記エリア収音フィルタの形成後、上記算出した上記各マイクロホンアレイの上記指向性形成手段からの出力間のパワー比と閾値とを比較し、閾値より大きい成分を目的音成分以外の成分と判定して上記エリア収音フィルタの値を変更することを特徴とする請求項1に記載の収音装置。
- 上記指向性形成手段が、
上記複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成する指向性形成部と、
上記指向性形成部からの各出力に基づいて、目的音以外の成分を抑圧する目的音フィルタを出力毎に形成し、更に上記指向性形成部からの各出力と上記各マイクロホンアレイの上記各入力信号とのパワー比を周波数成分毎に算出し、そのパワー比に基づいて目的音成分以外の成分を判定して上記目的音フィルタの値を変更するスペクトル減算フィルタ形成部と、
上記各マイクロホンアレイにより収音された各入力信号に、上記スペクトル減算フィルタ形成部により形成された上記目的音フィルタをかけて、目的音以外の成分を抑圧し、目的音を強調する目的音強調部と
を有することを特徴とする請求項1又は2に記載の収音装置。 - 上記目的エリア音抽出手段が、
全ての目的エリアと、上記各マイクロホンアレイと、上記マイクロホンアレイを構成するマイクロホンとの位置情報を保持する位置情報保持部と、
上記位置情報保持部に保持される位置情報を用いて、目的エリアと上記各マイクロホンアレイとの間の距離に基づいて、上記指向性形成手段からの出力に対して、目的エリアと上記各マイクロホンアレイの遅延を補正する遅延補正部と、
上記指向性形成手段からの上記マイクロホンアレイ毎の出力間で、周波数毎に、算出した振幅スペクトルの比率に基づいて、振幅スペクトルの比率の最頻値若しくは中央値を算出し、これを補正係数とする目的エリア音パワー補正係数算出部と、
上記目的エリア音パワー補正係数算出部で算出した補正係数を用い、上記指向性形成手段からの上記マイクロホンアレイ毎の各出力を補正し、それぞれをスペクトル減算することで非目的エリア音を抽出し、更に抽出した非目的エリア音を各マイクロホンアレイの指向性形成手段の出力からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出部と
を有することを特徴とする請求項1〜3のいずれかに記載の収音装置。 - コンピュータを、
複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成する指向性形成手段と、
上記指向性形成手段からの出力に対して、目的エリアと上記各マイクロホンアレイの遅延と、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出する目的エリア音抽出手段と、
上記目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に上記各マイクロホンアレイの上記指向性形成手段からの出力間のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定して上記エリア収音フィルタの値を変更するエリア収音フィルタ形成手段と、
上記マイクロホンアレイにより収音された音響信号に、上記エリア収音フィルタ形成手段により形成された上記エリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調するエリア音強調手段と
して機能させることを特徴とする収音プログラム。 - 指向性形成手段が、複数のマイクロホンアレイからの各入力信号に対して、目的エリアの方向に指向性を形成し、
目的エリア音抽出手段が、上記指向性形成手段からの出力に対して、目的エリアと上記各マイクロホンアレイの遅延と、目的エリア音成分のパワーを補正し、補正後の各出力を用いて非目的エリア音を抑圧し、目的エリア音を抽出し、
エリア収音形成手段が、上記目的エリア音抽出手段の出力から目的エリア音成分を判定し、目的エリア音成分以外の成分を抑圧するエリア収音フィルタを形成し、更に上記各マイクロホンアレイの上記指向性形成手段からの出力間のパワー比を算出し、そのパワー比に基づいて目的エリア音成分以外の成分を判定して上記エリア収音フィルタの値を変更し、
エリア音強調手段が、上記マイクロホンアレイにより収音された音響信号に、上記エリア収音フィルタ形成手段により形成された上記エリア収音フィルタをかけて目的エリア音以外の成分を抑圧し、目的エリア音を強調する
ことを特徴とする収音方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015136455A JP6131989B2 (ja) | 2015-07-07 | 2015-07-07 | 収音装置、プログラム及び方法 |
US15/158,569 US9866957B2 (en) | 2015-07-07 | 2016-05-18 | Sound collection apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015136455A JP6131989B2 (ja) | 2015-07-07 | 2015-07-07 | 収音装置、プログラム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017022468A true JP2017022468A (ja) | 2017-01-26 |
JP6131989B2 JP6131989B2 (ja) | 2017-05-24 |
Family
ID=57731747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015136455A Active JP6131989B2 (ja) | 2015-07-07 | 2015-07-07 | 収音装置、プログラム及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9866957B2 (ja) |
JP (1) | JP6131989B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018164156A (ja) * | 2017-03-24 | 2018-10-18 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP2021118461A (ja) * | 2020-01-27 | 2021-08-10 | 沖電気工業株式会社 | 収音装置、収音プログラム、及び収音方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6809467B2 (ja) * | 2015-08-24 | 2021-01-06 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN107889022B (zh) * | 2016-09-30 | 2021-03-23 | 松下电器产业株式会社 | 噪音抑制装置以及噪音抑制方法 |
JP7175096B2 (ja) * | 2018-03-28 | 2022-11-18 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
CN109545217B (zh) * | 2018-12-29 | 2022-01-04 | 深圳Tcl新技术有限公司 | 语音信号接收方法、装置、智能终端及可读存储介质 |
CN110364176A (zh) * | 2019-08-21 | 2019-10-22 | 百度在线网络技术(北京)有限公司 | 语音信号处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006006935A1 (en) * | 2004-07-08 | 2006-01-19 | Agency For Science, Technology And Research | Capturing sound from a target region |
JP2009025490A (ja) * | 2007-07-18 | 2009-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体 |
JP2013183358A (ja) * | 2012-03-02 | 2013-09-12 | Oki Electric Ind Co Ltd | 収音装置及びプログラム |
JP2014072708A (ja) * | 2012-09-28 | 2014-04-21 | Oki Electric Ind Co Ltd | 収音装置及びプログラム |
JP2014110613A (ja) * | 2012-12-04 | 2014-06-12 | Oki Electric Ind Co Ltd | マイクロホンアレイ選択装置、マイクロホンアレイ選択プログラム及び収音装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8238569B2 (en) * | 2007-10-12 | 2012-08-07 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus for extracting target sound from mixed sound |
US8861756B2 (en) * | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
JP5486694B2 (ja) * | 2010-12-21 | 2014-05-07 | 日本電信電話株式会社 | 音声強調方法、装置、プログラム、記録媒体 |
JP6206003B2 (ja) * | 2013-08-30 | 2017-10-04 | 沖電気工業株式会社 | 音源分離装置、音源分離プログラム、収音装置及び収音プログラム |
KR20170067682A (ko) * | 2014-05-26 | 2017-06-16 | 블라디미르 셔먼 | 음향 신호 수집을 위한 코드 실행가능 방법, 회로, 장치, 시스템 및 관련 컴퓨터 |
-
2015
- 2015-07-07 JP JP2015136455A patent/JP6131989B2/ja active Active
-
2016
- 2016-05-18 US US15/158,569 patent/US9866957B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006006935A1 (en) * | 2004-07-08 | 2006-01-19 | Agency For Science, Technology And Research | Capturing sound from a target region |
JP2009025490A (ja) * | 2007-07-18 | 2009-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体 |
JP2013183358A (ja) * | 2012-03-02 | 2013-09-12 | Oki Electric Ind Co Ltd | 収音装置及びプログラム |
JP2014072708A (ja) * | 2012-09-28 | 2014-04-21 | Oki Electric Ind Co Ltd | 収音装置及びプログラム |
JP2014110613A (ja) * | 2012-12-04 | 2014-06-12 | Oki Electric Ind Co Ltd | マイクロホンアレイ選択装置、マイクロホンアレイ選択プログラム及び収音装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018164156A (ja) * | 2017-03-24 | 2018-10-18 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP2021118461A (ja) * | 2020-01-27 | 2021-08-10 | 沖電気工業株式会社 | 収音装置、収音プログラム、及び収音方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6131989B2 (ja) | 2017-05-24 |
US9866957B2 (en) | 2018-01-09 |
US20170013357A1 (en) | 2017-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6131989B2 (ja) | 収音装置、プログラム及び方法 | |
JP5482854B2 (ja) | 収音装置及びプログラム | |
JP6065030B2 (ja) | 収音装置、プログラム及び方法 | |
JP6065028B2 (ja) | 収音装置、プログラム及び方法 | |
JP6206003B2 (ja) | 音源分離装置、音源分離プログラム、収音装置及び収音プログラム | |
JP6187626B1 (ja) | 収音装置及びプログラム | |
JP5772151B2 (ja) | 音源分離装置、プログラム及び方法 | |
JP6540730B2 (ja) | 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法 | |
JP6763332B2 (ja) | 収音装置、プログラム及び方法 | |
JP5737342B2 (ja) | 収音装置及びプログラム | |
JP2016163135A (ja) | 収音装置、プログラム及び方法 | |
JP6436180B2 (ja) | 収音装置、プログラム及び方法 | |
JP6241520B1 (ja) | 収音装置、プログラム及び方法 | |
JP6065029B2 (ja) | 収音装置、プログラム及び方法 | |
JP6260666B1 (ja) | 収音装置、プログラム及び方法 | |
JP6908142B1 (ja) | 収音装置、収音プログラム、及び収音方法 | |
JP6624256B1 (ja) | 収音装置、プログラム及び方法 | |
JP6879340B2 (ja) | 収音装置、収音プログラム、及び収音方法 | |
JP6863004B2 (ja) | 収音装置、プログラム及び方法 | |
JP6725014B1 (ja) | 収音装置、収音プログラム及び収音方法 | |
JP6772890B2 (ja) | 信号処理装置、プログラム及び方法 | |
JP6923025B1 (ja) | 収音装置、プログラム及び方法 | |
JP6624255B1 (ja) | 収音装置、プログラム及び方法 | |
JP2020120261A (ja) | 収音装置、収音プログラム及び収音方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170321 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6131989 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |