JP2010232717A - 受音信号処理装置、方法およびプログラム - Google Patents

受音信号処理装置、方法およびプログラム Download PDF

Info

Publication number
JP2010232717A
JP2010232717A JP2009074900A JP2009074900A JP2010232717A JP 2010232717 A JP2010232717 A JP 2010232717A JP 2009074900 A JP2009074900 A JP 2009074900A JP 2009074900 A JP2009074900 A JP 2009074900A JP 2010232717 A JP2010232717 A JP 2010232717A
Authority
JP
Japan
Prior art keywords
sound
signal
microphones
received
gain value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009074900A
Other languages
English (en)
Other versions
JP5197458B2 (ja
Inventor
Ko Amada
皇 天田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009074900A priority Critical patent/JP5197458B2/ja
Priority to PCT/JP2009/067709 priority patent/WO2010109708A1/ja
Publication of JP2010232717A publication Critical patent/JP2010232717A/ja
Priority to US13/219,844 priority patent/US8503697B2/en
Application granted granted Critical
Publication of JP5197458B2 publication Critical patent/JP5197458B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】マイクロホンアレーを構成するマイクロホンの感度を補正することのできる受音信号処理装置を提供する。
【解決手段】受音信号処理装置は、マイクロホン111,112が受音した受音信号が、近接音源からの音声を含む音声信号であるか、音声を含まない背景雑音信号かを判断する音声判断部150と、マイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出部131,132と、受音信号が背景雑音信号であると判断された場合に、複数の受音信号それぞれの信号レベルに基づいて、マイクロホン111,112のうち少なくとも1つのマイクロホンの受音信号に乗じるべき利得値であって、マイクロホンの間の信号レベルの差を減少させる利得値を決定し、少なくとも1つのマイクロホンの受音信号の利得値として設定する設定部160と、少なくとも1つのマイクロホンの受音信号に、利得値を乗じる演算部121,122とを備える。
【選択図】図1

Description

本発明は、複数のマイクロホンが取得した受音信号を処理する受音信号処理装置、方法およびプログラムに関する。
近年、複数のマイクロホンを用いて、特定の方向から到来する信号を強調し、その他の音を抑圧する技術や、音源の方向を検出する技術の研究が盛んである。代表的なマイクロホンアレー方式として、遅延和アレーがあげられる(非特許文献1)。この方法は、各マイクロホンの信号に所定の遅延を挿入し加算処理を行うと、事前に設定された方向から到来した信号のみが同位相で足し合わされ強調されるのに対し、その他の方向から到来した信号は位相が揃わず弱め合うという原理に基づいている。遅延和アレーでは、この原理に基づき加算処理を行うことにより、特定の方向からの信号を強調する。すなわち、特定の方向に指向性を形成する。遅延和アレーにより得られる出力信号Y(t)は、(式1)で表される。
Figure 2010232717
(式1)において、Nはマイクロホンの個数、X(t)は、各マイクロホンで得られた受音信号であり、n=1〜Nである。マイクロホンは等間隔に添え字nの順に配置されているものとする。また、τは、目的音の到来方向に受音信号を同相化するための遅延時間である。
マイクロホンアレー方式の別の例としては、Griffith−Jim型アレーがあげられる(非特許文献2)。Griffith−Jim型アレーは適応フィルタを用いて妨害音を除去する方式である。例えば、2つのマイクを利用したGriffith−Jim型アレーにおいて、目的音がアレーの正面から到来し、妨害音がアレーの側方から到来するとする。この場合、正面から到来する目的音は左右のマイクに同相で受音される。その結果、加算部では前述の遅延和アレーと同じ原理で目的音は強調される。一方、減算部では目的音は同相で減算されるため消去される。妨害音はマイク間で位相がそろっていないため、加算部、減算部のいずれでも強調もされなければ消去もされずに出力される。ここで、ポイントになるのが減算部の出力信号が目的音を除いた、いわゆる雑音成分のみから成る点である。Griffith−Jim型アレーではこの出力信号を参照信号として適応フィルタを駆動し、加算部の出力に残留している雑音成分を除去することにより、目的音の強調を行う。
J.L. Flanagan, J.D.Johnston, R.Zahn and G.W.Elko,"Computer-steered microphone arrays for sound transduction in large rooms,"J.Acoust. Soc. Am., vol.78, no.5, pp.1508-1518, 1985 L.J. Griffiths and C.W. Jim, "An Alternative Approach to Linearly Constrained Adaptive Beamforming," IEEE Trans. Antennas&Propagation, Vol.AP-30, No.1, Jan., 1982
このようなアレー処理においては、複数のマイクロホンの感度が同一であることが前提となっている。しかしながら、実際にはマイクロホンの感度にはバラつきがあり、また経時変化も無視できない。このため、常に同一感度を維持することは困難である。感度が不揃いなマイクロホンを用いてアレーを構成すると設計通りの指向性を形成することができない。例えばGriffith−Jim型アレーでは、減算部で目的音を除去する構成になっているが、2つのマイクロホンの感度が異なると同相で減算しても振幅の差分が消し残ってしまう。この消し残しは適応フィルタに供給される。この適応フィルタを用いた場合には、加算部の出力から目的音成分を一部除去することとなり、最終的な出力信号に歪みを生じる「目的音除去」という致命的な問題が発生してしまう。
本発明は、上記に鑑みてなされたものであって、マイクロホンアレーを構成するマイクロホンの感度を補正することのできる受音信号処理装置、方法およびプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、音声を受音する複数のマイクロホンと、前記複数のマイクロホンが受音した受音信号が、前記マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを、受音信号に基づいて判断する音声判断部と、前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出部と、前記音声判断部において前記受音信号が前記背景雑音信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、前記複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンの間の信号レベルの差を減少させる利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の前記利得値として設定する設定部と、前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算部とを備えたことを特徴とする。
また、本発明の他の形態は、予め定められた規定位置に設置され、音声を受音する複数のマイクロホンと、前記複数のマイクロホンが受信した受音信号が、マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを、受音信号に基づいて判断する音声判断部と、前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出部と、前記音声判断部において前記受音信号が音声信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンそれぞれが受音する複数の受音信号の信号レベルのバランスを、予め記憶部に記憶されている、前記規定位置に設置された複数のマイクロホンによる前記複数の受音信号の理想的なレベルバランスに近づける利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の利得値として設定する設定部と、前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算部とを備えたことを特徴とする。
本発明によれば、各マイクロホンの受音信号に乗じるべき利得値を自動的に継続して更新することができる。さらに、受音信号が背景雑音信号である場合に限り、利得値の調整を行うので、音声信号を利用することにより、不適切な利得値の調整を行うことがなく適切な利得値を設定することができるという効果を奏する。
第1の実施の形態にかかる受音信号処理装置100の構成を示すブロック図である。 マイクロホンと音源の配置例を示す図である。 マイクロホンと音源の配置例を示す図である。 受音信号処理装置100における受音信号処理を示すフローチャートである。 第5の変更例にかかる受音信号処理装置101の構成を示すブロック図である。 第2の実施の形態にかかる受音信号処理装置102の構成を示すブロック図である。 第1処理部211の構成を示すブロック図である。 第3の実施の形態にかかる受音信号処理装置103の構成を示すブロック図である。 第4の実施の形態にかかる受音信号処理装置104の構成を示すブロック図である。 第5の実施の形態にかかる受音信号処理装置105の構成を示すブロック図である。 第6の実施の形態にかかる受音信号処理装置106の構成を示すブロック図である。
以下に添付図面を参照して、この発明にかかる受音信号処理装置、方法およびプログラムの最良な実施の形態を詳細に説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態にかかる受音信号処理装置100の構成を示すブロック図である。本実施の形態にかかる受音信号処理装置100は、2つのマイクロホンを有するマイクロホンアレーにおける受音信号処理を行う。なお、マイクロホンアレーを構成するマイクロホンの個数は2つに限定されるものではなく、3つ以上のマイクロホンを有してもよい。
受音信号処理装置100は、第1マイクロホン111と、第2マイクロホン112と、第1利得演算部121と、第2利得演算部122と、第1レベル算出部131と、第2レベル算出部132と、相関算出部140と、音声判断部150と、利得設定部160と、アレー処理部170とを備えている。
第1マイクロホン111および第2マイクロホン112は、マイクロホンアレーを構成し、それぞれ受音信号を取得する。第1マイクロホン111が取得した受音信号は、第1利得演算部121、第1レベル算出部131および相関算出部140に入力される。第2マイクロホン112が取得した受音信号は、第2利得演算部122、第2レベル算出部132および相関算出部140に入力される。
第1利得演算部121は、第1マイクロホン111が取得した受音信号に対し利得値を乗じる。第2利得演算部122は、第1マイクロホン111が取得した受音信号に対し利得値を乗じる。これにより、マイクロホンアレーを構成する複数のマイクロホンの感度の差を補正することができる。なお、第1利得演算部121および第2利得演算部122が利用する利得値は、利得設定部160により設定される。
第1レベル算出部131は、第1マイクロホン111が取得した受信信号の信号レベルを算出する。第2レベル算出部132は、第2マイクロホン112が取得した受信信号の信号レベルを算出する。具体的には、第1レベル算出部131および第2レベル算出部132は、それぞれ(式2)により信号パワーの平均値Lを信号レベルとして算出する。
Figure 2010232717
(式2)において、E{}は、期待値を表し、時間平均により算出する。Xは、受音信号、tは時間インデックス、nはマイクロホンを識別する識別情報、すなわちチャネル番号を表している。なお、第1レベル算出部131および第2レベル算出部132は、それぞれ予め設定されているレベル算出時間周期で定期的に信号レベル算出を行う。
他の例としては、(式3)により再帰平均L(t)を信号レベルとして算出してもよい。
Figure 2010232717
(式3)において、αは1より小さな正の値である。
また、他の例としては、信号パワーの平均値と再帰平均とを組み合わせて、時間窓の平均パワーに対して再帰平均を適用してもよい。また、受音信号の2乗に替えて、振幅を用いることとしてもよい。また、平均値に替えて、最大値を用いてもよい。このように、受音信号の信号レベルは既存の技術を用いて算出すればよく、その方法は本実施の形態に限定されるものではない。
相関算出部140は、予め設定された相関算出時間周期で定期的に、第1マイクロホン111および第2マイクロホン112から受音信号を取得し、これらの相関を求める。第1マイクロホン111および第2マイクロホン112から取得した受音信号をそれぞれX(t),X(t)とすると、X(t)とX(t)の相互相関R12は、(式4)で定義される。
Figure 2010232717
相関算出部140は、窓幅Tでの相関を信号のパワーで正規化した正規化相互相関関数r12によりX(t)とX(t)の相関を算出する。rの添え字1,2は、それぞれチャネル番号を表している。相関算出部140は具体的には、(式5)により時刻tにおけるX(t)とX(t)の相関r12を算出する。
Figure 2010232717
ここで、φ12は、(式6)により算出される。また、Piiは、(式7)により算出される。
Figure 2010232717
Figure 2010232717
なお、φの添え字1,2およびPの添え字iはそれぞれチャネル番号を表している。正規化相互相関関数では値が0〜1に正規化される。このため、相関の強さを表す指標として用いるのに便利である。なお、マイクロホンの数が3以上の場合、すなわち3チャネル以上の場合には、2つのマイクロホン、すなわち2チャネルの相関値の統合により求めることができる。
相関算出部140は、3以上のチャネルにおける全チャネルの組み合わせを用いる場合は、(式8)により相関rm(t,τ)を算出する。
Figure 2010232717
他の例としては、全チャネルの統合(i<j)に替えて、隣接チャネルの統合(j=i+1)のように、他の統合方法を用いても良い。なお、以下では、簡単のため2チャネルの正規化相互相関関数r12(t,τ)を用いる場合について説明するが、3チャネル以上の場合も同様である。
相関算出部140は、異なるτの値に対する複数の相関値を算出し、τに関する相関値の最大値r12_max(t,τ_max)を特定する。相関値が大きいことは、相関の大きい信号が到来していることを意味し、またこのときのτ_maxは、これらの信号が2つのマイクロホンに到達するまでの時間差、すなわち音源方向を示している。なお、相関算出部140は、算出規定時間周期で観測時刻tを設定し、各時刻tに対して算出された相関値の最大値r12_maxを特定し、特定するごとに音声判断部150に出力する。
なお、第1レベル算出部131および第2レベル算出部132による信号レベル算出のタイミングであるレベル算出時間周期と、相関算出部140による相関算出のタイミングである相関算出時間周期は等しいことが望ましいが、互いに近いタイミングで信号レベルおよび相関が算出されていればよく、必ずしも一致する必要はない。
一般的に音源がマイクロホンアレーから遠ざかるに従い、チャネル間の相関は減少する。このため、チャネル間の相関を手がかりに近接音源の存在を検出することが可能である。音声信号のように時間的に不連続な信号を扱う場合、音声信号が存在する音声信号区間と、音声信号の存在しない区間、すなわち背景雑音信号の区間である背景雑音区間とが存在する。ここで、音声信号とは近接音源から発せられた音声を含む信号である。すなわち、近接音源とは、マイクロホンアレーが音声として認識可能な音を発する音源である。背景雑音信号とは、近接音源からの音声信号が存在しない場合に、マイクロホンアレーが受音する雑音信号である。例えば、ドライバーの声を受音することを目的として設定されたマイクロホンアレーにおいて、助手席に座っている人物の声の信号も、マイクロホンアレーに対する近接音源からの信号であり、音声信号である。一方、例えば遠くを走行する救急車のサイレンの信号は、近接音源からの信号ではなく、背景雑音信号である。
受音信号がマイクロホンアレーに近接する近接音源から発せられた音声信号である場合には、チャネル間の相関は大きくなる。一方、受音信号が背景雑音のみを含む背景雑音信号である場合には、チャネル間の相関は小さくなる。そこで、本実施の形態においては、相関の最大値r12_maxを算出し、相関の最大値r12_maxを用いて受音信号が音声信号であるか背景雑音信号であるかを判断する。
音声判断部150は、相関算出部140から相関の最大値r12_maxを取得する。そして、予め設定された相関値の閾値r12_thと比較し、最大値r12_maxが閾値r12_thに比べて小さい場合には、相関が小さく、受音信号は背景雑音信号であると判断する。また、最大値r12_maxが閾値r12_th以上である場合には、相関が大きく、受音信号は音声信号であると判断する。なお、閾値r12_thは、実験により求めた値である。実験においては、背景雑音および音声に対する受音信号を測定し、これらの測定結果から閾値を算出する。なお、受音信号が背景雑音信号であるか音声信号であるかをより正確に判断するためには、受音信号処理装置100が設置される環境にできるだけ近い環境において測定を行うのが望ましい。
利得設定部160は、予め設定された利得設定時間周期で音声判断部150から受音信号が音声信号であるか背景雑音信号であるかの判断結果を取得する。利得設定部160は、また第1レベル算出部131および第2レベル算出部132から第1マイクロホン111および第2マイクロホン112の受音信号の信号レベルを取得する。利得設定部160は、受音信号が背景雑音信号である場合には、第1マイクロホン111および第2マイクロホン112それぞれが取得した受音信号の信号レベルに基づいて、各受音信号に乗じるべき利得値を決定する。利得設定部160は、第1マイクロホン111が取得した受音信号に対して決定した利得値を第1利得演算部121に設定し、第2マイクロホン112が取得した受音信号に対して決定した利得値を第2利得演算部122に設定する。
例えば、受音信号の平均パワーがL<Lの場合、第2利得演算部122に設定されているチャネル2の利得を減少させ、第1利得演算部121に設定されているチャネル1の利得を増加させる。これにより、2つのマイクロホンの感度差を減少させる方向に利得値を更新することができる。具体的には、利得設定部160は、(式9)および(式10)に示す利得を各チャネルの利得演算部に設定する。なお、チャネルnに現在設定している利得値をGn_old、利得設定部160が新たにチャネルnの利得演算部に設定する利得値をGn_newとする。
Figure 2010232717
Figure 2010232717
なお、Lは、平均パワーの目標値であり、(式11)で表される。
Figure 2010232717
利得設定部160は、第1レベル算出部131および第2レベル算出部132から取得した受音信号の信号レベルに基づいて算出した新たな利得値G1_new,G2_newをそれぞれ第1利得演算部121および第2利得演算部122に設定する。これにより、第1マイクロホン111および第2マイクロホン112が取得した受音信号の感度、すなわち信号レベルの差が小さくなるように、より好ましくは等しくなるように信号レベルを調整することができる。
受音信号の利得を調整して感度補正を行うだけならば、目標レベル(例えば基準マイクのレベル)になるように、各マイクロホンの利得を独立に制御する方法が考えられる。しかしながら、この方法には問題がある。図2に示す配置例では、マイクロホンアレー111,112の正面、すなわち各マイクロホン111,112からの距離が等しい位置に音源11,12がある。この場合、各音源11,12と2つのマイクロホン111,112の間の距離の比(d11/d12およびd21/d22)は音源11,12とマイクロホン111,112の間の距離によらず1である。
図3に示す例では、マイクロホンアレー111,112の斜め方向に音源13,14がある。この場合には、2つのマイクロホン111,112までの距離の比(d31/d32およびd41/d42)は音源距離によって異なる。すなわち、マイクロホン111,112と音源13,14の間の距離が大きくなるほど音源13,14からマイクロホン111,112までの距離の比が1に近づくのに対し、マイクロホン111,112と音源13,14の間の距離が小さくなるほど音源13,14からマイクロホン111,112までの距離の比は1よりも大きくなる。
一般に、マイクロホンで受音した音波のエネルギーは、音源からの距離の2乗に反比例する。したがって、距離の比が大きくなるにつれて受音信号のパワーの比も大きくなる。すなわち、音源がマイクロホンアレーの近くであって、かつ斜め方向に存在する場合には、複数のマイクロホンの感度が等しければ各マイクロホンは異なる信号パワー、すなわち信号レベルの受音信号を取得するはずである。このようにマイクロホン毎に異なるべき信号レベルをすべて等しくなるように利得調整を行うことは、感度の等しいマイクロホンを用いた場合に得られる受音信号とは異なる受音信号に調整することになってしまう。
例えば、自動車内でドライバーの声を受音するために、ルームミラーにマイクロホンアレーを設置する場合がある。この場合、主な音源であるドライバーはマイクロホンアレーに対し斜め方向に存在する。単純にマイクロホン間の信号パワーが等しくなるように利得を調整すると、ドライバーの発話時に、ドライバーにより近いマイクロホンほど大きな信号を出力するという現象と一致しなくなってしまう。また、使用中に同乗者など他の方向に音源が現れると、その都度、音源方向に逆らうように利得調整を行うことになる。しかしながら、これはマイクロホンの感度をそろえることにはならず、適切な利得調整を行うことはできない。
そこで、上述のように利得設定部160は、近接音源が存在しない場合、すなわち受音信号が背景雑音信号である場合に限り、新たな利得値を算出し、これを第1利得演算部121および第2利得演算部122に設定する。これにより、本来異なるべき信号パワーを等しくするような、不適切な利得調整を行うのを防ぐことができる。
アレー処理部170は、利得設定部160により設定された利得値により第1利得演算部121および第2利得演算部122において調整された後の受音信号を用いてアレー処理を行う。なお、アレー処理としては、Griffith−Jim型アレーによる処理を行う。なお、他の例としては、アレー処理部170は、遅延和アレーやICAなど、複数のマイクロホンを用いた信号処理を行ってもよい。アレー処理部170は、第1利得演算部121および第2利得演算部122により信号レベルが調整された受音信号を利用して処理を行うので、設計通りの指向性を形成することができる。
図4は、受音信号処理装置100における受音信号処理を示すフローチャートである。まず、マイクロホンアレーを形成する第1マイクロホン111および第2マイクロホン112は、受音信号を取得する(ステップS100)。次に、第1レベル算出部131および第2レベル算出部132は、それぞれレベル算出時間が経過する度に、第1マイクロホン111および第2マイクロホン112が取得した受音信号の信号レベルを算出する(ステップS102)。相関算出部140は、相関算出時間が経過する度に、第1マイクロホン111が取得した受音信号および第2マイクロホン112が取得した受音信号の相関値を算出し、相関の最大値r12_maxを音声判断部150に出力する(ステップS104)。
音声判断部150は、相関算出部140から取得した最大値r12_maxと、予め設定されている閾値r12_thとを比較する。最大値r12_maxが閾値r12_thよりも小さい場合には(ステップS106,Yes)、受音信号は背景雑音信号であると判断する。一方、最大値r12_maxが閾値r12_th以上である場合には(ステップS106,No)、受音信号は音声信号であると判断する。
利得設定部160は、利得設定時間が経過する度に、音声判断部150から判断結果を取得する。算出された相関の最大値r12_maxが閾値r12_thよりも小さい場合には(ステップS106,Yes)、受音信号は背景雑音信号であるとの判断結果を取得する。この場合、利得設定部160は、第1利得演算部121および第2利得演算部122に設定されている利得値を更新する(ステップS108)。
具体的には、利得設定部160は、第1レベル算出部131および第2レベル算出部132が算出した受音信号の信号レベルに基づいて、第1利得演算部121および第2利得演算部122に設定する新たな利得値G1_new,G2_newを算出する。そして、算出した新たな利得値を第1利得演算部121および第2利得演算部122にそれぞれ設定する。
一方、ステップS106において、最大値r12_maxが閾値r12_th以上である場合、すなわち受音信号が音声信号である場合には(ステップS106,No)、利得設定部160は、利得を更新しない。そして第1マイクロホン111および第2マイクロホン112による受音信号の取得が終了していなければ(ステップS110,No)、再びステップS102に戻り、更新処理を継続し、第1マイクロホン111および第2マイクロホン112による受音信号の取得が終了すると(ステップS110,Yes)、処理は完了する。
このように、第1の実施の形態にかかる受音信号処理装置100においては、背景雑音区間においてのみ利得値の更新を行うので、近接斜方向の音源が存在する環境下において、音声信号を用いた利得調整により、異なるべき信号パワーを等しい信号パワーに調整するような不適切な利得調整を行うことなく、正しくマイクロホンの感度を合わせることができる。
また、受音信号処理装置100においては、受音信号が背景雑音信号である場合には、利得設定部160は、予め設定された利得設定時間が経過する度に必要に応じて利得を更新するので、マイクロホンアレーが作動している間継続して自動的に利得調整を行うことができる。したがって、マイクロホンの経時変化にも対応した利得調整を行うことができる。
実施の形態の第1の変更例としては、音声判断部150は、所定の時間間隔内の複数のtに対して得られた複数の相関値の最大値それぞれと閾値との比較を行い、予め設定された規定連続時間以上の間連続して相関値の最大値が閾値以下である場合に、受音信号が背景雑音であると判断してもよい。これにより、相関値の一時的な変動の影響を受けにくくすることができる。
第2の変更例としては、利得設定部160は、既に第1利得演算部121および第2利得演算部122に設定されている利得値G1_old,G2_oldから1回の調整量を比較的小さい値にし、算出した新たな利得値である目標利得値まで徐々に更新していくこととしてもよい。これにより、急な感度調整により聴覚的な違和感を与えるのを避けることができる。
この場合、利得設定部160が、設定時間周期で第1利得演算部121および第2利得演算部122に設定する、新たな利得値は、(式12)および(式13)により示される。
Figure 2010232717
Figure 2010232717
ここで、G_up,G_dwonはそれぞれ、G_up>1,G_down<1なる値である。例えば1回の更新時の利得値の変化量が1dBup,1dBdown程度であれば更新による変化が知覚されることはまずない。このように、1回に変更する調整幅(ステップサイズ)を制限することにより、緩やかにゲイン調整を行うことができる。
さらに、チャネル間の信号レベルの差が大きいほど大きい調整幅を設定し、この調整幅ずつ利得値を更新してもよい。これにより、新たな利得値G1_new,G2_newを設定するまでの収束時間を短縮することができる。また、他の例としては、チャネル間の信号レベルの差が大きいほど利得値の更新を行う時間間隔、すなわち設定時間周期を短くしてもよい。なお、いずれの場合にも、緩やかに利得値を変更している間も、目標利得値の算出を行い、目標利得値を定期的に更新する。
また、第3の変更例としては、第1の実施の形態においては、受音信号が背景雑音信号である場合には、利得更新を行わないこととしたが、これにかえて更新時のステップサイズを小さくし、利得更新の程度を小さくすることとしてもよい。これにより、緩やかにゲイン調整を行うことができる。
第4の変更例について説明する。図2および図3を参照しつつ説明したように、マイクロホンアレーの正面に音源が存在する場合には、音源とマイクロホンアレーの距離によらず、音源と各マイクロホンの間の距離は等しくなる。そこで、受音信号が音声信号であっても、音源がマイクロホンアレーの正面に位置する場合には、利得の更新を行うこととしてもよい。
例えば、音声判断部150は、さらに最大の相関値を与える時間差の絶対値|τ_max|と所定の閾値τ_thとを比較する。そして、利得設定部160は、|τ_max|<τ_thの関係にある場合、すなわち、音源がマイクロホンアレーのほぼ正面付近に存在する場合には、利得の更新を行う。なお、ここで閾値τ_thは、音源がマイクロホンアレーのほぼ正面に位置する場合に得られるτを実測して求めたものである。
図5は、第5の変更例にかかる受音信号処理装置101の構成を示すブロック図である。第5の変更例にかかる受音信号処理装置101においては、第1レベル算出部133および第2レベル算出部134はそれぞれ第1利得演算部123および第2利得演算部124により利得値の演算が施された後の受音信号を取得する。そして、これらの受音信号の信号レベルを算出する。また、相関算出部142は、第1利得演算部123および第2利得演算部124から受音信号を取得し、これらの受音信号に基づいて相関値を算出し、音声判断部152に送出する。このように、利得調整後の受音信号の信号レベルを利用するので、利得設定部162による(式9)および(式10)を利用した相対的な更新の実装を簡単にすることができる。
さらに、他の例としては、信号レベル算出には利得調整前の受音信号を利用し、相関算出には利得調整後の受音信号を利用してもよい。またこれとは逆に、信号レベル算出には利得調整後の受音信号を利用し、相関算出には、利得調整後の受音信号を利用してもよい。なお、上記変更例は、いずれも他の実施の形態においても同様に適用することができることはいうまでもない。
(第2の実施の形態)
図6は、第2の実施の形態にかかる受音信号処理装置102の構成を示すブロック図である。第2の実施の形態にかかる受音信号処理装置102は、時間信号である受音信号を周波数領域の信号に変換する。そして、各周波数成分に対し、利得調整を行う。
受音信号処理装置102は、第1マイクロホン111と、第2マイクロホン112と、第1DFT201と、第2DFT202と、第1処理部211〜第L処理部220と、IDFT230とを備えている。第1DFT201は、第1マイクロホン111が取得した受音信号を周波数領域の信号に変換する。第2DFT202は、第2マイクロホン112が取得した受音信号を周波数領域の信号に変換する。第1DFT201および第2DFT202は、受音信号を周波数領域の信号に変換する処理として、具体的には離散フーリエ変換(DFT)を行う。DFTでは、所定の時間幅の時間窓を設定する。そして、この時間窓をシフトしながら連続時間信号を処理する。以下、時間窓により切り出される信号の単位をフレームと称する。フレーム毎にL個の周波数成分が得られる。各周波数成分は、それぞれ第1処理部211〜第L処理部220に入力される。
第1処理部211〜第L処理部220は、それぞれ各周波数成分に対する処理を行い、処理後の信号を出力する。なお、第1処理部211〜第L処理部220は同一の構成であり、第1処理部211〜第L処理部220には、それぞれ第1マイクロホン111および第2マイクロホン112が取得した受音信号の第1周波数成分〜第L周波数成分が入力される。第1処理部211〜第L処理部220は、取得した周波数信号に対して利得調整処理を行う。IDFT230は、各処理部から取得した周波数成分を時間信号に変換し出力する。IDFT230は、具体的には、逆離散フーリエ変換(IDFT)を行う。
図7は、第1処理部211の構成を示すブロック図である。第1処理部211には、第1DFT201から、第1マイクロホン111の受音信号の第1周波数成分が入力される。第1処理部211には、また第2DFT202から第2マイクロホン112の受音信号の第1周波数成分が入力される。第1処理部211は、これらの周波数信号に対して利得調整処理を行う。
第1処理部211は、第1利得演算部241と、第2利得演算部242と、第1レベル算出部251と、第2レベル算出部252と、相関算出部260と、音声判断部270と、利得設定部280と、アレー処理部290とを備えている。
第1利得演算部241および第2利得演算部242は、それぞれ第1DFT201および第2DFT202から第1周波数成分を取得する。そして、第1利得演算部241および第2利得演算部242は、各第1周波数成分に対し、利得値を乗じる。なお、第1利得演算部241および第2利得演算部242が利用する利得値は、利得設定部280により設定される。
第1レベル算出部251および第2レベル算出部252はそれぞれ第1DFT201および第2DFT202から第1周波数成分を取得する。そして、これらの周波数成分の信号レベルを算出する。具体的には、第1レベル算出部251および第2レベル算出部252は、それぞれ(式14)により第l周波数成分の信号パワーの平均値L(1)を算出する。ここで、lは、周波数成分番号である。
Figure 2010232717
なお、期待値はフレーム平均として算出する。X(1)は複素数であるので、信号パワーの算出には絶対値の2乗を用いる。
相関算出部260は、第1DFT201および第2DFT202から第1周波数成分を取得し、これらの相関を求める。相関算出部260は、周波数成分毎の相関を表す代表的な指標である、コヒーレンスを用いて相関を算出する。具体的には、(式15)により第l周波数成分におけるチャネル1,2間のコヒーレンスを相関としてを算出する。ここで、conj()は共役複素数を、sqrt()は平方根を表している。
Figure 2010232717
コヒーレンスは複素数であり、その絶対値は、0〜1の範囲の値をとる。絶対値が1に近いほど相関が高いことを意味する。
音声判断部270は、相関算出部260により算出された相関値と、予め定めた閾値r12_thとを比較し、相関算出部260により算出された相関値r12が閾値r12_thに比べて小さい場合には、相関が小さく、受音信号は背景雑音信号であると判断する。また、相関値r12が閾値r12_th以上である場合には、相関が大きく、受音信号は音声信号であると判断する。なお、閾値r12_thは実験により求めた値である。このように、コヒーレンスの絶対値が大きいことは、近接音源の存在を示唆しているので、コヒーレンスの絶対値に基づいて、受音信号が背景雑音信号か音声信号かを判断することができる。
利得設定部280は、音声判断部270から受音信号が音声信号であるか背景雑音信号であるかの判断結果を取得する。利得設定部280はまた、第1レベル算出部251および第2レベル算出部252から第1マイクロホン111および第2マイクロホン112が取得した受音信号の第l周波数成分の信号レベルを算出する。利得設定部280は、受音信号が背景雑音信号である場合には、第1マイクロホン111および第2マイクロホン112の受音信号の第l周波数成分の信号レベルに基づいて、各マイクロホンに対応する第l周波数成分に対して乗じる利得値を決定し、この値を第1利得演算部241および第2利得演算部242に設定する。
アレー処理部290は、第1利得演算部241および第2利得演算部242から利得調整後の第l周波数成分を取得し、第l周波数成分に対するアレー処理を行い、処理後の第l周波数成分をIDFT230に出力する。
このように、本実施の形態にかかる受音信号処理装置102においては、L個の周波数成分それぞれに対して、利得の調整を行うことができる。これにより、マイクロホンの感度差が周波数領域毎に異なる場合には、周波数成分毎にそれぞれ適した値に利得値を調整することができる。
なお、第2の実施の形態にかかる受音信号処理装置102のこれ以外の構成および処理は、第1の実施の形態にかかる受音信号処理装置100の構成および処理と同様である。
第2の実施の形態にかかる受音信号処理装置102の第1の変更例としては、所定の周波数成分に対して求めた相関値を用いて、音声信号が背景雑音信号であるか音声信号であるかを判定し、この判定結果を他の周波数成分においても利用することとしてもよい。例えば、特定の周波数に大きなノイズが存在する場合、その周波数で求めた相関値を利用して音声信号か雑音信号かを判定するのは困難である。例えば、音声のような広帯域信号の近接音源が存在する場合には、この存在を検出するために、所定の周波数成分により算出した相関値を利用することができる。
さらに、低い周波数成分は近接音源の有無に関わらず相関が高くなる。このため、受音信号が音声信号であるか雑音信号であるかの判定精度が低下する可能性がある。そこで、比較的低い周波数成分に対応する処理部においては、相関算出部および音声判断部による処理を行わず、比較的高い周波数成分に対する処理部において得られた判断結果を利用することとする。これにより、受音信号が音声信号であるか雑音信号であるかの判断精度を向上させることができる。
また、第2の変更例としては、受音信号処理装置102は、IDFT230を備えなくともよい。例えば、音声認識などの用途でスペクトル情報のみが必要な場合は、IDFTを行わず周波数成分を出力してもよい。
(第3の実施の形態)
図8は、第3の実施の形態にかかる受音信号処理装置103の構成を示すブロック図である。第3の実施の形態にかかる受音信号処理装置103は、第2の実施の形態にかかる受音信号処理装置102と同様に、各周波数成分に対する利得調整を行う複数の処理部、すなわち第1処理部311〜第L処理部320を備えている。ただし、受音信号処理装置103は、各周波数成分に対応する複数の相関算出部および音声判断部を有するのではなく、1つの相関算出部340および1つの音声判断部350を有している。
相関算出部340は、第1DFT201により得られたすべての周波数成分を取得する。さらに、第2DFT202により得られたすべての周波数成分を取得する。相関算出部340は、取得したすべての周波数成分から、第1マイクロホン111が取得した受音信号と第2マイクロホン112が取得した受音信号の相関を算出する。相関算出部340は、すべての周波数成分を用いて(式16)により、一般化相互相関関数(GCC)を相関値として算出する。
Figure 2010232717
ここで、G12(l)はX(l)とX(l)のクロススペクトルである。w(l)は周波数ごとの重みである。また、クロススペクトルはE{conj(X(l)*X(l))}として期待値を用いる。フレーム毎に独立に求めても良いが、前者のほうが高い精度で得ることができる。w(l)は、(式17)により算出する。w(l)の決め方により異なる種類の相互相関関数が得られる点が一般化相互相関関数の特徴であり、詳細は、C. H. Knapp and G. C. Carter, "The Generalized Correlation Method for Estimation of Time Delay," IEEE Trans, Acoust., Speech, Signal Processing, Vol.ASSP-24, No.4, pp.320-327, 1976に記載されている。
Figure 2010232717
GCC(τ)は周波数ごとに重み付けされている点を除いては第1の実施の形態において説明した相互相関関数R12(τ)と同じ性質の関数である。したがって、第1の実施の形態にかかるR12(τ)と同様に扱うことができる。例えば、GCC(τ)のピークは相関の強さを表し、ピークを与える時間は音源方向に対応する。
なお、GCCと類似した相関関数としてCSP(Cross Spectral Phase)と呼ばれるものがある。また、これに重みを付けた重みつきCSPも提案されている。これらはGCCの一形態と考えられ、相関算出部340はこれらの関数により相関値を算出してもよい。
音声判断部350は、相関算出部340から相関値GCC(τ)を取得する。そして、予め設定された閾値GCC(τ)_thと比較する。相関算出部340が算出した相関値GCC(τ)が閾値GCC(τ)_thよりも小さい場合には、受音信号は背景雑音信号であると判断する。相関算出部340が算出した相関値GCC(τ)が閾値GCC(τ)_th以上である場合には、受音信号は音声信号であると判断する。音声判断部350は、判断結果を各処理部311〜320の利得設定部に出力する。
第1処理部311は、第1利得演算部361と、第2利得演算部362と、第1レベル算出部371と、第2レベル算出部372と、利得設定部380と、アレー処理部390とを備えている。なお、第1処理部311は、相関算出部および音声判断部は備えない。利得設定部380は、音声判断部350から受音信号が音声信号であるか背景雑音信号であるかの判断結果を取得する。利得設定部380は、さらに第1レベル算出部371および第2レベル算出部372からそれぞれ受音信号の第1周波数成分の信号レベルを取得する。利得設定部380は、背景雑音信号区間である場合に、第1レベル算出部371および第2レベル算出部372から取得した信号レベルに基づいて、第1利得演算部361および第2利得演算部362に設定すべき利得値を決定し、これを第1利得演算部361および第2利得演算部362に設定する。
なお、第2処理部312〜第L処理部320の構成および処理は、第1処理部311の構成および処理と同様である。また、第3の実施の形態にかかる受音信号処理装置103のこれ以外の構成は、第2の実施の形態にかかる受音信号処理装置102の構成と同様である。
このように、第3の実施の形態にかかる受音信号処理装置103においては、利得設定部は周波数毎に設けられているので、周波数毎に独立に利得設定を行うことができる。したがって、周波数毎にマイクロホンの感度が異なる場合には、周波数毎に適切な利得調整を行うことができる。
(第4の実施の形態)
図9は、第4の実施の形態にかかる受音信号処理装置104の構成を示すブロック図である。受音信号処理装置104は、第2,3の実施の形態にかかる受音信号処理装置と同様に、各周波数成分に対する利得調整を行う複数の処理部、すなわち第1処理部411〜第L処理部420を備えている。ただし、本実施の形態にかかる受音信号処理装置104においては、アレー処理部は、入力信号の処理に加えて、音源方向の推定と受音信号の強度の推定を行う。音声判断部は、アレー処理部による推定結果に基づいて、受音信号が音声信号であるか背景雑音信号であるかの判断を行う。
他の実施の形態において述べた相関の大きさは、本実施の形態において述べた信号の強度に対応する。また、コヒーレンスの位相や相関値の時間差τが音源方向に対応する。
アレー処理部480は、ビームフォーマ法により、アレーの指向性をスキャンしながら各方向の出力パワーを測定し、高い出力パワーを与える方向に音源が存在すると判定する。ビームフォーマ法では方向θにおける出力パワーは、(式18)で表される。
Figure 2010232717
ここで、a(θ)は音源方向に対応する縦ベクトルであり、方向ベクトルまたはモードベクトル等と呼ばれる。a(θ)の次元は、マイクロホンの数に相当する。すなわち、マイクロホンの数がN個である場合には、a(θ)は、N次元となる。a’(θ)は、a(θ)を転置した横ベクトルである。Rxxは空間相関行列であり、チャネル間の相互相関を行列で表したものである。2チャネルの場合の周波数領域でRxxは(式19)で表現される。
Figure 2010232717
ここで、lは周波数成分番号である。(式19)の成分Gxxは、第3の実施の形態において説明したクロススペクトルであり、チャネル間の相関を表している。
(式18)において方向ベクトルa(θ)は入力信号によらないベクトルである。したがって、Pow(θ)が大きな値をとるためには、Rxx(l)の成分が大きな値となる必要がある。つまり、他の実施の形態において説明した、受音信号間の相関が大きくなることと、アレー処理においてある方向に強い方向性が観測されることは等価なことである。
音声判断部460は、アレー処理部480により算出されたPow(θ)の最大値と予め設定された閾値Pow_thとを比較する。そして、Pow(θ)が閾値よりも小さい場合には、相関が低く受音信号は背景雑音信号であると判断する。また、Pow(θ)が閾値Pow_th以上である場合には、相関が高く受音信号は音声信号であると判断する。
利得設定部470は、受音信号が背景雑音信号であると判断される区間である背景雑音区間において第1レベル算出部451および第2レベル算出部452から取得した信号レベルに基づいて、利得値を決定し、これを第1利得演算部441および第2利得演算部442に設定する。
なお、第2処理部412〜第L処理部420における処理および構成は、図9を参照しつつ説明した第1処理部411の処理および構成と同様である。また、受音信号処理装置104のこれ以外の構成および処理は、他の実施の形態にかかる受音信号処理装置の構成および処理と同様である。
本実施の形態の変更例としては、アレー処理部480は、例えば空間相関行列の固有値分解を利用したMUSIC法など、従来から知られている他の方法を用いて音源方向を推定してもよい。方向推定の詳細な方法にいては、M. Brandstein and D. Ward,"Microphone Arrays," Springer, Part II , 2001に記載されている。ビームフォーマ法以外の方向探索アルゴリズムを用いた場合でも、大抵の場合、強い方向性が観測されることと、大きな相関値が得られることは同じことであり、表現方法の違いに過ぎない。
(第5の実施の形態)
図10は、第5の実施の形態にかかる受音信号処理装置105の構成を示すブロック図である。受音信号処理装置105は、第1の実施の形態にかかる受音信号処理装置100の相関算出部140にかえて音声検出部500を備えている。音声検出部500は、例えばVAD(Voice Activity Detector)等の音声検出器であり、音声の存在の有無を検出する。音声判断部510は、音声が存在する場合には、受音信号は音声信号であると判断する。また、音声が存在しない場合には、受音信号は雑音信号であると判断する。
例えば、受音信号処理装置105が設置された周辺環境において想定され得る近接音源が音声信号に限られている場合には、本実施の形態にかかる受音信号処理装置105のように、音声検出部500による検出結果に基づいて、受音信号が音声信号であるか背景雑音信号であるかを判定することにより、精度よく受音信号の判断を行うことができる。
なお、受音信号処理装置105のこれ以外の構成および処理は、第1の実施の形態にかかる受音信号処理装置100の構成および処理と同様である。
なお音声検出部500による音声検出の方法は、本実施の形態に限定されるものではない。音声検出は、信号のパワー情報を用いる手法、スペクトル情報を用いる手法、信号対雑音比に基づく手法など様々な方法が提案されており、音声検出部500はこれらの方法により音声を検出してもよい。
(第6の実施の形態)
図11は、第6の実施の形態にかかる受音信号処理装置106の構成を示すブロック図である。受音信号処理装置106は、背景雑音区間ではなく音声区間において、マイクロホンアレーの理想的な利得バランスに近づくように利得値を調整する。受音信号処理装置106は、第1の実施の形態にかかる受音信号処理装置100の音声判断部150にかえて相関判断部600を備えている。また、第1の実施の形態にかかる受音信号処理装置100の構成に加えて利得データ記憶部610を備えている。
相関判断部600は、相関算出部140から相関値の最大値r12_maxと、このときの位相τ12、すなわちτ12_maxの組を取得する。相関判断部600は、予め相関値およびこのときの位相の設定値の組を記憶しており、これと取得した最大値の組とを比較する。なお、設定値は、近接音源が存在する場合に得られる相関値の最大値r12_maxと、このときの位相τ12であり、予め実験等により求めたものである。相関算出部140により算出されたr12_maxとτ12_maxの値がそれぞれr12_maxとτ12_maxの設定値と一致した場合には、利得設定部620に対し利得調整を行う旨の指示を出力する。なお、相関算出部140により算出されたr12_maxとτ12_maxの値がそれぞれr12_maxとτ12_maxの設定値を基準としたある範囲内の値であれば、一致したと判断することとする。
利得データ記憶部610は、利得データを記憶している。ここで、利得データとは、相関が相関判断部600に記憶されている設定値になるような状況において感度のそろった複数のマイクロホンを用いて受音した場合の理想的な利得バランスを示す情報である。すなわち、利得データには、理想的な状況での各マイクロホンの信号パワーが示されている。利得設定部620は、利得データに基づいて、第1マイクロホン111および第2マイクロホン112の受音信号に乗じるべき利得値を決定する。具体的には、利得値を乗じた受音信号のパワーが理想的な利得バランスと一致するような利得値を決定する。そして、決定した利得値を第1利得演算部121および第2利得演算部122に設定する。なお、この場合にも、利得設定部620は目標値を理想的な利得バランスとして段階的に利得値を設定してもよい。
本実施の形態にかかる受音信号処理装置106においては、固定位置に音源が存在し、かつ、その音源から音が発せられている時間帯が長い場合において、効率良く利得調整を行うことが可能となる。
なお、本実施の形態にかかる受音信号処理装置106の構成および処理は、他の実施の形態にかかる受音信号処理装置の構成および処理と同様である。
本実施の形態の受音信号処理装置は、CPUなどの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、HDD、CDドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。
本実施の形態の受音信号処理装置で実行される受音信号処理プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、本実施の形態の受音信号処理装置で実行される受音信号処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施形態の受音信号処理装置で実行される受音信号処理プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。また、本実施形態の受音信号処理プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
本実施の形態の受音信号処理装置で実行される受音信号処理プログラムは、上述した各部(第1利得演算部、第2利得演算部、第1レベル算出部、第2レベル算出部、相関算出部、音声判断部、利得設定部、アレー処理部など)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から受音信号処理プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようになっている。
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。
100〜106 受音信号処理装置
111 第1マイクロホン
112 第2マイクロホン
121 第1利得演算部
122 第2利得演算部
131 第1レベル算出部
132 第2レベル算出部
150 音声判断部
160 利得設定部

Claims (11)

  1. 音声を受音する複数のマイクロホンと、
    前記複数のマイクロホンが受音した受音信号が、前記マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを、受音信号に基づいて判断する音声判断部と、
    前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出部と、
    前記音声判断部において前記受音信号が前記背景雑音信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、前記複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンの間の信号レベルの差を減少させる利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の前記利得値として設定する設定部と、
    前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算部と
    を備えたことを特徴とする受音信号処理装置。
  2. 前記設定部は、現在設定されている利得値を前記複数のマイクロホンの信号レベルが等しくなる目標利得値まで変更させる際の利得値の調整幅を決定し、予め設定された第1規定時間が経過する度に、前記調整幅だけ既に設定されている前記利得値を変更した値を、新たな利得値として設定することを特徴とする請求項1に記載の受音信号処理装置。
  3. 前記複数のマイクロホンが受音した複数の受音信号の相関を算出する相関算出部をさらに備え、
    前記音声判断部は、前記相関算出部により算出された前記相関が予め定められた閾値に比べて小さい場合に、前記背景雑音信号であると判断することを特徴とする請求項1に記載の受音信号処理装置。
  4. 前記受音信号を周波数成分に変換する変換部をさらに備え、
    前記信号レベル算出部は、前記変換部により得られた周波数成分毎に前記受音信号それぞれの信号レベルを算出し、
    前記相関算出部は、前記周波数成分の相関を算出し、
    前記設定部は、前記周波数成分毎に前記利得値を決定し、前記周波数成分毎に前記受音信号の前記利得値を設定し、
    前記演算部は、前記受音信号の前記周波数成分それぞれに対し、各周波数成分に対して設定された前記利得値を乗じることを特徴とする請求項3に記載の受音信号処理装置。
  5. 前記音声判断部は、予め設定された第2規定時間が経過する度に、前記受音信号が前記音声信号であるか前記背景雑音信号であるかを判断し、
    前記決定部は、予め設定された第3規定時間の間、前記受音信号が前記背景雑音信号であるとの判断が連続して得られた場合に、前記受音信号の前記利得値を決定することを特徴とする請求項1に記載の受音信号処理装置。
  6. 前記受音信号から発話を検出する音声検出部をさらに備え、
    前記音声判断部は、前記音声検出部により発話が検出されない場合に、前記背景雑音信号であると判断することを特徴とする請求項1に記載の受音信号処理装置。
  7. 予め定められた規定位置に設置され、音声を受音する複数のマイクロホンと、
    前記複数のマイクロホンが受信した受音信号が、マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを判断する音声判断部と、
    前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出部と、
    前記音声判断部において前記受音信号が音声信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンそれぞれが受音する複数の受音信号の信号レベルのバランスを、予め記憶部に記憶されている、前記規定位置に設置された複数のマイクロホンによる前記複数の受音信号の理想的なレベルバランスに近づける利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の利得値として設定する設定部と、
    前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算部と
    を備えたことを特徴とする受音信号処理装置。
  8. 複数のマイクロホンの受音信号を処理する受音信号処理をコンピュータに実行させるための受音信号処理プログラムであって、
    前記コンピュータを、
    前記複数のマイクロホンから前記受音信号を取得する取得部と、
    前記受音信号が、前記マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを、受音信号に基づいて判断する音声判断部と、
    前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出部と、
    前記音声判断部において前記受音信号が前記背景雑音信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、前記複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンの間の信号レベルの差を減少させる利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の前記利得値として設定する設定部と、
    前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算部と
    して機能させるためのプログラム。
  9. 予め定められた規定位置に設置された複数のマイクロホンの受音信号を処理する受音信号処理をコンピュータに実行させるための受音信号処理プログラムであって、
    前記コンピュータを、
    前記複数のマイクロホンから前記受音信号を取得する取得部と、
    前記受音信号が、マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを、受音信号に基づいて判断する音声判断部と、
    前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出部と、
    前記音声判断部において前記受音信号が音声信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンそれぞれが受音する複数の受音信号の信号レベルのバランスを、予め記憶部に記憶されている、前記規定位置に設置された複数のマイクロホンによる前記複数の受音信号の理想的なレベルバランスに近づける利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の利得値として設定する設定部と、
    前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算部と
    して機能させるためのプログラム。
  10. 複数のマイクロホンが音声を受音する受音ステップと、
    音声判断部が、前記複数のマイクロホンが受音した受音信号が、前記マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを、受音信号に基づいて判断する音声判断ステップと、
    信号レベル算出部が、前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出ステップと、
    設定部が、前記音声判断ステップにおいて前記受音信号が前記背景雑音信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、前記複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンの間の信号レベルの差を減少させる利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の前記利得値として設定する設定ステップと、
    演算部が、前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算ステップと
    を有することを特徴とする受音信号処理方法。
  11. 予め定められた規定位置に設置された複数のマイクロホンが音声を受音する受音ステップと、
    音声判断部が、前記複数のマイクロホンが受信した受音信号が、マイクロホンに近接する近接音源からの音声を含む音声信号であるか、前記音声を含まない背景雑音信号かを、受音信号に基づいて判断する音声判断ステップと、
    信号レベル算出部が、前記複数のマイクロホンが受音した複数の受音信号それぞれの信号レベルを算出する信号レベル算出ステップと、
    設定部が、前記音声判断ステップにおいて前記受音信号が音声信号であると判断された場合に、前記複数の受音信号それぞれの信号レベルに基づいて、複数のマイクロホンのうち少なくとも1つのマイクロホンの前記受音信号に乗じるべき利得値であって、前記複数のマイクロホンそれぞれが受音する複数の受音信号の信号レベルのバランスを、予め記憶部に記憶されている、前記規定位置に設置された複数のマイクロホンによる前記複数の受音信号の理想的なレベルバランスに近づける利得値を決定し、前記利得値を、前記少なくとも1つのマイクロホンの前記受音信号の利得値として設定する設定ステップと、
    演算部が、前記少なくとも1つのマイクロホンの前記受音信号に、前記設定部によって設定された前記利得値を乗じる演算ステップと
    を有することを特徴とする受音信号処理方法。
JP2009074900A 2009-03-25 2009-03-25 受音信号処理装置、方法およびプログラム Expired - Fee Related JP5197458B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009074900A JP5197458B2 (ja) 2009-03-25 2009-03-25 受音信号処理装置、方法およびプログラム
PCT/JP2009/067709 WO2010109708A1 (ja) 2009-03-25 2009-10-13 受音信号処理装置、方法およびプログラム
US13/219,844 US8503697B2 (en) 2009-03-25 2011-08-29 Pickup signal processing apparatus, method, and program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009074900A JP5197458B2 (ja) 2009-03-25 2009-03-25 受音信号処理装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010232717A true JP2010232717A (ja) 2010-10-14
JP5197458B2 JP5197458B2 (ja) 2013-05-15

Family

ID=42780411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009074900A Expired - Fee Related JP5197458B2 (ja) 2009-03-25 2009-03-25 受音信号処理装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US8503697B2 (ja)
JP (1) JP5197458B2 (ja)
WO (1) WO2010109708A1 (ja)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120303363A1 (en) * 2011-05-26 2012-11-29 Skype Limited Processing Audio Signals
JP2013061421A (ja) * 2011-09-12 2013-04-04 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
JP2013126026A (ja) * 2011-12-13 2013-06-24 Oki Electric Ind Co Ltd 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム
JP2013167805A (ja) * 2012-02-16 2013-08-29 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
JP2013182044A (ja) * 2012-02-29 2013-09-12 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
JP2014502109A (ja) * 2010-12-03 2014-01-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 到来方向推定から幾何学的な情報の抽出による音取得
JP2014068052A (ja) * 2012-09-24 2014-04-17 Oki Electric Ind Co Ltd 音響信号処理装置、方法及びプログラム
JP2014075674A (ja) * 2012-10-03 2014-04-24 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
US8824693B2 (en) 2011-09-30 2014-09-02 Skype Processing audio signals
JP2014168188A (ja) * 2013-02-28 2014-09-11 Fujitsu Ltd マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置
US8891785B2 (en) 2011-09-30 2014-11-18 Skype Processing signals
US8981994B2 (en) 2011-09-30 2015-03-17 Skype Processing signals
US9031257B2 (en) 2011-09-30 2015-05-12 Skype Processing signals
US9042574B2 (en) 2011-09-30 2015-05-26 Skype Processing audio signals
US9042575B2 (en) 2011-12-08 2015-05-26 Skype Processing audio signals
US9042573B2 (en) 2011-09-30 2015-05-26 Skype Processing signals
JP2015517116A (ja) * 2012-08-07 2015-06-18 ゴーアテック インコーポレイテッドGoertek Inc 携帯電話に適用する音声強調方法及び装置
WO2015114674A1 (ja) * 2014-01-28 2015-08-06 三菱電機株式会社 集音装置、集音装置の入力信号補正方法および移動機器情報システム
US9111543B2 (en) 2011-11-25 2015-08-18 Skype Processing signals
JP2015179983A (ja) * 2014-03-19 2015-10-08 沖電気工業株式会社 背景雑音区間推定装置及びプログラム
JP2015179981A (ja) * 2014-03-19 2015-10-08 沖電気工業株式会社 音声信号処理装置及びプログラム
US9210504B2 (en) 2011-11-18 2015-12-08 Skype Processing audio signals
US9269367B2 (en) 2011-07-05 2016-02-23 Skype Limited Processing audio signals during a communication event
JP2016526324A (ja) * 2013-05-16 2016-09-01 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数のマイクロフォンのための自動利得整合
JP2017150917A (ja) * 2016-02-24 2017-08-31 国際航業株式会社 海洋レーダによる津波検知装置、海洋レーダによる津波検知プログラム、及び海洋レーダの性能検証方法
US9847097B2 (en) 2015-09-28 2017-12-19 Fujitsu Limited Audio signal processing device, audio signal processing method, and recording medium storing a program
JP2018032931A (ja) * 2016-08-23 2018-03-01 沖電気工業株式会社 音響信号処理装置、プログラム及び方法
JP2018031897A (ja) * 2016-08-24 2018-03-01 富士通株式会社 利得調整装置、利得調整方法および利得調整プログラム
JPWO2018174135A1 (ja) * 2017-03-24 2020-01-16 ヤマハ株式会社 収音装置および収音方法
WO2022211300A1 (ko) * 2021-04-01 2022-10-06 삼성전자 주식회사 전자 장치 및 전자 장치에서 카메라 전환에 기반한 리코딩 방법
JP7435948B2 (ja) 2019-11-18 2024-02-21 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 収音装置、収音方法及び収音プログラム

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2339574B1 (en) * 2009-11-20 2013-03-13 Nxp B.V. Speech detector
US8879749B2 (en) * 2010-07-02 2014-11-04 Panasonic Corporation Directional microphone device and directivity control method
US9549251B2 (en) * 2011-03-25 2017-01-17 Invensense, Inc. Distributed automatic level control for a microphone array
JP6267860B2 (ja) * 2011-11-28 2018-01-24 三星電子株式会社Samsung Electronics Co.,Ltd. 音声信号送信装置、音声信号受信装置及びその方法
CN104067632B (zh) * 2012-01-27 2018-04-06 共荣工程株式会社 指向性控制方法及装置
JP5738488B2 (ja) * 2012-08-06 2015-06-24 三菱電機株式会社 ビームフォーミング装置
US9210505B2 (en) * 2013-01-29 2015-12-08 2236008 Ontario Inc. Maintaining spatial stability utilizing common gain coefficient
US9516418B2 (en) 2013-01-29 2016-12-06 2236008 Ontario Inc. Sound field spatial stabilizer
US9099973B2 (en) * 2013-06-20 2015-08-04 2236008 Ontario Inc. Sound field spatial stabilizer with structured noise compensation
US9106196B2 (en) * 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation
US9271100B2 (en) * 2013-06-20 2016-02-23 2236008 Ontario Inc. Sound field spatial stabilizer with spectral coherence compensation
US9414175B2 (en) 2013-07-03 2016-08-09 Robert Bosch Gmbh Microphone test procedure
GB2520029A (en) 2013-11-06 2015-05-13 Nokia Technologies Oy Detection of a microphone
CN107925819B (zh) * 2015-08-24 2020-10-02 雅马哈株式会社 声音拾取装置和声音拾取方法
US9640197B1 (en) 2016-03-22 2017-05-02 International Business Machines Corporation Extraction of target speeches
WO2018173267A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
US11575987B2 (en) * 2017-05-30 2023-02-07 Northeastern University Underwater ultrasonic communication system and method
WO2019012587A1 (ja) * 2017-07-10 2019-01-17 ヤマハ株式会社 ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム
US10219072B1 (en) * 2017-08-25 2019-02-26 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Dual microphone near field voice enhancement
CN107509155B (zh) * 2017-09-29 2020-07-24 广州视源电子科技股份有限公司 一种阵列麦克风的校正方法、装置、设备及存储介质
CN110556096A (zh) * 2018-05-31 2019-12-10 技嘉科技股份有限公司 声控显示装置及获取语音信号的方法
JP7404664B2 (ja) * 2019-06-07 2023-12-26 ヤマハ株式会社 音声処理装置及び音声処理方法
JP2021043337A (ja) * 2019-09-11 2021-03-18 オンキヨーホームエンターテイメント株式会社 システム
EP3823315B1 (en) * 2019-11-18 2024-01-10 Panasonic Intellectual Property Corporation of America Sound pickup device, sound pickup method, and sound pickup program
CN112860067B (zh) * 2021-02-07 2024-04-19 深圳市今视通数码科技有限公司 基于麦克风阵列的魔镜调整方法、系统及存储介质
JP2022183849A (ja) * 2021-05-31 2022-12-13 キヤノン株式会社 音声処理装置、制御方法、およびプログラム
EP4156719A1 (en) * 2021-09-28 2023-03-29 GN Audio A/S Audio device with microphone sensitivity compensator
CN114095835B (zh) * 2021-11-18 2023-06-09 歌尔科技有限公司 耳机通透模式的控制方法、装置、耳机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0416900A (ja) * 1990-05-10 1992-01-21 Clarion Co Ltd 音声認識装置
JPH0595596A (ja) * 1991-09-30 1993-04-16 Mazda Motor Corp 雑音低減装置
JP2007129373A (ja) * 2005-11-01 2007-05-24 Univ Waseda マイクロフォン感度調整方法およびそのシステム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58181099A (ja) * 1982-04-16 1983-10-22 三菱電機株式会社 音声識別装置
US5291558A (en) * 1992-04-09 1994-03-01 Rane Corporation Automatic level control of multiple audio signal sources
US5708722A (en) * 1996-01-16 1998-01-13 Lucent Technologies Inc. Microphone expansion for background noise reduction
US5983183A (en) * 1997-07-07 1999-11-09 General Data Comm, Inc. Audio automatic gain control system
EP1161852A2 (de) * 1999-03-19 2001-12-12 Siemens Aktiengesellschaft Verfahren und einrichtung zum aufnehmen und bearbeiten von audiosignalen in einer störschallerfüllten umgebung
JP2004507141A (ja) * 2000-08-14 2004-03-04 クリアー オーディオ リミテッド 音声強調システム
US7349547B1 (en) * 2001-11-20 2008-03-25 Plantronics, Inc. Noise masking communications apparatus
JP4162604B2 (ja) * 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法
US8290181B2 (en) * 2005-03-19 2012-10-16 Microsoft Corporation Automatic audio gain control for concurrent capture applications
US8116485B2 (en) * 2005-05-16 2012-02-14 Qnx Software Systems Co Adaptive gain control system
US7587056B2 (en) * 2006-09-14 2009-09-08 Fortemedia, Inc. Small array microphone apparatus and noise suppression methods thereof
US8184816B2 (en) * 2008-03-18 2012-05-22 Qualcomm Incorporated Systems and methods for detecting wind noise using multiple audio sources

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0416900A (ja) * 1990-05-10 1992-01-21 Clarion Co Ltd 音声認識装置
JPH0595596A (ja) * 1991-09-30 1993-04-16 Mazda Motor Corp 雑音低減装置
JP2007129373A (ja) * 2005-11-01 2007-05-24 Univ Waseda マイクロフォン感度調整方法およびそのシステム

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9396731B2 (en) 2010-12-03 2016-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Sound acquisition via the extraction of geometrical information from direction of arrival estimates
US10109282B2 (en) 2010-12-03 2018-10-23 Friedrich-Alexander-Universitaet Erlangen-Nuernberg Apparatus and method for geometry-based spatial audio coding
JP2014502109A (ja) * 2010-12-03 2014-01-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 到来方向推定から幾何学的な情報の抽出による音取得
US20120303363A1 (en) * 2011-05-26 2012-11-29 Skype Limited Processing Audio Signals
US9269367B2 (en) 2011-07-05 2016-02-23 Skype Limited Processing audio signals during a communication event
JP2013061421A (ja) * 2011-09-12 2013-04-04 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
US9426566B2 (en) 2011-09-12 2016-08-23 Oki Electric Industry Co., Ltd. Apparatus and method for suppressing noise from voice signal by adaptively updating Wiener filter coefficient by means of coherence
US8891785B2 (en) 2011-09-30 2014-11-18 Skype Processing signals
US9042573B2 (en) 2011-09-30 2015-05-26 Skype Processing signals
US8981994B2 (en) 2011-09-30 2015-03-17 Skype Processing signals
US9031257B2 (en) 2011-09-30 2015-05-12 Skype Processing signals
US9042574B2 (en) 2011-09-30 2015-05-26 Skype Processing audio signals
US8824693B2 (en) 2011-09-30 2014-09-02 Skype Processing audio signals
US9210504B2 (en) 2011-11-18 2015-12-08 Skype Processing audio signals
US9111543B2 (en) 2011-11-25 2015-08-18 Skype Processing signals
US9042575B2 (en) 2011-12-08 2015-05-26 Skype Processing audio signals
JP2013126026A (ja) * 2011-12-13 2013-06-24 Oki Electric Ind Co Ltd 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム
JP2013167805A (ja) * 2012-02-16 2013-08-29 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
JP2013182044A (ja) * 2012-02-29 2013-09-12 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
JP2015517116A (ja) * 2012-08-07 2015-06-18 ゴーアテック インコーポレイテッドGoertek Inc 携帯電話に適用する音声強調方法及び装置
JP2014068052A (ja) * 2012-09-24 2014-04-17 Oki Electric Ind Co Ltd 音響信号処理装置、方法及びプログラム
JP2014075674A (ja) * 2012-10-03 2014-04-24 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
JP2014168188A (ja) * 2013-02-28 2014-09-11 Fujitsu Ltd マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置
JP2016526324A (ja) * 2013-05-16 2016-09-01 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数のマイクロフォンのための自動利得整合
US9674607B2 (en) 2014-01-28 2017-06-06 Mitsubishi Electric Corporation Sound collecting apparatus, correction method of input signal of sound collecting apparatus, and mobile equipment information system
WO2015114674A1 (ja) * 2014-01-28 2015-08-06 三菱電機株式会社 集音装置、集音装置の入力信号補正方法および移動機器情報システム
CN105830152A (zh) * 2014-01-28 2016-08-03 三菱电机株式会社 集音装置、集音装置的输入信号校正方法以及移动设备信息系统
JP6048596B2 (ja) * 2014-01-28 2016-12-21 三菱電機株式会社 集音装置、集音装置の入力信号補正方法および移動機器情報システム
JPWO2015114674A1 (ja) * 2014-01-28 2017-03-23 三菱電機株式会社 集音装置、集音装置の入力信号補正方法および移動機器情報システム
JP2015179981A (ja) * 2014-03-19 2015-10-08 沖電気工業株式会社 音声信号処理装置及びプログラム
JP2015179983A (ja) * 2014-03-19 2015-10-08 沖電気工業株式会社 背景雑音区間推定装置及びプログラム
US9847097B2 (en) 2015-09-28 2017-12-19 Fujitsu Limited Audio signal processing device, audio signal processing method, and recording medium storing a program
JP2017150917A (ja) * 2016-02-24 2017-08-31 国際航業株式会社 海洋レーダによる津波検知装置、海洋レーダによる津波検知プログラム、及び海洋レーダの性能検証方法
JP2018032931A (ja) * 2016-08-23 2018-03-01 沖電気工業株式会社 音響信号処理装置、プログラム及び方法
JP2018031897A (ja) * 2016-08-24 2018-03-01 富士通株式会社 利得調整装置、利得調整方法および利得調整プログラム
JPWO2018174135A1 (ja) * 2017-03-24 2020-01-16 ヤマハ株式会社 収音装置および収音方法
JP7435948B2 (ja) 2019-11-18 2024-02-21 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 収音装置、収音方法及び収音プログラム
WO2022211300A1 (ko) * 2021-04-01 2022-10-06 삼성전자 주식회사 전자 장치 및 전자 장치에서 카메라 전환에 기반한 리코딩 방법

Also Published As

Publication number Publication date
JP5197458B2 (ja) 2013-05-15
US8503697B2 (en) 2013-08-06
WO2010109708A1 (ja) 2010-09-30
US20110313763A1 (en) 2011-12-22

Similar Documents

Publication Publication Date Title
JP5197458B2 (ja) 受音信号処理装置、方法およびプログラム
DK3253075T3 (en) A HEARING EQUIPMENT INCLUDING A RADIO FORM FILTER UNIT CONTAINING AN EXCHANGE UNIT
US8345890B2 (en) System and method for utilizing inter-microphone level differences for speech enhancement
US8509451B2 (en) Noise suppressing device, noise suppressing controller, noise suppressing method and recording medium
US9269367B2 (en) Processing audio signals during a communication event
US9159335B2 (en) Apparatus and method for noise estimation, and noise reduction apparatus employing the same
JP5305743B2 (ja) 音響処理装置及びその方法
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
US8861746B2 (en) Sound processing apparatus, sound processing method, and program
JP5331201B2 (ja) オーディオ処理
US7218741B2 (en) System and method for adaptive multi-sensor arrays
KR101601197B1 (ko) 마이크로폰 어레이의 이득 조정 장치 및 방법
JP2019503107A (ja) 音響信号を向上させるための音響信号処理装置および方法
JP2017503388A5 (ja)
CN106558315B (zh) 异质麦克风自动增益校准方法及系统
TW200818959A (en) Small array microphone apparatus and noise supression method thereof
JP5737342B2 (ja) 収音装置及びプログラム
US11900920B2 (en) Sound pickup device, sound pickup method, and non-transitory computer readable recording medium storing sound pickup program
KR20090037845A (ko) 혼합 신호로부터 목표 음원 신호를 추출하는 방법 및 장치
JP5903921B2 (ja) ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
JP5240026B2 (ja) マイクロホンアレイにおけるマイクロホンの感度を補正する装置、この装置を含んだマイクロホンアレイシステム、およびプログラム
JP2004078021A (ja) 収音方法、収音装置、および収音プログラム
WO2010061505A1 (ja) 発話音声検出装置
KR101203926B1 (ko) 다중 빔포머를 이용한 잡음 방향 탐지 방법
US8406432B2 (en) Apparatus and method for automatic gain control using phase information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees