JP2013170936A - 音源位置判定装置、音源位置判定方法、プログラム - Google Patents

音源位置判定装置、音源位置判定方法、プログラム Download PDF

Info

Publication number
JP2013170936A
JP2013170936A JP2012035131A JP2012035131A JP2013170936A JP 2013170936 A JP2013170936 A JP 2013170936A JP 2012035131 A JP2012035131 A JP 2012035131A JP 2012035131 A JP2012035131 A JP 2012035131A JP 2013170936 A JP2013170936 A JP 2013170936A
Authority
JP
Japan
Prior art keywords
sound source
feature amount
position determination
source position
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012035131A
Other languages
English (en)
Other versions
JP5815435B2 (ja
Inventor
Kenichi Noguchi
賢一 野口
Suehiro Shimauchi
末廣 島内
Naka Omuro
仲 大室
Yoichi Haneda
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012035131A priority Critical patent/JP5815435B2/ja
Publication of JP2013170936A publication Critical patent/JP2013170936A/ja
Application granted granted Critical
Publication of JP5815435B2 publication Critical patent/JP5815435B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

【課題】1チャネルのマイクロホン入力信号のみを用いて、音源がマイクロホンの近くにあるか、遠くにあるかを判定することができる音源位置判定装置、音源位置判定方法、プログラムを提供する。
【解決手段】入力信号をフレーム毎に分割するフレーム分割部20と、入力信号に含まれる音源信号の直接音と間接音の到達時間差に基づく特徴量を計算する特徴量計算部30と、計算された特徴量と、予め定めたしきい値とを比較して音源とマイクロホンの遠近を判定する遠近判定部40とを備える。
【選択図】図1

Description

本発明は、音源がマイクロホンの近くにあるか、遠くにあるかを判定する音源位置判定装置、音源位置判定方法、プログラムに関する。
音源とマイクロホン間の距離を測定する方法として、例えば、特許文献1に示される方法がある。この方法では、複数のマイクロホンからなるマイクロホンアレーを用いて、入力信号に含まれる直接音と間接音(残響音)との比である直間比を求める。直間比はマイクロホンと音源の距離が大きくなるほど、単調に減少する特性を持つため、直間比を求めることで、マイクロホンと音源の距離を測定することができる。
特開2011−53062号公報
しかしながら、特許文献1では、複数のマイクロホンからなるマイクロホンアレーを用いて、音源とマイクロホン間の距離を測定するため、複数マイクロホンデバイスのコスト、ディジタル信号に変換するためのA/D変換器のコスト、複数チャネル信号を処理するための演算量コスト等の装置コストが大きくなってしまうことが問題であった。そこで、本発明では、1チャネルマイクロホン入力信号のみを用いて、音源がマイクロホンの近くにあるか、遠くにあるかを判定することができる音源位置判定装置、音源位置判定方法、プログラムを提供することを目的とする。
本発明の音源位置判定装置は、フレーム分割部と、特徴量計算部と、第1遠近判定部とを備える。フレーム分割部は、入力信号をフレーム毎に分割する。特徴量計算部は、入力信号に含まれる音源信号の直接音と間接音の到達時間差に基づく特徴量を計算する。第1遠近判定部は、計算された特徴量と予め定めたしきい値を比較して音源とマイクロホンの遠近を判定する。
本発明の音源位置判定装置によれば、1チャネルマイクロホン入力信号のみを用いて、音源がマイクロホンの近くにあるか、遠くにあるかを判定することができる。
実施例1の音源位置判定装置の構成を示すブロック図。 実施例1の音源位置判定装置の動作を示すフローチャート。 マイクロホンの近くで発生する衝撃音の時間波形及びパワースペクトル時間変化量を示す図。 マイクロホンの遠くで発生する衝撃音の時間波形及びパワースペクトル時間変化量を示す図。 実施例2の音源位置判定装置の構成を示すブロック図。 実施例2の音源位置判定装置の動作を示すフローチャート。 音源とマイクロホンと壁面の配置について例示する図。 直接・間接音の到達時間差と音源−マイクロホン間距離との関係を示す図。 実施例3の音源位置判定装置の構成を示すブロック図。 実施例3のパワー比特徴量計算部の構成を示すブロック図。 実施例3の音源位置判定装置の動作を示すフローチャート。 実施例4の音源位置判定装置の構成を示すブロック図。 実施例4の音源位置判定装置の動作を示すフローチャート。 実施例5の音源位置判定装置の構成を示すブロック図。 実施例5の音源位置判定装置の動作を示すフローチャート。 実施例5の特徴量データベースの例を示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
<本発明のポイント>
マイクロホンの近くで音が発生した場合、直接音と間接音の到達時間差が生じるため、音発生直後においては、マイクロホン入力信号のほとんどの成分は直接音であり、間接音(残響音)は少ない。一方、マイクロホンの遠くで音が発生した場合、直接音と間接音の到達時間差が少ないため、音発生直後においてもマイクロホン入力信号は直接音と間接音の混合信号となる。本発明では、この差を利用して、音が発生した直後の信号を分析することで、直接音と間接音の特徴から、音がマイクロホンの近くで発生しているか、遠くで発生しているかを判定する。
図1、図2、図3、図4を参照して、実施例1の音源位置判定装置について詳細に説明する。図1は本実施例の音源位置判定装置1の構成を示すブロック図である。図2は本実施例の音源位置判定装置1の動作を示すフローチャートである。図3はマイクロホンの近くで発生する衝撃音の時間波形及びパワースペクトル時間変化量を示す図である。図4はマイクロホンの遠くで発生する衝撃音の時間波形及びパワースペクトル時間変化量を示す図である。
本実施例の音源位置判定装置1は、マイクロホン10と、フレーム分割部20と、特徴量計算部30と、遠近判定部40と、しきい値記憶部50とを備える。特徴量計算部30は、周波数領域変換手段31と、パワースペクトル計算手段32と、パワースペクトル記憶手段33と、パワースペクトル変化計算手段34とを備える。
本実施例では、物をたたく音や、ぶつかる音といった衝撃音を対象として、発生した音がマイクロホンの近くで発生しているか、遠くで発生しているかを判別する例について説明する。
マイクロホン10は音を収音する(S10)。例えばマイクロホン入力信号は、サンプリング周波数16kHz、量子化ビット数16bitのディジタル信号とすることができる。マイクロホン入力信号x(n)は、フレーム分割部20に入力される。ここで、nは離散時間を表す。フレーム分割部20は、マイクロホン入力信号をフレーム毎に分割し、フレーム分割信号x(n)とする(S20)。
ここで、tはフレーム番号を表す。フレーム長は例えば256サンプル(16ms)とすることができる。フレームシフト幅は例えば10サンプル(0.625ms)とする。後段では、あるフレーム内で求めた特徴量と、次フレーム内で求めた特徴量を比較し判定を行うため、フレーム長とフレームシフト幅は、判定精度に大きく寄与する。衝撃音を対象とする時、1フレーム内に衝撃音が収まる長さ以上に設定した方が、精度が高い。しかし、フレーム長が長い場合、処理遅延も大きくなり、問題となる。また、フレーム長を必要以上に長くすると、フレーム内に対象とする音以外の音が混入し、精度低下の要因となる。例えば、衝撃音の長さを10msと仮定して、フレーム長を16msとすることができる。本方法では対象音が微細な時間に変化するか否かについて着目する。よって、フレームシフト幅は短くし、細かく分析した方が望ましい。しかし、フレームシフト幅を短くすることは、処理量の増加につながる。判別精度を保ち、短すぎないフレームシフト幅として、例えば10サンプル程度を選択すればよい。フレーム分割部20で分割された信号x(n)は、周波数領域変換手段31に送られる。周波数領域変換手段31は、マイクロホン入力信号を周波数領域信号X(k)に変換する(S31)。ここで、kは周波数を表す。周波数領域への変換方法として例えば、フレーム分割信号x(n)にハニング窓wを乗じ、FFT(Fast_Fourier_Transform:高速フーリエ変換)を行えばよい。周波数領域信号X(k)は、パワースペクトル計算手段32に送られる。パワースペクトル計算手段32は、周波数領域信号からパワースペクトル信号を計算する(S32)。具体的には、次式によりパワースペクトル信号P(k)が計算される。パワースペクトルを計算することで、フレーム間における信号の位相変化を無視できる利点がある。
Figure 2013170936
パワースペクトル信号P(k)はパワースペクトル記憶手段33に送られる。パワースペクトル記憶手段33は、予め定めた時間区間ごとにパワースペクトル信号P(k)を記憶し、所定時間前の時間区間のパワースペクトル信号を出力する(S33)。ここでは、1フレーム分のパワースペクトル信号を記憶することとし、現処理フレーム番号がtの時、1フレーム前のパワースペクトル信号Pt−1(k)を出力する。次に、パワースペクトル変化計算手段34は、現在のパワースペクトル信号と、所定時間前の時間区間のパワースペクトル信号とからパワースペクトル時間変化量を計算する(S34)。ここでは現処理フレームのパワースペクトル信号P(k)と1フレーム前のパワースペクトル信号Pt−1(k)を入力し、パワースペクトル時間変化量Sを出力する。次式に示す計算式で、パワースペクトルの時間変化を求める。ここで、Nはkの最大値であり、ナイキスト周波数に相当する値とする。
Figure 2013170936
遠近判定部40は、パワースペクトル時間変化量Sを入力とし、当該パワースペクトル時間変化量Sと予め定めたしきい値を比較して音源とマイクロホンの遠近を判定する(S40)。図3に示すように、マイクロホンの近くで発生する衝撃音では、音が発生した瞬間、パワースペクトル時間変化量Sが急激に大きくなり、その後、急激に小さくなる。さらに、音が消える瞬間に再度急激に大きくなる。音が発生した直後の、パワースペクトル時間変化量が急激に小さくなるところに着目する。図4に示すように、マイクロホンの遠くで発生する衝撃音では、パワースペクトル時間変化量が急激に小さくなることはない。
定常雑音のみがある場合、パワースペクトル時間変化量はほぼ一定の値となるため、この値Sを基準として、しきい値係数Tを乗じて、遠近判定のためのしきい値Tを決定する。パワースペクトル時間変化量がしきい値Tを下回る時、音はマイクロホンの近くで発生していると判定し、それ以外では、音はマイクロホンの遠くで発生していると判定し、結果を出力する。ここでは、定常雑音のみがある場合のパワースペクトル時間変化量平均値に0.7を乗じた値をしきい値Tとして設定する。これにより、マイクロホンからの距離が1m以内で発生した音かどうかを判別可能とする。
しきい値はあらかじめ決めた固定値としてもよい。この場合は計算コストを削減することができる。また、パワースペクトル時間変化量Sが急激に大きくなるところを捉え、その直後の信号をしきい値で判定しても良い。これにより、判定の精度を高めることができる。
このように、本実施例の音源位置判定装置1によれば、1チャネルマイクロホン入力信号のみを用いて、発生する音がマイクロホンの近くで発生しているか、遠くで発生しているかを判定することができる。これにより、マイクロホンアレーを用いる方法と比較して、装置コストを削減できる。汎用端末である携帯電話機やパソコンなどのマイクロホンを有する機器のほとんどは、単一マイクロホンを搭載しているため、本発明をこれらの機器に用いることで、内蔵の単一マイクロホンを用いた処理が可能となるため、マイクロホンアレーを外部機器とした接続が不要となり、導入コストを大幅に下げることができる。
次に、図5、図6、図7、図8を参照して、実施例2の音源位置判定装置について詳細に説明する。図5は本実施例の音源位置判定装置2の構成を示すブロック図である。図6は本実施例の音源位置判定装置2の動作を示すフローチャートである。図7は音源とマイクロホンと壁面の配置について例示する図である。図8は直接・間接音の到達時間差と音源−マイクロホン間距離との関係を示す図である。
本実施例の音源位置判定装置2は、マイクロホン10と、フレーム分割部20と、周波数特徴量計算部230と、遠近判定部40と、しきい値記憶部50とを備える。周波数特徴量計算部230以外の構成は、実施例1の音源位置判定装置1において同一番号を付した各構成部と同じ動作をするため説明を割愛する。
本実施例の音源位置判定装置2は、直接音と間接音の到達時間差を利用して、直接音の成分が支配的な信号を捉えることで、音源の遠近を判定する。直接音と間接音の到達時間差はマイクロホンと音源が存在する部屋の特性に依存する。ここで、図7に示す配置を考える。音源とマイクロホンの直線距離はa[m]とし、一番近い壁との法線距離をb[m]とする。音速をc[m/s]とする。直接音と、最初の間接音の到達時間差T[s]は、次式で求められる。
Figure 2013170936
ここで、b=1[m]とし、c=340[m/s]としたときの、直接音と間接音の到達時間差T[s]と音源とマイクロホンの距離a[m]の関係を図8に示す。音源とマイクロホンの距離が0.5mの時、直接音と間接音の到達時間差は5msとなる。この5msの間、マイクロホン入力信号は直接音のみであり、5ms以降は直接音と間接音の混合音となる。この到達時間差はわずかであり、時間方向の微細な分析が必要となる。よって、フレーム分割ではシフト幅を小さくすることで、時間方向の微細な分析を行う。
周波数特徴量計算部230は、入力信号の全帯域パワーに対する高帯域のパワーの割合を特徴量として計算する(S230)。本実施例の音源位置判定装置2は、音源からの信号が到達した直後のマイクロホン入力信号の先頭または先頭に近いフレームにおいて、直接音のみか、直接音と間接音の混合信号かによって、音源の遠近判定を行うことを特徴とする。本実施例では直接音と間接音の特徴の差を利用している。ここでは、周波数特性の差に着目する。直接音と間接音の混合信号では、インパルス応答の周波数特性により、高域が減衰する。このことから、周波数特徴量計算部230は、例えばフーリエ変換により、周波数特性を求め、周波数全体に対する2kHz以上の高域のパワーの割合を特徴量として計算すればよい。周波数特性を求める計算としては、他に参考非特許文献1記載の音声スペクトル分析法を用いてもよい。
次に、遠近判定部40では、実施例1と同様に、周波数特徴量計算部230で計算された特徴量に対して、定められたしきい値と比較を行うことで、遠近の判定を行う(S40)。しきい値は、あらかじめ実験的に求める。
(参考非特許文献1)古井貞熙著、「ディジタル音声処理」、東海大学出版会、1985年、P.39
このように、本実施例の音源位置判定装置2によれば、入力信号の全帯域パワーに対する高帯域のパワーの割合を特徴量として、当該特徴量をしきい値と比較することにより、実施例1と同様の効果を得ることができる。
次に、図9、図10、図11を参照して、実施例3の音源位置判定装置について詳細に説明する。図9は本実施例の音源位置判定装置3の構成を示すブロック図である。図10は本実施例のパワー比特徴量計算部330の構成を示すブロック図である。図11は本実施例の音源位置判定装置3の動作を示すフローチャートである。
本実施例の音源位置判定装置3は、マイクロホン10と、フレーム分割部20と、パワー比特徴量計算部330と、遠近判定部40と、しきい値記憶部50とを備える。パワー比特徴量計算部330は、入力信号切り出し手段331と、離散フーリエ変換手段332と、パワー計算手段333と、基本周波数推定手段334と、周波数成分パワー計算手段335と、非周期成分パワー計算手段336と、除算手段337とを備える。パワー比特徴量計算部330以外の構成は、実施例1の音源位置判定装置1において同一番号を付した各構成部と同じ動作をするため説明を割愛する。
本実施例では、直接音と間接音の特徴の差として、直接音のみの時は、音の調波性、スパース性がよく表れるが、直接音と間接音の混合信号では信号の重なり合いから、音の調波性、スパース性が表れなくなるといった知見を利用する。本実施例では、入力信号に含まれる調波成分の割合を特徴量として用いる。信号に含まれる調波成分の割合を表す値として、参考特許文献1に記載の周期性成分パワーと非周期性成分パワーとのパワー比を用いる。パワー比特徴量計算部330は、入力信号を周期性成分パワーと非周期性成分パワーとのパワー比に変換する(S330)。
詳細には、ステップS20におけるフレーム分割の後、入力信号切り出し手段331は、入力信号の一部区間を切り出す(SS331)。離散フーリエ変換手段332は、切り出された入力信号を離散フーリエ変換して、周波数スペクトルを求める(SS332)。パワー計算手段333は、切り出された入力信号のパワーを計算する(SS333)。基本周波数推定手段334は、切り出された入力信号の基本周波数を推定する(SS334)。周期性成分パワー計算手段335は、切り出された入力信号の周波数スペクトル、パワー、推定した基本周波数から周期性成分パワーを求める(SS335)。非周期性成分パワー計算手段336は、切り出された入力信号のパワーから周期性成分パワーを減算して、非周期成分パワーを求める(SS336)。除算手段337は、周期性成分パワーと非周期成分パワーを除算することで、周期性成分パワーと非周期性成分パワーとのパワー比を求める(SS337)。
次に、遠近判定部40では、実施例2と同様に、パワー比特徴量計算部330で計算された特徴量に対して、定められたしきい値と比較を行うことで、遠近の判定を行う(S40)。しきい値は、あらかじめ実験的に求める。
このように、本実施例の音源位置判定装置3によれば、入力信号に含まれる調波成分の割合を特徴量として、当該特徴量をしきい値と比較することにより、実施例1、2と同様の効果を得ることができる。
次に、図12、図13を参照して、実施例4の音源位置判定装置について詳細に説明する。図12は本実施例の音源位置判定装置4の構成を示すブロック図である。図13は本実施例の音源位置判定装置4の動作を示すフローチャートである。
本実施例の音源位置判定装置4は、マイクロホン10と、フレーム分割部20と、周波数特徴量計算部230と、特徴量記憶部433と、特徴量変化計算部434と、遠近判定部440と、しきい値記憶部50とを備える。特徴量記憶部433と、特徴量変化計算部434と、遠近判定部440以外の構成は、実施例1の音源位置判定装置1、実施例2の音源位置判定装置2において同一番号を付した各構成部と同じ動作をするため説明を割愛する。本実施例では、特徴量の時間変化に着目する。本実施例では、特徴量を時間の関数として表し、その関数の傾きを特徴量変化として計算する。計算された特徴量は特徴量記憶部433に記憶される(S433)。特徴量変化計算部434では、特徴量記憶部433に記憶された過去の特徴量の値と現在の特徴量を比較し、特徴量変化を計算する(S434)。実施例2、3で挙げた特徴量である高域のパワーの割合、周期性成分パワーと非周期性成分パワーとのパワー比は、いずれも音が発生した後に減少する。本実施例では、減少の傾きを特徴量変化として計算する。遠近判定部440では、特徴量変化計算部434で計算された特徴量変化に対して、定められたしきい値と比較を行うことで、遠近の判定を行う(S440)。前述の減少の傾きに対しては、傾きが大きい時に、音はマイクロホンの近くで発生していると判定する。しきい値は、あらかじめ実験的に求める。
[変形例1]
次に、引き続き図12、図13を参照して、実施例4の変形例の音源位置判定装置について詳細に説明する。本変形例の音源位置判定装置4’は、実施例4における周波数特徴量計算部230を、実施例3におけるパワー比特徴量計算部330に置き換えたものである。前述したように、実施例3で挙げた特徴量である周期性成分パワーと非周期性成分パワーとのパワー比は、音が発生した後に減少するため、この減少の傾きを特徴量変化として、本変形例のように、周波数特徴量計算部230を、パワー比特徴量計算部330に置き換えても、同様の効果を達成できる。
このように、本実施例(本変形例)の音源位置判定装置4(4’)によれば、入力信号から得た特徴量の時間変化に着目して、当該特徴量変化をしきい値と比較することにより、実施例1、2、3と同様の効果を得ることができる。
次に、図14、図15、図16を参照して、実施例5の音源位置判定装置について詳細に説明する。図14は本実施例の音源位置判定装置5の構成を示すブロック図である。図15は本実施例の音源位置判定装置5の動作を示すフローチャートである。図16は本実施例の特徴量データベース550の例を示す図である。
本実施例の音源位置判定装置5は、マイクロホン10と、フレーム分割部20と、特徴量計算部30と、距離判定部540と、特徴量データベース550とを備える。特徴量計算部30は、周波数領域変換手段31と、パワースペクトル計算手段32と、パワースペクトル記憶手段33と、パワースペクトル変化計算手段34とを備える。距離判定部540と、特徴量データベース550以外の構成は、実施例1の音源位置判定装置1において同一番号を付した各構成部と同じ動作をするため説明を割愛する。
本実施例では、実施例1の構成を拡張し、遠近の判定だけでなく、マイクロホンと音源の距離を判定する。距離判定部540は、パワースペクトル時間変化量Sを入力とし、定常雑音のみがある場合はパワースペクトル時間変化量Sを計算し、あらかじめ様々なパワースペクトル時間変化量Sとマイクロホンと音源の距離の関係を対応させて記憶した特徴量データベース550と照合する。特徴量データベース550の例を図16に示す。距離判定部540は、パワースペクトル時間変化量Sと特徴量データベース550との照合により、測定されたパワースペクトル時間変化量Sと最も近いデータベース上のパワースペクトル時間変化量データと対応する距離値を、マイクロホンと音源の距離の推定値として出力する(S540)。
なお、本実施例では、パワースペクトル時間変化量Sを特徴量として、当該特徴量と距離の関係をデータベース化して予め記憶しておき、当該データベースを参照することで、音源とマイクロホンの距離を推定することとしたが、上述の特徴量はパワースペクトル時間変化量Sに限定されない。例えば、実施例2のように入力信号の全帯域パワーに対する高帯域のパワーの割合を特徴量としても良い。実施例3のように周期性成分パワーと非周期性成分パワーとのパワー比を特徴量としても良い。実施例4のように特徴量変化を用いることとし、特徴量変化とマイクロホン−音源間距離とを対応させてデータベース化しておくこととしても良い。
なお、実施例1〜5において、マイクロホン入力を例に説明したが、本発明の入力信号としては、これに限られず、マイクロホン入力の替わりに、あらかじめ録音された音声ファイルを入力としてもよい。また、入力信号に対して、ハイパス、ローパス、バンドパスフィルタフィルタを適用した信号を用いても良い。
このように、本実施例の音源位置判定装置5によれば、入力信号とマイクロホン−音源間距離の関係を予めデータベース化しておくことでマイクロホンと音源との距離を測定することができる。
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。
なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1. 入力信号をフレーム毎に分割するフレーム分割部と、
    入力信号に含まれる音源信号の直接音と間接音の到達時間差に基づく特徴量を計算する特徴量計算部と、
    前記計算された特徴量と予め定めたしきい値を比較して音源とマイクロホンの遠近を判定する第1遠近判定部と、
    を備えることを特徴とする音源位置判定装置。
  2. 請求項1に記載の音源位置判定装置であって、
    前記特徴量がパワースペクトル時間変化量であって、
    前記特徴量計算部が、
    入力信号を周波数領域信号に変換する周波数領域変換手段と、
    前記周波数領域信号からパワースペクトル信号を計算するパワースペクトル計算手段と、
    予め定めた時間区間ごとにパワースペクトル信号を記憶し、所定時間前の時間区間のパワースペクトル信号を出力するパワースペクトル記憶手段と、
    現在のパワースペクトル信号と、前記所定時間前の時間区間のパワースペクトル信号とから前記パワースペクトル時間変化量を計算するパワースペクトル変化計算手段と、
    を備えることを特徴とする音源位置判定装置。
  3. 請求項1に記載の音源位置判定装置であって、
    前記特徴量が入力信号の全周波数帯パワーに対する高域周波数帯信号パワーの割合であること
    を特徴とする音源位置判定装置。
  4. 請求項1に記載の音源位置判定装置であって、
    前記特徴量が入力信号の入力信号に含まれる調波成分の割合であること
    を特徴とする音源位置判定装置。
  5. 請求項3または4に記載の音源位置判定装置であって、
    予め定めた時間区間ごとに特徴量を記憶し、所定時間前の時間区間の特徴量を出力する特徴量記憶部と、
    現在の特徴量と、前記所定時間前の時間区間の特徴量とから特徴量変化量を計算する特徴量変化計算部とをさらに備え、
    前記第1遠近判定部に代えて、前記特徴量変化量と予め定めたしきい値を比較して音源とマイクロホンの遠近を判定する第2遠近判定部を備えること
    を特徴とする音源位置判定装置。
  6. 請求項1から5の何れかに記載の音源位置判定装置であって、
    予め音源−マイクロホン間距離と特徴量との関係を記憶する特徴量データベースをさらに備え、
    前記第1、または第2遠近判定部に代えて、前記特徴量データベースと、前記入力信号の特徴量とを比較して音源とマイクロホンの間の距離を判定する距離判定部を備えること
    を特徴とする音源位置判定装置。
  7. 入力信号をフレーム毎に分割するフレーム分割ステップと、
    入力信号に含まれる音源信号の直接音と間接音の到達時間差に基づく特徴量を計算する特徴量計算ステップと、
    前記計算された特徴量と予め定めたしきい値を比較して音源とマイクロホンの遠近を判定する遠近判定ステップと、
    を有することを特徴とする音源位置判定方法。
  8. コンピュータを、請求項1から6の何れかに記載の音源位置判定装置として機能させるためのプログラム。
JP2012035131A 2012-02-21 2012-02-21 音源位置判定装置、音源位置判定方法、プログラム Active JP5815435B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012035131A JP5815435B2 (ja) 2012-02-21 2012-02-21 音源位置判定装置、音源位置判定方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012035131A JP5815435B2 (ja) 2012-02-21 2012-02-21 音源位置判定装置、音源位置判定方法、プログラム

Publications (2)

Publication Number Publication Date
JP2013170936A true JP2013170936A (ja) 2013-09-02
JP5815435B2 JP5815435B2 (ja) 2015-11-17

Family

ID=49264964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012035131A Active JP5815435B2 (ja) 2012-02-21 2012-02-21 音源位置判定装置、音源位置判定方法、プログラム

Country Status (1)

Country Link
JP (1) JP5815435B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103928025A (zh) * 2014-04-08 2014-07-16 华为技术有限公司 一种语音识别的方法及移动终端
WO2018173266A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
JP2020012675A (ja) * 2018-07-13 2020-01-23 株式会社東芝 検出システム、検出装置、および検出方法
WO2021204027A1 (zh) * 2020-04-08 2021-10-14 华为技术有限公司 麦克风阵列控制方法、装置、电子设备及计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323134A (ja) * 2005-05-19 2006-11-30 Nippon Telegr & Teleph Corp <Ntt> 信号抽出装置
JP2011053062A (ja) * 2009-09-01 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323134A (ja) * 2005-05-19 2006-11-30 Nippon Telegr & Teleph Corp <Ntt> 信号抽出装置
JP2011053062A (ja) * 2009-09-01 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103928025A (zh) * 2014-04-08 2014-07-16 华为技术有限公司 一种语音识别的方法及移动终端
US10621979B2 (en) 2014-04-08 2020-04-14 Huawei Technologies Co., Ltd. Speech recognition method and mobile terminal
WO2018173266A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
US11197091B2 (en) 2017-03-24 2021-12-07 Yamaha Corporation Sound pickup device and sound pickup method
US11758322B2 (en) 2017-03-24 2023-09-12 Yamaha Corporation Sound pickup device and sound pickup method
JP2020012675A (ja) * 2018-07-13 2020-01-23 株式会社東芝 検出システム、検出装置、および検出方法
US11073498B2 (en) 2018-07-13 2021-07-27 Kabushiki Kaisha Toshiba Detection system, detection device, and detection method
JP7021019B2 (ja) 2018-07-13 2022-02-16 株式会社東芝 検出システム、検出装置、および検出方法
WO2021204027A1 (zh) * 2020-04-08 2021-10-14 华为技术有限公司 麦克风阵列控制方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
JP5815435B2 (ja) 2015-11-17

Similar Documents

Publication Publication Date Title
CN110265064B (zh) 音频爆音检测方法、装置和存储介质
EP2828856B1 (en) Audio classification using harmonicity estimation
JP5387459B2 (ja) 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
JP4568733B2 (ja) 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体
JP2015500511A (ja) ハーモニシティベースの単一チャネルスピーチ品質評価
JP5598552B2 (ja) 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置
CN105118522B (zh) 噪声检测方法及装置
JP2012027186A (ja) 音声信号処理装置、音声信号処理方法及びプログラム
JP2020204772A (ja) 高調波ノイズ源からのノイズを抑制する方法、記憶媒体及び装置
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP6182895B2 (ja) 処理装置、処理方法、プログラム及び処理システム
JP4454591B2 (ja) 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
CN112309417A (zh) 风噪抑制的音频信号处理方法、装置、系统和可读介质
WO2009150894A1 (ja) 音声認識システム、音声認識方法および音声認識用プログラムが格納された記憶媒体
CN105869656B (zh) 一种语音信号清晰度的确定方法及装置
CN106847299B (zh) 延时的估计方法及装置
JP2014194437A (ja) 音声処理装置、音声処理方法および音声処理プログラム
JPWO2010106734A1 (ja) 音声信号処理装置
EP3291228B1 (en) Audio processing method, audio processing device, and audio processing program
JP6729186B2 (ja) 音声処理プログラム、音声処理方法及び音声処理装置
US20130044890A1 (en) Information processing device, information processing method and program
JP2013178458A (ja) 信号処理装置及び信号処理プログラム
CN116504264B (zh) 音频处理方法、装置、设备及存储介质
JP7275711B2 (ja) オーディオ信号の処理方法
JP2015169900A (ja) 雑音抑圧装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150924

R150 Certificate of patent or registration of utility model

Ref document number: 5815435

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150