JP2014068052A - 音響信号処理装置、方法及びプログラム - Google Patents

音響信号処理装置、方法及びプログラム Download PDF

Info

Publication number
JP2014068052A
JP2014068052A JP2012209711A JP2012209711A JP2014068052A JP 2014068052 A JP2014068052 A JP 2014068052A JP 2012209711 A JP2012209711 A JP 2012209711A JP 2012209711 A JP2012209711 A JP 2012209711A JP 2014068052 A JP2014068052 A JP 2014068052A
Authority
JP
Japan
Prior art keywords
calibration gain
signal
input acoustic
acoustic signal
coherence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012209711A
Other languages
English (en)
Other versions
JP6102144B2 (ja
Inventor
Katsuyuki Takahashi
克之 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2012209711A priority Critical patent/JP6102144B2/ja
Publication of JP2014068052A publication Critical patent/JP2014068052A/ja
Application granted granted Critical
Publication of JP6102144B2 publication Critical patent/JP6102144B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 入力音響信号が有する周波数帯域に関係なく、多チャンネル入力音響信号におけるマイク感度差を適切に校正する。
【解決手段】 入力音響信号に遅延減算処理を施して、第1、第2の所定方位に死角を有する第1、第2の指向性信号を形成し、これらの指向性信号を用いてコヒーレンスを得る。また、コヒーレンスに基づいて正面から到来する信号区間を検出する。検出された信号区間の各入力音響信号を用い、各入力音響信号のそれぞれについて同じ演算を行ってマイク感度の指標値を算出し、複数のマイク感度の指標値から目標感度を決定し、各入力音響信号のそれぞれのマイク感度の指標値と目標感度とから、各入力音響信号のそれぞれに対する校正ゲインを算出し、得られた校正ゲインで対応する入力音響信号を校正する。
【選択図】 図1

Description

本発明は音響信号処理装置、方法及びプログラムに関し、例えば、複数(多チャンネル)のマイクロホン(以下、マイクと呼ぶ)を利用している、電話やテレビ会議などの通信装置に適用し得るものである。
近年、多チャンネルのマイクを用いた音響信号、音声信号(本明細書においては、音響信号及び音声信号を併せて音響信号と呼んでいることもある)の処理技術が実現されている。このような場合、同じ型番のマイクであっても感度差があり、感度差を校正しなければ正確な音響特徴量の計算ができない。これまでは、事前にマイクの感度を測定し、感度差に応じた補正ゲインを設定したり、チャンネルごとに入力レベルを比較して平均値に一致させるような補正ゲインを自動設定したりなどの手法で対処していた。しかし、前者は手間がかかり、後者はマイクの感度差だけでなく取得した入力信号の差も埋めてしまうため、校正回路の後段で計算する音響特徴量の精度が保障されない、という課題がある。
このような課題の改善方法の一つが、入力信号のうち、マイク正面から到来する信号成分の区間でのみ入力レベルの比較を行って校正ゲインを計算する、というものである。これは、正面から到来する信号ならば各マイクと音源との距離が等しいため、マイクに到達する信号成分の音響的な特性差は微小であり、両者に発生する特性差はマイク感度のみであると期待できることを前提としている。マイクに入力される音響成分のうち特定方位から到来する信号成分のみを検出する先行技術として特許文献1に記載の技術がある。
特許文献1の記載技術は、所定の距離を離して配置された2つのマイクからそれぞれ取得した音声信号に、目的音声以外の他の音声(非目的音声)の影響を受け易い周波数帯域に対して小さい値をとる重み付きCSP(Cross−power Spectrum Phase)係数を用いて、利得調整処理及び目的音声区間の切り出し処理の少なくとも一方を行おうとしたものである。
特開2011−113044号公報
しかしながら、特許文献1の記載技術で利用される重み付きCSP係数は、所定の周波数帯域を他の周波数帯域と区別する特徴量であるため、非目的音声の周波数帯域と目的音声の周波数帯域の関係や、目的音声が有するスペクトラムによっては、マイク感度差を表す特徴量として適当でないことも生じる。
そのため、入力される音響信号が有する周波数帯域に関係なく、多チャンネルのマイクからの複数の音響信号におけるマイク感度差を測定し、校正できる音響信号処理装置、方法及びプログラムが望まれている。
第1の本発明は、複数の入力音響信号におけるマイク感度の相違を校正する音響信号処理装置において、(1)入力音響信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、(2)入力音響信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、(3)上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、(4)上記コヒーレンスに基づいて正面から到来する信号区間を検出する正面到来信号検出部と、(5)正面から到来する信号区間の各入力音響信号を用い、各入力音響信号のそれぞれについて同じ演算を行ってマイク感度の指標値を算出し、算出された複数のマイク感度の指標値から目標感度を決定し、各入力音響信号のそれぞれのマイク感度の指標値と目標感度とから、各入力音響信号のそれぞれに対する校正ゲインを算出する校正ゲイン計算部と、(6)得られた校正ゲインで対応する入力音響信号を校正する複数の校正ゲイン乗算部とを備えることを特徴とする。
第2の本発明は、複数の入力音響信号におけるマイク感度の相違を校正する音響信号処理方法において、(1)第1の指向性形成部は、入力音響信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、(2)第2の指向性形成部は、入力音響信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、(3)コヒーレンス計算部は、上記第1及び第2の指向性信号を用いてコヒーレンスを得、(4)正面到来信号検出部は、上記コヒーレンスに基づいて正面から到来する信号区間を検出し、(5)校正ゲイン計算部は、正面から到来する信号区間の各入力音響信号を用い、各入力音響信号のそれぞれについて同じ演算を行ってマイク感度の指標値を算出し、算出された複数のマイク感度の指標値から目標感度を決定し、各入力音響信号のそれぞれのマイク感度の指標値と目標感度とから、各入力音響信号のそれぞれに対する校正ゲインを算出し、(6)複数の校正ゲイン乗算部はそれぞれ、自己に与えられた校正ゲインで対応する入力音響信号を校正することを特徴とする。
第3の本発明の音響信号処理プログラムは、複数の入力音響信号におけるマイク感度の相違を校正する音響信号処理装置に搭載されるコンピュータを、(1)入力音響信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、(2)入力音響信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、(3)上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、(4)上記コヒーレンスに基づいて正面から到来する信号区間を検出する正面到来信号検出部と、(5)正面から到来する信号区間の各入力音響信号を用い、各入力音響信号のそれぞれについて同じ演算を行ってマイク感度の指標値を算出し、算出された複数のマイク感度の指標値から目標感度を決定し、各入力音響信号のそれぞれのマイク感度の指標値と目標感度とから、各入力音響信号のそれぞれに対する校正ゲインを算出する校正ゲイン計算部と、(6)得られた校正ゲインで対応する入力音響信号を校正する複数の校正ゲイン乗算部として機能させることを特徴とする。
本発明の音響信号処理装置、方法及びプログラムによれば、入力音響信号が有する周波数帯域に関係なく、多チャンネル入力音響信号におけるマイク感度差を校正することができる。
第1の実施形態に係る音響信号処理装置の構成を示すブロック図である。 第1の実施形態における各指向性形成部からの指向性信号の性質を示す説明図である。 第1の実施形態における2つの指向性形成部による指向性の特性を示す説明図である。 第1の実施形態における校正ゲイン計算部の詳細構成を示すブロック図である。 第1の実施形態における校正ゲイン計算部の動作を示すフローチャートである。 第1の実施形態の変形実施形態における校正ゲイン計算部の動作を示すフローチャートである。 第2の実施形態における校正ゲイン計算部の詳細構成を示すブロック図である。 第2の実施形態における校正ゲイン観測区間長制御部の詳細構成を示すブロック図である。 第2の実施形態における観測区間長記憶部の構成を示す説明図である。 第2の実施形態における校正ゲイン計算部の動作を示すフローチャートである。 第2の実施形態における校正ゲイン観測区間長制御部の動作を示すフローチャートである。
(A)第1の実施形態
以下、本発明による音響信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
第1の実施形態は、音響信号の到来方位に係る特徴量としてコヒーレンスを適用することにより、入力される音響信号が有する周波数帯域に関係なく、複数の音響信号におけるマイク感度差を測定し、校正しようとしたものである。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音響信号処理装置の構成を示すブロック図である。ここで、一対のマイクm_1及びm_2を除いた部分は、CPUが実行するソフトウェア(音響信号処理プログラム)として実現することも可能であるが、機能的には、図1で表すことができる。
図1において、第1の実施形態の音響信号処理装置1は、マイクm_1、m_2、FFT部10、第1指向性形成部11、第2の指向性形成部12、コヒーレンス計算部13、正面到来信号検出部14、校正ゲイン計算部15及び校正ゲイン乗算部16、17を有する。
一対のマイクm_1、m_2は、所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音響を捕捉するものである。各マイクm_1、m_2で捕捉された音響信号(入力信号)は、図示しない対応するAD変換器を介してデジタル信号s1(n)、s2(n)に変換されてFFT部10に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。
FFT部10は、マイクm_1及びm_2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
Figure 2014068052
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部10は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)をそれぞれ、対応する第1の指向性形成部11、第2の指向性形成部12に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複致の周波数f1〜fmのスペクトル成分から構成されるものである。X2(f,K)や後述するB1(f,K)及びB2(f,K)も同様である。
X1(f,K)={(f1,K),(f2,K),…,(fm,K)}
…(2)
第1の指向性形成部11は、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成するものである。第2の指向性形成部12は、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成するものである。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
Figure 2014068052
これらの式の意味を、(3)式を例に、図2及び図3を用いて説明する。図2(A)に示した方向θから音波が到来し、距離lだけ隔てて設置されている一対のマイクm_1及びm_2で捕捉されたとする。このとき、音波が一対のマイクm_1及びm_2に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をdとすると、d=l×sinθなので、音速をcとすると(5)式で与えられる。
τ=l×sinθ/c …(5)
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm_1及びm_2は図2(B)のような指向特性を持つようになる。
なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した(3)式及び(4)式である。今、一例として、到来方位θが±90度であることを想定する。すなわち、第1の指向性形成部11からの指向性信号B1(f)は、図3(A)に示すように右方向に強い指向性を有し、第2の指向性形成部12からの指向性信号B2(f)は、図3(B)に示すように左方向に強い指向性を有する。
コヒーレンス計算部13は、以上のようにして得られた指向性信号B1(f)、B2(f)に対し、(6)式、(7)式に示す演算を施すことでコヒーレンスCOHを得るものである。(6)式におけるB2(f)はB2(f)の共役複素数である。また、フレームインデックスKは、(6)式、(7)式の演算には関与しないので、(6)式、(7)式ではフレームインデックスKの記載を省略している。
Figure 2014068052
正面到来信号検出部14は、コヒーレンスCOH(K)を正面到来信号検出閾値Θと比較し、コヒーレンスCOH(K)が正面到来信号検出閾値Θより大きければ正面から到来する信号区間とみなして検出結果格納変数VAD_RES(K)に1.0を代入し、コヒーレンスCOHが正面到来信号検出閾値Θより小さければ正面以外の方位から到来する信号区間とみなして検出結果格納変数VAD_RES(K)には0.0を代入し、検出結果格納変数VAD_RES(K)を校正ゲイン計算部15に与えるものである。
ここで、コヒーレンスの大小で入力信号が正面から到来した信号か否かを判定できる理由を簡単に説明する。
コヒーレンスの概念は、コヒーレンスCOHの概念は、右から到来する信号と左から到来する信号の相関と言い換えられる(上述した(6)式はある周波数成分についての相関を算出する式であり、(7)式は全ての周波数成分の相関値の平均を計算している)。従って、コヒーレンスCOHが小さい場合とは、2つの指向性信号B1及びB2の相関が小さい場合であり、反対にコヒーレンスCOHが大きい場合とは相関が大きい場合と言い換えることができる。そして、相関が小さい場合の入力信号は、入力到来方位が右又は左のどちらかに大きく偏っている、つまり、正面以外から到来している信号といえる。一方、コヒーレンスCOHの値が大きい場合は、到来方位の偏りがないため、入力信号が正面から到来する場合であるといえる。このようにコヒーレンスの大小で入力信号の到来方位が正面か否かを判定することができる。
因みに、校正ゲインを決定する段階の2つの入力信号は、一対のマイクm_1及びm_2の感度差がそのまま入り込んでおり、計算されたコヒーレンスCOHは厳密に言えば正確ではないが、マイクの感度差程度では、入力音響信号が正面から到来する場合にはコヒーレンスCOHは大きく、正面以外から到来する場合にはコヒーレンスCOHは小さいという特性は維持されるので、正面から到来する信号の検出には不都合は生じない。
校正ゲイン計算部15は、検出結果格納変数VAD_RES(K)、入力信号分析フレームFRAME1(K)、FRAME2(K)から、各入力信号s1(n)、s2(n)に対する校正ゲインCALIB_GAIN_1CH、CALIB_GAIN_2CHを計算し、校正ゲインCALIB_GAIN_1CHを校正ゲイン乗算部16に与え、校正ゲインCALIB_GAIN_2CHを校正ゲイン乗算部17に与えるものである。
校正ゲイン乗算部16は、入力信号s1(n)に校正ゲインCALIB_GAIN_1CHを乗算して乗算後の信号y1(n)を出力するものである。
校正ゲイン乗算部17は、入力信号s2(n)に校正ゲインCALIB_GAIN_2CHを乗算して乗算後の信号y2(n)を出力するものである。
校正ゲインが乗算された信号y1(n)及びy2(n)は、一対のマイクm_1及びm_2の感度差が是正(校正)されたものとなっている。
図4は、校正ゲイン計算部15の詳細構成を示すブロック図である。
図4において、校正ゲイン計算部15は、検出結果・入力信号受信部21、校正ゲイン計算実行判定部22、校正ゲイン計算実行部23、記憶部24及び校正ゲイン送信部25を有する。
検出結果・入力信号受信部21は、検出結果格納変数VAD_RES(K)、入力信号分析フレームFRAME1(K)、FRAME2(K)を取り込むものである。
校正ゲイン計算実行判定部22は、検出結果格納変数VAD_RES(K)が1.0ならば(入力音響の到来方位がほぼ正面ならば)、校正ゲイン計算実行部23が校正ゲインを計算するように制御し、検出結果格納変数VAD_RES(K)が0.0ならば(入力音響の到来方位が正面以外ならば)、校正ゲインを計算させずに、記憶部24に格納されている値を校正ゲインとして設定するように制御するものである。
校正ゲイン計算実行部23は、校正ゲイン計算実行判定部22が校正ゲインの計算を実行するフレームであることを指示したときに、入力信号分析フレームFRAME1(K)、FRAME2(K)に基づいて、入力信号s1(n)に対する校正ゲインCALIB_GAIN_1CH、及び、入力信号s2(n)に対する校正ゲインCALIB_GAIN_2CHを計算するものである。第1の実施形態の校正ゲイン計算実行部23は、(8)式〜(12)式に従って、校正ゲインCALIB_GAIN_1CH及びCALIB_GAIN_2CHを計算する。
Figure 2014068052
(8)式は、マイクm_1が捕捉した入力信号s1(n)に係る現フレーム(K番目のフレーム)の全ての構成要素の絶対値の平均LEVEL_1CHを算出しているものであり、この算出した値LEVEL_1CHはマイクm_1の感度を反映した値とみなすことができる。(9)式は、マイクm_2が捕捉した入力信号s2(n)に係る現フレーム(K番目のフレーム)の全ての構成要素の絶対値の平均LEVEL_2CHを算出しているものであり、この算出した値LEVEL_2CHはマイクm_2の感度を反映した値とみなすことができる。なお、例えば、所定フレーム数での各フレームの構成要素の総和値を、マイク感度を反映した値LEVEL_1CH、LEVEL_2CHとして用いるようにしても良く、また例えば、検出結果格納変数VAD_RES(K)が1.0であった最新のP(P≦K)個のフレームを構成する全ての要素(信号成分)の絶対値の平均を、マイク感度を反映した値LEVEL_1CH、LEVEL_2CHとして用いるようにしても良い。後者の場合、検出結果格納変数VAD_RES(K)が1.0であった最新のP−1個のフレームの構成要素の絶対値の総和値を保存しておくことにより、現フレーム(K番目のフレーム)FRAME1(K)、FRAME2(K)の情報が与えられたときに容易にマイク感度を反映した値LEVEL_1CH、LEVEL_2CHを計算することができる。
上述したように長期間の信号成分の絶対値の平均や総和値を算出することにより、瞬間的な入力信号の変動の影響を抑制してマイク感度を反映した値を算出することができる。(8)式及び(9)式は、マイク感度を反映した値の算出式の一例であり、上述したように、その他、種々の算出式が適用できる。但し、マイクm_1のマイク感度を反映した値LEVEL_1CHの算出式と、マイクm_2のマイク感度を反映した値LEVEL_2CHの算出式とが同じ算出式であることを要する。
(10)式は2つのマイクm_1及びm_2の感度LEVEL_1CH及びLEVEL_2CHの平均AVE_LEVELを、校正後のマイクm_1及びm_2の目標感度として算出している。なお、2つのマイクm_1及びm_2の感度LEVEL_1CH及びLEVEL_2CHの大きい方の値若しくは小さい方の値を目標感度とするようにしても良い。
(11)式は、その右辺の分母LEVEL_1CHを左辺に移行した式を考えると理解できるように、マイクm_1の感度LEVEL_1CHに校正ゲインCALIB_GAIN_1CHを乗算した値が目標感度AVE_LEVELになるように、校正ゲインCALIB_GAIN_1CHを定める式になっている。同様に、(12)式は、その右辺の分母LEVEL_2CHを左辺に移行した式を考えると理解できるように、マイクm_2の感度LEVEL_2CHに校正ゲインCALIB_GAIN_2CHを乗算した値が目標感度AVE_LEVELになるように、校正ゲインCALIB_GAIN_2CHを定める式になっている。
記憶部24は、校正ゲイン計算実行部23が校正ゲインを計算しない場合に適用する校正ゲインCALIB_GAIN_1CH(=INIT_GAIN_1CH)及びCALIB_GAIN_2CH(=INIT_GAIN_2CH)を記憶しているものである。このような記憶校正ゲインINIT_GAIN_1CH、INIT_GAIN_2CHとして、校正させない値1.0を適用しても良く、また、校正ゲイン計算実行部23が計算した直近の値を適用するようにしても良い。
校正ゲイン送信部25は、校正ゲイン計算実行部23が計算で得た校正ゲインCALIB_GAIN_1CH及びCALIB_GAIN_2CH、若しくは、記憶部24から読み出された校正ゲインINIT_GAIN_1CH及びINIT_GAIN_2CHをそれぞれ、対応する校正ゲイン乗算部16、17に与えるものである。
(A−2)第1の実施形態の動作
次に、第1の実施形態の音響信号処理装置1の動作を、図面を参照しながら、全体動作、校正ゲイン計算部15における詳細動作の順に説明する。
一対のマイクm_1及びm_2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部10によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換された後、第1及び第2の指向性形成部11及び12のそれぞれによって、所定の方位に死角を有する指向性信号B1(f,K)、B2(f,K)が生成される。そして、コヒーレンス計算部13において、指向性信号B1(f,K)及びB2(f,K)を適用して、(6)式及び(7)式の演算が実行され、コヒーレンスCOH(K)が算出される。
校正ゲイン計算部15においては、検出結果格納変数VAD_RES(K)、入力信号分析フレームFRAME1(K)、FRAME2(K)から、各入力信号s1(n)、s2(n)に対する校正ゲインCALIB_GAIN_1CH、CALIB_GAIN_2CHが定えられる。校正ゲインCALIB_GAIN_1CHは校正ゲイン乗算部16に与えられ、入力信号s1(n)に校正ゲインCALIB_GAIN_1CHが乗算されて、マイクm_1の感度の平均感度からのずれが是正(校正)された信号y1(n)が出力される。一方、校正ゲインCALIB_GAIN_2CHは校正ゲイン乗算部17に与えられ、入力信号s2(n)に校正ゲインCALIB_GAIN_2CHが乗算されて、マイクm_2の感度の平均感度からのずれが是正(校正)された信号y2(n)が出力される。
次に、校正ゲイン計算部15の動作を説明する。図5は、校正ゲイン計算部15の動作を示すフローチャートである。
新たなフレームの処理に移行したときには、検出結果格納変数VAD_RES(K)、入力信号分析フレームFRAME1(K)及びFRAME2(K)が、校正ゲイン計算部15に取り込まれる(ステップS100)。そして、検出結果格納変数VAD_RES(K)が1.0か否かが判定される(ステップS101)。
検出結果格納変数VAD_RES(K)が1.0の場合には、入力信号分析フレームFRAME1(K)及びFRAME2(K)が適用されて、上述した(8)式〜(12)式に従って、入力信号s1(n)に対する校正ゲインCALIB_GAIN_1CH、及び、入力信号s2(n)に対する校正ゲインCALIB_GAIN_2CHが計算される(ステップS102)。なお、校正ゲイン計算実行部23が計算した直近の値を記憶部24に記憶させる方法を採用している場合には、ステップS102において、計算された校正ゲインCALIB_GAIN_1CH、及び、CALIB_GAIN_2CHが記憶部24に書き込まれることも実行される。
一方、検出結果格納変数VAD_RES(K)が0.0の場合には、記憶部24に格納されている値INIT_GAIN_1CH及びINIT_GAIN_2CHが、現フレームについての入力信号s1(n)に対する校正ゲインCALIB_GAIN_1CH、及び、入力信号s2(n)に対する校正ゲインCALIB_GAIN_2CHとして取り出される(ステップS103)。
そして、計算で得られた校正ゲインCALIB_GAIN_1CH及びCALIB_GAIN_2CH、若しくは、記憶部24から読み出された校正ゲインINIT_GAIN_1CH及びINIT_GAIN_2CHがそれぞれ、対応する校正ゲイン乗算部16、17に与えられる(ステップS104)。
その後、処理フレームを規定するパラメータKを1インクリメントして、次のフレームの処理に進む(ステップS105)。
(A−3)第1の実施形態の効果
上記第1の実施形態によれば、コヒーレンスを適用して音響信号の到来方位が正面か否かを判定し、到来方位が正面のときの入力音響信号を用いて校正ゲインを得るようにしたので、入力音響信号が有する周波数帯域に関係なく、マイク感度差を適切に校正することができる。
これにより、第1の実施形態の音響信号処理装置を、テレビ会議システムや携帯電話などの通信装置に適用することで、通話音質の向上が期待できる。
(A−4)第1の実施形態の変形実施形態
ところで、マイク感度差は固定のものとみなすことができ、従って、校正ゲインは一度計算した後は変動することはないとみなすことができる。このような状況で、定常的に校正ゲインを更新し続けることは演算量の無駄となるので、途中から更新を停止するようにしても良い。
この場合には、校正ゲイン計算部13の校正ゲイン計算実行判定部22で、例えば、校正ゲインの計算を実施したフレーム数をCOUNTERという変数を用いて観測し、変数COUNTERが所定の閾値Tを上回った後は、校正ゲインの計算を行うことなく、常に記憶部24を照合するのみとする、という制御を追加すれば良い。図6は、このような変形実施形態における校正ゲイン計算部13の動作を示すフローチャートであり、上述した図5との同一、対応ステップには同一符号を付して示している。第1の実施形態との変更点は、上述の通り、ステップS101の処理に変数COUNTERによる判定が追加されたことと、ステップS102の処理に変数COUNTERの1インクリメント処理が追加されたことである。
(B)第2の実施形態
次に、本発明による音響信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態に至った考え方
音響信号処理装置をテレビ会議システムや携帯電話などの通信装置に適用する場合、入力信号は、正面から到来する目的話者の音声(目的音声)、正面以外から到来する目的話者以外の人の声(妨害音声)、背景雑音の3種に大別できる。妨害音声は音声なので、通常の音声区間検出方法では目的音声と区別できないのだが、到来方位によって値が変化するコヒーレンスによる判定ならば目的音声と区別することができる。しかし、目的音声と妨害音声とが重畳された区間は目的音声と判定される。この状態で、第1の実施形態の方法で校正ゲインを計算すると、妨害音声の成分も反映された状態で校正ゲインが計算されてしまう。この結果、「入力信号s1(n)及びs2(n)の特性差はマイク感度差のみに由来し、音響的な特性差は微小」という前提が崩れ、校正ゲインの推定精度が低下してしまう。妨害音の到来方位が正面に近ければ、精度の劣化度は小さいが、到来方位が右や左に偏るほどに精度の劣化が大きくなってしまう。
第2の実施形態は、妨害音声が存在する場合であっても、校正ゲインの推定精度の劣化を防止しようとしたものである。
精度の劣化は校正ゲインを計算する区間を長くすることで軽減できる。そこで、第2の実施形態では、非目的音声区間(妨害音声、背景雑音区間)でのコヒーレンスCOHから、妨害音声の到来方位を推定し、到来方位に応じて適切な校正区間長Tを設定できるようにした。
(B−2)第2の実施形態の構成
第2の実施形態に係る音響信号処理装置も、その全体構成は、第1の実施形態の説明で用いた図1で表すことができる。なお、図1における符号1Aは、第2の実施形態の音響信号処理装置を表している。
第2の実施形態の音響信号処理装置1Aは、校正ゲイン計算部(第2の実施形態では符号15Aを用いる)が第1の実施形態と異なっており、その他の構成要素、すなわち、マイクm_1、m_2、FFT部10、第1指向性形成部11、第2の指向性形成部12、コヒーレンス計算部13、正面到来信号検出部14及び校正ゲイン乗算部16、17は、第1の実施形態のものと同様であり、その説明は省略する。
図7は、第2の実施形態の校正ゲイン計算部15Aの詳細構成を示すブロック図である。
図7において、校正ゲイン計算部15Aは、検出結果・入力信号受信部21A、校正ゲイン計算実行判定部22A、校正ゲイン計算実行部23、記憶部24、校正ゲイン送信部25及び校正ゲイン観測区間長制御部26を有する。校正ゲイン計算実行部23、記憶部24及び校正ゲイン送信部25は、第1の実施形態のものと同様なものであり、その説明は省略する。
検出結果・入力信号受信部21Aは、検出結果格納変数VAD_RES(K)、入力信号分析フレームFRAME1(K)、FRAME2(K)に加え、コヒーレンスCOH(K)を取り込むものである。
校正ゲイン観測区間長制御部26は、非目的音声区間のコヒーレンスに基づいて、後述するようにして校正ゲイン観測区間長Tを定めて、校正ゲイン計算実行判定部22Aに与えるものである。
校正ゲイン計算実行判定部22Aは、校正ゲイン観測区間長Tを閾値として設定し、校正ゲイン観測区間長Tを超えたフレームについては、記憶部24から校正ゲインCALIB_GAIN_1CH、CALIB_GAIN_2CHを読み出すように制御するものである(図6参照)。
図8は、第2の実施形態の校正ゲイン観測区間長制御部26の詳細構成を示すブロック図である。
図8において、校正ゲイン観測区間長制御部26は、コヒーレンス・検出結果受信部31、非目的音声コヒーレンス平均処理実施判定部32、非目的音声コヒーレンス平均計算部33、校正ゲイン観測区間長照合部34、観測区間長記憶部35及び校正ゲイン観測区間長送信部36を有する。
コヒーレンス・検出結果受信部31は、コヒーレンスCOH(K)と検出結果VAD_RES(K)を取得するものである。
非目的音声コヒーレンス平均処理実施判定部32は、検出結果VAD_RES(K)が0.0か否かを確認し、検出結果VAD_RES(K)が0.0のフレームならば非目的音区間として、非目的音声コヒーレンス平均計算部33及び校正ゲイン観測区間長照合部34による処理を実施させ、検出結果VAD_RES(K)が1.0のフレームならば、非目的音声コヒーレンス平均計算部33及び校正ゲイン観測区間長照合部34による処理を実施させないように制御するものである。
非目的音声コヒーレンス平均計算部33は、現フレーム区間が非目的音声区間であれば、(13)式に従って、非目的音声区間におけるコヒーレンスの平均値を計算し直し、現フレーム区間が目的音声区間であれば非目的音声区間におけるコヒーレンスの平均値は更新せず、前フレームの平均値を流用するものである。
AVE_COH(K)=δ×COH(K)+(1.0−δ)×AVE_COH(K−1) (0.0<δ<1.0) …(13)
(13)式は、現フレーム区間(動作開始時点から数えてK番目のフレーム)の入力音響に対するコヒーレンスCOH(K)と、直前フレーム区間で得られた平均値AVE_COH(K−1)との重み付け加算平均値を計算しており、δの値の大小で、瞬時値COH(K)の平均値への寄与度を調整することができる。仮に、δを0に近い小さい値に設定した場合には、瞬時値の平均値への寄与度が小さくなるので、平均値AVE_COH(K)におけるコヒーレンスCOH(K)の変動の影響を抑制できる。また、δが1に近い値であれば、瞬時値の寄与度が高まるので、平均の効果を弱めることができる。
観測区間長記憶部35は、非目的音声区間におけるコヒーレンス平均値と校正ゲイン観測区間長との対応関係が記憶しているものである。図9は、観測区間長記憶部35の構成を示す説明図である。図9の例では、コヒーレンス平均値AVE_COH(K)がD以上C未満の範囲では校正ゲイン観測区間長としてγが対応付けられ、コヒーレンス平均値AVE_COH(K)がC以上B未満の範囲では校正ゲイン観測区間長としてβ(<γ)が対応付けられ、コヒーレンス平均値AVE_COH(K)がB以上A未満の範囲では校正ゲイン観測区間長としてα(<β)が対応付けられている。すなわち、コヒーレンス平均値AVE_COH(K)が小さくなればなるほど(妨害音の到来方位が正面からずれればずれるほど)、校正ゲイン観測区間長Tを長くするようになされている。
コヒーレンスは到来方位によってレンジが異なるため、コヒーレンスの平均値と到来方位を対応付けることができる。すなわち、コヒーレンス平均値AVE_COH(K)が得られれば到来方位を推定できる。今、妨害音声の到来方位を知りたいので、検出結果VAD_RES(K)が0.0の区間、すなわち、非目的音声区間を検出し、当該区間でのコヒーレンス平均値を算出している。そして、妨害音の到来方位と直結した特徴量であるコヒーレンスの平均値と観測区間長を対応付け、この対応関係に基づいて適切な観測区間長を取り出すようにしている。
因みに、校正ゲイン観測区間長Tを非常に長い値に固定した場合、正面から大きくずれた方位からの妨害音の存在による校正ゲインの計算精度の低下を防止できるが、その反面、妨害音がない状態や正面近くからの妨害音がある場合において、校正ゲインが適切になった以降も長期に渡って無駄な計算を行う。そこで、第2の実施形態においては、妨害音の到来方位に応じて、校正ゲイン観測区間長Tを制御することとした。
校正ゲイン観測区間長照合部34は、非目的音声コヒーレンス平均計算部33が計算した非目的音声区間におけるコヒーレンス平均値AVE_COH(K)をキーとして観測区間長記憶部35を照合し、校正ゲイン観測区間長Tを得るものである。
校正ゲイン観測区間長送信部36は、校正ゲイン観測区間長Tを校正ゲイン計算実行判定部22Aに与えるものである。
(B−3)第2の実施形態の動作
次に、第2の実施形態の音響信号処理装置1Aの動作を、図面を参照しながら、校正ゲイン計算部15Aにおける詳細動作、校正ゲイン観測区間長制御部26における詳細動作の順に説明する。
図10は、第2の実施形態の校正ゲイン計算部15Aの動作を示すフローチャートであり、上述した図6との同一、対応ステップには同一符号を付して示している。
新たなフレームの処理に移行したときには、検出結果格納変数VAD_RES(K)、入力信号分析フレームFRAME1(K)、FRAME2(K)及びコヒーレンスCOH(K)が、校正ゲイン計算部15Aに取り込まれる(ステップS100)。
次に、校正ゲイン観測区間長Tが定められて設定される(ステップS106)。そして、検出結果格納変数VAD_RES(K)が1.0で、かつ、変数COUNTERが閾値(校正ゲイン観測区間長)T以下であるか判定される(ステップS101)。この閾値Tは上述したようにステップS106で設定された値を用いる。
検出結果格納変数VAD_RES(K)が1.0で、かつ、変数COUNTERが閾値(校正ゲイン観測区間長)T以下の場合には、入力信号分析フレームFRAME1(K)及びFRAME2(K)が適用されて、上述した(8)式〜(12)式に従って、入力信号s1(n)に対する校正ゲインCALIB_GAIN_1CH、及び、入力信号s2(n)に対する校正ゲインCALIB_GAIN_2CHが計算され、また、変数COUNTERが1インクリメントされる(ステップS102)。
一方、検出結果格納変数VAD_RES(K)が0.0、若しくは、変数COUNTERが閾値Tを超えている、の一方が成立した場合には、記憶部24に格納されている値INIT_GAIN_1CH及びINIT_GAIN_2CHが、現フレームについての入力信号s1(n)に対する校正ゲインCALIB_GAIN_1CH、及び、入力信号s2(n)に対する校正ゲインCALIB_GAIN_2CHとして取り出される(ステップS103)。
そして、計算で得られた校正ゲインCALIB_GAIN_1CH及びCALIB_GAIN_2CH、若しくは、記憶部24から読み出された校正ゲインINIT_GAIN_1CH及びINIT_GAIN_2CHがそれぞれ、対応する校正ゲイン乗算部16、17に与えられる(ステップS104)。
その後、処理フレームを規定するパラメータKを1インクリメントして、次のフレームの処理に進む(ステップS105)。
次に、校正ゲイン観測区間長制御部26における詳細動作を、図11のフローチャートを参照しながら説明する。
新たなフレームの処理に移行したときには、検出結果格納変数VAD_RES(K)及びコヒーレンスCOH(K)が、校正ゲイン観測区間長制御部26に取り込まれる(ステップS200)。そして、検出結果格納変数VAD_RES(K)が0.0か否かが判定される(ステップS201)。
検出結果格納変数VAD_RES(K)が0.0であれば、非目的音声区間におけるコヒーレンス平均値AVE_COH(K)が、現フレームのコヒーレンスCOH(K)を適用した上述した(13)式に従って算出され(ステップS202)、一方、検出結果格納変数VAD_RES(K)が1.0であれば、直前フレームのコヒーレンス平均値AVE_COH(K−1)を、現フレームにおけるコヒーレンス平均値AVE_COH(K)としてそのまま適用される(ステップS203)。
そして、現フレームにおけるコヒーレンス平均値AVE_COH(K)をキーとして、観測区間長記憶部35が照合され、校正ゲイン観測区間長Tが得られる(ステップS204)。
その後、処理フレームを規定するパラメータKを1インクリメントして、次のフレームの処理に進む(ステップS205)。
なお、以上では、校正ゲイン観測区間長Tをフレーム毎に更新する場合を示したが、必ずしもフレーム毎に更新する必要はなく、校正ゲイン観測区間長Tを一度決定したら本機能を停止させるようにしても良く、あるいは、停止期間が所定期間になるごと(例えば300フレームごと)に校正ゲイン観測区間長Tの決定動作を再開させるようにしても良く、校正ゲイン観測区間長Tの決定に関し、装置利用者が任意に調整できるようにしても良い。
(B−4)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態と同様な効果に加え、以下のような効果を奏することができる。すなわち、第2の実施形態によれば、到来方位に応じて校正ゲイン観測区間長を最適値に設定できるので、妨害音が重畳していても校正ゲインの計算誤差を軽減することができる。
これにより、第1の実施形態の音響信号処理装置を、テレビ会議システムや携帯電話などの通信装置に適用することで、通話音質の向上が期待できる。
(C)他の実施形態
上記実施形態では、校正されていない入力信号をFFT部10に入力させるものを示したが、計算した校正ゲインによって校正された入力信号がFFT部10に入力させるようにし(フィードバック校正とし)、入力信号s1(n)、s2(n)にそれぞれ校正ゲインを乗算した校正後の入力信号を用いて校正ゲインを計算する構成とするようにしても良い。これにより、校正ゲイン計算の回数が増すごとに得られる校正ゲインの精度を高めることができる。この場合においては、フィードバックによって過去のフレームの情報が反映されるので、上述した(8)式及び(9)式を適用して、現フレームの全ての構成要素の絶対値の平均(LEVEL_1CH、LEVEL_2CH)を算出するようにすれば良い。
第2の実施形態(や第1の実施形態の変形実施形態)では、予め定めた校正ゲイン観測区間長Tによって校正ゲイン計算の終了判定を行っているが、これに限らず、例えば、校正ゲインの値が収束したときに校正ゲインの計算を終了させるようにしても良い。更新前後の校正ゲインの差が一定値以下になったことを、校正ゲインの値が収束したと捉えるようにしても良い。
上記各実施形態の説明では、マイクm_1、m_2以外の構成要素は、マイク感度差の校正のためだけに設けられているように説明したが、マイクm_1、m_2以外の構成要素を他の目的のために流用するようにしても良い。例えば、校正ゲイン乗算部16、17を、ボイススイッチ用の乗算部として併用し、ボイススイッチ用の係数と校正ゲインとを乗算した値を、併用する乗算部に与えるようにしても良い。
上記第2の実施形態では、テーブル構成の記憶部を利用して、校正ゲイン観測区間長を取得するものを示したが、コヒーレンス平均値から対応する校正ゲイン観測区間長を取得する方法は、変換テーブルを利用する方法に限定されず、例えば、変換関数を利用する方法であっても良い。
上記各実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良く、逆に、時間領域の信号で処理していた処理を、可能ならば周波数領域の信号で処理するようにしても良い。
上記各実施形態では、一対のマイクが捕捉した信号を直ちに処理する場合を示したが、本発明の処理対象の音響信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音響信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音響信号を処理する場合にも、本発明を適用することができる。
上記各実施形態においては、マイクが2本の2チャンネル音響信号を処理する装置を示したが、これより多いチャンネル数の音響信号を処理する装置に対しても、本発明の技術思想を適用することができる。この場合において、FFT部10へは多チャンネルの中から選定した2チャンネルの信号を入力させ、校正ゲインは各チャンネルについて算出するようにしても良く、目標感度は、各チャンネルの感度の平均値とすれば良い。
1、1A…音響信号処理装置、m_1、m_2…マイク、10…FFT部、11…第1指向性形成部、12…第2の指向性形成部、13…コヒーレンス計算部、14…正面到来信号検出部、15、15A…校正ゲイン計算部、16、17…校正ゲイン乗算部、21、21A…検出結果・入力信号受信部、22、22A…校正ゲイン計算実行判定部、23…校正ゲイン計算実行部、24…記憶部、25…校正ゲイン送信部、26…校正ゲイン観測区間長制御部。

Claims (7)

  1. 複数の入力音響信号におけるマイク感度の相違を校正する音響信号処理装置において、
    入力音響信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
    入力音響信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
    上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
    上記コヒーレンスに基づいて正面から到来する信号区間を検出する正面到来信号検出部と、
    正面から到来する信号区間の各入力音響信号を用い、各入力音響信号のそれぞれについて同じ演算を行ってマイク感度の指標値を算出し、算出された複数のマイク感度の指標値から目標感度を決定し、各入力音響信号のそれぞれのマイク感度の指標値と目標感度とから、各入力音響信号のそれぞれに対する校正ゲインを算出する校正ゲイン計算部と、
    得られた校正ゲインで対応する入力音響信号を校正する複数の校正ゲイン乗算部と
    を備えることを特徴とする音響信号処理装置。
  2. 上記校正ゲイン計算部は
    上記正面到来信号検出部が正面から到来する信号区間ではないと検出した区間の上記コヒーレンスに基づいて、校正ゲインの観測区間長を定める校正ゲイン観測区間長決定部と、
    校正ゲインの観測区間長内の正面から到来する信号区間において、校正ゲインの算出を実行させ、校正ゲインの観測区間長を超えた信号区間、並びに、校正ゲインの観測区間長内の正面以外から到来する信号区間において、校正ゲインの算出を実行させないように制御する校正ゲイン計算実行判定部と、
    校正ゲインを記憶する校正ゲイン記憶部と、
    校正ゲインの算出を実行させる信号区間において、校正ゲインを算出して出力すると共に、算出した校正ゲインを上記校正ゲイン記憶部に記憶させ、校正ゲインの算出を実行させない信号区間において、上記校正ゲイン記憶部から校正ゲインを読み出して出力する校正ゲイン計算実行部と
    を有することを特徴とする請求項1に記載の音響信号処理装置。
  3. 上記校正ゲイン観測区間長制御部は、
    上記正面到来信号検出部が正面から到来する信号区間ではないと検出した区間の上記コヒーレンスの平均値を得るコヒーレンス平均計算部と、
    コヒーレンスの平均値の段階と校正ゲインの観測区間長との対応関係を記憶している観測区間長記憶部と、
    上記コヒーレンス平均計算部が求めたコヒーレンスの平均値が属する段階の校正ゲインの観測区間長を上記観測区間長記憶部から取得する校正ゲイン観測区間長照合部と
    を有することを特徴とする請求項2に記載の音響信号処理装置。
  4. 上記校正ゲイン計算部は、上記各入力音響信号のそれぞれについて、その入力音響信号における複数の信号成分の絶対値の平均値を、その入力音響信号に係るマイク感度の指標値として算出することを特徴とする請求項1〜3のいずれかに記載の音響信号処理装置。
  5. 上記校正ゲイン計算部は、算出された複数のマイク感度の指標値の平均値を目標感度に決定し、決定した目標感度を、上記各入力音響信号のそれぞれに係るマイク感度の指標値で除算することにより、上記各入力音響信号のそれぞれに対する校正ゲインを算出することを特徴とする請求項1〜4のいずれかに記載の音響信号処理装置。
  6. 複数の入力音響信号におけるマイク感度の相違を校正する音響信号処理方法において、
    第1の指向性形成部は、入力音響信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
    第2の指向性形成部は、入力音響信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
    コヒーレンス計算部は、上記第1及び第2の指向性信号を用いてコヒーレンスを得、
    正面到来信号検出部は、上記コヒーレンスに基づいて正面から到来する信号区間を検出し、
    校正ゲイン計算部は、正面から到来する信号区間の各入力音響信号を用い、各入力音響信号のそれぞれについて同じ演算を行ってマイク感度の指標値を算出し、算出された複数のマイク感度の指標値から目標感度を決定し、各入力音響信号のそれぞれのマイク感度の指標値と目標感度とから、各入力音響信号のそれぞれに対する校正ゲインを算出し、
    複数の校正ゲイン乗算部はそれぞれ、自己に与えられた校正ゲインで対応する入力音響信号を校正する
    ことを特徴とする音響信号処理方法。
  7. 複数の入力音響信号におけるマイク感度の相違を校正する音響信号処理装置に搭載されるコンピュータを、
    入力音響信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
    入力音響信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
    上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
    上記コヒーレンスに基づいて正面から到来する信号区間を検出する正面到来信号検出部と、
    正面から到来する信号区間の各入力音響信号を用い、各入力音響信号のそれぞれについて同じ演算を行ってマイク感度の指標値を算出し、算出された複数のマイク感度の指標値から目標感度を決定し、各入力音響信号のそれぞれのマイク感度の指標値と目標感度とから、各入力音響信号のそれぞれに対する校正ゲインを算出する校正ゲイン計算部と、
    得られた校正ゲインで対応する入力音響信号を校正する複数の校正ゲイン乗算部と
    して機能させることを特徴とする音響信号処理プログラム。
JP2012209711A 2012-09-24 2012-09-24 音響信号処理装置、方法及びプログラム Active JP6102144B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012209711A JP6102144B2 (ja) 2012-09-24 2012-09-24 音響信号処理装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012209711A JP6102144B2 (ja) 2012-09-24 2012-09-24 音響信号処理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014068052A true JP2014068052A (ja) 2014-04-17
JP6102144B2 JP6102144B2 (ja) 2017-03-29

Family

ID=50744086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012209711A Active JP6102144B2 (ja) 2012-09-24 2012-09-24 音響信号処理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6102144B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018032931A (ja) * 2016-08-23 2018-03-01 沖電気工業株式会社 音響信号処理装置、プログラム及び方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06303691A (ja) * 1993-04-13 1994-10-28 Matsushita Electric Ind Co Ltd ステレオマイクロホン
JP2003153372A (ja) * 2001-11-14 2003-05-23 Matsushita Electric Ind Co Ltd マイクロホン装置
JP2010232717A (ja) * 2009-03-25 2010-10-14 Toshiba Corp 受音信号処理装置、方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06303691A (ja) * 1993-04-13 1994-10-28 Matsushita Electric Ind Co Ltd ステレオマイクロホン
JP2003153372A (ja) * 2001-11-14 2003-05-23 Matsushita Electric Ind Co Ltd マイクロホン装置
JP2010232717A (ja) * 2009-03-25 2010-10-14 Toshiba Corp 受音信号処理装置、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018032931A (ja) * 2016-08-23 2018-03-01 沖電気工業株式会社 音響信号処理装置、プログラム及び方法

Also Published As

Publication number Publication date
JP6102144B2 (ja) 2017-03-29

Similar Documents

Publication Publication Date Title
JP6028502B2 (ja) 音声信号処理装置、方法及びプログラム
JP5070873B2 (ja) 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
US9135924B2 (en) Noise suppressing device, noise suppressing method and mobile phone
US9449594B2 (en) Adaptive phase difference based noise reduction for automatic speech recognition (ASR)
US20090076810A1 (en) Sound processing apparatus, apparatus and method for cotrolling gain, and computer program
US8886499B2 (en) Voice processing apparatus and voice processing method
JP5257366B2 (ja) 雑音抑圧装置、雑音抑圧制御装置、雑音抑圧方法及び雑音抑圧プログラム
KR20100040664A (ko) 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
CN112272848A (zh) 使用间隙置信度的背景噪声估计
JP5459220B2 (ja) 発話音声検出装置
JP6102144B2 (ja) 音響信号処理装置、方法及びプログラム
JP6711205B2 (ja) 音響信号処理装置、プログラム及び方法
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP5970985B2 (ja) 音声信号処理装置、方法及びプログラム
JP6295650B2 (ja) 音声信号処理装置及びプログラム
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP6213324B2 (ja) 音声信号処理装置及びプログラム
JP6252274B2 (ja) 背景雑音区間推定装置及びプログラム
JP2016039398A (ja) 残響判定装置及びプログラム
JP6221463B2 (ja) 音声信号処理装置及びプログラム
JP2015025914A (ja) 音声信号処理装置及びプログラム
JP2013125084A (ja) 発話速度検出装置及び発話速度検出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170213

R150 Certificate of patent or registration of utility model

Ref document number: 6102144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150