JP5838861B2 - 音声信号処理装置、方法及びプログラム - Google Patents

音声信号処理装置、方法及びプログラム Download PDF

Info

Publication number
JP5838861B2
JP5838861B2 JP2012044138A JP2012044138A JP5838861B2 JP 5838861 B2 JP5838861 B2 JP 5838861B2 JP 2012044138 A JP2012044138 A JP 2012044138A JP 2012044138 A JP2012044138 A JP 2012044138A JP 5838861 B2 JP5838861 B2 JP 5838861B2
Authority
JP
Japan
Prior art keywords
coherence
target speech
unit
target
determination threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012044138A
Other languages
English (en)
Other versions
JP2013182044A (ja
Inventor
克之 高橋
克之 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2012044138A priority Critical patent/JP5838861B2/ja
Publication of JP2013182044A publication Critical patent/JP2013182044A/ja
Application granted granted Critical
Publication of JP5838861B2 publication Critical patent/JP5838861B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は音声信号処理装置、方法及びプログラムに関し、例えば、電話やテレビ会議などの音声信号を扱う通信機又は通信ソフトウェアに適用し得るものである。
雑音抑制技術として、ボイススイッチと呼ばれる技術やウィーナーフィルターと呼ばれる技術などがある(特許文献1、特許文献2参照)。
ボイススイッチは、目的音声区間検出機能を用いて入力信号から話者が話している区間(目的音声区間)を検出し、目的音声区間の場合は無処理で出力し、非目的音声区間の場合は振幅を減衰する、という技術である。例えば、図12に示すように、入力信号inputを受信すると、目的音声区間か否かを判定し(ステップS101)、目的音声区間であればゲインVS_GAINに1.0を設定し(ステップS102)、非目的音声区間であればゲインVS_GAINに1.0未満の任意の正の数値αを設定し(ステップS103)、その後、ゲインVS_GAINを入力信号inputに乗算して出力信号outputを得る(ステップS104)。
このボイススイッチ技術を、テレビ会議装置や携帯電話のような音声通信機器に適用することにより、非目的音声区間(雑音)を抑制して所望の目的音声を抽出することができるので、通話音質を高めることができる。
ところで、非目的音声は、話者以外の人間の声である「妨害音声」と、オフィスノイズや道路ノイズなどのような「背景雑音」とに分けられる。非目的音声区間が背景雑音のみの場合には、通常の目的音声区間検出機能で目的音声区間か否かを正確に判定できるのに対し、妨害音声が背景雑音に重畳されている場合には、目的音声区間検出機能は妨害音声も目的音声とみなしてしまうために誤判定が生じる。この結果、ボイススイッチで妨害音声を抑制できず、十分な通話音質に達しない。
この課題は、目的音声区間検出部で参照する特徴量として、これまで用いてきた入力信号レベルの変動から、コヒーレンスに変更することで改善される。コヒーレンスとは、簡単に述べれば、入力信号の到来方向を意味する特徴量である。携帯電話などの利用を想定した場合、話者の声(目的音声)は正面から到来し、妨害音声は正面以外から到来する傾向が強いので、到来方向に着目することで、従来は不可能だった目的音声と妨害音声との区別が可能となる。
図13は、目的音声検出機能にコヒーレンスを用いる場合のボイススイッチの構成を示すブロック図である。
一対のマイクm_1、m_2のそれぞれから、図示しないAD変換器を介して入力信号s1(n)、s2(n)を取得する。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。
FFT部10は、マイクm_1及びm_2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
Figure 0005838861
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の動作説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部10は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)をそれぞれ、対応する第1の指向性形成部11、第2の指向性形成部12に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複致の周波数f1〜fmのスペクトル成分から構成されるものである。X2(f,K)や後述するB1(f,K)及びB2(f,K)も同様である。
X1(f,K)={(f1,K),(f2,K),…,(fm,K)} …(2)
第1の指向性形成部11では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成し、第2の指向性形成部12では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成する。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
Figure 0005838861
これらの式の意味を、(3)式を例に、図14及び図15を用いて説明する。図14(A)に示した方向θから音波が到来し、距離lだけ隔てて設置されている一対のマイクm_1及びm_2で捕捉されたとする。このとき、音波が一対のマイクm_1及びm_2に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をdとすると、d=l×sinθなので、音速をcとすると(5)式で与えられる。
τ=l×sinθ/c …(5)
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm_1及びm_2は図14(B)のような指向特性を持つようになる。
なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した(3)式及び(4)式である。今、一例として、到来方向θが±90度であることを想定している。すなわち、第1の指向性形成部11からの指向性信号B1(f)は、図15(A)に示すように右方向に強い指向性を有し、第2の指向性形成部12からの指向性信号B2(f)は、図15(B)に示すように左方向に強い指向性を有する。
以上のようにして得られた指向性信号B1(f)、B2(f)に対し、コヒーレンス計算部13で、(6)式、(7)式のような演算を施すことでコヒーレンスCOHが得られる。(6)式におけるB2(f)はB2(f)の共役複素数である。
Figure 0005838861
目的音声区間検出部14では、コヒーレンスCOHを目的音声区間判定閾値Θと比較し、閾値Θより大きければ目的音声区間と判定し、そうでなければ非目的音声区間と判定し、判定結果VAD_RES(K)を形成する。
ここで、コヒーレンスの大小で目的音声区間を検出する背景を簡単に述べておく。コヒーレンスの概念は、右から到来する信号と左から到来する信号の相関と言い換えられる(上述した(6)式はある周波数成分についての相関を算出する式であり、(7)式は全ての周波数成分の相関値の平均を計算している)。従って、コヒーレンスCOHが小さい場合とは、2つの指向性信号B1及びB2の相関が小さい場合であり、反対にコヒーレンスCOHが大きい場合とは相関が大きい場合と言い換えることができる。そして、相関が小さい場合の入力信号は、入力到来方向が右又は左のどちらかに大きく偏った場合か、偏りがなくても雑音のような明確な規則性の少ない信号の場合である。そのため、コヒーレンスCOHが小さい区間は妨害音声区間あるいは背景雑音区間(非目的音声区間)であるといえる。一方、コヒーレンスCOHの値が大きい場合は、到来方向の偏りがないため、入力信号が正面から到来する場合であるといえる。今、目的音声は正面から到来すると仮定しているので、コヒーレンスCOHが大きい場合は目的音声区間といえる。
ゲイン制御部15は、目的音声区間ならばゲインVS_GAINとして1.0を、非目的音声区間(妨害音声、背景雑音)ならばゲインVS_GAINとして1.0未満の任意の正の数値αを設定する。ボイススイッチゲイン乗算部16は、得られたゲインVS_GAINを入力信号s1(n)に乗算することでボイススイッチ後信号y(n)を得る。
特開2006−333215号公報 特表2010−532879号公報
ところで、到来方位が正面寄りならばコヒーレンスCOHは全体的に大きい値となるが、側方にずれていくにつれてコヒーレンスCOHは小さい値になる。図16は、音声の到来方位が正面寄り(実線)、音声の到来方位が側方(点線)、到来方位が正面及び側方の中間(破線)の場合におけるコヒーレンスCOHの変化を示しており、縦軸がコヒーレンスCOH、横軸が時間(分析フレームk)を表している。
図16に示すように、コヒーレンスCOHは到来方位に応じて値のレンジが大きく変わるという特性をもつ。しかし、従来は、到来方位に関わらず目的音声区間判定閾値Θが固定値であるため、誤判定が生じるという課題がある。
例えば、閾値Θが大きい場合には、音声の立ち上がり区間や子音部のような、目的音声であってもコヒーレンスCOHの値がそれほど大きくならない期間で、目的音声区間が非目的音声区間と誤判定される。これにより、ボイススイッチ処理によって目的音声成分が減衰されてしまい、ところどころ途切れたような不自然な音質となってしまう。
また、閾値Θとして小さい値を設定した場合には、正面寄りの到来方位から妨害音が到来した場合には、妨害音のコヒーレンスが閾値Θを上回ってしまい、非目的音声区間が目的音声区間であると誤判定されてしまう。これにより、非目的音声成分が減衰されずに十分な消去性能が得られなくなる。加えて、装置利用者が妨害音声の到来方位が時々刻々と変化する環境にいる場合には、誤判定の頻度は増す。
以上のように、目的音声区間の判定閾値Θが固定値であるため、所望の区間でボイススイッチ処理を稼動させられず、所望外の区間でボイススイッチ処理を稼動させ、音質を低下させてしまうという課題がある。
そのため、ボイススイッチを適切に稼動させて音質を向上できる音声信号処理装置、方法及びプログラムが望まれている。
第1の本発明は、入力音声信号から雑音成分を抑制する音声信号処理装置において、(1)入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、(2)入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、(3)前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、(4)前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、(5)前記コヒーレンスに基づいて前記第1の判定閾値を制御する目的音声区間判定閾値制御部と、(6)前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、(7)前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部とを有することを特徴とする。
第2の本発明は、入力音声信号から雑音成分を抑制する音声信号処理方法において、(1)第1の指向性形成部は、入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、(2)第2の指向性形成部は、入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、(3)コヒーレンス計算部は、前記第1及び第2の指向性信号を用いてコヒーレンスを計算し、(4)目的音声区間検出部は、前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定し、(5)目的音声区間判定閾値制御部は、前記コヒーレンスに基づいて前記第1の判定閾値を制御し、(6)ゲイン制御部は、前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定し、(7)ボイススイッチゲイン乗算部は、前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算することを特徴とする。
第3の本発明の音声信号処理プログラムは、コンピュータを、(1)入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、(2)入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、(3)前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、(4)前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、(5)前記コヒーレンスに基づいて前記第1の判定閾値を制御する目的音声区間判定閾値制御部と、(6)前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、(7)前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部として機能させることを特徴とする。
本発明によれば、目的音声区間か否かを判定するために適用される判定閾値を制御するようにしたので、ボイススイッチを適切に稼動させて音質を向上させることができる。
第1の実施形態に係る音声信号処理装置の構成を示すブロック図である。 第1の実施形態の音声信号処理装置における目的音声区間判定閾値制御部の詳細構成を示すブロック図である。 第1の実施形態の音声信号処理装置における目的音声区間判定閾値制御部内の記憶部の記憶内容の説明図である。 第1の実施形態の音声信号処理装置における目的音声区間判定閾値制御部の動作を示すフローチャートである。 第2の実施形態の音声信号処理装置における目的音声区間判定閾値制御部の詳細構成を示すブロック図である。 第2の実施形態の音声信号処理装置における目的音声区間判定閾値制御部内の目的音声区間判定閾値計算部が適用する関数を導出する考え方の説明図である。 第2の実施形態の音声信号処理装置における目的音声区間判定閾値制御部の動作を示すフローチャートである。 周波数減算と第1の実施形態とを併用した変形実施形態の構成を示すブロック図である。 図8の第3の指向性形成部からの指向性信号の性質を示す説明図である。 コヒーレンスフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図である。 ウィーナーフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図である。 ボイススイッチ処理の流れを示すフローチャートである。 目的音声検出機能にコヒーレンスを用いる場合のボイススイッチの構成を示すブロック図である。 図13の指向性形成部からの指向性信号の性質を示す説明図である。 図13の2つの指向性形成部による指向性の特性を示す説明図である。 音声の到来方位によってコヒーレンスの変化が異なることを示す説明図である。
(A)第1の実施形態
以下、本発明による音声信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態は、コヒーレンスCOHに基づき、到来方位に応じて適切な目的音声区間の判定閾値Θを設定できるようにしたものである。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した図13との同一、対応部分には同一符号を付して示している。ここで、一対のマイクm_1及びm_2を除いた部分は、CPUが実行するソフトウェア(音声信号処理プログラム)として実現することも可能であるが、機能的には、図1で表すことができる。
図1において、第1の実施形態に係る音声信号処理装置1は、従来と同様なマイクm_1、m_2、FFT部10、第1指向性形成部11、第2の指向性形成部12、コヒーレンス計算部13、目的音声区間検出部14、ゲイン制御部15及びボイススイッチゲイン乗算部16に加え、目的音声区間判定閾値制御部20を有する。
ここで、マイクm_1、m_2、FFT部10、第1指向性形成部11、第2の指向性形成部12、コヒーレンス計算部13、ゲイン制御部15及びボイススイッチゲイン乗算部16は、従来と同様な機能を担っているので、その機能説明は省略する。
目的音声区間判定閾値制御部20は、コヒーレンス計算部13が計算したコヒーレンスCOH(K)に基づき、そのときの到来方位に応じた目的音声区間判定閾値Θ(K)を、目的音声区間検出部14に設定させるものである。
第1の実施形態の目的音声区間検出部14は、コヒーレンスCOH(K)を、可変制御されて設定された目的音声区間判定閾値Θ(K)と比較し、閾値Θ(K)より大きければ目的音声区間と判定し、そうでなければ非目的音声区間と判定し、判定結果VAD_RES(K)を形成するものである。
図2は、目的音声区間判定閾値制御部20の詳細構成を示すブロック図である。目的音声区間判定閾値制御部20は、コヒーレンス受信部21、非目的音声コヒーレンス平均計算部22、目的音声区間判定閾値照合部23、記憶部24及び目的音声区間判定閾値送信部25を有する。
コヒーレンス受信部21は、コヒーレンス計算部13が計算したコヒーレンスCOH(K)を取り込むものである。
非目的音声コヒーレンス平均計算部22は、コヒーレンスCOH(K)に係る区間が非目的音声区間か否かを粗判定するものである。この粗判定は、コヒーレンスCOH(K)を固定閾値Ψと比較し、コヒーレンスCOH(K)が固定閾値Ψより小さいときに非目的音声区間と判定する。判定閾値Ψは、目的音声区間検出部14が用いる時々刻々と制御される目的音声判定閾値Θとは異なる値であり、非目的音声区間を大雑把に検出できれば良いので、判定閾値Θのように高い精度である必要はなく、固定値を適用する。
非目的音声コヒーレンス平均計算部22は、目的音声区間であれば、非目的音声区間におけるコヒーレンスの平均値AVE_COH(K)として直前の分析フレームK−1における値AVE_COH(K−1)をそのまま適用し、一方、非目的音声区間であれば、(8)式に従って、非目的音声区間におけるコヒーレンスの平均値AVE_COH(K)を求める。なお、コヒーレンス平均値AVE_COH(K)の計算式は(7)式に限定されるものではなく、所定数のサンプル値を単純平均するなどの他の算出式を適用するようにしても良い。(8)式において、δは、0.0<δ<1.0の範囲内の値である。
AVE_COH(K)=δ×COH(K)+(1−δ)×AVE_COH(K−1)
…(8)
(8)式は、平均値として、現フレーム区間(動作開始時点から数えてK番目の分析フレーム)の入力音声に対するコヒーレンスCOH(K)と1つ前のフレーム区間で得られた平均値AVE_COH(K−1)との重み付け加算を計算しており、δの値の大小で、コヒーレンスCOH(K)の瞬時値の平均値への寄与度を調整することができる。仮に、δを0に近い小さい値に設定した場合には、瞬時値の平均値への寄与度が小さくなるので、瞬時値による変動を抑制できる。また、δが1に近い値であれば、瞬時値の寄与度が高まるので、平均値の効果を弱めることができる。このような観点に従い、δを適宜選定すれば良い。
記憶部24は、非目的音声区間におけるコヒーレンスの平均値AVE_COHの範囲と、目的音声判定閾値Θとの対応情報を記憶しているものである。例えば、図3に示すように、変換テーブル形式で記憶部24を構成することができる。図3の例は、非目的音声区間におけるコヒーレンスの平均値AVE_COHが範囲A<AVE_COH≦Bのときに目的音声判定閾値Θとして値Θ1が対応し、非目的音声区間におけるコヒーレンスの平均値AVE_COHが範囲B<AVE_COH≦Cのときに目的音声判定閾値Θとして値Θ2が対応し、非目的音声区間におけるコヒーレンスの平均値AVE_COHが範囲C<AVE_COH≦Dのときに目的音声判定閾値Θとして値Θ3が対応することを規定している。ここで、Θ1<Θ2<Θ3の関係がある。
目的音声区間判定閾値照合部23は、非目的音声コヒーレンス平均計算部22が得た平均値AVE_COH(K)が属する、記憶部24における平均値AVE_COHの範囲を探索し、探索された平均値AVE_COHの範囲に対応付けられた目的音声判定閾値Θの値を取り出すものである。
目的音声区間判定閾値送信部25は、目的音声区間判定閾値照合部23が取り出した目的音声判定閾値Θの値を、現分析フレームKで適用する目的音声判定閾値Θ(K)として目的音声区間検出部14に送信するものである。
(A−2)第1の実施形態の動作
次に、第1の実施形態の音声信号処理装置1の動作を、図面を参照しながら、全体動作、目的音声区間判定閾値制御部20における詳細動作の順に説明する。
一対のマイクm_1及びm_2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部10によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換された後、第1及び第2の指向性形成部11及び12のそれぞれによって、所定の方位に死角を有する指向性信号B1(f,K)、B2(f,K)が生成される。そして、コヒーレンス計算部13において、指向性信号B1(f,K)及びB2(f,K)を適用して、(6)式及び(7)式の演算が実行され、コヒーレンスCOH(K)が算出される。
目的音声区間判定閾値制御部20において、コヒーレンスCOH(K)に基づき、そのときの非目的音声の到来方位に応じた目的音声区間の判定閾値Θ(K)が求められ、目的音声区間検出部14に与えられる。そして、目的音声区間検出部14において、コヒーレンスCOH(K)と目的音声区間の判定閾値Θ(K)との比較により、目的音声区間か否かが判定し、判定結果VAD_RES(K)を受けてゲイン制御部15によってゲインVS_GAINが設定される。ボイススイッチゲイン乗算部16において、入力信号s1(n)にゲイン制御部15が設定したゲインVS_GAINが乗算され、出力信号y(n)が得られる。
次に、目的音声区間判定閾値制御部20の動作を説明する。図4は、目的音声区間判定閾値制御部20の動作を示すフローチャートである。
目的音声区間判定閾値制御部20に入力された、コヒーレンス計算部13が計算したコヒーレンスCOH(K)は、コヒーレンス受信部21によって取得される(ステップS151)。取得されたコヒーレンスCOH(K)は、非目的音声コヒーレンス平均計算部22において、固定閾値Ψと比較し、非目的音声区間か否かが判定される(ステップS152)。判定結果が目的音声区間であれば(COH(K)≧Ψであれば)、非目的音声コヒーレンス平均計算部22によって、非目的音声区間におけるコヒーレンスの平均値AVE_COH(K)として直前の分析フレームK−1における平均値AVE_COH(K−1)がそのまま適用される(ステップS153)。一方、非目的音声区間であれば(COH(K)<Ψであれば)、上述した(8)式に従って、非目的音声区間におけるコヒーレンスの平均値AVE_COH(K)が算出される(ステップS154)。以上のようにして得られた平均値AVE_COH(K)をキーとして、目的音声区間判定閾値照合部23によって、記憶部24に対する探索処理が実行され、キーである平均値AVE_COH(K)が属する平均値の範囲に対応付けられた目的音声判定閾値Θの値が取り出され、目的音声区間判定閾値送信部25によって、現分析フレームKで適用する目的音声判定閾値Θ(K)として目的音声区間検出部14に送信される(ステップS155)。その後、パラメータKが1インクリメントされて(ステップS156)、コヒーレンス受信部21による処理に戻る。
次に、以上のような処理により、最適な目的音声判定閾値Θ(K)が得られていることを説明する。
図16に示すように、コヒーレンスCOHは、到来方位に応じて値のレンジが異なるため、コヒーレンスの平均値と到来方位を対応付けることができる。このことは、コヒーレンスの平均値AVE_COH(K)が得られれば、到来方位を推定できることを意味する。また、ボイススイッチ処理は、目的音声を無処理で素通りさせ、妨害音声を減衰させる処理であるので、検出したいのは妨害音声の到来方位の方である。そのため、非目的音声コヒーレンス平均計算部22によって、非目的音声区間を検出し、非目的音声区間におけるコヒーレンスの平均値を算出することとした。
(A−3)第1の実施形態の効果
第1の実施形態によれば、非目的音声(主として妨害音声)の到来方位に応じて、目的音声区間判定閾値Θを制御するようにしたので、目的音声区間及び非目的音声区間の判定精度を向上させ、所望外の区間でボイススイッチ処理を誤って稼動して音質を低下させるようなことを防止することができる。
これにより、第1の実施形態の音声信号処理装置、方法若しくはプログラムを適用した、テレビ会議装置や携帯電話機などの通信装置における通話音質の向上が期待できる。
(B)第2の実施形態
次に、本発明による音声信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
第1の実施形態では、非目的音声区間におけるコヒーレンスの平均値に基づいて記憶部から目的音声区間判定閾値Θ(K)の値を取り出すようにしている。これに対して、この第2の実施形態は、非目的音声区間におけるコヒーレンスの平均値を適用した、関数演算により、目的音声区間判定閾値Θ(K)の値を得るようにしている。
(B−1)第2の実施形態の構成
第2の実施形態に係る音声信号処理装置1Aも、その全体構成は、第1の実施形態の説明で用いた図1で表すことができる。但し、第2の実施形態の場合、目的音声区間判定閾値制御部20Aの内部構成が、第1の実施形態の目的音声区間判定閾値制御部20と異なっている。
図5は、第2の実施形態の目的音声区間判定閾値制御部20Aの詳細構成を示すブロック図であり、第1の実施形態に係る図2との同一、対応部分には同一符号を付して示している。
第2の実施形態の目的音声区間判定閾値制御部20Aは、コヒーレンス受信部21、非目的音声コヒーレンス平均計算部22、目的音声区間判定閾値計算部26及び目的音声区間判定閾値送信部25を有する。コヒーレンス受信部21、非目的音声コヒーレンス平均計算部22及び目的音声区間判定閾値送信部25は、第1の実施形態のものと同様であるので、その機能説明は省略する。
目的音声区間判定閾値計算部26は、非目的音声区間におけるコヒーレンスの平均値AVE_COH(K)を入力とした、関数演算によって目的音声区間判定閾値Θ(K)を得るものである。
目的音声区間判定閾値計算部26が演算に適用する後述する関数は、非目的音声区間におけるコヒーレンスの平均値と、その平均値と瞬時値との差(以下、偏差と呼ぶ)の平均値との間に成り立つ関係に基づいている。図6は、この関係の説明図である。コヒーレンスは、妨害音声の到来方位が正面寄りになるほどコヒーレンス平均値が大きくなり、コヒーレンス平均値が大きくなるほど偏差が大きくなり、また、コヒーレンス平均値及び偏差はほぼ線形な関係をとる。一方、妨害音声の到来方位が正面寄りから側方に外れていくほど、コヒーレンス平均値が小さくなり、コヒーレンス平均値が小さくなるほど偏差は小さくなる。このときも、コヒーレンス平均値及び偏差はほぼ線形な関係をとる。さらに、妨害音声の到来方位が正面寄りからある一定以上側方に外れると、偏差は方位に依存せず、ほぼ一定になる。コヒーレンスの平均値と偏差のデータ対を複数取得し、そのような複数のデータ対をグラフ上にプロットすることにより、図6に示す関数を得ることができる。
目的音声区間判定閾値計算部26は、このコヒーレンスの平均値と偏差との関係に基づいて定めた(9−1)式若しくは(9−2)式に従って、目的音声区間検出部14が適用する閾値Θ(K)を算出する。(9−1)式は、コヒーレンスの平均値AVE_COH(K)が図6のW以下の場合に適用される式であり、(9−2)式は、コヒーレンスの平均値AVE_COH(K)が図6のWより大きい場合に適用される式である。(9−1)式におけるXは正の定数であり、(9−2)式におけるYは正の定数であり、Zは任意の定数である。
Θ(K)=AVE_COH(K)+X …(9−1)
Θ(K)=AVE_COH(K)+{Y×AVE_COH(K)+Z}
…(9−2)
(9−1)式若しくは(9−2)式の演算を行うことにより、到来方位ごとのコヒーレンス平均値の挙動に基づいた関数演算が実行され、適切な閾値Θ(K)を設定することができるようになる。
なお、(9−1)式若しくは(9−2)式は、コヒーレンス平均値AVE_COH(K)の値に、図6の特性で得られる値を加算している。加算している意味合いを説明する。非目的音声区間で得られるコヒーレンス平均値そのものを閾値とした場合、コヒーレンス瞬時値が平均値を上回ることがあり、その瞬間から目的音声区間判定に誤判定が生じ、付随して非目的音声区間コヒーレンス値の計算にも狂いが生じ始めるため、以降の入力信号に対して、目的音声区間検出部14は誤判定を続けることになる。そのため、コヒーレンス平均値に何らかの補正をしてコヒーレンスの瞬時値を上回る状態にしなければ、音声区間判定閾値として適切な値とはならず、安定した検出精度は得られなくなる。そこで、コヒーレンス平均値に、コヒーレンス平均値と瞬時値との差分情報(差の平均値)を加算することで、上記誤動作を避けることができるようになる。
(B−2)第2の実施形態の動作
次に、第2の実施形態の音声信号処理装置1Aの動作を説明する。第2の実施形態の音声信号処理装置1Aの全体動作は第1の実施形態と同様であるので、以下では、目的音声区間判定閾値制御部20Aにおける詳細動作のみ説明する。図7は、目的音声区間判定閾値制御部20Aの動作を示すフローチャートであり、第1の実施形態に係る図4との同一、対応ステップには同一符号を付して示している。
目的音声区間判定閾値制御部20Aに入力された、コヒーレンス計算部13が計算したコヒーレンスCOH(K)は、コヒーレンス受信部21によって取得される(ステップS151)。取得されたコヒーレンスCOH(K)は、非目的音声コヒーレンス平均計算部22において、固定閾値Ψと比較し、非目的音声区間か否かが判定される(ステップS152)。判定結果が目的音声区間であれば(COH(K)≧Ψであれば)、非目的音声コヒーレンス平均計算部22によって、非目的音声区間におけるコヒーレンスの平均値AVE_COH(K)として直前の分析フレームK−1における平均値AVE_COH(K−1)がそのまま適用される(ステップS153)。一方、非目的音声区間であれば(COH(K)<Ψであれば)、上述した(8)式に従って、非目的音声区間におけるコヒーレンスの平均値AVE_COH(K)が算出される(ステップS154)。以上のようにして得られた平均値AVE_COH(K)が適用されて、目的音声区間判定閾値計算部26によって、上述した(9−1)式若しくは(9−2)式の演算が実行されて目的音声判定閾値Θ(K)が得られ、目的音声区間判定閾値送信部25によって目的音声区間検出部14に送信される(ステップS157)。その後、パラメータKが1インクリメントされて(ステップS156)、コヒーレンス受信部21による処理に戻る。
なお、図6の関係は、コヒーレンス平均値と、コヒーレンス平均値と瞬時値との差の平均との間に成り立つものだが、コヒーレンス平均値と瞬時値との差の絶対値の平均についても同様な関係が成り立つ。よって、(9−1)式及び(9−2)式を、後者の関係に基づいて変更するようにしても良い。
(B−3)第2の実施形態の効果
第2の実施形態によっても、非目的音声(主として妨害音声)の方位に応じて、目的音声区間判定閾値Θを制御するようにしたので、目的音声区間及び非目的音声区間の判定精度を向上させ、所望外の区間でボイススイッチ処理を誤って稼動して音質を低下させるようなことを防止することができる。
これにより、第2の実施形態の音声信号処理装置、方法若しくはプログラムを適用した、テレビ会議装置や携帯電話機などの通信装置における通話音質の向上が期待できる。
なお、第2の実施形態によれば、記憶部を用いていないので、第1の実施形態に比較して必要とするメモリ量を削減することができる。
(C)他の実施形態
上記各実施形態では、非目的音声区間のコヒーレンス平均値に基づいて、目的音声区間検出部が利用する閾値を定めるものを示したが、閾値の決定に用いるパラメータは、コヒーレンス平均値に限定されるものではない。パラメータは、ある程度の直前期間のコヒーレンスの傾向を反映できているものであれば良く、例えば、公知のピークホールド手法を適用して得たコヒーレンスのピークに基づいて閾値を設定するようにしても良い。また、コヒーレンスの分散、標準偏差などの統計量に基づいて閾値を設定するようにしても良い。
上記各実施形態と、公知の周波数減算、コヒーレンスフィルター、ウィーナーフィルターのいずれか1つ、あるいは、いずれか2つ、あるいは、全てと併用するようにしても良い。併用によりさらに高い雑音抑圧性能を実現することができる。以下、周波数減算、コヒーレンスフィルター、ウィーナーフィルターのそれぞれと、第1の実施形態とを併用する場合の構成及び動作を簡単に記載する。
図8は、周波数減算と第1の実施形態とを併用した変形実施形態の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図8において、この変形実施形態に係る音声信号処理装置1Bは、第1の実施形態の構成に加えて、周波数減算部30を備えている。周波数減算部30は、第3の指向性形成部31と減算部32とIFFT部33とを有する。
ここで、「周波数減算」は、入力信号から非目的音声信号成分を減算することで雑音抑制を行う手法である。
第3の指向性形成部31には、FFT部10から周波数領域に変換された2つの入力信号X1(f,K)及びX2(f,K)が与えられる。第3の指向性形成部31は、(10)式を実行することにより、図9に示すような正面に死角を有する指向性特性に従った第3の指向性信号B3(f,K)を形成し、この指向性信号B3(f,K)を雑音信号として減算部32に減算入力として与える。減算部32には、周波数領域に変換された一方の入力信号X1(f,K)が被減算入力として与えられており、減算部32は、(11)式に示すように、入力信号X1(f,K)から第3の指向性信号B3(f、K)を減算しては周波数減算処理信号D(f,K)を得る。IFFT部33は、周波数減算処理信号D(f,K)を時間領域信号q(n)に変換し、ボイススイッチ乗算部16に与える。
B3(f,K)=X1(f,K)−X2(f,K) …(10)
D(f,K)=X1(f,K)−B3(f,K) …(11)
図10は、コヒーレンスフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図10において、この変形実施形態に係る音声信号処理装置1Cは、第1の実施形態の構成に加えて、コヒーレンスフィルター演算部40を備えている。コヒーレンスフィルター演算部40は、コヒーレンスフィルター係数乗算部41とIFFT部42とを有する。
ここで、「コヒーレンスフィルター」とは、上述した(6)式で得られたcoef(f,K)を周波数ごとに入力信号に乗算することで到来方向に偏りを有する信号成分を抑制する雑音除去技術のことである。
コヒーレンスフィルター係数乗算部41は、(12)式に示すように、入力信号X1(f,K)にコヒーレンス計算部13の演算の過程で得られる係数coef(f,K)を乗算し、雑音抑制後信号D(f,K)を得る。IFFT部42は、雑音抑制後信号D(f,K)を時間領域信号q(n)に変換し、ボイススイッチ乗算部16に与える。
D(f,K)=X1(f,K)×coef(f,K) …(12)
図11は、ウィーナーフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図11において、この変形実施形態に係る音声信号処理装置1Dは、第1の実施形態の構成に加えて、ウィーナーフィルター演算部50を備えている。ウィーナーフィルター演算部50は、ウィーナーフィルター係数計算部51とウィーナーフィルター係数乗算部52とIFFT部53とを有する。
ここで、「ウィーナーフィルター」とは、特許文献2に記載されているように、雑音区間の信号から周波数ごとに雑音特性を推定して得た係数を乗算することで雑音を除去する技術である。
ウィーナーフィルター係数計算部51は、目的音声区間検出部14の検出結果を参照し、非目的音声区間であればウィーナーフィルター係数wf_coef(f,K)の推定を行う(特許文献2の「数3」の演算式参照)。一方、目的音声区間であればウィーナーフィルター係数の推定を行わない。ウィーナーフィルター係数乗算部52は、(13)式に示すように、入力信号X1(f,K)にウィーナーフィルター係数wf_coef(f,K)を乗算して雑音抑圧後信号D(f,K)を得る。IFFT部53は、雑音抑圧後信号D(f,K)を時間領域信号q(n)に変換し、ボイススイッチ乗算部16に与える。
D(f,K)=X1(f,K)×wf_coef(f,K) …(13)
以上では、周波数減算処理、コヒーレンスフィルター処理若しくはウィーナーフィルター処理を施した後に、ボイススイッチ処理を施すものを示したが、この処理順序は逆であっても良い。
上記各実施形態では、非目的音声コヒーレンス平均計算部22が、1つの閾値Ψによって、コヒーレンス平均値の2つの更新方法のいずれを適用するかを判断するものを示したが、コヒーレンス平均値の更新方法として3つ以上を用意しておき、更新方法の数に合わせて閾値が複数設けるようにしても良い。例えば、(8)式におけるδが異なる複数の更新方法を用意しておくようにしても良い。
上記各実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良く、逆に、時間領域の信号で処理していた処理を、可能ならば周波数領域の信号で処理するようにしても良い。
上記各実施形態では、一対のマイクが捕捉した信号を直ちに処理する場合を示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。
m_1、m_2…マイク、10…FFT部、11…第1指向性形成部、12…第2の指向性形成部、13…コヒーレンス計算部、14…目的音声区間検出部、15…ゲイン制御部、16…ボイススイッチゲイン乗算部、20…目的音声区間判定閾値制御部、21…コヒーレンス受信部、22…非目的音声コヒーレンス平均計算部、23…目的音声区間判定閾値照合部、24…記憶部、25…目的音声区間判定閾値送信部、26…目的音声区間判定閾値計算部。

Claims (9)

  1. 入力音声信号から雑音成分を抑制する音声信号処理装置において、
    入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
    入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
    前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
    前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、
    前記コヒーレンスに基づいて前記第1の判定閾値を制御する目的音声区間判定閾値制御部と、
    前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、
    前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部と
    を有することを特徴とする音声信号処理装置。
  2. 前記目的音声区間判定閾値制御部は、
    前記コヒーレンスと固定値でなる第2の判定閾値とを比較して非目的音声区間を検出し、非目的音声区間でのみコヒーレンス平均値を更新し、目的音声区間でコヒーレンス平均値を維持する非目的音声コヒーレンス平均計算部と、
    非目的音声コヒーレンス平均値と前記第1の判定閾値との対応表が格納されている記憶部と、
    前記記憶部から、前記非目的音声コヒーレンス平均計算部が得た現在の非目的音声コヒーレンス平均値に対応した前記第1の判定閾値を取り出す目的音声区間判定閾値照合部と
    を有することを特徴とする請求項1に記載の音声信号処理装置。
  3. 前記目的音声区間判定閾値制御部は、
    前記コヒーレンスと固定値でなる第2の判定閾値とを比較して非目的音声区間を検出し、非目的音声区間でのみコヒーレンス平均値を更新し、目的音声区間でコヒーレンス平均値を維持する非目的音声コヒーレンス平均計算部と、
    前記非目的音声コヒーレンス平均計算部が得た現在の非目的音声コヒーレンス平均値に対し、所定の演算を施すことにより前記第1の判定閾値を得る目的音声区間判定閾値計算部と
    を有することを特徴とする請求項1に記載の音声信号処理装置。
  4. 現在の非目的音声コヒーレンス平均値をAVE_COH(K)、第1の判定閾値をΘ(K)、正の3つの定数をW、X、Y、任意の定数をZとし、
    前記目的音声区間判定閾値計算部は、AVE_COH(K)がW以下の場合に(A)式に従い、AVE_COH(K)がWより大きい場合に(B)式に従い、Θ(K)を求めることを特徴とする請求項3に記載の音声信号処理装置。
    Θ(K)=AVE_COH(K)+X …(A)
    Θ(K)=AVE_COH(K)+{Y×AVE_COH(K)+Z} …(B)
  5. 自己への入力信号から非目的音声信号成分を減算することで雑音抑制を行う周波数減算部を、前記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜4のいずれかに記載の音声信号処理装置。
  6. 複数の係数の平均処理によりコヒーレンスを求める際の要素である周波数ごとの前記各係数を、周波数ごとに、自己への入力信号に乗算することで到来方向に偏りを有する信号成分を抑制するコヒーレンスフィルター演算部を、前記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜5のいずれかに記載の音声信号処理装置。
  7. 雑音区間の信号から周波数ごとに雑音特性を推定して得た係数を、自己への入力信号に乗算することで雑音を除去するウィーナーフィルター演算部を、前記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜6のいずれかに記載の音声信号処理装置。
  8. 入力音声信号から雑音成分を抑制する音声信号処理方法において、
    第1の指向性形成部は、入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
    第2の指向性形成部は、入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
    コヒーレンス計算部は、前記第1及び第2の指向性信号を用いてコヒーレンスを計算し、
    目的音声区間検出部は、前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定し、
    目的音声区間判定閾値制御部は、前記コヒーレンスに基づいて前記第1の判定閾値を制御し、
    ゲイン制御部は、前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定し、
    ボイススイッチゲイン乗算部は、前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算する
    ことを特徴とする音声信号処理方法。
  9. コンピュータを、
    入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
    入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
    前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
    前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、
    前記コヒーレンスに基づいて前記第1の判定閾値を制御する目的音声区間判定閾値制御部と、
    前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、
    前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部と
    して機能させることを特徴とする音声信号処理プログラム。
JP2012044138A 2012-02-29 2012-02-29 音声信号処理装置、方法及びプログラム Expired - Fee Related JP5838861B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012044138A JP5838861B2 (ja) 2012-02-29 2012-02-29 音声信号処理装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012044138A JP5838861B2 (ja) 2012-02-29 2012-02-29 音声信号処理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013182044A JP2013182044A (ja) 2013-09-12
JP5838861B2 true JP5838861B2 (ja) 2016-01-06

Family

ID=49272743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012044138A Expired - Fee Related JP5838861B2 (ja) 2012-02-29 2012-02-29 音声信号処理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5838861B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5970985B2 (ja) * 2012-07-05 2016-08-17 沖電気工業株式会社 音声信号処理装置、方法及びプログラム
JP6314475B2 (ja) * 2013-12-25 2018-04-25 沖電気工業株式会社 音声信号処理装置及びプログラム
JP6295650B2 (ja) * 2013-12-25 2018-03-20 沖電気工業株式会社 音声信号処理装置及びプログラム
US10043532B2 (en) 2014-03-17 2018-08-07 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
JP6252274B2 (ja) * 2014-03-19 2017-12-27 沖電気工業株式会社 背景雑音区間推定装置及びプログラム
JP6213324B2 (ja) * 2014-03-19 2017-10-18 沖電気工業株式会社 音声信号処理装置及びプログラム
JP2016163135A (ja) * 2015-02-27 2016-09-05 沖電気工業株式会社 収音装置、プログラム及び方法
JP6531776B2 (ja) 2017-04-25 2019-06-19 トヨタ自動車株式会社 音声対話システムおよび音声対話方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム

Also Published As

Publication number Publication date
JP2013182044A (ja) 2013-09-12

Similar Documents

Publication Publication Date Title
JP6028502B2 (ja) 音声信号処理装置、方法及びプログラム
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
KR101116013B1 (ko) 잡음 억압 장치, 잡음 억압 방법 및 휴대 전화기
JP5672770B2 (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
US9219456B1 (en) Correcting clock drift via embedded sin waves
JP5927887B2 (ja) 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム
JP6190373B2 (ja) オーディオ信号ノイズ減衰
JP6314475B2 (ja) 音声信号処理装置及びプログラム
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
JP6711205B2 (ja) 音響信号処理装置、プログラム及び方法
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP5772562B2 (ja) 目的音抽出装置及び目的音抽出プログラム
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP5970985B2 (ja) 音声信号処理装置、方法及びプログラム
JP6763319B2 (ja) 非目的音判定装置、プログラム及び方法
JP5971047B2 (ja) 音声信号処理装置、方法及びプログラム
JP6295650B2 (ja) 音声信号処理装置及びプログラム
JP6102144B2 (ja) 音響信号処理装置、方法及びプログラム
JP2019036917A (ja) パラメータ制御装置、方法及びプログラム
JP6361360B2 (ja) 残響判定装置及びプログラム
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP6903947B2 (ja) 非目的音抑圧装置、方法及びプログラム
JP6221463B2 (ja) 音声信号処理装置及びプログラム
JP2015025914A (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151026

R150 Certificate of patent or registration of utility model

Ref document number: 5838861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees