JP2018031819A - 信号処理装置、信号処理方法、及び、信号処理プログラム - Google Patents

信号処理装置、信号処理方法、及び、信号処理プログラム Download PDF

Info

Publication number
JP2018031819A
JP2018031819A JP2016162069A JP2016162069A JP2018031819A JP 2018031819 A JP2018031819 A JP 2018031819A JP 2016162069 A JP2016162069 A JP 2016162069A JP 2016162069 A JP2016162069 A JP 2016162069A JP 2018031819 A JP2018031819 A JP 2018031819A
Authority
JP
Japan
Prior art keywords
signal
estimated
unit
mixed
mixing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016162069A
Other languages
English (en)
Other versions
JP6720771B2 (ja
Inventor
正徳 加藤
Masanori Kato
正徳 加藤
昭彦 杉山
Akihiko Sugiyama
昭彦 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2016162069A priority Critical patent/JP6720771B2/ja
Publication of JP2018031819A publication Critical patent/JP2018031819A/ja
Application granted granted Critical
Publication of JP6720771B2 publication Critical patent/JP6720771B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定する。
【解決手段】信号処理装置700は、第一信号と第二信号とが混在した混在信号を用いて、混在信号に混在する第二信号を推定し、推定第二信号として提供する推定部703と、混在信号と推定第二信号とに基づいて、推定第二信号が過小であるか否かを判定する判定部702と、推定第二信号を保存する記憶部708と、判定部702での判定の結果に基づいて、記憶部708に保存された信号と、推定第二信号とを混合して混合信号を生成する混合部707と、を備え、推定部703は、判定部702での判定の結果に基づいて、推定処理を初期化することを特徴とする。
【選択図】 図15

Description

本願発明は、第一信号と第二信号とが含まれる混在信号において、第二信号を推定する信号処理技術に関する。
携帯電話など様々な音声端末においては、第一信号(例えば音声などの注目すべき所望信号)と第二信号(例えば雑音(ノイズ)などの非所望信号)とを含む混在信号から、第二信号を推定する第二信号推定技術が使われている。第二信号推定技術は、混在信号と推定第二信号の関係に基づいて、混在信号に第一信号が含まれているか否かを判定する音声検出技術に利用されている。また、第二信号を抑圧することによって、第一信号を強調した出力信号を生成する雑音抑圧技術に利用されている。
このような技術に関連する技術として、特許文献1には、第二信号の音量を推定し、推定第二信号の音量に対応した閾値と、混在信号の音量を比較することにより音声の検出を行なう技術が開示されている。
このような技術に関連する技術として、特許文献2には、第一信号(第一信号)と第二信号(第二信号)とが混在した混在信号(入力信号)を処理することによって第二信号を抑圧する信号処理装置が開示されている。この装置は、当該混在信号に含まれる背景音信号を推定する。そしてこの装置は、第二信号を、背景音より小さくならないように、第二信号の抑圧を抑制する。
また、特許文献3には、第一信号と第二信号とが混在した混在信号を処理することによって第二信号を抑圧する信号処理装置が開示されている。この装置は、当該混在信号に含まれる第一信号の重要度を、その第一信号を構成する複数の周波数成分ごとに分析する。そしてこの装置は、その分析の結果、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する第二信号の抑圧を抑制する。
また、特許文献4には、階層化符号化データの復号及び再生において、受信済みの復号信号や補間信号を記憶装置に保存しておく伝送エラー隠蔽処理装置が開示されている。この装置は、再生したい時刻の所望階層が伝送エラーにより復号できなかった場合に、記憶装置に保存しておいた復号信号や補間信号を、所定の混合率で混合する混合関数に入力することによって、当該時刻において失われた所望階層の補間信号を擬似的に生成する。
また、非特許文献1には、第一信号と第二信号とが混在した混在信号が供給されはじめた初期の平均値を第二信号の推定値として抑圧係数を求め、混在信号に含まれる第二信号を抑圧する方法が開示されている。
また、非特許文献2には、第二信号の推定値と混在信号から求めた抑圧係数を混在信号に乗算することにより第二信号を抑圧し、第一信号を強調する方法が開示されている。この方法では、その際、第一信号と第二信号との推定パワー比に応じた重みづけを混在信号に施すことによって、第二信号を継続的に推定する。
特開2013-005418号公報 国際公開第2012-070670号 国際公開第2012-070668号 特開2013-102256号公報
Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-32, no. 6, pp. 1109-1121, Dec. 1984. M. Kato, A. Sugiyama, and M. Serizawa, "Noise suppression with high speech quality based on weighted noise estimation and MMSE STSA," IEICE Trans. Fundamentals (Japanese Edition), vol.J87-A, no.7, pp.851-860, July 2004. S. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-27, no. 2, pp. 113-120, Apr. 1979. R. Martin, "Spectral subtraction based on minimum statistics," Proc. of EUSPICO-94, pp.1182-1185, Sept. 1994 R. McAulay and M. Malpass, "Speech enhancement using a soft-decision noise suppression filter," IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-28, no. 2, pp. 137-145, Apr. 1980. N. Virag, "Single channel speech enhancement based on masking properties of the human auditory system," IEEE Trans. Speech and Audio Signal Processing, vol. 7, no. 2, pp. 126-137, March 1999. Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator," IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-33, no. 2, pp. 443-445, Dec. 1985.
しかしながら、上記文献に記載の技術では、雑音成分である第二信号が突然大きくなることを想定していない。このため、混在信号に含まれる第二信号が突然大きくなった場合、第二信号を正確に推定することができない。その結果、第一信号が混在信号に含まれているか否かを正しく判定できない。また、第二信号の抑圧を十分に行うことができず、出力信号の品質が低下する。本願発明の主たる目的は、この問題を解決する信号処理装置等を提供することである。
本願発明の一態様に係る信号処理装置は、第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供する推定手段と、前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定する第一の判定手段と、前記推定第二信号を保存する記憶手段と、前記第一の判定手段での判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成する混合手段と、を備え、前記推定手段は、前記第一の判定手段での判定の結果に基づいて、推定処理を初期化することを特徴とする。
上記目的を達成する他の見地において、本願発明の一態様に係る信号処理方法は、情報処理装置によって、第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供し、前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定し、前記推定第二信号を記憶手段に保存し、その判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成し、前記判定の結果に基づいて、推定処理を初期化する。
また、上記目的を達成する更なる見地において、本願発明の一態様に係る信号処理プログラムは、第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供する推定処理と、前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定する判定処理と、前記推定第二信号を記憶手段に保存する記憶処理と、前記判定処理での判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成する混合処理と、をコンピュータに実行させ、前記推定処理は、前記判定処理での判定の結果に基づいて、前記第二信号を推定する処理を初期化することを特徴とする。
更に、本願発明は、係る信号処理プログラム(コンピュータプログラム)が格納された、コンピュータ読み取り可能な、不揮発性の記録媒体によっても実現可能である。
本願発明は、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定できる。
本願発明の第1乃至第2の実施形態に係る信号処理装置100の構成を示すブロック図である。 本願発明の第1の実施形態に係る変換部101の構成を示すブロック図である。 本願発明の第1の実施形態に係る逆変換部106の構成を示すブロック図である。 本願発明の第1の実施形態に係る抑圧部105の構成を示すブロック図である。 本願発明の第1の実施形態に係る混合部107の構成を示すブロック図である。 本願発明の第1の実施形態に係る信号処理装置100の動作を示すフローチャートである。 本願発明の第2の実施形態に係る混合部207の構成を示すブロック図である。 本願発明の第3の実施形態に係る信号処理装置300の構成を示すブロック図である。 本願発明の第3の実施形態に係る混合部307の構成を示すブロック図である。 本願発明の第4の実施形態に係る信号処理装置400の構成を示すブロック図である。 本願発明の第4の実施形態に係る混合部407の構成を示すブロック図である。 本願発明の第5の実施形態に係る信号処理装置500の構成を示すブロック図である。 本願発明の第6の実施形態に係る信号処理装置600の構成を示すブロック図である。 本願発明の第6の実施形態に係る第二判定部609の構成を示すブロック図である。 本願発明の第7の実施形態に係る信号処理装置700の構成を示すブロック図である。 本願発明の各実施形態に係る信号処理装置を実行可能な情報処理装置の構成を示すブロック図である。
以下、本願発明の実施の形態について図面を参照して詳細に説明する。
<第1の実施形態>
図1は、本願発明の第1の実施の形態に係る信号処理装置100の構成を概念的に示すブロック図である。尚、後述する第2の実施形態に係る信号処理装置においては、「混合部」の構成が異なるだけなので、説明の便宜上、第2の実施形態においても、図1を改めて参照することとする。信号処理装置100は、第一信号(注目すべき所望の音声信号)と第二信号(雑音(ノイズ))とを含む混在信号(入力信号)から、第二信号を抑圧することによって第一信号を強調した出力信号を生成する装置である。本実施形態に係る信号処理装置100は、例えば、デジタルカメラ、ノートパソコン、携帯電話等の装置の一部として機能する。
本実施形態に係る信号処理装置100は、変換部101、判定部102、推定部103、初期化部104、抑圧部105、逆変換部106、混合部107、及び、記憶部108を備えている。以下、これらの各構成について詳細に説明する。
(変換部101)
図2は、本実施形態に係る変換部101の構成を概念的に示すブロック図である。図2に示す通り、変換部101は、フレーム分割部1011、窓関数乗算部1012、及び、フーリエ変換部1013を含む。
フレーム分割部1011には、混在信号が、サンプル値系列として入力される。フレーム分割部1011は、混在信号サンプル(サンプル値系列)を、K/2サンプル(Kは2以上の任意の偶数、「/」は除算を表す(以下同様))ごとに分割することによって複数のフレームを構成(生成)する。フレーム分割部1011は、フレームに分割された混在信号サンプルを、窓関数乗算部1012に入力する。
窓関数乗算部1012は、フレーム分割部1011から入力された混在信号サンプルと、窓関数(window function)であるw(t)(tは時間を示す変数)との乗算を行う。第nフレーム(nは任意の自然数)の混在信号x(t,n)(t=0, 1, …, K-1)に対してw(t)と乗算された(窓がけ(windowing)された)信号x-(t,n)(「-」はxの上部に記載されていることとする)は、数1が示す数式により表される。
Figure 2018031819
窓関数乗算部1012は、連続する2つのフレームの一部を重ね合わせた(オーバラップした)状態で窓がけしてもよい。例えば、重ね合わせる長さが、フレーム長の50%とする場合、窓関数乗算部1012は、t=0, 1, …, K/2-1に対して、数2が示す信号x-(t,n)を出力する。
Figure 2018031819
窓関数乗算部1012は、実数信号に対しては、左右対称窓関数を使用する。また、窓関数は、変換部101からの出力が逆変換部106に直接入力された場合に、混在信号と出力信号とが計算誤差を除いて一致するように設計される。このことは、「w2(t)+w2(t+K/2)=1」となることを意味する。
以後、連続する2フレームについて、フレーム長の50%を重ね合わせた状態で窓がけする場合を例として説明する。窓関数w(t)(t=0, 1, …, K-1)としては、例えば、数3が示すハニング窓を用いることができる。
Figure 2018031819
窓関数としては、このほかにも、ハミング窓、三角窓など、様々な関数が知られており、これらの関数を採用してもよい。窓関数乗算部1012は、フレーム分割部1011から入力された混在信号サンプルと、窓関数とを乗算した結果を、フーリエ変換部1013に入力する。
フーリエ変換部1013は、窓関数乗算部1012から入力された信号に対してフーリエ変換を施すことによって、当該信号を複数の異なる周波数成分に分割する。すなわち、フーリエ変換部1013は、当該信号を、混在信号スペクトルX(k,n)に変換する。フーリエ変換部1013は、混在信号スペクトルX(k,n)を、位相成分である混在信号位相スペクトルargX(k,n)と、振幅成分である混在信号振幅スペクトル|X(k,n)|とに分離する。フーリエ変換部1013は、混在信号位相スペクトルargX(k,n)を逆変換部106へ入力し、混在信号振幅スペクトル|X(k,n)|を、判定部102、推定部103、及び、抑圧部105へ入力する。フーリエ変換部1013は、振幅スペクトル|X(k,n)|の代わりに、その2乗に相当するパワースペクトル|X(k,n)|を利用してもよい。
(逆変換部106)
図3は、本実施形態に係る逆変換部106の構成を概念的に示すブロック図である。図3に示す通り、逆変換部106は、逆フーリエ変換部1061、窓関数乗算部1062、及び、フレーム合成部1063を含む。
逆フーリエ変換部1061は、抑圧部105から入力された出力信号振幅スペクトル|Y(k,n)|と、変換部101から入力された混在信号位相スペクトルargX(k,n)とを用いて、数4が示す通り、出力信号スペクトルY(k,n)を求める。数4におけるjは、虚数を表す符号である。また、本願において、「||」は絶対値を表すこととする。
Figure 2018031819
逆フーリエ変換部1061は、求めた出力信号スペクトルY(k,n)に対して逆フーリエ変換を行うことによって、1フレームがK個のサンプルを含む時間領域のサンプル値系列y(t,n)(t=0, 1, …, K-1)を生成し、生成したサンプル値系列y(t,n)を、窓関数乗算部1062へ入力する。
窓関数乗算部1062は、逆フーリエ変換部1061から入力されたサンプル値系列y(t,n)と、窓関数w(t)との乗算を行う。窓関数乗算部1062は、フレーム合成部1063に対して、数5が示す信号y-(t,n)(「-」はyの上部に記載されていることとする)を入力する。
Figure 2018031819
フレーム合成部1063は、窓関数乗算部1062から出力された隣接する2つのフレームを、K/2サンプルずつ取り出して重ね合わせ、数6に示す通り、t=0, 1, …, K/2-1における出力信号y(t,n)(「」はyの上部に記載されていることとする)を得る。フレーム合成部1063は、得られた出力信号y(t,n)を外部へ出力する。
Figure 2018031819
尚、変換部101及び逆変換部106が行う変換処理は、フーリエ変換(逆フーリエ変換)に限定されない。変換部101及び逆変換部106は、フーリエ変換に代えて、例えば、アダマール変換、ハール変換、ウェーブレット変換等、他の変換処理を行ってもよい。信号処理装置100は、ハール変換を用いることによって、乗算が不要となるので、必要な計算資源の量を削減することができる。また、信号処理装置100は、ウェーブレット変換を用いることによって、周波数によって時間解像度が異なるようにできるので、第二信号の抑圧効率を向上することができる。
また、図1に示す信号処理装置100は、変換部101と逆変換部106とを備えるが、信号処理装置100は、変換部101及び逆変換部106を備えない場合もある。その場合は、判定部102、推定部103、及び、抑圧部105に対して、外部から混在信号が直接入力される。そして、抑圧部105は、出力信号を直接外部に出力する。この場合、信号処理装置100は、必要な計算資源の量を削減することができる。
(推定部103)
図1に示す推定部103は、変換部101から入力された混在信号振幅スペクトルと、初期化部104から入力された初期化を指示する情報に基づいて、混在信号に含まれる第二信号のパワースペクトルを推定する。推定部103によって推定された第二信号のパワースペクトルを、以降、推定第二信号パワースペクトルと称する。推定部103は、一般的に、現在までに入力された混在信号の状態を示す情報に基づいて、第二信号パワースペクトルを推定する。推定部103による第二信号パワースペクトルを推定する方法としては、例えば、非特許文献1乃至4に記載の方法など、様々な推定方法が利用できる。非特許文献1乃至4に記載の方法では、混在信号振幅スペクトルを2乗することにより得られる混在信号パワースペクトルを用いて、第二信号パワースペクトルを推定する。
ところで、非特許文献1には、推定第二信号パワースペクトルを、混在信号振幅スペクトルが入力され始めた(推定処理が開始された)ときの混在信号パワースペクトルを平均化した値とする方法が示されている。この場合、推定処理が開始された直後には、第一信号(目的音)が含まれないという条件を満たす必要がある。
また、非特許文献3には、推定第二信号パワースペクトルを、第一信号が存在していないフレームの混在信号パワースペクトルの平均値とする方法が示されている。この方法では第一信号の存在を検出する必要がある。第一信号が存在する区間(第一信号区間)は、例えば出力信号のパワー(大きさ)により検知される。
信号処理装置100が理想的に動作する場合、出力信号は第一信号と一致する。また、第一信号や第二信号のレベル(大きさ)は、通常、隣接フレーム間において大きく変化しない。これらのことから、推定部103は、1フレーム分過去の出力信号レベルに基づき、第一信号区間であるか否かの判定を行う。推定部103は、1フレーム分過去の出力信号の大きさが閾値以上の場合、現在のフレームを第一信号区間と判定する。第二信号パワースペクトルは、第一信号区間と判定されなかったフレームにおける混在信号パワースペクトルを平均化することによって推定することができる。
また、非特許文献4には、推定第二信号パワースペクトルを、混在信号パワースペクトルの最小値(最小統計量)から求める方法が示されている。この方法では、推定部103は、一定時間内における混在信号パワースペクトルの最小値を保持し、その最小値に基づいて、第二信号パワースペクトルを推定する。混在信号パワースペクトルの最小値は、一般的に第二信号のスペクトル形状と類似するので、第二信号パワースペクトルの推定値として用いることができる。しかしながらこの場合、その最小値は、本来の第二信号の大きさより小さくなる。したがって、推定部103は、その最小値を適切に増幅させた値を、推定第二信号パワースペクトルとする。
これらの非特許文献に記載された方法の他、推定部103は、メジアンフィルタを用いて、推定第二信号パワースペクトルを求めてもよい。また、推定部103は、非特許文献2に記載されている通り、第二信号がゆっくり変動するという性質を利用することによって、推定第二信号パワースペクトルを求めてもよい。変動する第二信号に追従するこの方法では、先ず「第一信号」対「第二信号」の大きさの比の推定値を得るために、推定部103は、混在信号パワースペクトルを、1フレーム分過去の推定第二信号パワースペクトルにより除算する。推定部103は、次に、得られた商が大きいほど小さな値をとる関数を用いることによって重みを計算し、混在信号パワースペクトルに重み付けする。そして、推定部103は、過去に同様の方法によって重み付けされた混在信号パワースペクトルを複数用いて平均化し、その平均値を推定第二信号パワースペクトルとする。この場合、第一信号成分が多く含まれた混在信号パワースペクトルに対しては小さな重みづけがなされるので、推定部103は、第一信号の影響をほとんど受けることなく、第二信号パワースペクトルの推定を継続的に行うことができる。
推定部103は、また、変換部101において得られる周波数成分を複数統合したのち、第二信号の推定を行うこともできる。この場合、統合後の周波数成分の数は、統合前の周波数成分の数よりも少なくなる。より具体的には、推定部103は、周波数成分の統合によって得られる統合周波数成分に対して、共通の推定第二信号を求め、その共通の推定第二信号を、同じ統合周波数成分に属する個々の周波数成分に対して共通に用いればよい。このように、推定部103は、複数の周波数成分を統合してから第二信号を推定した場合、適用する周波数成分の数が少なくなるので、推定処理に要する演算量を削減することができる。
(判定部102)
図1に示す判定部102は、変換部101から入力された混在信号振幅スペクトルと、混合部107から入力された過去の混合信号パワースペクトルとを用いて、推定第二信号パワースペクトルが基準を満たすか否か(過小か否か)を判定する。混合信号パワースペクトルの詳細については、後述する。この判定結果は、混合部107が混合信号パワースペクトルを求める際に使用される。従って、この判定結果を求めるために用いられる混合信号パワースペクトルは、過去に推定された結果が利用される。本実施形態では、一例として、過去の混合信号パワースペクトルとして代表的な値である、1フレーム分過去の混合信号パワースペクトル|Nmix(k,n-1)|2を用いて判定する場合について説明する。なお、後述するように、混合信号パワースペクトルは、推定部103から供給された推定第二信号パワースペクトルを補正したものとみなすことが出来る。従って、判定部102は、混合信号パワースペクトルの代わりに推定部103から供給された推定第二信号パワースペクトルを用いても良い。
判定部102は、1フレーム分過去の混合信号パワースペクトル|Nmix(k,n-1)|2と、混在信号振幅スペクトルを2乗した混在信号パワースペクトル|X(k,n)|2を変数とする線形写像関数により算出した閾値とを比較する。本実施形態では、混在信号パワースペクトル|X(k,n)|2を、代表的な線形写像関数である定数倍(すなわちα1(k,n)倍)することによって当該閾値を算出する場合について説明する。α1(k,n)は0以上の実数である。判定部102は、1フレーム分過去の混合信号パワースペクトル|Nmix(k,n-1)|2がα1(k,n)|X(k,n)|2よりも小さい場合、推定第二信号パワースペクトルは基準を満たさない(過小推定である)と判定する。
1フレーム分過去の混合信号パワースペクトル|Nmix(k,n-1)|2との比較に用いる閾値の計算方法は、混在信号パワースペクトル|X(k,n)|2の線形写像関数を用いた方法に限定されない。例えば、α1(k,n)|X(k,n)|2+C(k,n)のような一次関数を採用することも可能である。その場合、α1(k,n)とC(k,n)の値を小さくすれば、基準を満たさないと判定される可能性が高くなるので、推定第二信号の大きさが基準を満たさない(過小推定である)状態にあることを見逃しにくくなる。その他にも、高次の多項式関数や非線形関数などを、上述した閾値の計算に用いることも可能である。
判定部102が用いる過去の混合信号パワースペクトルは、1フレーム分過去の混合信号パワースペクトル|Nmix(k,n-1)|2に限定されない。例えば、判定部102は、過去の混合信号パワースペクトルとして、過去数フレーム分の平均値を用いることも可能である。判定部102は、このように平均化することによって、混合信号パワースペクトルの時間変動を抑えられるので、判定精度を向上できる。混在信号パワースペクトル|X(k,n)|2についても同様であり、判定部102は、過去数フレーム分の平均値を用いることによって、混在信号パワースペクトルの時間変動を抑えられるので、判定精度を向上できる。平均値を求める方法としては、上述した移動平均のほか、一次リーク積分も有効な方法である。また、判定部102は、平均では無く、過去数フレーム分から最小値を選択する方法を用いることも可能である。
判定部102は、判定精度を改善するために、上述した混合信号パワースペクトルと混在信号パワースペクトルとの関係を確認することに加えて、それぞれの値もふまえて判定することも有効である。判定部102は、例えば、1フレーム分過去の混合信号パワースペクトル|Nmix(k,n-1)|2が所定の閾値よりも小さい場合、基準を満たさないと判定する。これにより、判定部102は、推定第二信号パワースペクトルと混在信号パワースペクトルの両方の値が、偶然にも小さいことによって、相対的な関係だけでは基準を満たさないと判定できない場合にも、正しく判定することができる。
(初期化部104)
図1に示す初期化部104は、判定部102によって推定第二信号パワースペクトルの大きさが基準を満たさないと判定された場合に、推定部103における混在信号の状態を示す情報を、推定部103が推定処理を開始した直後の状態に戻す(変更する)処理(以降、「初期化処理」と称する)を行う。例えば、推定部103が上述した非特許文献4に記載された方法により推定処理を行う場合、初期化部104は、初期化処理として、上述した最小値を予め設定された値に変更する。また、推定部103が上述した非特許文献2に記載された方法により推定処理を行う場合、初期化部104は、初期化処理として、推定部103が、過去の推定値を用いた更新を行わずに、入力された混在信号振幅スペクトルを2乗した値である混在信号パワースペクトル|X(k,n)|2を推定値とするように制御する。
この初期化処理の方法としては、初期化が行われる直前の推定値を考慮した方法も有効である。例えば、初期化部104は、初期化処理として、初期化用に予め設定された値の代わりに、初期化用の設定値と初期化が行われる直前の推定値を混合した値に変更する。この場合、初期化部104は、初期化直後に推定値が急変することを回避できるので、第二信号を抑圧する度合いが急変することに伴い発生する音質低下を回避することができる。また、推定部103が、初期化される前の推定値を複数フレーム分記憶しておき、初期化部104は、初期化処理として、推定部103が、記憶したフレームの平均値や最小値などの統計量を初期値に用いるように制御してもよい。初期化部104は、これにより、信号処理装置100の出力信号の品質が急変することを回避できる。尚、初期化部104は、推定部103に内包されてもよい。
(抑圧部105)
図4は、本実施形態に係る抑圧部105の構成を概念的に示すブロック図である。図4に示す通り、抑圧部105は、ゲイン計算部1051、及び、乗算部1052を含む。
ゲイン計算部1051は、既存の技術を用いて、第二信号を抑圧する際に使用する値であるゲインG(k,n)を求めることができる。ゲイン計算部1051は、例えば非特許文献5に記載されている通り、第一信号との平均2乗誤差を最小にする最適推定値をゲインとして求めてもよい。この場合、ゲイン計算部1051は、ゲインG(k,n)を、数7に示す通り算出する。
Figure 2018031819
ゲイン計算部1051は、また、非特許文献6に記載された方法を用いて、ゲインG(k,n)を求めても良い。この場合、ゲイン計算部1051は、ゲインG(k,n)を、数8に示す通り算出する。数8において、α0、β0、γ1、γ2は、いずれも実数であり、α0とβ0は、それぞれα0>1、0<β0<1を満たすこととする。
Figure 2018031819
ゲイン計算部1051は、あるいは、非特許文献1や非特許文献7に記載された方法を用いて、ゲインG(k,n)を計算してもよい。
図4に示す乗算部1052は、ゲイン計算部1051によって求めたゲインG(k,n)を、混在信号振幅スペクトル|X(k,n)|と乗算したG(k,n)|X(k,n)|を、出力信号振幅スペクトルとして求める。乗算部1052は、求めた出力信号振幅スペクトルを逆変換部106へ入力する。
(記憶部108)
図1に示す記憶部108は、推定部103から入力された推定第二信号パワースペクトルを所定の時間に亘って記憶したのち、記憶している推定第二信号パワースペクトルを保存信号パワースペクトルとして混合部107へ入力する。
記憶部108は、例えば複数のバッファ(記憶素子)により構成され、複数フレーム分の推定第二信号パワースペクトルを記憶する。記憶部108は、最も古くに記憶した推定第二信号パワースペクトルを、保存信号パワースペクトルとして出力する。記憶部108は、数9に示す手順(step1乃至step3)によって、当該複数のバッファを更新する。数9において、BN(k,m)は、記憶部108におけるバッファからの出力を表す。N(k,n)は、推定部103から記憶部108に入力された推定第二信号パワースペクトルを表す。BNout(k,n)は、記憶部108から出力された保存信号パワースペクトルを表す。記憶部108は、Q(Qは任意の自然数)フレーム分の推定第二信号パワースペクトルを記憶することとする。
Figure 2018031819
すなわち、記憶部108は、1番目のバッファに、推定部103から入力された推定第二信号パワースペクトルを記憶する。記憶部108は、各バッファに記憶した推定第二信号パワースペクトルを、当該バッファに隣接するバッファへコピーする。そして、記憶部108は、Q番目のバッファに記憶した推定第二信号パワースペクトルを、保存信号パワースペクトルとして出力する。
記憶部108は、このような隣接バッファに対して推定第二信号パワースペクトルをコピーする代わりに、バッファのインデックスを制御することによって、推定部103から入力された推定第二信号パワースペクトルを所定の時間に亘って記憶してもよい。この場合、記憶部108は、数10に示す手順(step1乃至step3)によって、当該複数のバッファを更新する。数10において、「%」は剰余演算を表す。
Figure 2018031819
数10におけるstep3が示す代入式は、バッファのインデックスqの更新式を表す。この更新式において、右辺が示すqを用いた計算結果が、新たなqの値となる。例えば、バッファのサイズが10(すなわち「Q=10」)である場合、右辺のqの値が5のときは左辺のqの値は6となり、右辺のqの値が10のときは左辺のqの値は1となる。記憶部108は、数10に示す手順を用いる場合、推定部103から推定第二信号パワースペクトルが入力されるたびに、隣接バッファに推定第二信号パワースペクトルをコピーする必要が無くなるので、処理量が低減することができる。
(混合部107)
図5は、本実施形態に係る混合部107の構成を概念的に示すブロック図である。図5に示す通り、混合部107は、混合処理部1071を含む。
混合処理部1071は、判定部102から入力された判定結果に基づいて、推定部103から入力された推定第二信号パワースペクトルと、記憶部108から入力された保存信号パワースペクトルとを混合し、混合信号パワースペクトルとして、判定部102と抑圧部105とへ入力する。
判定部102による判定結果に従い、初期化部104によって推定部103が初期化された時点では、記憶部108及び推定部103から出力されるパワースペクトルは、順に、初期化直前及び初期化直後の推定第二信号パワースペクトルであると言える。したがって、混合部107から出力される混合信号パワースペクトルは、初期化直前及び初期化直後の推定第二信号パワースペクトルを混合して得られる新たな推定第二信号パワースペクトルと言える。混合部107は、初期化直前及び初期化直後の信号を混合することによって、初期化に伴って急激に変化した推定第二信号パワースペクトルが抑圧部105に入力されるのを防ぐことができる。
混合処理部1071は、推定第二信号パワースペクトル及び保存信号パワースペクトルを変数とする写像関数によって算出した値を、混合信号パワースペクトルとして出力する。本実施形態では、代表的な写像関数として知られている重み付き和を用いる場合について説明する。混合処理部1071は、混合信号パワースペクトル|Nmix(k,n)|2を、数11に示す通り算出する。数11において、|N(k,n)|2は推定第二信号パワースペクトルを表し、BNout(k,n)は保存信号パワースペクトルを表す。c1(k,n)及びd2(k,n)は実数である。
Figure 2018031819
混合処理部1071が混合信号パワースペクトルを算出する方法は、上述した重み付き和を用いた方法に限定されない。混合処理部1071は、例えば、推定第二信号パワースペクトル|N(k,n)|2及び保存信号パワースペクトルBNout(k,n)を対数化し、対数化した両方のパワースペクトルの重み付き和を算出してもよい。混合処理部1071は、この場合、重み付き和を算出した後に、指数関数を使用することによって、算出した重み付き和をリニア領域信号へ変換する。すなわち、混合処理部1071は、混合信号パワースペクトル|Nmix(k,n)|2を、数12に示す通り算出する。数12において、「exp」及び「log」は、順に、指数関数及び対数関数を表す。
Figure 2018031819
特に、第一信号及び第二信号が音信号である場合、混合部107は、対数領域において重み付き和を算出することによって、聴覚的に優れた混合を実現できる。混合処理部1071は、また、高次の多項式関数や非線形関数など他の数式により表される関数を、混合信号パワースペクトルを算出する際に用いてもよい。
数12において、混合信号パワーが混合前の推定第二信号パワーと比べて大きく変化しないようにするために、c1(k,n)及びd1(k,n)は、共に0以上1未満の実数であり、かつ、「c1(k,n) + d1(k,n) = 1」という関係を満足することとする。そして、混合処理部1071は、判定部102によって過小推定と判定されてから所定の時間が経過したのちに、「c1(k,n) = 0, d1(k,n) = 1」となるようにする。すなわち、c1(k,n)及びd1(k,n)は、共にフレームnの関数として定義される。c1(k,n)及びd1(k,n)は、例えばフレームnの一次関数として、数13に示す通り定義される。
Figure 2018031819
数13において、n0は、判定部102によって過小推定と判定されたフレームである。また、a2及びb2は実数であり、「a2 > 0」を満足することとする。数13が示す「max(x,y)」は、x及びyのどちらか大きい方を出力する関数を表し、「min(x,y)」は、x及びyのどちらか小さい方を出力する関数を表す。混合部107は、このような一次関数を用いることによって、推定部103に対する初期化に伴う推定第二信号パワースペクトルの急激な変化を回避することができる。混合処理部1071は、高次の多項式関数や非線形関数を、上述した一次関数の代わりに用いてもよい。混合処理部1071は、判定部102によって過小と判定されてから所定の時間(短時間)が経過したのちに「c1(k,n) = 0, d1(k,n) = 1」となるようにすることによって、過小推定状態が継続する期間を短くすることができる。
次に図6のフローチャートを参照して、本実施形態に係る信号処理装置100の動作(処理)について詳細に説明する。
変換部101は、第一信号と第二信号とを含む混在信号から、混在信号の振幅スペクトル及び位相スペクトルを生成する(ステップS101)。推定部103は、変換部101により生成された混在信号の振幅スペクトルから第二信号を推定し、その推定結果として、推定第二信号を生成する(ステップS102)。記憶部108は、生成された推定第二信号を、所定の時間に亘って記憶する(ステップS103)。判定部102は、混在信号の振幅スペクトルと混合信号とに基づき、推定第二信号の大きさが基準を満たすか否か(過小推定か否か)を判定する(ステップS104)。
推定第二信号の大きさが基準を満たす場合(ステップS105でYes)、混合部107は、判定部102による判定結果に応じて、記憶部108に記憶された推定第二信号(保存信号)と、推定部103から出力された推定第二信号とを混合した混合信号を生成する(ステップS107)。推定第二信号の大きさが基準を満たさない場合(ステップS105でNo)、初期化部104は、推定部103における現在までに入力された混在信号の状態を示す情報を、第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に変更する初期化処理を行い(ステップS106)、処理はステップS107へ進む。
抑圧部105は、混合部107によって生成された混合信号を使用して第二信号を抑圧することにより、出力信号の振幅スペクトルを生成する(ステップS108)。逆変換部106は、抑圧部105により生成された出力信号の振幅スペクトルと、変換部101により生成された混在信号の位相スペクトルとを使用して出力信号を生成して、生成した出力信号を外部に出力し(ステップS109)、処理はステップS101へ戻る。
本実施形態に係る信号処理装置100は、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定できる。その理由は、信号処理装置100は、推定第二信号の大きさが基準を満たすか否かを判定し、基準を満たさない場合は、第二信号の推定に使用する混在信号の状態を示す情報を、推定処理を開始するときの状態あるいはその状態に関連する状態に変更する初期化処理を行うからである。
以下に、本実施形態に係る信号処理装置100によって実現される効果について、詳細に説明する。
携帯電話など様々な音声端末において使用されている第二信号推定技術は、一般的に、例えば雑音などの非所望信号である第二信号の大きさが突然大きくなることを想定していない。このため、混在信号に含まれる第二信号の大きさが突然大きくなった場合、第二信号の推定を正確に行うことができず、出力信号の品質が低下するという問題がある。
このような問題に対して、本実施形態に係る信号処理装置100では、推定部103は、第一信号と第二信号とが含まれる混在信号における、第二信号を現在までに入力された混在信号の状態を示す情報に基づいて推定し、推定結果として、推定第二信号を生成する。記憶部108は、推定部103によって生成された推定第二信号を、所定の時間に亘って記憶する。判定部102は、混在信号と、記憶部108に記憶された推定第二信号及び推定部103が生成した推定第二信号が混合された混合信号とに基づいて、推定第二信号の大きさが、基準を満たすか否か(過小か否か)を判定する。混合部107は、判定部102による判定結果に応じて、混合信号を生成する。初期化部104は、判定部102によって、推定第二信号の大きさが基準を満たさないと判定された場合に、当該混在信号の状態を示す情報を、第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に変更する初期化処理を行う。抑圧部105は、混在信号に含まれる第二信号を、混合信号を使用して抑圧することによって出力信号を生成する。
すなわち、本実施形態に係る信号処理装置100は、大きさが突然大きくなった第二信号に追随できるように、第二信号を推定する際に使用する混在信号の状態を示す情報を、第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に戻す(変更する)。これにより、本実施形態に係る信号処理装置100は、混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定することによって、雑音抑圧処理後の出力信号の品質を向上することができる。
また、本実施形態に係る信号処理装置100は、記憶部108から出力された推定第二信号(保存信号)と推定部103から出力された推定第二信号を混合した混合信号を生成し、この混合信号を用いて第二信号を推定する。すなわち、信号処理装置100は、判定部102による判定結果に基づいて推定部103を初期化する際に、初期化直前の推定第二信号が示す値を反映した混合信号を求めるので、初期化に伴う推定第二信号の急変を回避できる。これにより、本実施形態に係る信号処理装置100は、推定第二信号の急変に伴う音質劣化を防止できるので、出力信号の品質を向上することができる。
<第2の実施形態>
次に、本願発明の第2の実施形態に係る信号処理装置100Aについて説明する。本実施形態に係る信号処理装置100Aは、図1に示す通り、変換部101、判定部202、推定部103、初期化部104、抑圧部105、逆変換部106、混合部207、及び、記憶部108を備えている。本実施形態に係る信号処理装置100Aは、混合部207を除く構成については第1の実施形態と同様であるので、その説明を省略する。
図7は、本実施形態に係る混合部207の構成を概念的に示すブロック図である。図7に示す通り、混合部207は、混合処理部2071と、相対関係計算部2072と、を含む。
相対関係計算部2072は、推定部103から入力された推定第二信号パワースペクトルと、混合処理部2071から入力された混合信号パワースペクトルの相対関係(第一の相対関係)を示す値を算出し、算出した値を混合処理部2071へ入力する。ここで相対関係とは、単純な大小関係のほか、両者の差分あるいは比のことである。
混合部207は、現フレームの混合信号パワースペクトルを用いて、現フレームの混合信号パワースペクトルを求めることはできないので、過去に求めた混合信号パワースペクトルを用いる必要がある。本実施形態では、混合部207が1フレーム分過去に求めた混合信号パワースペクトルを用いる場合について説明する。例えば、相対関係を差分により示す場合、相対関係計算部2072は、相対関係D2(k,n)を数14に示す通り算出する。
Figure 2018031819
相対関係計算部2072は、あるいは、相対関係D2(k,n)を、数15に示す通り対数の差分として算出しても良い。
Figure 2018031819
混合部207は、数14あるいは数15に示す例では、1フレーム分過去に求めた混合信号パワースペクトルを用いるので、推定第二信号パワースペクトルについても1フレーム過去のパワースペクトルを使用するが、推定第二信号パワースペクトルについては、現フレーム(第nフレーム)のパワースペクトルを用いてもよい。
混合処理部2071は、判定部102から入力された判定結果と、相対関係計算部2072から入力された相対関係を示す値とに基づいて、推定部103から入力された推定第二信号パワースペクトルと、記憶部108から入力された保存信号パワースペクトルとを混合する。混合処理部2071は、これにより生成した混合信号パワースペクトルを、判定部102及び抑圧部105へ入力する。すなわち、本実施形態に係る混合処理部2071は、混合比率の算出に関して、混合前後の相対関係を示す値を新たに用いる点において、第1の実施形態に係る混合処理部1071と異なる。
混合処理部2071は、相対関係計算部2072によって算出された相対関係を示す値に基づいて、混合前後の推定第二信号パワースペクトルを比較する。混合処理部2071は、混合前後におけるパワースペクトルの変化が小さくなるのに応じて、保存信号パワースペクトルを混合する割合を小さくする。混合処理部2071がこのような処理を行う理由は、この場合、推定部103における過小推定が解消しつつあると考えられるためである。
混合処理部2071は、第1の実施形態に係る混合処理部1071と同様に、混合信号パワースペクトル|Nmix(k,n)|2を、数16に示す通り算出する。数16において、c2(k,n)及びd2(k,n)は実数である。
Figure 2018031819
第1の実施形態では、c2(k,n)及びd2(k,n)は、フレームnの関数により定義されているのに対して、本実施形態に係る混合処理部2071は、c2(k,n)及びd2(k,n)を、相対関係計算部2072によって算出された相対関係を示す値に応じて変化させる。すなわち、混合処理部2071は、相対関係を示す値を変数とする写像関数により、c2(k,n)及びd2(k,n)を求める。混合処理部2071は、例えば、写像関数として一次関数を用いる場合、相対関係D2(k,n)を用いて、c2(k,n)及びd2(k,n)を数17に示す通り算出する。
Figure 2018031819
数17において、|x|はxの絶対値を表す。また、a3及びb3は実数であり、「a3>0」を満足することとする。max(x,y)は、x及びyのどちらか大きい方を返す関数を表し、min(x,y)は、x及びyのどちらか小さい方を返す関数を表す。数17に示す数式において、D2(k,n)の絶対値が0である場合、「c2(k,n) = 0、d2(k,n) = 1」となるので、「|Nmix(k,n)|2 = BNout(k,n)」となる。混合処理部2071は、写像関数として、上述した一次関数の代わりに、例えばシグモイド関数を使用することによって、c2(k,n)及びd2(k,n)を滑らかに変化させることができる。混合処理部2071は、あるいは、高次の多項式関数や非線形関数など、他の形で表される関数を写像関数として用いてもよい。混合処理部2071は、第1の実施形態に係る混合処理部1071と同様に、判定部102によって過小推定と判定されてから所定の時間が経過したのちに、「c2(k,n) = 0, d2(k,n) = 1」となるようにする。
本実施形態に係る信号処理装置100Aは、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定することができる。その理由は、第1の実施形態について説明した通りである。
また、本実施形態に係る混合部207は、推定第二信号パワースペクトルと混合信号パワースペクトルとの相対関係に基づいて、保存信号パワースペクトル及び推定第二信号パワースペクトルの混合比率を制御する。混合部207は、推定第二信号パワースペクトルと混合信号パワースペクトルとの比較によって、第二信号パワースペクトルに対する過小推定が解消しているか否かを判断することができる。したがって、本実施形態に係る信号処理装置100Aは、保存信号パワースペクトルと推定第二信号パワースペクトルとを適切に混合することによって、出力信号の品質を向上することができる。
<第3の実施形態>
次に、本願発明の第3の実施形態に係る信号処理装置300について説明する。図8は、本実施形態に係る信号処理装置300の構成を概念的に示すブロック図である。本実施形態に係る信号処理装置300は、図8に示す通り、変換部101、判定部202、推定部103、初期化部104、抑圧部105、逆変換部106、混合部307、及び、記憶部108を備えている。本実施形態に係る信号処理装置300は、混合部307を除く構成については第1の実施形態と同様であるので、その説明を省略する。
図9は、本実施形態に係る混合部307の構成を概念的に示すブロック図である。図9に示す通り、混合部307は、混合処理部3071と、相対関係計算部2072と、相対関係計算部3073と、を含む。相対関係計算部2072の動作については、第2の実施形態と同様であるので、その説明を省略する。
相対関係計算部3073は、推定部103から入力された推定第二信号パワースペクトルと、変換部101から入力された混在信号振幅スペクトルを2乗した値である混在信号パワースペクトルとの相対関係(第二の相対関係)を示す値を算出し、算出した値を混合処理部3071へ入力する。相対関係計算部3073は、混在信号パワースペクトルと推定第二信号パワースペクトルとの相対関係を示す値を、第2の実施形態に係る相対関係計算部2072と同様の方法により算出する。例えば、相対関係を差分により示す場合、相対関係計算部3073は、相対関係D3(k,n)を数18に示す通り算出する。
Figure 2018031819
相対関係計算部3073は、あるいは、相対関係D3(k,n)を、数19に示す通り対数の差分として算出しても良い。
Figure 2018031819
混合処理部3071は、判定部102から入力された判定結果と、相対関係計算部2072から入力された相対関係を示す値と、相対関係計算部3073から入力された相対関係を示す値とに基づいて、推定部103から入力された推定第二信号パワースペクトルと、記憶部108から入力された保存信号パワースペクトルを混合する。混合処理部3071は、混合することによって生成した混合信号パワースペクトルを、判定部102及び抑圧部105へ入力する。本実施形態に係る混合処理部3071は、混合比率の算出において、混在信号パワースペクトルと推定第二信号パワースペクトルとの相対関係を示す値を新たに用いるという構成において、第2の実施形態に係る混合処理部2061と異なる。
混合処理部3071は、相対関係計算部3073によって算出された相対関係を示す値に基づいて、混在信号パワースペクトルと推定第二信号パワースペクトルとを比較して、推定第二信号パワースペクトルに対する混在信号パワースペクトルが小さくなるのに応じて、保存信号パワースペクトルを混合する割合を小さくする。混合処理部3071がこのような処理を行う理由は、この場合、推定部103における過小推定が解消しつつあると考えられるためである。
混合処理部3071は、第1の実施形態に係る混合処理部1071及び第2の実施形態に係る混合処理部2071と同様に、混合信号パワースペクトル|Nmix(k,n)|2を、数20に示す通り算出する。数20において、c3(k,n)及びd3(k,n)は実数である。
Figure 2018031819
混合処理部3071は、c3(k,n)及びd3(k,n)を、数21に示す通り算出する。
Figure 2018031819
数21において、D2(k,n)は、相対関係計算部2072によって算出された相対関係を示す値であり、D3(k,n)は、相対関係計算部3073によって算出された相対関係を示す値である。数21において、F1及びF2は単調増加関数を表し、F1及びF2がとる値域は0から1である。代表的な単調増加関数の例としては、例えば、数22に示す一次関数などがある。
Figure 2018031819
数22において、a4及びb4は実数であり、「a4>0」を満足することとする。a5及びb5も同様に実数であり、「a5>0」を満足することとする。混合処理部3071は、数21におけるF1及びF2として、数22に示す一次関数の代わりに、例えばシグモイド関数を使用することによって、c3(k,n)及びd3(k,n)を滑らかに変化させることができる。混合処理部3071は、あるいは、高次の多項式関数や非線形関数など、他の形で表される関数を、数21におけるF1及びF2として用いてもよい。混合処理部3071は、第1の実施形態に係る混合処理部1071及び第2の実施形態に係る混合処理部2071と同様に、判定部102によって過小推定と判定されてから所定の時間が経過したのちに、「c3(k,n) = 0, d3(k,n) = 1」となるようにする。
本実施形態に係る信号処理装置300は、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定することができる。その理由は、第1の実施形態について説明した通りである。
また、本実施形態に係る混合部307は、混在信号パワースペクトルと推定第二信号パワースペクトルとの相対関係を示す値も用いて、保存信号パワースペクトルと推定第二信号パワースペクトルとの混合比率を制御する。推定第二信号パワースペクトルが混在信号パワースペクトルよりも大きくなっている場合、推定部103による過小推定が解消されたことになるので、混合部307は、保存信号パワースペクトルを混合する必要が無くなる。したがって、本実施形態にかかる信号処理装置300は、保存信号パワースペクトルと推定第二信号パワースペクトルとを適切に混合することによって、出力信号の品質を向上することができる。
<第4の実施形態>
次に、本願発明の第4の実施形態に係る信号処理装置400について説明する。図10は、本実施形態に係る信号処理装置400の構成を概念的に示すブロック図である。本実施形態に係る信号処理装置400は、図10に示す通り、変換部101、判定部202、推定部403、初期化部104、抑圧部105、逆変換部106、混合部407、及び、記憶部108を備えている。本実施形態に係る信号処理装置400は、推定部403及び混合部407を除く構成については第1の実施形態と同様であるので、その説明を省略する。
推定部403は、変換部101から入力された混在信号振幅スペクトルを2乗した値である混在信号パワースペクトルと、判定部102から入力された判定結果とに基づいて、混在信号パワースペクトルに含まれる第二信号パワースペクトルを推定する。推定部403は、推定した第二信号パワースペクトルを、混合部407及び記憶部108へ入力する。推定部403は、また、推定部403の状態に関する情報である推定状態情報を、混合部407へ入力する。
推定状態情報は、推定部403が推定処理を行う過程において処理する内容を示す情報であり、例えば、推定処理の過程において算出された様々な値等を含む情報である。推定状態情報の内容は、推定部403が推定処理を行う方式により異なる。推定状態情報は、例えば、混在信号パワースペクトルが第二信号パワースペクトルらしいか否かを示す指標となる値を含む。推定状態情報は、例えば、混在信号パワースペクトルに第二信号の成分がどの程度含まれているかを示す第二信号の含有量に対する推定値を含む。推定状態情報は、例えば、推定値(推定第二信号)の更新回数や、推定値の単位時間あたりの更新回数を示す更新頻度等を含む。
図11は、本実施形態に係る混合部407の構成を概念的に示すブロック図である。図11に示す通り、混合部407は、混合処理部4071を含む。
混合処理部4071は、判定部102から入力された判定結果と、推定部403から入力された推定状態情報とに基づいて、推定部403から入力された推定第二信号パワースペクトルと、記憶部108から入力された保存信号パワースペクトルとを混合する。混合処理部4071は、混合することにより生成した混合信号パワースペクトルを、判定部102及び抑圧部105へ入力する。本実施形態に係る混合処理部4071は、混合比率の算出において、推定状態情報を使用するという構成において、第1の実施形態に係る混合処理部1071と異なる。
混合処理部4071は、推定状態情報に基づいて、例えば、推定部403により求められた推定値の安定度を算出する。この安定度は、例えば、推定値の更新が頻繁に行われず、推定値が安定していることを示す指標である。この場合、混合処理部4071は、推定状態情報に含まれる推定値の更新頻度に基づいて、推定値の安定度を算出する。混合処理部4071は、算出した安定度が基準を満たす(推定値が安定している)場合、保存信号パワースペクトルを混合する割合を低下させる。混合処理部4071は、第1乃至第3の実施形態に係る混合処理部と同様に、判定部102によって過小推定と判定されてから所定の時間が経過したのちに、保存信号パワースペクトルを混合する割合をゼロにする。
本実施形態に係る信号処理装置400は、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定することができる。その理由は、第1の実施形態について説明した通りである。
また、本実施形態に係る混合部407は、推定部403から入力された推定状態情報に基づいて、保存信号パワースペクトルと推定第二信号パワースペクトルとの混合比率を制御する。推定状態情報は、推定第二信号パワースペクトルに対して、保存信号パワースペクトルを混合する割合を適切に定めるための指標となる。したがって、本実施形態に係る信号処理装置400は、保存信号パワースペクトルと推定第二信号パワースペクトルとを適切に混合することによって、出力信号の品質を向上することができる。
<第5の実施形態>
次に、本願発明の第5の実施形態に係る信号処理装置500について説明する。図12は、本実施形態に係る信号処理装置500の構成を概念的に示すブロック図である。本実施形態に係る信号処理装置500は、図12に示す通り、変換部101、判定部202、推定部403、初期化部104、抑圧部105、逆変換部106、混合部107、記憶部508、及び、入力制御部509を備えている。本実施形態に係る信号処理装置500は、記憶部508及び入力制御部509を除く構成については第1の実施形態と同様であるので、その説明を省略する。
入力制御部509は、判定部102から供給された判定結果に基づいて、推定部103から出力された推定第二信号パワースペクトルを、記憶部508へ入力するか否かを制御する。入力制御部509は、判定部102により、推定第二信号パワースペクトルの大きさが基準を満たさない(過小推定である)と判定された場合、推定第二信号パワースペクトルを記憶部508に入力しないように制御する。これにより、推定部103が初期化された直後に推定部103から出力された推定第二信号パワースペクトルは、記憶部508へ入力されなくなる。そして、入力制御部509は、判定部102による過小推定の判定から所定の時間が経過したのち、記憶部508に対する推定第二信号パワースペクトルの供給を再開する。
記憶部508は、入力制御部509から入力された推定第二信号パワースペクトルを所定の時間に亘って記憶したのち、記憶している推定第二信号パワースペクトルを保存信号パワースペクトルとして混合部107へ入力する。記憶部507は、第1実施形態に係る記憶部108とは異なり、例えば単一のバッファ(記憶素子)によって構成され、1フレーム分の推定第二信号パワースペクトルを記憶する。
本実施形態に係る信号処理装置500は、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定することができる。その理由は、第1の実施形態について説明した通りである。
また、本実施形態に係る入力制御部509は、判定部102による判定結果に基づいて、記憶部508に対して、推定第二信号パワースペクトルを入力するか否かを制御する。推定部103による過小推定が生じている状態では、通常、時間の経過に伴う推定値の変化量は小さい。したがって、例えば、推定部103による過小推定の状態がMフレーム分の時間に亘って継続するときに、本実施形態に係る記憶部508から出力される保存信号パワースペクトルは、少なくともM個の記憶素子を有する第1の実施形態に係る記憶部108から出力される保存信号パワースペクトルとほぼ同等な値となる。したがって、本実施形態に係る信号処理装置500は、記憶部の記憶容量が小さい場合であっても、出力信号の品質を向上することができる。
<第6の実施形態>
図13は、本願発明の第6の実施形態に係る信号処理装置600の構成を概念的に示すブロック図である。信号処理装置600は、第一信号(注目すべき所望の音声信号)と第二信号(雑音(ノイズ))とを含む混在信号から、第二信号を推定することによって、第一信号が存在するか否かを判定する装置である。
本実施形態に係る信号処理装置700は、変換部101、判定部102、推定部103、初期化部104、混合部107、記憶部108、及び、第二判定部609を備えている。本実施形態に係る信号処理装置600は、第二判定部609を除く構成については第1の実施形態と同様であるので、その説明を省略する。
図14は、本実施形態に係る第二判定部609の構成を概念的に示すブロック図である。第二判定部609は、相対関係計算部6091と、判定実行部6092と、を含む。
相対関係計算部6091は、変換部101から入力された混在信号振幅スペクトルの2乗に相当する混在信号パワースペクトル|X(k,n)|2と、混合部107から入力された混合信号パワースペクトル|Nmix(k,n)|2との相対関係を示す値を算出する。ここで相対関係とは、単純な大小関係のほか、両者の差分あるいは比のことである。例えば、相対関係を大小関係により示す場合、相対関係計算部6091は、相対関係D2(n)を、数23に示す通り算出する。
Figure 2018031819
数23において、a2及びb2は実数である。また、相対関係を差分により示す場合、相対関係計算部6091は、相対関係D2(n)を、数24に示す通り算出する。
Figure 2018031819
相対関係計算部6091は、また、相対関係D2(n)を、数25に示す通り、対数の差分として算出してもよい。この場合、相対関係計算部6091により算出される値は、混在信号パワースペクトルと混合信号パワースペクトルとの比に相当する。
Figure 2018031819
判定実行部6092は、相対関係計算部6091により算出された相対関係を示す値を用いて、第一信号が存在するか否かを判定し、その判定結果を出力する。判定実行部6092は、例えば、混在信号パワースペクトルが混合信号パワースペクトルよりも大きい場合に、第一信号が存在すると判定する。したがって、例えば、相対関係計算部6091により算出される相対関係が、数23に示す通り大小関係により示される場合、判定実行部6092は、相対関係を示す値が「a2」となるときに、第一信号が存在すると判定する。判定実行部6092は、相対関係が数24あるいは数25に示す通りである場合、相対関係D(k,n)が予め定められた閾値を上回っているときに、第一信号が存在すると判定する。
本実施形態に係る信号処理装置600は、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定することができる。その理由は、第1の実施形態について説明した通りである。そして、本実施形態に係る信号処理装置600は、第二判定部609を備えることによって、第二信号の大きさが突然大きくなった場合であっても、第一信号が存在するか否かを正確に判定できる。
以下に、本実施形態に係る信号処理装置600によって実現される効果について、詳細に説明する。
携帯電話など様々な音声端末において使用されている音声検出技術は、一般的に、雑音成分である第二信号の大きさが突然大きくなることを想定していない。このため、混在信号に含まれる第二信号の大きさが突然大きくなった場合、第二信号を正しく推定できず、判定結果を誤るという問題がある。その結果、音声符号化のビットレートが誤って高くなる、あるいは、音声認識結果が誤るといった問題が発生する。
このような問題に対して、本実施形態に係る信号処理装置600では、推定部103は、第一信号と第二信号とが含まれる混在信号における、第二信号を現在までに入力された混在信号の状態を示す情報に基づいて推定し、推定結果として、推定第二信号を生成する。記憶部108は、推定部103によって生成された推定第二信号を、所定の時間に亘って記憶する。判定部102は、混在信号と、記憶部108に記憶された推定第二信号及び推定部103が生成した推定第二信号が混合された混合信号とに基づいて、推定第二信号の大きさが、基準を満たすか否か(過小か否か)を判定する。混合部107は、判定部102による判定結果に応じて、混合信号を生成する。初期化部104は、判定部102によって、推定第二信号の大きさが基準を満たさないと判定された場合に、当該混在信号の状態を示す情報を、第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に変更する初期化処理を行う。そして、第二判定部609は、推定第二信号を用いて、混在信号に第一信号が含まれるか否かを判定する。
すなわち、本実施形態に係る信号処理装置600は、大きさが突然大きくなった第二信号に追随できるように、第二信号を推定する際に使用する混在信号の状態を示す情報を、第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に戻す(変更する)。これにより、本実施形態に係る信号処理装置600は、混在信号において、第二信号の大きさが突然大きくなった場合であっても、第一信号が含まれているか否かを正確に判定することができる。
<第7の実施形態>
図15は、本願発明の第7の実施形態に係る信号処理装置700の構成を概念的に示すブロック図である。
本実施形態に係る信号処理装置700は、判定部702、推定部703、混合部707、及び、記憶部708を備えている。
推定部703は、第一信号と第二信号とが混在した混在信号を用いて、その混在信号に混在する第二信号を推定し(推定処理)、推定第二信号として提供する。
判定部702は、混在信号と推定第二信号とに基づいて、推定第二信号が過小であるか否かを判定する。
記憶部708は、推定第二信号を保存する。
混合部707は、判定部702での判定の結果に基づいて、記憶部708に保存された信号と、推定第二信号とを混合して混合信号を生成する。
そして、推定部703は、判定部702での判定の結果に基づいて、推定処理を初期化する。
本実施形態に係る信号処理装置700は、第一信号と第二信号とが含まれる混在信号において、第二信号の大きさが突然大きくなった場合であっても、第二信号を正確に推定することができる。その理由は、信号処理装置700は、推定第二信号が過小であるか否かを判定し、その判定の結果に基づいて、推定処理を初期化するからである。
また、本実施形態に係る信号処理装置700は、判定部702による判定の結果に基づいて、記憶部708に保存された信号と推定第二信号とを混合した混合信号を生成するので、初期化に伴う推定第二信号の急変を回避できる。
<ハードウェア構成例>
上述した各実施形態において図1乃至図5、及び、図7乃至図15に示した信号処理装置における各部は、専用のHW(HardWare)(電子回路)によって実現することができる。また、図1乃至図5、及び、図7乃至図15において、少なくとも、下記構成は、ソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。
・判定部102、及び、702、
・推定部103、403、及び、703、
・初期化部104、
・抑圧部105、
・混合部107、207、307、407、及び、707
・記憶部108、508、及び、708、
・第二判定部609。
但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図16を参照して説明する。
図16は、本願発明の各実施形態に係る信号処理装置を実行可能な情報処理装置900(コンピュータ)の構成を例示的に説明する図である。即ち、図16は、図1乃至図5、及び、図7乃至図15に示した信号処理装置を実現可能なコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。
図16に示した情報処理装置900は、構成要素として下記を備えている。
・CPU(Central_Processing_Unit)901、
・ROM(Read_Only_Memory)902、
・RAM(Random_Access_Memory)903、
・ハードディスク(記憶装置)904、
・外部装置との通信インタフェース905、
・バス906(通信線)、
・CD−ROM(Compact_Disc_Read_Only_Memory)等の記録媒体907に格納されたデータを読み書き可能なリーダライタ908、
・入出力インタフェース909。
即ち、上記構成要素を備える情報処理装置900は、これらの構成がバス906を介して接続された一般的なコンピュータである。情報処理装置900は、CPU901を複数備える場合もあれば、マルチコアにより構成されたCPU901を備える場合もある。
そして、上述した実施形態を例に説明した本願発明は、図16に示した情報処理装置900に対して、次の機能を実現可能なコンピュータプログラムを供給する。その機能とは、その実施形態の説明において参照したブロック構成図(図1乃至図5、及び、図7乃至図15)における上述した構成、或いはフローチャート(図6)の機能である。本願発明は、その後、そのコンピュータプログラムを、当該ハードウェアのCPU901に読み出して解釈し実行することによって達成される。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性のメモリ(RAM903)、または、ROM902やハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。入出力インタフェース909は,A(Analog)/D(Digital)変換機能やD/A変換機能を備えてもよい。
また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、現在では一般的な手順を採用することができる。その手順としては、例えば、CD−ROM等の各種記録媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等がある。そして、このような場合において、本願発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記録媒体907によって構成されると捉えることができる。
以上、上述した実施形態を模範的な例として本願発明を説明した。しかしながら、本願発明は、上述した実施形態には限定されない。即ち、本願発明は、本願発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
尚、上述した各実施形態の一部又は全部は、以下の付記のようにも記載されうる。しかしながら、上述した各実施形態により例示的に説明した本発明は、以下には限られない。すなわち、
(付記1)
第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供する推定手段と、
前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定する第一の判定手段と、
前記推定第二信号を保存する記憶手段と、
前記第一の判定手段での判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成する混合手段と、
を備え、
前記推定手段は、前記第一の判定手段での判定の結果に基づいて、推定処理を初期化する
ことを特徴とする信号処理装置。
(付記2)
前記混合手段は、前記推定第二信号と前記混合信号との第一の相対関係を求めることによって、前記混合信号を生成する、
付記1に記載の信号処理装置。
(付記3)
前記混合手段は、前記推定第二信号と前記混在信号との第二の相対関係を求めることによって、前記混合信号を生成する、
付記2に記載の信号処理装置。
(付記4)
前記混合手段は、
前記第一の相対関係に基づき、前記推定第二信号と前記混合信号との差分が小さくなるのに応じて、前記記憶手段に記憶された信号を混合する割合を低下させ、
前記第二の相対関係に基づき、前記推定第二信号に対する前記混在信号の大きさが小さくなるのに応じて、前記記憶手段に記憶された信号を混合する割合を低下させる、
付記3に記載の信号処理装置。
(付記5)
前記推定手段は、推定状態情報を出力し、
前記混合手段は、前記推定状態情報に基づいて前記混合信号を生成する、
付記1乃至4のいずれか一項に記載の信号処理装置。
(付記6)
前記推定手段は、前記推定第二信号の安定度を示す情報を含む前記推定状態情報を出力し、
前記混合手段は、前記安定度が基準を満たす場合、前記記憶手段に記憶された信号を混合する割合を低下させる、
付記5に記載の信号処理装置。
(付記7)
前記混合信号を使用して、前記混在信号に含まれる前記第二信号を抑圧する抑圧手段を更に備える、
付記1乃至6のいずれか一項に記載の信号処理装置。
(付記8)
前記混合信号を使用して、前記混在信号に前記第一信号が含まれているか否かを判定する第二の判定手段を更に備える、
付記1乃至6のいずれか一項に記載の信号処理装置。
(付記9)
情報処理装置によって、
第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供し、
前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定し、
前記推定第二信号を記憶手段に保存し、
その判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成し、
前記判定の結果に基づいて、推定処理を初期化する
信号処理方法。
(付記10)
第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供する推定処理と、
前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定する判定処理と、
前記推定第二信号を記憶手段に保存する記憶処理と、
前記判定処理での判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成する混合処理と、
をコンピュータに実行させ、
前記推定処理は、前記判定処理での判定の結果に基づいて、前記第二信号を推定する処理を初期化する
ことを特徴とする信号処理プログラム。
(付記11)
第一信号と第二信号とが含まれる混在信号における前記第二信号を、現在までに入力された前記混在信号の状態を示す情報に基づいて推定し、推定結果を表す推定第二信号を生成する推定手段と、
前記推定手段により生成された前記推定第二信号を、所定の時間に亘って記憶する記憶手段と、
前記混在信号と、前記記憶手段に記憶された前記推定第二信号及び前記推定手段が生成した前記推定第二信号とが混合された混合信号とに基づいて、前記推定第二信号の大きさが基準を満たすか否かを判定する第一の判定手段と、
前記第一の判定手段による判定結果に応じて、前記混合信号を生成する混合手段と、
前記推定第二信号の大きさが前記基準を満たさないと前記第一の判定手段によって判定された場合に、前記混在信号の状態を示す情報を、前記推定手段が前記第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に変更する初期化処理を行う初期化手段と、
を備える信号処理装置。
(付記12)
前記混合手段は、前記推定手段から出力された前記推定第二信号の大きさと前記混合信号の大きさとの第一の相対関係を示す値を求めることによって、前記混合信号を生成する、
付記11に記載の信号処理装置。
(付記13)
前記混合手段は、前記推定手段から出力された前記推定第二信号の大きさと前記混在信号の大きさとの第二の相対関係を示す値を求めることによって、前記混合信号を生成する、
付記12に記載の信号処理装置。
(付記14)
前記混合手段は、
前記第一の相対関係を示す値に基づき、前記推定手段から出力された前記推定第二信号の大きさと前記混合信号の大きさとの差分が小さくなるのに応じて、前記記憶手段に記憶された前記推定第二信号を混合する割合を低下させ、
前記第二の相対関係を示す値に基づき、前記推定手段から出力された前記推定第二信号に対する前記混在信号の大きさが小さくなるのに応じて、前記記憶手段に記憶された前記推定第二信号を混合する割合を低下させる、
付記13に記載の信号処理装置。
(付記15)
前記推定手段は、前記推定第二信号を生成する過程における処理内容を示す推定状態情報を出力し、
前記混合手段は、前記推定状態情報に基づいて前記混合信号を生成する、
付記11乃至14のいずれか一項に記載の信号処理装置。
(付記16)
前記推定手段は、前記推定第二信号の安定度を示す情報を含む前記推定状態情報を出力し、
前記混合手段は、前記安定度が基準を満たす場合、前記記憶手段に記憶された前記推定第二信号を混合する割合を低下させる、
付記15に記載の信号処理装置。
(付記17)
前記混合信号を使用して、前記混在信号に含まれる前記第二信号を抑圧する抑圧手段を更に備える、
付記11乃至16のいずれか一項に記載の信号処理装置。
(付記18)
前記混合信号を使用して、前記混在信号に前記第一信号が含まれているか否かを判定する第二の判定手段を更に備える、
付記11乃至16のいずれか一項に記載の信号処理装置。
(付記19)
前記判定手段によって、前記推定第二信号の大きさが前記基準を満たさないと判定された場合に、前記推定手段から出力された前記推定第二信号が、所定の時間に亘って前記記憶手段に入力されないように制御する入力制御手段、
をさらに備える付記1乃至8のいずれか一項に記載の信号処理装置。
(付記20)
前記混合手段は、前記判定手段によって、前記推定第二信号の大きさが前記基準を満たさないと判定されてから所定の時間が経過したのち、前記推定手段から出力された前記推定第二信号を使用せずに前記混合信号を生成する、
付記11乃至19のいずれか一項に記載の信号処理装置。
(付記21)
情報処理装置によって、
第一信号と第二信号とが含まれる混在信号における前記第二信号を、現在までに入力された前記混在信号の状態を示す情報に基づいて推定し、推定結果を表す推定第二信号を生成し、
生成した前記推定第二信号を、所定の時間に亘って記憶手段に記憶し、
前記混在信号と、前記記憶手段に記憶された前記推定第二信号及び生成した前記推定第二信号とが混合された混合信号とに基づいて、前記推定第二信号の大きさが基準を満たすか否かを判定し、
その判定結果に応じて、前記混合信号を生成し、
前記推定第二信号の大きさが前記基準を満たさないと判定した場合に、前記混在信号の状態を示す情報を、前記第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に変更する初期化処理を行う、
信号処理方法。
(付記22)
第一信号と第二信号とが含まれる混在信号における前記第二信号を、現在までに入力された前記混在信号の状態を示す情報に基づいて推定し、推定結果を表す推定第二信号を生成する推定処理と、
前記推定処理により生成された前記推定第二信号を、所定の時間に亘って記憶手段に記憶する記憶処理と、
前記混在信号と、前記記憶手段に記憶された前記推定第二信号及び前記推定処理が生成した前記推定第二信号とが混合された混合信号とに基づいて、前記推定第二信号の大きさが基準を満たすか否かを判定する判定処理と、
前記判定処理による判定結果に応じて、前記混合信号を生成する混合処理と、
前記推定第二信号の大きさが前記基準を満たさないと前記判定処理によって判定された場合に、前記混在信号の状態を示す情報を、前記推定処理が前記第二信号を推定する処理を開始するときの状態あるいはその状態に関連する状態に変更する初期化処理と、
をコンピュータに実行させるための信号処理プログラム。
100 信号処理装置
101 変換部
1011 フレーム分割部
1012 窓関数乗算部
1013 フーリエ変換部
102 判定部
103 推定部
104 初期化部
105 抑圧部
1051 ゲイン計算部
1052 乗算部
106 逆変換部
1061 逆フーリエ変換部
1062 窓関数乗算部
1063 フレーム合成部
107 混合部
1071 混合処理部
108 記憶部
207 混合部
2071 混合処理部
2072 相対関係計算部
300 信号処理装置
307 混合部
3071 混合処理部
3073 相対関係計算部
400 信号処理装置
403 推定部
407 混合部
4071 混合処理部
500 信号処理装置
508 記憶部
509 入力制御部
600 信号処理装置
609 第二判定部
700 信号処理装置
702 判定部
703 推定部
707 混合部
708 記憶部
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク(記憶装置)
905 通信インタフェース
906 バス
907 記録媒体
908 リーダライタ
909 入出力インタフェース

Claims (10)

  1. 第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供する推定手段と、
    前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定する第一の判定手段と、
    前記推定第二信号を保存する記憶手段と、
    前記第一の判定手段での判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成する混合手段と、
    を備え、
    前記推定手段は、前記第一の判定手段での判定の結果に基づいて、推定処理を初期化する
    ことを特徴とする信号処理装置。
  2. 前記混合手段は、前記推定第二信号と前記混合信号との第一の相対関係を求めることによって、前記混合信号を生成する、
    請求項1に記載の信号処理装置。
  3. 前記混合手段は、前記推定第二信号と前記混在信号との第二の相対関係を求めることによって、前記混合信号を生成する、
    請求項2に記載の信号処理装置。
  4. 前記混合手段は、
    前記第一の相対関係に基づき、前記推定第二信号と前記混合信号との差分が小さくなるのに応じて、前記記憶手段に記憶された信号を混合する割合を低下させ、
    前記第二の相対関係に基づき、前記推定第二信号に対する前記混在信号の大きさが小さくなるのに応じて、前記記憶手段に記憶された信号を混合する割合を低下させる、
    請求項3に記載の信号処理装置。
  5. 前記推定手段は、推定状態情報を出力し、
    前記混合手段は、前記推定状態情報に基づいて前記混合信号を生成する、
    請求項1乃至4のいずれか一項に記載の信号処理装置。
  6. 前記推定手段は、前記推定第二信号の安定度を示す情報を含む前記推定状態情報を出力し、
    前記混合手段は、前記安定度が基準を満たす場合、前記記憶手段に記憶された信号を混合する割合を低下させる、
    請求項5に記載の信号処理装置。
  7. 前記混合信号を使用して、前記混在信号に含まれる前記第二信号を抑圧する抑圧手段を更に備える、
    請求項1乃至6のいずれか一項に記載の信号処理装置。
  8. 前記混合信号を使用して、前記混在信号に前記第一信号が含まれているか否かを判定する第二の判定手段を更に備える、
    請求項1乃至6のいずれか一項に記載の信号処理装置。
  9. 情報処理装置によって、
    第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供し、
    前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定し、
    前記推定第二信号を記憶手段に保存し、
    その判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成し、
    前記判定の結果に基づいて、推定処理を初期化する
    信号処理方法。
  10. 第一信号と第二信号とが混在した混在信号を用いて、前記混在信号に混在する第二信号を推定し、推定第二信号として提供する推定処理と、
    前記混在信号と前記推定第二信号とに基づいて、前記推定第二信号が過小であるか否かを判定する判定処理と、
    前記推定第二信号を記憶手段に保存する記憶処理と、
    前記判定処理での判定の結果に基づいて、前記記憶手段に保存された信号と、前記推定第二信号とを混合して混合信号を生成する混合処理と、
    をコンピュータに実行させ、
    前記推定処理は、前記判定処理での判定の結果に基づいて、前記第二信号を推定する処理を初期化する
    ことを特徴とする信号処理プログラム。
JP2016162069A 2016-08-22 2016-08-22 信号処理装置、信号処理方法、及び、信号処理プログラム Active JP6720771B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016162069A JP6720771B2 (ja) 2016-08-22 2016-08-22 信号処理装置、信号処理方法、及び、信号処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016162069A JP6720771B2 (ja) 2016-08-22 2016-08-22 信号処理装置、信号処理方法、及び、信号処理プログラム

Publications (2)

Publication Number Publication Date
JP2018031819A true JP2018031819A (ja) 2018-03-01
JP6720771B2 JP6720771B2 (ja) 2020-07-08

Family

ID=61302998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016162069A Active JP6720771B2 (ja) 2016-08-22 2016-08-22 信号処理装置、信号処理方法、及び、信号処理プログラム

Country Status (1)

Country Link
JP (1) JP6720771B2 (ja)

Also Published As

Publication number Publication date
JP6720771B2 (ja) 2020-07-08

Similar Documents

Publication Publication Date Title
US11443756B2 (en) Detection and suppression of keyboard transient noise in audio streams with aux keybed microphone
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
TWI420509B (zh) 語音增強用雜訊變異量估計器
KR101224755B1 (ko) 음성-상태 모델을 사용하는 다중-감각 음성 향상
Cohen Speech enhancement using super-Gaussian speech models and noncausal a priori SNR estimation
TW200842824A (en) Speech enhancement employing a perceptual model
JPWO2007058121A1 (ja) 残響抑圧の方法、装置及び残響抑圧用プログラム
US20150230023A1 (en) Noise estimation apparatus of obtaining suitable estimated value about sub-band noise power and noise estimating method
JP5788873B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
JPWO2012070668A1 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP6300031B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5294085B2 (ja) 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
Rosenkranz et al. Integrating recursive minimum tracking and codebook-based noise estimation for improved reduction of non-stationary noise
JP2011170190A (ja) 信号分離装置、信号分離方法、および、信号分離プログラム
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6720771B2 (ja) 信号処理装置、信号処理方法、及び、信号処理プログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
US9190070B2 (en) Signal processing method, information processing apparatus, and storage medium for storing a signal processing program
JP6361148B2 (ja) 雑音推定装置、方法及びプログラム
JP6720772B2 (ja) 信号処理装置、信号処理方法、及び、信号処理プログラム
JPWO2015093025A1 (ja) 音声処理装置、音声処理方法、及び、音声処理プログラム
JPWO2013032025A1 (ja) 信号処理装置、信号処理方法、およびコンピュータ・プログラム
US10109291B2 (en) Noise suppression device, noise suppression method, and computer program product
JP6679881B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP2005124026A (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190716

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200601

R150 Certificate of patent or registration of utility model

Ref document number: 6720771

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150