JP4381383B2 - 判別装置、判別方法、プログラム、及び記録媒体 - Google Patents

判別装置、判別方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP4381383B2
JP4381383B2 JP2006000329A JP2006000329A JP4381383B2 JP 4381383 B2 JP4381383 B2 JP 4381383B2 JP 2006000329 A JP2006000329 A JP 2006000329A JP 2006000329 A JP2006000329 A JP 2006000329A JP 4381383 B2 JP4381383 B2 JP 4381383B2
Authority
JP
Japan
Prior art keywords
waveform
full
pulse noise
period
wave rectified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006000329A
Other languages
English (en)
Other versions
JP2006178486A (ja
Inventor
明 西村
Original Assignee
株式会社デジオン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社デジオン filed Critical 株式会社デジオン
Priority to JP2006000329A priority Critical patent/JP4381383B2/ja
Publication of JP2006178486A publication Critical patent/JP2006178486A/ja
Application granted granted Critical
Publication of JP4381383B2 publication Critical patent/JP4381383B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、アナログレコードの再生時などに発生するパルス性ノイズをデジタル信号処理を用いて検出しかつ除去する方法のための判別装置、判別方法、プログラム、及び記録媒体に関する。
パルス性ノイズの検出方法としては、パルス性ノイズが高い周波数成分を含むことを利用した方法がいくつか提案されている。実公昭60−7572記載のノイズ除去回路では、入力音声信号を高域通過フィルタに通し、その高域通過信号のエンベロープ信号を低域通過フィルタを用いて抽出する。高域通過信号とそのエンベロープ信号とのレベル比較の結果、高域通過信号の方が著しく大きいとき、入力音声信号にパルス性ノイズ信号が含まれていると判断する。
しかしこの方法では、金管楽器音のような周期的なパルス波によって構成されている楽音を、パルス性ノイズとして誤検出をしてしまう。そこで、特公平8−321001では、実公昭60−7572のパルス性信号検出回路の後段に、検出されたパルス性信号を、予め定めた期間内に反復する連続パルスから成るパルス性音声信号と、それ以外の単発パルスであるノイズとに判別するノイズ判別回路を備えている。具体的には、検出したパルス性信号をリリースフィルタに通して得られる、時間と共に減衰する振幅値が、高域通過信号のエンベロープ信号の振幅値より十分大きい時間内に次のパルス性信号が現れた場合には、それらのパルス性信号を音声信号パルスと判別する、というものである。
この方法にも欠点がある。第1に、音声信号パルスとみなしたパルス性信号が連続している区間内に、もし本当のパルス性ノイズが混入していたとしても、それを検出することはできない。第2に、パルス性ノイズが、あらかじめ見積もった音声信号パルス周期以下の時間間隔で連続しているような場合、これらは音声信号パルスとみなされ、パルス性ノイズとして判別されない。よって、特公平8−321001の方法は、パルス性ノイズ混入の頻度が多い音声信号に対しては、十分な効果を発揮できない。
先述のような手法で検出したパルス性ノイズを、聴感上聞こえにくくする手法としては、ノイズ部分波形の振幅を下げて抑圧する方法(特公平8−321001)と、ノイズ部分の波形を前後の信号音波形から補間する、あるいは適切な波形と置き換える方法(特公平8−149098)の二つに大きく分類できる。ノイズ波形の振幅を下げて抑圧する場合に、急激な振幅変化が生じると新たなノイズの原因となるので、ノイズ波形区間の直前の信号振幅を徐々に下げていく処理と、直後の信号振幅を徐々にあげていく処理とが必要である(実公昭60−7572)。
しかしこの方法では、ノイズ部分の前後が振幅ゼロ近傍でない場合には、ノイズ部分を振幅ゼロに近付けることによって、波形に歪みが生じる。特公昭59−66230では、ノイズ部分では、その直前の振幅値を保持することによって、ノイズ部分波形を置き換える。しかしこの方法も、ノイズ部分前後の振幅値がほぼ同じ値でない場合に、ノイズ部分を置換した波形と、前後の波形が不連続となり、新たなノイズを生成してしまう。
特公平8−149098では、ノイズ部分前後の信号より多項式補間を行って波形を生成し、ノイズ部分の波形と置き換える。この方法では、ノイズ部分の前後の波形とノイズ部分を置換する波形とを連続につなぐことは可能であるが、置換された波形が本当にそこに存在するべき音楽信号情報を含んでいるかについての保証はない。このため、新たなクリックノイズ等の発生は起こらないにしても、音楽信号としての連続性を乱し、音質劣化の原因となりやすい。
実公昭60−7572 特公平8−321001 特公平8−149098 特公昭59−66230
本発明が解決しようとする課題は、ノイズ部分の検出精度向上とノイズ部分の波形補間精度向上のために、入力音声信号(S0)に基づいて検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別装置等を提供することである。
従来の技術で示されたパルス性ノイズ検出における問題点、つまりパルス性ノイズと似たパルスが周期的に発生する楽音と、パルス性ノイズとの混同する危険性を低減させる方法として自己相関関数を用いる周期判定方法および単峰性パルスかどうかによる判定方法を導入した。また、パルス性ノイズの除去方法として、その前後の波形の周期性やスペクトル情報を利用した線形予測法によって生成される予測信号によってパルス性ノイズを置換する手法を導入した。構成としては、以下の手段が挙げられる。
請求項1に係る発明は、入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別装置であって、前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判別する周期判定部と、前記周期判定部により判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)とのいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する判別部を備え、前記周期判定部の判定結果及び前記判別部の判別結果が用いられて前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かが判別される。
この発明では、パルス性ノイズが周期的に現れることはなく、周期的に現れるものはパルス性楽音であり、周期的に現れたパルス性ノイズ候補区間に存在するものをパルス性楽音とみなし、それ以外がパルス性ノイズと判別できるので、パルス性ノイズ候補区間にパルス性ノイズが存在するか否かが判別される。
請求項2に係る発明では、請求項1の前記周期判定部が、前記入力音声信号(S0)を半波整流した波形又は前記入力音声信号(S0)の2階差分を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを判別する。
請求項3に係る発明は、請求項1又は2記載の前記周期判定部及び前記判定部をコンピュータとして実行させることが可能なプログラムである。
請求項4に係る発明は、請求項3記載のプログラムをコンピュータが実行することが可能にて記録した記録媒体である。
請求項5に係る発明は、入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別方法であって、前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する周期判定ステップと、前記周期判定ステップにより判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する判別ステップを含み、前記周期判定部の判定結果に加えて、前記判別ステップによる判別結果が用いられて、前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する。
請求項6に係る発明は、入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別方法であって、前記入力音声信号(S0)を半波整流した波形又は前記入力音声信号(S0)の2階差分を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する周期判定ステップと、前記周期判定ステップにより判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する判別ステップと、前記判定結果及び前記判別結果を用いて、前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別するステップとを含む。
請求項7に係る発明は、入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別方法であって、前記入力音声信号(S0)を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する第1周期判定ステップと、前記第1周期判定ステップにより判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する第1判別ステップと、前記入力音声信号(S0)の2階差分を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する第2周期判定ステップと、前記第2周期判定ステップにより判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する第2判別ステップと、前記判定結果及び前記判別結果を用いて、前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別するステップとを含む。
請求項8に係る発明は、請求項5から7のいずれかにおいて、前記検出された前記入力音声信号(S0)におけるパルス性ノイズ候補区間に相当する時間区間に正の山又は負の山からなる単峰性パルスが含まれる場合には、該パルス性ノイズ候補区間は楽音の一部とみなして候補から外されることを特徴とする。
以上説明したとおり、本発明のパルス性ノイズの検出方法を用いることにより、従来検出できなかった周期パルス性楽音の間に含まれるパルス性ノイズを検出できる。そして、線形予測法を用いたノイズ除去方法を用いることにより、本来の楽音の再現性に優れ、またパルス性ノイズを誤検出した場合も、本来の楽音への影響を最小限に抑えることができる。
図1にパルス性ノイズ除去処理の大まかな流れを示す。本発明はパルス性ノイズ判別部とパルス性ノイズ除去部に関するものである。以下の説明に使用するパラメータは以下の通りである。()内はサンプル値
・サンプリング周波数に依存しないパラメータ
a1(7) S1におけるエンベロープ振幅に対するパルス検出閾値
a2(a1×0.3) 隣接する周期位置のS1におけるエンベロープ振幅に対するパルス検出閾値
p1(0.35) 周期判定時の自己相関ピークの閾値
p2(4) 周期判定時の自己相関平均値に対する最大値の比の閾値
a3(4) 隣接する周期位置におけるS1の最大値間の、最小値と最大値との比
・サンプリング周波数に比例するパラメータ
w1(110) ローパスフィルタとして用いる矩形時間窓長
t1(10) 隣接する N1 の連結を行う最大間隔
t2(80) パルス性ノイズ区間の最大値
t3(2) パルス性ノイズ区間の過去への延長幅
t4(8) パルス性ノイズ区間の未来への延長幅
t5(440) 自己相関算出用波形長
r1(20) 自己相関関数より抽出する最短周期長
t6(5) 周期抽出時間幅
t7(880) 線形予測係数の算出に必要な波形時間長
m1(100) 線形予測係数の次数
図2に、パルス性ノイズを検出する処理の流れ図を示した。以下、各処理についての説明を行う。パルス性ノイズを検出する手法は、基本的に従来の技術と同じであり、パルス性雑音には高域パワーが豊富であることを利用して検出を行う。入力信号(S0)に施す高域通過フィルタとしては、高速に演算できる2階差分を採用した。この高域通過信号を全波整流したもの(S1)に、低域通過フィルタに通すことにより、高域通過信号のエンベロープ(E1)を求める。低域通過フィルタとしてはw1点の矩形窓を用いた。S1の振幅が、E1のa1倍を超える区間を、パルス性ノイズ区間(N0)の候補とした。このような検出手法は、高周波数成分の多い入力信号部分ではE1が大きくなることによってパルス性ノイズの検出閾値を上昇させ、高周波数成分を多く含む楽音をパルス性雑音として誤検出することを防ぐ意味がある。
入力信号波形振幅に急激な変動が続く際に、短い時間間隔で複数のN0が生じる場合がある。このような場合、これら複数N0は、ひとつのパルス性雑音によって生じた可能性が高く、これらを一つのN0と見なした方が妥当である。よって、隣合った2つのN0の間隔がt1サンプル以下である場合には、これらを連結することとした。一方、シンバル音のように波形振幅に急激な変動が続く楽音の場合、上記に従って連結されたN0がかなり長くなることがある。このような場合のN0はパルス性雑音によって生じた可能性は低いため、連結後のN0の長さがt2より大きいときには、この区間はパルス性ノイズではないと見なした。
アナログディスク再生時に生じるパルス性ノイズは、カートリッジ内のカンチレバーの振動特性、RIAAフィルタ、AD変換時に用いる回路の伝達特性などによって、パルスの前後にプリエコーやポストエコーを伴うことが多い。このような、パルス性ノイズによる影響を受けた波形区間をN0に含めるため、N0の前後をそれぞれt3;t4だけ延長し、これをN1と置く。
アナログディスク再生時に生じるパルス性ノイズ波形に多く見られるのは、1周期分のサイン波のように、振幅が正負に振動し、正の山と負の谷の両方を持つ特徴である。しかし、前節までの処理で求められたN1区間に対応するS0に、正の山あるいは負の谷のどちらかしか含まない単峰性のパルスの存在する場合がある。このような場合のN1はパルス性雑音によって生じた可能性は低いため、この区間はパルス性ノイズではないと見なした。具体的な判定方法としては、N1区間におけるS0波形の一次差分が、一度だけ正から負に、あるいは負から正に変わる場合は、単峰性パルスと見なした。
入力信号S0が周期波形であり、その1周期の特定の時刻にパルス性波形が含まれているとき、S0の2階差分波形も周期的となる。この性質を利用して、検出されたN1区間にパルス性ノイズが存在するのか、楽音の周期的なパルス性波形が存在するのかを判別する。図3に、この処理全体の流れ図を、図4に自己相関関数を用いた周期判定部における処理の流れ図を示した。まず、S0の2階差分を半波整流した波形から、N1を時間的中央とした区間長t5の波形を抽出し、その自己相関関数a1(dt)を求める。自己相関関数には、対象波形の周期に相当する遅れ時刻において、ピークを持つ性質がある。ここで、dtは自己相関関数における遅れ時間であり、0からt5=2の値をとる。自己相関関数から抽出しうる最短周期(r1)をあらかじめ定めておき、a1(dt)において、r1<dtt5=2の範囲で最大値をとる遅れ時間(xdt1)を、S1波形の周期とする。ここまでの処理では、求められた周期が本当に周期のある波形のものなのか、単に自己相関関数の最大値をもつ遅れ時間が求められただけなのかは分からない。このため、a1(dt)のもつ特徴より、S1波形が周期をもつ波形か否かを判定する処理が必要となる。
このための処理は以下のとおりである。まず、a1(0)によってa1(dt)を基準化する。基準化されたa1(dt)のr1<dtt5=2における最大値をamaxとおく。amaxがp1を超えてかつ、r1<dtt5=2で求めたa1(dt)の平均値ameanに対するamaxの比がp2以上であるときに、S1波形が周期を持っているものと判定する。
次に、今注目しているN1区間のパルス性ノイズ候補が、周期波形の一部として繰り返し現れるのか、それとも周期信号内に混入したパルス性ノイズなのかを判定する必要がある。具体的には、N1におけるS1の最大値をemax1とし、その時刻から、前および後に1周期(xdt1)だけ離れた時刻を中心としてt6の区間のS1に生じた最大値をそれぞれemax0;emax2とする。これら、emax0;emax1;emax2がいずれもE1のa2倍を超えており、かつそれらのうちの最小値と最大値との比がa3以内であるときに、N1区間には周期信号の一部としてパルスが現れたものと考え、パルス性ノイズとしては扱わないことにした。
しかし、上記の周期信号におけるパルス性ノイズ判定方法では、周期波形に高周波成分を多く含む場合には、S1の周期が正確に推定できない。そこで、入力信号であるS0の半波整流波形からも、同様な自己相関を用いた手法によって周期の推定を行った。そして得られた周期(xdt0)を、前段落におけるxdt1と置き換え、S1波形に対して同様なパルス性ノイズ判定う。周期xdt0とxdt1を元に行ったパルス性ノイズ判定のいずれかにおいて、N1がパルス性ノイズであると判定された場合には、次節に説明するパルス性ノイズの除去処理を行う。
ここでは、パルス性ノイズが混入しているN1にあるべき本来の音楽信号を、線形予測法によって推定し、S0におけるN1区間を推定された波形によって置き換える処理について説明する。
線形予測法は、過去の信号に線形予測係数を掛けて足し合わせる線形結合によって、未来の信号を予測する方法である。ここでは、N1にあるべき信号が未来の波形であり、N1以前にある波形が過去の信号と考える。つまり、パルス性ノイズが混入する直前の音楽信号からパルス性ノイズが混入した部分本来の波形を予測するわけである。具体的には、N1直前の長さt7区間の波形よりm1次の線形予測係数を求め、その線形結合によってN1にあるべき信号S2を予測していく。N1区間直前の入力音声信号をx(n-k);(k>0)、N1区間直前の入力音声信号より算出した線形予測係数をc(k)、予測誤差をe(n)とすると、予測するN1区間の信号x(n)は、(1)式と表される。次数m1が十分大きいとき、e(n)は白色雑音となる性質を持つ。そこで、e(n)をゼロとおいて、この(1)式をnを増やしながら順次計算していくことによって、N1区間の信号を予測していく。線形予測係数はLevinson-Durbin法あるいはBurg法などによって求めることができる。
Figure 0004381383
この方法の利点としては、
1.予測開始部分とその直前とで波形が不連続にならない
2.周期性を持つ音であればほぼ正確な予測が可能である
3.周期性を持たない音であっても、予測波形のスペクトルは、その直前にある波形のスペクトルと同じ特徴をもつ
4.仮に楽音における周期信号波形の一部をノイズとして検出し、予測波形による置換処理を行ったとしても、音楽信号としての連続性を保つことができ、音質劣化が少ない
という点が挙げられる。
しかし、現実的には、予測終了部とその直後の波形との連続性については保証はないし、完全に周期的な信号の一部を予測するとも限らない。このため、N1の直後にある長さt7の波形を用いて、時間軸を逆に辿って同様な線形予測を行い、N1の予測波形S3を得る。そして、S2は、その振幅がN1区間に伴い線形に1から0まで減衰する窓をかけ、S3には逆に0から1まで増加する窓をかけて、両者を足し合わせる。こうして得られる、N1区間を予測した信号の開始部および終了部は共に、その前後のS0の波形と連続になる。このように未来の入力音声信号波形を予測に用いるため、実際には、現在注目しているN1区間より、少なくともt7だけ先の信号まで読み込んだ時点からでないと、処理を進めることができない。つまり、ある程度入力音声信号をバッファリングしておく処理を必要とする。
図6に、パルス性ノイズ区間候補を検出し、それを前後に延長した後、そのパルス性ノイズ区間を線形予測による予測波形で置換した波形の例を示した。図7に線形予測による予測波形の合成と置換を表す波形を示した。
今回提案する手法の、客観的なパルス性ノイズ除去能力を調べる。具体的には、パルス性ノイズを含まない音楽信号に対して、パルス性ノイズを付加し、そのノイズをどれだけ検出できたか、またノイズ除去信号として、どれだけノイズ付加前の信号に近い信号を出力できたについて、コンピュータ・シミュレーションを行い定量的に検討する。
実際のアナログディスクの無音部分再生時に生じたパルス性ノイズ波形データを20個記録した。それらのうちから任意のパルスを、任意の最大振幅になるよう線形に増幅あるいは減衰させて、音楽波形の任意の時刻において加算することによって、パルス性ノイズを含む音楽信号を生成した。ここでは、音楽信号の絶対値最大振幅を1として、付加するパルス性ノイズの絶対値振幅は、0.1〜1の範囲で矩形一様分布となるように決定した。また、20個あるパルス性雑音からランダムに選ばれたノイズが、1秒あたり20個ランダムな時刻に付加されるようにした。対象とした音楽信号は、RWC研究用音楽データベース(ポピュラー音楽)RWC-MDB-P-2001No.1〜100の100曲のうち、効果音としてあらかじめレコード雑音が混入しているNo.11を除いた、99曲の左チャンネル冒頭1分間とした。
前節のように作成したパルス性ノイズ混入音楽信号を、提案する手法によってノイズ除去処理し、正しい位置にパルス性ノイズを検出できたかどうかを調べた。ここで検出率を、付加したノイズ個数(1200個)に対する正しい位置にノイズを検出した率とした。また、誤検出率を、パルス性ノイズを検出した個数に対する、ノイズを付加していない位置にノイズを検出した率とした。
また、従来法である特公平8−321001を用いて、同じ条件にてパルス性ノイズ区間の検出を行い、同様な検出率と誤検出率を算出した。なお、本手法と従来法とを同条件で比較するため、特開平8−321001における図1中の高域フィルタ2は、本手法と同じ2階差分フィルタとし、図1中の低域フィルタ4は、本手法と同じw1点移動平均フィルタを用いた。図8には、全99曲に対する処理の結果得られた平均値を、最も検出率に影響を及ぼすパラメータである、a1を横軸に取り、示した。この図からは、従来法と本手法の誤検出率はほぼ同程度であるが、本検出手法の方が検出率が高いことが分かる。これは従来法が、周期パルス性楽音の間に含まれるパルス性ノイズの検出ができないのに対して、本手法ではそのような検出が可能なためである。
ここでの分析は、前節のコンピュータ・シミュレーションおいて、妥当な検出率を誤検出率を示した、a1=7の時の結果である。パルス性ノイズを正しく検出して除去した信号は、ノイズ付加前の波形とどの程度類似しているのかを調べた。一つのノイズ除去区間に対して、ノイズ付加前信号波形をSx、ノイズ除去後信号波形をSyとし、2つの波形の差分を求めると、Sy-Sxは除去後も残ってしまうノイズ成分の波形となる。このパワーと、このときに付加されていたパルス性ノイズのパワーとの比を求めると、ノイズ除去処理によってパルス性ノイズのパワーがどの程度低減されたかが分かる。これを正しくノイズが検出された全てについて求め、その平均値をパルス性ノイズ低減の指標とした。その結果、全99曲の平均値は、-15.6dBであった。
また、本パルス性ノイズ検出手法によって、検出されないノイズも存在する。そのようなノイズ波形のパワーの平均値を求めた。その結果、全99曲の平均値としては、-23.9dBであった。なお、ここでの0dBは最大振幅の純音のパワーとした。さらに、パルス性ノイズを誤検出してしまうと、パルス性ノイズ除去処理によってノイズを含まないはずの信号が変化することになる。この変化を捉える指標としては、ひとつの誤除去区間に対して、2つの波形の差分(Sy-Sx)のパワーを、誤除去によって付加されたノイズのパワーとした。全誤除去における平均値を、誤検出時の音質変化の指標とした。その結果、全99曲の平均値としては、-26.5dBであった。なお、ここでの0dBは最大振幅の純音のパワーとした。ここで得られた値は、検出されずに残った雑音のパワーより、誤検出によって生成されたノイズのパワーが、平均で-2.6dB低いことを示しており、誤検出による音質劣化は、検出できないことによる音質劣化より小さいことを定量的に示しており、本発明の効果が確認された。
処理の流れ パルス性ノイズの検出 周期性パルスとパルス性ノイズとの判別 自己相関関数を用いた周期判定 波形周期による周期性パルスの判別 パルス性ノイズ区間候補の検出と区間延長、置換後の波形 線形予測による予測波形の合成と置換 本手法と従来法の検出率と誤検出率

Claims (8)

  1. 入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別装置であって、
    前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判別する周期判定部と、
    前記周期判定部により判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)とのいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する判別部を備え、
    前記周期判定部の判定結果及び前記判別部の判別結果が用いられて前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かが判別される、判別装置。
  2. 前記周期判定部は、前記入力音声信号(S0)を半波整流した波形又は前記入力音声信号(S0)の2階差分を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを判別する、請求項1記載の判別装置。
  3. 請求項1又は2記載の前記周期判定部及び前記判定部をコンピュータとして実行させることが可能なプログラム。
  4. 請求項3記載のプログラムをコンピュータが実行することが可能にて記録した記録媒体。
  5. 入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別方法であって、
    前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する周期判定ステップと、
    前記周期判定ステップによる判定された周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する判別ステップを含み、
    前記周期判定ステップの判定結果及び前記判別ステップによる判別結果が用いられて、前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する、判別方法。
  6. 入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別方法であって、
    前記入力音声信号(S0)を半波整流した波形又は前記入力音声信号(S0)の2階差分を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する周期判定ステップと、
    前記周期判定ステップにより判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する判別ステップと、
    前記判定結果及び前記判別結果を用いて、前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別するステップとを含む、判別方法。
  7. 入力音声信号(S0)から高域通過フィルタにより高周波成分信号を抽出して全波整流した全波整流波形(S1)と、前記全波整流波形(S1)に低域通過フィルタを施すことによって得られる高域通過信号のエンベロープとを比較することにより、パルス性ノイズが混入していると考えられる区間として検出されたパルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別する判別方法であって、
    前記入力音声信号(S0)を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する第1周期判定ステップと、
    前記第1周期判定ステップにより判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する第1判別ステップと、
    前記入力音声信号(S0)の2階差分を半波整流した波形から前記パルス性ノイズ候補区間を時間的中央とした所定区間の波形を抽出して自己相関関数を算出するとともに基準化し、基準化された自己相関関数の最大値(amax)と第1閾値とを比較するとともに前記基準化された自己相関関数の平均値(amean)と第2閾値とを比較し、比較結果に基づいて前記入力音声信号(S0)の全波整流波形(S1)が周期性のある波形であるかを周期の判定を行って判定する第2周期判定ステップと、
    前記第2周期判定ステップにより判定される周期がある場合に、前記パルス性ノイズ候補区間における全波整流波形(S1)の最大値(emax1)と該最大値(emax1)の時刻から前及び後にそれぞれ1周期離れた時刻を中心として所定区間の前記全波整流波形(S1)に生じた最大値(emax0,emax2)のいずれもが所定の条件を満たすか否かによって、楽音の一部である周期をもったパルスをパルス性ノイズ候補から外すため、パルス性ノイズ候補が前記全波整流波形(S1)に周期的に出現するか否かを判別する第2判別ステップと、
    前記判定結果及び前記判別結果を用いて、前記パルス性ノイズ候補区間にパルス性ノイズが存在するか否かを判別するステップとを含む、判別方法。
  8. 前記検出された前記入力音声信号(S0)におけるパルス性ノイズ候補区間に相当する時間区間に正の山又は負の山からなる単峰性パルスが含まれる場合には、該パルス性ノイズ候補区間は楽音の一部とみなして候補から外されることを特徴とする、請求項5から7のいずれかに記載の判別方法。
JP2006000329A 2006-01-05 2006-01-05 判別装置、判別方法、プログラム、及び記録媒体 Expired - Fee Related JP4381383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006000329A JP4381383B2 (ja) 2006-01-05 2006-01-05 判別装置、判別方法、プログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006000329A JP4381383B2 (ja) 2006-01-05 2006-01-05 判別装置、判別方法、プログラム、及び記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002123503A Division JP2003317368A (ja) 2002-04-25 2002-04-25 パルス性ノイズのデジタル信号処理による検出および除去方法

Publications (2)

Publication Number Publication Date
JP2006178486A JP2006178486A (ja) 2006-07-06
JP4381383B2 true JP4381383B2 (ja) 2009-12-09

Family

ID=36732581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006000329A Expired - Fee Related JP4381383B2 (ja) 2006-01-05 2006-01-05 判別装置、判別方法、プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP4381383B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5245622B2 (ja) 2008-07-31 2013-07-24 富士通株式会社 ノイズ検出装置及びノイズ検出方法

Also Published As

Publication number Publication date
JP2006178486A (ja) 2006-07-06

Similar Documents

Publication Publication Date Title
JP4740609B2 (ja) 有声音および無声音の検出装置、並びにその方法
JP4587160B2 (ja) 信号処理装置および方法
US8586847B2 (en) Musical fingerprinting based on onset intervals
KR100590561B1 (ko) 신호의 피치를 평가하는 방법 및 장치
US20070083365A1 (en) Neural network classifier for separating audio sources from a monophonic audio signal
JP2012027186A (ja) 音声信号処理装置、音声信号処理方法及びプログラム
KR100552693B1 (ko) 피치검출방법 및 장치
JP4572218B2 (ja) 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
JP6920445B2 (ja) 楽曲解析装置および楽曲解析プログラム
JP2005292207A (ja) 音楽分析の方法
JP4735398B2 (ja) 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム
JP2003317368A (ja) パルス性ノイズのデジタル信号処理による検出および除去方法
JP4381383B2 (ja) 判別装置、判別方法、プログラム、及び記録媒体
US20110166857A1 (en) Human Voice Distinguishing Method and Device
JP6235198B2 (ja) 音声信号処理方法、音声信号処理装置およびプログラム
JP4413175B2 (ja) 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体
JP4419249B2 (ja) 音響信号分析方法及び装置並びに音響信号処理方法及び装置
CN112750458B (zh) 一种触屏声音检测方法和装置
JP2019029861A (ja) 音響信号処理装置、方法及びプログラム
JP2019028301A (ja) 音響信号処理装置、方法及びプログラム
CN115862685B (zh) 一种实时语音活动的检测方法、装置和电子设备
JP2019028300A (ja) 音響信号処理装置、方法及びプログラム
Czyzewski et al. New algorithms for wow and flutter detection and compensation in audio
JP3148466B2 (ja) ヘリコプタ音と車両音との識別装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090915

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151002

Year of fee payment: 6

R150 Certificate of patent or registration of utility model

Ref document number: 4381383

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees