JP4413175B2 - 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 - Google Patents
非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 Download PDFInfo
- Publication number
- JP4413175B2 JP4413175B2 JP2005256915A JP2005256915A JP4413175B2 JP 4413175 B2 JP4413175 B2 JP 4413175B2 JP 2005256915 A JP2005256915 A JP 2005256915A JP 2005256915 A JP2005256915 A JP 2005256915A JP 4413175 B2 JP4413175 B2 JP 4413175B2
- Authority
- JP
- Japan
- Prior art keywords
- stationary noise
- frame
- signal sample
- sample sequence
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
従来技術として、例えば、非特許文献1に示されている非定常(突発性)雑音区間の判別方法がある。この技術では、一般に有声音の周波数特性は、低周波域にパワーが集中する。一方、非定常(突発性)雑音の周波数特性は平坦である。そこで、音声に非定常雑音が重畳した場合に、周波数特性の高周域のパワーが増大する点に着目する。
V=(ω1[P1]、...、ωn[Pn]、...、ωN[PN])
図7にパワースペクトル及び特徴ベクトルの比較を示す。ここでは、周波数帯域を16に分割し、重みには次式のsin関数を用いた。
ωn=sin{π(n−1)/2(N−1)}
図7において、横軸は周波数を、縦軸はパワーをそれぞれ表し、図の実線と●印は突発性雑音が重畳した音声区間のパワースペクトルと特徴ベクトルを構成する分割帯域毎の成分を表し、点線と○印は音声のみの区間のパワースペクトルと特徴ベクトルを構成する分割帯域毎の成分を表す。突発性雑音が重畳したときに高周波域のパワーが増大し、音声のみの区間の特徴ベクトルとに差が出ることがわかる。
C=(|Vm|2|Vm−1|2)/(Vm・Vm−1)
特徴量Cは、現フレームの特徴ベクトルVmと直前フレームの特徴ベクトルVm−1との差に、比例して大きくなる。しきい値レジスタ74に格納した、しきい値と特徴量Cとを、比較部76で比較し、特徴量Cがしきい値以上である場合、現フレームmに、非定常雑音が存在すると判別する。
野口,阪内,羽田,片岡「1チャネル入力信号中の突発性雑音の判別と除去」,日本音響学会講演論文集,655頁〜656頁,2004年3月
また従来のケプストラムを用いる方法では、入力音声信号を離散フーリエ変換し、得られたスペクトルの対数を求め、これら対数を逆離散フーリエ変換して、ケプストラムを求めるため、演算量が多い。
図1にこの発明を実施するための最良な形態の非定常雑音判別装置の機能構成例を、図2にその処理手順をそれぞれ示す。目的信号と不要な周囲の非定常雑音の混入する入力信号x(k)はディジタル信号に変換されており、周期的に標本化(サンプリング)され、その各サンプルがディジタル信号に変換されているものとする。フレーム分割部10は入力信号x(k)に対して、例えば、窓処理を行い、フレームに分割する(ステップS201)。ここで、分割された1フレーム分の入力信号をx(n)(n=1、2、...、N)と置く。フレーム長は約10ms〜約100msが良く、音声信号の場合は、一般的な音声通信に用いられるフレーム長20msと同一にすると便利である。
以上述べた実施例における各部の処理結果の例を図3に示す。図3Aは各フレームにおける入力信号の性質を示し、無声音区間、有声音区間、無声音区間、非定常雑音区間の順の場合であり、フレーム長を20ms、サブフレーム長を4msとし、1フレーム中のサブフレーム数は5である。またサンプリング周波数は16kHzとする。各フレームと対応し、その各サブフレームごとに、予測残差信号|ei(m)|が第1のしきい値th1を越えたサンプル点数の計数値kiを「少」、「中」、「多」の3段階で区別して、図3Bに示す。最初の無声音区間(フレーム)では線形予測残差信号は振幅が小さくなるので、th1を越えるサンプル点数は大概はゼロであり、kiは「少」となり、次のフレームの有声音区間では、上述の通り、1個のサブフレームの中に、1個のピークが生じるが、th1が上述のように設定されているから、th1を越えるサンプル点数は多くても7〜8であるから、この例では全て数は、「中」となる。なお前記th1の選定であるから、有声音区間でkiの数が少なくとも一部は「少」の場合もある。第4番目のフレームは非定常雑音区間であり、その雑音が重畳されている部分では線形予測残差信号の振幅は増大する。継続時間が短い非定常雑音でもkiは12〜13、継続時間が長い非定常雑音であればkiは40以上にもなる。従って、この非定常雑音区間では少なくとも、1個のサブフレーム区間の中に、th1を越える非定常雑音がまとまって存在するので、1個のサブフレームは「多」となる。
なおサブフレームに分割することなく、フレームごとに、線形予測残差信号e(n)が第1のしきい値th1を超えた数を計数し、その計数値から判別することを考えたとする。その場合は、図3Eに示すように無声音区間では少ないと判別されるが、有声音区間では、場合によっては、計数値kiが70〜80となり、「多」と判別される。非定常雑音区間では、計数値kiが「多」と判別されるが、この計数値kiは例えば、20〜80と大きくばらつく。従って、適切な第2のしきい値th2を選定することが困難であり、誤判別の恐れがある。
[実施例2]
図4は、この発明の実施例2の要部を示し、図1と対応する部分には同一参照番号を付けてある。実施例1に対し、定常雑音レベル推定部36としきい値計算部38が加えられている。これらを加えたことにより、定常雑音の大きさが変化する場合に対しても、しきい値を可変にして、誤判別を防ぐようにしたものである。
前述した実施例においては予測残差信号の各サンプル点の振幅の絶対値|ei(m)|とth1とを比較したが、絶対値の代わりに{パワーei(m)}2を用いてもよい。この場合は、第1のしきい値の値もそれに応じて異なった値になる。更に、絶対値を求めることもなく予測残差信号の正側が+th1を越えるサンプル点と負側が−th1よりも更に、負の大きな値をとるサンプル点を求めてもよい。従って、この出願の特許請求の範囲中における「予測残差信号の振幅が第1のしきい値以上となる」はこれら全てのことを意味するものである。
実験例
以下に、この発明の効果を示すために行った計算機種シミュレーション実験の結果を、従来法及びこの発明方法について図5A及び図5Bにそれぞれ示す。
NTT−AT社多言語音声データベースから、男性4名の各音声、女性4名の各音声40sに対し、突発性雑音19種類(ペンで机を叩く音、紙資料を落とす音など)を0.5s間隔で重畳し、サンプリング周波数16kHz、定常雑音としてSN比30dbの白色雑音を重畳したものを入力信号とした。この場合、非定常雑音は合計12160箇所になる。分析条件は、フレーム長(分析長)を40ms、シフト長20msとした。これらは従来法、この発明法に対しても同一である。分析条件として、この発明法では、サブフレーム分割数を10、窓はハミング窓を用い、線形予測次数を14次とした。
図5Aにおいて、「+」は実験の結果のプロットであり、「△」はこれらの平均値を示している。図5Bで「×」は実験の結果のプロットであり、「□」はこれらの平均値を示している。まず図5Aの従来の技術では、再現率、適合率共に30%以上を表示し、図5Bのこの発明では、両者とも80%以上を表示していることに留意すべきである。図5AにおいてプロットP2群から殆どの雑音区間を検出できるが、子音部分で、音声区間を雑音区間と誤判別することが適合率の値から理解される。従来技術では、低域は偏りのある雑音区間を殆ど検出できていないこと、再現率、適合率の各平均値はそれぞれ、92.7%、93%であった。
Claims (8)
- コンピュータをフレーム分割部、線形予測分析部、サブフレーム分割部、処理部、最大値検出部、第2の比較部を有する非定常雑音判別装置として機能させ、そのコンピュータが実行する非定常雑音判別方法であって、
上記フレーム分割部が、入力音響信号を一定時間区間(以下フレームという)ごとに分割してフレームごとの音響信号サンプル列を生成するステップと、
上記線形予測分析部が、上記各フレームごとに、音響信号サンプル列を線形予測分析して予測残差信号サンプル列を求めるステップと、
上記サブフレーム分割部が、上記予測残差信号サンプル列を同一時間長の複数のサブフレームに分割するステップと、
上記処理部が、上記サブフレームごとの、予測残差信号サンプル列のうち大きさが第1のしきい値以上となるサンプルの数を計数するステップと、
上記最大値検出部が、上記各フレームごとに、同一フレーム内の各サブフレームに対する上記計数値のうちの最大値を求めるステップと、
上記第2の比較部が、上記各フレームごとに、上記最大値が第2のしきい値以上か否かにより、そのフレームに非定常雑音が存在するか否かを判別するステップと、
を有することを特徴とする非定常雑音判別方法。 - 請求項1記載の方法において、
上記同一時間長は、音声のピッチ周期の平均値であることを特徴とする非定常雑音判別方法。 - 請求項1または2に記載の方法において、
上記各フレームごとの音響信号サンプル列の定常雑音レベルMを推定し、
上記推定した定常雑音レベルMと、定常雑音レベルMCと、定常雑音レベルMCのときの既定のしきい値th1Cと、既定の定数αとを用いて、定常雑音レベルMが大きい程大きい上記第1のしきい値th1を
th1=α(M/MC)th1C
により求めることを特徴とする非定常雑音判別方法。 - 入力された音響信号を一定時間区間(以下フレームという)ごとに分割してフレームごとの音響信号サンプル列を生成するフレーム分割部と、
上記フレーム分割された音響信号サンプル列が入力され、上記各フレームごとに、音響信号サンプル列の線形予測分析を行い、線形予測係数を求める線形予測分析部と、
上記線形予測係数で対応するフィルタ係数が設定され、上記フレーム分割された音響信号サンプル列が入力され、これを逆フィルタ処理して上記各フレームごとの予測残差信号サンプル列を出力する逆フィルタと、
上記各フレームごとの予測残差信号サンプル列が入力され、これを同一時間長の複数のサブフレームに分割して、複数のサブフレーム予測残差信号サンプル列を出力するサブフレーム分割部と、
上記複数のサブフレームの予測残差信号サンプル列がそれぞれ入力され、その予測残差信号サンプル列のサンプルの大きさと第1のしきい値とが、それぞれ比較され、第1のしきい値以上となるごとにそのことを示す信号を出力する複数の第1の比較部と、
上記複数の第1比較部の出力信号が入力され、振幅が第1のしきい値以上のサンプルの数をそれぞれ計数する複数の計数部と、
これら複数の計数部で計数された計数値が入力され、これら計数値中の最大値を検出する最大値検出部と、
上記最大値が入力され、その最大値が第2のしきい値以上か否かにより、そのフレームに非定常雑音が存在するか否かを判別し、その結果を出力する第2の比較部と、
を具備することを特徴とする非定常雑音判別装置。 - 請求項4記載の装置において、
上記同一時間長は、音声のピッチ周期の平均値であることを特徴とする非定常雑音判別装置。 - 請求項4または5に記載の装置において、
上記各フレームごとの音響信号サンプル列が入力され、その音響信号サンプル列の定常雑音レベルMを推定する定常雑音レベル推定部と、
上記推定した定常雑音レベルMが入力され、その定常雑音レベルMと、定常雑音レベルMCと、定常雑音レベルMCのときの既定のしきい値th1Cと、既定の定数αとを用いて、定常雑音レベルMが大きい程大きい上記第1のしきい値th1を
th1=α(M/MC)th1C
により計算するしきい値計算部と、
を具備することを特徴とする非定常雑音判別装置。 - 請求項1乃至3のいずれかに記載した非定常雑音判別方法の各過程をコンピュータに実行させるための非定常雑音判別プログラム。
- 請求項7に記載した非定常雑音判別プログラムを記録したコンピュータが読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005256915A JP4413175B2 (ja) | 2005-09-05 | 2005-09-05 | 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005256915A JP4413175B2 (ja) | 2005-09-05 | 2005-09-05 | 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007072005A JP2007072005A (ja) | 2007-03-22 |
JP4413175B2 true JP4413175B2 (ja) | 2010-02-10 |
Family
ID=37933520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005256915A Active JP4413175B2 (ja) | 2005-09-05 | 2005-09-05 | 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4413175B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3404657A1 (en) | 2017-05-15 | 2018-11-21 | Panasonic Intellectual Property Corporation of America | Noise suppression apparatus, noise suppression method, and non-transitory recording medium |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100800873B1 (ko) | 2005-10-28 | 2008-02-04 | 삼성전자주식회사 | 음성 신호 검출 시스템 및 방법 |
JP5293329B2 (ja) | 2009-03-26 | 2013-09-18 | 富士通株式会社 | 音声信号評価プログラム、音声信号評価装置、音声信号評価方法 |
WO2014027419A1 (ja) * | 2012-08-17 | 2014-02-20 | Toa株式会社 | 雑音除去装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61154324A (ja) * | 1984-12-27 | 1986-07-14 | Nec Corp | パルス性雑音抑圧回路 |
JP3367592B2 (ja) * | 1996-09-24 | 2003-01-14 | 日本電信電話株式会社 | 自動利得調整装置 |
JP2001236085A (ja) * | 2000-02-25 | 2001-08-31 | Matsushita Electric Ind Co Ltd | 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置 |
JP2002006898A (ja) * | 2000-06-22 | 2002-01-11 | Asahi Kasei Corp | ノイズ低減方法及びノイズ低減装置 |
-
2005
- 2005-09-05 JP JP2005256915A patent/JP4413175B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3404657A1 (en) | 2017-05-15 | 2018-11-21 | Panasonic Intellectual Property Corporation of America | Noise suppression apparatus, noise suppression method, and non-transitory recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2007072005A (ja) | 2007-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5411936B2 (ja) | 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体 | |
KR101266894B1 (ko) | 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법 | |
JP4587160B2 (ja) | 信号処理装置および方法 | |
KR100770839B1 (ko) | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 | |
KR100744352B1 (ko) | 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치 | |
US20060053003A1 (en) | Acoustic interval detection method and device | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JP2014515124A (ja) | 効率的なコンテンツ分類及びラウドネス推定 | |
US20140177853A1 (en) | Sound processing device, sound processing method, and program | |
EP1395977A2 (en) | Processing speech signals | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
JP3105465B2 (ja) | 音声区間検出方法 | |
WO2014132102A1 (en) | Audio signal analysis | |
JP4413175B2 (ja) | 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 | |
CN108682432B (zh) | 语音情感识别装置 | |
EP3136388B1 (en) | Utterance condition determination apparatus and method | |
JP5293329B2 (ja) | 音声信号評価プログラム、音声信号評価装置、音声信号評価方法 | |
JP4490090B2 (ja) | 有音無音判定装置および有音無音判定方法 | |
JP5815435B2 (ja) | 音源位置判定装置、音源位置判定方法、プログラム | |
JP4601970B2 (ja) | 有音無音判定装置および有音無音判定方法 | |
Kumar | Performance measurement of a novel pitch detection scheme based on weighted autocorrelation for speech signals | |
Cabañas Molero et al. | Low-complexity F0-based speech/nonspeech discrimination approach for digital hearing aids | |
JP2008058876A (ja) | 音声信号区間推定方法、及びその装置とそのプログラムとその記憶媒体 | |
JP4691079B2 (ja) | 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体 | |
CN111226278B (zh) | 低复杂度的浊音语音检测和基音估计 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090908 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091117 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121127 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4413175 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121127 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131127 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |