JP4413175B2 - 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 - Google Patents

非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 Download PDF

Info

Publication number
JP4413175B2
JP4413175B2 JP2005256915A JP2005256915A JP4413175B2 JP 4413175 B2 JP4413175 B2 JP 4413175B2 JP 2005256915 A JP2005256915 A JP 2005256915A JP 2005256915 A JP2005256915 A JP 2005256915A JP 4413175 B2 JP4413175 B2 JP 4413175B2
Authority
JP
Japan
Prior art keywords
stationary noise
frame
signal sample
sample sequence
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005256915A
Other languages
English (en)
Other versions
JP2007072005A (ja
Inventor
賢一 野口
賢一 古家
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005256915A priority Critical patent/JP4413175B2/ja
Publication of JP2007072005A publication Critical patent/JP2007072005A/ja
Application granted granted Critical
Publication of JP4413175B2 publication Critical patent/JP4413175B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、目的となる音声信号や音楽信号などの音響信号と不要な雑音信号が混在する入力信号から、非定常雑音が混在する信号区間を判別するための方法、その装置、そのプログラム及びその記録媒体に関する。
例えば音声通信会議において、突発性雑音は通信品質の劣化を招く。そこで、突発性雑音が重畳された音声信号区間を判断し、その音声信号区間が判別されると、その直前の音声周期波形信号をその区間に繰り返し挿入することで突発性雑音の除去を行うことが提案されている。
従来技術として、例えば、非特許文献1に示されている非定常(突発性)雑音区間の判別方法がある。この技術では、一般に有声音の周波数特性は、低周波域にパワーが集中する。一方、非定常(突発性)雑音の周波数特性は平坦である。そこで、音声に非定常雑音が重畳した場合に、周波数特性の高周域のパワーが増大する点に着目する。
図6にこの従来技術の機能構成ブロック図を示す。入力信号x(k)をフレーム分割部60に転送して、一定時間区間毎のフレームに切り出す。ここでkは離散的時刻を表す。各々のフレームの入力信号x(k)をフーリエ変換部62により短時間離散フーリエ変換して、周波数領域信号x(ω)に変換し、この周波数領域信号x(ω)をパワースペクトル変換部64に転送することにより、パワースペクトルP(ω)を求める。次に、このパワースペクトルP(ω)を周波数帯域分割部66に転送し、ナイキスト周波数までの周波数帯域をN個の帯域に分割して、各々の分割帯域毎に対応するパワースペクトル計算部68−1〜68−Nに転送して各分割されたパワースペクトルの平均値[P]を求める。ただしn=1、2、...、Nである。これらパワースペクトルの平均値[P]を特徴ベクトル形成部70に転送して、高周波域の影響が大きくなるように重みωを乗じ、次式で表される特徴ベクトルVを求める。
V=(ω[P]、...、ω[P]、...、ω[P])
図7にパワースペクトル及び特徴ベクトルの比較を示す。ここでは、周波数帯域を16に分割し、重みには次式のsin関数を用いた。
ω=sin{π(n−1)/2(N−1)}
図7において、横軸は周波数を、縦軸はパワーをそれぞれ表し、図の実線と●印は突発性雑音が重畳した音声区間のパワースペクトルと特徴ベクトルを構成する分割帯域毎の成分を表し、点線と○印は音声のみの区間のパワースペクトルと特徴ベクトルを構成する分割帯域毎の成分を表す。突発性雑音が重畳したときに高周波域のパワーが増大し、音声のみの区間の特徴ベクトルとに差が出ることがわかる。
現処理フレームmと直前フレームm−1の特徴ベクトルVとVm―1の相関を使った特徴量をCとする。上記特徴ベクトルVとVm―1を特徴量計算部72に転送して、これらの特徴ベクトルのパワーを考慮に入れ、特徴量Cを次式で求める。
C=(|V|Vm−1)/(V・Vm−1
特徴量Cは、現フレームの特徴ベクトルVと直前フレームの特徴ベクトルVm−1との差に、比例して大きくなる。しきい値レジスタ74に格納した、しきい値と特徴量Cとを、比較部76で比較し、特徴量Cがしきい値以上である場合、現フレームmに、非定常雑音が存在すると判別する。
前記非特許文献1には、雑音区間の判別方法として、次の方法も示されている。この方法は、有声音の周期性に着目したもので、有声音のケプストラムには、基本周期に高いピークが現れる。しかし、非定常(突発性)雑音が重畳すると、そのピーク値が小さくなる。従って図8に示すように入力音声信号をフレーム分割部80でフレーム分割し、その各フレームの音声信号のケプストラムをケプストラム計算部82で計算し、そのケプストラムをレジスタ84内のしきい値と比較部86で比較し、その比較結果として、しきい値を越えるピークが存在しない場合はそのフレームは雑音区間として判断する。
野口,阪内,羽田,片岡「1チャネル入力信号中の突発性雑音の判別と除去」,日本音響学会講演論文集,655頁〜656頁,2004年3月
従来技術のような特徴ベクトルによる特徴量を用いた非定常雑音に対する判別方法は効果的である。しかし、音声に子音が含まれていると、子音のパワースペクトルが高域に偏っているため、特徴量Cは大きくなり、非定常雑音が存在すると誤判別するおそれがあるという問題がある。
また従来のケプストラムを用いる方法では、入力音声信号を離散フーリエ変換し、得られたスペクトルの対数を求め、これら対数を逆離散フーリエ変換して、ケプストラムを求めるため、演算量が多い。
この発明は、これらの問題を解決し、かつ音声信号のみならず音楽信号などを含む音響信号に適用することができる雑音判別方法、その装置、そのプログラム及び、その記録媒体を提供することを目的とする。
この発明によれば、フレーム分割部、線形予測分析部、サブフレーム分割部、処理部、最大値検出部、第2の比較部を有する非定常雑音判別装置として機能するコンピュータが実行する非定常雑音判別方法は、フレーム分割部が入力音響信号をフレームごとに分割してフレームごとの音響信号サンプル列を生成するステップと線形予測分析部が上記各フレームごとに音響信号サンプル列を線形予測分析して予測残差信号サンプル列を求めるステップとサブフレーム分割部が上記予測残差信号サンプル列を同一時間長の複数のサブフレームに分割するステップと処理部が上記サブフレームごとの予測残差信号サンプル列のうち大きさが第1のしきい値以上となるサンプルの数を計数するステップと最大値検出部が上記各フレームごとに、同一フレーム内の各サブフレームに対する上記計数値のうちの最大値を求めるステップと第2の比較部が上記各フレームごとに、上記最大値が第2のしきい値以上か否かにより、そのフレームに非定常雑音が存在するか否かを判別するステップとを有する
この構成によれば、入力音響信号に、子音が含まれている場合の誤判別を避け、各フレームごとに、入力信号中に非定常雑音が存在するかどうかが判別可能となる。さらに、演算として主な処理は線形予測分析のみであるから、低演算量である。またこの発明は、1入力による処理を実現しているので、既存の処理や収音システムなどに組み合わせることも容易である。
[実施例1]
図1にこの発明を実施するための最良な形態の非定常雑音判別装置の機能構成例を、図2にその処理手順をそれぞれ示す。目的信号と不要な周囲の非定常雑音の混入する入力信号x(k)はディジタル信号に変換されており、周期的に標本化(サンプリング)され、その各サンプルがディジタル信号に変換されているものとする。フレーム分割部10は入力信号x(k)に対して、例えば、窓処理を行い、フレームに分割する(ステップS201)。ここで、分割された1フレーム分の入力信号をx(n)(n=1、2、...、N)と置く。フレーム長は約10ms〜約100msが良く、音声信号の場合は、一般的な音声通信に用いられるフレーム長20msと同一にすると便利である。
フレーム分割された信号ごとに、線形予測分析部12で、線形予測分析を行い、線形予測残差信号e(n)を得る(ステップS203)。音声信号は、線形予測分析を用いて、モデル化可能であり、線形予測残差信号の振幅は小さくなる。よって、子音が含まれている無音声区間も、線形予測残差信号の振幅は小さくなる。線形予測の次数は例えば14次とする。機能構成としては、例えば、線形予測分析部12で求めた線形予測係数を逆フィルタ14に設定し、その逆フィルタ14にそのフレームの入力信号を通して、フィルタ処理をし、線形予測残差信号e(n)を求める。サブフレーム分割部16では、線形予測残差信号e(n)を入力とし、時間領域で、s個のサブフレームに分割を行い、サブフレーム分割した線形予測残差信号e(m)を得る(ステップS205)。ただしm=1、2、...、N/s、i=1,2、...、sである。サブフレーム長は、音声の1周期分(例えば4ms)とする。つまり、この例では、男性、女性の各種ピッチの全体の平均的な値の周期をサブフレーム長とした。しかし、サブフレーム分割は、有声音区間の場合、1周期分とは、1個のサブフレームの線形予測残差信号e(m)中に、1個のピークが含まれている状態、すなわち、1周期をピッチ周期にするのが好ましいが、1個のサブフレームの線形予測残差信号e(m)中に、少量(例えば2個もしくは3個)のピークが含まれていても、問題はない。
各絶対値計算部20−i(図1では、i=1についてのみ示している)で線形予測残差信号e(m)の絶対値|e(m)|を計算する(ステップS207)。第1の比較部22−iで、|e(m)|としきい値レジスタ24に格納されている第1のしきい値th1とを比較する(ステップS209)。計数部26−iにて、第1の比較部22−iで、|e(m)|>th1となる離散点mのサンプル点数を計数し、その計数値をkとする(ステップS211)。ここで、th1は例えば|e(m)|の有声音区間で生じるピークの最大値と同程度とする。各計数部26−iはフレーム分割部10からの指令により、各フレームの開始時点に、計数値kが0にリセットされる。なお、絶対値計算部20−iと、第1の比較部22−iと、計数部26−iとによる処理をする部分を処理部28−iとする。
をそれぞれサンプル数最大値検出部30に転送する。サンプル数最大値検出部30では、kを入力とし、フレーム毎に、kの最大値kmax=max(k)を求める。第2の比較部32でkmaxと第2のしきい値レジスタ34に格納された第2のしきい値th2とを比較し、kmax≧th2となるとき、「非定常雑音がその処理フレーム内に存在する」という判別結果を出力する。kmax<th2となるとき、「非定常雑音がその処理フレーム内に存在しない」と判別結果を出力する(ステップS215)。第2のしきい値th2の値は、非定常雑音が存在しないフレーム、特に有声音区間でのkmaxの最大値より大であり、非定常雑音が存在するフレームにおけるkmaxより小に予め設定されている。
上述した構成においては、子音が含まれている音声区間であっても、非定常雑音が重畳されていなければ、線形予測残差信号の振幅は小さくなるので、子音に基づく誤判別することなく、非定常雑音を判別することが出来る。またケプストラムを求める場合と比較しても線形予測分析は処理量がかなり少なく、非定常雑音フレームか否かの判別結果をごくわずかの遅れで求めることが出来る。
以上述べた実施例における各部の処理結果の例を図3に示す。図3Aは各フレームにおける入力信号の性質を示し、無声音区間、有声音区間、無声音区間、非定常雑音区間の順の場合であり、フレーム長を20ms、サブフレーム長を4msとし、1フレーム中のサブフレーム数は5である。またサンプリング周波数は16kHzとする。各フレームと対応し、その各サブフレームごとに、予測残差信号|e(m)|が第1のしきい値th1を越えたサンプル点数の計数値kを「少」、「中」、「多」の3段階で区別して、図3Bに示す。最初の無声音区間(フレーム)では線形予測残差信号は振幅が小さくなるので、th1を越えるサンプル点数は大概はゼロであり、kは「少」となり、次のフレームの有声音区間では、上述の通り、1個のサブフレームの中に、1個のピークが生じるが、th1が上述のように設定されているから、th1を越えるサンプル点数は多くても7〜8であるから、この例では全て数は、「中」となる。なお前記th1の選定であるから、有声音区間でkの数が少なくとも一部は「少」の場合もある。第4番目のフレームは非定常雑音区間であり、その雑音が重畳されている部分では線形予測残差信号の振幅は増大する。継続時間が短い非定常雑音でもkは12〜13、継続時間が長い非定常雑音であればkは40以上にもなる。従って、この非定常雑音区間では少なくとも、1個のサブフレーム区間の中に、th1を越える非定常雑音がまとまって存在するので、1個のサブフレームは「多」となる。
フレーム毎に上記kmaxを求めると、図3Cに示すように、kmaxは、無声音区間は「小」、有声音区間は「中」、非定常雑音区間は「大」となる。従って、「中」と「大」の間に第2のしきい値th2を設定する。前記数値の場合、例えばth2=10に選定される。このth2による判定結果は、図3Dに示すように、子音が含まれている無声音区間、ピッチ構造を有する有声音区間では、「非定常雑音なし」と判別され、非定常雑音区間のみ「非定常雑音あり」と判定され、正確な判別をすることが出来る。
なおサブフレームに分割することなく、フレームごとに、線形予測残差信号e(n)が第1のしきい値th1を超えた数を計数し、その計数値から判別することを考えたとする。その場合は、図3Eに示すように無声音区間では少ないと判別されるが、有声音区間では、場合によっては、計数値kが70〜80となり、「多」と判別される。非定常雑音区間では、計数値kが「多」と判別されるが、この計数値kは例えば、20〜80と大きくばらつく。従って、適切な第2のしきい値th2を選定することが困難であり、誤判別の恐れがある。
[実施例2]
図4は、この発明の実施例2の要部を示し、図1と対応する部分には同一参照番号を付けてある。実施例1に対し、定常雑音レベル推定部36としきい値計算部38が加えられている。これらを加えたことにより、定常雑音の大きさが変化する場合に対しても、しきい値を可変にして、誤判別を防ぐようにしたものである。
定常雑音レベル推定部36にフレーム分割部10よりのフレーム分割された信号が入力され、そのフレームごとにその入力信号の定常雑音レベルが推定される。定常雑音レベルの推定には、例えば、特開平9−258792号公報に記載されている手法を用いる。推定した定常雑音レベルMをしきい値計算部38に転送する。しきい値計算部38では、しきい値th1=α(M/M)th1を計算する。th1は、ある定常雑音Mのときに、あらかじめ定めたしきい値である。αは係数を調整するための、あらかじめ定めた値である。例えば、SN比が30dBのときに、M、th1、αを実験的に決定し、与える。例えばα=0.8とする。ここで、定常雑音レベルが2倍になり、M/M=2となると、しきい値th1はth1に対して1.6倍となる。しきい値計算部38では、定常雑音レベルMが大きいときに、th1が大きく、Mが小さいときに、th1が小さくなるようにしきい値th1の計算を行う。しきい値計算部38で計算された第1のしきい値th1はしきい値レジスタ24に格納される。
この構成によれば、定常雑音レベルが変動しても、非定常雑音区間を正しく判別することができることは容易に理解されよう。
前述した実施例においては予測残差信号の各サンプル点の振幅の絶対値|e(m)|とth1とを比較したが、絶対値の代わりに{パワーe(m)}を用いてもよい。この場合は、第1のしきい値の値もそれに応じて異なった値になる。更に、絶対値を求めることもなく予測残差信号の正側が+th1を越えるサンプル点と負側が−th1よりも更に、負の大きな値をとるサンプル点を求めてもよい。従って、この出願の特許請求の範囲中における「予測残差信号の振幅が第1のしきい値以上となる」はこれら全てのことを意味するものである。
図1及び図2に示した装置をコンピューターにより機能させてもよい。この場合は、これら図1及び図2に示した装置として、コンピュータを機能させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などからコンピュータにインストールし、あるいは、通信回線を介して、ダウンロードし、そのプログラムを実行させればよい。
実験例
以下に、この発明の効果を示すために行った計算機種シミュレーション実験の結果を、従来法及びこの発明方法について図5A及び図5Bにそれぞれ示す。
NTT−AT社多言語音声データベースから、男性4名の各音声、女性4名の各音声40sに対し、突発性雑音19種類(ペンで机を叩く音、紙資料を落とす音など)を0.5s間隔で重畳し、サンプリング周波数16kHz、定常雑音としてSN比30dbの白色雑音を重畳したものを入力信号とした。この場合、非定常雑音は合計12160箇所になる。分析条件は、フレーム長(分析長)を40ms、シフト長20msとした。これらは従来法、この発明法に対しても同一である。分析条件として、この発明法では、サブフレーム分割数を10、窓はハミング窓を用い、線形予測次数を14次とした。
図5の横軸は再現率、縦軸は適合率をそれぞれ表す。再現率とは全ての雑音区間のうち、雑音区間として判別できた割合を意味し、(検出された雑音区間数)/(雑音区間数)で求められ、適合率とは判別したうち本当に雑音区間である割合を意味し、(検出された雑音区関数)/(雑音区間検出数)で求められる。
図5Aにおいて、「+」は実験の結果のプロットであり、「△」はこれらの平均値を示している。図5Bで「×」は実験の結果のプロットであり、「□」はこれらの平均値を示している。まず図5Aの従来の技術では、再現率、適合率共に30%以上を表示し、図5Bのこの発明では、両者とも80%以上を表示していることに留意すべきである。図5AにおいてプロットP群から殆どの雑音区間を検出できるが、子音部分で、音声区間を雑音区間と誤判別することが適合率の値から理解される。従来技術では、低域は偏りのある雑音区間を殆ど検出できていないこと、再現率、適合率の各平均値はそれぞれ、92.7%、93%であった。
一方、この発明法では、プロット群Pから殆どの雑音区間を判別可能であり、しかも、適合率98%以上であるから、音声区間の誤判別が減少する。また、再現率、適合率の各平均値はそれぞれ、98.2%、98.1%になり、「△」で示した従来法の各平均値に対し、矢印で示すように、「□」で示す点に移動し、格段に判別能力が向上し、ほとんどの雑音区間を判別検出することが出来、音声の誤判別も減少した。
この発明の実施例1の機能構成例を示すブロック図。 この発明の実施例1の処理手順の例を示すフローチャート図。 図1の各部の出力形態を定性的に示す図。 この発明の実施例2の要部の機能構成例を示すブロック図。 この発明法と従来法のそれぞれによる判別率の計算シミュレーション結果を示すグラフ図。 従来技術の機能構成例を示すブロック図。 従来技術のパワースペクトル及び特徴ベクトルの比較を示すグラフ図。 従来技術の他の機能構成を示すブロック図。

Claims (8)

  1. コンピュータをフレーム分割部、線形予測分析部、サブフレーム分割部、処理部、最大値検出部、第2の比較部を有する非定常雑音判別装置として機能させ、そのコンピュータが実行する非定常雑音判別方法であって、
    上記フレーム分割部が、入力音響信号を一定時間区間(以下フレームという)ごとに分割してフレームごとの音響信号サンプル列を生成するステップと
    上記線形予測分析部が、上記各フレームごとに、音響信号サンプル列を線形予測分析して予測残差信号サンプル列を求めるステップと
    上記サブフレーム分割部が、上記予測残差信号サンプル列を同一時間長の複数のサブフレームに分割するステップと
    上記処理部が、上記サブフレームごとの、予測残差信号サンプル列のうち大きさが第1のしきい値以上となるサンプルの数を計数するステップと
    上記最大値検出部が、上記各フレームごとに、同一フレーム内の各サブフレームに対する上記計数値のうちの最大値を求めるステップと
    上記第2の比較部が、上記各フレームごとに、上記最大値が第2のしきい値以上か否かにより、そのフレームに非定常雑音が存在するか否かを判別するステップと
    を有することを特徴とする非定常雑音判別方法。
  2. 請求項1記載の方法において、
    上記同一時間長は、音声のピッチ周期の平均値であることを特徴とする非定常雑音判別方法。
  3. 請求項1または2に記載の方法において、
    上記各フレームごとの音響信号サンプル列の定常雑音レベルMを推定し、
    上記推定した定常雑音レベルMと、定常雑音レベルMと、定常雑音レベルMのときの既定のしきい値th1と、既定の定数αとを用いて、定常雑音レベルMが大きい程大きい上記第1のしきい値th1を
    th1=α(M/M)th1
    により求めることを特徴とする非定常雑音判別方法。
  4. 入力された音響信号を一定時間区間(以下フレームという)ごとに分割してフレームごとの音響信号サンプル列を生成するフレーム分割部と、
    上記フレーム分割された音響信号サンプル列が入力され、上記各フレームごとに、音響信号サンプル列の線形予測分析を行い、線形予測係数を求める線形予測分析部と、
    上記線形予測係数で対応するフィルタ係数が設定され、上記フレーム分割された音響信号サンプル列が入力され、これを逆フィルタ処理して上記各フレームごとの予測残差信号サンプル列を出力する逆フィルタと、
    上記各フレームごとの予測残差信号サンプル列が入力され、これを同一時間長の複数のサブフレームに分割して、複数のサブフレーム予測残差信号サンプル列を出力するサブフレーム分割部と、
    上記複数のサブフレームの予測残差信号サンプル列がそれぞれ入力され、その予測残差信号サンプル列のサンプルの大きさと第1のしきい値とが、それぞれ比較され、第1のしきい値以上となるごとにそのことを示す信号を出力する複数の第1の比較部と、
    上記複数の第1比較部の出力信号が入力され、振幅が第1のしきい値以上のサンプルの数をそれぞれ計数する複数の計数部と、
    これら複数の計数部で計数された計数値が入力され、これら計数値中の最大値を検出する最大値検出部と、
    上記最大値が入力され、その最大値が第2のしきい値以上か否かにより、そのフレームに非定常雑音が存在するか否かを判別し、その結果を出力する第2の比較部と、
    を具備することを特徴とする非定常雑音判別装置。
  5. 請求項4記載の装置において、
    上記同一時間長は、音声のピッチ周期の平均値であることを特徴とする非定常雑音判別装置。
  6. 請求項4または5に記載の装置において、
    上記各フレームごとの音響信号サンプル列が入力され、その音響信号サンプル列の定常雑音レベルMを推定する定常雑音レベル推定部と、
    上記推定した定常雑音レベルMが入力され、その定常雑音レベルMと、定常雑音レベルMと、定常雑音レベルMのときの既定のしきい値th1と、既定の定数αとを用いて、定常雑音レベルMが大きい程大きい上記第1のしきい値th1を
    th1=α(M/M)th1
    により計算するしきい値計算部と、
    を具備することを特徴とする非定常雑音判別装置。
  7. 請求項1乃至3のいずれかに記載した非定常雑音判別方法の各過程をコンピュータに実行させるための非定常雑音判別プログラム。
  8. 請求項7に記載した非定常雑音判別プログラムを記録したコンピュータが読み取り可能な記録媒体。
JP2005256915A 2005-09-05 2005-09-05 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 Active JP4413175B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005256915A JP4413175B2 (ja) 2005-09-05 2005-09-05 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005256915A JP4413175B2 (ja) 2005-09-05 2005-09-05 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体

Publications (2)

Publication Number Publication Date
JP2007072005A JP2007072005A (ja) 2007-03-22
JP4413175B2 true JP4413175B2 (ja) 2010-02-10

Family

ID=37933520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005256915A Active JP4413175B2 (ja) 2005-09-05 2005-09-05 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体

Country Status (1)

Country Link
JP (1) JP4413175B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3404657A1 (en) 2017-05-15 2018-11-21 Panasonic Intellectual Property Corporation of America Noise suppression apparatus, noise suppression method, and non-transitory recording medium

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100800873B1 (ko) 2005-10-28 2008-02-04 삼성전자주식회사 음성 신호 검출 시스템 및 방법
JP5293329B2 (ja) 2009-03-26 2013-09-18 富士通株式会社 音声信号評価プログラム、音声信号評価装置、音声信号評価方法
WO2014027419A1 (ja) * 2012-08-17 2014-02-20 Toa株式会社 雑音除去装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61154324A (ja) * 1984-12-27 1986-07-14 Nec Corp パルス性雑音抑圧回路
JP3367592B2 (ja) * 1996-09-24 2003-01-14 日本電信電話株式会社 自動利得調整装置
JP2001236085A (ja) * 2000-02-25 2001-08-31 Matsushita Electric Ind Co Ltd 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置
JP2002006898A (ja) * 2000-06-22 2002-01-11 Asahi Kasei Corp ノイズ低減方法及びノイズ低減装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3404657A1 (en) 2017-05-15 2018-11-21 Panasonic Intellectual Property Corporation of America Noise suppression apparatus, noise suppression method, and non-transitory recording medium

Also Published As

Publication number Publication date
JP2007072005A (ja) 2007-03-22

Similar Documents

Publication Publication Date Title
JP5411936B2 (ja) 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体
KR101266894B1 (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
JP4587160B2 (ja) 信号処理装置および方法
KR100770839B1 (ko) 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
KR100744352B1 (ko) 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
US20060053003A1 (en) Acoustic interval detection method and device
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
JP2014515124A (ja) 効率的なコンテンツ分類及びラウドネス推定
US20140177853A1 (en) Sound processing device, sound processing method, and program
EP1395977A2 (en) Processing speech signals
CN108305639B (zh) 语音情感识别方法、计算机可读存储介质、终端
JP3105465B2 (ja) 音声区間検出方法
WO2014132102A1 (en) Audio signal analysis
JP4413175B2 (ja) 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体
CN108682432B (zh) 语音情感识别装置
EP3136388B1 (en) Utterance condition determination apparatus and method
JP5293329B2 (ja) 音声信号評価プログラム、音声信号評価装置、音声信号評価方法
JP4490090B2 (ja) 有音無音判定装置および有音無音判定方法
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP4601970B2 (ja) 有音無音判定装置および有音無音判定方法
Kumar Performance measurement of a novel pitch detection scheme based on weighted autocorrelation for speech signals
Cabañas Molero et al. Low-complexity F0-based speech/nonspeech discrimination approach for digital hearing aids
JP2008058876A (ja) 音声信号区間推定方法、及びその装置とそのプログラムとその記憶媒体
JP4691079B2 (ja) 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4413175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350