JP2006079085A - 音声品質向上方法及び装置 - Google Patents

音声品質向上方法及び装置 Download PDF

Info

Publication number
JP2006079085A
JP2006079085A JP2005258585A JP2005258585A JP2006079085A JP 2006079085 A JP2006079085 A JP 2006079085A JP 2005258585 A JP2005258585 A JP 2005258585A JP 2005258585 A JP2005258585 A JP 2005258585A JP 2006079085 A JP2006079085 A JP 2006079085A
Authority
JP
Japan
Prior art keywords
speech
voiced sound
adaptive
ale
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005258585A
Other languages
English (en)
Other versions
JP4350690B2 (ja
Inventor
Chan Woo Kim
チャン ウ キム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2006079085A publication Critical patent/JP2006079085A/ja
Application granted granted Critical
Publication of JP4350690B2 publication Critical patent/JP4350690B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetically Actuated Valves (AREA)
  • Machine Translation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Navigation (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

【課題】 無声音での雑音除去を通して音声品質の低下を減らし、特に、ALEとSSMを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。
【解決手段】 本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ;前記有声音の雑音を除去するための適応フィルタリングを行うステップ;前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。入力音声を有声音と無声音とに区分する決定ブロック;前記有声音に対して適応ライン向上技法(ALE)を行うALEブロック;前記無声音に対してスペクトルサブトラクションを行うSSブロックを含んで構成されることを特徴とする音声品質向上装置。
【選択図】 図3

Description

本発明は効果的な音声品質向上方法および装置に関する。
従来、様々な音質向上方法が提案されてきた。その代表的な方法の一つがスペクトルサブトラクション方法(spectral subtraction method:以下、SSM)である。以下、そのSSMを図1に基づいて説明する。
SSMは、ショートタイムスペクトルの大きさを直接推定する方法である。
SSMで音声は、無相関ランダム変数で表示される雑音が加えられた形態でモデリングされる。その音声のモデリングは次の式1のように表される。
(数学式1)
y[n]=s[n]+d[n]
上記式1で y[n] は入力音声である。また、式1で d[n] は s[n] と無相関した雑音であると仮定する。
これに基づき、電力スペクトル密度を求めると、次の式2のように表される。
(数学式2)
Figure 2006079085
上記の式2で
Figure 2006079085
をショートタイム離散時間フーリエ変換(Discrete-Time Fourier Transform;以下、DTFTでに表示すると、次の式3となる。
(数学式3)
Figure 2006079085
音声フレーム自体のスペクトルを求めるためには、位相が分からなければならず、事実上、雑音の交った音声の位相で音声フレームのフレーム位相を決定しても大きな問題がないことが立証された。[1]
[1] D.L.Wang and J.S Lim,"The unimportance of phase in 音声 enhancement,"IEEE Trans. on Acoust.音声, and Signal Processing, vol-ASSP.30,pp.679-681,1982.
上記の雑音の交った音声の位相で音声フレームの位相を決定する場合、得ようとするショートタイムDTFTは次の式4から求められる。
(数学式4)
Figure 2006079085
上記の式4の
Figure 2006079085
は、上記の式2から求められる。
Figure 2006079085
は雑音の交った音声の位相を用いる。その結果、式4から得ようとする
Figure 2006079085
の推定値を得ることができ、
Figure 2006079085
は、音声がない時に雑音から推定できる。
次に、他の音声品質向上方法のうちの一つである適応ライン向上技法(Adaptive Line Enhancer; 以下、ALE)について図2を参照して説明する。
ALEの説明に先立って、一般的な適応フィルタを用いる場合について先ず説明する。
これは、ALEが適応フィルタを用いる方法から更に発展したものであるからである。
まず、適応フィルターを用いる場合は、両マイクロフォンの入力、即ち、一つのマイクロフォンの入力の雑音の交った音声と、他方のマイクロフォンの入力の純粋な雑音を受信した後には、2つのマイクロフォン間の距離などで伝達関数などが生じる。しかし、それを適応フィルターで除去して、きれいな音声だけを得ることができる。
上述した適応フィルタを用いる方法は、場合によって非常に効果的で実用的な目的で有用に用いられてきた。しかし、2つのマイクロフォンを設置しなければならない。そして、2つのマイクロファンの間の距離をどの程度にするべきかなどの構造的な不具合がある。そのため、端末機に適用するには無理が伴う。
ALEは、上記の適応フィルタを用いる方法を改良したもので、同一のマイクロフォンから得た信号s[n]と d[n]を、ピッチ周期だけの差異を置いて適応フィルタリングする方法である。前記のピッチ周期は音声信号の有声音部分の周期である。
一方、有線信号の場合には、周期的なインパルス列(impulse train)がボーカルトラクト(vocal tract)を励起させる構造となっている。したがって、有声音でALEは最も大きな効果を発揮する。しかし、無声音の場合は、音声の歪みなどの現象が現れる。
次に、ほかの音声品質向上方法のうちの一つである適応コムフィルタを用いる方法について説明する。適応コムフィルタを用いる場合もALEと類似した点があり、有声音により優れた効果を発揮する。有声音の場合に励起信号は周期的な信号であるが、周知のように、インパルス列をフーリエ変換しても、その結果を見ると、周波数領域でインパルス列に現れる。
したがって、有声音の場合、ピッチ周波数の倍となる部分でピークが周期的に現れる形態で構成される。勿論、全体のスペクトルの輪郭は、フォルマントというボーカルトラクトの反響に表示される。
雑音の交った音声を
Figure 2006079085
として表示し、音声を
Figure 2006079085
として表示し、雑音を除去した音声を推定したものを
Figure 2006079085
として表示する場合に、適応コムフィルタによって向上した音声は次の式5のように表される。
(数学式5)
Figure 2006079085
上記の式5で
Figure 2006079085
は抽出されたピッチ手記を表し、
Figure 2006079085
はコムフィルタの係数を表す。
Lの値は通常小さい値(1〜6)を用いる。
一方、適応コムフィルタは、一般的にノイジが周期的ではないため、それを除去するのに効果的である。
しかしながら、上記の従来技術に係る音声品質向上方法を用いるには次のような問題があった。
まず、SSMで
Figure 2006079085
は、音声がない時に雑音から推定する。ところが、その
Figure 2006079085
を信頼性よく測定することができない。即ち、
Figure 2006079085
は、雑音の
Figure 2006079085
が固定された信号であると仮定する場合に推定できる。しかし、実際の場合はそうであるとしても、時間に従ったスペクトルの変化はある。特に、携帯用端末機などの場合は、続けて周辺の環境が変わるので、実質に
Figure 2006079085
を信頼度よく測定することができない。
また、ALEや適応コムフィルタを用いる技法は、有声音より優れた性能を発揮する。
しかし、これらの方法は、有声信号に対してのみ適用可能であり、有声/無線決定が多少外れて無声信号にその方法が適用される場合には、却って性能低下を引き起こす。
また、一部の音声の場合、低周波数では有声特性を現わすが、高周波数では無声特性を現わしたりもする。このような点がALEの性能低下をもたらす。
本発明は上記の問題点を鑑みて案出したもので、無声音での雑音除去を通して音声品質の低下を防ぐのに適した音声品質向上方法及び装置を提供することにある。
他の目的として、ALEとSSMを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。
上記目的を達成するための本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ;前記有声音の雑音を除去するための適応フィルタリングを行うステップ;前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。
より好ましくは、前記有声音の雑音を除去するために、前記適応フィルタリングを用いる適応ライン向上技法(ALE)を行う。ここで、前記適応ライン向上技法(ALE)により、前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を、スペクトルサブトラクションに用いる。
より好ましくは、前記適応フィルタリングは、前記有声音に当たるフレームから抽出したピッチ周期を用いる。
より好ましくは、前記入力音声に対して低域通過フィルタリング及び高域通過フィルタリングを行うステップを更に備える。前記高域通過フィルタリングの出力から雑音を除去するための適応コムフィルタリングを更に行う。ここで、前記適応コムフィルタリングは、
前記高域通過フィルタリングの出力が有声音の場合に行う。また、前記低域通過フィルタリングの出力を、前記有声音と前記無声音とに区分する。
より好ましくは、前記有声音の区間で得た雑音スペクトルデータを前記スペクトルサブトラクションに用いる。ここで、前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値である。
上記目的を達成するための本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分する決定ブロック;前記有声音に対して適応ライン向上技法(ALE)を行うALEブロック;前記無声音に対してスペクトルサブトラクションを行うSSブロックを含んで構成されることを特徴とする。
より好ましくは、前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタ;前記入力音声を高域通過フィルタリングする高域通過フィルタを更に備える。前記高域通過フィルタの出力が有声音の場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタを更に備える。そして、前記適応コムフィルタは、前記有声音から抽出したピッチ周期を用いる。
より好ましくは、前記有声音からピッチ周期を抽出するピッチ抽出器を更に備える。ここで、前記ピッチ抽出器は、前記抽出したピッチ周期をALEブロックに提供する。
より好ましくは、前記SSブロックは、前記ALEブロックで推定した雑音スペクトルを用いる。
より好ましくは、前記SSブロックは、前記ALEブロックによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を用いる。
上記目的を達成するために、本発明は、例えば、以下の手段を提供する。
(項目1)
入力音声を有声音と無声音とに区分するステップ;
前記有声音の雑音を除去するための適応フィルタリングを行うステップ;
前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする音声品質向上方法。
(項目2)
前記有声音の雑音を除去するために、前記適応フィルタリングを用いる適応ライン向上技法(ALE)を行うことを特徴とする項目1に記載の音声品質向上方法。
(項目3)
前記適応ライン向上技法(ALE)により、前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を、スペクトルサブトラクションに用いることを特徴とする項目2に記載の音声品質向上方法。
(項目4)
前記適応フィルタリングは、前記有声音に当たるフレームから抽出したピッチ周期を用いることを特徴とする項目1に記載の音声品質向上方法。
(項目5)
前記入力音声に対して低域通過フィルタリング及び高域通過フィルタリングを行うステップを更に備えることを特徴とする項目1に記載の音声品質向上方法。
(項目6)
前記高域通過フィルタリングの出力から雑音を除去するための適応コムフィルタリングを更に行うことを特徴とする項目5に記載の音声品質向上方法。
(項目7)
前記適応コムフィルタリングは、
前記高域通過フィルタリングの出力が有声音の場合に行うことを特徴とする項目6に記載の音声品質向上方法。
(項目8)
前記低域通過フィルタリングの出力を、前記有声音と前記無声音とに区分することを特徴とする項目5に記載の音声品質向上方法。
(項目9)
前記有声音の区間で得た雑音スペクトルデータを前記スペクトルサブトラクションに用いることを特徴とする項目1に記載の音声品質向上方法。
(項目10)
前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値であることを特徴とする項目9に記載の音声品質向上方法。
(項目11)
入力音声を有声音と無声音とに区分する決定ブロック;
前記有声音に対して適応ライン向上技法(ALE)を行うALEブロック;
前記無声音に対してスペクトルサブトラクションを行うSSブロックを含んで構成されることを特徴とする音声品質向上装置。
(項目12)
前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタ;
前記入力音声を高域通過フィルタリングする高域通過フィルタを更に備えることを特徴とする項目11に記載の音声品質向上装置。
(項目13)
前記高域通過フィルタの出力が有声音の場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタを更に備えることを特徴とする項目12に記載の音声品質向上装置。
(項目14)
前記適応コムフィルタは、
前記有声音から抽出したピッチ周期を用いることを特徴とする項目13に記載の音声品質向上装置。
(項目15)
前記有声音からピッチ周期を抽出するピッチ抽出器を更に備えることを特徴とする項目11に記載の音声品質向上装置。
(項目16)
前記ピッチ抽出器は、前記抽出したピッチ周期をALEブロックに提供することを特徴とする項目15に記載の音声品質向上装置。
(項目17)
前記SSブロックは、前記ALEブロックで推定した雑音スペクトルを用いることを特徴とする項目11に記載の音声品質向上装置。
(項目18)
前記SSブロックは、前記ALEブロックによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を用いることを特徴とする項目11に記載の音声品質向上装置。
本発明によれば、ALEやSSMより優れた性能を期待することができる。本発明は、ピッチ特性が最も強く現れる低周波数成分に対してALEを行った後、再び高周波数の成分が有声音である場合には適応コムフィルタを更に用いるので、低周波数が有声的な特性を有し、高周波数が無声的な特性を有する時にも効果的な性能を発揮する。
本発明は、音声の固有の特徴であるピッチ特性に基づき、音声品質を向上させるので、不分明な雑音などに対して、他の音質向上方法(例えば、ウィンナーフィルタリング(Wiener filtering)或いはSSM)より強い特性を持つ。
以上の本発明は、特に、携帯用端末機で単一のマイクロフォンを用いる時、雑音除去に有用であり、携帯用録音機で雑音を除去しながら録音をするのにも有用である。
また、本発明は、一般の有/無線電話機で雑音を除去するための用途や、その他PDAなどで音声を録音するための用途としても使用可能である。
以下、本発明に係る音声品質向上方法及び装置についての好適な実施例を、添付の図面に基づいて詳細に説明する。
本発明に係る音声品質の向上方法は、有声音に対して所定の音声品質の向上方法を行い、それによって得た雑音スペクトルを用いて、無声音に対するSSMを行う。
まず、図3を参照して、本発明に係る装置の構成を説明する。
図3は本発明に係る音声品質向上装置を説明するための図面である。
図3を参照すると、本発明に係る装置は、入力された音声y[n]を低域通過フィルタリングする低域通過フィルタ(以下、LPF)51と、前記入力された音声y[n]を高域通過フィルタリングする高域通過フィルタ(以下、HPF)50とを備える。
本発明に係る装置は、高周波数成分に対する処理のために、適応コムフィルタ56を備え、低周波数成分に対する処理のために、有声/無声決定ブロック52と、ピッチ抽出機53と、スペクトルサブトラクションブロック55とを備える。また、ALEブロック54をさらに備える。ここで、ALEブロック54の代わりに他の音質向上方法を用いる手段を備えることもできる。
HPF50の出力は適応コムフィルタ56に入力され、LPF51の出力は有声音か無声音かによって互いに異なる経路(ALEを用いる経路とSSMを用いる経路)をとる。
有声/無声決定ブロック52は、LPF51を通過した音声が有声音か無声音かを判断する。有声/無声決定ブロック52の判断結果から、ALEを使用するかSSMを使用するかが決定される。即ち、有声/無声決定ブロック52は、LPF51を通過した音声で無声音に当たるフレームは、SSMを用いるスペクトルサブトラクションブロック55に伝達する。
反面、LPF51を通過した音声で有声音に当たるフレームは、ALEを用いる経路に伝達される。ALEを用いる経路は、ピッチ抽出機53と、ALEブロック54とで構成される。ピッチ抽出機53は、有声音に当たるフレームでピッチ周期を抽出する。そうして、ピッチ抽出機53は、抽出したピッチ周期T0を適応フィルタ56に提供する。
また、ピッチ抽出機53は、抽出した前記ピッチ周期をALEブロック54に提供する。
ALEブロック54は、ピッチ周期をALEに用いて、有声音に当たるフレームに対して音声品質を向上させる。
一方、上述したように、本発明では有声音に当たるフレームに対して音声品質を向上させるための手段として、ALEブロック54を用いたが、これは一つの実施例に過ぎない。
一方、一般的なピッチ周波数が存在する周波数の範囲が50〜400Hzなので、本発明では、前記周波数の範囲に充分に属しながらピッチ周期の影響に最も優れた部分を通過させるように、LPF51のカットオフ周波数を定める。
好ましくは、そのカットオフ周波数は800Hz程度が良い。
上述した本発明の一実施例のとおりALEを適用させると、400Hzから4000Hzまでの範囲と再び結合させ、0〜4kHzの帯域幅を有する音声を得る。
これは、8kHzサンプリングレートの場合であり、そのような場合に対比して、本発明では適応コムフィルタ56を更に用いる。
本発明に係る適応コムフィルタ56は、高周波数でピッチ成分として現れるインパルス列のように見える部分の間にある雑音を除去する。特に、適応コムフィルタ56は、高周波数の成分で有声音に当たる分明な信号が存在する場合にのみ動作する。
一方、SSMを用いるスペクトルサブトラクションブロック55は、有声音の区間で得た雑音スペクトルデータを用いる。即ち、スペクトルサブトラクションブロック55は、ALEブロック54で前の有声音の所定のフレームで推定した雑音スペクトルの平均値を用いる。
言い換えると、前記雑音スペクトルデータは、有声音で雑音スペクトルを得るごとに所定の個数のフレームの雑音スペクトルデータトレインに対する平均を出して得る。
その結果、スペクトルサブトラクションブロック55の出力と、適応コムフィルター56の出力から雑音を除去した音声
Figure 2006079085
を得ることができる。
図4は、本発明に係る音声品質向上の手順を説明するための図面である。
図4を参照すると、所定の音声y[n]が入力されると(S1)、まず、その入力された音声y[n]に対して低域通過フィルタリングS2、及び高域通過フィルタリングS3を行う。
一方、一般的にピッチ周波数が存在する周波数の範囲が50〜400Hzであるため、本発明では前記周波数の範囲に充分に属しながらピッチ周期の影響に最も優れた部分を低域通過フィルタリングさせる。
上記で低域通過フィルタリングのカットオフ周波数は800Hz程度が好ましい。次いで、低域通過フィルタリングの出力が有声音か無声音かを区分する(S4)。
もし、低域通過フィルタリングの出力が有声音であれば、該有声音に当たるフレームに対しては所定の音質向上方法を行う。本発明では、有声音に対する音質向上方法としてALEを適用する。それによって、有声音に当たるフレームに対してALE技法を行う(S6)。
勿論、ALE技法に先立って、有声音に当たるフレームでピッチ周期を抽出する(S5)。
その抽出されたピッチ周期は適応コムフィルタリングのために用いられ、また、ALE技法にも用いられる。
反面、低域通過フィルタリングの出力が無声音であれば、該無声音に当たるフレームに対してはスペクトルサブトラクションを行う(S9)。
スペクトルサブトラクションを行う時は、ALE技法によって前の有声音の所定のフレームで推定した雑音スペクトルの平均値を用いる。即ち、ALE技法によって有声音で雑音スペクトルを得るごとに、所定の個数のフレームの雑音スペクトルデータトレインに対する平均値を用いる。その値が有声音から得た雑音スペクトルデータである。
一方、入力された音声y[n]を高域通過フィルタリングした出力に対しては、該雑音を除去するための適応コムフィルタリングを行う(S8)。この時は低域通過フィルタリングされた出力のうち、有声音から抽出したピッチ周期を適応コムフィルタリングするのに用いる。この際、適応コムフィルタリングに先立ち、高域通過フィルタリングした出力が有声音に当たるかを先に判断した後(S7)、有声音に当たる明らかな信号が存在する時、適応コムフィルタリングを行う。その結果、スペクトルサブトラクションの結果と、適応コムフィルタリングの結果から雑音を除去した音声
Figure 2006079085
を得ることができる。
以上で説明した内容を通じて、当業者であれば本発明の技術思想を逸脱しない範囲で多様な変更および修正が可能なことが分かる。したがって、本発明の技術的な範囲は明細書の詳細な説明に記載された内容に限定されるものではなく、特許請求の範囲によって定められなければならない。
以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、この実施形態に限定して解釈されるべきものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。本明細書において引用した文献は、その内容自体が具体的に本明細書に記載されているのと同様にその内容が本明細書に対する参考として援用されるべきであることが理解される。
無声音での雑音除去を通して音声品質の低下を減らし、特に、ALEとSSMを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。
本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ;前記有声音の雑音を除去するための適応フィルタリングを行うステップ;前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。
一般的なALEを説明するための図面である。 一般的なSSMを説明するための図面である。 本発明に係る音声品質向上装置を説明するための図面である。 本発明に係る音声品質向上の手順を説明するための図面である。

Claims (18)

  1. 入力音声を有声音と無声音とに区分するステップ;
    前記有声音の雑音を除去するための適応フィルタリングを行うステップ;
    前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする音声品質向上方法。
  2. 前記有声音の雑音を除去するために、前記適応フィルタリングを用いる適応ライン向上技法(ALE)を行うことを特徴とする請求項1に記載の音声品質向上方法。
  3. 前記適応ライン向上技法(ALE)により、前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を、スペクトルサブトラクションに用いることを特徴とする請求項2に記載の音声品質向上方法。
  4. 前記適応フィルタリングは、前記有声音に当たるフレームから抽出したピッチ周期を用いることを特徴とする請求項1に記載の音声品質向上方法。
  5. 前記入力音声に対して低域通過フィルタリング及び高域通過フィルタリングを行うステップを更に備えることを特徴とする請求項1に記載の音声品質向上方法。
  6. 前記高域通過フィルタリングの出力から雑音を除去するための適応コムフィルタリングを更に行うことを特徴とする請求項5に記載の音声品質向上方法。
  7. 前記適応コムフィルタリングは、
    前記高域通過フィルタリングの出力が有声音の場合に行うことを特徴とする請求項6に記載の音声品質向上方法。
  8. 前記低域通過フィルタリングの出力を、前記有声音と前記無声音とに区分することを特徴とする請求項5に記載の音声品質向上方法。
  9. 前記有声音の区間で得た雑音スペクトルデータを前記スペクトルサブトラクションに用いることを特徴とする請求項1に記載の音声品質向上方法。
  10. 前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値であることを特徴とする請求項9に記載の音声品質向上方法。
  11. 入力音声を有声音と無声音とに区分する決定ブロック;
    前記有声音に対して適応ライン向上技法(ALE)を行うALEブロック;
    前記無声音に対してスペクトルサブトラクションを行うSSブロックを含んで構成されることを特徴とする音声品質向上装置。
  12. 前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタ;
    前記入力音声を高域通過フィルタリングする高域通過フィルタを更に備えることを特徴とする請求項11に記載の音声品質向上装置。
  13. 前記高域通過フィルタの出力が有声音の場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタを更に備えることを特徴とする請求項12に記載の音声品質向上装置。
  14. 前記適応コムフィルタは、
    前記有声音から抽出したピッチ周期を用いることを特徴とする請求項13に記載の音声品質向上装置。
  15. 前記有声音からピッチ周期を抽出するピッチ抽出器を更に備えることを特徴とする請求項11に記載の音声品質向上装置。
  16. 前記ピッチ抽出器は、前記抽出したピッチ周期をALEブロックに提供することを特徴とする請求項15に記載の音声品質向上装置。
  17. 前記SSブロックは、前記ALEブロックで推定した雑音スペクトルを用いることを特徴とする請求項11に記載の音声品質向上装置。
  18. 前記SSブロックは、前記ALEブロックによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を用いることを特徴とする請求項11に記載の音声品質向上装置。
JP2005258585A 2004-09-07 2005-09-06 音声品質向上方法及び装置 Expired - Fee Related JP4350690B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040071371A KR100640865B1 (ko) 2004-09-07 2004-09-07 음성 품질 향상 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2006079085A true JP2006079085A (ja) 2006-03-23
JP4350690B2 JP4350690B2 (ja) 2009-10-21

Family

ID=36126658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005258585A Expired - Fee Related JP4350690B2 (ja) 2004-09-07 2005-09-06 音声品質向上方法及び装置

Country Status (9)

Country Link
US (1) US7590524B2 (ja)
EP (1) EP1632935B1 (ja)
JP (1) JP4350690B2 (ja)
KR (1) KR100640865B1 (ja)
CN (1) CN100520913C (ja)
AT (1) ATE385027T1 (ja)
BR (1) BRPI0503959A (ja)
DE (1) DE602005004464T2 (ja)
RU (1) RU2391778C2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063394A (ja) * 2010-09-14 2012-03-29 Casio Comput Co Ltd 雑音抑制装置、雑音抑制方法およびプログラム
JP2013167720A (ja) * 2012-02-15 2013-08-29 Renesas Electronics Corp 半導体装置及び音声通信装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
US7844453B2 (en) * 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8326620B2 (en) * 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
RU2477533C2 (ru) * 2011-04-26 2013-03-10 Юрий Анатольевич Кропотов Способ многоканального адаптивного подавления акустических шумов и сосредоточенных помех и устройство для его осуществления
KR20150032390A (ko) 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
RU2580796C1 (ru) * 2015-03-02 2016-04-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки
CN104810023B (zh) * 2015-05-25 2018-06-19 河北工业大学 一种用于语音信号增强的谱减法
EP3416167B1 (en) 2017-06-16 2020-05-13 Nxp B.V. Signal processor for single-channel periodic noise reduction
CN112927715B (zh) * 2021-02-26 2024-06-14 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及计算机可读存储介质
CN112700787B (zh) * 2021-03-24 2021-06-25 深圳市中科蓝讯科技股份有限公司 一种降噪方法、非易失性可读存储介质及电子设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4238746A (en) * 1978-03-20 1980-12-09 The United States Of America As Represented By The Secretary Of The Navy Adaptive line enhancer
FR2697101B1 (fr) * 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
SG49709A1 (en) * 1993-02-12 1998-06-15 British Telecomm Noise reduction
JPH07239696A (ja) 1994-02-28 1995-09-12 Hitachi Ltd 音声認識装置
JPH07283860A (ja) 1994-04-06 1995-10-27 Toshiba Corp ノイズ除去装置
BR9610290A (pt) 1995-09-14 1999-03-16 Ericsson Ge Mobile Inc Processo para aumentar a inteligibilidade de voz em sinais de áudio aparelho para reduzir ruído em quadros recebidos de sinais de áudio digitalizados e sistema de telecomunicações
JP3297307B2 (ja) 1996-06-14 2002-07-02 沖電気工業株式会社 背景雑音消去装置
JP3264831B2 (ja) 1996-06-14 2002-03-11 沖電気工業株式会社 背景雑音消去装置
US5742694A (en) * 1996-07-12 1998-04-21 Eatwell; Graham P. Noise reduction filter
JP4040126B2 (ja) * 1996-09-20 2008-01-30 ソニー株式会社 音声復号化方法および装置
JPH11338499A (ja) 1998-05-28 1999-12-10 Kokusai Electric Co Ltd ノイズキャンセラ
CA2399706C (en) * 2000-02-11 2006-01-24 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
JP2002175099A (ja) 2000-12-06 2002-06-21 Hioki Ee Corp 雑音抑制方法および雑音抑制装置
DE10118653C2 (de) * 2001-04-14 2003-03-27 Daimler Chrysler Ag Verfahren zur Geräuschreduktion
US7092877B2 (en) * 2001-07-31 2006-08-15 Turk & Turk Electric Gmbh Method for suppressing noise as well as a method for recognizing voice signals
JP2003131401A (ja) * 2001-10-26 2003-05-09 Adtec Engineeng Co Ltd 多層回路基板製造におけるマーキング装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063394A (ja) * 2010-09-14 2012-03-29 Casio Comput Co Ltd 雑音抑制装置、雑音抑制方法およびプログラム
JP2013167720A (ja) * 2012-02-15 2013-08-29 Renesas Electronics Corp 半導体装置及び音声通信装置

Also Published As

Publication number Publication date
BRPI0503959A (pt) 2007-05-22
EP1632935B1 (en) 2008-01-23
RU2391778C2 (ru) 2010-06-10
RU2005127995A (ru) 2007-03-20
US7590524B2 (en) 2009-09-15
DE602005004464D1 (de) 2008-03-13
CN1746974A (zh) 2006-03-15
JP4350690B2 (ja) 2009-10-21
ATE385027T1 (de) 2008-02-15
US20060074640A1 (en) 2006-04-06
EP1632935A1 (en) 2006-03-08
CN100520913C (zh) 2009-07-29
KR20060022525A (ko) 2006-03-10
DE602005004464T2 (de) 2009-02-19
KR100640865B1 (ko) 2006-11-02

Similar Documents

Publication Publication Date Title
JP4350690B2 (ja) 音声品質向上方法及び装置
US10249325B2 (en) Pitch detection algorithm based on PWVT of Teager Energy Operator
JP2009128906A (ja) 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム
JP5799013B2 (ja) 音声信号の処理に際して、ノイズを無視して音声を対象にすることによりノイズを低減するシステムおよび方法
FR2820227A1 (fr) Procede et dispositif de reduction de bruit
EP1891627B1 (en) Multi-sensory speech enhancement using a clean speech prior
JP6677662B2 (ja) 音響処理装置、音響処理方法およびプログラム
KR20070055599A (ko) 잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치
JP2010055000A (ja) 信号帯域拡張装置
JPS5850360B2 (ja) 音声認識装置における前処理方法
JP5148414B2 (ja) 信号帯域拡張装置
Nongpiur Impulse noise removal in speech using wavelets
KR20150032390A (ko) 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
JP5782402B2 (ja) 音声品質客観評価装置及び方法
JP2009223210A (ja) 信号帯域拡張装置および信号帯域拡張方法
JP2005258158A (ja) ノイズ除去装置
JP2004020679A (ja) 雑音抑圧装置および雑音抑圧方法
JP2007093635A (ja) 既知雑音除去装置
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
JP4166405B2 (ja) 駆動信号分析装置
JP5327735B2 (ja) 信号再生装置
JPH1138998A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
Krishnamoorthy et al. Processing noisy speech for enhancement
CN114613379A (zh) 一种用于消除音频中噪声信号的方法及系统
Krishnamoorthy et al. Temporal and spectral processing of degraded speech

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090722

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130731

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees