JP4350690B2 - 音声品質向上方法及び装置 - Google Patents

音声品質向上方法及び装置 Download PDF

Info

Publication number
JP4350690B2
JP4350690B2 JP2005258585A JP2005258585A JP4350690B2 JP 4350690 B2 JP4350690 B2 JP 4350690B2 JP 2005258585 A JP2005258585 A JP 2005258585A JP 2005258585 A JP2005258585 A JP 2005258585A JP 4350690 B2 JP4350690 B2 JP 4350690B2
Authority
JP
Japan
Prior art keywords
voiced
adaptive
filtering
speech
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005258585A
Other languages
English (en)
Other versions
JP2006079085A (ja
Inventor
チャン ウ キム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2006079085A publication Critical patent/JP2006079085A/ja
Application granted granted Critical
Publication of JP4350690B2 publication Critical patent/JP4350690B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Machine Translation (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Navigation (AREA)
  • Magnetically Actuated Valves (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Description

本発明は効果的な音声品質向上方法および装置に関する。
従来、様々な音質向上方法が提案されてきた。その代表的な方法の一つがスペクトルサブトラクション方法(spectral subtraction method:以下、SSM)である。以下、そのSSMを図1に基づいて説明する。
SSMは、ショートタイムスペクトルの大きさを直接推定する方法である。
SSMで音声は、無相関ランダム変数で表示される雑音が加えられた形態でモデリングされる。その音声のモデリングは次の式1のように表される。
(数学式1)
y[n]=s[n]+d[n]
上記式1で y[n] は入力音声である。また、式1で d[n] は s[n] と無相関した雑音であると仮定する。
これに基づき、電力スペクトル密度を求めると、次の式2のように表される。
(数学式2)
Figure 0004350690
上記の式2で
Figure 0004350690
をショートタイム離散時間フーリエ変換(Discrete-Time Fourier Transform;以下、DTFTでに表示すると、次の式3となる。
(数学式3)
Figure 0004350690
音声フレーム自体のスペクトルを求めるためには、位相が分からなければならず、事実上、雑音の交った音声の位相で音声フレームのフレーム位相を決定しても大きな問題がないことが立証された。[1]
[1] D.L.Wang and J.S Lim,"The unimportance of phase in 音声 enhancement,"IEEE Trans. on Acoust.音声, and Signal Processing, vol-ASSP.30,pp.679-681,1982.
上記の雑音の交った音声の位相で音声フレームの位相を決定する場合、得ようとするショートタイムDTFTは次の式4から求められる。
(数学式4)
Figure 0004350690
上記の式4の
Figure 0004350690
は、上記の式2から求められる。
Figure 0004350690
は雑音の交った音声の位相を用いる。その結果、式4から得ようとする
Figure 0004350690
の推定値を得ることができ、
Figure 0004350690
は、音声がない時に雑音から推定できる。
次に、他の音声品質向上方法のうちの一つである適応ライン向上技法(Adaptive Line Enhancer; 以下、ALE)について図2を参照して説明する。
ALEの説明に先立って、一般的な適応フィルタを用いる場合について先ず説明する。
これは、ALEが適応フィルタを用いる方法から更に発展したものであるからである。
まず、適応フィルターを用いる場合は、両マイクロフォンの入力、即ち、一つのマイクロフォンの入力の雑音の交った音声と、他方のマイクロフォンの入力の純粋な雑音を受信した後には、2つのマイクロフォン間の距離などで伝達関数などが生じる。しかし、それを適応フィルターで除去して、きれいな音声だけを得ることができる。
上述した適応フィルタを用いる方法は、場合によって非常に効果的で実用的な目的で有用に用いられてきた。しかし、2つのマイクロフォンを設置しなければならない。そして、2つのマイクロファンの間の距離をどの程度にするべきかなどの構造的な不具合がある。そのため、端末機に適用するには無理が伴う。
ALEは、上記の適応フィルタを用いる方法を改良したもので、同一のマイクロフォンから得た信号s[n]と d[n]を、ピッチ周期だけの差異を置いて適応フィルタリングする方法である。前記のピッチ周期は音声信号の有声音部分の周期である。
一方、有線信号の場合には、周期的なインパルス列(impulse train)がボーカルトラクト(vocal tract)を励起させる構造となっている。したがって、有声音でALEは最も大きな効果を発揮する。しかし、無声音の場合は、音声の歪みなどの現象が現れる。
次に、ほかの音声品質向上方法のうちの一つである適応コムフィルタを用いる方法について説明する。適応コムフィルタを用いる場合もALEと類似した点があり、有声音により優れた効果を発揮する。有声音の場合に励起信号は周期的な信号であるが、周知のように、インパルス列をフーリエ変換しても、その結果を見ると、周波数領域でインパルス列に現れる。
したがって、有声音の場合、ピッチ周波数の倍となる部分でピークが周期的に現れる形態で構成される。勿論、全体のスペクトルの輪郭は、フォルマントというボーカルトラクトの反響に表示される。
雑音の交った音声を
Figure 0004350690
として表示し、音声を
Figure 0004350690
として表示し、雑音を除去した音声を推定したものを
Figure 0004350690
として表示する場合に、適応コムフィルタによって向上した音声は次の式5のように表される。
(数学式5)
Figure 0004350690
上記の式5で
Figure 0004350690
は抽出されたピッチ手記を表し、
Figure 0004350690
はコムフィルタの係数を表す。
Lの値は通常小さい値(1〜6)を用いる。
一方、適応コムフィルタは、一般的にノイジが周期的ではないため、それを除去するのに効果的である。
しかしながら、上記の従来技術に係る音声品質向上方法を用いるには次のような問題があった。
まず、SSMで
Figure 0004350690
は、音声がない時に雑音から推定する。ところが、その
Figure 0004350690
を信頼性よく測定することができない。即ち、
Figure 0004350690
は、雑音の
Figure 0004350690
が固定された信号であると仮定する場合に推定できる。しかし、実際の場合はそうであるとしても、時間に従ったスペクトルの変化はある。特に、携帯用端末機などの場合は、続けて周辺の環境が変わるので、実質に
Figure 0004350690
を信頼度よく測定することができない。
また、ALEや適応コムフィルタを用いる技法は、有声音より優れた性能を発揮する。
しかし、これらの方法は、有声信号に対してのみ適用可能であり、有声/無線決定が多少外れて無声信号にその方法が適用される場合には、却って性能低下を引き起こす。
また、一部の音声の場合、低周波数では有声特性を現わすが、高周波数では無声特性を現わしたりもする。このような点がALEの性能低下をもたらす。
本発明は上記の問題点を鑑みて案出したもので、無声音での雑音除去を通して音声品質の低下を防ぐのに適した音声品質向上方法及び装置を提供することにある。
他の目的として、ALEとSSMを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。
上記目的を達成するための本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ;前記有声音の雑音を除去するための適応フィルタリングを行うステップ;前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。
より好ましくは、前記有声音の雑音を除去するために、前記適応フィルタリングを用いる適応ライン向上技法(ALE)を行う。ここで、前記適応ライン向上技法(ALE)により、前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を、スペクトルサブトラクションに用いる。
より好ましくは、前記適応フィルタリングは、前記有声音に当たるフレームから抽出したピッチ周期を用いる。
より好ましくは、前記入力音声に対して低域通過フィルタリング及び高域通過フィルタリングを行うステップを更に備える。前記高域通過フィルタリングの出力から雑音を除去するための適応コムフィルタリングを更に行う。ここで、前記適応コムフィルタリングは、
前記高域通過フィルタリングの出力が有声音の場合に行う。また、前記低域通過フィルタリングの出力を、前記有声音と前記無声音とに区分する。
より好ましくは、前記有声音の区間で得た雑音スペクトルデータを前記スペクトルサブトラクションに用いる。ここで、前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値である。
上記目的を達成するための本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分する決定ブロック;前記有声音に対して適応ライン向上技法(ALE)を行うALEブロック;前記無声音に対してスペクトルサブトラクションを行うSSブロックを含んで構成されることを特徴とする。
より好ましくは、前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタ;前記入力音声を高域通過フィルタリングする高域通過フィルタを更に備える。前記高域通過フィルタの出力が有声音の場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタを更に備える。そして、前記適応コムフィルタは、前記有声音から抽出したピッチ周期を用いる。
より好ましくは、前記有声音からピッチ周期を抽出するピッチ抽出器を更に備える。ここで、前記ピッチ抽出器は、前記抽出したピッチ周期をALEブロックに提供する。
より好ましくは、前記SSブロックは、前記ALEブロックで推定した雑音スペクトルを用いる。
より好ましくは、前記SSブロックは、前記ALEブロックによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を用いる。
上記目的を達成するために、本発明は、例えば、以下の手段を提供する。
(項目1)
入力音声を有声音と無声音とに区分するステップ;
前記有声音の雑音を除去するための適応フィルタリングを行うステップ;
前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする音声品質向上方法。
(項目2)
前記有声音の雑音を除去するために、前記適応フィルタリングを用いる適応ライン向上技法(ALE)を行うことを特徴とする項目1に記載の音声品質向上方法。
(項目3)
前記適応ライン向上技法(ALE)により、前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を、スペクトルサブトラクションに用いることを特徴とする項目2に記載の音声品質向上方法。
(項目4)
前記適応フィルタリングは、前記有声音に当たるフレームから抽出したピッチ周期を用いることを特徴とする項目1に記載の音声品質向上方法。
(項目5)
前記入力音声に対して低域通過フィルタリング及び高域通過フィルタリングを行うステップを更に備えることを特徴とする項目1に記載の音声品質向上方法。
(項目6)
前記高域通過フィルタリングの出力から雑音を除去するための適応コムフィルタリングを更に行うことを特徴とする項目5に記載の音声品質向上方法。
(項目7)
前記適応コムフィルタリングは、
前記高域通過フィルタリングの出力が有声音の場合に行うことを特徴とする項目6に記載の音声品質向上方法。
(項目8)
前記低域通過フィルタリングの出力を、前記有声音と前記無声音とに区分することを特徴とする項目5に記載の音声品質向上方法。
(項目9)
前記有声音の区間で得た雑音スペクトルデータを前記スペクトルサブトラクションに用いることを特徴とする項目1に記載の音声品質向上方法。
(項目10)
前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値であることを特徴とする項目9に記載の音声品質向上方法。
(項目11)
入力音声を有声音と無声音とに区分する決定ブロック;
前記有声音に対して適応ライン向上技法(ALE)を行うALEブロック;
前記無声音に対してスペクトルサブトラクションを行うSSブロックを含んで構成されることを特徴とする音声品質向上装置。
(項目12)
前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタ;
前記入力音声を高域通過フィルタリングする高域通過フィルタを更に備えることを特徴とする項目11に記載の音声品質向上装置。
(項目13)
前記高域通過フィルタの出力が有声音の場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタを更に備えることを特徴とする項目12に記載の音声品質向上装置。
(項目14)
前記適応コムフィルタは、
前記有声音から抽出したピッチ周期を用いることを特徴とする項目13に記載の音声品質向上装置。
(項目15)
前記有声音からピッチ周期を抽出するピッチ抽出器を更に備えることを特徴とする項目11に記載の音声品質向上装置。
(項目16)
前記ピッチ抽出器は、前記抽出したピッチ周期をALEブロックに提供することを特徴とする項目15に記載の音声品質向上装置。
(項目17)
前記SSブロックは、前記ALEブロックで推定した雑音スペクトルを用いることを特徴とする項目11に記載の音声品質向上装置。
(項目18)
前記SSブロックは、前記ALEブロックによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を用いることを特徴とする項目11に記載の音声品質向上装置。
本発明によれば、ALEやSSMより優れた性能を期待することができる。本発明は、ピッチ特性が最も強く現れる低周波数成分に対してALEを行った後、再び高周波数の成分が有声音である場合には適応コムフィルタを更に用いるので、低周波数が有声的な特性を有し、高周波数が無声的な特性を有する時にも効果的な性能を発揮する。
本発明は、音声の固有の特徴であるピッチ特性に基づき、音声品質を向上させるので、不分明な雑音などに対して、他の音質向上方法(例えば、ウィンナーフィルタリング(Wiener filtering)或いはSSM)より強い特性を持つ。
以上の本発明は、特に、携帯用端末機で単一のマイクロフォンを用いる時、雑音除去に有用であり、携帯用録音機で雑音を除去しながら録音をするのにも有用である。
また、本発明は、一般の有/無線電話機で雑音を除去するための用途や、その他PDAなどで音声を録音するための用途としても使用可能である。
以下、本発明に係る音声品質向上方法及び装置についての好適な実施例を、添付の図面に基づいて詳細に説明する。
本発明に係る音声品質の向上方法は、有声音に対して所定の音声品質の向上方法を行い、それによって得た雑音スペクトルを用いて、無声音に対するSSMを行う。
まず、図3を参照して、本発明に係る装置の構成を説明する。
図3は本発明に係る音声品質向上装置を説明するための図面である。
図3を参照すると、本発明に係る装置は、入力された音声y[n]を低域通過フィルタリングする低域通過フィルタ(以下、LPF)51と、前記入力された音声y[n]を高域通過フィルタリングする高域通過フィルタ(以下、HPF)50とを備える。
本発明に係る装置は、高周波数成分に対する処理のために、適応コムフィルタ56を備え、低周波数成分に対する処理のために、有声/無声決定ブロック52と、ピッチ抽出機53と、スペクトルサブトラクションブロック55とを備える。また、ALEブロック54をさらに備える。ここで、ALEブロック54の代わりに他の音質向上方法を用いる手段を備えることもできる。
HPF50の出力は適応コムフィルタ56に入力され、LPF51の出力は有声音か無声音かによって互いに異なる経路(ALEを用いる経路とSSMを用いる経路)をとる。
有声/無声決定ブロック52は、LPF51を通過した音声が有声音か無声音かを判断する。有声/無声決定ブロック52の判断結果から、ALEを使用するかSSMを使用するかが決定される。即ち、有声/無声決定ブロック52は、LPF51を通過した音声で無声音に当たるフレームは、SSMを用いるスペクトルサブトラクションブロック55に伝達する。
反面、LPF51を通過した音声で有声音に当たるフレームは、ALEを用いる経路に伝達される。ALEを用いる経路は、ピッチ抽出機53と、ALEブロック54とで構成される。ピッチ抽出機53は、有声音に当たるフレームでピッチ周期を抽出する。そうして、ピッチ抽出機53は、抽出したピッチ周期T0を適応フィルタ56に提供する。
また、ピッチ抽出機53は、抽出した前記ピッチ周期をALEブロック54に提供する。
ALEブロック54は、ピッチ周期をALEに用いて、有声音に当たるフレームに対して音声品質を向上させる。
一方、上述したように、本発明では有声音に当たるフレームに対して音声品質を向上させるための手段として、ALEブロック54を用いたが、これは一つの実施例に過ぎない。
一方、一般的なピッチ周波数が存在する周波数の範囲が50〜400Hzなので、本発明では、前記周波数の範囲に充分に属しながらピッチ周期の影響に最も優れた部分を通過させるように、LPF51のカットオフ周波数を定める。
好ましくは、そのカットオフ周波数は800Hz程度が良い。
上述した本発明の一実施例のとおりALEを適用させると、400Hzから4000Hzまでの範囲と再び結合させ、0〜4kHzの帯域幅を有する音声を得る。
これは、8kHzサンプリングレートの場合であり、そのような場合に対比して、本発明では適応コムフィルタ56を更に用いる。
本発明に係る適応コムフィルタ56は、高周波数でピッチ成分として現れるインパルス列のように見える部分の間にある雑音を除去する。特に、適応コムフィルタ56は、高周波数の成分で有声音に当たる分明な信号が存在する場合にのみ動作する。
一方、SSMを用いるスペクトルサブトラクションブロック55は、有声音の区間で得た雑音スペクトルデータを用いる。即ち、スペクトルサブトラクションブロック55は、ALEブロック54で前の有声音の所定のフレームで推定した雑音スペクトルの平均値を用いる。
言い換えると、前記雑音スペクトルデータは、有声音で雑音スペクトルを得るごとに所定の個数のフレームの雑音スペクトルデータトレインに対する平均を出して得る。
その結果、スペクトルサブトラクションブロック55の出力と、適応コムフィルター56の出力から雑音を除去した音声
Figure 0004350690
を得ることができる。
図4は、本発明に係る音声品質向上の手順を説明するための図面である。
図4を参照すると、所定の音声y[n]が入力されると(S1)、まず、その入力された音声y[n]に対して低域通過フィルタリングS2、及び高域通過フィルタリングS3を行う。
一方、一般的にピッチ周波数が存在する周波数の範囲が50〜400Hzであるため、本発明では前記周波数の範囲に充分に属しながらピッチ周期の影響に最も優れた部分を低域通過フィルタリングさせる。
上記で低域通過フィルタリングのカットオフ周波数は800Hz程度が好ましい。次いで、低域通過フィルタリングの出力が有声音か無声音かを区分する(S4)。
もし、低域通過フィルタリングの出力が有声音であれば、該有声音に当たるフレームに対しては所定の音質向上方法を行う。本発明では、有声音に対する音質向上方法としてALEを適用する。それによって、有声音に当たるフレームに対してALE技法を行う(S6)。
勿論、ALE技法に先立って、有声音に当たるフレームでピッチ周期を抽出する(S5)。
その抽出されたピッチ周期は適応コムフィルタリングのために用いられ、また、ALE技法にも用いられる。
反面、低域通過フィルタリングの出力が無声音であれば、該無声音に当たるフレームに対してはスペクトルサブトラクションを行う(S9)。
スペクトルサブトラクションを行う時は、ALE技法によって前の有声音の所定のフレームで推定した雑音スペクトルの平均値を用いる。即ち、ALE技法によって有声音で雑音スペクトルを得るごとに、所定の個数のフレームの雑音スペクトルデータトレインに対する平均値を用いる。その値が有声音から得た雑音スペクトルデータである。
一方、入力された音声y[n]を高域通過フィルタリングした出力に対しては、該雑音を除去するための適応コムフィルタリングを行う(S8)。この時は低域通過フィルタリングされた出力のうち、有声音から抽出したピッチ周期を適応コムフィルタリングするのに用いる。この際、適応コムフィルタリングに先立ち、高域通過フィルタリングした出力が有声音に当たるかを先に判断した後(S7)、有声音に当たる明らかな信号が存在する時、適応コムフィルタリングを行う。その結果、スペクトルサブトラクションの結果と、適応コムフィルタリングの結果から雑音を除去した音声
Figure 0004350690
を得ることができる。
以上で説明した内容を通じて、当業者であれば本発明の技術思想を逸脱しない範囲で多様な変更および修正が可能なことが分かる。したがって、本発明の技術的な範囲は明細書の詳細な説明に記載された内容に限定されるものではなく、特許請求の範囲によって定められなければならない。
以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、この実施形態に限定して解釈されるべきものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。本明細書において引用した文献は、その内容自体が具体的に本明細書に記載されているのと同様にその内容が本明細書に対する参考として援用されるべきであることが理解される。
無声音での雑音除去を通して音声品質の低下を減らし、特に、ALEとSSMを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。
本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ;前記有声音の雑音を除去するための適応フィルタリングを行うステップ;前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。
一般的なALEを説明するための図面である。 一般的なSSMを説明するための図面である。 本発明に係る音声品質向上装置を説明するための図面である。 本発明に係る音声品質向上の手順を説明するための図面である。

Claims (14)

  1. 入力音声を有声音と無声音とに区分することと、
    前記有声音の雑音を除去するために、前記有声音に対して適応フィルタリングを行うことと、
    前記有声音の雑音を除去するために、前記有声音に対して前記適応フィルタリングを用いる適応ライン向上技法を行うことと、
    前記無声音に対してスペクトルサブトラクションを行うことと
    を含み、
    前記適応ライン向上技法により、前の有声音に対応する所定のフレームから推定された雑音スペクトルの平均値が前記スペクトルサブトラクションに用いられる、音声品質向上する方法。
  2. 前記適応フィルタリングは、前記有声音に対応するフレームから抽出されたピッチ周期を用いる請求項1に記載の方法。
  3. 前記入力音声に対して低域通過フィルタリング高域通過フィルタリングとのうちの少なくとも1つを行うことをさらに含む、請求項1に記載の方法。
  4. 前記高域通過フィルタリングの出力雑音を除去するために前記高域通過フィルタリングの出力に対して適応コムフィルタリングを行うことをさらに含む、請求項に記載の方法。
  5. 前記適応コムフィルタリングは、前記高域通過フィルタリングの出力が有声音に対応する場合に行われる、請求項に記載の方法。
  6. 前記低域通過フィルタリングの出力、前記有声音と前記無声音とに区分される、請求項に記載の方法。
  7. 入力音声を有声音と無声音とに区分することと、
    前記有声音の雑音を除去するために、前記有声音に対して適応フィルタリングを行うことと、
    前記無声音に対してスペクトルサブトラクションを行うことと
    を含み、
    前記有声音の区間から得られた雑音スペクトルデータが前記スペクトルサブトラクションに用いられ、前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に対応する所定のフレームから推定された雑音スペクトルを平均することから得られる値である音声品質向上する方法。
  8. 入力音声を有声音と無声音とに区分する決定ブロックと、
    前記有声音の雑音を除去するために前記有声音に対して適応ライン向上技法を行う適応ライン向上技法(ALEブロックと、
    前記無声音に対してスペクトルサブトラクションを行うスペクトルサブトラクション(SSブロック
    を備え、前記SSブロックは、前記ALEブロックによって前の有声音に対応する所定のフレームから推定された雑音スペクトルの平均値を用いる、音声品質向上する装置。
  9. 前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタと、
    前記入力音声を高域通過フィルタリングする高域通過フィルタ
    をさらに備える請求項に記載の装置。
  10. 前記高域通過フィルタの出力が有声音に対応する場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタをさらに備える請求項に記載の装置。
  11. 前記適応コムフィルタは、前記有声音から抽出されたピッチ周期を用いる請求項10に記載の装置。
  12. 前記有声音からピッチ周期を抽出するピッチ抽出器をさらに備える請求項に記載の装置。
  13. 前記ピッチ抽出器は、前記抽出されたピッチ周期を前記ALEブロックに提供する請求項12に記載の装置。
  14. 音声の品質を向上する方法であって、
    前記方法は、
    入力音声を受信することと、
    前記入力音声に対して高域通過フィルタリングを行うことと、
    前記高域通過フィルタリングの出力が有声音に対応する場合に、前記高域通過フィルタリングの出力に対して適応コムフィルタリングを行うことと、
    前記入力音声に対して低域通過フィルタリングを行うことと、
    前記低域通過フィルタリングの出力が有声音に対応する場合に、前記低域通過フィルタリングの出力に対して前記適応コムフィルタリングを用いる適応ライン向上技法を行うことと、
    前記低域通過フィルタリングの出力が無声音に対応する場合に、前記低域通過フィルタリングの出力に対してスペクトルサブトラクションを行うことと
    を含み、
    前記スペクトルサブトラクションは、前記適応ライン向上技法により、前の有声音に対応する所定のフレームから推定された雑音スペクトルの平均値を用いる、方法。
JP2005258585A 2004-09-07 2005-09-06 音声品質向上方法及び装置 Expired - Fee Related JP4350690B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040071371A KR100640865B1 (ko) 2004-09-07 2004-09-07 음성 품질 향상 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2006079085A JP2006079085A (ja) 2006-03-23
JP4350690B2 true JP4350690B2 (ja) 2009-10-21

Family

ID=36126658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005258585A Expired - Fee Related JP4350690B2 (ja) 2004-09-07 2005-09-06 音声品質向上方法及び装置

Country Status (9)

Country Link
US (1) US7590524B2 (ja)
EP (1) EP1632935B1 (ja)
JP (1) JP4350690B2 (ja)
KR (1) KR100640865B1 (ja)
CN (1) CN100520913C (ja)
AT (1) ATE385027T1 (ja)
BR (1) BRPI0503959A (ja)
DE (1) DE602005004464T2 (ja)
RU (1) RU2391778C2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
US7844453B2 (en) * 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
EP2444966B1 (en) * 2009-06-19 2019-07-10 Fujitsu Limited Audio signal processing device and audio signal processing method
JP5672437B2 (ja) * 2010-09-14 2015-02-18 カシオ計算機株式会社 雑音抑制装置、雑音抑制方法およびプログラム
RU2477533C2 (ru) * 2011-04-26 2013-03-10 Юрий Анатольевич Кропотов Способ многоканального адаптивного подавления акустических шумов и сосредоточенных помех и устройство для его осуществления
JP5898515B2 (ja) * 2012-02-15 2016-04-06 ルネサスエレクトロニクス株式会社 半導体装置及び音声通信装置
KR20150032390A (ko) 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
RU2580796C1 (ru) * 2015-03-02 2016-04-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки
CN104810023B (zh) * 2015-05-25 2018-06-19 河北工业大学 一种用于语音信号增强的谱减法
EP3416167B1 (en) 2017-06-16 2020-05-13 Nxp B.V. Signal processor for single-channel periodic noise reduction
CN112927715B (zh) * 2021-02-26 2024-06-14 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及计算机可读存储介质
CN112700787B (zh) * 2021-03-24 2021-06-25 深圳市中科蓝讯科技股份有限公司 一种降噪方法、非易失性可读存储介质及电子设备
KR102781787B1 (ko) * 2023-05-17 2025-03-17 주식회사 이엠텍 복수의 음향 입력 신호들을 이용한 음향 처리 방법

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4238746A (en) * 1978-03-20 1980-12-09 The United States Of America As Represented By The Secretary Of The Navy Adaptive line enhancer
FR2681715B1 (fr) * 1991-09-25 1994-02-11 Matra Communication Procede de traitement de la parole en presence de bruits acoustiques: procede de soustraction spectrale non lineaire .
FR2697101B1 (fr) * 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
CA2155832C (en) * 1993-02-12 2000-07-18 Philip Mark Crozier Noise reduction
JPH07239696A (ja) 1994-02-28 1995-09-12 Hitachi Ltd 音声認識装置
JPH07283860A (ja) 1994-04-06 1995-10-27 Toshiba Corp ノイズ除去装置
WO1997010586A1 (en) 1995-09-14 1997-03-20 Ericsson Inc. System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP3264831B2 (ja) 1996-06-14 2002-03-11 沖電気工業株式会社 背景雑音消去装置
JP3297307B2 (ja) 1996-06-14 2002-07-02 沖電気工業株式会社 背景雑音消去装置
US5742694A (en) * 1996-07-12 1998-04-21 Eatwell; Graham P. Noise reduction filter
JP4040126B2 (ja) * 1996-09-20 2008-01-30 ソニー株式会社 音声復号化方法および装置
JPH11338499A (ja) 1998-05-28 1999-12-10 Kokusai Electric Co Ltd ノイズキャンセラ
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
AU2001241475A1 (en) 2000-02-11 2001-08-20 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
JP2002175099A (ja) 2000-12-06 2002-06-21 Hioki Ee Corp 雑音抑制方法および雑音抑制装置
DE10118653C2 (de) * 2001-04-14 2003-03-27 Daimler Chrysler Ag Verfahren zur Geräuschreduktion
US7092877B2 (en) * 2001-07-31 2006-08-15 Turk & Turk Electric Gmbh Method for suppressing noise as well as a method for recognizing voice signals
JP2003131401A (ja) * 2001-10-26 2003-05-09 Adtec Engineeng Co Ltd 多層回路基板製造におけるマーキング装置
RU2248619C2 (ru) * 2003-02-12 2005-03-20 Рыболовлев Александр Аркадьевич Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов

Also Published As

Publication number Publication date
US7590524B2 (en) 2009-09-15
KR20060022525A (ko) 2006-03-10
DE602005004464D1 (de) 2008-03-13
CN1746974A (zh) 2006-03-15
EP1632935A1 (en) 2006-03-08
BRPI0503959A (pt) 2007-05-22
RU2005127995A (ru) 2007-03-20
US20060074640A1 (en) 2006-04-06
ATE385027T1 (de) 2008-02-15
RU2391778C2 (ru) 2010-06-10
CN100520913C (zh) 2009-07-29
EP1632935B1 (en) 2008-01-23
KR100640865B1 (ko) 2006-11-02
JP2006079085A (ja) 2006-03-23
DE602005004464T2 (de) 2009-02-19

Similar Documents

Publication Publication Date Title
JP4350690B2 (ja) 音声品質向上方法及び装置
JP4818335B2 (ja) 信号帯域拡張装置
CN106463106B (zh) 用于音频接收的风噪声降低
US20060116873A1 (en) Repetitive transient noise removal
JP2009128906A (ja) 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム
FR2820227A1 (fr) Procede et dispositif de reduction de bruit
KR20070055599A (ko) 잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치
US20170287508A1 (en) Pitch detection algorithm based on pwvt of teager energy operator
US20140177853A1 (en) Sound processing device, sound processing method, and program
US10152986B2 (en) Acoustic processing apparatus, acoustic processing method, and computer program product
JPS5850360B2 (ja) 音声認識装置における前処理方法
US8744846B2 (en) Procedure for processing noisy speech signals, and apparatus and computer program therefor
Nongpiur Impulse noise removal in speech using wavelets
JP5148414B2 (ja) 信号帯域拡張装置
CN103295580A (zh) 一种语音信号噪声抑制方法及装置
KR20150032390A (ko) 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
JP5782402B2 (ja) 音声品質客観評価装置及び方法
JP2005258158A (ja) ノイズ除去装置
CN114613379A (zh) 一种用于消除音频中噪声信号的方法及系统
JP5327735B2 (ja) 信号再生装置
JP2001249674A (ja) 駆動信号分析装置
CN120708640B (zh) 一种语音降噪方法、装置、电子设备及存储介质
JPH1138999A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JPH1138998A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
Krishnamoorthy et al. Processing noisy speech for enhancement

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090722

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130731

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees