JP2007164169A - 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム - Google Patents

高周波数圧縮を通じてスピーチ了解度を改良するためのシステム Download PDF

Info

Publication number
JP2007164169A
JP2007164169A JP2006321499A JP2006321499A JP2007164169A JP 2007164169 A JP2007164169 A JP 2007164169A JP 2006321499 A JP2006321499 A JP 2006321499A JP 2006321499 A JP2006321499 A JP 2006321499A JP 2007164169 A JP2007164169 A JP 2007164169A
Authority
JP
Japan
Prior art keywords
speech
signal
frequency
gain
high frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006321499A
Other languages
English (en)
Other versions
JP2007164169A5 (ja
Inventor
Phillip A Hetherington
エー. ヘザーリントン フィリップ
Xueman Li
リー シュエマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
QNX Software Systems Wavemakers Inc
Original Assignee
QNX Software Systems Wavemakers Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QNX Software Systems Wavemakers Inc filed Critical QNX Software Systems Wavemakers Inc
Publication of JP2007164169A publication Critical patent/JP2007164169A/ja
Publication of JP2007164169A5 publication Critical patent/JP2007164169A5/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】制限された周波数範囲内のスピーチの知覚できる音を改良するシステムを提供すること。
【解決手段】処理されたスピーチの了解度および知覚品質を改良するスピーチ強調システムは、周波数変換器およびスペクトル圧縮器を含む。周波数変換器は、スピーチ信号を時間ドメインから周波数ドメインに変換する。スペクトル圧縮器は、高周波数帯域の予め選択された部分を圧縮し、かつ圧縮された高周波数帯域をより低い帯域制限された周波数範囲にマッピングする。
【選択図】図1

Description

(優先権の主張)
本出願は、2005年4月20日に出願された米国出願第11/110,556号「System for Improving Speech Quality and Intelligibility」の一部継続出願である。上記出願の開示は、参考により本明細書中に援用される。
(技術分野)
本発明は、通信システムに関し、より詳細には、スピーチの了解度を改良するシステムに関する。
(関連技術)
多数の通信デバイスは、スピーチ信号を取得、同化および転送する。スピーチ信号は、通信媒体を介して1つのシステムからもう一方のシステムへと送られる。全ての通信システム、特にワイヤレス通信システムは、帯域幅制限を受ける。一部の電話システムを含む一部のシステムにおいては、音声信号の明確性は、高および低周波数を通過させることができるシステム能力による。多数の低周波数が通信システムの通過帯域にあり得る一方、システムは、一部の無声音の子音にて見い出される高周波数成分を含む高周波数信号をブロックまたは減衰し得る。
一部の通信デバイスは、スペクトルを処理することによってこの高周波数減衰を克服し得る。これらのシステムは、無声音のスピーチを識別および処理するためにスピーチ/サイレンススイッチおよび声音/無声音スイッチを使用し得る。声音と無声音セグメントとの間における遷移を検出するのが困難になり得るため、一部のシステム、特にノイズまたは残響に対して影響を受けやすいシステムは、信頼性がなく、かつリアルタイム処理と使用されない場合もある。一部のシステムにおいては、スイッチは高価であり、スピーチの知覚をひずませるアーティファクトを生成する。
従って、制限された周波数範囲内のスピーチの知覚できる音を改良するシステムが必要である。
スピーチ強調システムは、スピーチ信号の了解度を改良する。システムは、周波数変換器およびスペクトル圧縮器を含む。周波数変換器は、スピーチ信号を時間ドメインから周波数ドメインに変換する。スペクトル圧縮器は、高周波数帯域の予め選択された部分を圧縮し、かつ圧縮された高周波数帯域をより低い帯域制限された周波数範囲にマッピングする。
本発明の他のシステム、方法、特徴、および利点は、以下の図および詳細な説明の考察によって当業者に明らかになるであろう。そのような全ての追加のシステム、方法、特徴、および利点が、この説明に含まれ、本発明の範囲内にあり、上記の特許請求の範囲によって保護されることが意図される。
本発明は、さらに、以下の手段を提供する。
(項目1)
処理されたスピーチの了解度および品質を改良するスピーチシステムであって、該システムは、
スピーチ信号を周波数のスペクトルに変換する周波数変換器と、
該周波数変換器に電気的に結合されているスペクトル圧縮器であって、予め選択された高周波数帯域を圧縮し、かつ該圧縮された高周波数帯域をより低い帯域制限された周波数範囲にマッピングする、スペクトル圧縮器と
を備える、システム。
(項目2)
前記周波数変換器が、ほぼリアルタイムにおいて、前記スピーチ信号をその周波数スペクトルに自動的に変換するようにプログラムされる、項目1に記載のシステム。
(項目3)
前記周波数変換器が、リアルタイムにおいて、前記スピーチ信号を周波数の前記スペクトルに自動的に変換するように、プログラムされるか構成される、項目1に記載のシステム。
(項目4)
前記高周波数帯域が、前記より低い帯域制限された周波数範囲より大きい範囲の周波数を含む、項目1に記載のシステム。
(項目5)
前記スペクトル圧縮器が、非線形圧縮基底関数を含む、項目1に記載のシステム。
(項目6)
前記より低い帯域制限された周波数範囲が、アナログ帯域幅の一部を含む、項目1に記載のシステム。
(項目7)
前記より低い帯域制限された周波数範囲が、電話帯域幅の一部を含む、項目1に記載のシステム。
(項目8)
前記スピーチ信号が検出されたときに存在するノイズのレベルを検出および測定するように構成されるノイズ検出器をさらに備える、項目1に記載のシステム。
(項目9)
前記スピーチ信号が検出されたときに存在するノイズのレベルを検出および推定するように構成されるノイズ検出器をさらに備える、項目1に記載のシステム。
(項目10)
独立した外部信号に関連して前記圧縮された高周波数帯域のゲインを調節するように構成されるゲインコントローラをさらに備える、項目1に記載のシステム。
(項目11)
前記独立した外部信号がバックグラウンドノイズを含む、項目10に記載のシステム。
(項目12)
前記スペクトル圧縮器に結合されるゲインコントローラをさらに備え、該スペクトル圧縮器は、前記より低い帯域制限された周波数範囲において、前記圧縮された高周波数帯域のゲインのみを実質的に調節するように構成される、項目1に記載のシステム。
(項目13)
前記スペクトル圧縮器が、検出されたスピーチ信号から独立した信号によって変化する複数のゲイン調節を適用するように構成される、項目12に記載のシステム。
(項目14)
処理されたスピーチの了解度を改良するスピーチシステムであって、該スピーチシステムは、
スピーチ信号をその周波数ドメインに変換する周波数変換器と、
該周波数変換器に結合されているスペクトル圧縮器であって、予め選択された高周波数帯域を圧縮し、かつ該圧縮された高周波数帯域をより低い周波数帯域にマッピングする、スペクトル圧縮器と、
存在するノイズのレベルを検出および推定するように構成されるノイズ検出器と、
該圧縮された高周波数帯域のゲインを独立した外部信号の変化するレベルに比例して調節するように構成されるゲインコントローラと
を備える、スピーチシステム。
(項目15)
前記スペクトル圧縮器を調整するコントローラをさらに備え、該コントローラは、圧縮された信号の信号−ノイズ比を圧縮される前の信号の信号−ノイズ比と比較するモニタを含む、項目14に記載のスピーチシステム。
(項目16)
前記ゲインコントローラが、前記外部信号の変化するレベルによって変化するゲインを適用するように構成される、項目14に記載のスピーチシステム。
(項目17)
前記ゲインコントローラが、圧縮された信号のレベルが前記独立した外部信号のレベルと実質的に一致するように、可変ゲインを適用するように構成される、項目14に記載のスピーチシステム。
(項目18)
処理されたスピーチの了解度を改良するスピーチシステムであって、該スピーチシステムは、
リアルタイムにおいて、スピーチ信号を時間ドメインから周波数ドメインに変換する周波数変換器と、
該周波数変換器に結合されているスペクトル圧縮器であって、予め選択された高周波数帯域を圧縮し、かつ該圧縮された高周波数帯域を電話通過帯域内のより低い周波数帯域にマッピングする、スペクトル圧縮器と、
スピーチ信号のバックグラウンドノイズレベルを検出および計測するように構成されるノイズ検出器と、
該バックグラウンドノイズのレベルに関連して該圧縮された高周波数帯域に可変ゲインを適用するように構成されるゲインコントローラと
を備える、スピーチシステム。
(項目19)
前記スペクトル圧縮器を通信バスを介して調整するコントローラをさらに備え、該コントローラは、検出されたスピーチ信号の一部の信号−ノイズ比を圧縮された信号の一部の信号−ノイズ比と比較する、項目18に記載のスピーチシステム。
(項目20)
前記コントローラが、周波数ビンの比較を通じて振幅を比較するようにプログラムされる、項目19に記載のスピーチシステム。
(項目21)
前記ゲインコントラーラに結合される自動スピーチ認識システムをさらに備える、項目19に記載のスピーチシステム。
本発明により、制限された周波数範囲内のスピーチの知覚できる音を改良するシステムが提供され得る。
本発明は、以下の図面および説明を参照してより理解され得る。図における構成要素は、縮尺どおりではないが、代わりに、本発明の原理を示すことに対して強調される。更に、図においては、同一の参照番号が異なる図に亘って、対応する部分を指定する。
強調ロジックは、処理されたスピーチの了解度を改良する。ロジックは、処理されるスピーチセグメントを識別および圧縮し得る。選択された音声および/または無声音セグメントは、処理され得、かつ1つ以上の周波数帯域にシフトされ得る。知覚品質を改良するために、適応ゲイン調節は、時間または周波数ドメインにおいて行われ得る。システムは、スピーチセグメントの一部または全体のゲインを調節し得る。システムの多様性は、一部のアプリケーションにおいて第2のシステムにスピーチが送られる前に、ロジックがスピーチを強調することを可能にする。スピーチおよびオーディオは、ワイヤレスに、または時間および/または周波数ドメイン内の音声をキャプチャおよび引き出し得る通信バスを介してAutomatic Speech Recognition(ASR)に送られ得る。
任意の帯域制限されたデバイスは、これらのシステムから利益を受け得る。システムは、任意の帯域制限されたデバイスに埋め込まれ得るか、そのデバイスの基本部分になり得るか、またはそのデバイスにインターフェースするように構成され得る。システムは、航空交通管制デバイス(同様の帯域制限された通過帯域を有し得る)、無線インターコム(互いに通信するクルーまたはユーザのための可動または固定システム、および1つ以上のBluetoothリンクに亘って制限された帯域幅を有し得る、ヘッドセットのような、Bluetooth使用可能デバイスのような無線アプリケーションの一部になり得るか、またはその無線アプリケーションをインターフェースし得る。システムは、車両、商用アプリケーションまたはユーザの家を制御し得るデバイス(例えば、音声制御のような)をインターフェースし得る他の個人的または商用の制限された帯域幅通信システムの一部にもなり得る。
一部の代替として、システムは、他の処理またはシステムに先行し得る。一部のシステムは、強調ロジックの性質を破壊し得る適応フィルタ、他の回路網またはプログラミングを使用し得る。一部のシステムにおいて、強調ロジックは先行し、エコーキャンセラー(例えば、不要音を減衰または実質的に減衰するシステムまたは処理)に結合され得る。エコーが検出または処理された場合、強調ロジックは、自動的にディセーブルまたは緩和され得、後に、エコーの圧縮およびマッピング、ならびに一部の場合においては、ゲイン調節を防ぐためにイネーブルされ得る。システムが先行するか、またはビーム形成器に結合された場合、制御器またはビーム形成器(例えば、信号コンバイナ)は、強調ロジックの動作を制御し得る(例えば、強調ロジックを自動的にイネーブル、ディセーブル、または緩和する)。一部のシステムにおいては、この制御は、マルチパスひずみおよび/または同一チャネル干渉のようなひずみを更に抑制し得る。他のシステムまたはアプリケーションにおいては、強調ロジックは、適合後のシステムまたは処理に結合される。一部のアプリケーションにおいては、強調ロジックは、制御されるか、または不要信号の強調を防ぐか最小化する制御器にインターフェースされる。
図1は、強調ロジック100のブロック図である。強調ロジック100は、1つ以上のオペレーティングシステムにて実行またはそのシステムをインターフェースすることが可能であるハードウェアおよび/またはソフトウェアを含み得る。時間ドメインにおいては、強調ロジック100は、変換ロジックおよび圧縮ロジックを含み得る。図1においては、変換ロジックは、周波数変換器102を含む。周波数変換器102は、入力信号の周波数変換に対して時間を提供する。受け取った際、周波数変換器は、入力信号をその周波数スペクトルに変換するようにプログラムまたは構成される。周波数変換器は、アナログオーディオまたはスピーチ信号を、遅れて、またはリアルタイムで周波数のプログラムされた範囲に変換し得る。一部の周波数変換器102は、通過帯域の外にある周波数を消去、最小化、または鈍らせる(dampening)一方、所定の周波数を選択的に通過させる狭帯域通過フィルタのセットを含み得る。他の強調システム100は、高速フーリエ変換(FFT)に基づくデジタル周波数スペクトルを生成するようにプログラムまたは構成された周波数変換器102を使用する。これらの周波数変換器102は、リアルタイム、ほぼリアルタイム、または遅れた周波数スペクトルを生成するために、選択された範囲または周波数帯域の全体から信号を集め得る。一部の強調システムにおいては、周波数変換器102は、オーディオまたはスピーチ信号を自動的に検出し、周波数のプログラムされた範囲に自動的に変換する。
圧縮ロジックは、スペクトル圧縮デバイスまたはスペクトル圧縮器104を含む。スペクトル圧縮器104は、高周波数範囲内の広い範囲の周波数成分をより低い、および一部の強調システムにおいては、より狭い周波数範囲にマッピングする。図1においては、スペクトル圧縮器104は、選択された高周波数帯域を圧縮し、圧縮された帯域をより低い帯域制限された周波数範囲にマッピングすることによってオーディオまたはスピーチ範囲を処理する。電話帯域幅のような通信帯域を介して送信されたスピーチまたはオーディオ信号に適用された場合、圧縮は、一部の高周波数成分を、電話または通信帯域幅内にある帯域に変換およびマッピングする。一強調システムにおいては、スペクトル圧縮器104は、対象の最高周波数よりほぼ2倍高い、第1の周波数と第2の周波数との間の周波数成分をより短いまたはより小さい帯域制限された範囲にマッピングする。これらの強調システムにおいて、帯域制限された範囲の上側カットオフ周波数は、電話または他の通信帯域幅の上側カットオフ周波数と実質的に一致し得る。
図2において、図1に示されるスペクトル圧縮器104は、指定のカットオフ周波数「A」とナイキスト周波数との間の周波数成分をカットオフ周波数「A」と「B」との間にある帯域制限された範囲に圧縮およびマッピングする。示されるように、約2,800Hzから約5,550Hzの間にある無声音の子音(ここにおいて、文字「S」)の圧縮は、約2,800Hzから約3,600Hzの間に固定される周波数範囲に圧縮およびマッピングされる。カットオフ周波数「A」の下にある周波数成分は、変化されないか、または実質的に変化されない。約0Hzから約3,600Hzの間の帯域幅は、電話システムまたは他の通信システムの帯域幅と一致し得る。他の通信帯域幅と一致する他の周波数範囲も使用され得る。
一部の強調システムによって使用される周波数圧縮スキームの1つは、周波数圧縮を周波数互換と組み合わせる。これらの強調システムにおいては、圧縮された高周波数成分を見出すように強調コントローラがプログラムされ得る。一部の強調システムにおいては、式1が使用される。
ここにおいて、Cは、圧縮された高周波数成分の振幅であり、gはゲイン係数であり、Sはオリジナルスピーチ信号の周波数成分であり、
は圧縮基底関数であり、kは離散周波数インデックスである。任意の形の窓関数が、例えば、三角形、ハニング、ハミング、ガウシアン、ガボール、またはウェーブレットウィンドウを含む非線形圧縮基底関数
として使用され得る一方、図3は、一部の強調システムにて使用される典型的50%の重複基底関数の一群を示す。これらの三角形の基底関数は、より狭い周波数範囲を覆うより低い周波数基底関数およびより広い周波数範囲を覆うより高い周波数基底関数を有する。
周波数成分は次いで、より低い周波数範囲にマッピングされる。一部の強調システムにおいては、強調コントローラは、式2に示される関数に周波数をマッピングするようにプログラムされ得るか、またはそのように構成され得る。
式2においては、
は圧縮されたスピーチ信号の周波数成分であり、fはカットオフ周波数インデックスである。この圧縮スキームに基づいて、カットオフ周波数インデックスfより低いオリジナルスピーチの全ての周波数成分は、変化されないままか、または実質的に変化されない。カットオフ周波数「A」からナイキスト周波数までの周波数成分は、圧縮され、より低い周波数範囲にシフトされる。周波数範囲は、下側カットオフ周波数「A」から、電話または通信通過帯域の上限をも含み得る上側カットオフ周波数「B」まで延びる。この強調システムにおいては、より高い周波数成分は、上側カットオフ周波数「B」に近い周波数より、より高い圧縮率およびより大きい周波数シフトを有す。これらの強調システムは、スピーチ信号の了解度および/または知覚品質を改良する。なぜなら、カットオフ周波数「B」より上の周波数が、正確なスピーチ認識に対して重大になり得るかなりの子音情報を運ぶからである。
実質的に平滑な、および/または実質的に一定の聴覚バックグラウンドを維持するために、適応高周波数ゲイン調節が圧縮された信号に適用され得る。図1においては、ゲインコントローラ106は、ノイズ検出器108を介してリアルタイム、ほぼリアルタイム、またはディレイドタイムにおいて、バックグラウンドノイズ信号のような独立した外部信号を計測または推定することによって、高周波数抵抗制御を圧縮された信号に適用し得る。ノイズ検出器108は、バックグラウンドノイズを検出し、それを計測し得、および/または推定し得る。バックグラウンドノイズは、通信ライン、媒体、ロジック、または回路に固有になり得、および/または音声またはスピーチ信号に対して独立し得る。一部の強調システムにおいては、実質的に一定の識別可能バックグラウンドノイズまたは音は、電話または通信帯域幅の周波数「A」から周波数「B」までのような選択された帯域幅に維持される。
ゲインコントローラ106は、式3に示される関数に従うと、一部のアプリケーションにノイズを含む圧縮されたスペクトル信号のみを増幅および/または減衰するようにプログラムされ得る。式3においては、出力ゲインgは、
によって導き出される。ここにおいて、Nは、入力バックグラウンドノイズの周波数成分である。ゲインを計測されまたは推定されたノイズレベルまで追跡することによって、一部の強調システムは、圧縮されたおよび圧縮されていない帯域幅に亘ってノイズフロアを維持する。図4に示されるように、周波数が圧縮された周波数帯域にて増加するとともに、ノイズがスロープダウンした場合、信号の圧縮された部分は、圧縮前より圧縮後により少ないエネルギーを有し得る。これらの状況において、比例ゲインは、圧縮された信号のスロープを調節するために圧縮された信号に適用され得る。図4において、圧縮された信号のスロープは、圧縮された周波数帯域内のオリジナル信号のスロープに実質的に等しくなるように調節される。一部の強調システムにおいては、ゲインコントローラ106は、図4に示される圧縮された信号を1と等しいまたは1より大きく、圧縮された信号の周波数によって変化する乗数をかける。図4において、圧縮された帯域幅に亘る乗数におけるインクリメンタルな差異は、ポジティブトレンドを有するであろう。
図5に示される圧縮された信号帯域内の増加するバックグラウンドノイズの効果を克服するため、ゲインコントローラ106は、信号の圧縮された部分のゲインを鈍らし得るか、またはそれを減衰し得る。これらの状況において、圧縮された信号の強さは、圧縮された信号のスロープを調節するために鈍らされ、または減衰される。図5において、スロープは、圧縮された周波数帯域内のオリジナル信号のスロープに実質的に等しくなるように調節される。一部の強調システムにおいては、ゲインコントローラ106は、図5に示される圧縮された信号に0より大きく1以下である乗数をかける。図5において、乗数は、圧縮された信号の周波数によって変化する。図5に示される圧縮された帯域幅に亘る乗数におけるインクリメンタルな差異は、ネガティブトレンドを有するであろう。
図6に示されるように、バックグラウンドノイズが所望の帯域幅の全ての周波数に亘って均等またはほぼ均等である場合、ゲインコントローラ106は、圧縮された信号を増幅または鈍らせずに渡す。一部の強調システムにおいて、ゲインコントローラ106はこれらの状況にて使用されないが、入力信号を正規化するプリコンディショニングコントローラが、オリジナル入力スピーチセグメントを生成するためにスピーチ強調システムのフロントエンド上にインターフェースされる。
帯域制限された周波数範囲におけるスピーチ損失を最小化するために、強調システムのカットオフ周波数は、通信システムの帯域幅によって異なり得る。約3,600Hzまでの帯域幅を有する一部の電話システムにおいては、カットオフ周波数は、約2,500Hzから約3,600Hzの間にあり得る。これらのシステムにおいて、最も低いカットオフ周波数の下に少しの圧縮が生じるか、または全く生じない一方、より高い周波数は、より強く圧縮および互換される。結果的に、ピッチを伝える(impart)、または人間の耳によって知覚され得るより低い高調波関係が保存される。
音声強調システムに対する更なる代替は、圧縮されたおよび圧縮されていない信号の信号−ノイズ比(SNR)を解析することによって達成され得る。この代替は、母音の第2のフォルマントピークが約3,200Hzの周波数より低く支配的に位置され、それらのエネルギーがより高い周波数に対して素早く減衰することを認識する。これは、/s/,/f/,/t/および/t∫/のような一部の無声音の子音に対しては、そうでない場合がある。子音を表すエネルギーは、周波数のより高い範囲を覆い得る。一部のシステムにおいては、子音は約3,000Hzから約12,000Hzの間にあり得る。車のような車両にて検出され得る高バックグラウンドノイズが検出された場合、子音は、より低い周波数帯域より、より高い周波数帯域において、より高い信号−ノイズ比を有する傾向があり得る。この代替においては、カットオフ周波数「A」と「B」との間にある圧縮されていない範囲SNRA−B uncompressed内の平均SNRは、コントローラによって、カットオフ周波数「A」と「B」との間にある圧縮されるであろう周波数範囲SNRA−B compressed内の平均SNRと比較される。平均SNRA−B uncompressedが、平均SNRA−B compressedより高くまたはそれと等しい場合、圧縮は生じない。平均SNRA−B uncompressedが、平均SNRA−B compressedより低い場合、圧縮が、一部の場合、ゲイン調節が生じる。この代替A−Bは、周波数帯域を表す。この代替におけるコントローラは、ワイヤレスに、または通信バスのような有形(tangible)通信媒体を介してスペクトル圧縮器104を調整し得るプロセッサを含み得る。
他の代替のスピーチ強調システムおよび方法は、入力信号の各周波数成分の振幅を、スペクトル圧縮器に結合される第2のコントローラを介して同じ周波数帯域内にある圧縮された信号の対応する振幅と比較する。
式4に示されるこの代替においては、カットオフ周波数「A」と「B」との間にある各周波数ビンの振幅は、圧縮されたまたは圧縮されていないスペクトルの高い方のどちらかの振幅になるように選ばれる。
上述されたコントローラ、システムおよび方法の各々は、信号ベアリング媒体、メモリのようなコンピュータ読取可能媒体に符号化され得るか、1つ以上の集積回路のようなデバイス内にプログラムされ得るか、もしくはコントローラまたはコンピュータによって処理され得る。方法がソフトウェアによって実行される場合、ソフトウェアは、スペクトル圧縮器104、ノイズ検出器108、ゲイン調節器106、周波数−時間変換器110に内在するかまたはそれらにインターフェースされるメモリ、もしくはスピーチ強調ロジックにインターフェースされるかまたはそれに内在する任意の種類の不揮発性または揮発性メモリに内在し得る。メモリは、ロジカル機能をインプリメントするための実行可能命令の順序付けられたリスティングを含み得る。ロジカル機能は、デジタル回路網を介して、ソースコードを介して、アナログ回路網を介して、もしくはアナログ電気または光信号を介してのようにアナログソースを介してインプリメントされ得る。ソフトウェアは、命令実行可能システム、装置、またはデバイスによる使用のために、またはそれらに関連して、任意のコンピュータ読取可能または信号ベアリング媒体に組み入れられ得る。そのようなシステムは、コンピュータベースシステム、プロセッサ含有システム、または命令を実行し得る命令実行可能システム、装置、またはデバイスから命令を選択的に取り出し得る他のシステムを含み得る。
「コンピュータ読取可能媒体」、「機械読取可能媒体」、「伝搬信号」媒体、および/または「信号ベアリング媒体」は、命令実行可能システム、装置、またはデバイスによる使用のために、またはそれらに関連して、ソフトウェアを含み、格納し、通信し、伝搬し、または移動させる任意の装置を含み得る。機械読取可能媒体は、電子、磁気、光、電磁、赤外線または半導体システム、装置、デバイス、または伝搬媒体に選択的になり得るが、それらに限定されない。機械読取可能媒体の非網羅的リストの例は、1つ以上のワイヤを有する電気接続「電子」、携帯磁気または光ディスク、ランダムアクセスメモリ「RAM」(電子)、読取専用メモリ「ROM」(電子)、消去可能プログラマブル読取専用メモリ(EPROMまたはフラッシュメモリ)(電子)のような揮発性メモリ、または光ファイバ(光)を含む。ソフトウェアが画像または他の形式(例えば、光スキャンを介して)として電子的に格納され得、コンパイルされ得、および/または解釈され得、他の処理され得る一方、機械読取可能媒体は、ソフトウェアがプリントされた有形媒体をも含み得る。処理された媒体は次いで、コンピュータおよび/または機械メモリに格納され得る。
スピーチ強調ロジック100は、任意の技術またはデバイスに適応できる。図1に示されるように、一部のスピーチ強調システムは、周波数−時間変換器110にインターフェースされるか、またはそれに結合される。周波数−時間変換器110は、信号を周波数ドメインから時間ドメインに変換し得る。一部の時間−周波数変換器は、一部または全ての入力周波数をほぼ同時に処理し得るため、一部の周波数−時間変換器は、リアルタイム、ほぼリアルタイム、またはいくらかの遅れで入力信号を変換するようにプログラムされ得るか、またはそのように構成され得る。一部のスピーチ強調ロジックまたは構成要素は、図8に示されるように(電話ロジックまたは車両制御ロジック単独で組み入れられ得る車両に示される)、リモートまたはローカルASRエンジンをインターフェースするか、それらを結合する。ASRエンジンは、電話およびオーディオ機器を含み得るランドラインおよびワイヤレス通信デバイスのようなリモート配置に送信され得る形式に音声および他の音を変換し、人または物を移動させるデバイスまたは構造(例えば、車両)内部にあり得、またはデバイス内にてスタンドアローンである器具に組み入れられ得る。同様に、スピーチ強調は、図7に示されるように、ASRを備えるまたは備えない車両の外またはその車両にインターフェースされるウォーキートーキー、Bluetooth使用可能デバイス(例えば、ヘッドセット)を含むパーソナル通信デバイスに組み入れられ得る。
スピーチ強調ロジックは、適応可能でもあり、音をワイヤレスにもしくは電気または光接続によって検出および/またはモニタするシステムをインターフェースし得る。所定の音が高周波数帯域内にて検出された場合、システムは、これらの信号の圧縮、マッピング、および一部の場合において、ゲイン調節を防ぐために強調ロジックをディスエーブルし得、ディスエーブルしない場合、その強調ロジックを緩和し得る。通信バスのようなバスを介して、ノイズ検出器は、これらの音の強調を防ぎまたは緩和するために、割込み(ソフトウェア割込みのハードウェア)またはメッセージを送信し得る。これらのアプリケーションにおいて、強調ロジックは、各々が参考により本明細書中に援用される米国出願第11/006,935号の「System for Suppressing Rain Noise」に説明される1つ以上の回路、ロジック、システムまたは方法をインターフェースし得るか、またはそれらに組み入れられ得る。
スピーチ強調ロジックは、スピーチ信号の了解度を改良する。ロジックは、処理されるスピーチセグメントを自動的に識別および圧縮し得る。選択された音声および/または無音声セグメントは処理され得、かつ1つ以上の周波数帯域にシフトされ得る。知覚品質を改良するために、適応ゲイン調節は、時間または周波数ドメイン内にて行われ得る。システムは、感知された信号または推定された信号に基づく一部の調節を用いて、スピーチセグメントの一部のみまたは全てのゲインを調節し得る。システムの多様性は、ロジックが、第2のシステムによってスピーチが渡されまたは処理される前にそのスピーチを強調することを可能にする。一部のアプリケーションにおいては、スピーチまたは他のオーディオ信号は、時間および/または周波数ドメイン内の音声をキャプチャし得、かつ引き出し得るリモート、ローカル、またはモバイルASRエンジンに渡され得る。一部のスピーチ強調システムは、スピーチとサイレンスまたは音声と無音声セグメントの間にてスイッチせず、従って、キーキー、ギャーギャー、チュッチュッ、カチリ、ポタポタ、ポン、低周波数楽音(tones)もしくはスピーチをキャプチャまたは再構成する一部のスピーチシステム内にて生成され得る他の音響アーチファクトにあまり影響されない。
本発明の様々な実施形態が説明される一方、本発明の範囲内にて更なる実施形態およびインプリメンテーションが可能であることが当業者に明らかになるであろう。従って、本発明は、添付の特許請求の範囲およびそれらの均等物の観点から以外には制限されない。
以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、この実施形態に限定して解釈されるべきものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。
処理されたスピーチの了解度および知覚品質を改良するスピーチ強調システムは、周波数変換器およびスペクトル圧縮器を含む。周波数変換器は、スピーチ信号を時間ドメインから周波数ドメインに変換する。スペクトル圧縮器は、高周波数帯域の予め選択された部分を圧縮し、かつ圧縮された高周波数帯域をより低い帯域制限された周波数範囲にマッピングする。
スピーチ強調システムのブロック図である。 圧縮されていないおよび圧縮された信号のグラフである。 基底関数の一群のグラフである。 オリジナル例示的スピーチ信号およびその信号の圧縮された部分のグラフである。 オリジナル例示的スピーチ信号およびその信号の圧縮された部分の第2のグラフである。 オリジナル例示的スピーチ信号およびその信号の圧縮された部分の第3のグラフである。 車両内のスピーチ強調システムおよび/または電話または他の通信デバイスのブロック図である。 車両内の自動スピーチ認識システムおよび/または電話または他の通信デバイスに結合されるスピーチ強調システムのブロック図である。
符号の説明
102 周波数変換器
104 スペクトル圧縮器

Claims (21)

  1. 処理されたスピーチの了解度および品質を改良するスピーチシステムであって、該システムは、
    スピーチ信号を周波数のスペクトルに変換する周波数変換器と、
    該周波数変換器に電気的に結合されているスペクトル圧縮器であって、予め選択された高周波数帯域を圧縮し、かつ該圧縮された高周波数帯域をより低い帯域制限された周波数範囲にマッピングする、スペクトル圧縮器と
    を備える、システム。
  2. 前記周波数変換器が、ほぼリアルタイムにおいて、前記スピーチ信号をその周波数スペクトルに自動的に変換するようにプログラムされる、請求項1に記載のシステム。
  3. 前記周波数変換器が、リアルタイムにおいて、前記スピーチ信号を周波数の前記スペクトルに自動的に変換するように、プログラムされるか構成される、請求項1に記載のシステム。
  4. 前記高周波数帯域が、前記より低い帯域制限された周波数範囲より大きい範囲の周波数を含む、請求項1に記載のシステム。
  5. 前記スペクトル圧縮器が、非線形圧縮基底関数を含む、請求項1に記載のシステム。
  6. 前記より低い帯域制限された周波数範囲が、アナログ帯域幅の一部を含む、請求項1に記載のシステム。
  7. 前記より低い帯域制限された周波数範囲が、電話帯域幅の一部を含む、請求項1に記載のシステム。
  8. 前記スピーチ信号が検出されたときに存在するノイズのレベルを検出および測定するように構成されるノイズ検出器をさらに備える、請求項1に記載のシステム。
  9. 前記スピーチ信号が検出されたときに存在するノイズのレベルを検出および推定するように構成されるノイズ検出器をさらに備える、請求項1に記載のシステム。
  10. 独立した外部信号に関連して前記圧縮された高周波数帯域のゲインを調節するように構成されるゲインコントローラをさらに備える、請求項1に記載のシステム。
  11. 前記独立した外部信号がバックグラウンドノイズを含む、請求項10に記載のシステム。
  12. 前記スペクトル圧縮器に結合されるゲインコントローラをさらに備え、該スペクトル圧縮器は、前記より低い帯域制限された周波数範囲において、前記圧縮された高周波数帯域のゲインのみを実質的に調節するように構成される、請求項1に記載のシステム。
  13. 前記スペクトル圧縮器が、検出されたスピーチ信号から独立した信号によって変化する複数のゲイン調節を適用するように構成される、請求項12に記載のシステム。
  14. 処理されたスピーチの了解度を改良するスピーチシステムであって、該スピーチシステムは、
    スピーチ信号をその周波数ドメインに変換する周波数変換器と、
    該周波数変換器に結合されているスペクトル圧縮器であって、予め選択された高周波数帯域を圧縮し、かつ該圧縮された高周波数帯域をより低い周波数帯域にマッピングする、スペクトル圧縮器と、
    存在するノイズのレベルを検出および推定するように構成されるノイズ検出器と、
    該圧縮された高周波数帯域のゲインを独立した外部信号の変化するレベルに比例して調節するように構成されるゲインコントローラと
    を備える、スピーチシステム。
  15. 前記スペクトル圧縮器を調整するコントローラをさらに備え、該コントローラは、圧縮された信号の信号−ノイズ比を圧縮される前の信号の信号−ノイズ比と比較するモニタを含む、請求項14に記載のスピーチシステム。
  16. 前記ゲインコントローラが、前記外部信号の変化するレベルによって変化するゲインを適用するように構成される、請求項14に記載のスピーチシステム。
  17. 前記ゲインコントローラが、圧縮された信号のレベルが前記独立した外部信号のレベルと実質的に一致するように、可変ゲインを適用するように構成される、請求項14に記載のスピーチシステム。
  18. 処理されたスピーチの了解度を改良するスピーチシステムであって、該スピーチシステムは、
    リアルタイムにおいて、スピーチ信号を時間ドメインから周波数ドメインに変換する周波数変換器と、
    該周波数変換器に結合されているスペクトル圧縮器であって、予め選択された高周波数帯域を圧縮し、かつ該圧縮された高周波数帯域を電話通過帯域内のより低い周波数帯域にマッピングする、スペクトル圧縮器と、
    スピーチ信号のバックグラウンドノイズレベルを検出および計測するように構成されるノイズ検出器と、
    該バックグラウンドノイズのレベルに関連して該圧縮された高周波数帯域に可変ゲインを適用するように構成されるゲインコントローラと
    を備える、スピーチシステム。
  19. 前記スペクトル圧縮器を通信バスを介して調整するコントローラをさらに備え、該コントローラは、検出されたスピーチ信号の一部の信号−ノイズ比を圧縮された信号の一部の信号−ノイズ比と比較する、請求項18に記載のスピーチシステム。
  20. 前記コントローラが、周波数ビンの比較を通じて振幅を比較するようにプログラムされる、請求項19に記載のスピーチシステム。
  21. 前記ゲインコントラーラに結合される自動スピーチ認識システムをさらに備える、請求項19に記載のスピーチシステム。
JP2006321499A 2005-12-09 2006-11-29 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム Withdrawn JP2007164169A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/298,053 US8086451B2 (en) 2005-04-20 2005-12-09 System for improving speech intelligibility through high frequency compression

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011020254A Division JP5463306B2 (ja) 2005-12-09 2011-02-01 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム

Publications (2)

Publication Number Publication Date
JP2007164169A true JP2007164169A (ja) 2007-06-28
JP2007164169A5 JP2007164169A5 (ja) 2007-08-09

Family

ID=37719203

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006321499A Withdrawn JP2007164169A (ja) 2005-12-09 2006-11-29 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム
JP2011020254A Active JP5463306B2 (ja) 2005-12-09 2011-02-01 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011020254A Active JP5463306B2 (ja) 2005-12-09 2011-02-01 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム

Country Status (6)

Country Link
US (2) US8086451B2 (ja)
EP (2) EP1796082A1 (ja)
JP (2) JP2007164169A (ja)
KR (1) KR100843926B1 (ja)
CN (1) CN101030382A (ja)
CA (1) CA2569221C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2013136742A1 (ja) * 2012-03-14 2015-08-03 パナソニックIpマネジメント株式会社 車載通話装置

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
KR101414233B1 (ko) * 2007-01-05 2014-07-02 삼성전자 주식회사 음성 신호의 명료도를 향상시키는 장치 및 방법
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
KR100876794B1 (ko) * 2007-04-03 2009-01-09 삼성전자주식회사 이동 단말에서 음성의 명료도 향상 장치 및 방법
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
EP2211339B1 (en) 2009-01-23 2017-05-31 Oticon A/s Listening system
EP2372707B1 (en) 2010-03-15 2013-03-13 Svox AG Adaptive spectral transformation for acoustic speech signals
JP2012103395A (ja) 2010-11-09 2012-05-31 Sony Corp 符号化装置、符号化方法、およびプログラム
US20120197643A1 (en) * 2011-01-27 2012-08-02 General Motors Llc Mapping obstruent speech energy to lower frequencies
US20150281853A1 (en) * 2011-07-11 2015-10-01 SoundFest, Inc. Systems and methods for enhancing targeted audibility
CN102291496B (zh) * 2011-09-06 2013-08-07 华为终端有限公司 终端的通话方法及使用该通话方法的终端
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
CN104981870B (zh) * 2013-02-22 2018-03-20 三菱电机株式会社 声音增强装置
US9060223B2 (en) 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
US20140278415A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Voice Recognition Configuration Selector and Method of Operation Therefor
US9084050B2 (en) * 2013-07-12 2015-07-14 Elwha Llc Systems and methods for remapping an audio range to a human perceivable range
CN104681032B (zh) * 2013-11-28 2018-05-11 中国移动通信集团公司 一种语音通信方法和设备
CN106340306A (zh) * 2016-11-04 2017-01-18 厦门盈趣科技股份有限公司 一种提高语音识别度的方法及装置
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
TWI588819B (zh) * 2016-11-25 2017-06-21 元鼎音訊股份有限公司 語音處理之方法、語音通訊裝置及其電腦程式產品
CN108461081B (zh) * 2018-03-21 2020-07-31 北京金山安全软件有限公司 语音控制的方法、装置、设备和存储介质
TWI662544B (zh) * 2018-05-28 2019-06-11 塞席爾商元鼎音訊股份有限公司 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置
CN110570875A (zh) * 2018-06-05 2019-12-13 塞舌尔商元鼎音讯股份有限公司 检测环境噪音以改变播放语音频率的方法及声音播放装置
IT201900016328A1 (it) * 2019-09-13 2021-03-13 Elenos S R L Metodo per la misurazione e la visualizzazione del rapporto segnale/rumore audio

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002244686A (ja) * 2001-02-13 2002-08-30 Hitachi Ltd 音声加工方法、これを用いた電話機及び中継局
JP2004521574A (ja) * 2001-06-28 2004-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 知覚的な低周波増強を備えた狭帯域音声信号伝送システム
JP2004524560A (ja) * 2001-01-24 2004-08-12 クゥアルコム・インコーポレイテッド 広帯域信号の狭帯域信号への強化された変換
WO2005015952A1 (en) * 2003-08-11 2005-02-17 Vast Audio Pty Ltd Sound enhancement for hearing-impaired listeners

Family Cites Families (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1424133A (en) 1972-02-24 1976-02-11 Int Standard Electric Corp Transmission of wide-band sound signals
US4130734A (en) 1977-12-23 1978-12-19 Lockheed Missiles & Space Company, Inc. Analog audio signal bandwidth compressor
US4255620A (en) * 1978-01-09 1981-03-10 Vbc, Inc. Method and apparatus for bandwidth reduction
US4170719A (en) * 1978-06-14 1979-10-09 Bell Telephone Laboratories, Incorporated Speech transmission system
US4419544A (en) * 1982-04-26 1983-12-06 Adelman Roger A Signal processing apparatus
US4374304A (en) 1980-09-26 1983-02-15 Bell Telephone Laboratories, Incorporated Spectrum division/multiplication communication arrangement for speech signals
FR2494988B1 (fr) 1980-11-28 1985-07-05 Lafon Jean Claude Perfectionnements aux dispositifs de prothese auditive
US4343005A (en) * 1980-12-29 1982-08-03 Ford Aerospace & Communications Corporation Microwave antenna system having enhanced band width and reduced cross-polarization
US4454609A (en) * 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
GB2124456A (en) * 1982-01-26 1984-02-15 Bloy Graham P System for maximum efficient transfer of modulated energy
JPS59122135A (ja) 1982-12-28 1984-07-14 Fujitsu Ltd 音声圧縮伝送方式
US4600902A (en) * 1983-07-01 1986-07-15 Wegener Communications, Inc. Compandor noise reduction circuit
US4700360A (en) * 1984-12-19 1987-10-13 Extrema Systems International Corporation Extrema coding digitizing signal processing method and apparatus
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
EP0305603B1 (en) * 1987-09-03 1993-03-10 Koninklijke Philips Electronics N.V. Gain and phase correction in a dual branch receiver
JPH03136100A (ja) * 1989-10-20 1991-06-10 Canon Inc 音声処理方法及び装置
JP3137995B2 (ja) 1991-01-31 2001-02-26 パイオニア株式会社 Pcmディジタルオーディオ信号再生装置
KR940006623B1 (ko) * 1991-02-01 1994-07-23 삼성전자 주식회사 영상신호 처리 시스템
US5416787A (en) * 1991-07-30 1995-05-16 Kabushiki Kaisha Toshiba Method and apparatus for encoding and decoding convolutional codes
US5396414A (en) * 1992-09-25 1995-03-07 Hughes Aircraft Company Adaptive noise cancellation
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JPH0775339B2 (ja) 1992-11-16 1995-08-09 株式会社小電力高速通信研究所 音声符号化方法及び装置
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3396506B2 (ja) 1993-04-09 2003-04-14 東光株式会社 音声信号の圧縮装置と伸張装置
US5345200A (en) * 1993-08-26 1994-09-06 Gte Government Systems Corporation Coupling network
JP2570603B2 (ja) 1993-11-24 1997-01-08 日本電気株式会社 音声信号伝送装置およびノイズ抑圧装置
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
US5497090A (en) * 1994-04-20 1996-03-05 Macovski; Albert Bandwidth extension system using periodic switching
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
EP0706299B1 (en) 1994-10-06 2004-12-01 Fidelix Y.K. A method for reproducing audio signals and an apparatus therefor
US5828756A (en) * 1994-11-22 1998-10-27 Lucent Technologies Inc. Stereophonic acoustic echo cancellation using non-linear transformations
JPH08321792A (ja) 1995-05-26 1996-12-03 Tohoku Electric Power Co Inc 音声信号帯域圧縮伝送方法
US5774841A (en) * 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US5790671A (en) * 1996-04-04 1998-08-04 Ericsson Inc. Method for automatically adjusting audio response for improved intelligibility
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5771299A (en) * 1996-06-20 1998-06-23 Audiologic, Inc. Spectral transposition of a digital audio signal
AU3690197A (en) 1996-08-02 1998-02-25 Universite De Sherbrooke Speech/audio coding with non-linear spectral-amplitude transformation
JPH10124098A (ja) 1996-10-23 1998-05-15 Kokusai Electric Co Ltd 音声処理装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US6275596B1 (en) * 1997-01-10 2001-08-14 Gn Resound Corporation Open ear canal hearing aid system
US6115363A (en) * 1997-02-19 2000-09-05 Nortel Networks Corporation Transceiver bandwidth extension using double mixing
KR100316769B1 (ko) 1997-03-12 2002-01-15 윤종용 오디오 부호화/복호화 장치 및 방법
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6577739B1 (en) 1997-09-19 2003-06-10 University Of Iowa Research Foundation Apparatus and methods for proportional audio compression and frequency shifting
DE69836785T2 (de) * 1997-10-03 2007-04-26 Matsushita Electric Industrial Co., Ltd., Kadoma Audiosignalkompression, Sprachsignalkompression und Spracherkennung
US6154643A (en) * 1997-12-17 2000-11-28 Nortel Networks Limited Band with provisioning in a telecommunications system having radio links
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
US6157682A (en) * 1998-03-30 2000-12-05 Nortel Networks Corporation Wideband receiver with bandwidth extension
KR100269216B1 (ko) * 1998-04-16 2000-10-16 윤종용 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
US6295322B1 (en) * 1998-07-09 2001-09-25 North Shore Laboratories, Inc. Processing apparatus for synthetically extending the bandwidth of a spatially-sampled video image
US6504935B1 (en) * 1998-08-19 2003-01-07 Douglas L. Jackson Method and apparatus for the modeling and synthesis of harmonic distortion
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6195394B1 (en) * 1998-11-30 2001-02-27 North Shore Laboratories, Inc. Processing apparatus for use in reducing visible artifacts in the display of statistically compressed and then decompressed digital motion pictures
US6144244A (en) * 1999-01-29 2000-11-07 Analog Devices, Inc. Logarithmic amplifier with self-compensating gain for frequency range extension
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
SE517525C2 (sv) 1999-09-07 2002-06-18 Ericsson Telefon Ab L M Förfarande och anordning för konstruktion av digitala filter
FI19992350A (fi) * 1999-10-29 2001-04-30 Nokia Mobile Phones Ltd Parannettu puheentunnistus
EP1147515A1 (en) * 1999-11-10 2001-10-24 Koninklijke Philips Electronics N.V. Wide band speech synthesis by means of a mapping matrix
US7027981B2 (en) * 1999-11-29 2006-04-11 Bizjak Karl M System output control method and apparatus
JP2001196934A (ja) 2000-01-05 2001-07-19 Yamaha Corp 音声信号帯域圧縮回路
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
JP3576941B2 (ja) 2000-08-25 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US7173961B2 (en) * 2000-08-31 2007-02-06 Nokia Corporation Frequency domain partial response signaling with high spectral efficiency and low peak to average power ratio
AU2001285936A1 (en) * 2000-09-08 2002-03-22 Koninklijke Philips Electronics N.V. Audio signal processing with adaptive noise-shaping modulation
KR20020024742A (ko) 2000-09-26 2002-04-01 김대중 비선형 방법에 의한 음성신호의 특징 추출 장치 및 그 방법
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
EP1211671A3 (en) * 2000-11-16 2003-09-10 Alst Innovation Technologies Automatic gain control with noise suppression
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6741966B2 (en) * 2001-01-22 2004-05-25 Telefonaktiebolaget L.M. Ericsson Methods, devices and computer program products for compressing an audio signal
US7076316B2 (en) * 2001-02-02 2006-07-11 Nortel Networks Limited Method and apparatus for controlling an operative setting of a communications link
AUPR438601A0 (en) * 2001-04-11 2001-05-17 Cochlear Limited Variable sensitivity control for a cochlear implant
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP2004521394A (ja) * 2001-06-28 2004-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 広帯域信号伝送システム
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
FR2831717A1 (fr) * 2001-10-25 2003-05-02 France Telecom Methode et systeme d'elimination d'interference pour antenne multicapteur
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
US7630507B2 (en) * 2002-01-28 2009-12-08 Gn Resound A/S Binaural compression system
US7689406B2 (en) * 2002-03-08 2010-03-30 Koninklijke Kpn. N.V. Method and system for measuring a system's transmission quality
JP2003280691A (ja) * 2002-03-19 2003-10-02 Sanyo Electric Co Ltd 音声処理方法および音声処理装置
US7613310B2 (en) * 2003-08-27 2009-11-03 Sony Computer Entertainment Inc. Audio input system
US20040022404A1 (en) * 2002-07-30 2004-02-05 Ryuichi Negishi Sound processing apparatus and hearing aid
CA2469674C (en) * 2002-09-19 2012-04-24 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
US7062040B2 (en) * 2002-09-20 2006-06-13 Agere Systems Inc. Suppression of echo signals and the like
US7430300B2 (en) * 2002-11-18 2008-09-30 Digisenz Llc Sound production systems and methods for providing sound inside a headgear unit
US7248711B2 (en) * 2003-03-06 2007-07-24 Phonak Ag Method for frequency transposition and use of the method in a hearing device and a communication device
US20040175010A1 (en) * 2003-03-06 2004-09-09 Silvia Allegro Method for frequency transposition in a hearing device and a hearing device
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
EP1494208A1 (en) * 2003-06-30 2005-01-05 Harman Becker Automotive Systems GmbH Method for controlling a speech dialog system and speech dialog system
US7333618B2 (en) * 2003-09-24 2008-02-19 Harman International Industries, Incorporated Ambient noise sound level compensation
US7580531B2 (en) * 2004-02-06 2009-08-25 Cirrus Logic, Inc Dynamic range reducing volume control
US7415117B2 (en) * 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US7856240B2 (en) * 2004-06-07 2010-12-21 Clarity Technologies, Inc. Distributed sound enhancement
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
WO2006046761A1 (ja) * 2004-10-27 2006-05-04 Yamaha Corporation ピッチ変換装置
KR100842590B1 (ko) * 2004-11-09 2008-07-01 삼성전자주식회사 이동 단말에서 음향 반향 제거 방법 및 장치
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8275120B2 (en) * 2006-05-30 2012-09-25 Microsoft Corp. Adaptive acoustic echo cancellation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004524560A (ja) * 2001-01-24 2004-08-12 クゥアルコム・インコーポレイテッド 広帯域信号の狭帯域信号への強化された変換
JP2002244686A (ja) * 2001-02-13 2002-08-30 Hitachi Ltd 音声加工方法、これを用いた電話機及び中継局
JP2004521574A (ja) * 2001-06-28 2004-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 知覚的な低周波増強を備えた狭帯域音声信号伝送システム
WO2005015952A1 (en) * 2003-08-11 2005-02-17 Vast Audio Pty Ltd Sound enhancement for hearing-impaired listeners

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2013136742A1 (ja) * 2012-03-14 2015-08-03 パナソニックIpマネジメント株式会社 車載通話装置

Also Published As

Publication number Publication date
US8086451B2 (en) 2011-12-27
CN101030382A (zh) 2007-09-05
CA2569221C (en) 2013-02-19
JP5463306B2 (ja) 2014-04-09
CA2569221A1 (en) 2007-06-09
KR100843926B1 (ko) 2008-07-03
EP1796082A1 (en) 2007-06-13
JP2011141551A (ja) 2011-07-21
US8219389B2 (en) 2012-07-10
EP3089162B1 (en) 2018-01-31
EP3089162A1 (en) 2016-11-02
KR20070061360A (ko) 2007-06-13
US20120095759A1 (en) 2012-04-19
US20060241938A1 (en) 2006-10-26

Similar Documents

Publication Publication Date Title
JP5463306B2 (ja) 高周波数圧縮を通じてスピーチ了解度を改良するためのシステム
US8249861B2 (en) High frequency compression integration
US9361901B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
KR100860805B1 (ko) 음성 강화 시스템
EP2056296B1 (en) Dynamic noise reduction
EP2283484B1 (en) System and method for dynamic sound delivery
EP2244254B1 (en) Ambient noise compensation system robust to high excitation noise
JP4981123B2 (ja) オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整
US8200499B2 (en) High-frequency bandwidth extension in the time domain
JP5453740B2 (ja) 音声強調装置
EP1450353A1 (en) System for suppressing wind noise
KR20070000987A (ko) 음성 신호의 적응성 개선을 위한 시스템
US20110054889A1 (en) Enhancing Receiver Intelligibility in Voice Communication Devices
KR20080090002A (ko) 이동 단말에서 음성의 명료도 향상 장치 및 방법
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
KR20070022206A (ko) 오디오 신호 처리를 위한 시스템

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110201

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110201

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110201

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110411

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20110708

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110810