JP2014524593A - 適応音声了解度プロセッサ - Google Patents
適応音声了解度プロセッサ Download PDFInfo
- Publication number
- JP2014524593A JP2014524593A JP2014523980A JP2014523980A JP2014524593A JP 2014524593 A JP2014524593 A JP 2014524593A JP 2014523980 A JP2014523980 A JP 2014523980A JP 2014523980 A JP2014523980 A JP 2014523980A JP 2014524593 A JP2014524593 A JP 2014524593A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- enhancement
- speech
- input
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Abstract
Description
この出願は、その全てを参照することによりここにその開示が組み込まれている、2011年7月29日出願、米国仮特許出願61/513,298号、発明の名称「Adaptive Voice Intelligibility Processor」に、米国合衆国法典第35部第119条の下、優先権を主張する。
ある実施形態では、音声了解度エンハンスメントを調整する方法は、入力音声信号を受信することと、リニア予測符号化(LPC)処理で入力音声信号のスペクトル表現を取得することを含む。スペクトル表現は、1つ以上のホルマント周波数を含むことができる。方法は、1つ以上のホルマント周波数を強調するように構成されたエンハンスメントフィルタを作り出すために、1つ以上のプロセッサで入力音声信号のスペクトル表現を調整することを含む。加えて、方法は、向上されたホルマント周波数で、修正された音声信号を作り出すために入力音声信号の表現に対するエンハンスメントフィルタを適用すること、入力音声信号に基づく包絡線を検出すること、1つ以上の時間的エンハンスメントパラメータを決定するために修正された音声信号の包絡線を分析することを含むことができる。更に、方法は、出力音声信号を作り出すために修正された音声信号に対する1つ以上の時間的エンハンスメントパラメータを適用することを含むことができる。少なくとも、1つ以上の時間的エンハンスメントパラメータを適用することは、1つ以上のプロセッサにより実行されることができる。
既存の音声了解度システムは、ある母音と自鳴音子音に対応するスピーカーの音声和音により生成された共鳴周波数を含むことがある、スピーチ中のホルマントを強調するよう試みる。これら既存のシステムは、一般的には、ホルマントが生じると見込まれる異なる固定された周波数帯域で、ホルマントを強調する帯域通過フィルタを有するフィルタバンクを用いる。このアプローチにおける問題は、ホルマントロケーションが、異なる個人で異なることがあることである。さらに、所与の個人のホルマントロケーションは、時間と共に変化することもある。依って、固定された帯域通過フィルタが、所与の個人のホルマント周波数とは異なる周波数を強調するかもしれず、音声了解度に障害をもたらすことになる。
図1は、音声エンハンスメントシステム110を実現することができる移動電話環境100の実施形態を図示している。音声エンハンスメントシステム110は、音声入力信号102の了解度を増加させるためのハードウェア及び/またはソフトウェアを含むことができる。例えば、音声エンハンスメントシステム110は、(例えば破裂音、摩擦音を含む子音のような)非音声の(non-vocal)サウンドと同様にホルマントのような音声のサウンドの顕著な特徴を強調する音声エンハンスメントで、音声入力信号102を処理することができる。
図3を参照すると、適応音声エンハンスメントモジュール320の実施形態が示されている。適応音声エンハンスメントモジュール320は、図2の適応音声エンハンスメントモジュール220のさらなる詳細な実施形態である。従って、適応音声エンハンスメントモジュール320は、音声エンハンスメントシステム110または210のどちらかにより実現されることができる。それに応じて、適応音声エンハンスメントモジュール320は、ソフトウェア及び/またはハードウェアで実現されることができる。適応音声エンハンスメントモジュール320は、有利には、適応してホルマントのような有声のスピーチを追跡することができ、非有声のスピーチを時間的に向上させることもできる。
図3における全極フィルタ326により修正された音声信号または図5におけるコンバイナ528による出力としての音声信号は、いくつかの実施形態において、時間的包絡線整形器332に提供されることができる。時間的包絡線整形器332は、時間領域において時間的包絡線整形を介して非有声のスピーチ(瞬間的スピーチを含む)を向上することができる。1つの実施形態では、時間的包絡線整形器332は、おおよそ3kHzを下回る(オプション的に低周波数を上回る)周波数を含む中間域周波数を向上させる。時間的包絡線整形器332は、同様に、中間域周波数とは他の周波数を向上してもよい。
図9は、音声検出処理900の実施形態を図示している。ノイズ検出処理900は、上述された音声エンハンスメントシステム110、210のどちらかにより実現されることができる。1つの実施形態では、ノイズ検出処理900は、音声アクティビティ検出器212により実現されている。
図10は、マイクロフォンキャリブレーション処理1000の実施形態を図示している。マイクロフォンキャリブレーション処理1000は、上述された音声エンハンスメントシステム110、210のどちらかにより、少なくとも一部実現されることができる。1つの実施形態では、マイクロフォンキャリブレーション処理1000は、マイクロフォンキャリブレーションモジュール234により少なくとも一部実現される。示されたように、処理1000の部分は、実験室(LAB)またはデザイン施設で実現されることができ、同時に、処理1000のの残りは、音声エンハンスメントシステム110または210を組み込んでいるデバイスの製造者の施設のようなところのフィールド(FIELD)で実現されることができる。
ここに記述されたバリエーションとは別の多くのバリエーションが、この開示から明白となるだろう。例えば、実施形態に依存し、ここに記述されているアルゴリズムのいずれかのある動作(act)、イベントまたは機能は、異なるシーケンスで実行されることができ、全体として追加され、併合され、または、除外されることもできる(例えば、記載されている動作またはイベントの全てがアルゴリスムの実践に必要というわけではない)。さらに、ある実施形態では、動作またはイベントは、例えば、マルチスレッド処理、割り込み処理、または、複数のプロセッサまたはプロセッサコアを通して、または、他のパラレルアーキテクチャ上で、シーケンシャルというよりむしろ、同時に実行されることができる。加えて、異なるタスクまたは処理は、一緒に機能することができる異なる機械及び/またはコンピューティングシステムによって実行されることができる。
Claims (20)
- 音声了解度エンハンスメントを調整する方法であって、前記方法は、
入力音声信号を受信することと、
リニア予測符号化(LPC)処理で前記入力音声信号のスペクトル表現を取得することと、前記スペクトル表現は、1つ以上のホルマント周波数を備え、
前記1つ以上のホルマント周波数を強調するように構成されたエンハンスメントフィルタを作り出すために、1つ以上のプロセッサで前記入力音声信号の前記スペクトル表現を調整することと、
向上されたホルマント周波数で修正された音声信号を作り出すために前記エンハンスメントフィルタを前記入力音声信号の表現に適用することと、
前記入力音声信号に基づいて包絡線を検出することと、
1つ以上の時間的エンハンスメントパラメータを決定するために前記修正された音声信号の前記包絡線を分析することと、
出力音声信号を作り出すために前記修正された音声信号に対する前記1つ以上の時間的エンハンスメントパラメータを適用することとを備え、
少なくとも前記1つ以上の時間的エンハンスメントパラメータを適用することは、1つ以上のプロセッサにより実行される方法。 - 前記修正された音声信号に1つ以上の時間的エンハンスメントパラメータを適用することは、前記修正された音声信号における選択された子音を強調するために、前記修正された音声信号の前記1つ以上の包絡線におけるピークを鋭利にすることを備える、請求項1記載の方法。
- 前記包絡線を検出することは、前記入力音声信号及び前記修正された音声信号の1つ以上の包絡線を検出することを備える、請求項1記載の方法。
- 前記エンハンスメントフィルタを前記入力音声信号の前記表現に適用することが、前記エンハンスメントフィルタを励起信号に適用することを備えるように、前記励起信号を作り出すために、前記入力音声信号に逆フィルタを適用することをさらに備える、請求項1記載の方法。
- 音声了解度エンハンスメントを調整するためのシステムであって、前記システムは、
入力オーディオ信号の少なくとも一部分のスペクトル表現を取得するように構成された分析モジュールと、前記スペクトル表現は1つ以上のホルマント周波数を備え、
前記1つ以上のホルマント周波数を強調するように構成されたエンハンスメントフィルタを生成するように構成されたホルマントエンハンスメントモジュールと、
前記エンハンスメントフィルタは、修正された音声信号を作り出すために1つ以上のプロセッサで前記入力オーディオ信号の表現に適用されるように構成され、
時間的エンハンスメントを前記修正された音声信号の1つ以上の包絡線に少なくとも一部基づいて前記修正された音声信号に適用するように構成された時間的包絡線整形器とを備えるシステム。 - 前記分析モジュールは、前記スペクトル表現に対応する係数を生成するように構成されたリニア予測符号化技術を使用して、前記入力オーディオ信号の前記スペクトル表現を取得するようにさらに構成された、請求項5記載の方法。
- 線スペクトル対に前記係数をマップするように構成されたマッピングモジュールをさらに備える、請求項6記載の方法。
- 前記ホルマント周波数に対応する前記スペクトル表現において利得を増加させるために前記線スペクトル対を修正することをさらに備える、請求項7記載の方法。
- 前記エンハンスメントフィルタは、前記入力オーディオ信号及び前記入力オーディオ信号から導きだされた励起信号の1つ以上に適用されるようにさらに構成された、請求項5記載の方法。
- 前記時間的な包絡線整形器は、修正された音声信号を複数の帯域に細分するようにさらに構成され、前記1つ以上の包絡線は、少なくともいくつかの前記複数の帯域のための包絡線に対応する、請求項5記載の方法。
- 入力マイクロフォン信号における検出された環境ノイズの量に少なくとも部分的に基づいて前記エンハンスメントフィルタの利得を調整するように構成された音声エンハンスメントコントローラをさらに備える、請求項5記載の方法。
- 前記入力マイクロフォン信号における音声を検出し、前記検出された音声に応答する前記音声エンハンスメントコントローラを制御するように構成された音声アクティビティ検出器をさらに含む、請求項11記載の方法。
- 前記音声アクティビティ検出器は、前記音声エンハンスメントコントローラに、前記入力マイクロフォン信号において音声検出に応答し先のノイズ入力に基づいて前記エンハンスメントフィルタの前記利得を調整させるようにさらに構成された、請求項12記載の方法。
- 前記入力マイクロフォン信号を受信するように構成されたマイクロフォンの利得をセットするように構成されたマイクロフォンキャリブレーションモジュールをさらに備え、前記マイクロフォンキャリブレーションモジュールは、参照信号及び記録されたノイズ信号に少なくとも一部基づいて、前記利得をセットするようにさらに構成された、請求項11記載の方法。
- 音声了解度エンハンスメントを調整するためのシステムであって、前記システムは、
入力音声信号のスペクトルに対応するLPC係数を取得するためにリニア予測符号化(LPC)技術を適用するように構成されたリニア予測符号化分析モジュールと、前記スペクトルは、1つ以上のホルマント周波数を備え、
前記LPC係数を線スペクトル対にマップするように構成されたマッピングモジュールと、
1つ以上のプロセッサを備えるホルマントエンハンスメントモジュールとを備え、前記ホルマントエンハンスメントモジュールは、前記線スペクトル対を修正し、それにより前記入力音声信号の前記スペクトルを調整し、前記1つ以上のホルマント周波数を強調するように構成されたエンハンスメントフィルタを作り出すように構成され、
前記エンハンスメントフィルタは、修正された音声信号を作り出すために前記入力音声信号の表現に適用されるように構成された、システム。 - 入力マイクロフォン信号における音声を検出し、前記エンハンスメントフィルタの利得が前記入力マイクロフォン信号における音声検出に応答し調整されるように構成された音声アクティビティ検出器をさらに備える、請求項15記載のシステム。
- 前記入力マイクロフォン信号を受信するように構成されたマイクロフォンの利得をセットするように構成されたマイクロフォンキャリブレーションモジュールをさらに備え、前記マイクロフォンキャリブレーションモジュールは、参照信号及び記録されたノイズ信号に少なくとも一部基づいて、前記利得をセットするようにさらに構成された、請求項16記載のシステム。
- 前記エンハンスメントフィルタは、前記入力音声信号及び前記入力音声信号から導きだされた励起信号の1つ以上に適用されるようにさらに構成された、請求項15記載のシステム。
- 時間的エンハンスメントを前記修正された音声信号の1つ以上の包絡線に少なくとも一部基づいて前記修正された音声信号に適用するように構成された時間的包絡線整形器をさらに備える、請求項15記載のシステム。
- 前記時間的包絡線整形器は、前記修正された音声信号の選択された部分を強調するために、前記修正された音声信号の前記1つ以上の包絡線におけるピークを鋭利にするようにさらに構成された、請求項19記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161513298P | 2011-07-29 | 2011-07-29 | |
US61/513,298 | 2011-07-29 | ||
PCT/US2012/048378 WO2013019562A2 (en) | 2011-07-29 | 2012-07-26 | Adaptive voice intelligibility processor |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014524593A true JP2014524593A (ja) | 2014-09-22 |
JP6147744B2 JP6147744B2 (ja) | 2017-06-14 |
Family
ID=46750434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014523980A Active JP6147744B2 (ja) | 2011-07-29 | 2012-07-26 | 適応音声了解度処理システムおよび方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US9117455B2 (ja) |
EP (1) | EP2737479B1 (ja) |
JP (1) | JP6147744B2 (ja) |
KR (1) | KR102060208B1 (ja) |
CN (1) | CN103827965B (ja) |
HK (1) | HK1197111A1 (ja) |
PL (1) | PL2737479T3 (ja) |
TW (1) | TWI579834B (ja) |
WO (1) | WO2013019562A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016153820A (ja) * | 2015-02-20 | 2016-08-25 | ヤマハ株式会社 | 音声処理装置 |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2484140B (en) | 2010-10-01 | 2017-07-12 | Asio Ltd | Data communication system |
US8918197B2 (en) * | 2012-06-13 | 2014-12-23 | Avraham Suhami | Audio communication networks |
JP6177798B2 (ja) | 2011-12-27 | 2017-08-09 | ディーティーエス・エルエルシーDts Llc | バスエンハンスメントシステム |
CN104143337B (zh) * | 2014-01-08 | 2015-12-09 | 腾讯科技(深圳)有限公司 | 一种提高音频信号音质的方法和装置 |
JP6386237B2 (ja) * | 2014-02-28 | 2018-09-05 | 国立研究開発法人情報通信研究機構 | 音声明瞭化装置及びそのためのコンピュータプログラム |
EP3123469B1 (en) * | 2014-03-25 | 2018-04-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US9747924B2 (en) | 2014-04-08 | 2017-08-29 | Empire Technology Development Llc | Sound verification |
US9865256B2 (en) * | 2015-02-27 | 2018-01-09 | Storz Endoskop Produktions Gmbh | System and method for calibrating a speech recognition system to an operating environment |
US9467569B2 (en) | 2015-03-05 | 2016-10-11 | Raytheon Company | Methods and apparatus for reducing audio conference noise using voice quality measures |
EP3079151A1 (en) | 2015-04-09 | 2016-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and method for encoding an audio signal |
US10575103B2 (en) | 2015-04-10 | 2020-02-25 | Starkey Laboratories, Inc. | Neural network-driven frequency translation |
EP3107097B1 (en) * | 2015-06-17 | 2017-11-15 | Nxp B.V. | Improved speech intelligilibility |
US9847093B2 (en) | 2015-06-19 | 2017-12-19 | Samsung Electronics Co., Ltd. | Method and apparatus for processing speech signal |
US9843875B2 (en) * | 2015-09-25 | 2017-12-12 | Starkey Laboratories, Inc. | Binaurally coordinated frequency translation in hearing assistance devices |
CN106558298A (zh) * | 2015-09-29 | 2017-04-05 | 广州酷狗计算机科技有限公司 | 一种音效模拟方法和装置及系统 |
EP3457402B1 (en) * | 2016-06-24 | 2021-09-15 | Samsung Electronics Co., Ltd. | Noise-adaptive voice signal processing method and terminal device employing said method |
GB201617408D0 (en) | 2016-10-13 | 2016-11-30 | Asio Ltd | A method and system for acoustic communication of data |
GB201617409D0 (en) * | 2016-10-13 | 2016-11-30 | Asio Ltd | A method and system for acoustic communication of data |
CN106340306A (zh) * | 2016-11-04 | 2017-01-18 | 厦门盈趣科技股份有限公司 | 一种提高语音识别度的方法及装置 |
CN106847249B (zh) * | 2017-01-25 | 2020-10-27 | 得理电子(上海)有限公司 | 一种发音处理方法及系统 |
JP6646001B2 (ja) * | 2017-03-22 | 2020-02-14 | 株式会社東芝 | 音声処理装置、音声処理方法およびプログラム |
GB201704636D0 (en) | 2017-03-23 | 2017-05-10 | Asio Ltd | A method and system for authenticating a device |
GB2565751B (en) | 2017-06-15 | 2022-05-04 | Sonos Experience Ltd | A method and system for triggering events |
CN107346659B (zh) * | 2017-06-05 | 2020-06-23 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音识别方法、装置及终端 |
US10887712B2 (en) * | 2017-06-27 | 2021-01-05 | Knowles Electronics, Llc | Post linearization system and method using tracking signal |
AT520106B1 (de) * | 2017-07-10 | 2019-07-15 | Isuniye Llc | Verfahren zum Modifizieren eines Eingangssignals |
US10200003B1 (en) * | 2017-10-03 | 2019-02-05 | Google Llc | Dynamically extending loudspeaker capabilities |
GB2570634A (en) | 2017-12-20 | 2019-08-07 | Asio Ltd | A method and system for improved acoustic transmission of data |
WO2019136065A1 (en) * | 2018-01-03 | 2019-07-11 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
CN110610702B (zh) * | 2018-06-15 | 2022-06-24 | 惠州迪芬尼声学科技股份有限公司 | 以自然语言声控均衡器的方法及计算器可读存储介质 |
CN109346058A (zh) * | 2018-11-29 | 2019-02-15 | 西安交通大学 | 一种语音声学特征扩大系统 |
EP3671741A1 (en) * | 2018-12-21 | 2020-06-24 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Audio processor and method for generating a frequency-enhanced audio signal using pulse processing |
KR102096588B1 (ko) * | 2018-12-27 | 2020-04-02 | 인하대학교 산학협력단 | 음향 장치에서 맞춤 오디오 잡음을 이용해 사생활 보호를 구현하는 기술 |
CN113823299A (zh) * | 2020-06-19 | 2021-12-21 | 北京字节跳动网络技术有限公司 | 用于骨传导的音频处理方法、装置、终端和存储介质 |
TWI748587B (zh) * | 2020-08-04 | 2021-12-01 | 瑞昱半導體股份有限公司 | 聲音事件偵測系統及方法 |
CA3193267A1 (en) * | 2020-09-14 | 2022-03-17 | Pindrop Security, Inc. | Speaker specific speech enhancement |
US11694692B2 (en) | 2020-11-11 | 2023-07-04 | Bank Of America Corporation | Systems and methods for audio enhancement and conversion |
EP4256558A1 (en) * | 2020-12-02 | 2023-10-11 | Hearunow, Inc. | Dynamic voice accentuation and reinforcement |
CN113555033A (zh) * | 2021-07-30 | 2021-10-26 | 乐鑫信息科技(上海)股份有限公司 | 语音交互系统的自动增益控制方法、装置及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002507291A (ja) * | 1997-07-02 | 2002-03-05 | シムコ・インターナショナル・リミテッド | 音声通信システムにおける音声強調方法およびその装置 |
JP2003513319A (ja) * | 1999-10-26 | 2003-04-08 | ザ ユニバーシテイ オブ メルボルン | 短期間の過渡的音声の特徴のエンファシス |
JP2004086102A (ja) * | 2002-08-29 | 2004-03-18 | Fujitsu Ltd | 音声処理装置及び移動通信端末装置 |
Family Cites Families (112)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3101446A (en) | 1960-09-02 | 1963-08-20 | Itt | Signal to noise ratio indicator |
US3127477A (en) | 1962-06-27 | 1964-03-31 | Bell Telephone Labor Inc | Automatic formant locator |
US3327057A (en) * | 1963-11-08 | 1967-06-20 | Bell Telephone Labor Inc | Speech analysis |
US4454609A (en) * | 1981-10-05 | 1984-06-12 | Signatron, Inc. | Speech intelligibility enhancement |
US4586193A (en) * | 1982-12-08 | 1986-04-29 | Harris Corporation | Formant-based speech synthesizer |
JPS59226400A (ja) * | 1983-06-07 | 1984-12-19 | 松下電器産業株式会社 | 音声認識装置 |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4882758A (en) | 1986-10-23 | 1989-11-21 | Matsushita Electric Industrial Co., Ltd. | Method for extracting formant frequencies |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
CA2056110C (en) | 1991-03-27 | 1997-02-04 | Arnold I. Klayman | Public address intelligibility system |
US5175769A (en) | 1991-07-23 | 1992-12-29 | Rolm Systems | Method for time-scale modification of signals |
KR940002854B1 (ko) * | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
US5590241A (en) * | 1993-04-30 | 1996-12-31 | Motorola Inc. | Speech processing system and method for enhancing a speech signal in a noisy environment |
JP3235925B2 (ja) | 1993-11-19 | 2001-12-04 | 松下電器産業株式会社 | ハウリング抑制装置 |
US5471527A (en) | 1993-12-02 | 1995-11-28 | Dsc Communications Corporation | Voice enhancement system and method |
US5537479A (en) | 1994-04-29 | 1996-07-16 | Miller And Kreisel Sound Corp. | Dual-driver bass speaker with acoustic reduction of out-of-phase and electronic reduction of in-phase distortion harmonics |
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
US5864798A (en) * | 1995-09-18 | 1999-01-26 | Kabushiki Kaisha Toshiba | Method and apparatus for adjusting a spectrum shape of a speech signal |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
US6240384B1 (en) * | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
US5737719A (en) * | 1995-12-19 | 1998-04-07 | U S West, Inc. | Method and apparatus for enhancement of telephonic speech signals |
US5742689A (en) | 1996-01-04 | 1998-04-21 | Virtual Listening Systems, Inc. | Method and device for processing a multichannel signal for use with a headphone |
SE506341C2 (sv) * | 1996-04-10 | 1997-12-08 | Ericsson Telefon Ab L M | Metod och anordning för rekonstruktion av en mottagen talsignal |
TW416044B (en) | 1996-06-19 | 2000-12-21 | Texas Instruments Inc | Adaptive filter and filtering method for low bit rate coding |
US6744882B1 (en) | 1996-07-23 | 2004-06-01 | Qualcomm Inc. | Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone |
JP4040126B2 (ja) * | 1996-09-20 | 2008-01-30 | ソニー株式会社 | 音声復号化方法および装置 |
GB2319379A (en) * | 1996-11-18 | 1998-05-20 | Secr Defence | Speech processing system |
US5930373A (en) * | 1997-04-04 | 1999-07-27 | K.S. Waves Ltd. | Method and system for enhancing quality of sound signal |
US6006185A (en) * | 1997-05-09 | 1999-12-21 | Immarco; Peter | System and device for advanced voice recognition word spotting |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
US6169971B1 (en) * | 1997-12-03 | 2001-01-02 | Glenayre Electronics, Inc. | Method to suppress noise in digital voice processing |
US6182033B1 (en) * | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US7392180B1 (en) * | 1998-01-09 | 2008-06-24 | At&T Corp. | System and method of coding sound signals using sound enhancement |
WO2000005923A1 (de) * | 1998-07-24 | 2000-02-03 | Siemens Audiologische Technik Gmbh | Hörhilfe mit verbesserter sprachverständlichkeit durch frequenzselektive signalverarbeitung sowie verfahren zum betrieb einer derartigen hörhilfe |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6073093A (en) * | 1998-10-14 | 2000-06-06 | Lockheed Martin Corp. | Combined residual and analysis-by-synthesis pitch-dependent gain estimation for linear predictive coders |
US6993480B1 (en) * | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US6233552B1 (en) * | 1999-03-12 | 2001-05-15 | Comsat Corporation | Adaptive post-filtering technique based on the Modified Yule-Walker filter |
US7423983B1 (en) | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
US6732073B1 (en) * | 1999-09-10 | 2004-05-04 | Wisconsin Alumni Research Foundation | Spectral enhancement of acoustic signals to provide improved recognition of speech |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US7277767B2 (en) | 1999-12-10 | 2007-10-02 | Srs Labs, Inc. | System and method for enhanced streaming audio |
JP2001175298A (ja) * | 1999-12-13 | 2001-06-29 | Fujitsu Ltd | 騒音抑圧装置 |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
AU2001241475A1 (en) * | 2000-02-11 | 2001-08-20 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
US6606388B1 (en) * | 2000-02-17 | 2003-08-12 | Arboretum Systems, Inc. | Method and system for enhancing audio signals |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
EP1526639A3 (en) | 2000-08-14 | 2006-03-01 | Clear Audio Ltd. | Voice enhancement system |
US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
US7349841B2 (en) | 2001-03-28 | 2008-03-25 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression device including subband-based signal-to-noise ratio |
EP1280138A1 (de) | 2001-07-24 | 2003-01-29 | Empire Interactive Europe Ltd. | Verfahren zur Analyse von Audiosignalen |
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
US6985857B2 (en) * | 2001-09-27 | 2006-01-10 | Motorola, Inc. | Method and apparatus for speech coding using training and quantizing |
US7065485B1 (en) * | 2002-01-09 | 2006-06-20 | At&T Corp | Enhancing speech intelligibility using variable-rate time-scale modification |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
US6950799B2 (en) * | 2002-02-19 | 2005-09-27 | Qualcomm Inc. | Speech converter utilizing preprogrammed voice profiles |
AU2003263380A1 (en) | 2002-06-19 | 2004-01-06 | Koninklijke Philips Electronics N.V. | Audio signal processing apparatus and method |
US7233896B2 (en) * | 2002-07-30 | 2007-06-19 | Motorola Inc. | Regular-pulse excitation speech coder |
CA2399159A1 (en) | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
US7146316B2 (en) | 2002-10-17 | 2006-12-05 | Clarity Technologies, Inc. | Noise reduction in subbanded speech signals |
EP1557827B8 (en) * | 2002-10-31 | 2015-01-07 | Fujitsu Limited | Voice intensifier |
FR2850781B1 (fr) | 2003-01-30 | 2005-05-06 | Jean Luc Crebouw | Procede pour le traitement numerique differencie de la voix et de la musique, le filtrage du bruit, la creation d'effets speciaux et dispositif pour la mise en oeuvre dudit procede |
US7424423B2 (en) | 2003-04-01 | 2008-09-09 | Microsoft Corporation | Method and apparatus for formant tracking using a residual model |
DE10323126A1 (de) | 2003-05-22 | 2004-12-16 | Rcm Technology Gmbh | Adaptive Bassanhebung für aktive Basslautsprecherboxen |
EP1629463B1 (en) | 2003-05-28 | 2007-08-22 | Dolby Laboratories Licensing Corporation | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
KR100511316B1 (ko) | 2003-10-06 | 2005-08-31 | 엘지전자 주식회사 | 음성신호의 포만트 주파수 검출방법 |
KR20050049103A (ko) * | 2003-11-21 | 2005-05-25 | 삼성전자주식회사 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
ATE396537T1 (de) | 2004-01-19 | 2008-06-15 | Nxp Bv | System für die audiosignalverarbeitung |
EP1755109B1 (en) * | 2004-04-27 | 2012-08-15 | Panasonic Corporation | Scalable encoding and decoding apparatuses and methods |
JP4460580B2 (ja) | 2004-07-21 | 2010-05-12 | 富士通株式会社 | 速度変換装置、速度変換方法及びプログラム |
US7643993B2 (en) * | 2006-01-05 | 2010-01-05 | Broadcom Corporation | Method and system for decoding WCDMA AMR speech data using redundancy |
US7783480B2 (en) * | 2004-09-17 | 2010-08-24 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US7346502B2 (en) * | 2005-03-24 | 2008-03-18 | Mindspeed Technologies, Inc. | Adaptive noise state update for a voice activity detector |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
WO2006116132A2 (en) | 2005-04-21 | 2006-11-02 | Srs Labs, Inc. | Systems and methods for reducing audio noise |
US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
US20070005351A1 (en) * | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
US20070134635A1 (en) | 2005-12-13 | 2007-06-14 | Posit Science Corporation | Cognitive training using formant frequency sweeps |
US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
US7831420B2 (en) * | 2006-04-04 | 2010-11-09 | Qualcomm Incorporated | Voice modifier for speech processing systems |
US8589151B2 (en) * | 2006-06-21 | 2013-11-19 | Harris Corporation | Vocoder and associated method that transcodes between mixed excitation linear prediction (MELP) vocoders with different speech frame rates |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
EP1918910B1 (en) * | 2006-10-31 | 2009-03-11 | Harman Becker Automotive Systems GmbH | Model-based enhancement of speech signals |
EP2096632A4 (en) * | 2006-11-29 | 2012-06-27 | Panasonic Corp | DECODING DEVICE AND AUDIO DECODING METHOD |
SG144752A1 (en) * | 2007-01-12 | 2008-08-28 | Sony Corp | Audio enhancement method and system |
JP2008197200A (ja) | 2007-02-09 | 2008-08-28 | Ari Associates:Kk | 了解度自動調整装置及び了解度自動調整方法 |
JP5164970B2 (ja) * | 2007-03-02 | 2013-03-21 | パナソニック株式会社 | 音声復号装置および音声復号方法 |
KR100876794B1 (ko) | 2007-04-03 | 2009-01-09 | 삼성전자주식회사 | 이동 단말에서 음성의 명료도 향상 장치 및 방법 |
US8160872B2 (en) * | 2007-04-05 | 2012-04-17 | Texas Instruments Incorporated | Method and apparatus for layered code-excited linear prediction speech utilizing linear prediction excitation corresponding to optimal gains |
US20080312916A1 (en) * | 2007-06-15 | 2008-12-18 | Mr. Alon Konchitsky | Receiver Intelligibility Enhancement System |
US8606566B2 (en) | 2007-10-24 | 2013-12-10 | Qnx Software Systems Limited | Speech enhancement through partial speech reconstruction |
JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
CN102017402B (zh) | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
JP5219522B2 (ja) * | 2008-01-09 | 2013-06-26 | アルパイン株式会社 | 音声明瞭度改善システム及び音声明瞭度改善方法 |
EP2151821B1 (en) * | 2008-08-07 | 2011-12-14 | Nuance Communications, Inc. | Noise-reduction processing of speech signals |
KR101547344B1 (ko) * | 2008-10-31 | 2015-08-27 | 삼성전자 주식회사 | 음성복원장치 및 그 방법 |
GB0822537D0 (en) * | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US8626516B2 (en) * | 2009-02-09 | 2014-01-07 | Broadcom Corporation | Method and system for dynamic range control in an audio processing system |
US8788270B2 (en) * | 2009-06-16 | 2014-07-22 | University Of Florida Research Foundation, Inc. | Apparatus and method for determining an emotion state of a speaker |
US8204742B2 (en) | 2009-09-14 | 2012-06-19 | Srs Labs, Inc. | System for processing an audio signal to enhance speech intelligibility |
DE112010005020B4 (de) * | 2009-12-28 | 2018-12-13 | Mitsubishi Electric Corporation | Sprachsignal-Wiederherstellungsvorrichtung und Sprachsignal-Wiederherstellungsverfahren |
US8798992B2 (en) * | 2010-05-19 | 2014-08-05 | Disney Enterprises, Inc. | Audio noise modification for event broadcasting |
US8606572B2 (en) * | 2010-10-04 | 2013-12-10 | LI Creative Technologies, Inc. | Noise cancellation device for communications in high noise environments |
US8898058B2 (en) * | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
-
2012
- 2012-07-26 PL PL12751170T patent/PL2737479T3/pl unknown
- 2012-07-26 CN CN201280047329.2A patent/CN103827965B/zh active Active
- 2012-07-26 WO PCT/US2012/048378 patent/WO2013019562A2/en active Application Filing
- 2012-07-26 US US13/559,450 patent/US9117455B2/en active Active
- 2012-07-26 JP JP2014523980A patent/JP6147744B2/ja active Active
- 2012-07-26 EP EP12751170.7A patent/EP2737479B1/en active Active
- 2012-07-26 KR KR1020147004922A patent/KR102060208B1/ko active IP Right Grant
- 2012-07-27 TW TW101127284A patent/TWI579834B/zh active
-
2014
- 2014-10-22 HK HK14110559A patent/HK1197111A1/xx unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002507291A (ja) * | 1997-07-02 | 2002-03-05 | シムコ・インターナショナル・リミテッド | 音声通信システムにおける音声強調方法およびその装置 |
JP2003513319A (ja) * | 1999-10-26 | 2003-04-08 | ザ ユニバーシテイ オブ メルボルン | 短期間の過渡的音声の特徴のエンファシス |
JP2004086102A (ja) * | 2002-08-29 | 2004-03-18 | Fujitsu Ltd | 音声処理装置及び移動通信端末装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016153820A (ja) * | 2015-02-20 | 2016-08-25 | ヤマハ株式会社 | 音声処理装置 |
Also Published As
Publication number | Publication date |
---|---|
PL2737479T3 (pl) | 2017-07-31 |
WO2013019562A2 (en) | 2013-02-07 |
EP2737479A2 (en) | 2014-06-04 |
HK1197111A1 (en) | 2015-01-02 |
KR102060208B1 (ko) | 2019-12-27 |
US9117455B2 (en) | 2015-08-25 |
EP2737479B1 (en) | 2017-01-18 |
CN103827965B (zh) | 2016-05-25 |
KR20140079363A (ko) | 2014-06-26 |
WO2013019562A3 (en) | 2014-03-20 |
US20130030800A1 (en) | 2013-01-31 |
CN103827965A (zh) | 2014-05-28 |
TW201308316A (zh) | 2013-02-16 |
TWI579834B (zh) | 2017-04-21 |
JP6147744B2 (ja) | 2017-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6147744B2 (ja) | 適応音声了解度処理システムおよび方法 | |
RU2464652C2 (ru) | Способ и устройство для оценки энергии полосы высоких частот в системе расширения полосы частот | |
US9336785B2 (en) | Compression for speech intelligibility enhancement | |
EP2517202B1 (en) | Method and device for speech bandwidth extension | |
CN113823319B (zh) | 改进的语音可懂度 | |
US8271292B2 (en) | Signal bandwidth expanding apparatus | |
PH12015501575B1 (en) | Device and method for reducing quantization noise in a time-domain decoder. | |
US20110054889A1 (en) | Enhancing Receiver Intelligibility in Voice Communication Devices | |
WO2013078677A1 (zh) | 一种自适应调节音效的方法和设备 | |
US8254590B2 (en) | System and method for intelligibility enhancement of audio information | |
JP2008309955A (ja) | ノイズサプレス装置 | |
WO2017196382A1 (en) | Enhanced de-esser for in-car communication systems | |
EP4029018B1 (en) | Context-aware voice intelligibility enhancement | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
KR20160000680A (ko) | 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치 | |
JP2012242470A (ja) | 信号広帯域化装置、信号広帯域化方法、及びそのプログラム | |
JP6160045B2 (ja) | 調整装置および調整方法 | |
JP2011071806A (ja) | 電子機器、及び電子機器の音量制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160816 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6147744 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |