JP2012177949A - オーディオ信号の分解および修正のためのシステムおよび方法 - Google Patents
オーディオ信号の分解および修正のためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2012177949A JP2012177949A JP2012137938A JP2012137938A JP2012177949A JP 2012177949 A JP2012177949 A JP 2012177949A JP 2012137938 A JP2012137938 A JP 2012137938A JP 2012137938 A JP2012137938 A JP 2012137938A JP 2012177949 A JP2012177949 A JP 2012177949A
- Authority
- JP
- Japan
- Prior art keywords
- model
- segment
- source
- source model
- modification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004048 modification Effects 0.000 title claims abstract description 31
- 238000012986 modification Methods 0.000 title claims abstract description 31
- 230000005236 sound signal Effects 0.000 title description 14
- 238000004458 analytical method Methods 0.000 title description 3
- 230000003044 adaptive effect Effects 0.000 claims abstract description 13
- 230000003595 spectral effect Effects 0.000 claims description 26
- 238000000354 decomposition reaction Methods 0.000 claims description 24
- 230000001052 transient effect Effects 0.000 claims description 17
- 238000007728 cost analysis Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 13
- 230000006978 adaptation Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000003477 cochlea Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010063659 Aversion Diseases 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
Abstract
【解決手段】例示的な実施形態では、適応的複数モデル最適化器が、分解された信号の修正を容易にするために少なくとも一つの源モデル・パラメータを生成するよう構成される。前記適応的複数モデル最適化器は、セグメント・グループ化エンジンおよび源グループ化エンジンを有する。前記セグメント・グループ化エンジンは、同時の諸特徴セグメントをグループ化して、少なくとも一つのセグメント・モデルを生成するよう構成される。前記少なくとも一つのセグメント・モデルは、少なくとも一つの源モデルを生成するために源グループ化エンジンによって使用される。前記少なくとも一つの源モデルは、前記少なくとも一つの源モデル・パラメータを有する。次いで、前記少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号の修正のための制御信号が生成されうる。
【選択図】図3
Description
本出願は、2005年5月27日に出願された“Sound Analysis and Modification Using Hierarchical Adaptive Multiple-Module Optimizer”という名称の米国仮出願第60/685,750号の優先権の恩恵を主張するものである。該文献はここに参照によって組み込まれる。
本発明の実施形態は、オーディオ処理に、より詳細にはオーディオ信号の分解および修正に関する。
前記少なくとも一つのセグメント・モデルは、次いで、少なくとも一つの源モデルを生成するために源グループ化エンジンによって使用される。前記少なくとも一つの源モデルは、前記少なくとも一つの源モデル・パラメータを有する。次いで、前記少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号の修正のための制御信号が生成されうる。
P(Mi|Oi)=P(Oi|Mi)×P(Mi)/P(Oi)
として与えられ、ここで、全モデルをN個として、i=1からNまでiについて和を取る。
c(Mi|Oi)=c(Oi|Mi)+c(Mi)−c(Oi)
である。
〔態様1〕
オーディオ入力信号の修正のための方法であって:
少なくとも一つの観察されたセグメント・モデル・パラメータを少なくとも一つの予測されたセグメント・モデル・パラメータと比較する段階と;
前記比較に基づいて源モデルを構成する段階と;
前記構成された源モデルに基づいて、分解された信号の修正を容易にする少なくとも一つの源モデル・パラメータを生成する段階とを有する方法。
〔態様2〕
前記源モデルが最良あてはめ源モデルであるかどうかを判定する段階をさらに有する、態様1記載の方法。
〔態様3〕
前記判定がコスト解析に基づいている、態様2記載の方法。
〔態様4〕
源モデルを構成する段階が、該源モデルを生成することを含む、態様1記載の方法。
〔態様5〕
源モデルを構成する段階が、該源モデルが最良あてはめ源モデルでない場合、該源モデルを調整することを含む、態様1記載の方法。
〔態様6〕
前記少なくとも一つの観察されたセグメント・モデル・パラメータを、構成されたセグメント・モデルに基づいて生成する段階をさらに有する、態様1記載の方法。
〔態様7〕
観察された特徴セグメントを予測された特徴セグメントと比較する段階をさらに有しており、前記構成されたセグメント・モデルが前記比較に基づく、態様6記載の方法。
〔態様8〕
前記観察された特徴セグメントを、スペクトル形トラッカーを利用して生成する段階をさらに有する、態様7記載の方法。
〔態様9〕
前記分解された信号を、前記オーディオ入力信号を周波数領域に変換することによって生成する段階をさらに有する、態様1記載の方法。
〔態様10〕
前記少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号の前記修正を制御する少なくとも一つの制御信号を生成する段階をさらに有する、態様1記載の方法。
〔態様11〕
オーディオ入力信号の修正のためのシステムであって:
分解された信号の修正を容易にするために少なくとも一つの源モデル・パラメータを生成するよう構成された適応的複数モデル最適化器を有しており、該適応的複数モデル最適化器はさらに、
同時の諸特徴セグメントをグループ化して、少なくとも一つのセグメント・モデルを生成するよう構成されたセグメント・グループ化エンジンと;
前記少なくとも一つのセグメント・モデルに基づいて少なくとも一つの源モデルを生成するよう構成された源グループ化エンジンとを有しており、前記少なくとも一つの源モデルが、前記少なくとも一つの源モデル・パラメータを与える、システム。
〔態様12〕
前記セグメント・グループ化エンジンによって利用される前記諸特徴セグメントを抽出するよう構成された特徴抽出器をさらに有する、態様11記載のシステム。
〔態様13〕
前記特徴抽出器が、前記分解された信号のスペクトル・ピークを追跡するスペクトル・ピーク・トラッカーを有する、態様12記載のシステム。
〔態様14〕
前記特徴抽出器が、トーンに関連する諸特徴セグメントを決定するよう構成されたトーン・トラッカーを有する、態様12記載のシステム。
〔態様15〕
前記特徴抽出器が、過渡音に関連する諸特徴セグメントを決定するよう構成された過渡音トラッカーを有する、態様12記載のシステム。
〔態様16〕
前記特徴抽出器が、ノイズに関連する諸特徴セグメントを決定するよう構成されたノイズ・トラッカーを有する、態様12記載のシステム。
〔態様17〕
前記オーディオ入力信号を、周波数領域の前記分解された信号に変換するよう構成された分解モジュールをさらに有する、態様11記載のシステム。
〔態様18〕
前記少なくとも一つのセグメント・モデルから得られる少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号の前記修正のための制御信号を生成するよう構成された関心選択器をさらに有する、態様11記載のシステム。
〔態様19〕
前記少なくとも一つのセグメント・モデルから得られる少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号を修正するよう構成された調節器をさらに有する、態様11記載のシステム。
〔態様20〕
オーディオ入力信号の修正のための方法を実行するために機械によって実行可能なプログラムが具現されている機械可読媒体であって、該方法が:
少なくとも一つの観察されたセグメント・モデル・パラメータを少なくとも一つの予測されたセグメント・モデル・パラメータと比較する段階と;
前記比較に基づいて源モデルを構成する段階と;
前記構成された源モデルに基づいて、分解された信号の修正を容易にする少なくとも一つの源モデル・パラメータを生成する段階とを有する、機械可読媒体。
Claims (19)
- デジタル通信装置によるオーディオ入力信号の修正のための方法であって:
前記オーディオ入力信号および設定されたセグメント・モデルに基づいて少なくとも一つの観察されたセグメント・モデル・パラメータを生成し、前記少なくとも一つの観察されたセグメント・モデル・パラメータを前記デジタル通信装置内に記憶する段階であって、前記オーディオ入力信号はノイズ・セグメントを含む、段階と;
前記デジタル通信装置内に記憶された前記少なくとも一つの観察されたセグメント・モデル・パラメータを、前記デジタル通信装置内に記憶された少なくとも一つの予測されたセグメント・モデル・パラメータと比較する段階と;
前記比較に基づいて前記デジタル通信装置内に記憶されている源モデルを設定する段階と;
前記設定された源モデルに基づいて、前記デジタル通信装置による分解された信号の修正を容易にする少なくとも一つの源モデル・パラメータを生成する段階とを有する方法。 - 前記源モデルがベスト・フィット源モデルであるかどうかを判定する段階をさらに有する、請求項1記載の方法。
- 前記判定がコスト解析に基づいている、請求項2記載の方法。
- 源モデルを設定する段階が、該源モデルを生成することを含む、請求項1記載の方法。
- 源モデルを設定する段階が、該源モデルがベスト・フィット源モデルでない場合、該源モデルを調整することを含む、請求項1記載の方法。
- 観察された特徴セグメントを予測された特徴セグメントと比較する段階をさらに有しており、前記設定されたセグメント・モデルが前記比較に基づく、請求項1記載の方法。
- 前記観察された特徴セグメントを、スペクトル形トラッカーを利用して生成する段階をさらに有する、請求項6記載の方法。
- 前記分解された信号を、前記オーディオ入力信号を周波数領域に変換することによって生成する段階をさらに有する、請求項1記載の方法。
- 前記少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号の前記修正を制御する少なくとも一つの制御信号を生成する段階をさらに有する、請求項1記載の方法。
- オーディオ入力信号の修正のためのシステムであって:
分解された信号の修正を容易にするために少なくとも一つの源モデル・パラメータを生成するよう構成された適応的複数モデル最適化器を有しており、該適応的複数モデル最適化器はさらに、
同時の諸特徴セグメントをグループ化して、少なくとも一つのセグメント・モデルを生成し、ノイズ・セグメントを含む前記オーディオ入力信号およびセグメント・モデルに基づいて少なくとも一つの観察されたセグメント・モデル・パラメータを生成するよう構成されたセグメント・グループ化エンジンと;
前記少なくとも一つのセグメント・モデルに基づいて少なくとも一つの源モデルを生成するよう構成された源グループ化エンジンとを有しており、前記少なくとも一つの源モデルが、前記少なくとも一つの源モデル・パラメータを与える、システム。 - 前記セグメント・グループ化エンジンによって利用される前記諸特徴セグメントを抽出するよう構成された特徴抽出器をさらに有する、請求項10記載のシステム。
- 前記特徴抽出器が、前記分解された信号のスペクトル・ピークを追跡するスペクトル・ピーク・トラッカーを有する、請求項11記載のシステム。
- 前記特徴抽出器が、トーンに関連する諸特徴セグメントを決定するよう構成されたトーン・トラッカーを有する、請求項11記載のシステム。
- 前記特徴抽出器が、過渡音に関連する諸特徴セグメントを決定するよう構成された過渡音トラッカーを有する、請求項11記載のシステム。
- 前記特徴抽出器が、ノイズに関連する諸特徴セグメントを決定するよう構成されたノイズ・トラッカーを有する、請求項11記載のシステム。
- 前記オーディオ入力信号を、周波数領域の前記分解された信号に変換するよう構成された分解モジュールをさらに有する、請求項10記載のシステム。
- 前記少なくとも一つのセグメント・モデルから得られる少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号の前記修正のための制御信号を生成するよう構成された関心選択器をさらに有する、請求項10記載のシステム。
- 前記少なくとも一つのセグメント・モデルから得られる少なくとも一つの源モデル・パラメータに基づいて、前記分解された信号を修正するよう構成された調節器をさらに有する、請求項10記載のシステム。
- オーディオ入力信号の修正のための方法を実行するために機械によって実行可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、該方法が:
前記オーディオ入力信号および設定されたセグメント・モデルに基づいて少なくとも一つの観察されたセグメント・モデル・パラメータを生成し、前記少なくとも一つの観察されたセグメント・モデル・パラメータを前記デジタル通信装置内に記憶する段階であって、前記オーディオ入力信号はノイズ・セグメントを含む、段階と;
前記少なくとも一つの観察されたセグメント・モデル・パラメータを少なくとも一つの予測されたセグメント・モデル・パラメータと比較する段階と;
前記比較に基づいて源モデルを設定する段階と;
前記設定された源モデルに基づいて、分解された信号の修正を容易にする少なくとも一つの源モデル・パラメータを生成する段階とを有する、記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US68575005P | 2005-05-27 | 2005-05-27 | |
US60/685,750 | 2005-05-27 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008513807A Division JP2008546012A (ja) | 2005-05-27 | 2006-05-30 | オーディオ信号の分解および修正のためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012177949A true JP2012177949A (ja) | 2012-09-13 |
JP5383867B2 JP5383867B2 (ja) | 2014-01-08 |
Family
ID=37452961
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008513807A Pending JP2008546012A (ja) | 2005-05-27 | 2006-05-30 | オーディオ信号の分解および修正のためのシステムおよび方法 |
JP2012137938A Expired - Fee Related JP5383867B2 (ja) | 2005-05-27 | 2012-06-19 | オーディオ信号の分解および修正のためのシステムおよび方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008513807A Pending JP2008546012A (ja) | 2005-05-27 | 2006-05-30 | オーディオ信号の分解および修正のためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8315857B2 (ja) |
JP (2) | JP2008546012A (ja) |
KR (1) | KR101244232B1 (ja) |
FI (1) | FI20071018L (ja) |
WO (1) | WO2006128107A2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2796493T3 (es) * | 2008-03-20 | 2020-11-27 | Fraunhofer Ges Forschung | Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio |
US20110228948A1 (en) * | 2010-03-22 | 2011-09-22 | Geoffrey Engel | Systems and methods for processing audio data |
US20130152767A1 (en) * | 2010-04-22 | 2013-06-20 | Jamrt Ltd | Generating pitched musical events corresponding to musical content |
JP5575977B2 (ja) | 2010-04-22 | 2014-08-20 | クゥアルコム・インコーポレイテッド | ボイスアクティビティ検出 |
US8898058B2 (en) | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
US9818416B1 (en) * | 2011-04-19 | 2017-11-14 | Deka Products Limited Partnership | System and method for identifying and processing audio signals |
JP2013205830A (ja) * | 2012-03-29 | 2013-10-07 | Sony Corp | トーン成分検出方法、トーン成分検出装置およびプログラム |
MY181026A (en) | 2013-06-21 | 2020-12-16 | Fraunhofer Ges Forschung | Apparatus and method realizing improved concepts for tcx ltp |
JP6487650B2 (ja) * | 2014-08-18 | 2019-03-20 | 日本放送協会 | 音声認識装置及びプログラム |
US11308928B2 (en) | 2014-09-25 | 2022-04-19 | Sunhouse Technologies, Inc. | Systems and methods for capturing and interpreting audio |
JP6814146B2 (ja) | 2014-09-25 | 2021-01-13 | サンハウス・テクノロジーズ・インコーポレーテッド | オーディオをキャプチャーし、解釈するシステムと方法 |
EP3409380A1 (en) * | 2017-05-31 | 2018-12-05 | Nxp B.V. | Acoustic processor |
US11029914B2 (en) | 2017-09-29 | 2021-06-08 | Knowles Electronics, Llc | Multi-core audio processor with phase coherency |
CN111383646B (zh) * | 2018-12-28 | 2020-12-08 | 广州市百果园信息技术有限公司 | 一种语音信号变换方法、装置、设备和存储介质 |
CN111873742A (zh) * | 2020-06-16 | 2020-11-03 | 吉利汽车研究院(宁波)有限公司 | 一种车辆控制方法、装置及计算机存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002140096A (ja) * | 2000-06-02 | 2002-05-17 | Canon Inc | 信号処理システム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2644915A1 (fr) * | 1989-03-22 | 1990-09-28 | Inst Nat Sante Rech Med | Procede et dispositif d'analyse spectrale en temps reel de signaux instationnaires complexes |
JP2001503154A (ja) * | 1996-09-10 | 2001-03-06 | シーメンス アクチエンゲゼルシヤフト | 音声認識システムにおける隠れマルコフ音声モデルの適合方法 |
US6151575A (en) * | 1996-10-28 | 2000-11-21 | Dragon Systems, Inc. | Rapid adaptation of speech models |
US6510408B1 (en) | 1997-07-01 | 2003-01-21 | Patran Aps | Method of noise reduction in speech signals and an apparatus for performing the method |
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
JP2002073072A (ja) | 2000-08-31 | 2002-03-12 | Sony Corp | モデル適応装置およびモデル適応方法、記録媒体、並びにパターン認識装置 |
JP2002366187A (ja) * | 2001-06-08 | 2002-12-20 | Sony Corp | 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体 |
US20030050783A1 (en) * | 2001-09-13 | 2003-03-13 | Shinichi Yoshizawa | Terminal device, server device and speech recognition method |
JP2003177790A (ja) | 2001-09-13 | 2003-06-27 | Matsushita Electric Ind Co Ltd | 端末装置、サーバ装置および音声認識方法 |
JP2003099085A (ja) | 2001-09-25 | 2003-04-04 | National Institute Of Advanced Industrial & Technology | 音源の分離方法および音源の分離装置 |
US7146315B2 (en) * | 2002-08-30 | 2006-12-05 | Siemens Corporate Research, Inc. | Multichannel voice detection in adverse environments |
JP4091047B2 (ja) * | 2002-10-31 | 2008-05-28 | 深▲川▼市中▲興▼通▲訊▼股▲分▼有限公司 | 広帯域プリディストーション線形化の方法およびシステム |
US7457745B2 (en) * | 2002-12-03 | 2008-11-25 | Hrl Laboratories, Llc | Method and apparatus for fast on-line automatic speaker/environment adaptation for speech/speaker recognition in the presence of changing environments |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
JP3987927B2 (ja) | 2003-03-20 | 2007-10-10 | 独立行政法人産業技術総合研究所 | 波形認識方法及び装置、並びにプログラム |
-
2006
- 2006-05-30 WO PCT/US2006/020737 patent/WO2006128107A2/en active Application Filing
- 2006-05-30 JP JP2008513807A patent/JP2008546012A/ja active Pending
- 2006-05-30 US US11/444,060 patent/US8315857B2/en active Active
- 2006-05-30 KR KR1020077029312A patent/KR101244232B1/ko not_active IP Right Cessation
-
2007
- 2007-12-27 FI FI20071018A patent/FI20071018L/fi not_active IP Right Cessation
-
2012
- 2012-06-19 JP JP2012137938A patent/JP5383867B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002140096A (ja) * | 2000-06-02 | 2002-05-17 | Canon Inc | 信号処理システム |
Also Published As
Publication number | Publication date |
---|---|
JP5383867B2 (ja) | 2014-01-08 |
US8315857B2 (en) | 2012-11-20 |
WO2006128107A3 (en) | 2009-09-17 |
FI20071018L (fi) | 2008-02-27 |
KR101244232B1 (ko) | 2013-03-18 |
WO2006128107A2 (en) | 2006-11-30 |
US20070010999A1 (en) | 2007-01-11 |
JP2008546012A (ja) | 2008-12-18 |
KR20080020624A (ko) | 2008-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5383867B2 (ja) | オーディオ信号の分解および修正のためのシステムおよび方法 | |
US9741360B1 (en) | Speech enhancement for target speakers | |
US5848163A (en) | Method and apparatus for suppressing background music or noise from the speech input of a speech recognizer | |
US8447596B2 (en) | Monaural noise suppression based on computational auditory scene analysis | |
JP5528538B2 (ja) | 雑音抑圧装置 | |
JP5127754B2 (ja) | 信号処理装置 | |
JP5649488B2 (ja) | 音声判別装置、音声判別方法および音声判別プログラム | |
US11894008B2 (en) | Signal processing apparatus, training apparatus, and method | |
JP2010054728A (ja) | 音源抽出装置 | |
Yu et al. | Audio-visual multi-channel integration and recognition of overlapped speech | |
JP2014126856A (ja) | 雑音除去装置及びその制御方法 | |
KR100917460B1 (ko) | 잡음제거 장치 및 방법 | |
JP5180928B2 (ja) | 音声認識装置及び音声認識装置のマスク生成方法 | |
JP2007047427A (ja) | 音声処理装置 | |
JP2003532162A (ja) | 雑音に影響された音声の認識のためのロバストなパラメータ | |
JP5443547B2 (ja) | 信号処理装置 | |
WO2021193093A1 (ja) | 信号処理装置、信号処理方法およびプログラム | |
Chen et al. | On Synthesis for Supervised Monaural Speech Separation in Time Domain. | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP2020012980A (ja) | 信号処理装置、信号処理プログラム、信号処理方法、及び収音装置 | |
JP3916834B2 (ja) | 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法 | |
KR101022457B1 (ko) | Casa 및 소프트 마스크 알고리즘을 이용한 단일채널 음성 분리방법 | |
Hepsiba et al. | Computational intelligence for speech enhancement using deep neural network | |
Li et al. | Joint Noise Reduction and Listening Enhancement for Full-End Speech Enhancement | |
Zeng et al. | Low-complexity Multi-Channel Speaker Extraction with Pure Speech Cues |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131001 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |