JP5643686B2 - 音声判別装置、音声判別方法および音声判別プログラム - Google Patents
音声判別装置、音声判別方法および音声判別プログラム Download PDFInfo
- Publication number
- JP5643686B2 JP5643686B2 JP2011054758A JP2011054758A JP5643686B2 JP 5643686 B2 JP5643686 B2 JP 5643686B2 JP 2011054758 A JP2011054758 A JP 2011054758A JP 2011054758 A JP2011054758 A JP 2011054758A JP 5643686 B2 JP5643686 B2 JP 5643686B2
- Authority
- JP
- Japan
- Prior art keywords
- acoustic signal
- voice
- frequency spectrum
- weight
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012850 discrimination method Methods 0.000 title claims description 4
- 238000001228 spectrum Methods 0.000 claims description 69
- 238000000605 extraction Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 13
- 230000001629 suppression Effects 0.000 claims description 10
- 230000002452 interceptive effect Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 8
- 230000002708 enhancing effect Effects 0.000 claims 2
- 230000003044 adaptive effect Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
第1の実施形態の音声判別装置は、音声認識の前処理に利用されるものであり、所定区間長に分割した音響信号の各区間に認識対象となる利用者の音声が含まれるか否かを判別する。音声判別装置は、利用者の近くに設置された主マイクロホンで取得した第1の音響信号と、主マイクロホンと比べて相対的に利用者から遠い位置に設置された副マイクロホンで取得した第2の音響信号の2つの音響信号を取得する。マイクロホンの位置関係から、第1の音響信号には利用者の音声が、第2の音響信号には妨害音の方が主として含まれる。音声判別装置は、第1および第2の音響信号の周波数スペクトルの大きさを利用して、周波数帯域別の重みを付与する。本実施形態では、利用者音声を含まず、かつ妨害音を含む周波数帯域には小さな重みを、それ以外の周波数帯域には大きな重みを付与する。そして、音声判別装置は、重みの小さな周波数帯域を除外して第1の音響信号から特徴量を抽出する。このように、第1および第2の音響信号の周波数スペクトルの大きさを利用して重みを付与することにより、利用者音声の主要な成分を含む周波数帯域の周波数スペクトルが特徴抽出時に除外されることを防止する。
図1は、第1の実施形態にかかる音声判別装置を備えた音声認識システムを示すブロック図である。この音声認識システムは、利用者の近くに設置された主マイクロホン130−1と、主マイクロホン130−1と比べて相対的に利用者から遠い位置に設置された副マイクロホン130−2と、主マイクロホン130−1で取得した第1の音響信号の音声/非音声を判別する音声判別装置100と、音声/非音声の判別結果を利用して音声判別装置100が出力した音響信号e(t)(tは時間インデックス)を認識する音声認識部110とを備える。
図3は、本実施形態にかかる音声認識システムのフローチャートである。まず、ステップS401では、重み付与部101が、第1の音響信号d(t)と第2の音響信号x(t)の周波数スペクトルの大きさを利用して、特徴抽出部102で特徴量を抽出する際に利用する各周波数帯域fの重みRf(k)を算出する(kは、フレーム番号)。
このように、本実施形態にかかる音声判別装置は、第1および第2の音響信号のパワースペクトルの大きさを利用して周波数帯域別の重みを付与することにより、利用者音声の主要な成分を含む周波数帯域に小さな重みが付与されることを防止する。これにより、利用者音声の主要な成分を含む周波数帯域が特徴抽出時に除外されることを防ぐことができる。
本実施形態における音声判別装置100を、次に述べる音声判別装置200に置き換えることもできる。図4は、音声判別装置200の構成を示すブロック図である。音声判別装置100と異なるのは、第1の音響信号d(t)から妨害音を除外する適応フィルタ部204(雑音抑圧部)を有する点である。これに伴い、重み付与部101は、妨害音を除外した後の第1の音響信号e(t)および雑音抑圧のフィルタ特性を畳み込んだ後の第2の音響信号y(t)のパワースペクトルの大きさを利用して周波数帯域別の重みを付与する。また、特徴抽出部102はe(t)から特徴量を抽出する。
図6は、第2の実施形態にかかる音声判別装置を備えた音声認識システムを示すブロック図である。この音声認識システムの音声判別装置300は、マイクロホン330−1からマイクロホン330−nまでのn本のマイクロホンを用いてnチャンネルの音響信号を取得する。
図8は、本変形例にかかる音声認識システムのフローチャートである。第1の実施形態と異なる処理は、ステップS411およびステップS412である。
本実施形態における音声判別装置300を、次に述べる音声判別装置400に置き換えることもできる。図9は、音声判別装置400の構成を示すブロック図である。音声判別装置300と異なるのは、遅延和アレイ304が出力した音響信号から妨害音を更に除外する適応フィルタ部204(雑音抑圧部)を有する点である。
本実施形態における音声判別装置300を、図11に示す音声判別装置500に置き換えることもできる。この構成では、変形例2の音声判別装置400に加えて、第2の音響信号x(t)にシステム音を混合する混合部508を更に設けている。この音声判別装置500は、スピーカから拡声出力されたシステム音が妨害音(エコー)として第1の音響信号に混入するような場合にも対応できるよう改良されている。
本実施形態では、重み付与部101は、妨害主要周波数帯域には重み0を、それ以外の周波数帯域には重み1を付与している。付与する重みはこれに限定されず、例えば、妨害主要周波数帯域に重み−100を、それ以外の周波数帯域に重み100を付与し、特徴抽出部102で特徴量を抽出する際に重み−100が付与された周波数帯域における周波数スペクトルを除外するようにしてもよい。また、特徴抽出時に利用する重みの値を連続的に変化させてもよい。
以上述べた少なくとも一つの実施形態の音声判別装置によれば、第1および第2の音響信号のパワースペクトルの大きさを利用して周波数帯域別の重みを付与することにより、利用者音声の主要な成分を含む周波数帯域に小さな重みが付与されることを防止する。これにより、利用者音声の主要な成分を含む周波数帯域が特徴抽出時に除外されることを防止する。
101 重み付与部
102 特徴抽出部
103 音声/非音声判別部
110 音声認識部
130−1 主マイクロホン
130−2 副マイクロホン
204 適応フィルタ部(雑音抑圧部)
205 減算部
304 遅延和アレイ(目的音強調部)
305 死角型アレイ(妨害音強調部)
330−1〜330−n アレイマイクロホン
508 混合部
540−1〜540−q スピーカ
Claims (10)
- 利用者の音声を含む第1の音響信号の周波数スペクトルと妨害音を含む第2の音響信号の周波数スペクトルに基づいて、周波数帯域別の重みを付与する重み付与手段と、
前記重み付与手段で付与された周波数帯域別の重みを利用して、前記第1の音響信号の周波数スペクトルから特徴量を抽出する特徴抽出手段と、
前記特徴抽出手段で抽出された特徴量に基づいて、前記第1の音響信号の音声/非音声を判別する音声/非音声判別手段と、
を備え、
前記重み付与手段が、前記第1の音響信号の周波数スペクトルの大きさが第1の閾値より小さく、かつ、前記第2の音響信号の周波数スペクトルの大きさが第2の閾値より大きくなるような周波数帯域に予め決められた所定の重みを付与する音声判別装置。 - 利用者の音声を含む第1の音響信号の周波数スペクトルと妨害音を含む第2の音響信号の周波数スペクトルに基づいて、周波数帯域別の重みを付与する重み付与手段と、
前記重み付与手段で付与された周波数帯域別の重みを利用して、前記第1の音響信号の周波数スペクトルから特徴量を抽出する特徴抽出手段と、
前記特徴抽出手段で抽出された特徴量に基づいて、前記第1の音響信号の音声/非音声を判別する音声/非音声判別手段と、
を備え、
前記特徴抽出手段が、前記重み付与手段で所定の重みが付与された周波数帯域における周波数スペクトルを除外して特徴量を抽出する音声判別装置。 - 前記第2の音響信号を利用して、前記第1の音響信号に含まれる妨害音を抑圧する雑音抑圧手段を更に備え、
前記重み付与手段が、前記雑音抑圧手段で妨害音が抑圧された第1の音響信号の周波数スペクトルの大きさを利用する請求項1乃至請求項2記載の音声判別装置。 - 複数チャンネルの音響信号を処理して利用者の音声を強調した第1の音響信号を抽出する目的音強調手段と、
複数チャンネルの音響信号を処理して妨害音を強調した第2の音響信号を抽出する妨害音強調手段を更に備え、
前記重み付与手段が、前記目的音強調手段で抽出された第1の音響信号の周波数スペクトルと、前記妨害音強調手段で抽出された第2の音響信号の周波数スペクトルを利用する請求項1乃至請求項2に記載の音声判別装置。 - 複数チャンネルの音響信号を処理して利用者の音声を強調した第1の音響信号を抽出する目的音強調手段と、
複数チャンネルの音響信号を処理して妨害音を強調した第2の音響信号を抽出する妨害音強調手段を更に備え、
前記雑音抑圧手段が、前記妨害音強調手段で抽出された第2の音響信号を利用して、前記目的音強調手段で抽出された第1の音響信号に含まれる妨害音を抑圧する請求項3記載の音声判別装置。 - 第2の音響信号にシステム音を混合する混合手段を更に備え、
前記重み付与手段が、前記システム音が混合された第2の音響信号の周波数スペクトルを利用する請求項1から請求項5の何れか1項に記載の音声判別装置。 - 利用者の音声を含む第1の音響信号の周波数スペクトルと妨害音を含む第2の音響信号の周波数スペクトルに基づいて、周波数帯域別の重みを付与する重み付与工程と、
前記重み付与工程で付与された周波数帯域別の重みを利用して、前記第1の音響信号の周波数スペクトルから特徴量を抽出する特徴抽出工程と、
前記特徴抽出工程で抽出された特徴量に基づいて、前記第1の音響信号の音声/非音声を判別する音声/非音声判別工程と、
を備え、
前記重み付与工程が、前記第1の音響信号の周波数スペクトルの大きさが第1の閾値より小さく、かつ、前記第2の音響信号の周波数スペクトルの大きさが第2の閾値より大きくなるような周波数帯域に予め決められた所定の重みを付与する音声判別方法。 - 利用者の音声を含む第1の音響信号の周波数スペクトルと妨害音を含む第2の音響信号の周波数スペクトルに基づいて、周波数帯域別の重みを付与する重み付与工程と、
前記重み付与工程で付与された周波数帯域別の重みを利用して、前記第1の音響信号の周波数スペクトルから特徴量を抽出する特徴抽出工程と、
前記特徴抽出工程で抽出された特徴量に基づいて、前記第1の音響信号の音声/非音声を判別する音声/非音声判別工程と、
を備え、
前記特徴抽出工程が、前記重み付与手段で所定の重みが付与された周波数帯域における周波数スペクトルを除外して特徴量を抽出する音声判別方法。 - 利用者の音声を含む第1の音響信号の音声/非音声を判別する判別装置に、
前記第1の音響信号の周波数スペクトルと妨害音を含む第2の音響信号の周波数スペクトルに基づいて、周波数帯域別の重みを付与する重み付与工程と、
前記重み付与工程で付与された周波数帯域別の重みを利用して、前記第1の音響信号の周波数スペクトルから特徴量を抽出する特徴抽出工程と、
前記特徴抽出工程で抽出された特徴量に基づいて、前記第1の音響信号の音声/非音声を判別する音声/非音声判別工程と、
を実現させるための音声判別プログラムであって、
前記重み付与工程が、前記第1の音響信号の周波数スペクトルの大きさが第1の閾値より小さく、かつ、前記第2の音響信号の周波数スペクトルの大きさが第2の閾値より大きくなるような周波数帯域に予め決められた所定の重みを付与する音声判別プログラム。 - 利用者の音声を含む第1の音響信号の音声/非音声を判別する判別装置に、
前記第1の音響信号の周波数スペクトルと妨害音を含む第2の音響信号の周波数スペクトルに基づいて、周波数帯域別の重みを付与する重み付与工程と、
前記重み付与工程で付与された周波数帯域別の重みを利用して、前記第1の音響信号の周波数スペクトルから特徴量を抽出する特徴抽出工程と、
前記特徴抽出工程で抽出された特徴量に基づいて、前記第1の音響信号の音声/非音声を判別する音声/非音声判別工程と、
を実現させるための音声判別プログラムであって、
前記特徴抽出工程が、前記重み付与手段で所定の重みが付与された周波数帯域における周波数スペクトルを除外して特徴量を抽出する音声判別プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011054758A JP5643686B2 (ja) | 2011-03-11 | 2011-03-11 | 音声判別装置、音声判別方法および音声判別プログラム |
US13/232,491 US9330683B2 (en) | 2011-03-11 | 2011-09-14 | Apparatus and method for discriminating speech of acoustic signal with exclusion of disturbance sound, and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011054758A JP5643686B2 (ja) | 2011-03-11 | 2011-03-11 | 音声判別装置、音声判別方法および音声判別プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012189906A JP2012189906A (ja) | 2012-10-04 |
JP5643686B2 true JP5643686B2 (ja) | 2014-12-17 |
Family
ID=46796869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011054758A Active JP5643686B2 (ja) | 2011-03-11 | 2011-03-11 | 音声判別装置、音声判別方法および音声判別プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9330683B2 (ja) |
JP (1) | JP5643686B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101514966B1 (ko) * | 2012-06-28 | 2015-04-24 | 주식회사 케이티 | 무선랜 시스템에서 aid 재할당 방법 |
US20140270219A1 (en) * | 2013-03-15 | 2014-09-18 | CSR Technology, Inc. | Method, apparatus, and manufacture for beamforming with fixed weights and adaptive selection or resynthesis |
EP3031265B1 (en) * | 2013-08-08 | 2017-12-06 | Sony Corporation | Mobile communications network. communications device and methods |
DE102014217681B4 (de) | 2014-09-04 | 2020-12-10 | Imra Europe S.A.S. | Sirenensignalquellenerfassung, -Erkennung und -Lokalisation |
CN104270489A (zh) * | 2014-09-10 | 2015-01-07 | 中兴通讯股份有限公司 | 一种从多个麦克风中确定主副麦克风的方法和系统 |
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0707763B1 (en) * | 1993-07-07 | 2001-08-29 | Picturetel Corporation | Reduction of background noise for speech enhancement |
US6035048A (en) * | 1997-06-18 | 2000-03-07 | Lucent Technologies Inc. | Method and apparatus for reducing noise in speech and audio signals |
JP4163294B2 (ja) * | 1998-07-31 | 2008-10-08 | 株式会社東芝 | 雑音抑圧処理装置および雑音抑圧処理方法 |
US6826528B1 (en) * | 1998-09-09 | 2004-11-30 | Sony Corporation | Weighted frequency-channel background noise suppressor |
US6671667B1 (en) * | 2000-03-28 | 2003-12-30 | Tellabs Operations, Inc. | Speech presence measurement detection techniques |
JP4580508B2 (ja) * | 2000-05-31 | 2010-11-17 | 株式会社東芝 | 信号処理装置及び通信装置 |
JP4533517B2 (ja) * | 2000-08-31 | 2010-09-01 | 株式会社東芝 | 信号処理方法および信号処理装置 |
JP2002169599A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | ノイズ抑制方法及び電子機器 |
US7617099B2 (en) * | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
EP1376539B8 (en) * | 2001-03-28 | 2010-12-15 | Mitsubishi Denki Kabushiki Kaisha | Noise suppressor |
JP4509413B2 (ja) * | 2001-03-29 | 2010-07-21 | 株式会社東芝 | 電子機器 |
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
US7146316B2 (en) * | 2002-10-17 | 2006-12-05 | Clarity Technologies, Inc. | Noise reduction in subbanded speech signals |
US7359504B1 (en) * | 2002-12-03 | 2008-04-15 | Plantronics, Inc. | Method and apparatus for reducing echo and noise |
JP2005084253A (ja) | 2003-09-05 | 2005-03-31 | Matsushita Electric Ind Co Ltd | 音響処理装置、方法、プログラム及び記憶媒体 |
US7333618B2 (en) * | 2003-09-24 | 2008-02-19 | Harman International Industries, Incorporated | Ambient noise sound level compensation |
US6889189B2 (en) * | 2003-09-26 | 2005-05-03 | Matsushita Electric Industrial Co., Ltd. | Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations |
FI20045315A (fi) * | 2004-08-30 | 2006-03-01 | Nokia Corp | Ääniaktiivisuuden havaitseminen äänisignaalissa |
JP4533126B2 (ja) * | 2004-12-24 | 2010-09-01 | 日本電信電話株式会社 | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 |
US20080243496A1 (en) * | 2005-01-21 | 2008-10-02 | Matsushita Electric Industrial Co., Ltd. | Band Division Noise Suppressor and Band Division Noise Suppressing Method |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
GB2426166B (en) * | 2005-05-09 | 2007-10-17 | Toshiba Res Europ Ltd | Voice activity detection apparatus and method |
JP2007150737A (ja) * | 2005-11-28 | 2007-06-14 | Sony Corp | 音声信号ノイズ低減装置及び方法 |
US8280731B2 (en) * | 2007-03-19 | 2012-10-02 | Dolby Laboratories Licensing Corporation | Noise variance estimator for speech enhancement |
KR100919223B1 (ko) * | 2007-09-19 | 2009-09-28 | 한국전자통신연구원 | 부대역의 불확실성 정보를 이용한 잡음환경에서의 음성인식 방법 및 장치 |
US9336785B2 (en) * | 2008-05-12 | 2016-05-10 | Broadcom Corporation | Compression for speech intelligibility enhancement |
JP2011002535A (ja) * | 2009-06-17 | 2011-01-06 | Toyota Motor Corp | 音声対話システム、音声対話方法、及びプログラム |
JP5156043B2 (ja) | 2010-03-26 | 2013-03-06 | 株式会社東芝 | 音声判別装置 |
JP5649488B2 (ja) * | 2011-03-11 | 2015-01-07 | 株式会社東芝 | 音声判別装置、音声判別方法および音声判別プログラム |
-
2011
- 2011-03-11 JP JP2011054758A patent/JP5643686B2/ja active Active
- 2011-09-14 US US13/232,491 patent/US9330683B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9330683B2 (en) | 2016-05-03 |
JP2012189906A (ja) | 2012-10-04 |
US20120232895A1 (en) | 2012-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5649488B2 (ja) | 音声判別装置、音声判別方法および音声判別プログラム | |
US8620672B2 (en) | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal | |
EP1875466B1 (en) | Systems and methods for reducing audio noise | |
JP5643686B2 (ja) | 音声判別装置、音声判別方法および音声判別プログラム | |
KR101210313B1 (ko) | 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법 | |
US9269367B2 (en) | Processing audio signals during a communication event | |
EP2643981B1 (en) | A device comprising a plurality of audio sensors and a method of operating the same | |
US20160351179A1 (en) | Single-channel, binaural and multi-channel dereverberation | |
US8364479B2 (en) | System for speech signal enhancement in a noisy environment through corrective adjustment of spectral noise power density estimations | |
US10553236B1 (en) | Multichannel noise cancellation using frequency domain spectrum masking | |
EP2372700A1 (en) | A speech intelligibility predictor and applications thereof | |
EP2463856B1 (en) | Method to reduce artifacts in algorithms with fast-varying gain | |
US8422696B2 (en) | Apparatus and method for removing noise | |
US10262673B2 (en) | Soft-talk audio capture for mobile devices | |
CN104021798B (zh) | 用于通过具有可变频谱增益和可动态调制的硬度的算法对音频信号隔音的方法 | |
US9378754B1 (en) | Adaptive spatial classifier for multi-microphone systems | |
CN111415686A (zh) | 针对高度不稳定的噪声源的自适应空间vad和时间-频率掩码估计 | |
JP2021511755A (ja) | 音声認識オーディオシステムおよび方法 | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
US8639499B2 (en) | Formant aided noise cancellation using multiple microphones | |
JPWO2018173267A1 (ja) | 収音装置および収音方法 | |
EP2490218A1 (en) | Method for interference suppression | |
CN111508512B (zh) | 语音信号中的摩擦音检测的方法和系统 | |
CN109151663B (zh) | 信号处理器和信号处理系统 | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140718 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141031 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5643686 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |