JP2005181458A - 信号検出装置および方法、ならびに雑音追跡装置および方法 - Google Patents
信号検出装置および方法、ならびに雑音追跡装置および方法 Download PDFInfo
- Publication number
- JP2005181458A JP2005181458A JP2003418646A JP2003418646A JP2005181458A JP 2005181458 A JP2005181458 A JP 2005181458A JP 2003418646 A JP2003418646 A JP 2003418646A JP 2003418646 A JP2003418646 A JP 2003418646A JP 2005181458 A JP2005181458 A JP 2005181458A
- Authority
- JP
- Japan
- Prior art keywords
- likelihood
- signal sequence
- noise component
- feature amount
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims description 65
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 77
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 20
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 17
- 238000007476 Maximum Likelihood Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000011410 subtraction method Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Abstract
【解決手段】 入力された信号系列の特徴量を抽出するとともに(32,34)、前記信号系列に含まれる雑音成分の特徴量を抽出する(36)。その後、あらかじめ設定された信号対雑音比と、抽出された前記信号系列の特徴量とに基づいて、当該信号系列が検出される確からしさを表す第1の尤度を計算するとともに、前記雑音成分が検出される確からしさを表す第2の尤度を計算し、さらに、前記第1の尤度と前記第2の尤度との比を示す尤度比を計算する(38)。そして、その尤度比に基づいて前記信号系列の検出を判断する(40,44)。
【選択図】 図4
Description
上記したような先行技術には、典型的な音声信号と背景雑音の間の信号対雑音比を指定する方法がない。このために、ある種の雑音が誤って音声として通知されることになる。この点、本発明の一つの特徴は、信号対雑音比をあらかじめ設定する手段を提供することにより、MAP法(事後確立最大化法)による定式化をしたことにある。このことにより、ある種の雑音において、音声検出の感度を低くすることが可能となる。
上記した典型的な先行技術は、音声信号のスペクトル形状に関して何ら仮定をしていない。このために、単に音の大きい雑音も誤って音声として通知されることになる。この点、本発明のもう一つの特徴は、ある種の雑音(周波数形状が平坦であるもの)と音声(周波数形状が平坦ではないもの)との区別を可能にする差分スペクトル尺度を用いている点にある。
上記の先行技術では、背景雑音が現れる区間のみを用いて雑音追尾の更新が行われる。このような区間においては、低周波の変動のみを精度よく追尾できるように、最小追尾率を用いる必要がある。先行技術では、明示的な最小値が与えられていないため、特に前述のMAP法を用いた場合には、高周波の変動をも追尾してしまう可能性がある。本発明のもう一つの特徴は、最小追尾率を有する雑音追尾方法にある。
マイクロフォン9より入力された音響信号(音声および背景雑音が含まれうる)は、A/Dコンバータ10によって例えば11.025kHzでサンプリングされ、フレーム処理モジュール32により、256サンプルからなるフレームに分割される。このフレームは例えば110サンプル毎に生成される。これにより、これらのフレームは、隣接するフレームとオーバーラップすることになる。この構成によれば、100フレームでおよそ1秒となる。各フレームは、ハミング窓処理の後、ハートレー変換処理が行われ、同じ周波数に対応するハートレー変換の2つの出力結果は2乗和がとられ、ぺリオドグラム(periodgram)が形成される。ぺリオドグラムは一般に、パワースペクトル密度(PSD:Power Spectral Density)として知られている。256サンプルのフレームでは、PSDは128個の値(bin)からなる。
メル尺度信号は、雑音追跡モジュール36および音声区間検出尺度計算モジュール38に入力される。雑音追跡モジュール36は、入力されたメル尺度信号において、緩やかに変動する背景雑音を追跡する。この追跡には、過去に音声区間検出尺度計算モジュール38で計算された音声区間検出尺度の平均が利用される。
本発明は音声区間検出尺度として数1に示した尤度比を用いることは先述したとおりである。以下では、尤度比の算出する3つの手法を示す。
最尤法(ML:Maximum Likelihood method)は、例えば次式により表される。これは、非特許文献2として掲げた、Jongseo Sohnらによる“A Voice Activity Detector employing soft decision based noise spectrum adaptation.”(Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing, p. 365-368, May 1998)にも開示されている。
ところで、上記(1)の最尤法を用いた計算方法では、ベクトルλfの計算が必要とされる。この計算には、スペクトルサブトラクション法や、判定結果により導出する推定("decision directed" estimation)のような処理を必要とする。そこで、最尤法を用いるかわりに最大事後確率法(MAP:Maximum a-posteriori method)を用いることもできる。MAPによる方法では、ベクトルλfの計算を避けることができるという利点がある。この計算手順を図示すると、図6のようになる。この場合では、61で示される雑音尤度計算は、上記の最尤法の場合(図5の52で示される雑音尤度計算)と同様であるが、音声尤度計算は上記の最尤法と異なり、次式により計算する。
ところで、上記した2つの計算法は、特徴量を直接用いる方法に基づいている。これと異なる方法として、(時間ドメインではなく)特徴量ドメインにおいて、音声区間検出計算を行う前にローパスフィルタを施す方法がある。特徴量がスペクトルの場合には、下記の2つの利点が生まれる。
(b)また、メル化する処理の導入により生じる、相関を除くことができる。
典型的なローパスフィルタは、次の再帰式により表される。
x’2 = x2−x3,
・・・
x’S-1 = xS-1−xS
x’2 = x3−x4,
・・・
x’S/2 = xS-1−xS
上述の全てのLfの計算は、次式のとおり定式化される。
図8は、本実施形態における信号検出処理を示すフローチャートである。このフローチャートに対応するプログラムはHDD4に記憶されているVADプログラムに含まれ、RAM3にロードされた後、CPU1によって実行されるものである。
上述した実施形態は、音声認識などの音声に関わる内容で説明したが、本発明は例えば、機械などの音や動物の音などの音声以外の音響信号にも適用することが可能である。また、ソナーや動物の音などのように、人には聞くことができないような領域の音響情報にも利用できるものである。さらに、レーダーや無線信号などの電磁波などの信号などにも利用できる。
Claims (21)
- 入力した信号系列の特徴量を抽出する第1の抽出手段と、
前記信号系列に含まれる雑音成分の特徴量を抽出する第2の抽出手段と、
あらかじめ設定された信号対雑音比と、前記第1の抽出手段により抽出された前記信号系列の特徴量とに基づいて、前記信号系列が検出される確からしさを表す第1の尤度を計算する第1の尤度計算手段と、
前記第2の抽出手段により抽出された前記雑音成分の特徴量に基づいて、前記雑音成分が検出される確からしさを表す第2の尤度を計算する第2の尤度計算手段と、
前記第1の尤度と前記第2の尤度とを比較する尤度比較手段と、
前記尤度比較手段による比較結果に基づいて前記信号系列の検出を判断する判断手段と、
を有することを特徴とする信号検出装置。 - 前記第2の抽出手段は、この第2の抽出手段により抽出された過去の信号系列に含まれる雑音成分の特徴量と、当該過去の信号系列に対する前記尤度比較手段による比較結果とに基づいて雑音を追跡する雑音追跡手段を含むことを特徴とする請求項1に記載の信号検出装置。
- 入力した信号系列の特徴量を抽出する第1の抽出手段と、
前記信号系列に含まれる雑音成分の特徴量を抽出する第2の抽出手段と、
前記第1の抽出手段により抽出された前記信号系列の特徴量に基づいて、前記信号系列が検出される確からしさを表す第1の尤度を計算する第1の尤度計算手段と、
前記第2の抽出手段により抽出された前記雑音成分の特徴量に基づいて、前記雑音成分が検出される確からしさを表す第2の尤度を計算する第2の尤度計算手段と、
前記第1および第2の尤度にそれぞれ周波数方向にローパスフィルタを施すフィルタ手段と、
前記フィルタ手段通過後の前記第1の尤度と前記第2の尤度とを比較する尤度比較手段と、
前記尤度比較手段の比較結果に基づいて前記信号系列の検出を判断する判断手段と
を有することを特徴とする信号検出装置。 - 前記信号系列が音響信号系列であることを特徴とする請求項1から7までのいずれかに記載の信号検出装置。
- 前記音響信号系列が音声信号系列であることを特徴とする請求項8に記載の信号検出装置。
- (a)入力した信号系列の特徴量を抽出するステップと、
(b)前記信号系列に含まれる雑音成分の特徴量を抽出するステップと、
(c)あらかじめ設定された信号対雑音比と、上記ステップ(a)で抽出された前記信号系列の特徴量とに基づいて、前記信号系列が検出される確からしさを表す第1の尤度を計算するステップと、
(d)上記ステップ(b)で抽出された前記雑音成分の特徴量に基づいて、前記雑音成分が検出される確からしさを表す第2の尤度を計算するステップと、
(e)前記第1の尤度と前記第2の尤度とを比較するステップと、
(f)上記ステップ(e)の比較結果に基づいて前記信号系列の検出を判断するステップと、
を有することを特徴とする信号検出方法。 - コンピュータが実行可能なプログラムであって、
(a)入力した信号系列の特徴量を抽出するステップのコードと、
(b)前記信号系列に含まれる雑音成分の特徴量を抽出するステップのコードと、
(c)あらかじめ設定された信号対雑音比と、上記ステップ(a)で抽出された前記信号系列の特徴量とに基づいて、前記信号系列が検出される確からしさを表す第1の尤度を計算するステップのコードと、
(d)上記ステップ(b)で抽出された前記雑音成分の特徴量に基づいて、前記雑音成分が検出される確からしさを表す第2の尤度を計算するステップのコードと、
(e)前記第1の尤度と前記第2の尤度とを比較するステップのコードと、
(f)上記ステップ(e)の比較結果に基づいて前記信号系列の検出を判断するステップのコードと、
を含むことを特徴とするプログラム。 - 請求項11に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
- (a)入力した信号系列の特徴量を抽出するステップと、
(b)前記信号系列に含まれる雑音成分の特徴量を抽出するステップと、
(c)上記ステップ(a)で抽出された前記信号系列の特徴量に基づいて、前記信号系列が検出される確からしさを表す第1の尤度を計算するステップと、
(d)上記ステップ(b)で抽出された前記雑音成分の特徴量に基づいて、前記雑音成分が検出される確からしさを表す第2の尤度を計算するステップと、
(e)前記第1および第2の尤度にそれぞれ周波数方向にローパスフィルタを施すステップと、
(f)上記ステップ(e)における前記ローパスフィルタ通過後の前記第1の尤度と前記第2の尤度とを比較するステップと、
(g)上記ステップ(f)の比較結果に基づいて前記信号系列の検出を判断するステップと、
を有することを特徴とする信号検出方法。 - コンピュータが実行可能なプログラムであって、
(a)入力した信号系列の特徴量を抽出するステップのコードと、
(b)前記信号系列に含まれる雑音成分の特徴量を抽出するステップのコードと、
(c)上記ステップ(a)で抽出された前記信号系列の特徴量に基づいて、前記信号系列が検出される確からしさを表す第1の尤度を計算するステップのコードと、
(d)上記ステップ(b)で抽出された前記雑音成分の特徴量に基づいて、前記雑音成分が検出される確からしさを表す第2の尤度を計算するステップのコードと、
(e)前記第1および第2の尤度にそれぞれ周波数方向にローパスフィルタを施すステップのコードと、
(f)上記ステップ(e)における前記ローパスフィルタ通過後の前記第1の尤度と前記第2の尤度を比較するステップのコードと、
(g)上記ステップ(f)の比較結果に基づいて前記信号系列の検出を判断するステップのコードと、
を含むことを特徴とするプログラム。 - 請求項14に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
- 信号系列の特徴量と、その信号系列に含まれる雑音成分の特徴量とを入力する入力手段と、
前記信号系列が検出される確からしさを表す第1の尤度を、前記信号系列の特徴量に基づき計算するとともに、前記雑音成分が検出される確からしさを表す第2の尤度を、前記雑音成分の特徴量に基づき計算し、これら第1の尤度と第2の尤度とを比較する尤度比較手段と、
前記雑音成分の特徴量を、過去の雑音成分の特徴量と、前記尤度比較手段の比較結果と最低の更新値に基づいて計算し、その計算結果でもって更新する更新手段と、
を有することを特徴とする雑音追跡装置。 - (a)信号系列の特徴量と、その信号系列に含まれる雑音成分の特徴量とを入力するステップと、
(b)前記信号系列が検出される確からしさを表す第1の尤度を、前記信号系列の特徴量に基づき計算するとともに、前記雑音成分が検出される確からしさを表す第2の尤度を、前記雑音成分の特徴量に基づき計算し、これら第1の尤度と第2の尤度とを比較するステップと、
(c)前記雑音成分の特徴量を、過去の雑音成分の特徴量と、上記ステップ(b)における比較結果とに基づいて計算し、その計算結果でもって更新するステップと、
を有することを特徴とする雑音追跡方法。 - コンピュータが実行可能なプログラムであって、
(a)信号系列の特徴量と、その信号系列に含まれる雑音成分の特徴量とを入力するステップのコードと、
(b)前記信号系列が検出される確からしさを表す第1の尤度を、前記信号系列の特徴量に基づき計算するとともに、前記雑音成分が検出される確からしさを表す第2の尤度を、前記雑音成分の特徴量に基づき計算し、これら第1の尤度と第2の尤度とを比較するステップのコードと、
(c)前記雑音成分の特徴量を、過去の雑音成分の特徴量と、上記ステップ(b)における比較結果とに基づいて計算し、その計算結果でもって更新するステップのコードと、
を含むことを特徴とするプログラム。 - 請求項20に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418646A JP4497911B2 (ja) | 2003-12-16 | 2003-12-16 | 信号検出装置および方法、ならびにプログラム |
US11/007,245 US7475012B2 (en) | 2003-12-16 | 2004-12-09 | Signal detection using maximum a posteriori likelihood and noise spectral difference |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418646A JP4497911B2 (ja) | 2003-12-16 | 2003-12-16 | 信号検出装置および方法、ならびにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005181458A true JP2005181458A (ja) | 2005-07-07 |
JP2005181458A5 JP2005181458A5 (ja) | 2007-02-01 |
JP4497911B2 JP4497911B2 (ja) | 2010-07-07 |
Family
ID=34650709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003418646A Expired - Fee Related JP4497911B2 (ja) | 2003-12-16 | 2003-12-16 | 信号検出装置および方法、ならびにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7475012B2 (ja) |
JP (1) | JP4497911B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011070972A1 (ja) * | 2009-12-10 | 2011-06-16 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識プログラム |
WO2015059946A1 (ja) * | 2013-10-22 | 2015-04-30 | 日本電気株式会社 | 音声検出装置、音声検出方法及びプログラム |
WO2015059947A1 (ja) * | 2013-10-22 | 2015-04-30 | 日本電気株式会社 | 音声検出装置、音声検出方法及びプログラム |
JP2019040148A (ja) * | 2017-08-29 | 2019-03-14 | 日本電信電話株式会社 | 音声区間検出装置、その方法、及びプログラム |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4729927B2 (ja) * | 2005-01-11 | 2011-07-20 | ソニー株式会社 | 音声検出装置、自動撮像装置、および音声検出方法 |
KR100714721B1 (ko) * | 2005-02-04 | 2007-05-04 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
GB2426166B (en) * | 2005-05-09 | 2007-10-17 | Toshiba Res Europ Ltd | Voice activity detection apparatus and method |
US8738367B2 (en) * | 2009-03-18 | 2014-05-27 | Nec Corporation | Speech signal processing device |
US8560313B2 (en) * | 2010-05-13 | 2013-10-15 | General Motors Llc | Transient noise rejection for speech recognition |
WO2012083552A1 (en) * | 2010-12-24 | 2012-06-28 | Huawei Technologies Co., Ltd. | Method and apparatus for voice activity detection |
US8650029B2 (en) * | 2011-02-25 | 2014-02-11 | Microsoft Corporation | Leveraging speech recognizer feedback for voice activity detection |
CA2913578C (en) | 2013-06-21 | 2018-05-22 | Michael Schnabel | Apparatus and method for generating an adaptive spectral shape of comfort noise |
KR102495517B1 (ko) * | 2016-01-26 | 2023-02-03 | 삼성전자 주식회사 | 전자 장치, 전자 장치의 음성 인식 방법 |
CN107346658B (zh) * | 2017-07-14 | 2020-07-28 | 深圳永顺智信息科技有限公司 | 混响抑制方法及装置 |
CN107731242B (zh) * | 2017-09-26 | 2020-09-04 | 桂林电子科技大学 | 一种广义最大后验的谱幅度估计的增益函数语音增强方法 |
CN112489692A (zh) * | 2020-11-03 | 2021-03-12 | 北京捷通华声科技股份有限公司 | 语音端点检测方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0458297A (ja) * | 1990-06-27 | 1992-02-25 | Toshiba Corp | 有音検出装置および有音検出方法 |
JPH05273992A (ja) * | 1992-03-25 | 1993-10-22 | Mitsubishi Electric Corp | 音声区間検出装置 |
JP2000330597A (ja) * | 1999-05-20 | 2000-11-30 | Matsushita Electric Ind Co Ltd | 雑音抑圧装置 |
JP2002055691A (ja) * | 2000-08-08 | 2002-02-20 | Sanyo Electric Co Ltd | 音声認識方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5692104A (en) * | 1992-12-31 | 1997-11-25 | Apple Computer, Inc. | Method and apparatus for detecting end points of speech activity |
US5432859A (en) | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
IN184794B (ja) | 1993-09-14 | 2000-09-30 | British Telecomm | |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
US6556967B1 (en) * | 1999-03-12 | 2003-04-29 | The United States Of America As Represented By The National Security Agency | Voice activity detector |
US6615170B1 (en) * | 2000-03-07 | 2003-09-02 | International Business Machines Corporation | Model-based voice activity detection system and method using a log-likelihood ratio and pitch |
AU2001294989A1 (en) * | 2000-10-04 | 2002-04-15 | Clarity, L.L.C. | Speech detection |
US6993481B2 (en) * | 2000-12-04 | 2006-01-31 | Global Ip Sound Ab | Detection of speech activity using feature model adaptation |
US20020087307A1 (en) * | 2000-12-29 | 2002-07-04 | Lee Victor Wai Leung | Computer-implemented progressive noise scanning method and system |
US6985858B2 (en) * | 2001-03-20 | 2006-01-10 | Microsoft Corporation | Method and apparatus for removing noise from feature vectors |
US6678656B2 (en) * | 2002-01-30 | 2004-01-13 | Motorola, Inc. | Noise reduced speech recognition parameters |
-
2003
- 2003-12-16 JP JP2003418646A patent/JP4497911B2/ja not_active Expired - Fee Related
-
2004
- 2004-12-09 US US11/007,245 patent/US7475012B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0458297A (ja) * | 1990-06-27 | 1992-02-25 | Toshiba Corp | 有音検出装置および有音検出方法 |
JPH05273992A (ja) * | 1992-03-25 | 1993-10-22 | Mitsubishi Electric Corp | 音声区間検出装置 |
JP2000330597A (ja) * | 1999-05-20 | 2000-11-30 | Matsushita Electric Ind Co Ltd | 雑音抑圧装置 |
JP2002055691A (ja) * | 2000-08-08 | 2002-02-20 | Sanyo Electric Co Ltd | 音声認識方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011070972A1 (ja) * | 2009-12-10 | 2011-06-16 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識プログラム |
JPWO2011070972A1 (ja) * | 2009-12-10 | 2013-04-22 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識プログラム |
JP5621783B2 (ja) * | 2009-12-10 | 2014-11-12 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識プログラム |
US9002709B2 (en) | 2009-12-10 | 2015-04-07 | Nec Corporation | Voice recognition system and voice recognition method |
WO2015059946A1 (ja) * | 2013-10-22 | 2015-04-30 | 日本電気株式会社 | 音声検出装置、音声検出方法及びプログラム |
WO2015059947A1 (ja) * | 2013-10-22 | 2015-04-30 | 日本電気株式会社 | 音声検出装置、音声検出方法及びプログラム |
JPWO2015059947A1 (ja) * | 2013-10-22 | 2017-03-09 | 日本電気株式会社 | 音声検出装置、音声検出方法及びプログラム |
JPWO2015059946A1 (ja) * | 2013-10-22 | 2017-03-09 | 日本電気株式会社 | 音声検出装置、音声検出方法及びプログラム |
JP2019040148A (ja) * | 2017-08-29 | 2019-03-14 | 日本電信電話株式会社 | 音声区間検出装置、その方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20050131689A1 (en) | 2005-06-16 |
US7475012B2 (en) | 2009-01-06 |
JP4497911B2 (ja) | 2010-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4587160B2 (ja) | 信号処理装置および方法 | |
JP4497911B2 (ja) | 信号検出装置および方法、ならびにプログラム | |
US7107210B2 (en) | Method of noise reduction based on dynamic aspects of speech | |
US6993481B2 (en) | Detection of speech activity using feature model adaptation | |
US7266494B2 (en) | Method and apparatus for identifying noise environments from noisy signals | |
US7460992B2 (en) | Method of pattern recognition using noise reduction uncertainty | |
JP4491210B2 (ja) | 再帰的構成における反復ノイズ推定法 | |
US7181390B2 (en) | Noise reduction using correction vectors based on dynamic aspects of speech and noise normalization | |
JP2011158918A (ja) | クリーン信号確率変数の推定値を識別する方法 | |
JP4824286B2 (ja) | 漸進的ベイズ学習を使用する雑音推定の方法 | |
US20060253285A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
JP2005527002A (ja) | ノイズの低減に関連する不確実性を判定する方法 | |
JP4731855B2 (ja) | 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法およびコンピュータ可読記録媒体 | |
US7254536B2 (en) | Method of noise reduction using correction and scaling vectors with partitioning of the acoustic space in the domain of noisy speech | |
KR20050050534A (ko) | 복수-감지기형 음성 향상 방법 및 컴퓨터-판독가능 매체 | |
US11823669B2 (en) | Information processing apparatus and information processing method | |
JP2007093635A (ja) | 既知雑音除去装置 | |
JP2009229583A (ja) | 信号検出方法及び装置 | |
JP2003271189A (ja) | 話者方向検出回路及びその検出方法 | |
JP2005309138A (ja) | コードブック生成装置、話者認識装置、プログラム及びコードブック生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061208 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100402 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100413 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |