JP2010204266A - 音響信号変換装置、方法、及びプログラム - Google Patents
音響信号変換装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2010204266A JP2010204266A JP2009047973A JP2009047973A JP2010204266A JP 2010204266 A JP2010204266 A JP 2010204266A JP 2009047973 A JP2009047973 A JP 2009047973A JP 2009047973 A JP2009047973 A JP 2009047973A JP 2010204266 A JP2010204266 A JP 2010204266A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic signal
- distance
- snr
- value
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
SNR閾値を用いた発話区間検出に関し、話者とマイクロホンの距離が一定ではない環境では、認識性能と誤認識のトレードオフが存在するため、前記SNR閾値の設定が一般に容易ではない。
【解決手段】
音源から発せられる音響信号を電気信号に変換する変換手段と、前記音源からの音響信号が発せられたことを前記電気信号に基づいて検出する音響信号検出手段とを有する音響信号変換装置であって、音響信号を発する音源と当該音響信号を電気信号に変換する変換手段との距離を検出する距離検出手段を有し、前記音源からの音響信号が発せられたことを前記電気信号に基づいて検出する音響信号検出手段の音響信号検出の閾値を前記距離検出手段により検出した距離に応じて変化させる。
【選択図】図1
Description
(D_max−D_min)}×(d−D_min)
図6に、話者とマイクロホンとの距離(d)と、上記の手順により算出したSNR閾値(s)との関係を表すグラフを示す。このグラフでは、横軸に距離dを、縦軸にSNR閾値sをそれぞれ取っている。そして、(d,s)=(距離下限値,SNR閾値下限値)=(D_min,SNR_TH_min)に対応する座標上の点と、(d,s)=(距離上限値,SNR閾値上限値)=(D_max,SNR_TH_max)に対応する座標上の点とを取り、当該2点を直線(傾きが正の一次関数)で結んでいる。ステップS408の計算式が、前記直線に対応しており、すなわち距離dを変数としてSNR閾値sを算出している。また、距離d=D_min以下である場合にはSNR閾値s=SNR_TH_minで一定とし、また、距離d=D_max以上である場合にはSNR閾値s=SNR_TH_maxで一定としている。このようにすることで、予め距離の上限値及び下限値に対応するSNR閾値(すなわち、SNR閾値上限値とSNR閾値下限値の2つ)を設定しておけば、その他の距離に対応するSNR閾値を機械的に算出することが可能となる。なお、前記2点を結ぶ一次関数に関し、これ以外の関数を用いることもできる。すなわち、任意の広義な単調増加関数を用いることができる。これにより、SNR閾値の決定を柔軟に行うことが可能となる。
11 CPU
12 主記憶
13 補助記憶装置
14 出力インタフェース
15 入力インタフェース
16 通信インタフェース
17 バス
18 モニタ
19 キーボード
20 マウス
21 ネットワーク
100 本体部
101 マイクロホン
102 距離センサ
103 スピーカ
111 SNR閾値設定部
112 A/D変換部
113 発話区間検出部
114 SNR算出部
115 SNR閾値決定部
116 SNR判定部
117 音声照合処理部
118 出力部
119 音声再生部
121 SNR閾値上下限値
122 距離上下限値
123 音響モデル
124 語彙辞書
125 バッファ
Claims (10)
- 音源から発せられる音響信号を受付けて電気信号に変換する受付手段と、前記音源からの音響信号が発せられたことを前記電気信号に基づいて検出する音響信号検出手段とを有する音響信号変換装置であって、
前記音源と前記受付手段との距離を検出する距離検出手段
を有し、
前記音響信号検出手段の音響信号検出の閾値を前記距離検出手段により検出した距離に応じて変化させる
ことを特徴とする音響信号変換装置。 - 前記音響信号検出手段が検出した前記音源から発せられた音響信号に含まれる単語を認識する単語認識手段と、
を有することを特徴とする音響信号変換装置。 - 前記音響信号検出の閾値が、前記距離検出手段により検出した距離を引数とする単調増加関数に基づき決定されることを特徴とする請求項1または2記載の音響信号変換装置。
- 前記音響信号検出の閾値が、前記距離検出手段により検出した距離が所定の下限値よりも小さい場合には第1の規定値と決定され、前記距離が所定の上限値よりも大きい場合には前記第1の規定値よりも大きい第2の規定値と決定され、前記距離が前記所定の下限値と前記所定の上限値との間である場合には前記第1の規定値と前記第2の規定値の間の値と決定される
ことを特徴とする請求項1〜3のいずれかに記載の音響信号変換装置。 - 前記音響検出手段が誤検出した音響信号を収集し、当該収集した音響信号の頻度分布に基づいて前記第1の規定値と前記第2の規定値を決定する
ことを特徴とする請求項4記載の音響信号変換装置。 - 前記単語認識手段が誤検出した音響信号を収集し、当該収集した音響信号の頻度分布に基づいて前記第1の規定値と前記第2の規定値を決定する
ことを特徴とする請求項4記載の音響信号変換装置。 - 前記頻度分布の平均値と標準偏差とを算出し、
当該平均値との差が標準偏差の定数倍となる値をそれぞれ前記第1の規定値と前記第2の規定値と決定する
ことを特徴とする請求項5または6記載の音響信号変換装置。 - 、
前記音響信号検出の閾値がSNRに対する閾値であるSNR閾値である
ことを特徴とする請求項1〜7のいずれかに記載の音響信号変換装置。 - 音源から発せられる音響信号を受付けて電気信号に変換する受付手段を有するコンピュータによって実現される、前記音源からの音響信号が発せられたことを前記電気信号に基づいて検出する音響信号検出手順を有する音響信号変換方法であって、
前記音源と前記受付手段との距離を検出する距離検出手順
を備え、
前記音響信号検出手順の音響信号検出の閾値を前記距離検出手順により検出した距離に応じて変化させる
ことを特徴とする音響信号変換方法。 - 音源から発せられる音響信号を受付けて電気信号に変換する受付手段を備えるコンピュータに、前記音源からの音響信号が発せられたことを前記電気信号に基づいて検出する音響信号検出手順を実行させる音響信号変換プログラムであって、
コンピュータに、
前記音源と前記受付手段との距離を検出する距離検出手順
を実行させ、
前記音響信号検出手順の音響信号検出の閾値を前記距離検出手順により検出した距離に応じて変化させる
ことを特徴とする音響信号変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009047973A JP5402089B2 (ja) | 2009-03-02 | 2009-03-02 | 音響信号変換装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009047973A JP5402089B2 (ja) | 2009-03-02 | 2009-03-02 | 音響信号変換装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010204266A true JP2010204266A (ja) | 2010-09-16 |
JP5402089B2 JP5402089B2 (ja) | 2014-01-29 |
Family
ID=42965834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009047973A Active JP5402089B2 (ja) | 2009-03-02 | 2009-03-02 | 音響信号変換装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5402089B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013231797A (ja) * | 2012-04-27 | 2013-11-14 | Fujitsu Ltd | 音声認識装置、音声認識方法、及びプログラム |
JP2015080076A (ja) * | 2013-10-16 | 2015-04-23 | ヤマハ株式会社 | 収音解析装置 |
CN104751852A (zh) * | 2015-03-20 | 2015-07-01 | 广东小天才科技有限公司 | 一种声音处理的方法和装置 |
JP2018156044A (ja) * | 2017-03-21 | 2018-10-04 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
US10152967B2 (en) | 2014-02-19 | 2018-12-11 | Nokia Technologies Oy | Determination of an operational directive based at least in part on a spatial audio property |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57144597A (en) * | 1981-03-04 | 1982-09-07 | Fujitsu Ltd | Voice signal processor |
JPH02293797A (ja) * | 1989-05-08 | 1990-12-04 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH04347898A (ja) * | 1991-05-24 | 1992-12-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法 |
JPH06124097A (ja) * | 1992-10-13 | 1994-05-06 | Hitachi Ltd | 携帯型端末装置 |
JP2004045591A (ja) * | 2002-07-10 | 2004-02-12 | Mitsubishi Heavy Ind Ltd | 音声認識方法及び特定話者音響辞書の提供方法 |
JP2006181651A (ja) * | 2004-12-24 | 2006-07-13 | Toshiba Corp | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム |
JP2007501444A (ja) * | 2003-05-08 | 2007-01-25 | ボイス シグナル テクノロジーズ インコーポレイテッド | 信号対雑音比による音声認識方法 |
-
2009
- 2009-03-02 JP JP2009047973A patent/JP5402089B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57144597A (en) * | 1981-03-04 | 1982-09-07 | Fujitsu Ltd | Voice signal processor |
JPH02293797A (ja) * | 1989-05-08 | 1990-12-04 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH04347898A (ja) * | 1991-05-24 | 1992-12-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法 |
JPH06124097A (ja) * | 1992-10-13 | 1994-05-06 | Hitachi Ltd | 携帯型端末装置 |
JP2004045591A (ja) * | 2002-07-10 | 2004-02-12 | Mitsubishi Heavy Ind Ltd | 音声認識方法及び特定話者音響辞書の提供方法 |
JP2007501444A (ja) * | 2003-05-08 | 2007-01-25 | ボイス シグナル テクノロジーズ インコーポレイテッド | 信号対雑音比による音声認識方法 |
JP2006181651A (ja) * | 2004-12-24 | 2006-07-13 | Toshiba Corp | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013231797A (ja) * | 2012-04-27 | 2013-11-14 | Fujitsu Ltd | 音声認識装置、音声認識方法、及びプログラム |
JP2015080076A (ja) * | 2013-10-16 | 2015-04-23 | ヤマハ株式会社 | 収音解析装置 |
US10152967B2 (en) | 2014-02-19 | 2018-12-11 | Nokia Technologies Oy | Determination of an operational directive based at least in part on a spatial audio property |
CN104751852A (zh) * | 2015-03-20 | 2015-07-01 | 广东小天才科技有限公司 | 一种声音处理的方法和装置 |
CN104751852B (zh) * | 2015-03-20 | 2018-07-24 | 广东小天才科技有限公司 | 一种声音处理的方法和装置 |
JP2018156044A (ja) * | 2017-03-21 | 2018-10-04 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5402089B2 (ja) | 2014-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
US9196247B2 (en) | Voice recognition method and voice recognition apparatus | |
Goto et al. | A real-time filled pause detection system for spontaneous speech recognition | |
US20110184737A1 (en) | Speech recognition apparatus, speech recognition method, and speech recognition robot | |
US20070225975A1 (en) | Apparatus, method, and computer program product for processing voice in speech | |
US8996373B2 (en) | State detection device and state detecting method | |
US20140337024A1 (en) | Method and system for speech command detection, and information processing system | |
JP2008139568A (ja) | 音声処理装置および音声処理方法、並びに、プログラム | |
JP2006227628A (ja) | フレーム別に重み付けされたキーワードモデルの信頼度に基づく音声認識方法、及びその方法を用いた装置 | |
JP5411807B2 (ja) | チャネル統合方法、チャネル統合装置、プログラム | |
JP5402089B2 (ja) | 音響信号変換装置、方法、及びプログラム | |
JP2019101385A (ja) | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム | |
JP6028556B2 (ja) | 対話制御方法及び対話制御用コンピュータプログラム | |
JP2007017620A (ja) | 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体 | |
JP4353202B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP2012168296A (ja) | 音声による抑圧状態検出装置およびプログラム | |
JP2015055653A (ja) | 音声認識装置及び方法、並びに、電子機器 | |
TWI299855B (en) | Detection method for voice activity endpoint | |
US20230252971A1 (en) | System and method for speech processing | |
JP2002189487A (ja) | 音声認識装置および音声認識方法 | |
JPH03120598A (ja) | 音声認識方法及び装置 | |
JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JPWO2011077924A1 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
KR20210137502A (ko) | 음성 샘플 정렬에 기반한 진단 기법 | |
Lipeika | Optimization of formant feature based speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131014 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5402089 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |