JP5402089B2 - 音響信号変換装置、方法、及びプログラム - Google Patents
音響信号変換装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5402089B2 JP5402089B2 JP2009047973A JP2009047973A JP5402089B2 JP 5402089 B2 JP5402089 B2 JP 5402089B2 JP 2009047973 A JP2009047973 A JP 2009047973A JP 2009047973 A JP2009047973 A JP 2009047973A JP 5402089 B2 JP5402089 B2 JP 5402089B2
- Authority
- JP
- Japan
- Prior art keywords
- acoustic signal
- distance
- value
- snr
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
(D_max−D_min)}×(d−D_min)
図6に、話者とマイクロホンとの距離(d)と、上記の手順により算出したSNR閾値(s)との関係を表すグラフを示す。このグラフでは、横軸に距離dを、縦軸にSNR閾値sをそれぞれ取っている。そして、(d,s)=(距離下限値,SNR閾値下限値)=(D_min,SNR_TH_min)に対応する座標上の点と、(d,s)=(距離上限値,SNR閾値上限値)=(D_max,SNR_TH_max)に対応する座標上の点とを取り、当該2点を直線(傾きが正の一次関数)で結んでいる。ステップS408の計算式が、前記直線に対応しており、すなわち距離dを変数としてSNR閾値sを算出している。また、距離d=D_min以下である場合にはSNR閾値s=SNR_TH_minで一定とし、また、距離d=D_max以上である場合にはSNR閾値s=SNR_TH_maxで一定としている。このようにすることで、予め距離の上限値及び下限値に対応するSNR閾値(すなわち、SNR閾値上限値とSNR閾値下限値の2つ)を設定しておけば、その他の距離に対応するSNR閾値を機械的に算出することが可能となる。なお、前記2点を結ぶ一次関数に関し、これ以外の関数を用いることもできる。すなわち、任意の広義な単調増加関数を用いることができる。これにより、SNR閾値の決定を柔軟に行うことが可能となる。
11 CPU
12 主記憶
13 補助記憶装置
14 出力インタフェース
15 入力インタフェース
16 通信インタフェース
17 バス
18 モニタ
19 キーボード
20 マウス
21 ネットワーク
100 本体部
101 マイクロホン
102 距離センサ
103 スピーカ
111 SNR閾値設定部
112 A/D変換部
113 発話区間検出部
114 SNR算出部
115 SNR閾値決定部
116 SNR判定部
117 音声照合処理部
118 出力部
119 音声再生部
121 SNR閾値上下限値
122 距離上下限値
123 音響モデル
124 語彙辞書
125 バッファ
Claims (10)
- 音源から発せられる音響信号を電気信号に変換する変換手段と、前記音源からの音響信号を前記電気信号に基づいて検出する音響信号検出手段とを有する音響信号変換装置であって、
前記音源と前記変換手段との距離を検出する距離検出手段を有し、
前記音響信号検出手段の音響信号検出の閾値を前記距離検出手段により検出した距離に応じて変化させる
ことを特徴とする音響信号変換装置。 - 前記音響信号検出手段が検出した前記音源から発せられた音響信号に含まれる単語を認識する単語認識手段と、
を有することを特徴とする請求項1記載の音響信号変換装置。 - 前記音響信号検出の閾値が、前記距離検出手段により検出した距離を引数とする単調増加関数に基づき決定されることを特徴とする請求項1または2記載の音響信号変換装置。
- 前記音響信号検出の閾値が、前記距離検出手段により検出した距離が所定の下限値よりも小さい場合には第1の規定値と決定され、前記距離が所定の上限値よりも大きい場合には前記第1の規定値よりも大きい第2の規定値と決定され、前記距離が前記所定の下限値と前記所定の上限値との間である場合には前記第1の規定値と前記第2の規定値の間の値と決定される
ことを特徴とする請求項1〜3のいずれか一項に記載の音響信号変換装置。 - 前記音響信号検出手段が誤検出した音響信号を収集し、当該収集した音響信号の頻度分布に基づいて前記第1の規定値と前記第2の規定値を決定する
ことを特徴とする請求項4記載の音響信号変換装置。 - 前記単語認識手段が誤検出した音響信号を収集し、当該収集した音響信号の頻度分布に基づいて前記第1の規定値と前記第2の規定値を決定する
ことを特徴とする請求項4記載の音響信号変換装置。 - 前記頻度分布の平均値と標準偏差とを算出し、
当該平均値との差が標準偏差の定数倍となる値をそれぞれ前記第1の規定値と前記第2の規定値と決定する
ことを特徴とする請求項5または6記載の音響信号変換装置。 - 前記音響信号検出の閾値がSNRに対する閾値であるSNR閾値である
ことを特徴とする請求項1〜7のいずれか一項に記載の音響信号変換装置。 - 音源から発せられる音響信号を電気信号に変換する変換手段を有するコンピュータによって実現される、前記音源からの音響信号を前記電気信号に基づいて検出する音響信号検出手順を有する音響信号変換方法であって、
前記音源と前記変換手段との距離を検出する距離検出手順を備え、
前記音響信号検出手順の音響信号検出の閾値を前記距離検出手順により検出した距離に応じて変化させる
ことを特徴とする音響信号変換方法。 - 音源から発せられる音響信号を電気信号に変換する変換手段を備えるコンピュータに、前記音源からの音響信号を前記電気信号に基づいて検出する音響信号検出手順を実行させる音響信号変換プログラムであって、
コンピュータに、
前記音源と前記変換手段との距離を検出する距離検出手順を実行させ、
前記音響信号検出手順の音響信号検出の閾値を前記距離検出手順により検出した距離に応じて変化させる
ことを特徴とする音響信号変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009047973A JP5402089B2 (ja) | 2009-03-02 | 2009-03-02 | 音響信号変換装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009047973A JP5402089B2 (ja) | 2009-03-02 | 2009-03-02 | 音響信号変換装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010204266A JP2010204266A (ja) | 2010-09-16 |
JP5402089B2 true JP5402089B2 (ja) | 2014-01-29 |
Family
ID=42965834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009047973A Active JP5402089B2 (ja) | 2009-03-02 | 2009-03-02 | 音響信号変換装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5402089B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6024180B2 (ja) * | 2012-04-27 | 2016-11-09 | 富士通株式会社 | 音声認識装置、音声認識方法、及びプログラム |
JP6303385B2 (ja) * | 2013-10-16 | 2018-04-04 | ヤマハ株式会社 | 収音解析装置および収音解析方法 |
EP2911149B1 (en) | 2014-02-19 | 2019-04-17 | Nokia Technologies OY | Determination of an operational directive based at least in part on a spatial audio property |
CN104751852B (zh) * | 2015-03-20 | 2018-07-24 | 广东小天才科技有限公司 | 一种声音处理的方法和装置 |
JP6553111B2 (ja) * | 2017-03-21 | 2019-07-31 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57144597A (en) * | 1981-03-04 | 1982-09-07 | Fujitsu Ltd | Voice signal processor |
JPH0754434B2 (ja) * | 1989-05-08 | 1995-06-07 | 松下電器産業株式会社 | 音声認識装置 |
JPH04347898A (ja) * | 1991-05-24 | 1992-12-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法 |
JPH06124097A (ja) * | 1992-10-13 | 1994-05-06 | Hitachi Ltd | 携帯型端末装置 |
JP2004045591A (ja) * | 2002-07-10 | 2004-02-12 | Mitsubishi Heavy Ind Ltd | 音声認識方法及び特定話者音響辞書の提供方法 |
GB2417812B (en) * | 2003-05-08 | 2007-04-18 | Voice Signal Technologies Inc | A signal-to-noise mediated speech recognition algorithm |
JP4204541B2 (ja) * | 2004-12-24 | 2009-01-07 | 株式会社東芝 | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム |
-
2009
- 2009-03-02 JP JP2009047973A patent/JP5402089B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010204266A (ja) | 2010-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
JP4786384B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
US9196247B2 (en) | Voice recognition method and voice recognition apparatus | |
US20110184737A1 (en) | Speech recognition apparatus, speech recognition method, and speech recognition robot | |
US8996373B2 (en) | State detection device and state detecting method | |
US20140337024A1 (en) | Method and system for speech command detection, and information processing system | |
JP2008139568A (ja) | 音声処理装置および音声処理方法、並びに、プログラム | |
JP2006227628A (ja) | フレーム別に重み付けされたキーワードモデルの信頼度に基づく音声認識方法、及びその方法を用いた装置 | |
JP5402089B2 (ja) | 音響信号変換装置、方法、及びプログラム | |
JP2019101385A (ja) | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム | |
JP2011248025A (ja) | チャネル統合方法、チャネル統合装置、プログラム | |
JP2007017620A (ja) | 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体 | |
JP4353202B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP2015055653A (ja) | 音声認識装置及び方法、並びに、電子機器 | |
TWI299855B (en) | Detection method for voice activity endpoint | |
JP2012168296A (ja) | 音声による抑圧状態検出装置およびプログラム | |
KR20210137502A (ko) | 음성 샘플 정렬에 기반한 진단 기법 | |
JP2002189487A (ja) | 音声認識装置および音声認識方法 | |
JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JPH03120598A (ja) | 音声認識方法及び装置 | |
JPWO2011077924A1 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
JP4408665B2 (ja) | 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム | |
CN101226741B (zh) | 一种活动语音端点的侦测方法 | |
Baghai-Ravary et al. | Detecting gross alignment errors in the Spoken British National Corpus | |
Lipeika | Optimization of formant feature based speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131014 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5402089 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |