JP2006267664A - 音声認識方法および音声認識装置 - Google Patents
音声認識方法および音声認識装置 Download PDFInfo
- Publication number
- JP2006267664A JP2006267664A JP2005086805A JP2005086805A JP2006267664A JP 2006267664 A JP2006267664 A JP 2006267664A JP 2005086805 A JP2005086805 A JP 2005086805A JP 2005086805 A JP2005086805 A JP 2005086805A JP 2006267664 A JP2006267664 A JP 2006267664A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- signal
- myoelectric
- detected
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 本発明の一実施形態による音声認識装置は、筋電信号を検出する筋電信号検出部と、音声信号を検出する音声信号検出部とを備える。一般に、筋電信号は音声信号に先行して発生するので、筋電信号から音声に先行する非発話区間を特定することができる。この非発話区間で音声信号検出部により周囲の雑音を検出する。この周囲雑音に関する情報により音声認識の精度を向上することができる。一般に、音声信号による音声認識は周囲の雑音の影響を受けやすいが、筋電信号による音声認識は周囲の雑音の影響を受けにくい。そのため、例えば、周囲の雑音レベルに応じて、音声信号による音声認識と筋電信号による音声認識の重みを変えることで、雑音環境下で音声認識の精度を向上することができる。
【選択図】 図1
Description
110 筋電信号検出部
111 筋電信号
112 音声信号検出部
113 音声信号
120 筋電信号処理部
121 処理区間を示す信号
122 音声信号処理部
123 処理区間における筋電信号
124 筋電信号の特徴量
125 音声信号の特徴量
126 周囲の雑音に関連するパラメータ
130 筋電信号認識部
131 筋電信号による認識結果
132 音声信号認識部
133 音声信号による認識結果
140 重み算出部
141 重み
150 認識結果統合部
151 統合した認識結果
160 認識結果出力部
210 筋電信号処理区間検出部
220 筋電信号特徴量算出部
310 非発話区間検出部
311 非発話区間の音声信号
312 発話区間の音声信号
320 発話区間検出部
321 発話区間の音声信号
330 推定SNR算出部
340 発話区間切換部
341 発話区間の音声信号
350 音声信号特徴量算出部
Claims (10)
- 音声信号と筋電信号を用いて音声を認識する方法であって、
筋電信号から音声の発話区間を検出するステップと、
前記検出された発話区間において音声信号を検出するステップと、
前記発話区間において検出された音声信号に基づいて音声認識を行うステップと
を備えることを特徴とする音声認識方法。 - 音声信号に基づく音声認識結果と筋電信号に基づく音声認識結果を統合して音声を認識する方法であって、
筋電信号から音声の非発話区間を検出するステップと、
前記非発話区間において周囲の雑音を検出して雑音に関連するパラメータを算出するステップと、
前記雑音に関連するパラメータに応じて前記音声信号に基づく音声認識結果と前記筋電信号に基づく音声認識結果を統合するステップと
を備えることを特徴とする音声認識方法。 - 請求項2に記載の音声認識方法であって、
前記統合するステップは、前記雑音に関連するパラメータに応じて前記音声信号に基づく認識結果と前記筋電信号に基づく認識結果の重みを変えることで認識結果を統合することを特徴とする音声認識方法。 - 音声信号と筋電信号を用いて音声を認識する方法であって、
筋電信号から音声の発話区間と非発話区間を検出するステップと、
音声信号から音声の発話区間を検出するステップと、
前記検出された非発話区間において周囲の雑音を検出して雑音に関連するパラメータを算出するステップと、
前記算出された雑音に関連するパラメータに応じて前記音声信号から検出された発話区間と前記筋電信号から検出された発話区間とのいずれかを選択するステップと、
前記選択された発話区間において検出された音声信号に基づいて音声認識を行うステップと
を備えることを特徴とする音声認識方法。 - 請求項1ないし4のいずれかに記載の音声認識方法において、
筋電信号から音声の発話区間または非発話区間を検出するステップは、複数のチャンネルから得られた筋電信号を掛け合わせて処理することを特徴とする音声認識方法。 - 音声信号と筋電信号を用いて音声を認識する装置であって、
筋電信号を検出する筋電信号検出手段と、
音声信号を検出する音声信号検出手段と、
前記検出された筋電信号を処理して音声の発話区間を検出する発話区間検出手段と、
前記発話区間において検出された音声信号を処理して音声の特徴量を算出する特徴量算出手段と、
前記算出された音声の特徴量に基づいて音声認識を行う音声認識手段と
を備えたことを特徴とする音声認識装置。 - 音声信号に基づく音声認識結果と筋電信号に基づく音声認識結果を統合して音声を認識する装置であって、
筋電信号を検出する筋電信号検出手段と、
音声信号を検出する音声信号検出手段と、
前記検出された筋電信号を処理して音声の非発話区間を検出する非発話区間検出手段と、
前記検出された非発話区間において検出された音声信号を処理して周囲の雑音に関連するパラメータを算出するパラメータ算出手段と、
前記算出されたパラメータに応じて前記音声信号に基づく音声認識結果と前記筋電信号に基づく音声認識結果を統合する音声認識結果統合手段と
を備えたことを特徴とする音声認識装置。 - 請求項7に記載の音声認識装置において、
前記音声信号に基づく音声認識結果と前記筋電信号に基づく音声認識結果を統合するための重みを算出する重み算出部をさらに備えたことを特徴とする音声認識装置。 - 音声信号と筋電信号を用いて音声を認識する装置であって、
筋電信号を検出する筋電信号検出手段と、
音声信号を検出する音声信号検出手段と、
前記検出された筋電信号を処理して音声の発話区間と非発話区間を検出する第1の発話区間検出手段と、
前記検出された音声信号を処理して音声の発話区間を検出する第2の発話区間検出手段と、
前記検出された非発話区間において検出された音声信号を処理して周囲の雑音に関連するパラメータを算出するパラメータ算出手段と、
前記算出されたパラメータに応じて前記音声信号から検出された発話区間と前記筋電信号から検出された発話区間のいずれかを選択する発話区間選択手段と、
前記選択された発話区間において検出された音声信号に基づいて音声認識を行う音声認識手段と
を備えたことを特徴とする音声認識装置。 - 請求項6ないし9のいずれかに記載の音声認識装置において、
筋電信号から音声の発話区間または非発話区間を検出する発話区間検出手段は、複数のチャンネルから検出された筋電信号を掛け合わせて処理することを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005086805A JP4632831B2 (ja) | 2005-03-24 | 2005-03-24 | 音声認識方法および音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005086805A JP4632831B2 (ja) | 2005-03-24 | 2005-03-24 | 音声認識方法および音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006267664A true JP2006267664A (ja) | 2006-10-05 |
JP4632831B2 JP4632831B2 (ja) | 2011-02-16 |
Family
ID=37203707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005086805A Expired - Fee Related JP4632831B2 (ja) | 2005-03-24 | 2005-03-24 | 音声認識方法および音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4632831B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010185975A (ja) * | 2009-02-10 | 2010-08-26 | Denso Corp | 車載音声認識装置 |
JP2013520707A (ja) * | 2010-02-24 | 2013-06-06 | クゥアルコム・インコーポレイテッド | 複数の音声区間検出器に基づく音声区間検出 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001092974A (ja) * | 1999-08-06 | 2001-04-06 | Internatl Business Mach Corp <Ibm> | 話者認識方法及びその実行装置並びに音声発生確認方法及び装置 |
JP2002358089A (ja) * | 2001-06-01 | 2002-12-13 | Denso Corp | 音声処理装置及び音声処理方法 |
JP2003233392A (ja) * | 2002-02-08 | 2003-08-22 | Altia Co Ltd | 車両用音声入力装置 |
JP2003255993A (ja) * | 2002-03-04 | 2003-09-10 | Ntt Docomo Inc | 音声認識システム、音声認識方法、音声認識プログラム、音声合成システム、音声合成方法、音声合成プログラム |
JP2005010652A (ja) * | 2003-06-20 | 2005-01-13 | Ntt Docomo Inc | 音声検出装置 |
-
2005
- 2005-03-24 JP JP2005086805A patent/JP4632831B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001092974A (ja) * | 1999-08-06 | 2001-04-06 | Internatl Business Mach Corp <Ibm> | 話者認識方法及びその実行装置並びに音声発生確認方法及び装置 |
JP2002358089A (ja) * | 2001-06-01 | 2002-12-13 | Denso Corp | 音声処理装置及び音声処理方法 |
JP2003233392A (ja) * | 2002-02-08 | 2003-08-22 | Altia Co Ltd | 車両用音声入力装置 |
JP2003255993A (ja) * | 2002-03-04 | 2003-09-10 | Ntt Docomo Inc | 音声認識システム、音声認識方法、音声認識プログラム、音声合成システム、音声合成方法、音声合成プログラム |
JP2005010652A (ja) * | 2003-06-20 | 2005-01-13 | Ntt Docomo Inc | 音声検出装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010185975A (ja) * | 2009-02-10 | 2010-08-26 | Denso Corp | 車載音声認識装置 |
JP2013520707A (ja) * | 2010-02-24 | 2013-06-06 | クゥアルコム・インコーポレイテッド | 複数の音声区間検出器に基づく音声区間検出 |
Also Published As
Publication number | Publication date |
---|---|
JP4632831B2 (ja) | 2011-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1569422B1 (en) | Method and apparatus for multi-sensory speech enhancement on a mobile device | |
US10540979B2 (en) | User interface for secure access to a device using speaker verification | |
US9305567B2 (en) | Systems and methods for audio signal processing | |
US6691090B1 (en) | Speech recognition system including dimensionality reduction of baseband frequency signals | |
US9959886B2 (en) | Spectral comb voice activity detection | |
US10755731B2 (en) | Apparatus, method, and non-transitory computer-readable storage medium for storing program for utterance section detection | |
JP2011033717A (ja) | 雑音抑圧装置 | |
US20190180758A1 (en) | Voice processing apparatus, voice processing method, and non-transitory computer-readable storage medium for storing program | |
KR20150104345A (ko) | 음성 합성 장치 및 음성 합성 방법 | |
US20100082338A1 (en) | Voice processing apparatus and voice processing method | |
WO2013132337A2 (en) | Formant based speech reconstruction from noisy signals | |
JP2012168296A (ja) | 音声による抑圧状態検出装置およびプログラム | |
US20190088272A1 (en) | Apparatus, method for detecting speech production interval, and non-transitory computer-readable storage medium for storing speech production interval detection computer program | |
JP4858663B2 (ja) | 音声認識方法及び音声認識装置 | |
JP4632831B2 (ja) | 音声認識方法および音声認識装置 | |
US11978433B2 (en) | Multi-encoder end-to-end automatic speech recognition (ASR) for joint modeling of multiple input devices | |
KR20190125064A (ko) | 음성 유사도 판단 장치 및 음성 유사도 판단 방법 | |
KR20150112168A (ko) | 음성 인식 향상 장치 및 방법 | |
Tiwari et al. | Speech enhancement using noise estimation with dynamic quantile tracking | |
Heracleous et al. | Fusion of standard and alternative acoustic sensors for robust automatic speech recognition | |
GB2580655A (en) | Reducing a noise level of an audio signal of a hearing system | |
Zhu et al. | Lbp based recursive averaging for babble noise reduction applied to automatic speech recognition | |
JP6790851B2 (ja) | 音声処理プログラム、音声処理方法、及び音声処理装置 | |
Muhammad | Noise-robust pitch detection using auto-correlation function with enhancements | |
Bulbuller et al. | In-ear microphone speech data segmentation and recognition using neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071002 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080625 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101116 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4632831 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131126 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |