JPWO2009147927A1 - 音声認識装置、音声認識方法および電子機器 - Google Patents
音声認識装置、音声認識方法および電子機器 Download PDFInfo
- Publication number
- JPWO2009147927A1 JPWO2009147927A1 JP2010515817A JP2010515817A JPWO2009147927A1 JP WO2009147927 A1 JPWO2009147927 A1 JP WO2009147927A1 JP 2010515817 A JP2010515817 A JP 2010515817A JP 2010515817 A JP2010515817 A JP 2010515817A JP WO2009147927 A1 JPWO2009147927 A1 JP WO2009147927A1
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- candidate
- speech
- likelihood
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000004364 calculation method Methods 0.000 claims abstract description 66
- 238000001914 filtration Methods 0.000 claims abstract description 31
- 238000009826 distribution Methods 0.000 claims description 36
- 238000000605 extraction Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 25
- 230000014509 gene expression Effects 0.000 description 24
- 238000012854 evaluation process Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000005286 illumination Methods 0.000 description 3
- 102100022907 Acrosin-binding protein Human genes 0.000 description 2
- 102100031798 Protein eva-1 homolog A Human genes 0.000 description 2
- 102100040791 Zona pellucida-binding protein 1 Human genes 0.000 description 2
- 101000642536 Apis mellifera Venom serine protease 34 Proteins 0.000 description 1
- 101000756551 Homo sapiens Acrosin-binding protein Proteins 0.000 description 1
- 101100333868 Homo sapiens EVA1A gene Proteins 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
- Navigation (AREA)
Abstract
Description
(a)雑音環境20dB以上では、図3に示すように、第1候補の尤度値はある範囲に収束する。図示していないが、雑音環境10dB以下では、第1候補の尤度値がある範囲に収束しない場合がある。
(b)雑音環境10dB以下の場合でも、第1候補の尤度値と第2候補の尤度値の差と、第2候補の尤度値と第3候補以降の尤度値との差を比べた場合、前者のほうが大きい場合が多く見受けられる。
(a)図4に示した第1候補の尤度値は、図3に示した登録内フレーズを発話した場合と同じ値になる場合がある。
(b)第1候補の尤度値と第2候補以降の尤度値との差があまり大きくない。
(c)第1候補の尤度値が発話者により、一定化しない。
なお、第1式では、≧αで判別しているが、>αで判定してもよい。また、第M候補は第3候補以下のいずれかの候補であればよい。このように第1候補と第2候補の尤度値と、第2候補と第M候補の尤度値との尤度差比を算出することにより認識率を高めることができる。ただし、第1式の演算結果がしきい値αよりも≧であっても、図4に示す登録外フレーズのように第1候補の尤度値と、第2候補の尤度値との差があまり大きくなければ、第1候補とは判定できない。
なお、第2式では、>βで判別しているが、≧βで判定してもよい。多くの場合、第1式および第2式の判定をするだけで、認識率の低い第1候補を棄却することができるので処理速度を早くできる。しかし、第1式および第2式を満足しても、図4に示す登録外フレーズのように第1候補と第3候補以下の候補との尤度値の差が少ない場合もあり得る。すなわち、第1候補を認識候補とするためには、第1候補と第3候補以下の尤度値の差もある程度大きいことが必要である。
なお、第3式では、>Δで判別しているが、≧Δで判定してもよい。このように第1式、第2式および第3式を満足することにより、認識率を高めることができる。
なお、第4式では、>γで判別しているが、≧γで判定してもよい。
または(子供別の第1候補の尤度値×K3)・・・・・・(第5式)
なお、第5式では、≧で判別しているが、>で判定してもよい。
≧(子供の第1候補の尤度値×K3)・・・・・(第6式)
なお、第6式では、≧で判別しているが、>で判定してもよい。
Claims (14)
- 雑音環境下において、発話された音声を登録されているフレーズごとに認識する音声認識装置であって、
前記発話された音声のフレーズごとの音声特徴量を算出する音声特徴量算出手段と、
前記フレーズごとの音声パターン系列情報を記憶するフレーズ記憶手段と、
前記音声特徴量算出手段によって算出されたフレーズごとの音声特徴量と、前記フレーズ記憶手段に記憶されている複数のフレーズの音声パターン系列情報とを比較して尤度値を算出する尤度値算出手段と、
前記尤度値算出手段によって算出された尤度値に基づいて、尤度値の高い順に複数の音声認識候補を選び出す候補抽出手段と、
前記候補抽出手段によって選び出された前記複数の音声認識候補のそれぞれの尤度値の分布に基づいて、前記選び出された音声認識候補を棄却するか否かを判定する認識フィルタリング手段とを備える、音声認識装置。 - 雑音環境下において、発話された音声を登録されているフレーズごとに認識する音声認識装置であって、
前記発話された音声のフレーズごとの音声特徴量を算出する音声特徴量算出手段と、
前記フレーズごとの音声パターン系列情報を記憶するフレーズ記憶手段と、
前記音声特徴量算出手段によって算出されたフレーズごとの音声特徴量と、前記フレーズ記憶手段に記憶されている複数のフレーズの音声パターン系列情報とを比較して複数の音声認識候補の尤度値を算出する尤度値算出手段と、
前記尤度値算出手段によって算出された尤度値に基づいて、尤度値の高い順に第1音声認識候補、前記第1音声認識候補より下位の第2音声認識候補、前記第2音声認識候補よりも下位の第3音声認識候補を選び出す候補抽出手段と、
前記候補抽出手段によって抽出された前記第1音声認識候補と前記第2音声認識候補の尤度値の差と、前記第2音声認識候補と前記第3音声認識候補の尤度値の差との、尤度差比に基づいて、前記抽出された音声認識候補を棄却するか否かを判定する認識フィルタリング手段とを備える、音声認識装置。 - 前記認識フィルタリング手段は、前記尤度差比が、所定の値よりも小さければ、前記第1音声認識候補を棄却し、前記所定の値よりも大きければ、前記第1音声認識候補を音声認識の対象とする、請求項2に記載の音声認識装置。
- 前記フレーズ記憶手段は、音声の特徴別のグループの音声パターン系列情報を記憶しており、
前記認識フィルタリング手段は、音声の特徴別のグループの前記尤度差比に基づいて、前記抽出された第1音声認識候補を棄却するか否かを判定する第1の判定手段を含む、請求項2に記載の音声認識装置。 - 前記認識フィルタリング手段は、前記第1音声認識候補の尤度値と、前記第2音声認識候補の尤度値とに基づいて、前記抽出された第1音声認識候補を棄却するか否かを判定する第2の判定手段を含む、請求項2に記載の音声認識装置。
- 前記尤度値算出手段は、前記第3音声認識候補よりも下位の第4音声認識候補を抽出し、
前記認識フィルタリング手段は、前記第1音声認識候補の尤度値と、前記第4音声認識候補の尤度値との差に基づいて、前記抽出された第1音声認識候補を棄却するか否かを判定する第3の判定手段を含む、請求項2に記載の音声認識装置。 - 前記認識フィルタリング手段は、前記第1音声認識候補の尤度値に基づいて、前記抽出された第1音声認識候補を棄却するか否かを判定する第4の判定手段とを含む、請求項2に記載の音声認識装置。
- 前記候補抽出手段は、前記第1音声認識候補よりも下位の音声認識候補に前記第1音声認識候補の音声パターン系列情報に近似する音声認識候補が存在する場合には、前記音声認識候補を除外し、前記音声認識候補よりも下位の音声認識候補を抽出する、請求項2に記載の音声認識装置。
- 雑音環境下において、発話された音声を登録されているフレーズごとに認識する音声認識方法であって、
前記発話された音声のフレーズごとの音声特徴量を算出するステップと、
前記算出されたフレーズごとの音声特徴量と、予め記憶されている複数のフレーズの音声パターン系列情報とを比較して音声認識の対象とする複数の音声認識候補の尤度値を算出するステップと、
前記各フレーズごとに前記算出された尤度値に基づいて、尤度値の高い順に第1音声認識候補、前記第1音声認識候補より下位の第2音声認識候補、前記第2音声認識候補よりも下位の第3音声認識候補を選び出すステップと、
前記選び出された前記第1音声認識候補と、前記第2音声認識候補の尤度値の差と、前記第2音声認識候補と、前記第3音声認識候補の尤度値の差との尤度差比を比較するステップと、
前記尤度差比が所定の値よりも小さければ、前記第1音声認識候補を棄却し、前記所定の値よりも大きければ、前記第1音声認識候補を前記音声認識の対象とするステップとを備える、音声認識方法。 - 雑音環境下において、発話された音声を登録されているフレーズごとに認識する音声認識装置を備える電子機器であって、
前記音声認識装置は、
前記発話された音声のフレーズごとの音声特徴量を算出する音声特徴量算出手段と、
前記フレーズごとの音声パターン系列情報を記憶するフレーズ記憶手段と、
前記音声特徴量算出手段によって算出されたフレーズごとの音声特徴量と、前記フレーズ記憶手段に記憶されている複数のフレーズの音声パターン系列情報とを比較して尤度値を算出する尤度値算出手段と、
前記尤度値算出手段によって算出された尤度値に基づいて、尤度値の高い順に複数の音声認識候補を選び出す候補抽出手段と、
前記候補抽出手段によって選び出された前記複数の音声認識候補のそれぞれの尤度値の分布に基づいて、前記選び出された音声認識候補を棄却するか否かを判定する認識フィルタリング手段とを備え、
前記電子機器は、
前記音声認識装置によって認識された音声に基づいて、前記電子機器に対して所定の動作を行うよう制御する制御手段を備える、電子機器。 - 前記尤度値算出手段は、複数の音声認識候補の尤度値を算出し、
前記候補抽出手段は、前記尤度値算出手段によって算出された尤度値に基づいて、尤度値の高い順に第1音声認識候補、前記第1音声認識候補より下位の第2音声認識候補、前記第2音声認識候補よりも下位の第3音声認識候補を選び出し、
前記認識フィルタリング手段は、前記候補抽出手段によって抽出された前記第1音声認識候補と前記第2音声認識候補の尤度値の差と、前記第2音声認識候補と前記第3音声認識候補の尤度値の差との、尤度差比に基づいて、前記抽出された音声認識候補を棄却するか否かを判定する、請求項10に記載の電子機器。 - 前記音声認識装置によって認識された音声は、所定の番号と関連付けられており、前記所定の番号は、前記電子機器の具備する動作内容ごとに定められている、請求項10に記載の電子機器。
- 前記動作内容は、2値によって定められている、請求項12に記載の電子機器。
- 前記動作内容は、多値によって定められている、請求項12に記載の電子機器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010515817A JP5467043B2 (ja) | 2008-06-06 | 2009-05-11 | 音声認識装置、音声認識方法および電子機器 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008149732 | 2008-06-06 | ||
JP2008149732 | 2008-06-06 | ||
PCT/JP2009/058784 WO2009147927A1 (ja) | 2008-06-06 | 2009-05-11 | 音声認識装置、音声認識方法および電子機器 |
JP2010515817A JP5467043B2 (ja) | 2008-06-06 | 2009-05-11 | 音声認識装置、音声認識方法および電子機器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009147927A1 true JPWO2009147927A1 (ja) | 2011-10-27 |
JP5467043B2 JP5467043B2 (ja) | 2014-04-09 |
Family
ID=41398004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010515817A Active JP5467043B2 (ja) | 2008-06-06 | 2009-05-11 | 音声認識装置、音声認識方法および電子機器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20110087492A1 (ja) |
EP (1) | EP2293289B1 (ja) |
JP (1) | JP5467043B2 (ja) |
CN (1) | CN102047322B (ja) |
DK (1) | DK2293289T3 (ja) |
HK (1) | HK1157046A1 (ja) |
WO (1) | WO2009147927A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120323967A1 (en) * | 2011-06-14 | 2012-12-20 | Microsoft Corporation | Spelling Using a Fuzzy Pattern Search |
JP2013072974A (ja) * | 2011-09-27 | 2013-04-22 | Toshiba Corp | 音声認識装置、方法及びプログラム |
US10088853B2 (en) | 2012-05-02 | 2018-10-02 | Honeywell International Inc. | Devices and methods for interacting with an HVAC controller |
KR101330671B1 (ko) | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
US10145579B2 (en) | 2013-05-01 | 2018-12-04 | Honeywell International Inc. | Devices and methods for interacting with a control system that is connected to a network |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
GB2552280B (en) * | 2013-06-26 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Speech recognition |
WO2015026933A2 (en) | 2013-08-21 | 2015-02-26 | Honeywell International Inc. | Devices and methods for interacting with an hvac controller |
US10030878B2 (en) | 2013-08-21 | 2018-07-24 | Honeywell International Inc. | User interaction with building controller device using a remote server and a duplex connection |
JP2015125499A (ja) * | 2013-12-25 | 2015-07-06 | 株式会社東芝 | 音声通訳装置、音声通訳方法及び音声通訳プログラム |
US10514677B2 (en) | 2014-04-11 | 2019-12-24 | Honeywell International Inc. | Frameworks and methodologies configured to assist configuring devices supported by a building management system |
US9953632B2 (en) * | 2014-04-17 | 2018-04-24 | Qualcomm Incorporated | Keyword model generation for detecting user-defined keyword |
US9418679B2 (en) * | 2014-08-12 | 2016-08-16 | Honeywell International Inc. | Methods and apparatus for interpreting received speech data using speech recognition |
JP6481939B2 (ja) * | 2015-03-19 | 2019-03-13 | 株式会社レイトロン | 音声認識装置および音声認識プログラム |
US10152298B1 (en) * | 2015-06-29 | 2018-12-11 | Amazon Technologies, Inc. | Confidence estimation based on frequency |
CN105489222B (zh) * | 2015-12-11 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
JP6553111B2 (ja) * | 2017-03-21 | 2019-07-31 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
US10524046B2 (en) | 2017-12-06 | 2019-12-31 | Ademco Inc. | Systems and methods for automatic speech recognition |
CN110493616B (zh) * | 2018-05-15 | 2021-08-06 | 中国移动通信有限公司研究院 | 一种音频信号处理方法、装置、介质和设备 |
US20190390866A1 (en) | 2018-06-22 | 2019-12-26 | Honeywell International Inc. | Building management system with natural language interface |
US11915698B1 (en) * | 2021-09-29 | 2024-02-27 | Amazon Technologies, Inc. | Sound source localization |
CN116959421B (zh) * | 2023-09-21 | 2023-12-19 | 湖北星纪魅族集团有限公司 | 处理音频数据的方法及装置、音频数据处理设备和介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06324699A (ja) * | 1993-05-11 | 1994-11-25 | N T T Data Tsushin Kk | 連続音声認識装置 |
JPH09212189A (ja) * | 1996-02-02 | 1997-08-15 | Ricoh Elemex Corp | 音声認識方法及び装置 |
JPH09258770A (ja) * | 1996-03-19 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識のための話者適応化方法 |
JPH11249688A (ja) * | 1998-03-05 | 1999-09-17 | Mitsubishi Electric Corp | 音声認識装置およびその方法 |
JP2001215996A (ja) * | 2000-01-31 | 2001-08-10 | Sumitomo Electric Ind Ltd | 音声認識装置 |
JP2003036094A (ja) * | 2001-07-23 | 2003-02-07 | Oki Electric Ind Co Ltd | 音声対話装置及び音声対話処理方法 |
JP2004177551A (ja) * | 2002-11-26 | 2004-06-24 | Matsushita Electric Ind Co Ltd | 音声認識用未知発話検出装置及び音声認識装置 |
JP2006215315A (ja) * | 2005-02-04 | 2006-08-17 | Kddi Corp | 音声認識装置、音声認識端末装置、音声認識システム及びコンピュータプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0760318B2 (ja) * | 1986-09-29 | 1995-06-28 | 株式会社東芝 | 連続音声認識方式 |
JP3576272B2 (ja) * | 1995-06-22 | 2004-10-13 | シャープ株式会社 | 音声認識装置および方法 |
US6574596B2 (en) * | 1999-02-08 | 2003-06-03 | Qualcomm Incorporated | Voice recognition rejection scheme |
US6577997B1 (en) * | 1999-05-28 | 2003-06-10 | Texas Instruments Incorporated | System and method of noise-dependent classification |
US7526539B1 (en) * | 2000-01-04 | 2009-04-28 | Pni Corporation | Method and apparatus for a distributed home-automation-control (HAC) window |
US6952676B2 (en) * | 2000-07-11 | 2005-10-04 | Sherman William F | Voice recognition peripheral device |
US7003465B2 (en) * | 2000-10-12 | 2006-02-21 | Matsushita Electric Industrial Co., Ltd. | Method for speech recognition, apparatus for the same, and voice controller |
US6876968B2 (en) * | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
JP4604424B2 (ja) | 2001-08-07 | 2011-01-05 | カシオ計算機株式会社 | 音声認識装置及び方法、並びにプログラム |
US7822612B1 (en) * | 2003-01-03 | 2010-10-26 | Verizon Laboratories Inc. | Methods of processing a voice command from a caller |
CN1957397A (zh) * | 2004-03-30 | 2007-05-02 | 先锋株式会社 | 声音识别装置和声音识别方法 |
US7778830B2 (en) * | 2004-05-19 | 2010-08-17 | International Business Machines Corporation | Training speaker-dependent, phrase-based speech grammars using an unsupervised automated technique |
JP4459267B2 (ja) | 2005-02-28 | 2010-04-28 | パイオニア株式会社 | 辞書データ生成装置及び電子機器 |
US7941316B2 (en) * | 2005-10-28 | 2011-05-10 | Microsoft Corporation | Combined speech and alternate input modality to a mobile device |
US7653543B1 (en) * | 2006-03-24 | 2010-01-26 | Avaya Inc. | Automatic signal adjustment based on intelligibility |
CN101118745B (zh) * | 2006-08-04 | 2011-01-19 | 中国科学院声学研究所 | 语音识别系统中的置信度快速求取方法 |
-
2009
- 2009-05-11 WO PCT/JP2009/058784 patent/WO2009147927A1/ja active Application Filing
- 2009-05-11 EP EP09758194A patent/EP2293289B1/en not_active Not-in-force
- 2009-05-11 CN CN200980119624.2A patent/CN102047322B/zh not_active Expired - Fee Related
- 2009-05-11 DK DK09758194.6T patent/DK2293289T3/da active
- 2009-05-11 US US12/995,267 patent/US20110087492A1/en not_active Abandoned
- 2009-05-11 JP JP2010515817A patent/JP5467043B2/ja active Active
-
2011
- 2011-10-20 HK HK11111251.8A patent/HK1157046A1/xx not_active IP Right Cessation
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06324699A (ja) * | 1993-05-11 | 1994-11-25 | N T T Data Tsushin Kk | 連続音声認識装置 |
JPH09212189A (ja) * | 1996-02-02 | 1997-08-15 | Ricoh Elemex Corp | 音声認識方法及び装置 |
JPH09258770A (ja) * | 1996-03-19 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識のための話者適応化方法 |
JPH11249688A (ja) * | 1998-03-05 | 1999-09-17 | Mitsubishi Electric Corp | 音声認識装置およびその方法 |
JP2001215996A (ja) * | 2000-01-31 | 2001-08-10 | Sumitomo Electric Ind Ltd | 音声認識装置 |
JP2003036094A (ja) * | 2001-07-23 | 2003-02-07 | Oki Electric Ind Co Ltd | 音声対話装置及び音声対話処理方法 |
JP2004177551A (ja) * | 2002-11-26 | 2004-06-24 | Matsushita Electric Ind Co Ltd | 音声認識用未知発話検出装置及び音声認識装置 |
JP2006215315A (ja) * | 2005-02-04 | 2006-08-17 | Kddi Corp | 音声認識装置、音声認識端末装置、音声認識システム及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5467043B2 (ja) | 2014-04-09 |
DK2293289T3 (da) | 2012-06-25 |
EP2293289B1 (en) | 2012-05-30 |
HK1157046A1 (en) | 2012-06-22 |
EP2293289A1 (en) | 2011-03-09 |
EP2293289A4 (en) | 2011-05-18 |
WO2009147927A1 (ja) | 2009-12-10 |
US20110087492A1 (en) | 2011-04-14 |
CN102047322A (zh) | 2011-05-04 |
CN102047322B (zh) | 2013-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5467043B2 (ja) | 音声認識装置、音声認識方法および電子機器 | |
EP3132442B1 (en) | Keyword model generation for detecting a user-defined keyword | |
US9373321B2 (en) | Generation of wake-up words | |
EP1936606B1 (en) | Multi-stage speech recognition | |
US9633652B2 (en) | Methods, systems, and circuits for speaker dependent voice recognition with a single lexicon | |
KR101154011B1 (ko) | 다중 모델 적응화와 음성인식장치 및 방법 | |
JP3826032B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
US9009048B2 (en) | Method, medium, and system detecting speech using energy levels of speech frames | |
US7684984B2 (en) | Method for recognizing speech/speaker using emotional change to govern unsupervised adaptation | |
Zelinka et al. | Impact of vocal effort variability on automatic speech recognition | |
WO2021030918A1 (en) | User-defined keyword spotting | |
US20220076683A1 (en) | Data mining apparatus, method and system for speech recognition using the same | |
CN110914897A (zh) | 语音识别系统和语音识别装置 | |
KR20200023893A (ko) | 화자 인증 방법, 화자 인증을 위한 학습 방법 및 그 장치들 | |
CN116343797A (zh) | 语音唤醒方法及相应装置 | |
CN113192501A (zh) | 一种指令词识别方法及装置 | |
JP4784056B2 (ja) | 音声認識機能付制御装置 | |
KR100998230B1 (ko) | 화자 독립 음성 인식 처리 방법 | |
KR101214252B1 (ko) | 다중 모델 적응화장치 및 방법 | |
JP3615088B2 (ja) | 音声認識方法及び装置 | |
US20090254335A1 (en) | Multilingual weighted codebooks | |
KR101427806B1 (ko) | 전투기 조종사 음성명령실행방법 및 이의 음성명령어 인식 시스템 | |
Herbig et al. | Detection of unknown speakers in an unsupervised speech controlled system | |
JP2009265567A (ja) | 音声認識装置と音声認識方法とコンピュータ・プログラムおよびコマンド認識装置 | |
JP7482086B2 (ja) | キーワード検出装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111012 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20121105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5467043 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |