JP6716968B2 - 音声認識装置、音声認識プログラム - Google Patents
音声認識装置、音声認識プログラム Download PDFInfo
- Publication number
- JP6716968B2 JP6716968B2 JP2016043348A JP2016043348A JP6716968B2 JP 6716968 B2 JP6716968 B2 JP 6716968B2 JP 2016043348 A JP2016043348 A JP 2016043348A JP 2016043348 A JP2016043348 A JP 2016043348A JP 6716968 B2 JP6716968 B2 JP 6716968B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice recognition
- processing unit
- likelihood
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 29
- 230000000007 visual effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Description
例えば、音声認識装置10は、ステップS8において、閾値Tを低くするだけでなく、音声認識処理の処理速度を遅くする、あるいは、音声認識処理の処理にかける時間を長くする、といった処理を行うようにしてもよい。即ち、音声認識処理の処理速度を遅くしたり、処理時間を長くしたりすることにより、より正確に音声認識処理を行うことができるようになる。正しい音声認識結果が得られずユーザが同じ言葉を何度も繰り返し入力する場合には、このような正確な音声認識処理を行うための措置を行うことが有効である。
Claims (5)
- ユーザの音声が入力される音声入力部(12)と、
前記音声入力部に入力される音声を記憶する音声記憶部(16)と、
前記音声入力部に入力される音声を認識する音声認識処理部(21)と、
前記音声認識処理部による音声の認識結果の尤度を算出する尤度算出処理部(22)と、
前記尤度算出処理部により算出される尤度が所定の閾値以上である場合に、前記音声認識処理部による音声の認識結果を有効と判定する有効判定処理部(23)と、
前記音声記憶部に記憶されている前回の音声と今回の音声との一致度に基づいて、前回の音声と今回の音声とが同一であるか否かを判定する同一判定処理部(24)と、
前記同一判定処理部により前回の音声と今回の音声とが同一であると判定された場合に、前記閾値を所定の調整値だけ低くする閾値調整処理部(25)と、
を備え、
前記閾値調整処理部が前記閾値を所定の調整値だけ低くしたことをユーザに出力する音声認識装置。 - 前記閾値調整処理部は、前記尤度算出処理部により算出される尤度に応じて前記調整値を変化させる請求項1に記載の音声認識装置。
- 前記閾値調整処理部は、前記尤度算出処理部により算出される尤度が前記閾値以上となった回数に応じて前記調整値を変化させる請求項1または2に記載の音声認識装置。
- 前記有効判定処理部は、前記尤度算出処理部により算出される尤度が所定の閾値よりも小さい場合に、前記音声認識処理部による音声の認識結果を無効と判定するとともに、その判定理由を出力する請求項1から3の何れか1項に記載の音声認識装置。
- ユーザの音声が入力される音声入力部(12)と、前記音声入力部に入力される音声を記憶する音声記憶部(16)と、を備える音声認識装置(10)に、
前記音声入力部に入力される音声を認識する音声認識処理と、
前記音声認識処理による音声の認識結果の尤度を算出する尤度算出処理と、
前記尤度算出処理により算出される尤度が所定の閾値以上である場合に、前記音声認識処理による音声の認識結果を有効と判定する有効判定処理と、
前記音声記憶部に記憶されている前回の音声と今回の音声との一致度に基づいて、前回の音声と今回の音声とが同一であるか否かを判定する同一判定処理と、
前記同一判定処理により前回の音声と今回の音声とが同一であると判定された場合に、前記閾値を所定の調整値だけ低くする閾値調整処理と、
前記閾値調整処理により前記閾値を所定の調整値だけ低くしたことをユーザに出力する処理と、
を実行させる音声認識プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016043348A JP6716968B2 (ja) | 2016-03-07 | 2016-03-07 | 音声認識装置、音声認識プログラム |
PCT/JP2017/001556 WO2017154358A1 (ja) | 2016-03-07 | 2017-01-18 | 音声認識装置、音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016043348A JP6716968B2 (ja) | 2016-03-07 | 2016-03-07 | 音声認識装置、音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017161581A JP2017161581A (ja) | 2017-09-14 |
JP6716968B2 true JP6716968B2 (ja) | 2020-07-01 |
Family
ID=59790301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016043348A Active JP6716968B2 (ja) | 2016-03-07 | 2016-03-07 | 音声認識装置、音声認識プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6716968B2 (ja) |
WO (1) | WO2017154358A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI622029B (zh) * | 2017-09-15 | 2018-04-21 | 驊鉅數位科技有限公司 | 具發音辨識之互動式語文學習系統 |
CN108922520B (zh) * | 2018-07-12 | 2021-06-01 | Oppo广东移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
JP2023154894A (ja) * | 2022-04-08 | 2023-10-20 | キヤノン株式会社 | 情報変換システム、情報処理装置、情報処理方法及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11149294A (ja) * | 1997-11-17 | 1999-06-02 | Toyota Motor Corp | 音声認識装置および音声認識方法 |
JP2003091299A (ja) * | 2001-07-13 | 2003-03-28 | Honda Motor Co Ltd | 車載用音声認識装置 |
JP4074543B2 (ja) * | 2003-04-23 | 2008-04-09 | シャープ株式会社 | 音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体 |
JP2006030915A (ja) * | 2004-07-22 | 2006-02-02 | Iwatsu Electric Co Ltd | 音声認識方法と装置。 |
JP4680714B2 (ja) * | 2005-08-03 | 2011-05-11 | パナソニック株式会社 | 音声認識装置および音声認識方法 |
JPWO2009008115A1 (ja) * | 2007-07-09 | 2010-09-02 | 三菱電機株式会社 | 音声認識装置およびナビゲーションシステム |
-
2016
- 2016-03-07 JP JP2016043348A patent/JP6716968B2/ja active Active
-
2017
- 2017-01-18 WO PCT/JP2017/001556 patent/WO2017154358A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2017161581A (ja) | 2017-09-14 |
WO2017154358A1 (ja) | 2017-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10446155B2 (en) | Voice recognition device | |
CN106796786B (zh) | 语音识别系统 | |
US9251789B2 (en) | Speech-recognition system, storage medium, and method of speech recognition | |
US11056118B2 (en) | Speaker identification | |
US20200075028A1 (en) | Speaker recognition and speaker change detection | |
JP5172973B2 (ja) | 音声認識装置 | |
US20170243581A1 (en) | Using combined audio and vision-based cues for voice command-and-control | |
JP6716968B2 (ja) | 音声認識装置、音声認識プログラム | |
JP5431282B2 (ja) | 音声対話装置、方法、プログラム | |
WO2010128560A1 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
US8781825B2 (en) | Reducing false positives in speech recognition systems | |
JP2020086571A (ja) | 車載装置及び音声認識方法 | |
JP6759058B2 (ja) | 音声認識装置および音声認識方法 | |
JP2006208486A (ja) | 音声入力装置 | |
US20090106025A1 (en) | Speaker model registering apparatus and method, and computer program | |
US20230223014A1 (en) | Adapting Automated Speech Recognition Parameters Based on Hotword Properties | |
JP2011203434A (ja) | 音声認識装置及び音声認識方法 | |
JP2018116206A (ja) | 音声認識装置、音声認識方法及び音声認識システム | |
JP5157596B2 (ja) | 音声認識装置 | |
JP6966374B2 (ja) | 音声認識システム及びコンピュータプログラム | |
JP6811865B2 (ja) | 音声認識装置および音声認識方法 | |
JP6999236B2 (ja) | 音声認識システム | |
JP2020091435A (ja) | 音声認識システム、音声認識システムの通知方法、プログラム、及び移動体搭載機器 | |
KR101610152B1 (ko) | 차량용 음성 인식 시스템 및 그 방법 | |
JP2018091911A (ja) | 音声対話システム及び音声対話方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200512 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200525 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6716968 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |