JP6719127B2 - 音声認識装置、音声認識方法及びコンピュータプログラム - Google Patents
音声認識装置、音声認識方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP6719127B2 JP6719127B2 JP2016135355A JP2016135355A JP6719127B2 JP 6719127 B2 JP6719127 B2 JP 6719127B2 JP 2016135355 A JP2016135355 A JP 2016135355A JP 2016135355 A JP2016135355 A JP 2016135355A JP 6719127 B2 JP6719127 B2 JP 6719127B2
- Authority
- JP
- Japan
- Prior art keywords
- filler
- misrecognition
- list
- voice recognition
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
「be:」がフィラーリスト31の音素列312として登録されていなければ、「be:」は、非フィラーとして検出される。
図1に示すように、実施形態の音声認識処理は、誤認識リスト33−1,・・,33−nの変更処理27を含むことができる。音声認識装置10は、図2のステップS22において、ステップS19において用いられる誤認識リスト33−1,・・,33−nの変更処理27を実行する。変更処理27によって、誤認識リストをカスタマイズできる。誤認識リストのカスタマイズは、評価処理26の精度の向上に役立つ。
実施形態による音声認識装置10では、フィラーリストを用いたフィラー検出精度が低くても、フィラーを精度良く認識することができる。フィラーの精度良い認識は、音声認識処理によるフィラー認識結果を利用するシステムにおいて有用である。フィラー認識結果は、例えば、話し方の改善支援システムとして利用される。意味のないフィラーを口癖として多発させると、聞き手にとって聞きづらいことが多い。聞き手にとって適切な話し方をするには、意味のないフィラーの抑制が望まれる。
本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。
20 プロセッサ
21 音声解析処理
22 フィラー検出処理
23 形態素解析処理
24 評価対象決定処理
25 誤認識リスト選択処理
26 誤認識評価処理
27 誤認識リスト変更処理
28 出力処理
30 メモリ
31 フィラーリスト
32 辞書
33 誤認識テーブル
33a フィラー
33b 音素列
33c 誤認識候補
33d 誤認識候補
33e 誤認識候補
33−1 誤認識リスト
33−n 誤認識リスト
40 マイク
311 フィラー文字列
312 音素列
321 文字列
322 音素列
Claims (12)
- プロセッサと、
メモリと、
を備えた音声認識装置であって、
前記プロセッサは、
発話におけるフィラーを検出する検出処理と、
前記検出処理によってフィラーとして検出されなかった非フィラーが、フィラーを誤認識したものであるかを、前記メモリに記憶されたテーブルに基づいて評価する評価処理と、
を含む音声認識処理を実行するよう構成され、
前記テーブルは、1又は複数の誤認識リストを有し、
前記誤認識リストは、フィラーと、前記フィラーを誤認識して得られる可能性のある1又は複数の誤認識候補を有する
音声認識装置。 - 前記音声認識処理は、前記非フィラー直前の音及び前記非フィラー直後の音が無音である場合に、前記非フィラーを、前記評価処理の対象として決定する決定処理を更に含む
請求項1に記載の音声認識装置。 - 前記決定処理は、前記非フィラー直前の音及び前記非フィラー直後の音が無音であることを、発話から検出された文字列において非フィラーの直前及び直後に位置する文字に基づいて判定する
請求項2に記載の音声認識装置。 - 前記テーブルは、複数の前記誤認識リストを有し、
前記音声認識処理は、前記非フィラーと前記誤認識リストにおけるフィラーとの音の近似性に基づいて、複数の前記誤認識リストから、前記評価処理に用いられる誤認識リストを選択する選択処理を更に含む
請求項1〜3のいずれか1項に記載の音声認識装置。 - 前記非フィラーと前記誤認識リストにおけるフィラーとの音の近似性は、前記非フィラーに含まれる母音と前記誤認識リストにおけるフィラーに含まれる母音に基づいて判定される
請求項4に記載の音声認識装置。 - 前記音声認識処理は、ユーザの発話内容又はユーザ指示に基づいて、前記誤認識リストを変更する変更処理を更に含む
請求項1〜5のいずれか1項に記載の音声認識装置。 - 前記変更処理は、ユーザの発話内容又はユーザ指示に基づいて、前記誤認識リストに含まれる前記誤認識候補を変更することを含む
請求項6に記載の音声認識装置。 - 前記評価処理は、前記非フィラーが、前記誤認識リストに含まれる前記誤認識候補と一致するかどうかを判定することを含む
請求項1〜7のいずれか1項に記載の音声認識装置。 - 前記誤認識リストは、前記誤認識リストに含まれる各誤認識候補が、フィラーを誤認識したものである確率を示す確率情報を有し、
前記評価処理は、前記確率情報を用いて、前記非フィラーが、フィラーを誤認識したものであるかを評価することを含む
請求項1〜8のいずれか1項に記載の音声認識装置。 - 前記音声認識処理は、前記確率情報を変更することを更に含む
請求項9に記載の音声認識装置。 - 音声認識方法であって、
発話におけるフィラーを音声認識装置が検出すること、
発話に含まれる非フィラーがフィラーを誤認識したものであるかを、前記音声認識装置がテーブルに基づいて評価すること、
を含み、
前記テーブルは、1又は複数の誤認識リストを有し、
前記誤認識リストは、フィラーと、前記フィラーを誤認識して得られる可能性のある1又は複数の誤認識候補を有する
音声認識方法。 - コンピュータに、音声認識処理を実行させるためのコンピュータプログラムであって、
前記音声認識処理は、
発話におけるフィラーを検出する検出処理と、
前記検出処理によってフィラーとして検出されなかった非フィラーが、フィラーを誤認識したものであるかを、テーブルに基づいて評価する評価処理と、
を含み、
前記テーブルは、1又は複数の誤認識リストを有し、
前記誤認識リストは、フィラーと、前記フィラーを誤認識して得られる可能性のある1又は複数の誤認識候補を有する
コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016135355A JP6719127B2 (ja) | 2016-07-07 | 2016-07-07 | 音声認識装置、音声認識方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016135355A JP6719127B2 (ja) | 2016-07-07 | 2016-07-07 | 音声認識装置、音声認識方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018005120A JP2018005120A (ja) | 2018-01-11 |
JP6719127B2 true JP6719127B2 (ja) | 2020-07-08 |
Family
ID=60946246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016135355A Active JP6719127B2 (ja) | 2016-07-07 | 2016-07-07 | 音声認識装置、音声認識方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6719127B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020127131A (ja) * | 2019-02-05 | 2020-08-20 | オムロン株式会社 | 携帯端末、放送システム、表示装置、データ受信方法、およびデータ受信プログラム |
JP7015408B1 (ja) * | 2021-10-07 | 2022-02-02 | 真旭 徳山 | 端末装置、情報処理方法、及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005164656A (ja) * | 2003-11-28 | 2005-06-23 | Mitsubishi Electric Corp | 音声認識装置及び音声認識プログラム |
JP5148671B2 (ja) * | 2010-09-15 | 2013-02-20 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム |
-
2016
- 2016-07-07 JP JP2016135355A patent/JP6719127B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018005120A (ja) | 2018-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US10319365B1 (en) | Text-to-speech processing with emphasized output audio | |
US20150255069A1 (en) | Predicting pronunciation in speech recognition | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
KR20010096490A (ko) | 이동통신을 위한 철자 음성인식장치 및 방법 | |
US20090182559A1 (en) | Context sensitive multi-stage speech recognition | |
WO2007010680A1 (ja) | 声質変化箇所特定装置 | |
JP2002511154A (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
JP2008209717A (ja) | 入力された音声を処理する装置、方法およびプログラム | |
US9390709B2 (en) | Voice recognition device and method, and semiconductor integrated circuit device | |
JP2016062069A (ja) | 音声認識方法、及び音声認識装置 | |
Savchenko et al. | Towards the creation of reliable voice control system based on a fuzzy approach | |
JP2016521383A (ja) | 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体 | |
US20020184016A1 (en) | Method of speech recognition using empirically determined word candidates | |
JP2015530614A (ja) | 精度スコアを使用した音声認識性能を予測するための方法およびシステム | |
JP4758919B2 (ja) | 音声認識装置及び音声認識プログラム | |
KR102580904B1 (ko) | 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스 | |
JP6719127B2 (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
JP2015049254A (ja) | 音声データ認識システム及び音声データ認識方法 | |
CN107610691B (zh) | 英语元音发声纠错方法及装置 | |
JP5152588B2 (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP2010197644A (ja) | 音声認識システム | |
Guijarrubia et al. | Text-and speech-based phonotactic models for spoken language identification of Basque and Spanish | |
JP2004133003A (ja) | 音声認識辞書作成方法及びその装置と音声認識装置 | |
Tjalve et al. | Pronunciation variation modelling using accent features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20160729 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20180205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190425 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6719127 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |