JP2005181439A - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP2005181439A JP2005181439A JP2003418412A JP2003418412A JP2005181439A JP 2005181439 A JP2005181439 A JP 2005181439A JP 2003418412 A JP2003418412 A JP 2003418412A JP 2003418412 A JP2003418412 A JP 2003418412A JP 2005181439 A JP2005181439 A JP 2005181439A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- recognition processing
- processing unit
- recognition
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】マイク101を介して入力された発話内容は、第1音声認識処理部103と第2音声認識処理部111において音声認識がなされる。第1音声認識処理部103で認識された結果の類似度が基準値以上であるか否かが判断部110で判断され、基準値以上であれば、第1音声認識処理部103による認識結果を最終的な認識結果として決定する。基準値未満の場合は、第2音声認識処理部111で認識された結果の類似度が基準値以上であるか否かが判断部118にて判断され、基準値以上であれば、第2音声認識処理部111による認識結果を最終的な認識結果として決定する。第2音声認識手段処理部111による音声認識結果の類似度も基準値未満の場合は、認識不能となる。
【選択図】 図1
Description
図1は、本発明による音声認識装置の一実施の形態を示すブロック図である。音声認識装置100は、発話者の発話を入力するマイク101と、マイク101から入力された発話内容を認識する第1音声認識処理部103および第2音声認識処理部111と、第1音声認識処理部103または第2音声認識処理部111で認識された認識結果を出力するスピーカー102とを備えている。
第1の実施の形態における音声認識装置においては、第1音声認識処理部103と第2音声認識処理部111の認識能力については特に言及しなかった。この変形例においては、各音声認識処理部の認識能力が異なる場合について特に詳細に説明する。各音声認識処理部の認識能力が異なる場合には、以下のように各音声認識処理部を使い分けることにより、効率よく音声認識を行うことが可能となる。
変形例1においては、各音声認識処理部のRAMに格納する待ち受け単語は、それぞれの音声認識処理部の認識能力に基づいて異なったものを格納した。これに対して、この変形例においては、それぞれの音声認識処理部の認識能力が異なるものの、各音声認識処理部のRAMに格納する待ち受け単語の全てもしくは一部は共通なものとする。
変形例1および2のように、第1音声認識処理部103と第2音声認識処理部111の認識能力が異なる場合においては、第1の実施の形態における図2のステップS50およびS80で使用される基準値は、一義的に設定することができない。このため、各音声認識処理部の処理能力に応じた基準値を設定する必要がある。変形例3においては、変形例2と同様に各音声認識処理部のRAMには、全てもしくは一部が共通な待ち受け単語を記憶しておく。そして、発話内容が正常認識されたときの各音声認識処理部によって算出された同一の待ち受け単語の類似度に基づいて基準値を設定する。以下、詳細に説明する。
(1)上記の説明においては、最終的な認識結果を決定するに当たって、まず第1音声認識処理部103による音声認識結果の類似度が基準値以上であるかを判断部110にて判定した。そして、第1音声認識処理部103の認識結果が基準値未満であれば第2音声認識処理部111による認識結果の類似度が基準値以上であるかを判断部118にて判定した。しかし、第1音声認識処理部103による音声認識結果の類似度と第2音声認識処理部111による認識結果の類似度とを得た後、双方の類似度に基づいて最終的な認識結果を決定してもよい。例えば、双方の類似度のうち大きい方を抽出し、抽出した類似度を基準値と比較することにより最終的な認識結果を決定してもよい。
101 マイク
102 スピーカー
103 第1音声認識処理部
104,112 アンプ
105、113 A/Dコンバータ
106、114 D/Aコンバータ
109、117 CPU
110,118 判断部
111 第2音声認識処理部
Claims (4)
- 音声入力手段を介して入力した発話者の発話内容を認識する複数の音声認識処理手段と、
前記複数の音声認識処理手段の認識結果のそれぞれが正しいか否かを判断する判断手段と、
前記判断手段によって正しいと判定された認識結果の中から、所定の条件に基づいて最終的な認識結果を決定する認識結果決定手段とを有することを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記複数の音声認識処理手段は縦列に接続され、
前記判断手段は、一の音声認識処理手段による認識結果が誤認識もしくは認識不能であると判断した場合には、他の音声認識処理手段による認識結果が正しいかを判定することにより、最終的な音声認識結果を得ることを特徴とする音声認識装置。 - 請求項1または2に記載の音声認識装置において、
前記複数の音声認識処理手段ごとに音声認識用の待ち受け単語を格納する待ち受け単語格納手段をさらに有し、
前記待ち受け単語は、必要とされる認識率に基づいて前記複数の音声認識処理手段ごとの待ち受け単語格納手段に格納されることを特徴とする音声認識装置。 - 請求項3に記載の音声認識装置において、
前記複数の音声認識処理手段ごとの待ち受け単語格納手段は、全ての待ち受け単語格納手段に共通する待ち受け単語を少なくとも1つ格納していることを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418412A JP2005181439A (ja) | 2003-12-16 | 2003-12-16 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003418412A JP2005181439A (ja) | 2003-12-16 | 2003-12-16 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005181439A true JP2005181439A (ja) | 2005-07-07 |
Family
ID=34780633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003418412A Pending JP2005181439A (ja) | 2003-12-16 | 2003-12-16 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005181439A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015075903A1 (ja) * | 2013-11-21 | 2015-05-28 | 日産自動車株式会社 | 音声認識装置 |
JP2018537734A (ja) * | 2016-08-26 | 2018-12-20 | 三菱電機株式会社 | ファクトリーオートメーションシステムおよびリモートサーバ |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58208795A (ja) * | 1982-05-28 | 1983-12-05 | 富士通株式会社 | 音声認識に於るリジエクト方式 |
JPS62119599A (ja) * | 1985-11-20 | 1987-05-30 | 富士通株式会社 | 単語音声認識装置 |
JPS63306499A (ja) * | 1987-06-08 | 1988-12-14 | 株式会社リコー | 不特定話者音声認識装置 |
JP2002116796A (ja) * | 2000-10-11 | 2002-04-19 | Canon Inc | 音声処理装置、音声処理方法及び記憶媒体 |
JP2003323196A (ja) * | 2002-05-08 | 2003-11-14 | Nec Corp | 音声認識システム、音声認識方法および音声認識用プログラム |
JP2005003997A (ja) * | 2003-06-12 | 2005-01-06 | Toyota Motor Corp | 音声認識装置および音声認識方法ならびに車両 |
-
2003
- 2003-12-16 JP JP2003418412A patent/JP2005181439A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58208795A (ja) * | 1982-05-28 | 1983-12-05 | 富士通株式会社 | 音声認識に於るリジエクト方式 |
JPS62119599A (ja) * | 1985-11-20 | 1987-05-30 | 富士通株式会社 | 単語音声認識装置 |
JPS63306499A (ja) * | 1987-06-08 | 1988-12-14 | 株式会社リコー | 不特定話者音声認識装置 |
JP2002116796A (ja) * | 2000-10-11 | 2002-04-19 | Canon Inc | 音声処理装置、音声処理方法及び記憶媒体 |
JP2003323196A (ja) * | 2002-05-08 | 2003-11-14 | Nec Corp | 音声認識システム、音声認識方法および音声認識用プログラム |
JP2005003997A (ja) * | 2003-06-12 | 2005-01-06 | Toyota Motor Corp | 音声認識装置および音声認識方法ならびに車両 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015075903A1 (ja) * | 2013-11-21 | 2015-05-28 | 日産自動車株式会社 | 音声認識装置 |
JP2018537734A (ja) * | 2016-08-26 | 2018-12-20 | 三菱電機株式会社 | ファクトリーオートメーションシステムおよびリモートサーバ |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4346571B2 (ja) | 音声認識システム、音声認識方法、及びコンピュータプログラム | |
WO2011148594A1 (ja) | 音声認識システム、音声取得端末、音声認識分担方法および音声認識プログラム | |
US20070061147A1 (en) | Distributed speech recognition method | |
CN107104994B (zh) | 语音识别方法、电子装置及语音识别系统 | |
CN107949880A (zh) | 车载用语音识别装置以及车载设备 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2008033198A (ja) | 音声対話システム、音声対話方法、音声入力装置、プログラム | |
KR102417899B1 (ko) | 차량의 음성인식 시스템 및 방법 | |
EP1477965A1 (en) | Spoken keyword recognition apparatus and method | |
JP5375423B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP2005037615A (ja) | クライアント装置、音声認識サーバ、分散型音声認識システム、音声認識プログラム、およびコンピュータ読み取り可能な記録媒体 | |
KR101444411B1 (ko) | 발화검증 기반 대용량 음성 데이터 자동 처리 장치 및 방법 | |
JP2004109563A (ja) | 音声対話システム、音声対話のためのプログラムおよび音声対話方法 | |
JP2005181439A (ja) | 音声認識装置 | |
JP2020148805A (ja) | 音声認識システム、及び、音声認識方法 | |
JP4951422B2 (ja) | 音声認識装置、および音声認識方法 | |
JP2006039382A (ja) | 音声認識装置 | |
JP2019132997A (ja) | 音声処理装置、方法およびプログラム | |
US20060004573A1 (en) | Microphone initialization enhancement for speech recognition | |
JP2018005163A (ja) | 運転支援装置および運転支援方法 | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
US20200168221A1 (en) | Voice recognition apparatus and method of voice recognition | |
US20240232312A1 (en) | Authentication device and authentication method | |
JP2005024869A (ja) | 音声応答装置 | |
US20220215854A1 (en) | Speech sound response device and speech sound response method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090930 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091027 |