JP4639094B2 - 音声認識システム、音声認識装置及び音声認識プログラム - Google Patents
音声認識システム、音声認識装置及び音声認識プログラム Download PDFInfo
- Publication number
- JP4639094B2 JP4639094B2 JP2005028715A JP2005028715A JP4639094B2 JP 4639094 B2 JP4639094 B2 JP 4639094B2 JP 2005028715 A JP2005028715 A JP 2005028715A JP 2005028715 A JP2005028715 A JP 2005028715A JP 4639094 B2 JP4639094 B2 JP 4639094B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- data
- recognition
- user
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
102 音声認識部
103 判定部
104 応答部
105 音声記憶部
106、302 認識辞書記憶部
107 操作部
301 追加認識辞書記憶部
Claims (6)
- ユーザが発した音声の入力によって、機能を特定する指示を受け付ける音声認識システムであって、
ユーザが発した音声を音声データに変換する音声入力部と、
前記音声データを一時的に記憶する音声記憶部と、
音声認識対象の第1の語彙データを記憶する認識辞書記憶部と、
初期設定では音声認識対象としない第2の語彙データを記憶する追加音声認識辞書記憶部と、
前記音声データに対応する前記第1の語彙データを認識し、当該音声データの認識の信頼度を算出する音声認識部と、
前記信頼度と所定の閾値との比較結果に基づいて、前記認識された第1の語彙データを特定の機能の選択の指示として受理するか否かを判定する判定部と、
ユーザに情報を伝達する応答部と、
ユーザの操作入力を受け付ける操作部と、を備え、
前記音声データに基づいて算出された信頼度が所定の閾値未満である場合に、
前記音声認識部は、当該音声データを前記音声記憶部に記憶し、
前記応答部は、ユーザの指示が受理できない旨を通知し、
前記通知後に入力された音声データに基づいて算出された信頼度が所定の閾値以上である場合であって、かつ、前記通知後に入力された音声データに対応する前記第1の語彙データが機能を特定する指示である場合、又は、前記操作部によって機能を特定する指示がされた場合に、
前記音声認識部は、
前記追加音声認識辞書記憶部から、ユーザによって指示された機能に関する第2の語彙データを抽出し、
前記音声記憶部に記憶された音声データと当該抽出された第2の語彙データとの信頼度を算出し、
前記応答部は、
当該信頼度が所定の閾値以上である場合に、当該抽出された第2の語彙データを前記ユーザによって指示された機能と対応付けて前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、
前記音声認識部は、前記問い合わせに対応するユーザの指示に基づいて、当該抽出された第2の語彙データを前記ユーザによって指示された機能と対応付け、音声認識対象の第1の語彙データとして前記認識辞書記憶部に記憶することを特徴とする音声認識システム。 - 前記応答部は、
前記音声記憶部に記憶された音声データと当該抽出された第2の語彙データとの信頼度が所定の閾値未満である場合に、前記音声記憶部に記憶された音声データを、前記通知後に入力された音声データによって選択された機能、又は、前記操作部によって選択された機能と対応付けて前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、
前記音声認識部は、前記問い合わせに対応するユーザの指示に基づいて、前記音声記憶部に記憶された音声データを、前記通知後に入力された音声データによって選択された機能、又は、前記操作部によって選択された機能と対応付け、音声認識対象の第1の語彙データとして前記認識辞書記憶部に記憶することを特徴とする請求項1に記載の音声認識システム。 - 前記第1の語彙データ及び前記第2の語彙データは、音声の発音を表す識別子、及び/又は、人の発声から得られた音声特徴量列によって構成されることを特徴とする請求項1に記載の音声認識システム。
- 前記特定の機能は、階層的に構成されたメニューによって選択され、
前記認識辞書記憶部は、前記階層毎の第1の語彙データを記憶しており、
前記音声認識部は、指示された階層の第1の語彙データを用いて前記音声データを認識し、
前記音声データに基づいて算出された信頼度が所定の閾値以上である場合であって、かつ、当該音声データに対応する前記第1の語彙データが機能を特定する指示である場合、又は、前記操作部によって機能を特定する指示がされた場合に、
前記応答部は、前記音声記憶部に記憶された音声が発声された時点での階層が最上層でなかった場合に、前記音声記憶部に記憶された音声データを、当該音声データによって選択された機能、又は、前記操作部によって選択された機能と対応付け、どの階層の音声認識対象の第1の語彙データとして前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせることを特徴とする請求項1から3の何れか一つに記載の音声認識システム。 - ユーザが発した音声を認識する音声認識装置であって、
ユーザが発した音声を音声データに変換する音声入力部と、
前記音声データを一時的に記憶する音声記憶部と、
音声認識対象の第1の語彙データを記憶する認識辞書記憶部と、
初期設定では音声認識対象としない第2の語彙データを記憶する追加音声認識辞書記憶部と、
前記音声データに対応する前記第1の語彙データを認識し、当該音声データの認識の信頼度を算出する音声認識部と、
前記信頼度と所定の閾値の比較結果に基づいて、前記認識された第1の語彙データを特定の機能の選択の指示として受理するか否かを判定する判定部と、
ユーザに情報を伝達する応答部と、を備え、
前記音声データに基づいて算出された信頼度が所定の閾値未満である場合に、前記音声認識部は、当該音声データを前記音声記憶部に記憶し、
前記音声データの記憶後に入力された音声データに基づいて算出された信頼度が所定の閾値以上である場合であって、かつ、前記記憶後に入力された音声データに対応する語彙データが機能を特定する指示である場合に、
前記音声認識部は、
前記追加音声認識辞書記憶部から、ユーザによって指示された機能に関する第2の語彙データを抽出し、
前記音声記憶部に記憶された音声データと当該抽出された第2の語彙データとの信頼度を算出し、
前記応答部は、当該信頼度が所定の閾値以上である場合に、当該抽出された第2の語彙データを前記ユーザによって指示された機能と対応付けて前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、
前記音声認識部は、前記問い合わせに対応するユーザの指示に基づいて、当該抽出された第2の語彙データを前記ユーザによって指示された機能と対応付け、音声認識対象の第1の語彙データとして前記認識辞書記憶部に記憶することを特徴とする音声認識装置。 - ユーザが発した音声を音声データに変換する音声入力部と、前記音声データを一時的に記憶する音声記憶部と、音声認識対象の第1の語彙データを記憶する認識辞書記憶部と、初期設定では音声認識対象としない第2の語彙データを記憶する追加音声認識辞書記憶部と、前記音声データに対応する前記第1の語彙データを認識し、当該音声データの認識の信頼度を算出する音声認識部と、前記信頼度と所定の閾値の比較結果に基づいて、前記認識された第1の語彙データを特定の機能の選択の指示として受理するか否かを判定する判定部と、ユーザに情報を伝達する応答部と、ユーザの操作入力を受け付ける操作部と、を備えた音声認識システムに以下の手順を実行させて、ユーザが発した音声によって、機能を特定する指示を受け付ける音声認識プログラムであって、
前記音声データに基づいて算出された信頼度が所定の閾値未満である場合に、当該音声データを記憶し、ユーザに認識結果が受理できなかった旨を通知する第1のステップと、
前記通知後に入力された音声データに基づいて算出された信頼度が所定の閾値以上である場合であって、かつ、前記通知後に入力された音声データに対応する前記第1の語彙データが機能を特定する指示である場合、又は、前記操作部によって機能を特定する指示がされた場合に、前記追加音声認識辞書記憶部から、ユーザによって指示された機能に関する第2の語彙データを抽出し、前記音声記憶部に記憶された音声データと当該抽出された第2の語彙データとの信頼度を算出し、当該信頼度が所定の閾値以上である場合に、当該抽出された第2の語彙データを前記ユーザによって指示された機能と対応付けて前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、前記問い合わせに対応するユーザの指示に基づいて、当該抽出された第2の語彙データを前記ユーザによって指示された機能と対応付け、音声認識対象の第1の語彙データとして前記認識辞書記憶部に記憶する第2のステップと、を含むことを特徴とする音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005028715A JP4639094B2 (ja) | 2005-02-04 | 2005-02-04 | 音声認識システム、音声認識装置及び音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005028715A JP4639094B2 (ja) | 2005-02-04 | 2005-02-04 | 音声認識システム、音声認識装置及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006215317A JP2006215317A (ja) | 2006-08-17 |
JP4639094B2 true JP4639094B2 (ja) | 2011-02-23 |
Family
ID=36978596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005028715A Expired - Fee Related JP4639094B2 (ja) | 2005-02-04 | 2005-02-04 | 音声認識システム、音声認識装置及び音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4639094B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072081A (ja) * | 2008-09-16 | 2010-04-02 | Denso Corp | 音声認識用辞書作成装置 |
JP5035208B2 (ja) * | 2008-10-10 | 2012-09-26 | 株式会社デンソー | 情報処理装置,インタフェース提供方法およびプログラム |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
US11270074B2 (en) * | 2018-01-16 | 2022-03-08 | Sony Corporation | Information processing apparatus, information processing system, and information processing method, and program |
WO2019163247A1 (ja) * | 2018-02-22 | 2019-08-29 | ソニー株式会社 | 情報処理装置、情報処理方法、および、プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04204700A (ja) * | 1990-11-30 | 1992-07-27 | Fujitsu Ten Ltd | 音声認識装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
WO2004086360A1 (de) * | 2003-03-25 | 2004-10-07 | Siemens Aktiengesellschaft | Verfahren zur sprecherabhängigen spracherkennung und spracherkennungssystem |
JP2004294872A (ja) * | 2003-03-27 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識を利用した電子機器 |
-
2005
- 2005-02-04 JP JP2005028715A patent/JP4639094B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04204700A (ja) * | 1990-11-30 | 1992-07-27 | Fujitsu Ten Ltd | 音声認識装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
WO2004086360A1 (de) * | 2003-03-25 | 2004-10-07 | Siemens Aktiengesellschaft | Verfahren zur sprecherabhängigen spracherkennung und spracherkennungssystem |
JP2004294872A (ja) * | 2003-03-27 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識を利用した電子機器 |
Also Published As
Publication number | Publication date |
---|---|
JP2006215317A (ja) | 2006-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6463825B2 (ja) | 多重話者音声認識修正システム | |
JP4542974B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP4481972B2 (ja) | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム | |
JP4304952B2 (ja) | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム | |
US8954329B2 (en) | Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information | |
JP3935844B2 (ja) | 入力された音声のトランスクリプションおよび表示 | |
US20070016421A1 (en) | Correcting a pronunciation of a synthetically generated speech object | |
JP4855421B2 (ja) | 音声認識装置 | |
US20080154591A1 (en) | Audio Recognition System For Generating Response Audio by Using Audio Data Extracted | |
JP2007256836A (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP2007011380A (ja) | 自動車インターフェース | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
JP3803029B2 (ja) | 音声認識装置 | |
JP4639094B2 (ja) | 音声認識システム、音声認識装置及び音声認識プログラム | |
US20030065516A1 (en) | Voice recognition system, program and navigation system | |
JP2008033198A (ja) | 音声対話システム、音声対話方法、音声入力装置、プログラム | |
JP5591428B2 (ja) | 自動記録装置 | |
EP1316944A2 (en) | Sound signal recognition system and method, and dialog control system and method using it | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
KR102069697B1 (ko) | 자동 통역 장치 및 방법 | |
JP2006208905A (ja) | 音声対話装置及び音声対話方法 | |
JP4951422B2 (ja) | 音声認識装置、および音声認識方法 | |
JP2007183516A (ja) | 音声対話装置及び音声認識方法 | |
JP2011039468A (ja) | 電子辞書で音声認識を用いた単語探索装置及びその方法 | |
KR101830210B1 (ko) | 적어도 하나의 의미론적 유닛의 집합을 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070907 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101129 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4639094 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |