JP2006215317A - 音声認識システム、音声認識装置及び音声認識プログラム - Google Patents
音声認識システム、音声認識装置及び音声認識プログラム Download PDFInfo
- Publication number
- JP2006215317A JP2006215317A JP2005028715A JP2005028715A JP2006215317A JP 2006215317 A JP2006215317 A JP 2006215317A JP 2005028715 A JP2005028715 A JP 2005028715A JP 2005028715 A JP2005028715 A JP 2005028715A JP 2006215317 A JP2006215317 A JP 2006215317A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- voice
- data
- speech
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
音声認識技術を用いて、ユーザの音声による特定の機能の指示を受け付ける音声認識システム、音声認識装置及び音声認識プログラムを提供する。
【解決手段】
音声データに基づいて算出された信頼度は所定条件を満たさない場合に、音声認識部は、当該音声データを記憶し、応答部は、ユーザの指示が受理できない旨を通知し、通知後に入力された音声データに基づいて算出された信頼度が所定条件を満たす場合、又は、操作部によって機能を特定する指示がされた場合に、応答部は、音声認識部に記憶された音声データを音声認識対象の語彙データとして認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、音声認識部は、問い合わせに対応するユーザの指示に基づいて、当該音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶することを特徴とする。
【選択図】 図2
Description
102 音声認識部
103 判定部
104 応答部
105 音声記憶部
106、302 認識辞書記憶部
107 操作部
301 追加認識辞書記憶部
Claims (7)
- ユーザが発した音声の入力によって、機能を特定する指示を受け付ける音声認識システムであって、
ユーザが発した音声を音声データに変換する音声入力部と、
前記音声データを一時的に記憶する音声記憶部と、
音声認識対象の語彙データを記憶する認識辞書記憶部と、
前記音声データに対応する前記語彙データを認識し、当該音声データの認識の信頼度を算出する音声認識部と、
前記信頼度と所定条件との比較結果に基づいて、前記認識された語彙データを特定の機能の選択の指示として受理するか否かを判定する判定部と、
ユーザに情報を伝達する応答部と、
ユーザの操作入力を受け付ける操作部と、を備え、
前記音声データに基づいて算出された信頼度は所定条件を満たさない場合に、
前記音声認識部は、当該音声データを記憶し、
前記応答部は、ユーザの指示が受理できない旨を通知し、
前記通知後に入力された音声データに基づいて算出された信頼度が所定条件を満たす場合、又は、前記操作部によって機能を特定する指示がされた場合に、
前記応答部は、前記音声認識部に記憶された音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、
前記音声認識部は、前記問い合わせに対応するユーザの指示に基づいて、当該音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶することを特徴とする音声認識システム。 - 前記語彙データは、音声の発音を表す識別子、及び/又は、人の発声から得られた音声特徴量列によって構成されることを特徴とする請求項1に記載の音声認識システム。
- 初期設定では音声認識対象としない第2の語彙データを記憶する追加音声認識辞書記憶部を備え、
前記音声データに基づいて算出された信頼度が所定条件を満たす場合、又は、前記操作部によって機能を特定する指示がされた場合に、
前記音声認識部は、前記追加音声認識辞書記憶部から、ユーザによって指示された機能に関する第2の語彙データを抽出し、
前記応答部は、
前記音声認識部に記憶された音声データと当該抽出された第2の語彙データとの信頼度を算出し、
当該信頼度が所定条件を満たす場合に、当該抽出された第2の語彙データを前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、
前記音声認識部は、ユーザの指示に基づいて、当該抽出された第2の語彙データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶することを特徴とする請求項1に記載の音声認識システム。 - 前記特定の機能は、階層的に構成されたメニューによって選択され、
前記認識辞書記憶部は、前記階層毎の語彙データを記憶しており、
前記音声認識部は、指示された階層の語彙データを用いて前記音声データを認識し、
前記音声データに基づいて算出された信頼度が所定条件を満たす場合、又は、前記操作部によって機能を特定する指示がされた場合に、
前記応答部は、前記音声記憶部に記憶された音声が発声された時点での階層が最上層でなかった場合に、前記音声認識部に記憶された音声データを、どの階層の音声認識対象の語彙データとして前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせることを特徴とする請求項1から3の何れか一つに記載の音声認識システム。 - ユーザが発した音声を認識する音声認識装置であって、
ユーザが発した音声を音声データに変換する音声入力部と、
前記音声データを一時的に記憶する音声記憶部と、
音声認識対象の語彙データを記憶する認識辞書記憶部と、
前記音声データに対応する前記語彙データを認識し、当該音声データの認識の信頼度を算出する音声認識部と、
前記信頼度と所定条件の比較結果に基づいて、前記認識された語彙データを特定の機能の選択の指示として受理するか否かを判定する判定部と、を備え、
前記音声データに基づいて算出された信頼度は所定条件を満たさない場合に、前記音声認識部は、当該音声データを記憶し、
前記音声データの記憶後に入力された音声データに基づいて算出された信頼度が所定条件を満たす場合に、前記音声認識部は、当該音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶することを特徴とする音声認識装置。 - ユーザに情報を伝達する応答部を備え、
前記応答部は、前記音声認識部に記憶された音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、
前記音声認識部は、前記問い合わせに対応するユーザからの指示に基づいて、当該音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶することを特徴とする請求項5に記載の音声認識装置。 - ユーザが発した音声を音声データに変換する音声入力部と、前記音声データを一時的に記憶する音声記憶部と、音声認識対象の語彙データを記憶する認識辞書記憶部と、前記音声データに対応する前記語彙データを認識し、当該音声データの認識の信頼度を算出する音声認識部と、前記信頼度と所定条件の比較結果に基づいて、前記認識された語彙データを特定の機能の選択の指示として受理するか否かを判定する判定部と、ユーザに情報を伝達する応答部と、ユーザの操作入力を受け付ける操作部と、を備えた音声認識システムに以下の手順を実行させて、ユーザが発した音声によって、機能を特定する指示を受け付ける音声認識プログラムであって、
前記音声データに基づいて算出された信頼度は所定条件を満たさない場合に、当該音声データを記憶し、ユーザに認識結果が受理できなかった旨を通知する第1のステップと、
前記通知後に入力された音声データに基づいて算出された信頼度が所定条件を満たす場合、又は、前記操作部によって機能を特定する指示がされた場合に、前記音声認識部に記憶された音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶させるか否かをユーザに問い合わせ、前記問い合わせに対応するユーザの指示に基づいて、当該音声データを音声認識対象の語彙データとして前記認識辞書記憶部に記憶する第2のステップと、を含むことを特徴とする音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005028715A JP4639094B2 (ja) | 2005-02-04 | 2005-02-04 | 音声認識システム、音声認識装置及び音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005028715A JP4639094B2 (ja) | 2005-02-04 | 2005-02-04 | 音声認識システム、音声認識装置及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006215317A true JP2006215317A (ja) | 2006-08-17 |
JP4639094B2 JP4639094B2 (ja) | 2011-02-23 |
Family
ID=36978596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005028715A Expired - Fee Related JP4639094B2 (ja) | 2005-02-04 | 2005-02-04 | 音声認識システム、音声認識装置及び音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4639094B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072081A (ja) * | 2008-09-16 | 2010-04-02 | Denso Corp | 音声認識用辞書作成装置 |
JP2010091962A (ja) * | 2008-10-10 | 2010-04-22 | Denso Corp | 情報処理装置,インタフェース提供方法およびプログラム |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
WO2019142427A1 (ja) * | 2018-01-16 | 2019-07-25 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
WO2019163247A1 (ja) * | 2018-02-22 | 2019-08-29 | ソニー株式会社 | 情報処理装置、情報処理方法、および、プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04204700A (ja) * | 1990-11-30 | 1992-07-27 | Fujitsu Ten Ltd | 音声認識装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
WO2004086360A1 (de) * | 2003-03-25 | 2004-10-07 | Siemens Aktiengesellschaft | Verfahren zur sprecherabhängigen spracherkennung und spracherkennungssystem |
JP2004294872A (ja) * | 2003-03-27 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識を利用した電子機器 |
-
2005
- 2005-02-04 JP JP2005028715A patent/JP4639094B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04204700A (ja) * | 1990-11-30 | 1992-07-27 | Fujitsu Ten Ltd | 音声認識装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
WO2004086360A1 (de) * | 2003-03-25 | 2004-10-07 | Siemens Aktiengesellschaft | Verfahren zur sprecherabhängigen spracherkennung und spracherkennungssystem |
JP2004294872A (ja) * | 2003-03-27 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識を利用した電子機器 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072081A (ja) * | 2008-09-16 | 2010-04-02 | Denso Corp | 音声認識用辞書作成装置 |
JP2010091962A (ja) * | 2008-10-10 | 2010-04-22 | Denso Corp | 情報処理装置,インタフェース提供方法およびプログラム |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
JPWO2016151698A1 (ja) * | 2015-03-20 | 2017-05-25 | 株式会社東芝 | 対話装置、方法及びプログラム |
WO2019142427A1 (ja) * | 2018-01-16 | 2019-07-25 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JPWO2019142427A1 (ja) * | 2018-01-16 | 2020-11-19 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP7234926B2 (ja) | 2018-01-16 | 2023-03-08 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
WO2019163247A1 (ja) * | 2018-02-22 | 2019-08-29 | ソニー株式会社 | 情報処理装置、情報処理方法、および、プログラム |
JPWO2019163247A1 (ja) * | 2018-02-22 | 2021-02-04 | ソニー株式会社 | 情報処理装置、情報処理方法、および、プログラム |
US11398221B2 (en) | 2018-02-22 | 2022-07-26 | Sony Corporation | Information processing apparatus, information processing method, and program |
JP7375741B2 (ja) | 2018-02-22 | 2023-11-08 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、および、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4639094B2 (ja) | 2011-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6463825B2 (ja) | 多重話者音声認識修正システム | |
JP4542974B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP4481972B2 (ja) | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム | |
JP3935844B2 (ja) | 入力された音声のトランスクリプションおよび表示 | |
US8954329B2 (en) | Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information | |
JP4304952B2 (ja) | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム | |
US7826945B2 (en) | Automobile speech-recognition interface | |
US20070016421A1 (en) | Correcting a pronunciation of a synthetically generated speech object | |
US20080154591A1 (en) | Audio Recognition System For Generating Response Audio by Using Audio Data Extracted | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
JP2008009153A (ja) | 音声対話システム | |
JP4639094B2 (ja) | 音声認識システム、音声認識装置及び音声認識プログラム | |
JP2008033198A (ja) | 音声対話システム、音声対話方法、音声入力装置、プログラム | |
JP2006208486A (ja) | 音声入力装置 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP2006208905A (ja) | 音声対話装置及び音声対話方法 | |
JP2007183516A (ja) | 音声対話装置及び音声認識方法 | |
JP4951422B2 (ja) | 音声認識装置、および音声認識方法 | |
JP2011180416A (ja) | 音声合成装置、音声合成方法およびカーナビゲーションシステム | |
JP3797003B2 (ja) | 音声出力装置 | |
JP2005157166A (ja) | 音声認識装置、音声認識方法及びプログラム | |
KR101830210B1 (ko) | 적어도 하나의 의미론적 유닛의 집합을 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
JP4946358B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP2007286198A (ja) | 音声合成出力装置 | |
JP2010060729A (ja) | 受付装置、受付方法、及び受付プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070907 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101129 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4639094 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |