JP5408810B2 - 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム - Google Patents
音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム Download PDFInfo
- Publication number
- JP5408810B2 JP5408810B2 JP2011141031A JP2011141031A JP5408810B2 JP 5408810 B2 JP5408810 B2 JP 5408810B2 JP 2011141031 A JP2011141031 A JP 2011141031A JP 2011141031 A JP2011141031 A JP 2011141031A JP 5408810 B2 JP5408810 B2 JP 5408810B2
- Authority
- JP
- Japan
- Prior art keywords
- voice recognition
- recognition command
- command
- influence
- specified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 230000006870 function Effects 0.000 description 112
- 230000000694 effects Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Description
また、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値以上のコマンドについては音声認識コマンドの正否を確認することができ、ユーザにとって影響の大きいコマンドを誤って実行することを確実に防止できる。また、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値未満のコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができ、ユーザの操作負担の増大を確実に抑制することができる。
また、影響度情報格納手段は、所定の機能を実行させるために音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの影響度が所定値以上となるように設定された影響度情報を格納するので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が大きいコマンドを誤って実行することを、一層確実に防止できる。
まず、実施の形態1に係る音声認識制御システムについて説明する。この実施の形態1は、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度と、当該音声認識コマンドの特定結果の信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する形態である。ここで「音声認識コマンド」とは、音声認識制御システムに接続されたナビゲーション装置やエアコン等の各種接続機器に対する操作指示を含み、当該操作指示に伴って必要になる情報を含む、一連の発話内容をいうものとする。
最初に、実施の形態1に係る音声認識制御システムの構成について説明する。図1は、本実施の形態1に係る音声認識制御システムを例示するブロック図である。この音声認識制御システム1は、概略的に、ユーザが発話した音声に基づいて音声認識コマンドを特定する。そして、音声認識制御システム1に接続された各種接続機器(図1の例では、ナビゲーション装置6、エアコン7、オーディオ8、携帯電話9、及びECU10(Electronic Control Unit))に、当該特定した音声認識コマンドに対応する機能を実行させる。
制御部11は、音声認識制御システム1を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態1に係る音声認識制御プログラムは、任意の記録媒体又はネットワークを介して音声認識制御システム1にインストールされることで、制御部11の各部を実質的に構成する。
データ記録部12は、音声認識制御システム1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記憶装置としてのハードディスク(図示省略)の如き磁気的記録媒体を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、フラッシュメモリの如き半導体型記憶媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。
図1に戻り、マイク2は、音声を電気信号に変換して音声認識制御システム1に出力する。このマイク2としては、公知のマイクを用いることができる。
タッチパネル3は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル3は、透明又は半透明状に形成され、ディスプレイ4の前面において当該ディスプレイ4の表示面と重畳するように設けられている。このタッチパネル3としては、例えば抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。
ディスプレイ4は、音声認識制御システム1の制御に基づいて情報を表示にて出力する表示出力手段である。なお、このディスプレイ4の具体的な構成は任意であり、公知の液晶ディスプレイや有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。
スピーカ5は、音声認識制御システム1の制御に基づいて情報を音声にて出力する音声出力手段である。スピーカ5から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。
次に、このように構成された音声認識制御システム1によって実行される音声認識制御処理について説明する。図4は音声認識制御処理のフローチャートである(以下の各処理の説明ではステップを「S」と略記する)。この音声認識制御処理は、例えば、音声認識制御システム1に電源が投入された後に起動される。
このように本実施の形態1によれば、判定部11bは、影響度DB12aに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザにとって相対的に影響の大きいコマンドについては音声認識結果についての正否を確認し、ユーザにとって相対的に影響の小さいコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる。
次に、実施の形態2について説明する。この実施の形態2は、ユーザの発話音声に含まれる単語毎に信頼度を特定する形態である。なお、実施の形態2の構成は、特記する場合を除いて、実施の形態1の構成と略同一であり、実施の形態1の構成と略同一の構成についてはこの実施の形態1で用いたものと同一の符号及び/又は名称を必要に応じて付して、その説明を省略する。
まず、実施の形態2に係るデータ記録部12について説明する。図8は、実施の形態2に係る判定テーブル12bに格納されている情報を例示した表である。この図8に示すように、判定テーブル12bには、音声認識コマンド特定部11aにより特定された音声認識コマンドに含まれる各単語の信頼度の組み合わせを特定する信頼度情報(図8では、「全て3」、「「全て3」又は「全て1」以外」、及び「全て1」)と、音声認識コマンドの影響度を特定する影響度情報(図8では1から3の整数)との双方に対応付けて、判定部11bによる判定内容を特定する判定情報が格納されている(例えば、信頼度「全て3」及び影響度「3」に対応して「ユーザに確認」等)。なお、この判定テーブル12bに格納されている情報を用いた処理の詳細については後述する。
次に、実施の形態2に係る音声認識制御処理について説明する。なお、本実施の形態2に係る音声認識制御処理における各処理は、図4のSA4、6、9、及び10の各処理の内容を除き、実施の形態1で説明した音声認識制御処理と同じであるので、図示及び説明を省略する。
このように本実施の形態2によれば、音声認識コマンド特定部11aは、当該音声認識コマンド特定部11aが認識したユーザの発話音声に含まれる各単語の信頼度を特定し、判定部11bは、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度と、音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザの発話音声に含まれる単語がユーザの意図する単語とは異なる可能性が高い場合には当該単語について音声認識結果の正否を確認し、ユーザの発話音声に含まれる単語がユーザの意図する単語とは異なる可能性が低い場合には音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザの意図するコマンドとは異なるコマンドを誤って実行することを一層確実に防止できる。
以上、本発明に係る各実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成できる。例えば、音声認識制御システム1を一体の装置として車両に搭載してもよく、あるいは制御部11やデータ記録部12をネットワーク上に分散配置してもよい。
上述の各実施の形態では、判定部11bが、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度と、当該音声認識コマンドについて音声認識コマンド特定部11aにより特定された信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する場合を例として説明したが、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度のみに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するようにしてもよい。この場合、図4に示した音声認識制御処理において、SA4の処理を省略することができいる。
2 マイク
3 タッチパネル
4 ディスプレイ
5 スピーカ
6 ナビゲーション装置
7 エアコン
8 オーディオ
9 携帯電話
10 ECU
11 制御部
11a 音声認識コマンド特定部
11b 判定部
12 データ記録部
12a 影響度DB
12b 判定テーブル
Claims (5)
- ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、
前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度情報格納手段と、
前記影響度情報格納手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定手段と、を備え、
前記影響度情報格納手段は、
所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき前記音声認識コマンドの前記影響度が所定値以上となるように設定された前記影響度情報を格納し、
前記判定手段は、
前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が前記所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行い、
前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が前記所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う、
音声認識制御システム。 - 前記影響度情報格納手段は、
前記所定の機能を実行するための前記音声認識コマンドの数が多いほど、当該所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの前記影響度が大きくなるように設定された前記影響度情報を格納する、
請求項1に記載の音声認識制御システム。 - 前記音声認識コマンド特定手段は、当該音声認識コマンド特定手段による前記音声認識コマンドの特定結果の信頼度を特定し、
前記判定手段は、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度と、当該音声認識コマンドについて前記音声認識コマンド特定手段により特定された前記信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する、
請求項1又は2に記載の音声認識制御システム。 - ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、
前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて記憶手段に格納する影響度情報格納ステップと、
前記影響度情報格納ステップで前記記憶手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定ステップで特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定ステップと、を含み、
前記影響度情報格納ステップにおいて、
所定の機能を実行させるために前記音声認識コマンド特定ステップで最後に特定されるべき前記音声認識コマンドの前記影響度が所定値以上となるように設定された前記影響度情報を格納し、
前記判定ステップにおいて、
前記音声認識コマンド特定ステップで特定された音声認識コマンドの前記影響度が前記所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行い、
前記音声認識コマンド特定ステップで特定された音声認識コマンドの前記影響度が前記所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う、
音声認識制御方法。 - 請求項4に記載の方法をコンピュータに実行させる音声認識制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011141031A JP5408810B2 (ja) | 2011-06-24 | 2011-06-24 | 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011141031A JP5408810B2 (ja) | 2011-06-24 | 2011-06-24 | 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013007917A JP2013007917A (ja) | 2013-01-10 |
JP5408810B2 true JP5408810B2 (ja) | 2014-02-05 |
Family
ID=47675314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011141031A Active JP5408810B2 (ja) | 2011-06-24 | 2011-06-24 | 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5408810B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6432233B2 (ja) | 2014-09-15 | 2018-12-05 | 株式会社デンソー | 車両用機器制御装置、制御内容検索方法 |
CN106796786B (zh) | 2014-09-30 | 2021-03-02 | 三菱电机株式会社 | 语音识别系统 |
EP3457399A4 (en) * | 2016-05-13 | 2019-10-16 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM |
JP2018031985A (ja) * | 2016-08-26 | 2018-03-01 | 恒次 國分 | 音声認識補完システム |
CN106356075B (zh) * | 2016-09-29 | 2019-09-17 | 合肥美的智能科技有限公司 | 盲音分离方法、结构及语音控制系统和电器总成 |
JP6530528B1 (ja) * | 2018-03-26 | 2019-06-12 | 株式会社エヌ・ティ・ティ・データ | 情報処理装置及びプログラム |
JP6673513B1 (ja) * | 2019-03-26 | 2020-03-25 | 株式会社セガゲームス | ゲームシステム |
JP7363075B2 (ja) * | 2019-04-01 | 2023-10-18 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
JP2021135648A (ja) * | 2020-02-26 | 2021-09-13 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
WO2022003822A1 (ja) * | 2020-06-30 | 2022-01-06 | 日産自動車株式会社 | 情報処理装置及び情報処理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03248199A (ja) * | 1990-02-26 | 1991-11-06 | Ricoh Co Ltd | 音声認識方式 |
JP5157596B2 (ja) * | 2008-04-01 | 2013-03-06 | トヨタ自動車株式会社 | 音声認識装置 |
-
2011
- 2011-06-24 JP JP2011141031A patent/JP5408810B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013007917A (ja) | 2013-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5408810B2 (ja) | 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム | |
US20190189125A1 (en) | Contextual voice commands | |
JP4804052B2 (ja) | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 | |
US8340958B2 (en) | Text and speech recognition system using navigation information | |
US9779723B2 (en) | Multi-pass vehicle voice recognition systems and methods | |
JP5821639B2 (ja) | 音声認識装置 | |
US9188456B2 (en) | System and method of fixing mistakes by going back in an electronic device | |
JP4260788B2 (ja) | 音声認識機器制御装置 | |
US20080221891A1 (en) | Interactive speech recognition system | |
JP5637131B2 (ja) | 音声認識装置 | |
JP2008064885A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2013512476A (ja) | 複数の辞書を用いたスピーチ認識 | |
JPWO2016174955A1 (ja) | 情報処理装置、及び、情報処理方法 | |
US9355639B2 (en) | Candidate selection apparatus and candidate selection method utilizing voice recognition | |
JP2011203434A (ja) | 音声認識装置及び音声認識方法 | |
JP2007101892A (ja) | 音声認識装置 | |
AU2020264367B2 (en) | Contextual voice commands | |
JP2011180416A (ja) | 音声合成装置、音声合成方法およびカーナビゲーションシステム | |
JP2000089782A (ja) | 音声認識装置と方法、ナビゲーションシステム、及び記録媒体 | |
AU2014221287A1 (en) | Contextual voice commands | |
JPWO2019058453A1 (ja) | 音声対話制御装置および音声対話制御方法 | |
JP2011080824A (ja) | ナビゲーション装置 | |
JP2011215291A (ja) | 音声認識装置及びプログラム | |
JP2008233009A (ja) | カーナビゲーション装置及びカーナビゲーション装置用プログラム | |
JP2007193184A (ja) | 音声住所認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131008 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5408810 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |