JP2007286356A

JP2007286356A - 電子機器

Info

Publication number: JP2007286356A
Application number: JP2006113635A
Authority: JP
Inventors: Shusuke Narita; 修輔成田; Susumu Tokoshima; 進床嶋
Original assignee: Funai Electric Co Ltd
Current assignee: Funai Electric Co Ltd
Priority date: 2006-04-17
Filing date: 2006-04-17
Publication date: 2007-11-01
Also published as: US7853448B2; EP1847987A1; US20070244705A1

Abstract

【課題】音声認識の誤認識による誤作動を未然に防止することができる電子機器を提供することである。
【解決手段】ディジタルテレビ受像機１００において、表示制御手段（ＣＰＵ１２１、表示制御プログラム１２３ｃ）によって、音声認識結果に基づくコマンド情報に対応する制御内容を表示手段（受像部１０）に表示し、音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの所定の待ち時間内に、指定手段（音声情報取得部１１）による制御内容に対する制御を中止する旨の指定がない場合、制御手段（ＣＰＵ１２１、制御プログラム１２３ｄ）によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、中止する旨の指定がある場合、音声認識結果に基づくコマンド情報に基づく制御を中止する。
【選択図】図１

Description

本発明は、音声認識により各種制御を行うことができる電子機器に関する。

近年、テレビやビデオ等の電子機器の多機能化・高機能化が進むに伴い、様々な機能に対応し、かつ簡易に操作可能なものが求められ、現在では、このような操作に音声認識技術を用いた電子機器が利用されている。

当該電子機器には、例えば、利用者によって音声入力されたキーワードに基づいて番組が検索され、当該キーワード検索結果画面を表示させるディジタル放送受信装置がある（特許文献１参照）。

また、ＴＶ表示手段に一覧表示された、例えば「天気予報」、「ニュース」、「野球」など、番組案内用のカテゴリの中から希望するカテゴリを音声で選択することができ、さらに、音声選択したカテゴリに合致する番組の番組名や放送時間、放送チャンネル、放送内容を確認した後で、一覧表示された中から希望の番組名を音声により選択することができる番組予約システムがある（特許文献２参照）。

また、マイクから入力した音声信号に基づいて電子機器の制御をする際に、その制御態様をモニタにキャラクタ等を動的にモニタ表示させて認識し易くした音声認識装置がある（特許文献３参照）。
特開２００２−２９０８５９号公報特開平０９−３２２０８６号公報特開２０００−３２２０８６号公報

しかしながら、上記特許文献１〜３に開示された装置では、音声認識結果を表示させる機能を有するが、これは音声認識した結果を視覚認識により容易に解るようにしたものにすぎず、音声認識の誤認識による誤作動を未然に防止することまではできない。

本発明の課題は、音声認識の誤認識による誤作動を未然に防止することができる電子機器を提供することである。

上記課題を解決するため、請求項１に記載の発明による電子機器は、外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、前記待ち時間を短縮する短縮手段と、
一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
を備えることを特徴とする。

請求項２に記載の発明による電子機器は、外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
を備えることを特徴とする。

請求項３に記載の発明による電子機器は、請求項２に記載の電子機器において、
前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、前記待ち時間を短縮する短縮手段と、
をさらに備えることを特徴とする。

請求項４に記載の発明による電子機器は、請求項２又は３に記載の電子機器において、
一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
をさらに備えることを特徴とする。

請求項１に記載の発明によれば、表示制御手段によって、音響モデルパターンによる音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示することができ、指定手段によって、表示制御手段により表示手段に表示された制御内容に対する制御を中止する旨の指定をすることができ、表示制御手段により音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの所定の待ち時間内に、指定手段による制御内容に対する制御を中止する旨の指定がない場合、制御手段によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、指定手段による制御内容に対する制御を中止する旨の指定がある場合、制御手段によって、音声認識結果に基づくコマンド情報に基づく制御を中止することができる。
従って、音声認識結果に基づき得られたコマンド情報による制御内容がユーザの意図した制御内容であるか否かがユーザにより確認されてから、電子機器の制御を行うことができることとなって、誤認識による電子機器の誤作動を未然に防止することができる。
また、コマンド情報記憶手段によって、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができ、表示制御手段により音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、短縮手段によって、待ち時間を短縮することができる。
従って、音声認識の成功率が高いコマンド情報については、音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの待ち時間を短縮することができることとなって、音声認識結果に基づき得られたコマンド情報による制御を迅速に行うことができる。
さらに、表示制御手段により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、コマンド情報削除手段によって、当該一のコマンド情報における一の音響モデルパターンを、コマンド情報記憶手段から削除することができる。
従って、誤認識の可能性の高い一のコマンド情報における一の音響モデルパターンについては、コマンド情報記憶手段から削除することができることとなって、誤認識による電子機器の誤作動を未然に防止することができるとともにコマンド情報記憶手段のカスタマイズをすることができる。

請求項２に記載の発明によれば、表示制御手段によって、音響モデルパターンによる音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示することができ、指定手段によって、表示制御手段により表示手段に表示された制御内容に対する制御を中止する旨の指定をすることができ、表示制御手段により音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの所定の待ち時間内に、指定手段による制御内容に対する制御を中止する旨の指定がない場合、制御手段によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、指定手段による制御内容に対する制御を中止する旨の指定がある場合、制御手段によって、音声認識結果に基づくコマンド情報に基づく制御を中止することができる。
従って、音声認識結果に基づき得られたコマンド情報による制御内容がユーザの意図した制御内容であるか否かがユーザにより確認されてから、電子機器の制御を行うことができることとなって、誤認識による電子機器の誤作動を未然に防止することができる。

請求項３に記載の発明によれば、請求項２に記載の発明と同様の効果が得られることは無論のこと、表示制御手段により音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、短縮手段によって、待ち時間を短縮することができる。
従って、音声認識の成功率が高いコマンド情報については、音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの待ち時間を短縮することができることとなって、音声認識結果に基づき得られたコマンド情報による制御を迅速に行うことができる。

請求項４に記載の発明によれば、請求項２又は３に記載の発明と同様の効果が得られることは無論のこと、コマンド情報記憶手段によって、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができ、表示制御手段により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、コマンド情報削除手段によって、当該一のコマンド情報における一の音響モデルパターンを、コマンド情報記憶手段から削除することができる。
従って、誤認識の可能性の高い一のコマンド情報における一の音響モデルパターンについては、コマンド情報記憶手段から削除することができることとなって、誤認識による電子機器の誤作動を未然に防止することができるとともにコマンド情報記憶手段のカスタマイズをすることができる。

以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
なお、本実施の形態では、電子機器として、ディジタルテレビ受像機を例に説明する。しかし、電子機器はこれに限られることなく、例えば、ビデオやエアコン等の家電機器であっても良い。

まず、図１を参照しながら、機器全体の構成及び要部構成について説明する。
本実施形態のディジタルテレビ受像機１００は、例えば、テレビジョン放送信号（以下、放送信号という。）を受信し、受信した放送信号を、所定の出力信号に変換し、映像／音声データを出力する機器本体部１と、指定手段としてのマイク付きリモートコントロール装置（以下、マイク付きリモコンという。）２と、を備えて構成されている。

次に、ディジタルテレビ受像機１００の要部構成について説明する。
機器本体部１は、放送信号を受信するアンテナ３と、アンテナ３により受信された放送信号から所定の放送チャンネルの放送信号を選局するチューナ４と、チューナ４から出力された放送信号の復調及び誤り訂正処理を行う復調部５と、復調部５で復調された放送信号に付加されている不正視聴防止用のスクランブル信号を解除するデスクランブル６と、デスクランブル６で解除された放送信号から各データを分離抽出することで、映像／音声データを取得するデマルチクサ７と、デマルチクサ７で取得された映像／音声データに伸張処理を行うデコーダ８と、デコーダ８で伸張された映像データにＯＳＤデータを付加する表示制御手段としてのＯＳＤ（On-Screen Character Display）処理部９と、デコーダ８、ＯＳＤ処理部９で処理された映像／音声データを出力する表示手段としての受像部１０と、音声情報を取得する音声情報取得部１１と、機器本体部１全体を統括制御する制御部１２と、各部を接続する制御バス１３と、を備えて構成されている。

音声情報取得部１１は、例えば、マイクロホンが用いられ、音声をそのまま音声情報として取得する。
音声情報取得部１１は、ＣＰＵ１２１が表示制御プログラム１２３ｃを実行することにより表示された制御内容に対して、ユーザから中止する旨の音声情報を取得することにより、指定手段として機能する。
なお、音声情報取得部１１は、音声をそのまま音声情報として取得する場合に限らず、音声が音声信号に変換された後に、当該音声信号を音声情報として取得する設計であっても良い。

制御部１２は、例えば、図１に示すように、ＣＰＵ（Central Processing Unit）１２１と、ＲＡＭ（Random Access Memory）１２２と、記憶部１２３と、などを備えている。

ＣＰＵ１２１は、記憶部１２３に記憶されたコマンドテーブル及び各種処理プログラムに従って各種の制御動作を行う。

ＲＡＭ１２２は、ＣＰＵ１２１によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。

記憶部１２３は、機器本体部１で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、ＣＰＵ１２１によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部１２３に記憶されている。
具体的には、記憶部１２３には、例えば、図１に示すように、コマンドテーブル１２３ａ、音声認識プログラム１２３ｂ、表示制御プログラム１２３ｃ、制御プログラム１２３ｄ、短縮プログラム１２３ｅ、コマンド情報削除プログラム１２３ｆ、などが記憶されている。

コマンドテーブル１２３ａは、機器本体部１を制御するための音声情報からなるコマンド情報を記憶したテーブルである。
具体的には、コマンドテーブル１２３ａは、例えば、図２に示すように、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶し、また、各コマンド情報における音響モデルパターンと、当該音響モデルパターンに対応するコマンド情報が実行された実行回数及び中止された中止回数と、を対応付けて記憶している。
さらに、コマンドデーブル１２３ａは、コマンド情報と当該コマンド情報の制御内容を示す表示用コマンドとを対応付けて記憶している。
記憶部１２３は、かかるコマンドテーブル１２３ａを記憶することで、コマンド情報記憶手段として機能する。

音声認識プログラム１２３ｂは、ＣＰＵ１２１に、音声情報取得部１１により取得した音声情報に対して音声認識処理を行う機能を実現させるプログラムである。
ここで、音声認識は、例えば、Ｊｕｌｉｕｓという音声認識ソフトウェアが用いられ、膨大な音声パターンと言語パターンの統計データを集積することにより実現される。音声認識の基本原理は、音響モデル（音素（ローマ字１文字にほぼ相当）や音節（かな１文字に相当））の周波数パターンを保持し、単語辞書を参照しながら、入力された音声の音声波形信号から単音節部分を切出した音節列信号とマッチングを行い、音声の認識を行う。
具体的には、ＣＰＵ１２１は、予め設定された複数の音響モデルパターンのうち一の音響モデルパターンを用いて音声情報取得部１１により取得した音声情報の音声認識を行い、その音声認識結果と一致するコマンド情報をコマンドテーブル１２３ａより抽出する。また、ＣＰＵ１２１は、一の音響モデルパターンによる音声認識の結果、コマンドテーブル１２３ａに一致するコマンド情報がない場合、音響モデルパターンを変更して、再度、音声認識を行い、一致するコマンド情報をコマンドテーブル１２３ａより抽出する。

表示制御プログラム１２３ｃは、ＣＰＵ１２１に、音声認識結果に基づくコマンド情報に対応する制御内容を受像部１０に表示させる機能を実現させるプログラムである。
具体的には、ＣＰＵ１２１は、図３に示すように、表示制御プログラム１２３ｃを実行することによって、例えば、図２に示す音声認識結果に基づき得られた一のコマンド情報に対応する表示用コマンドをコマンドテーブル１２３ａから抽出し、ＯＳＤ処理部９で当該表示用コマンドを処理することにより、表示手段としての受像部１０に表示させる。
ＣＰＵ１２１は、かかる表示制御プログラム１２３ｃを実行することにより、表示制御手段として機能する。

制御プログラム１２３ｄは、ＣＰＵ１２１に、音声認識結果に基づくコマンド情報により、機器本体部１の制御を行う機能を実現させるプログラムである。
具体的には、ＣＰＵ１２１は、表示制御プログラム１２３ｃの実行により音声認識結果に基づくコマンド情報に対応する制御内容が受像部１０に表示開始されてからの所定の待ち時間内に、例えば、音声情報取得部１１から当該制御内容に対する制御を中止する旨の音声情報による指定がない場合、制御プログラム１２３ｄの実行によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、音声情報取得部１１から当該制御内容に対する制御を中止する旨の音声情報による指定がある場合、制御プログラム１２３ｄによって、音声認識結果に基づくコマンド情報に基づく制御を中止する。
ＣＰＵ１２１は、かかる制御プログラム１２３ｄを実行することにより、制御手段として機能する。

短縮プログラム１２３ｅは、ＣＰＵ１２１に、表示制御プログラム１２３ｃを実行することにより音声認識結果に基づくコマンド情報に対応する制御内容が受像部１０に表示開始されてからの所定の待ち時間を短縮する機能を実現させるプログラムである。
具体的には、表示制御プログラム１２３ｃにより音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部１０に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、ＣＰＵ１２１は、短縮プログラム１２３ｅを実行することにより、待ち時間を短縮する。
ＣＰＵ１２１は、かかる短縮プログラム１２３ｅを実行することにより、短縮手段として機能する。
尚、待ち時間は、第１設定値を段階的に設けることを可能とし、例えば、表示制御プログラム１２３ｃにより音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部１０に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が８５％以上であれば、待ち時間を５秒、当該割合が９０％以上であれば、待ち時間を３秒、当該割合が９５％以上であれば、待ち時間を０秒のように短縮する設計であっても良い。

コマンド情報削除プログラム１２３ｆは、ＣＰＵ１２１に、コマンドテーブル１２３ａに記憶された一のコマンド情報における一の音響モデルパターンを削除する機能を実現させるプログラムである。
具体的には、表示制御プログラム１２３ｂの実行により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部１０に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、ＣＰＵ１２１は、コマンド情報削除プログラム１２３ｅを実行することにより、当該一のコマンド情報における一の音響モデルパターンを、コマンドテーブル１２３ａから削除する。
ＣＰＵ１２１は、かかるコマンド情報削除プログラム１２３ｆを実行することにより、コマンド情報削除手段として機能する。

次に、本発明の機器本体部１の動作について、図４を用いて説明する。
まず、ステップＳ１において、機器本体部１は、音声情報取得待機状態にあり、ＣＰＵ１２１は、音声情報取得部１１により音声情報が取得されたと判断した場合（ステップＳ１；Ｙｅｓ）、ステップＳ２へ進む。一方、ＣＰＵ１２１が音声情報の取得がないと判断した場合（ステップＳ１；Ｎｏ）は、再度、音声情報取得待機状態となる。

次いで、ステップＳ２において、ＣＰＵ１２１は、音声認識プログラム１２３ｂを実行することによって、取得された音声情報の音声認識を行う。
具体的には、例えば、音声情報取得部１１により、音声情報「ＯＮ」が取得された場合、音響モデルパターン「１」を用いて音声認識を行い、その音声認識結果と一致するコマンド情報「ＯＮ」をコマンドテーブル１２３ａより抽出する。

次いで、ステップＳ３において、ＣＰＵ１２１は、表示制御プログラム１２３ｂを実行することにより、音声認識結果に基づくコマンド情報に対応する表示用コマンドをコマンドテーブル１２３ａから抽出し、ＯＳＤ処理部９で当該表示用コマンドを処理することにより、受像部１０に表示する。
具体的には、例えば、音声認識の結果、コマンド情報「ＯＮ」が抽出された場合、それに対応する表示用コマンド「音声認識結果「ＯＮ」で宜しいですか？」を抽出し、図３に示すように、受像部１０に表示用コマンド「音声認識結果「ＯＮ」で宜しいですか？」を表示する。

次いで、ステップＳ４において、ＣＰＵ１２１は、制御プログラム１２３ｃを実行することにより、音声認識結果に基づくコマンド情報に対応する制御内容が受像部１０に表示開始されてからの所定の待ち時間が経過したか否かを判断する。そして、ＣＰＵ１２１は、所定の待ち時間が経過したと判断した場合（ステップＳ４；Ｙｅｓ）、ステップＳ５へ進み、音声認識結果に基づき得られたコマンド情報により、機器本体部１の制御を実行し、ステップＳ９へ進む。

一方、ステップＳ４において、ＣＰＵ１２１は、所定の待ち時間が経過していないと判断した場合（ステップＳ；Ｎｏ）、ステップＳ６へ進み、機器本体部１は、ユーザによる音声情報取得待機状態に入る。

次いで、ステップＳ６において、ＣＰＵ１２１は、音声情報取得部１１により、音声情報が取得されたと判断した場合（ステップＳ６；Ｙｅｓ）、ステップＳ７へ進み、ＣＰＵ１２１は、音声認識プログラム１２３ｂを実行することにより、外部から取得された当該音声情報の音声認識を行い、得られたコマンド情報が中止命令であるか否かを判断する。一方、ステップＳ６において、ＣＰＵ１２１は、音声情報が取得されていないと判断した場合（ステップＳ６；Ｎｏ）、ステップＳ４へ戻る。
具体的には、例えば、図３に示すように、「音声認識結果「ＯＮ」で宜しいですか？」との表示に対して、ユーザが当該制御の中止をしたい場合、音声情報取得部１１に音声情報「中止」を入力する。ＣＰＵ１２１は、この音声情報「中止」に対して音声認識を行う。

次いで、ステップＳ７において、ＣＰＵ１２１は、音声認識の結果、中止命令に対応するコマンド情報があったと判断すると（ステップＳ７；Ｙｅｓ）、ステップＳ８へ進む。一方、ステップＳ７において、ＣＰＵ１２１は、音声認識の結果、中止命令に対応するコマンド情報がないと判断すると（ステップＳ７；Ｎｏ）、ステップＳ４へ戻る。

次いで、ステップＳ８において、ＣＰＵ１２１は、制御プログラム１２３ｃを実行することにより、音声認識結果に基づき得られたコマンド情報による制御を中止し、ステップＳ９へ進む。

次いで、ステップＳ９において、ＣＰＵ１２１は、短縮プログラム１２３ｄ及びコマンド情報削除プログラム１２３ｅの実行により、後述するコマンドテーブル更新処理を行い、本処理を終了する。

次に、図４におけるステップＳ９のコマンドテーブル１２３ａの更新処理について、図５を用いて説明する。
まず、ステップＳ１１において、ＣＰＵ１２１は、制御プログラム１２３ｄを実行することにより、音声認識結果に基づき得られたコマンド情報による制御が実行された場合（ステップＳ１１；Ｙｅｓ）、ステップＳ１２へ進み、制御実行回数を「１」加算し、ステップＳ１３へ進む。
具体的には、例えば、図２に示すように、音響モデルパターン１に対応するコマンド「ＯＮ」による制御が実行された場合、制御実行回数が「１」加算され、実行回数が「１２」から「１３」となる。

一方、ステップＳ１１において、ＣＰＵ１２１は、制御プログラム１２３ｄを実行することにより、音声認識結果に基づき得られたコマンド情報による制御が中止された場合（ステップＳ１１；Ｎｏ）、ステップＳ１５へ進み、制御中止回数を「１」加算し、ステップＳ１６へ進む。
具体的には、例えば、図２に示すように、音響モデルパターン２に対応するコマンド「ＯＮ」による制御が中止された場合、制御中止回数が「１」加算され、中止回数が「１９」から「２０」となる。

次いで、ステップＳ１３において、ＣＰＵ１２１は、第１設定値を超えたと判断した場合（ステップＳ１３；Ｙｅｓ）、ステップＳ１４へ進み、ＣＰＵ１２１は、短縮プログラム１２３ｄを実行することにより、所定の待ち時間を短縮する。一方、ステップＳ１３において、ＣＰＵ１２１は、第１設定値を超えていないと判断した場合（ステップＳ１３；Ｎｏ）、本処理を終了する。
具体的には、例えば、図２に示すように、音響モデルパターン１に対応するコマンド「ＯＮ」による制御実行回数の割合が第１設定値を超えたと判断された場合、待ち時間が、例えば、５秒から２秒に短縮される。

次いで、ステップＳ１６において、ＣＰＵ１２１は、第２設定値を超えたと判断した場合（ステップＳ１６；Ｙｅｓ）、ステップＳ１７へ進み、ＣＰＵ１２１は、コマンド情報削除プログラム１２３ｅを実行することにより、当該コマンド情報における一の音響モデルパターンをコマンドテーブル１２３ａから削除する。一方、ステップＳ１６において、ＣＰＵ１２１は、第２設定値を超えていないと判断した場合（ステップＳ１６；Ｎｏ）、本処理を終了する。
具体的には、例えば、図２に示すように、音響モデルパターン２に対応するコマンド「ＯＮ」による制御中止回数の割合が第２設定値を超えたと判断された場合、当該コマンド情報における音響モデルパターン２をコマンドテーブル１２３ａから削除する。

以上説明した本発明にかかるディジタルテレビ受像機１００によれば、ＣＰＵ１２１が表示制御プログラム１２３ｃを実行することによって、音響モデルパターンによる音声認識結果に基づくコマンド情報に対応する制御内容を受像部１０に表示することができ、音声情報取得部１１によって中止する旨の音声情報を取得することにより、表示制御プログラム１２３ｂの実行により受像部１０に表示された制御内容に対する制御を中止する旨の指定をすることができ、表示制御プログラム１２３ｂの実行により音声認識結果に基づくコマンド情報に対応する制御内容が受像部１０に表示開始されてからの所定の待ち時間内に、音声情報取得部１１によって中止する旨の音声情報を取得することによる制御内容に対する制御を中止する旨の指定がない場合、ＣＰＵ１２１が制御プログラム１２３ｃを実行することによって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、音声情報取得部１１によって中止する旨の音声情報を取得することによる制御内容に対する制御を中止する旨の指定がある場合、音声認識結果に基づくコマンド情報に基づく制御を中止することができる。
従って、音声認識結果に基づき得られたコマンド情報による制御内容がユーザの意図した制御内容であるか否かがユーザにより確認されてから、電子機器の制御を行うことができることとなって、誤認識による電子機器の誤作動を未然に防止することができる。
また、コマンドテーブル１２３ａによって、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができ、表示制御プログラム１２３ｂの実行により音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部１０に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、ＣＰＵ１２１が短縮プログラム１２３ｄを実行することによって、待ち時間を短縮することができる。
従って、音声認識の成功率が高いコマンド情報については、音声認識結果に基づくコマンド情報に対応する制御内容が受像部１０に表示開始されてからの待ち時間を短縮することができることとなって、音声認識結果に基づき得られたコマンド情報を迅速に実行することができる。
さらに、表示制御プログラム１２３ｂの実行により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部１０に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、ＣＰＵ１２１がコマンド情報削除プログラム１２３ｅを実行することによって、当該一のコマンド情報における一の音響モデルパターンを、コマンドテーブル１２３ａから削除することができる。
従って、誤認識の可能性の高いコマンド情報については、コマンドテーブル１２３ａから当該コマンド情報の削除を行うことができることとなって、誤認識による機器本体部１の誤作動を未然に防止することができるとともにコマンドテーブル１２３ａのカスタマイズをすることができる。

なお、本発明は、上記実施の形態に限定されることなく、本発明の趣旨を逸脱しない範囲において、種々の改良並びに設計の変更を行っても良い。
例えば、指定手段は、制御を中止する旨の音声情報を外部入力する場合に限らず、リモコン等に、制御を中止するための操作キーを設け、これにより制御の中止を行う設計であっても良い。

本発明にかかるディジタルテレビ受像機の要部構成を示すブロック図である。本発明におけるコマンドテーブルの１例を示す図である。本発明の表示制御手段による表示例を示す図である。本発明における機器本体部の動作処理を示すフローチャートである。本発明におけるコマンドテーブル更新処理を示すフローチャートである。

符号の説明

１００ディジタルテレビ受像機（電子機器）
１機器本体部
２マイク付きリモコン（指定手段）
９ＯＳＤ処理部（表示制御手段）
１０受像部（表示手段）
１１音声情報取得部（指定手段）
１２１ＣＰＵ（表示制御手段、制御手段、短縮手段、コマンド情報削除手段）
１２３ａコマンドテーブル（コマンド情報記憶手段）
１２３ｂ音声認識プログラム
１２３ｃ表示制御プログラム（表示制御手段）
１２３ｄ制御プログラム（制御手段）
１２３ｅ短縮プログラム（短縮手段）
１２３ｆコマンド情報削除プログラム（コマンド情報削除手段）

Claims

外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、前記待ち時間を短縮する短縮手段と、
一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
を備えることを特徴とする電子機器。
外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
を備えることを特徴とする電子機器。
前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第１設定値を超えると、前記待ち時間を短縮する短縮手段と、
を備えることを特徴とする請求項２に記載の電子機器。
一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第２設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
をさらに備えることを特徴とする請求項２又は３に記載の電子機器。