JP2007286356A - 電子機器 - Google Patents

電子機器 Download PDF

Info

Publication number
JP2007286356A
JP2007286356A JP2006113635A JP2006113635A JP2007286356A JP 2007286356 A JP2007286356 A JP 2007286356A JP 2006113635 A JP2006113635 A JP 2006113635A JP 2006113635 A JP2006113635 A JP 2006113635A JP 2007286356 A JP2007286356 A JP 2007286356A
Authority
JP
Japan
Prior art keywords
command information
control
voice recognition
recognition result
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006113635A
Other languages
English (en)
Inventor
Shusuke Narita
修輔 成田
Susumu Tokoshima
進 床嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Original Assignee
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd filed Critical Funai Electric Co Ltd
Priority to JP2006113635A priority Critical patent/JP2007286356A/ja
Priority to US11/785,241 priority patent/US7853448B2/en
Priority to EP07007722A priority patent/EP1847987A1/en
Publication of JP2007286356A publication Critical patent/JP2007286356A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】音声認識の誤認識による誤作動を未然に防止することができる電子機器を提供することである。
【解決手段】ディジタルテレビ受像機100において、表示制御手段(CPU121、表示制御プログラム123c)によって、音声認識結果に基づくコマンド情報に対応する制御内容を表示手段(受像部10)に表示し、音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの所定の待ち時間内に、指定手段(音声情報取得部11)による制御内容に対する制御を中止する旨の指定がない場合、制御手段(CPU121、制御プログラム123d)によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、中止する旨の指定がある場合、音声認識結果に基づくコマンド情報に基づく制御を中止する。
【選択図】図1

Description

本発明は、音声認識により各種制御を行うことができる電子機器に関する。
近年、テレビやビデオ等の電子機器の多機能化・高機能化が進むに伴い、様々な機能に対応し、かつ簡易に操作可能なものが求められ、現在では、このような操作に音声認識技術を用いた電子機器が利用されている。
当該電子機器には、例えば、利用者によって音声入力されたキーワードに基づいて番組が検索され、当該キーワード検索結果画面を表示させるディジタル放送受信装置がある(特許文献1参照)。
また、TV表示手段に一覧表示された、例えば「天気予報」、「ニュース」、「野球」など、番組案内用のカテゴリの中から希望するカテゴリを音声で選択することができ、さらに、音声選択したカテゴリに合致する番組の番組名や放送時間、放送チャンネル、放送内容を確認した後で、一覧表示された中から希望の番組名を音声により選択することができる番組予約システムがある(特許文献2参照)。
また、マイクから入力した音声信号に基づいて電子機器の制御をする際に、その制御態様をモニタにキャラクタ等を動的にモニタ表示させて認識し易くした音声認識装置がある(特許文献3参照)。
特開2002−290859号公報 特開平09−322086号公報 特開2000−322086号公報
しかしながら、上記特許文献1〜3に開示された装置では、音声認識結果を表示させる機能を有するが、これは音声認識した結果を視覚認識により容易に解るようにしたものにすぎず、音声認識の誤認識による誤作動を未然に防止することまではできない。
本発明の課題は、音声認識の誤認識による誤作動を未然に防止することができる電子機器を提供することである。
上記課題を解決するため、請求項1に記載の発明による電子機器は、外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、前記待ち時間を短縮する短縮手段と、
一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
を備えることを特徴とする。
請求項2に記載の発明による電子機器は、外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
を備えることを特徴とする。
請求項3に記載の発明による電子機器は、請求項2に記載の電子機器において、
前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、前記待ち時間を短縮する短縮手段と、
をさらに備えることを特徴とする。
請求項4に記載の発明による電子機器は、請求項2又は3に記載の電子機器において、
一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
をさらに備えることを特徴とする。
請求項1に記載の発明によれば、表示制御手段によって、音響モデルパターンによる音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示することができ、指定手段によって、表示制御手段により表示手段に表示された制御内容に対する制御を中止する旨の指定をすることができ、表示制御手段により音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの所定の待ち時間内に、指定手段による制御内容に対する制御を中止する旨の指定がない場合、制御手段によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、指定手段による制御内容に対する制御を中止する旨の指定がある場合、制御手段によって、音声認識結果に基づくコマンド情報に基づく制御を中止することができる。
従って、音声認識結果に基づき得られたコマンド情報による制御内容がユーザの意図した制御内容であるか否かがユーザにより確認されてから、電子機器の制御を行うことができることとなって、誤認識による電子機器の誤作動を未然に防止することができる。
また、コマンド情報記憶手段によって、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができ、表示制御手段により音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、短縮手段によって、待ち時間を短縮することができる。
従って、音声認識の成功率が高いコマンド情報については、音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの待ち時間を短縮することができることとなって、音声認識結果に基づき得られたコマンド情報による制御を迅速に行うことができる。
さらに、表示制御手段により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、コマンド情報削除手段によって、当該一のコマンド情報における一の音響モデルパターンを、コマンド情報記憶手段から削除することができる。
従って、誤認識の可能性の高い一のコマンド情報における一の音響モデルパターンについては、コマンド情報記憶手段から削除することができることとなって、誤認識による電子機器の誤作動を未然に防止することができるとともにコマンド情報記憶手段のカスタマイズをすることができる。
請求項2に記載の発明によれば、表示制御手段によって、音響モデルパターンによる音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示することができ、指定手段によって、表示制御手段により表示手段に表示された制御内容に対する制御を中止する旨の指定をすることができ、表示制御手段により音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの所定の待ち時間内に、指定手段による制御内容に対する制御を中止する旨の指定がない場合、制御手段によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、指定手段による制御内容に対する制御を中止する旨の指定がある場合、制御手段によって、音声認識結果に基づくコマンド情報に基づく制御を中止することができる。
従って、音声認識結果に基づき得られたコマンド情報による制御内容がユーザの意図した制御内容であるか否かがユーザにより確認されてから、電子機器の制御を行うことができることとなって、誤認識による電子機器の誤作動を未然に防止することができる。
請求項3に記載の発明によれば、請求項2に記載の発明と同様の効果が得られることは無論のこと、表示制御手段により音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、短縮手段によって、待ち時間を短縮することができる。
従って、音声認識の成功率が高いコマンド情報については、音声認識結果に基づくコマンド情報に対応する制御内容が表示手段に表示開始されてからの待ち時間を短縮することができることとなって、音声認識結果に基づき得られたコマンド情報による制御を迅速に行うことができる。
請求項4に記載の発明によれば、請求項2又は3に記載の発明と同様の効果が得られることは無論のこと、コマンド情報記憶手段によって、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができ、表示制御手段により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、コマンド情報削除手段によって、当該一のコマンド情報における一の音響モデルパターンを、コマンド情報記憶手段から削除することができる。
従って、誤認識の可能性の高い一のコマンド情報における一の音響モデルパターンについては、コマンド情報記憶手段から削除することができることとなって、誤認識による電子機器の誤作動を未然に防止することができるとともにコマンド情報記憶手段のカスタマイズをすることができる。
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
なお、本実施の形態では、電子機器として、ディジタルテレビ受像機を例に説明する。しかし、電子機器はこれに限られることなく、例えば、ビデオやエアコン等の家電機器であっても良い。
まず、図1を参照しながら、機器全体の構成及び要部構成について説明する。
本実施形態のディジタルテレビ受像機100は、例えば、テレビジョン放送信号(以下、放送信号という。)を受信し、受信した放送信号を、所定の出力信号に変換し、映像/音声データを出力する機器本体部1と、指定手段としてのマイク付きリモートコントロール装置(以下、マイク付きリモコンという。)2と、を備えて構成されている。
次に、ディジタルテレビ受像機100の要部構成について説明する。
機器本体部1は、放送信号を受信するアンテナ3と、アンテナ3により受信された放送信号から所定の放送チャンネルの放送信号を選局するチューナ4と、チューナ4から出力された放送信号の復調及び誤り訂正処理を行う復調部5と、復調部5で復調された放送信号に付加されている不正視聴防止用のスクランブル信号を解除するデスクランブル6と、デスクランブル6で解除された放送信号から各データを分離抽出することで、映像/音声データを取得するデマルチクサ7と、デマルチクサ7で取得された映像/音声データに伸張処理を行うデコーダ8と、デコーダ8で伸張された映像データにOSDデータを付加する表示制御手段としてのOSD(On-Screen Character Display)処理部9と、デコーダ8、OSD処理部9で処理された映像/音声データを出力する表示手段としての受像部10と、音声情報を取得する音声情報取得部11と、機器本体部1全体を統括制御する制御部12と、各部を接続する制御バス13と、を備えて構成されている。
音声情報取得部11は、例えば、マイクロホンが用いられ、音声をそのまま音声情報として取得する。
音声情報取得部11は、CPU121が表示制御プログラム123cを実行することにより表示された制御内容に対して、ユーザから中止する旨の音声情報を取得することにより、指定手段として機能する。
なお、音声情報取得部11は、音声をそのまま音声情報として取得する場合に限らず、音声が音声信号に変換された後に、当該音声信号を音声情報として取得する設計であっても良い。
制御部12は、例えば、図1に示すように、CPU(Central Processing Unit)121と、RAM(Random Access Memory)122と、記憶部123と、などを備えている。
CPU121は、記憶部123に記憶されたコマンドテーブル及び各種処理プログラムに従って各種の制御動作を行う。
RAM122は、CPU121によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。
記憶部123は、機器本体部1で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU121によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部123に記憶されている。
具体的には、記憶部123には、例えば、図1に示すように、コマンドテーブル123a、音声認識プログラム123b、表示制御プログラム123c、制御プログラム123d、短縮プログラム123e、コマンド情報削除プログラム123f、などが記憶されている。
コマンドテーブル123aは、機器本体部1を制御するための音声情報からなるコマンド情報を記憶したテーブルである。
具体的には、コマンドテーブル123aは、例えば、図2に示すように、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶し、また、各コマンド情報における音響モデルパターンと、当該音響モデルパターンに対応するコマンド情報が実行された実行回数及び中止された中止回数と、を対応付けて記憶している。
さらに、コマンドデーブル123aは、コマンド情報と当該コマンド情報の制御内容を示す表示用コマンドとを対応付けて記憶している。
記憶部123は、かかるコマンドテーブル123aを記憶することで、コマンド情報記憶手段として機能する。
音声認識プログラム123bは、CPU121に、音声情報取得部11により取得した音声情報に対して音声認識処理を行う機能を実現させるプログラムである。
ここで、音声認識は、例えば、Juliusという音声認識ソフトウェアが用いられ、膨大な音声パターンと言語パターンの統計データを集積することにより実現される。音声認識の基本原理は、音響モデル(音素(ローマ字1文字にほぼ相当)や音節(かな1文字に相当))の周波数パターンを保持し、単語辞書を参照しながら、入力された音声の音声波形信号から単音節部分を切出した音節列信号とマッチングを行い、音声の認識を行う。
具体的には、CPU121は、予め設定された複数の音響モデルパターンのうち一の音響モデルパターンを用いて音声情報取得部11により取得した音声情報の音声認識を行い、その音声認識結果と一致するコマンド情報をコマンドテーブル123aより抽出する。また、CPU121は、一の音響モデルパターンによる音声認識の結果、コマンドテーブル123aに一致するコマンド情報がない場合、音響モデルパターンを変更して、再度、音声認識を行い、一致するコマンド情報をコマンドテーブル123aより抽出する。
表示制御プログラム123cは、CPU121に、音声認識結果に基づくコマンド情報に対応する制御内容を受像部10に表示させる機能を実現させるプログラムである。
具体的には、CPU121は、図3に示すように、表示制御プログラム123cを実行することによって、例えば、図2に示す音声認識結果に基づき得られた一のコマンド情報に対応する表示用コマンドをコマンドテーブル123aから抽出し、OSD処理部9で当該表示用コマンドを処理することにより、表示手段としての受像部10に表示させる。
CPU121は、かかる表示制御プログラム123cを実行することにより、表示制御手段として機能する。
制御プログラム123dは、CPU121に、音声認識結果に基づくコマンド情報により、機器本体部1の制御を行う機能を実現させるプログラムである。
具体的には、CPU121は、表示制御プログラム123cの実行により音声認識結果に基づくコマンド情報に対応する制御内容が受像部10に表示開始されてからの所定の待ち時間内に、例えば、音声情報取得部11から当該制御内容に対する制御を中止する旨の音声情報による指定がない場合、制御プログラム123dの実行によって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、音声情報取得部11から当該制御内容に対する制御を中止する旨の音声情報による指定がある場合、制御プログラム123dによって、音声認識結果に基づくコマンド情報に基づく制御を中止する。
CPU121は、かかる制御プログラム123dを実行することにより、制御手段として機能する。
短縮プログラム123eは、CPU121に、表示制御プログラム123cを実行することにより音声認識結果に基づくコマンド情報に対応する制御内容が受像部10に表示開始されてからの所定の待ち時間を短縮する機能を実現させるプログラムである。
具体的には、表示制御プログラム123cにより音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部10に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、CPU121は、短縮プログラム123eを実行することにより、待ち時間を短縮する。
CPU121は、かかる短縮プログラム123eを実行することにより、短縮手段として機能する。
尚、待ち時間は、第1設定値を段階的に設けることを可能とし、例えば、表示制御プログラム123cにより音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部10に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が85%以上であれば、待ち時間を5秒、当該割合が90%以上であれば、待ち時間を3秒、当該割合が95%以上であれば、待ち時間を0秒のように短縮する設計であっても良い。
コマンド情報削除プログラム123fは、CPU121に、コマンドテーブル123aに記憶された一のコマンド情報における一の音響モデルパターンを削除する機能を実現させるプログラムである。
具体的には、表示制御プログラム123bの実行により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部10に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、CPU121は、コマンド情報削除プログラム123eを実行することにより、当該一のコマンド情報における一の音響モデルパターンを、コマンドテーブル123aから削除する。
CPU121は、かかるコマンド情報削除プログラム123fを実行することにより、コマンド情報削除手段として機能する。
次に、本発明の機器本体部1の動作について、図4を用いて説明する。
まず、ステップS1において、機器本体部1は、音声情報取得待機状態にあり、CPU121は、音声情報取得部11により音声情報が取得されたと判断した場合(ステップS1;Yes)、ステップS2へ進む。一方、CPU121が音声情報の取得がないと判断した場合(ステップS1;No)は、再度、音声情報取得待機状態となる。
次いで、ステップS2において、CPU121は、音声認識プログラム123bを実行することによって、取得された音声情報の音声認識を行う。
具体的には、例えば、音声情報取得部11により、音声情報「ON」が取得された場合、音響モデルパターン「1」を用いて音声認識を行い、その音声認識結果と一致するコマンド情報「ON」をコマンドテーブル123aより抽出する。
次いで、ステップS3において、CPU121は、表示制御プログラム123bを実行することにより、音声認識結果に基づくコマンド情報に対応する表示用コマンドをコマンドテーブル123aから抽出し、OSD処理部9で当該表示用コマンドを処理することにより、受像部10に表示する。
具体的には、例えば、音声認識の結果、コマンド情報「ON」が抽出された場合、それに対応する表示用コマンド「音声認識結果 「ON」で宜しいですか?」を抽出し、図3に示すように、受像部10に表示用コマンド「音声認識結果 「ON」で宜しいですか?」を表示する。
次いで、ステップS4において、CPU121は、制御プログラム123cを実行することにより、音声認識結果に基づくコマンド情報に対応する制御内容が受像部10に表示開始されてからの所定の待ち時間が経過したか否かを判断する。そして、CPU121は、所定の待ち時間が経過したと判断した場合(ステップS4;Yes)、ステップS5へ進み、音声認識結果に基づき得られたコマンド情報により、機器本体部1の制御を実行し、ステップS9へ進む。
一方、ステップS4において、CPU121は、所定の待ち時間が経過していないと判断した場合(ステップS;No)、ステップS6へ進み、機器本体部1は、ユーザによる音声情報取得待機状態に入る。
次いで、ステップS6において、CPU121は、音声情報取得部11により、音声情報が取得されたと判断した場合(ステップS6;Yes)、ステップS7へ進み、CPU121は、音声認識プログラム123bを実行することにより、外部から取得された当該音声情報の音声認識を行い、得られたコマンド情報が中止命令であるか否かを判断する。一方、ステップS6において、CPU121は、音声情報が取得されていないと判断した場合(ステップS6;No)、ステップS4へ戻る。
具体的には、例えば、図3に示すように、「音声認識結果 「ON」で宜しいですか?」との表示に対して、ユーザが当該制御の中止をしたい場合、音声情報取得部11に音声情報「中止」を入力する。CPU121は、この音声情報「中止」に対して音声認識を行う。
次いで、ステップS7において、CPU121は、音声認識の結果、中止命令に対応するコマンド情報があったと判断すると(ステップS7;Yes)、ステップS8へ進む。一方、ステップS7において、CPU121は、音声認識の結果、中止命令に対応するコマンド情報がないと判断すると(ステップS7;No)、ステップS4へ戻る。
次いで、ステップS8において、CPU121は、制御プログラム123cを実行することにより、音声認識結果に基づき得られたコマンド情報による制御を中止し、ステップS9へ進む。
次いで、ステップS9において、CPU121は、短縮プログラム123d及びコマンド情報削除プログラム123eの実行により、後述するコマンドテーブル更新処理を行い、本処理を終了する。
次に、図4におけるステップS9のコマンドテーブル123aの更新処理について、図5を用いて説明する。
まず、ステップS11において、CPU121は、制御プログラム123dを実行することにより、音声認識結果に基づき得られたコマンド情報による制御が実行された場合(ステップS11;Yes)、ステップS12へ進み、制御実行回数を「1」加算し、ステップS13へ進む。
具体的には、例えば、図2に示すように、音響モデルパターン1に対応するコマンド「ON」による制御が実行された場合、制御実行回数が「1」加算され、実行回数が「12」から「13」となる。
一方、ステップS11において、CPU121は、制御プログラム123dを実行することにより、音声認識結果に基づき得られたコマンド情報による制御が中止された場合(ステップS11;No)、ステップS15へ進み、制御中止回数を「1」加算し、ステップS16へ進む。
具体的には、例えば、図2に示すように、音響モデルパターン2に対応するコマンド「ON」による制御が中止された場合、制御中止回数が「1」加算され、中止回数が「19」から「20」となる。
次いで、ステップS13において、CPU121は、第1設定値を超えたと判断した場合(ステップS13;Yes)、ステップS14へ進み、CPU121は、短縮プログラム123dを実行することにより、所定の待ち時間を短縮する。一方、ステップS13において、CPU121は、第1設定値を超えていないと判断した場合(ステップS13;No)、本処理を終了する。
具体的には、例えば、図2に示すように、音響モデルパターン1に対応するコマンド「ON」による制御実行回数の割合が第1設定値を超えたと判断された場合、待ち時間が、例えば、5秒から2秒に短縮される。
次いで、ステップS16において、CPU121は、第2設定値を超えたと判断した場合(ステップS16;Yes)、ステップS17へ進み、CPU121は、コマンド情報削除プログラム123eを実行することにより、当該コマンド情報における一の音響モデルパターンをコマンドテーブル123aから削除する。一方、ステップS16において、CPU121は、第2設定値を超えていないと判断した場合(ステップS16;No)、本処理を終了する。
具体的には、例えば、図2に示すように、音響モデルパターン2に対応するコマンド「ON」による制御中止回数の割合が第2設定値を超えたと判断された場合、当該コマンド情報における音響モデルパターン2をコマンドテーブル123aから削除する。
以上説明した本発明にかかるディジタルテレビ受像機100によれば、CPU121が表示制御プログラム123cを実行することによって、音響モデルパターンによる音声認識結果に基づくコマンド情報に対応する制御内容を受像部10に表示することができ、音声情報取得部11によって中止する旨の音声情報を取得することにより、表示制御プログラム123bの実行により受像部10に表示された制御内容に対する制御を中止する旨の指定をすることができ、表示制御プログラム123bの実行により音声認識結果に基づくコマンド情報に対応する制御内容が受像部10に表示開始されてからの所定の待ち時間内に、音声情報取得部11によって中止する旨の音声情報を取得することによる制御内容に対する制御を中止する旨の指定がない場合、CPU121が制御プログラム123cを実行することによって、所定の待ち時間経過後に音声認識結果に基づくコマンド情報に基づいて制御を行い、音声情報取得部11によって中止する旨の音声情報を取得することによる制御内容に対する制御を中止する旨の指定がある場合、音声認識結果に基づくコマンド情報に基づく制御を中止することができる。
従って、音声認識結果に基づき得られたコマンド情報による制御内容がユーザの意図した制御内容であるか否かがユーザにより確認されてから、電子機器の制御を行うことができることとなって、誤認識による電子機器の誤作動を未然に防止することができる。
また、コマンドテーブル123aによって、一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができ、表示制御プログラム123bの実行により音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部10に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、CPU121が短縮プログラム123dを実行することによって、待ち時間を短縮することができる。
従って、音声認識の成功率が高いコマンド情報については、音声認識結果に基づくコマンド情報に対応する制御内容が受像部10に表示開始されてからの待ち時間を短縮することができることとなって、音声認識結果に基づき得られたコマンド情報を迅速に実行することができる。
さらに、表示制御プログラム123bの実行により一の音響モデルパターンによる音声認識結果に基づく一のコマンド情報に対応する制御内容が受像部10に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、CPU121がコマンド情報削除プログラム123eを実行することによって、当該一のコマンド情報における一の音響モデルパターンを、コマンドテーブル123aから削除することができる。
従って、誤認識の可能性の高いコマンド情報については、コマンドテーブル123aから当該コマンド情報の削除を行うことができることとなって、誤認識による機器本体部1の誤作動を未然に防止することができるとともにコマンドテーブル123aのカスタマイズをすることができる。
なお、本発明は、上記実施の形態に限定されることなく、本発明の趣旨を逸脱しない範囲において、種々の改良並びに設計の変更を行っても良い。
例えば、指定手段は、制御を中止する旨の音声情報を外部入力する場合に限らず、リモコン等に、制御を中止するための操作キーを設け、これにより制御の中止を行う設計であっても良い。
本発明にかかるディジタルテレビ受像機の要部構成を示すブロック図である。 本発明におけるコマンドテーブルの1例を示す図である。 本発明の表示制御手段による表示例を示す図である。 本発明における機器本体部の動作処理を示すフローチャートである。 本発明におけるコマンドテーブル更新処理を示すフローチャートである。
符号の説明
100 ディジタルテレビ受像機(電子機器)
1 機器本体部
2 マイク付きリモコン(指定手段)
9 OSD処理部(表示制御手段)
10 受像部(表示手段)
11 音声情報取得部(指定手段)
121 CPU(表示制御手段、制御手段、短縮手段、コマンド情報削除手段)
123a コマンドテーブル(コマンド情報記憶手段)
123b 音声認識プログラム
123c 表示制御プログラム(表示制御手段)
123d 制御プログラム(制御手段)
123e 短縮プログラム(短縮手段)
123f コマンド情報削除プログラム(コマンド情報削除手段)

Claims (4)

  1. 外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
    前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
    前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
    前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
    前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、前記待ち時間を短縮する短縮手段と、
    一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
    前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
    を備えることを特徴とする電子機器。
  2. 外部から入力される音声情報に対して音響モデルパターンによる音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
    前記音声認識結果に基づくコマンド情報に対応する制御内容を表示手段に表示する表示制御手段と、
    前記表示制御手段により前記表示手段に表示された前記制御内容に対する制御を中止する旨の指定をする指定手段と、
    前記表示制御手段により前記音声認識結果に基づくコマンド情報に対応する制御内容が前記表示手段に表示開始されてからの所定の待ち時間内に、前記指定手段による前記制御内容に対する制御を中止する旨の指定がない場合、前記所定の待ち時間経過後に前記音声認識結果に基づくコマンド情報に基づいて制御を行い、前記指定手段による前記制御内容に対する制御を中止する旨の指定がある場合、前記音声認識結果に基づくコマンド情報に基づく制御を中止する制御手段と、
    を備えることを特徴とする電子機器。
  3. 前記表示制御手段により前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が実行された実行回数の割合が第1設定値を超えると、前記待ち時間を短縮する短縮手段と、
    を備えることを特徴とする請求項2に記載の電子機器。
  4. 一のコマンド情報と複数の音響モデルパターンとを、対応付けて記憶することができるコマンド情報記憶手段と、
    前記表示制御手段により一の音響モデルパターンによる前記音声認識結果に基づく一のコマンド情報に対応する制御内容が前記表示手段に表示された回数のうち、当該一のコマンド情報が中止された中止回数の割合が第2設定値を超えると、前記一のコマンド情報における前記一の音響モデルパターンを、前記コマンド情報記憶手段から削除するコマンド情報削除手段と、
    をさらに備えることを特徴とする請求項2又は3に記載の電子機器。
JP2006113635A 2006-04-17 2006-04-17 電子機器 Pending JP2007286356A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006113635A JP2007286356A (ja) 2006-04-17 2006-04-17 電子機器
US11/785,241 US7853448B2 (en) 2006-04-17 2007-04-16 Electronic instrument for speech recognition with standby time shortening and acoustic model deletion
EP07007722A EP1847987A1 (en) 2006-04-17 2007-04-16 Electronic instrument

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006113635A JP2007286356A (ja) 2006-04-17 2006-04-17 電子機器

Publications (1)

Publication Number Publication Date
JP2007286356A true JP2007286356A (ja) 2007-11-01

Family

ID=38024530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006113635A Pending JP2007286356A (ja) 2006-04-17 2006-04-17 電子機器

Country Status (3)

Country Link
US (1) US7853448B2 (ja)
EP (1) EP1847987A1 (ja)
JP (1) JP2007286356A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116206A (ja) * 2017-01-20 2018-07-26 アルパイン株式会社 音声認識装置、音声認識方法及び音声認識システム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738377B2 (en) * 2010-06-07 2014-05-27 Google Inc. Predicting and learning carrier phrases for speech input
US8825493B2 (en) 2011-07-18 2014-09-02 At&T Intellectual Property I, L.P. Method and apparatus for social network communication over a media network
US9082407B1 (en) * 2014-04-15 2015-07-14 Google Inc. Systems and methods for providing prompts for voice commands
CN105895093A (zh) * 2015-11-02 2016-08-24 乐视致新电子科技(天津)有限公司 语音信息处理方法及装置
CN116095377A (zh) * 2022-12-30 2023-05-09 无锡威达智能电子股份有限公司 一种基于语音识别的遥控器控制方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6259997A (ja) * 1985-09-11 1987-03-16 沖電気工業株式会社 音声認識装置
JPH0832663A (ja) * 1994-07-13 1996-02-02 Hitachi Ltd 音声ダイアル機能付き電話装置
JPH08115096A (ja) * 1994-10-14 1996-05-07 Sanyo Electric Co Ltd 音声処理装置
JP2006058641A (ja) * 2004-08-20 2006-03-02 Nissan Motor Co Ltd 音声認識装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW347503B (en) * 1995-11-15 1998-12-11 Hitachi Ltd Character recognition translation system and voice recognition translation system
JPH09322086A (ja) 1996-05-31 1997-12-12 Hitachi Ltd 番組予約システム
EP1021804A4 (en) * 1997-05-06 2002-03-20 Speechworks Int Inc SYSTEM AND METHOD FOR DEVELOPING INTERACTIVE LANGUAGE APPLICATIONS
US6965863B1 (en) * 1998-11-12 2005-11-15 Microsoft Corporation Speech recognition user interface
US6937984B1 (en) * 1998-12-17 2005-08-30 International Business Machines Corporation Speech command input recognition system for interactive computer display with speech controlled display of recognized commands
GB2344917B (en) 1998-12-16 2003-04-02 Ibm Speech command input recognition system
JP2000322086A (ja) 1999-05-06 2000-11-24 Sony Corp 音声認識装置
US6766295B1 (en) * 1999-05-10 2004-07-20 Nuance Communications Adaptation of a speech recognition system across multiple remote sessions with a speaker
JP3990075B2 (ja) * 1999-06-30 2007-10-10 株式会社東芝 音声認識支援方法及び音声認識システム
AU2002246550A1 (en) * 2000-11-30 2002-08-06 Enterprise Integration Group, Inc. Method and system for preventing error amplification in natural language dialogues
JP2002290859A (ja) 2001-03-26 2002-10-04 Sanyo Electric Co Ltd ディジタル放送受信装置
JP2002358095A (ja) * 2001-03-30 2002-12-13 Sony Corp 音声処理装置および音声処理方法、並びにプログラムおよび記録媒体
US7103542B2 (en) * 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
KR100668297B1 (ko) * 2002-12-31 2007-01-12 삼성전자주식회사 음성인식방법 및 장치
US7533023B2 (en) * 2003-02-12 2009-05-12 Panasonic Corporation Intermediary speech processor in network environments transforming customized speech parameters
JP2007501420A (ja) * 2003-08-01 2007-01-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ダイアログシステムの駆動方法
DE10348408A1 (de) * 2003-10-14 2005-05-19 Daimlerchrysler Ag Nutzeradaptive Dialogunterstützung für Sprachdialogsysteme
US7552055B2 (en) * 2004-01-10 2009-06-23 Microsoft Corporation Dialog component re-use in recognition systems
US7321856B1 (en) * 2005-08-03 2008-01-22 Microsoft Corporation Handling of speech recognition in a declarative markup language
US8355913B2 (en) * 2006-11-03 2013-01-15 Nokia Corporation Speech recognition with adjustable timeout period

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6259997A (ja) * 1985-09-11 1987-03-16 沖電気工業株式会社 音声認識装置
JPH0832663A (ja) * 1994-07-13 1996-02-02 Hitachi Ltd 音声ダイアル機能付き電話装置
JPH08115096A (ja) * 1994-10-14 1996-05-07 Sanyo Electric Co Ltd 音声処理装置
JP2006058641A (ja) * 2004-08-20 2006-03-02 Nissan Motor Co Ltd 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116206A (ja) * 2017-01-20 2018-07-26 アルパイン株式会社 音声認識装置、音声認識方法及び音声認識システム

Also Published As

Publication number Publication date
US7853448B2 (en) 2010-12-14
EP1847987A1 (en) 2007-10-24
US20070244705A1 (en) 2007-10-18

Similar Documents

Publication Publication Date Title
JP4887911B2 (ja) 電子機器
JP4872241B2 (ja) テレビ受像機
US10720162B2 (en) Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof
CN109508167B (zh) 显示装置和在语音识别系统中控制显示装置的方法
US8706502B2 (en) Electronic equipment and television receiver utilizing multimodal multifunction voice commands
JP2007286356A (ja) 電子機器
JP2002300495A (ja) 発話認識に基づいたキャプションシステム
JP2007286174A (ja) 電子機器
JP2008003474A (ja) 電子機器
JP2001309256A (ja) デジタルテレビ放送受信機
JP2007323296A (ja) 電子機器
JP4670716B2 (ja) 音声認識機能付き電子機器
WO2017037882A1 (ja) リモートコントローラ
JP2007081930A (ja) デジタルテレビジョン放送受信機
KR102237832B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
JP4807145B2 (ja) 電子機器
KR102482457B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
JP2005004032A (ja) 音声認識装置及び音声認識方法
KR20210040913A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR101125421B1 (ko) 영상표시기기 및 선호메뉴 설정방법
JP2006109281A (ja) 機器設定情報表示制御装置,表示装置
JP2008103905A (ja) ディジタルテレビジョン受信機
JP2001309257A (ja) デジタルテレビ放送受信機
JP2014182343A (ja) 音声操作機能付き電子機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111115