JP4050574B2 - 遠隔制御対象機器、遠隔制御システム、及び画像処理装置 - Google Patents

遠隔制御対象機器、遠隔制御システム、及び画像処理装置 Download PDF

Info

Publication number
JP4050574B2
JP4050574B2 JP2002246673A JP2002246673A JP4050574B2 JP 4050574 B2 JP4050574 B2 JP 4050574B2 JP 2002246673 A JP2002246673 A JP 2002246673A JP 2002246673 A JP2002246673 A JP 2002246673A JP 4050574 B2 JP4050574 B2 JP 4050574B2
Authority
JP
Japan
Prior art keywords
remote control
unit
control
voice
control pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002246673A
Other languages
English (en)
Other versions
JP2003219201A (ja
Inventor
俊英 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2002246673A priority Critical patent/JP4050574B2/ja
Publication of JP2003219201A publication Critical patent/JP2003219201A/ja
Application granted granted Critical
Publication of JP4050574B2 publication Critical patent/JP4050574B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Details Of Television Systems (AREA)
  • Selective Calling Equipment (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、リモートコントロール(以下、リモコンと略す)送信器でのキー操作と音声とで家電機器等を遠隔制御するためのシステム、特にそのシステム内の制御対象機器に関し、更に、そのシステムによるGUI(Graphical User Interface)を搭載する画像処理装置に関する。
【0002】
【従来の技術】
近年の家電機器は技術の高度化により、非常に多くの機能を獲得した。
例えばテレビジョン(TV)受像機は、選局、電源入切、音量調節、及び音声多重モードの切替等の標準機能を持つ。近年では更に、デジタル放送への対応に伴う機能のデジタル化及び多チャンネル化により、例えば、EPG(Electric Program Guide:電子番組表)による番組検索、i−Link(IEEE1394)接続による周辺機器の制御、又はインターネットへの接続等の拡張機能を装備する。
【0003】
機能の増大は、便利である反面、機器の操作を複雑にした。ユーザによる操作の簡単化を目的とし、多くの家電機器はリモコン送信器による遠隔制御システムを搭載する。特に、TV受信機又はビデオテープレコーダ(VTR)等、画面表示機能を発揮する機器(以下、画像処理装置という)は、その遠隔制御システムによる次のようなGUIを実現する:
ユーザはリモコンで、操作メニューを画面に表示させる。ユーザは更にリモコン送信器に対するキー操作で、画面に表示されたカーソルを移動させ、それによりメニュー内のカテゴリーを一つ選択する。その選択されたカテゴリーが更にサブカテゴリーを含むとき、画面にはそれらのサブカテゴリーのメニューが表示される。ユーザはそのメニューからサブカテゴリーを一つ、同様なカーソル操作で選択する。こうして、選択された操作に対応する機能を、画像処理装置は実行する。
【0004】
上記のようなメニューの階層構造は、機能の更なる増大に伴い深層化し、かつ複雑化する。そのとき、カテゴリーの選択では、メニューの各階層間の移動が、一般に多数回必要である。それにより、リモコン送信器でのキー操作が長時間繰り返されねばならない。そのようなキー操作の長時間の繰り返しは、特に中高齢のユーザにとって、必ずしも容易ではない。
そこで、音声によりリモコン送信器でのキー操作を補う遠隔制御システムが開発されている。そのシステムによるGUIでは例えば、メニューの各階層間の移動が音声で指示され、画面上のカーソル移動がリモコン送信器でのキー操作で指示される。そのように、音声による制御と、リモコン送信器でのキー操作による制御とのそれぞれの利点を生かし、操作性の向上が図られる。
【0005】
従来の遠隔制御システムには例えば、電子技術出版発行「テレビ技術」1991年5月号第38〜44頁にVTR用音声リモコンとして開示されたものが知られる。この遠隔制御システムは、VTRを遠隔制御対象機器とし、音声認識装置付リモコン送信器を通し、キー操作と音声とでそのVTRに対する遠隔制御を実現する。
【0006】
図13は、その従来の遠隔制御システムに含まれるリモコン送信器100の構成を示すブロック図である。
ユーザがキーパッド101の一つを押すとき、リモコンパルス変換部102がそのキーに応じ制御コードを選択する。更に、その制御コードを電気信号(以下、第一のリモコンパルスP1という)へ変換し、出力する。
【0007】
ユーザがリモコン送信器100のマイクロフォン106に向け発声するとき、その音声はマイクロフォン106と低周波増幅器107とを通し、音声信号Sへ変換され、音声認識部108へ入力される。
音声認識部108は音声信号Sを、辞書109に登録された音声認識対象データと比較する。音声認識対象データは通常、単語ごとに登録される。音声認識部108は音声信号Sに対応する単語Wを辞書109から選択し、出力制御部110へ通知する。
出力制御部110は制御コード格納部111へアクセスし、通知された単語Wに対応する制御コードCを読み出す。ここで、制御コード格納部111は、辞書109に登録された単語のそれぞれに対応する制御コードを記憶する。出力制御部110は、読み出した制御コードCを電気信号(以下、第二のリモコンパルスP2という)へ変換し、出力する。
【0008】
リモコンパルス選択部103は第一のリモコンパルスP1又は第二のリモコンパルスP2のいずれかを選択し、LED駆動部104へ出力する。
LED駆動部104は入力したリモコンパルスPに従い、赤外線発光ダイオード(LED)105を発光させる。リモコンパルスに基づく赤外線の変調方式としては例えば、パルス位置変調(PPM)が用いられる。こうして、リモコンパルスPに従い変調された赤外線(以下、リモコン信号という)RがVTR200へ送出される。
【0009】
図14は、上記の従来の遠隔制御システムでの遠隔制御対象機器、すなわちVTR200内のリモコンに関する部分を示すブロック図である。
受光部201はフォトダイオード等の受光素子を含み、外部からの赤外線Rを入力する。リモコン信号検波部202は、受光部201により受信された赤外線の中から、リモコン送信器100のリモコン信号Rを検出し、リモコンパルスPへ変換する。リモコンパルス解読部203はそのリモコンパルスPから制御コードCを解読する。機器制御部204は制御データ格納部205へアクセスし、その制御コードCに対応するコマンド又は制御データDを読み出す。更に、そのコマンド又は制御データDに従い、所定の操作を行う。
こうして、上記の遠隔制御システムは、VTR200に対し、リモコン送信器100でのキー操作及び音声による遠隔制御を実現する。
【0010】
制御コードは、VTR200に対する操作、又はVTR200に与えるべき制御データごとに、予め設定される。例えば、電源入切、録画、再生、停止、早送り、若しくは巻戻し等の各操作を示すコマンド、又は、録画チャンネル若しくは録画開始/終了時刻等の制御データのそれぞれに対し、異なる制御コードが割り当てられる。制御コードとコマンドとの間、又は制御コードと制御データとの間の対応は、制御データ格納部205により記憶される。
【0011】
上記の遠隔制御システムでは、VTR200に対し一つの操作又は一つの制御データを指定するとき、リモコン送信器100が、キー操作又は音声のいずれでの指示に関わらず、共通の制御コードを選択し、共通のリモコン信号Rへ変換する。それにより、VTR200はリモコンに関し、リモコン送信器でのキー操作又は音声のいずれでの指示に関わらず、図14に示される共通の構成を利用できる。
【0012】
リモコン信号を赤外線で送信するとき、他の遠隔制御システムによる同様なリモコン信号との誤認を防止しなければならない。それ故、異なる遠隔制御システム間では、同一の制御コードの使用が回避される。その結果、赤外線による遠隔制御システムのそれぞれに割り当てられる制御コードの数が制限される。それにより、制御コードは例えば、一つの製品カテゴリー当たり1バイト(=256個)程度しか割り当てられない。
【0013】
その反面、遠隔制御対象機器の機能は上記の通り、増大し続けている。例えば衛星デジタル放送のチャンネルは理論的には101〜999chであり、現行のものに限っても200〜300種類を既に含む。従って、チャンネル数の増加に単純に対応するだけでも、制御コード数は不足する。
【0014】
上記の遠隔制御システムのように、リモコン送信器がキー操作での指示と音声での指示との両方に共通の制御コードを割り当てるとき、制御コード数の不足は一層深刻である。
実際、選局を音声で指示するとき、現在の音声認識技術は、選局対象チャンネル群と少なくとも同数の単語を要する。
その他には例えば、EPGによる番組検索を音声で直接指示するとき、認識すべき単語数は100個程度必要である。
こうして、一つの操作について、音声での指示に対し割り当てるべき制御コード数が、キー操作での指示に対し割り当てるべき制御コード数を大幅に上回る。それ故、キー操作と音声との両方の指示で共用可能な制御コードの数は、ごくわずかに限られた。その結果、上記の遠隔制御システムは機能の拡張性に乏しい。
【0015】
従来の遠隔制御システムには、上記のものの他に、特開平7−30982号公報に開示されたものが知られる。この遠隔制御システムは、VTRを遠隔制御対象機器とし、マイクロフォン付リモコン送信器を通し、キー操作と音声とでそのVTRに対する遠隔制御を実現する。但し、上記の遠隔制御システムとは異なり、リモコン送信器はユーザの音声そのものに従い、赤外線に対し周波数変調を施し、送信する。一方、音声認識はVTRすなわちリモコン信号の受信側で実行される。それにより、その機能の拡張性が、以下に示されるように、上記の遠隔制御システムより高い。
【0016】
図15は、その従来の遠隔制御システムに含まれるリモコン送信器300の構成を示すブロック図である。ここで、図13に示される従来のリモコン送信器100と同様な構成に対し、図13と同じ符号を付す。更に、それらの同様な構成の詳細については、上記の説明を援用する。
【0017】
ユーザがリモコン送信器300のマイクロフォン106に向け発声するとき、その音声はマイクロフォン106と低周波増幅器107とを通し、音声信号Sへ変換され、周波数変調部301へ入力される。
周波数変調部301はその音声信号Sに従い、所定のキャリアに対し周波数変調を施す。リモコンパルス選択部103は、第一のリモコンパルスP1又は周波数変調による音声信号PSのいずれかを選択し、LED駆動部104へ出力する。
LED駆動部104は、第一のリモコンパルスP1又は周波数変調による音声信号PSのいずれかに従い、赤外線LED105を発光させる。それにより、リモコン信号RがVTR400へ送出される。
【0018】
図16は上記の従来の遠隔制御システムでの遠隔制御対象機器、すなわちVTR400内のリモコン及び音声認識に関する部分を示すブロック図である。ここで、図14に示される従来のVTR200と同様な構成に対し図14と同じ符号を付す。
リモコンパルス/音声信号選択部401は通常、第一のリモコン信号検波部202Aを出力先として選択する。そのとき、受光部201により受信されたリモコン信号Rは、第一のリモコン信号検波部202Aへ入力される。
第一のリモコン信号検波部202Aはリモコン信号Rの中から第一のリモコンパルスP1を検出する。リモコンパルス解読部203は第一のリモコンパルスP1から制御コードCを解読する。第一の機器制御部204は第一の制御データ格納部205へアクセスし、その制御コードCに対応するコマンド又は制御データD1を読み出す。更に、そのコマンド又は制御データD1に従い所定の操作を行う。
こうして、リモコン送信器300でのキー操作による遠隔制御が実現される。
【0019】
一方、音声による遠隔制御は次のように行われる。
第二のリモコン信号検波部202Bは、受光部201からリモコンパルス/音声信号選択部401へ送出されるリモコン信号Rを監視し、その中から、音声認識開始を指示するための特定のリモコンパルスPTを探す。その特定のリモコンパルスPTは、例えばリモコン送信器300でのキー操作により、リモコン送信器300から送信される。その特定のリモコンパルスPTが第二のリモコン信号検波部202Bにより検出されたとき、音声認識起動制御部402は、リモコンパルス/音声信号選択部401の出力先をFM検波部403へ切り替える。そのとき、受光部201により受信されたリモコン信号Rは、FM検波部403へ入力される。それにより、FM検波部403は起動する。
上記の特定のリモコンパルスPTは、第一のリモコン信号検波部202Aでも検出される。そのとき、リモコンパルス解読部203は所定のトリガTを音声認識部404へ出力する。それにより、音声認識部404が起動する。
【0020】
FM検波部403はリモコン信号Rの中から、周波数変調による音声信号PSを検出し、元の音声信号Sに復調する。音声認識部404は復調された音声信号Sを、辞書405に登録された音声認識対象データと比較する。音声認識対象データは通常、単語ごとに登録される。音声認識部404は音声信号Sに対応する単語Wを辞書405から選択し、第二の機器制御部406へ通知する。第二の機器制御部406は第二の制御データ格納部407へアクセスし、通知された単語Wに対応するコマンド又は制御データD2を読み出す。ここで、第二の制御データ格納部407は、辞書405に登録された単語のそれぞれに対応するコマンド及び制御データを記憶する。第二の機器制御部406は更に、読み出したコマンド又は制御データD2に従い、所定の操作を行う。
【0021】
この遠隔制御システムでは、リモコン送信器300ではなく、遠隔制御対象機器であるVTR400が音声認識部404と辞書405とを含む。従って、例えば辞書405の語彙の拡張又はアルゴリズムの高級化等に伴う回路規模の増大が、リモコン送信器300のサイズ及び消費電力による制限を受けない。
一方、リモコン送信器300は音声信号そのものを赤外線で送信する。従って、音声での指示に対し制御コードを割り当てなくても良いので、制御コード数による制限を受けない。
こうして、上記の遠隔制御システムは、音声で指示可能な機能、更に音声認識機能自体を、容易に拡張できる。
【0022】
上記の遠隔制御システムは、特に音声での指示に対し、例えば次のようなGUIを提供できる。
VTR400をTV受信機へ接続するとき、第二の機器制御部406は音声での指示に従い画面表示部408を制御し、所定の画像をそのTV受信機の画面(以下、TV画面という)へ表示する。そのような画像処理機能を利用し、音声認識に関する情報をTV画面に表示し、ユーザへフィードバックする。その情報は例えば、ユーザに対する適切な発声タイミングの通知、認識された単語若しくはその候補の一覧、又は、認識された操作内容等を含む。更に、音声認識に関しエラーが生じたとき、そのエラー情報をTV画面に表示しても良い。そのような画面表示による情報のフィードバックを通し、ユーザは、例えば認識されやすい発音、スピード、抑揚、又は音量を、容易に工夫できる。
【0023】
【発明が解決しようとする課題】
図13と図14とに示されるような従来の遠隔制御システムでは、リモコン送信器が、キー操作での指示と音声での指示との両方を、共通の制御コードに対応させる。しかし、異なる遠隔制御システム間では同一の制御コードの使用が回避されるので、一つの遠隔制御システムに割り当てられる制御コード数が制限される。従って、図13と図14とに示されるような遠隔制御システムでは、制御コード数が不足し、機能の拡張が困難であった。
【0024】
図15と図16とに示されるような従来の遠隔制御システムでは、リモコン送信器ではなく、遠隔制御対象機器が音声認識を行う。従って、音声認識機能の拡張に伴う回路規模の増大が、リモコン送信器のサイズ及び消費電力による制限を受けない。一方、リモコン送信器は音声信号そのものを赤外線で送信する。従って、音声での指示の種類が制御コード数による制限を受けない。こうして、図15と図16とに示されるような遠隔制御システムでは、図13と図14とに示されるようなシステムより機能の拡張が容易である。
【0025】
しかし、図15と図16とに示されるような従来の遠隔制御システムには次のような問題点があった。
この遠隔制御システムでは、VTR400のような遠隔制御対象機器が制御情報をリモコンパルスと音声信号との二種類のデータ形態で利用する。それにより、図16に示されるように、VTR400がリモコンパルスと音声信号とのそれぞれに対し、異なる制御系統を持つ。すなわち、リモコンパルスにより示される制御コードCに従う第一の機器制御部204と、音声で入力された単語Wに従う第二の機器制御部406との二つの機器制御部を持つ。
【0026】
これら二つの機器制御部全体の回路規模は、シャシのサイズで制限される。従って、それらの機器制御部を共通のCPUで同一基板上に設計することが望ましい。しかし、制御情報のデータ形態(すなわち、制御コードCと単語Wと)の相違が、両機器制御部の統合を複雑化する。シャシ設計では特に、リモコンパルスだけによる従来の遠隔制御システムの構成を大きく変更しなければならない。それは技術的に困難であり、更にコストアップにつながるので好ましくない。
【0027】
本発明は、従来の構成を最小限の変更で利用し、かつ高度な機能拡張性を有する、リモコン送信器でのキー操作と音声との両方による遠隔制御システムの提供を目的とする。更に、その遠隔制御システムを搭載し、特に音声認識に関する情報を画面表示によりユーザへフィードバックするGUIを実現し、それにより好適な操作性を有する画像処理装置の提供、を目的とする。
【0028】
【課題を解決するための手段】
本発明による遠隔制御対象機器は、
(A) リモコン信号を受信し、そのリモコン信号を第一のリモコンパルスへ変換するためのリモコン受信部;
(B) 音声信号を入力し、その音声信号に対応する制御コードを選択し、その制御コードを第二のリモコンパルスへ変換するための音声信号/リモコンパルス変換部;
(C) 所定の切替信号に従い、第一のリモコンパルスと第二のリモコンパルスとのいずれかを選択するためのリモコンパルス選択部;及び、
(D) リモコンパルス選択部により選択されたリモコンパルスから制御コードを解読し、その制御コードに従い動作制御を行うためのリモコンパルス処理部;
を有する。
ここで、リモコン信号は例えば、外部のリモコン送信器から送出される。すなわち、リモコン送信器は複数のキーパッドを含み、ユーザにより押さえられたキーパッドのそれぞれに対応する制御コードをリモコン信号として送信する。
上記の遠隔制御対象機器はそのようなリモコン送信器と共に、一つの遠隔制御システムを構成する。
【0029】
上記の遠隔制御対象機器は音声認識を行う。そのとき、認識された音声信号により示される制御情報はリモコンパルスへ変換され、リモコンパルス処理部へ送出される。こうして、リモコンパルス処理部により扱われるべき制御情報が、従来のものと共通のデータ形態、すなわちリモコンパルスで表される。従って、ユーザからの制御情報がリモコン送信器からのリモコン信号又は音声信号のいずれのデータ形態で入力されるときでも、リモコンパルス処理部としては従来と同様な回路構成を共用できる。すなわち、リモコンパルス処理部が従来と同様な一系統として容易に統合される。その結果、シャシ設計が容易である。
【0030】
リモコンパルス選択部は、上記の切替信号によるイネーブル制御に従い、音声信号/リモコンパルス変換部による第二のリモコンパルスの出力時、その第二のリモコンパルスをリモコンパルス処理部へ入力し、リモコン受信部からの第一のリモコンパルスを遮断する。こうして、リモコンパルス処理部は、第一のリモコンパルスと第二のリモコンパルスとを排他的に処理する。従って、第一のリモコンパルスと第二のリモコンパルスとの間で共通の制御コードを、それぞれ別の機能へ割り当てても良い。
更に、音声信号/リモコンパルス変換部とリモコンパルス選択部との間を、例えば共通の筐体内部又はケーブル等で接続し、第二のリモコンパルスが遠隔制御対象機器の外部へ漏れないようにしても良い。それにより、第二のリモコンパルスにより示される制御コードを、他の遠隔制御システムのものと重複させ得る。以上の結果、第二のリモコンパルスにより示される制御コードとして、任意のカテゴリーコード又はデータコードを割り当て得る。すなわち、第二のリモコンパルスにより示される制御コード数は、第一のリモコンパルスにより示される制御コード数のような制限を受けない。こうして、上記の遠隔制御対象機器は、音声で指示可能な機能を容易に拡張できる。
【0031】
上記の遠隔制御対象機器では、好ましくは、
(A) 音声信号/リモコンパルス変換部が、
(a) 音声認識対象データを含む辞書;
(b) 上記の音声信号と音声認識対象データのそれぞれとの類似度(尤度ともいう)を計算し、それらの類似度に基づき、その音声信号に対応すべき音声認識対象データの候補、又はエラーコードを選択するための音声認識部;
(c) 音声認識対象データとエラーコードとのそれぞれに対応する制御コードを記憶する制御コード格納部;及び、
(d) 音声認識対象データの候補、又はエラーコードに対応する制御コードを制御コード格納部から読み出し、その制御コードを第二のリモコンパルスへ変換し、上記の切替信号と共にリモコンパルス選択部へ出力するための出力制御部;
を有し、
(B) リモコンパルス処理部が、
(a) リモコンパルス選択部により選択されたリモコンパルスを解読し、そのリモコンパルスに対応する制御コードへ変換するためのリモコンパルス解読部;
(b) その制御コードのそれぞれに対応する制御データとコマンドとを記憶する制御データ格納部;及び、
(c) リモコンパルス解読部により解読された制御コードに対応する制御データ又はコマンドを制御データ格納部から読み出し、それらの制御データ又はコマンドに基づき所定の動作制御を行うための機器制御部;
を有する。
【0032】
この遠隔制御対象機器は特に、不揮発性記録媒体を含むパラメータ保存部、を有しても良い。そのとき、
(A) 音声認識部が音声認識パラメータを出力制御部へ出力し;
(B) 制御コード格納部がその音声認識パラメータに対応する制御コードを記憶し;
(C) 出力制御部が、その制御コードを制御コード格納部から読み出し、その制御コードを第二のリモコンパルスへ変換し、リモコンパルス選択部へ出力し;
(D) 制御データ格納部がその制御コードに対応する音声認識パラメータを記憶し;
(E) 機器制御部が、リモコンパルス解読部により解読されたその制御コードに対応する音声認識パラメータを制御データ格納部から読み出し、それらの音声認識パラメータをパラメータ保存部へ書き込んでも良い。
ここで、不揮発性記録媒体は、好ましくはフラッシュメモリ、すなわち一括消去型EEPROMである。
【0033】
音声認識パラメータは、例えば声質レベル(声道長による周波数対パワースペクトル偏移を指標化したもの)等の音響分析パラメータ又は尤度閾値を含む。第二のリモコンパルスにより示される制御コード数は十分に多いので、それらの制御コードの一部が音声認識パラメータに対し、割り当てられても良い。それにより、音声認識部で設定された音声認識パラメータをパラメータ保存部へ通知できる。こうして、音声認識パラメータを不揮発性記録媒体により記憶することで、音声認識に関する学習の履歴を電源の入切に関わらず保持できる。その結果、電源の再投入時、音声認識パラメータの最適化を迅速に実現できる。
【0034】
上記の遠隔制御対象機器では、
(A) ユーザの音声を入力し上記の音声信号へ変換するための音声入力部と、(B)その音声信号の振幅に応じ音声信号/リモコンパルス変換部を起動するための起動制御部と、を音声信号/リモコンパルス変換部が含んでも良い。
この遠隔制御対象機器はユーザの音声を直接又は有線で入力する。従って、この遠隔制御対象機器を含む遠隔制御システムでは、リモコン送信器が従来と同様なもので良い。
その上、音声信号/リモコンパルス変換部は音声信号の振幅検出を通し自動的に起動するので、ユーザは遠隔制御対象機器へ向け発声するだけで、音声による遠隔制御を実行できる。
【0035】
本発明による遠隔制御システムは、
(A) (a) ユーザの音声を入力し音声信号へ変換するための音声入力部と、(b)超音波、赤外線、又は電波によるキャリアをその音声信号により変調し外部へ送出するための無線送信部と、を含み、かつリモコン信号を送信するためのリモコン送信器;及び、
(B) 音声信号/リモコンパルス変換部が、(a) 上記のキャリアを受信するための無線受信部と、(b) そのキャリアの振幅に応じ音声信号/リモコンパルス変換部を起動するための起動制御部と、を含む、上記の遠隔制御対象機器;
を有する。
この遠隔制御システムでは、音声信号がリモコン送信器から無線により、遠隔制御対象機器へ入力される。それにより、音声入力部をケーブル等の制約を受けることなく、ユーザの傍に置くことができる。従って、周囲の雑音等の音声信号への混入を抑制できる。
その上、音声信号/リモコンパルス変換部はキャリアの検出を通し自動的に起動するので、ユーザは音声をリモコン送信器へ入力するだけで、音声による遠隔制御を実行できる。
【0036】
本発明による画像処理装置は、
機器制御部に従い所定の画像を表示するための画面表示部、を有し、かつ上記の遠隔制御対象機器であり、
(A) 制御データ格納部が、画面表示部に対する制御データとコマンド、及び画面表示部により表示させるための表示データを、所定の制御コードにそれぞれ対応させて記憶し;
(B) 機器制御部が、第二のリモコンパルスからリモコンパルス解読部により解読された制御コードに対応する表示データを制御データ格納部から読み出し、その表示データを画面表示部により表示させる。
ここで、上記の表示データがテキストデータを含んでも良い。そのテキストデータには、例えば音声認識対象データの候補、音声認識エラーを示す文章、又は音声認識パラメータが含まれる。
その他に、その表示データが画像データを含んでも良い。その画像データには例えば、音声認識エラーを示す画像、発声のタイミングを示す画像、又は音声認識パラメータを表示するための画像(例えば、声質レベルのインジケータ)が含まれる。
【0037】
上記の画像処理装置は、特に音声での指示に対し、例えば次のようなGUIを提供できる。
機器制御部は音声での指示に従い画面表示部を制御し、上記の表示データを画面へ表示する。それにより、音声認識に関する情報がユーザへ、視覚的にフィードバックされる。その情報は例えば、ユーザに対する適切な発声タイミングの通知、認識された単語若しくはその候補の一覧、又は認識された操作内容を含む。更に、音声認識に関しエラーが生じたとき、そのエラー情報を画面に表示しても良い。そのような画面表示による情報のフィードバックを通し、ユーザは、例えば認識されやすい発音、スピード、抑揚、又は音量を、容易に工夫できる。
【0038】
【発明の実施の形態】
以下、本発明の最適な実施の形態について、その好ましい実施例を挙げて、図面を参照しつつ説明する。
【0039】
《実施例1》
本発明の実施例1による画像処理装置はディジタルテレビ受像器(以下、DTVと略す)である。このDTVは、マイクロフォン付リモコン送信器を通したキー操作と音声とによる遠隔制御システムを搭載する。
図1は、本発明の実施例1によるDTV20での遠隔制御システムの外観を示す模式図である。
ユーザがリモコン送信器10のキーパッド1の一つを押す。そのとき、そのキーに対応する制御情報(例えば、目標のチャンネル番号等)が、例えば赤外線によるリモコン信号RKとして、第一の赤外線LED4KからDTV20へ送信される。そのリモコン信号RKはDTV20の第一の受光部21により受信され、対応する制御情報が解読される。それにより、その制御情報の示す操作が実行される。例えば、キーパッド1のそれぞれに対応するチャンネルの番組がTV画面28Aに映し出される。こうして、リモコン送信器10でのキー操作による遠隔制御が実現される。
【0040】
ユーザがリモコン送信器10の発声ボタン8を押しながら、DTV20に対する制御情報(例えば、目標のチャンネル番号等)を示す音声Vを、マイクロフォン5へ入力する。そのとき、その音声Vは例えば赤外線による音声信号RVへ変換され、第二の赤外線LED4VからDTV20へ送信される。その音声信号RVは音声信号/リモコンパルス変換部30の第二の受光部31により受信され、対応する制御情報が解読される。解読された制御情報は、例えばケーブル38を通しDTV20本体へ伝送され、その制御情報に対応する操作が実行される。例えば、音声Vの示す目標チャンネルの番組がTV画面28Aに映し出される。こうして、リモコン送信器10を用いたプレストーク方式での、音声による遠隔制御が実現される。
【0041】
実施例1による遠隔制御システムでは、リモコン送信器10がマイクロフォン5を内蔵するので、ユーザとマイクロフォン5との距離が小さい。従って、周囲の雑音等によるマイクロフォン5への侵入を回避しやすい。それ故、音声認識を高精度で実行できる。
【0042】
図2は、上記の遠隔制御システムに含まれるリモコン送信器10の構成を示すブロック図である。
キーパッド1は、例えば図1に示されるように、チャンネル番号のそれぞれに対応する選局ボタン、GUIとしてTV画面28Aに表示されたカーソルを移動させるための上下左右ボタン1a、及び、決定操作を行うための決定ボタンを含む。
それぞれのキーパッド1は異なる制御情報と対応する。制御情報は例えば、チャンネル番号等の制御データ、並びに、電源入切、音量調節、音声多重モードの切替、及び、二画面表示等の画面表示モードの切換、等の操作を指示するためのコマンドを含む。制御情報は所定のフォーマットのコード(以下、制御コードという)で表され、例えば1バイトのコードで識別される。
【0043】
リモコンパルス変換部2は、ユーザにより押されたキーパッド1の一つを識別する。更に、そのキーに対応する制御コードを選択し、電気信号(以下、第一のリモコンパルスP1という)として出力する。
第一のLED駆動部3Kは第一のリモコンパルスP1に従い、第一の赤外線LED4Kを明滅させる。そのとき、キャリアは例えばPPMにより変調される。こうして、変調された赤外線、すなわちリモコン信号RKがDTV20へ送出される。
【0044】
キーパッド1のそれぞれに対応する制御コードは、赤外線によるリモコン信号RKでDTV20へ伝送される。そのとき、DTV20がそのリモコン信号RKと、他の同様な遠隔制御システムからのものとを誤認しないように、キーパッド1のそれぞれに対応する制御コードとして、例えば財団法人家電製品協会へ予め登録された制御コードが用いられる。
財団法人家電製品協会により規定された制御コードのフォーマット(以下、家製協フォーマットという)は、1バイトのカテゴリーコードと1バイトのデータコードとを含む。
カテゴリーコードは、例えばTV又はVTR等の製品カテゴリーを示し、メーカー毎に割り当てられる。従って、家製協フォーマットでは、遠隔制御システムがカテゴリーコードにより識別される。すなわち、異なる遠隔制御システム間ではカテゴリーコードが異なるので、同一の制御コードの使用が回避される。
データコードは、実際の制御情報を示す。従って、家製協フォーマットでは、製品カテゴリーごと、すなわち遠隔制御システムごとに最大256通りのコードが制御コードとして使用可能である。すなわち、一つの遠隔制御システムによりリモコン信号RKとして使用され得る制御コード数は、最大256個に制限される。
【0045】
マイクロフォン5はユーザの音声Vを入力し、電気信号へ変換する。
低周波増幅器6は、マイクロフォン5により変換された電気信号から音声Vに対応する周波数成分を抜き出し、音声信号Sとして出力する。
周波数変調部7は、音声信号Sの振幅変動に従い、所定の高周波のキャリアに対し周波数変調を施し、周波数変調波PSとして出力する。
第二のLED駆動部3Vは、音声信号による周波数変調波PSに従い、第二の赤外線LED4Vの電流量を変動させる。それにより、第二の赤外線LED4Vが、周波数変調波PSに従い発光出力を変化させる。こうして、変調された赤外線による音声信号RVがDTV20へ送出される。
【0046】
第一の赤外線LED4Kと第二の赤外線LED4Vとは、好ましくは、それぞれ異なる波長の赤外線を発する。それにより、DTV20は、リモコン信号RKと赤外線による音声信号RVとを容易に識別できる。
その他に、第一の赤外線LED4Kと第二の赤外線LED4Vとを共通の赤外線LEDとし、第一のLED駆動部3Kと第二のLED駆動部3Vとを共通のLED駆動部としても良い。但しそのときは、例えばリモコン信号RKと赤外線による音声信号RVとのそれぞれに異なる識別コードを含ませる等の工夫が必要である。
【0047】
発声ボタン8は、電力供給部9を駆動させるためのスイッチである。電力供給部9はその駆動時、低周波増幅器6、周波数変調部7、及び第二のLED駆動部3Vへ電力を供給する。
発声ボタン8がユーザにより押される間だけ、ユーザの音声Vが、赤外線による音声信号RVとしてDTV20へ送信される。こうして、リモコン送信器10はプレストーク方式による音声Vの送信を実現する。
【0048】
図3はDTV20内の遠隔制御システムに関する部分を示すブロック図である。第一の受光部21はフォトダイオード等の受光素子を含み、外部からの赤外線を検出する。ここで、検出対象の赤外線の波長は、リモコン送信器10の第一の赤外線LED4Kの波長に等しい。
リモコン信号検波部22は、第一の受光部21により検出された赤外線の中から、リモコン送信器10からのリモコン信号RKを識別し、第一のリモコンパルスP1へ変換する。
【0049】
リモコンパルス選択部23は通常、リモコン信号検波部22を入力元として選択する。すなわち、第一のリモコンパルスP1が通常、リモコンパルス解読部24へ入力される。
リモコンパルス解読部24は、第一のリモコンパルスP1から制御コードCを解読し、機器制御部25へ通知する。
機器制御部25はその制御コードCの受信時、制御データ格納部26へアクセスする。制御データ格納部26は、制御コードのそれぞれに対応するコマンド又は制御データを記憶する。機器制御部25は、入力された制御コードCに対応するコマンド又は制御データDを、制御データ格納部26から読み出す。更に、そのコマンド又は制御データDに従い、例えば画面表示部28等の機能部を制御し、所定の操作を実行する。
【0050】
音声信号/リモコンパルス変換部30は以下の構成により、リモコン送信器10から赤外線による音声信号RVを受信し、それに対し音声認識を行う。認識された音声により示される制御情報は、第一のリモコンパルスP1により示される制御コードと共通のフォーマットで符号化される。更に、その符号化された制御情報(すなわち制御コード)は、第一のリモコンパルスP1と共通のフォーマットの電気信号(以下、第二のリモコンパルスP2という)として出力される。
【0051】
第二の受光部31はフォトダイオード等の受光素子を含み、外部からの赤外線を検出する。ここで、検出対象の赤外線の波長は、リモコン送信器10の第二の赤外線LED4Vの波長に等しい。
FM検波部32は第二の受光部31により検出された赤外線の中から、リモコン送信器10の第二の赤外線LED4Vによるキャリアを抜き出し、キャリア検出部33へ通知する。更に、そのキャリアの周波数変動から音声信号による周波数変調波を検出し、元の音声信号Sに復調する。
キャリア検出部33は、FM検波部32により抜き出されたキャリアの振幅を一定レベルと比較する。キャリアの振幅がその一定レベルを超えて増大するとき、キャリア検出部33は音声認識開始信号Tを論理的な真状態へ転移させる(以下、アサートする、という)。一方、キャリアの振幅がその一定レベルより低下するとき、キャリア検出部33は音声認識開始信号Tを論理的な偽状態へ転移させる(以下、ネゲートする、という)。ここで、論理的な真/偽状態は、正論理では高/低電圧状態に、負論理ではその反対に、それぞれ対応する。
【0052】
キャリア検出部33からの音声認識開始信号Tがアサートされる間、音声認識部34は起動する。音声認識部34は、FM検波部32からの音声信号Sを、辞書35に登録された音声認識対象データと比較する。音声認識対象データは通常、単語ごとに登録される。音声認識部34は音声信号Sに対応する単語Wを辞書35から選択し、出力制御部36へ通知する。
【0053】
出力制御部36は音声認識部34からの単語Wの通知時、制御コード格納部37へアクセスする。制御コード格納部37は、辞書35に登録された単語のそれぞれに対応する制御コードを記憶する。出力制御部36は、音声認識部34から通知された単語Wに対応する制御コードCを、制御コード格納部37から読み出す。
ここで、制御コード格納部37により記憶された制御コードCは、第一のリモコンパルスP1により示される制御コードと共通のフォーマット、例えば家製協フォーマットで定義される。すなわち、2バイトのコードで識別される。
出力制御部36は制御コード格納部37から読み出した制御コードCを第二のリモコンパルスP2へ変換し、リモコンパルス選択部23へ送出する。
【0054】
出力制御部36は第二のリモコンパルスP2の送出時、リモコンパルス切替信号Nをまずアサートする。そのアサートから所定時間(例えば、100msec)だけ待機した後、第二のリモコンパルスP2を、例えばケーブル38を通し、リモコンパルス選択部23へ送出する。
リモコンパルス切替信号Nのアサート時、リモコンパルス選択部23は出力制御部36を入力元として選択する。それにより、第二のリモコンパルスP2がリモコンパルス解読部24へ入力される。
【0055】
リモコンパルス解読部24は、第二のリモコンパルスP2から制御コードCを解読する。ここで、第二のリモコンパルスP2は第一のリモコンパルスP1と共通のフォーマットであるので、リモコンパルス解読部24は第二のリモコンパルスP2を、第一のリモコンパルスP1と区別することなく、同様に解読できる。
【0056】
リモコンパルス解読部24への第二のリモコンパルスP2の入力開始は、リモコンパルス選択部23による入力の切替から上記の所定時間だけ遅れる。リモコンパルス解読部24は、その遅れをリモコンパルス無入力状態(No Operation:NOP)と判断する。それにより、リモコンパルス解読部24が、続いて入力される第二のリモコンパルスP2を、それ以前に入力されていた第一のリモコンパルスP1と明確に区別できる。
【0057】
リモコンパルス解読部24は解読した制御コードCを機器制御部25へ通知する。そのとき、リモコンパルス切替信号Nのアサートを検知し、その制御コードCが音声信号/リモコンパルス変換部30によるものであることを、機器制御部25へ通知する。
【0058】
第二のリモコンパルスP2により示される制御コードは、第一のリモコンパルスP1により示されるものと共通のフォーマットである。従って、機器制御部25はその両方のリモコンパルスを特に区別することなく、同様に処理できる。
すなわち、機器制御部25は、第二のリモコンパルスP2により示される制御コードCの受信時、制御データ格納部26へアクセスする。制御データ格納部26は、制御コードのそれぞれに対応するコマンド又は制御データを記憶する。機器制御部25は、入力された制御コードCに対応するコマンド又は制御データDを、制御データ格納部26から読み出す。更に、そのコマンド又は制御データDに従い、例えば画面表示部28等の機能部を制御し、所定の操作を実行する。
こうして、実施例1による遠隔制御システムでは、リモコンパルス解読部24と機器制御部25とが、第一のリモコンパルスP1と第二のリモコンパルスP2とのいずれに対しても共通に使用される。それらは特に、従来の回路と同様な一系統の制御回路として構成される。その結果、シャシ設計が容易である。
【0059】
第二のリモコンパルスP2は例えばケーブル38を通し、音声信号/リモコンパルス変換部30からリモコンパルス選択部23までの間だけを伝送される。すなわち、第二のリモコンパルスP2はDTV20の外部へ漏れない。従って、第一のリモコンパルスP1とは異なり、DVT20と同様な他の遠隔制御対象機器により受信されない。
それ故、第二のリモコンパルスP2により示される制御コードは、第一のリモコンパルスP1により示されるものとは異なり、他の遠隔制御システムでのものと重複しても構わない。例えば家製協フォーマットでは、第一のリモコンパルスP1により示される制御コードの総数がデータコードのデータ量(最大1バイト=256個)に制限されるのに対し、第二のリモコンパルスP2により示される制御コードの総数は、カテゴリーコードとデータコードとの全データ量(2バイト=4096個)まで許される。
こうして、実施例1による遠隔制御システムでは、音声による制御情報として割り当て可能な制御コード数が豊富である。その結果、音声により指示可能な機能が容易に拡張される。
【0060】
実施例1によるDTV20は以上の構成により、特に音声による遠隔制御を以下の流れに従い実現する。
図4は、音声信号/リモコンパルス変換部30の動作の詳細を示すフローチャートである。
<ステップS1>
ユーザがリモコン送信器10の発声ボタン8を押しながら、制御情報を示す音声Vをマイクロフォン5へ入力する。そのとき、第二の赤外線LED4Vが発光し、赤外線によるキャリアがDTV20へ送信される。ユーザの音声Vは、そのキャリアの周波数変調として伝送される。
FM検波部32が、第二の受光部31により検出された赤外線の中から、リモコン送信器10の第二の赤外線LED4Vによるキャリアを抜き出し、キャリア検出部33へ通知する。そのキャリアの振幅が一定レベルを超えて増大するとき、キャリア検出部33は音声認識開始信号Tをアサートする。音声認識部34は、その音声認識開始信号Tの立ち上がりエッジを検出する。
<ステップS2>
音声認識部34は、音声認識開始検出信号Tのアサートを出力制御部36へ通知する。それにより、出力制御部36は、音声認識開始を示す制御コード(以下、認識開始コードという)を第二のリモコンパルスP2へ変換し、送出する。
【0061】
<ステップS3>
FM検波部32は上記のキャリアから音声信号による周波数変調波を検出し、元の音声信号Sに復調する。
音声認識部34は、その音声信号Sに対し認識処理を行う。具体的にはまず、音声信号Sを辞書35に登録される単語のそれぞれと比較し、両方の類似度(尤度)を計算する。次に、その尤度に基づき、第一候補の単語Wを所定条件に従い決定する。
【0062】
<ステップS4>
認識処理が正常に行われたか否か、すなわち第一候補の単語Wが正常に決定されたか否かが判断される。
例えば、計算された尤度が辞書35に登録される単語のいずれに対しても所定条件を満たさない等により、第一候補の単語が決定されないとき、認識エラーがあると判断される。
認識エラーがないとき、処理はステップS5へ進む。認識エラーがあるとき、処理はステップS7へ分岐する。
【0063】
ここで、以下のような場合にも、認識エラーがあると判断される。
ユーザによるリモコン送信器10の発声ボタン8の押下が発声途中で誤って中断したとき、リモコン送信器10では第二の赤外線LED4Vの発光が突然止まる。そのとき、音声信号/リモコンパルス変換部30では、FM検波部32により取り出されたキャリアの振幅が、キャリア検出部33により設定された一定レベルより下まで、突然降下する。リモコン送信器10の第二の赤外線LED4Vから出射された赤外線RVが発声途中で障害物に遮られたとき、又は、リモコン送信器10に内蔵された電池の消耗により第二の赤外線LED4Vの出力が発声途中で著しく減衰したときも、キャリアの振幅が同様に急減少する。
キャリア検出部33はキャリア振幅の減少に応じ、音声認識開始信号Tをネゲートする。音声認識部34は音声認識開始信号Tの立ち下がりエッジの検出時、認識処理を中断し、その中断直前の一定期間について、音声信号の平均パワーを計測する。その平均パワーが一定の閾値以上であれば、「発声途中のキャリア遺失」という認識エラーがある、と判断される。
【0064】
<ステップS5>
出力制御部36は音声認識部34から第一候補の単語Wを取り出す。
<ステップS6>
出力制御部36は制御コード格納部37をアクセスし、第一候補の単語Wに対応する制御コードCを制御コード格納部37から読み出す。更に、読み出した制御コードCを第二のリモコンパルスP2へ変換し、送出する。
【0065】
<ステップS7>
音声認識部34は認識処理を中断する。更に、認識エラーに関する情報をその要因毎に出力制御部36へ通知する。出力制御部36は、その通知された情報に対応する制御コード(以下、エラーコードという)を、制御コード格納部37から読み出す。更に、そのエラーコードを第二のリモコンパルスP2へ変換し、送出する。
【0066】
<ステップS8>
ユーザがリモコン送信器10の発声ボタン8の押下をやめる。それにより、リモコン送信器10では、第二の赤外線LED4Vの発光が止まる。
音声信号/リモコンパルス変換部30では、FM検波部32により取り出されたキャリアの振幅が、キャリア検出部33により設定された一定レベルより下まで降下する。そのとき、キャリア検出部33は音声認識開始信号Tをネゲートする。音声認識部34は、その音声認識開始信号Tの立ち下がりエッジを検出する。
<ステップS9>
音声認識部34は、音声認識開始検出信号Tのネゲートを出力制御部36へ通知する。それにより、出力制御部36は、音声認識終了を示す制御コード(以下、認識終了コードという)を第二のリモコンパルスP2へ変換し、送出する。
【0067】
図5は、リモコンパルス選択部23による第一のリモコンパルスP1と第二のリモコンパルスP2との切替の詳細を示すフローチャートである。
<ステップS11>
音声信号/リモコンパルス変換部30では、出力制御部36が第二のリモコンパルスP2の送出に先立ち、リモコンパルス切替信号Nをアサートする。リモコンパルス選択部23はリモコンパルス切替信号Nのアサートを検知し、出力制御部36を入力元として選択する。それにより、リモコンパルス選択部23への入力が第一のリモコンパルスP1から第二のリモコンパルスP2へ切り替わる。
【0068】
<ステップS12>
出力制御部36は、リモコンパルス切替信号Nのアサートから例えば約100msecだけ待機する。その待機の間、リモコンパルス解読部24へはリモコンパルスが入力されない。それにより、リモコンパルス解読部24はNOPを判断する。
<ステップS13>
出力制御部36は、リモコンパルス切替信号Nのアサートから約100msec経過後、第二のリモコンパルスP2をリモコンパルス選択部23へ送出する。リモコンパルス解読部24はその第二のリモコンパルスP2から制御コードCを解読し、機器制御部25へ通知する。
【0069】
<ステップS14>
出力制御部36は、第二のリモコンパルスP2の送出完了時、約100msecだけ待機する。その待機の間、リモコンパルス解読部24へはリモコンパルスが入力されない。それにより、リモコンパルス解読部24はNOPを判断する。
<ステップS15>
出力制御部36は、第二のリモコンパルスP2の送出完了から約100msec経過後、リモコンパルス切替信号Nをネゲートする。リモコンパルス選択部23はリモコンパルス切替信号Nのネゲートを検知し、リモコン信号検波部22を入力元として再び選択する。それにより、リモコンパルス選択部23への入力が第二のリモコンパルスP2から第一のリモコンパルスP1へ切り替わる。
【0070】
リモコンパルス選択部23が上記の通り、第一のリモコンパルスP1と第二のリモコンパルスP2とを互いに排他的にリモコンパルス解読部24へ入力するので、両パルスの衝突が回避される。従って、リモコン送信器10でのキー操作による遠隔制御と音声による遠隔制御との間で、リモコンパルス解読部24と機器制御部25との共用が良好に実現される。
更に、音声信号/リモコンパルス変換部30での制御コードが、リモコン送信器10での制御コードと重複しても良い。
【0071】
リモコンパルス選択部23によるリモコンパルスの切替時、リモコンパルス解読部24への入力は実際には、一定時間の停止期間を経て切り替わる。リモコンパルス解読部24はその停止期間をNOPと判断し、その停止期間の前後でそれぞれ入力されるリモコンパルス同士を正確に区別できる。すなわち、リモコンパルスの切替の前後でそれぞれ入力された第一のリモコンパルスP1と第二のリモコンパルスP2とを、一連のリモコンパルスと誤認することが防止される。従って、第一のリモコンパルスP1と第二のリモコンパルスP2とが頻繁に切り替わるときでも、リモコンパルス解読部24は、それぞれのリモコンパルスから制御コードを正確に解読できる。
【0072】
図6は、音声での遠隔制御に関するDTV20の機器制御部25の動作の詳細を示すフローチャートである。
<ステップS21>
機器制御部25が、音声信号/リモコンパルス変換部30から認識開始コードを受信する。そのとき、機器制御部25は制御データ格納部26をアクセスし、認識開始コードに対応する制御データを読み出す。ここで、その制御データは、例えば、音声認識開始を示すテキストデータ又は画像データと、画面表示部28に対しそれらのデータをTV画面へ表示させるように指示するためのコマンドとを含む。
<ステップS22>
機器制御部25は、上記のコマンドに従い画面表示部28を制御し、それにより、上記のテキストデータ又は画像データをTV画面へ表示させる。
【0073】
<ステップS23>
機器制御部25は、第二のリモコンパルスP2により示される制御コードを受信する。そのとき、機器制御部25は制御データ格納部26をアクセスし、その制御コードに対応する制御データを読み出す。
ここで、音声信号/リモコンパルス変換部30が第一候補の単語Wを正常に決定したとき、その単語Wに対応するデータ又はコマンドが制御データ格納部26から読み出される。一方、機器制御部25により受信された制御コードがエラーコードであるとき、そのエラーコードにより示される認識エラーに関する情報が制御データ格納部26から読み出される。
<ステップS24>
制御データ格納部26から読み出された制御データが認識エラーに関する情報であるか否かを判断する。制御データが認識エラーに関する情報でないとき、処理はステップS25へ進み、それ以外のとき、処理はステップS27へ分岐する。
【0074】
<ステップS25>
音声信号/リモコンパルス変換部30で決定された第一候補の単語Wに対応する制御データに応じ、機器制御部25はDTV20内の機能部を制御する。
例えば、その制御データがチャンネルの切替を示すコマンドと目標チャンネルの番号とを含むとき、機器制御部25は画面表示部28を制御し、TV画面にその目標チャンネルの番組の映像を表示させる。
<ステップS26>
機器制御部25は、第一候補の単語Wを示すテキストデータを制御データ格納部26から読み出し、画面表示部28によりTV画面へ表示させる。更に、音声認識の成功を示す画像データを制御データ格納部26から読み出し、画面表示部28によりTV画面へ表示させても良い。こうして、音声による指示に従い、DTV20により実行された動作内容がユーザに通知される。
【0075】
<ステップS27>
機器制御部25は、認識エラーの要因を示すテキストデータを制御データ格納部26から読み出し、画面表示部28によりTV画面へ表示させる。更に、認識エラーを示す画像データを制御データ格納部26から読み出し、画面表示部28によりTV画面へ表示させても良い。こうして、音声による指示がDTV20により認識されなかったことが、その要因と共にユーザに通知される。
【0076】
<ステップS28>
機器制御部25が認識終了コードを受信する。そのとき、機器制御部25はタイムアウト処理を行い、ステップS26又はステップS27でのテキストデータ又は画像データの表示を、一定時間だけ維持する。
<ステップS29>
機器制御部25は画面表示部28を制御し、ステップS26又はステップS27で表示させたテキストデータ又は画像データを消去させる。
【0077】
ステップS26又はステップS27で、DTV20による音声認識の結果に関する情報を、TV画面にテキストデータ又は画像データで表示させる。それにより、音声による指示が正しく認識されたか否かを、ユーザは視覚的に判断できる。更に誤認があった場合はその内容を、ユーザは視覚的に把握できる。
その上、ステップS28でテキストデータ又は画像データの表示時間を調節することにより、ユーザは、次の音声による指示を発声すべきタイミングを、視覚的に判断できる。
【0078】
第二のリモコンパルスP2により示される制御コード数は、第一のリモコンパルスP1により示される制御コード数とは異なり制限されない。従って、第二のリモコンパルスP2により示される制御コード数は豊富である。
例えば、それらの制御コードの一部が、音声認識部34により設定される音声認識パラメータに対し割り当てられても良い。ここで、音声認識パラメータは例えば、声質レベル等の音響分析パラメータ又は尤度閾値を含む。
【0079】
音声認識パラメータは制御コードとして、音声認識部34から機器制御部25へ通知されても良い。機器制御部25は、通知された音声認識パラメータの値を種類別にパラメータ保存部27(図3参照)へ書き込む。それにより、音声認識部34で最適化された音声認識パラメータを保持できる。
ここで、パラメータ保存部27は不揮発性記録媒体、好ましくはフラッシュメモリを含む。その他に、ハードディスクを含んでも良い。それにより、一旦最適化された音声認識パラメータが、DTV20の電源の入切に関わらず保持される。電源の再投入時、音声認識部28はパラメータ保存部27に保持された音声認識パラメータに基づき、新たなパラメータの最適化を迅速に実現できる。
【0080】
音声認識部34により最適化された音声認識パラメータは、以下の流れに従い機器制御部25へ通知され、パラメータ保存部27により記憶される。
図7は、音声信号/リモコンパルス変換部30による音声認識パラメータの送出の詳細を示すフローチャートである。
<ステップS31>
音声認識部34は、出力制御部36に対し、音声認識パラメータの取り出しを指示する。出力制御部36はそのとき、音声認識パラメータの転送開始を示す制御コード(以下、パラメータ転送開始コードという)を制御コード格納部37から読み出し、第二のリモコンパルスP2へ変換し、送出する。
<ステップS32>
出力制御部36は、音声認識部34から音声認識パラメータを取り出す。
<ステップS33>
出力制御部36は、音声認識部34から取り出した音声認識パラメータのそれぞれの種類と値とを示す制御コードを、制御コード格納部37から読み出す。更に、それらの制御コードを順次、第二のリモコンパルスP2へ変換し、送出する。
【0081】
<ステップS34>
出力制御部36は音声認識部34へアクセスし、取り出すべき音声認識パラメータが残っているか否か、を判断する。未送出の音声認識パラメータが残っているとき、処理がステップS32へ戻る。音声認識パラメータを全て転送し終えたとき、処理がステップS35へ進む。
<ステップS35>
出力制御部36は、音声認識パラメータの転送終了を示す制御コード(以下、パラメータ転送終了コードという)を制御コード格納部37から読み出し、第二のリモコンパルスP2へ変換し、送出する。
【0082】
図8は、機器制御部25による音声認識パラメータの受信及び保存の詳細を示すフローチャートである。
<ステップS41>
リモコンパルス解読部24が第二のリモコンパルスP2からパラメータ転送開始コードを解読し、機器制御部25へ通知する。それにより、続いて入力される制御コードが音声認識パラメータを示すことを、機器制御部25は把握する。
<ステップS42>
リモコンパルス解読部24は第二のリモコンパルスP2から制御コードを解読し、機器制御部25へ通知する。機器制御部25は、その制御コードに対応する音声認識パラメータを制御データ格納部26から読み出す。読み出された音声認識パラメータは逐次、バッファへ一時記憶される。
【0083】
<ステップS43>
リモコンパルス解読部24が第二のリモコンパルスP2からパラメータ転送終了コードを解読し、機器制御部25へ通知する。それにより、機器制御部25は、バッファへ一時記憶された音声認識パラメータに対応するテキストデータ又は画像データを制御データ格納部26から読み出す。
<ステップS44>
機器制御部25は、ステップS43で読み出されたテキストデータ又は画像データを、画面表示部28によりTV画面に表示する。それにより、それらのパラメータの種類と値とが、ユーザへフィードバックされる。ユーザはそれらのパラメータに基づき、認識されやすい発音、スピード、抑揚、又は音量を、容易に工夫できる。
【0084】
<ステップS45>
機器制御部25は更に、バッファへ一時記憶された音声認識パラメータの値を種類別にパラメータ保存部27へ書き込む。
こうして、音声認識パラメータがパラメータ保存部27により記憶され、音声認識に関する学習の履歴を、DTV20の電源の入切に関わらず保持できる。その結果、電源の再投入時、音声認識パラメータの最適化を、パラメータ保存部27により保持された履歴を利用し、迅速に実現できる。
【0085】
実施例1によるDTV20は、上記の遠隔制御システムを利用し、例えば以下のようなGUIを実現する。
ユーザがリモコン送信器10の発声ボタン8を押す(図1参照)。それにより、第二の赤外線LED4Vが発光する(図2参照)。
DTV20の音声信号/リモコンパルス変換部30では、第二の受光部31を通し、FM検波部32が第二の赤外線LED4Vからのキャリアを検出する(図3参照)。そのキャリアの振幅が一定レベルを超えて増大することをキャリア検出部33が検出し、音声認識開始信号Tをアサートする。それにより、音声認識部34が起動し、音声認識を開始する。
【0086】
音声認識部34は、音声認識の開始を出力制御部36へ通知する。出力制御部36はそのとき制御コード格納部37にアクセスし、音声認識開始を通知するためのコマンドに対応する制御コード、すなわち認識開始コードを読み出す。
表1は、音声認識に関するコマンド又は音声認識パラメータと制御コードとの対応表、及び、それらの制御コードに従い実行されるDTV20の操作とTV画面28Aに表示されるテキストデータ又は画像データとの対応表の一例である。
【0087】
【表1】
Figure 0004050574
【0088】
ここで、第一列と第二列との対応は、音声信号/リモコンパルス変換部30内の制御コード格納部37(図3参照)により保持される。一方、第二列と第三〜五列との対応は、制御データ格納部26により保持される。
出力制御部36は、制御コード格納部37にアクセスし、表1の第一列と第二列とに相当する対応表を参照する。それにより、認識開始コード「0F/FE」を読み出す。更に、そのコードを第二のリモコンパルスP2へ変換し、機器制御部25へ送出する。
【0089】
機器制御部25は、第二のリモコンパルスP2からリモコンパルス解読部24により解読された認識開始コード「0F/FE」を受信する。そのとき、制御データ格納部26にアクセスし、表1の第二列と第三〜五列とに相当する対応表を参照する。それにより、認識開始コード「0F/FE」に対応するコマンド、テキストデータ、及び画像データを読み出す。表1に示される例では、「音声認識パネル」という画像A1(図1参照)のTV画面28Aへの表示を指示するためのコマンド、「音声認識パネル」A1内に表示される画像データIMとして「パターン1」、及び「音声認識パネル」A1内に表示されるテキストデータTXとして「テキスト1」が読み出される。
【0090】
図9は、制御コードのそれぞれに応じTV画面28Aに表示される画像データを例示する図である。ここで、画像データは、パターン4とパターン5とのような単一の静止画であっても、又はパターン1〜3のような動画であっても良い。
表2は、制御コードのそれぞれに応じTV画面28Aに表示されるテキストデータを例示する表である。
【0091】
【表2】
Figure 0004050574
【0092】
機器制御部25は、制御データ格納部26から読み出したコマンドに従い画面表示部28を制御し、図1に示されるように、TV画面28Aへ音声認識パネルA1を表示させる。図1の例では特に、音声認識パネルA1には、図9の「パターン1」と表2の「テキスト1」とが表示される。
こうして、DTV20による音声認識の開始準備の完了がユーザへ通知される。それにより、ユーザは、リモコン送信器10の発声ボタン8を押した後での発声開始のタイミングを的確に把握できる。
【0093】
ユーザはリモコン送信器10の発声ボタン8を押しながら、例えば選局目標のチャンネル番号を示す単語「いっちゃんねる」を発声する(図1参照)。その一連の音声Vは、リモコン送信器10内のマイクロフォン5と低周波増幅器6とを通し、音声信号Sとして入力される。その音声信号Sは更に周波数変調を通し、第二の赤外線LED4Vからの赤外線による音声信号RVへ変換され、送出される(図2参照)。
【0094】
DTV20の音声信号/リモコンパルス変換部30では、第二の受光部31を通し、FM検波部32が第二の赤外線LED4Vからの音声信号RVを検出し、元の音声信号Sに復調する(図3参照)。音声認識部34はその復調された音声信号Sを辞書35に登録された単語のそれぞれと比較し、尤度を計算する。その尤度に基づき、第一候補の単語Wを所定条件に従い決定する。
【0095】
認識処理が正常に行われるとき、例えば上記の音声「いっちゃんねる」に対しては、辞書35に登録された「いっちゃんねる」という単語が第一候補の単語Wとして、正しく決定される。
出力制御部36は音声認識部34から第一候補の単語Wを取り出す。更に、制御コード格納部37をアクセスする。
表3は、辞書35に登録される単語と制御コードとの対応表、及び、それらの制御コードに従い実行されるDTV20の操作とTV画面28Aに表示されるテキストデータ又は画像データとの対応表の一例である。
【0096】
【表3】
Figure 0004050574
【0097】
ここで、第一列と第二列との対応は、音声信号/リモコンパルス変換部30内の制御コード格納部37(図3参照)により保持される。一方、第二列と第三〜五列との対応は、制御データ格納部26により保持される。
出力制御部36は、制御コード格納部37にアクセスし、表3の第一列と第二列とに相当する対応表を参照する。それにより、単語「いっちゃんねる」に対応する制御コード「00/00」を読み出す。更に、その制御コードを第二のリモコンパルスP2へ変換し、機器制御部25へ送出する。
【0098】
機器制御部25は、第二のリモコンパルスP2からリモコンパルス解読部24により解読された制御コード「00/00」を受信する。そのとき、制御データ格納部26にアクセスし、表3の第二列と第三〜五列とに相当する対応表を参照する。それにより、制御コード「00/00」に対応するコマンド、テキストデータ、及び画像データを読み出す。表3に示される例では、チャンネル番号「1」に相当するポジション1の選局をTVチューナに対し指示するためのコマンド、音声認識パネルA1(図1参照)内に表示される画像データIMとして「パターン2」(図9参照)、及び音声認識パネルA1内に表示されるテキストデータTXとして「テキスト2」(表2参照)が読み出される。ここで、表2のテキスト2の内容中、「〜」には選局目標のチャンネル番号を示すテキストデータ、例えば「1CH」が挿入される。
【0099】
機器制御部25はまず画面表示部28を制御し、「パターン2」と「テキスト2」の第一文「1CHを選局します」とをTV画面28Aへ表示させる。次に、TVチューナ(図示せず)を制御し、ポジション1を選局させる。更に、画面表示部28を制御し、「テキスト2」の第二文「1CHを選局しました」をTV画面28Aに表示させる。
こうして、認識された音声による選局の実行とその選局先とがユーザに通知される。それにより、音声による指示がDTV20によりどのように認識されたのかを、ユーザは明確に把握できる。
【0100】
音声による指示に対し割り当て可能な制御コード数は、リモコン送信器10でのキー操作に対し割り当て可能な制御コードとは異なり制限されない。表3に例示されるように、音声で指示可能な機能は、選局を含め、多種多様である。
例えば、ユーザが「さっかー」と発声するとき、TV画面28Aにはまず、「サッカーを検索します」という「テキスト5」の第一文がテキストデータTXとして表示される。更に、EPGにより「サッカー」がジャンル検索され、その検索結果の一覧が、「サッカーを検索しました」という「テキスト5」の第二文と共にTV画面28Aに表示される。
ここで、選局又はEPGによる検索等、比較的長い処理時間を要する操作を指示するとき、「テキスト2」又は「テキスト5」のように、テキストデータTXをDTV20の操作前後で変化させる。それにより、DTV20が音声により指示された操作を実行中であることを、ユーザは明確に把握できる。その結果、ユーザに待ち時間を短く感じさせ得る。
【0101】
音声認識部34は、第一候補の単語を決定できないとき、又は「発声途中のキャリア遺失」を検出したとき、認識エラーがあると判断し、認識処理を中断する。更に、認識エラーに関する情報をその要因毎に出力制御部36へ通知する。
出力制御部36は、その通知された情報に対応する制御コード、すなわちエラーコードを制御コード格納部37から読み出す。
表4は、認識エラーの内容とエラーコードとの対応表、及び、それらのエラーコードに従いTV画面28Aに表示されるテキストデータ又は画像データとの対応表の一例である。
【0102】
【表4】
Figure 0004050574
【0103】
ここで、第一列と第二列との対応は、制御コード格納部37(図3参照)により保持される。一方、第二列と第三、四列との対応は、制御データ格納部26により保持される。
出力制御部36は、制御コード格納部37にアクセスし、表4の第一列と第二列とに相当する対応表を参照する。
【0104】
例えば、通知された認識エラーが「発声途中のキャリア遺失」であるとき、エラーコード「0F/06」を読み出す。更に、そのエラーコードを第二のリモコンパルスP2へ変換し、機器制御部25へ送出する。
機器制御部25は、第二のリモコンパルスP2からリモコンパルス解読部24により解読されたエラーコード「0F/06」を受信する。そのとき、制御データ格納部26にアクセスし、表4の第二列と第三、四列とに相当する対応表を参照する。それにより、エラーコード「0F/06」に対応するテキストデータと画像データとを読み出す。表4に示される例では、「音声認識パネル」A1内に表示される画像データIMとして「パターン3」、及びテキストデータTXとして「テキスト13」が読み出される。機器制御部25は画面表示部28を制御し、「パターン3」と「テキスト13」とをTV画面28Aへ表示させる。
その結果、発声途中で発声ボタンを放す等により赤外線が途切れ、認識エラーが生じた、とユーザは理解できる。
【0105】
認識エラーには、表4に例示されるように、様々な要因があり得る。例えば、ユーザの声量、声質、若しくは発声タイミングが不適切であること、周囲の雑音が過大でS/N比が過小なこと、又は、発声された単語が誤っていること等により、音声認識部34が音声信号により示される単語を認識できない場合がある。その他に、認識された単語について計算された尤度が、辞書35に登録されたいずれの単語に対しても所定条件を満たさない場合がある。
【0106】
例えば、リモコン送信器10のマイクロフォン5により捉えられた音声のレベルが大きすぎる、と音声認識部34が判断するとき、出力制御部36は、「声が大きすぎた」という認識エラーの内容に対応するエラーコード「0F/02」を送出する。機器制御部25は、エラーコード「0F/02」に対応する「テキスト9」(表2参照)と「パターン3」(図9参照)をTV画面28Aに表示させる。
それにより、認識エラーの発生、及びその原因が大きすぎる声量であることをユーザは容易に把握できる。その結果、音声による指示を新たに行うとき、声量を抑える等のエラー回避方法をユーザは工夫できる。
【0107】
DTV20による認識エラーは以上のように、そのエラー内容と共にユーザへ通知される。それにより、ユーザは、音声による指示を新たに行うとき、認識エラーの再発を適切に回避できる。
【0108】
ユーザは更に、次のような「マイクテスト」、すなわち音声認識部34による音声認識パラメータの最適化を実行しても良い。
ユーザが「まいくてすと」と発声する。
音声認識部34がその音声を「まいくてすと」という単語として正しく認識するとき、出力制御部36は、その単語に対応する制御コード「0F/9F」(表3参照)を機器制御部25へ送出する。
機器制御部25は、その制御コード「0F/9F」に対応するコマンド、テキストデータ、及び画像データを、制御データ格納部26から読み出す。表3に示される例では、「マイクテスト画面」という画像A2(図1参照)のTV画面28Aへの表示を指示するためのコマンド、「音声認識パネル」A1内に表示されるテキストデータTXとして「テキスト15」(表2参照)、及び、「マイクテスト画面」A2内に表示される画像データとして「パターン4」(図9参照)が読み出される。機器制御部25はそのコマンドにより画面表示部28を制御し、「マイクテスト画面」A2と「テキスト15」とをTV画面28Aに表示させる。
【0109】
音声認識部34は「まいくてすと」という音声を基に、ユーザの音声固有のフォルマントから音声認識パラメータを最適化する。特に、声道長による周波数対パワースペクトル偏移を声質レベルとして指標化し、最も高い尤度に対応する声質レベルの最適値αを分析する。
【0110】
音声認識部34が音声認識パラメータの最適化に成功したとき、出力制御部36は音声認識パラメータの最適化成功を通知するためのコマンド「マイクテスト結果通知(OK)」に対応する制御コード「08/52」(表1参照)を、機器制御部25へ送出する。それにより、機器制御部25は「テキスト16」(表2参照)と「パターン5」(図9参照)とをTV画面28Aに表示させる。
【0111】
出力制御部36は次に、声質レベルの最適値αを含む最適化された音声認識パラメータを、音声認識部34から取り出す。例えば、声質レベルの最適値αが−2であるとき、出力制御部36は、声質レベルα=−2を通知するためのコマンドに対応する制御コード「08/61」(表1参照)を、機器制御部25へ送出する。それにより、機器制御部25は「パターン5」による声質レベルの表示を、通知された最適値αに合わせる。
ここで、図9では、「パターン5」が「声質レベルα=−2」を示す画像として描かれる。声質レベルの最適値αがその他の値であるとき、その値に応じ、「パターン5」中に描かれるインジケータGの位置及び声質レベルの値Hが変化する。それらの表示を通し、音声認識部34が音声認識パラメータの最適化を実現できることを、ユーザは明確に把握できる。
【0112】
音声認識部34が音声認識パラメータの最適化に成功したとき、その最適化された音声認識パラメータが次のように、パラメータ保存部27(図3参照)により記憶されても良い。
出力制御部36は、パラメータ転送開始コード「0E/10」(表1参照)を機器制御部25へ送出する。更に、最適化された音声認識パラメータのそれぞれに対応する制御コードを順次、機器制御部25へ送出する。それらのパラメータを全て送出し終えた時、出力制御部36は、パラメータ転送終了コード「0E/11」(表1参照)を機器制御部25へ送出する。
【0113】
機器制御部25は、パラメータ転送開始コードの受信後、出力制御部36から受信される一連の制御コードのそれぞれに対応する音声認識パラメータを、制御データ格納部26からバッファに順次転送する。更に、パラメータ転送終了コードの受信時、バッファに蓄積された一連の音声認識パラメータを、パラメータ保存部27に記憶する。
こうして、最適化された音声認識パラメータを、パラメータ保存部27内の不揮発性記録媒体により記憶する。それにより、音声認識に関する学習の履歴をDTV20での電源の入切に関わらず保持できる。その結果、電源の再投入時、その保持された音声認識パラメータの履歴を利用し、音声認識パラメータの最適化を迅速に実現できる。
【0114】
音声認識部34がユーザの音声「まいくてすと」の認識に失敗し、又は音声認識パラメータの最適化に失敗したとき、出力制御部36は音声認識パラメータの最適化失敗を通知するためのコマンド「マイクテスト結果通知(NG)」に対応する制御コード「08/53」(表1参照)を、機器制御部25へ送出する。それにより、機器制御部25は「テキスト17」(表2参照)と「パターン4」(図9参照)とをTV画面28Aに表示させる。
それらの表示を通し、音声認識部34が音声認識パラメータの最適化を実現できない状態にあることを、ユーザは明確に把握できる。それにより、例えば周囲の騒音の抑制等の対策をユーザは工夫できる。
【0115】
実施例1による遠隔制御システムは、赤外線を通信媒体として利用する。その他に、電波を通信媒体として利用しても良い。そのとき、リモコン送信器10として、携帯電話、PHS、又はPDAを利用できる。特に、PHS、W−CDMA方式採用の第三世代移動体通信端末、又はBLUETOOTH(登録商標)規格に準拠の通信端末等は、音声信号を高品位に伝送可能である。従って、それらを実施例1による遠隔制御システムでの音声信号の伝送に利用するとき、信頼性の高い音声認識が実現され得る。
【0116】
《実施例2》
本発明の実施例2による画像処理装置は、実施例1と同様、DTVであり、リモコン送信器でのキー操作と音声とによる遠隔制御システムを搭載する。但し、実施例1とは異なり、リモコン送信器は音声入力部を含まず、遠隔制御対象機器であるDTVがマイクロフォンを通し、ユーザの音声を直接入力する。その他の構成及び動作については、実施例2は実施例1と共通する。
【0117】
図10は、本発明の実施例2によるDTV20Aでの遠隔制御システムの外観を示す模式図である。
ユーザがリモコン送信器10Aのキーパッド1の一つを押す。そのとき、そのキーに対応する制御情報(例えば、目標のチャンネル番号等)が、例えば赤外線によるリモコン信号RKとして、赤外線LED4KからDTV20Aへ送信される。そのリモコン信号RKはDTV20の受光部21により受信され、対応する制御情報が解読される。それにより、その制御情報の示す操作が実行される。例えば、キーパッド1のそれぞれに対応するチャンネルの番組がTV画面28Aに映し出される。こうして、リモコン送信器10Aでのキー操作による遠隔制御が実現される。
【0118】
ユーザがDTV20Aのマイクロフォン5Aへ、DTV20Aに対する制御情報(例えば、目標のチャンネル番号等)を示す音声Vを入力する。ここで、マイクロフォン5AはDTV20の音声信号/リモコンパルス変換部30Aと接続される。ユーザの音声Vはマイクロフォン5Aを通し音声信号/リモコンパルス変換部30Aへ直接入力され、対応する制御情報が解読される。解読された制御情報は例えばケーブル38を通しDTV20A本体へ伝送され、その制御情報に対応する操作が実行される。例えば、音声Vの示す目標チャンネルの番組がTV画面28Aに映し出される。こうして、音声による遠隔制御が実現される。
【0119】
以下、実施例2について、実施例1とは異なる部分を説明し、共通の部分については実施例1での説明を援用する。
図11は、上記の実施例2による遠隔制御システムに含まれるリモコン送信器10Aの構成を示すブロック図である。ここで、実施例1によるリモコン送信器10と同様な構成に対し、図2と同じ符号を付し、それらの説明は実施例1のものを援用する。
図2と図11との比較から明らかなように、実施例2によるリモコン送信器10Aは実施例1によるリモコン送信器10から音声入力に関する構成を除いたものと実質的に等しい。
【0120】
図12は、実施例2によるDTV20A内の遠隔制御システムに関する部分を示すブロック図である。ここで、実施例1によるDTV20と同様な構成に対し、図3と同じ符号を付し、それらの説明は実施例1のものを援用する。
【0121】
音声信号/リモコンパルス変換部30Aは以下の構成により、ユーザの音声Vを直接入力し、音声信号Sへ変換し、それに対し音声認識を行う。認識された音声により示される制御情報は実施例1と同様に、第一のリモコンパルスP1により示される制御コードと共通のフォーマットで符号化され、第一のリモコンパルスP1と共通のフォーマットである第二のリモコンパルスP2として出力される。
【0122】
マイクロフォン5Aはユーザの音声Vを入力し、電気信号へ変換する。
低周波増幅器6Aは、マイクロフォン5Aにより変換された電気信号から音声Vに対応する周波数成分を抜き出し、音声信号Sとして音声認識部34へ送出する。
レベル検出部33Aは、低周波増幅部6Aにより抜き出された音声信号Sの振幅を、一定レベルと比較する。音声信号Sの振幅がその一定レベルを超えて増大するとき、レベル検出部33Aは音声認識開始信号Tを一定時間だけアサートする。一方、音声信号Sの振幅が一定時間、その一定レベルより低く維持されるとき、レベル検出部33Aは音声認識開始信号Tをネゲートする。
【0123】
実施例2によるDTV20Aでは、実施例1によるDTV20とは異なり、ユーザの音声が直接入力される。従って、プレストーク方式に関する認識エラー、例えば発声途中に発声ボタンの押下が止まった等による認識エラーについては、処理が不要である。それ故、音声認識部34等の処理負担が軽減される。
【0124】
実施例2による音声信号/リモコンパルス変換部30Aへ一旦入力された音声信号Sは、実施例1と同様に処理される。従って、実施例2は、音声入力の相違を除き、実施例1と同様な遠隔制御システムを実現する。それ故、実施例2は実施例1と同様な以下の効果を発揮できる。
まず、第一のリモコンパルスP1と第二のリモコンパルスP2とが共通のフォーマットに従うので、リモコンパルス解読部24と機器制御部25とがそれらのリモコンパルスのいずれに対しても共用される。それらは特に、従来の回路と同様な一系統の制御回路として構成される。その結果、シャシ設計が容易である。
【0125】
第二のリモコンパルスP2は更に、音声信号/リモコンパルス変換部30Aからリモコンパルス選択部23までの間だけを、外部に漏出することなく伝送される。それ故、第二のリモコンパルスP2により示される制御コードは、第一のリモコンパルスP1により示されるものとは異なり、他の遠隔制御システムでのものと重複しても構わない。こうして、実施例2による遠隔制御システムでは、音声による制御情報として割り当て可能な制御コード数が豊富である。その結果、音声により指示可能な機能が容易に拡張される。
【0126】
【発明の効果】
本発明による遠隔制御対象機器は音声認識を行う。そのとき、認識された音声信号により示される制御情報はリモコンパルスへ変換され、機器制御部へ送出される。こうして、機器制御部により扱われるべき制御情報が従来のものと共通のデータ形態、すなわちリモコンパルスで表される。従って、ユーザからの制御情報がリモコン送信器からのリモコン信号又は音声信号のいずれのデータ形態で入力されるときでも、機器制御部としては従来と同様な回路構成を共用できる。すなわち、機器制御部が従来と同様な一系統として容易に統合される。その結果、シャシ設計が容易である。
【0127】
リモコンパルス選択部は、音声信号/リモコンパルス変換部による第二のリモコンパルスの出力時、その第二のリモコンパルスをリモコンパルス解読部へ入力し、リモコン受信部からの第一のリモコンパルスを遮断する。こうして、リモコンパルス解読部は、第一のリモコンパルスと第二のリモコンパルスとを排他的に処理する。従って、第一のリモコンパルスと第二のリモコンパルスとの間で共通の制御コードを、それぞれ別の機能へ割り当てても良い。
更に、音声信号/リモコンパルス変換部とリモコンパルス選択部との間を、例えば共通の筐体内部又はケーブル等で接続し、第二のリモコンパルスが遠隔制御対象機器の外部へ漏れないようにしても良い。それにより、第二のリモコンパルスにより示される制御コードを、他の遠隔制御システムのものと重複させ得る。以上の結果、第二のリモコンパルスにより示される制御コードとして、任意のカテゴリーコード又はデータコードを割り当て得る。特に、第二のリモコンパルスにより示される制御コード数は、第一のリモコンパルスとは異なり、リモコン信号により示される制御コード数の制約を受けない。こうして、本発明による遠隔制御対象機器は、音声で指示可能な機能を容易に拡張できる。
【0128】
本発明による画像処理装置は、上記の本発明による遠隔制御対象機器であり、特に音声での指示に対し、例えば次のようなGUIを提供できる。
機器制御部は音声での指示に従い画面表示部を制御し、音声認識に関する情報を表示する。それにより、その情報がユーザへ視覚的にフィードバックされる。その情報は例えば、ユーザに対する適切な発声タイミングの通知、認識された単語若しくはその候補の一覧、又は認識された操作内容を含む。更に、音声認識に関しエラーが生じたとき、そのエラー情報を画面に表示しても良い。そのような画面表示による情報のフィードバックを通し、ユーザは、例えば認識されやすい発音、スピード、抑揚、又は音量を、容易に工夫できる。
こうして、本発明による画像処理装置は、特に音声での遠隔制御に関し、操作性を向上できる。
【図面の簡単な説明】
【図1】本発明の実施例1によるDTV20での遠隔制御システムの外観を示す模式図である。
【図2】本発明の実施例1による遠隔制御システムに含まれるリモコン送信器10の構成を示すブロック図である。
【図3】本発明の実施例1によるDTV20内の遠隔制御システムに関する部分を示すブロック図である。
【図4】本発明の実施例1による音声信号/リモコンパルス変換部30の動作の詳細を示すフローチャートである。
【図5】本発明の実施例1によるリモコンパルス選択部23について、第一のリモコンパルスP1と第二のリモコンパルスP2との切替の詳細を示すフローチャートである。
【図6】本発明の実施例1によるDTV20について、音声での遠隔制御に関する機器制御部25の動作の詳細を示すフローチャートである。
【図7】本発明の実施例1による音声信号/リモコンパルス変換部30について、音声認識パラメータの送出の詳細を示すフローチャートである。
【図8】本発明の実施例1による機器制御部25について、音声認識パラメータの受信及び保存の詳細を示すフローチャートである。
【図9】本発明の実施例1によるDTV20でのGUIについて、制御コードのそれぞれに応じTV画面28Aに表示される画像データを例示する図である。
【図10】本発明の実施例2によるDTV20Aでの遠隔制御システムの外観を示す模式図である。
【図11】本発明の実施例2による遠隔制御システムに含まれるリモコン送信器10Aの構成を示すブロック図である。
【図12】本発明の実施例2によるDTV20A内の遠隔制御システムに関する部分を示すブロック図である。
【図13】従来の遠隔制御システムの一例に含まれるリモコン送信器100の構成を示すブロック図である。
【図14】従来の遠隔制御システムの一例での遠隔制御対象機器、すなわちVTR200内のリモコンに関する部分を示すブロック図である。
【図15】従来の遠隔制御システムの別例に含まれるリモコン送信器400の構成を示すブロック図である。
【図16】従来の遠隔制御システムの別例での遠隔制御対象機器、すなわちVTR400内のリモコン及び音声認識に関する部分を示すブロック図である。
【符号の説明】
20 DTV
38 ケーブル
RK リモコン信号
RV 赤外線による音声信号
S 音声信号
T 音声認識開始信号
W 第一候補の単語
C 制御コード
N リモコンパルス切替信号
P1 第一のリモコンパルス
P2 第二のリモコンパルス
P リモコンパルス
D 制御データ

Claims (8)

  1. (A) リモコン信号を受信し、そのリモコン信号を第一のリモコンパルスへ変換するためのリモコン受信部;
    (B) 音声信号を入力し、その音声信号に対応する制御コードを選択し、その制御コードを第二のリモコンパルスへ変換するための音声信号/リモコンパルス変換部;
    (C) 所定の切替信号に従い、前記第一のリモコンパルスと前記第二のリモコンパルスとのいずれかを選択するためのリモコンパルス選択部;及び、
    (D) 前記リモコンパルス選択部により選択されたリモコンパルスから制御コードを解読し、その制御コードに従い動作制御を行うためのリモコンパルス処理部;
    を有する遠隔制御対象機器。
  2. (A) 前記音声信号/リモコンパルス変換部が、
    (a) 音声認識対象データを含む辞書;
    (b) 前記音声信号と前記音声認識対象データのそれぞれとの類似度を計算し、それらの類似度に基づき、前記音声信号に対応すべき前記音声認識対象データの候補、又はエラーコードを選択するための音声認識部;
    (c) 前記音声認識対象データと前記エラーコードとのそれぞれに対応する制御コードを記憶する制御コード格納部;及び、
    (d) 前記音声認識対象データの候補、又は前記エラーコードに対応する制御コードを前記制御コード格納部から読み出し、その制御コードを前記第二のリモコンパルスへ変換し、前記切替信号と共に前記リモコンパルス選択部へ出力するための出力制御部;
    を有し、
    (B) 前記リモコンパルス処理部が、
    (a) 前記リモコンパルス選択部により選択されたリモコンパルスを解読し、そのリモコンパルスに対応する制御コードへ変換するためのリモコンパルス解読部;
    (b) 前記制御コードのそれぞれに対応する制御データとコマンドとを記憶する制御データ格納部;及び、
    (c) 前記リモコンパルス解読部により解読された制御コードに対応する制御データ又はコマンドを前記制御データ格納部から読み出し、それらの制御データ又はコマンドに基づき所定の動作制御を行うための機器制御部;
    を有する、請求項1記載の遠隔制御対象機器。
  3. (A) 不揮発性記録媒体を含むパラメータ保存部、を前記遠隔制御対象機器が有し;
    (B) 前記音声認識部が音声認識パラメータを前記出力制御部へ出力し;
    (C) 前記制御コード格納部が前記音声認識パラメータに対応する制御コードを記憶し;
    (D) 前記出力制御部が、前記制御コードを前記制御コード格納部から読み出し、その制御コードを前記第二のリモコンパルスへ変換し、前記リモコンパルス選択部へ出力し;
    (E) 前記制御データ格納部が前記制御コードに対応する前記音声認識パラメータを記憶し;
    (F) 前記機器制御部が、前記リモコンパルス解読部により解読された前記制御コードに対応する前記音声認識パラメータを前記制御データ格納部から読み出し、それらの音声認識パラメータを前記パラメータ保存部へ書き込む;
    請求項2記載の遠隔制御対象機器。
  4. (A) ユーザの音声を入力し前記音声信号へ変換するための音声入力部と、(B) 前記音声信号の振幅に応じ前記音声信号/リモコンパルス変換部を起動するための起動制御部と、を前記音声信号/リモコンパルス変換部が含む;
    請求項1記載の遠隔制御対象機器。
  5. (A) (a) ユーザの音声を入力し前記音声信号へ変換するための音声入力部と、(b) 超音波、赤外線、又は電波によるキャリアを前記音声信号により変調し外部へ送出するための無線送信部と、を含み、かつ前記リモコン信号を送信するためのリモコン送信器;及び、
    (B) (a) 前記キャリアを受信するための無線受信部と、(b) 前記キャリアの振幅に応じ前記音声信号/リモコンパルス変換部を起動するための起動制御部と、を前記音声信号/リモコンパルス変換部が含む、請求項1記載の遠隔制御対象機器;
    を有する遠隔制御システム。
  6. 前記機器制御部に従い所定の画像を表示するための画面表示部と、を有し、かつ請求項2記載の遠隔制御対象機器である画像処理装置であり、
    (A) 前記制御データ格納部が、前記画面表示部に対する制御データとコマンド、及び前記画面表示部により表示させるための表示データを、所定の制御コードにそれぞれ対応させて記憶し;
    (B) 前記機器制御部が、前記第二のリモコンパルスから前記リモコンパルス解読部により解読された制御コードに対応する前記表示データを前記制御データ格納部から読み出し、その表示データを前記画面表示部により表示させる;
    画像処理装置。
  7. 前記表示データがテキストデータを含む、請求項6記載の画像処理装置。
  8. 前記表示データが画像データを含む、請求項6記載の画像処理装置。
JP2002246673A 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置 Expired - Fee Related JP4050574B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002246673A JP4050574B2 (ja) 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001-352753 2001-11-19
JP2001352753 2001-11-19
JP2002246673A JP4050574B2 (ja) 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置

Publications (2)

Publication Number Publication Date
JP2003219201A JP2003219201A (ja) 2003-07-31
JP4050574B2 true JP4050574B2 (ja) 2008-02-20

Family

ID=27667325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002246673A Expired - Fee Related JP4050574B2 (ja) 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置

Country Status (1)

Country Link
JP (1) JP4050574B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4660299B2 (ja) * 2005-06-29 2011-03-30 三菱電機株式会社 移動体用情報装置
JP2007020079A (ja) * 2005-07-11 2007-01-25 Funai Electric Co Ltd テレビ受像機
JP2011118822A (ja) * 2009-12-07 2011-06-16 Nec Casio Mobile Communications Ltd 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム
CN102238287B (zh) * 2011-08-05 2014-04-09 宇龙计算机通信科技(深圳)有限公司 移动终端和根据环境数据进行显示的方法
JP2014010161A (ja) * 2012-06-27 2014-01-20 Nitto Denko Corp 表示入力装置
KR20140054643A (ko) * 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
JP6114915B2 (ja) 2013-03-25 2017-04-19 パナソニックIpマネジメント株式会社 音声入力選択装置及び音声入力選択方法
JP5802784B2 (ja) * 2014-03-24 2015-11-04 株式会社東芝 音声処理装置および音声処理方法

Also Published As

Publication number Publication date
JP2003219201A (ja) 2003-07-31

Similar Documents

Publication Publication Date Title
KR100486368B1 (ko) 원격제어대상기기, 원격제어시스템 및 화상처리장치
JP6824316B2 (ja) 映像処理装置及びその制御方法、並びに映像処理システム
EP1209661B1 (en) Universal remote control adapted to receive voice input
US10720162B2 (en) Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof
US20130218562A1 (en) Sound Recognition Operation Apparatus and Sound Recognition Operation Method
US9552057B2 (en) Electronic apparatus and method for controlling the same
US20030018479A1 (en) Electronic appliance capable of preventing malfunction in speech recognition and improving the speech recognition rate
EP3429215B1 (en) Remote controller and method for receiving a user's voice thereof
US6560469B1 (en) Microphone/speaker-contained wireless remote control system for internet device and method for controlling operation of remote controller therein
JP2004507936A (ja) ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置
EP1085500B1 (en) Voice recognition for controlling a device
JP4050574B2 (ja) 遠隔制御対象機器、遠隔制御システム、及び画像処理装置
US20110040563A1 (en) Voice Control Device and Voice Control Method and Display Device
KR102501655B1 (ko) 디스플레이장치, 음성취득장치 및 그 음성인식방법
CN101998077A (zh) 语音控制装置、语音控制方法及相关显示装置
US20090072993A1 (en) Remote control system and method thereof
US20060033636A1 (en) Controlling an infrared responsive device
JP4670716B2 (ja) 音声認識機能付き電子機器
US20230223019A1 (en) Information processing device, information processing method, and program
KR20020011028A (ko) 음성신호를 이용한 원격 제어방법 및 제어장치
KR102420155B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR101220288B1 (ko) Tv 전원 상태에 기인한 방송수신장치 자동 모드 전환 방법 및 이를 적용한 방송수신장치
KR20240078409A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR20230007994A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
JP2008096577A (ja) Av機器に対する音声操作システム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050819

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees