JP2003219201A - 遠隔制御対象機器、遠隔制御システム、及び画像処理装置 - Google Patents

遠隔制御対象機器、遠隔制御システム、及び画像処理装置

Info

Publication number
JP2003219201A
JP2003219201A JP2002246673A JP2002246673A JP2003219201A JP 2003219201 A JP2003219201 A JP 2003219201A JP 2002246673 A JP2002246673 A JP 2002246673A JP 2002246673 A JP2002246673 A JP 2002246673A JP 2003219201 A JP2003219201 A JP 2003219201A
Authority
JP
Japan
Prior art keywords
remote control
control
unit
voice
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002246673A
Other languages
English (en)
Other versions
JP4050574B2 (ja
Inventor
Shunei Ishihara
俊英 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002246673A priority Critical patent/JP4050574B2/ja
Publication of JP2003219201A publication Critical patent/JP2003219201A/ja
Application granted granted Critical
Publication of JP4050574B2 publication Critical patent/JP4050574B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Details Of Television Systems (AREA)
  • Selective Calling Equipment (AREA)

Abstract

(57)【要約】 【課題】 従来の構成を最小限の変更で利用しかつ高度
な機能拡張性を有する、リモコン送信器でのキー操作と
音声との両方による遠隔制御システム、及び、その遠隔
制御システムを搭載し、音声認識に関する情報を画面表
示でユーザへフィードバックするGUIにより好適な操
作性を有する画像処理装置を提供する。 【解決手段】 音声信号/リモコンパルス変換部30は音
声信号Sをリモコン送信器から赤外線RVで入力し、音声
認識を行う。認識された単語Wにより示される制御情報
は、リモコン信号RKにより示される制御コードと同じフ
ォーマットの制御コードCへ変換される。それぞれの制
御コードは共通のフォーマットのリモコンパルスP1とP2
として、リモコンパルス選択部23へ入力される。リモコ
ンパルス選択部23はリモコンパルス切替信号Nに従い、
リモコンパルスP1とP2とのいずれかを排他的にリモコン
パルス解読部24へ入力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、リモートコントロ
ール(以下、リモコンと略す)送信器でのキー操作と音
声とで家電機器等を遠隔制御するためのシステム、特に
そのシステム内の制御対象機器に関し、更に、そのシス
テムによるGUI(Graphical User Interface)を搭載
する画像処理装置に関する。
【0002】
【従来の技術】近年の家電機器は技術の高度化により、
非常に多くの機能を獲得した。例えばテレビジョン(T
V)受像機は、選局、電源入切、音量調節、及び音声多
重モードの切替等の標準機能を持つ。近年では更に、デ
ジタル放送への対応に伴う機能のデジタル化及び多チャ
ンネル化により、例えば、EPG(Electric Program G
uide:電子番組表)による番組検索、i−Link(I
EEE1394)接続による周辺機器の制御、又はインター
ネットへの接続等の拡張機能を装備する。
【0003】機能の増大は、便利である反面、機器の操
作を複雑にした。ユーザによる操作の簡単化を目的と
し、多くの家電機器はリモコン送信器による遠隔制御シ
ステムを搭載する。特に、TV受信機又はビデオテープ
レコーダ(VTR)等、画面表示機能を発揮する機器
(以下、画像処理装置という)は、その遠隔制御システ
ムによる次のようなGUIを実現する:ユーザはリモコ
ンで、操作メニューを画面に表示させる。ユーザは更に
リモコン送信器に対するキー操作で、画面に表示された
カーソルを移動させ、それによりメニュー内のカテゴリ
ーを一つ選択する。その選択されたカテゴリーが更にサ
ブカテゴリーを含むとき、画面にはそれらのサブカテゴ
リーのメニューが表示される。ユーザはそのメニューか
らサブカテゴリーを一つ、同様なカーソル操作で選択す
る。こうして、選択された操作に対応する機能を、画像
処理装置は実行する。
【0004】上記のようなメニューの階層構造は、機能
の更なる増大に伴い深層化し、かつ複雑化する。そのと
き、カテゴリーの選択では、メニューの各階層間の移動
が、一般に多数回必要である。それにより、リモコン送
信器でのキー操作が長時間繰り返されねばならない。そ
のようなキー操作の長時間の繰り返しは、特に中高齢の
ユーザにとって、必ずしも容易ではない。そこで、音声
によりリモコン送信器でのキー操作を補う遠隔制御シス
テムが開発されている。そのシステムによるGUIでは
例えば、メニューの各階層間の移動が音声で指示され、
画面上のカーソル移動がリモコン送信器でのキー操作で
指示される。そのように、音声による制御と、リモコン
送信器でのキー操作による制御とのそれぞれの利点を生
かし、操作性の向上が図られる。
【0005】従来の遠隔制御システムには例えば、電子
技術出版発行「テレビ技術」1991年5月号第38〜44頁に
VTR用音声リモコンとして開示されたものが知られ
る。この遠隔制御システムは、VTRを遠隔制御対象機
器とし、音声認識装置付リモコン送信器を通し、キー操
作と音声とでそのVTRに対する遠隔制御を実現する。
【0006】図13は、その従来の遠隔制御システムに含
まれるリモコン送信器100の構成を示すブロック図であ
る。ユーザがキーパッド101の一つを押すとき、リモコ
ンパルス変換部102がそのキーに応じ制御コードを選択
する。更に、その制御コードを電気信号(以下、第一の
リモコンパルスP1という)へ変換し、出力する。
【0007】ユーザがリモコン送信器100のマイクロフ
ォン106に向け発声するとき、その音声はマイクロフォ
ン106と低周波増幅器107とを通し、音声信号Sへ変換さ
れ、音声認識部108へ入力される。音声認識部108は音声
信号Sを、辞書109に登録された音声認識対象データと比
較する。音声認識対象データは通常、単語ごとに登録さ
れる。音声認識部108は音声信号Sに対応する単語Wを辞
書109から選択し、出力制御部110へ通知する。出力制御
部110は制御コード格納部111へアクセスし、通知された
単語Wに対応する制御コードCを読み出す。ここで、制御
コード格納部111は、辞書109に登録された単語のそれぞ
れに対応する制御コードを記憶する。出力制御部110
は、読み出した制御コードCを電気信号(以下、第二の
リモコンパルスP2という)へ変換し、出力する。
【0008】リモコンパルス選択部103は第一のリモコ
ンパルスP1又は第二のリモコンパルスP2のいずれかを選
択し、LED駆動部104へ出力する。LED駆動部104は
入力したリモコンパルスPに従い、赤外線発光ダイオー
ド(LED)105を発光させる。リモコンパルスに基づ
く赤外線の変調方式としては例えば、パルス位置変調
(PPM)が用いられる。こうして、リモコンパルスP
に従い変調された赤外線(以下、リモコン信号という)
RがVTR200へ送出される。
【0009】図14は、上記の従来の遠隔制御システムで
の遠隔制御対象機器、すなわちVTR200内のリモコン
に関する部分を示すブロック図である。受光部201はフ
ォトダイオード等の受光素子を含み、外部からの赤外線
Rを入力する。リモコン信号検波部202は、受光部201に
より受信された赤外線の中から、リモコン送信器100の
リモコン信号Rを検出し、リモコンパルスPへ変換する。
リモコンパルス解読部203はそのリモコンパルスPから制
御コードCを解読する。機器制御部204は制御データ格納
部205へアクセスし、その制御コードCに対応するコマン
ド又は制御データDを読み出す。更に、そのコマンド又
は制御データDに従い、所定の操作を行う。こうして、
上記の遠隔制御システムは、VTR200に対し、リモコ
ン送信器100でのキー操作及び音声による遠隔制御を実
現する。
【0010】制御コードは、VTR200に対する操作、
又はVTR200に与えるべき制御データごとに、予め設
定される。例えば、電源入切、録画、再生、停止、早送
り、若しくは巻戻し等の各操作を示すコマンド、又は、
録画チャンネル若しくは録画開始/終了時刻等の制御デ
ータのそれぞれに対し、異なる制御コードが割り当てら
れる。制御コードとコマンドとの間、又は制御コードと
制御データとの間の対応は、制御データ格納部205によ
り記憶される。
【0011】上記の遠隔制御システムでは、VTR200
に対し一つの操作又は一つの制御データを指定すると
き、リモコン送信器100が、キー操作又は音声のいずれ
での指示に関わらず、共通の制御コードを選択し、共通
のリモコン信号Rへ変換する。それにより、VTR200は
リモコンに関し、リモコン送信器でのキー操作又は音声
のいずれでの指示に関わらず、図14に示される共通の構
成を利用できる。
【0012】リモコン信号を赤外線で送信するとき、他
の遠隔制御システムによる同様なリモコン信号との誤認
を防止しなければならない。それ故、異なる遠隔制御シ
ステム間では、同一の制御コードの使用が回避される。
その結果、赤外線による遠隔制御システムのそれぞれに
割り当てられる制御コードの数が制限される。それによ
り、制御コードは例えば、一つの製品カテゴリー当たり
1バイト(=256個)程度しか割り当てられない。
【0013】その反面、遠隔制御対象機器の機能は上記
の通り、増大し続けている。例えば衛星デジタル放送の
チャンネルは理論的には101〜999chであり、現行のもの
に限っても200〜300種類を既に含む。従って、チャンネ
ル数の増加に単純に対応するだけでも、制御コード数は
不足する。
【0014】上記の遠隔制御システムのように、リモコ
ン送信器がキー操作での指示と音声での指示との両方に
共通の制御コードを割り当てるとき、制御コード数の不
足は一層深刻である。実際、選局を音声で指示すると
き、現在の音声認識技術は、選局対象チャンネル群と少
なくとも同数の単語を要する。その他には例えば、EP
Gによる番組検索を音声で直接指示するとき、認識すべ
き単語数は100個程度必要である。こうして、一つの操
作について、音声での指示に対し割り当てるべき制御コ
ード数が、キー操作での指示に対し割り当てるべき制御
コード数を大幅に上回る。それ故、キー操作と音声との
両方の指示で共用可能な制御コードの数は、ごくわずか
に限られた。その結果、上記の遠隔制御システムは機能
の拡張性に乏しい。
【0015】従来の遠隔制御システムには、上記のもの
の他に、特開平7−30982号公報に開示されたものが知ら
れる。この遠隔制御システムは、VTRを遠隔制御対象
機器とし、マイクロフォン付リモコン送信器を通し、キ
ー操作と音声とでそのVTRに対する遠隔制御を実現す
る。但し、上記の遠隔制御システムとは異なり、リモコ
ン送信器はユーザの音声そのものに従い、赤外線に対し
周波数変調を施し、送信する。一方、音声認識はVTR
すなわちリモコン信号の受信側で実行される。それによ
り、その機能の拡張性が、以下に示されるように、上記
の遠隔制御システムより高い。
【0016】図15は、その従来の遠隔制御システムに含
まれるリモコン送信器300の構成を示すブロック図であ
る。ここで、図13に示される従来のリモコン送信器100
と同様な構成に対し、図13と同じ符号を付す。更に、そ
れらの同様な構成の詳細については、上記の説明を援用
する。
【0017】ユーザがリモコン送信器300のマイクロフ
ォン106に向け発声するとき、その音声はマイクロフォ
ン106と低周波増幅器107とを通し、音声信号Sへ変換さ
れ、周波数変調部301へ入力される。周波数変調部301は
その音声信号Sに従い、所定のキャリアに対し周波数変
調を施す。リモコンパルス選択部103は、第一のリモコ
ンパルスP1又は周波数変調による音声信号PSのいずれか
を選択し、LED駆動部104へ出力する。LED駆動部1
04は、第一のリモコンパルスP1又は周波数変調による音
声信号PSのいずれかに従い、赤外線LED105を発光さ
せる。それにより、リモコン信号RがVTR400へ送出さ
れる。
【0018】図16は上記の従来の遠隔制御システムでの
遠隔制御対象機器、すなわちVTR400内のリモコン及
び音声認識に関する部分を示すブロック図である。ここ
で、図14に示される従来のVTR200と同様な構成に対
し図14と同じ符号を付す。リモコンパルス/音声信号選
択部401は通常、第一のリモコン信号検波部202Aを出力
先として選択する。そのとき、受光部201により受信さ
れたリモコン信号Rは、第一のリモコン信号検波部202A
へ入力される。第一のリモコン信号検波部202Aはリモコ
ン信号Rの中から第一のリモコンパルスP1を検出する。
リモコンパルス解読部203は第一のリモコンパルスP1か
ら制御コードCを解読する。第一の機器制御部204は第一
の制御データ格納部205へアクセスし、その制御コードC
に対応するコマンド又は制御データD1を読み出す。更
に、そのコマンド又は制御データD1に従い所定の操作を
行う。こうして、リモコン送信器300でのキー操作によ
る遠隔制御が実現される。
【0019】一方、音声による遠隔制御は次のように行
われる。第二のリモコン信号検波部202Bは、受光部201
からリモコンパルス/音声信号選択部401へ送出される
リモコン信号Rを監視し、その中から、音声認識開始を
指示するための特定のリモコンパルスPTを探す。その特
定のリモコンパルスPTは、例えばリモコン送信器300で
のキー操作により、リモコン送信器300から送信され
る。その特定のリモコンパルスPTが第二のリモコン信号
検波部202Bにより検出されたとき、音声認識起動制御部
402は、リモコンパルス/音声信号選択部401の出力先を
FM検波部403へ切り替える。そのとき、受光部201によ
り受信されたリモコン信号Rは、FM検波部403へ入力さ
れる。それにより、FM検波部403は起動する。上記の
特定のリモコンパルスPTは、第一のリモコン信号検波部
202Aでも検出される。そのとき、リモコンパルス解読部
203は所定のトリガTを音声認識部404へ出力する。それ
により、音声認識部404が起動する。
【0020】FM検波部403はリモコン信号Rの中から、
周波数変調による音声信号PSを検出し、元の音声信号S
に復調する。音声認識部404は復調された音声信号Sを、
辞書405に登録された音声認識対象データと比較する。
音声認識対象データは通常、単語ごとに登録される。音
声認識部404は音声信号Sに対応する単語Wを辞書405から
選択し、第二の機器制御部406へ通知する。第二の機器
制御部406は第二の制御データ格納部407へアクセスし、
通知された単語Wに対応するコマンド又は制御データD2
を読み出す。ここで、第二の制御データ格納部407は、
辞書405に登録された単語のそれぞれに対応するコマン
ド及び制御データを記憶する。第二の機器制御部406は
更に、読み出したコマンド又は制御データD2に従い、所
定の操作を行う。
【0021】この遠隔制御システムでは、リモコン送信
器300ではなく、遠隔制御対象機器であるVTR400が音
声認識部404と辞書405とを含む。従って、例えば辞書40
5の語彙の拡張又はアルゴリズムの高級化等に伴う回路
規模の増大が、リモコン送信器300のサイズ及び消費電
力による制限を受けない。一方、リモコン送信器300は
音声信号そのものを赤外線で送信する。従って、音声で
の指示に対し制御コードを割り当てなくても良いので、
制御コード数による制限を受けない。こうして、上記の
遠隔制御システムは、音声で指示可能な機能、更に音声
認識機能自体を、容易に拡張できる。
【0022】上記の遠隔制御システムは、特に音声での
指示に対し、例えば次のようなGUIを提供できる。V
TR400をTV受信機へ接続するとき、第二の機器制御
部406は音声での指示に従い画面表示部408を制御し、所
定の画像をそのTV受信機の画面(以下、TV画面とい
う)へ表示する。そのような画像処理機能を利用し、音
声認識に関する情報をTV画面に表示し、ユーザへフィ
ードバックする。その情報は例えば、ユーザに対する適
切な発声タイミングの通知、認識された単語若しくはそ
の候補の一覧、又は、認識された操作内容等を含む。更
に、音声認識に関しエラーが生じたとき、そのエラー情
報をTV画面に表示しても良い。そのような画面表示に
よる情報のフィードバックを通し、ユーザは、例えば認
識されやすい発音、スピード、抑揚、又は音量を、容易
に工夫できる。
【0023】
【発明が解決しようとする課題】図13と図14とに示され
るような従来の遠隔制御システムでは、リモコン送信器
が、キー操作での指示と音声での指示との両方を、共通
の制御コードに対応させる。しかし、異なる遠隔制御シ
ステム間では同一の制御コードの使用が回避されるの
で、一つの遠隔制御システムに割り当てられる制御コー
ド数が制限される。従って、図13と図14とに示されるよ
うな遠隔制御システムでは、制御コード数が不足し、機
能の拡張が困難であった。
【0024】図15と図16とに示されるような従来の遠隔
制御システムでは、リモコン送信器ではなく、遠隔制御
対象機器が音声認識を行う。従って、音声認識機能の拡
張に伴う回路規模の増大が、リモコン送信器のサイズ及
び消費電力による制限を受けない。一方、リモコン送信
器は音声信号そのものを赤外線で送信する。従って、音
声での指示の種類が制御コード数による制限を受けな
い。こうして、図15と図16とに示されるような遠隔制御
システムでは、図13と図14とに示されるようなシステム
より機能の拡張が容易である。
【0025】しかし、図15と図16とに示されるような従
来の遠隔制御システムには次のような問題点があった。
この遠隔制御システムでは、VTR400のような遠隔制
御対象機器が制御情報をリモコンパルスと音声信号との
二種類のデータ形態で利用する。それにより、図16に示
されるように、VTR400がリモコンパルスと音声信号
とのそれぞれに対し、異なる制御系統を持つ。すなわ
ち、リモコンパルスにより示される制御コードCに従う
第一の機器制御部204と、音声で入力された単語Wに従う
第二の機器制御部406との二つの機器制御部を持つ。
【0026】これら二つの機器制御部全体の回路規模
は、シャシのサイズで制限される。従って、それらの機
器制御部を共通のCPUで同一基板上に設計することが
望ましい。しかし、制御情報のデータ形態(すなわち、
制御コードCと単語Wと)の相違が、両機器制御部の統合
を複雑化する。シャシ設計では特に、リモコンパルスだ
けによる従来の遠隔制御システムの構成を大きく変更し
なければならない。それは技術的に困難であり、更にコ
ストアップにつながるので好ましくない。
【0027】本発明は、従来の構成を最小限の変更で利
用し、かつ高度な機能拡張性を有する、リモコン送信器
でのキー操作と音声との両方による遠隔制御システムの
提供を目的とする。更に、その遠隔制御システムを搭載
し、特に音声認識に関する情報を画面表示によりユーザ
へフィードバックするGUIを実現し、それにより好適
な操作性を有する画像処理装置の提供、を目的とする。
【0028】
【課題を解決するための手段】本発明による遠隔制御対
象機器は、 (A) リモコン信号を受信し、そのリモコン信号を第一
のリモコンパルスへ変換するためのリモコン受信部; (B) 音声信号を入力し、その音声信号に対応する制御
コードを選択し、その制御コードを第二のリモコンパル
スへ変換するための音声信号/リモコンパルス変換部; (C) 所定の切替信号に従い、第一のリモコンパルスと
第二のリモコンパルスとのいずれかを選択するためのリ
モコンパルス選択部;及び、 (D) リモコンパルス選択部により選択されたリモコン
パルスから制御コードを解読し、その制御コードに従い
動作制御を行うためのリモコンパルス処理部;を有す
る。ここで、リモコン信号は例えば、外部のリモコン送
信器から送出される。すなわち、リモコン送信器は複数
のキーパッドを含み、ユーザにより押さえられたキーパ
ッドのそれぞれに対応する制御コードをリモコン信号と
して送信する。上記の遠隔制御対象機器はそのようなリ
モコン送信器と共に、一つの遠隔制御システムを構成す
る。
【0029】上記の遠隔制御対象機器は音声認識を行
う。そのとき、認識された音声信号により示される制御
情報はリモコンパルスへ変換され、リモコンパルス処理
部へ送出される。こうして、リモコンパルス処理部によ
り扱われるべき制御情報が、従来のものと共通のデータ
形態、すなわちリモコンパルスで表される。従って、ユ
ーザからの制御情報がリモコン送信器からのリモコン信
号又は音声信号のいずれのデータ形態で入力されるとき
でも、リモコンパルス処理部としては従来と同様な回路
構成を共用できる。すなわち、リモコンパルス処理部が
従来と同様な一系統として容易に統合される。その結
果、シャシ設計が容易である。
【0030】リモコンパルス選択部は、上記の切替信号
によるイネーブル制御に従い、音声信号/リモコンパル
ス変換部による第二のリモコンパルスの出力時、その第
二のリモコンパルスをリモコンパルス処理部へ入力し、
リモコン受信部からの第一のリモコンパルスを遮断す
る。こうして、リモコンパルス処理部は、第一のリモコ
ンパルスと第二のリモコンパルスとを排他的に処理す
る。従って、第一のリモコンパルスと第二のリモコンパ
ルスとの間で共通の制御コードを、それぞれ別の機能へ
割り当てても良い。更に、音声信号/リモコンパルス変
換部とリモコンパルス選択部との間を、例えば共通の筐
体内部又はケーブル等で接続し、第二のリモコンパルス
が遠隔制御対象機器の外部へ漏れないようにしても良
い。それにより、第二のリモコンパルスにより示される
制御コードを、他の遠隔制御システムのものと重複させ
得る。以上の結果、第二のリモコンパルスにより示され
る制御コードとして、任意のカテゴリーコード又はデー
タコードを割り当て得る。すなわち、第二のリモコンパ
ルスにより示される制御コード数は、第一のリモコンパ
ルスにより示される制御コード数のような制限を受けな
い。こうして、上記の遠隔制御対象機器は、音声で指示
可能な機能を容易に拡張できる。
【0031】上記の遠隔制御対象機器では、好ましく
は、 (A) 音声信号/リモコンパルス変換部が、 (a) 音声認識対象データを含む辞書; (b) 上記の音声信号と音声認識対象データのそれぞれ
との類似度(尤度ともいう)を計算し、それらの類似度
に基づき、その音声信号に対応すべき音声認識対象デー
タの候補、又はエラーコードを選択するための音声認識
部; (c) 音声認識対象データとエラーコードとのそれぞれ
に対応する制御コードを記憶する制御コード格納部;及
び、 (d) 音声認識対象データの候補、又はエラーコードに
対応する制御コードを制御コード格納部から読み出し、
その制御コードを第二のリモコンパルスへ変換し、上記
の切替信号と共にリモコンパルス選択部へ出力するため
の出力制御部;を有し、 (B) リモコンパルス処理部が、 (a) リモコンパルス選択部により選択されたリモコン
パルスを解読し、そのリモコンパルスに対応する制御コ
ードへ変換するためのリモコンパルス解読部; (b) その制御コードのそれぞれに対応する制御データ
とコマンドとを記憶する制御データ格納部;及び、 (c) リモコンパルス解読部により解読された制御コー
ドに対応する制御データ又はコマンドを制御データ格納
部から読み出し、それらの制御データ又はコマンドに基
づき所定の動作制御を行うための機器制御部;を有す
る。
【0032】この遠隔制御対象機器は特に、不揮発性記
録媒体を含むパラメータ保存部、を有しても良い。その
とき、 (A) 音声認識部が音声認識パラメータを出力制御部へ
出力し; (B) 制御コード格納部がその音声認識パラメータに対
応する制御コードを記憶し; (C) 出力制御部が、その制御コードを制御コード格納
部から読み出し、その制御コードを第二のリモコンパル
スへ変換し、リモコンパルス選択部へ出力し; (D) 制御データ格納部がその制御コードに対応する音
声認識パラメータを記憶し; (E) 機器制御部が、リモコンパルス解読部により解読
されたその制御コードに対応する音声認識パラメータを
制御データ格納部から読み出し、それらの音声認識パラ
メータをパラメータ保存部へ書き込んでも良い。 ここで、不揮発性記録媒体は、好ましくはフラッシュメ
モリ、すなわち一括消去型EEPROMである。
【0033】音声認識パラメータは、例えば声質レベル
(声道長による周波数対パワースペクトル偏移を指標化
したもの)等の音響分析パラメータ又は尤度閾値を含
む。第二のリモコンパルスにより示される制御コード数
は十分に多いので、それらの制御コードの一部が音声認
識パラメータに対し、割り当てられても良い。それによ
り、音声認識部で設定された音声認識パラメータをパラ
メータ保存部へ通知できる。こうして、音声認識パラメ
ータを不揮発性記録媒体により記憶することで、音声認
識に関する学習の履歴を電源の入切に関わらず保持でき
る。その結果、電源の再投入時、音声認識パラメータの
最適化を迅速に実現できる。
【0034】上記の遠隔制御対象機器では、(A) ユー
ザの音声を入力し上記の音声信号へ変換するための音声
入力部と、(B)その音声信号の振幅に応じ音声信号/リ
モコンパルス変換部を起動するための起動制御部と、を
音声信号/リモコンパルス変換部が含んでも良い。この
遠隔制御対象機器はユーザの音声を直接又は有線で入力
する。従って、この遠隔制御対象機器を含む遠隔制御シ
ステムでは、リモコン送信器が従来と同様なもので良
い。その上、音声信号/リモコンパルス変換部は音声信
号の振幅検出を通し自動的に起動するので、ユーザは遠
隔制御対象機器へ向け発声するだけで、音声による遠隔
制御を実行できる。
【0035】本発明による遠隔制御システムは、(A)
(a) ユーザの音声を入力し音声信号へ変換するための
音声入力部と、(b)超音波、赤外線、又は電波によるキ
ャリアをその音声信号により変調し外部へ送出するため
の無線送信部と、を含み、かつリモコン信号を送信する
ためのリモコン送信器;及び、(B) 音声信号/リモコ
ンパルス変換部が、(a) 上記のキャリアを受信するた
めの無線受信部と、(b) そのキャリアの振幅に応じ音
声信号/リモコンパルス変換部を起動するための起動制
御部と、を含む、上記の遠隔制御対象機器;を有する。
この遠隔制御システムでは、音声信号がリモコン送信器
から無線により、遠隔制御対象機器へ入力される。それ
により、音声入力部をケーブル等の制約を受けることな
く、ユーザの傍に置くことができる。従って、周囲の雑
音等の音声信号への混入を抑制できる。その上、音声信
号/リモコンパルス変換部はキャリアの検出を通し自動
的に起動するので、ユーザは音声をリモコン送信器へ入
力するだけで、音声による遠隔制御を実行できる。
【0036】本発明による画像処理装置は、機器制御部
に従い所定の画像を表示するための画面表示部、を有
し、かつ上記の遠隔制御対象機器であり、 (A) 制御データ格納部が、画面表示部に対する制御デ
ータとコマンド、及び画面表示部により表示させるため
の表示データを、所定の制御コードにそれぞれ対応させ
て記憶し; (B) 機器制御部が、第二のリモコンパルスからリモコ
ンパルス解読部により解読された制御コードに対応する
表示データを制御データ格納部から読み出し、その表示
データを画面表示部により表示させる。 ここで、上記の表示データがテキストデータを含んでも
良い。そのテキストデータには、例えば音声認識対象デ
ータの候補、音声認識エラーを示す文章、又は音声認識
パラメータが含まれる。その他に、その表示データが画
像データを含んでも良い。その画像データには例えば、
音声認識エラーを示す画像、発声のタイミングを示す画
像、又は音声認識パラメータを表示するための画像(例
えば、声質レベルのインジケータ)が含まれる。
【0037】上記の画像処理装置は、特に音声での指示
に対し、例えば次のようなGUIを提供できる。機器制
御部は音声での指示に従い画面表示部を制御し、上記の
表示データを画面へ表示する。それにより、音声認識に
関する情報がユーザへ、視覚的にフィードバックされ
る。その情報は例えば、ユーザに対する適切な発声タイ
ミングの通知、認識された単語若しくはその候補の一
覧、又は認識された操作内容を含む。更に、音声認識に
関しエラーが生じたとき、そのエラー情報を画面に表示
しても良い。そのような画面表示による情報のフィード
バックを通し、ユーザは、例えば認識されやすい発音、
スピード、抑揚、又は音量を、容易に工夫できる。
【0038】
【発明の実施の形態】以下、本発明の最適な実施の形態
について、その好ましい実施例を挙げて、図面を参照し
つつ説明する。
【0039】《実施例1》本発明の実施例1による画像
処理装置はディジタルテレビ受像器(以下、DTVと略
す)である。このDTVは、マイクロフォン付リモコン
送信器を通したキー操作と音声とによる遠隔制御システ
ムを搭載する。図1は、本発明の実施例1によるDTV2
0での遠隔制御システムの外観を示す模式図である。ユ
ーザがリモコン送信器10のキーパッド1の一つを押す。
そのとき、そのキーに対応する制御情報(例えば、目標
のチャンネル番号等)が、例えば赤外線によるリモコン
信号RKとして、第一の赤外線LED4KからDTV20へ送
信される。そのリモコン信号RKはDTV20の第一の受光
部21により受信され、対応する制御情報が解読される。
それにより、その制御情報の示す操作が実行される。例
えば、キーパッド1のそれぞれに対応するチャンネルの
番組がTV画面28Aに映し出される。こうして、リモコ
ン送信器10でのキー操作による遠隔制御が実現される。
【0040】ユーザがリモコン送信器10の発声ボタン8
を押しながら、DTV20に対する制御情報(例えば、目
標のチャンネル番号等)を示す音声Vを、マイクロフォ
ン5へ入力する。そのとき、その音声Vは例えば赤外線に
よる音声信号RVへ変換され、第二の赤外線LED4Vから
DTV20へ送信される。その音声信号RVは音声信号/リ
モコンパルス変換部30の第二の受光部31により受信さ
れ、対応する制御情報が解読される。解読された制御情
報は、例えばケーブル38を通しDTV20本体へ伝送さ
れ、その制御情報に対応する操作が実行される。例え
ば、音声Vの示す目標チャンネルの番組がTV画面28Aに
映し出される。こうして、リモコン送信器10を用いたプ
レストーク方式での、音声による遠隔制御が実現され
る。
【0041】実施例1による遠隔制御システムでは、リ
モコン送信器10がマイクロフォン5を内蔵するので、ユ
ーザとマイクロフォン5との距離が小さい。従って、周
囲の雑音等によるマイクロフォン5への侵入を回避しや
すい。それ故、音声認識を高精度で実行できる。
【0042】図2は、上記の遠隔制御システムに含まれ
るリモコン送信器10の構成を示すブロック図である。キ
ーパッド1は、例えば図1に示されるように、チャンネル
番号のそれぞれに対応する選局ボタン、GUIとしてT
V画面28Aに表示されたカーソルを移動させるための上
下左右ボタン1a、及び、決定操作を行うための決定ボタ
ンを含む。それぞれのキーパッド1は異なる制御情報と
対応する。制御情報は例えば、チャンネル番号等の制御
データ、並びに、電源入切、音量調節、音声多重モード
の切替、及び、二画面表示等の画面表示モードの切換、
等の操作を指示するためのコマンドを含む。制御情報は
所定のフォーマットのコード(以下、制御コードとい
う)で表され、例えば1バイトのコードで識別される。
【0043】リモコンパルス変換部2は、ユーザにより
押されたキーパッド1の一つを識別する。更に、そのキ
ーに対応する制御コードを選択し、電気信号(以下、第
一のリモコンパルスP1という)として出力する。第一の
LED駆動部3Kは第一のリモコンパルスP1に従い、第一
の赤外線LED4Kを明滅させる。そのとき、キャリアは
例えばPPMにより変調される。こうして、変調された
赤外線、すなわちリモコン信号RKがDTV20へ送出され
る。
【0044】キーパッド1のそれぞれに対応する制御コ
ードは、赤外線によるリモコン信号RKでDTV20へ伝送
される。そのとき、DTV20がそのリモコン信号RKと、
他の同様な遠隔制御システムからのものとを誤認しない
ように、キーパッド1のそれぞれに対応する制御コード
として、例えば財団法人家電製品協会へ予め登録された
制御コードが用いられる。財団法人家電製品協会により
規定された制御コードのフォーマット(以下、家製協フ
ォーマットという)は、1バイトのカテゴリーコードと1
バイトのデータコードとを含む。カテゴリーコードは、
例えばTV又はVTR等の製品カテゴリーを示し、メー
カー毎に割り当てられる。従って、家製協フォーマット
では、遠隔制御システムがカテゴリーコードにより識別
される。すなわち、異なる遠隔制御システム間ではカテ
ゴリーコードが異なるので、同一の制御コードの使用が
回避される。データコードは、実際の制御情報を示す。
従って、家製協フォーマットでは、製品カテゴリーご
と、すなわち遠隔制御システムごとに最大256通りのコ
ードが制御コードとして使用可能である。すなわち、一
つの遠隔制御システムによりリモコン信号RKとして使用
され得る制御コード数は、最大256個に制限される。
【0045】マイクロフォン5はユーザの音声Vを入力
し、電気信号へ変換する。低周波増幅器6は、マイクロ
フォン5により変換された電気信号から音声Vに対応する
周波数成分を抜き出し、音声信号Sとして出力する。周
波数変調部7は、音声信号Sの振幅変動に従い、所定の高
周波のキャリアに対し周波数変調を施し、周波数変調波
PSとして出力する。第二のLED駆動部3Vは、音声信号
による周波数変調波PSに従い、第二の赤外線LED4Vの
電流量を変動させる。それにより、第二の赤外線LED
4Vが、周波数変調波PSに従い発光出力を変化させる。こ
うして、変調された赤外線による音声信号RVがDTV20
へ送出される。
【0046】第一の赤外線LED4Kと第二の赤外線LE
D4Vとは、好ましくは、それぞれ異なる波長の赤外線を
発する。それにより、DTV20は、リモコン信号RKと赤
外線による音声信号RVとを容易に識別できる。その他
に、第一の赤外線LED4Kと第二の赤外線LED4Vとを
共通の赤外線LEDとし、第一のLED駆動部3Kと第二
のLED駆動部3Vとを共通のLED駆動部としても良
い。但しそのときは、例えばリモコン信号RKと赤外線に
よる音声信号RVとのそれぞれに異なる識別コードを含ま
せる等の工夫が必要である。
【0047】発声ボタン8は、電力供給部9を駆動させる
ためのスイッチである。電力供給部9はその駆動時、低
周波増幅器6、周波数変調部7、及び第二のLED駆動部
3Vへ電力を供給する。発声ボタン8がユーザにより押さ
れる間だけ、ユーザの音声Vが、赤外線による音声信号R
VとしてDTV20へ送信される。こうして、リモコン送
信器10はプレストーク方式による音声Vの送信を実現す
る。
【0048】図3はDTV20内の遠隔制御システムに関
する部分を示すブロック図である。第一の受光部21はフ
ォトダイオード等の受光素子を含み、外部からの赤外線
を検出する。ここで、検出対象の赤外線の波長は、リモ
コン送信器10の第一の赤外線LED4Kの波長に等しい。
リモコン信号検波部22は、第一の受光部21により検出さ
れた赤外線の中から、リモコン送信器10からのリモコン
信号RKを識別し、第一のリモコンパルスP1へ変換する。
【0049】リモコンパルス選択部23は通常、リモコン
信号検波部22を入力元として選択する。すなわち、第一
のリモコンパルスP1が通常、リモコンパルス解読部24へ
入力される。リモコンパルス解読部24は、第一のリモコ
ンパルスP1から制御コードCを解読し、機器制御部25へ
通知する。機器制御部25はその制御コードCの受信時、
制御データ格納部26へアクセスする。制御データ格納部
26は、制御コードのそれぞれに対応するコマンド又は制
御データを記憶する。機器制御部25は、入力された制御
コードCに対応するコマンド又は制御データDを、制御デ
ータ格納部26から読み出す。更に、そのコマンド又は制
御データDに従い、例えば画面表示部28等の機能部を制
御し、所定の操作を実行する。
【0050】音声信号/リモコンパルス変換部30は以下
の構成により、リモコン送信器10から赤外線による音声
信号RVを受信し、それに対し音声認識を行う。認識され
た音声により示される制御情報は、第一のリモコンパル
スP1により示される制御コードと共通のフォーマットで
符号化される。更に、その符号化された制御情報(すな
わち制御コード)は、第一のリモコンパルスP1と共通の
フォーマットの電気信号(以下、第二のリモコンパルス
P2という)として出力される。
【0051】第二の受光部31はフォトダイオード等の受
光素子を含み、外部からの赤外線を検出する。ここで、
検出対象の赤外線の波長は、リモコン送信器10の第二の
赤外線LED4Vの波長に等しい。FM検波部32は第二の
受光部31により検出された赤外線の中から、リモコン送
信器10の第二の赤外線LED4Vによるキャリアを抜き出
し、キャリア検出部33へ通知する。更に、そのキャリア
の周波数変動から音声信号による周波数変調波を検出
し、元の音声信号Sに復調する。キャリア検出部33は、
FM検波部32により抜き出されたキャリアの振幅を一定
レベルと比較する。キャリアの振幅がその一定レベルを
超えて増大するとき、キャリア検出部33は音声認識開始
信号Tを論理的な真状態へ転移させる(以下、アサート
する、という)。一方、キャリアの振幅がその一定レベ
ルより低下するとき、キャリア検出部33は音声認識開始
信号Tを論理的な偽状態へ転移させる(以下、ネゲート
する、という)。ここで、論理的な真/偽状態は、正論
理では高/低電圧状態に、負論理ではその反対に、それ
ぞれ対応する。
【0052】キャリア検出部33からの音声認識開始信号
Tがアサートされる間、音声認識部34は起動する。音声
認識部34は、FM検波部32からの音声信号Sを、辞書35
に登録された音声認識対象データと比較する。音声認識
対象データは通常、単語ごとに登録される。音声認識部
34は音声信号Sに対応する単語Wを辞書35から選択し、出
力制御部36へ通知する。
【0053】出力制御部36は音声認識部34からの単語W
の通知時、制御コード格納部37へアクセスする。制御コ
ード格納部37は、辞書35に登録された単語のそれぞれに
対応する制御コードを記憶する。出力制御部36は、音声
認識部34から通知された単語Wに対応する制御コードC
を、制御コード格納部37から読み出す。ここで、制御コ
ード格納部37により記憶された制御コードCは、第一の
リモコンパルスP1により示される制御コードと共通のフ
ォーマット、例えば家製協フォーマットで定義される。
すなわち、2バイトのコードで識別される。出力制御部3
6は制御コード格納部37から読み出した制御コードCを第
二のリモコンパルスP2へ変換し、リモコンパルス選択部
23へ送出する。
【0054】出力制御部36は第二のリモコンパルスP2の
送出時、リモコンパルス切替信号Nをまずアサートす
る。そのアサートから所定時間(例えば、100msec)だ
け待機した後、第二のリモコンパルスP2を、例えばケー
ブル38を通し、リモコンパルス選択部23へ送出する。リ
モコンパルス切替信号Nのアサート時、リモコンパルス
選択部23は出力制御部36を入力元として選択する。それ
により、第二のリモコンパルスP2がリモコンパルス解読
部24へ入力される。
【0055】リモコンパルス解読部24は、第二のリモコ
ンパルスP2から制御コードCを解読する。ここで、第二
のリモコンパルスP2は第一のリモコンパルスP1と共通の
フォーマットであるので、リモコンパルス解読部24は第
二のリモコンパルスP2を、第一のリモコンパルスP1と区
別することなく、同様に解読できる。
【0056】リモコンパルス解読部24への第二のリモコ
ンパルスP2の入力開始は、リモコンパルス選択部23によ
る入力の切替から上記の所定時間だけ遅れる。リモコン
パルス解読部24は、その遅れをリモコンパルス無入力状
態(No Operation:NOP)と判断する。それにより、
リモコンパルス解読部24が、続いて入力される第二のリ
モコンパルスP2を、それ以前に入力されていた第一のリ
モコンパルスP1と明確に区別できる。
【0057】リモコンパルス解読部24は解読した制御コ
ードCを機器制御部25へ通知する。そのとき、リモコン
パルス切替信号Nのアサートを検知し、その制御コードC
が音声信号/リモコンパルス変換部30によるものである
ことを、機器制御部25へ通知する。
【0058】第二のリモコンパルスP2により示される制
御コードは、第一のリモコンパルスP1により示されるも
のと共通のフォーマットである。従って、機器制御部25
はその両方のリモコンパルスを特に区別することなく、
同様に処理できる。すなわち、機器制御部25は、第二の
リモコンパルスP2により示される制御コードCの受信
時、制御データ格納部26へアクセスする。制御データ格
納部26は、制御コードのそれぞれに対応するコマンド又
は制御データを記憶する。機器制御部25は、入力された
制御コードCに対応するコマンド又は制御データDを、制
御データ格納部26から読み出す。更に、そのコマンド又
は制御データDに従い、例えば画面表示部28等の機能部
を制御し、所定の操作を実行する。こうして、実施例1
による遠隔制御システムでは、リモコンパルス解読部24
と機器制御部25とが、第一のリモコンパルスP1と第二の
リモコンパルスP2とのいずれに対しても共通に使用され
る。それらは特に、従来の回路と同様な一系統の制御回
路として構成される。その結果、シャシ設計が容易であ
る。
【0059】第二のリモコンパルスP2は例えばケーブル
38を通し、音声信号/リモコンパルス変換部30からリモ
コンパルス選択部23までの間だけを伝送される。すなわ
ち、第二のリモコンパルスP2はDTV20の外部へ漏れな
い。従って、第一のリモコンパルスP1とは異なり、DV
T20と同様な他の遠隔制御対象機器により受信されな
い。それ故、第二のリモコンパルスP2により示される制
御コードは、第一のリモコンパルスP1により示されるも
のとは異なり、他の遠隔制御システムでのものと重複し
ても構わない。例えば家製協フォーマットでは、第一の
リモコンパルスP1により示される制御コードの総数がデ
ータコードのデータ量(最大1バイト=256個)に制限さ
れるのに対し、第二のリモコンパルスP2により示される
制御コードの総数は、カテゴリーコードとデータコード
との全データ量(2バイト=4096個)まで許される。こ
うして、実施例1による遠隔制御システムでは、音声に
よる制御情報として割り当て可能な制御コード数が豊富
である。その結果、音声により指示可能な機能が容易に
拡張される。
【0060】実施例1によるDTV20は以上の構成によ
り、特に音声による遠隔制御を以下の流れに従い実現す
る。図4は、音声信号/リモコンパルス変換部30の動作
の詳細を示すフローチャートである。 <ステップS1>ユーザがリモコン送信器10の発声ボタン
8を押しながら、制御情報を示す音声Vをマイクロフォン
5へ入力する。そのとき、第二の赤外線LED4Vが発光
し、赤外線によるキャリアがDTV20へ送信される。ユ
ーザの音声Vは、そのキャリアの周波数変調として伝送
される。FM検波部32が、第二の受光部31により検出さ
れた赤外線の中から、リモコン送信器10の第二の赤外線
LED4Vによるキャリアを抜き出し、キャリア検出部33
へ通知する。そのキャリアの振幅が一定レベルを超えて
増大するとき、キャリア検出部33は音声認識開始信号T
をアサートする。音声認識部34は、その音声認識開始信
号Tの立ち上がりエッジを検出する。 <ステップS2>音声認識部34は、音声認識開始検出信号
Tのアサートを出力制御部36へ通知する。それにより、
出力制御部36は、音声認識開始を示す制御コード(以
下、認識開始コードという)を第二のリモコンパルスP2
へ変換し、送出する。
【0061】<ステップS3>FM検波部32は上記のキャ
リアから音声信号による周波数変調波を検出し、元の音
声信号Sに復調する。音声認識部34は、その音声信号Sに
対し認識処理を行う。具体的にはまず、音声信号Sを辞
書35に登録される単語のそれぞれと比較し、両方の類似
度(尤度)を計算する。次に、その尤度に基づき、第一
候補の単語Wを所定条件に従い決定する。
【0062】<ステップS4>認識処理が正常に行われた
か否か、すなわち第一候補の単語Wが正常に決定された
か否かが判断される。例えば、計算された尤度が辞書35
に登録される単語のいずれに対しても所定条件を満たさ
ない等により、第一候補の単語が決定されないとき、認
識エラーがあると判断される。認識エラーがないとき、
処理はステップS5へ進む。認識エラーがあるとき、処理
はステップS7へ分岐する。
【0063】ここで、以下のような場合にも、認識エラ
ーがあると判断される。ユーザによるリモコン送信器10
の発声ボタン8の押下が発声途中で誤って中断したと
き、リモコン送信器10では第二の赤外線LED4Vの発光
が突然止まる。そのとき、音声信号/リモコンパルス変
換部30では、FM検波部32により取り出されたキャリア
の振幅が、キャリア検出部33により設定された一定レベ
ルより下まで、突然降下する。リモコン送信器10の第二
の赤外線LED4Vから出射された赤外線RVが発声途中で
障害物に遮られたとき、又は、リモコン送信器10に内蔵
された電池の消耗により第二の赤外線LED4Vの出力が
発声途中で著しく減衰したときも、キャリアの振幅が同
様に急減少する。キャリア検出部33はキャリア振幅の減
少に応じ、音声認識開始信号Tをネゲートする。音声認
識部34は音声認識開始信号Tの立ち下がりエッジの検出
時、認識処理を中断し、その中断直前の一定期間につい
て、音声信号の平均パワーを計測する。その平均パワー
が一定の閾値以上であれば、「発声途中のキャリア遺
失」という認識エラーがある、と判断される。
【0064】<ステップS5>出力制御部36は音声認識部
34から第一候補の単語Wを取り出す。 <ステップS6>出力制御部36は制御コード格納部37をア
クセスし、第一候補の単語Wに対応する制御コードCを制
御コード格納部37から読み出す。更に、読み出した制御
コードCを第二のリモコンパルスP2へ変換し、送出す
る。
【0065】<ステップS7>音声認識部34は認識処理を
中断する。更に、認識エラーに関する情報をその要因毎
に出力制御部36へ通知する。出力制御部36は、その通知
された情報に対応する制御コード(以下、エラーコード
という)を、制御コード格納部37から読み出す。更に、
そのエラーコードを第二のリモコンパルスP2へ変換し、
送出する。
【0066】<ステップS8>ユーザがリモコン送信器10
の発声ボタン8の押下をやめる。それにより、リモコン
送信器10では、第二の赤外線LED4Vの発光が止まる。
音声信号/リモコンパルス変換部30では、FM検波部32
により取り出されたキャリアの振幅が、キャリア検出部
33により設定された一定レベルより下まで降下する。そ
のとき、キャリア検出部33は音声認識開始信号Tをネゲ
ートする。音声認識部34は、その音声認識開始信号Tの
立ち下がりエッジを検出する。 <ステップS9>音声認識部34は、音声認識開始検出信号
Tのネゲートを出力制御部36へ通知する。それにより、
出力制御部36は、音声認識終了を示す制御コード(以
下、認識終了コードという)を第二のリモコンパルスP2
へ変換し、送出する。
【0067】図5は、リモコンパルス選択部23による第
一のリモコンパルスP1と第二のリモコンパルスP2との切
替の詳細を示すフローチャートである。 <ステップS11>音声信号/リモコンパルス変換部30で
は、出力制御部36が第二のリモコンパルスP2の送出に先
立ち、リモコンパルス切替信号Nをアサートする。リモ
コンパルス選択部23はリモコンパルス切替信号Nのアサ
ートを検知し、出力制御部36を入力元として選択する。
それにより、リモコンパルス選択部23への入力が第一の
リモコンパルスP1から第二のリモコンパルスP2へ切り替
わる。
【0068】<ステップS12>出力制御部36は、リモコ
ンパルス切替信号Nのアサートから例えば約100msecだけ
待機する。その待機の間、リモコンパルス解読部24へは
リモコンパルスが入力されない。それにより、リモコン
パルス解読部24はNOPを判断する。 <ステップS13>出力制御部36は、リモコンパルス切替
信号Nのアサートから約100msec経過後、第二のリモコン
パルスP2をリモコンパルス選択部23へ送出する。リモコ
ンパルス解読部24はその第二のリモコンパルスP2から制
御コードCを解読し、機器制御部25へ通知する。
【0069】<ステップS14>出力制御部36は、第二の
リモコンパルスP2の送出完了時、約100msecだけ待機す
る。その待機の間、リモコンパルス解読部24へはリモコ
ンパルスが入力されない。それにより、リモコンパルス
解読部24はNOPを判断する。 <ステップS15>出力制御部36は、第二のリモコンパル
スP2の送出完了から約100msec経過後、リモコンパルス
切替信号Nをネゲートする。リモコンパルス選択部23は
リモコンパルス切替信号Nのネゲートを検知し、リモコ
ン信号検波部22を入力元として再び選択する。それによ
り、リモコンパルス選択部23への入力が第二のリモコン
パルスP2から第一のリモコンパルスP1へ切り替わる。
【0070】リモコンパルス選択部23が上記の通り、第
一のリモコンパルスP1と第二のリモコンパルスP2とを互
いに排他的にリモコンパルス解読部24へ入力するので、
両パルスの衝突が回避される。従って、リモコン送信器
10でのキー操作による遠隔制御と音声による遠隔制御と
の間で、リモコンパルス解読部24と機器制御部25との共
用が良好に実現される。更に、音声信号/リモコンパル
ス変換部30での制御コードが、リモコン送信器10での制
御コードと重複しても良い。
【0071】リモコンパルス選択部23によるリモコンパ
ルスの切替時、リモコンパルス解読部24への入力は実際
には、一定時間の停止期間を経て切り替わる。リモコン
パルス解読部24はその停止期間をNOPと判断し、その
停止期間の前後でそれぞれ入力されるリモコンパルス同
士を正確に区別できる。すなわち、リモコンパルスの切
替の前後でそれぞれ入力された第一のリモコンパルスP1
と第二のリモコンパルスP2とを、一連のリモコンパルス
と誤認することが防止される。従って、第一のリモコン
パルスP1と第二のリモコンパルスP2とが頻繁に切り替わ
るときでも、リモコンパルス解読部24は、それぞれのリ
モコンパルスから制御コードを正確に解読できる。
【0072】図6は、音声での遠隔制御に関するDTV2
0の機器制御部25の動作の詳細を示すフローチャートで
ある。 <ステップS21>機器制御部25が、音声信号/リモコン
パルス変換部30から認識開始コードを受信する。そのと
き、機器制御部25は制御データ格納部26をアクセスし、
認識開始コードに対応する制御データを読み出す。ここ
で、その制御データは、例えば、音声認識開始を示すテ
キストデータ又は画像データと、画面表示部28に対しそ
れらのデータをTV画面へ表示させるように指示するた
めのコマンドとを含む。 <ステップS22>機器制御部25は、上記のコマンドに従
い画面表示部28を制御し、それにより、上記のテキスト
データ又は画像データをTV画面へ表示させる。
【0073】<ステップS23>機器制御部25は、第二の
リモコンパルスP2により示される制御コードを受信す
る。そのとき、機器制御部25は制御データ格納部26をア
クセスし、その制御コードに対応する制御データを読み
出す。ここで、音声信号/リモコンパルス変換部30が第
一候補の単語Wを正常に決定したとき、その単語Wに対応
するデータ又はコマンドが制御データ格納部26から読み
出される。一方、機器制御部25により受信された制御コ
ードがエラーコードであるとき、そのエラーコードによ
り示される認識エラーに関する情報が制御データ格納部
26から読み出される。 <ステップS24>制御データ格納部26から読み出された
制御データが認識エラーに関する情報であるか否かを判
断する。制御データが認識エラーに関する情報でないと
き、処理はステップS25へ進み、それ以外のとき、処理
はステップS27へ分岐する。
【0074】<ステップS25>音声信号/リモコンパル
ス変換部30で決定された第一候補の単語Wに対応する制
御データに応じ、機器制御部25はDTV20内の機能部を
制御する。例えば、その制御データがチャンネルの切替
を示すコマンドと目標チャンネルの番号とを含むとき、
機器制御部25は画面表示部28を制御し、TV画面にその
目標チャンネルの番組の映像を表示させる。 <ステップS26>機器制御部25は、第一候補の単語Wを示
すテキストデータを制御データ格納部26から読み出し、
画面表示部28によりTV画面へ表示させる。更に、音声
認識の成功を示す画像データを制御データ格納部26から
読み出し、画面表示部28によりTV画面へ表示させても
良い。こうして、音声による指示に従い、DTV20によ
り実行された動作内容がユーザに通知される。
【0075】<ステップS27>機器制御部25は、認識エ
ラーの要因を示すテキストデータを制御データ格納部26
から読み出し、画面表示部28によりTV画面へ表示させ
る。更に、認識エラーを示す画像データを制御データ格
納部26から読み出し、画面表示部28によりTV画面へ表
示させても良い。こうして、音声による指示がDTV20
により認識されなかったことが、その要因と共にユーザ
に通知される。
【0076】<ステップS28>機器制御部25が認識終了
コードを受信する。そのとき、機器制御部25はタイムア
ウト処理を行い、ステップS26又はステップS27でのテキ
ストデータ又は画像データの表示を、一定時間だけ維持
する。 <ステップS29>機器制御部25は画面表示部28を制御
し、ステップS26又はステップS27で表示させたテキスト
データ又は画像データを消去させる。
【0077】ステップS26又はステップS27で、DTV20
による音声認識の結果に関する情報を、TV画面にテキ
ストデータ又は画像データで表示させる。それにより、
音声による指示が正しく認識されたか否かを、ユーザは
視覚的に判断できる。更に誤認があった場合はその内容
を、ユーザは視覚的に把握できる。その上、ステップS2
8でテキストデータ又は画像データの表示時間を調節す
ることにより、ユーザは、次の音声による指示を発声す
べきタイミングを、視覚的に判断できる。
【0078】第二のリモコンパルスP2により示される制
御コード数は、第一のリモコンパルスP1により示される
制御コード数とは異なり制限されない。従って、第二の
リモコンパルスP2により示される制御コード数は豊富で
ある。例えば、それらの制御コードの一部が、音声認識
部34により設定される音声認識パラメータに対し割り当
てられても良い。ここで、音声認識パラメータは例え
ば、声質レベル等の音響分析パラメータ又は尤度閾値を
含む。
【0079】音声認識パラメータは制御コードとして、
音声認識部34から機器制御部25へ通知されても良い。機
器制御部25は、通知された音声認識パラメータの値を種
類別にパラメータ保存部27(図3参照)へ書き込む。そ
れにより、音声認識部34で最適化された音声認識パラメ
ータを保持できる。ここで、パラメータ保存部27は不揮
発性記録媒体、好ましくはフラッシュメモリを含む。そ
の他に、ハードディスクを含んでも良い。それにより、
一旦最適化された音声認識パラメータが、DTV20の電
源の入切に関わらず保持される。電源の再投入時、音声
認識部28はパラメータ保存部27に保持された音声認識パ
ラメータに基づき、新たなパラメータの最適化を迅速に
実現できる。
【0080】音声認識部34により最適化された音声認識
パラメータは、以下の流れに従い機器制御部25へ通知さ
れ、パラメータ保存部27により記憶される。図7は、音
声信号/リモコンパルス変換部30による音声認識パラメ
ータの送出の詳細を示すフローチャートである。 <ステップS31>音声認識部34は、出力制御部36に対
し、音声認識パラメータの取り出しを指示する。出力制
御部36はそのとき、音声認識パラメータの転送開始を示
す制御コード(以下、パラメータ転送開始コードとい
う)を制御コード格納部37から読み出し、第二のリモコ
ンパルスP2へ変換し、送出する。 <ステップS32>出力制御部36は、音声認識部34から音
声認識パラメータを取り出す。 <ステップS33>出力制御部36は、音声認識部34から取
り出した音声認識パラメータのそれぞれの種類と値とを
示す制御コードを、制御コード格納部37から読み出す。
更に、それらの制御コードを順次、第二のリモコンパル
スP2へ変換し、送出する。
【0081】<ステップS34>出力制御部36は音声認識
部34へアクセスし、取り出すべき音声認識パラメータが
残っているか否か、を判断する。未送出の音声認識パラ
メータが残っているとき、処理がステップS32へ戻る。
音声認識パラメータを全て転送し終えたとき、処理がス
テップS35へ進む。 <ステップS35>出力制御部36は、音声認識パラメータ
の転送終了を示す制御コード(以下、パラメータ転送終
了コードという)を制御コード格納部37から読み出し、
第二のリモコンパルスP2へ変換し、送出する。
【0082】図8は、機器制御部25による音声認識パラ
メータの受信及び保存の詳細を示すフローチャートであ
る。 <ステップS41>リモコンパルス解読部24が第二のリモ
コンパルスP2からパラメータ転送開始コードを解読し、
機器制御部25へ通知する。それにより、続いて入力され
る制御コードが音声認識パラメータを示すことを、機器
制御部25は把握する。 <ステップS42>リモコンパルス解読部24は第二のリモ
コンパルスP2から制御コードを解読し、機器制御部25へ
通知する。機器制御部25は、その制御コードに対応する
音声認識パラメータを制御データ格納部26から読み出
す。読み出された音声認識パラメータは逐次、バッファ
へ一時記憶される。
【0083】<ステップS43>リモコンパルス解読部24
が第二のリモコンパルスP2からパラメータ転送終了コー
ドを解読し、機器制御部25へ通知する。それにより、機
器制御部25は、バッファへ一時記憶された音声認識パラ
メータに対応するテキストデータ又は画像データを制御
データ格納部26から読み出す。 <ステップS44>機器制御部25は、ステップS43で読み出
されたテキストデータ又は画像データを、画面表示部28
によりTV画面に表示する。それにより、それらのパラ
メータの種類と値とが、ユーザへフィードバックされ
る。ユーザはそれらのパラメータに基づき、認識されや
すい発音、スピード、抑揚、又は音量を、容易に工夫で
きる。
【0084】<ステップS45>機器制御部25は更に、バ
ッファへ一時記憶された音声認識パラメータの値を種類
別にパラメータ保存部27へ書き込む。こうして、音声認
識パラメータがパラメータ保存部27により記憶され、音
声認識に関する学習の履歴を、DTV20の電源の入切に
関わらず保持できる。その結果、電源の再投入時、音声
認識パラメータの最適化を、パラメータ保存部27により
保持された履歴を利用し、迅速に実現できる。
【0085】実施例1によるDTV20は、上記の遠隔制
御システムを利用し、例えば以下のようなGUIを実現
する。ユーザがリモコン送信器10の発声ボタン8を押す
(図1参照)。それにより、第二の赤外線LED4Vが発光
する(図2参照)。DTV20の音声信号/リモコンパルス
変換部30では、第二の受光部31を通し、FM検波部32が
第二の赤外線LED4Vからのキャリアを検出する(図3
参照)。そのキャリアの振幅が一定レベルを超えて増大
することをキャリア検出部33が検出し、音声認識開始信
号Tをアサートする。それにより、音声認識部34が起動
し、音声認識を開始する。
【0086】音声認識部34は、音声認識の開始を出力制
御部36へ通知する。出力制御部36はそのとき制御コード
格納部37にアクセスし、音声認識開始を通知するための
コマンドに対応する制御コード、すなわち認識開始コー
ドを読み出す。表1は、音声認識に関するコマンド又は
音声認識パラメータと制御コードとの対応表、及び、そ
れらの制御コードに従い実行されるDTV20の操作とT
V画面28Aに表示されるテキストデータ又は画像データ
との対応表の一例である。
【0087】
【表1】
【0088】ここで、第一列と第二列との対応は、音声
信号/リモコンパルス変換部30内の制御コード格納部37
(図3参照)により保持される。一方、第二列と第三〜
五列との対応は、制御データ格納部26により保持され
る。出力制御部36は、制御コード格納部37にアクセス
し、表1の第一列と第二列とに相当する対応表を参照す
る。それにより、認識開始コード「0F/FE」を読み出
す。更に、そのコードを第二のリモコンパルスP2へ変換
し、機器制御部25へ送出する。
【0089】機器制御部25は、第二のリモコンパルスP2
からリモコンパルス解読部24により解読された認識開始
コード「0F/FE」を受信する。そのとき、制御データ格
納部26にアクセスし、表1の第二列と第三〜五列とに相
当する対応表を参照する。それにより、認識開始コード
「0F/FE」に対応するコマンド、テキストデータ、及び
画像データを読み出す。表1に示される例では、「音声
認識パネル」という画像A1(図1参照)のTV画面28Aへ
の表示を指示するためのコマンド、「音声認識パネル」
A1内に表示される画像データIMとして「パターン1」、
及び「音声認識パネル」A1内に表示されるテキストデー
タTXとして「テキスト1」が読み出される。
【0090】図9は、制御コードのそれぞれに応じTV
画面28Aに表示される画像データを例示する図である。
ここで、画像データは、パターン4とパターン5とのよ
うな単一の静止画であっても、又はパターン1〜3のよ
うな動画であっても良い。表2は、制御コードのそれぞ
れに応じTV画面28Aに表示されるテキストデータを例
示する表である。
【0091】
【表2】
【0092】機器制御部25は、制御データ格納部26から
読み出したコマンドに従い画面表示部28を制御し、図1
に示されるように、TV画面28Aへ音声認識パネルA1を
表示させる。図1の例では特に、音声認識パネルA1に
は、図9の「パターン1」と表2の「テキスト1」とが表
示される。こうして、DTV20による音声認識の開始準
備の完了がユーザへ通知される。それにより、ユーザ
は、リモコン送信器10の発声ボタン8を押した後での発
声開始のタイミングを的確に把握できる。
【0093】ユーザはリモコン送信器10の発声ボタン8
を押しながら、例えば選局目標のチャンネル番号を示す
単語「いっちゃんねる」を発声する(図1参照)。その一
連の音声Vは、リモコン送信器10内のマイクロフォン5と
低周波増幅器6とを通し、音声信号Sとして入力される。
その音声信号Sは更に周波数変調を通し、第二の赤外線
LED4Vからの赤外線による音声信号RVへ変換され、送
出される(図2参照)。
【0094】DTV20の音声信号/リモコンパルス変換
部30では、第二の受光部31を通し、FM検波部32が第二
の赤外線LED4Vからの音声信号RVを検出し、元の音声
信号Sに復調する(図3参照)。音声認識部34はその復調
された音声信号Sを辞書35に登録された単語のそれぞれ
と比較し、尤度を計算する。その尤度に基づき、第一候
補の単語Wを所定条件に従い決定する。
【0095】認識処理が正常に行われるとき、例えば上
記の音声「いっちゃんねる」に対しては、辞書35に登録
された「いっちゃんねる」という単語が第一候補の単語
Wとして、正しく決定される。出力制御部36は音声認識
部34から第一候補の単語Wを取り出す。更に、制御コー
ド格納部37をアクセスする。表3は、辞書35に登録され
る単語と制御コードとの対応表、及び、それらの制御コ
ードに従い実行されるDTV20の操作とTV画面28Aに
表示されるテキストデータ又は画像データとの対応表の
一例である。
【0096】
【表3】
【0097】ここで、第一列と第二列との対応は、音声
信号/リモコンパルス変換部30内の制御コード格納部37
(図3参照)により保持される。一方、第二列と第三〜
五列との対応は、制御データ格納部26により保持され
る。出力制御部36は、制御コード格納部37にアクセス
し、表3の第一列と第二列とに相当する対応表を参照す
る。それにより、単語「いっちゃんねる」に対応する制
御コード「00/00」を読み出す。更に、その制御コード
を第二のリモコンパルスP2へ変換し、機器制御部25へ送
出する。
【0098】機器制御部25は、第二のリモコンパルスP2
からリモコンパルス解読部24により解読された制御コー
ド「00/00」を受信する。そのとき、制御データ格納部
26にアクセスし、表3の第二列と第三〜五列とに相当す
る対応表を参照する。それにより、制御コード「00/0
0」に対応するコマンド、テキストデータ、及び画像デ
ータを読み出す。表3に示される例では、チャンネル番
号「1」に相当するポジション1の選局をTVチューナ
に対し指示するためのコマンド、音声認識パネルA1(図
1参照)内に表示される画像データIMとして「パターン
2」(図9参照)、及び音声認識パネルA1内に表示される
テキストデータTXとして「テキスト2」(表2参照)が
読み出される。ここで、表2のテキスト2の内容中、
「〜」には選局目標のチャンネル番号を示すテキストデ
ータ、例えば「1CH」が挿入される。
【0099】機器制御部25はまず画面表示部28を制御
し、「パターン2」と「テキスト2」の第一文「1CH
を選局します」とをTV画面28Aへ表示させる。次に、
TVチューナ(図示せず)を制御し、ポジション1を選
局させる。更に、画面表示部28を制御し、「テキスト
2」の第二文「1CHを選局しました」をTV画面28A
に表示させる。こうして、認識された音声による選局の
実行とその選局先とがユーザに通知される。それによ
り、音声による指示がDTV20によりどのように認識さ
れたのかを、ユーザは明確に把握できる。
【0100】音声による指示に対し割り当て可能な制御
コード数は、リモコン送信器10でのキー操作に対し割り
当て可能な制御コードとは異なり制限されない。表3に
例示されるように、音声で指示可能な機能は、選局を含
め、多種多様である。例えば、ユーザが「さっかー」と
発声するとき、TV画面28Aにはまず、「サッカーを検
索します」という「テキスト5」の第一文がテキストデ
ータTXとして表示される。更に、EPGにより「サッカ
ー」がジャンル検索され、その検索結果の一覧が、「サ
ッカーを検索しました」という「テキスト5」の第二文
と共にTV画面28Aに表示される。ここで、選局又はE
PGによる検索等、比較的長い処理時間を要する操作を
指示するとき、「テキスト2」又は「テキスト5」のよ
うに、テキストデータTXをDTV20の操作前後で変化さ
せる。それにより、DTV20が音声により指示された操
作を実行中であることを、ユーザは明確に把握できる。
その結果、ユーザに待ち時間を短く感じさせ得る。
【0101】音声認識部34は、第一候補の単語を決定で
きないとき、又は「発声途中のキャリア遺失」を検出し
たとき、認識エラーがあると判断し、認識処理を中断す
る。更に、認識エラーに関する情報をその要因毎に出力
制御部36へ通知する。出力制御部36は、その通知された
情報に対応する制御コード、すなわちエラーコードを制
御コード格納部37から読み出す。表4は、認識エラーの
内容とエラーコードとの対応表、及び、それらのエラー
コードに従いTV画面28Aに表示されるテキストデータ
又は画像データとの対応表の一例である。
【0102】
【表4】
【0103】ここで、第一列と第二列との対応は、制御
コード格納部37(図3参照)により保持される。一方、
第二列と第三、四列との対応は、制御データ格納部26に
より保持される。出力制御部36は、制御コード格納部37
にアクセスし、表4の第一列と第二列とに相当する対応
表を参照する。
【0104】例えば、通知された認識エラーが「発声途
中のキャリア遺失」であるとき、エラーコード「0F/0
6」を読み出す。更に、そのエラーコードを第二のリモ
コンパルスP2へ変換し、機器制御部25へ送出する。機器
制御部25は、第二のリモコンパルスP2からリモコンパル
ス解読部24により解読されたエラーコード「0F/06」を
受信する。そのとき、制御データ格納部26にアクセス
し、表4の第二列と第三、四列とに相当する対応表を参
照する。それにより、エラーコード「0F/06」に対応す
るテキストデータと画像データとを読み出す。表4に示
される例では、「音声認識パネル」A1内に表示される画
像データIMとして「パターン3」、及びテキストデータ
TXとして「テキスト13」が読み出される。機器制御部
25は画面表示部28を制御し、「パターン3」と「テキス
ト13」とをTV画面28Aへ表示させる。その結果、発
声途中で発声ボタンを放す等により赤外線が途切れ、認
識エラーが生じた、とユーザは理解できる。
【0105】認識エラーには、表4に例示されるよう
に、様々な要因があり得る。例えば、ユーザの声量、声
質、若しくは発声タイミングが不適切であること、周囲
の雑音が過大でS/N比が過小なこと、又は、発声され
た単語が誤っていること等により、音声認識部34が音声
信号により示される単語を認識できない場合がある。そ
の他に、認識された単語について計算された尤度が、辞
書35に登録されたいずれの単語に対しても所定条件を満
たさない場合がある。
【0106】例えば、リモコン送信器10のマイクロフォ
ン5により捉えられた音声のレベルが大きすぎる、と音
声認識部34が判断するとき、出力制御部36は、「声が大
きすぎた」という認識エラーの内容に対応するエラーコ
ード「0F/02」を送出する。機器制御部25は、エラーコ
ード「0F/02」に対応する「テキスト9」(表2参照)
と「パターン3」(図9参照)をTV画面28Aに表示させ
る。それにより、認識エラーの発生、及びその原因が大
きすぎる声量であることをユーザは容易に把握できる。
その結果、音声による指示を新たに行うとき、声量を抑
える等のエラー回避方法をユーザは工夫できる。
【0107】DTV20による認識エラーは以上のよう
に、そのエラー内容と共にユーザへ通知される。それに
より、ユーザは、音声による指示を新たに行うとき、認
識エラーの再発を適切に回避できる。
【0108】ユーザは更に、次のような「マイクテス
ト」、すなわち音声認識部34による音声認識パラメータ
の最適化を実行しても良い。ユーザが「まいくてすと」
と発声する。音声認識部34がその音声を「まいくてす
と」という単語として正しく認識するとき、出力制御部
36は、その単語に対応する制御コード「0F/9F」(表3
参照)を機器制御部25へ送出する。機器制御部25は、そ
の制御コード「0F/9F」に対応するコマンド、テキスト
データ、及び画像データを、制御データ格納部26から読
み出す。表3に示される例では、「マイクテスト画面」
という画像A2(図1参照)のTV画面28Aへの表示を指示
するためのコマンド、「音声認識パネル」A1内に表示さ
れるテキストデータTXとして「テキスト15」(表2参
照)、及び、「マイクテスト画面」A2内に表示される画
像データとして「パターン4」(図9参照)が読み出さ
れる。機器制御部25はそのコマンドにより画面表示部28
を制御し、「マイクテスト画面」A2と「テキスト15」
とをTV画面28Aに表示させる。
【0109】音声認識部34は「まいくてすと」という音
声を基に、ユーザの音声固有のフォルマントから音声認
識パラメータを最適化する。特に、声道長による周波数
対パワースペクトル偏移を声質レベルとして指標化し、
最も高い尤度に対応する声質レベルの最適値αを分析す
る。
【0110】音声認識部34が音声認識パラメータの最適
化に成功したとき、出力制御部36は音声認識パラメータ
の最適化成功を通知するためのコマンド「マイクテスト
結果通知(OK)」に対応する制御コード「08/52」
(表1参照)を、機器制御部25へ送出する。それによ
り、機器制御部25は「テキスト16」(表2参照)と
「パターン5」(図9参照)とをTV画面28Aに表示させ
る。
【0111】出力制御部36は次に、声質レベルの最適値
αを含む最適化された音声認識パラメータを、音声認識
部34から取り出す。例えば、声質レベルの最適値αが−
2であるとき、出力制御部36は、声質レベルα=−2を通
知するためのコマンドに対応する制御コード「08/61」
(表1参照)を、機器制御部25へ送出する。それによ
り、機器制御部25は「パターン5」による声質レベルの
表示を、通知された最適値αに合わせる。ここで、図9
では、「パターン5」が「声質レベルα=−2」を示す
画像として描かれる。声質レベルの最適値αがその他の
値であるとき、その値に応じ、「パターン5」中に描か
れるインジケータGの位置及び声質レベルの値Hが変化す
る。それらの表示を通し、音声認識部34が音声認識パラ
メータの最適化を実現できることを、ユーザは明確に把
握できる。
【0112】音声認識部34が音声認識パラメータの最適
化に成功したとき、その最適化された音声認識パラメー
タが次のように、パラメータ保存部27(図3参照)によ
り記憶されても良い。出力制御部36は、パラメータ転送
開始コード「0E/10」(表1参照)を機器制御部25へ送
出する。更に、最適化された音声認識パラメータのそれ
ぞれに対応する制御コードを順次、機器制御部25へ送出
する。それらのパラメータを全て送出し終えた時、出力
制御部36は、パラメータ転送終了コード「0E/11」(表
1参照)を機器制御部25へ送出する。
【0113】機器制御部25は、パラメータ転送開始コー
ドの受信後、出力制御部36から受信される一連の制御コ
ードのそれぞれに対応する音声認識パラメータを、制御
データ格納部26からバッファに順次転送する。更に、パ
ラメータ転送終了コードの受信時、バッファに蓄積され
た一連の音声認識パラメータを、パラメータ保存部27に
記憶する。こうして、最適化された音声認識パラメータ
を、パラメータ保存部27内の不揮発性記録媒体により記
憶する。それにより、音声認識に関する学習の履歴をD
TV20での電源の入切に関わらず保持できる。その結
果、電源の再投入時、その保持された音声認識パラメー
タの履歴を利用し、音声認識パラメータの最適化を迅速
に実現できる。
【0114】音声認識部34がユーザの音声「まいくてす
と」の認識に失敗し、又は音声認識パラメータの最適化
に失敗したとき、出力制御部36は音声認識パラメータの
最適化失敗を通知するためのコマンド「マイクテスト結
果通知(NG)」に対応する制御コード「08/53」(表
1参照)を、機器制御部25へ送出する。それにより、機
器制御部25は「テキスト17」(表2参照)と「パター
ン4」(図9参照)とをTV画面28Aに表示させる。それ
らの表示を通し、音声認識部34が音声認識パラメータの
最適化を実現できない状態にあることを、ユーザは明確
に把握できる。それにより、例えば周囲の騒音の抑制等
の対策をユーザは工夫できる。
【0115】実施例1による遠隔制御システムは、赤外
線を通信媒体として利用する。その他に、電波を通信媒
体として利用しても良い。そのとき、リモコン送信器10
として、携帯電話、PHS、又はPDAを利用できる。
特に、PHS、W−CDMA方式採用の第三世代移動体
通信端末、又はBLUETOOTH(登録商標)規格に
準拠の通信端末等は、音声信号を高品位に伝送可能であ
る。従って、それらを実施例1による遠隔制御システム
での音声信号の伝送に利用するとき、信頼性の高い音声
認識が実現され得る。
【0116】《実施例2》本発明の実施例2による画像
処理装置は、実施例1と同様、DTVであり、リモコン
送信器でのキー操作と音声とによる遠隔制御システムを
搭載する。但し、実施例1とは異なり、リモコン送信器
は音声入力部を含まず、遠隔制御対象機器であるDTV
がマイクロフォンを通し、ユーザの音声を直接入力す
る。その他の構成及び動作については、実施例2は実施
例1と共通する。
【0117】図10は、本発明の実施例2によるDTV20
Aでの遠隔制御システムの外観を示す模式図である。ユ
ーザがリモコン送信器10Aのキーパッド1の一つを押す。
そのとき、そのキーに対応する制御情報(例えば、目標
のチャンネル番号等)が、例えば赤外線によるリモコン
信号RKとして、赤外線LED4KからDTV20Aへ送信さ
れる。そのリモコン信号RKはDTV20の受光部21により
受信され、対応する制御情報が解読される。それによ
り、その制御情報の示す操作が実行される。例えば、キ
ーパッド1のそれぞれに対応するチャンネルの番組がT
V画面28Aに映し出される。こうして、リモコン送信器1
0Aでのキー操作による遠隔制御が実現される。
【0118】ユーザがDTV20Aのマイクロフォン5A
へ、DTV20Aに対する制御情報(例えば、目標のチャ
ンネル番号等)を示す音声Vを入力する。ここで、マイ
クロフォン5AはDTV20の音声信号/リモコンパルス変
換部30Aと接続される。ユーザの音声Vはマイクロフォン
5Aを通し音声信号/リモコンパルス変換部30Aへ直接入
力され、対応する制御情報が解読される。解読された制
御情報は例えばケーブル38を通しDTV20A本体へ伝送
され、その制御情報に対応する操作が実行される。例え
ば、音声Vの示す目標チャンネルの番組がTV画面28Aに
映し出される。こうして、音声による遠隔制御が実現さ
れる。
【0119】以下、実施例2について、実施例1とは異
なる部分を説明し、共通の部分については実施例1での
説明を援用する。図11は、上記の実施例2による遠隔制
御システムに含まれるリモコン送信器10Aの構成を示す
ブロック図である。ここで、実施例1によるリモコン送
信器10と同様な構成に対し、図2と同じ符号を付し、そ
れらの説明は実施例1のものを援用する。図2と図11と
の比較から明らかなように、実施例2によるリモコン送
信器10Aは実施例1によるリモコン送信器10から音声入
力に関する構成を除いたものと実質的に等しい。
【0120】図12は、実施例2によるDTV20A内の遠
隔制御システムに関する部分を示すブロック図である。
ここで、実施例1によるDTV20と同様な構成に対し、
図3と同じ符号を付し、それらの説明は実施例1のもの
を援用する。
【0121】音声信号/リモコンパルス変換部30Aは以
下の構成により、ユーザの音声Vを直接入力し、音声信
号Sへ変換し、それに対し音声認識を行う。認識された
音声により示される制御情報は実施例1と同様に、第一
のリモコンパルスP1により示される制御コードと共通の
フォーマットで符号化され、第一のリモコンパルスP1と
共通のフォーマットである第二のリモコンパルスP2とし
て出力される。
【0122】マイクロフォン5Aはユーザの音声Vを入力
し、電気信号へ変換する。低周波増幅器6Aは、マイクロ
フォン5Aにより変換された電気信号から音声Vに対応す
る周波数成分を抜き出し、音声信号Sとして音声認識部3
4へ送出する。レベル検出部33Aは、低周波増幅部6Aによ
り抜き出された音声信号Sの振幅を、一定レベルと比較
する。音声信号Sの振幅がその一定レベルを超えて増大
するとき、レベル検出部33Aは音声認識開始信号Tを一定
時間だけアサートする。一方、音声信号Sの振幅が一定
時間、その一定レベルより低く維持されるとき、レベル
検出部33Aは音声認識開始信号Tをネゲートする。
【0123】実施例2によるDTV20Aでは、実施例1
によるDTV20とは異なり、ユーザの音声が直接入力さ
れる。従って、プレストーク方式に関する認識エラー、
例えば発声途中に発声ボタンの押下が止まった等による
認識エラーについては、処理が不要である。それ故、音
声認識部34等の処理負担が軽減される。
【0124】実施例2による音声信号/リモコンパルス
変換部30Aへ一旦入力された音声信号Sは、実施例1と同
様に処理される。従って、実施例2は、音声入力の相違
を除き、実施例1と同様な遠隔制御システムを実現す
る。それ故、実施例2は実施例1と同様な以下の効果を
発揮できる。まず、第一のリモコンパルスP1と第二のリ
モコンパルスP2とが共通のフォーマットに従うので、リ
モコンパルス解読部24と機器制御部25とがそれらのリモ
コンパルスのいずれに対しても共用される。それらは特
に、従来の回路と同様な一系統の制御回路として構成さ
れる。その結果、シャシ設計が容易である。
【0125】第二のリモコンパルスP2は更に、音声信号
/リモコンパルス変換部30Aからリモコンパルス選択部2
3までの間だけを、外部に漏出することなく伝送され
る。それ故、第二のリモコンパルスP2により示される制
御コードは、第一のリモコンパルスP1により示されるも
のとは異なり、他の遠隔制御システムでのものと重複し
ても構わない。こうして、実施例2による遠隔制御シス
テムでは、音声による制御情報として割り当て可能な制
御コード数が豊富である。その結果、音声により指示可
能な機能が容易に拡張される。
【0126】
【発明の効果】本発明による遠隔制御対象機器は音声認
識を行う。そのとき、認識された音声信号により示され
る制御情報はリモコンパルスへ変換され、機器制御部へ
送出される。こうして、機器制御部により扱われるべき
制御情報が従来のものと共通のデータ形態、すなわちリ
モコンパルスで表される。従って、ユーザからの制御情
報がリモコン送信器からのリモコン信号又は音声信号の
いずれのデータ形態で入力されるときでも、機器制御部
としては従来と同様な回路構成を共用できる。すなわ
ち、機器制御部が従来と同様な一系統として容易に統合
される。その結果、シャシ設計が容易である。
【0127】リモコンパルス選択部は、音声信号/リモ
コンパルス変換部による第二のリモコンパルスの出力
時、その第二のリモコンパルスをリモコンパルス解読部
へ入力し、リモコン受信部からの第一のリモコンパルス
を遮断する。こうして、リモコンパルス解読部は、第一
のリモコンパルスと第二のリモコンパルスとを排他的に
処理する。従って、第一のリモコンパルスと第二のリモ
コンパルスとの間で共通の制御コードを、それぞれ別の
機能へ割り当てても良い。更に、音声信号/リモコンパ
ルス変換部とリモコンパルス選択部との間を、例えば共
通の筐体内部又はケーブル等で接続し、第二のリモコン
パルスが遠隔制御対象機器の外部へ漏れないようにして
も良い。それにより、第二のリモコンパルスにより示さ
れる制御コードを、他の遠隔制御システムのものと重複
させ得る。以上の結果、第二のリモコンパルスにより示
される制御コードとして、任意のカテゴリーコード又は
データコードを割り当て得る。特に、第二のリモコンパ
ルスにより示される制御コード数は、第一のリモコンパ
ルスとは異なり、リモコン信号により示される制御コー
ド数の制約を受けない。こうして、本発明による遠隔制
御対象機器は、音声で指示可能な機能を容易に拡張でき
る。
【0128】本発明による画像処理装置は、上記の本発
明による遠隔制御対象機器であり、特に音声での指示に
対し、例えば次のようなGUIを提供できる。機器制御
部は音声での指示に従い画面表示部を制御し、音声認識
に関する情報を表示する。それにより、その情報がユー
ザへ視覚的にフィードバックされる。その情報は例え
ば、ユーザに対する適切な発声タイミングの通知、認識
された単語若しくはその候補の一覧、又は認識された操
作内容を含む。更に、音声認識に関しエラーが生じたと
き、そのエラー情報を画面に表示しても良い。そのよう
な画面表示による情報のフィードバックを通し、ユーザ
は、例えば認識されやすい発音、スピード、抑揚、又は
音量を、容易に工夫できる。こうして、本発明による画
像処理装置は、特に音声での遠隔制御に関し、操作性を
向上できる。
【図面の簡単な説明】
【図1】本発明の実施例1によるDTV20での遠隔制御
システムの外観を示す模式図である。
【図2】本発明の実施例1による遠隔制御システムに含
まれるリモコン送信器10の構成を示すブロック図であ
る。
【図3】本発明の実施例1によるDTV20内の遠隔制御
システムに関する部分を示すブロック図である。
【図4】本発明の実施例1による音声信号/リモコンパ
ルス変換部30の動作の詳細を示すフローチャートであ
る。
【図5】本発明の実施例1によるリモコンパルス選択部2
3について、第一のリモコンパルスP1と第二のリモコン
パルスP2との切替の詳細を示すフローチャートである。
【図6】本発明の実施例1によるDTV20について、音
声での遠隔制御に関する機器制御部25の動作の詳細を示
すフローチャートである。
【図7】本発明の実施例1による音声信号/リモコンパ
ルス変換部30について、音声認識パラメータの送出の詳
細を示すフローチャートである。
【図8】本発明の実施例1による機器制御部25につい
て、音声認識パラメータの受信及び保存の詳細を示すフ
ローチャートである。
【図9】本発明の実施例1によるDTV20でのGUIに
ついて、制御コードのそれぞれに応じTV画面28Aに表
示される画像データを例示する図である。
【図10】本発明の実施例2によるDTV20Aでの遠隔制
御システムの外観を示す模式図である。
【図11】本発明の実施例2による遠隔制御システムに含
まれるリモコン送信器10Aの構成を示すブロック図であ
る。
【図12】本発明の実施例2によるDTV20A内の遠隔制
御システムに関する部分を示すブロック図である。
【図13】従来の遠隔制御システムの一例に含まれるリモ
コン送信器100の構成を示すブロック図である。
【図14】従来の遠隔制御システムの一例での遠隔制御対
象機器、すなわちVTR200内のリモコンに関する部分
を示すブロック図である。
【図15】従来の遠隔制御システムの別例に含まれるリモ
コン送信器400の構成を示すブロック図である。
【図16】従来の遠隔制御システムの別例での遠隔制御対
象機器、すなわちVTR400内のリモコン及び音声認識
に関する部分を示すブロック図である。
【符号の説明】
20 DTV 38 ケーブル RK リモコン信号 RV 赤外線による音声信号 S 音声信号 T 音声認識開始信号 W 第一候補の単語 C 制御コード N リモコンパルス切替信号 P1 第一のリモコンパルス P2 第二のリモコンパルス P リモコンパルス D 制御データ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04Q 9/00 301 G10L 3/00 531E 311 551F 331 551G 341 561C 571H

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 (A) リモコン信号を受信し、そのリモ
    コン信号を第一のリモコンパルスへ変換するためのリモ
    コン受信部; (B) 音声信号を入力し、その音声信号に対応する制御
    コードを選択し、その制御コードを第二のリモコンパル
    スへ変換するための音声信号/リモコンパルス変換部; (C) 所定の切替信号に従い、前記第一のリモコンパル
    スと前記第二のリモコンパルスとのいずれかを選択する
    ためのリモコンパルス選択部;及び、 (D) 前記リモコンパルス選択部により選択されたリモ
    コンパルスから制御コードを解読し、その制御コードに
    従い動作制御を行うためのリモコンパルス処理部;を有
    する遠隔制御対象機器。
  2. 【請求項2】 (A) 前記音声信号/リモコンパルス変
    換部が、 (a) 音声認識対象データを含む辞書; (b) 前記音声信号と前記音声認識対象データのそれぞ
    れとの類似度を計算し、それらの類似度に基づき、前記
    音声信号に対応すべき前記音声認識対象データの候補、
    又はエラーコードを選択するための音声認識部; (c) 前記音声認識対象データと前記エラーコードとの
    それぞれに対応する制御コードを記憶する制御コード格
    納部;及び、 (d) 前記音声認識対象データの候補、又は前記エラー
    コードに対応する制御コードを前記制御コード格納部か
    ら読み出し、その制御コードを前記第二のリモコンパル
    スへ変換し、前記切替信号と共に前記リモコンパルス選
    択部へ出力するための出力制御部;を有し、 (B) 前記リモコンパルス処理部が、 (a) 前記リモコンパルス選択部により選択されたリモ
    コンパルスを解読し、そのリモコンパルスに対応する制
    御コードへ変換するためのリモコンパルス解読部; (b) 前記制御コードのそれぞれに対応する制御データ
    とコマンドとを記憶する制御データ格納部;及び、 (c) 前記リモコンパルス解読部により解読された制御
    コードに対応する制御データ又はコマンドを前記制御デ
    ータ格納部から読み出し、それらの制御データ又はコマ
    ンドに基づき所定の動作制御を行うための機器制御部;
    を有する、請求項1記載の遠隔制御対象機器。
  3. 【請求項3】 (A) 不揮発性記録媒体を含むパラメー
    タ保存部、を前記遠隔制御対象機器が有し; (B) 前記音声認識部が音声認識パラメータを前記出力
    制御部へ出力し; (C) 前記制御コード格納部が前記音声認識パラメータ
    に対応する制御コードを記憶し; (D) 前記出力制御部が、前記制御コードを前記制御コ
    ード格納部から読み出し、その制御コードを前記第二の
    リモコンパルスへ変換し、前記リモコンパルス選択部へ
    出力し; (E) 前記制御データ格納部が前記制御コードに対応す
    る前記音声認識パラメータを記憶し; (F) 前記機器制御部が、前記リモコンパルス解読部に
    より解読された前記制御コードに対応する前記音声認識
    パラメータを前記制御データ格納部から読み出し、それ
    らの音声認識パラメータを前記パラメータ保存部へ書き
    込む;請求項2記載の遠隔制御対象機器。
  4. 【請求項4】 (A) ユーザの音声を入力し前記音声信
    号へ変換するための音声入力部と、(B) 前記音声信号
    の振幅に応じ前記音声信号/リモコンパルス変換部を起
    動するための起動制御部と、を前記音声信号/リモコン
    パルス変換部が含む;請求項1記載の遠隔制御対象機
    器。
  5. 【請求項5】 (A) (a) ユーザの音声を入力し前記音
    声信号へ変換するための音声入力部と、(b) 超音波、
    赤外線、又は電波によるキャリアを前記音声信号により
    変調し外部へ送出するための無線送信部と、を含み、か
    つ前記リモコン信号を送信するためのリモコン送信器;
    及び、 (B) (a) 前記キャリアを受信するための無線受信部
    と、(b) 前記キャリアの振幅に応じ前記音声信号/リ
    モコンパルス変換部を起動するための起動制御部と、を
    前記音声信号/リモコンパルス変換部が含む、請求項1
    記載の遠隔制御対象機器;を有する遠隔制御システム。
  6. 【請求項6】 前記機器制御部に従い所定の画像を表示
    するための画面表示部と、を有し、かつ請求項2記載の
    遠隔制御対象機器である画像処理装置であり、 (A) 前記制御データ格納部が、前記画面表示部に対す
    る制御データとコマンド、及び前記画面表示部により表
    示させるための表示データを、所定の制御コードにそれ
    ぞれ対応させて記憶し; (B) 前記機器制御部が、前記第二のリモコンパルスか
    ら前記リモコンパルス解読部により解読された制御コー
    ドに対応する前記表示データを前記制御データ格納部か
    ら読み出し、その表示データを前記画面表示部により表
    示させる;画像処理装置。
  7. 【請求項7】 前記表示データがテキストデータを含
    む、請求項6記載の画像処理装置。
  8. 【請求項8】 前記表示データが画像データを含む、請
    求項6記載の画像処理装置。
JP2002246673A 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置 Expired - Fee Related JP4050574B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002246673A JP4050574B2 (ja) 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001-352753 2001-11-19
JP2001352753 2001-11-19
JP2002246673A JP4050574B2 (ja) 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置

Publications (2)

Publication Number Publication Date
JP2003219201A true JP2003219201A (ja) 2003-07-31
JP4050574B2 JP4050574B2 (ja) 2008-02-20

Family

ID=27667325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002246673A Expired - Fee Related JP4050574B2 (ja) 2001-11-19 2002-08-27 遠隔制御対象機器、遠隔制御システム、及び画像処理装置

Country Status (1)

Country Link
JP (1) JP4050574B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007000846A1 (ja) * 2005-06-29 2007-01-04 Mitsubishi Denki Kabushiki Kaisha 移動体用情報装置
JP2007020079A (ja) * 2005-07-11 2007-01-25 Funai Electric Co Ltd テレビ受像機
JP2011118822A (ja) * 2009-12-07 2011-06-16 Nec Casio Mobile Communications Ltd 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム
JP2014010161A (ja) * 2012-06-27 2014-01-20 Nitto Denko Corp 表示入力装置
WO2014069798A1 (en) * 2012-10-29 2014-05-08 Samsung Electronics Co., Ltd. Voice recognition apparatus and voice recognition method thereof
US20140187226A1 (en) * 2011-08-05 2014-07-03 Yulong Computer Telecommunication Scientific (Shenzhen) Co., Ltd. Mobile terminal and method of displaying according to environmental data
US9147396B2 (en) 2013-03-25 2015-09-29 Panasonic Intellectual Property Management Co., Ltd. Voice recognition device and voice recognition method
JP2015184487A (ja) * 2014-03-24 2015-10-22 株式会社東芝 音声処理装置および音声処理方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2441250A (en) * 2005-06-29 2008-02-27 Mitsubishi Electric Corp Movable body information apparatus
GB2441250B (en) * 2005-06-29 2010-12-29 Mitsubishi Electric Corp Movable body information apparatus
US8442815B2 (en) 2005-06-29 2013-05-14 Mitsubishi Electric Corporation Adaptive recognition dictionary update apparatus for use in mobile unit with a tuner
WO2007000846A1 (ja) * 2005-06-29 2007-01-04 Mitsubishi Denki Kabushiki Kaisha 移動体用情報装置
JP2007020079A (ja) * 2005-07-11 2007-01-25 Funai Electric Co Ltd テレビ受像機
JP2011118822A (ja) * 2009-12-07 2011-06-16 Nec Casio Mobile Communications Ltd 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム
US20140187226A1 (en) * 2011-08-05 2014-07-03 Yulong Computer Telecommunication Scientific (Shenzhen) Co., Ltd. Mobile terminal and method of displaying according to environmental data
US9544784B2 (en) * 2011-08-05 2017-01-10 Yulong Computer Telecommunication Scientific (Shenzhen) Co., Ltd. Mobile terminal and method of displaying according to environmental data
JP2014010161A (ja) * 2012-06-27 2014-01-20 Nitto Denko Corp 表示入力装置
WO2014069798A1 (en) * 2012-10-29 2014-05-08 Samsung Electronics Co., Ltd. Voice recognition apparatus and voice recognition method thereof
US9147396B2 (en) 2013-03-25 2015-09-29 Panasonic Intellectual Property Management Co., Ltd. Voice recognition device and voice recognition method
US9520132B2 (en) 2013-03-25 2016-12-13 Panasonic Intellectual Property Management Co., Ltd. Voice recognition device and voice recognition method
JP2015184487A (ja) * 2014-03-24 2015-10-22 株式会社東芝 音声処理装置および音声処理方法

Also Published As

Publication number Publication date
JP4050574B2 (ja) 2008-02-20

Similar Documents

Publication Publication Date Title
KR100486368B1 (ko) 원격제어대상기기, 원격제어시스템 및 화상처리장치
USRE49493E1 (en) Display apparatus, electronic device, interactive system, and controlling methods thereof
US7080014B2 (en) Hands-free, voice-operated remote control transmitter
EP1209661B1 (en) Universal remote control adapted to receive voice input
US20130218562A1 (en) Sound Recognition Operation Apparatus and Sound Recognition Operation Method
US6879351B1 (en) Method and apparatus for remote control
US20060077174A1 (en) Integrated remote control device receiving multimodal input and method of the same
US20030018479A1 (en) Electronic appliance capable of preventing malfunction in speech recognition and improving the speech recognition rate
US20060235698A1 (en) Apparatus for controlling a home theater system by speech commands
JP2004507936A (ja) ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置
EP3429215A1 (en) Remote controller and method for receiving a user's voice thereof
US6560469B1 (en) Microphone/speaker-contained wireless remote control system for internet device and method for controlling operation of remote controller therein
US20050151886A1 (en) Remote controller
KR102604297B1 (ko) 프로세서, 디스플레이 장치 및 방법
JP4050574B2 (ja) 遠隔制御対象機器、遠隔制御システム、及び画像処理装置
US20110040563A1 (en) Voice Control Device and Voice Control Method and Display Device
US20070052549A1 (en) Apparatus and method for updating encoded signal information stored in a remote control unit through direct key entry
US20090072993A1 (en) Remote control system and method thereof
JP3683502B2 (ja) リモコン装置
EP2513883B1 (en) Method and apparatus for controlling an electronic system
US20060033636A1 (en) Controlling an infrared responsive device
JP3107142U (ja) 音声認識式リモートコントロール装置
KR20020011028A (ko) 음성신호를 이용한 원격 제어방법 및 제어장치
US20230223019A1 (en) Information processing device, information processing method, and program
KR101220288B1 (ko) Tv 전원 상태에 기인한 방송수신장치 자동 모드 전환 방법 및 이를 적용한 방송수신장치

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050819

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees