JP2004096520A - 音声認識リモコン - Google Patents

音声認識リモコン Download PDF

Info

Publication number
JP2004096520A
JP2004096520A JP2002256361A JP2002256361A JP2004096520A JP 2004096520 A JP2004096520 A JP 2004096520A JP 2002256361 A JP2002256361 A JP 2002256361A JP 2002256361 A JP2002256361 A JP 2002256361A JP 2004096520 A JP2004096520 A JP 2004096520A
Authority
JP
Japan
Prior art keywords
voice recognition
voice
remote control
module
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002256361A
Other languages
English (en)
Inventor
Shunji Muraoka
村岡 俊二
Shogo Kubota
窪田 昭吾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hosiden Corp
Original Assignee
Hosiden Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hosiden Corp filed Critical Hosiden Corp
Priority to JP2002256361A priority Critical patent/JP2004096520A/ja
Publication of JP2004096520A publication Critical patent/JP2004096520A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

【課題】消費電力をできる限り抑えるとともにその操作性も満足できる音声認識リモコンを提供することである。
【解決手段】制御対象に送信するリモコンコード群の一部に対応づけられた制御データを音声入力に基づいて生成する音声認識モジュール2と、制御対象に送信する前記リモコンコード群の残りの部分に対応づけられた制御データをキー入力に基づいて生成するリモコン制御モジュール3とから構成されるとともに、前記音声認識モジュールは音声認識を行わない時には省電力状態に維持される音声認識リモコン1。
【選択図】図2

Description

【0001】
【発明の属する技術分野】
本発明は、音声入力によって操作可能な音声認識リモコンに関する。
【0002】
【従来の技術】
テレビやビデオなどの家電製品や電子玩具などの電気機器を制御対象として無線で遠隔操作するリモコンは、その制御対象の機能が多様化するにしたがって多くの操作キーが用意されることとなり、その操作の煩わしさは無視できなくなったことから、音声によって操作を指令できる音声認識リモコンが注目されている。
【0003】
しかしながら、音声認識処理は複雑かつ高速なデジタル処理を伴うものであり、電力消費が大きく、電池駆動が必須となるリモコンでの重大な問題点となっている。この問題点を解消するため、従来の音声認識リモコンの1つでは、入力ボタンを押している間だけ音声認識処理のために電力を供給することや、所定レベルの音声信号が入力されると一定時間だけリモコン制御処理のために電力を供給することで電源電池の消費量を低減している(例えば、特許文献1参照。)。また、別の従来の低電力消費型の音声認識リモコンでは、スタートスイッチを押すと所定の時間だけリモコン制御処理のために電力が供給される(例えば、特許文献2参照。)。いずれにしても、リモコン操作を全て音声入力によって行うためには、消費電力が大きくなる高レベルの音声認識処理が必要であり、小さな電池で十分な動作時間を確保することは難しく、よりきめの細かい省電力対策が期待されている。
【0004】
キー入力操作型のリモコン機能はそのままで、さらに音声入力操作機能を付加した音声認識リモコンも提案されている(例えば、特許文献3参照。)。好きな入力操作方式を選択できることから操作の種別に応じて操作方式を選べるといったリモコン操作上のメリットはあるが、音声入力操作を主に使う場合、上述した消費電力の問題から、多くの大容量電池の収容ないしは頻繁な電池の交換が必要となる。
【0005】
さらに別な従来のリモコンでは、キー入力操作機能と音声入力操作機能の両方を備えているが、音声認識処理部を制御対象側に持たせることでリモコンの消費電力の問題を解決しようとしている(例えば、特許文献4参照。)。しかしながら、リモコン側ではマイクを通じて入力された音声信号を制御対象に送信する回路が必要であり、制御対象側では音声認識処理部を設けることによって操作制御回路が複雑となる問題が残る。特に、1つのリモコンで複数台の制御対象を制御可能とすることでリモコンの数を減らそうとする技術的な流れにおいては、各制御対象にリモコンの一部の機能を持たせることは省資源の観点から避けるべきである。
【0006】
【特許文献1】
特開平08ー115096号公報(第4−5頁、第5図と第6図)
【特許文献2】
特開2001−318689号公報(第5頁、第7図)
【特許文献3】
特開平11ー249687号公報(第2頁、第2図)
【特許文献4】
特開2000−074465号公報(第6−7頁、第4図と第8図)
【0007】
【発明が解決しようとする課題】
上記実状に鑑み、本発明の課題は、消費電力をできる限り抑えるとともにその操作性も満足できる音声認識リモコンを提供することである。
【0008】
【課題を解決するための手段】
上記課題を解決するため、本発明による音声認識リモコンでは、制御対象に送信するリモコンコード群の一部に対応づけられた制御データを音声入力に基づいて生成する音声認識モジュールと、制御対象に送信する前記リモコンコード群の残りの部分に対応づけられた制御データをキー入力に基づいて生成するリモコン制御モジュールとから構成されるとともに、前記音声認識モジュールは音声認識を行わない時には省電力状態に維持される。
【0009】
この構成では、制御対象の制御するためのコマンドを音声入力操作に適したものとキー入力操作に適したものを分けることにより、リモコン上に配置される操作キーや操作ボタンの数を少なくして、リモコンの大形化を回避するとともに、音声入力操作に向いたコマンドだけを生成するための音声認識モジュールが無駄に電力を消費することを避けるために、音声認識モジュールは音声認識を行わない時には省電力モードに設定される。さらに、音声認識モジュールとリモコン制御モジュールを独立させていることから、省電力対策を各モジュール別にきめ細かく行うことが可能となる。
【0010】
上述したような各モジュール別のきめ細かい省電力対策の具体的な実施形態の1つでは、前記音声認識モジュールは音声入力を受け入れる動作モードと音声入力を受け入れない休止モードを備えており、特定のキー入力に基づいて前記リモコン制御モジュールから送られるアクティブ化信号によって休止モードから動作モードに切り替わる。この休止モードにおいて音声認識モジュールは実質的に動作停止状態となるので、消費電流は数マイクロアンペア程度である。従って、音声入力操作とキー入力操作とが組み合わされたこのリモコンの平均消費電力は従来の音声認識操作専用のリモコンに比べて非常に低いものである。
【0011】
さらに、本発明の好適な実施形態では、前記音声認識モジュールの動作モードは入力音声信号を高サンプリングレートで処理する高動作モードと入力音声信号を低サンプリングレートで処理する低動作モードからなり、入力音声信号の変化が少ない場合低動作モードに、入力音声信号の変化が大きい場合高動作モードに自動的に切り換えられる。このように音声認識モジュールの動作モードをさらに高動作モードと低動作モードの2つのモードにわけることにより、よりきめの細かい省電力対策を可能にしている。
【0012】
本発明のさらに別な好適な実施形態では、前記リモコン制御モジュールの動作状態から独立して作用する音声認識起動スイッチが設けられており、この音声認識起動スイッチの操作によって前記音声認識モジュールは休止モードから動作モードに切り替わる。この構成では、音声認識モジュールをスイッチ操作により強制的に動作モードに切り替えることで、音声の常時受付を可能にし、完全なハンズフリー操作を実現している。ハンズフリー操作が必須となる高齢者やキー入力操作が困難な人にとって便利な機能である。その際の高い消費電力の問題は、頻繁な音声認識起動スイッチの切り替え、あるいは充電機能と充電台の組み合わせで実用的に対処することができる。
【0013】
よりきめの細かい省電力対策としては、リモコン制御モジュール側の消費電力も考慮する必要がある。このため、本発明の好適な実施形態の1つでは、前記リモコン制御モジュールは省電力駆動モードを備えており、前記音声認識モジュールから送られるウエイクアップ信号によって省電力駆動モードが解消される。もちろん、技術的にはよく知られている、キーマトリックスのどれかのキーを押すことでリモコン制御モジュールをウエイクアップさせる機能をも備えておくことは好都合である。このウエイクアップ信号の具体的な実施形態の1つとして、入力された音声信号が適切に音声認識されると認識報知のために生成される認識報知信号が前記ウエイクアップ信号として利用されることが提案される。音声入力操作において、入力された音声が音声認識モジュールによって正しく認識された時に初めてリモコン制御モジュールを正常な動作モードに移行させることにより、消費電力の低減を図っている。
【0014】
本発明による音声認識リモコンの重要な特徴である音声認識モジュールとリモコン制御部との独立的な省電力対策が可能となる分離構成を採用した場合、リモコンコードの生成に直接対応するようなキー入力操作を実質的に排除した音声認識リモコンも実用レベルの使用に耐えることができる消費電力の条件で提供可能となる。そのような本発明による音声認識リモコンは、音声入力に基づいて制御データを生成する音声認識モジュールと、前記制御データに対応するリモコンコードを制御対象に送信するリモコン制御モジュールとから構成され、前記音声認識モジュールは音声入力を受け入れる動作モードと音声入力を受け入れない休止モードを備えているとともに前記リモコン制御モジュールの動作状態から独立して作用する音声認識起動スイッチの操作によって前記音声認識モジュールは休止モードから動作モードに切り替わり、前記リモコン制御モジュールは省電力駆動モードを備えているとともに前記音声認識モジュールから送られるウエイクアップ信号によって省電力駆動モードが解消されることを特徴としている。この構成では、使用条件に応じて、音声認識モジュールとリモコン制御モジュールのどちらか一方、もしくは両方を省電力モードに設定することで、消費電力の低減と操作性の維持の両立を図っている。
【0015】
前記リモコン制御モジュール側からの信号によって前記音声認識モジュールを休止モードから動作モードに切り替えるための1つの具体例として、前記リモコン制御モジュールは特定のキー入力に基づいて前記音声認識モジュールを休止モードから動作モードに切り替えるアクティブ化信号を前記音声認識モジュールに送ることが提案される。このアクディブ化信号は、音声認識起動スイッチの操作によって前記音声認識モジュールに送られる休止モードから動作モードへの切り替え信号と同等なものとすると回路設計上好都合である。
【0016】
音声認識モジュールにおける音声認識率を向上させるために、本発明による好適な実施形態の1つでは、前記音声認識モジュールにおけるリモコン操作音声信号のための音声認識処理の開始タイミングとして機能する特定の言葉でなるスタートワードが定義されており、このスタートワードのみが他の言葉より高い確度で認識させるように前記音声認識モジュールが構成されている。このようなスタートワードによるリモコン操作音声入力の音声認識処理のスタートタイミングの決定は、動作モードにおいて機能させると特に有効である。このスタートワードの採用は、単一の言葉を高い確度で認識するだけならばコストや消費電力の増加はそれほどともなわないという知見に基づいている。そのようなスタートワード以降に入力される音声信号はリモコン操作音声信号であるとみなすことができることからそれらの認識率は向上する。
【0017】
また、特に休止モードにおいて音声認識モジュールにおける音声認識率を向上させるために、本発明による好適な実施形態の他の1つでは、前記音声認識モジュールは駆動モードに応じて変更される基準入力音声レベルを設定し、この基準入力音声レベル以上の入力音声信号だけを音声認識処理するように構成されている。この構成では、大きな声での音声によるリモコン操作入力だけが音声処理を受けることになるので、結果的に周囲の雑音とリモコン操作のための音声信号とのS/N比が向上し、リモコン操作音声信号の音声認識率が改善され、騒々しい環境下においていたずらに誤認識を繰り返すという問題を解決することができる。
本発明によるその他の特徴及び利点は、以下図面を用いた実施例の説明により明らかになるだろう。
【0018】
【発明の実施の形態】
図1には本発明による音声認識リモコン1の一例の外観が示されており、図1にはその音声認識リモコン1のブロック構成図が示されている。この音声認識リモコン(以後、単にリモコンと称する)1は、音声認識モジュール2と、リモコン制御モジュール3と、キーマトリックス4と、マイク5と、スピーカ6と、音声認識モジュール3における音声認識処理状態を表示する音声認識状態表示LED7と、ユーザの操作入力に応じてリモコン制御モジュール3で生成されたリモコンコードを制御対象としてのテレビやビデオに送信する赤外線LED8と、電源としての電池10から構成されている。
【0019】
音声認識モジュール2とリモコン制御モジュール3はそれぞれ独立して動作する省電力モードを備えている。特に、音声認識モジュール2は、音声認識を全く行わない休止モードと音声認識を行う動作モードを備え、さらにこの動作モードには、マイク5を通じて入力された入力音声信号を高サンプリングレートで処理する高動作モードと入力音声信号を低サンプリングレートで処理する低動作モードが含まれており、入力音声信号の変化が少ない場合低動作モードに、入力音声信号の変化が大きい場合高動作モードに自動的に切り換えられる。
【0020】
図1から明らかなように、リモコン1は細長いドーム状であり、そのハウジング表面の前端には赤外線LED8が、前側領域にはマイク5と音声認識状態表示LED7が、後側領域にはスピーカ6が配置されている。リモコンハウジングの中間領域には、テレビ放送チャンネルを順次昇順で切り替える昇順チャンネルキー41と、テレビ放送チャンネルを順次降順で切り替える降順チャンネルキー42と、テレビ音量を大きくする音量アップキー43と、テレビ音量を小さくする音量ダウンキー44と、テレビ/ビデオ切り替えキー45と、休止モードの音声認識モジュール2を約30秒の間動作モードに切り替えるための音声認識キー46が配置されている。これらのキーは、前述したキーマトリックス4で割り当てられている。
【0021】
さらに、リモコンハウジングの一側面には音声認識起動スイッチとして機能する音声認識動作切替スイッチ9が配置されている。図2から明らかなように、音声認識動作切替スイッチ9はリモコン制御モジュール2の出力ポートと音声認識モジュール2の反転CE(チップイネーブル)ポートを接続するラインに介装された2位置スイッチであり、一方の接点は接地されている。音声認識動作切替スイッチ9が接地状態に切り替えられると音声認識モジュール2は動作(常時)モードとなり、前記出力ポートと反転CEポートを接続する状態に切り替えられると音声認識モジュール2は休止(省電力)モードとなる。しかしながら、前記出力ポートと反転CEポートを接続する状態において前述した音声認識キー46が押し下げられると、約30秒間だけ反転CEポートが低レベルにセットされ、結果的に音声認識モジュール2は動作モードになり、音声認識モジュール2における音声認識が実行可能となる。この音声認識キー46による音声認識モジュール2のアクティブ化のタイムチャートが図3に示されている。
【0022】
リモコン制御モジュール3もそれ自体はよく知られた省電力モードを備えており、キーマトリックス4に何らかの操作入力が生じた場合、リモコン制御モジュール3がウエイクアップする。ここでは、リモコン制御モジュール3のためのもう1つのウエイクアップ方法が提供されており、それは、音声認識モジュール2からリモコン制御モジュール3に送信されるウエイクアップ信号である。
【0023】
この実施形態では、制御対象に対する操作のためにマイク5を通じて入力されたユーザの音声信号が適切に音声認識モジュール2において音声認識されると認識報知のための認識報知信号が生成され、この認識報知信号が音声認識状態表示LED7を点灯させる。この認識報知信号は音声認識状態表示LED7を点滅させるパルス信号となっているが、その繰り返し周波数は人間によっては点灯していると視覚判断する程度に設定されており、常時点灯に比べて点灯消費電力の低減化を図っている。
【0024】
この実施形態では、このパルス上の認識報知信号が音声認識モジュール2からリモコン制御モジュール3に送信されるウエイクアップ信号として利用されている。つまり、認識報知信号の立ち下がりのエッジによりリモコン制御モジュール3がウエイクアップし、ユーザによる音声操作に対応するデータ信号とシリアルクロックを音声認識モジュール2から受け取ることが可能な状態となる。このことを表すタイムチャートが図4に示されている。
【0025】
図番11は電源ON/OFFスイッチであり、このリモコンを長時間使用しない際にOFF位置に切り換えることにより、電池11の長寿命化を図っている。
【0026】
音声認識モジュール2は種々の機能を果たすように設計されているが、これらの機能はハードウエア又はソフトウエアあるいはその両方で実現されるものであり、特に本発明に関係する機能としては、図5に示すように、この音声認識モジュールを休止モードと高動作モードと低動作モードのいずれかのモードに設定管理する省電力モード決定部21、マイク8から入力されたアナログ音声信号をサンプリングしてデジタル音声信号に変換する音声入力部22と、予め登録された操作音声信号の音声パターンを記憶している登録音声パターン格納部23、音声入力部22で処理された音声信号と一致する音声パターンを登録音声パターン格納部23にアクセスしながら照合するとともに合致した音声パターンに対応する制御コードを出力する音声データ照合部24、音声データ照合部24が入力音声信号のパターンマッチングに成功して該当音声信号を認識した際に認識報知信号を生成する認識報知信号生成部25、音声データ照合部24から出力された制御コードをリモコン制御モジュール3に転送する制御データ転送部26が挙げられる。前述したように、認識報知信号生成部25によって生成された認識報知信号は音声認識状態表示LED7に送られてこのLED7を点灯させるとともに、ウエイクアップ信号としてリモコン制御モジュールにも送られる。
【0027】
さらに、この音声認識モジュール2には、音声照合部24でパターンマッチした音声パターンに対応するオーディオ信号をスピーカ駆動信号に変換してスピーカ6に送る音声出力部27が備えられている。例えば、いわゆる「Gコード」を用いたビデオ録画設定を音声入力によって行う場合、ユーザはマイク5に向かって「Gコード53253予約」を話し、この音声入力信号が音声認識されると、スピーカ6を通じて、「Gコード53253予約送信します」あるいはGコードをデコードして「8月17日4チャンネル21時から22時までを録画予約します」と報知される。同時に、この特定Gコードを表す制御コードが制御データ転送部26からリモコン制御モジュール3に転送される。これとは逆に、録画予約日時とチャンネルを音声入力して、音声照合部24でGコードに変換してもよい。
【0028】
同様にリモコン制御モジュール3の種々の機能もハードウエア又はソフトウエアあるいはその両方で実現されるが、特に本発明に関係する機能としては、図6に示すように、リモコン制御モジュール3の省電力機能を管理する省電力管理部31、キーマトリックス4を通じてのキー操作入力に基づいて各キーに割り当てられた制御データないしは制御コマンドを出力するキー制御部32、前記音声認識モジュール2の制御データ転送部26から送られてきた制御データを受け取る制御データ受信部33、キー制御部32や制御データ受信部33からの制御データを制御対象のリモコン制御のための制御コードに変換するリモコンコード生成部34、リモコンコード生成部34で生成されたリモコンコードを赤外線LED8を通じて制御対象の受信部に赤外線伝送するリモコン通信部35が挙げられる。
【0029】
このリモコン制御モジュール3にはさらに音声認識起動信号転送部36が備えられているが、これはキーマトリックス4の1つのキーである音声認識キー46が押し下げられたことをキー制御部32が検知することによって与えられる制御コマンドに基づいて音声認識モジュール2の反転CEポートに音声認識アクティブ化信号を出力する。この音声認識アクティブ化信号とは、図3に示されるように、約30秒間だけ反転CEポートを低レベルにする信号であり、休止モードの音声認識モジュール2を音声認識動作可能な動作モードに復帰させるものである。
【0030】
上述したように、本発明による音声認識リモコン1では、音声認識モジュール2とリモコン制御モジュール3がそれぞれ独立した省電力対策を施されている。このリモコン1を音声認識モードで使用する際の典型的な省電力管理の様子を図7に示すフローチャートを用いて説明する。
【0031】
ここでは、まず、音声認識モジュール2は、音声認識動作切替スイッチ9の操作により設定される休止モード(#01)又は動作モード(#02)のいずれかのモードで待機している。休止モードにおいて音声認識キー46が操作されると(#10でYES 分岐)、音声認識起動信号転送部36が音声認識モジュール2に音声認識アクティブ化信号を送る(#12)。これにより音声認識モジュール2は動作モードとなり、音声認識可能な状態となる(#14)。ただし、マイク8に音声が入らない限り、この音声認識モジュール2は入力音声信号を低サンプリングレートで処理する低動作モードを維持している。この状態は動作モードで待機している(#02)音声認識モジュール2でも同じである。
【0032】
この低動作モードではマイク8を通じて音声入力部22に入力された音声入力信号の変化がチェックされている(#20)。この音声入力信号の変化が所定レベルを超えると(#20でYES 分岐)、高動作モードに切り替わり、入力した音声信号は音声入力部22において高いサンプリングレートで処理される(#22)。続いて、音声入力部22で処理された音声信号と登録音声パターン格納部23に記憶されている音声パターンとの照合が行われる(#24)。音声パターンが合致すると(#26でYES 分岐)音声認識が完了したとして、認識報知信号が生成される。この認識報知信号は、一方ではリモコン制御モジュール3を省電力モードから復帰させるウエイクアップ信号としてリモコン制御モジュール3に送られ(#28)、他方では音声認識状態表示LED7に送られてこのLED7を点灯させる(#30)。さらに、音声認識が完了した入力音声のユーザ確認のために、認識音声又はこれを表現する別な音声をスピーカ6を通じて出力する(#32)。ステップ#28でリモコン制御モジュール3にウエイクアップ信号が送られることにより、リモコン制御モジュール3の制御データ受信部33は制御データの受け入れ許可状態となるので、音声認識された音声パターンに対応する制御データが制御データ転送部26を通じてリモコン制御モジュール3に送られる(#34)。
リモコン制御モジュール3に送られた制御コードはキーマトリックス4を通じて入力されるキー入力の処理と同様にリモコン生成部34でリモコンコードに変換され(#36)、赤外線LED8を通じて制御対象に送信する(#38)。リモコンコードの送信が完了すると、再びリモコン制御モジュールは省電力モードに復帰するとともに、音声認識モジュール2も音声認識動作切替スイッチ9の操作により設定されたモード、休止モード又は動作モードでの待機状態となる。
【0033】
動作モード及び休止モードにおいて音声認識モジュール2における音声認識率を向上させるために、本発明では、次のような方策がさらに提案されている。
そのひとつは、動作モードにおいて、音声認識のスタートワードとして特定の言葉を定義しておき、その言葉の発生音だけは特別に高い確度で認識できるように音声照合部24を構成する。全ての言葉を正確に認識するような手法が近年開発されているが、いずれも複雑で高速な電子回路を必要とし、そのことはリモコンへの採用を不可能にするコスト高を導くだけではなく、電池駆動を不可能とする消費電力の増大も導く。しかしながら、単一の言葉を高い確度で認識するだけならばそのようなコストや消費電力の増加はともなわない。従って、特定の言葉、この実施形態では「リモコン」という言葉を認識した場合、この言葉に続いて音声によるリモコン操作が入力されると判断できるので、そのタイミングで音声照合部24が音声入力部22で処理された音声信号のパターンマッチングを行う。これにより、スタートワード(「リモコン」)以降に入力される音声信号、つまりリモコン操作音声信号の認識率が向上する。
【0034】
他のひとつは、特に休止モードにおける認識率の向上に関するものである。周囲の雑音とリモコン操作のための音声信号とのS/N比を向上させる必要があるが、これを最も簡単に実現しようとすると、ユーザによるリモコン操作音声信号の音量レベルを上げること、つまり大きな声で発音してもらうか、あるいはマイクに近づいて発音してもらうことになる。このため、休止モードにおいては、音声入力部22における入力音量の可変スレッシホルドレベルを高めに設定しておき、大きな音量をもつ入力音声信号だけが音声認識処理を受けるように構成すると好都合である。つまり、小さな声では音声認識が開始されないことをユーザに理解してもらうことで、大きな声での音声によるリモコン操作を促し、結果的に高いS/N比を実現し、騒々しい環境下においていたずらに誤認識を繰り返すという問題を解決することができるのである。
【0035】
上述した実施形態の説明では、この音声認識リモコン1はビデオやテレビのためのリモコン操作として用いられる例を取り上げたが、もちろん、他の家電商品だけではなく電子玩具やその他の電子機器のリモコンとしても適用可能である。また、リモコンコードを制御対象に送信する伝送方式としては、赤外線通信に限らず、電波を用いた通信プロトコルを利用したものを採用してもよい。
【図面の簡単な説明】
【図1】本発明の一例としての音声認識リモコンの外観図
【図2】図1による音声認識リモコンの機能ブロック図
【図3】音声認識アクティブ化信号のタイムチャート図
【図4】ウエイクアップ信号のタイムチャート図
【図5】音声認識モジュールの機能ブロック図
【図6】リモコン制御モジュールの機能ブロック図
【図7】省電力管理の様子を示すフローチャート図
【符号の説明】
1 音声認識リモコン
2 音声認識モジュール
3 リモコン制御モジュール
4 キーマトリックス
5 マイク
6 スピーカ
7 音声認識状態表示LED
8 赤外線LED
9 音声認識動作切替スイッチ
46 音声認識キー

Claims (10)

  1. 制御対象に送信するリモコンコード群の一部に対応づけられた制御データを音声入力に基づいて生成する音声認識モジュールと、制御対象に送信する前記リモコンコード群の残りの部分に対応づけられた制御データをキー入力に基づいて生成するリモコン制御モジュールとから構成されるとともに、前記音声認識モジュールは音声認識を行わない時には省電力状態に維持されることを特徴とする音声認識リモコン。
  2. 前記音声認識モジュールは音声入力を受け入れる動作モードと音声入力を受け入れない休止モードを備えており、特定のキー入力に基づいて前記リモコン制御モジュールから送られるアクティブ化信号によって休止モードから動作モードに切り替わることを特徴とする請求項1に記載の音声認識リモコン。
  3. 前記音声認識モジュールの動作モードは入力音声信号を高サンプリングレートで処理する高動作モードと入力音声信号を低サンプリングレートで処理する低動作モードからなり、入力音声信号の変化が少ない場合低動作モードに、入力音声信号の変化が大きい場合高動作モードに自動的に切り換えられることを特徴とする請求項2に記載の音声認識リモコン。
  4. 前記リモコン制御モジュールの動作状態から独立して作用する音声認識起動スイッチが設けられており、この音声認識起動スイッチの操作によって前記音声認識モジュールは休止モードから動作モードに切り替わることを特徴とする請求項2又は3に記載の音声認識リモコン。
  5. 前記リモコン制御モジュールは省電力駆動モードを備えており、前記音声認識モジュールから送られるウエイクアップ信号によって省電力駆動モードが解消されることを特徴とする請求項1〜4のいずれかに記載の音声認識リモコン。
  6. 入力された音声信号が適切に音声認識されると認識報知のための認識報知信号が生成され、この認識報知信号が前記ウエイクアップ信号として利用されることを特徴とする請求項5に記載の音声認識リモコン。
  7. 音声入力に基づいて制御データを生成する音声認識モジュールと、前記制御データに対応するリモコンコードを制御対象に送信するリモコン制御モジュールとから構成され、前記音声認識モジュールは音声入力を受け入れる動作モードと音声入力を受け入れない休止モードを備えているとともに前記リモコン制御モジュールの動作状態から独立して作用する音声認識起動スイッチの操作によって前記音声認識モジュールは休止モードから動作モードに切り替わり、前記リモコン制御モジュールは省電力駆動モードを備えているとともに前記音声認識モジュールから送られるウエイクアップ信号によって省電力駆動モードが解消されることを特徴とする音声認識リモコン。
  8. 前記リモコン制御モジュールは特定のキー入力に基づいて前記音声認識モジュールを休止モードから動作モードに切り替えるアクティブ化信号を前記音声認識モジュールに送ることを特徴とする請求項7に記載の音声認識リモコン。
  9. 前記音声認識モジュールにおけるリモコン操作音声信号のための音声認識処理の開始タイミングとして機能する特定の言葉でなるスタートワードが定義されており、このスタートワードのみが他の言葉より高い確度で認識されるように前記音声認識モジュールが構成されていることを特徴とする請求項1〜8のいずれかに記載の音声認識リモコン。
  10. 前記音声認識モジュールは駆動モードに応じて変更される基準入力音声レベルを設定しており、この基準入力音声レベル以上の入力音声信号だけを音声認識処理することを特徴とする請求項1〜8のいずれかに記載の音声認識リモコン。
JP2002256361A 2002-09-02 2002-09-02 音声認識リモコン Pending JP2004096520A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002256361A JP2004096520A (ja) 2002-09-02 2002-09-02 音声認識リモコン

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002256361A JP2004096520A (ja) 2002-09-02 2002-09-02 音声認識リモコン

Publications (1)

Publication Number Publication Date
JP2004096520A true JP2004096520A (ja) 2004-03-25

Family

ID=32061604

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002256361A Pending JP2004096520A (ja) 2002-09-02 2002-09-02 音声認識リモコン

Country Status (1)

Country Link
JP (1) JP2004096520A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005269A (ja) * 2006-06-23 2008-01-10 Audio Technica Corp ノイズキャンセルヘッドフォン
JP2012185861A (ja) * 2012-07-03 2012-09-27 Toshiba Corp 操作装置及び操作方法
JP2015501438A (ja) * 2011-09-23 2015-01-15 ディジマーク コーポレイション 状況(Context)に基づくスマートフォンセンサロジック
JP2015508516A (ja) * 2011-11-17 2015-03-19 マイクロソフト コーポレーション デバイス・アクティブ化のためのオーディオ・パターン照合
CN107564532A (zh) * 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 电子设备的唤醒方法、装置、设备及计算机可读存储介质
JP2018203445A (ja) * 2017-06-02 2018-12-27 フジテック株式会社 昇降装置の遠隔制御システム
JP2019015952A (ja) * 2017-07-05 2019-01-31 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体
JP2020023405A (ja) * 2019-11-25 2020-02-13 フジテック株式会社 昇降装置の遠隔制御システム
US11574632B2 (en) 2018-04-23 2023-02-07 Baidu Online Network Technology (Beijing) Co., Ltd. In-cloud wake-up method and system, terminal and computer-readable storage medium
US11934742B2 (en) 2016-08-05 2024-03-19 Sonos, Inc. Playback device supporting concurrent voice assistants
US11947870B2 (en) 2016-02-22 2024-04-02 Sonos, Inc. Audio response playback
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification
US11973893B2 (en) 2018-08-28 2024-04-30 Sonos, Inc. Do not disturb feature for audio notifications
US11979960B2 (en) 2016-07-15 2024-05-07 Sonos, Inc. Contextualization of voice inputs

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005269A (ja) * 2006-06-23 2008-01-10 Audio Technica Corp ノイズキャンセルヘッドフォン
JP2015501438A (ja) * 2011-09-23 2015-01-15 ディジマーク コーポレイション 状況(Context)に基づくスマートフォンセンサロジック
JP2015508516A (ja) * 2011-11-17 2015-03-19 マイクロソフト コーポレーション デバイス・アクティブ化のためのオーディオ・パターン照合
JP2012185861A (ja) * 2012-07-03 2012-09-27 Toshiba Corp 操作装置及び操作方法
US11947870B2 (en) 2016-02-22 2024-04-02 Sonos, Inc. Audio response playback
US11979960B2 (en) 2016-07-15 2024-05-07 Sonos, Inc. Contextualization of voice inputs
US11934742B2 (en) 2016-08-05 2024-03-19 Sonos, Inc. Playback device supporting concurrent voice assistants
JP2018203445A (ja) * 2017-06-02 2018-12-27 フジテック株式会社 昇降装置の遠隔制御システム
CN107564532A (zh) * 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 电子设备的唤醒方法、装置、设备及计算机可读存储介质
US10783884B2 (en) 2017-07-05 2020-09-22 Baidu Online Network Technology (Beijing) Co., Ltd. Electronic device-awakening method and apparatus, device and computer-readable storage medium
US10964317B2 (en) 2017-07-05 2021-03-30 Baidu Online Network Technology (Beijing) Co., Ltd. Voice wakeup method, apparatus and system, cloud server and readable medium
JP2019015951A (ja) * 2017-07-05 2019-01-31 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体
JP2019015952A (ja) * 2017-07-05 2019-01-31 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体
US11574632B2 (en) 2018-04-23 2023-02-07 Baidu Online Network Technology (Beijing) Co., Ltd. In-cloud wake-up method and system, terminal and computer-readable storage medium
US11973893B2 (en) 2018-08-28 2024-04-30 Sonos, Inc. Do not disturb feature for audio notifications
JP2020023405A (ja) * 2019-11-25 2020-02-13 フジテック株式会社 昇降装置の遠隔制御システム
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification

Similar Documents

Publication Publication Date Title
JP2004096520A (ja) 音声認識リモコン
KR101732137B1 (ko) 원격 제어 장치 및 전력 제어 방법
WO2014030540A1 (ja) 遠隔操作装置
CN106131292B (zh) 设置终端唤醒的方法、唤醒方法及对应的系统
KR100967316B1 (ko) 터치감지장치 및 그 터치감지장치와 연결된 전자장치
US11330690B2 (en) Switching device with auxiliary power unit and wireless receiver function, and lamp system using the same
CN108734906A (zh) 自发电门铃装置和控制方法
CN101483683A (zh) 手持装置及其语音识别方法
CN108573703B (zh) 电器系统的控制方法
CN113438564B (zh) 控制系统、终端的处理方法、无线开关及其处理方法
CN113300473B (zh) 智能控制器及其处理方法、控制系统
CN113423026B (zh) 无线开关及其处理方法,以及控制系统
CN202362929U (zh) 一种语音交互式红外遥控器
CN202920607U (zh) 桑拿房或远红外光波房
US20070294551A1 (en) Wireless remote control circuit with dual processing units and method therefor
CN108663942B (zh) 一种语音识别设备控制方法、语音识别设备和中控服务器
CN111162768B (zh) 控制装置及方法
CN210295320U (zh) 一种具有蓝牙功能的门铃
CN113905264A (zh) 一种基于语音遥控器的语音控制系统
CN103795946A (zh) 电视机无线语音遥控装置
JPH10133788A (ja) 電源制御機能付き無線型情報入力装置
KR20030020031A (ko) 음향/음성 자동 송출시스템
CN111625106A (zh) 一种可自定义键盘开关触发位置的方法及装置
CN210202158U (zh) 一种酒店用智能灯光控制系统
KR101191185B1 (ko) 이동통신 단말기 및 이동통신 단말기의 이어마이크 키인식방법