JP2015039071A - 音声認識操作装置及び音声認識操作方法 - Google Patents

音声認識操作装置及び音声認識操作方法 Download PDF

Info

Publication number
JP2015039071A
JP2015039071A JP2011076444A JP2011076444A JP2015039071A JP 2015039071 A JP2015039071 A JP 2015039071A JP 2011076444 A JP2011076444 A JP 2011076444A JP 2011076444 A JP2011076444 A JP 2011076444A JP 2015039071 A JP2015039071 A JP 2015039071A
Authority
JP
Japan
Prior art keywords
voice
channel
zapping
voice recognition
voice instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011076444A
Other languages
English (en)
Inventor
五十嵐 義浩
Yoshihiro Igarashi
義浩 五十嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011076444A priority Critical patent/JP2015039071A/ja
Publication of JP2015039071A publication Critical patent/JP2015039071A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】ユーザに対してより好適なザッピング機能を提供可能な音声認識操作装置及び音声認識操作方法を提供することを主たる目的とする。
【解決手段】音声認識された音声指示がザッピングの開始要求である場合(ステップ12)、デジタルテレビジョン放送受信装置12で受信されるチャンネルの切り替えを行なう操作信号を所定時間間隔毎に送信する(ステップ13〜16)。そして、当該ザッピング中での前記ザッピングの開始要求とは異なる音声指示に応じて、前記所定時間間隔を変更して前記チャンネルの切り替えを行う操作信号を送信する(ステップ18)。
【選択図】 図6

Description

この発明の実施の形態は、音声指示を認識して電子機器を操作する音声認識操作装置及び音声認識操作方法に関する。
ユーザのキー操作に対応した操作信号を送信して、電子機器を遠隔操作する従前のリモートコントローラに代わり、ユーザの音声指示を認識し、その音声指示に対応した操作信号を送信して電子機器を遠隔操作する、音声認識機能を備えた遠隔操作機器が開発されてきている。
このような音声認識機能を備えた遠隔操作機器は、従前のリモートコントローラのように多数のキーの中から所望のキーを選択して操作するといった煩雑な作業が不要となる反面、周囲の雑音を認識して誤動作することがあるという不都合な面も持ち合わせており、実用化に向けて種々の点で改良の余地が多々残されている。
特開2000−148682号公報 特開2006−320004号公報
テレビ視聴時において、ユーザはザッピングを行なうことがある。ザッピングは、テレビ視聴において、リモコンでチャンネルを頻繁に切り替えながら視聴する行為といわれている。
しかしながら、音声認識機能を備えた遠隔装置を用いてこのようなザッピングを行なうことについてはこれまで十分な検討がなされていなかった。
そこで本発明の実施形態では、ユーザに対してより好適なザッピング機能を提供可能な音声認識操作装置及び音声認識操作方法を提供することを主たる目的とする。
実施形態の音声認識操作装置は、受信したチャンネルに応じた映像を表示する受信装置を操作する音声認識操作装置であって、音声指示を認識し、当該音声指示に対応する操作信号を送信する送信手段を備え、前記送信手段は、音声認識された音声指示がザッピングの開始要求である場合、前記受信装置で受信するチャンネルの切り替えを行なう操作信号を所定時間間隔毎に送信し、当該ザッピング中での前記ザッピングの開始要求とは異なる音声指示に応じて、前記所定時間間隔を変更して前記チャンネルの切り替えを行う操作信号を送信する。
実施の形態における音声認識遠隔操作システムの一例を説明するための図である。 同実施の形態における音声認識遠隔操作システムを構成する遠隔操作機器を説明するための外観図である。 同実施の形態における遠隔操作機器の信号処理系の一例を説明するためのブロック構成図である。 同実施の形態における音声認識遠隔操作システムを構成するデジタルテレビジョン放送受信装置の信号処理系の一例を説明するためのブロック構成図である。 同実施の形態における遠隔操作機器が行なう処理動作の一例を説明するためのフローチャートである。 同実施の形態における遠隔操作機器が行なう処理動作の一例を説明するためのフローチャートである。
以下、実施の形態について図面を参照して詳細に説明する。図1は、この実施の形態で説明する音声認識遠隔操作システムの一例を示している。この音声認識遠隔操作システムは、ユーザUSが、音声認識機能を備えた遠隔操作機器11を用いて、デジタルテレビジョン放送受信装置12を制御する構成となっている。
すなわち、ユーザUSが音声指示を発生すると、その音声指示を遠隔操作機器11が認識する。そして、遠隔操作機器11は、認識した音声指示に対応する操作信号を生成し、例えば赤外線や電波等を伝送媒体としてデジタルテレビジョン放送受信装置12に無線送信する。
このため、デジタルテレビジョン放送受信装置12では、遠隔操作機器11が送信する操作信号を受信し、その操作内容に対応した状態に各部を制御する。これにより、ユーザUSの音声指示によって、被制御機器であるデジタルテレビジョン放送受信装置12を遠隔操作することができるようになる。
上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の状態として、拍手検出モードに設定されている。この拍手検出モードでは、遠隔操作機器11は、ユーザUSが予め設定された回数(例えば2回)以上の拍手を連続的に行なったことを音声認識により検出している。
そして、拍手検出モードに設定された状態において、予め設定された回数以上の連続的な拍手音を検出すると、遠隔操作機器11は、キーワード検出モードに設定される。キーワード検出モードにおいて、遠隔操作機器11は、予め設定された特定のキーワード(例えば「テレビ」等)のみを対象とした音声認識を行なっており、ユーザUSが特定のキーワードを言ったことを音声認識により検出している。
このように、キーワード検出モードに設定された状態において、特定のキーワードを検出すると、遠隔操作機器11は、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。その後、遠隔操作機器11は、ユーザUSからのデジタルテレビジョン放送受信装置12に対する各種の音声指示を認識する音声指示認識モードに設定される。
音声指示認識モードに設定された状態において、ユーザUSが音声指示を発生すると、遠隔操作機器11は、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信する。これにより、デジタルテレビジョン放送受信装置12が、ユーザUSの音声指示により遠隔操作されることになる。
このようにして、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信すると、遠隔操作機器11は、再び拍手検出モードに設定されて、ユーザUSによる次の拍手を検出すべく待機状態となる。待機状態では、拍手を検出するのに必要最小限の回路構成のみが動作していることが、低消費電力の観点から好ましい。
遠隔操作機器11では、ユーザUSが予め設定された回数以上の連続的な拍手を行ない、続いて、ユーザUSが予め設定された特定のキーワードを言うことで、デジタルテレビジョン放送受信装置12に対するユーザUSの音声指示を認識するように構成されている。つまり、この例では第1の認識段階(連続的な拍手を検出する段階)とそれに続く第2の認識段階(特定のキーワードを検出する段階)を経ることで、デジタルテレビジョン放送受信装置12に対する音声指示を認識するように制御されている。このため、周囲の雑音に影響されることなくユーザUSの音声指示を極力正確に認識することができるようになり、ひいてはデジタルテレビジョン放送受信装置12をユーザUSの所望する通りに正しく制御することが可能となる。
また、上記した遠隔操作機器11では、予め設定された回数以上の連続的な拍手音を検出し、続いて、予め設定された特定のキーワードを検出した状態で、デジタルテレビジョン放送受信装置12の音声をミュート状態にするようにしている。このため、ユーザUSの発生する音声指示を、デジタルテレビジョン放送受信装置12の発生する音声に妨害されることなく、正確に認識することができるようになる。
なお、デジタルテレビジョン放送受信装置12の音声をミュート状態にする際には、音声を完全に消音状態、つまり、100%ミュート状態にするだけでなく、必要に応じて、例えば音量を現在の音量の半分にする、いわゆる、50%ミュート状態にすることも可能である。つまり、音声ミュートとは、音量を現在の音量よりも低くするという意味を含むものとする。このように、遠隔操作機器11はデジタルテレビジョン放送受信装置12がミュート状態となる操作信号を送信する。
また、ユーザUSの発生する音声指示が認識され、その音声指示に対応して送信された操作信号に基づいて、デジタルテレビジョン放送受信装置12が新たな状態に制御されたときには、デジタルテレビジョン放送受信装置12は、その音声ミュート状態を自動的に解除するようになっている。
ただし、デジタルテレビジョン放送受信装置12が音声ミュート状態を自動的に解除する機能を持っていない場合には、遠隔操作機器11が、デジタルテレビジョン放送受信装置12に対して、音声ミュート状態を解除することを指示する操作信号を送信してもよい。
この場合、遠隔操作機器11としては、例えば以下2通りの動作を取り得る。1つ目は、ユーザUSの音声指示を認識した場合、音声ミュートを解除する操作信号をデジタルテレビジョン放送受信装置12に送信し、次に音声指示に対応した操作信号を送信し、その後拍手検出モードに移行する動作である。2つ目は、ユーザUSの音声指示を認識した場合、音声指示に対応した操作信号を送信し、次に音声ミュートを解除
する操作信号を送信し、その後拍手検出モードに移行する動作である。
なお、音声ミュートを解除する操作信号を送信する処理と、音声指示に対応した操作信号を送信する処理とは、時間的にほぼ同時に行なうことが可能であり、また、これらの2つの処理は、拍手検出モードに移行する前または後のいずれの時点で行なわれても良いものである。
さらに、上記した遠隔操作機器11では、拍手検出モードにおいて、例えばボールのバウンド音やドアのノック音等を拍手音と誤認識したとしても、その後のキーワード検出モードで特定のキーワードが検出されない限り、音声指示認識モードにならないので、誤操作の発生を極力防止することができる。
また、予め設定された回数以上の連続的な拍手音が検出されたという条件の元に、特定のキーワードを検出するようにしているので、特定のキーワードとしても特別に変わったフレーズ(例えば日常的に用いられない言葉等)を用いる必要は必ずしもなく、例えば「テレビ」等の日常的に使用され易い簡単な言葉でも誤操作防止効果が期待できるため、ユーザUSが言い易いキーワードを設定することができるという利点もある。
図2(a)は、上記遠隔操作機器11の外観を示している。この遠隔操作機器11は、ほぼ薄型の円柱形状に形成された2つの筐体13,14を、同心円状に重ね合わせるように構成されている。この遠隔操作機器11は、その一方の筐体14の底面に複数(図では2つしか見えない)の脚部14aが突設されており、例えばテーブル等の水平台上に載置して使用される。
また、この筐体14には、その側面にマイクロホン15が設置されている。さらに、他方の筐体13には、その側面に一対の赤外線LED(light emitting diode)16a,16bが設置されている。そして、この遠隔操作機器11は、マイクロホン15で拍手、キーワード及び音声指示等の音声情報を採集し、一対の赤外線LED16a,16bから操作情報を無線送信している。
さらに、この遠隔操作機器11は、2つの筐体13,14が、その軸心を中心として相互に回動自在となるように構成されている。すなわち、筐体14に対して、図2(b)に示すように筐体13を右方向に回動させることや、図2(c)に示すように筐体13を左方向に回動させることができる。
これにより、遠隔操作機器11は、マイクロホン15をユーザUSのいる方向に向け、一対の赤外線LED16a,16bデジタルテレビジョン放送受信装置12のある方向に向けるというように、それぞれの位置に合わせて細かい調整を行なうことが可能となっている。
図3は、上記遠隔操作機器11の信号処理系の一例を示している。すなわち、上記マイクロホン15で採集された音声情報は、音声信号として音声認識用LSI(large scale integration)17に供給される。この音声認識用LSI17は、入力された音声信号をA/D(analog/digital)変換モジュール18でデジタル化し、音声認識処理モジュール19に供給する。なお、遠隔操作機器11は各種の動作(音声認識動作、操作信号の送信動作など)を統括的に制御する制御モジュールを遠隔操作機器11の内部であって、音声認識用LSI17内部あるいは外部に備えていてもよい。
この音声認識処理モジュール19は、入力されたデジタルの音声信号を音声認識し、入力音声信号がユーザUSの発生した音声指示である場合、その音声指示に対応した操作信号を出力する。そして、この音声認識処理モジュール19から出力された操作信号は、上記した一対の赤外線LED16a,16bで構成される赤外線発光モジュール16により赤外線を伝送媒体として送信され、デジタルテレビジョン放送受信装置12に受信されることになる。なお、赤外線に限らず、RF信号を送信してデジタルテレビジョン放送受信装置12を操作するよう構成してもよい。このように遠隔操作機器11は、音声認識された音声指示に対応した操作信号を出力する手段を備える。
音声認識処理モジュール19は、メモリ20を利用している。すなわち、このメモリ20には、デジタルテレビジョン放送受信装置12に対する各種の音声指示と、それらの音声指示に対する符号化された操作コードとを対応させた音声指示操作コード対応テーブルが格納されている。
そして、音声認識処理モジュール19は、入力されたデジタルの音声信号を音声認識した結果、入力音声信号がユーザUSの発生した音声指示であると判断した場合、その音声指示に対応した操作コードを音声指示操作コード対応テーブルから検索し、検索した操作コードを操作信号として赤外線発光モジュール16に出力する。
また、この音声認識処理モジュール19は、拍手検出モジュール21a、キーワード検出モジュール21b及び音声ミュート処理部21cを含んでいる。このうち、拍手検出モジュール21aは、予め設定された回数以上の連続的な拍手が行なわれたことを検出するものである。この場合、拍手は音のインパルスとして捉えられ、拍手検出モジュール21aは、そのインパルスの発生回数を検出する動作を行なえればよいため、構成が簡易で電力消費量も僅かな回路で実現することができる。
このため、上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の拍手検出モードでは、主としてA/D変換モジュール18及び拍手検出モジュール21aに電源電力を供給し、拍手検出モジュール21a以外の音声認識処理モジュール19には電源電力を供給せず、電力消費量を低く抑えるようにしている。
すなわち、拍手検出モードでは、主としてA/D変換モジュール18及び拍手検出モジュール21aが駆動状態となり、拍手検出モジュール21a以外の音声認識処理モジュール19は非駆動(スリープ)状態となっている。このため、遠隔操作機器11が電池の電力で駆動される場合、電池電力の延命を図ることができる。
そして、拍手検出モジュール21aは、予め設定された回数以上の連続的な拍手音を検出した場合、音声認識処理モジュール19の全体に電源電力を供給する。すなわち、音声認識処理モジュール19全体が駆動状態となる。これにより、音声認識処理モジュール19は、以後、ユーザUSの発生する特定のキーワードや音声指示等を音声認識することができるようになる。
また、上記キーワード検出モジュール21bは、先に述べたキーワード検出モードにおいて、予め設定された特定のキーワードのみを対象とした音声認識を行なっており、ユーザUSがその特定のキーワードを言ったことを音声認識により検出している。
さらに、上記音声ミュート処理部21cは、キーワード検出モードで特定のキーワードが検出される場合、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。
なお、拍手検出モジュール21aとキーワード検出モジュール21bとは、別々に構成しても良いが、1つの音声検出モジュールの中に、拍手検出機能とキーワード検出機能とが共に含まれる構成とするようにしても良いものである。
また、音声認識処理モジュール19には、操作モジュール22が接続されている。この操作モジュール22は、電源スイッチや、ユーザUSが遠隔操作機器11に対して各種の設定等を行なうための複数の操作子を含んでいる。そして、音声認識処理モジュール19は、操作モジュール22から得られた操作信号に基づいて、その操作内容が反映されるように各部を制御している。
さらに、上記音声認識処理モジュール19には、音声発生モジュール23が接続されている。このため、音声認識処理モジュール19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、音声発生モジュール23を用いて音によりユーザUSに通知することができる。
また、この音声認識処理モジュール19には、ディスプレイ24が接続されている。これにより、音声認識処理モジュール19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、ディスプレイ24を用いて光を点滅させる等の手法によりユーザUSに通知することができる。
図4は、被制御機器の一例である上記デジタルテレビジョン放送受信装置12の信号処理系の概略を示している。すなわち、アンテナ25で受信したデジタルテレビジョン放送信号は、入力端子26を介してチューナー27に供給されることにより、所望のチャンネルの放送信号が選局される。
このチューナー27で選局された放送信号は、復調・復号モジュール28に供給されてデジタルの映像信号及び音声信号等に復元された後、信号処理モジュール29に出力される。この信号処理モジュール29は、復調・復号モジュール28から供給されたデジタルの映像信号及び音声信号に対してそれぞれ所定のデジタル信号処理を施している。
そして、この信号処理モジュール29は、デジタルの映像信号を合成処理モジュール30に出力し、デジタルの音声信号を音声処理モジュール31に出力している。このうち、合成処理モジュール30は、信号処理部29から供給されるデジタルの映像信号に、OSD(on screen display)信号を重畳して映像処理モジュール32に出力している。
この映像処理モジュール32は、入力されたデジタルの映像信号を、後段の、例えば液晶表示パネル等を有する平面型のディスプレイ33で表示可能なフォーマットに変換している。そして、この映像処理モジュール32から出力された映像信号が、ディスプレイ33に供給されて映像表示に供される。
また、上記音声処理モジュール31は、入力されたデジタルの音声信号を、後段のスピーカ34で再生可能なフォーマットのアナログ音声信号に変換している。そして、この音声処理モジュール31から出力されたアナログ音声信号が、スピーカ34に供給されることにより音声再生に供される。
ここで、このデジタルテレビジョン放送受信装置12は、上記した各種の受信動作を含むその全ての動作を制御モジュール35によって統括的に制御されている。この制御モジュール35は、CPU(central processing unit)35aを内蔵しており、デジタルテレビジョン放送受信装置12の本体に設置された操作モジュール36(例えば、本体筺体の側面等に設けられた操作スイッチ)からの操作信号を受けて、または、上記遠隔操作機器11から送出され受信モジュール37で受信した操作信号を受けて、その操作内容が反映されるように各部をそれぞれ制御している。
この場合、制御モジュール35は、メモリ35bを利用している。このメモリ35bは、主として、CPU35aが実行する制御プログラムを格納したROM(read only memory)と、該CPU35aに作業エリアを提供するためのRAM(random access memory)と、各種の設定情報及び制御情報等が格納される不揮発性メモリとを有している。
また、この制御モジュール35には、HDD(hard disk drive)38が接続されている。この制御モジュール35は、ユーザによる操作モジュール36や遠隔操作機器11等の操作に基づいて、上記復調・復号モジュール28から得られるデジタルの映像信号及び音声信号を、記録再生処理部39によって暗号化し所定の記録フォーマットに変換した後、HDD38に供給してハードディスク38aに記録させるように制御することができる。
さらに、この制御モジュール35は、ユーザによる操作モジュール36や遠隔操作機器11等の操作に基づいて、HDD38によりハードディスク38aからデジタルの映像信号及び音声信号を読み出させ、上記記録再生処理部39によって復号化した後、信号処理モジュール29に供給することによって、以後、上記した映像表示及び音声再生に供させるように制御することができる。
また、上記デジタルテレビジョン放送受信装置12には、入力端子40が接続されている。この入力端子40は、デジタルテレビジョン放送受信装置12の外部からデジタルの映像信号及び音声信号を直接入力するためのものである。この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作モジュール36や遠隔操作機器11等の操作に対応した制御モジュール35の制御に基づいて、記録再生処理部39を介した後、信号処理部29に供給されて、以後、上記した映像表示及び音声再生に供される。
さらに、この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作モジュール36や遠隔操作機器11等の操作に対応した制御モジュール35の制御に基づいて、記録再生処理部39を介した後、HDD38に対しての記録再生に供される。
また、上記制御モジュール35は、ネットワークインターフェース41を介して外部のネットワーク42に接続されている。このため、制御モジュール35は、ユーザによる操作モジュール36や遠隔操作機器11等の操作に基づいて、ネットワーク42上の複数のネットワークサーバに選択的にアクセスすることにより、そこで提供している各種のサービスを利用することができるようになっている。
図5は、上記遠隔操作機器11が行なう主要な処理動作の一例をまとめたフローチャートを示している。この処理動作は、遠隔操作機器11が拍手検出モード、つまり、主としてA/D変換モジュール18及び拍手検出モジュール21aが駆動状態となり、拍手検出モジュール21a以外の音声認識処理モジュール19が非駆動(スリープ)状態となっている設定で開始(ステップS1)される。
すると、遠隔操作機器11は、ステップS2で、拍手検出モジュール21aにより予め設定された回数以上の連続的な拍手音が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS3で、音声認識処理モジュール19の全体に電源電力を供給して、音声認識処理モジュール19全体が駆動状態となるよう制御される。
その後、遠隔操作機器11は、ステップS4で、拍手検出モードから特定のキーワードのみを対象として音声認識を行なうキーワード検出モードに切り替えられ、ステップS5で、特定のキーワードが入力されるのを待つ、いわゆる、キーワード待ち状態であることをユーザUSに通知する。
このキーワード待ち状態をユーザUSに通知する手段としては、音声発生モジュール23により「ピ、ピ、ピ」といったアラーム音を発生させる手法や、音声発生モジュール23に「キーワード待ちです」のような音声によるメッセージを発生させる手法等を用いることができる。また、ディスプレイ24により光を点滅させる手法や、ディスプレイ24に「キーワード待ちです」のような文字によるメッセージを表示させる手法等を用いることができる。
さらに、キーワード待ち状態をユーザUSに通知する手段としては、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、そのスピーカ34からアラーム音や音声によるメッセージを発生させる操作信号を送信する手法も考えられる。また、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、そのディスプレイ33に文字によるメッセージを表示させる操作信号を送信する手法も考えられる。
このように、遠隔操作機器11が自己の音声発生モジュール23やディスプレイ24等を用いてキーワード待ち状態であることを通知するようにしても良いし、被制御機器(この場合、デジタルテレビジョン放送受信装置12)のディスプレイ33やスピーカ34等を用いてキーワード待ち状態であることを通知するようにしても良いものである。
そして、遠隔操作機器11は、ステップS6で、特定のキーワードが検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS7で、デジタルテレビジョン放送受信装置12に対して音声をミュート状態にさせる操作信号を送信し、ステップS8で、音声指示が入力されるのを待つ状態となる。
その後、遠隔操作機器11は、ステップS9で、音声指示が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS10で、その検出された音声指示に対応した操作信号を送信し、ステップS11で、拍手検出モード、つまり、主としてA/D変換モジュール18及び拍手検出モジュール21aが駆動状態で、拍手検出モジュール21a以外の音声認識処理部19が非駆動(スリープ)状態になっているモードに設定し、処理を終了(ステップS12)する。
なお、予め設定された回数以上の連続的な拍手音が検出された時点から、予め設定された所定時間内に特定のキーワードが検出されなかった場合、または、特定のキーワードが検出された時点から、予め設定された所定時間内にユーザUSの音声指示が検出されなかった場合には、自動的に拍手検出モードに戻るようにしている。これにより、無駄な電力消費を抑えることができる。
次に、上記した遠隔操作機器11を用いてデジタルテレビジョン放送受信装置12を操作する一使用形態について説明する。すなわち、デジタルテレビジョン放送受信装置12によってデジタルテレビジョン放送番組を視聴する際、ユーザUSが、視聴可能な複数のチャンネルを頻繁に切り替えて視聴する、いわゆる、ザッピングと称される行為をよく行なうことが知られている。
図6は、上記遠隔操作機器11を用いてデジタルテレビジョン放送受信装置12のザッピングを行う主要な処理動作の一例を示すフローチャートである。
遠隔操作機器11を用いてザッピングを行なう場合、ユーザUSは、ザッピングの開始要求を示す音声指示(例えば「ザッピング・アップ」なる音声指示)を発し、これに応じて音声認識処理モジュール19は当該ザッピングの開始の音声指示を認識する(ステップ12)。すると、遠隔操作機器11は、例えば視聴可能な複数のチャンネルを選局する(切り替える)ための操作信号を、視聴中のチャンネル番号から最大チャンネルに向けて、赤外線発光モジュール16を介して数秒毎に順次自動的に送信する。より詳細には例えば以下のとおりである。つまり、ザッピングの開始要求があった場合、チャンネル切り替えの操作信号を送信する(ステップ13)。これにより、例えばチャンネル1からチャンネル2に切り替わる。
次に、チャンネル切り替え時間のタイマーがクリアされ(ステップ14)、一定時間(例えば数秒間)当該チャンネル(上記例ではチャンネル2)がデジタルテレビジョン放送受信装置12にて表示される。チャンネル切り替え時間のタイマーは、ザッピングするタイミングを計測する。
更なる音声指示がなかった場合(ステップ15のNo)、タイマーを用いてチャンネル切り替えのタイミングが計測され、チャンネル切り替えの時間になった場合(ステップ16のYes)チャンネル切り替えの操作信号を送信する(ステップ13)。上記例であれば、チャンネル2からチャンネル3へと切り替わる。チャンネル切り替えの時間でなければ(ステップ16のNo)、ステップ15へとループする。
以上のように、ステップ13〜16の一連の処理により、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルから最大チャンネルの方向に、数秒毎に切り替えて順次視聴することができる。
また、ユーザUSが例えば「ザッピング・アップ」なる音声指示を発した場合、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、最小チャンネル(例えばチャンネル1)からチャンネル番号の最大チャンネル(例えばチャンネル100)に向けて、数秒毎に順次自動的に送信するようにすることも可能である。これにより、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルからチャンネル番号の最大チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
逆に、ユーザUSが「ザッピング・ダウン」なる音声指示を発したときには、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に順次自動的に送信する。これにより、視聴可能な複数のチャンネルの放送番組を、チャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。なお、現在選択しているチャンネルからチャンネル番号の少ないチャンネルの方向に、数秒毎に順次自動的に操作信号を送信するようにすることも可能である。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態(自動ザッピングの状態)で、チャンネル切り替えの時間間隔を変更する指示があった場合(ステップ17のYes)には、音声処理認識モジュール19は当該音声指示を認識し、チャンネル切り替えの時間間隔が変更されるよう制御してチャンネル切り替えの操作信号を送信する(ステップ18)。つまり、チャンネル切り替えの時間間隔が変更され、ザッピングの停止要求がなければ(ステップ19のNo)、変更された時間間隔でタイマーを用いてチャンネル切り替えのタイミングが計測され、変更された時間間隔でチャンネル切り替えの操作信号が送信される(ステップ16→ステップ13→ステップ14→ステップ15→ステップ16)。
チャンネル切り替えの時間間隔を変更する指示は例えば以下のような指示である。例えば、自動ザッピングの状態でユーザUSが「速く」という指示を発した場合には、音声認識処理モジュール19は、次のチャンネルに切り替えるための操作信号を通常(数秒間)よりも短い間隔(例えば通常の1/2倍の間隔等)で送信するよう制御し、結果として自動ザッピングにおけるチャンネルの切り替え間隔を短くすることができる。逆に、自動ザッピングの状態でユーザUSが例えば「遅く」なる音声指示を発した場合には、音声認識処理モジュール19は、次のチャンネルに切り替えるための操作信号を、通常(数秒間)よりも長い間隔(例えば通常の2倍の間隔等)で送信し、結果として自動ザッピングにおけるチャンネルの切り替え間隔を長くすることもできる。
そして、ユーザUSが例えばザッピングの停止要求(例えば「「ストップ」または「このチャンネル」といった音声指示)を発した場合(ステップ19のYes)には、音声認識処理モジュール19は当該音声指示を認識し、その音声指示以降、自動的にチャンネルを切り替える処理を停止するよう操作信号を送信し、結果として自動ザッピングが終了する(ステップ20)。これにより、ユーザUSは、音声指示により指定したチャンネルの放送番組を連続して視聴することができるようになる。なお、自動ザッピング中にチャンネル切り替えの時間間隔を変更する指示がなく(ステップ17のNo)、その後ザッピングの停止要求があった場合(ステップ19のYes)にはザッピングが終了するよう遠隔操作機器11が制御される(ステップ20)。
また、自動ザッピングの状態で、ユーザUSが例えば「ネクスト」なる音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを、数秒間待つことなく、次のチャンネルに切り替えるための操作信号を直ちに送信するよう音声認識処理モジュール19が構成されていてもよい。
また、自動ザッピングの状態で、ユーザUSが例えば「もう少し」または「延長」といった音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを数秒間で切り替えず、さらに数秒間待ってから、次のチャンネルに切り替えるための操作信号を送信するよう音声認識処理モジュール19が構成されていてもよい。
また、自動ザッピングの状態で、ユーザUSが例えば「次、次、次」のように音声指示を連続して発した場合には、遠隔操作機器11は、チャンネルを次のチャンネルに切り替えるための操作信号を、音声指示された「次」の回数だけ即座に送信するよう音声認識処理モジュール19が構成されていてもよい。これにより、ユーザUSが「次」といった数だけチャンネルを飛ばすこともできる。
ここで、遠隔操作機器11は、ユーザUSの音声指示により、数秒毎に自動的にチャンネルを切り替える処理を開始する際に、これからザッピングを開始することを、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、デジタルテレビジョン放送受信装置12の画面に「ザッピング中」というメッセージを表示させたり、デジタルテレビジョン放送受信装置12の図示しないインジケータ(LED等)を点灯または点滅させたりすることができる。これにより、ユーザUSは、遠隔操作機器11がザッピングの自動処理を現在実施していることを、視覚的に知ることができる。
なお、「ザッピング中」であるというメッセージは、デジタルテレビジョン放送受信装置12の画面やインジケータに表示させるだけでなく、遠隔操作機器11のディスプレイ24により光を点滅させる手法や、ディスプレイ24に「ザッピング中」のような文字によるメッセージを表示させる手法等を用いることができる。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、遠隔操作機器11が、チャンネルの切り替えられた時点から1秒経過する毎に時間情報を、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、あと何秒で次のチャンネルに自動的に切り替わるのかを、デジタルテレビジョン放送受信装置12の画面に秒数でカウントダウン表示することができる。
なお、次のチャンネルに自動的に切り替わるまでの時間のカウントダウン表示は、デジタルテレビジョン放送受信装置12の画面に表示させるだけでなく、スピーカ34からアラーム音によってユーザUSに通知するようにしても良いものである。また、遠隔操作機器11の音声発生モジュール23によりアラーム音でユーザUSに通知することもできる。
ここで、ザッピングにより数秒毎に自動的にチャンネルを切り替える際、視聴可能な全てのチャンネルをチャンネル切り替えの対象としてもよい。この場合、ユーザUSが「ザッピング・アップ」または「ザッピング・ダウン」なる音声指示を発すると、遠隔操作機器11は、視聴可能な全てのチャンネルを選局するための操作信号を数秒毎に順次自動的に送信し、視聴可能な全てのチャンネルの放送番組を1つ1つ順番に視聴することができる。
ところで、視聴可能なチャンネルの数は、数100を越えることがある。この場合、視聴可能な全てのチャンネルを切り替えの対象とすることは現実的でないと思われる。このため、ユーザUSが予めお好みのチャンネルをデジタルテレビジョン放送受信装置12に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることが考えられている。
この場合、ユーザUSは、例えば「お好み・アップ」または「お好み・ダウン」といった音声指示を発する。すると、遠隔操作機器11は、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を数秒毎に順次自動的に送信する。そして、デジタルテレビジョン放送受信装置12では、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を受信する毎に、自己に登録されたチャンネルのみを順次アップまたはダウン選局する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
また、ユーザUSが予めお好みのチャンネルのチャンネル番号を遠隔操作機器11に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることも考えられる。つまり、遠隔操作機器11は、ザッピングにてチャンネルの切り替えを行なう対象のチャンネルを予め設定する設定手段を備えておいてもよい。この場合、ユーザUSが「お好み・アップ」または「お好み・ダウン」といった音声指示を発すると、遠隔操作機器11は、自己に登録されたお好みチャンネルのチャンネル番号(例えば“1”→“5”→“8”)を送信する。そして、数秒後に、次のお好みチャンネルのチャンネル番号(例えば“3”→“6”→“4”)を送信する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
さらに、ユーザUSが、ザッピング時に切り替え対象となるチャンネルの数を設定することができるようにしておいても良いものである。このようにすれば、例えばユーザUSが「ザッピング・アップ」なる音声指示を発すると、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最小チャンネルから最大チャンネルに向けて数秒毎に順次自動的に送信するが、予め設定された数だけチャンネルを切り替えると自動的にザッピングを停止するようになる。
ここで、上記した実施の形態では、被制御機器としてデジタルテレビジョン放送受信装置12を例に説明したが、被制御機器としては、デジタルテレビジョン放送受信装置12に限るものではなく、例えばSTB(set top box)や音声再生機能を有するAV(audio visual)機器等に広く適用することが可能である。
なお、この発明は上記した実施の形態や図面そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。例えば、音声認識LSI17と別に音声認識LSIを制御するLSIが設けられていても良いし、音声認識LSIの内部的に上記実施形態で説明した一連の音声認識処理を統括的に制御する制御モジュールを備えていてもよい。また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係る構成要素を適宜組み合わせても良いものである。
11…遠隔操作機器、12…デジタルテレビジョン放送受信装置、13,14…筐体、14a…脚部、15…マイクロホン、16…赤外線発光モジュール、16a,16b…赤外線LED、17…音声認識用LSI、18…A/D変換モジュール、19…音声認識処理モジュール、20…メモリ、21a…拍手検出モジュール、21b…キーワード検出モジュール、21c…音声ミュート処理モジュール、22…操作モジュール、23…音声発生モジュール、24…ディスプレイ、25…アンテナ、26…入力端子、27…チューナー、28…復調・復号モジュール、29…信号処理モジュール、30…合成処理モジュール、31…音声処理モジュール、32…映像処理モジュール、33…ディスプレイ、34…スピーカ、35…制御モジュール、35a…CPU、35b…メモリ、36…操作モジュール、37…受信モジュール、38…HDD、39…記録再生処理モジュール、40…入力端子、41…ネットワークインターフェース、42…ネットワーク、US…ユーザ。
実施形態の音声認識操作装置は、受信したチャンネルに応じた映像を表示する映像受信装置を操作する音声認識操作装置であって、音声指示を認識し、この認識された音声指示に対応する操作信号を前記映像受信装置に送信する送信手段を備え、前記送信手段は、前記認識された音声指示がザッピングの開始要求を含む場合、前記受信したチャンネルの切り替えを行なう第1の操作信号を所定時間間隔毎に前記映像受信装置に送信し、さらに、前記送信手段は、ザッピング中前記ザッピングの開始要求とは異なる音声指示を認識した場合、この認識された異なる音声指示に従って前記所定時間間隔を変更して前記第1の操作信号を前記映像受信装置に送信する。
実施形態の音声認識操作装置は、受信したチャンネルに応じた映像を表示する映像受信装置を操作する音声認識操作装置であって、音声指示を認識し、この認識された音声指示に対応する操作信号を前記映像受信装置に送信する送信手段を備え、前記送信手段は、前記認識された音声指示がザッピングの開始要求を含む場合、前記受信したチャンネルの切り替えを行なう第1の操作信号を所定の時間間隔毎に前記映像受信装置に送信し、さらに、前記送信手段は、ザッピング中に前記ザッピングの開始要求とは異なる音声指示を認識した場合、この認識された異なる音声指示に従って前記所定の時間間隔を変更して前記第1の操作信号を前記映像受信装置に送信し、また、前記送信手段は、拍手音を検出する拍手検出モードにおいて所定回数以上の連続的な拍手音を検出した場合に、発声された特定のキーワードを検出するキーワード検出モードに移行し、さらに前記特定のキーワードが検出された場合に前記音声指示を認識する音声指示認識モードに移行する。

Claims (6)

  1. 受信したチャンネルに応じた映像を表示する受信装置を操作する音声認識操作装置であって、
    音声指示を認識し、当該音声指示に対応する操作信号を送信する送信手段を備え、
    前記送信手段は、音声認識された音声指示がザッピングの開始要求である場合、前記受信装置で受信するチャンネルの切り替えを行なう操作信号を所定時間間隔毎に送信し、
    当該ザッピング中での前記ザッピングの開始要求とは異なる音声指示に応じて、前記所定時間間隔を変更して前記チャンネルの切り替えを行う操作信号を送信することを特徴とする音声認識操作装置。
  2. 前記送信手段は、音声認識された音声指示がザッピングの停止要求である場合、前記チャンネルの切り替えを行なう操作信号の送信を停止することを特徴とする請求項1に記載の音声認識操作装置。
  3. 前記ザッピング中であることを通知する通知手段を具備する請求項1または請求項2に記載の音声認識操作装置。
  4. 前記受信装置の音声ミュートを指示する音声ミュート手段を備えることを特徴とする請求項1または請求項2に記載の音声認識操作装置。
  5. 前記ザッピングにてチャンネルの切り替えを行う対象のチャンネルを予め設定する設定手段を備えることを特徴とする請求項1または請求項2に記載の音声認識操作装置。
  6. 受信したチャンネルに応じた映像を表示する受信装置を操作する音声認識操作方法であって、
    音声手段により音声指示を認識し、当該音声指示に対応する操作信号を送信手段から送信し、
    前記音声認識された音声指示がザッピングの開始要求である場合、前記受信装置で受信されるチャンネルの切り替えを行なう操作信号を所定時間間隔毎に送信し、
    当該ザッピング中での前記ザッピングの開始要求とは異なる音声指示に応じて、前記所定時間間隔を変更して前記チャンネルの切り替えを行う操作信号を送信する音声認識操作方法。
JP2011076444A 2011-03-30 2011-03-30 音声認識操作装置及び音声認識操作方法 Pending JP2015039071A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011076444A JP2015039071A (ja) 2011-03-30 2011-03-30 音声認識操作装置及び音声認識操作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011076444A JP2015039071A (ja) 2011-03-30 2011-03-30 音声認識操作装置及び音声認識操作方法

Publications (1)

Publication Number Publication Date
JP2015039071A true JP2015039071A (ja) 2015-02-26

Family

ID=52631920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011076444A Pending JP2015039071A (ja) 2011-03-30 2011-03-30 音声認識操作装置及び音声認識操作方法

Country Status (1)

Country Link
JP (1) JP2015039071A (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07131727A (ja) * 1993-10-28 1995-05-19 Victor Co Of Japan Ltd テレビジョン受像機
JP2000184228A (ja) * 1998-12-11 2000-06-30 Aiwa Co Ltd 多チャネル放送受信装置
JP2001154692A (ja) * 1999-11-30 2001-06-08 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体
JP2002299071A (ja) * 2001-03-29 2002-10-11 Mitsubishi Electric Corp 照明制御システム装置
JP2006320004A (ja) * 2006-06-20 2006-11-24 Victor Co Of Japan Ltd Av装置の制御システム及び制御方法
JP2008134725A (ja) * 2006-11-27 2008-06-12 Sharp Corp コンテンツ再生装置
JP2009252238A (ja) * 2008-04-08 2009-10-29 Lg Electronics Inc 移動端末機及びそのメニュー制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07131727A (ja) * 1993-10-28 1995-05-19 Victor Co Of Japan Ltd テレビジョン受像機
JP2000184228A (ja) * 1998-12-11 2000-06-30 Aiwa Co Ltd 多チャネル放送受信装置
JP2001154692A (ja) * 1999-11-30 2001-06-08 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体
JP2002299071A (ja) * 2001-03-29 2002-10-11 Mitsubishi Electric Corp 照明制御システム装置
JP2006320004A (ja) * 2006-06-20 2006-11-24 Victor Co Of Japan Ltd Av装置の制御システム及び制御方法
JP2008134725A (ja) * 2006-11-27 2008-06-12 Sharp Corp コンテンツ再生装置
JP2009252238A (ja) * 2008-04-08 2009-10-29 Lg Electronics Inc 移動端末機及びそのメニュー制御方法

Similar Documents

Publication Publication Date Title
JP5039214B2 (ja) 音声認識操作装置及び音声認識操作方法
US8633808B2 (en) Systems, methods and apparatus for locating a lost remote control
US9257034B2 (en) Systems, methods and apparatus for providing an audio indicator via a remote control
US20090089675A1 (en) Method for providing graphical user interface and video apparatus using the same
KR20150146193A (ko) 디스플레이 장치 및 그의 동작 방법
WO2015062471A1 (zh) 机顶盒控制方法及装置
JP2012185861A (ja) 操作装置及び操作方法
US8621546B2 (en) Display-enabled remote device to facilitate temporary program changes
US20070171307A1 (en) Media playback system with real-time camera image display and method thereof
US20060264250A1 (en) Remote control system with a wireless earphone function and corresponding method
JP2015039071A (ja) 音声認識操作装置及び音声認識操作方法
US11343558B1 (en) Systems, methods, and media for providing an enhanced remote control that synchronizes with media content presentation
JP2007110391A (ja) 放送受信機
US20110309914A1 (en) Remote control system
JP2010028732A (ja) 電子機器
JP2008258748A (ja) 液晶テレビジョン、及びテレビジョン受信機
JP2007074056A (ja) テレビ受信システム及び携帯テレビ受信装置
JP6239847B2 (ja) テレビジョン受信機
JP2008076062A (ja) リモコン送信機付目覚まし時計及びavシステム
US20130076983A1 (en) Television system and method of watching television programs
KR100687921B1 (ko) 전자 장치
JP2014068073A (ja) 映像表示システム、表示装置、映像出力装置及びテレビジョン受信機
JP2010021798A (ja) 電子機器
KR20140130856A (ko) 멀티미디어 디바이스 및 그 제어 방법
JP4999599B2 (ja) リモートコントロール機能付き電子機器

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120710