JP2012173325A - 音声認識操作装置及び音声認識操作方法 - Google Patents

音声認識操作装置及び音声認識操作方法 Download PDF

Info

Publication number
JP2012173325A
JP2012173325A JP2011032151A JP2011032151A JP2012173325A JP 2012173325 A JP2012173325 A JP 2012173325A JP 2011032151 A JP2011032151 A JP 2011032151A JP 2011032151 A JP2011032151 A JP 2011032151A JP 2012173325 A JP2012173325 A JP 2012173325A
Authority
JP
Japan
Prior art keywords
keyword
voice
sound
voice recognition
operation device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011032151A
Other languages
English (en)
Other versions
JP5039214B2 (ja
Inventor
Yoshihiro Igarashi
義浩 五十嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011032151A priority Critical patent/JP5039214B2/ja
Priority to US13/238,883 priority patent/US20120215537A1/en
Publication of JP2012173325A publication Critical patent/JP2012173325A/ja
Application granted granted Critical
Publication of JP5039214B2 publication Critical patent/JP5039214B2/ja
Priority to US13/848,635 priority patent/US20130218562A1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4396Processing of audio elementary streams by muting the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Selective Calling Equipment (AREA)
  • Details Of Television Systems (AREA)

Abstract

【課題】周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供すること。
【解決手段】実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。
【選択図】 図5

Description

この発明の実施の形態は、音声指示を認識して被制御機器を操作する音声認識操作装置及び音声認識操作方法に関する。
周知のように、近年では、ユーザのキー操作に対応した操作信号を送信して、被制御機器を遠隔操作する従前のリモートコントローラに代わり、ユーザの音声指示を認識し、その音声指示に対応した操作信号を送信して被制御機器を遠隔操作する、音声認識機能を備えた遠隔操作機器が開発されてきている。
ところで、このような音声認識機能を備えた遠隔操作機器は、従前のリモートコントローラのように多数のキーの中から所望のキーを選択して操作するといった煩雑な作業が不要となる反面、周囲の雑音を認識して誤動作することがあるという不都合な面も持ち合わせており、実用化に向けて種々の点で改良の余地が多々残されている。
特開2000−148682号公報 特開2006−320004号公報
周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供することを目的とする。
実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。
実施の形態における音声認識遠隔操作システムの一例を説明するために示す図。 同実施の形態における音声認識遠隔操作システムを構成する遠隔操作機器を説明するために示す外観図。 同実施の形態における遠隔操作機器の信号処理系の一例を説明するために示すブロック構成図。 同実施の形態における音声認識遠隔操作システムを構成するデジタルテレビジョン放送受信装置の信号処理系の一例を説明するために示すブロック構成図。 同実施の形態における遠隔操作機器が行なう主要な処理動作の一例を説明するために示すフローチャート。
以下、実施の形態について図面を参照して詳細に説明する。図1は、この実施の形態で説明する音声認識遠隔操作システムの一例を示している。この音声認識遠隔操作システムは、ユーザUSが、音声認識機能を備えた遠隔操作機器11を用いて、被制御機器としてのデジタルテレビジョン放送受信装置12を制御する構成となっている。
すなわち、ユーザUSが音声指示を発生すると、その音声指示を遠隔操作機器11が認識する。そして、遠隔操作機器11は、認識した音声指示に対応する操作信号を生成し、例えば赤外線や電波等を伝送媒体としてデジタルテレビジョン放送受信装置12に無線送信する。
このため、デジタルテレビジョン放送受信装置12では、遠隔操作機器11が送信する操作信号を受信し、その操作内容に対応した状態に各部を制御する。これにより、ユーザUSの音声指示によって、被制御機器であるデジタルテレビジョン放送受信装置12を遠隔操作することができるようになる。
ここで、上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の状態として、拍手検出モードに設定されている。この拍手検出モードでは、遠隔操作機器11は、ユーザUSが予め設定された回数(例えば2回)以上の拍手を連続的に行なったことを音声認識により検出している。
そして、拍手検出モードに設定された状態において、予め設定された回数以上の連続的な拍手音を検出すると、遠隔操作機器11は、キーワード検出モードに設定される。このキーワード検出モードでは、遠隔操作機器11は、予め設定された特定のキーワード(例えば「テレビ」等)のみを対象とした音声認識を行なっており、ユーザUSが特定のキーワードを言ったことを音声認識により検出している。
このように、キーワード検出モードに設定された状態において、特定のキーワードを検出すると、遠隔操作機器11は、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。その後、遠隔操作機器11は、ユーザUSからのデジタルテレビジョン放送受信装置12に対する各種の音声指示を認識する音声指示認識モードに設定される。
そして、この音声指示認識モードに設定された状態において、ユーザUSが音声指示を発生すると、遠隔操作機器11は、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信する。これにより、デジタルテレビジョン放送受信装置12が、ユーザUSの音声指示により遠隔操作されることになる。
このようにして、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信すると、遠隔操作機器11は、再び拍手検出モードに設定されて、ユーザUSによる次の拍手を検出すべく待機状態となる。
上記した遠隔操作機器11では、ユーザUSが予め設定された回数以上の連続的な拍手を行ない、続いて、ユーザUSが予め設定された特定のキーワードを言った状態で、始めて、デジタルテレビジョン放送受信装置12に対するユーザUSの音声指示を認識するようにしている。このため、周囲の雑音に影響されることなくユーザUSの音声指示を極力正確に認識することができるようになり、ひいてはデジタルテレビジョン放送受信装置12をユーザUSの所望する通りに正しく制御することが可能となる。
また、上記した遠隔操作機器11では、予め設定された回数以上の連続的な拍手音を検出し、続いて、予め設定された特定のキーワードを検出した状態で、デジタルテレビジョン放送受信装置12の音声をミュート状態にするようにしている。このため、ユーザUSの発生する音声指示を、デジタルテレビジョン放送受信装置12の発生する音声に妨害されることなく、正確に認識することができるようになる。
なお、デジタルテレビジョン放送受信装置12の音声をミュート状態にする際には、音声を完全に消音状態、つまり、100%ミュート状態にするだけでなく、必要に応じて、例えば音量を現在の音量の半分にする、いわゆる、50%ミュート状態にすることも可能である。つまり、音声ミュートとは、音量を現在の音量よりも低くするという意味を含むものとする。
また、ユーザUSの発生する音声指示が認識され、その音声指示に対応して送信された操作信号に基づいて、デジタルテレビジョン放送受信装置12が新たな状態に制御されたときには、デジタルテレビジョン放送受信装置12は、その音声ミュート状態を自動的に解除するようになっている。
ただし、デジタルテレビジョン放送受信装置12が音声ミュート状態を自動的に解除する機能を持っていない場合には、遠隔操作機器11が、デジタルテレビジョン放送受信装置12に対して、音声ミュート状態を解除することを指示する操作信号を送信する必要がある。
この場合、遠隔操作機器11としては、2通りの動作を取り得る。1つ目は、ユーザUSの音声指示を認識したとき、音声ミュートを解除する操作信号を送信し、音声指示に対応した操作信号を送信し、拍手検出モードに移行する動作である。2つ目は、ユーザUSの音声指示を認識したとき、音声指示に対応した操作信号を送信し、音声ミュートを解除する操作信号を送信し、拍手検出モードに移行する動作である。
なお、音声ミュートを解除する操作信号を送信する処理と、音声指示に対応した操作信号を送信する処理とは、時間的にほぼ同時に行なうことが可能であり、また、これらの2つの処理は、拍手検出モードに移行する前または後のいずれの時点で行なわれても良いものである。
さらに、上記した遠隔操作機器11では、拍手検出モードにおいて、例えばボールのバウンド音やドアのノック音等を拍手音と誤認識したとしても、その後のキーワード検出モードで特定のキーワードが検出されない限り、音声指示認識モードにならないので、誤操作の発生を極力防止することができる。
また、予め設定された回数以上の連続的な拍手音が検出されたという条件の元に、特定のキーワードを検出するようにしているので、特定のキーワードとしても特別に変わったフレーズ(例えば日常的に用いられない言葉等)を用いる必要は必ずしもなく、例えば「テレビ」等の日常的に使用され易い簡単な言葉でも誤操作防止効果が期待できるため、ユーザUSが言い易いキーワードを設定することができるという利点もある。
図2(a)は、上記遠隔操作機器11の外観を示している。この遠隔操作機器11は、ほぼ薄型の円柱形状に形成された2つの筐体13,14を、同心円状に重ね合わせるように構成されている。この遠隔操作機器11は、その一方の筐体14の底面に複数(図では2つしか見えない)の脚部14aが突設されており、例えばテーブル等の水平台上に載置して使用される。
また、この筐体14には、その側面にマイクロホン15が設置されている。さらに、他方の筐体13には、その側面に一対の赤外線LED(light emitting diode)16a,16bが設置されている。そして、この遠隔操作機器11は、マイクロホン15で拍手、キーワード及び音声指示等の音声情報を採集し、一対の赤外線LED16a,16bから操作情報を無線送信している。
さらに、この遠隔操作機器11は、2つの筐体13,14が、その軸心を中心として相互に回動自在となるように構成されている。すなわち、筐体14に対して、図2(b)に示すように筐体13を右方向に回動させることや、図2(c)に示すように筐体13を左方向に回動させることができる。
これにより、遠隔操作機器11は、マイクロホン15をユーザUSのいる方向に向け、一対の赤外線LED16a,16bデジタルテレビジョン放送受信装置12のある方向に向けるというように、それぞれの位置に合わせて細かい調整を行なうことが可能となっている。
図3は、上記遠隔操作機器11の信号処理系の一例を示している。すなわち、上記マイクロホン15で採集された音声情報は、音声信号として音声認識用LSI(large scale integration)17に供給される。この音声認識用LSI17は、入力された音声信号をA/D(analog/digital)変換部18でデジタル化し、音声認識処理部19に供給する。
この音声認識処理部19は、入力されたデジタルの音声信号を音声認識し、入力音声信号がユーザUSの発生した音声指示である場合、その音声指示に対応した操作信号を出力する。そして、この音声認識処理部19から出力された操作信号は、上記した一対の赤外線LED16a,16bで構成される赤外線発光部16により赤外線を伝送媒体として送信され、デジタルテレビジョン放送受信装置12に受信されることになる。
この場合、音声認識処理部19は、メモリ部20を利用している。すなわち、このメモリ部20には、デジタルテレビジョン放送受信装置12に対する各種の音声指示と、それらの音声指示に対する符号化された操作コードとを対応させた音声指示操作コード対応テーブルが格納されている。
そして、音声認識処理部19は、入力されたデジタルの音声信号を音声認識した結果、入力音声信号がユーザUSの発生した音声指示であると判断した場合、その音声指示に対応した操作コードを音声指示操作コード対応テーブルから検索し、検索した操作コードを操作信号として赤外線発光部16に出力する。
また、この音声認識処理部19は、拍手検出部21a、キーワード検出部21b及び音声ミュート処理部21cを含んでいる。このうち、拍手検出部21aは、予め設定された回数以上の連続的な拍手が行なわれたことを検出するものである。この場合、拍手は音のインパルスとして捉えられ、拍手検出部21aは、そのインパルスの発生回数を検出する動作を行なえればよいため、構成が簡易で電力消費量も僅かな回路で実現することができる。
このため、上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の拍手検出モードでは、主としてA/D変換部18及び拍手検出部21aに電源電力を供給し、拍手検出部21a以外の音声認識処理部19には電源電力を供給せず、電力消費量を低く抑えるようにしている。
すなわち、拍手検出モードでは、主としてA/D変換部18及び拍手検出部21aが駆動状態となり、拍手検出部21a以外の音声認識処理部19は非駆動(スリープ)状態となっている。このため、遠隔操作機器11が電池の電力で駆動される場合、電池電力の延命を図ることができる。
そして、拍手検出部21aは、予め設定された回数以上の連続的な拍手音を検出した場合、音声認識処理部19の全体に電源電力を供給する。すなわち、音声認識処理部19全体が駆動状態となる。これにより、音声認識処理部19は、以後、ユーザUSの発生する特定のキーワードや音声指示等を音声認識することができるようになる。
また、上記キーワード検出部21bは、先に述べたキーワード検出モードにおいて、予め設定された特定のキーワードのみを対象とした音声認識を行なっており、ユーザUSがその特定のキーワードを言ったことを音声認識により検出している。
さらに、上記音声ミュート処理部21cは、キーワード検出モードで特定のキーワードが検出される場合、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。
なお、拍手検出部21aとキーワード検出部21bとは、別々に構成しても良いが、1つの音声検出部の中に、拍手検出機能とキーワード検出機能とが共に含まれる構成とするようにしても良いものである。
また、音声認識処理部19には、操作部22が接続されている。この操作部22は、電源スイッチや、ユーザUSが遠隔操作機器11に対して各種の設定等を行なうための複数の操作子を含んでいる。そして、音声認識処理部19は、操作部22から得られた操作信号に基づいて、その操作内容が反映されるように各部を制御している。
さらに、上記音声認識処理部19には、音声発生部23が接続されている。このため、音声認識処理部19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、音声発生部23を用いて音によりユーザUSに通知することができる。
また、この音声認識処理部19には、表示部24が接続されている。これにより、音声認識処理部19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、表示部24を用いて光を点滅させる等の手法によりユーザUSに通知することができる。
図4は、被制御機器の一例である上記デジタルテレビジョン放送受信装置12の信号処理系の概略を示している。すなわち、アンテナ25で受信したデジタルテレビジョン放送信号は、入力端子26を介してチューナ部27に供給されることにより、所望のチャンネルの放送信号が選局される。
このチューナ部27で選局された放送信号は、復調復号部28に供給されてデジタルの映像信号及び音声信号等に復元された後、信号処理部29に出力される。この信号処理部29は、復調復号部28から供給されたデジタルの映像信号及び音声信号に対してそれぞれ所定のデジタル信号処理を施している。
そして、この信号処理部29は、デジタルの映像信号を合成処理部30に出力し、デジタルの音声信号を音声処理部31に出力している。このうち、合成処理部30は、信号処理部29から供給されるデジタルの映像信号に、OSD(on screen display)信号を重畳して映像処理部32に出力している。
この映像処理部32は、入力されたデジタルの映像信号を、後段の、例えば液晶表示パネル等を有する平面型の映像表示部33で表示可能なフォーマットに変換している。そして、この映像処理部32から出力された映像信号が、映像表示部33に供給されて映像表示に供される。
また、上記音声処理部31は、入力されたデジタルの音声信号を、後段のスピーカ34で再生可能なフォーマットのアナログ音声信号に変換している。そして、この音声処理部31から出力されたアナログ音声信号が、スピーカ34に供給されることにより音声再生に供される。
ここで、このデジタルテレビジョン放送受信装置12は、上記した各種の受信動作を含むその全ての動作を制御部35によって統括的に制御されている。この制御部35は、CPU(central processing unit)35aを内蔵しており、デジタルテレビジョン放送受信装置12の本体に設置された操作部36からの操作信号を受けて、または、上記遠隔操作機器11から送出され受信部37で受信した操作信号を受けて、その操作内容が反映されるように各部をそれぞれ制御している。
この場合、制御部35は、メモリ部35bを利用している。このメモリ部35bは、主として、CPU35aが実行する制御プログラムを格納したROM(read only memory)と、該CPU35aに作業エリアを提供するためのRAM(random access memory)と、各種の設定情報及び制御情報等が格納される不揮発性メモリとを有している。
また、この制御部35には、HDD(hard disk drive)38が接続されている。この制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、上記復調復号部28から得られるデジタルの映像信号及び音声信号を、記録再生処理部39によって暗号化し所定の記録フォーマットに変換した後、HDD38に供給してハードディスク38aに記録させるように制御することができる。
さらに、この制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、HDD38によりハードディスク38aからデジタルの映像信号及び音声信号を読み出させ、上記記録再生処理部39によって復号化した後、信号処理部29に供給することによって、以後、上記した映像表示及び音声再生に供させるように制御することができる。
また、上記デジタルテレビジョン放送受信装置12には、入力端子40が接続されている。この入力端子40は、デジタルテレビジョン放送受信装置12の外部からデジタルの映像信号及び音声信号を直接入力するためのものである。この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作部36や遠隔操作機器11等の操作に対応した制御部35の制御に基づいて、記録再生処理部39を介した後、信号処理部29に供給されて、以後、上記した映像表示及び音声再生に供される。
さらに、この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作部36や遠隔操作機器11等の操作に対応した制御部35の制御に基づいて、記録再生処理部39を介した後、HDD38によるハードディスク38aに対しての記録再生に供される。
また、上記制御部35は、ネットワークインターフェース41を介して外部のネットワーク42に接続されている。このため、制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、ネットワーク42上の複数のネットワークサーバ431〜43nに選択的にアクセスすることにより、そこで提供している各種のサービスを利用することができるようになっている。
図5は、上記遠隔操作機器11が行なう主要な処理動作の一例をまとめたフローチャートを示している。この処理動作は、遠隔操作機器11が拍手検出モード、つまり、主としてA/D変換部18及び拍手検出部21aが駆動状態となり、拍手検出部21a以外の音声認識処理部19が非駆動(スリープ)状態となっている設定で開始(ステップS1)される。
すると、遠隔操作機器11は、ステップS2で、拍手検出部21aにより予め設定された回数以上の連続的な拍手音が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS3で、音声認識処理部19の全体に電源電力を供給して、音声認識処理部19全体を駆動状態とする。
その後、遠隔操作機器11は、ステップS4で、拍手検出モードから特定のキーワードのみを対象として音声認識を行なうキーワード検出モードに切り替えられ、ステップS5で、特定のキーワードが入力されるのを待つ、いわゆる、キーワード待ち状態であることをユーザUSに通知する。
このキーワード待ち状態をユーザUSに通知する手段としては、音声発生部23により「ピ、ピ、ピ」といったアラーム音を発生させる手法や、音声発生部23に「キーワード待ちです」のような音声によるメッセージを発生させる手法等を用いることができる。また、表示部24により光を点滅させる手法や、表示部24に「キーワード待ちです」のような文字によるメッセージを表示させる手法等を用いることができる。
さらに、キーワード待ち状態をユーザUSに通知する手段としては、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、そのスピーカ34からアラーム音や音声によるメッセージを発生させる操作信号を送信する手法も考えられる。また、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、その映像表示部33に文字によるメッセージを表示させる操作信号を送信する手法も考えられる。
このように、遠隔操作機器11が自己の音声発生部23や表示部24等を用いてキーワード待ち状態であることを通知するようにしても良いし、被制御機器(この場合、デジタルテレビジョン放送受信装置12)の映像表示部33やスピーカ34等を用いてキーワード待ち状態であることを通知するようにしても良いものである。
そして、遠隔操作機器11は、ステップS6で、特定のキーワードが検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS7で、デジタルテレビジョン放送受信装置12に対して音声をミュート状態にさせる操作信号を送信し、ステップS8で、音声指示が入力されるのを待つ状態となる。
その後、遠隔操作機器11は、ステップS9で、音声指示が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS10で、その検出された音声指示に対応した操作信号を送信し、ステップS11で、拍手検出モード、つまり、主としてA/D変換部18及び拍手検出部21aが駆動状態で、拍手検出部21a以外の音声認識処理部19が非駆動(スリープ)状態になっているモードに設定し、処理を終了(ステップS12)する。
なお、予め設定された回数以上の連続的な拍手音が検出された時点から、予め設定された所定時間内に特定のキーワードが検出されなかった場合、または、特定のキーワードが検出された時点から、予め設定された所定時間内にユーザUSの音声指示が検出されなかった場合には、自動的に拍手検出モードに戻るようにしている。これにより、無駄な電力消費を抑えることができる。
次に、上記した遠隔操作機器11を用いてデジタルテレビジョン放送受信装置12を操作する一使用形態について説明する。すなわち、デジタルテレビジョン放送受信装置12によってデジタルテレビジョン放送番組を視聴する際、ユーザUSが、視聴可能な複数のチャンネルを頻繁に切り替えて視聴する、いわゆる、ザッピングと称される行為をよく行なうことが知られている。
そして、上記した遠隔操作機器11を用いてザッピングを行なう場合には、ユーザUSは、例えば「ザッピング・アップ」なる音声指示を発する。すると、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最小チャンネルから最大チャンネルに向けて、数秒毎に順次自動的に送信する。これにより、視聴可能な複数のチャンネルの放送番組を、チャンネル番号の最小チャンネルから最大チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
また、ユーザUSが例えば「ザッピング・アップ」なる音声指示を発した場合、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、現在選択しているチャンネルからチャンネル番号の最大チャンネルに向けて、数秒毎に順次自動的に送信するようにすることも可能である。これにより、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルからチャンネル番号の最大チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
逆に、ユーザUSが「ザッピング・ダウン」なる音声指示を発したときには、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に順次自動的に送信する。これにより、視聴可能な複数のチャンネルの放送番組を、チャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
また、ユーザUSが例えば「ザッピング・ダウン」なる音声指示を発した場合、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、現在選択しているチャンネルからチャンネル番号の最小チャンネルに向けて、数秒毎に順次自動的に送信するようにすることも可能である。これにより、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルからチャンネル番号の最小チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
このようにして、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「ストップ」または「このチャンネル」といった音声指示を発した場合には、遠隔操作機器11は、その音声指示以降、自動的にチャンネルを切り替える処理を停止する。これにより、ユーザUSは、音声指示により指定したチャンネルの放送番組を連続して視聴することができるようになる。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「ネクスト」なる音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを、数秒間待つことなく、次のチャンネルに切り替えるための操作信号を直ちに送信する。
さらに、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「もう少し」または「延長」といった音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを数秒間で切り替えず、さらに数秒間待ってから、次のチャンネルに切り替えるための操作信号を送信する。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「次、次、次」のように音声指示を連続して発した場合には、遠隔操作機器11は、チャンネルを次のチャンネルに切り替えるための操作信号を、音声指示された「次」の回数だけ即座に送信する。これにより、ユーザUSが「次」といった数だけチャンネルを飛ばすことができる。
さらに、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「速く」なる音声指示を発した場合には、遠隔操作機器11は、次のチャンネルに切り替えるための操作信号を、通常(数秒間)よりも短い間隔(例えば通常の1/2倍の間隔等)で送信し、チャンネルの切り替え間隔を短くすることができる。
また、逆に、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「遅く」なる音声指示を発した場合には、遠隔操作機器11は、次のチャンネルに切り替えるための操作信号を、通常(数秒間)よりも長い間隔(例えば通常の2倍の間隔等)で送信し、チャンネルの切り替え間隔を長くすることができる。
ここで、遠隔操作機器11は、ユーザUSの音声指示により、数秒毎に自動的にチャンネルを切り替える処理を開始する際に、これからザッピングを開始することを、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、デジタルテレビジョン放送受信装置12の画面に「ザッピング中」というメッセージを表示させたり、デジタルテレビジョン放送受信装置12の図示しないインジケータ(LED等)を点灯または点滅させたりすることができる。これにより、ユーザUSは、遠隔操作機器11がザッピングの自動処理を現在実施していることを、視覚的に知ることができる。
なお、「ザッピング中」であるというメッセージは、デジタルテレビジョン放送受信装置12の画面やインジケータに表示させるだけでなく、遠隔操作機器11の表示部24により光を点滅させる手法や、表示部24に「ザッピング中」のような文字によるメッセージを表示させる手法等を用いることができる。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、遠隔操作機器11が、チャンネルの切り替えられた時点から1秒経過する毎に時間情報を、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、あと何秒で次のチャンネルに自動的に切り替わるのかを、デジタルテレビジョン放送受信装置12の画面に秒数でカウントダウン表示することができる。
なお、次のチャンネルに自動的に切り替わるまでの時間のカウントダウン表示は、デジタルテレビジョン放送受信装置12の画面に表示させるだけでなく、スピーカ34からアラーム音によってユーザUSに通知するようにしても良いものである。また、遠隔操作機器11の音声発生部23によりアラーム音でユーザUSに通知することもできる。
ここで、ザッピングにより数秒毎に自動的にチャンネルを切り替える際、視聴可能な全てのチャンネルをチャンネル切り替えの対象とすることができる。この場合、ユーザUSが「ザッピング・アップ」または「ザッピング・ダウン」なる音声指示を発すると、遠隔操作機器11は、視聴可能な全てのチャンネルを選局するための操作信号を数秒毎に順次自動的に送信し、視聴可能な全てのチャンネルの放送番組を1つ1つ順番に視聴することができる。
ところで、視聴可能なチャンネルの数は、数100を越えることがある。この場合、視聴可能な全てのチャンネルを切り替えの対象とすることは現実的でないと思われる。このため、ユーザUSが予めお好みのチャンネルをデジタルテレビジョン放送受信装置12に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることが考えられている。
この場合、ユーザUSは、例えば「お好み・アップ」または「お好み・ダウン」といった音声指示を発する。すると、遠隔操作機器11は、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を数秒毎に順次自動的に送信する。そして、デジタルテレビジョン放送受信装置12では、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を受信する毎に、自己に登録されたチャンネルのみを順次アップまたはダウン選局する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
また、ユーザUSが予めお好みのチャンネルのチャンネル番号を遠隔操作機器11に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることも考えられる。この場合、ユーザUSが「お好み・アップ」または「お好み・ダウン」といった音声指示を発すると、遠隔操作機器11は、自己に登録されたお好みチャンネルのチャンネル番号(例えば“1”→“5”→“8”)を送信する。そして、数秒後に、次のお好みチャンネルのチャンネル番号(例えば“3”→“6”→“4”)を送信する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
さらに、ユーザUSが、ザッピング時に切り替え対象となるチャンネルの数を設定することができるようにしておいても良いものである。このようにすれば、例えばユーザUSが「ザッピング・アップ」なる音声指示を発すると、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最小チャンネルから最大チャンネルに向けて数秒毎に順次自動的に送信するが、予め設定された数だけチャンネルを切り替えると自動的にザッピングを停止するようになる。
ここで、上記した実施の形態では、被制御機器としてデジタルテレビジョン放送受信装置12を例に説明したが、被制御機器としては、デジタルテレビジョン放送受信装置12に限るものではなく、例えばSTB(set top box)や音声再生機能を有するAV(audio visual)機器等に広く適用することが可能である。
なお、この発明は上記した実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係る構成要素を適宜組み合わせても良いものである。
11…遠隔操作機器、12…デジタルテレビジョン放送受信装置、13,14…筐体、14a…脚部、15…マイクロホン、16…赤外線発光部、16a,16b…赤外線LED、17…音声認識用LSI、18…A/D変換部、19…音声認識処理部、20…メモリ部、21a…拍手検出部、21b…キーワード検出部、21c…音声ミュート処理部、22…操作部、23…音声発生部、24…表示部、25…アンテナ、26…入力端子、27…チューナ部、28…復調復号部、29…信号処理部、30…合成処理部、31…音声処理部、32…映像処理部、33…映像表示部、34…スピーカ、35…制御部、35a…CPU、35b…メモリ部、36…操作部、37…受信部、38…HDD、38a…ハードディスク、39…記録再生処理部、40…入力端子、41…ネットワークインターフェース、42…ネットワーク、431〜43n…ネットワークサーバ、US…ユーザ。
実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段と電力制御手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。電力制御手段は、音検出手段に電力を供給した音検出モードで音が検出された場合に、キーワード検出手段に電力を供給してキーワード検出モードに設定する。

Claims (12)

  1. 音を検出する音検出手段と、
    前記音検出手段で音が検出された場合、特定のキーワードを音声認識により検出するキーワード検出手段と、
    前記キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する音声ミュート手段と、
    前記キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する送信手段とを具備する音声認識操作装置。
  2. 前記音検出手段で音が検出された場合、キーワード待ちであることを通知するように制御する通知制御手段を具備する請求項1記載の音声認識操作装置。
  3. 前記通知制御手段は、音声及び表示の少なくとも一方の手段を用いてキーワード待ちであることを通知するように制御する請求項2記載の音声認識操作装置。
  4. 前記キーワード検出手段は、前記音検出手段で音が検出された時点から所定時間以内、キーワードを音声認識により検出する請求項1記載の音声認識操作装置。
  5. 前記送信手段は、前記キーワード検出手段でキーワードが検出された時点から所定時間以内だけ音声指示を認識する請求項1記載の音声認識操作装置。
  6. 前記音検出手段は、拍手音を検出する請求項1記載の音声認識操作装置。
  7. 前記音検出手段は、所定回数以上の連続的な拍手音を検出する請求項6記載の音声認識操作装置。
  8. 前記送信手段は、音声認識された音声指示がザッピングの開始要求である場合、所定時間毎に自動的にチャンネルの切り替えを行なう操作信号を送信する請求項1記載の音声認識操作装置。
  9. 前記送信手段は、音声認識された音声指示がザッピングの停止要求である場合、チャンネルの切り替えを行なう操作信号の送信を停止して、その時点で選局していたチャンネルを継続して選局する請求項1記載の音声認識操作装置。
  10. 前記送信手段は、ザッピング中に音声認識された音声指示がチャンネルの切り替え間隔を変更する要求である場合、チャンネルの切り替えを行なう操作信号を送信する間隔を変える請求項8記載の音声認識操作装置。
  11. ザッピング中であることを通知する通知手段を具備する請求項8記載の音声認識操作装置。
  12. 音検出手段により音を検出し、
    前記音検出手段で音が検出された場合、キーワード検出手段により特定のキーワードを音声認識により検出し、
    前記キーワード検出手段でキーワードが検出された場合、音声ミュート手段により音声ミュートを指示する操作信号を送信し、
    前記キーワード検出手段でキーワードが検出された後の音声指示を認識し、送信手段により当該音声指示に対応する操作信号を送信する音声認識操作方法。
JP2011032151A 2011-02-17 2011-02-17 音声認識操作装置及び音声認識操作方法 Expired - Fee Related JP5039214B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011032151A JP5039214B2 (ja) 2011-02-17 2011-02-17 音声認識操作装置及び音声認識操作方法
US13/238,883 US20120215537A1 (en) 2011-02-17 2011-09-21 Sound Recognition Operation Apparatus and Sound Recognition Operation Method
US13/848,635 US20130218562A1 (en) 2011-02-17 2013-03-21 Sound Recognition Operation Apparatus and Sound Recognition Operation Method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011032151A JP5039214B2 (ja) 2011-02-17 2011-02-17 音声認識操作装置及び音声認識操作方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012149607A Division JP2012185861A (ja) 2012-07-03 2012-07-03 操作装置及び操作方法

Publications (2)

Publication Number Publication Date
JP2012173325A true JP2012173325A (ja) 2012-09-10
JP5039214B2 JP5039214B2 (ja) 2012-10-03

Family

ID=46653497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011032151A Expired - Fee Related JP5039214B2 (ja) 2011-02-17 2011-02-17 音声認識操作装置及び音声認識操作方法

Country Status (2)

Country Link
US (2) US20120215537A1 (ja)
JP (1) JP5039214B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046563A (ja) * 2018-09-20 2020-03-26 Dynabook株式会社 電子機器、音声認識方法及びプログラム
WO2020080846A1 (en) * 2018-10-17 2020-04-23 Samsung Electronics Co., Ltd. Electronic device, control method thereof, and sound output control system of the electronic device
JP2021009190A (ja) * 2019-06-28 2021-01-28 アイリスオーヤマ株式会社 遠隔操作装置及び映像音響機器

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9142215B2 (en) * 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9251787B1 (en) * 2012-09-26 2016-02-02 Amazon Technologies, Inc. Altering audio to improve automatic speech recognition
FR2996399B3 (fr) 2012-09-28 2015-05-15 Samsung Electronics Co Ltd Appareil de traitement d'image et procede de commande de celui-ci et systeme de traitement d'image
CN102945672B (zh) 2012-09-29 2013-10-16 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法
US8615221B1 (en) 2012-12-06 2013-12-24 Google Inc. System and method for selection of notification techniques in an electronic device
US9704486B2 (en) * 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
KR101732137B1 (ko) * 2013-01-07 2017-05-02 삼성전자주식회사 원격 제어 장치 및 전력 제어 방법
US9256269B2 (en) * 2013-02-20 2016-02-09 Sony Computer Entertainment Inc. Speech recognition system for performing analysis to a non-tactile inputs and generating confidence scores and based on the confidence scores transitioning the system from a first power state to a second power state
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
US10674198B2 (en) 2013-08-06 2020-06-02 Saronikos Trading And Services, Unipessoal Lda System for controlling electronic devices by means of voice commands, more specifically a remote control to control a plurality of electronic devices by means of voice commands
US9697700B2 (en) * 2013-11-20 2017-07-04 Honeywell International Inc. Ambient condition detector with processing of incoming audible commands followed by speech recognition
US9037455B1 (en) * 2014-01-08 2015-05-19 Google Inc. Limiting notification interruptions
CN105357564A (zh) * 2014-08-20 2016-02-24 中兴通讯股份有限公司 遥控移动终端、遥控系统及遥控方法
KR102306537B1 (ko) 2014-12-04 2021-09-29 삼성전자주식회사 소리 신호를 처리하는 방법 및 디바이스.
FR3030177B1 (fr) * 2014-12-16 2016-12-30 Stmicroelectronics Rousset Dispositif electronique comprenant un module de reveil d'un appareil electronique distinct d'un coeur de traitement
US10719115B2 (en) * 2014-12-30 2020-07-21 Avago Technologies International Sales Pte. Limited Isolated word training and detection using generated phoneme concatenation models of audio inputs
WO2016119989A1 (en) * 2015-01-27 2016-08-04 Philips Lighting Holding B.V. Method and apparatuses for proximity detection for device control
US11956503B2 (en) * 2015-10-06 2024-04-09 Comcast Cable Communications, Llc Controlling a device based on an audio input
US10057642B2 (en) 2015-10-06 2018-08-21 Comcast Cable Communications, Llc Controlling the provision of power to one or more devices
US10289205B1 (en) * 2015-11-24 2019-05-14 Google Llc Behind the ear gesture control for a head mountable device
CN105895103B (zh) * 2015-12-03 2020-01-17 乐融致新电子科技(天津)有限公司 一种语音识别方法及装置
CN106254915A (zh) * 2016-07-29 2016-12-21 乐视控股(北京)有限公司 基于电视终端的交互方法、装置及系统
US10210863B2 (en) 2016-11-02 2019-02-19 Roku, Inc. Reception of audio commands
KR102519165B1 (ko) * 2016-11-24 2023-04-07 삼성전자주식회사 원격 제어 장치, 디스플레이 장치 및 그들의 제어 방법
US10531187B2 (en) * 2016-12-21 2020-01-07 Nortek Security & Control Llc Systems and methods for audio detection using audio beams
KR102398390B1 (ko) 2017-03-22 2022-05-16 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
KR102392087B1 (ko) 2017-07-10 2022-04-29 삼성전자주식회사 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법
US10599377B2 (en) 2017-07-11 2020-03-24 Roku, Inc. Controlling visual indicators in an audio responsive electronic device, and capturing and providing audio using an API, by native and non-native computing devices and services
US10777197B2 (en) 2017-08-28 2020-09-15 Roku, Inc. Audio responsive device with play/stop and tell me something buttons
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
US11062710B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US10448762B2 (en) 2017-09-15 2019-10-22 Kohler Co. Mirror
US11099540B2 (en) 2017-09-15 2021-08-24 Kohler Co. User identity in household appliances
US11093554B2 (en) 2017-09-15 2021-08-17 Kohler Co. Feedback for water consuming appliance
US10887125B2 (en) 2017-09-15 2021-01-05 Kohler Co. Bathroom speaker
US10768697B2 (en) * 2017-11-02 2020-09-08 Chian Chiu Li System and method for providing information
EP3776169A4 (en) * 2017-12-29 2022-01-26 Polk Audio, LLC VOICE CONTROLLED SPEAKER SYSTEM WITH DEDICATED DSP SETTINGS FOR VOICE ASSISTANT AND MODE SWITCHING METHOD
US11145298B2 (en) 2018-02-13 2021-10-12 Roku, Inc. Trigger word detection with multiple digital assistants
CN108597536A (zh) * 2018-03-20 2018-09-28 成都星环科技有限公司 一种基于声音信息定位的交互系统
CN109361944A (zh) * 2018-12-12 2019-02-19 江苏集萃微纳自动化系统与装备技术研究所有限公司 具有语言识别功能的遥控器
KR20200084413A (ko) * 2018-12-21 2020-07-13 삼성전자주식회사 컴퓨팅 장치 및 그 동작 방법
CN113039601A (zh) * 2019-09-20 2021-06-25 深圳市汇顶科技股份有限公司 一种语音控制方法、装置、芯片、耳机及系统
US11915698B1 (en) * 2021-09-29 2024-02-27 Amazon Technologies, Inc. Sound source localization

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05216492A (ja) * 1992-01-31 1993-08-27 Clarion Co Ltd 音声起動制御方法
JP2000148682A (ja) * 1998-11-05 2000-05-30 Toshiba Corp 情報再生装置
JP2001154692A (ja) * 1999-11-30 2001-06-08 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4776016A (en) * 1985-11-21 1988-10-04 Position Orientation Systems, Inc. Voice control system
US5481256A (en) * 1987-10-14 1996-01-02 Universal Electronics Inc. Direct entry remote control with channel scan
US4856081A (en) * 1987-12-09 1989-08-08 North American Philips Consumer Electronics Corp. Reconfigurable remote control apparatus and method of using the same
KR920009681B1 (ko) * 1989-05-26 1992-10-22 삼성전자 주식회사 자동 프로그램시 채널의 스캐닝 시간 단축 방법
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US6668244B1 (en) * 1995-07-21 2003-12-23 Quartet Technology, Inc. Method and means of voice control of a computer, including its mouse and keyboard
US6198513B1 (en) * 1995-12-08 2001-03-06 Zenith Electronics Corporation Receiver with channel surfing mode
US5987106A (en) * 1997-06-24 1999-11-16 Ati Technologies, Inc. Automatic volume control system and method for use in a multimedia computer system
DE69917479T2 (de) * 1998-10-26 2005-06-02 Janez Pirs Ansteuerungsschema und elektronischer schaltkreis für ein elektooptisches lcd-schaltelement
US6606280B1 (en) * 1999-02-22 2003-08-12 Hewlett-Packard Development Company Voice-operated remote control
US6584439B1 (en) * 1999-05-21 2003-06-24 Winbond Electronics Corporation Method and apparatus for controlling voice controlled devices
US6397186B1 (en) * 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter
US8909739B2 (en) * 2001-01-29 2014-12-09 Universal Electronics Inc. System and method for upgrading the remote control functionality of a device
US7023498B2 (en) * 2001-11-19 2006-04-04 Matsushita Electric Industrial Co. Ltd. Remote-controlled apparatus, a remote control system, and a remote-controlled image-processing apparatus
EP1606898A1 (en) * 2003-03-17 2005-12-21 Philips Intellectual Property & Standards GmbH Method for remote control of an audio device
WO2005045461A1 (en) * 2003-10-16 2005-05-19 Hill-Rom Services, Inc. Universal communications, monitoring, tracking, and control system for a healthcare facility
US20050209858A1 (en) * 2004-03-16 2005-09-22 Robert Zak Apparatus and method for voice activated communication
US20060028337A1 (en) * 2004-08-09 2006-02-09 Li Qi P Voice-operated remote control for TV and electronic systems
US7706553B2 (en) * 2005-07-13 2010-04-27 Innotech Systems, Inc. Auto-mute command stream by voice-activated remote control
JP5115058B2 (ja) * 2006-08-28 2013-01-09 株式会社Jvcケンウッド 電子機器の制御装置及び電子機器の制御方法
KR100759003B1 (ko) * 2007-02-09 2007-09-14 주식회사 서비전자 통합 콘트롤러 및 그것의 제어코드 설정방법
KR20090107365A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
US8296151B2 (en) * 2010-06-18 2012-10-23 Microsoft Corporation Compound gesture-speech commands
DE102010062528B4 (de) * 2010-12-07 2020-12-17 Sennheiser Electronic Gmbh & Co. Kg Audiosignalverarbeitungseinheit und Audioübertragungssystem, insbesondere Mikrofonsystem
JP5695447B2 (ja) * 2011-03-01 2015-04-08 株式会社東芝 テレビジョン装置及び遠隔操作装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05216492A (ja) * 1992-01-31 1993-08-27 Clarion Co Ltd 音声起動制御方法
JP2000148682A (ja) * 1998-11-05 2000-05-30 Toshiba Corp 情報再生装置
JP2001154692A (ja) * 1999-11-30 2001-06-08 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046563A (ja) * 2018-09-20 2020-03-26 Dynabook株式会社 電子機器、音声認識方法及びプログラム
WO2020080846A1 (en) * 2018-10-17 2020-04-23 Samsung Electronics Co., Ltd. Electronic device, control method thereof, and sound output control system of the electronic device
US11188290B2 (en) 2018-10-17 2021-11-30 Samsung Electronics Co., Ltd. Electronic device, control method thereof, and sound output control system of the electronic device
US11822855B2 (en) 2018-10-17 2023-11-21 Samsung Electronics Co., Ltd. Electronic device, control method thereof, and sound output control system of the electronic device
JP2021009190A (ja) * 2019-06-28 2021-01-28 アイリスオーヤマ株式会社 遠隔操作装置及び映像音響機器
JP7223423B2 (ja) 2019-06-28 2023-02-16 アイリスオーヤマ株式会社 遠隔操作装置及び映像音響機器

Also Published As

Publication number Publication date
US20120215537A1 (en) 2012-08-23
US20130218562A1 (en) 2013-08-22
JP5039214B2 (ja) 2012-10-03

Similar Documents

Publication Publication Date Title
JP5039214B2 (ja) 音声認識操作装置及び音声認識操作方法
US8633808B2 (en) Systems, methods and apparatus for locating a lost remote control
WO2015062471A1 (zh) 机顶盒控制方法及装置
JP2012185861A (ja) 操作装置及び操作方法
US20210064335A1 (en) Electronic apparatus, display apparatus and method of controlling the same
JP2006217117A (ja) テレビジョン受像機
US20060256986A1 (en) Remote control system with a wireless earphone function and corresponding method
US8862091B2 (en) Method and apparatus for generating emergency alert notifications on mobile devices
US20070171307A1 (en) Media playback system with real-time camera image display and method thereof
JP5670211B2 (ja) 監視装置、テレビジョン受像機、監視システム、監視方法、監視プログラム、および記録媒体
US20060264250A1 (en) Remote control system with a wireless earphone function and corresponding method
US11343558B1 (en) Systems, methods, and media for providing an enhanced remote control that synchronizes with media content presentation
JP2015023497A (ja) テレビジョン受像装置
JP2015039071A (ja) 音声認識操作装置及び音声認識操作方法
JP2014171202A (ja) 一時停止機能を有する映像再生装置または音声再生装置
JP2016506118A (ja) 電源がオンになったときに所望のチャンネルを選択する方法および装置
JP2010028732A (ja) 電子機器
JP2008258748A (ja) 液晶テレビジョン、及びテレビジョン受信機
JP6239847B2 (ja) テレビジョン受信機
WO2021027892A1 (zh) 接收装置
JP2008306354A (ja) リモコン装置を備えた電子機器
JP2008076062A (ja) リモコン送信機付目覚まし時計及びavシステム
KR100687921B1 (ko) 전자 장치
JP2010021798A (ja) 電子機器
JP4606435B2 (ja) リモコン装置を備えた電子機器

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120706

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees