JP5039214B2 - 音声認識操作装置及び音声認識操作方法 - Google Patents
音声認識操作装置及び音声認識操作方法 Download PDFInfo
- Publication number
- JP5039214B2 JP5039214B2 JP2011032151A JP2011032151A JP5039214B2 JP 5039214 B2 JP5039214 B2 JP 5039214B2 JP 2011032151 A JP2011032151 A JP 2011032151A JP 2011032151 A JP2011032151 A JP 2011032151A JP 5039214 B2 JP5039214 B2 JP 5039214B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- sound
- voice
- voice recognition
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000001514 detection method Methods 0.000 claims abstract description 88
- 230000005540 biological transmission Effects 0.000 claims abstract description 12
- 230000005236 sound signal Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000004397 blinking Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42222—Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4396—Processing of audio elementary streams by muting the audio signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Details Of Television Systems (AREA)
- Selective Calling Equipment (AREA)
Description
この発明の実施の形態は、音声指示を認識して被制御機器を操作する音声認識操作装置及び音声認識操作方法に関する。
周知のように、近年では、ユーザのキー操作に対応した操作信号を送信して、被制御機器を遠隔操作する従前のリモートコントローラに代わり、ユーザの音声指示を認識し、その音声指示に対応した操作信号を送信して被制御機器を遠隔操作する、音声認識機能を備えた遠隔操作機器が開発されてきている。
ところで、このような音声認識機能を備えた遠隔操作機器は、従前のリモートコントローラのように多数のキーの中から所望のキーを選択して操作するといった煩雑な作業が不要となる反面、周囲の雑音を認識して誤動作することがあるという不都合な面も持ち合わせており、実用化に向けて種々の点で改良の余地が多々残されている。
周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供することを目的とする。
実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段と電力制御手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。電力制御手段は、音検出手段に電力を供給した音検出モードで音が検出された場合に、キーワード検出手段に電力を供給してキーワード検出モードに設定する。
以下、実施の形態について図面を参照して詳細に説明する。図1は、この実施の形態で説明する音声認識遠隔操作システムの一例を示している。この音声認識遠隔操作システムは、ユーザUSが、音声認識機能を備えた遠隔操作機器11を用いて、被制御機器としてのデジタルテレビジョン放送受信装置12を制御する構成となっている。
すなわち、ユーザUSが音声指示を発生すると、その音声指示を遠隔操作機器11が認識する。そして、遠隔操作機器11は、認識した音声指示に対応する操作信号を生成し、例えば赤外線や電波等を伝送媒体としてデジタルテレビジョン放送受信装置12に無線送信する。
このため、デジタルテレビジョン放送受信装置12では、遠隔操作機器11が送信する操作信号を受信し、その操作内容に対応した状態に各部を制御する。これにより、ユーザUSの音声指示によって、被制御機器であるデジタルテレビジョン放送受信装置12を遠隔操作することができるようになる。
ここで、上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の状態として、拍手検出モードに設定されている。この拍手検出モードでは、遠隔操作機器11は、ユーザUSが予め設定された回数(例えば2回)以上の拍手を連続的に行なったことを音声認識により検出している。
そして、拍手検出モードに設定された状態において、予め設定された回数以上の連続的な拍手音を検出すると、遠隔操作機器11は、キーワード検出モードに設定される。このキーワード検出モードでは、遠隔操作機器11は、予め設定された特定のキーワード(例えば「テレビ」等)のみを対象とした音声認識を行なっており、ユーザUSが特定のキーワードを言ったことを音声認識により検出している。
このように、キーワード検出モードに設定された状態において、特定のキーワードを検出すると、遠隔操作機器11は、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。その後、遠隔操作機器11は、ユーザUSからのデジタルテレビジョン放送受信装置12に対する各種の音声指示を認識する音声指示認識モードに設定される。
そして、この音声指示認識モードに設定された状態において、ユーザUSが音声指示を発生すると、遠隔操作機器11は、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信する。これにより、デジタルテレビジョン放送受信装置12が、ユーザUSの音声指示により遠隔操作されることになる。
このようにして、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信すると、遠隔操作機器11は、再び拍手検出モードに設定されて、ユーザUSによる次の拍手を検出すべく待機状態となる。
上記した遠隔操作機器11では、ユーザUSが予め設定された回数以上の連続的な拍手を行ない、続いて、ユーザUSが予め設定された特定のキーワードを言った状態で、始めて、デジタルテレビジョン放送受信装置12に対するユーザUSの音声指示を認識するようにしている。このため、周囲の雑音に影響されることなくユーザUSの音声指示を極力正確に認識することができるようになり、ひいてはデジタルテレビジョン放送受信装置12をユーザUSの所望する通りに正しく制御することが可能となる。
また、上記した遠隔操作機器11では、予め設定された回数以上の連続的な拍手音を検出し、続いて、予め設定された特定のキーワードを検出した状態で、デジタルテレビジョン放送受信装置12の音声をミュート状態にするようにしている。このため、ユーザUSの発生する音声指示を、デジタルテレビジョン放送受信装置12の発生する音声に妨害されることなく、正確に認識することができるようになる。
なお、デジタルテレビジョン放送受信装置12の音声をミュート状態にする際には、音声を完全に消音状態、つまり、100%ミュート状態にするだけでなく、必要に応じて、例えば音量を現在の音量の半分にする、いわゆる、50%ミュート状態にすることも可能である。つまり、音声ミュートとは、音量を現在の音量よりも低くするという意味を含むものとする。
また、ユーザUSの発生する音声指示が認識され、その音声指示に対応して送信された操作信号に基づいて、デジタルテレビジョン放送受信装置12が新たな状態に制御されたときには、デジタルテレビジョン放送受信装置12は、その音声ミュート状態を自動的に解除するようになっている。
ただし、デジタルテレビジョン放送受信装置12が音声ミュート状態を自動的に解除する機能を持っていない場合には、遠隔操作機器11が、デジタルテレビジョン放送受信装置12に対して、音声ミュート状態を解除することを指示する操作信号を送信する必要がある。
この場合、遠隔操作機器11としては、2通りの動作を取り得る。1つ目は、ユーザUSの音声指示を認識したとき、音声ミュートを解除する操作信号を送信し、音声指示に対応した操作信号を送信し、拍手検出モードに移行する動作である。2つ目は、ユーザUSの音声指示を認識したとき、音声指示に対応した操作信号を送信し、音声ミュートを解除する操作信号を送信し、拍手検出モードに移行する動作である。
なお、音声ミュートを解除する操作信号を送信する処理と、音声指示に対応した操作信号を送信する処理とは、時間的にほぼ同時に行なうことが可能であり、また、これらの2つの処理は、拍手検出モードに移行する前または後のいずれの時点で行なわれても良いものである。
さらに、上記した遠隔操作機器11では、拍手検出モードにおいて、例えばボールのバウンド音やドアのノック音等を拍手音と誤認識したとしても、その後のキーワード検出モードで特定のキーワードが検出されない限り、音声指示認識モードにならないので、誤操作の発生を極力防止することができる。
また、予め設定された回数以上の連続的な拍手音が検出されたという条件の元に、特定のキーワードを検出するようにしているので、特定のキーワードとしても特別に変わったフレーズ(例えば日常的に用いられない言葉等)を用いる必要は必ずしもなく、例えば「テレビ」等の日常的に使用され易い簡単な言葉でも誤操作防止効果が期待できるため、ユーザUSが言い易いキーワードを設定することができるという利点もある。
図2(a)は、上記遠隔操作機器11の外観を示している。この遠隔操作機器11は、ほぼ薄型の円柱形状に形成された2つの筐体13,14を、同心円状に重ね合わせるように構成されている。この遠隔操作機器11は、その一方の筐体14の底面に複数(図では2つしか見えない)の脚部14aが突設されており、例えばテーブル等の水平台上に載置して使用される。
また、この筐体14には、その側面にマイクロホン15が設置されている。さらに、他方の筐体13には、その側面に一対の赤外線LED(light emitting diode)16a,16bが設置されている。そして、この遠隔操作機器11は、マイクロホン15で拍手、キーワード及び音声指示等の音声情報を採集し、一対の赤外線LED16a,16bから操作情報を無線送信している。
さらに、この遠隔操作機器11は、2つの筐体13,14が、その軸心を中心として相互に回動自在となるように構成されている。すなわち、筐体14に対して、図2(b)に示すように筐体13を右方向に回動させることや、図2(c)に示すように筐体13を左方向に回動させることができる。
これにより、遠隔操作機器11は、マイクロホン15をユーザUSのいる方向に向け、一対の赤外線LED16a,16bデジタルテレビジョン放送受信装置12のある方向に向けるというように、それぞれの位置に合わせて細かい調整を行なうことが可能となっている。
図3は、上記遠隔操作機器11の信号処理系の一例を示している。すなわち、上記マイクロホン15で採集された音声情報は、音声信号として音声認識用LSI(large scale integration)17に供給される。この音声認識用LSI17は、入力された音声信号をA/D(analog/digital)変換部18でデジタル化し、音声認識処理部19に供給する。
この音声認識処理部19は、入力されたデジタルの音声信号を音声認識し、入力音声信号がユーザUSの発生した音声指示である場合、その音声指示に対応した操作信号を出力する。そして、この音声認識処理部19から出力された操作信号は、上記した一対の赤外線LED16a,16bで構成される赤外線発光部16により赤外線を伝送媒体として送信され、デジタルテレビジョン放送受信装置12に受信されることになる。
この場合、音声認識処理部19は、メモリ部20を利用している。すなわち、このメモリ部20には、デジタルテレビジョン放送受信装置12に対する各種の音声指示と、それらの音声指示に対する符号化された操作コードとを対応させた音声指示操作コード対応テーブルが格納されている。
そして、音声認識処理部19は、入力されたデジタルの音声信号を音声認識した結果、入力音声信号がユーザUSの発生した音声指示であると判断した場合、その音声指示に対応した操作コードを音声指示操作コード対応テーブルから検索し、検索した操作コードを操作信号として赤外線発光部16に出力する。
また、この音声認識処理部19は、拍手検出部21a、キーワード検出部21b及び音声ミュート処理部21cを含んでいる。このうち、拍手検出部21aは、予め設定された回数以上の連続的な拍手が行なわれたことを検出するものである。この場合、拍手は音のインパルスとして捉えられ、拍手検出部21aは、そのインパルスの発生回数を検出する動作を行なえればよいため、構成が簡易で電力消費量も僅かな回路で実現することができる。
このため、上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の拍手検出モードでは、主としてA/D変換部18及び拍手検出部21aに電源電力を供給し、拍手検出部21a以外の音声認識処理部19には電源電力を供給せず、電力消費量を低く抑えるようにしている。
すなわち、拍手検出モードでは、主としてA/D変換部18及び拍手検出部21aが駆動状態となり、拍手検出部21a以外の音声認識処理部19は非駆動(スリープ)状態となっている。このため、遠隔操作機器11が電池の電力で駆動される場合、電池電力の延命を図ることができる。
そして、拍手検出部21aは、予め設定された回数以上の連続的な拍手音を検出した場合、音声認識処理部19の全体に電源電力を供給する。すなわち、音声認識処理部19全体が駆動状態となる。これにより、音声認識処理部19は、以後、ユーザUSの発生する特定のキーワードや音声指示等を音声認識することができるようになる。
また、上記キーワード検出部21bは、先に述べたキーワード検出モードにおいて、予め設定された特定のキーワードのみを対象とした音声認識を行なっており、ユーザUSがその特定のキーワードを言ったことを音声認識により検出している。
さらに、上記音声ミュート処理部21cは、キーワード検出モードで特定のキーワードが検出される場合、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。
なお、拍手検出部21aとキーワード検出部21bとは、別々に構成しても良いが、1つの音声検出部の中に、拍手検出機能とキーワード検出機能とが共に含まれる構成とするようにしても良いものである。
また、音声認識処理部19には、操作部22が接続されている。この操作部22は、電源スイッチや、ユーザUSが遠隔操作機器11に対して各種の設定等を行なうための複数の操作子を含んでいる。そして、音声認識処理部19は、操作部22から得られた操作信号に基づいて、その操作内容が反映されるように各部を制御している。
さらに、上記音声認識処理部19には、音声発生部23が接続されている。このため、音声認識処理部19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、音声発生部23を用いて音によりユーザUSに通知することができる。
また、この音声認識処理部19には、表示部24が接続されている。これにより、音声認識処理部19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、表示部24を用いて光を点滅させる等の手法によりユーザUSに通知することができる。
図4は、被制御機器の一例である上記デジタルテレビジョン放送受信装置12の信号処理系の概略を示している。すなわち、アンテナ25で受信したデジタルテレビジョン放送信号は、入力端子26を介してチューナ部27に供給されることにより、所望のチャンネルの放送信号が選局される。
このチューナ部27で選局された放送信号は、復調復号部28に供給されてデジタルの映像信号及び音声信号等に復元された後、信号処理部29に出力される。この信号処理部29は、復調復号部28から供給されたデジタルの映像信号及び音声信号に対してそれぞれ所定のデジタル信号処理を施している。
そして、この信号処理部29は、デジタルの映像信号を合成処理部30に出力し、デジタルの音声信号を音声処理部31に出力している。このうち、合成処理部30は、信号処理部29から供給されるデジタルの映像信号に、OSD(on screen display)信号を重畳して映像処理部32に出力している。
この映像処理部32は、入力されたデジタルの映像信号を、後段の、例えば液晶表示パネル等を有する平面型の映像表示部33で表示可能なフォーマットに変換している。そして、この映像処理部32から出力された映像信号が、映像表示部33に供給されて映像表示に供される。
また、上記音声処理部31は、入力されたデジタルの音声信号を、後段のスピーカ34で再生可能なフォーマットのアナログ音声信号に変換している。そして、この音声処理部31から出力されたアナログ音声信号が、スピーカ34に供給されることにより音声再生に供される。
ここで、このデジタルテレビジョン放送受信装置12は、上記した各種の受信動作を含むその全ての動作を制御部35によって統括的に制御されている。この制御部35は、CPU(central processing unit)35aを内蔵しており、デジタルテレビジョン放送受信装置12の本体に設置された操作部36からの操作信号を受けて、または、上記遠隔操作機器11から送出され受信部37で受信した操作信号を受けて、その操作内容が反映されるように各部をそれぞれ制御している。
この場合、制御部35は、メモリ部35bを利用している。このメモリ部35bは、主として、CPU35aが実行する制御プログラムを格納したROM(read only memory)と、該CPU35aに作業エリアを提供するためのRAM(random access memory)と、各種の設定情報及び制御情報等が格納される不揮発性メモリとを有している。
また、この制御部35には、HDD(hard disk drive)38が接続されている。この制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、上記復調復号部28から得られるデジタルの映像信号及び音声信号を、記録再生処理部39によって暗号化し所定の記録フォーマットに変換した後、HDD38に供給してハードディスク38aに記録させるように制御することができる。
さらに、この制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、HDD38によりハードディスク38aからデジタルの映像信号及び音声信号を読み出させ、上記記録再生処理部39によって復号化した後、信号処理部29に供給することによって、以後、上記した映像表示及び音声再生に供させるように制御することができる。
また、上記デジタルテレビジョン放送受信装置12には、入力端子40が接続されている。この入力端子40は、デジタルテレビジョン放送受信装置12の外部からデジタルの映像信号及び音声信号を直接入力するためのものである。この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作部36や遠隔操作機器11等の操作に対応した制御部35の制御に基づいて、記録再生処理部39を介した後、信号処理部29に供給されて、以後、上記した映像表示及び音声再生に供される。
さらに、この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作部36や遠隔操作機器11等の操作に対応した制御部35の制御に基づいて、記録再生処理部39を介した後、HDD38によるハードディスク38aに対しての記録再生に供される。
また、上記制御部35は、ネットワークインターフェース41を介して外部のネットワーク42に接続されている。このため、制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、ネットワーク42上の複数のネットワークサーバ431〜43nに選択的にアクセスすることにより、そこで提供している各種のサービスを利用することができるようになっている。
図5は、上記遠隔操作機器11が行なう主要な処理動作の一例をまとめたフローチャートを示している。この処理動作は、遠隔操作機器11が拍手検出モード、つまり、主としてA/D変換部18及び拍手検出部21aが駆動状態となり、拍手検出部21a以外の音声認識処理部19が非駆動(スリープ)状態となっている設定で開始(ステップS1)される。
すると、遠隔操作機器11は、ステップS2で、拍手検出部21aにより予め設定された回数以上の連続的な拍手音が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS3で、音声認識処理部19の全体に電源電力を供給して、音声認識処理部19全体を駆動状態とする。
その後、遠隔操作機器11は、ステップS4で、拍手検出モードから特定のキーワードのみを対象として音声認識を行なうキーワード検出モードに切り替えられ、ステップS5で、特定のキーワードが入力されるのを待つ、いわゆる、キーワード待ち状態であることをユーザUSに通知する。
このキーワード待ち状態をユーザUSに通知する手段としては、音声発生部23により「ピ、ピ、ピ」といったアラーム音を発生させる手法や、音声発生部23に「キーワード待ちです」のような音声によるメッセージを発生させる手法等を用いることができる。また、表示部24により光を点滅させる手法や、表示部24に「キーワード待ちです」のような文字によるメッセージを表示させる手法等を用いることができる。
さらに、キーワード待ち状態をユーザUSに通知する手段としては、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、そのスピーカ34からアラーム音や音声によるメッセージを発生させる操作信号を送信する手法も考えられる。また、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、その映像表示部33に文字によるメッセージを表示させる操作信号を送信する手法も考えられる。
このように、遠隔操作機器11が自己の音声発生部23や表示部24等を用いてキーワード待ち状態であることを通知するようにしても良いし、被制御機器(この場合、デジタルテレビジョン放送受信装置12)の映像表示部33やスピーカ34等を用いてキーワード待ち状態であることを通知するようにしても良いものである。
そして、遠隔操作機器11は、ステップS6で、特定のキーワードが検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS7で、デジタルテレビジョン放送受信装置12に対して音声をミュート状態にさせる操作信号を送信し、ステップS8で、音声指示が入力されるのを待つ状態となる。
その後、遠隔操作機器11は、ステップS9で、音声指示が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS10で、その検出された音声指示に対応した操作信号を送信し、ステップS11で、拍手検出モード、つまり、主としてA/D変換部18及び拍手検出部21aが駆動状態で、拍手検出部21a以外の音声認識処理部19が非駆動(スリープ)状態になっているモードに設定し、処理を終了(ステップS12)する。
なお、予め設定された回数以上の連続的な拍手音が検出された時点から、予め設定された所定時間内に特定のキーワードが検出されなかった場合、または、特定のキーワードが検出された時点から、予め設定された所定時間内にユーザUSの音声指示が検出されなかった場合には、自動的に拍手検出モードに戻るようにしている。これにより、無駄な電力消費を抑えることができる。
次に、上記した遠隔操作機器11を用いてデジタルテレビジョン放送受信装置12を操作する一使用形態について説明する。すなわち、デジタルテレビジョン放送受信装置12によってデジタルテレビジョン放送番組を視聴する際、ユーザUSが、視聴可能な複数のチャンネルを頻繁に切り替えて視聴する、いわゆる、ザッピングと称される行為をよく行なうことが知られている。
そして、上記した遠隔操作機器11を用いてザッピングを行なう場合には、ユーザUSは、例えば「ザッピング・アップ」なる音声指示を発する。すると、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最小チャンネルから最大チャンネルに向けて、数秒毎に順次自動的に送信する。これにより、視聴可能な複数のチャンネルの放送番組を、チャンネル番号の最小チャンネルから最大チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
また、ユーザUSが例えば「ザッピング・アップ」なる音声指示を発した場合、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、現在選択しているチャンネルからチャンネル番号の最大チャンネルに向けて、数秒毎に順次自動的に送信するようにすることも可能である。これにより、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルからチャンネル番号の最大チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
逆に、ユーザUSが「ザッピング・ダウン」なる音声指示を発したときには、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に順次自動的に送信する。これにより、視聴可能な複数のチャンネルの放送番組を、チャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
また、ユーザUSが例えば「ザッピング・ダウン」なる音声指示を発した場合、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、現在選択しているチャンネルからチャンネル番号の最小チャンネルに向けて、数秒毎に順次自動的に送信するようにすることも可能である。これにより、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルからチャンネル番号の最小チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
このようにして、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「ストップ」または「このチャンネル」といった音声指示を発した場合には、遠隔操作機器11は、その音声指示以降、自動的にチャンネルを切り替える処理を停止する。これにより、ユーザUSは、音声指示により指定したチャンネルの放送番組を連続して視聴することができるようになる。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「ネクスト」なる音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを、数秒間待つことなく、次のチャンネルに切り替えるための操作信号を直ちに送信する。
さらに、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「もう少し」または「延長」といった音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを数秒間で切り替えず、さらに数秒間待ってから、次のチャンネルに切り替えるための操作信号を送信する。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「次、次、次」のように音声指示を連続して発した場合には、遠隔操作機器11は、チャンネルを次のチャンネルに切り替えるための操作信号を、音声指示された「次」の回数だけ即座に送信する。これにより、ユーザUSが「次」といった数だけチャンネルを飛ばすことができる。
さらに、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「速く」なる音声指示を発した場合には、遠隔操作機器11は、次のチャンネルに切り替えるための操作信号を、通常(数秒間)よりも短い間隔(例えば通常の1/2倍の間隔等)で送信し、チャンネルの切り替え間隔を短くすることができる。
また、逆に、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「遅く」なる音声指示を発した場合には、遠隔操作機器11は、次のチャンネルに切り替えるための操作信号を、通常(数秒間)よりも長い間隔(例えば通常の2倍の間隔等)で送信し、チャンネルの切り替え間隔を長くすることができる。
ここで、遠隔操作機器11は、ユーザUSの音声指示により、数秒毎に自動的にチャンネルを切り替える処理を開始する際に、これからザッピングを開始することを、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、デジタルテレビジョン放送受信装置12の画面に「ザッピング中」というメッセージを表示させたり、デジタルテレビジョン放送受信装置12の図示しないインジケータ(LED等)を点灯または点滅させたりすることができる。これにより、ユーザUSは、遠隔操作機器11がザッピングの自動処理を現在実施していることを、視覚的に知ることができる。
なお、「ザッピング中」であるというメッセージは、デジタルテレビジョン放送受信装置12の画面やインジケータに表示させるだけでなく、遠隔操作機器11の表示部24により光を点滅させる手法や、表示部24に「ザッピング中」のような文字によるメッセージを表示させる手法等を用いることができる。
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、遠隔操作機器11が、チャンネルの切り替えられた時点から1秒経過する毎に時間情報を、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、あと何秒で次のチャンネルに自動的に切り替わるのかを、デジタルテレビジョン放送受信装置12の画面に秒数でカウントダウン表示することができる。
なお、次のチャンネルに自動的に切り替わるまでの時間のカウントダウン表示は、デジタルテレビジョン放送受信装置12の画面に表示させるだけでなく、スピーカ34からアラーム音によってユーザUSに通知するようにしても良いものである。また、遠隔操作機器11の音声発生部23によりアラーム音でユーザUSに通知することもできる。
ここで、ザッピングにより数秒毎に自動的にチャンネルを切り替える際、視聴可能な全てのチャンネルをチャンネル切り替えの対象とすることができる。この場合、ユーザUSが「ザッピング・アップ」または「ザッピング・ダウン」なる音声指示を発すると、遠隔操作機器11は、視聴可能な全てのチャンネルを選局するための操作信号を数秒毎に順次自動的に送信し、視聴可能な全てのチャンネルの放送番組を1つ1つ順番に視聴することができる。
ところで、視聴可能なチャンネルの数は、数100を越えることがある。この場合、視聴可能な全てのチャンネルを切り替えの対象とすることは現実的でないと思われる。このため、ユーザUSが予めお好みのチャンネルをデジタルテレビジョン放送受信装置12に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることが考えられている。
この場合、ユーザUSは、例えば「お好み・アップ」または「お好み・ダウン」といった音声指示を発する。すると、遠隔操作機器11は、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を数秒毎に順次自動的に送信する。そして、デジタルテレビジョン放送受信装置12では、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を受信する毎に、自己に登録されたチャンネルのみを順次アップまたはダウン選局する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
また、ユーザUSが予めお好みのチャンネルのチャンネル番号を遠隔操作機器11に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることも考えられる。この場合、ユーザUSが「お好み・アップ」または「お好み・ダウン」といった音声指示を発すると、遠隔操作機器11は、自己に登録されたお好みチャンネルのチャンネル番号(例えば“1”→“5”→“8”)を送信する。そして、数秒後に、次のお好みチャンネルのチャンネル番号(例えば“3”→“6”→“4”)を送信する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
さらに、ユーザUSが、ザッピング時に切り替え対象となるチャンネルの数を設定することができるようにしておいても良いものである。このようにすれば、例えばユーザUSが「ザッピング・アップ」なる音声指示を発すると、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最小チャンネルから最大チャンネルに向けて数秒毎に順次自動的に送信するが、予め設定された数だけチャンネルを切り替えると自動的にザッピングを停止するようになる。
ここで、上記した実施の形態では、被制御機器としてデジタルテレビジョン放送受信装置12を例に説明したが、被制御機器としては、デジタルテレビジョン放送受信装置12に限るものではなく、例えばSTB(set top box)や音声再生機能を有するAV(audio visual)機器等に広く適用することが可能である。
なお、この発明は上記した実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係る構成要素を適宜組み合わせても良いものである。
11…遠隔操作機器、12…デジタルテレビジョン放送受信装置、13,14…筐体、14a…脚部、15…マイクロホン、16…赤外線発光部、16a,16b…赤外線LED、17…音声認識用LSI、18…A/D変換部、19…音声認識処理部、20…メモリ部、21a…拍手検出部、21b…キーワード検出部、21c…音声ミュート処理部、22…操作部、23…音声発生部、24…表示部、25…アンテナ、26…入力端子、27…チューナ部、28…復調復号部、29…信号処理部、30…合成処理部、31…音声処理部、32…映像処理部、33…映像表示部、34…スピーカ、35…制御部、35a…CPU、35b…メモリ部、36…操作部、37…受信部、38…HDD、38a…ハードディスク、39…記録再生処理部、40…入力端子、41…ネットワークインターフェース、42…ネットワーク、431〜43n…ネットワークサーバ、US…ユーザ。
Claims (13)
- 音を検出する音検出手段と、
前記音検出手段で音が検出された場合、特定のキーワードを音声認識により検出するキーワード検出手段と、
前記キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する音声ミュート手段と、
前記キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する送信手段と、
前記音検出手段に電力を供給した音検出モードで音が検出された場合に、前記キーワード検出手段に電力を供給してキーワード検出モードに設定する電力制御手段とを具備する音声認識操作装置。 - 前記音検出手段で音が検出された場合、キーワード待ちであることを通知するように制御する通知制御手段を具備する請求項1記載の音声認識操作装置。
- 前記通知制御手段は、音声及び表示の少なくとも一方の手段を用いてキーワード待ちであることを通知するように制御する請求項2記載の音声認識操作装置。
- 前記キーワード検出手段は、前記音検出手段で音が検出された時点から所定時間以内、キーワードを音声認識により検出する請求項1記載の音声認識操作装置。
- 前記送信手段は、前記キーワード検出手段でキーワードが検出された時点から所定時間以内だけ音声指示を認識する請求項1記載の音声認識操作装置。
- 前記音検出手段は、拍手音を検出する請求項1記載の音声認識操作装置。
- 前記音検出手段は、所定回数以上の連続的な拍手音を検出する請求項6記載の音声認識操作装置。
- 前記送信手段は、音声認識された音声指示がザッピングの開始要求である場合、所定時間毎に自動的にチャンネルの切り替えを行なう操作信号を送信する請求項1記載の音声認識操作装置。
- 前記送信手段は、音声認識された音声指示がザッピングの停止要求である場合、チャンネルの切り替えを行なう操作信号の送信を停止して、その時点で選局していたチャンネルを継続して選局する請求項1記載の音声認識操作装置。
- 前記送信手段は、ザッピング中に、チャンネルの切り替え間隔を現在の間隔よりも短くする音声指示、チャンネルの切り替え間隔を現在の間隔よりも長くする音声指示、1または複数のチャンネルを飛ばす音声指示の少なくともいずれかが音声認識された場合、その音声認識された音声指示に対応した操作信号を送信する請求項8記載の音声認識操作装置。
- ザッピング中であることを通知する通知手段を具備する請求項8記載の音声認識操作装置。
- 音を検出する音検出手段と、
前記音検出手段で音が検出された場合、放送受信装置の動作に対応した特定のキーワードを音声認識により検出するキーワード検出手段と、
前記キーワード検出手段でキーワードが検出された場合、前記放送受信装置に対して音声ミュートを指示する操作信号を送信する音声ミュート手段と、
前記キーワード検出手段でキーワードが検出された後の前記放送受信装置に対する音声指示を認識し、当該音声指示に対応する操作信号を前記放送受信装置に送信する送信手段と、
前記音検出手段に電力を供給した音検出モードで音が検出された場合に、前記キーワード検出手段に電力を供給してキーワード検出モードに設定する電力制御手段とを具備する音声認識操作装置。 - 音検出手段により音を検出し、
前記音検出手段で音が検出された場合、キーワード検出手段により特定のキーワードを音声認識により検出し、
前記キーワード検出手段でキーワードが検出された場合、音声ミュート手段により音声ミュートを指示する操作信号を送信し、
前記キーワード検出手段でキーワードが検出された後の音声指示を認識し、送信手段により当該音声指示に対応する操作信号を送信し、
前記音検出手段に電力を供給した音検出モードで音が検出された場合に、電力制御手段により前記キーワード検出手段に電力を供給してキーワード検出モードに設定する音声認識操作方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011032151A JP5039214B2 (ja) | 2011-02-17 | 2011-02-17 | 音声認識操作装置及び音声認識操作方法 |
US13/238,883 US20120215537A1 (en) | 2011-02-17 | 2011-09-21 | Sound Recognition Operation Apparatus and Sound Recognition Operation Method |
US13/848,635 US20130218562A1 (en) | 2011-02-17 | 2013-03-21 | Sound Recognition Operation Apparatus and Sound Recognition Operation Method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011032151A JP5039214B2 (ja) | 2011-02-17 | 2011-02-17 | 音声認識操作装置及び音声認識操作方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012149607A Division JP2012185861A (ja) | 2012-07-03 | 2012-07-03 | 操作装置及び操作方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012173325A JP2012173325A (ja) | 2012-09-10 |
JP5039214B2 true JP5039214B2 (ja) | 2012-10-03 |
Family
ID=46653497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011032151A Expired - Fee Related JP5039214B2 (ja) | 2011-02-17 | 2011-02-17 | 音声認識操作装置及び音声認識操作方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US20120215537A1 (ja) |
JP (1) | JP5039214B2 (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US9251787B1 (en) | 2012-09-26 | 2016-02-02 | Amazon Technologies, Inc. | Altering audio to improve automatic speech recognition |
FR2996399B3 (fr) | 2012-09-28 | 2015-05-15 | Samsung Electronics Co Ltd | Appareil de traitement d'image et procede de commande de celui-ci et systeme de traitement d'image |
CN102945672B (zh) | 2012-09-29 | 2013-10-16 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
US8615221B1 (en) | 2012-12-06 | 2013-12-24 | Google Inc. | System and method for selection of notification techniques in an electronic device |
US9704486B2 (en) * | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
KR101732137B1 (ko) * | 2013-01-07 | 2017-05-02 | 삼성전자주식회사 | 원격 제어 장치 및 전력 제어 방법 |
US9256269B2 (en) * | 2013-02-20 | 2016-02-09 | Sony Computer Entertainment Inc. | Speech recognition system for performing analysis to a non-tactile inputs and generating confidence scores and based on the confidence scores transitioning the system from a first power state to a second power state |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
CN105493511A (zh) | 2013-08-06 | 2016-04-13 | 萨罗尼科斯贸易与服务一人有限公司 | 用于借助于语音命令控制电子设备的系统、更具体地借助于语音命令控制多个电子设备的远程控制器 |
US9697700B2 (en) * | 2013-11-20 | 2017-07-04 | Honeywell International Inc. | Ambient condition detector with processing of incoming audible commands followed by speech recognition |
US9037455B1 (en) * | 2014-01-08 | 2015-05-19 | Google Inc. | Limiting notification interruptions |
CN105357564A (zh) * | 2014-08-20 | 2016-02-24 | 中兴通讯股份有限公司 | 遥控移动终端、遥控系统及遥控方法 |
KR102306537B1 (ko) | 2014-12-04 | 2021-09-29 | 삼성전자주식회사 | 소리 신호를 처리하는 방법 및 디바이스. |
FR3030177B1 (fr) * | 2014-12-16 | 2016-12-30 | Stmicroelectronics Rousset | Dispositif electronique comprenant un module de reveil d'un appareil electronique distinct d'un coeur de traitement |
US10719115B2 (en) * | 2014-12-30 | 2020-07-21 | Avago Technologies International Sales Pte. Limited | Isolated word training and detection using generated phoneme concatenation models of audio inputs |
WO2016119989A1 (en) * | 2015-01-27 | 2016-08-04 | Philips Lighting Holding B.V. | Method and apparatuses for proximity detection for device control |
US11956503B2 (en) * | 2015-10-06 | 2024-04-09 | Comcast Cable Communications, Llc | Controlling a device based on an audio input |
US10057642B2 (en) | 2015-10-06 | 2018-08-21 | Comcast Cable Communications, Llc | Controlling the provision of power to one or more devices |
US10289205B1 (en) * | 2015-11-24 | 2019-05-14 | Google Llc | Behind the ear gesture control for a head mountable device |
CN105895103B (zh) * | 2015-12-03 | 2020-01-17 | 乐融致新电子科技(天津)有限公司 | 一种语音识别方法及装置 |
CN106254915A (zh) * | 2016-07-29 | 2016-12-21 | 乐视控股(北京)有限公司 | 基于电视终端的交互方法、装置及系统 |
US10210863B2 (en) | 2016-11-02 | 2019-02-19 | Roku, Inc. | Reception of audio commands |
KR102519165B1 (ko) * | 2016-11-24 | 2023-04-07 | 삼성전자주식회사 | 원격 제어 장치, 디스플레이 장치 및 그들의 제어 방법 |
US10531187B2 (en) * | 2016-12-21 | 2020-01-07 | Nortek Security & Control Llc | Systems and methods for audio detection using audio beams |
KR102398390B1 (ko) * | 2017-03-22 | 2022-05-16 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
KR102392087B1 (ko) | 2017-07-10 | 2022-04-29 | 삼성전자주식회사 | 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법 |
US10599377B2 (en) | 2017-07-11 | 2020-03-24 | Roku, Inc. | Controlling visual indicators in an audio responsive electronic device, and capturing and providing audio using an API, by native and non-native computing devices and services |
US10777197B2 (en) | 2017-08-28 | 2020-09-15 | Roku, Inc. | Audio responsive device with play/stop and tell me something buttons |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US11062710B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Local and cloud speech recognition |
US10663938B2 (en) | 2017-09-15 | 2020-05-26 | Kohler Co. | Power operation of intelligent devices |
US10887125B2 (en) | 2017-09-15 | 2021-01-05 | Kohler Co. | Bathroom speaker |
US11099540B2 (en) | 2017-09-15 | 2021-08-24 | Kohler Co. | User identity in household appliances |
US10448762B2 (en) | 2017-09-15 | 2019-10-22 | Kohler Co. | Mirror |
US11093554B2 (en) | 2017-09-15 | 2021-08-17 | Kohler Co. | Feedback for water consuming appliance |
US10768697B2 (en) * | 2017-11-02 | 2020-09-08 | Chian Chiu Li | System and method for providing information |
WO2019133942A1 (en) * | 2017-12-29 | 2019-07-04 | Polk Audio, Llc | Voice-control soundbar loudspeaker system with dedicated dsp settings for voice assistant output signal and mode switching method |
US11145298B2 (en) | 2018-02-13 | 2021-10-12 | Roku, Inc. | Trigger word detection with multiple digital assistants |
CN108597536A (zh) * | 2018-03-20 | 2018-09-28 | 成都星环科技有限公司 | 一种基于声音信息定位的交互系统 |
JP2020046563A (ja) * | 2018-09-20 | 2020-03-26 | Dynabook株式会社 | 電子機器、音声認識方法及びプログラム |
KR20200043075A (ko) * | 2018-10-17 | 2020-04-27 | 삼성전자주식회사 | 전자 장치 및 그 제어방법, 전자 장치의 음향 출력 제어 시스템 |
CN109361944A (zh) * | 2018-12-12 | 2019-02-19 | 江苏集萃微纳自动化系统与装备技术研究所有限公司 | 具有语言识别功能的遥控器 |
KR20200084413A (ko) * | 2018-12-21 | 2020-07-13 | 삼성전자주식회사 | 컴퓨팅 장치 및 그 동작 방법 |
JP7223423B2 (ja) * | 2019-06-28 | 2023-02-16 | アイリスオーヤマ株式会社 | 遠隔操作装置及び映像音響機器 |
WO2021051403A1 (zh) * | 2019-09-20 | 2021-03-25 | 深圳市汇顶科技股份有限公司 | 一种语音控制方法、装置、芯片、耳机及系统 |
CN113658595A (zh) * | 2021-09-02 | 2021-11-16 | 北京第七九七音响股份有限公司 | 一种带有语音识别的声卡设备系统 |
US11915698B1 (en) * | 2021-09-29 | 2024-02-27 | Amazon Technologies, Inc. | Sound source localization |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4776016A (en) * | 1985-11-21 | 1988-10-04 | Position Orientation Systems, Inc. | Voice control system |
US5481256A (en) * | 1987-10-14 | 1996-01-02 | Universal Electronics Inc. | Direct entry remote control with channel scan |
US4856081A (en) * | 1987-12-09 | 1989-08-08 | North American Philips Consumer Electronics Corp. | Reconfigurable remote control apparatus and method of using the same |
KR920009681B1 (ko) * | 1989-05-26 | 1992-10-22 | 삼성전자 주식회사 | 자동 프로그램시 채널의 스캐닝 시간 단축 방법 |
US5267323A (en) * | 1989-12-29 | 1993-11-30 | Pioneer Electronic Corporation | Voice-operated remote control system |
JPH05216492A (ja) * | 1992-01-31 | 1993-08-27 | Clarion Co Ltd | 音声起動制御方法 |
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US6668244B1 (en) * | 1995-07-21 | 2003-12-23 | Quartet Technology, Inc. | Method and means of voice control of a computer, including its mouse and keyboard |
US6198513B1 (en) * | 1995-12-08 | 2001-03-06 | Zenith Electronics Corporation | Receiver with channel surfing mode |
US5987106A (en) * | 1997-06-24 | 1999-11-16 | Ati Technologies, Inc. | Automatic volume control system and method for use in a multimedia computer system |
AU6494599A (en) * | 1998-10-26 | 2000-05-15 | Bojan Marin | Driving scheme and electronic circuitry for the lcd electrooptical switching element |
JP2000148682A (ja) * | 1998-11-05 | 2000-05-30 | Toshiba Corp | 情報再生装置 |
US6606280B1 (en) * | 1999-02-22 | 2003-08-12 | Hewlett-Packard Development Company | Voice-operated remote control |
US6584439B1 (en) * | 1999-05-21 | 2003-06-24 | Winbond Electronics Corporation | Method and apparatus for controlling voice controlled devices |
JP2001154692A (ja) * | 1999-11-30 | 2001-06-08 | Sony Corp | ロボット制御装置およびロボット制御方法、並びに記録媒体 |
US6397186B1 (en) * | 1999-12-22 | 2002-05-28 | Ambush Interactive, Inc. | Hands-free, voice-operated remote control transmitter |
US8909739B2 (en) * | 2001-01-29 | 2014-12-09 | Universal Electronics Inc. | System and method for upgrading the remote control functionality of a device |
US7023498B2 (en) * | 2001-11-19 | 2006-04-04 | Matsushita Electric Industrial Co. Ltd. | Remote-controlled apparatus, a remote control system, and a remote-controlled image-processing apparatus |
US20060206335A1 (en) * | 2003-03-17 | 2006-09-14 | Eric Thelen | Method for remote control of an audio device |
US20070080801A1 (en) * | 2003-10-16 | 2007-04-12 | Weismiller Matthew W | Universal communications, monitoring, tracking, and control system for a healthcare facility |
US20050209858A1 (en) * | 2004-03-16 | 2005-09-22 | Robert Zak | Apparatus and method for voice activated communication |
US20060028337A1 (en) * | 2004-08-09 | 2006-02-09 | Li Qi P | Voice-operated remote control for TV and electronic systems |
US7706553B2 (en) * | 2005-07-13 | 2010-04-27 | Innotech Systems, Inc. | Auto-mute command stream by voice-activated remote control |
JP5115058B2 (ja) * | 2006-08-28 | 2013-01-09 | 株式会社Jvcケンウッド | 電子機器の制御装置及び電子機器の制御方法 |
KR100759003B1 (ko) * | 2007-02-09 | 2007-09-14 | 주식회사 서비전자 | 통합 콘트롤러 및 그것의 제어코드 설정방법 |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US8296151B2 (en) * | 2010-06-18 | 2012-10-23 | Microsoft Corporation | Compound gesture-speech commands |
DE102010062528B4 (de) * | 2010-12-07 | 2020-12-17 | Sennheiser Electronic Gmbh & Co. Kg | Audiosignalverarbeitungseinheit und Audioübertragungssystem, insbesondere Mikrofonsystem |
JP5695447B2 (ja) * | 2011-03-01 | 2015-04-08 | 株式会社東芝 | テレビジョン装置及び遠隔操作装置 |
-
2011
- 2011-02-17 JP JP2011032151A patent/JP5039214B2/ja not_active Expired - Fee Related
- 2011-09-21 US US13/238,883 patent/US20120215537A1/en not_active Abandoned
-
2013
- 2013-03-21 US US13/848,635 patent/US20130218562A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2012173325A (ja) | 2012-09-10 |
US20120215537A1 (en) | 2012-08-23 |
US20130218562A1 (en) | 2013-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5039214B2 (ja) | 音声認識操作装置及び音声認識操作方法 | |
US8633808B2 (en) | Systems, methods and apparatus for locating a lost remote control | |
USRE49493E1 (en) | Display apparatus, electronic device, interactive system, and controlling methods thereof | |
JP5695447B2 (ja) | テレビジョン装置及び遠隔操作装置 | |
US9392326B2 (en) | Image processing apparatus, control method thereof, and image processing system using a user's voice | |
US20090089675A1 (en) | Method for providing graphical user interface and video apparatus using the same | |
CN104780404B (zh) | 声音辅助装置以及操作方法 | |
US11907616B2 (en) | Electronic apparatus, display apparatus and method of controlling the same | |
WO2015062471A1 (zh) | 机顶盒控制方法及装置 | |
JP2012185861A (ja) | 操作装置及び操作方法 | |
US20060256986A1 (en) | Remote control system with a wireless earphone function and corresponding method | |
US20070171307A1 (en) | Media playback system with real-time camera image display and method thereof | |
US20060264250A1 (en) | Remote control system with a wireless earphone function and corresponding method | |
US20150106104A1 (en) | Display device and control method thereof | |
JP2015039071A (ja) | 音声認識操作装置及び音声認識操作方法 | |
JP2008258748A (ja) | 液晶テレビジョン、及びテレビジョン受信機 | |
JP6239847B2 (ja) | テレビジョン受信機 | |
WO2021027892A1 (zh) | 接收装置 | |
JP4606435B2 (ja) | リモコン装置を備えた電子機器 | |
JP2010021798A (ja) | 電子機器 | |
JP2018038075A (ja) | テレビジョン受信機の電源制御方法 | |
JP4999599B2 (ja) | リモートコントロール機能付き電子機器 | |
KR100687921B1 (ko) | 전자 장치 | |
JP2009253452A (ja) | リモコン装置を備えた電子機器 | |
JP2019128483A (ja) | 電子機器、テレビジョン装置、ロボット装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120612 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120706 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150713 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150713 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |